CN116737693A - 数据迁移方法及装置、电子设备和计算机可读存储介质 - Google Patents

数据迁移方法及装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN116737693A
CN116737693A CN202310706714.3A CN202310706714A CN116737693A CN 116737693 A CN116737693 A CN 116737693A CN 202310706714 A CN202310706714 A CN 202310706714A CN 116737693 A CN116737693 A CN 116737693A
Authority
CN
China
Prior art keywords
data
migration
migrated
identifier
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310706714.3A
Other languages
English (en)
Inventor
赵奂良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310706714.3A priority Critical patent/CN116737693A/zh
Publication of CN116737693A publication Critical patent/CN116737693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据迁移方法及装置、电子设备和计算机可读存储介质,可以应用于计算机技术、数据库技术、数据处理技术和金融领域。该数据迁移方法包括:响应于接收到数据迁移请求,根据数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,源数据库具有第一数据量;在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据;将待迁移数据导入至与目标数据库标识对应的目标数据库,其中,目标数据库具有第二数据量;根据第一数据量和第二数据量,确定数据迁移结果。

Description

数据迁移方法及装置、电子设备和计算机可读存储介质
技术领域
本公开涉及计算机技术、数据库技术、数据处理技术和金融领域,更具体地,涉及一种数据迁移方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,数据库技术应运而生,并已广泛应用于数据的存储和管理。
在利用数据库进行海量数据的存储和管理的过程中,如何实现不同类型数据库之间的数据迁移是亟待解决的问题。数据迁移可以指把数据从一个数据库移动到另一个数据库中,迁移的过程即为在源数据库进行备份和在目标数据库进行恢复的过程组合。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:无法满足数据安全性的需求,并且数据迁移效率较低。
发明内容
有鉴于此,本公开提供了一种数据迁移方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一个方面,提供了一种数据迁移方法,包括:
响应于接收到数据迁移请求,根据上述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,上述迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,上述源数据库具有第一数据量;
在上述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对上述原始待迁移数据进行处理,得到待迁移数据;
将上述待迁移数据导入至与上述目标数据库标识对应的目标数据库,其中,上述目标数据库具有第二数据量;以及
根据上述第一数据量和上述第二数据量,确定数据迁移结果。
根据本公开的实施例,上述迁移配置信息还包括待迁移数据标识、预定字段分隔符和待导入位置标识。
根据本公开的实施例,上述数据处理方法还包括:
将上述待迁移数据标识和上述预定字段分隔符,填充至与上述源数据库标识对应的数据迁移脚本模板中,得到数据迁移脚本;以及
将上述待导入位置标识和上述预定字段分隔符,填充至与上述目标数据库标识对应的数据导入脚本模板中,得到数据导入脚本。
根据本公开的实施例,上述响应于接收到数据迁移请求,根据上述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据包括:
响应于接收到上述数据迁移请求,利用上述数据迁移脚本,根据上述源数据库标识和上述待迁移数据标识,从上述源数据库中获取上述原始待迁移数据。
根据本公开的实施例,上述将上述待迁移数据导入至与上述目标数据库标识对应的目标数据库包括:
利用上述数据导入脚本,将上述待迁移数据导入至上述目标数据库。
根据本公开的实施例,上述待迁移数据标识包括M个待迁移数据表标识和与上述M个待迁移数据表标识各自对应的N个待迁移字段标识,M和N均为正整数。
根据本公开的实施例,上述利用上述数据迁移脚本,根据上述源数据库标识和上述待迁移数据标识,从上述源数据库中获取上述原始待迁移数据包括:
针对上述M个待迁移数据表标识中的第m个待迁移数据表标识,根据与上述第m个待迁移数据表标识对应的N个待迁移字段标识,在上述源数据库中确定与上述N个待迁移字段标识各自对应的对应的地址信息;
基于与上述N个待迁移字段标识各自对应的对应的地址信息,获取与上述N个待迁移字段标识各自对应的原始待迁移子数据;以及
根据与上述M个待迁移数据表标识各自对应的N个原始待迁移子数据,确定上述原始待迁移数据。
根据本公开的实施例,上述利用上述数据导入脚本,将上述待迁移数据导入至上述目标数据库包括:
根据上述待导入位置标识,确定上述目标数据库中的目标数据表;
对上述目标数据表进行初始化处理,得到经初始化的目标数据表;
对上述待迁移数据进行分隔符解析处理,得到解析后的目标数据;以及
将上述解析后的目标数据导入至上述经初始化的目标数据表。
根据本公开的实施例,上述在上述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对上述原始待迁移数据进行处理,得到待迁移数据包括:
在上述数据格式标识表征需要进行数据格式转换的情况下,根据上述源数据库标识,确定源数据格式;
根据上述目标数据库标识,确定目标数据格式;
根据上述源数据格式和上述目标数据格式,确定上述预定格式转换规则;以及
利用上述预定格式转换规则,对上述原始待迁移数据进行格式转换处理,得到上述待迁移数据。
根据本公开的实施例,上述第一数据量包括迁移前的第一数据量和迁移后的第一数据量,上述第二数据量包括迁移前的第二数据量和迁移后的第二数据量。
根据本公开的实施例,上述根据上述第一数据量和上述第二数据量,确定数据迁移结果包括:
根据上述迁移前的第一数据量和上述迁移前的第二数据量,确定迁移前数据总量;
根据上述迁移后的第一数据量和上述迁移后的第二数据量,确定迁移后数据总量;
对上述迁移前数据总量和上述迁移后数据总量进行比较,得到数据总量比较结果;
在上述数据总量比较结果表征上述迁移前数据总量和上述迁移后数据总量之间的关系满足预定条件的情况下,确定表征数据迁移执行成功的数据迁移结果;以及
在上述数据总量比较结果表征上述迁移前数据总量和上述迁移后数据总量之间的关系未满足上述预定条件的情况下,确定表征数据迁移执行失败的数据迁移结果。
根据本公开的实施例,上述迁移配置信息还包括并发执行标识。
根据本公开的实施例,上述数据迁移方法还包括:
响应于上述并发执行标识表征上述数据迁移请求支持并发执行,确定并发线程数量;以及
根据上述并发线程数量,创建多个执行线程。
根据本公开的另一个方面,提供了一种数据迁移装置,包括:
获取模块,用于响应于接收到数据迁移请求,根据上述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,上述迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,上述源数据库具有第一数据量;
处理模块,用于在上述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对上述原始待迁移数据进行处理,得到待迁移数据;
导入模块,用于将上述待迁移数据导入至与上述目标数据库标识对应的目标数据库,其中,上述目标数据库具有第二数据量;以及
第一确定模块,用于根据上述第一数据量和上述第二数据量,确定数据迁移结果。
根据本公开的另一个方面,提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个指令,
其中,当上述一个或多个指令被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开所述的方法。
根据本公开的另一个方面,提供了一种计算机可读存储介质,其上存储有可执行指令,上述可执行指令被处理器执行时使处理器实现如本公开所述的方法。
根据本公开的另一个方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机可执行指令,上述计算机可执行指令在被执行时用于实现如本公开所述的方法。
根据本公开的实施例,由于待迁移数据是在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理得到的,原始待迁移数据是根据数据迁移请求中的迁移配置信息从源数据库中获取的,因而待迁移数据能够适应于目标数据库的数据格式,避免了相关技术中无法满足数据安全性的需求,并且数据迁移效率较低的技术问题,实现了在数据迁移过程中数据格式的自适应转换,从而保障了待迁移数据的安全性。在此基础上,由于数据迁移结果是根据源数据库具有的第一数据量和目标数据库具有的第二数据量确定的,因而数据迁移结果能够表征数据迁移是否执行成功,由此提高了数据迁移的效率和准确性。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的可以应用数据迁移方法的系统架构;
图2示意性示出了根据本公开实施例的数据迁移方法的流程图;
图3示意性示出了根据本公开实施例的利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中获取原始待迁移数据过程的示例示意图;
图4示意性示出了根据本公开实施例的利用数据导入脚本,将待迁移数据导入至目标数据库过程的示例示意图;
图5示意性示出了根据本公开实施例的根据第一数据量和第二数据量,确定数据迁移结果过程的示例示意图;
图6示意性示出了根据本公开实施例的数据迁移过程的示例示意图;
图7示意性示出了根据本公开实施例的数据迁移装置的框图;以及
图8示意性示出了根据本公开实施例的适于实现数据迁移方法的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
在相关技术中,数据迁移方法可以包括以下方式之一:基于迁移工具的数据迁移方法和基于Java数据库连接(Java DataBase Connectivity,JDBC)的数据迁移方法。
基于数据文件的数据迁移方法可以指利用工具连接源数据库和目标数据库以进行存量数据的导出和导入。但是,由于该方法是通过人工手工操作的,因而无法保障数据安全性。
基于Java数据库连接的数据迁移方法可以指基于JDBC数据库连接遍历数据库中的全量数据以进行存量数据的导出和导入。但是,由于该方法需要通过数据库连接读取源数据库中的全量数据到内存,再根据语句逐行写入目标数据库,因而迁移效率较低。
为了至少部分地解决相关技术中存在的技术问题,本公开提供了一种数据迁移方法及装置、电子设备和计算机可读存储介质,可以应用于计算机技术、数据库技术、数据处理技术和金融领域。该数据迁移方法包括:响应于接收到数据迁移请求,根据数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,源数据库具有第一数据量;在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据;将待迁移数据导入至与目标数据库标识对应的目标数据库,其中,目标数据库具有第二数据量;根据第一数据量和第二数据量,确定数据迁移结果。
需要说明的是,本公开实施例提供的数据迁移方法和装置可用于计算机技术、数据库技术、数据处理技术和金融领域,例如应用于互联网技术领域。本公开实施例提供的数据迁移方法和装置也可用于除计算机技术、数据库技术、数据处理技术和金融领域之外的任意领域,例如应用于信息安全技术领域。本公开实施例提供的数据迁移方法和装置的应用领域不做限定。
图1示意性示出了根据本公开实施例的可以应用数据迁移方法的系统架构。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,服务器104,源数据库105和目标数据库106。终端设备101、102、103和服务器104,服务器104和源数据库105,服务器104和目标数据库106彼此之间可以通过网络进行通信,网络可以包括各种连接类型,例如有线和/或无线通信链路等。
用户可以使用终端设备101、102、103通过网络与服务器104交互,设置配置信息以对数据库的迁移进行配置。终端设备101、102、103上还可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器104可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103发起的数据迁移请求提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的信息或数据等)反馈给终端设备。
源数据库105和目标数据库106可以存储于单一服务器或服务器集群,其可以包含一个或多个数据库。目标数据库可以包括关系型数据库,例如,Oracle、SQLServer、Sybase、Informix、access、DB2或mysql等。目标数据库也可以是非关系数据库,例如,Hbase、Cassandra、SimpleDB、CouchDB、MongoDB或Redis等。
需要说明的是,本公开实施例所提供的数据迁移方法一般可以由服务器104执行。相应地,本公开实施例所提供的数据迁移装置一般可以设置于服务器104中。本公开实施例所提供的数据迁移方法也可以由不同于服务器104且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器104通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据迁移装置也可以设置于不同于服务器104且能够与第一终端设备101、第二终端设备102、第三终端设备103和/或服务器104通信的服务器或服务器集群中。
备选地,本公开实施例所提供的数据迁移方法也可以由第一终端设备101、第二终端设备102或第三终端设备103执行,或者也可以由不同于第一终端设备101、第二终端设备102或第三终端设备103的其他终端设备执行。相应地,本公开实施例所提供的数据迁移装置也可以设置于第一终端设备101、第二终端设备102或第三终端设备103中,或设置于不同于第一终端设备101、第二终端设备102或第三终端设备103的其他终端设备中。
应该理解,图1中的第一终端设备、第二终端设备、第三终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的第一终端设备、第二终端设备、第三终端设备、网络和服务器。
应注意,以下方法中各个操作的序号仅作为该操作的表示以便描述,而不应被看作表示该各个操作的执行顺序。除非明确指出,否则该方法不需要完全按照所示顺序来执行。
图2示意性示出了根据本公开实施例的数据迁移方法的流程图。
如图2所示,该数据迁移方法200包括操作S210~S240。
在操作S210,响应于接收到数据迁移请求,根据数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,源数据库具有第一数据量。
在操作S220,在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据。
在操作S230,将待迁移数据导入至与目标数据库标识对应的目标数据库,其中,目标数据库具有第二数据量。
在操作S240,根据第一数据量和第二数据量,确定数据迁移结果。
根据本公开的实施例,可以将生成数据迁移请求的代码预先写入脚本中,在需要进行数据迁移的情况下,用户可以通过终端设备运行该脚本,以生成数据迁移请求,并将数据迁移请求发送至服务器,以便于服务器根据该数据迁移请求进行数据迁移操作。
根据本公开的实施例,原始待迁移数据的获取方式可以根据实际业务需求进行设置,在此不作限定。例如,原始待迁移数据可以是通过实时采集获取的。例如,可以通过采集数据等方式来获取。备选地,原始待迁移数据也可以是从数据源中获取的。数据源可以包括以下至少之一:本地数据库、云数据库和网络资源。例如,可以调用数据接口,利用数据接口从数据源中获取原始待迁移数据。备选地,原始待迁移数据可以是接收自其它终端设备发送的。
根据本公开的实施例,在接收到数据迁移请求之后,可以确定数据迁移请求中的迁移配置信息。迁移配置信息可以包括源数据库标识、目标数据库标识和数据格式标识。源数据库标识可以用于标识源数据库。目标数据库标识可以用于标识目标数据库。数据格式标识可以用于表征由源数据库至目标数据库是否需要进行数据格式转换。
根据本公开的实施例,在数据格式标识表征无需进行数据格式转换的情况下,可以将原始待迁移数据直接确定为待迁移数据。在数据格式标识表征需要进行数据格式转换的情况下,可以根据迁移配置信息中的源数据库标识,确定源数据格式。根据迁移配置信息中的目标数据库标识,确定目标数据格式。根据源数据格式和目标数据格式,确定预定格式转换规则。在此基础上,可以利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据。备选地,迁移配置信息可以包括预定格式转换规则,在此情况下,可以直接利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据。
根据本公开的实施例,在从源数据库中获取原始待迁移数据之前,源数据库可以具有迁移前的第一数据量。在从源数据库中获取原始待迁移数据之后,源数据库可以具有迁移后的第一数据量。在将待迁移数据导入至目标数据库之前,目标数据库可以具有迁移前的第二数据量。在将待迁移数据导入至目标数据库之后,目标数据库可以具有迁移后的第二数据量。
根据本公开的实施例,在完成数据迁移操作之后,可以根据第一数据量和第二数据量,确定数据迁移结果。数据迁移结果可以用于表征数据迁移是否执行成功。例如,可以确定迁移前的第一数据量和迁移前的第二数据量之间的第一累加值,确定迁移后的第一数据量和迁移后的第二数据量之间的第二累加值,在此基础上,在确定第一累加值和第二累加值相等的情况下,可以确定数据迁移执行成功。
备选地,可以确定迁移前的第一数据量和迁移后的第一数据量之间的第一差值,确定迁移前的第二数据量和迁移后的第二数据量之间的第二差值,在此基础上,在确定第一差值和第二差值相等的情况下,可以确定数据迁移执行成功。
根据本公开的实施例,由于待迁移数据是在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理得到的,原始待迁移数据是根据数据迁移请求中的迁移配置信息从源数据库中获取的,因而待迁移数据能够适应于目标数据库的数据格式,避免了相关技术中无法满足数据安全性的需求,并且数据迁移效率较低的技术问题,实现了在数据迁移过程中数据格式的自适应转换,从而保障了待迁移数据的安全性。在此基础上,由于数据迁移结果是根据源数据库具有的第一数据量和目标数据库具有的第二数据量确定的,因而数据迁移结果能够表征数据迁移是否执行成功,由此提高了数据迁移的效率和准确性。
下面参考图2~图6,对根据本发明实施例的数据迁移方法200做进一步说明。
根据本公开的实施例,数据迁移方法200还可以包括如下操作。
将待迁移数据标识和预定字段分隔符,填充至与源数据库标识对应的数据迁移脚本模板中,得到数据迁移脚本。将待导入位置标识和预定字段分隔符,填充至与目标数据库标识对应的数据导入脚本模板中,得到数据导入脚本。
根据本公开的实施例,迁移配置信息还可以包括待迁移数据标识、预定字段分隔符和待导入位置标识。
根据本公开的实施例,脚本模板可以指用于根据实际需求动态生成特定脚本文件的通用模板,脚本模板可以包括预先定义的代码块、参数和逻辑结构。通过对脚本模板进行参数配置和逻辑设置,可以灵活地生成各种类型的脚本文件,以满足不同情况下的自动化部署、自动化测试、数据迁移、日志分析和报表生成等需求。脚本模板可以是基于编程语言或标记语言编写的,例如,Python、Shell Script、XML和YAML等。
根据本公开的实施例,可以根据源数据库标识,确定数据迁移脚本模板。根据待迁移数据标识和预定字段分隔符,对数据迁移脚本模板中的占位符和变量进行替换,得到数据迁移脚本。可以根据目标数据库标识,确定数据导入脚本模板。根据待导入位置标识和预定字段分隔符,对数据导入脚本模板中的占位符和变量进行替换,得到数据导入脚本。
根据本公开的实施例,针对具体的业务需求,用户可以直接在模板类中增加数据处理方法而无需调整代码的整体逻辑。例如,A应用需要将一张大表或者宽表table1拆分为多表,则可以在模板类中增加table1的特殊处理方法,即对table1配置的字段进行拆分生产不同的数据迁移脚本和数据导入脚本。
根据本公开的实施例,操作S210可以包括如下操作。
响应于接收到数据迁移请求,利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中获取原始待迁移数据。
根据本公开的实施例,操作S230可以包括如下操作。
利用数据导入脚本,将待迁移数据导入至目标数据库。
根据本公开的实施例,数据迁移请求可以包括第一迁移配置文件和第二迁移配置文件。第一迁移配置文件例如可以使用Settings.properties来表征,第一迁移配置文件可以包括源数据库标识、目标数据库标识、预定字段分隔符、并发执行标识和待导入位置标识。第二迁移配置文件例如可以使用sql.yaml来表征,第二迁移配置文件可以包括待迁移数据表标识和与待迁移数据表标识对应的待迁移字段标识。
根据本公开的实施例,在接收到数据迁移请求之后,可以采用单例模式(即Singleton pattern),创建类在当前进程中的实例,调用该实例,解析第一迁移配置文件和第二迁移配置文件中的参数,并存入全局唯一变量MoveDataPojo,以供生成数据迁移脚本(例如,database_export.sql)和数据导入脚本(例如,database_import.sql)。
根据本公开的实施例,利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中获取原始待迁移数据可以包括+下操作。
针对M个待迁移数据表标识中的第m个待迁移数据表标识,根据与第m个待迁移数据表标识对应的N个待迁移字段标识,在源数据库中确定与N个待迁移字段标识各自对应的对应的地址信息。基于与N个待迁移字段标识各自对应的对应的地址信息,获取与N个待迁移字段标识各自对应的原始待迁移子数据。根据与M个待迁移数据表标识各自对应的N个原始待迁移子数据,确定原始待迁移数据。
根据本公开的实施例,待迁移数据标识包括M个待迁移数据表标识和与M个待迁移数据表标识各自对应的N个待迁移字段标识,M和N均为正整数。
根据本公开的实施例,地址信息可以用于表征与待迁移字段标识对应字段内容在源数据库中存放的地址。地址信息可以包括以下至少之一:网际互连协议(InternetProtocol,IP)和唯一标示符(Identity Document,ID)。可以根据地址信息,获取与待迁移字段标识对应的原始待迁移子数据。
根据本公开的实施例,在进行数据导出的过程中,可以预先指定用于存放导出数据的文件。例如,以Oracle数据库为例,可以利用Oracle客户端提供的SQL*PLUS命令执行数据迁移脚本(即database_export.sql),以将原始待迁移数据导出至指定的逗号分隔值(Comma-Separated Values,CSV)文件。
根据本公开的实施例,在进行数据导出的过程中,还可以基于迁移配置信息中的预定字段分隔符,对与M个待迁移数据表标识各自对应的N个原始待迁移子数据分别进行分割。例如,预定字段分隔符可以为“**/”或“*/”。可以通过对迁移配置信息中的预定字段分隔符进行修改,以实现预定字段分隔符的替换。通过对待迁移数据表和待迁移字段的灵活配置,简化了用户的操作与使用难度。
根据本公开的实施例,由于数据迁移脚本是通过将待迁移数据标识和预定字段分隔符,填充至数据迁移脚本模板中得到的,因而数据迁移脚本能够与源数据库相适应,以实现自动化数据迁移。在此基础上,由于原始待迁移数据是利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中自动获取的,因而保障了原始待迁移数据获取的效率和准确性。
图3示意性示出了根据本公开实施例的利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中获取原始待迁移数据过程的示例示意图。
如图3所示,在300中,响应于接收到数据迁移请求301,可以根据数据迁移请求301中的迁移配置信息301_1,确定待迁移数据标识301_11、预定字段分隔符301_12和源数据库标识301_13。
可以根据源数据库标识301_13,确定与源数据库标识301_13对应的数据迁移脚本模板302。将待迁移数据标识301_11和预定字段分隔符301_12,填充至与源数据库标识301_13对应的数据迁移脚本模板302中,得到数据迁移脚本303。
利用数据迁移脚本303,根据与第m个待迁移数据表标识对应的N个待迁移字段标识304,在源数据库305中确定与N个待迁移字段标识各自对应的对应的地址信息306。基于与N个待迁移字段标识各自对应的对应的地址信息306,获取与N个待迁移字段标识各自对应的原始待迁移子数据307。
在此基础上,可以根据N个待迁移字段标识各自对应的原始待迁移子数据307,确定原始待迁移数据308。
根据本公开的实施例,利用数据导入脚本,将待迁移数据导入至目标数据库可以包括如下操作。
根据待导入位置标识,确定目标数据库中的目标数据表。对目标数据表进行初始化处理,得到经初始化的目标数据表。对待迁移数据进行分隔符解析处理,得到解析后的目标数据。将解析后的目标数据导入至经初始化的目标数据表。
根据本公开的实施例,可以根据待导入位置标识,确定目标数据库中的目标数据表。初始化处理可以包括清空操作。在进行数据导入操作之前,可以对目标数据表执行清空操作,得到经初始化的目标数据表。在进行数据导入的过程中,还可以基于迁移配置信息中的预定字段分隔符,对待迁移数据进行分隔符解析处理,得到解析后的目标数据。
根据本公开的实施例,以Mysql数据库为例,可以利用Mysql客户端提供的DML语句Load命令执行数据导入脚本(即database_export.sql),以将指定的逗号分隔值文件中解析后的目标数据导入经初始化的目标数据表。
根据本公开的实施例,由于数据导入脚本是通过将待导入位置标识和预定字段分隔符,填充至数据导入脚本模板中得到的,因而数据导入脚本能够与目标数据库相适应,以实现自动化数据导入。在此基础上,由于经初始化的目标数据表是对目标数据表进行初始化处理得到的,解析后的目标数据是对待迁移数据进行分隔符解析处理得到的,通过将解析后的目标数据自动导入至经初始化的目标数据表,能够保障数据导入的效率和准确性。
图4示意性示出了根据本公开实施例的利用数据导入脚本,将待迁移数据导入至目标数据库过程的示例示意图。
如图4所示,在400中,响应于接收到数据迁移请求401,可以根据数据迁移请求401中的迁移配置信息401_1,确定待导入位置标识401_11、预定字段分隔符401_12和目标数据库标识401_13。
可以根据目标数据库标识401_13,确定与目标数据库标识401_13对应的数据导入脚本模板402。将待导入位置标识401_11和预定字段分隔符401_12,填充至与目标数据库标识401_13对应的数据导入脚本模板402中,得到数据导入脚本403。
利用数据导入脚本403,根据待导入位置标识401_11,确定目标数据库404中的目标数据表405。对目标数据表405进行初始化处理,得到经初始化的目标数据表406。对待迁移数据407进行分隔符解析处理,得到解析后的目标数据408。将解析后的目标数据408导入至经初始化的目标数据表406。
根据本公开的实施例,操作S220可以包括如下操作。
在数据格式标识表征需要进行数据格式转换的情况下,根据源数据库标识,确定源数据格式。根据目标数据库标识,确定目标数据格式。根据源数据格式和目标数据格式,确定预定格式转换规则。利用预定格式转换规则,对原始待迁移数据进行格式转换处理,得到待迁移数据。
根据本公开的实施例,在源数据库的数据编码方式和目标数据库的数据编码方式不一致的情况下,可以确定表征需要进行数据格式转换的数据格式标识。在源数据库的数据编码方式和目标数据库的数据编码方式相一致的情况下,可以确定表征无需进行数据格式转换的数据格式标识。
根据本公开的实施例,以源数据库为Oracle数据库、目标数据库为Mysql数据库为例,可以确定与Oracle数据库对应的源数据格式为GBK(Chinese Internal CodeSpecification,汉字内码扩展规范)格式,确定与Mysql数据库对应的目标数据格式为UTF-8(Unicode Transformation Format,8位元)格式。在此基础上,可以根据GBK格式和UTF-8格式,确定预定格式转换规则。预定格式转换规则可以包括使用字符集转换工具,对原始待迁移数据进行字符集转换,例如,字符集转换工具可以包括以下至少之一:系统自带工具、第三方字符集转换工具和在线字符集转换工具等。
根据本公开的实施例,操作S240可以包括如下操作。
根据迁移前的第一数据量和迁移前的第二数据量,确定迁移前数据总量。根据迁移后的第一数据量和迁移后的第二数据量,确定迁移后数据总量。对迁移前数据总量和迁移后数据总量进行比较,得到数据总量比较结果。在数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系满足预定条件的情况下,确定表征数据迁移执行成功的数据迁移结果。在数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系未满足预定条件的情况下,确定表征数据迁移执行失败的数据迁移结果。
根据本公开的实施例,第一数据量可以包括迁移前的第一数据量和迁移后的第一数据量。第二数据量可以包括迁移前的第二数据量和迁移后的第二数据量。
根据本公开的实施例,Java数据库连接(Java DataBase Connectivity,JDBC)可以指用于Java语言连接和操作数据库的标准接口。JDBC提供了一组类和接口,使得Java应用程序可以与各种不同的关系型数据库进行交互。可以基于JDBC连接源数据库和目标数据库,查询源数据库具有的迁移前的第一数据量和迁移后的第一数据量,以及目标数据库具有的迁移前的第二数据量和迁移后的第二数据量。
根据本公开的实施例,可以基于迁移前数据总量和迁移后数据总量,对数据迁移进行校验。数据总量比较结果可以用于表征迁移前数据总量和迁移后数据总量之间的关系是否满足预定条件。预定条件可以根据实际业务需求进行设置,在此不作限定。例如,预定条件可以设置为迁移前数据总量和迁移后数据总量之间的差值小于预定阈值。预定阈值可以为1。备选地,预定条件可以设置为迁移前数据总量和迁移后数据总量相等。
根据本公开的实施例,在数据迁移结果表征数据迁移执行失败的情况下,可以根据日志进一步分析迁移失败原因,并重新执行数据导入操作。
根据本公开的实施例,由于数据总量比较结果是通过对迁移前数据总量和迁移后数据总量进行比较得到的,因而数据总量比较结果能够表征迁移前数据总量和迁移后数据总量之间的关系。在此基础上,能够通过根据数据总量比较结果自动确定数据迁移结果,由此提高了数据迁移的效率和准确性。
图5示意性示出了根据本公开实施例的根据第一数据量和第二数据量,确定数据迁移结果过程的示例示意图。
如图5所示,在500中,第一数据量可以包括迁移前的第一数据量501_1和迁移后的第一数据量501_2。第二数据量可以包括迁移前的第二数据量502_1和迁移后的第二数据量502_2。
可以根据迁移前的第一数据量501_1和迁移前的第二数据量502_1,确定迁移前数据总量503。根据迁移后的第一数据量501_2和迁移后的第二数据量502_2,确定迁移后数据总量504。可以对迁移前数据总量503和迁移后数据总量504进行比较,得到数据总量比较结果505。在获得数据总量比较结果505之后,可以执行操作S510。
在操作S510,数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系满足预定条件?
若是,则可以确定表征数据迁移执行成功的数据迁移结果506。
若否,则可以确定表征数据迁移执行失败的数据迁移结果507。
根据本公开的实施例,数据迁移方法200还可以包括如下操作。
响应于并发执行标识表征数据迁移请求支持并发执行,确定并发线程数量。根据并发线程数量,创建多个执行线程。
根据本公开的实施例,迁移配置信息还可以包括并发执行标识。
根据本公开的实施例,并发执行标识可以用于表征数据迁移请求是否支持并发执行。响应于并发执行标识表征数据迁移请求不支持并发执行,可以创建单一线程,并基于单一线程执行数据迁移方法。响应于并发执行标识表征数据迁移请求支持并发执行,可以确定数据迁移请求支持的并发线程数量。在此基础上,可以根据并发线程数量,创建与并发线程数量对应的多个执行线程,并基于多个执行线程并行执行数据迁移方法。
图6示意性示出了根据本公开实施例的数据迁移过程的示例示意图。
如图6所示,在600中,响应于接收到数据迁移请求601,可以根据数据迁移请求601中的迁移配置信息601_1确定并发执行标识601_11。在获得并发执行标识601_11之后,可以执行操作S610。
在操作S610,并发执行标识表征数据迁移请求支持并发执行?
若是,则可以确定并发线程数量602。根据并发线程数量602,创建多个执行线程603。通过多个执行线程603,调用脚本模板604。若否,则可以直接调用脚本模板604。
可以确定数据迁移脚本605和数据导入脚本606。利用数据迁移脚本605,从源数据库中获取原始待迁移数据607。在获得原始待迁移数据607之后,可以执行操作S620。
在操作S620,数据格式标识表征需要进行数据格式转换?
若是,则可以利用预定格式转换规则,对原始待迁移数据607进行处理,得到待迁移数据608。若否,则可以直接将原始待迁移数据607确定为待迁移数据608。
在获得待迁移数据608之后,可以利用数据导入脚本606,将待迁移数据608导入至目标数据库609。在完成数据迁移操作之后,可以根据源数据库具有的第一数据量和目标数据库609具有的第二数据量,确定数据总量比较结果610。在获得数据总量比较结果610之后,可以执行操作S630。
在操作S630,数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系满足预定条件?
若是,则可以确定表征数据迁移执行成功的数据迁移结果611。若否,则可以确定表征数据迁移执行失败的数据迁移结果612。
以上仅是示例性实施例,但不限于此,还可以包括本领域已知的其他数据迁移方法,只要能够提高数据迁移的效率和准确性即可。
图7示意性示出了根据本公开实施例的数据迁移装置的框图。
如图7所示,数据迁移装置700可以包括获取模块710、处理模块720、导入模块730和第一确定模块740。
获取模块710,用于响应于接收到数据迁移请求,根据数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,源数据库具有第一数据量。
处理模块720,用于在数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对原始待迁移数据进行处理,得到待迁移数据。
导入模块730,用于将待迁移数据导入至与目标数据库标识对应的目标数据库,其中,目标数据库具有第二数据量。
第一确定模块740,用于根据第一数据量和第二数据量,确定数据迁移结果。
根据本公开的实施例,迁移配置信息还包括待迁移数据标识、预定字段分隔符和待导入位置标识。
根据本公开的实施例,数据迁移装置700还可以包括第一填充模块和第二填充模块。
第一填充模块,用于将待迁移数据标识和预定字段分隔符,填充至与源数据库标识对应的数据迁移脚本模板中,得到数据迁移脚本。
第二填充模块,用于将待导入位置标识和预定字段分隔符,填充至与目标数据库标识对应的数据导入脚本模板中,得到数据导入脚本。
根据本公开的实施例,获取模块710可以包括获取单元。
获取单元,用于响应于接收到数据迁移请求,利用数据迁移脚本,根据源数据库标识和待迁移数据标识,从源数据库中获取原始待迁移数据。
根据本公开的实施例,导入模块730可以包括导入单元。
导入单元,用于利用数据导入脚本,将待迁移数据导入至目标数据库。
根据本公开的实施例,待迁移数据标识包括M个待迁移数据表标识和与M个待迁移数据表标识各自对应的N个待迁移字段标识,M和N均为正整数。
根据本公开的实施例,获取单元可以包括第一确定子单元、获取子单元和第二确定子单元。
第一确定子单元,用于针对M个待迁移数据表标识中的第m个待迁移数据表标识,根据与第m个待迁移数据表标识对应的N个待迁移字段标识,在源数据库中确定与N个待迁移字段标识各自对应的对应的地址信息。
获取子单元,用于基于与N个待迁移字段标识各自对应的对应的地址信息,获取与N个待迁移字段标识各自对应的原始待迁移子数据。
第二确定子单元,用于根据与M个待迁移数据表标识各自对应的N个原始待迁移子数据,确定原始待迁移数据。
根据本公开的实施例,导入单元可以包括第三确定子单元、初始化处理子单元、解析处理子单元和导入子单元。
第三确定子单元,用于根据待导入位置标识,确定目标数据库中的目标数据表。
初始化处理子单元,用于对目标数据表进行初始化处理,得到经初始化的目标数据表。
解析处理子单元,用于对待迁移数据进行分隔符解析处理,得到解析后的目标数据。
导入子单元,用于将解析后的目标数据导入至经初始化的目标数据表。
根据本公开的实施例,处理模块720可以包括第一确定单元、第二确定单元、第三确定单元和第一处理单元。
第一确定单元,用于在数据格式标识表征需要进行数据格式转换的情况下,根据源数据库标识,确定源数据格式。
第二确定单元,用于根据目标数据库标识,确定目标数据格式。
第三确定单元,用于根据源数据格式和目标数据格式,确定预定格式转换规则。
第一处理单元,用于利用预定格式转换规则,对原始待迁移数据进行格式转换处理,得到待迁移数据。
根据本公开的实施例,第一数据量包括迁移前的第一数据量和迁移后的第一数据量,第二数据量包括迁移前的第二数据量和迁移后的第二数据量。
根据本公开的实施例,第一确定模块740可以包括第四确定单元、第五确定单元、比较单元、第六确定单元和第七确定单元。
第四确定单元,用于根据迁移前的第一数据量和迁移前的第二数据量,确定迁移前数据总量。
第五确定单元,用于根据迁移后的第一数据量和迁移后的第二数据量,确定迁移后数据总量。
比较单元,用于对迁移前数据总量和迁移后数据总量进行比较,得到数据总量比较结果。
第六确定单元,用于在数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系满足预定条件的情况下,确定表征数据迁移执行成功的数据迁移结果。
第七确定单元,用于在数据总量比较结果表征迁移前数据总量和迁移后数据总量之间的关系未满足预定条件的情况下,确定表征数据迁移执行失败的数据迁移结果。
根据本公开的实施例,迁移配置信息还包括并发执行标识。
根据本公开的实施例,数据迁移装置700还可以包括第二确定模块和创建模块。
第二确定模块,用于响应于并发执行标识表征数据迁移请求支持并发执行,确定并发线程数量。
创建模块,用于根据并发线程数量,创建多个执行线程。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块710、处理模块720、导入模块730和第一确定模块740中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块710、处理模块720、导入模块730和第一确定模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块710、处理模块720、导入模块730和第一确定模块740中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中数据迁移装置部分与本公开的实施例中数据迁移方法部分是相对应的,数据迁移装置部分的描述具体参考数据迁移方法部分,在此不再赘述。
图8示意性示出了根据本公开实施例的适于实现数据迁移方法的电子设备的框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的计算机电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分809加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至输入/输出(I/O)接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至输入/输出(I/O)接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的数据迁移方法。
在该计算机程序被处理器801执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种数据迁移方法,包括:
响应于接收到数据迁移请求,根据所述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,所述迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,所述源数据库具有第一数据量;
在所述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对所述原始待迁移数据进行处理,得到待迁移数据;
将所述待迁移数据导入至与所述目标数据库标识对应的目标数据库,其中,所述目标数据库具有第二数据量;以及
根据所述第一数据量和所述第二数据量,确定数据迁移结果。
2.根据权利要求1所述的方法,其中,所述迁移配置信息还包括待迁移数据标识、预定字段分隔符和待导入位置标识;
所述方法还包括:
将所述待迁移数据标识和所述预定字段分隔符,填充至与所述源数据库标识对应的数据迁移脚本模板中,得到数据迁移脚本;以及
将所述待导入位置标识和所述预定字段分隔符,填充至与所述目标数据库标识对应的数据导入脚本模板中,得到数据导入脚本。
3.根据权利要求2所述的方法,其中,所述响应于接收到数据迁移请求,根据所述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据包括:
响应于接收到所述数据迁移请求,利用所述数据迁移脚本,根据所述源数据库标识和所述待迁移数据标识,从所述源数据库中获取所述原始待迁移数据;
所述将所述待迁移数据导入至与所述目标数据库标识对应的目标数据库包括:
利用所述数据导入脚本,将所述待迁移数据导入至所述目标数据厍。
4.根据权利要求3所述的方法,其中,所述待迁移数据标识包括M个待迁移数据表标识和与所述M个待迁移数据表标识各自对应的N个待迁移字段标识,M和N均为正整数;
所述利用所述数据迁移脚本,根据所述源数据库标识和所述待迁移数据标识,从所述源数据库中获取所述原始待迁移数据包括:
针对所述M个待迁移数据表标识中的第m个待迁移数据表标识,根据与所述第m个待迁移数据表标识对应的N个待迁移字段标识,在所述源数据库中确定与所述N个待迁移字段标识各自对应的对应的地址信息;
基于与所述N个待迁移字段标识各自对应的对应的地址信息,获取与所述N个待迁移字段标识各自对应的原始待迁移子数据;以及
根据与所述M个待迁移数据表标识各自对应的N个原始待迁移子数据,确定所述原始待迁移数据。
5.根据权利要求3所述的方法,其中,所述利用所述数据导入脚本,将所述待迁移数据导入至所述目标数据库包括:
根据所述待导入位置标识,确定所述目标数据库中的目标数据表;
对所述目标数据表进行初始化处理,得到经初始化的目标数据表;
对所述待迁移数据进行分隔符解析处理,得到解析后的目标数据;以及
将所述解析后的目标数据导入至所述经初始化的目标数据表。
6.根据权利要求1至5中任一项所述的方法,其中,所述在所述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对所述原始待迁移数据进行处理,得到待迁移数据包括:
在所述数据格式标识表征需要进行数据格式转换的情况下,根据所述源数据库标识,确定源数据格式;
根据所述目标数据库标识,确定目标数据格式;
根据所述源数据格式和所述目标数据格式,确定所述预定格式转换规则;以及
利用所述预定格式转换规则,对所述原始待迁移数据进行格式转换处理,得到所述待迁移数据。
7.根据权利要求1至5中任一项所述的方法,其中,所述第一数据量包括迁移前的第一数据量和迁移后的第一数据量,所述第二数据量包括迁移前的第二数据量和迁移后的第二数据量;
所述根据所述第一数据量和所述第二数据量,确定数据迁移结果包括:
根据所述迁移前的第一数据量和所述迁移前的第二数据量,确定迁移前数据总量;
根据所述迁移后的第一数据量和所述迁移后的第二数据量,确定迁移后数据总量;
对所述迁移前数据总量和所述迁移后数据总量进行比较,得到数据总量比较结果;
在所述数据总量比较结果表征所述迁移前数据总量和所述迁移后数据总量之间的关系满足预定条件的情况下,确定表征数据迁移执行成功的数据迁移结果;以及
在所述数据总量比较结果表征所述迁移前数据总量和所述迁移后数据总量之间的关系未满足所述预定条件的情况下,确定表征数据迁移执行失败的数据迁移结果。
8.根据权利要求1至5中任一项所述的方法,其中,所述迁移配置信息还包括并发执行标识;
所述方法还包括:
响应于所述并发执行标识表征所述数据迁移请求支持并发执行,确定并发线程数量;以及
根据所述并发线程数量,创建多个执行线程。
9.一种数据迁移装置,包括:
获取模块,用于响应于接收到数据迁移请求,根据所述数据迁移请求中的迁移配置信息,从源数据库中获取原始待迁移数据,其中,所述迁移配置信息包括源数据库标识、目标数据库标识和数据格式标识,所述源数据库具有第一数据量;
处理模块,用于在所述数据格式标识表征需要进行数据格式转换的情况下,利用预定格式转换规则,对所述原始待迁移数据进行处理,得到待迁移数据;
导入模块,用于将所述待迁移数据导入至与所述目标数据库标识对应的目标数据库,其中,所述目标数据库具有第二数据量;以及
第一确定模块,用于根据所述第一数据量和所述第二数据量,确定数据迁移结果。
10.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个指令,
其中,当所述一个或多个指令被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行指令,所述可执行指令被处理器执行时使处理器实现权利要求1至8中任一项所述的方法。
12.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述计算机可执行指令在被执行时用于实现权利要求1至8中任一项所述的方法。
CN202310706714.3A 2023-06-14 2023-06-14 数据迁移方法及装置、电子设备和计算机可读存储介质 Pending CN116737693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310706714.3A CN116737693A (zh) 2023-06-14 2023-06-14 数据迁移方法及装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310706714.3A CN116737693A (zh) 2023-06-14 2023-06-14 数据迁移方法及装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN116737693A true CN116737693A (zh) 2023-09-12

Family

ID=87912945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310706714.3A Pending CN116737693A (zh) 2023-06-14 2023-06-14 数据迁移方法及装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116737693A (zh)

Similar Documents

Publication Publication Date Title
US8321450B2 (en) Standardized database connectivity support for an event processing server in an embedded context
US8387076B2 (en) Standardized database connectivity support for an event processing server
US9710530B2 (en) Performance checking component for an ETL job
CN110990420A (zh) 数据查询方法、装置
CN111125064B (zh) 一种生成数据库模式定义语句的方法和装置
CN113138757B (zh) 前端代码自动生成方法、装置、服务器、系统及介质
CN114090113B (zh) 数据源处理插件动态加载的方法、装置、设备及存储介质
CN114281803A (zh) 数据迁移方法、装置、设备、介质和程序产品
CN113419740A (zh) 程序数据流的分析方法、装置、电子设备及可读存储介质
CN113191889A (zh) 风控配置方法、配置系统、电子设备及可读存储介质
CN116069725A (zh) 文件迁移方法、装置、设备、介质和程序产品
CN116414855A (zh) 信息处理方法及装置、电子设备和计算机可读存储介质
CN116737693A (zh) 数据迁移方法及装置、电子设备和计算机可读存储介质
CN113515271B (zh) 服务代码生成方法、装置、电子设备及可读存储介质
CN114201508A (zh) 数据处理方法、数据处理装置、电子设备和存储介质
CN117009397A (zh) 数据查询方法、数据查询装置、电子设备和存储介质
CN113032256A (zh) 自动化测试方法、装置、计算机系统和可读存储介质
CN113434382A (zh) 数据库性能监控方法、装置、电子设备及计算机可读介质
CN113515326B (zh) 数据转换方法、装置、电子设备以及存储介质
CN114640585B (zh) 一种资源更新方法、装置、电子设备和存储介质
CN113608817B (zh) 弹框处理方法及系统
WO2021047506A1 (zh) 数据统计分析系统、方法及计算机可读存储介质
CN116401319B (zh) 数据同步方法及装置、电子设备和计算机可读存储介质
CN116126934A (zh) 数据采集方法、装置、电子设备和介质
CN114297295A (zh) 数据同步方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination