CN115495440A - 异构数据库的数据迁移方法、装置、设备及存储介质 - Google Patents

异构数据库的数据迁移方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115495440A
CN115495440A CN202211313464.9A CN202211313464A CN115495440A CN 115495440 A CN115495440 A CN 115495440A CN 202211313464 A CN202211313464 A CN 202211313464A CN 115495440 A CN115495440 A CN 115495440A
Authority
CN
China
Prior art keywords
database
target
data
incremental
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211313464.9A
Other languages
English (en)
Inventor
王增臣
沈文宽
侯博文
黄健
付裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinzhuan Xinke Co Ltd
Original Assignee
Jinzhuan Xinke Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinzhuan Xinke Co Ltd filed Critical Jinzhuan Xinke Co Ltd
Priority to CN202211313464.9A priority Critical patent/CN115495440A/zh
Publication of CN115495440A publication Critical patent/CN115495440A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种异构数据库的数据迁移方法、装置、设备及存储介质,涉及数据库的数据同步技术领域。该方法包括:响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。采用上述技术方案,可以通过源数据库中的增量日志,实现异构数据库之间的数据迁移,减小数据迁移过程中对源数据库的侵入性。

Description

异构数据库的数据迁移方法、装置、设备及存储介质
技术领域
本发明涉及数据库的数据同步技术领域,尤其涉及一种异构数据库的数据迁移方法、装置、设备及存储介质。
背景技术
随着数据库技术的迅速发展,企业在信息化建设过程中能够选择的数据库更加丰富。随着企业业务系统的发展,原有的数据库系统逐渐不能满足企业的要求,为保证业务数据安全和业务能力提升,企业就需要对数据库系统进行升级。在数据库升级改造过程中,不可避免的要对原有数据库中的数据进行迁移。
在很多情况下,需要在异构数据库之间进行全量数据迁移,保证源数据库和目的数据库初始环境相同。全量数据迁移经常面临迁移数据量大,迁移时间长的问题,会影响业务的正常运行,不适于频繁进行全量迁移。因此,在数据库升级改造过程中,在全量数据迁移的基础上,还需要对源数据库中的数据进行增量迁移,满足用户的同步需求。因此,如何实现异构数据库之间的数据增量迁移对于数据库升级十分重要。
发明内容
本发明提供了一种异构数据库的数据迁移方法、装置、设备及存储介质,在对源数据库侵入性较小的情况下,实现异构数据库间数据迁移。
根据本发明的一方面,提供了一种异构数据库的数据迁移方法,包括:
响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;
依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;
通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。
根据本发明的另一方面,提供了一种异构数据库的数据迁移方法装置,包括:
源文件获取模块,用于响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;
目的文件获取模块,用于依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;
增量数据迁移模块,用于通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。
根据本发明的另一方面,提供了一种电子设备,电子设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的异构数据库的数据迁移方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的异构数据库的数据迁移方法。
本发明实施例通过响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。采用上述技术方案,通过源数据库中的增量日志,实现异构数据库之间的数据迁移,减小数据迁移过程中对源数据库的侵入性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是根据本发明实施例一提供的一种异构数据库的数据迁移方法的流程图;
图1B是根据本发明实施例一提供的一种SQL文件语法转换的示意图;
图2A是根据本发明实施例二提供的一种异构数据库的数据迁移方法的流程图;
图2B是根据本发明实施例二提供的一种大对象数据关联的数据操作语言的语法转换示意图;
图3是根据本发明实施例三提供的一种异构数据库的数据迁移方法的流程图;
图4是根据本发明实施例四提供的一种异构数据库的数据迁移装置的结构示意图;
图5A是根据本发明实施例五提供的一种异构数据库的数据迁移系统的示意图;
图5B是根据本发明实施例五提供的一种异构数据库的数据迁移构架图;
图5C是根据本发明实施例五提供的一种异构数据库的数据迁移时序图;
图6是实现本发明实施例的异构数据库的数据迁移方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1A为本发明实施例一提供了一种异构数据库的数据迁移方法的流程图,本实施例可适用于异构数据库间进行数据迁移情况,该方法可以由异构数据库的数据迁移装置来执行,该异构数据库的数据迁移装置可以采用硬件和/或软件的形式实现,该异构数据库的数据迁移装置可配置于各种通用计算设备中。
本发明实施例将结合图1B所示的SQL文件语法转换示意图,对异构数据库的数据迁移系统进行详细说明。
如图1A所示,该方法包括:
S101、响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件。
其中,增量迁移请求可以指示数据迁移软件将源数据库中的增量数据迁移至目的数据库中,增量迁移请求中可以包括当前迁移任务的标识。源数据库可以理解为存储增量数据的数据库。目的数据库可以理解为将与源数据库数据保持数据同步的数据库。增量数据即为源数据库中新增的尚未存储于目的数据库的数据。增量日志即为增量数据对应的数据库日志。源结构化查询语言(Structured Query Language,简称SQL)文件可以由至少一条源SQL语句组成,各源SQL语句与数据库中的各增量数据相互关联。
本发明实施例中,响应于用户发起的增量迁移请求,从源数据库中获取与增量迁移请求对应的增量日志,进而从增量日志中提取至少一条源SQL语句,并由提取到的至少一条源SQL构成源SQL文件。具体的,在接收到增量迁移请求后,可以依据增量迁移请求中包含的迁移任务标识,获取与当前迁移任务匹配的日志过滤策略,进而采用日志过滤策略对源数据库中的日志进行过滤,获取与当前迁移任务匹配的增量日志。进一步的,通过关键字提取的方式,提取增量日志中包含的源SQL语句,并由至少一条源SQL语句构成源SQL文件。其中,日志过滤策略可以是根据迁移任务的需求预先配置的,例如,日志过滤策略可以包括时间过滤规则或者是指定表名的过滤规则。
另外,还可以是在接收到增量迁移请求后,还可以获取上一次进行数据同步的时间,并从源数据库提取上一次数据同步时间之后的日志作为增量日志,进而从增量日志中提取源SQL文件。
S102、依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件。
其中,源SQL文件即上述与源数据库的语法匹配的SQL文件。目的SQL文件可以是与目的数据库的语法匹配的SQL文件。语法转换可以包括但不限于符号转换、内置函数转换和精度转换等中的至少一种。如图1B所示,将源SQL文件的SQL语句中的双引号转换为单引号,将TO_DATE(日期)函数转换为STR_TO_DATE(字符串-日期)函数,并对应修改函数的参数格式。本发明实施例中,将源SQL文件中SQL语句的语法类型转换为目的数据库的语法类型,得到目的SQL文件。
具体的,首先可以获取与当前迁移任务匹配的数据迁移策略,其中,数据迁移策略可以是根据数据迁移需求预先配置的,例如,数据迁移策略可以包括表名映射关系和列名的映射关系等信息。在对源SQL文件进行词法语法解析,得到对应的语法树后,依据数据迁移策略对语法树进行更新,例如,根据表名映射关系,将原表名映射为用户所需表名,以及根据列名映射关系,将原列名映射为用户所需列名。在依据数据迁移策略完成语法树的更新后,进一步的,将更新后的语法中与源数据库匹配的数据操作语言进行语法转换,转换为与目的数据库匹配的数据操作语言,得到进一步更新后的语法树。最终,依据两次更新后的语法树以及目的数据库的语法,生成与目标数据库匹配的SQL文件。
S103、通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。
本发明实施例中,通过运行目的SQL文件,执行目的SQL文件中的SQL语句,将目的SQL文件中SQL语句对应的源数据库中的增量数据迁移至目的数据库中。具体的,为了提高数据迁移效率,在执行目的SQL文件中SQL语句时,可以将不同的表并发导入至目的数据库。另外,在一些情况下,数据库表的数据量巨大,单线程进行单数据表的导入耗时仍较长。此时,可以对数据量大的表进行分表,得到多个子表,并通过多个线程对各子表进行同时导入。还可以是对数据表进行表内并发导入,实现数据高效迁移。
本发明实施例通过响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。采用上述技术方案,通过源数据库中的增量日志,实现异构数据库之间的数据迁移,减小数据迁移过程中对源数据库的侵入性。
实施例二
图2A为本发明实施例二提供的一种异构数据库的数据迁移方法的流程图,本实施例在上述实施例的基础上进行了优化改进。
进一步地,将“依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件”细化为“对源SQL文件进行解析,得到初始语法树;依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的数据迁移策略;依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新,得到目标语法树;依据目标语法树和目的数据库的类型,生成与目的数据库匹配的目的SQL文件”,以完善目的SQL文件的获取操作。
需要说明的是,在本发明实施例中未详述部分,可参见前述实施例的表述。
如图2A所示,该方法包括:
S201、响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件。
S202、对源SQL文件进行解析,得到初始语法树;
其中,初始语法树中包括至少一个初始语法树节点,初始语法树节点可以表示源SQL文件中SQL语句的语法关键词,其中语法关键词例如可以是符号、内置函数和精度字符等。具体的,对源SQL文件进行词法语法解析,确定源SQL文件中SQL语句的语法关键词,将语法关键词用树节点的形式表示,得到初始语法树。
S203、依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的数据迁移策略。
其中,迁移任务即为迁移当前源数据库中增量数据的任务,迁移任务标识用于标识当前迁移任务。数据迁移策略即对增量数据进行迁移的规则,可以由技术人员根据源数据库和目的数据库类型进行预设。具体的,根据迁移任务标识,获取与迁移任务匹配的数据迁移策略。
示例性的,数据迁移策略可以包括由源数据库迁移到目的数据库时需要进行的表名映射,或者列名映射,还可以包括对需要迁移的表的行过滤策略,例如,根据设定的行过滤规则,在需要迁移的表中过滤掉不符合条件的数据。
S204、依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新,得到目标语法树。
其中,目标语法树中包括至少一个目标语法树节点,目标语法树节点可以表示目的SQL文件中SQL语句的语法关键词。
本发明实施例中,在得到初始语法树后,进一步依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新得到目标语法树。具体的,首先依据数据迁移策略对初始语法树进行更新,例如,依据数据迁移策略中的表名映射规则,对初始语法树中关联的表名进行映射。进一步的,依据源数据库和目的数据库的类型,对映射后的语法树进语法转换,将源数据库匹配的数据操作语言转换为目的数据库匹配的操作语言,得到目标语法树。
可选的,依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新,得到目标语法树,包括:依据数据迁移策略,对初始语法树进行结构更新,得到过渡语法树;依据源数据库和目的数据库的类型,对过渡语法树中与源数据库匹配的数据操作语言进行语法转换,得到目标语法树。
在一个可选实施例中,依据数据迁移策略中的数据库表的行过滤策略,在初始语法树中增加行过滤节点;和/或依据数据迁移策略中的数据库表的表名映射策略以及列名映射策略,在初始语法树中增加表名和列名映射节点,将节点增加后的初始语法树作为过渡语法树。
其中,行过滤策略可以是确定源数据库的数据库表中无需进行数据迁移的行的规则,行过滤节点即执行过滤策略的语法树节点;表名映射策略可以是修改源数据库表迁移至目的数据库中表名的规则,例如表名映射策略可以是增加表名前缀、增加表名后缀和重定义新表名等。表名映射节点即执行表名映射策略的语法树节点;列名映射策略可以是修改源数据库数据表列迁移至目的数据库中的列名的规则,例如列名映射策略可以是增加列名前缀、增加列名后缀和重定义新列名等。列名映射节点即执行列名映射策略的语法树节点。最终将依据数据迁移策略在初始语法树中增加相应节点后得到的语法树作为过渡语法树。
可以理解的是,采用上述技术方案,通过数据迁移策略中的行过滤策略、表名映射策略和列名映射策略,在初始语法树中增加相应节点,实现增量数据迁移中对增量数据的过滤和映射,提高了数据迁移的灵活性。
在一个具体实施例中,数据迁移策略还可以包括数据库表的列增加策略,列增加策略可以是确定迁移至目的数据库的数据表中新增列的规则,在初始语法树中增加列增加节点。示例性的,列增加策略可以是将数据库表中的至少两列数据相加作为新增列,还可以是将数据库表中至少两列相减作为新增列。
在另一个具体实施例中,数据迁移策略还可以包括数据库表的行增加策略,行增加策略可以是确定迁移至目的数据库的数据表中新增行的规则,在初始语法树中增加行增加节点。示例性的,行增加策略可以是将数据库表中的至少两行数据相加作为新增行,还可以是将数据库表中至少两行相减作为新增行。
在又一个具体实施例中,数据迁移策略还可以包括数据库表的表增加策略,表增加策略可以是确定增加迁移至目的数据库中的数据库表的规则,在初始语法树中增加表增加节点。示例性的,表增加策略可以是将源数据库中至少两个数据库表中的数据进行融合处理得到新增表。
进一步的,在得到过渡语法树后,依据源数据库和目的数据库的类型,将过渡语法树中与源数据库匹配的数据操作语言类型转换为目的数据库支持的数据操作语言类型,得到目标语法树。
在一个可选实施例中,依据源数据库和目的数据库的类型,确定大对象数据关联的大对象语法转换策略。依据大对象语法转换策略,对过渡语法树中大对象数据关联的数据操作语言进行语法转换,得到目标语法树。
其中,大对象数据可以是存储图片、视频和音乐等数据量较大的数据。大对象语法转换策略可以是对大对象数据对应的SQL语句进行语法转换的规则,例如可以是对大对象关联的数据操作语言中的符号、内置函数和精度等中的至少一种中进行转换。图2B是一种大对象关联的数据语言的语法转换示意图。如图2B所示,其中,将源SQL文件中大对象数据关联的数据操作语言的双引号转换为单引号,将大对象数据的循环写入函数EMPTY_BLOB(EMPTY_Binary Large Object,空二进制大对象数据)改为大对象数据的内容BLOB1。可以理解的是,采用上述技术方案,通过大对象语法转化策略对大对象数据进行语法转换,可以实现对异构数据库中含有大对象数据类型的增量数据进行数据迁移,丰富了异构数据库数据迁移的数据类型。
可以理解的是,采用上述技术方案,通过对初始语法树进行结构更新,得到过渡语法树,对过渡语法树进行语法转换,得到目标语法树,只需根据数据迁移策略、源数据库类型和目的数据库类型,即可完成语法转换,实现了异构数据库数据迁移对源数据库的零侵入性。
S205、依据目标语法树和目的数据库的类型,生成与目的数据库匹配的目的SQL文件。
具体的,根据目标语法树表示的语法结构、相关策略节点和目的数据库语法类型,生成与目的数据库语法类型相匹配的目的SQL文件类型。
S206、通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。
本发明实施例通过对源SQL文件进行解析,得到初始语法树;依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的数据迁移策略;依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新,得到目标语法树;依据目标语法树和目的数据库的类型,生成与目的数据库匹配的目的SQL文件。采用上述技术方案,可以灵活的在目标语法树中设置数据迁移策略,根据数据迁移策略进行增量数据迁移,提高了增量数据迁移的灵活性。
实施例三
图3为本发明实施例三提供的一种异构数据库的数据迁移方法的流程图,本实施例在上述实施例的基础上进行了优化改进。
进一步地,将“通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库”细化为“依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的表内并发策略;基于表内并发策略,运行目的SQL文件,将源数据库中的增量数据并发迁移至目的数据库”,以完善目的SQL文件的运行操作。
需要说明的是,在本发明实施例中未详述部分,可参见前述实施例的表述。
S301、响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件。
可选的,响应于增量迁移请求,依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的日志过滤策略;日志过滤策略中包括数据库表筛选规则。依据日志过滤策略,在源数据库中提取增量日志。
其中,日志过滤策略可以包括但不限于数据库表筛选规则和日期筛选规则。示例性的,基于数据库表筛选规则,筛选源数据库中指定数据库表所关联的日志;基于日期筛选规则,在源数据库中筛选日期满足设定规则的日志,例如,在XX年YY月ZZ日之后产生的日志。
具体的,可以根据日志过滤策略中包含的数据库表筛选规则,在源数据库中筛选出满足数据库表筛选规则的日志作为增量日志。还可以根据日志过滤策略中包含的日期筛选规则,在源数据库中筛选出满足日期筛选规则的日志作为增量日志。
示例性的,日志过滤策略中包括日期筛选规则,则根据源数据库中日志的产生时间,筛选出符合日期筛选规则的日志作为增量日志。又示例性的,日志过滤策略中包括数据库表筛选规则,可以根据数据库表筛选规则,从源数据库中筛选出与满足数据库表筛选规则的数据库表关联的日志作为增量日志。
可以理解的是,采用上述技术方案,通过获取日志过滤策略,并依据日志过滤策略从数据库中提取增量日志,提高了提取增量日志的灵活性。
在一个具体实施例中,响应于增量迁移请求,对该增量迁移请求进行鉴权,确定该增量迁移请求的发送方是否有增量数据迁移的发起权限。若鉴权通过,则从源数据库中提取增量日志;若鉴权不通过,则丢弃该增量迁移请求。
S302、依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件。
S303、依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的表内并发策略。
其中,表内并发策略可以对源数据库的数据库表中的至少两行分为一组,利用多线程技术对各组进行并行迁移。示例性的,若数据库表行数为111行,每10行分为一组,剩余1行分为1组,对该12组各分配一个线程,利用多线程技术将该12组并行迁移至目的数据库的数据库表中。
在一个具体实施例中,还可以依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的分表策略,将源数据库中数据量较大的数据库表拆分为至少两个子表,利用多线程技术对各子表进行并行迁移,提高数据迁移效率。
S304、基于表内并发策略,运行目的SQL文件,将源数据库中的增量数据并发迁移至目的数据库。
具体的,基于表内并发策略,确定与源数据库表中各分组匹配目的SQL文件中的SQL语句,并行执行各分组对应的SQL语句,将源数据中的增量数据并发迁移至目的数据库。
在一个可选实施例中,基于分表策略,确定与源数据库中各组匹配的SQL文件中的SQL语句,并行执行各分组对应的SQL语句,将源数据中的增量数据并发迁移至目的数据库。
在一个具体实施例中,在完成增量数据迁移后,整理目的SQL文件和迁移过程中的数据,例如初始语法树、过渡语法树和目标语法树等,生成对应的数据迁移结果报告,用于记录增量数据导入总数、增量数据导入成功数、增量数据导入失败数、执行的日志过滤策略和执行的数据迁移策略等,可以使用户直观的获取数据迁移的过程以及结果。
本发明实施例通过迁移任务标识获取表内并发策略,基于表内并发策略,运行目的SQL文件,将源数据库中的增量数据并发迁移目的数据库,采用上述技术方案,利用多线程的表内并发,将表内多行数据并行发送,提高了异构数据库数据迁移的效率。
实施例四
图4为本发明实施例四提供的一种异构数据库的数据迁移装置的结构示意图。如图4所示,该装置包括:源文件获取模块401,目的文件获取模块402和增量数据迁移模块403,其中,
源文件获取模块401,用于响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;
目的文件获取模块402,用于依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;
增量数据迁移模块403,用于通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。
本发明实施例通过源文件获取模块响应于增量迁移请求,在源数据库中提取增量日志,并获取增量日志中的源结构化查询语言SQL文件;目的文件获取模块依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;增量数据迁移模块通过运行目的SQL文件,将源数据库中的增量数据迁移至目的数据库。采用上述技术方案,可以通过源数据库中的增量日志,实现异构数据库之间的数据迁移,减小数据迁移过程中对源数据库的侵入性。
在一个可选实施例中,目的文件获取模块402,包括:
初始语法树获得单元,用于对源SQL文件进行解析,得到初始语法树;
迁移策略获取单元,用于依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的数据迁移策略;
目标语法树获取单元,用于依据数据迁移策略,以及源数据库和目的数据库的类型,对初始语法树进行更新,得到目标语法树;
目的文件生成单元,用于依据目标语法树和目的数据库的类型,生成与目的数据库匹配的目的SQL文件。
在一个可选实施例中,目标语法树获取单元,包括:
过渡语法树获取子单元,用于依据数据迁移策略,对初始语法树进行结构更新,得到过渡语法树;
目标语法树获取子单元,用于依据源数据库和目的数据库的类型,对过渡语法树中与源数据库匹配的数据操作语言进行语法转换,得到目标语法树。
在一个可选实施例中,过渡语法树获取子单元,具体用于:
根据数据迁移策略中的数据库表的行过滤策略,在初始语法树中增加行过滤节点;和/或,
依据数据迁移策略中的数据库表的表名映射策略以及列名映射策略,在初始语法树中增加表名和列名映射节点。
在一个可选实施例中,目标语法树获取子单元,具体用于:
依据源数据库和目的数据库的类型,确定大对象数据关联的大对象语法转换策略;
依据大对象语法转换策略,对过渡语法树中大对象数据关联的数据操作语言进行语法转换,得到目标语法树。
在一个可选实施例中,源文件获取模块401,包括:
策略获取单元,用于响应于增量迁移请求,依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的日志过滤策略;日志过滤策略中包括数据库表筛选规则;
日志提取单元,用于依据日志过滤策略,在源数据库中提取增量日志。
本发明实施例所提供的异构数据库的数据迁移装置可执行本发明任意实施例所提供的异构数据库的数据迁移方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5A为本发明实施例五提供的一种异构数据库的数据迁移系统的示意图。本发明实施例将结合图5B所示的异构数据库的数据迁移构架图和图5C的异构数据库的数据迁移时序图,对异构数据库的数据迁移系统进行详细说明。
如图5A所示,该系统包括:日志获取模块501,语法转换模块502和迁移策略模块503和迁移导入模块504。其中,
日志获取模块501,用于连接源数据库日志,并结合数据迁移策略,获取数据库增量日志。
迁移策略模块502,用于提供数据迁移策略,例如指定源数据库中的数据库表迁移、表内行过滤等策略。
语法转换模块503,基于异构数据库之间不同的语法类型,对日志进行语法解析,尤其是对大对象数据类型进行语法转换,实现从源数据库语法到目的数据库语法的转换。
迁移导入模块503,基于分表策略和表内并发策略,生成目的SQL文件,运行目的SQL文件,将目的SQL文件对应的增量数据迁移至目的数据库中。
参见图5B,该异构数据库的数据迁移系统具体配置于源数据库与目的数据库之间。
图5C是一种异构数据库的数据迁移时序图。参见图5C,用户号通过客户端向日志获取模块发送增量数据迁移请求。日志获取模块响应于增量数据迁移请求,向迁移策略模块查询日志过滤策略。迁移策略模块根据增量数据迁移请求中的迁移任务信息向日志获取模块反馈的日志过滤策略。日志获取模块从源数据库中提取增量日志,向语法转换模块发送增量日志。语法转换模块对增量日志中的源SQL文件进行词法语法解析,向迁移策略模块查询语法转换策略,根据迁移策略模块反馈的语法转换策略,对源SQL文件进行语法转换,生成目的SQL文件。迁移导入模块获取目的SQL文件,并利用多线程技术向目的异构数据库并行发送目的SQL文件,结果输出模块根据语法转换模块的增量迁移记录,对目的SQL文件和策略信息,生成对应的数据迁移结果。
本发明实施例提供的异构数据库的数据迁移系统,可以通过源数据库中的增量日志,实现异构数据库之间的数据迁移,减小数据迁移过程中对源数据库的侵入性。
实施例六
图6表示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如异构数据库的数据迁移方法。
在一些实施例中,异构数据库的数据迁移方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的异构数据库的数据迁移方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行异构数据库的数据迁移方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种异构数据库的数据迁移方法,其特征在于,包括:
响应于增量迁移请求,在源数据库中提取增量日志,并获取所述增量日志中的源结构化查询语言SQL文件;
依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;
通过运行所述目的SQL文件,将所述源数据库中的增量数据迁移至所述目的数据库。
2.根据权利要求1所述的方法,其特征在于,依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件,包括:
对所述源SQL文件进行解析,得到初始语法树;
依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的数据迁移策略;
依据所述数据迁移策略,以及源数据库和目的数据库的类型,对所述初始语法树进行更新,得到目标语法树;
依据所述目标语法树和目的数据库的类型,生成与所述目的数据库匹配的目的SQL文件。
3.根据权利要求2所述的方法,其特征在于,依据所述数据迁移策略,以及源数据库和目的数据库的类型,对所述初始语法树进行更新,得到目标语法树,包括:
依据所述数据迁移策略,对所述初始语法树进行结构更新,得到过渡语法树;
依据源数据库和目的数据库的类型,对所述过渡语法树中与源数据库匹配的数据操作语言进行语法转换,得到目标语法树。
4.根据权利要求3所述的方法,其特征在于,依据所述数据迁移策略,对所述初始语法树进行结构更新,包括:
依据数据迁移策略中的数据库表的行过滤策略,在所述初始语法树中增加行过滤节点;和/或,
依据数据迁移策略中的数据库表的表名映射策略以及列名映射策略,在所述初始语法树中增加表名和列名映射节点。
5.根据权利要求3所述的方法,其特征在于,依据源数据库和目的数据库的类型,对所述过渡语法树中与源数据库匹配的数据操作语言进行语法转换,得到目标语法树,包括:
依据源数据库和目的数据库的类型,确定大对象数据关联的大对象语法转换策略;
依据所述大对象语法转换策略,对所述过渡语法树中大对象数据关联的数据操作语言进行语法转换,得到目标语法树。
6.根据权利要求1所述的方法,其特征在于,通过运行所述目的SQL文件,将所述源数据库中的增量数据迁移至所述目的数据库,包括:
依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的表内并发策略;
基于所述表内并发策略,运行所述目的SQL文件,将所述源数据库中的增量数据并发迁移至所述目的数据库。
7.根据权利要求1-6任一所述的方法,其特征在于,响应于增量迁移请求,在源数据库中提取增量日志,包括:
响应于增量迁移请求,依据增量迁移请求中包含的迁移任务标识,获取与迁移任务匹配的日志过滤策略;所述日志过滤策略中包括数据库表筛选规则;
依据所述日志过滤策略,在所述源数据库中提取增量日志。
8.一种异构数据库的数据迁移装置,其特征在于,包括:
源文件获取模块,用于响应于增量迁移请求,在源数据库中提取增量日志,并获取所述增量日志中的源结构化查询语言SQL文件;
目的文件获取模块,用于依据源数据库和目的数据库的类型,对源SQL文件进行语法转换,得到目的SQL文件;
增量数据迁移模块,用于通过运行所述目的SQL文件,将所述源数据库中的增量数据迁移至所述目的数据库。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的异构数据库的数据迁移方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的异构数据库的数据迁移方法。
CN202211313464.9A 2022-10-25 2022-10-25 异构数据库的数据迁移方法、装置、设备及存储介质 Pending CN115495440A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211313464.9A CN115495440A (zh) 2022-10-25 2022-10-25 异构数据库的数据迁移方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211313464.9A CN115495440A (zh) 2022-10-25 2022-10-25 异构数据库的数据迁移方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115495440A true CN115495440A (zh) 2022-12-20

Family

ID=85114622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211313464.9A Pending CN115495440A (zh) 2022-10-25 2022-10-25 异构数据库的数据迁移方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115495440A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056316A (zh) * 2023-10-10 2023-11-14 之江实验室 一种多源异构数据关联查询加速方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056316A (zh) * 2023-10-10 2023-11-14 之江实验室 一种多源异构数据关联查询加速方法、装置及设备
CN117056316B (zh) * 2023-10-10 2024-01-26 之江实验室 一种多源异构数据关联查询加速方法、装置及设备

Similar Documents

Publication Publication Date Title
CN110704479A (zh) 任务处理方法、装置、电子设备及存储介质
CN110647579A (zh) 数据同步方法及装置、计算机设备与可读介质
US11934403B2 (en) Generating training data for natural language search systems
CN111324610A (zh) 一种数据同步的方法及装置
CN112380180A (zh) 数据同步处理方法、装置、设备及存储介质
US20120158742A1 (en) Managing documents using weighted prevalence data for statements
JP2022031625A (ja) 情報をプッシュするための方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
CN114595686B (zh) 知识抽取方法、知识抽取模型的训练方法及装置
CN111651519A (zh) 数据同步方法、数据同步装置、电子设备及存储介质
CN112948486A (zh) 批量数据同步方法、系统及电子设备
CN111125064A (zh) 一种生成数据库模式定义语句的方法和装置
CN113282611A (zh) 一种流数据同步的方法、装置、计算机设备及存储介质
CN115495440A (zh) 异构数据库的数据迁移方法、装置、设备及存储介质
CN114816578A (zh) 基于配置表的程序配置文件生成方法、装置及设备
CN113962597A (zh) 一种数据分析方法、装置、电子设备及存储介质
CN113220710A (zh) 数据查询方法、装置、电子设备以及存储介质
WO2023103432A1 (zh) 代码文件编辑方法、装置、电子设备以及存储介质
CN103809915A (zh) 一种磁盘文件的读写方法和装置
CN113590651B (zh) 一种基于hql的跨集群数据处理系统及方法
CN113468529B (zh) 一种数据搜索方法和装置
CN114661918A (zh) 知识图谱构建方法、装置、存储介质及电子设备
JP2018109898A (ja) データマイグレーションシステム
JP6835755B2 (ja) 日本語名詞句抽出装置、日本語名詞句抽出方法および日本語名詞句抽出プログラム
CN112817930A (zh) 一种数据迁移的方法和装置
US20240152511A1 (en) Transliteration of machine interpretable languages for enhanced compaction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination