CN111414358A - 应用于关系型数据库数据装载的方法 - Google Patents
应用于关系型数据库数据装载的方法 Download PDFInfo
- Publication number
- CN111414358A CN111414358A CN201911403002.4A CN201911403002A CN111414358A CN 111414358 A CN111414358 A CN 111414358A CN 201911403002 A CN201911403002 A CN 201911403002A CN 111414358 A CN111414358 A CN 111414358A
- Authority
- CN
- China
- Prior art keywords
- data
- thread
- loading
- database
- increment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011068 loading method Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 5
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000002085 persistent effect Effects 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000010076 replication Effects 0.000 description 8
- 238000013506 data mapping Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种应用于关系型数据库数据装载的方法,包括如下步骤:数据文件读取线程读取需要装载到目标数据库的数据文件,数据文件分为存量数据文件和增量数据文件;存量数据装载线程将读取的数据文件,通过数据处理生成sql语句,批量执行至目标数据库中,并保存为ckpt数据;当存量装载线程手动退出或异常终止,重新启动存量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据。本发明具有能够实现数据库的存量和增量的数据装载;能够根据配置解决异构数据库的DDL转换的特点。
Description
技术领域
本发明涉及数据库中的数据复制技术领域,尤其是涉及一种能够实现数据库的存量和增量的数据装载;能够根据配置解决异构数据库的DDL转换,保证异构数据库的数据装载;可根据使用场景,对数据进行转换后装载的应用于关系型数据库数据装载的方法。
背景技术
传统的数据同步复制是由数据库自身同构复制技术实现的,当源表发生变化时,由数据库引擎引发同步事件,把源表中变化的数据同步更新到目标数据库中,但是上述复制技术只能在同构数据库之间使用,目前各数据库开发商在各自的数据库同构复制的基础上提出了异构数据库的复制方案,例如,Microsoft SQL Server提出了出版者/预订者同步方案,Oracle中采用多主复制和物化视图的方案来实现数据同步的功能,DB使用CCD表来实现异构数据库之间的复制。虽然各厂商研发出的辅助工具更好地完善了数据同步复制的功能,但是复制方案仍依赖于自己的数据库管理系统(Database Management System,DBMS)核心技术,不能保证完全与DBMS无关。
与同构数据库装载相比,异构数据的装载存在如下几个缺点:
(1)数据库会因为使用各种不同的数据模型来表示和存储数据,导致数据格式的混乱,访问接口独立。
(2)某些情况下,不能对目标数据库的表结构进行任何改变。当表是动态生成时,无法修改表结构,不能利用数据库本身的复制功能。
(3)同步过程中不能对数据进行过滤和转换处理。
发明内容
本发明的发明目的是为了克服现有技术中的上述不足,提供了一种能够实现数据库的存量和增量的数据装载;能够根据配置解决异构数据库的DDL转换,保证异构数据库的数据装载;可根据使用场景,对数据进行转换后装载的应用于关系型数据库数据装载的方法。
为了实现上述目的,本发明采用以下技术方案:
一种应用于关系型数据库数据装载的方法,包括如下步骤:
(1-1)数据读取
数据文件读取线程读取需要装载到目标数据库的数据文件,数据文件分为存量数据文件和增量数据文件;
(1-2)数据装载
存量数据装载线程将读取的数据文件,通过数据处理生成sql语句,批量执行至目标数据库中,并保存为ckpt数据;
(1-3)断点续传
当存量装载线程手动退出或异常终止,重新启动存量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据;
当增量装载线程手动退出或异常终止,重新启动增量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据。
本发明可以集中处理同异构数据库数据装载过程中产生的冲突,并将数据装载到目标数据库,同时,根据配置可对数据进行过滤转换、数据映射,解决了源数据中分散、零乱、标准不统一的数据,大大提升了数据质量。
作为优选,(1-1)包括如下步骤:
启动数据文件读取线程,数据文件读取线程获取存量数据文件,以数据段的方式读取,将读取的数据以Json格式序列化到数据文件中,通过Json反序列化解析后得到数据对象;数据对象的属性包括scn值和源数据库库类型;源数据库类型包括Oracle,MySql和Postgresql;
根据数据对象得到源数据库类型,如果源数据库类型为oracle数据库,并且当前读取到的数据是存量数据,则将读取到的数据中的scn值存放到持久化的容器中,利用scn值建立存量数据与增量数据的衔接;
如果源数据库类型为oracle数据库,并且当前读取到的数据是增量数据,先对oracle数据库的行进行回滚操作;然后,将当前读取到的数据放入内存中,并将数据中的事务号放入待装载的数据队列中。
作为优选,(1-2)包括如下步骤:
每个存量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的所有数据行;
每个增量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的数据行,遍历所有的数据行,根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A11;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A12;再利用当前的装载线程数B1,将A11或A12为被除数,B1为除数做取模运算,得到模值C1;将每个数据行放到模值C1对应的装载线程中进行装载。
作为优选,数据文件读取线程在上一次读取的位置继续读取数据包括存量数据续传过程和增量数据续传过程;
存量数据续传过程包括如下步骤:
读取目标数据库ckpt表中所有的存量装载线程的数据,取得所有的正在装载的事务号和最后提交的事务号,如果正在装载事务号和最后提交的事务号相同,则该事务号对应的事务不必恢复;
如果正在装载的事务号和最后提交的事务号不相同,则将该事务号对应的事务恢复;
通过比较获取装载线程ckpt中最小的文件偏移位置和最大的文件偏移位置,数据文件读取线程从最小的文件偏移位置开始读取文件,判断数据行中的事务号是否对应需要恢复的事务;
如果数据行中的事务号对应需要恢复的事务,则将该事务放入待提交数据队列;数据文件读取线程读取到最大文件偏移位置时,则存量数据断点续传完成。
作为优选,增量数据续传过程包括如下步骤:
当每个增量装载线程启动时,根据当前的增量装载线程的线程名到目标数据库中查询出当前增量装载线程上次装载的增量装载线程,并在最小的文件偏移位置和最大的文件偏移位置进行数据恢复;
增量装载线程根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A21;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A22;再利用当前的装载线程数B2,将A21或A22做为被除数,B2为除数做取模运算,得到模值C2;将每个数据行放到模值C2对应的装载线程中进行装载;
判断所述数据行是否属于增量装载线程,如果所述数据行属于增量装载线程,则将该数据行放入数据队列,当数据文件读取线程读取到最大文件偏移位置时,则增量数据断点续传完成。
作为优选,利用scn值建立存量数据与增量数据的衔接包括如下步骤:
数据文件读取线程中保存有每张表A的存量scn值,增量装载线程读取表A的scn值,如果存量的scn值≥增量的scn值,则丢弃掉增量的scn值对应的数据行,如果存量的scn值<增量的scn值,则将增量的scn值对应的数据行装载到目标数据库中,并移除保存的scn值所对应的数据行。
作为优选,(1-2)还包括ddl装载处理过程:
根据源数据的数据库类型和备库的数据库类型,通过sql语句的语法和词法解析,自动转换备库的ddl语句;如果ddl为与表操作相关的语句,重载数据字典。
因此,本发明具有如下有益效果:能够实现数据库的存量和增量的数据装载;能够根据配置解决异构数据库的DDL转换,保证异构数据库的数据装载;可根据使用场景,对数据进行转换后装载;可以集中处理同异构数据库数据装载过程中产生的冲突,并将数据装载到目标数据库,同时,根据配置可对数据进行过滤转换、数据映射,解决了源数据中分散、零乱、标准不统一的数据,大大提升了数据质量。
附图说明
图1为本发明的一种数据装载整体流程图;
图2为本发明的一种数据读取线程流程图;
图3为本发明的一种数据装载线程流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
如图1所示的实施例是一种应用于关系型数据库数据装载的方法,包括如下步骤:
(1-1)数据读取:
如图2所示,启动数据文件读取线程,数据文件读取线程获取存量数据文件,以数据段的方式读取,将读取的数据以Json格式序列化到数据文件中,通过Json反序列化解析后得到数据对象;数据对象的属性包括scn值和源数据库库类型;源数据库类型包括Oracle,MySql和Postgresql;
数据对象的属性如下表所示:
根据数据对象得到源数据库类型,如果源数据库类型为oracle数据库,并且当前读取到的数据是存量数据,则将读取到的数据中的scn值存放到持久化的容器中,利用scn值建立存量数据与增量数据的衔接;
如果源数据库类型为oracle数据库,并且当前读取到的数据是增量数据,先对oracle数据库的行进行回滚操作;然后,将当前读取到的数据放入内存中,并将数据中的事务号放入待装载的数据队列中。
(1-2)数据装载:
如图3所示,每个存量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的所有数据行;
每个增量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的数据行,遍历所有的数据行,根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A11;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A12;再利用当前的装载线程数B1,将A11或A12为被除数,B1为除数做取模运算,得到模值C1;将每个数据行放到模值C1对应的装载线程中进行装载。
利用scn值建立存量数据与增量数据的衔接包括如下步骤:
数据文件读取线程中保存有每张表A的存量scn值,增量装载线程读取表A的scn值,如果存量的scn值≥增量的scn值,则丢弃掉增量的scn值对应的数据行,如果存量的scn值<增量的scn值,则将增量的scn值对应的数据行装载到目标数据库中,并移除保存的scn值所对应的数据行。
还包括ddl装载处理过程:
根据源数据的数据库类型和备库的数据库类型,通过sql语句的语法和词法解析,自动转换备库的ddl语句;如果ddl为与表操作相关的语句,重载数据字典。
dml数据按类型生成标准的可执行的dml sql语句,按照schema名和表名加载目标数据库的数据字典,将数据进行数据类型转换,处理完成后,将数据提交到目标数据库;如果为存量数据装载,并且主备库为oralce,可对源库中的rowid与目标数据库的rowid进行映射,这样可大大加快update与delete操作的执行效率,在存量数据装载前,将生成的insert sql语句生成为可回调获取oracle rowid的语句,并将源库中的rowid和回调获取的rowid持久化到指定的key-value的存储介质中;在执行增量的update或delete语句时,通过源库的rowid在存储介质中取得目标数据库的rowid,并将rowid作为where的唯一条件执行sql语句;
装载线程在提交数据时,需要同时更新目标端的ckpt表,已保证数据的完整性,在步骤三断点续传通过ckpt表进行数据恢复。
(1-3)断点续传:
当装载进程手动退出或异常终止,重新启动存量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据。
存量数据续传过程包括如下步骤:
读取目标数据库ckpt表中所有的存量装载线程的数据,取得所有的正在装载的事务号和最后提交的事务号,如果正在装载事务号和最后提交的事务号相同,则该事务号对应的事务不必恢复;
如果正在装载的事务号和最后提交的事务号不相同,则将该事务号对应的事务恢复;
通过比较获取装载线程ckpt中最小的文件偏移位置和最大的文件偏移位置,数据文件读取线程从最小的文件偏移位置开始读取文件,判断数据行中的事务号是否对应需要恢复的事务;
如果数据行中的事务号对应需要恢复的事务,则将该事务放入待提交数据队列;数据文件读取线程读取到最大文件偏移位置时,则存量数据断点续传完成。
当每个增量装载线程启动时,根据当前的增量装载线程的线程名到目标数据库中查询出当前增量装载线程上次装载的增量装载线程,并在最小的文件偏移位置和最大的文件偏移位置进行数据恢复;
增量装载线程根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A21;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A22;再利用当前的装载线程数B2,将A21或A22做为被除数,B2为除数做取模运算,得到模值c2;将每个数据行放到模值c2对应的装载线程中进行装载;
判断所述数据行是否属于增量装载线程,如果所述数据行属于增量装载线程,则将该数据行放入数据队列,当数据文件读取线程读取到最大文件偏移位置时,则增量数据断点续传完成。
应理解,本实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (7)
1.一种应用于关系型数据库数据装载的方法,其特征是,包括如下步骤:
(1-1)数据读取
数据文件读取线程读取需要装载到目标数据库的数据文件,数据文件分为存量数据文件和增量数据文件;
(1-2)数据装载
存量数据装载线程将读取的数据文件,通过数据处理生成sql语句,批量执行至目标数据库中,并保存为ckpt数据;
(1-3)断点续传
当存量装载线程手动退出或异常终止,重新启动存量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据;
当增量装载线程手动退出或异常终止,重新启动增量数据装载线程后,数据文件读取线程在上一次读取的位置继续读取数据。
2.根据权利要求1所述的应用于关系型数据库数据装载的方法,其特征是,(1-1)包括如下步骤:
启动数据文件读取线程,数据文件读取线程获取存量数据文件,以数据段的方式读取,将读取的数据以Json格式序列化到数据文件中,通过Json反序列化解析后得到数据对象;数据对象的属性包括scn值和源数据库库类型;源数据库类型包括Oracle,MySql和Postgresql;
根据数据对象得到源数据库类型,如果源数据库类型为oracle数据库,并且当前读取到的数据是存量数据,则将读取到的数据中的scn值存放到持久化的容器中,利用scn值建立存量数据与增量数据的衔接;
如果源数据库类型为oracle数据库,并且当前读取到的数据是增量数据,先对oracle数据库的行进行回滚操作;然后,将当前读取到的数据放入内存中,并将数据中的事务号放入待装载的数据队列中。
3.根据权利要求1所述的应用于关系型数据库数据装载的方法,其特征是,(1-2)包括如下步骤:
每个存量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的所有数据行;
每个增量装载线程获取待装载的数据队列中的事务号,根据事务号,在数据缓存中获取该事务号所对应的数据行,遍历所有的数据行,根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A11;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A12;再利用当前的装载线程数B1,将A11或A12为被除数,B1为除数做取模运算,得到模值C1;将每个数据行放到模值C1对应的装载线程中进行装载。
4.根据权利要求1所述的应用于关系型数据库数据装载的方法,其特征是,数据文件读取线程在上一次读取的位置继续读取数据包括存量数据续传过程和增量数据续传过程;
存量数据续传过程包括如下步骤:
读取目标数据库ckpt表中所有的存量装载线程的数据,取得所有的正在装载的事务号和最后提交的事务号,如果正在装载事务号和最后提交的事务号相同,则该事务号对应的事务不必恢复;
如果正在装载的事务号和最后提交的事务号不相同,则将该事务号对应的事务恢复;
通过比较获取装载线程ckpt中最小的文件偏移位置和最大的文件偏移位置,数据文件读取线程从最小的文件偏移位置开始读取文件,判断数据行中的事务号是否对应需要恢复的事务;
如果数据行中的事务号对应需要恢复的事务,则将该事务放入待提交数据队列;数据文件读取线程读取到最大文件偏移位置时,则存量数据断点续传完成。
5.根据权利要求4所述的应用于关系型数据库数据装载的方法,其特征是,增量数据续传过程包括如下步骤:
当每个增量装载线程启动时,根据当前的增量装载线程的线程名到目标数据库中查询出当前增量装载线程上次装载的增量装载线程,并在最小的文件偏移位置和最大的文件偏移位置进行数据恢复;
增量装载线程根据每个数据行的数据库类型,如果源库为Oracle数据库,那么对rowld字段值进行hash,得到hash值A21;如果源库为非Oracle数据库,那么通过schemaName、tableName和所有primarys值进行拼接后进行hash,得到hash值A22;再利用当前的装载线程数B2,将A21或A22做为被除数,B2为除数做取模运算,得到模值C2;将每个数据行放到模值C2对应的装载线程中进行装载;
判断所述数据行是否属于增量装载线程,如果所述数据行属于增量装载线程,则将该数据行放入数据队列,当数据文件读取线程读取到最大文件偏移位置时,则增量数据断点续传完成。
6.根据权利要求3所述的应用于关系型数据库数据装载的方法,其特征是,利用scn值建立存量数据与增量数据的衔接包括如下步骤:
数据文件读取线程中保存有每张表A的存量scn值,增量装载线程读取表A的scn值,如果存量的scn值≥增量的scn值,则丢弃掉增量的scn值对应的数据行,如果存量的scn值<增量的scn值,则将增量的scn值对应的数据行装载到目标数据库中,并移除保存的scn值所对应的数据行。
7.根据权利要求3所述的应用于关系型数据库数据装载的方法,其特征是,(1-2)还包括ddl装载处理过程:
根据源数据的数据库类型和备库的数据库类型,通过sql语句的语法和词法解析,自动转换备库的ddl语句;如果ddl为与表操作相关的语句,重载数据字典。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403002.4A CN111414358A (zh) | 2019-12-30 | 2019-12-30 | 应用于关系型数据库数据装载的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911403002.4A CN111414358A (zh) | 2019-12-30 | 2019-12-30 | 应用于关系型数据库数据装载的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111414358A true CN111414358A (zh) | 2020-07-14 |
Family
ID=71492709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911403002.4A Pending CN111414358A (zh) | 2019-12-30 | 2019-12-30 | 应用于关系型数据库数据装载的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111414358A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113918657A (zh) * | 2021-12-14 | 2022-01-11 | 天津南大通用数据技术股份有限公司 | 一种并行高性能增量同步方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103221949A (zh) * | 2010-07-27 | 2013-07-24 | 甲骨文国际公司 | Mysql数据库的异构的基于日志的复制 |
CN103761318A (zh) * | 2014-01-27 | 2014-04-30 | 中国工商银行股份有限公司 | 一种关系型异构数据库数据同步的方法及系统 |
US20160070726A1 (en) * | 2013-09-21 | 2016-03-10 | Oracle International Corporation | Automatic verification and triage of query results |
CN106126753A (zh) * | 2016-08-23 | 2016-11-16 | 易联众信息技术股份有限公司 | 基于大数据的增量抽取的方法 |
US20170109420A1 (en) * | 2015-10-20 | 2017-04-20 | Mastercard International Incorporated | Parallel Transfer of SQL Data to Software Framework |
US20170116237A1 (en) * | 2015-10-27 | 2017-04-27 | Teradata Us, Inc. | Buffered data-loading in column-partitioned database tables |
CN107590256A (zh) * | 2017-09-20 | 2018-01-16 | 北京九桥同步软件有限公司 | 异构数据库同步方法和装置 |
US20190171650A1 (en) * | 2017-12-01 | 2019-06-06 | Chavdar Botev | System and method to improve data synchronization and integration of heterogeneous databases distributed across enterprise and cloud using bi-directional transactional bus of asynchronous change data system |
CN109947841A (zh) * | 2017-07-27 | 2019-06-28 | 成都蓝盾网信科技有限公司 | 基于事务日志分析的单导系统中oracle数据库同步技术 |
CN110569142A (zh) * | 2019-08-29 | 2019-12-13 | 天津大学 | 一种oracle数据增量同步系统及方法 |
-
2019
- 2019-12-30 CN CN201911403002.4A patent/CN111414358A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103221949A (zh) * | 2010-07-27 | 2013-07-24 | 甲骨文国际公司 | Mysql数据库的异构的基于日志的复制 |
US20160070726A1 (en) * | 2013-09-21 | 2016-03-10 | Oracle International Corporation | Automatic verification and triage of query results |
CN103761318A (zh) * | 2014-01-27 | 2014-04-30 | 中国工商银行股份有限公司 | 一种关系型异构数据库数据同步的方法及系统 |
US20170109420A1 (en) * | 2015-10-20 | 2017-04-20 | Mastercard International Incorporated | Parallel Transfer of SQL Data to Software Framework |
US20170116237A1 (en) * | 2015-10-27 | 2017-04-27 | Teradata Us, Inc. | Buffered data-loading in column-partitioned database tables |
CN106126753A (zh) * | 2016-08-23 | 2016-11-16 | 易联众信息技术股份有限公司 | 基于大数据的增量抽取的方法 |
CN109947841A (zh) * | 2017-07-27 | 2019-06-28 | 成都蓝盾网信科技有限公司 | 基于事务日志分析的单导系统中oracle数据库同步技术 |
CN107590256A (zh) * | 2017-09-20 | 2018-01-16 | 北京九桥同步软件有限公司 | 异构数据库同步方法和装置 |
US20190171650A1 (en) * | 2017-12-01 | 2019-06-06 | Chavdar Botev | System and method to improve data synchronization and integration of heterogeneous databases distributed across enterprise and cloud using bi-directional transactional bus of asynchronous change data system |
CN110569142A (zh) * | 2019-08-29 | 2019-12-13 | 天津大学 | 一种oracle数据增量同步系统及方法 |
Non-Patent Citations (5)
Title |
---|
于闽: "\"烟草异构数据库复制灾备新方式\"", pages 4417 - 4435 * |
刘传尧: ""基于日志解析的Oracle远程数据库同步方法研究及实现"", no. 12, pages 138 - 550 * |
刘勇: "\"基于Zookeeper的异构关系数据库同步中间件的研究与实现\"", no. 03, pages 138 - 616 * |
宋芳利: "\"基于日志解析的数据库海量数据同步系统的研究与实现\"", no. 05, pages 138 - 723 * |
钟华: "《企业IT架构转型之道 阿里巴巴中台战略思想与架构实战》", vol. 1, 30 April 2017, 机械工业出版社, pages: 81 - 82 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113918657A (zh) * | 2021-12-14 | 2022-01-11 | 天津南大通用数据技术股份有限公司 | 一种并行高性能增量同步方法 |
CN113918657B (zh) * | 2021-12-14 | 2022-03-15 | 天津南大通用数据技术股份有限公司 | 一种并行高性能增量同步方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180260435A1 (en) | Redis-based database data aggregation and synchronization method | |
CN110262929B (zh) | 一种保证复制事务一致性的方法以及相应的复制装置 | |
CN109710388B (zh) | 数据读取方法、装置、电子设备以及存储介质 | |
WO2016041481A1 (en) | Statement based migration for adaptively building and updating column store database from row store database based on query demands using disparate database systems | |
CN112286941B (zh) | 一种基于Binlog+HBase+Hive的大数据同步方法和装置 | |
CN108121827B (zh) | 一种全量数据的同步方法及装置 | |
CN111026771B (zh) | 一种保证缓存与数据库数据一致的方法 | |
US20230137119A1 (en) | Method for replaying log on data node, data node, and system | |
CN113792094A (zh) | 一种数据同步系统、方法、设备及介质 | |
CN111414358A (zh) | 应用于关系型数据库数据装载的方法 | |
AU2020200649B2 (en) | Apparatus and method for managing storage of primary database and replica database | |
CN114547524A (zh) | 一种同步http接口数据的方法、设备及存储介质 | |
CN109358817B (zh) | 用于复制数据的方法、装置和系统 | |
CN112527900A (zh) | 一种数据库读多副本一致性的方法、装置、设备及介质 | |
CN117633024B (zh) | 一种基于预处理优化join的数据库优化方法 | |
CN113239061B (zh) | 智慧法院数据更新方法及系统 | |
CN113282600B (zh) | 一种Oracle数据库同步环境下批量主键更新处理方法及系统 | |
CN117390040B (zh) | 基于实时宽表的业务请求处理方法、设备及存储介质 | |
US20240004898A1 (en) | Updating a staged dataset for ingestion | |
CN117827979B (zh) | 一种数据批量导入方法、装置、电子设备及存储介质 | |
CN116186088A (zh) | 一种缓存管理方法、装置、计算机设备以及存储介质 | |
CN117932135A (zh) | 数据库的索引管理方法及装置 | |
CN116303422A (zh) | 数据查询方法、装置、电子设备和存储介质 | |
CN113254461A (zh) | 一种基于nifi的实现数据库同步的优化方法及系统 | |
CN116303525A (zh) | 数据库的数据处理方法、存储介质与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |