CN109829016B - 一种数据同步方法及装置 - Google Patents

一种数据同步方法及装置 Download PDF

Info

Publication number
CN109829016B
CN109829016B CN201910071849.0A CN201910071849A CN109829016B CN 109829016 B CN109829016 B CN 109829016B CN 201910071849 A CN201910071849 A CN 201910071849A CN 109829016 B CN109829016 B CN 109829016B
Authority
CN
China
Prior art keywords
data
source
record
databases
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910071849.0A
Other languages
English (en)
Other versions
CN109829016A (zh
Inventor
汪建福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN201910071849.0A priority Critical patent/CN109829016B/zh
Priority to PCT/CN2019/077238 priority patent/WO2020151054A1/zh
Priority to EP19772639.1A priority patent/EP3716094A1/en
Publication of CN109829016A publication Critical patent/CN109829016A/zh
Priority to US16/588,798 priority patent/US20200242131A1/en
Application granted granted Critical
Publication of CN109829016B publication Critical patent/CN109829016B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Abstract

本发明公开了一种数据同步方法及装置。所述方法包括:管理设备接收各源数据库在当前周期内发送的各源数据后,根据各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合并将目标数据集合发送至各数据宿。本发明实施例中,只需要管理设备执行这一计算过程,在同步的过程进行目标数据集合的计算,使得数据宿能够直接获取目标数据集合,大大降低了整个系统的计算量,提升了数据同步的时效性。

Description

一种数据同步方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据同步方法及装置。
背景技术
数据同步一直是计算机系统之间进行交互的不可避免的问题,数据同步的时效性和准确性将直接影响计算机系统之间的交互。现有的数据同步技术,通常是先将各源数据库中的各源数据分别同步到数据宿,然后由数据宿进行计算,从而获取所需的数据。然而,这种方法对于每个数据宿而言,都需要进行这样的计算过程,过程比较复杂,比较浪费时间。
基于此,目前亟需一种数据同步方法,用于解决现有技术中的数据同步过程比较复杂,耗时较长的问题。
发明内容
本发明实施例提供一种数据同步方法及装置,以解决现有技术中数据同步过程比较复杂,耗时较长的技术问题。
本发明实施例提供一种数据同步方法,所述方法应用于数据同步系统,所述系统包括管理设备、多个源数据库和至少一个数据宿;所述方法包括:
所述管理设备接收各源数据库在当前周期内发送的各源数据;所述各源数据为所述各源数据库在所述当前周期内对应的全量数据;
所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合;
所述管理设备将所述目标数据集合发送至各数据宿,所述数据宿用于接收数据。
如此,本发明实施例设置管理设备,通过管理设备对各源数据库的各源数据进行计算,从而在管理设备层面确定目标数据集合,进而可以将目标增量数据集合发送给各数据宿。相比于现有技术中每个数据宿都需要分别计算目标数据集合的方式而言,本发明实施例中,只需要管理设备执行这一计算过程,在同步的过程进行目标数据集合的计算,使得数据宿能够直接获取目标数据集合,大大降低了整个系统的计算量,提升了数据同步的时效性;进一步地,采用管理设备向个数据宿发送目标数据集合,能够将一份目标数据集合同时发送到多个数据宿,从而能够提升数据同步的效率。
在一种可能的实现方式中,所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合,包括:
所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定所述当前周期内的第一数据集合;
所述管理设备若确定存在所述当前周期的上一周期对应的第二数据集合,则确定所述第一数据集合相较于所述第二数据集合的增量数据集合,并将所述增量数据集合作为所述目标数据集合;所述第二数据集合是根据所述各源数据库在所述上一周期内发送的各源数据得到的。
在一种可能的实现方式中,每条数据记录包括索引值;
所述各源数据库之间的关联关系通过以下方式确定:
针对第一源数据中的第一数据记录,所述管理设备根据所述第一数据记录对应的索引值,若确定第二源数据中存在索引值与所述第一数据记录对应的索引值一致的第二数据记录,则根据所述第一数据记录在所述第一数据源中的位置和所述第二数据记录在所述第二数据源中的位置,确定所述第一数据记录与所述第二数据记录的关联关系;所述第一源数据为所述各源数据中任一源数据,所述第一数据记录为所述第一源数据包括的多条数据记录中任一数据记录;
根据所述每个源数据包括的多条数据记录之间的关联关系,确定所述各源数据库之间的关联关系。
在一种可能的实现方式中,所述各源数据库之间为异构数据库,所述异构数据库为数据库之间的结构不同的数据库;
所述各源数据的关联关系为基于结构化查询语言SQL的关联关系。
如此,采用通用的SQL语言,能够降低各异构源数据计算的难度,方便各异构源数据的逻辑计算,也便于数据的维护。
在一种可能的实现方式中,所述管理设备将所述目标数据集合发送至各数据宿,包括:
所述管理设备根据所述各数据宿的数据需求,从所述目标数据集合中确定符合所述各数据宿的数据需求的各目标数据;
所述管理设备将所述各目标数据对应发送至所述各数据宿。
在一种可能的实现方式中,还包括:
所述管理设备若确定不存在所述第二数据集合,则将所述第一数据集合作为所述目标数据集合。
在一种可能的实现方式中,所述管理设备将所述目标数据集合发送至各数据宿之后,还包括:
所述管理设备获取所述各数据宿的数据同步信息;所述数据同步信息包括数据增加记录、数据删除记录和数据修改记录中的至少一项;
所述管理设备根据所述各数据宿的数据同步信息,对所述各数据宿的同步情况进行监控。
如此,可以实时监测各数据宿的同步情况,便于管理设备统计分析。
在一种可能的实现方式中,所述管理设备接收各源数据库在当前周期内发送的源数据之后,还包括:
所述管理设备获取所述各源数据库的数据发送情况,所述数据发送情况是根据所述各源数据的数据发送耗时和/或数据发送量确定的;
所述管理设备根据所述各源数据库的数据发送情况,对所述各源数据库的同步情况进行监控。
如此,可以实时监测各源数据库的同步情况,便于管理设备统计分析。
在一种可能的实现方式中,所述管理设备将所述目标数据集合发送至各数据宿之后,还包括:
所述管理设备若确定所述目标数据集合发送失败,且发送失败的次数大于预设阈值,则向管理员发送告警消息,所述告警消息用于通知所述管理员所述目标数据集合发送失败。
如此,一旦目标数据集合多次出现发送失败的情况管理设备可以及时向管理员发送告警消息,以便管理员及时进行处理。
本发明实施例提供一种数据同步装置,所述装置应用于数据同步系统,所述系统包括管理设备、多个源数据库和至少一个数据宿;所述装置为管理设备,所述装置包括:
接收单元,用于接收各源数据库在当前周期内发送的各源数据;所述各源数据为所述各源数据库在所述当前周期内对应的全量数据;
处理单元,用于根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合;
发送单元,用于将所述目标数据集合发送至各数据宿,所述数据宿用于接收数据。
在一种可能的实现方式中,所述处理单元具体用于:
根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定所述当前周期内的第一数据集合;以及若确定存在所述当前周期的上一周期对应的第二数据集合,则确定所述第一数据集合相较于所述第二数据集合的增量数据集合,并将所述增量数据集合作为所述目标数据集合;所述第二数据集合是根据所述各源数据库在所述上一周期内发送的各源数据得到的。
在一种可能的实现方式中,每条数据记录包括索引值;
所述各源数据库之间的关联关系通过以下方式确定:
针对第一源数据中的第一数据记录,所述管理设备根据所述第一数据记录对应的索引值,若确定第二源数据中存在索引值与所述第一数据记录对应的索引值一致的第二数据记录,则根据所述第一数据记录在所述第一数据源中的位置和所述第二数据记录在所述第二数据源中的位置,确定所述第一数据记录与所述第二数据记录的关联关系;所述第一源数据为所述各源数据中任一源数据,所述第一数据记录为所述第一源数据包括的多条数据记录中任一数据记录;
根据所述每个源数据包括的多条数据记录之间的关联关系,确定所述各源数据库之间的关联关系。
在一种可能的实现方式中,所述各源数据库之间为异构数据库,所述异构数据库为数据库之间的结构不同的数据库;
所述各源数据的关联关系为基于结构化查询语言SQL的关联关系。
在一种可能的实现方式中,所述发送单元具体用于:
根据所述各数据宿的数据需求,从所述目标数据集合中确定符合所述各数据宿的数据需求的各目标数据;以及将所述各目标数据对应发送至所述各数据宿。
在一种可能的实现方式中,所述处理单元还用于:
若确定不存在所述第二数据集合,则将所述第一数据集合作为所述目标数据集合。
在一种可能的实现方式中,所述发送单元将所述增量数据集合发送至各数据宿之后,所述处理单元还用于:
获取所述各数据宿的数据同步信息;所述数据同步信息包括数据增加记录、数据删除记录和数据修改记录中的至少一项;以及根据所述各数据宿的数据同步信息,对所述各数据宿的同步情况进行监控。
在一种可能的实现方式中,所述接收单元接收各源数据库在当前周期内发送的源数据之后,所述处理单元还用于:
获取所述各源数据库的数据发送情况,所述数据发送情况是根据所述各源数据的数据发送耗时和/或数据发送量确定的;以及根据所述各源数据库的数据发送情况,对所述各源数据库的同步情况进行监控。
在一种可能的实现方式中,所述发送单元将所述目标数据集合发送至各数据宿之后,所述处理单元还用于:
若确定所述目标数据集合发送失败,且发送失败的次数大于预设阈值,则向管理员发送告警消息,所述告警消息用于通知所述管理员所述目标数据集合发送失败。
本申请实施例的还提供一种装置,该装置具有实现上文所描述的数据同步方法的功能。该功能可以通过硬件执行相应的软件实现,在一种可能的设计中,该装置包括:处理器、收发器、存储器;该存储器用于存储计算机执行指令,该收发器用于实现该装置与其他通信实体进行通信,该处理器与该存储器通过该总线连接,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行上文所描述的数据同步方法。
本发明实施例还提供一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现上述各种可能的实现方式中所描述的数据同步方法。
本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的数据同步方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例适用的系统架构图;
图2为本发明实施例提供的一种数据同步方法所对应的流程示意图;
图3为本发明实施例涉及到的整体性的流程示意图;
图4为本发明实施例提供的一种数据同步装置的结构示意图。
具体实施方式
下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例中。
图1示例性示出了本发明实施例适用的系统架构图。如图1所示,所述系统100包括管理设备101、多个源数据库(例如图1中示出的源数据库1021、源数据库1022和源数据库1023)以及至少一个数据宿(例如图1中示出的数据宿1031、数据宿1032和数据宿1033)。其中,管理设备101与任一源数据库可以通过网络连接,例如,管理设备101可以通过网络与源数据库1021、源数据库1022和源数据库1023中任一源数据库连接;管理设备101与任一数据宿可以通过网络连接,例如,管理设备101可以通过网络与数据宿1031、数据宿1032和数据宿1033中任一数据宿连接。
基于图1所示的系统架构,图2示例性示出了本发明实施例提供的一种数据同步方法所对应的流程示意图,具体包括如下步骤:
步骤201,管理设备接收各源数据库在当前周期内发送的各源数据。
步骤202,管理设备根据各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合。
步骤203,管理设备将目标数据集合发送至各数据宿,所述数据宿用于接收数据。
如此,本发明实施例设置管理设备,通过管理设备对各源数据库的各源数据进行计算,从而在管理设备层面确定目标数据集合,进而可以将目标数据集合发送给各数据宿。相比于现有技术中每个数据宿都需要分别计算目标数据集合的方式而言,本发明实施例中,只需要管理设备执行这一计算过程,在同步的过程进行目标数据集合的计算,使得数据宿能够直接获取目标数据集合,大大降低了整个系统的计算量,提升了数据同步的时效性;进一步地,采用管理设备向个数据宿发送目标数据集合,能够将一份目标数据集合同时发送到多个数据宿,从而能够提升数据同步的效率。
具体来说,步骤201中,各源数据可以为各源数据库在当前周期内对应的全量数据。举个例子,如表1所示,为各源数据的一种示例。其中,源数据库A对应的源数据为源数据库A在当前周期内对应的全量数据A,源数据库B对应的源数据为源数据库B在当前周期内对应的全量数据B,源数据库C对应的源数据为源数据库C在当前周期内对应的全量数据C。
表1:各源数据的一种示例
源数据库 源数据
源数据库A 全量数据A
源数据库B 全量数据B
源数据库C 全量数据C
进一步地,每个源数据可以包括多条数据记录。如表2所示,为源数据的一种示例。其中,源数据库A在当前周期内对应的全量数据A包括数据记录A1、数据记录A2和数据记录A3;源数据库B在当前周期内对应的全量数据B包括数据记录B1、数据记录B2和数据记录B3;源数据库C在当前周期内对应的全量数据C包括数据记录C1、数据记录C2和数据记录C3。
表2:源数据的一种示例
Figure BDA0001957528850000081
举个例子,如表3a所示,为源数据库A在当前周期内发送的各源数据的一种示例。如表3b所示,为源数据库B在当前周期内发送的各源数据的一种示例。根据表3a和表3b示出的内容可知,源数据库A在当前周期内发送的源数据(即源数据库A在当前周期内对应的全量数据)中包括:数据记录A1,张三语文分数为80分;数据记录A2,李四数学分数90分;数据记录A3,赵五外语分数为100分。源数据库B在当前周期内发送的源数据(即源数据库B在当前周期内对应的全量数据)中包括:数据记录B1,张三语文指导老师为王老师;数据记录B2,李四数学指导老师为钱老师;数据记录B3,赵五外语指导老师为孙老师。
表3a:源数据库A在当前周期内发送的源数据的一种示例
Figure BDA0001957528850000091
表3b:源数据库B在当前周期内发送的源数据的一种示例
Figure BDA0001957528850000092
更进一步地,每条数据记录可以包括索引值。以表3a示出的内容为例,姓名对应的内容可以为每条数据记录的索引值,即,数据记录A1的索引值为“张三”,数据记录A2的索引值为“李四”,数据记录A3的索引值为“赵五”。类似地,表3b中,数据记录B1的索引值也为“张三”,数据记录B2的索引值也为“李四”,数据记录B3的索引值也为“赵五”。
进一步地,在执行步骤201之后,管理设备还可以获取各源数据库的数据发送情况,进而可以根据各源数据库的数据发送情况,对各源数据库的同步情况进行监控。其中,数据发送情况可以是根据述各源数据的数据发送耗时和/或数据发送量确定的。如此,可以实时监测各源数据库的同步情况,便于管理设备统计分析。
步骤202中,根据各源数据库在当前周期内发送的各源数据,可以确定各源数据库之间的关联关系。具体地,针对第一源数据中的第一数据记录,管理设备可以根据一数据记录对应的索引值,若确定第二源数据中存在索引值与第一数据记录对应的索引值一致的第二数据记录,则根据第一数据记录在第一数据源中的位置和第二数据记录在第二数据源中的位置,确定第一数据记录与第二数据记录的关联关系;其中,第一源数据为各源数据中任一源数据,第一数据记录为第一源数据包括的多条数据记录中任一数据记录。进而,管理设备可以根据每个源数据包括的多条数据记录之间的关联关系,确定各源数据库之间的关联关系。
以表3a和表3b示出的内容为例,针对源数据库A发送的源数据中的数据记录A1,该数据记录A1的索引值为“张三”,并且在源数据库B发送的源数据中可以确定存在数据记录B1,该数据记录B1的索引值也为“张三”,进而,可以确定数据记录A1和数据记录B1之间存在关联关系,且这一关联关系可以根据数据记录A1在源数据库A发送的源数据中的位置(即第一行)和数据记录B1在源数据库B发送的源数据中的位置(即第一行)来确定,即,源数据库A发送的源数据中第一行的数据记录A1与源数据库B发送的源数据中第一行的数据记录B1存在关联关系。类似地,可以确定源数据库A发送的源数据中第二行的数据记录A2与源数据库B发送的源数据中第二行的数据记录B2存在关联关系,源数据库A发送的源数据中第三行的数据记录A3与源数据库B发送的源数据中第三行的数据记录B3存在关联关系。
进而,根据数据记录A1、数据记录A2和数据记录A3与数据记录B1、数据记录B2和数据记录B3之前关联关系,可以确定源数据库A和源数据库B之间的关联关系,即源数据库A的第一行与源数据库B第一行关联,源数据库A的第二行与源数据库B第二行关联,源数据库A的第三年行与源数据库B第三行关联。
本发明实施例中,管理设备可以根据各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,可以得到目标数据集合。
具体地,管理设备可以根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定当前周期内的第一数据集合。其中,第一数据集合可以是指各源数据库发送的各源数据的集合。以表3a和表3b示出的内容为例,根据上述所描述的源数据库A和源数据库B之间的关联关系以及表3a和表3b中包括的各数据记录,可以得到如表4所示的第一数据集合的一种示例。
表4:第一数据集合的一种示例
Figure BDA0001957528850000111
需要说明的是,上文所举的例子中,各源数据库之间可以为同构数据库。在其它可能的示例中,各源数据库之间也可以为异构数据库,异构数据库为数据库之间的结构不同的数据库。进而,各源数据的关联关系为基于结构化查询语言SQL的关联关系。具体来说,可以分析各异构源数据库,映射成对应的数据表,并对各个异构源数据的关系进行分析,输出符合要求的SQL语句。如此,采用通用的SQL语言,能够降低各异构源数据计算的难度,方便各异构源数据的逻辑计算,也便于数据的维护。
进一步地,管理设备首先可以判断是否存在当前周期的上一周期对应的第二数据集合,若存在,则可以确定第一数据集合相较于第二数据集合的增量数据集合,并将增量数据集合作为目标数据集合;若不存在,则可以将第一数据集合作为目标数据集合。其中,第二数据集合可以是根据各源数据库在上一周期内发送的各源数据得到的,具体的获得方式与第一数据集合的获得方式类型,此处不再详细描述。
本发明实施例中,只需要管理设备在同步的过程进行增量数据集合的计算,使得数据宿能够直接获取增量数据集合,大大降低了整个系统的计算量,提升了数据同步的时效性;进一步地,采用管理设备向个数据宿发送增量数据集合,能够将一份增量数据集合同时发送到多个数据宿,从而能够提升数据同步的效率。
举个例子,如5所示,为第二数据集合的一种示例。其中,第二数据集合中的第1条数据记录为,张三语文分数为80分,指导老师为王老师;李四数学分数为90分,指导老师为钱老师。
表5:第二数据集合的一种示例
Figure BDA0001957528850000121
进一步地,根据表4和表5示出的内容,可以得到如表6所示的增量数据集合的一种示例即可以确定增量数据集合为:赵五外语100分,指导老师为孙老师。
表6:增量数据集合的一种示例
Figure BDA0001957528850000122
步骤203中,管理设备可以直接将目标数据集合发送至各数据宿,其中,数据宿可以用于接收数据。
进一步地,管理设备也可以根据各数据宿的数据需求,从目标数据集合中确定符合各数据宿的数据需求的各目标数据,进而可以将各目标数据对应发送至各数据宿。举个例子,以表6示出的增量数据集合为例,若数据宿A的数据需求为需要科目和分数,则可以确定数据宿A对应的目标数据为:赵五外语分数为100分;若数据宿B的数据需求为需要科目和指导老师,则可以确定数据宿B对应的目标数据为:赵五外语指导老师为孙老师。
在执行步骤203之后,管理设备可以获取各数据宿的数据同步信息,进而可以根据各数据宿的数据同步信息,对各数据宿的同步情况进行监控。其中,数据同步信息可以包括数据增加记录、数据删除记录和数据修改记录中的至少一项。如此,可以实时监测目标数据集合写入到各数据宿的过程,监控各数据宿的同步情况,比如监控数据增加记录、数据删除记录和数据修改记录等,便于管理设备统计分析;进而,本发明实施例中,通过管理设备监测数据同步过程,使得整个数据同步过程对于管理员而言是透明化的,从而便于管理员实时掌控数据ton公布情况。
进一步地,在执行步骤203之后,管理设备若确定目标数据集合发送失败,且发送失败的次数大于预设阈值,则向管理员发送告警消息,其中,告警消息用于通知管理员目标数据集合发送失败。如此,一旦目标数据集合多次出现发送失败的情况管理设备可以及时向管理员发送告警消息,以便管理员及时进行处理。
为了更清楚地介绍上述数据同步方法,下面结合图3,对本发明实施例中所涉及到的流程进行整体性说明。如图3所示,可以包括以下步骤:
步骤301,各源数据库在当前周期内向管理设备发送各源数据。
步骤302,管理设备判断各源数据是否全部发送完成,若未全部发送完成,则执行步骤303;否则,执行步骤305。
步骤303,管理设备判断各源数据的数据发送耗时是否大于预设阈值,若大于,则执行步骤304;否则,返回步骤302。
步骤304,管理设备尝试重新接收数据发送耗时大于预设阈值的源数据。
步骤305,管理设备根据各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定当前周期内的第一数据集合。
步骤306,管理设备判断是否存在当前周期的上一周期对应的第二数据集合,若存在,执行步骤307;否则,执行步骤310。
步骤307,管理设备确定第一数据集合相较于第二数据集合的增量数据集合,并将增量数据集合作为目标数据集合。
步骤308,管理设备根据各数据宿的数据需求,从目标数据集合中确定符合所述各数据宿的数据需求的各目标数据。
步骤309,管理设备将各目标数据对应发送至各数据宿。
步骤310,管理设备将第一数据集合作为所述目标数据集合,并根据各数据宿的数据需求,从目标数据集合中确定符合所述各数据宿的数据需求的各目标数据。
步骤311,管理设备将各目标数据发送至各数据宿。
针对上述步骤301至步骤311所描述的内容,下面以异构源数据库为例,进行举例说明。首先,管理设备可以分析各异构源数据库,映射成对应的源数据表,并对各个异构源数据的关系进行分析,输出符合要求的SQL语句;然后,管理设备可以选择一种稳定的内存数据库方案(例如h2),根据异构源数据对应的源数据表,创建内存数据库;再然后,管理设备可以执行定时任务,将各个异构源数据分别同步到内存数据库中;进而,管理设备可以检查各个异构源数据是否已全部同步到内存数据库相应表中,如果全部同步,则开始计算,具体地,根据上文输出的SQL语句,在内存数据库中执行查询,生成当前周期的全量数据,然后判断是否存在上一周期对应的全量数据,如果不存在,则可以直接推送当前周期的全量数据到各数据宿中;如果存在,则可以将当前周期的全量数据与上一周期的全量数据做比较,生成增量数据集合,并将增量数据集合推送到各数据宿中。进一步地,管理设备还可以检查各数据宿更新的数据于内存数据库中生成的数据在数量和内容上是否一致,如果一致,则表明同步成功。
基于同样的发明构思,图4示例性示出了本发明实施例提供的一种数据同步装置的结构示意图,该装置可以应用于数据同步系统,该系统包括管理设备、多个源数据库和至少一个数据宿;该装置可以为管理设备,如图4所示,该装置包括接收单元401、处理单元402、发送单元403;其中,
接收单元401,用于接收各源数据库在当前周期内发送的各源数据;所述各源数据为所述各源数据库在所述当前周期内对应的全量数据;
处理单元402,用于根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定所述当前周期内的第一数据集合;若确定存在所述当前周期的上一周期对应的第二数据集合,则比较所述第二数据集合和所述第一数据集合,得到增量数据集合;所述第二数据集合是根据所述各源数据库在所述上一周期内发送的各源数据得到的;
发送单元403,用于将所述增量数据集合发送至各数据宿。
在一种可能的实现方式中,每条数据记录包括索引值;
所述各源数据库之间的关联关系通过以下方式确定:
针对第一源数据中的第一数据记录,所述管理设备根据所述第一数据记录对应的索引值,若确定第二源数据中存在索引值与所述第一数据记录对应的索引值一致的第二数据记录,则根据所述第一数据记录在所述第一数据源中的位置和所述第二数据记录在所述第二数据源中的位置,确定所述第一数据记录与所述第二数据记录的关联关系;所述第一源数据为所述各源数据中任一源数据,所述第一数据记录为所述第一源数据包括的多条数据记录中任一数据记录;
根据所述每个源数据包括的多条数据记录之间的关联关系,确定所述各源数据库之间的关联关系。
在一种可能的实现方式中,所述各源数据库之间为异构数据库;
所述各源数据的关联关系为基于结构化查询语言SQL的关联关系。
在一种可能的实现方式中,所述发送单元403具体用于:
根据所述各数据宿的数据需求,从所述增量数据集合中确定符合所述各数据宿的数据需求的各目标增量数据;以及将所述各目标增量数据对应发送至所述各数据宿。
在一种可能的实现方式中,所述处理单元402还用于:
若确定不存在所述第二数据集合,则将所述第一数据集合发送至各数据宿。
在一种可能的实现方式中,所述发送单元403将所述增量数据集合发送至各数据宿之后,所述处理单元402还用于:
获取所述各数据宿的数据同步信息;所述数据同步信息包括数据增加记录、数据删除记录和数据修改记录中的至少一项;以及根据所述各数据宿的数据同步信息,对所述各数据宿的同步情况进行监控。
在一种可能的实现方式中,所述接收单元401接收各源数据库在当前周期内发送的源数据之后,所述处理单元402还用于:
获取所述各源数据库的数据发送情况,所述数据发送情况是根据所述各源数据的数据发送耗时和/或数据发送量确定的;以及根据所述各源数据库的数据发送情况,对所述各源数据库的同步情况进行监控。
本申请实施例的还提供一种装置,该装置具有实现上文所描述的数据同步方法的功能。该功能可以通过硬件执行相应的软件实现,在一种可能的设计中,该装置包括:处理器、收发器、存储器;该存储器用于存储计算机执行指令,该收发器用于实现该装置与其他通信实体进行通信,该处理器与该存储器通过该总线连接,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行上文所描述的数据同步方法。
本发明实施例还提供一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现上述各种可能的实现方式中所描述的数据同步方法。
本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的数据同步方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (18)

1.一种数据同步方法,其特征在于,所述方法应用于数据同步系统,所述系统包括管理设备、多个源数据库和至少一个数据宿;所述方法包括:
所述管理设备接收各源数据库在当前周期内发送的各源数据;所述各源数据为所述各源数据库在所述当前周期内对应的全量数据;
所述管理设备判断所述各源数据是否全部发送完成,若未全部发送完成,则判断各源数据中是否存在数据发送耗时大于预设阈值的目标源数据,若存在,则重新接收所述目标源数据,若不存在,则重复执行判断所述各源数据是否全部发送完成的操作,直至确定各源数据全部发送完成;
所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合;所述目标数据集合中的一条数据记录在一个或多个源数据库的源数据中具有同一索引值;
所述管理设备根据各数据宿的数据需求,从所述目标数据集合中确定符合所述各数据宿中的数据需求的各目标数据,将所述各目标数据对应发送至所述各数据宿,所述各数据宿用于接收数据。
2.根据权利要求1所述的方法,其特征在于,所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合,包括:
所述管理设备根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定所述当前周期内的第一数据集合;
所述管理设备若确定存在所述当前周期的上一周期对应的第二数据集合,则确定所述第一数据集合相较于所述第二数据集合的增量数据集合,并将所述增量数据集合作为所述目标数据集合;所述第二数据集合是根据所述各源数据库在所述上一周期内发送的各源数据得到的。
3.根据权利要求1所述的方法,其特征在于,每条数据记录包括索引值;
所述各源数据库之间的关联关系通过以下方式确定:
针对第一源数据中的第一数据记录,所述管理设备根据所述第一数据记录对应的索引值,若确定第二源数据中存在索引值与所述第一数据记录对应的索引值一致的第二数据记录,则根据所述第一数据记录在所述第一数据源中的位置和所述第二数据记录在所述第二数据源中的位置,确定所述第一数据记录与所述第二数据记录的关联关系;所述第一源数据为所述各源数据中任一源数据,所述第一数据记录为所述第一源数据包括的多条数据记录中任一数据记录;
根据所述每个源数据包括的多条数据记录之间的关联关系,确定所述各源数据库之间的关联关系。
4.根据权利要求2所述的方法,其特征在于,所述各源数据库之间为异构数据库,所述异构数据库为数据库之间的结构不同的数据库;
所述各源数据的关联关系为基于结构化查询语言SQL的关联关系。
5.根据权利要求2所述的方法,其特征在于,还包括:
所述管理设备若确定不存在所述第二数据集合,则将所述第一数据集合作为所述目标数据集合。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述管理设备将所述目标数据集合发送至各数据宿之后,还包括:
所述管理设备获取所述各数据宿的数据同步信息;所述数据同步信息包括数据增加记录、数据删除记录和数据修改记录中的至少一项;
所述管理设备根据所述各数据宿的数据同步信息,对所述各数据宿的同步情况进行监控。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述管理设备接收各源数据库在当前周期内发送的源数据之后,还包括:
所述管理设备获取所述各源数据库的数据发送情况,所述数据发送情况是根据所述各源数据的数据发送耗时和/或数据发送量确定的;
所述管理设备根据所述各源数据库的数据发送情况,对所述各源数据库的同步情况进行监控。
8.根据权利要求1至5中任一项所述的方法,其特征在于,所述管理设备将所述目标数据集合发送至各数据宿之后,还包括:
所述管理设备若确定所述目标数据集合发送失败,且发送失败的次数大于预设阈值,则向管理员发送告警消息,所述告警消息用于通知所述管理员所述目标数据集合发送失败。
9.一种数据同步装置,其特征在于,所述装置应用于数据同步系统,所述系统包括管理设备、多个源数据库和至少一个数据宿;所述装置为管理设备,所述装置包括:
接收单元,用于接收各源数据库在当前周期内发送的各源数据;所述各源数据为所述各源数据库在所述当前周期内对应的全量数据;
处理单元,用于判断所述各源数据是否全部发送完成,若未全部发送完成,则判断各源数据中是否存在数据发送耗时大于预设阈值的目标源数据,若存在,则重新接收所述目标源数据,若不存在,则重复执行判断所述各源数据是否全部发送完成的操作,直至确定各源数据全部发送完成;在确定各源数据全部发送完成后,根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,进行计算,得到目标数据集合;所述目标数据集合中的一条数据记录在一个或多个源数据库的源数据中具有同一索引值;
发送单元,用于根据所述各数据宿的数据需求,从所述目标数据集合中确定符合所述各数据宿的数据需求的各目标数据;以及将所述各目标数据对应发送至所述各数据宿,所述各数据宿用于接收数据。
10.根据权利要求9所述的装置,其特征在于,所述处理单元具体用于:
根据所述各源数据库之间的关联关系以及每个源数据包括的多条数据记录,确定所述当前周期内的第一数据集合;以及若确定存在所述当前周期的上一周期对应的第二数据集合,则确定所述第一数据集合相较于所述第二数据集合的增量数据集合,并将所述增量数据集合作为所述目标数据集合;所述第二数据集合是根据所述各源数据库在所述上一周期内发送的各源数据得到的。
11.根据权利要求9所述的装置,其特征在于,每条数据记录包括索引值;
所述各源数据库之间的关联关系通过以下方式确定:
针对第一源数据中的第一数据记录,所述管理设备根据所述第一数据记录对应的索引值,若确定第二源数据中存在索引值与所述第一数据记录对应的索引值一致的第二数据记录,则根据所述第一数据记录在所述第一数据源中的位置和所述第二数据记录在所述第二数据源中的位置,确定所述第一数据记录与所述第二数据记录的关联关系;所述第一源数据为所述各源数据中任一源数据,所述第一数据记录为所述第一源数据包括的多条数据记录中任一数据记录;
根据所述每个源数据包括的多条数据记录之间的关联关系,确定所述各源数据库之间的关联关系。
12.根据权利要求10所述的装置,其特征在于,所述各源数据库之间为异构数据库,所述异构数据库为数据库之间的结构不同的数据库;
所述各源数据的关联关系为基于结构化查询语言SQL的关联关系。
13.根据权利要求10所述的装置,其特征在于,所述处理单元还用于:
若确定不存在所述第二数据集合,则将所述第一数据集合作为所述目标数据集合。
14.根据权利要求9至13中任一项所述的装置,其特征在于,所述发送单元将所述目标数据集合发送至各数据宿之后,所述处理单元还用于:
获取所述各数据宿的数据同步信息;所述数据同步信息包括数据增加记录、数据删除记录和数据修改记录中的至少一项;以及根据所述各数据宿的数据同步信息,对所述各数据宿的同步情况进行监控。
15.根据权利要求9至13中任一项所述的装置,其特征在于,所述接收单元接收各源数据库在当前周期内发送的源数据之后,所述处理单元还用于:
获取所述各源数据库的数据发送情况,所述数据发送情况是根据所述各源数据的数据发送耗时和/或数据发送量确定的;以及根据所述各源数据库的数据发送情况,对所述各源数据库的同步情况进行监控。
16.根据权利要求9至13中任一项所述的装置,其特征在于,所述发送单元将所述目标数据集合发送至各数据宿之后,所述处理单元还用于:
若确定所述目标数据集合发送失败,且发送失败的次数大于预设阈值,则向管理员发送告警消息,所述告警消息用于通知所述管理员所述目标数据集合发送失败。
17.一种计算机可读存储介质,其特征在于,所述存储介质存储有指令,当所述指令在计算机上运行时,使得计算机实现执行权利要求1至8中任一项所述的方法。
18.一种计算机设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至8中任一权利要求所述的方法。
CN201910071849.0A 2019-01-25 2019-01-25 一种数据同步方法及装置 Expired - Fee Related CN109829016B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201910071849.0A CN109829016B (zh) 2019-01-25 2019-01-25 一种数据同步方法及装置
PCT/CN2019/077238 WO2020151054A1 (zh) 2019-01-25 2019-03-06 一种数据同步方法及装置
EP19772639.1A EP3716094A1 (en) 2019-01-25 2019-03-06 Data synchronization method and apparatus
US16/588,798 US20200242131A1 (en) 2019-01-25 2019-09-30 Method and device for synchronizing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910071849.0A CN109829016B (zh) 2019-01-25 2019-01-25 一种数据同步方法及装置

Publications (2)

Publication Number Publication Date
CN109829016A CN109829016A (zh) 2019-05-31
CN109829016B true CN109829016B (zh) 2021-06-01

Family

ID=66862392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910071849.0A Expired - Fee Related CN109829016B (zh) 2019-01-25 2019-01-25 一种数据同步方法及装置

Country Status (3)

Country Link
EP (1) EP3716094A1 (zh)
CN (1) CN109829016B (zh)
WO (1) WO2020151054A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909075B (zh) * 2019-10-30 2022-08-09 北京达佳互联信息技术有限公司 数据的同步方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369878A (zh) * 2007-08-14 2009-02-18 大唐移动通信设备有限公司 时分双工系统中同步混合自动重传请求方法和装置
CN105450720A (zh) * 2014-09-30 2016-03-30 高德软件有限公司 一种gps数据采集及传输方法和装置
CN106649632A (zh) * 2016-12-07 2017-05-10 北京众享比特科技有限公司 数据同步方法及系统
CN109033391A (zh) * 2018-07-31 2018-12-18 北京嘀嘀无限科技发展有限公司 一种多数据中心之间数据同步方法、系统及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101102577B (zh) * 2006-07-07 2010-12-08 中兴通讯股份有限公司 无线通信基站系统前后台数据库表数据增量同步方法
CN103186624B (zh) * 2011-12-31 2017-10-20 亿阳信通股份有限公司 一种数据同步方法和数据同步装置
CN103729204B (zh) * 2012-10-16 2017-11-24 阿里巴巴集团控股有限公司 一种网络平台中应用更新的数据在线迁移方法和装置
CN102902812B (zh) * 2012-10-22 2015-05-27 飞天诚信科技股份有限公司 一种数据库远程同步的实现方法
CN104778175A (zh) * 2014-01-13 2015-07-15 世纪禾光科技发展(北京)有限公司 一种实现异构数据库数据同步的方法及系统
CN104317921B (zh) * 2014-10-29 2017-10-17 北京思特奇信息技术股份有限公司 一种跨数据库数据同步系统及方法
CN104598531B (zh) * 2014-12-25 2019-05-07 广东电子工业研究院有限公司 一种基于触发器的异构关系型数据库间增量数据迁移方法
CN104573100B (zh) * 2015-01-29 2017-11-14 无锡江南计算技术研究所 一种带自增量标识的分布式数据库同步方法
CN105554114B (zh) * 2015-12-17 2018-11-02 深圳市从晶科技有限公司 一种数据同步方法及数据同步固件平台
CN108205560B (zh) * 2016-12-19 2021-12-14 腾讯科技(深圳)有限公司 一种数据同步方法以及装置
CN107657002A (zh) * 2017-09-20 2018-02-02 北京九桥同步软件有限公司 文件同步方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369878A (zh) * 2007-08-14 2009-02-18 大唐移动通信设备有限公司 时分双工系统中同步混合自动重传请求方法和装置
CN105450720A (zh) * 2014-09-30 2016-03-30 高德软件有限公司 一种gps数据采集及传输方法和装置
CN106649632A (zh) * 2016-12-07 2017-05-10 北京众享比特科技有限公司 数据同步方法及系统
CN109033391A (zh) * 2018-07-31 2018-12-18 北京嘀嘀无限科技发展有限公司 一种多数据中心之间数据同步方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
EP3716094A4 (en) 2020-09-30
EP3716094A1 (en) 2020-09-30
CN109829016A (zh) 2019-05-31
WO2020151054A1 (zh) 2020-07-30

Similar Documents

Publication Publication Date Title
CN112650762B (zh) 数据质量监控的方法、装置、电子设备以及存储介质
CN111339175B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN110708212B (zh) 分布式系统中调用链路的追踪方法及装置
CN101952799A (zh) 一致地信令状态变更
CN112751726A (zh) 一种数据处理方法、装置、电子设备和存储介质
CN111400288A (zh) 数据质量检查方法及系统
CN111966289A (zh) 基于Kafka集群的分区优化方法和系统
JP2020057416A (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN112559831A (zh) 链路监控方法、装置、计算机设备及介质
CN108509453B (zh) 一种信息处理方法及装置
CN103324713A (zh) 多级服务器中的数据处理方法、装置和数据处理系统
CN113242157A (zh) 一种分布式处理环境下的集中式数据质量监测方法
CN109829016B (zh) 一种数据同步方法及装置
US20200242131A1 (en) Method and device for synchronizing data
CN114416703A (zh) 数据完整性自动监控方法、装置、设备及介质
CN117336135A (zh) 数据传输方法、装置、存储介质以及电子设备
CN109408544B (zh) 基于引擎的数据聚合方法、装置及存储介质、服务器
CN109947828B (zh) 一种处理报表数据的方法和装置
CN105446707B (zh) 一种数据转换方法
CN116303320A (zh) 基于日志文件的实时任务管理方法、装置、设备及介质
CN115905392A (zh) 流批一体的数据处理方法、装置、设备及存储介质
CN110941536B (zh) 监控方法及系统、第一服务器集群
CN114048231A (zh) 数据处理方法、装置及计算机程序产品
CN113094241A (zh) 一种实时程序准确性的确定方法、装置、设备及存储介质
CN110716726A (zh) 客户端更新方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210601

Termination date: 20220125

CF01 Termination of patent right due to non-payment of annual fee