WO2020119709A1

WO2020119709A1 - 数据合并的实现方法、装置、系统及存储介质

Info

Publication number: WO2020119709A1
Application number: PCT/CN2019/124491
Authority: WO
Inventors: 司文武
Original assignee: 中兴通讯股份有限公司
Priority date: 2018-12-11
Filing date: 2019-12-11
Publication date: 2020-06-18
Also published as: CN111309799A

Abstract

一种数据合并的实现方法、装置、系统及存储介质，其方法包括：在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间（S101）；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果（S102）；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致（S103）。

Description

数据合并的实现方法、装置、系统及存储介质

本公开要求享有2018年12月11日提交的名称为“数据合并的实现方法、装置、系统及存储介质”的中国专利申请CN201811510709.0的优先权，其全部内容通过引用并入本文中。

技术领域

本公开涉及分布式数据技术领域，尤其涉及一种分布式数据库副本间数据合并的实现方法、装置、系统及存储介质。

背景技术

UDSF(Unstructured Data Storage network function，非结构化数据存储功能)作为5G核心网中存储非结构化数据的数据库网元，面临诸多性能需求：多业务共享访问库、极低的响应时延。因此，要求UDSF网元具备更高的系统吞吐量、数据存储容量、极低的响应时延。

分布式数据库(DDB，Distributed Database)技术是解决5G核心网对数据存取高性能要求的必然技术手段。分布式数据库系统中，副本的存取模式，可分为主备模式、主主模式。其中，在主备模式下，所有副本均可读，只有在选举出的主副本上进行写；在主主模式下，所有副本均可读、写。因此，主主访问模式，具备更高的访问性能。但主主模式下，必须解决所引入的新的场景问题：

主主模式下，副本自身日志缓冲区溢出时，导致其它副本无法读取连续日志，而无法应用后续日志，造成副本间数据不一致；

主主模式下，同一数据在多个副本上并发修改，副本间应用日志时，发现被修改数据最近操作时间与日志中携带时间不一，从而无法应用日志。

发明内容

本公开的主要目的在于提供一种分布式数据库副本间数据合并的实现方法、装置、系统及存储介质，以解决分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题，实现副本间数据的一致性。

为实现上述目的，本公开提供的一种数据合并的实现方法，所述方法应用于分布式数据库系统，所述方法包括：在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。

本公开实施例还提出一种数据合并的实现装置，包括：比较模块，用于在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；保存模块，用于根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；合并操作模块，用于基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。

本公开实施例还提出一种数据合并的实现系统，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的数据合并的实现方法的步骤。

本公开实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的数据合并的实现方法的步骤。

附图说明

图1是本公开数据合并的实现方法第一实施例的流程示意图；

图2是本公开数据合并的实现方法第二实施例的流程示意图；

图3是本公开数据合并的实现方法第三实施例的流程示意图；

图4是本公开数据合并的实现方法第四实施例的流程示意图；

图5是本公开数据合并的实现方法第五实施例的流程示意图；

图6是本公开数据合并的实现方法第六实施例的流程示意图；

图7是本公开数据合并的实现方法第七实施例的流程示意图；

图8是本公开实施例运行环境涉及的系统架构示意图。

本公开目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

为了使本公开的技术方案更加清楚、明了，下面将结合附图作进一步详述。

具体实施方式

应当理解，此处所描述的实施例仅仅用以解释本公开，并不用于限定本公开。

本公开实施例的主要解决方案是：在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理，保证了副本间数据的一致性。

由于一些情况中，分布式数据库在主主模式下存取副本数据时，若副本自身日志缓冲区溢出，会导致其它副本无法读取连续日志，而无法应用后续日志，造成副本间数据不一致；或者，同一数据在多个副本上并发修改，副本间应用日志时，由于被修改数据最近操作时间与日志中携带时间不一，从而导致数据更新冲突而无法应用日志，也会造成副本间数据不一致。

本公开提供一种解决方案，可以解决分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题，实现副本间数据的一致性。

在一个实施例中，如图1所示，本公开第一实施例提出一种数据合并的实现方法，所述方法应用于分布式数据库系统，所述方法包括：

步骤S101，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；

本实施例方案涉及分布式数据库中副本间数据的复制技术。在分布式系统中，通过日志复制，以保证多个副本间数据的一致性。

其中，本实施例方案应用场景为副本存取模式的主主工作模式，主主工作模式下，所有副本均可读、写。因此，主主访问模式，具备更高的访问性能。

由于一些情况中，在副本存取模式为主主工作模式下，当日志无法接续或者多主访问导致数据更新冲突，造成副本间数据不一致。本公开实施例提出一种解决冲突的数据合并方法，实现副本间数据的一致性。

在一个实施例中，在分布式数据库处于主主工作模式进行副本存取时，若检测到多个副本间数据不一致，则比较不同副本上数据最近操作的时间。

步骤S102，根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；

步骤S103，基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。

根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果。基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。

举例如下：在日志缓冲区溢出导致日志不连续，或者副本间无法进行日志应用时，则发起副本间数据合并；如果两个副本均发生数据更新，则发起双向数据合并。

其中，副本间数据的相互合并操作不仅可以包括：数据库中的单条记录发生合并，还可以是整个分布式数据库系统的数据合并。

由于分布式数据库在主主模式下存取副本数据时，若副本自身日志缓冲区溢出，会导致其它副本无法读取连续日志，而无法应用后续日志，造成副本间数据不一致；或者，同一数据在多个副本上并发修改，副本间应用日志时，由于被修改数据最近操作时间与日志中携带时间不一，从而导致数据更新冲突而无法应用日志，也会造成副本间数据不一致。

本实施例通过上述方案，在上述场景发生时，比较不同副本上数据最近操作的时间，保留数据最后更新的结果，使得多副本上数据并发操作的最终结果不会丢失，通过副本间数据的相互合并，使得副本间数据保持一致。

如图2所示，本公开第二实施例提出一种数据合并的实现方法，基于上述图1所示的实施例，在上述步骤S101，所述在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间的步骤之前还包括：

步骤S100，在分布式数据库处于主主工作模式进行副本存取时，检测多个副本间数据是否不一致。

相比上述图1所示的实施例，本实施例还包括检测多个副本间数据是否不一致的方案。其中，根据不同的应用场景，可以采用如下方案来检测多个副本间数据是否不一致。

作为一种实现方式，在分布式数据库处于主主工作模式进行副本存取时，检测是否存在副本自身日志缓冲区溢出，导致其它副本无法读取连续日志；

若是，则检测到多个副本间数据不一致。

作为另一种实现方式，在分布式数据库处于主主工作模式进行副本存取时，若同一数据在多个副本上并发修改，并在副本间应用日志时，检测被修改数据最近操作时间与日志中携带时间是否一致，若不一致，则检测到多个副本间数据不一致。

本实施例通过上述方案，在分布式数据库处于主主工作模式进行副本存取时，检测多个副本间数据是否不一致，在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。

如图3所示，本公开第三实施例提出一种数据合并的实现方法，基于上述图1或图2 所示的实施例，所述方法还包括：

步骤S104，在接收到删除请求或应用其它副本的删除操作日志，以删除当前副本上的数据时，将当前副本上被删除数据的主键及删除操作时间，保存于预设的主键存储队列。

相比上述图1或图2所示的实施例，本实施例还包括：删除副本数据的方案。

在一个实施例中，本实施例预先设置有一主键存储队列(DEL_PK_QUE，Deleted data Primary Key Queue)，该主键存储队列用于保存因删除操作请求或应用删除操作日志而被删除数据的主键及删除操作时间。

在本实施例中，在收到删除请求或应用其它副本的删除操作日志，以删除副本上的数据时，将被删除数据的主键及删除操作时间，保存于DEL_PK_QUE中。

其中，日志包含操作时间戳、操作类别、操作的key及value、对于非增加操作的日志，还包含数据最近一次被操作的时间戳。

以两个副本(Replica_1---副本1，Replica_2---副本2)为例，进行副本数据删除操作或者应用删除操作日志，存储数据的主键及操作时间的过程如下：步骤1，副本1收到删除数据的请求；步骤2，副本1从数据库中删除数据；步骤3，副本1将删除数据的主键及删除操作时间插入DEL_PK_QUE中；步骤4，副本1产生本次删除操作的日志(日志包含如下信息：本次操作时间戳、操作类别、操作的key及value，对于非增加操作的日志，还包含数据最近一次被操作的时间戳)；步骤5，副本1向删除请求发起者发送删除操作响应；步骤6，副本1本次删除操作的日志被同步到副本2；步骤7，副本2应用删除操作日志；只有待删数据存在且日志携带删除操作时间大于数据最近操作时间，才删除数据；步骤8，副本2上数据被删除，则将删除数据的主键及删除操作时间插入DEL_PK_QUE中。

本实施例通过上述方案，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与其他操作的合并处理，保证了副本间数据的一致性。

如图4所示，本公开第四实施例提出一种数据合并的实现方法，基于上述图3所示的实施例，所述方法还包括：

步骤S105，在接收到增加数据请求，以在副本上增加新的数据时，使用新增数据的主键从所述主键存储队列中删除相应的队列元素。

相比上述图3所示的实施例，本实施例还包括：增加新数据的操作。

在一个实施例中，在接收到增加数据请求，以在副本上增加新的数据时，使用新增数据的主键从DEL_PK_QUE中删除可能存在的队列元素。

还是以两个副本(Replica_1---副本1，Replica_2---副本2)为例，进行副本增加数据操作、应用增加操作日志，删除、查询DEL_PK_QUE处理的过程如下：步骤1.副本1收到增加数据请求；步骤2.副本1将数据插入数据库；步骤3.副本1使用数据的主键从DEL_PK_QUE中删除可能存在的删除信息(性能考虑,此步骤可以忽略)；步骤4.副本1产生本次增加操作的日志；步骤5.副本1向增加请求发起者发送增加操作响应；步骤6.副本1本次增加操作的日志被同步到副本2；步骤7.副本2应用增加操作日志；查询DEL_PK_QUE，如果存在删除操作信息且删除操作时间大于日志携带增加数据操作时间，则不插入数据，其它情况，插入数据；步骤8.副本2上数据被插入，且DEL_PK_QUE中存在删除操作信息，则从DEL_PK_QUE中删除插入数据的删除信息(性能考虑,此步骤可以忽略)。

本实施例通过上述方案，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增加操作的合并处理，保证了副本间数据的一致性。

如图5所示，本公开第五实施例提出一种数据合并的实现方法，基于上述图4所示的实施例，所述方法还包括：步骤S106，在副本应用增加操作日志时，使用待新增数据的主键查询所述主键存储队列；如果所述主键存储队列中不存在对应待新增数据的删除操作记录，则在当前副本中插入对应的待新增数据；否则，比较应用的增加操作日志中携带的增加操作时间和所述主键存储队列中保存的删除操作时间，若前者大于后者，则插入对应的待新增数据；若前者不大于后者，则不插入对应的待新增数据。

相比上述实施例，本实施例还包括：应用增加操作日志的操作。

在一个实施例中，在副本应用增加操作日志时，使用待新增数据的主键查询DEL_PK_QUE，如果不存在对应待新增数据的删除操作，则在当前副本中插入新增数据；否则，比较日志中携带的增加操作时间和DEL_PK_QUE中保存的删除操作时间，若前者大于后者，则插入新增数据；若前者不大于后者，则不插入新增数据。

本实施例通过上述方案，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理，保证了副本间数据的一致性。

如图6所示，本公开第六实施例提出一种数据合并的实现方法，基于上述图5所示的实施例，所述方法还包括：

步骤S107，在副本应用修改操作日志时，比较应用的修改操作日志中携带的数据被修改的操作时间和被修改数据的最近操作时间；若被修改数据的最近操作时间不等于修改操作日志中携带的数据被修改的操作时间，则针对该条数据发起数据合并操作。

相比上述图5所示的实施例，本实施例还包括应用修改操作日志的方案。

在一个实施例中，在副本应用修改操作日志时，比较发现被修改数据的最近操作时间不等于日志中携带的数据被修改前的操作时间，则针对该条数据发起数据合并。

还是以两个副本(Replica_1---副本1，Replica_2---副本2)为例，进行副本应用修改操作日志，触发单条数据合并处理的过程如下：步骤1.副本2上产生了修改操作的日志；步骤2.副本2上的修改日志被同步到副本1；步骤3.副本1上应用日志发生冲突：修改日志中携带的副本2上数据被修改前的操作时间不等于副本1上该数据最近一次的操作时间；步骤4.副本1向副本2读取日志应用冲突涉及修改的数据；步骤5.副本1收到副本2上读取数据；步骤6.比较两个副本中数据的操作时间，选择操作时间最新的数据作为修改结果；步骤7.当前日志应用冲突解决，使用当前日志继续读取副本2的后续日志；步骤8.副本1与副本2间进入正常的日志复制应用流程。

此外，在另一实施例中，本公开实施例方案还可以进行副本间数据恢复处理。

副本间数据恢复处理的过程可以举例如下：步骤1.副本1向副本2发送恢复DEL_PK_QUE中所有数据的请求；步骤2.副本1收到副本2发送的读取DEL_PK_QUE中数据的响应；步骤3.副本1将步骤2中返回的删除操作信息插DEL_PK_QUE中；步骤4.副本1向副本2发送恢复所有数据请求，即从副本2中该副本的所有数据；步骤5.副本1收到副本2发送的若干读取数据的响应；步骤6.副本1将步骤5中返回的数据插入数据库中；步骤7.副本1数据恢复完成，向副本2读取数据恢复期间可能产生的日志；步骤8.副本1收到副本2发送的若干读取日志的响应；步骤9.副本1基于DEL_PK_QUE中存储的删除操作信息应用步骤8中返回的日志(操作日志应用参考图1图2图3)；步骤10.副本1与副本2间进入正常的日志复制应用流程。

此外，在另一实施例中，本公开实施例方案还可以基于DEL_PK_QUE中删除信息，进行数据合并处理。

副本间基于DEL_PK_QUE中删除信息，进行数据合并的处理的过程可以举例如下：步骤1.副本1向副本2发起读取所有数据的请求；步骤2.副本1收到若干副本2发送的读取数据的响应；步骤3.对于步骤2中返回的每条数据记录，进行如下合并处理；步骤3.1数据在副本1中存在，则比较两个副本中数据的操作时间，选择操作时间最新的数据为记录内容；步骤3.2数据在副本1中不存在，查询DEL_PK_QUE，如果存在删除操作信息且删除操作时间大于副本2中数据的操作时间，则不插入数据，其它情况，插入数据；步骤3.3基于3.1、3.2中的执行结果产生操作日志；步骤4.完成副本2上所有数据的合并处理，则向副本2读取数据合并期间产生的日志；步骤5.副本1收到副本2发送的若干读取日志的响应；步骤6.副本1基于DEL_PK_QUE中存储的删除操作信息应用步骤 3.3中返回的日志；步骤7.副本1与副本2间进入正常的日志复制应用流程。

此外，在另一实施例中，本公开实施例方案还可以实现DEL_PK_QUE的插入处理。

DEL_PK_QUE的插入处理过程可以举例如下：步骤1.往DEL_PK_QUE中插入删除操作信息：主键及删除操作时间；步骤2.按如下步骤进行插入处理；步骤2.1存储主键及操作时间信息的缓存区有空闲空间，则分配空间存储主键及删除操作时间；步骤2.2存储主键及操作时间信息的缓存区有无空闲空间，则从DEL_PK_QUE中释放所保存删除操作时间最老的队列元素所占资源，而后分配空间存储主键及删除操作时间；步骤2.3插入的删除操作信息在DEL_PK_QUE中不存在，则直接插入DEL_PK_QUE；步骤2.3插入的删除操作信息在DEL_PK_QUE中已存在，则更新对应主键的删除操作时间。

如图7所示，本公开第七实施例提出一种数据合并的实现方法，基于上述图6所示的实施例，所述方法还包括：

步骤S108，若检测到存储主键及删除操作时间的缓存空间使用完毕，则释放所述主键存储队列中所保存删除操作时间最老的队列元素所占空间。

如前所述，DEL_PK_QUE中保存因删除操作请求或应用删除操作日志而被删除数据的主键及删除操作时间。

在本实施例中，存储主键及操作时间的缓存空间使用完毕，则释放DEL_PK_QUE中所保存删除操作时间最老的队列元素所占空间。

本实施例通过上述方案，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理，保证了副本间数据的一致性。此外，在存储主键及操作时间的缓存空间使用完毕时，释放DEL_PK_QUE中所保存删除操作时间最老的队列元素所占空间，以节省存储资源。

需要说明的是，上述各实施例根据实际情况，可以相互组合实施，在此不再赘述。

此外，本公开实施例还提出一种数据合并的实现装置，包括：比较模块，用于在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；保存模块，用于根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；合并操作模块，用于基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致

在一个实施例中，上述合并操作模块，还用于在接收到删除请求或应用其它副本的删除操作日志，以删除当前副本上的数据时，将当前副本上被删除数据的主键及删除操作时间，保存于预设的主键存储队列。

在一个实施例中，上述合并操作模块，还用于在接收到增加数据请求，以在副本上增加新的数据时，使用新增数据的主键从所述主键存储队列中删除相应的队列元素。

在一个实施例中，上述合并操作模块，还用于在副本应用增加操作日志时，使用待新增数据的主键查询所述主键存储队列；如果所述主键存储队列中不存在对应待新增数据的删除操作记录，则在当前副本中插入对应的待新增数据；否则，比较应用的增加操作日志中携带的增加操作时间和所述主键存储队列中保存的删除操作时间，若前者大于后者，则插入对应的待新增数据；若前者不大于后者，则不插入对应的待新增数据。

在一个实施例中，上述合并操作模块，还用于在副本应用修改操作日志时，比较应用的修改操作日志中携带的数据被修改的操作时间和被修改数据的最近操作时间；

若被修改数据的最近操作时间不等于修改操作日志中携带的数据被修改的操作时间，则针对该条数据发起数据合并操作。

在一个实施例中，上述合并操作模块，还用于若检测到存储主键及删除操作时间的缓存空间使用完毕，则释放所述主键存储队列中所保存删除操作时间最老的队列元素所占空间。

本实施例实现副本间数据合并的原理请参照上述各实施例，在此不再赘述。

本实施例在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理，保证了副本间数据的一致性。

此外，本公开实施例还提出一种数据合并的实现系统，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的数据合并的实现方法的步骤。

在一个实施例中，如图8所示，本实施例系统可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图8中示出的系统结构并不构成对平台的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图8所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据合并的实现程序。

在图8所示的系统中，网络接口1004主要用于连接网络服务器，与网络服务器进行数据通信；用户接口1003主要用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，并执行以下操作：在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：在接收到删除请求或应用其它副本的删除操作日志，以删除当前副本上的数据时，将当前副本上被删除数据的主键及删除操作时间，保存于预设的主键存储队列。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：在接收到增加数据请求，以在副本上增加新的数据时，使用新增数据的主键从所述主键存储队列中删除相应的队列元素。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：在副本应用增加操作日志时，使用待新增数据的主键查询所述主键存储队列；如果所述主键存储队列中不存在对应待新增数据的删除操作记录，则在当前副本中插入对应的待新增数据；否则，比较应用的增加操作日志中携带的增加操作时间和所述主键存储队列中保存的删除操作时间，若前者大于后者，则插入对应的待新增数据；若前者不大于后者，则不插入对应的待新增数据。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：在副本应用修改操作日志时，比较应用的修改操作日志中携带的数据被修改的操作时间和被修改数据的最近操作时间；若被修改数据的最近操作时间不等于修改操作日志中携带的数据被修改的操作时间，则针对该条数据发起数据合并操作。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：对副本间数据进行恢复处理或在副本上进行主键存储队列中信息的插入处理。

在一个实施例中，处理器1001可以用于调用存储器1005中存储的数据合并的实现程序，还执行以下操作：若检测到存储主键及删除操作时间的缓存空间使用完毕，则释放所述主键存储队列中所保存删除操作时间最老的队列元素所占空间。

此外，本公开实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的数据合并的实现方法的步骤。

相比一些情况，本公开实施例提出的一种数据合并的实现方法、装置、系统及存储介质，在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致，由此，通过日志复制，解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理，保证了副本间数据的一致性。

本公开解决了分布式系统中，当日志无法接续或者多主访问导致数据更新冲突的技术问题。此外，通过将被删除数据的主键保存于预设的主键删除队列中，解决数据合并发生时，删除操作与增、改操作的合并处理。

以上所述仅为本公开的优选实施例，并非因此限制本公开的专利范围，凡是利用本公开说明书及附图内容所作的等效结构或流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本公开的专利保护范围内。

Claims

一种数据合并的实现方法，其中，所述方法应用于分布式数据库系统，所述方法包括：

在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；

根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；

基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。
根据权利要求1所述的数据合并的实现方法，其中，所述在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间的步骤之前还包括：

在分布式数据库处于主主工作模式进行副本存取时，检测是否存在副本自身日志缓冲区溢出，导致其它副本无法读取连续日志；

若是，则检测到多个副本间数据不一致。
根据权利要求1所述的数据合并的实现方法，其中，所述在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间的步骤之前还包括：

在分布式数据库处于主主工作模式进行副本存取时，若同一数据在多个副本上并发修改，并在副本间应用日志时，检测被修改数据最近操作时间与日志中携带时间是否一致，若不一致，则检测到多个副本间数据不一致。
根据权利要求1所述的数据合并的实现方法，其中，所述基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致的步骤中包括：

若多个副本均发生数据更新，则发起双向数据合并。
根据权利要求1所述的数据合并的实现方法，其中，所述方法还包括：

在接收到删除请求或应用其它副本的删除操作日志，以删除当前副本上的数据时，将当前副本上被删除数据的主键及删除操作时间，保存于预设的主键存储队列。
根据权利要求5所述的数据合并的实现方法，其中，所述方法还包括：

在接收到增加数据请求，以在副本上增加新的数据时，使用新增数据的主键从所述主键存储队列中删除相应的队列元素。
根据权利要求6所述的数据合并的实现方法，其中，所述方法还包括：

在副本应用增加操作日志时，使用待新增数据的主键查询所述主键存储队列；

如果所述主键存储队列中不存在对应待新增数据的删除操作记录，则在当前副本中插入对应的待新增数据；

如果所述主键存储队列中存在对应待新增数据的删除操作记录，则比较应用的增加操作日志中携带的增加操作时间和所述主键存储队列中保存的删除操作时间，若前者大于后者，则插入对应的待新增数据；若前者不大于后者，则不插入对应的待新增数据。
根据权利要求5-7中任一项所述的数据合并的实现方法，其中，所述方法还包括：

在副本应用修改操作日志时，比较应用的修改操作日志中携带的数据被修改的操作时间和被修改数据的最近操作时间；

若被修改数据的最近操作时间不等于修改操作日志中携带的数据被修改的操作时间，则针对该条数据发起数据合并操作。
根据权利要求8所述的数据合并的实现方法，其中，所述方法还包括：

对副本间数据进行恢复处理或在副本上进行主键存储队列中信息的插入处理。
根据权利要求9所述的数据合并的实现方法，其中，所述方法还包括：

若检测到存储主键及删除操作时间的缓存空间使用完毕，则释放所述主键存储队列中所保存删除操作时间最老的队列元素所占空间。
一种数据合并的实现装置，其中，包括：

比较模块，用于在分布式数据库处于主主工作模式进行副本存取，并在检测到多个副本间数据不一致时，比较不同副本上数据最近操作的时间；

保存模块，用于根据不同副本上数据最近操作的时间，保留各副本上数据的最后更新结果；

合并操作模块，用于基于各副本上数据的最后更新结果，进行各副本间数据的相互合并操作，使得各副本间数据保持一致。
一种数据合并的实现系统，其中，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-10中任一项所述的数据合并的实现方法的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-10中任一项所述的数据合并的实现方法的步骤。