CN110795503A - 分布式存储系统的多集群数据同步方法及相关装置 - Google Patents

分布式存储系统的多集群数据同步方法及相关装置 Download PDF

Info

Publication number
CN110795503A
CN110795503A CN201910994182.1A CN201910994182A CN110795503A CN 110795503 A CN110795503 A CN 110795503A CN 201910994182 A CN201910994182 A CN 201910994182A CN 110795503 A CN110795503 A CN 110795503A
Authority
CN
China
Prior art keywords
cluster
data
index key
slave
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910994182.1A
Other languages
English (en)
Inventor
李明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Reach Best Technology Co Ltd
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Reach Best Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Reach Best Technology Co Ltd filed Critical Reach Best Technology Co Ltd
Priority to CN201910994182.1A priority Critical patent/CN110795503A/zh
Publication of CN110795503A publication Critical patent/CN110795503A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Abstract

本公开公开了一种分布式存储系统的多集群数据同步方法及相关装置,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述方法应用于主集群,所述方法包括:接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键;响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据;将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。由此,为保障多个集群的数据一致性提供支持。

Description

分布式存储系统的多集群数据同步方法及相关装置
技术领域
本公开涉及数据库技术领域,特别涉及一种分布式存储系统的多集群数据同步方法及相关装置。
背景技术
在分布式存储系统中,多机房部署是增强系统容灾及可用性的常见手段,但redis作为一个非常常用的开源缓存组件,本身并不支持多机房部署或多集群同步。因此,各大互联网公司通常设计一个redis的多机房数据同步方案,以解决在分布式存储系统中多个redis集群之间的数据同步问题。
然而,现有技术中的redis的多机房数据同步方案,仍然存在诸多不足,例如要么请求处理耗时成倍增加,要么数据不一致,要么产生巨大的网络带宽等。如何克服这些不足,仍然亟需解决。
发明内容
本公开的目的是提供一种分布式存储系统的多集群数据同步方法及相关装置,以解决上述问题。
第一方面,本公开实施例提供了一种分布式存储系统的多集群数据同步方法,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述方法应用于主集群,所述方法包括:
接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键;
响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据;
将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,所述方法还包括:
接收终端设备发送的更新数据库的更新请求;
根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群,以使所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群之前,所述方法还包括:
将更新的数据对应的索引键,写入主集群的同步队列中;
将更新的数据对应的索引键发送给从集群,包括:
将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列。
在一个实施例中,所述数据同步请求是从集群的同步进程响应于从集群的同步队列的写入所述索引键触发的。
在一个实施例中,当具有多个从集群时,将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列,包括:
将所述主集群的同步队列中的索引键,发送给每个从集群的同步队列。
在一个实施例中,所述主集群和所述从集群为Redis集群。
第二方面,本公开实施例提供了一种分布式存储系统的多集群数据同步方法,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述方法应用于从集群,所述方法包括:
向主集群发送数据同步请求,所述数据同步请求包括索引键;
接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据,;
实现对所述索引键对应的值的全量更新。
在一个实施例中,所述数据同步请求是响应于从集群接收到来自主集群的索引键触发的,所述索引键是所述主集群响应于更新请求更新主集群的数据库后发出的,所述索引键对应于更新的数据。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述主集群根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键写入主集群的同步队列中,所述数据同步请求是响应于从集群的同步队列接收到来自主集群的同步队列的所述索引键触发的。
在一个实施例中,所述主集群和所述从集群为Redis集群。
第三方面,本公开实施例提供了一种分布式存储系统的多集群数据同步装置,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述装置应用于主集群,所述装置包括:
同步请求接收单元,被配置为接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键;
数据获取单元,被配置为响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据;
数据发送单元,被配置为将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,数据同步装置还可以包括:
更新请求接收单元,被配置为接收终端设备发送的更新数据库的更新请求。
索引键发送单元,被配置为根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群,以使所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述数据同步装置还包括:
队列写入单元,被配置为根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群之前,将更新的数据对应的索引键,写入主集群的同步队列中;
其中,索引键发送单元,被配置为将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列。
在一个实施例中,所述数据同步请求是从集群的同步进程响应于从集群的同步队列的写入所述索引键触发的。
在一个实施例中,当具有多个从集群时,索引键发送单元,被配置为将所述主集群的同步队列中的索引键,发送给每个从集群的同步队列。
在一个实施例中,所述主集群和所述从集群为Redis集群。
第四方面,本公开实施例提供了一种分布式存储系统的多集群数据同步装置,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述装置应用于从集群,所述装置包括:
同步请求发送单元,被配置为向主集群发送数据同步请求,所述数据同步请求包括索引键;
数据接收单元,被配置为接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据,;
更新单元,被配置为实现对所述索引键对应的值的全量更新。
在一个实施例中,所述数据同步请求是响应于从集群接收到来自主集群的索引键触发的,所述索引键是所述主集群响应于更新请求更新主集群的数据库后发出的,所述索引键对应于更新的数据。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述主集群根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键写入主集群的同步队列中,所述数据同步请求是响应于从集群的同步队列接收到来自主集群的同步队列的所述索引键触发的。
在一个实施例中,所述主集群和所述从集群为Redis集群。
第五方面,本公开另一实施例还提供了一种计算设备,包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例提供的任一数据同步方法。
第六方面,本公开另一实施例还提供了一种计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本公开实施例中的任一数据同步方法。
本公开实施例提供的数据同步方案,通过在多个集群中分别维护同步队列和同步进程,并在主集群存在数据变更时,将发生变更的数据对应的索引键写入到每个从集群的同步队列中,使得每个从集群均能够异步地实现对该索引键对应的值的全量更新,从而减少请求处理耗时,并可以避免因时序性而导致的数据不一致的问题。
另外,当网络状态异常并重新恢复时,基于本公开的数据同步方案,也不会触发数据库的全量同步操作,从而避免产生巨大的网络带宽,也避免影响其它服务。
本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开一个实施例的分布式存储系统的示意图;
图2为根据本公开一个实施例的分布式存储系统的数据同步的流程示意图;
图3为根据本公开一个实施例的分布式存储系统的多集群数据同步方法的流程示意图;
图4为根据本公开一个实施例的分布式存储系统的多集群数据同步方法的流程示意图;
图5为根据本公开一个实施例的分布式存储系统的多集群数据同步装置的示意图;
图6为根据本公开一个实施例的分布式存储系统的多集群数据同步装置的示意图;
图7为根据本公开一个实施例的计算设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
图1为根据本公开一个实施例的分布式存储系统的示意图。
如图1所示,本公开的分布式存储系统可以包括多个机房(例如机房1、机房2、机房3……),每个机房均可以部署一个集群,即分布式存储系统可以包括多个集群(例如集群A、集群B、集群C……)。这多个集群可以基于一主多从集群模式,即可以包括一个主集群和多个从集群。
各集群中可以包括至少一台用于存储信息的服务器,各服务器的数据可以基于键值存储。
主集群可以向外(例如业务客户端)提供服务,从集群可以作为备集群,以增强系统容灾及系统可用性。
在一个实施例中,本公开的多个集群可以为redis集群。结合图2所示,业务客户端10(例如redis客户端)可以连接到集群进行数据操作。作为示例,可以以集群A作为主集群,集群A可以用于数据的读写操作。以集群B、集群C等作为从集群,从集群通常不对外提供写服务(若业务对数据一致性要求较低,可提供读服务)。
并且,在集群A发生故障时,可以从多个从集群中重新确定一个集群作为新的主集群,以将业务客户端10的读写请求交由新的主集群(例如从集群B)处理从而避免单个集群故障影响业务服务,从而提高系统的可用性。
本公开实施例中,主从集群的切换,例如可以通过人工或程序更改配置的方式来实现,也可以通过心跳检测机制实时检测各集群是否存活。实施时,多个从集群例如可以通过竞争或竞选的方式成为新的主集群。
重选新的主集群后,可由新的主集群向业务客户端发送消息,以向客户端告知主从集群发生了切换,并告知新的主集群的地址,以便于分布式存储系统仍然能够向外提供服务,例如进行数据的读写操作,从而保障系统的可用性。
并且,在新的主集群进行了数据的读写操作后,使得各个从集群向该新的主集群请求进行数据同步,从而保障该分布式存储系统的各个集群的数据一致。
图2为根据本公开一个实施例的分布式存储系统的数据同步的流程示意图。其中,以主集群A和从集群B作为一个示例,来对本公开的数据同步方案进行说明。
应当理解的是,下述数据同步流程可以适用于该分布式存储系统中的各主集群和/或从集群,以下将不再针对每个主集群或从集群的具体实现进行赘述。
如图2所示,在业务客户端有数据更新需求时,在步骤S201,业务客户端可以从配置中获取主集群A的地址,并向主集群A发出数据更新请求,以实现对主集群的数据进行数据更新,例如将数据写入主集群A,例如写入主集群A的主节点(Master)。
从集群本地可以维护同步队列。数据在主集群A更新成功后,在步骤S202,主集群A例如可以将变更的数据对应的索引键(Key)同步到从集群B的同步队列中。其中,若存在多个从集群,则可以将变更的数据对应的索引键(Key)同步到每个从集群的同步队列。其中,从集群的同步队列可以在本地硬盘中,并使得每个从集群的同步队列的容量可以不受限制。
实施时,主集群本地也可以维护同步队列。在步骤S202,主集群A例如可以先将变更的数据对应的索引键(Key)写入到主集群A的同步队列中,并使得主集群A的同步队列中的索引键能够同步至每个从集群的同步队列中,通过多个集群之间的同步队列的数据一致,为保障多个集群之间的数据一致性提供支持。
在一个实施例中,不同集群的同步队列之间的数据同步例如可以通过Kafka实现。Kafka是一种高吞吐量的分布式发布订阅消息系统,其可以通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。并且,Kafka支持高吞吐量,即使是非常普通的硬件Kafka也可以支持每秒数百万量级的消息。Kafka可以通过Hadoop的并行加载机制来统一线上和离线的消息处理,能够通过集群来提供实时的消息。不同集群的同步队列之间的数据同步,在此不再赘述。
分布式存储系统的每个集群(包括主集群和从集群)均可以包括一个同步进程,该同步进程可以实现集群间的数据同步。其中,在从集群的同步队列中写入了索引键时,可以视为从集群接收到数据更新请求。应当理解的是,本公开实施例中,用于进行数据同步的同步进程与维护同步队列的进程可以不为同一进程。
在步骤S203,从集群的同步队列可以通过通知消息的方式,使得从集群的同步进程知晓该数据更新请求。
在步骤S204,从集群的同步进程可以向执行了该数据更新请求的相关处理的主集群A,请求获取相关数据,例如该数据更新请求涉及的发生变化的数据对应的索引键Key对应的值的全量数据。
在步骤S205,从集群的同步进程可以将从主集群A所获取的相关数据,更新到该从集群中。
由此,每当在主集群出现了数据更新时,可以将发生变化的数据对应的Key同步到每个从集群的同步队列中,使得每个从集群基于其同步队列自身的先入先写机制,能够基于Key的写入时序依次更新相关Key的全量数据,实现了多集群的数据同步的异步处理,从而解决了现有的数据同步方案中一次更新多个集群而导致请求处理耗时成倍增加的问题,并避免了因处理请求的时序性而产生的数据不一致的问题。
并且,当网络状态异常并重新恢复后,主集群的同步队列和从集群的同步队列之间,能够自动进行同步,以便捷地实现从集群与主集群的数据同步,而不会触发redis集群自身的数据库全量同步操作,从而避免产生巨大的网络带宽。
实施时,在步骤S204,从集群的同步进程可以向主集群发送数据同步请求,该数据同步请求中可以包括数据更新请求所涉及的索引键(也即主集群中发生变化的数据对应的索引键)。主集群可以在其数据库中查询并获取该索引键对应的值的全部数据,也即上述的相关数据,并向该从集群返回该索引键对应的值的全部数据,以便于从集群在步骤S205实现对索引键对应的值的全量更新。
举例而言,即,若某个索引键key1对应的值共包括value1、value2、value3、value4,上述在步骤S201中,主集群A响应于数据更新请求执行了相关处理后,主集群的数据更新仅涉及对索引键key1某个值,例如value2,的改写,即响应于数据更新请求,只有索引键key1对应的value2发生了变化,而其它值value1、value3、value4未发生变化。此时,在主集群侧,索引键key1对应的值共包括value1、value2’、value3、value4。在上述步骤S202,将该索引键key1同步到每个从集群的同步队列。在步骤S204,每个从集群的同步进程向主集群发送包括了该索引键key1的数据同步请求,主集群在其数据库中查询该索引键key1涉及的值的全量数据即value1、value2’、value3、value4,并返回给从集群。在步骤S205,从集群将其数据库中该索引键key1原本涉及的值的全量数据即value1、value2、value3、value4,全部替换为新获取的数据即value1、value2’、value3、value4,以实现对索引键key对应的值的全量更新。
由此,本公开实施例,通过在多个集群中分别维护同步队列和同步进程,并在主集群存在数据变更时,将发生变更的数据对应的索引键写入到每个从集群的同步队列中,使得每个从集群均能够异步地实现与主集群的数据同步,从而减少请求处理耗时,并可以避免因时序性而导致的数据不一致的问题。
当网络状态异常并重新恢复时,基于本公开的数据同步方案,也不会触发数据库的全量同步操作,从而避免产生巨大的网络带宽,也避免影响其它服务。
图3为根据本公开一个实施例的分布式存储系统的多集群数据同步方法的流程示意图。其中,该方法可由上述的图1所示的主集群实现。
如图3所示,在步骤S310,接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键。
在步骤S320,响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据。
在步骤S330,将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
由此,在主集群存在数据变更时,将发生变更的数据对应的索引键写入到每个从集群的同步队列中,使得每个从集群能够异步地实现与主集群的数据同步,从而减少请求处理耗时,并可以避免因时序性而导致的数据不一致的问题。
在一个实施例中,该数据同步方法还可以包括:
接收终端设备发送的更新数据库的更新请求;
根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群,以使所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群之前,所述方法还包括:
将更新的数据对应的索引键,写入主集群的同步队列中;
将更新的数据对应的索引键发送给从集群,包括:
将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列。
在一个实施例中,所述数据同步请求是从集群的同步进程响应于从集群的同步队列的写入所述索引键触发的。
在一个实施例中,当具有多个从集群时,将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列,包括:
将所述主集群的同步队列中的索引键,发送给每个从集群的同步队列。
在一个实施例中,所述主集群和所述从集群为Redis集群。
图4为根据本公开一个实施例的分布式存储系统的多集群数据同步方法的流程示意图。其中,该方法可由上述的图1所示的从集群实现。
如图4所示,在步骤S410,向主集群发送数据同步请求,所述数据同步请求包括索引键。
在步骤S420,接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据。
在步骤S430,实现对所述索引键对应的值的全量更新。
由此,在主集群存在数据变更时,将发生变更的数据对应的索引键写入到每个从集群的同步队列中,使得每个从集群能够异步地实现与主集群的数据同步,从而减少请求处理耗时,并可以避免因时序性而导致的数据不一致的问题。
在一个实施例中,所述数据同步请求是响应于从集群接收到来自主集群的索引键触发的,所述索引键是所述主集群响应于更新请求更新主集群的数据库后发出的,所述索引键对应于更新的数据。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述主集群根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键写入主集群的同步队列中,所述数据同步请求是响应于从集群的同步队列接收到来自主集群的同步队列的所述索引键触发的。
在一个实施例中,所述主集群和所述从集群为Redis集群。
由此,通过本公开结合图3、图4所述的数据同步方法,每当在主集群出现了数据更新时,可以将发生变化的数据对应的Key同步到每个从集群的同步队列中,使得每个从集群基于其同步队列自身的先入先写机制,能够基于Key的写入时序依次更新相关Key的全量数据,实现了多集群的数据同步的异步处理,从而解决了现有的数据同步方案中一次更新多个集群而导致请求处理耗时成倍增加的问题,并避免了因处理请求的时序性而产生的数据不一致的问题。
并且,当网络状态异常并重新恢复后,主集群的同步队列和从集群的同步队列之间,能够自动进行同步,以便捷地实现从集群与主集群的数据同步,而不会触发redis集群自身的数据库全量同步操作,从而避免产生巨大的网络带宽。
基于相同的发明构思,本公开实施例还提出了一种分布式存储系统的多集群数据同步装置。该数据同步装置可以实现如图3或图4所示的数据同步方法。
图5为根据本公开一个实施例的分布式存储系统的多集群数据同步装置的示意图。所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,该数据同步装置可以用于图1所示的主集群,并可以实现图3所示的数据同步方法。
如图5所示,该数据同步装置500可以包括:
同步请求接收单元510,被配置为接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键。
数据获取单元520,被配置为响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据。
数据发送单元530,被配置为将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,数据同步装置还可以包括:
更新请求接收单元,被配置为接收终端设备发送的更新数据库的更新请求。
索引键发送单元,被配置为根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群,以使所述从集群实现对所述索引键对应的值的全量更新。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述数据同步装置还包括:
队列写入单元,被配置为根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群之前,将更新的数据对应的索引键,写入主集群的同步队列中;
其中,索引键发送单元,被配置为将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列。
在一个实施例中,所述数据同步请求是从集群的同步进程响应于从集群的同步队列的写入所述索引键触发的。
在一个实施例中,当具有多个从集群时,索引键发送单元,被配置为将所述主集群的同步队列中的索引键,发送给每个从集群的同步队列。
在一个实施例中,所述主集群和所述从集群为Redis集群。
图6为根据本公开一个实施例的分布式存储系统的多集群数据同步装置的示意图。所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,该数据同步装置用于图1所示的从集群,并可以实现图4所示的数据同步方法。
如图6所示,该数据同步装置600可以包括:
同步请求发送单元610,被配置为向主集群发送数据同步请求,所述数据同步请求包括索引键;
数据接收单元620,被配置为接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据,;
更新单元630,被配置为实现对所述索引键对应的值的全量更新。
在一个实施例中,所述数据同步请求是响应于从集群接收到来自主集群的索引键触发的,所述索引键是所述主集群响应于更新请求更新主集群的数据库后发出的,所述索引键对应于更新的数据。
在一个实施例中,所述主集群和所述从集群各自维护同步队列,所述主集群根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键写入主集群的同步队列中,所述数据同步请求是响应于从集群的同步队列接收到来自主集群的同步队列的所述索引键触发的。
在一个实施例中,所述主集群和所述从集群为Redis集群。
上述结合图5和图6所述的数据同步装置的功能的具体实现与前文结合图1-图4所示的数据同步方法相同或相似,具体可参见上文结合图1-图4的相关描述,在此不再赘述。
本公开实施例,通过在多个集群中分别维护同步队列和同步进程,并在主集群存在数据变更时,将发生变更的数据对应的索引键写入到每个从集群的同步队列中,使得每个从集群能够异步地实现与主集群的数据同步,从而减少请求处理耗时,并可以避免因时序性而导致的数据不一致的问题。当网络状态异常并重新恢复时,基于本公开的数据同步方案,也不会触发数据库的全量同步操作,从而避免产生巨大的网络带宽,也避免影响其它服务。
在介绍了本公开示例性实施方式的一种数据同步方法和装置之后,接下来,介绍根据本公开的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本公开的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本公开各种示例性实施方式的数据同步方法中的步骤。例如,处理器可以执行如图2中所示的步骤S201-S205或者如图3所示的步骤S310-S330或者图4所示的步骤S410-S430。
下面参照图7来描述根据本公开的这种实施方式的计算设备130。图7显示的计算设备130仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,计算设备130以通用计算设备的形式表现。计算设备130的组件可以包括但不限于:上述至少一个处理器131、上述至少一个存储器132、连接不同系统组件(包括存储器132和处理器131)的总线133。
总线133表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器132可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1321和/或高速缓存存储器1322,还可以进一步包括只读存储器(ROM)1323。
存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325,这样的程序模块1324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算设备130交互的设备通信,和/或与使得该计算设备130能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口135进行。并且,计算设备130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器136通过总线133与用于计算设备130的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备130使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本公开提供的一种数据同步方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的一种数据同步方法中的步骤,例如,计算机设备可以执行如图2中所示的步骤S201-S205或者如图3所示的步骤S310-S330或者图4所示的步骤S410-S430。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本公开的实施方式的用于数据同步的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本公开的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。

Claims (10)

1.一种分布式存储系统的多集群数据同步方法,其特征在于,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述方法应用于主集群,
所述方法包括:
接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键;
响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据;
将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收终端设备发送的更新数据库的更新请求;
根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群,以使所述从集群实现对所述索引键对应的值的全量更新。
3.根据权利要求2所述的方法,其特征在于,所述主集群和所述从集群各自维护同步队列,根据所述更新请求更新主集群的数据库后,将更新的数据对应的索引键发送给从集群之前,
所述方法还包括:
将更新的数据对应的索引键,写入主集群的同步队列中;
将更新的数据对应的索引键发送给从集群,包括:
将所述主集群的同步队列中的索引键,发送给所述从集群的同步队列。
4.根据权利要求3所述的方法,其特征在于,所述数据同步请求是从集群的同步进程响应于从集群的同步队列的写入所述索引键触发的。
5.一种分布式存储系统的多集群数据同步方法,其特征在于,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述方法应用于从集群,
所述方法包括:
向主集群发送数据同步请求,所述数据同步请求包括索引键;
接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据,;
实现对所述索引键对应的值的全量更新。
6.根据权利要求5所述的方法,其特征在于,
所述数据同步请求是响应于从集群接收到来自主集群的索引键触发的,所述索引键是所述主集群响应于更新请求更新主集群的数据库后发出的,所述索引键对应于更新的数据。
7.一种分布式存储系统的多集群数据同步装置,其特征在于,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述装置应用于主集群,
所述装置包括:
同步请求接收单元,被配置为接收任一从集群发送的数据同步请求,所述数据同步请求包括索引键;
数据获取单元,被配置为响应于所述数据同步请求,从主集群的数据库中获取所述索引键对应的值的全量数据;
数据发送单元,被配置为将所述索引键对应的值的全量数据发送给所述从集群,以使得所述从集群实现对所述索引键对应的值的全量更新。
8.一种分布式存储系统的多集群数据同步装置,其特征在于,所述多集群中包括主集群和从集群,各集群中包括至少一台用于存储信息的服务器,各服务器的数据基于键值存储,所述装置应用于从集群,
所述装置包括:
同步请求发送单元,被配置为向主集群发送数据同步请求,所述数据同步请求包括索引键;
数据接收单元,被配置为接收所述主集群响应于所述数据同步请求返回的与所述索引键对应的值的全量数据,;
更新单元,被配置为实现对所述索引键对应的值的全量更新。
9.一种计算设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-4、5-6中任何一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-4、5-6中任何一项所述的方法。
CN201910994182.1A 2019-10-18 2019-10-18 分布式存储系统的多集群数据同步方法及相关装置 Pending CN110795503A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910994182.1A CN110795503A (zh) 2019-10-18 2019-10-18 分布式存储系统的多集群数据同步方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910994182.1A CN110795503A (zh) 2019-10-18 2019-10-18 分布式存储系统的多集群数据同步方法及相关装置

Publications (1)

Publication Number Publication Date
CN110795503A true CN110795503A (zh) 2020-02-14

Family

ID=69439613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910994182.1A Pending CN110795503A (zh) 2019-10-18 2019-10-18 分布式存储系统的多集群数据同步方法及相关装置

Country Status (1)

Country Link
CN (1) CN110795503A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343277A (zh) * 2020-03-04 2020-06-26 腾讯科技(深圳)有限公司 分布式数据存储方法、系统、计算机设备和存储介质
CN111953760A (zh) * 2020-08-04 2020-11-17 深圳市欢太科技有限公司 数据同步方法、装置、多活系统及存储介质
CN112861188A (zh) * 2021-02-01 2021-05-28 青岛易来智能科技股份有限公司 用于多集群的数据汇集系统和方法
CN113407634A (zh) * 2021-07-05 2021-09-17 挂号网(杭州)科技有限公司 一种数据同步方法、装置、系统、服务器和存储介质
CN113726827A (zh) * 2020-05-25 2021-11-30 北京同邦卓益科技有限公司 基于分布式集群的数据包处理方法和装置
CN113810456A (zh) * 2021-02-09 2021-12-17 京东科技信息技术有限公司 数据获取方法、装置、系统、计算机设备及存储介质
CN114297989A (zh) * 2021-12-16 2022-04-08 北京华夏电通科技股份有限公司 笔录同步方法、装置、电子设备及存储介质
CN114564458A (zh) * 2022-03-10 2022-05-31 苏州浪潮智能科技有限公司 集群间数据同步的方法、装置、设备和存储介质
CN114661818A (zh) * 2022-03-17 2022-06-24 杭州欧若数网科技有限公司 图数据库中集群间数据实时同步的方法、系统和介质
CN115098035A (zh) * 2022-07-08 2022-09-23 天津华呈鼎丰科技有限公司 基于多端云计算集群的大数据存储方法及系统
CN115544172A (zh) * 2022-11-28 2022-12-30 杭州欧若数网科技有限公司 一种一主多从的集群间数据实时同步的方法和系统
WO2024016624A1 (zh) * 2022-07-19 2024-01-25 京东科技信息技术有限公司 多集群访问方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228397A (zh) * 2016-12-22 2018-06-29 深圳市优朋普乐传媒发展有限公司 一种集群间跨机房同步的方法和装置
CN108256002A (zh) * 2017-12-31 2018-07-06 广东欧珀移动通信有限公司 跨机房数据同步方法、装置、系统以及服务器
US20180300203A1 (en) * 2017-04-18 2018-10-18 Netapp, Inc. Systems and methods for backup and restore of distributed master-slave database clusters
CN108920504A (zh) * 2018-05-28 2018-11-30 北京达佳互联信息技术有限公司 一种缓存数据的同步方法及装置
CN109684406A (zh) * 2018-11-13 2019-04-26 北京达佳互联信息技术有限公司 跨机房的redis集群备份数据的方法、装置、设备及存储介质
CN110149382A (zh) * 2019-05-08 2019-08-20 拉扎斯网络科技(上海)有限公司 数据同步的方法、系统、主服务器、同步客户端及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228397A (zh) * 2016-12-22 2018-06-29 深圳市优朋普乐传媒发展有限公司 一种集群间跨机房同步的方法和装置
US20180300203A1 (en) * 2017-04-18 2018-10-18 Netapp, Inc. Systems and methods for backup and restore of distributed master-slave database clusters
CN108256002A (zh) * 2017-12-31 2018-07-06 广东欧珀移动通信有限公司 跨机房数据同步方法、装置、系统以及服务器
CN108920504A (zh) * 2018-05-28 2018-11-30 北京达佳互联信息技术有限公司 一种缓存数据的同步方法及装置
CN109684406A (zh) * 2018-11-13 2019-04-26 北京达佳互联信息技术有限公司 跨机房的redis集群备份数据的方法、装置、设备及存储介质
CN110149382A (zh) * 2019-05-08 2019-08-20 拉扎斯网络科技(上海)有限公司 数据同步的方法、系统、主服务器、同步客户端及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周智: "Redis分布式缓存实现与解析", 《信息通信》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343277B (zh) * 2020-03-04 2021-12-14 腾讯科技(深圳)有限公司 分布式数据存储方法、系统、计算机设备和存储介质
CN111343277A (zh) * 2020-03-04 2020-06-26 腾讯科技(深圳)有限公司 分布式数据存储方法、系统、计算机设备和存储介质
CN113726827A (zh) * 2020-05-25 2021-11-30 北京同邦卓益科技有限公司 基于分布式集群的数据包处理方法和装置
CN111953760B (zh) * 2020-08-04 2023-08-11 深圳市欢太科技有限公司 数据同步方法、装置、多活系统及存储介质
CN111953760A (zh) * 2020-08-04 2020-11-17 深圳市欢太科技有限公司 数据同步方法、装置、多活系统及存储介质
CN112861188A (zh) * 2021-02-01 2021-05-28 青岛易来智能科技股份有限公司 用于多集群的数据汇集系统和方法
CN113810456A (zh) * 2021-02-09 2021-12-17 京东科技信息技术有限公司 数据获取方法、装置、系统、计算机设备及存储介质
CN113407634A (zh) * 2021-07-05 2021-09-17 挂号网(杭州)科技有限公司 一种数据同步方法、装置、系统、服务器和存储介质
CN114297989A (zh) * 2021-12-16 2022-04-08 北京华夏电通科技股份有限公司 笔录同步方法、装置、电子设备及存储介质
CN114564458A (zh) * 2022-03-10 2022-05-31 苏州浪潮智能科技有限公司 集群间数据同步的方法、装置、设备和存储介质
CN114564458B (zh) * 2022-03-10 2024-01-23 苏州浪潮智能科技有限公司 集群间数据同步的方法、装置、设备和存储介质
CN114661818A (zh) * 2022-03-17 2022-06-24 杭州欧若数网科技有限公司 图数据库中集群间数据实时同步的方法、系统和介质
CN115098035A (zh) * 2022-07-08 2022-09-23 天津华呈鼎丰科技有限公司 基于多端云计算集群的大数据存储方法及系统
CN115098035B (zh) * 2022-07-08 2022-12-13 四川银亿科技有限公司 基于多端云计算集群的大数据存储方法及系统
WO2024016624A1 (zh) * 2022-07-19 2024-01-25 京东科技信息技术有限公司 多集群访问方法和系统
CN115544172A (zh) * 2022-11-28 2022-12-30 杭州欧若数网科技有限公司 一种一主多从的集群间数据实时同步的方法和系统

Similar Documents

Publication Publication Date Title
CN110795503A (zh) 分布式存储系统的多集群数据同步方法及相关装置
CN109951331B (zh) 用于发送信息的方法、装置和计算集群
CN111090699A (zh) 业务数据的同步方法和装置、存储介质、电子装置
US10491560B2 (en) Message delivery in messaging networks
CN112069265B (zh) 配置数据的同步方法、业务数据系统、计算机系统和介质
US8108623B2 (en) Poll based cache event notifications in a distributed cache
CN107430606B (zh) 具有并行持久性的消息代理系统
US10127077B2 (en) Event distribution pattern for use with a distributed data grid
CN109245908B (zh) 一种主从集群切换的方法和装置
CN114363407B (zh) 消息服务方法及装置、可读存储介质及电子设备
US11223522B1 (en) Context-based intelligent re-initiation of microservices
US9690576B2 (en) Selective data collection using a management system
CN111338834B (zh) 数据存储方法和装置
CN109901948A (zh) 无共享数据库集群异地双活容灾系统
CN110740145A (zh) 消息消费方法、装置、存储介质及电子设备
CN111427689B (zh) 集群保活方法、装置及存储介质
CN112231399A (zh) 一种应用于图数据库的方法和装置
CN112181942A (zh) 时序数据库系统和数据处理方法及装置
US10372542B2 (en) Fault tolerant event management system
CN111162938A (zh) 数据处理系统及方法
US10728323B2 (en) Method and apparatus for operating infrastructure layer in cloud computing architecture
CN114625566A (zh) 数据容灾方法、装置、电子设备及存储介质
US9141979B1 (en) Virtual stand-in computing service for production computing service
CN113821232A (zh) 模型更新方法和装置
CN112052104A (zh) 基于多机房实现的消息队列的管理方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214