CN116932603A

CN116932603A - 一种基于有向图的高性能事务并发复制方法

Info

Publication number: CN116932603A
Application number: CN202310970070.9A
Authority: CN
Inventors: 陈磊; 邱卓栋; 吴婵; 冯友旭
Original assignee: Shanghai Yunxi Technology Co ltd
Current assignee: Shanghai Yunxi Technology Co ltd
Priority date: 2023-08-03
Filing date: 2023-08-03
Publication date: 2023-10-24

Abstract

本发明提供一种基于有向图的高性能事务并发复制方法，属于数据处理技术领域，本发明根据事务数据事件kvEvent构建事务之间的依赖关系，根据事务提交事件commitEvent消除事务的循环依赖关系，并且对于有向图的数个强联通分量实现并发回放。通过条件变量以及阻塞队列，轮询多个回放协程，实现多个可回放强联通分量之间的并发回放效果。

Description

一种基于有向图的高性能事务并发复制方法

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于有向图的高性能事务并发复制方法。使数据库主备节点之间的数据复制一致性。

背景技术

当主节点执行事务时，主节点向从节点发送事务数据事件kvEvent以及事务提交事件commitEvent，从节点收到事务数据事件后kvEvent，根据之间的先后顺序构建冲突关系，并且生成依赖关系，此时依赖关系可能会存在环形依赖。

发明内容

为了解决以上技术问题，本发明提供了一种基于有向图的高性能事务并发复制方法。对于环形依赖，从节点需要接收提交时间戳拆除重复的依赖关系，并且根据提交时间戳排序后，进行事务回放。对于有向图的多个强联通分量，可以进行并发回放处理。

本发明的技术方案是：

一种基于有向图的高性能事务并发复制方法，根据事务数据事件kvEvent构建事务之间的依赖关系，根据事务提交事件commitEvent消除事务的循环依赖关系，并且对于有向图的数个强联通分量实现并发回放。

进一步的，

通过有向图模拟事务之间的依赖关系；

通过强联通分量定义事务顶端；

通过并查集实现互相依赖的事务关系之间的合并；

通过拆分顶端事务与非顶端事务，引入并发实现事务之间互不阻塞；

通过拆分事务数据事件与事务提交事件，引入并发实现事件之间互不阻塞；

通过引入阻塞队列条件变量以及多个回放协程，实现并发的对数个可回放的强联通分量进行并发回放。

再进一步的，

从节点收到主节点发送的事务数据事件后，从节点构建Range级别的冲突关系，并且根据Range级别的冲突关系，生成全局的事务依赖有向图。

当事务出现强联通分量后，即事务之间的依赖关系成环，如果环出现在事务依赖关系的顶端，则事务回放会被卡住，对事务依赖关系进行拆分；当前事务依赖关系的顶端是一个环，则当前事务回放需优先处理顶端的强联通分量。

对从节点消费主节点的事务数据进行并发拆分，根据事件对应的事务是否从属于顶端联通分量，进行拆分。

通过并查集，可发现数个节点是否处于同一个强联通分量，并且如果存在新的节点同时联通两个强联通分量，此时对两个强联通分量进行合并。

当一个环接收到全部的事务数据事件kvEvent以及全部的事务提交事件commitEvent后，可对强联通分量内的事务节点进行排序，此时问题退化为一组数据排序；通过对数据节点按照提交时间戳排序，即可得到最终的事务回放顺序，则事务最终按照事务的提交顺序进行回放。

当出现数个强联通分量同时可回放时，需要构建一个阻塞队列，并通过该阻塞队列不断唤醒回放协程进行工作，对强联通分量内的事务节点进行按顺序回放；每个强联通分量分配一个回放协程，回放协程数量按照CPU核数进行分配，并且可调整数量。阻塞队列通过条件变量不断轮询数个回放协程提醒可以进行回放。

本发明的有益效果是

本发明提出在面向主从的事务一致性复制场景下，通过有向图寻找顶端的强联通分量、并查集实现有向图合并以及按照事务提交时间戳排序，实现有向图的并发处理。通过拆分顶端事务与非顶端事务，事务数据事件与事务提交事件，引入四组并发，以实现互相之间不会阻塞。通过条件变量以及阻塞队列，轮询多个回放协程，实现多个可回放强联通分量之间的并发回放效果。

附图说明

图1是Range1和Range2的事务依赖关系示意图；

图2是事务出现死锁示意图；

图3是当事务出现强联通分量后成环的示意图；

图4是事务数据进行并发拆分示意图；

图5是两个强联通分量进行合并示意图；

图6是得到最终的事务回放顺序示意图；

图7是多个强联通分量同时回放示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种基于有向图的高性能事务并发复制方法，引入有向图的概念定义事务之间的依赖关系，并且通过寻找有向图的强联通分量、使用并查集算法合并有向图以及对事务依赖关系排序确定事务之间的回放顺序。

具体实现如下：

1.从节点收到主节点发送的事务数据事件后，从节点需要构建Range级别的冲突关系，并且根据Range级别的冲突关系，生成全局的事务依赖有向图。如图1、2所示。

2.当事务出现强联通分量后，即事务之间的依赖关系成环，如果环出现在事务依赖关系的顶端，则事务回放会被卡住，因此需要对事务依赖关系进行拆分。如图3所示，当前事务依赖关系的顶端是一个环，则当前事务回放需要优先处理顶端的强联通分量。

3.基于此，对从节点消费主节点的事务数据进行并发拆分，分类如下，根据事件对应的事务是否从属于顶端联通分量，进行拆分，可以拆分为

a.Top non-top top non-top

b.KV Commit

c.顶端环事务数据事件

i.并发1

d.顶端环事务提交事件

i.并发2

e.非顶端环事务数据事件

i.并发3

f.非顶端环事务提交事件

i.并发4

g.通过拆分[事务数据事件,事务提交事件][顶端环事务,非顶端事务]这两种类别，可以实现最大程度的事务消费并发性能。

4.通过并查集，可以发现多个节点是否处于同一个强联通分量，并且如果存在新的节点同时联通两个强联通分量，此时可以对两个强联通分量进行合并。步骤如图5所示。

5.当一个环接收到全部的事务数据事件kvEvent以及全部的事务提交事件commitEvent后，可以对强联通分量内的事务节点进行排序，此时问题退化为一组数据排序。通过对数据节点按照提交时间戳排序，即可得到最终的事务回放顺序，则事务最终按照事务的提交顺序进行回放。如图6所示。

6.当出现多个强联通分量同时可回放时，需要构建一个阻塞队列BlockingQueue，并通过该阻塞队列不断唤醒回放协程进行工作，对强联通分量内的事务节点进行按顺序回放。每个强联通分量分配一个回放协程，回放协程数量按照CPU核数进行分配，并且可以调整数量。阻塞队列通过条件变量不断轮询多个回放协程提醒可以进行回放。如图7所示。

7.时间复杂度评估

a.假设图为G＝(V,E)

b.时间复杂度为O(V+E+V+VlogV)

i.处理所有的点集与边集O(V+E)

ii.并查集按秩合并/路径压缩O(V)

iii.数组排序O(VlogV)

iv.整体复杂度为O(E+VlogV)

以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于有向图的高性能事务并发复制方法，其特征在于，

根据事务数据事件kvEvent构建事务之间的依赖关系，根据事务提交事件commitEvent消除事务的循环依赖关系，并且对于有向图的数个强联通分量实现并发回放。

2.根据权利要求1所述的方法，其特征在于，

通过有向图模拟事务之间的依赖关系；

通过强联通分量定义事务顶端；

通过并查集实现互相依赖的事务关系之间的合并；

通过引入阻塞队列条件变量以及数个回放协程，实现并发的对数个可回放的强联通分量进行并发回放。

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求3所述的方法，其特征在于，

5.根据权利要求4所述的方法，其特征在于，

6.根据权利要求5所述的方法，其特征在于，

7.根据权利要求6所述的方法，其特征在于，

当一个环接收到全部的事务数据事件以及全部的事务提交事件后，可对强联通分量内的事务节点进行排序，此时问题退化为一组数据排序；通过对数据节点按照提交时间戳排序，即可得到最终的事务回放顺序，则事务最终按照事务的提交顺序进行回放。

8.根据权利要求7所述的方法，其特征在于，

当出现数个强联通分量同时可回放时，需要构建一个阻塞队列，并通过该阻塞队列不断唤醒回放协程进行工作，对强联通分量内的事务节点进行按顺序回放；每个强联通分量分配一个回放协程，回放协程数量按照CPU核数进行分配，并且可调整数量。

9.根据权利要求8所述的方法，其特征在于，

阻塞队列通过条件变量不断轮询数个回放协程提醒可以进行回放。