WO2024040902A1

WO2024040902A1 - 数据访问方法、分布式数据库系统及计算设备集群

Info

Publication number: WO2024040902A1
Application number: PCT/CN2023/079068
Authority: WO
Inventors: 徐宜良
Original assignee: 华为云计算技术有限公司
Priority date: 2022-08-22
Filing date: 2023-03-01
Publication date: 2024-02-29
Also published as: CN117668097A

Abstract

一种数据访问方法、分布式数据库系统及计算设备集群，属于数据库技术领域。该数据访问方法应用于分布式数据库系统，该系统包括协调节点（201）和多组数据节点（202），其中，协调节点（201）响应于针对数据的数据访问请求，从多组数据节点（202）中的多个备节点上报的事务快照点中，确定第一快照点，将第一快照点和数据访问请求发送给多个备节点，以使多个备节点基于第一快照点返回数据的目标版本的数据分片。在这一过程中，由于第一快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此该第一快照点能够作为一种全局一致性读的快照点，确保多个备节点返回同一版本的数据分片，从而满足了数据一致性原则。

Description

数据访问方法、分布式数据库系统及计算设备集群

本申请要求于2022年08月22日提交的申请号为202211009112.4、发明名称为“数据访问方法、分布式数据库系统及计算设备集群”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据库技术领域，特别涉及一种数据访问方法、分布式数据库系统及计算设备集群。

背景技术

目前，越来越多的互联网应用采用分布式数据库系统来实现相关业务。由于大多数互联网业务操作的特点是读多写少，因此，往往采用读写分离来提升分布式数据库系统的读性能。例如，通过为分布式数据库系统中各个数据分片(shard)设置主备节点来实现读写分离，由主节点负责“写操作”，由备节点负责“读操作”。

然而，由于分布式数据库系统中各个数据分片对应的主备节点之间数据同步时会存在延迟，导致在向多个备节点同时发起访问请求时，难以确保获取到的数据满足一致性原则。例如，在基于一个分布式事务对数据分片A和数据分片B进行数据更新时，由于主备节点之间的数据同步存在延迟，数据分片A对应的备节点已完成数据同步，数据分片B对应的备节点尚未完成数据同步，此时，若向这两个数据分片对应的备节点同时发起访问请求，则从数据分片A对应的备节点上获取到的是更新后的数据分片，从数据分片B对应的备节点上获取到的是更新前的数据分片，导致获取到的数据不满足一致性原则。

因此，亟需一种能够确保读写分离场景下，从备节点获取到的数据满足一致性原则的数据访问方法和分布式数据库系统。

发明内容

本申请实施例提供了一种数据访问方法、分布式数据库系统及计算设备集群，能够确保读写分离场景下，从备节点获取到的数据满足一致性原则。该技术方案如下：

第一方面，提供了一种数据访问方法，应用于分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，该方法包括：

该协调节点响应于针对数据的数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，该第一快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

该协调节点将该数据访问请求和该第一快照点发送给该多个备节点；

该多个备节点基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点，该目标版本为该第一快照点对应的版本。

其中，事务快照点是事务提交完成的情况下获取到的事务提交快照点，每个事务的事务标识全局唯一，每个事务的事务快照点全局唯一，且事务快照点能够指示事务提交的先后顺序。换言之，事务、事务标识以及事务快照点之间存在映射关系，每个事务都对应有唯一的事务标识和事务快照点。以事务快照点为事务提交序列号(commit sequence number，CSN)为例，若事务A、事务B以及事务C的CSN分别为111、113、112，表明这三个事务的提交顺序为事务A、事务C以及事务B。在上述方法中，协调节点响应于针对数据的数据访问请求，从多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，将该第一快照点和该数据访问请求发送给该多个备节点，以使该多个备节点基于该第一快照点返回该数据的目标版本的数据分片。在这一过程中，由于第一快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此该第一快照点能够作为一种全局一致性读的快照点，确保多个备节点返回同一版本的数据分片，从而满足了数据一致性原则。

在一些实施例中，该多个备节点基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点，包括：

第一备节点基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的事务快照点大于或等于该第一快照点的情况下，将该第一备节点上该数据的目标版本的数据分片发送给该协调节点，该第一备节点为该多个备节点中的任一个备节点。

上述过程也即是备节点基于第一快照点进行数据可见性判定的过程，通过这种方式，备节点能够返回该第一快照点对应的版本的数据分片，满足数据一致性原则。

在一些实施例中，该方法还包括：

该第一备节点基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的事务快照点小于该第一快照点的情况下，将该数据访问请求和该第一快照点发送给该第一备节点对应的主节点；

该第一备节点对应的主节点基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点。

通过这种方式，当某一备节点上不存在目标版本的数据分片时，由该备节点对应的主节点向协调节点返回执行结果，从而确保了客户端能够接收到完整的数据访问结果。

在一些实施例中，该方法还包括：

该多个备节点每间隔第一时长，向该协调节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

该协调节点基于接收到的事务快照点，更新该多个备节点上报的事务快照点。

通过上述方式，分布式数据库系统中每个备节点内部都维护一个最大的事务快照点，并定时上报给协调节点，以使协调节点获知系统中每个备节点上已和主节点完成数据同步的最新事务，为后续基于数据访问请求读取数据时，确保各个数据分片的数据一致性提供了基础。

在一些实施例中，该事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。

在一些实施例中，该协调节点响应于针对数据的数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，包括：

该协调节点响应于该数据访问请求，从目标列表中确定该第一快照点，该目标列表用于存储该多个备节点的节点标识和该多个备节点上报的事务快照点，该多个备节点上报的事务快照点指示该多个备节点上已和主节点完成数据同步的最新事务。

通过这种方式，协调节点以列表的形式存储各个备节点上报的事务快照点，便于查询，提高了数据访问效率。

在一些实施例中，该方法还包括：

该协调节点响应于第一主节点发送的数据清理请求，从该多个备节点上报的事务快照点中，确定第二快照点，该第二快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，该第一主节点为该多个主节点中的任一个主节点；

该协调节点将该第二快照点发送给该第一主节点；

该第一主节点基于该第二快照点，清理该第一主节点上该数据的历史版本的数据分片，该历史版本为该第二快照点之前的版本。

在上述过程中，由于第二快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此第二快照点能够作为一种全局一致性清理的快照点，确保了主节点在进行数据清理时各个数据分片的数据一致性。

在一些实施例中，该系统还包括管理节点，该方法还包括：

该多个备节点每间隔第二时长，向该管理节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

该协调节点响应于针对数据的数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，包括：

该协调节点响应于该数据访问请求，向该管理节点发送快照点获取请求，以获取该第一快照点。

通过上述方式，分布式数据库系统中每个备节点内部都维护一个最大的事务快照点，并定时上报给管理节点，以使管理节点获知系统中每个备节点上已和主节点完成数据同步的最新事务，当协调节点基于数据访问请求读取数据时，能够通过向管理节点发送快照点获取请求的方式获取相应的快照点，为确保各个数据分片的数据一致性提供了基础。

在一些实施例中，该系统还包括管理节点，该方法还包括：

第一主节点在目标事务提交完成的情况下，向该管理节点发送针对该目标事务的事务提交请求；

该管理节点响应于该事务提交请求，生成该目标事务的事务快照点，将该目标事务的事务快照点发送给该第一主节点；

该第一主节点对应的备节点对该目标事务进行日志回放，完成和该第一主节点的数据同步。

第二方面，本申请实施例提供了一种分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点；

该协调节点，用于响应于针对数据的数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，该第一快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

该协调节点，还用于将该数据访问请求和该第一快照点发送给该多个备节点；

该多个备节点，用于基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点，该目标版本为该第一快照点对应的版本。

在一些实施例中，第一备节点，用于基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的快照点大于或等于该第一快照点的情况下，将该第一备节点上该数据的目标版本的数据分片发送给该协调节点，该第一备节点为该多个备节点中的任一个备节点。

在一些实施例中，该第一备节点，还用于基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的事务快照点小于该第一快照点的情况下，将该数据访问请求和该第一快照点发送给该第一备节点对应的主节点；

该第一备节点对应的主节点，用于基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点。

在一些实施例中，该多个备节点，用于每间隔第一时长，向该协调节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

该协调节点，用于基于接收到的事务快照点，更新该多个备节点上报的事务快照点。

在一些实施例中，该事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。

在一些实施例中，该协调节点，用于响应于该数据访问请求，从目标列表中确定该第一快照点，该目标列表用于存储该多个备节点的节点标识和该多个备节点上报的事务快照点，该多个备节点上报的事务快照点指示该多个备节点上已和主节点完成数据同步的最新事务。

在一些实施例中，该协调节点，还用于响应于第一主节点发送的数据清理请求，从该多个备节点上报的事务快照点中，确定第二快照点，该第二快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，该第一主节点为该多个主节点中的任一个主节点；

该协调节点，还用于将该第二快照点发送给该第一主节点；

该第一主节点，用于基于该第二快照点，清理该第一主节点上该数据的历史版本的数据分片，该历史版本为该第二快照点之前的版本。

在一些实施例中，该系统还包括管理节点，

该多个备节点，还用于每间隔第二时长，向该管理节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

该协调节点，用于响应于该数据访问请求，向该管理节点发送快照点获取请求，以获取该第一快照点。

在一些实施例中，该系统还包括管理节点，

第一主节点，用于在目标事务提交完成的情况下，向该管理节点发送针对该目标事务的事务提交请求；

该管理节点，用于响应于该事务提交请求，生成该目标事务的事务快照点，将该目标事务的事务快照点发送给该第一主节点；

该第一主节点对应的备节点，用于对该目标事务进行日志回放，完成和该第一主节点的数据同步。

第三方面，本申请实施例提供了一种计算设备集群，包括至少一个计算设备，每个计算设备包括处理器和存储器；该至少一个计算设备的处理器用于执行该至少一个计算设备的存储器中存储的指令，以使得该计算设备集群执行如前述第一方面或第一方面的任意一种可能的实现方式所提供的数据访问方法。

第四方面，本申请实施例提供了一种数据访问装置，应用于分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，该装置包括至少一个功能模块，用于执行如前述第二方面或第二方面的任意一种可能的实现方式所涉及的协调节点的功能。

第五方面，本申请实施例提供了一种数据访问装置，应用于分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，该装置包括至少一个功能模块，用于执行如前述第二方面或第二方面的任意一种可能的实现方式所涉及的备节点的功能。

第六方面，本申请实施例提供了一种包含指令的计算机程序产品，当该指令被计算设备集群运行时，使得该计算设备集群执行如前述第一方面或第一方面的任意一种可能的实现方式所提供的数据访问方法。该计算机程序产品可以为一个软件安装包，在需要实现前述计算设备集群的功能的情况下，可以下载该计算机程序产品并在计算设备集群上执行该计算机程序产品。

第七方面，本申请实施例提供了一种计算机可读存储介质，包括计算机程序指令，当该计算机程序指令由计算设备集群执行时，该计算设备集群执行如前述第一方面或第一方面的任意一种可能的实现方式所提供的数据访问方法。该存储介质包括但不限于易失性存储器，例如随机访问存储器，非易失性存储器，例如快闪存储器、硬盘(hard disk drive，HDD)、固态硬盘(solid state drive，SSD)。

附图说明

图1是本申请实施例提供的一种实施环境示意图；

图2是本申请实施例提供的一种分布式数据库系统的架构示意图；

图3是本申请实施例提供的一种计算设备的硬件结构示意图；

图4是本申请实施例提供的一种计算设备集群的结构示意图；

图5是本申请实施例提供的一种计算设备集群的连接方式示意图；

图6是本申请实施例提供的一种数据访问方法的流程示意图；

图7是本申请实施例提供的一种数据节点定时上报事务快照点的示意图；

图8是本申请实施例提供的一种数据访问方法的流程示意图；

图9是本申请实施例提供的一种数据清理方法的流程示意图；

图10是本申请实施例提供的一种数据访问装置的结构示意图；

图11是本申请实施例提供的一种数据访问装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

为了方便理解，下面先对本申请涉及的关键术语和关键概念进行说明。

数据库(database)，一种电子化的文件柜，也即是存储电子文件的处所，用户可以对电子文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

事务，是数据库系统在执行操作的过程中的一个逻辑单位，由一个有限的数据库操作序列构成，是数据库系统操作的最小执行单位。

数据分片(shard)，是指在分布式数据库系统中数据管理的最小逻辑单元。一个数据分片拥有多个副本。在一些实施例中，当分布式数据库系统新建一个数据分片时，将该数据分片的分片信息进行存储。例如，该分片信息包括该数据分片的数据范围以及多个副本各自的节点信息等，对此不作限定。

虚拟机(virtual machine)，是指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。在服务器中能够完成的工作在虚拟机中都能够实现。在服务器中创建虚拟机时，需要将实体机的部分硬盘和内存容量作为虚拟机的硬盘和内存容量，每个虚拟机都有独立的硬盘和操作系统，虚拟机的用户可以像使用服务器一样对虚拟机进行操作。

下面对本申请涉及的应用场景和实施环境进行介绍。

本申请实施例提供的技术方案能够应用于数据库领域，其应用场景包括各种能够实现读写分离的分布式数据库系统中。

图1是本申请实施例提供的一种实施环境示意图。如图1所示，该实施环境包括终端101和服务器102，终端101通过无线网络或有线网络与服务器102直接或间接相连。

终端101可以是智能手机、台式计算机、增强现实终端、平板电脑、电子书阅读器和膝上型便携计算机中的至少一种。终端101能够安装和运行应用程序。该应用程序可以是客户端应用，也可以是浏览器应用等，对此不作限定。例如，应用程序为网页浏览客户端、社交客户端或者音视频客户端等等。以应用程序为网页浏览客户端为例，用户能够通过该网页浏览客户端浏览各类网页数据。

服务器102为独立的物理服务器，或者是多个物理服务器构成的服务器集群或者分布式文件系统，又或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，CDN)以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于运行分布式数据库系统，为终端101上运行的应用程序提供后台服务。例如，以网页浏览客户端为例，终端101响应于用户针对目标网页的浏览操作，触发网页浏览客户端向服务器102上运行的分布式数据库系统发送针对该目标网页的数据访问请求，由该分布式数据库系统响应于该数据访问请求，读取目标网页的网页数据，向网页浏览客户端返回数据访问结果。在一些实施例中，服务器 102通过虚拟机来运行分布式数据库系统，或者，服务器102通过容器引擎来运行分布式数据库系统，对此不作限定。

终端101可以泛指多个终端中的一个，或者多个终端组成的集合；服务器102可以是计算设备集群、虚拟机或容器引擎等等，本申请实施例对实施环境中每种设备的数量和设备类型不做限定。

在一些实施例中，上述的无线网络或有线网络使用标准通信技术和/或协议。网络包括但不限于数据中心网络(data center network)、存储区域网(storage area network，SAN)、局域网(local area network，LAN)、城域网(metropolitan area network，MAN)、广域网(wide area network，WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实现方式中，使用包括超级文本标记语言(hyper text markup language，HTML)、可扩展标记语言(extensible markup language，XML)等的技术和/或格式来代表通过网络交换的数据。此外还能够使用诸如安全套接字层(secure sockets layer，SSL)、传输层安全(transport layer security，TLS)、虚拟专用网络(virtual private network，VPN)、网际协议安全(internet protocol security，IPsec)等常规加密技术来加密所有或者部分链路。在另一些实施例中，还能够使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

下面对上述实施环境涉及的分布式数据库系统的架构进行介绍。

图2是本申请实施例提供的一种分布式数据库系统的架构示意图。图2仅是示例性地展示了分布式数据库系统的一种结构化示意图，本申请并不限定对分布式数据库系统中各个部分的划分。如图2所示，该分布式数据库系统200包括协调节点(coordinator node，CN)201、多组数据节点(data node，DN)202以及管理节点203，每组数据节点202包括主节点和至少一个备节点，对于任一组数据节点202，该组数据节点202用于维护一个数据分片，该组数据节点202中的主节点用于执行针对该数据分片的写事务，该组数据节点202中的备节点用于执行针对该数据分片的读事务。

协调节点201与终端之间通信连接，终端上运行有客户端，协调节点201用于接收客户端发送的针对数据的数据处理请求(如数据访问请求、数据更新请求等)，将请求下发给对应的数据节点202执行，在接收到数据节点202反馈的执行结果后，向客户端返回相应的数据处理结果(如数据访问结果、数据更新结果等)。

多组数据节点202用于存储客户端的数据，接收来自协调节点201的数据处理请求，执行相应的事务(如数据访问对应的读事务、数据更新对应的写事务等)，向协调节点201返回执行结果。

管理节点203用于生成和维护事务标识和事务快照点等全局唯一的信息。在一些实施例中，该管理节点203也称为全局事务管理器(global transaction manager，GTM)，对此不作限定。

下面对分布式数据库系统200处理数据更新请求和数据访问请求的过程进行简要介绍。

以数据更新请求为例，协调节点201接收客户端发送的针对数据的数据更新请求，向管理节点203申请开启一个分布式写事务，接收管理节点203下发的事务标识，确定该数据对应的数据分片，根据路由分片规则，将该分布式写事务下发给对应的主节点(DN1主和DN2主)执行，主节点执行完成后，将执行结果发送给协调节点201，以使协调节点201向客户端返回数据更新结果。另外，协调节点201在该分布式写事务提交完成的情况下，向管理节点203申请该分布式写事务已提交的事务快照点，将该事务快照点反馈给对应的主节点。在这一过程中，备节点(DN1备和DN2备)对该分布式写事务进行日志回放，完成和主节点的数据同步。

以数据访问请求为例，协调节点201接收客户端发送的针对数据的数据访问请求，确定该数据对应的数据分片，在数据分片所在的备节点(DN1备和DN2备)满足读写分离条件的情况下，根据路由分片规则，将该数据访问请求下发给对应的备节点执行，备节点执行完成后，将执行结果发送给协调节点201，以使协调节点201向客户端返回数据访问结果。这一过程会在后续方法实施例中进行详细介绍，在此不再赘述。

需要说明的是，上述分布式数据库系统中的协调节点和数据节点均可以通过软件实现，或者可以通过硬件实现。示例性的，接下来介绍协调节点的实现方式。类似的，数据节点的实现方式可以参考协调节点的实现方式。

节点作为软件功能单元的一种举例，协调节点可以包括运行在计算实例上的代码。其中，计算实例可以是物理主机(计算设备)、虚拟机、容器等计算设备中的至少一种。进一步地，上述计算设备可以是一台或者多台。例如，协调节点可以包括运行在多个主机/虚拟机/容器上的代码。需要说明的是，用于运行该应用程序的多个主机/虚拟机/容器可以分布在相同的区域(region)中，也可以分布在不同的region中。用于运行该代码的多个主机/虚拟机/容器可以分布在相同的可用区(availability zone，AZ)中，也可以分布在不同的AZ中，每个AZ包括一个数据中心或多个地理位置相近的数据中心。其中，通常一个region可以包括多个AZ。

同样，用于运行该代码的多个主机/虚拟机/容器可以分布在同一个虚拟私有云(virtual private cloud，VPC)中，也可以分布在多个VPC中。其中，通常一个VPC设置在一个region内。同一region内两个VPC之间，以及不同region的VPC之间跨区通信需在每个VPC内设置通信网关，经通信网关实现VPC之间的互连。

节点作为硬件功能单元的一种举例，协调节点可以包括至少一个计算设备，如服务器等。或者，协调节点也可以是利用专用集成电路(application-specific integrated circuit，ASIC)实现、或可编程逻辑器件(programmable logic device，PLD)实现的设备等。其中，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)、现场可编程门阵列(field-programmable gate array，FPGA)、通用阵列逻辑(generic array logic，GAL)或其任意组合实现。

协调节点包括的多个计算设备可以分布在相同的region中，也可以分布在不同的region中。协调节点包括的多个计算设备可以分布在相同的AZ中，也可以分布在不同的AZ中。同样，协调节点包括的多个计算设备可以分布在同一个VPC中，也可以分布在多个VPC中。其中，该多个计算设备可以是服务器、ASIC、PLD、CPLD、FPGA和GAL等计算设备的任意组合。

下面对上述分布式数据库系统中涉及的计算设备的结构进行介绍。

本申请还提供了一种计算设备，能够配置为上述分布式数据库系统中的协调节点和数据节点。参考图3，图3是本申请实施例提供的一种计算设备的硬件结构示意图。如图3所示，计算设备300包括：总线302、处理器304、存储器306和通信接口308。处理器304、存储器306和通信接口308之间通过总线302通信。应理解，本申请不限定计算设备300中的处理器、存储器的个数。

总线302可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条线表示，但并不表示仅有一根总线或一种类型的总线。总线304可包括在计算设备300各个部件(例如，存储器306、处理器304、通信接口308)之间传送信息的通路。

处理器304可以包括中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)、微处理器(micro processor，MP)或者数字信号处理器(digital signal processor，DSP)等处理器中的任意一种或多种。

存储器306可以包括易失性存储器(volatile memory)，例如随机存取存储器(random access memory，RAM)。处理器304还可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器，机械硬盘(hard disk drive，HDD)或固态硬盘(solid state drive，SSD)。

存储器306中存储有可执行的程序代码，处理器304执行该可执行的程序代码以分别实现前述协调节点和数据节点的功能，从而实现下述数据访问方法。也即，存储器306上存有用于执行数据访问方法的指令。

通信接口303使用例如但不限于网络接口卡、收发器一类的收发模块，来实现计算设备300与其他设备或通信网络之间的通信。

本申请实施例还提供了一种计算设备集群。该计算设备集群包括至少一台计算设备。

图4是本申请实施例提供的一种计算设备集群的结构示意图。如图4所示，该计算设备集群包括至少一个计算设备300。计算设备集群中的一个或多个计算设备300中的存储器306中可以存有相同的用于执行数据访问方法的指令。

在一些可能的实现方式中，该计算设备集群中的一个或多个计算设备300的存储器306中也可以分别存有用于执行数据访问方法的部分指令。换言之，一个或多个计算设备300的组合可以共同执行用于执行数据访问方法的指令。

需要说明的是，计算设备集群中的不同的计算设备300中的存储器306可以存储不同的指令，分别用于执行分布式数据库系统的部分功能。也即，不同的计算设备300中的存储器306存储的指令可以实现协调节点和数据节点中的一个或多个节点的功能。

在一些实施例中，计算设备集群中的一个或多个计算设备可以通过网络连接。其中，该网络可以是广域网或局域网等等。图5是本申请实施例提供的一种计算设备集群的连接方式示意图。如图5所示，两个计算设备300之间通过网络进行连接。具体地，通过各个计算设备中的通信接口与该网络进行连接。在这一类可能的实现方式中，图5所示的计算设备集群之间的连接方式考虑到本申请提供的数据访问方法涉及不同类型的节点，因此在不同计算设备的存储器中存有执行不同节点的功能的指令。例如，一个计算设备300中的存储器306中存有执行协调节点的功能的指令。另一个计算设备300中的存储器306中存有执行数据节点的功能的指令。

应理解，图5中示出的计算设备300的功能也可以由多个计算设备300完成。

本申请实施例还提供了一种包含指令的计算机程序产品。该计算机程序产品可以是包含指令的，能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当该计算机程序产品在计算设备集群上运行时，使得计算设备集群执行数据访问方法。

本申请实施例还提供了一种计算机可读存储介质。该计算机可读存储介质可以是计算设备能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。该可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令，该指令指示计算设备集群执行数据访问方法。

下面对本申请实施例提供的数据访问方法进行介绍。

图6是本申请实施例提供的一种数据访问方法的流程示意图。如图6所示，该数据访问方法应用于上述分布式数据库系统，下面以分布式数据库系统中各节点之间的交互为例，对该数据访问方法进行介绍。示意性地，该方法包括如下步骤601至步骤606。

601、多组数据节点中的多个备节点每间隔第一时长，向协调节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点。

在本申请实施例中，分布式数据库系统基于数据分片来存储数据，一个数据分片由一组数据节点来维护，该组数据节点包括主节点和至少一个备节点，主节点用于执行写事务，备节点用于执行读事务。事务快照点是主节点在事务提交完成的情况下，通过管理节点获取到的事务提交快照点，每个事务的事务标识全局唯一，每个事务的事务快照点全局唯一，且事务快照点能够指示事务提交的先后顺序。换言之，事务、事务标识以及事务快照点之间存在映射关系，每个事务都对应有唯一的事务标识和事务快照点。在一些实施例中，事务快照点为事务提交序列号(commit sequence number，CSN)或事务提交时间戳等，对此不作限定。以事务快照点为CSN为例，CSN是一种全局自增的整数，根据CSN的大小可以判断事务提交的先后顺序，CSN越小表示事务的提交顺序越早。例如，若事务A、事务B以及事务C的CSN分别为111、113、112，表明这三个事务的提交顺序为事务A、事务C以及事务B。

以第一主节点(多组数据节点中的任一个主节点)执行目标事务为例，第一主节点在目标事务提交完成的情况下，向管理节点发送针对该目标事务的事务提交请求；该管理节点响应于该事务提交请求，生成该目标事务的事务快照点，将该目标事务的事务快照点发送给该第一主节点；该第一主节点对应的备节点对该目标事务进行日志回放，完成和该第一主节点的数据同步。其中，第一主节点对应的备节点在对该目标事务进行日志回放的过程中，也即获取到了该目标事务的事务快照点。

在分布式数据库系统的运行过程中，多组数据节点的备节点通过日志回放的方式完成和主节点的数据同步，也即获取到已提交事务的事务快照点，在这一过程中，各个备节点每间隔第一时长，向协调节点发送备节点上已和主节点完成数据同步的最新事务的事务快照点。其中，该第一时长为预设时长，能够根据需求进行设置，例如，第一时长为5秒，对此不作限定。这一过程也即是，以事务快照点为CSN为例，分布式数据库系统中的各个备节点内部都维护一个最大的事务快照点，并定时上报给协调节点。例如，第一时长为5秒，备节点每间隔5秒，将该备节点上存储的最大CSN发送给协调节点。需要说明的是，该多个备节点可以每间隔第一时长，同步向协调节点上报事务快照点(如备节点1和备节点2同步上报)，也可以异步上报(如备节点1和备节点2依次上报)，本申请实施例对此不作限定。

602、协调节点基于接收到的事务快照点，更新该多个备节点上报的事务快照点。

在本申请实施例中，协调节点存储有目标列表，该目标列表用于存储该多个备节点的节点标识和该多个备节点上报的事务快照点。需要说明的是，协调节点还能够以其他形式存储多个备节点上报的事务快照点，并不局限于列表形式，本申请实施例对此不作限定。

在一些实施例中，协调节点每接收到一个备节点上报的事务快照点，基于该备节点的节点标识，更新该目标列表中该备节点上报的事务快照点。例如，以事务快照点为CSN为例，该目标列表存储有备节点1(115)、备节点2(116)、备节点3(117)，若协调节点接收到备节点1发送的事务快照点118，则更新该目标列表为备节点1(118)、备节点2(116)、备节点3(117)。通过这种方式，协调节点能够及时根据接收到的事务快照点更新目标列表，确保目标列表的实时性。

在一些实施例中，协调节点基于指定时间段内接收到的多个事务快照点，更新该目标列表。例如，该指定时间段为10秒，对此不作限定。应理解，指定时间段内某一备节点有可能上报了多个事务快照点，基于此，协调节点基于该备节点上报的最后一个事务快照点，更新该目标列表。或者，协调节点在接收到的多个事务快照点的数量达到指定数量的情况下，更新该目标列表，例如，该指定数量为10。同理，协调节点接收到的指定数量个事务快照点中也可能包括了某一个备节点上报的多个事务快照点，基于此，协调节点基于该备节点上报的最后一个事务快照点，更新该目标列表。通过上述方式，能够减少协调节点更新目标列表的频率，从而节约数据处理量。

经过上述步骤601和步骤602，分布式数据库系统中每个备节点内部都维护一个最大的事务快照点，也称为事务强一致性快照点，能够确保事务的执行不影响系统的数据一致性，通过将事务快照点定时上报给协调节点，便于协调节点获知系统中每个备节点上已和主节点完成数据同步的最新事务，为后续基于数据访问请求读取数据时，确保各个数据分片的数据一致性提供了基础。

603、协调节点响应于针对数据的数据访问请求，从多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，该第一快照点指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务。

在本申请实施例中，数据访问请求由客户端发送，协调节点响应于该数据访问请求，基于该数据对应的多个数据分片，确定该多个数据分片所在的多组数据节点，在该多组数据节点中的多个备节点满足读写分离条件的情况下，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点。其中，读写分离条件指示任一组数据节点中的备节点与主节点之间数据更新的时间差小于或等于目标时长，即，主节点上数据的最新版本和备节点上数据的最新版本之间不能相差太远，否则不满足业务需求。例如，该目标时长为5秒，对此不作限定。这一过程也即是，在协调节点接收到一个数据访问请求的情况下，会判断该数据访问请求是否可以使用读写分离，在可以使用读写分离的情况下，再将该数据访问请求下发至备节点执行。

基于上述步骤602可知，协调节点上存储有目标列表，相应地，协调节点响应于该数据访问请求，从目标列表中确定该第一快照点。以事务快照点为CSN为例，协调节点响应于该数据访问请求，基于该数据对应的多个数据分片，确定该多个数据分片所在的多组数据节点，基于该多组数据节点中的多个备节点的节点标识，从目标列表中该多个备节点上报的CSN中，确定最小CSN，该最小CSN也即是提交顺序最早的事务，将该最小CSN作为第一快照点。

604、协调节点将该数据访问请求和该第一快照点发送给多个备节点。

在本申请实施例中，协调节点基于路由分片规则，将该数据访问请求和该第一快照点发送给多个备节点。

605、多个备节点基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给协调节点。

在本申请实施例中，目标版本是指该第一快照点对应的版本。例如，以事务快照点为CSN为例，若第一快照点为119，则该数据的目标版本是指CSN为119的事务提交完成后该数据的版本。对于多个备节点中的任一个备节点(称为第一备节点)，该第一备节点基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的事务快照点大于或等于该第一快照点的情况下，将该第一备节点上该数据的目标版本的数据分片发送给该协调节点。这一过程也即是基于第一快照点进行数据可见性判定的过程。

基于此，每个备节点都将各自节点上同一版本的数据分片发送给协调节点，确保了各个数据分片的数据一致性。例如，以事务快照点为CSN为例，第一快照点为119，第一备节点上已和主节点完成数据同步的最新事务的事务快照点为120，该120大于119，则将该第一备节点上与CSN为119的事务对应的版本的数据分片发送给协调节点。

在一些实施例中，该第一备节点基于该数据访问请求和该第一快照点，在该第一备节点上已和主节点完成数据同步的最新事务的事务快照点小于该第一快照点的情况下，将该数据访问请求和该第一快照点发送给该第一备节点对应的主节点；该第一备节点对应的主节点基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点。即，当某一备节点上不存在目标版本的数据分片时，由该备节点对应的主节点向协调节点返回执行结果，从而确保了客户端能够接收到完整的数据访问结果。

606、协调节点基于接收到的多个数据分片，返回针对该数据的数据访问结果。

在本申请实施例中，协调节点基于该多个数据分片的分片信息，对该多个数据分片进行汇总，得到该数据的数据访问结果，向客户端返回该数据访问结果。

在上述步骤601至步骤606中，是以分布式数据库系统中备节点向协调节点上报事务快照点为例进行说明的，在另一些实施例中，备节点还能够向管理节点上报事务快照点，当协调节点基于数据访问请求读取数据时，能够通过向管理节点发送快照点获取请求的方式获取相应的快照点。

示意性地，多个备节点每间隔第二时长，向该管理节点发送该多个备节点上已和主节点完成数据同步的最新事务的事务快照点。其中，该第二时长为预设时长，能够根据需求进行设置，例如，第二时长为5秒，对此不作限定。基于与上述步骤601和步骤602同理的过程，管理节点基于接收到的事务快照点，更新该多个备节点上报的事务快照点，即，管理节点也能够以列表的形式存储该多个备节点上报的事务快照点。在协调节点接收到客户端发送的数据访问请求的情况下，该协调节点响应于该数据访问请求，向该管理节点发送快照点获取请求，以获取该第一快照点。其中，管理节点响应于该快照点获取请求，从多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，将该第一快照点发送给协调节点。这一过程与上述步骤603同理，在此不再赘述。通过这种方式，由管理节点维护多个备节点上报的事务快照点，能够节约协调节点的计算资源，释放协调节点的存储空间。

综上，介绍了本申请实施例提供的一种数据访问方法，应用于分布式数据库系统，其中，协调节点响应于针对数据的数据访问请求，从多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，将该第一快照点和该数据访问请求发送给该多个备节点，以使该多个备节点基于该第一快照点返回该数据的目标版本的数据分片。在这一过程中，由于第一快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此该第一快照点能够作为一种全局一致性读的快照点，确保多个备节点返回同一版本的数据分片，从而满足了数据一致性原则。

另外，在一些实施例中，主节点在进行数据清理时，能够根据多个备节点上报的事务快照点来确保各个数据分片的数据一致性。下面对这一过程进行介绍，包括下述几个步骤：

步骤A、协调节点响应于第一主节点发送的数据清理请求，从该多个备节点上报的事务快照点中，确定第二快照点，该第二快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务。

其中，该第一主节点为该多个主节点中的任一个主节点。基于与上述步骤603同理的过程，协调节点上存储有目标列表，该协调节点响应于该数据清理请求，从目标列表中确定该第二快照点。以事务快照点为CSN为例，协调节点响应于该数据清理请求，基于该数据对应的多个数据分片，确定该多个数据分片所在的多组数据节点，基于该多组数据节点中的多个备节点的节点标识，从目标列表中该多个备节点上报的CSN中，确定最小CSN，该最小CSN也即是提交顺序最早的事务，将该最小CSN作为第二快照点。

步骤B、协调节点将该第二快照点发送给该第一主节点。

步骤C、第一主节点基于该第二快照点，清理该第一主节点上该数据的历史版本的数据分片。

其中，该历史版本是指该第二快照点之前的版本。例如，以事务快照点为CSN为例，若第二快照点为118，则该数据的历史版本是指CSN为118的事务执行之前该数据的版本。应理解，第一主节点会将这一数据清理过程保存在日志中，该第一主节点对应的备节点也能够通过日志回放的方式完成与主节点的数据同步，在此不再赘述。

经过上述步骤A至步骤C，协调节点响应于第一主节点的数据清理请求，从多个备节点上报的事务快照点中，确定第二快照点，将该第二快照点发送给该第一主节点，以使该第一主节点基于该第二快照点清理该数据的历史版本。在这一过程中，由于第二快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此第二快照点能够作为一种全局一致性清理的快照点，确保了主节点在进行数据清理时各个数据分片的数据一致性。例如，以一组数据节点为例，该组数据节点中主节点上已提交的最新事务的事务快照点，大于该组数据节点中备节点上已和主节点完成数据同步的最新事务的事务快照点，由于备节点的数据正在读取时是不能清理的，因此以备节点上报的事务快照点中的最小值为清理点，能够确保数据清理时各个数据分片的数据一致性。

下面参考图7至图9，以事务快照点为CSN为例，对上述实施例中介绍的方法流程进行举例说明。

图7是本申请实施例提供的一种数据节点定时上报事务快照点的示意图。如图7所示，在本申请实施例提供的分布式数据库系统中，多组数据节点中每个备节点内部都维护一个最大的事务快照点(即CSN)，并定时上报给协调节点。协调节点在收到各个备节点上报的CSN后，在内部维护目标列表，其中，目标列表用于存储所有备节点的节点标识以及所有备节点上报的CSN，备节点上报的CSN为备节点上已和主节点完成数据同步的最新事务的CSN。

图8是本申请实施例提供的一种数据访问方法的流程示意图。如图8所示，该数据访问方法包括下述几个步骤：

步骤1、客户端发起一个针对数据的数据访问请求，即向协调节点发送数据访问请求。

步骤2、协调节点响应于该数据访问请求，判断是否可以使用读写分离，若可以，从内部维护的“目标列表”中确定第一快照点，该第一快照点即为“目标列表”中的最小CSN。

步骤3、协调节点将数据访问请求和该第一快照点发送给多个备节点。

步骤4、备节点接收该数据访问请求和该第一快照点，基于该第一快照点进行数据可见性判定，读取该数据的目标版本的数据分片。

步骤5、备节点把数据分片发送给协调节点。

步骤6、协调节点汇总各个数据分片并返回给客户端。

在上述过程中，由于第一快照点能够指示多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，因此该第一快照点能够作为一种全局一致性读的快照点，确保多个备节点返回同一版本的数据分片，从而满足了数据一致性原则。

图9是本申请实施例提供的一种数据清理方法的流程示意图。如图9所示，该数据清理方法包括下述几个步骤：

步骤1、主节点向协调节点发送数据清理请求。

步骤2、协调节点响应于该数据清理请求，从内部维护的“目标列表”中确定第二快照点，该第二快照点即为“目标列表”中的最小CSN。

步骤3、协调节点将该第二快照点发送给主节点。

步骤4、主节点基于该第二快照点，清理该主节点上该数据的历史版本的数据分片。

在上述过程中，由于第二快照点能够指示多个主节点上已提交的最新事务中提交顺序最早的事务，因此第二快照点能够作为一种全局一致性清理的快照点，确保了主节点在进行数据清理时各个数据分片的数据一致性。

图10是本申请实施例提供的一种数据访问装置的结构示意图。该数据访问装置可以通过软件、硬件或者两者的结合实现前述分布式数据库系统中协调节点的部分或者全部功能。本申请实施例提供的数据访问装置应用于分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，能够实现上述方法实施例中协调节点所执行的步骤。如图10所示，该数据访问装置包括确定模块1001和发送模块1002。

该确定模块1001，用于响应于针对数据的数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，该第一快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

该发送模块1002，用于将该数据访问请求和该第一快照点发送给该多个备节点，以使该多个备节点基于该数据访问请求和该第一快照点发送该数据的目标版本的数据分片，该目标版本为该第一快照点对应的版本。

在一些实施例中，该装置还包括更新模块，用于：接收该多个备节点每间隔第一时长发送的已和主节点完成数据同步的最新事务的事务快照点，基于接收到的事务快照点，更新该多个备节点上报的事务快照点。

在一些实施例中，该事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。

在一些实施例中，该确定模块1001，用于响应于该数据访问请求，从目标列表中确定该第一快照点，该目标列表用于存储该多个备节点的节点标识和该多个备节点上报的事务快照点，该多个备节点上报的事务快照点指示该多个备节点上已和主节点完成数据同步的最新事务。

在一些实施例中，该确定模块1001，还用于响应于第一主节点发送的数据清理请求，从该多个备节点上报的事务快照点中，确定第二快照点，该第二快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，该第一主节点为该多个主节点中的任一个主节点；

该发送模块1002，还用于将该第二快照点发送给该第一主节点，以使该第一主节点基于该第二快照点，清理该第一主节点上该数据的历史版本的数据分片，该历史版本为该第二快照点之前的版本。

需要说明的是：上述实施例提供的数据访问装置在进行数据处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的数据访问装置与数据访问装置实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图11是本申请实施例提供的一种数据访问装置的结构示意图。该数据访问装置可以通过软件、硬件或者两者的结合实现前述分布式数据库系统中备节点的部分或者全部功能。本申请实施例提供的数据访问装置应用于分布式数据库系统，该系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，能够实现上述方法实施例中任一个备节点所执行的步骤。如图11所示，该数据访问装置包括接收模块1101和发送模块1102。

接收模块1101，用于接收协调节点发送的针对数据的数据访问请求和第一快照点，该第一快照点由该协调节点响应于该数据访问请求，从该多组数据节点中的多个备节点上报的事务快照点中确定，该第一快照点指示该多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

发送模块1102，用于基于该数据访问请求和该第一快照点，将该数据的目标版本的数据分片发送给该协调节点，该目标版本为该第一快照点对应的版本。

在一些实施例中，该发送模块1102，用于基于该数据访问请求和该第一快照点，在已和主节点完成数据同步的最新事务的事务快照点大于或等于该第一快照点的情况下，将该数据的目标版本的数据分片发送给该协调节点。

在一些实施例中，该装置还包括上报模块，该上报模块用于每间隔第一时长，向该协调节点发送备节点上已和主节点完成数据同步的最新事务的事务快照点。

在一些实施例中，该事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。

在一些实施例中，该系统还包括管理节点，该发送模块1102，还用于每间隔第二时长，向该管理节点发送备节点上已和主节点完成数据同步的最新事务的事务快照点。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语第一、第二等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如，在不脱离各种所述示例的范围的情况下，第一备节点可以被称为第二备节点，并且类似地，第二备节点可以被称为第一词组。第一词组和第二备节点都可以是备节点，并且在某些情况下，可以是单独且不同的备节点。

本申请中术语“至少一个”的含义是指一个或多个，本申请中术语“多个”的含义是指两个或两个以上，例如，多个备节点是指两个或两个以上的备节点。

以上描述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以程序结构信息的形式实现。该程序结构信息包括一个或多个程序指令。在计算设备上加载和执行该程序指令时，全部或部分地产生按照本申请实施例中的流程或功能。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的保护范围。

Claims

一种数据访问方法，其特征在于，应用于分布式数据库系统，所述系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点，所述方法包括：

所述协调节点响应于针对数据的数据访问请求，从所述多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，所述第一快照点指示所述多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

所述协调节点将所述数据访问请求和所述第一快照点发送给所述多个备节点；

所述多个备节点基于所述数据访问请求和所述第一快照点，将所述数据的目标版本的数据分片发送给所述协调节点，所述目标版本为所述第一快照点对应的版本。
根据权利要求1所述的方法，其特征在于，所述多个备节点基于所述数据访问请求和所述第一快照点，将所述数据的目标版本的数据分片发送给所述协调节点，包括：

第一备节点基于所述数据访问请求和所述第一快照点，在所述第一备节点上已和主节点完成数据同步的最新事务的事务快照点大于或等于所述第一快照点的情况下，将所述第一备节点上所述数据的目标版本的数据分片发送给所述协调节点，所述第一备节点为所述多个备节点中的任一个备节点。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

所述第一备节点基于所述数据访问请求和所述第一快照点，在所述第一备节点上已和主节点完成数据同步的最新事务的事务快照点小于所述第一快照点的情况下，将所述数据访问请求和所述第一快照点发送给所述第一备节点对应的主节点；

所述第一备节点对应的主节点基于所述数据访问请求和所述第一快照点，将所述数据的目标版本的数据分片发送给所述协调节点。
根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

所述多个备节点每间隔第一时长，向所述协调节点发送所述多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

所述协调节点基于接收到的事务快照点，更新所述多个备节点上报的事务快照点。
根据权利要求1至4中任一项所述的方法，其特征在于，所述事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。
根据权利要求1至5中任一项所述的方法，其特征在于，所述协调节点响应于针对数据的数据访问请求，从所述多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，包括：

所述协调节点响应于所述数据访问请求，从目标列表中确定所述第一快照点，所述目标列表用于存储所述多个备节点的节点标识和所述多个备节点上报的事务快照点，所述多个备节点上报的事务快照点指示所述多个备节点上已和主节点完成数据同步的最新事务。
根据权利要求1至6中任一项所述的方法，其特征在于，所述方法还包括：

所述协调节点响应于第一主节点发送的数据清理请求，从所述多个备节点上报的事务快照点中，确定第二快照点，所述第二快照点指示所述多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，所述第一主节点为所述多个主节点中的任一个主节点；

所述协调节点将所述第二快照点发送给所述第一主节点；

所述第一主节点基于所述第二快照点，清理所述第一主节点上所述数据的历史版本的数据分片，所述历史版本为所述第二快照点之前的版本。
根据权利要求1至7中任一项所述的方法，其特征在于，所述系统还包括管理节点，所述方法还包括：

所述多个备节点每间隔第二时长，向所述管理节点发送所述多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

所述协调节点响应于针对数据的数据访问请求，从所述多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，包括：

所述协调节点响应于所述数据访问请求，向所述管理节点发送快照点获取请求，以获取所述第一快照点。
根据权利要求1至8中任一项所述的方法，其特征在于，所述系统还包括管理节点，所述方法还包括：

第一主节点在目标事务提交完成的情况下，向所述管理节点发送针对所述目标事务的事务提交请求；

所述管理节点响应于所述事务提交请求，生成所述目标事务的事务快照点，将所述目标事务的事务快照点发送给所述第一主节点；

所述第一主节点对应的备节点对所述目标事务进行日志回放，完成和所述第一主节点的数据同步。
一种分布式数据库系统，其特征在于，所述系统包括协调节点和多组数据节点，每组数据节点包括主节点和备节点；

所述协调节点，用于响应于针对数据的数据访问请求，从所述多组数据节点中的多个备节点上报的事务快照点中，确定第一快照点，所述第一快照点指示所述多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务；

所述协调节点，还用于将所述数据访问请求和所述第一快照点发送给所述多个备节点；

所述多个备节点，用于基于所述数据访问请求和所述第一快照点，将所述数据的目标版本的数据分片发送给所述协调节点，所述目标版本为所述第一快照点对应的版本。
根据权利要求10所述的系统，其特征在于，

第一备节点，用于基于所述数据访问请求和所述第一快照点，在所述第一备节点上已和主节点完成数据同步的最新事务的快照点大于或等于所述第一快照点的情况下，将所述第一备节点上所述数据的目标版本的数据分片发送给所述协调节点，所述第一备节点为所述多个备节点中的任一个备节点。
根据权利要求11所述的系统，其特征在于，

所述第一备节点，还用于基于所述数据访问请求和所述第一快照点，在所述第一备节点上已和主节点完成数据同步的最新事务的事务快照点小于所述第一快照点的情况下，将所述数据访问请求和所述第一快照点发送给所述第一备节点对应的主节点；

所述第一备节点对应的主节点，用于基于所述数据访问请求和所述第一快照点，将所述数据的目标版本的数据分片发送给所述协调节点。
根据权利于要求10至12中任一项所述的系统，其特征在于，

所述多个备节点，用于每间隔第一时长，向所述协调节点发送所述多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

所述协调节点，用于基于接收到的事务快照点，更新所述多个备节点上报的事务快照点。
根据权利要求10至13中任一项所述的系统，其特征在于，所述事务快照点为下述任一项：

事务提交序列号；

事务提交时间戳。
根据权利要求10至14中任一项所述的系统，其特征在于，

所述协调节点，用于响应于所述数据访问请求，从目标列表中确定所述第一快照点，所述目标列表用于存储所述多个备节点的节点标识和所述多个备节点上报的事务快照点，所述多个备节点上报的事务快照点指示所述多个备节点上已和主节点完成数据同步的最新事务。
根据权利要求10至15中任一项所述的系统，其特征在于，

所述协调节点，还用于响应于第一主节点发送的数据清理请求，从所述多个备节点上报的事务快照点中，确定第二快照点，所述第二快照点指示所述多个备节点上已和主节点完成数据同步的最新事务中提交顺序最早的事务，所述第一主节点为所述多个主节点中的任一个主节点；

所述协调节点，还用于将所述第二快照点发送给所述第一主节点；

所述第一主节点，用于基于所述第二快照点，清理所述第一主节点上所述数据的历史版本的数据分片，所述历史版本为所述第二快照点之前的版本。
根据权利要求10至16中任一项所述的系统，其特征在于，所述系统还包括管理节点，

所述多个备节点，还用于每间隔第二时长，向所述管理节点发送所述多个备节点上已和主节点完成数据同步的最新事务的事务快照点；

所述协调节点，用于响应于所述数据访问请求，向所述管理节点发送快照点获取请求，以获取所述第一快照点。
根据权利要求10至17中任一项所述的系统，其特征在于，所述系统还包括管理节点，

第一主节点，用于在目标事务提交完成的情况下，向所述管理节点发送针对所述目标事务的事务提交请求；

所述管理节点，用于响应于所述事务提交请求，生成所述目标事务的事务快照点，将所述目标事务的事务快照点发送给所述第一主节点；

所述第一主节点对应的备节点，用于对所述目标事务进行日志回放，完成和所述第一主节点的数据同步。
一种计算设备集群，其特征在于，包括至少一个计算设备，每个计算设备包括处理器和存储器；

所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令，以使得所述计算设备集群执行如权利要求1至9中任一项所述的数据访问方法。
一种包含指令的计算机程序产品，其特征在于，当所述指令被计算设备集群运行时，使得所述计算设备集群执行如权利要求的1至9中任一项所述的数据访问方法。
一种计算机可读存储介质，其特征在于，包括计算机程序指令，当所述计算机程序指令由计算设备集群执行时，所述计算设备集群执行如权利要求1至9中任一项所述的数据访问方法。