WO2022002044A1

WO2022002044A1 - 分布式数据库的处理方法及装置、网络设备和计算机可读存储介质

Info

Publication number: WO2022002044A1
Application number: PCT/CN2021/103095
Authority: WO
Inventors: 吕修阳; 郭龙波; 徐文锋; 刘志文; 付裕; 吕达
Original assignee: 中兴通讯股份有限公司
Priority date: 2020-06-29
Filing date: 2021-06-29
Publication date: 2022-01-06
Also published as: CN113934792B; CN113934792A

Abstract

一种分布式数据库的处理方法及装置、一种网络设备和一种计算机可读存储介质，该分布式数据库的处理方法包括：对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果；待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。

Description

分布式数据库的处理方法及装置、网络设备和计算机可读存储介质

相关申请的交叉引用

本申请要求于2020年6月29日提交的中国专利申请NO.202010604834.9的优先权，该中国专利申请的内容通过引用的方式整体合并于此。

技术领域

本申请涉及数据库管理技术领域，具体涉及分布式数据库的处理方法及装置、网络设备和计算机可读存储介质。

背景技术

随着互联网行业迅猛发展，数据量呈爆发性增长。相关技术中的单机数据库越来越不能满足用户的业务需求，各行业用户都希望能够使用分布式数据库来进行数据的管理。但是，相关技术中的单机数据库的使用习惯已形成，用户很难适应分布式数据库的使用方法，尤其涉及到相关技术中的单机数据库中常用的自增长序列在分布式数据库中的应用问题。

序列(sequence)是数据库系统中按照一定规则自增的数列，因为序列具有自增性，所以序列中的数字不会重复。序列主要为数据库系统持续提供唯一的自增长的数值，序列可以作为数据表的主键，也可以作为数据操作时的唯一标识等。但是，分布式数据库中的数据搜索的效率较低，用户体验差。

公开内容

本申请实施例提供一种分布式数据库的处理方法，包括：对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果；待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。

本申请实施例提供一种分布式数据库的处理装置，包括：获取模块，配置为获取数据库集群中的待处理信息；处理模块，配置为对待处理信息进行排序，生成唯一递增的序列处理结果；待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。

本申请实施例提供一种网络设备，包括：一个或多个处理器；存储器，其上存储有一个或多个计算机程序，当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现本申请实施例中的分布式数据库的处理方法。

本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例中的分布式数据库的处理方法。

关于本申请的以上实施例和其他方面以及其实现方式，在附图说明、具体实施方式和权利要求中提供更多说明。

附图说明

图1示出本申请实施例中的分布式数据库的处理方法的一种流程示意图。

图2示出本申请实施例中的分布式数据库的处理方法的另一种流程示意图。

图3示出本申请实施例中的分布式数据库的处理装置的结构示意图。

图4示出本申请实施例中的分布式数据库的处理系统的一种组成方框图。

图5示出本申请实施例中的分布式数据库的处理系统的另一种组成方框图。

图6a示出本申请实施例中的全局序列管理器备机对数据进行全量备份时存在异常的处理流程示意图。

图6b示出本申请实施例中的全局序列管理器主机对数据进行恢复时的处理流程示意图。

图7示出能够实现根据本申请实施例的方法和装置的计算设备的示例性硬件架构的结构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下文中将结合附图对本申请的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的各实施例及实施例中的各特征可以相互任意组合。

在分布式数据库中，由于数据是处于不同分片上的，对各个数据的操作是互相隔离的，导致各分片上的数据对应的序列不唯一，用户在整个数据库集群上搜索数据时，无法为用户提供唯一的序列，使得数据搜索的效率较低，用户体验差。

图1是本申请实施例中的分布式数据库的处理方法的一种流程示意图，该方法可应用于分布式数据库的处理装置。如图1所示，所述分布式数据库的处理方法包括以下步骤101和102。

步骤101，获取数据库集群中的待处理信息。

待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。

需要说明的是，数据库集群中创建的分布式数据库可以有序列，也可以没有序列。一个序列对应一个分布式数据库，每个分布式数据库中可以有多个序列(例如，序列1、序列2等)。若某个分布式数据库中没有序列，则该分布式数据库无法使用序列的相关功能。

例如，应用发送多个待处理的结构化查询语言(Structured Query Language，SQL)语句给分布式数据库的处理装置，分布式数据库的处理装置通过多个不同的线程对待处理的SQL语句进行解析，获得待处理信息。该待处理信息包括多条需处理的序列信息，将一条待执行的SQL语句发送至对应的数据库节点上执行，可获得一条需处理的序列信息的处理结果。

步骤102，对待处理信息进行排序，生成唯一递增的序列处理结果。

需要说明的是，待处理信息中可包括序列创建、序列申请、序列删除等信息，使得分布式数据库的处理装置能够针对不同的序列操作，对待处理信息进行分类，然后依照不同的类别，对待处理信息进行处理，生成唯一递增的序列处理结果。

在一个具体实现中，步骤102可采用如下方式实现。依据待处理信息的到达顺序对待处理信息进行如下操作中的任意一项，生成唯一递增的序列处理结果：将待处理信息对应的序列添加至序列集合中；从序列集合中删除待处理信息对应的序列；依据待处理信息对序列集合进行修改。

序列处理结果包括序列，序列是数据库集群中按照一定规则自增的数字，因为自增所以不会重复，保证了序列的唯一性。序列可以作为代理主键，用于识别数据；还可以用于记录数据库中最新变化的语句，只要数据库中的语句有变化(例如，插入语句或删除语句等)，序列都会随着更新，故可根据序列来筛选出更新的语句。以上对于序列的使用方式仅是举例说明，可根据具体情况具体设定，其他未说明的序列的使用方式也在本申请的保护范围之内，在此不再赘述。

例如：第一待处理信息先到达，第二待处理信息后到达，则会先处理第一待处理信息(例如，为第一待处理信息分配序列100)，然后再处理第二待处理信息(例如，为第二待处理信息分配序列101)，使得获得的序列处理结果为：序列100和序列101，以保证序列是唯一递增的，避免出现两个序列为100的序列。

在本实施例中，通过依据待处理信息的到达顺序对待处理信息进行处理，生成唯一递增的序列处理结果，保证了序列的唯一性和自增性。由于待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，该序列集合包括序列，当用户使用序列处理结果在整个数据库集群上搜索数据时，加快了数据搜索的速度，提高了用户体验度。

本申请实施例提供了另一种可能的实现方式，在步骤101之前，所述分布式数据库的处理方法还包括以下步骤103至105。

步骤103，接收应用发送的数据库处理语句。

步骤104，对数据库处理语句进行解析，获得数据定义语言和数据操纵语言。

数据定义语言(Data Definition Language，DDL)是结构化查询语言(Structured Query Language，SQL)集合中负责数据结构定义与数据库对象定义的语言，DDL负责对数据库中的对象进行创建、修改、删除、索引和存储等操作。例如，建立数据库、建立数据表、建立数据表索引、建立查看表等操作。DDL须由计算机软件进行编译，转换为便于计算机存储、查询和操作的格式，完成这个转换工作的程序称为模式编译器。数据操纵语言(Data Manipulation Language，DML)，用户通过它可以实现对数据库的基本操作，例如，DML负责对数据库中的数据进行插入、修改和删除等操作。例如，将某个数据插入到已生成的数据库或数据表中，删除数据表中的某个数据，或，对数据表中的某些数据进行修改等操作。

步骤105，对数据库定义语言和数据操纵语言进行分析，提取待处理信息。

例如，通过对DDL和DML进行分析，获得DDL中的数据表所对应的数据库节点为数据库节点A，同时，DML语句中的数据对应的数据库节点也是数据库节点A，则将以上两条信息进行合并，获得与数据库节点A对应的待处理信息。

在一个具体实现中，步骤105可采用如下方式实现：对数据库定义语言和数据操纵语言进行分析，获得N个序列处理需求；对N个序列处理需求进行批量处理，生成待处理信息，N为大于或等于1的整数。

通过对N个序列处理需求进行批量处理，减少处理次数，避免消息冗余和数据库性能下降，提升了数据处理速度。

在本实施例中，通过多个不同的线程对数据库定义语言和数据操纵语言进行分析，提取待处理信息，然后将待处理信息进行批量处理，减少数据处理次数，避免消息冗余和数据库性能下降，提升了数据处理速度。

本申请实施例提供了另一种可能的实现方式，在步骤101之前，所述分布式数据库的处理方法还包括：依据分布式数据节点的处理能力对分布式数据节点进行集群的划分，获得数据库集群。

在本实施例中，通过依据分布式数据节点的处理能力对分布式数据节点进行集群的划分，使得能够让处理能力高的分布式数据节点可以处理较复杂的数据，处理能力较低的分布式数据节点处理较简单的数据，提升了数据库的工作效率。并且，采用数据库集群的方式来对各个分布式数据节点进行管理，在数据库集群的层面上对数据进行隔离，使得每个数据库集群上的序列信息保证唯一递增性，当用户在该数据库集群中查询某些数据时，能够快速找到需要的数据，提升用户体验度。

本申请实施例提供了另一种可能的实现方式，在步骤102之后，所述分布式数据库的处理方法还包括如下步骤106和107。

步骤106，依据序列处理结果，将数据库处理语句发送至分布式数据节点进行处理。

例如，序列处理结果包括多个序列，将序列1对应的待处理的SQL语句，发送至第一分布式数据节点中进行处理，生成第一数据处理结果；将序列2对应的待处理的SQL语句，发送至第二分布式数据节点中进行处理，生成第二数据处理结果；……；将序列n对应的待处理的SQL语句，发送至第n分布式数据节点中进行处理，生成第n数据处理结果。使得能够并行的对多个待处理的SQL语句进行处理，提升数据处理效率。

步骤107，响应于分布式数据节点反馈的数据处理结果，将数据处理结果转发给应用。

例如，将第一分布式数据节点反馈的第一数据处理结果，通过第1处理线程反馈至应用，将第二分布式数据节点反馈的第二数据处理结果，通过第2处理线程反馈至应用，……，将第n分布式数据节点反馈的第n数据处理结果，通过第n处理线程反馈至应用。并发的处理线程提升了数据处理速度，提升了用户体验度。

在本实施例中，通过将序列处理结果，通过不同的处理线程发送至对应的分布式数据节点进行处理，并将各个分布式数据节点反馈的数据处理结果再通过对应的处理线程反馈至应用，提升了数据处理效率，并使得应用能够快速获得数据处理结果，提升了用户体验度。

图2是本申请实施例中的分布式数据库的处理方法的另一种流程示意图。如图2所示，该分布式数据库的处理方法包括如下步骤201至203。

步骤201，获取数据库集群中的待处理信息。

步骤202，第一全局序列管理器对待处理信息进行排序，生成唯一递增的序列处理结果。

需要说明的是，本实施例中的步骤201和202与上一实施例中的步骤101和102类似，在此不再赘述。

步骤203，将序列处理结果同步至第二全局序列管理器中。

第二全局序列管理器是第一全局序列管理器的备份管理器，第一全局序列管理器包括处理线程。

例如，第二全局序列管理器和第一全局序列管理器互为备份管理器，当第一全局序列管理器发生故障时，使用第二全局序列管理器对待处理信息进行处理，生成唯一递增的序列处理结果；对应的，当第二全局序列管理器发生故障时，可以使用第一全局序列管理器对待处理信息进行处理，生成唯一递增的序列处理结果。

在一些具体实现中，全局序列管理器还可以采用集群的形式实现，例如，全局序列管理器包括一台全局序列管理器主机和多台全局序列管理器备机，保证有多个持有完整序列备份数据的全局序列管理器备机能够在全局序列管理器主机发生故障时，接替全局序列管理器主机继续进行工作，维持数据库序列功能的正常使用。

在本实施例中，通过将序列处理结果同步至第二全局序列管理器中，使得能够对序列处理结果进行备份，避免数据的丢失，保证在第一全局序列管理器出现故障时，第二全局序列管理器可以接替第一全局序列管理器，继续对待处理信息进行排序，维持数据库序列功能的正常使用，提升用户体验度。

在一些具体实现中，在步骤203之后，所述分布式数据库的处理方法还包括：每间隔预设时长，对第一全局序列管理器中的数据进行全量备份。

例如，第一全局序列管理器每间隔10分钟，对数据进行一次全量备份，即将数据写入磁盘文件中。通过定时对第一全局序列管理器中的数据进行全量备份，保证数据的安全性。

在一些具体实现中，在步骤203之后，所述分布式数据库的处理方法还包括：统计待处理信息的数量；依据待处理信息的数量和预设序列阈值，对第一全局序列管理器中的数据进行全量备份。

例如，对接收到的待处理信息的数量进行统计，若该待处理信息的数量大于预设序列阈值(例如，预设序列阈值为20000条)时，则需要对第一全局序列管理器中的数据进行全量备份，以保证实时数据的安全性。

在一些具体实现中，在对第一全局序列管理器中的数据进行全量备份的步骤之后，所述分布式数据库的处理方法还包括：在第一全局序列管理器发生故障时，使用第二全局序列管理器替换第一全局序列管理器；在第一全局序列管理器的故障恢复时，使用第二全局序列管理器中的序列数据作为恢复数据，对第一全局序列管理器中的数据进行恢复，获得恢复后的序列数据；对恢复后的序列数据进行持久化处理。

需要说明的是，持久化处理，包括与数据库相关的各种操作。例如，把恢复后的序列数据写入磁盘文件中，若第一全局序列管理器宕机，则第二全局序列管理器会接替第一全局序列管理器继续为数据库提供服务，待第一全局序列管理器恢复后，第一全局序列管理器会从第二全局序列管理器中获取最新的序列信息，并写入到自己的磁盘文件中，以保证恢复后的序列数据被第一全局序列管理器以磁盘文件的形式保存下来，提升容灾能力。此时若第一全局序列管理器和第二全局序列管理器均宕机，然后第一全局序列管理器恢复，则可以从磁盘文件中读出最新的序列信息，以保证序列信息的唯一递增性。

持久化处理还可以是把域对象永久保存到数据库中；更新数据库中域对象的状态；从数据库中删除一个域对象；根据特定的标识，把一个域对象从数据库加载到内存中；根据特定的查询条件，把符合查询条件的一个或多个域对象从数据库加载到内存中等等。以上对于持久化处理仅是举例说明，可根据具体情况具体设定，其他未说明的持久化处理方式也在本申请的保护范围之内，在此不再赘述。

对恢复后的序列数据进行持久化处理，不仅封装了数据访问细节，为大部分业务逻辑提供面向对象的接口函数；而且可以减少访问数据库数据的次数，增加应用程序的执行速度；并且持久化处理的代码重用性高，可以完成大部分的数据库操作；同时，持久化处理是不依赖于底层数据库和上层业务逻辑实现的，在更换数据库时只需修改该数据库对应的配置文件即可。

通过使用第二全局序列管理器替换第一全局序列管理器，使得在第一全局序列管理器发生故障时，仍能够保证对待处理信息的处理，避免数据库无法使用的情况发生。并且，在第一全局序列管理器的故障恢复时，使用第二全局序列管理器中的序列数据作为恢复数据，对第一全局序列管理器中的数据进行恢复，使得第一全局序列管理器可以继续对待处理信息进行处理，保证在第一全局序列管理器出现故障的过程中的数据不丢失，保证数据的安全性。通过对对恢复后的序列数据进行持久化处理，减少访问数据库数据的次数，增加应用程序的执行速度。

在一些具体实现中，在对第一全局序列管理器中的数据进行全量备份的步骤之后，所述分布式数据库的处理方法还包括：在第一全局序列管理器发生故障，且未使用第二全局序列管理器替换第一全局序列管理器时，获取第一时刻的全局备份数据和第二时刻的全局备份数据；计算预设恢复时刻与第一时刻的第一差值，以及计算预设恢复时刻与第二时刻的第二差值，第一时刻和第二时刻均早于恢复时刻；若确定第二差值小于第一差值，则使用第二时刻的全局备份数据作为恢复数据，对第一全局序列管理器中的数据进行恢复，获得恢复后的序列数据；依据数据恢复后的序列最大值和预设序列阈值，设置起始序列。

通过选取距离预设恢复时刻最近的一次全量备份数据作为备份数据，使得第一全局序列管理器能够快速将数据恢复至可用状态，保证数据的完整性，并且在完成数据恢复后，依据数据恢复后的序列最大值和预设序列阈值，设置起始序列，避免序列重复。

下面结合附图，详细介绍根据本申请实施例的节点设备。图3示出根据本申请实施例中的分布式数据库的处理装置的结构示意图。分布式数据库的处理装置可以使用包括有全局序列管理器的计算节点来实现。如图3所示，该分布式数据库的处理装置包括如下模块：

获取模块301，配置为获取数据库集群中的待处理信息；处理模块302，配置为对待处理信息进行排序，生成唯一递增的序列处理结果；待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。

需要说明的是，在数据库集群中创建序列集合，该序列集合包括序列，一个数据库集群中的所有分布式数据节点上均有相同的序列集合。每个数据库集群对应一个处理线程，并且，在一个线程内，根据待处理信息的到达顺序对待处理信息进行处理，并获得唯一递增的序列处理结果，保证了序列的唯一递增性。

在本实施例中，通过处理模块依据待处理信息的到达顺序对待处理信息进行处理，生成唯一递增的序列处理结果，保证了序列的唯一性和自增性。由于待处理信息是来自于不同线程的信息，数据库集群中的所有分布式数据节点上均有相同的序列集合，当用户使用序列处理结果在整个数据库集群上搜索数据时，加快了数据搜索的速度，提高了用户体验度。

需要明确的是，本申请并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁，这里省略了对已知方法的详细描述，并且上述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图4是本申请实施例中的分布式数据库的处理系统的一种组成方框图。该分布式数据库的处理系统包括：应用410、计算节点420、全局序列管理器430和数据库集群440。计算节点420包括合并线程422和n个处理线程，例如，第1处理线程4211、第2处理线程4212、……、第n处理线程421n，n为大于或等于1的整数。全局序列管理器430包括：全局序列管理器主机431和全局序列管理器备机432，在全局序列管理器主机431中包括m个处理线程，例如，第1处理线程4311、第2处理线程4312、……、第m处理线程431m,m为大于或等于1的整数。在数据库集群440中创建序列集合441，一个数据库集群440中所包含的所有分布式数据节点上均有相同的序列集合441。

需要说明的是，全局序列管理器430还可以采用集群的形式实现，例如，全局序列管理器包括一台全局序列管理器主机和多台全局序列管理器备机，保证有多个持有完整序列备份数据的全局序列管理器备机能够在全局序列管理器主机发生故障时，接替全局序列管理器主机继续进行工作，维持数据库序列功能的正常使用。

全局序列管理器430配置为对数据库集群440中的序列进行处理。全局序列管理器430采用一台主机和多台备机的集群架构，构成多副本高可用集群架构，能够保证在全局序列管理器主机宕机时，可以有多个持有完整序列副本的全局序列管理器备机能够接替全局序列管理器主机，维持数据库序列功能的正常使用。一个全局序列管理器可以处理一个或多个数据库集群上的序列信息，保证多个数据库集群的处理的高处理性能，同时，保证了集群层面的隔离性，并具有较好的容灾能力。

计算节点420配置为对应用410发送的SQL语句进行解析，并发送序列处理请求给全局序列管理器430。计算节点420在接收到全局序列管理器430返回的序列处理结果后，将序列处理结果中的序列对应的待处理SQL语句发送至各个数据库节点进行处理。计算节点420与数据库集群440建立连接，并与全局序列管理器430建立连接。

数据库集群440包括多个分布式数据节点，对外是一个完整的存储单位，提供高可靠的数据服务，并保证数据的一致性。各个分布式数据节点配置为执行计算节点420发送的SQL语句，并返回数据处理结果至计算节点420。每个分布式数据节点都具有相同的序列集合441。序列集合441对应全局序列管理器430中的一个处理线程。在全局序列管理器430中的一个处理线程内，根据序列处理请求消息的到达顺序，对待处理的序列信息进行处理并返回响应，以此保证序列的唯一递增性。

全局序列管理器430为一个或多个数据库集群提供唯一递增的序列信息，保证在数据库集群中的序列是唯一递增序列。

需要说明的是，全局序列管理器430只处理与序列相关的信息。全局序列管理器430创建m个处理线程(例如，第1处理线程4311、第2处理线程4312、……、第m处理线程431m)，且一个处理线程为数据库集群440中的序列集合441提供服务，即全局序列管理器430中的一个处理线程只处理序列集合441的序列信息。

分布式数据库的处理系统对应用410输入的SQL语句进行处理的方法包括步骤S401至步骤S408。

步骤S401，应用410向计算节点420发送多个待处理的SQL语句。

步骤S402，计算节点420使用第1处理线程4211、第2处理线程4212、……、第n处理线程421n等依次对各个待处理的SQL语句进行解析，获得需处理的序列信息1、需处理的序列信息2、……、需处理的序列信息n等，然后将以上多个需处理的序列信息发送至合并线程422，使得合并线程422能够将各个需处理的序列信息合并，生成并发送序列请求消息至全局序列管理器430。

序列请求消息包括n个需处理的序列信息，以及需处理的序列信息的到达顺序，该到达顺序是需处理的序列信息到达全局序列管理器主机431中的某个处理线程的顺序。

步骤S403，全局序列管理器430中的全局序列管理器主机431在接收到序列请求消息后，通过筛选获得需要数据库集群440中的分布式数据节点进行处理的待处理序列信息集合，然后将该待处理序列信息集合中的序列，依据各个待处理序列信息的到达顺序，使用第1处理线程4311依次进行处理，生成唯一递增的序列(例如，生成的序列依次为1、2、……、k)，k为大于或等于1的整数，以保证数据库集群440上的序列是唯一递增的序列，然后依据生成的序列1、序列2、……、序列k，生成同步消息，并发送同步消息至全局序列管理器备机432。

步骤S404，全局序列管理器备机432接收到同步消息后，将步骤S403中生成的序列信息保存至本地磁盘上，并发送同步完成消息给全局序列管理器主机431。

步骤S405，全局序列管理器主机431响应于全局序列管理器备机432反馈的同步完成消息，确定已将数据成功同步至全局序列管理器备机432中，然后，依据步骤S403中生成的序列1、序列2、……、序列k，生成并发送序列响应消息至计算节点420。

步骤S406，计算节点420依据序列响应消息中的各个序列，将各个序列与对应的SQL语句结合后，直接发送至指定的分布式数据节点上执行，获得执行结果，指定的分布式数据节点执行完成后，将执行结果反馈给计算节点420。

通过数据库集群440中的多个分布式数据节点，并行的对待处理的SQL语句进行处理，使得数据处理效率得到提升。

步骤S407，计算节点420将数据库集群440反馈的数据处理结果反馈给应用410。

在本实施例中，通过计算节点中的多个处理线程对应用发送的多个待处理的SQL语句同时进行处理，生成序列请求消息，该序列请求消息包括多个需处理的序列信息，使得数据的处理效率得到提升，提升了用户体验度。并且，当全局序列管理器接收到计算节点发送的序列请求消息后，各个处理线程依据序列请求消息的到达顺序，对需处理的序列信息进行依次处理，以保证序列的唯一递增性。

图5是本申请实施例中的分布式数据库的处理系统的另一种组成方框图。如图5所示，该分布式数据库的处理系统包括：应用510、计算节点520、第一全局序列管理器530、第二全局序列管理器550、第一数据库集群540和第二数据库集群560。

第一全局序列管理器530包括：第一全局序列管理器主机531和第一全局序列管理器备机532，全局序列管理器主机531包括n个处理线程，例如，第1处理线程5311、第2处理线程5312、……、第n处理线程531n，n为大于或等于1的整数。第二全局序列管理器550包括：第二全局序列管理器主机551和第二全局序列管理器备机552，全局序列管理器主机551包括m个处理线程，例如，第1处理线程5511、第2处理线程5512、……、第m处理线程551m，m为大于或等于1的整数。计算节点520包括合并线程522和k个处理线程，例如，第1处理线程5211、第2处理线程5212、……、第k处理线程521k，k大于或等于m与n的和。数据库集群540包括序列集合541。数据库集群560包括序列集合561。

需要说明的是，在本实施例中，第一全局序列管理器530仅用于处理第一数据库集群540对应的序列信息，第二全局序列管理器550仅用于处理第二数据库集群560对应的序列信息，计算节点520中的合并线程需要将应用510发送的待处理序列信息进行分类，依据待处理序列的到达顺序，以及待处理序列对应的SQL语句需要哪个数据库集群进行处理，为待处理序列分配对应的全局序列管理器，进而将不同的待处理序列分发至不同的全局序列管理器中进行处理。

例如，本实施例中的分布式数据库的处理系统对应用510输入的SQL语句进行数据处理的方法包括步骤S501至步骤S509。

步骤S501，应用510向计算节点520发送多个待处理的SQL语句。

步骤S502，计算节点520使用第1处理线程5211、第2处理线程5212、……、第k处理线程521k等依次对各个待处理的SQL语句进行解析，获得需处理的序列信息1、需处理的序列信息2、……、需处理的序列信息k等，然后将以上多个需处理的序列信息发送至合并线程522，使得合并线程522依据待处理序列的到达顺序，以及处理该待处理序列对应的SQL语句的数据库集群，对各个待处理的序列信息进行分类和合并，生成第一序列请求消息和第二序列请求消息；发送第一序列请求消息至第一全局序列管理器530，发送第二序列请求消息至第二全局序列管理器550。

第一序列请求消息包括n个需处理的序列信息；第二序列请求消息包括m个需处理的序列信息。需要说明的是，第一序列请求消息中的n个需处理的序列信息都属于第一数据库集群540，第二序列请求消息中的m个需处理的序列信息都属于第二数据库集群560。

步骤S503，第一全局序列管理器530中的第一全局序列管理器主机531在接收到第一序列请求消息后，将n个需处理的序列信息依次分发至第1处理线程5311上进行处理，以依次生成序列1、2、……、n，n为大于或等于1的整数，保证第一数据库集群540上的序列是唯一递增的序列，然后依据以上生成的序列信息生成第一同步消息，并发送第一同步消息至第一全局序列管理器备机532，第一同步消息包括序列1、序列2、……、序列n。

步骤S504，第一全局序列管理器备机532接收到同步消息后，将步骤S503中生成的序列信息保存至本地磁盘上，并发送同步完成消息给第一全局序列管理器主机531。

步骤S505，第一全局序列管理器主机531响应于第一全局序列管理器备机532反馈的同步完成消息，确定已将数据成功同步至第一全局序列管理器备机532中，然后，依据步骤S503中生成的序列1、序列2、……、序列n，和各个序列对应的分布式数据节点的标识，生成并发送第一序列响应消息至计算节点520。

需要说明的是，在步骤S503至步骤S505执行的同时，第二全局序列管理器550同时进行相类似的操作，具体如步骤S506至步骤S508所示。

步骤S506，第二全局序列管理器550中的第二全局序列管理器主机551在接收到第二序列请求消息后，将m个需处理的序列信息依次分发至例如第2处理线程5512上进行处理，依次生成序列1、2、……、m，保证第二数据库集群560上的序列是唯一递增的序列，然后依据以上生成的序列信息生成第二同步消息，并发送第二同步消息至第二全局序列管理器备机552，第二同步消息包括序列1、序列2、……、序列m等。

步骤S507，第二全局序列管理器备机552接收到同步消息后，将步骤S506中生成的序列信息保存至本地磁盘上，并发送同步完成消息给第二全局序列管理器主机551。

步骤S508，第二全局序列管理器主机551响应于第二全局序列管理器备机552反馈的同步完成消息，确定已将数据成功同步至第二全局序列管理器备机552中，然后，依据步骤S506中生成的序列1、序列2、……、序列m，生成并发送第二序列响应消息给计算节点520。

需要说明的是，第一全局序列管理器530所生成的序列(序列1、序列2、……、序列n)，保证第一数据库集群540中的序列是唯一递增的；第二全局序列管理器550所生成的序列(序列1、序列2、……、序列m)，保证第二数据库集群560中的序列是唯一递增的，使得分布式数据库能够在数据库集群的层面上得到序列的隔离，保证序列的唯一递增性。

步骤S509，计算节点520接收到第一序列响应消息和第二序列响应消息后，将第一序列响应消息中的各个序列与待处理的SQL语句进行组合，生成并发送第一数据处理消息至数据库集群540进行处理，同时，将第二序列响应消息中的各个序列与待处理的SQL语句进行组合，生成并发送第二数据处理消息至数据库集群560进行处理，计算节点520在获得第一数据库集群540和第二数据库集群560中的各个分布式数据节点反馈的数据处理结果后，将各个数据处理结果转发给应用510。

需要说明的是，因第一数据库集群540和第二数据库集群560是物理上隔离的，因此，生成的各个数据处理结果对应的序列之间不会受到干扰。保证了数据库集群层面的上的序列的隔离，以及序列的唯一递增性。

在本实施例中，通过不同的全局序列管理器处理不同的数据库集群中的序列信息，使得能够从数据库集群的层面上进行序列的隔离，同时，保证每个数据库集群内部的序列的唯一性。采用多个线程对待处理信息进行并发的处理，提升了序列处理效率，保证了分布式数据库系统的高性能。

图6a示出本申请实施例中的全局序列管理器备机对数据进行全量备份时存在异常的处理流程示意图。如图6a所示，全局序列管理器备机每间隔预设时长(例如5分钟)可对数据进行一次全量备份，即将数据写入磁盘文件中。但是，例如在12:05之后、12:10到来之前，接收到序列处理请求并统计获得待处理信息的数量，当待处理信息的数量大于预设序列阈值(例如，预设序列阈值设定为10000条)时(例如12：06时)，全局序列管理器备机还会再次对数据进行全量备份，以确保序列信息不丢失。当12:10到来时，全局序列管理器备机再次对数据进行全量备份。

图6b示出本申请实施例中的全局序列管理器主机对数据进行恢复时的处理流程示意图。如图6b所示，例如12：09时，全局序列管理器主机由于工作人员的维修，已恢复正常工作状态，此时，全局序列管理器主机需要启动数据恢复操作。因图6a中所示，全局序列管理器备机分别在12:06和12:10都进行了全量备份，故全局序列管理器主机需要向全局序列管理器备机申请当前恢复时刻之前的数据，依此数据作为备份数据，对故全局序列管理器主机的数据进行恢复，包括步骤S601至步骤S604。

步骤S601,全局序列管理器主机向全局序列管理器备机申请获取例如12:06时刻的备份数据，作为本次的恢复数据。

需要说明的是，全局序列管理器主机会选择早于例如12:09时刻(恢复时刻)、且距离12:09时刻最近的一次全量备份数据作为本次恢复的恢复数据，以保证数据的全面性和安全性。

步骤S602,全局序列管理器主机将例如12:06时刻的备份数据作为本次的恢复数据，对自己内部的数据进行恢复。

步骤S603,在数据恢复完成时，设定序列的起始值。

例如，将恢复后的序列的最大值和预设序列阈值做加和运算，获得序列的起始值；或者，先通过步长(即序列之间的间隔长度，例如，1、5等)与预设序列阈值做乘法运算，获得乘积值，然后再将恢复后的序列的最大值和该乘积值做加和运算，以获得序列的起始值。以上对于序列的起始值的设定方法仅是举例说明，可根据实际情况具体设定，其他未说明的序列的起始值的设定方法也在本申请的保护范围之内，在此不再赘述。

步骤S604,删除例如12:09时刻(恢复时刻)以后的备份数据，以防止数据的重复，提升存储空间的利用率。

在本实施例中，通过全局序列管理器备机每间隔预设时长对序列信息进行全量备份，确保序列信息不丢失。在全局序列管理器主机从宕机的故障中恢复后，通过向全局序列管理器备机申请获取备份数据，即将距离当前时间点最近的一次全量备份数据作为备份数据，使得全局序列管理器主机能够快速将数据恢复至当前可用状态，保证数据的完整性，并且在完成数据恢复后，删除恢复时刻之后的备份数据，以防止数据的重复，同时，提升存储空间的利用率。

如图7所示，计算设备700包括输入设备701、输入接口702、中央处理器703、存储器704、输出接口705、以及输出设备706。输入接口702、中央处理器703、存储器704、以及输出接口705通过总线707相互连接，输入设备701和输出设备706分别通过输入接口702和输出接口705与总线707连接，进而与计算设备700的其他组件连接。

具体地，输入设备701接收来自外部的输入信息，并通过输入接口702将输入信息传送到中央处理器703；中央处理器703基于存储器704中存储的计算机可执行指令对输入信息进行处理以生成输出信息，将输出信息临时或者永久地存储在存储器704中，然后通过输出接口705将输出信息传送到输出设备706；输出设备706将输出信息输出到计算设备700的外部，供用户使用。

在一些实施方式中，图7所示的计算设备可以被实现为一种网络设备，该网络设备可以包括：存储器，被配置为存储计算机程序；处理器，被配置为运行存储器中存储的计算机程序，以执行上述实施例描述的分布式数据库的处理方法。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例描述的分布式数据库的处理方法。

本申请实施例提供的分布式数据库的处理方法及装置、网络设备和计算机可读存储介质，通过对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果，保证了序列的唯一性和自增性，另外，由于待处理信息是来自于不同线程的信息，数据库集群包括分布式数据节点，通过使得序列处理结果仅能够被对应的分布式数据节点使用，保证了序列的唯一性，能够克服相关技术中由于分布式数据库无法提供唯一的序列而导致的数据搜索效率低的问题，当用户使用序列处理结果在整个数据库集群上搜索数据时，加快了数据搜索的速度，提高了用户体验度。

一般来说，本申请的多种实施例可以在硬件或专用电路、软件、逻辑或其任何组合中实现。例如，一些方面可以被实现在硬件中，而其它方面可以被实现在可以被控制器、微处理器或其它计算装置执行的固件或软件中，尽管本申请不限于此。

本申请的实施例可以通过移动装置的数据处理器执行计算机程序指令来实现，例如在处理器实体中，或者通过硬件，或者通过软件和硬件的组合。计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者是以一种或多种编程语言的任意组合编写的源代码或目标代码。

本申请附图中的任何逻辑流程的框图可以表示程序步骤，或者可以表示相互连接的逻辑电路、模块和功能，或者可以表示程序步骤与逻辑电路、模块和功能的组合。计算机程序可以存储在存储器上。存储器可以具有任何适合于本地技术环境的类型并且可以使用任何适合的数据存储技术实现，例如但不限于只读存储器(ROM)、随机访问存储器(RAM)、光存储器装置和系统(数码多功能光碟DVD或 CD光盘)等。计算机可读介质可以包括非瞬时性存储介质。数据处理器可以是任何适合于本地技术环境的类型，例如但不限于通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(FGPA)以及基于多核处理器架构的处理器。

通过示范性和非限制性的示例，上文已提供了对本申请的示范实施例的详细描述。但结合附图和权利要求来考虑，对以上实施例的多种修改和调整对本领域技术人员来说是显而易见的，但不偏离本申请的范围。因此，本申请的恰当范围将根据权利要求确定。

Claims

一种分布式数据库的处理方法，包括：

对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果，其中，所述待处理信息是来自于不同线程的信息，所述数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。
根据权利要求1所述的方法，其中，所述对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果，包括：

依据所述待处理信息的到达顺序对所述待处理信息进行如下操作中的任意一项，以生成所述序列处理结果：

将所述待处理信息对应的序列添加至所述序列集合中；

从所述序列集合中删除所述待处理信息对应的序列；以及

依据所述待处理信息对所述序列集合进行修改。
根据权利要求1所述的方法，还包括：

在所述对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果的步骤之前，接收应用发送的数据库处理语句；

对所述数据库处理语句进行解析，获得数据定义语言和数据操纵语言；以及

对所述数据库定义语言和所述数据操纵语言进行分析，提取所述待处理信息。
根据权利要求3所述的方法，其中，对所述数据库定义语言和所述数据操纵语言进行分析，提取所述待处理信息，包括：

对所述数据库定义语言和所述数据操纵语言进行分析，获得N个序列处理需求；

对所述N个序列处理需求进行批量处理，生成所述待处理信息，其中，N为大于或等于1的整数。
根据权利要求3所述的方法，还包括：

在所述对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果之后，依据所述序列处理结果，将所述数据库处理语句发送至所述分布式数据节点进行处理；以及

响应于所述分布式数据节点反馈的数据处理结果，将所述数据处理结果转发给所述应用。
根据权利要求1所述的方法，还包括：

在所述对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果的步骤之前，依据所述分布式数据节点的处理能力对所述分布式数据节点进行集群的划分，获得所述数据库集群。
根据权利要求1至6中任一项所述的方法，其中，

第一全局序列管理器对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果，

所述方法还包括：

在所述对数据库集群中的待处理信息进行排序，生成唯一递增的序列处理结果之后，将所述序列处理结果同步至第二全局序列管理器中，其中，所述第二全局序列管理器是所述第一全局序列管理器的备份管理器，所述第一全局序列管理器包括处理线程。
根据权利要求7所述的方法，还包括：

在所述将所述序列处理结果同步至第二全局序列管理器中之后，每间隔预设时长，对所述第一全局序列管理器中的数据进行全量备份。
根据权利要求7所述的方法，还包括：

在所述将所述序列处理结果同步至第二全局序列管理器中之后，统计所述待处理信息的数量；以及

依据所述待处理信息的数量和预设序列阈值，对所述第一全局序列管理器中的数据进行全量备份。
根据权利要求8或9所述的方法，还包括：

在所述对所述第一全局序列管理器中的数据进行全量备份之后，

在所述第一全局序列管理器发生故障时，使用第二全局序列管理器替换所述第一全局序列管理器；

在所述第一全局序列管理器的故障恢复时，使用所述第二全局序列管理器中的序列数据作为恢复数据，对所述第一全局序列管理器中的数据进行恢复，获得恢复后的序列数据；以及

对所述恢复后的序列数据进行持久化处理。
根据权利要求8或9所述的方法，还包括：

在所述对所述第一全局序列管理器中的数据进行全量备份之后，

在所述第一全局序列管理器发生故障，且未使用第二全局序列管理器替换所述第一全局序列管理器时，获取第一时刻的全局备份数据和第二时刻的全局备份数据；

计算预设恢复时刻与所述第一时刻的第一差值，以及计算所述预设恢复时刻与所述第二时刻的第二差值，其中，所述第一时刻和所述第二时刻均早于所述恢复时刻；

若确定所述第二差值小于第一差值，则使用所述第二时刻的全局备份数据作为恢复数据，对所述第一全局序列管理器中的数据进行恢复，获得恢复后的序列数据；以及

依据数据恢复后的序列最大值和预设序列阈值，设置起始序列。
一种分布式数据库的处理装置，包括：

获取模块，配置为获取数据库集群中的待处理信息；

处理模块，配置为对所述待处理信息进行排序，生成唯一递增的序列处理结果，其中，所述待处理信息是来自于不同线程的信息，所述数据库集群中的所有分布式数据节点上均有相同的序列集合，所述序列集合包括序列。
一种网络设备，包括：

一个或多个处理器；

存储器，其上存储有一个或多个计算机程序，当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至11中任一项所述的方法。
一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法。