WO2021017646A1

WO2021017646A1 - 一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质

Info

Publication number: WO2021017646A1
Application number: PCT/CN2020/094941
Authority: WO
Inventors: 随建; 卢勤元; 张玲东; 景雯雯
Original assignee: 中兴通讯股份有限公司
Priority date: 2019-07-29
Filing date: 2020-06-08
Publication date: 2021-02-04
Also published as: EP4002146A4; US11824924B2; US20220286498A1; CN112307113A; EP4002146A1

Abstract

一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质，其中的方法包括：接收业务请求消息(S101)，将业务请求消息经过N层计算节点发送到对应的存储单元中，其中N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多(S102)。

Description

一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质

相关申请的交叉引用

本申请基于申请号为201910690727.X、申请日为2019年07月29日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本发明实施例涉及分布式数据库领域，更具体地说，涉及一种业务请求消息发送方法、分布式数据库架构及计算机可读存储介质。

背景技术

目前，分布式数据库的计算节点只有一层，其需要与所有存储节点都能建连，明显的，当计算节点与所有存储节点都建连时，后端链路数太多。例如，分布式组网中有40个存储节点，某个计算节点接收到来自客户端的1000个并发任务(业务请求消息)，那么该计算节点就可能需要创建40*1000个后端链路，且这40*1000个链路存在利用不充分现象(业务一般都是以随机读写操作为主，同一时刻部分存储节点可能不繁忙，连接池可能就会回收链路，下一个时刻被回收的链路可能就需要重新创建)，此时即使有连接池的存在(连接池的回收与新建也很增添时延)，计算节点维护这些链路也已经比较吃力。

随着网络业务的拓展，业务数据量和客户端并发数会持续升高，很可能会发展到400个存储节点，单计算节点接收到10000个并发，那么该计算节点就可能需要创建400*10000＝400万个后端链路。可见，随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度。

发明内容

本发明实施例提供的业务请求消息发送方法、分布式数据库架构及计算机可读存储介质，至少在一定程度上解决相关技术中的技术问题之一，包括相关技术中随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题。

有鉴于此，本发明实施例提供了一种业务请求消息发送方法，应用于分布式数据库，所述业务请求消息发送包括：接收业务请求消息；将所述业务请求消息经过N层计算节点发送到对应的存储单元中，所述N为整数且大于等于2，越接近所述存储单元所在层的计算节点的个数越多。

本发明实施例还提供了一种分布式数据库架构，所述分布式数据库架构包括：N层计算节点，所述N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多；当接收到业务请求消息时经过N层计算节点发送到对应的存储单元中。

本发明实施例还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序用于执行上述的业务请求消息发送方法。

本发明其他特征和相应的有益效果在说明书的后面部分进行阐述说明，且应当理解，至少部分有益效果从本发明说明书中的记载变的显而易见。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1为本发明实施例一提供的一种业务请求消息发送方法的基本流程示意图；

图2为本发明实施例一提供的一种三层计算节点的示意图；

图3为本发明实施例一提供的一种两层计算节点的示意图；

图4为本发明实施例一提供的一种存储集群的示意图；

图5为本发明实施例二提供的一种三层计算节点进行业务请求消息发送的示意图；

图6为本发明实施例三提供的一种两层计算节点进行业务请求消息发送的示意图；

图7为本发明实施例四提供的一种添加存储节点的示意图；

图8为本发明实施例四提供的一种删除存储节点的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，下面通过具体实施方式结合附图对本发明实施例作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例一

为了至少在一定程度上解决相关技术中的技术问题之一，包括随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题，在本发明实施例中提供了一种业务请求消息发送方法，通过接收业务请求消息，进而将接收到的业务请求消息经过N层计算节点发送到对应的存储单元中，其中N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多；请参见图1所示，如图1为本实施例提供的业务请求消息发送方法的基本流程示意图。

S101：接收业务请求消息。

S102：将业务请求消息经过N层计算节点发送到对应的存储单元中，N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多。

首先对本实施例中的各术语进行说明：

计算节点：消息代理节点，负责SQL优化、SQL路由、下级节点的负载均衡、分布式事务的调度等。

存储集群：分布式数据库中存储节点的合集，业务数据库有规则的分布在存储集群中的存储节点上。

存储单元：存储集群下的子集合，存储单元中包含多个存储节点。

存储节点：分布式数据库中的DB节点，可以是Mysql、Oracle、PostgreSQL等关系型数据库。

应当理解的是，本实施例中的计算节点分为至少两层，即划分计算节点为至少两层，其中越接近存储单元所在层的计算节点的个数越多，即形成的各层计算节点整体为“金字塔”式。

在一些示例中，请参见图2所示，计算节点为三层，第一层计算节点又可称之为顶层计算节点，第二层计算节点又可称之为中间层计算节点，第三层计算节点接近存储单元又可称之为底层计算节点，其中，顶层计算节点的个数为1，中间层计算节点的个数为3，底层计算节点的个数为6，顶层计算节点与所有中间层计算节点建连，中间层计算节点与所属底层计算节点建连。

在一些示例中，请参见图3所示，计算节点为两层，第一层计算节点又可称之为顶层计算节点，第二层计算节点接近存储单元又可称之为底层计算节点，其中，顶层计算节点的个数为2，底层计算节点的个数为4，顶层计算节点与所有底层计算节点建连。

值得注意的是，本发明并不局限于N为3或2，在实际应用中，可根据业务数据量和客户端并发数确定计算节点的层数N。

在本实施例一些示例中，将业务请求消息经过N层计算节点发送到对应的存储单元中之前，还包括：

将存储集群划分为至少两个存储单元，各个存储单元中包含至少一个存储节点。

例如请参见图4所示，设将存储集群划分为3个存储单元，分别为存储单元1、存储单元2以及存储单元3，其中存储单元1包含3个存储节点，存储单元2包含2个存储节点，存储单元3包含1个存储节点。

值得注意的是，在实际应用中，将存储集群划分为的存储单元的个数以及各个存储单元中包含的存储节点的个数可根据具体业务数据量做灵活调整。

应当理解的是，当将存储集群划分为至少两个存储单元后，各个存储节点的增/删(扩容/缩容)之间互不影响，从而使得各个存储节点的增/删(扩容/缩容)更易实施，容量变动更为灵活且在一定程度上减低了维护成本。

在本实施例的一些示例中，与存储单元最接近的计算节点称之为底层计算节点，其中底层计算节点用于管理和维护与之相连的存储单元中的各存储节点，因此无需再单独针对管理存储单元中的各存储节点设置管理和维护模块，通过底层计算节点便可实现对与之相连的存储单元中的各存储节点，节约成本，且由于与各个计算节点相连的存储单元中的各存储节点较少，也便于实施管理和维护。

在本实施例的一些示例中，除底层计算节点之外的其他各层的计算节点均能实现负载均衡功能。

其中，顶层计算节点可以与下一层任意一个计算节点建连，根据业务并发繁忙情况，可以启用多个顶层计算节点，多个顶层计算节点之间相互独立(无依赖)、相互对等(共享元数据信息)，顶层计算节点拥有负载均衡功能(也可以集成第三方负载均衡模块)。

其中，中间层计算节点可按区域划分，区域之间的计算节点相互独立、相互不对等(元数据信息存在部分差异)，每个区域内的计算节点可以有多个，区域内的计算节点相互独立、相互对等。中间计算节点与下一层所属的计算节点建连，并非跟下一层任意的计算节点建连，中间层可以有多层，划分区域规则相同，中间层计算节点也拥有负载均衡功能(也可以集成第三方负载均衡模块)。

应当理解的是，底层计算节点只对接单个存储单元，存储单元之间的计算节点相互独立、相互不对等(元数据信息存在部分差异)。每个存储单元上可以有多个底层计算节点，这些计算节点相互独立、相互对等。由于顶层计算节点和中间层计算节点都有负载均衡功能，且底层计算节点只与单个存储单元建连，所以最底层计算节点分担到的链路压力就减小了很多。

在本实施例的一些示例中，各N层的计算节点可以分别采用相同的分发策略。例如，在第一层、第二层、第三层的计算节点均采用分发策略1，或在第一层、第二层、第三层的计算节点均采用分发策略2，或在第一层、第二层、第三层的计算节点均采用分发策略3。

在本实施例的一些示例中，各N层的计算节点也可以分别采用不同的分发策略。例如，在第一层的计算节点采用分发策略1，在第二层的计算节点采用分发策略2，在第三层的计算节点采用分发策略3。

在本实施例的一些示例中，本实施例中的分发策略包括哈希hash分发策略、范围range分发策略、枚举list分发策略、复制duplicate分发策略中的至少一种。值得注意的是，这里所列举的只是几种常见的分发策略，在实际应用中，可根据具体需求做灵活调整。

本发明实施例提供的业务请求消息发送方法，通过接在收业务请求消息时，将业务请求消息经过N层计算节点发送到对应的存储单元中，其中N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多；至少在一定程度上解决了相关技术中的技术问题之一，包括随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题。也即本发明实施例提供的业务请求消息发送方法，首先是将计算节点分层(至少两层)，且将存储集群划分成多个(至少两个)存储单元(每个存储单元中包含至少一个存储节点)，然后通过“链路负载均衡”，使每个计算节点的后端链路数都大幅减少，最后通过“每层计算节点各自使用自己的分发策略”，将业务请求消息发送到对应的存储节点，避免了同一计算节点的后端链路太多，难以维护的现象发生，在极大程度上提升了计算节点后端链路的可维护性，大大降低了维护难度。

实施例二

在本发明实施例中以分布式数据库架构包括三层计算节点进行业务请求消息发送的过程为例进行说明，请参见图5所示。

其中，计算节点划分为三层，顶层计算节点可以与所有中间层计算节点建连，中间层计算节点又划分了两个区域，应当理解的是，中间层计算节点可划分为多个区域，同一区域内的中间层计算节点对等，底层计算节点只能对接单个存储单元。

其中，存储集群划分为K个存储单元，各个存储单元中包含M个存储节点，K为大于等于2的整数，M为大于等于1的整数。

下文以一种具体的链路分压机制进行说明：

1、顶层计算节点1接收到来自客户端1的4000并发请求。

应当理解的是，客户端可以有多个，顶层计算节点也可以有多个。

2、顶层计算节点1与区域1中的两个对等中间层计算节点建连，采用负载均衡的方式，每个建连2000链路；同时顶层计算节点1还可以与其他区域的中间层计算节点建连，例如区域2的中间层计算节点，模式同区域1的建连。

应当理解的是，在本实施例的一些示例中，顶层计算节点1与区域1中的两个对等中间层计算节点建连，其中一个中间层计算节点可建连1600链路，另一个中间层计算节点可建连2400链路，在实际应用中，可根据具体需求以及分发策略做灵活调整。

3、区域1的中间层计算节点与两个对等底层计算节点建连，也采用负载均衡的方式，每个建连1000链路；底层计算节点只能与单个存储单元建连。

应当理解的是，在本实施例的一些示例中，区域1中的第一个中间层计算节点与两个对等底层计算节点建连，其中一个底层计算节点可建连600链路，另一个底层计算节点可建连1000链路，在实际应用中，可根据具体需求以及分发策略做灵活调整。

4、底层计算节点与存储单元中的所有存储节点建连，后端链路数为1000*M(未计算其他中间层计算节点过来的链路)。

如果采用现有方式顶层计算节点直接对接所有存储节点，后端链路数就是4000*M*K。

可见，本发明实施例提供的业务请求消息发送方法具有以下有益效果：

1、多层计算节点后端链路数大幅度减少，从而减少了链路“回收-重建”的消耗，解决了计算节点链路数承载瓶颈的问题。

2、多层计算节点结构更灵活，可以根据存储节点数量调整计算节点层数，计算节点层数范围[2，N]，N为大于等于2的整数。

3、将存储集群划分为多个存储单元后，存储单元的维护成本更低，容量变动更灵活。

实施例三

在本发明实施例中以分布式数据库架构包括两层计算节点进行业务请求消息发送的过程为例进行说明，请参见图6所示。

其中，计算节点划分为两层，两个顶层计算节点相对独立、相互对等，且都能与所有底层计算节点建连；

其中，存储集群划分为K个存储单元，各个存储单元中包含M个存储节点，K为大于等于2的整数，M为大于等于1的整数。存储单元1上的底层计算节点与存储单元K上的底层计算节点相互不对等，元数据存在部分差异(差异点：前者绑定了存储单元1，后者绑定了存储单元2)；

底层计算节点只与单个存储单元建连，根据图中节点数示例，与单个计算节点直接对接所有存储节点相比，图中单个底层计算节点后端链路数缩减了K倍(2个顶层计算节点平分客户端链路，又汇聚到每个底层计算节点，即每个底层计算节点前端链路数等于客户端链路数，但存储集群被划分成了K个存储单元，底层计算节点只与单个存储单元建连，所以后端链路缩减了K倍。)

实施例四

在本发明实施例中以添加、删除存储节点的过程为例进行说明。

当业务数据量增加时，需要增加存储节点，只需要在适当的存储单元中添加。如图7所示，在存储单元1中增加了一个“new存储节点”。其中，增加了“new存储节点”，业务数据的迁移/重组只需要在存储单元1内，其他存储单元不涉及数据迁移/重组，在很多场景下大幅度减小了增加存储节点的成本。

当业务数据量减少时，需要删除存储节点，只需要在适当的存储单元中删除。如图8 所示，在存储单元1中删除了一个“存储节点2”(删除的“存储节点2”以虚线所示，便于观察业务数据变化)。其中，删除了“存储节点2”，业务数据的迁移/重组只需要在存储单元1内，其他存储单元不涉及数据迁移/重组，在很多场景下大幅度减小了删除存储节点的成本。

实施例五

为了至少解决相关技术中的技术问题之一，包括随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题，在本发明实施例中提供一种分布式数据库架构，其中分布式数据库架构包括N层计算节点，N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多，当接收到业务请求消息时经过N层计算节点发送到对应的存储单元中。

应当理解的是，本实施例中的计算节点分为至少两层，即划分计算节点为至少两层，其中越接近存储单元所在层的计算节点的个数越多，即计算节点层数为“金字塔”式。

在一些示例中，同样参见图2所示，计算节点划分为三层，第一层计算节点又可称之为顶层计算节点，第二层计算节点又可称之为中间层计算节点，第三层计算节点接近存储单元又可称之为底层计算节点，其中，顶层计算节点的个数为1，中间层计算节点的个数为3，底层计算节点的个数为6，顶层计算节点与所有中间层计算节点建连，中间层计算节点与所属底层计算节点建连。

在一些示例中，同样参见图3所示，计算节点划分为两层，第一层计算节点又可称之为顶层计算节点，第二层计算节点接近存储单元又可称之为底层计算节点，其中，顶层计算节点的个数为2，底层计算节点的个数为4，顶层计算节点与所有底层计算节点建连。

在本实施例一些示例中，存储集群包括至少两个存储单元，各个存储单元中包含至少一个存储节点。

例如同样参见图4所示，设将存储集群包括3个存储单元，分别为存储单元1、存储单元2以及存储单元3，其中存储单元1包含3个存储节点，存储单元2包含2个存储节点，存储单元3包含1个存储节点。

本发明实施例还提供了一种计算机可读存储介质，其存储有计算机程序，该计算机程序用于执行上述的业务请求消息发送方法。

本发明实施例提供的分布式数据库架构包括N层计算节点，N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多，当接收到业务请求消息时经过N层计算节点发送到对应的存储单元中；至少在一定程度上解决了相关技术中的技术问题，包括随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题。也即本发明实施例提供的分布式数据库架构，首先是将计算节点分层(至少两层)，且将存储集群划分成多个(至少两个)存储单元(每个存储单元中包含至少一个存储节点)，然后通过“链路负载均衡”，使每个计算节点的后端链路数都大幅减少，最后通过“每层计算节点各自使用自己的分发策略”，将业务请求消息发送到对应的存储节点，避免了同一计算节点的后端链路太多，难以维护的现象发生，在极大程度上提升了计算节点后端链路的可维护性，大大降低了维护难度。

本发明实施例提供的业务请求消息发送方法及分布式数据库架构，通过接在收业务请求消息时，将业务请求消息经过N层计算节点发送到对应的存储单元中，其中N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多；解决了相关技术中随着业务数据量和客户端并发数的持续升高，产生的后端链路已超出想象，加大了维护难度的问题。也即本发明实施例提供的业务请求消息发送方法及分布式数据库架构，通过N层计算节点(金字塔式)依次将业务请求消息发送至对应的存储节点，一层一层的减小计算节点的后端链路，避免了同一计算节点的后端链路太多，难以维护的现象发生。

显然，本领域的技术人员应该明白，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件(可以用计算装置可执行的程序代码来实现)、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。所以，本发明不限制于任何特定的硬件和软件结合。

以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

一种业务请求消息发送方法，应用于分布式数据库，包括：

接收业务请求消息；

将所述业务请求消息经过N层计算节点发送到对应的存储单元中，所述N为整数且大于等于2，越接近所述存储单元所在层的计算节点的个数越多。
如权利要求1所述的业务请求消息发送方法，其中，所述将业务请求消息经过N层计算节点发送到对应的存储单元中之前，还包括：

将存储集群划分为至少两个存储单元，各个存储单元中包含至少一个存储节点。
如权利要求2所述的业务请求消息发送方法，其中，与所述存储单元最接近的计算节点为底层计算节点，所述底层计算节点用于管理和维护与之相连的存储单元中的各存储节点。
如权利要求3所述的业务请求消息发送方法，其中，除所述底层计算节点之外的其他各层的计算节点均能实现负载均衡功能。
如权利要求1-4任一项所述的业务请求消息发送方法，其中，所述各N层的计算节点分别采用相同的分发策略，或，所述各N层的计算节点分别采用不同的分发策略。
如权利要求5所述的业务请求消息发送方法，其中，所述分发策略包括哈希分发策略、范围分发策略、枚举分发策略、复制分发策略中的至少一种。
一种分布式数据库架构，包括：

N层计算节点，所述N为整数且大于等于2，越接近存储单元所在层的计算节点的个数越多；

当接收到业务请求消息时经过N层计算节点发送到对应的存储单元中。
如权利要求7所述的分布式数据库架构，其中，所述分布式数据库架构还包括：至少两个存储单元，各个存储单元中包含至少一个存储节点。
如权利要求8所述的分布式数据库架构，其中，与所述存储单元最接近的计算节点为底层计算节点，所述底层计算节点用于管理和维护与之相连的存储单元中的各存储节点。
如权利要求9所述的分布式数据库架构，其中，除所述底层计算节点之外的其他各层的计算节点均能实现负载均衡功能。
一种计算机可读存储介质，其存储有计算机程序，所述计算机程序用于执行权利要求1-6任一项所述的业务请求消息发送方法。