WO2017097059A1

WO2017097059A1 - 分布式数据库系统及其自适应方法

Info

Publication number: WO2017097059A1
Application number: PCT/CN2016/103964
Authority: WO
Inventors: 郑国斌; 肖旸; 章恩华
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-12-07
Filing date: 2016-10-31
Publication date: 2017-06-15
Also published as: CN106844399B; CN106844399A

Abstract

一种分布式数据库系统及其自适应方法，所述系统包括控制节点、客户端API及数据节点，控制节点设置为管理系统的数据节点，计算系统的数据路由并广播给客户端API及数据节点；客户端API设置为为数据访问者提供读/写数据的接口并将接收到的数据操作请求按照本地缓存的数据路由，转发给相应的数据节点；数据节点设置为存储数据分片，以及根据本地缓存的数据路由，处理收到的数据操作请求。

Description

分布式数据库系统及其自适应方法

技术领域

本公开涉及数据库领域，例如涉及一种分布式数据库系统及其自适应方法。

背景技术

分布式数据库一般是有多台具有计算、存储、网络通讯功能的数据节点构成的数据库集群系统，具有高性能、高可靠的特点，已在电信、银行、互联网等行业广泛使用；分布式数据库可以由数据访问代理节点和数据存储节点组成，数据存储节点按照数据关键字被分成多个数据存储集群，每个数据存储集群有1个数据存储主节点和多个数据存储备节点，主节点可以提供读写数据服务，备节点仅提供读数据服务，主节点写入的数据会复制到备节点；数据访问代理节点可以负责代理数据访问者的数据操作请求，并转发到对应的数据存储集群的相应数据存储节点处理；这种分布式数据库因数据节点较多，数据节点间相互依赖，存在访问效率低、节点建数据容量和符合不均衡、数据分布难以调整和数据难以平滑迁移，以及状态维护复杂等问题。

对于以上分布式数据库的问题，通常处理方式可以是：把数据按照范围或者数据关键字的HASH值划分为多个分片，再按照一致性HASH算法，将分片均匀分布到数据节点上，但对于每个分片的副本(备份)分布未考虑节点间的均匀性；以上基于一致性HASH分布方式又可能带来了新的问题，即在增减节点时，有时调整的分片很少，有时调整的分片较多，数据分片在节点间调整是不可预见的，导致迁移的数据分片数量可能不可控。

发明内容

本公开提供一种分布式数据库系统及其自适应方法，可以改善分布式数据库系统内的节点间负荷不均衡、数据分布难以调整、数据迁移不平滑及维护复杂的问题。

本公开实施例公开了一种分布式数据库系统，上述系统包括控制节点、客户端应用程序编程接口(Application Programming Interface，API)及数据节点，其中，

控制节点，设置为管理系统的数据节点，计算系统的数据路由并广播给客户端API及数据节点；

客户端API，设置为为数据访问者提供读/写数据的接口，并将接收到的数据操作请求按照本地缓存的数据路由，转发给相应的数据节点；

数据节点，设置为存储数据分片，以及根据本地缓存的数据路由，处理收到的数据操作请求。

可选地，上述数据节点以虚拟机或者计算存储主机方式部署在上述系统中。

可选地，上述客户端API以动态库或插件方式供数据访问者操作。

可选地，上述控制节点，设置为实时监控系统中数据节点的数量及状态变化，并在数据节点数量变化时，执行节点扩容/缩容操作；在数据节点状态变化时，更新数据路由中对应数据节点的状态并广播更新后的数据路由。

可选地，上述客户端API，设置为根据收到数据操作请求中的数据关键字，计算请求数据对应的数据分片，并在本地缓存的数据路由中查找每个数据分片所在的数据节点；以及按照本地缓存的数据节点选取规则，将上述数据操作请求转发给相应的数据节点。

可选地，上述数据节点，设置为在收到数据操作请求后，在本地缓存的数据路由中查找上述数据操作请求中的数据分片是否存储在本数据节点中；并在上述数据分片未存储在本数据节点时，在本地缓存的数据路由中查找上述数据分片所在的数据节点，并将上述数据操作请求转发给找到的数据节点；在上述数据分片存储在本数据节点中时，执行上述数据操作请求，并向数据访问者返回数据操作响应。

可选地，上述数据节点，设置为周期性向上述控制节点上报自身状态；以及在链路变化时，实时向控制节点上报自身状态；

上述控制节点，设置为周期性更新数据路由。

可选地，上述数据节点，设置为执行数据恢复操作及数据复制操作；

上述控制节点，设置为按照预设的分域规则，对数据节点进行分域。

本公实施例公开了一种分布式数据库系统的自适应方法，上述方法在系统上电后，执行：

控制节点计算系统的数据路由并广播给客户API及所有数据节点；

客户端API接收访问者的数据操作请求，按照本地缓存的数据路由，将上述请求转发给对应的数据节点；以及

数据节点处理收到的数据操作请求，并返回数据操作响应给访问者。

可选地，上述控制节点在计算系统的数据路由前，还可以执行：

按照预设的分域规则，对数据节点进行分域。

可选地，上述分域规则为：若数据节点归属的主机/服务器数量为1，则将所述数据节点划分为左域或右域；若数据节点归属的主机/服务器数量大于等于2，则按照数据节点归属的主机/服务器均匀分布原则，将数据节点划分为左域和右域，使属于同一主机/服务器的数据节点位于同一域。若数据节点总数为1，则将上述数据节点划分为左域；若数据节点总数大于等于2，则按照节点归属的主机/服务器，将数据节点划分为左域和右域，使每个域下的数据节点属于同一主机/服务器。

可选地，上述控制节点根据系统的数据节点数量及数据分片数量，计算每个数据节点上需要分布的数据分片数量，生成数据路由。

可选地，上述客户端API按照本地缓存的数据路由，将上述请求转发给对应的数据节点步骤可以为：

根据数据操作请求中的数据关键字，计算相应的数据分片；

在本地缓存的数据路由中查找每个数据分片对应的数据节点；以及

按照预设的数据节点选择规则，将上述数据操作请求分别转发给找到的数据节点。

可选地，上述数据节点选取规则可以为：

当查找到的数据分片对应的数据节点数为1时，直接将上述数据操作请求转发给上述数据节点；以及

当查找到的数据分片对应的数据节点数大于1时，判断上述数据操作请求的类型，若为写操作，则查看上述每个数据节点中的上述数据分片的副本号及数据节点的状态，将上述数据操作请求发送给状态正常且副本号小的数据节点；若为读操作，则将上述数据操作请求发送给负荷最小的数据节点。

可选地，上述数据节点通过如下方法处理收到的数据操作请求：

在本地缓存的数据路由中查找上述数据操作请求中的数据分片是否存储在本数据节点中；当在本地缓存的数据路由中查找到上述数据操作请求中的数据分片存储在本数据节点中时，则执行上述数据操作请求，并向数据访问者返回数据操作响应；当在本地缓存的数据路由中未查找上述数据操作请求中的数据分片存储在本数据节点中时，在本地缓存的数据路由中查找上述数据分片所在的数据节点，将上述数据操作请求转发给找到的数据节点。

可选地，上述执行数据操作请求可以为：

当上述数据操作请求为写操作时，根据访问者的操作方式，对数据分片存储于本地的副本进行增加、修改或删除操作；以及

当上述数据操作请求为读操作时，从数据分片存储于本地的副本中读取数据。

可选地，上述方法数据操作请求为写操作时，在处理完上述数据操作请求后，执行数据复制流程，可以为：

记录数据分片变更的数据或者全数据；以及

在本地缓存的数据路由中查找上述数据分片其余副本所在的数据节点，向数据分片其余副本所在的数据节点复制上述数据分片变更的数据或全数据。

可选地，上述控制节点在系统运行过程中，还可以执行：

实时监控系统中是否有数据节点新增或者删除，若有数据节点新增，则执行节点扩容操作；若有数据节点删除，则执行节点缩容操作。

可选地，上述节点扩容操作还可以包括：

计算要迁移到新增数据节点上的第一副本数据分片列表及第二副本数据分片列表；

在新增数据节点上为待迁入数据分片分配第三副本，重新计算系统的数据路由并广播；

等待新增数据节点恢复数据；

收到新增数据节点上报的自身状态，根据预设的扩容规则，重新计算系统的数据路由并广播；

通知所有数据节点删除本地所有数据分片的第三副本；以及

确认所有数据节点删除完成后，删除本地数据路由中的第三副本，重新计算系统的数据路由并广播。

可选地，上述计算要迁移到新增数据节点上的第一副本数据分片列表及第二副本数据分片列表步骤可以为：

用数据分片总数除以包含新增数据节点在内的数据节点总数，计算出每个数据节点要存储的平均数据分片数量；

用每个数据节点的当前数据分片数量减去计算得到的平均数据分片数量，计算出从每个原有数据节点应迁移到新增数据节点的数据分片数量；以及

所有要从原有数据节点中迁出的数据分片的第一副本组成新增数据节点的第一副本数据分片列表，所有要从原有数据节点中迁出的数据分片的第二副本组成新增数据节点的第二副本数据分片列表。

可选地，上述预设的扩容规则可以为：

通知原有数据节点将本地待迁移到新增数据节点上的数据分片的第一副本切换为第三副本；同时通知新增数据节点将对应的数据分片的第三副本切换为第一副本；以及

通知原有数据节点将本地待迁移到新增数据节点上的数据分片的第二副本切换为第三副本；同时通知新增数据节点将对应的数据分片的第三副本切换为第二副本。

可选地，上述节点缩容操作可以包括：

计算各剩余节点上第一副本数据分片列表和第二副本数据分片列表；

在剩余数据节点上为待迁入数据分片分配第三副本，重新计算系统的数据路由并广播；

等待其余数据节点恢复数据；

等待其余数据节点复制数据；

收到其余数据节点上报的自身状态，根据预设的缩容规则，重新计算系统的数据路由并广播；

通知所有数据节点删除本地所有数据分片的第三副本；以及

可选地，上述计算每个剩余节点上第一副本数据分片列表和第二副本数据分片列表步骤可以为：

用数据分片总数除以剩余数据节点数，计算出剩余数据节点中每个数据节点要存储的平均数据分片数量；

用平均数据分片数量减去每个剩余数据节点上当前数据分片数量，计算出每个剩余数据节点上应从待关闭节点迁入的数据分片数；以及

根据预设的数据分片分布原则，将待删除数据节点上的数据分片第一副本和第二副本，分配到剩余数据节点上，得到每个剩余节点上第一副本数据分片列表和第二副本数据分片列表。

可选地，上述预设的缩容规则可以为：

通知待删除数据节点将待迁移数据分片的第一副本切换为第三副本；同时通知存储有上述数据分片第三副本的剩余数据节点将上述数据分片的第三副本切换为第一副本；以及

通知待删除数据节点将待迁移数据分片的第二副本切换为第三副本；同时通知存储有上述数据分片第三副本的剩余数据节点将上述数据分片的第三副本切换为第二副本。

可选地，上述数据分片分布原则可以为：

每个数据节点上的数据分片数量尽量相同；且

每个数据分片的第一副本和第二副本分布在不同域的数据节点上；以及

每个数据节点上所有第一副本数据分片的第二副本均匀分布在异域的所有数据节点上。

可选地，上述数据节点通过如下步骤恢复数据：

查询本地数据路由，获取本节点上第一副本数据分片的第三副本所在的数据节点；

向第三副本所在的数据节点复制相应数据分片；以及

恢复完成，向控制节点上报自身状态。

可选地，上述增加的数据节点为新加入系统的数据节点；

上述删除的数据节点可以包括：因负担小于预设值而需要删除的数据节点及因收到用户删除指令而要求删除的数据节点。

可选地，上述客户端API通过对数据关键字取HASH值，再对HASH值取数据分片总数的模值方式来确定请求数据的分片数量。

本公开实施例可以无需经过专门的代理访问节点，数据访问路径更短，效率更高；数据分片存储和管理，数据节点无主备之分，同分片的多副本数据可相互复制，可以使得分布式数据库的节点间负载更加均衡；数据路由自动计算和分发，数据迁移过程可控，更加平滑和均匀，无需人工干预，且不会中断访问。

本公开实施例还公开了一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述分布式数据库系统的自适应方法。

本公开实施例还公开了一种电子设备，该电子设备包括一个或多个处理器、存储器以及一个或多个程序，所述一个或多个程序存储在存储器中，当被一个或多个处理器执行时，执行上述分布式数据库系统的自适应方法。

附图说明

图1是本公开实施例所述分布式数据库系统的框架示意图；

图2是本公开实施例所述分布式数据库系统自适应方法实施例流程图；

图3是本公开实施例所述分布式数据库系统自适应方法中数据节点发现过程实施例流程图；

图4是本公开实施例所述分布式数据库系统自适应方法中数据节点状态管理过程实施例流程图；

图5是本公开实施例所述分布式数据库系统自适应方法中数据复制实施例流程图；

图6是本公开实施例所述分布式数据库系统自适应方法中节点扩容操作实施例流程图；

图7是本公开实施例所述分布式数据库系统自适应方法中节点缩容操作实施例流程图；

图8是本公开实施例所述分布式数据库系统自适应方法中数据节点恢复数据过程实施例流程图；以及

图9是本公开实施例提供的一种电子设备的硬件结构示意图。

具体实施方式

应当理解，此处所描述的可选实施例仅用以解释本公开，并不用于限定本公开。在不冲突的情况下，本公开实施例以及实施例中的技术特征可以相互组合。

在相关技术中，由于分布式数据库的数据节点繁多，数据节点之间相互依赖而使得分布式数据库可能存在以下问题：

1、访问效率低

分布式数据库中有专门的数据访问代理节点，可能延长了数据访问者的数据访问路径，降低了数据访问者的处理效率；

2、节点间数据容量和负荷不均衡

数据存储节点间有主备之分，使得在写数据的频率较高时，只能在主节点上写入数据，可能导致主节点的负荷较重，易达到性能瓶颈，而数据备节点因只提供读服务，且有多个节点，资源利用不充分，导致数据节点间数据容量和负荷不均衡，部分数据节点存在性能瓶颈或者资源浪费；当某个数据节点故障后，其上面的数据只能被单个或者部分数据节点(备用节点)分担处理，加剧节点间负载不均衡；

3、数据分布难以调整，数据难以平滑迁移

一旦增减数据节点时，例如在虚拟化环境下，数据节点的弹性伸缩是常态，需经常调整数据在数据节点上的分布，可能需人工执行命令或者重启来调整数据的分布或者数据分布调整的过程较长，给分布式数据库稳定运行和服务质量带来较大的风险；

4、状态维护复杂

数据存储主备节点间采用主备单向复制，主节点故障，可能需要重新选举新的主节点，系统状态维护复杂；

基础上述问题，本公开实施例提供了一种分布式数据库系统及其自适应方法。

如图1所示，是本公开实施例所述分布式数据库系统的框架示意图；本实施例包括控制节点10、客户端API20、数据节点30，在本公开实施例中，以分布式数据库系统包括4个数据节点30；其中，

控制节点10，设置为管理系统的数据节点30，计算系统的数据路由并广播给客户端API 20及数据节点30；可以包括：

周期性更新数据路由并广播；

实时监控系统中数据节点30的数量及状态变化，并在系统中的数据节点30的数量变化时，执行节点扩容/缩容操作；

在数据节点30状态变化时，更新数据路由中对应数据节点30的状态并广播更新后的数据路由；以及

按照预设的分域规则，对数据节点30进行分域；

上述分域规则可以为：

若数据节点归属的主机/服务器数量为1，则将所述数据节点划分为左域或右域；若数据节点归属的主机/服务器数量大于等于2，则按照数据节点归属的主机/服务器均匀分布原则(即使分布在左域和右域中的主机/服务器数量尽量相同)，将数据节点划分为左域和右域，使属于同一主机/服务器的数据节点位于同一域。

例如，如图1所示，将4个数据节点依次从左到右编号为1-4；若4个数据节点归属于同1个主机/服务器，则将4个数据节点全部划分到左域或者右域；若4个数据节点归属于同2个主机/服务器，假设编号为1和2的数据节点归属于第一主机/服务器，编号3和4的数据节点归属于第二主机/服务器；则将归属于第一主机/服务器的数据节点1和2划分为左域，将归属于第二主机/服务器的数据节点3和4划分为右域，那么每个域下均拥有2个数据节点；或者假设编号为1、2和3的数据节点归属于第一主机/服务器，编号为4的数据节点归属于第二主机/服务器，则将归属于第一主机/服务器的数据节点1、2和3划分为左域，将归属于第二主机/服务器的数据节点4划分为右域，那么左域拥有3个数据节点；右域拥有1个数据节点；

若数据节点总数为1，则将所述数据节点划分为左域；若数据节点总数大于等于2，则按照节点归属的主机/服务器，将数据节点划分为左域和右域；使每个域下的数据节点属于同一主机/服务器。

为了实现数据分片的均衡和数据的可靠性，控制节点10计算数据路由可以满足以下数据分片分布原则：

每个数据节点上的数据分片数量尽量相同；且

每个数据节点上所有第一副本数据分片的第二副本均匀分布在异域的所有数据节点上；例如当前数据节点位于左域，其上共有10个数据分片的第一副本，按照以上分布原则，这10个数据分片的第二副本应均匀分布在右域的所有数据节点上，假设右域有2个数据节点，则右域的每个数据节点上分布有上述10个数据分片的第二副本中的5个。

如图1所示，本实施例中，分布式数据库系统共有4个数据节点30，共存储有16个数据分片，数据分片的第一副本分别用数字1-16标记；第二副本分别用数字1′-16′标记，每个数据节点30上均保存4个数据分片的第一副本和4个数据分片的第二副本；可选地，第一副本中的数据分片与第二副本中的数据分片完全不同。

客户端API 20，设置为为数据访问者提供读/写数据的接口，并将接收到的数据操作请求按照本地缓存的数据路由，发送给相应的数据节点30；可以为：

根据收到数据操作请求中的数据关键字，计算对应的数据分片，并在本地缓存的数据路由中查找每个数据分片所在的数据节点30；计算数据分片的算法可以是对数据关键字取HASH值，再对HASH值取数据分片总数的模值方式来确定请求数据的分片数量；也可以按照数据关键字的前缀、后缀范围来划分数据分片；

按照本地缓存的数据节点选取规则，将所述数据操作请求转发给相应的数据节点30；

客户端API 20以动态库/插件方式供数据访问者操作；

数据节点30，以虚拟机或者计算存储主机方式部署在系统中，可被配置归属为左域或者右域；设置为：

存储数据分片；

数据分片是指根据数据关键字把数据切分为多个分片，不同分片的数据不同，每个数据分片有第一副本、第二副本和第三副本，第三副本只在增减数据节点过程中临时使用，多个副本间的数据是相同的，且同一数据分片的多个副本按照数据分片分布原则，被存储在不同域的数据节点上；

缓存收到的数据路由，以及处理收到的数据操作请求，数据操作请求包括读、写操作；可以为：在收到数据操作请求后，在本地缓存的数据路由中查找所述数据操作请求中的数据分片是否存储在本数据节点30中；并在所述数据分片未存储在本数据节点30中时，在本地缓存的数据路由中查找所述数据分片所在的数据节点30，并将所述数据操作请求转发给找到的数据节点30；在所述数据分片存储在本数据节点30中时，执行所述数据操作请求，并向数据访问者返回数据操作响应；

重启或者数据路由变化时，执行数据恢复操作；

在数据分片变化时，例如执行写操作后数据分片内容变更，记录变更的数据或全数据，并执行数据复制操作；将变更的数据或者全数据复制到含有相同数据分片的其他数据节点30上；

周期性向所述控制节点10上报自身状态；以及在链路变化时，实时向控制节点10上报自身状态。

本公开实施例分布式数据库系统的拓扑对数据访问者隐藏，可以实现分布式数据库和数据访问者的解耦。

如图2所示，是本公开实施例所述分布式数据库系统自适应方法实施例流程图；本实施例包括S101-S107。

在S101中，系统上电，控制节点10按照预设的分域规则，对数据节点30进行分域，然后计算系统的数据路由，并广播给客户API 20及所有数据节点30；

本步骤根据系统的数据节点30数量、数据分片数量及预设的路由计算原则，计算每个数据节点30上需要分布的数据分片的第一副本列表和第二副本列表，生成数据路由。

控制节点10在系统运行过程中，还可以负责数据节点发现及状态管理，过程分别如图3及图4所示；

在S102中，系统初始化完成后，客户端API 20接收访问者的数据操作请求；

在S103中，根据数据操作请求中的数据关键字，计算相应的数据分片；

本步骤通过采用对数据关键字取HASH值，再对HASH值取数据分片总数的模值的方式来确定请求数据的分片数量；也可以按照数据关键字的前缀、后缀范围来划分数据分片；

在S104中，在本地缓存的数据路由中查找每个数据分片对应的数据节点30，按照预设的数据节点选取规则，将所述数据操作请求分别转发给相应的数据节点30；

数据路由即为每个数据分片和数据节点30的对应关系。

数据节点选取规则可以为：当查找到的数据分片对应的数据节点30数为1时，直接将所述数据操作请求转发给所述数据节点30；

当查找到的数据分片对应的数据节点30数大于1时，判断所述数据操作请求的类型，若为写操作，则查看所述每个数据节点30中的所述数据分片的副本号及数据节点30的状态，将所述数据操作请求发送给状态正常且副本号小的数据节点30；若为读操作，则将所述数据操作请求发送给负荷最小的数据节点30。

在S105中，数据节点30收到的数据操作请求，在本地缓存的数据路由中查找所述数据操作请求中的数据分片是否存储在本数据节点30中；当在本地缓存的数据路由中查找所述数据操作请求中的数据分片存储在本数据节点30中时，则执行S106；当在本地缓存的数据路由中未查找所述数据操作请求中的数据分片存储在本数据节点30中时，执行S107；

本步骤通过解析数据操作请求中的数据关键字，可以查看请求数据的数据分片是否属于本节点；当在本地缓存的数据路由中查找所述数据操作请求中的数据分片存储在本数据节点30中时，则所述请求数据对应的数据分片存储在本数据节点30，当在本地缓存的数据路由中未查找所述数据操作请求中的数据分片存储在本数据节点30中时，所述请求数据对应的数据分片未存储在本数据节点30。

在S106中，执行所述数据操作请求，向数据访问者返回数据操作响应，当前数据分片处理结束；

本步骤中，执行数据操作请求可以为：

当所述数据操作请求为写操作时，根据访问者的操作方式，对数据分片存储于本地的副本进行增加、修改或删除操作；以及

当所述数据操作请求为读操作时，从数据分片存储于本地的副本中读取数据。

在数据操作请求为写操作时，处理完所述数据操作请求后，还可以执行如图5所示的数据复制流程；即在数据节点30修改本地的数据后，需要把变更后的数据复制到同分片的其他副本所在的数据节点30上。

在S107中，本地缓存的数据路由中查找所述数据分片所在的数据节点30，按照预设的数据节点选取规则，将所述数据操作请求转发给相应的与本节点通信正常的数据节点。

即若数据操作请求对应的数据分片在本数据节点30，则在本地处理，读写本地的数据；若数据操作请求对应的数据分片不在本数据节点30，则转发到对应的节点处理。

如图3所示，是本公开实施例所述分布式数据库系统自适应方法中数据节点发现过程实施例流程图；本实施例包括S201-S203。

在S201中，控制节点10实时监控系统中是否有数据节点30新增或者删除，若发现有数据节点30新增，则执行S202；若发现有数据节点30删除，则执行S203；

新增的数据节点即为新加入的数据节点；

删除的数据节点可以包括：因负担小于预设值而需要删除的数据节点及因收到用户删除指令而要求删除的数据节点。

在S202中，执行节点扩容操作，当前发现处理结束；

节点扩容操作可以如图6所示；

在S203中，执行节点缩容操作，当前发现处理结束。

节点缩容操作可以如图7所示。

如图4所示，是本公开实施例所述分布式数据库系统自适应方法中数据节点状态管理过程实施例流程图；本实施例包括S301-S303。

在S301中，控制节点10收到数据节点30上报的自身状态；

在S302中，查看所述状态，为若正常，则当前状态处理结束；若为异常，则执行S303；

在S303中，更新数据路由中所述数据节点30的状态，并广播更新后的数据路由。

如图5所示，是本公开实施例所述分布式数据库系统自适应方法中数据复制实施例流程图；本实施例包括S401-S403。

在S401中，执行写操作的数据节点30记录本次写操作的数据分片变更的数据或者全数据；

在S402中，在本地缓存的数据路由中查找所述数据分片其余副本所在的数据节点30；

在S403中，向数据分片其余副本所在的数据节点30复制所述数据分片变更的数据或全数据。

复制变更的数据或全数据到同分片的其他副本所在的数据节点30，可以包括允许存储有第一副本的数据节点30写入数据后，复制变更的数据或全数据到该分片的第二、第三副本所在的数据节点30，也允许在存储有第二或者第三副本的数据节点30写入数据后，复制变更的数据或全数据到该分片的第一、第三副本或者第一、第二副本所在的数据节点30，即允许数据副本间的相互复制，相同分片的副本间的相同数据相互复制可能存在的冲突问题，可通过时间戳来解决，即通过比较数据的更新时间戳，来确定是通过合并、覆盖来变更数据还是放弃变更。

数据复制过程中，被复制数据的数据节点，可同步完成相应数据更新，也可异步完成相应数据更新。

如图6所示，是本公开实施例所述分布式数据库系统自适应方法中节点扩容操作实施例流程图；本实施例包括S501-S506。

在S501中，控制节点10计算要迁移到新增数据节点30上的第一副本数据分片列表及第二副本数据分片列表；可以包括：

用数据分片总数除以包含新增数据节点30在内的数据节点总数，计算出每个数据节点要存储的平均数据分片数量，应比原有数据节点30的当前数据分片数量少；

用每个原有数据节点30的当前数据分片数量减去计算得到的平均数据分片数量，计算出从每个原有数据节点30应迁移到新增数据节点30的数据分片数量；以及

所有要从原有数据节点30中迁出的数据分片的第一副本组成新增数据节点30的第一副本数据分片列表，所有要从原有数据节点30中迁出的数据分片的第二副本组成新增数据节点30的第二副本数据分片列表；此时的列表中的数据为空；

在S502中，在新增数据节点30上为待迁入数据分片分配第三副本；重新计算系统的数据路由并广播；

在S503中，等待新增数据节点30恢复数据；

数据节点恢复数据过程可以如图8所示；

在S504中，收到新增数据节点30上报的自身状态，根据预设的扩容规则，重新计算系统的数据路由并广播；

所述预设的扩容规则可以为：

通知原有数据节点30将本地待迁移到新增数据节点30上的数据分片的第一副本切换为第三副本；同时通知新增数据节点将对应的数据分片的第三副本切换为第一副本；以及

通知原有数据节点30将本地待迁移到新增数据节点30上的数据分片的第二副本切换为第三副本；同时通知新增数据节点30将对应的数据分片的第三副本切换为第二副本。

在S505中，通知所有数据节点30删除本地所有数据分片的第三副本；

在S506中，确认所有数据节点30删除完成后，删除本地数据路由中的第三副本，重新计算系统的数据路由并广播。

如图7所示，是本公开实施例所述分布式数据库系统自适应方法中节点缩容操作优选实施例流程图；本实施例包括S601-S607。

在S601中，控制节点10计算各剩余数据节点30的第一副本数据分片列表及第二副本数据分片列表；本步骤可以包括：

用数据分片总数除以剩余数据节点30数，计算出剩余数据节点30中每个数据节点30要存储的平均数据分片数量，应比减少节点前要多；

用平均数据分片数量减去每个剩余数据节点30上当前数据分片数量，计算出每个剩余数据节点30上应从待关闭节点迁入的数据分片数；以及

根据预设的数据分片分布原则，将待删除数据节点30上的数据分片第一副本和第二副本，分配到剩余数据节点30上，得到每个剩余节点上第一副本数据分片列表和第二副本数据列表列表；

在S602中，在剩余数据节点30上为待迁入数据分片分配第三副本，重新计算系统的数据路由并广播；

在S603中，等待剩余数据节点30恢复数据；

数据节点30恢复数据过程可以如图8所示；

在S604中，等待剩余数据节点30复制数据；

数据节点30复制数据过程可以如图5所示；

在S605中，收到剩余数据节点30上报的自身状态，根据预设的缩容规则，重新计算系统的数据路由并广播；

预设的缩容规则可以为：

通知待删除数据节点30将待迁移数据分片的第一副本切换为第三副本；同时通知存储有所述数据分片第三副本的剩余数据节点30将所述数据分片的第三副本切换为第一副本；以及

通知待删除数据节点30将待迁移数据分片的第二副本切换为第三副本；同时通知存储有所述数据分片第三副本的剩余数据节点30将所述数据分片的第三副本切换为第二副本。

在S606中，通知所有数据节点30删除本地所有数据分片的第三副本；

在S607中，确认所有数据节点30删除完成后，删除本地数据路由中的第三副本，重新计算系统的数据路由并广播。

如图8所示，是本公开实施例所述分布式数据库系统自适应方法中数据节点恢复数据过程实施例流程图；本实施例包括S701-S703。

在S701中，查询本地数据路由，获取本节点上第一副本数据分片的第三副本所在的数据节点30；

在S702中，向第三副本所在的数据节点30复制相应数据分片；

收到数据分片的数据节点30，将收到的数据分片存入对应的第三副本中；

在S703中，所有第一副本数据分片均恢复完成后，向控制节点10上报自身状态。

本公开实施例还提供一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述分布式系统自适应方法。

如图9所示，是本公开实施例提供的一种电子设备的硬件结构示意图，如图9所示，该电子设备包括：

处理器(processor)810和存储器(memory)820；还可以包括通信接口(Communications Interface)830和总线840。

其中，处理器810、存储器820和通信接口830可以通过总线840完成相互间的通信。通信接口830可以用于信息传输。处理器810可以调用存储器820中的逻辑指令，以执行上述实施例的分布式数据库系统自适应方法。

此外，上述的存储器820中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质，包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质，也可以是暂态存储介质。

最后需要说明的是，本领域普通技术人员可理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来执行相关的硬件来完成的，该程序可存储于一个非暂态计算机可读存储介质中，该程序在执行时，可包括如上述方法的实施例的流程，其中，该计算机可读存储介质可以为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

工业实用性

本公开实施例提供了一种分布式数据库系统及其自适应方法，能够使得数据访问路径更短，效率更高；且数据节点无主备之分，使得系统负载更加均衡；数据迁移过程更加平滑和均匀。

Claims

一种分布式数据库系统，包括控制节点、客户端应用程序编程接口API及数据节点，其中，

控制节点，设置为管理系统的数据节点，计算系统的数据路由并广播给客户端API及数据节点；

客户端API，设置为为数据访问者提供读/写数据的接口，并将接收到的数据操作请求按照本地缓存的数据路由，转发给相应的数据节点；

数据节点，设置为存储数据分片，以及根据本地缓存的数据路由，处理收到的数据操作请求。
如权利要求1所述的系统，其中，所述数据节点以虚拟机或者计算存储主机方式部署在所述系统中。
如权利要求1所述的系统，其中，所述客户端API以动态库或插件方式供数据访问者操作。
如权利要求1-3任一项所述的系统，其中，

所述控制节点，设置为实时监控系统中数据节点的数量及状态变化，并在数据节点数量变化时，执行节点扩容/缩容操作；在数据节点状态变化时，更新数据路由中对应数据节点的状态并广播更新后的数据路由。
如权利要求1-3任一项所述的系统，其中，

所述客户端API，设置为根据收到数据操作请求中的数据关键字，计算请求数据对应的数据分片，并在本地缓存的数据路由中查找每个数据分片所在的数据节点；以及按照本地缓存的数据节点选取规则，将所述数据操作请求转发给相应的数据节点。
如权利要求4所述的系统，其中，

所述数据节点，设置为在收到数据操作请求后，在本地缓存的数据路由中查找所述数据操作请求中的数据分片是否存储在本数据节点中；并在所述数据分片未存储在本数据节点时，在本地缓存的数据路由中查找所述数据分片所在的数据节点，并将所述数据操作请求转发给找到的数据节点；在所述数据分片存储在本数据节点中时，执行所述数据操作请求，并向数据访问者返回数据操作响应。
如权利要求1所述的系统，其中，

所述数据节点，设置为周期性向所述控制节点上报自身状态；以及在链路变化时，实时向控制节点上报自身状态；以及

所述控制节点，设置为周期性更新数据路由。
如权利要求1所述的系统，其中，所述数据节点，设置为执行数据恢复操作及数据复制操作；

所述控制节点，设置为按照预设的分域规则，对数据节点进行分域。
一种分布式数据库系统的自适应方法，包括：在所述系统上电后，

控制节点计算系统的数据路由并广播给客户API及所有数据节点；

客户端API接收访问者的数据操作请求，按照本地缓存的数据路由，将所述请求转发给对应的数据节点；以及

数据节点处理收到的数据操作请求，并返回数据操作响应给访问者。
如权利要求9所述的方法，在所述控制节点在计算系统的数据路由前，还包括：

按照预设的分域规则，对数据节点进行分域。
如权利要求10所述的方法，其中，所述分域规则为：若数据节点归属的主机/服务器总数数量为1，则将所述数据节点划分为左域或右域；若数据节点归属的主机/服务器数量总数大于等于2，则按照数据节点归属的主机/服务器均匀分布原则，将数据节点划分为左域和右域，使每个域下的数据节点属于同一主机/服务器使属于同一主机/服务器的数据节点位于同一域。
如权利要求9或10所述的方法，其中，所述控制节点根据系统的数据节点数量及数据分片数量，计算每个数据节点上需要分布的数据分片数量，生成数据路由。
如权利要求9或10所述的方法，其中，所述客户端API按照本地缓存的数据路由，将所述请求转发给对应的数据节点包括：

根据数据操作请求中的数据关键字，计算相应的数据分片；

在本地缓存的数据路由中查找每个数据分片对应的数据节点；以及

按照预设的数据节点选择规则，将所述数据操作请求分别转发给找到的数据节点。
如权利要求13所述的方法，其中，所述数据节点选取规则为：

当查找到的数据分片对应的数据节点数为1时，直接将所述数据操作请求转发给所述数据节点；以及

当查找到的数据分片对应的数据节点数大于1时，判断所述数据操作请求的类型，若为写操作，则查看所述每个数据节点中的所述数据分片的副本号及数据节点的状态，将所述数据操作请求发送给状态正常且副本号小的数据节点；若为读操作，则将所述数据操作请求发送给负荷最小的数据节点。
如权利要求9或10所述的方法，其中，所述数据节点通过如下方法处理收到的数据操作请求：

在本地缓存的数据路由中查找所述数据操作请求中的数据分片是否存储在本数据节点中；若是，则执行所述数据操作请求，并向数据访问者返回数据操作响应；否则，在本地缓存的数据路由中查找所述数据分片所在的数据节点，将所述数据操作请求转发给找到的数据节点。
如权利要求15所述的方法，其中，所述执行数据操作请求为：

当所述数据操作请求为写操作时，根据访问者的操作方式，对数据分片存储于本地的副本进行增加、修改或删除操作；以及

当所述数据操作请求为读操作时，从数据分片存储于本地的副本中读取数据。
如权利要求16所述的方法，其中，所述方法数据操作请求为写操作时，在处理完所述数据操作请求后，执行数据复制流程，为：

记录数据分片变更的数据或者全数据；以及

在本地缓存的数据路由中查找所述数据分片其余副本所在的数据节点，向数据分片其余副本所在的数据节点复制所述数据分片变更的数据或全数据。
如权利要求9或10所述的方法，其中，所述控制节点在系统运行过程中包括：

实时监控系统中是否有数据节点新增或者删除，若有数据节点新增，则执行节点扩容操作；若有数据节点删除，则执行节点缩容操作。
如权利要求18所述的方法，其中，所述节点扩容操作包括：

计算要迁移到新增数据节点上的第一副本数据分片列表及第二副本数据分片列表；

在新增数据节点上为待迁入数据分片分配第三副本，重新计算系统的数据路由并广播；

等待新增数据节点恢复数据；

收到新增数据节点上报的自身状态，根据预设的扩容规则，重新计算系统的数据路由并广播；

通知所有数据节点删除本地所有数据分片的第三副本；以及

确认所有数据节点删除完成后，删除本地数据路由中的第三副本，重新计算系统的数据路由并广播。
如权利要求19所述的方法，其中，所述计算要迁移到新增数据节点上的第一副本数据分片列表及第二副本数据分片列表包括：

用数据分片总数除以包含新增数据节点在内的数据节点总数，计算出每个数据节点要存储的平均数据分片数量；

用每个数据节点的当前数据分片数量减去计算得到的平均数据分片数量，计算出从每个原有数据节点应迁移到新增数据节点的数据分片数量；以及

所有要从原有数据节点中迁出的数据分片的第一副本组成新增数据节点的第一副本数据分片列表，所有要从原有数据节点中迁出的数据分片的第二副本组成新增数据节点的第二副本数据分片列表。
如权利要求19所述的方法，其中，所述预设的扩容规则为：

通知原有数据节点将本地待迁移到新增数据节点上的数据分片的第一副本切换为第三副本；同时通知新增数据节点将对应的数据分片的第三副本切换为第一副本；以及

通知原有数据节点将本地待迁移到新增数据节点上的数据分片的第二副本切换为第三副本；同时通知新增数据节点将对应的数据分片的第三副本切换为第二副本。
如权利要求18所述的方法，其中，所述节点缩容操作包括：

计算每个剩余节点上第一副本数据分片列表和第二副本数据分片列表；

在剩余数据节点上为待迁入数据分片分配第三副本，重新计算系统的数据路由并广播；

等待其余数据节点恢复数据；

等待其余数据节点复制数据；

收到其余数据节点上报的自身状态，根据预设的缩容规则，重新计算系统的数据路由并广播；

通知所有数据节点删除本地所有数据分片的第三副本；以及

确认所有数据节点删除完成后，删除本地数据路由中的第三副本，重新计算系统的数据路由并广播。
如权利要求22所述的方法，其中，所述计算每个剩余节点上第一副本数据分片列表和第二副本数据分片列表步骤具体为：

用数据分片总数除以剩余数据节点数，计算出剩余数据节点中每个数据节点要存储的平均数据分片数量；

用平均数据分片数量减去每个剩余数据节点上当前数据分片数量，计算出每个剩余数据节点上应从待关闭节点迁入的数据分片数；以及

根据预设的数据分片分布原则，将待删除数据节点上的数据分片第一副本和第二副本，分配到剩余数据节点上，得到每个剩余节点上第一副本数据分片列表和第二副本数据分片列表。
如权利要求22所述的方法，其中，所述预设的缩容规则为：

通知待删除数据节点将待迁移数据分片的第一副本切换为第三副本；同时通知存储有所述数据分片第三副本的剩余数据节点将所述数据分片的第三副本切换为第一副本；以及

通知待删除数据节点将待迁移数据分片的第二副本切换为第三副本；同时通知存储有所述数据分片第三副本的剩余数据节点将所述数据分片的第三副本切换为第二副本。
如权利要求23所述的方法，其中，所述数据分片分布原则为：

每个数据节点上的数据分片数量尽量相同；且

每个数据分片的第一副本和第二副本分布在不同域的数据节点上；以及

每个数据节点上所有第一副本数据分片的第二副本均匀分布在异域的所有数据节点上。
如权利要求19或22所述的方法，其中，所述等待新增数据节点恢复数据包括：

查询本地数据路由，获取本节点上第一副本数据分片的第三副本所在的数据节点；

向第三副本所在的数据节点复制相应数据分片；以及

恢复完成，向控制节点上报自身状态。
如权利要求18所述的方法，其中，

所述增加的数据节点为新加入系统的数据节点；

所述删除的数据节点包括：因负担小于预设值而需要删除的数据节点及因收到用户删除指令而要求删除的数据节点。
如权利要求13所述的方法，其中，所述客户端API通过对数据关键字取HASH值，再对HASH值取数据分片总数的模值方式来确定请求数据的分片数量。
一种非暂态计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求9-28任一项的分布式数据库系统的自适应方法。