CN114218326A - 一种分布式数据库提升数据路由效率的方法 - Google Patents

一种分布式数据库提升数据路由效率的方法 Download PDF

Info

Publication number
CN114218326A
CN114218326A CN202111472676.7A CN202111472676A CN114218326A CN 114218326 A CN114218326 A CN 114218326A CN 202111472676 A CN202111472676 A CN 202111472676A CN 114218326 A CN114218326 A CN 114218326A
Authority
CN
China
Prior art keywords
metadata information
node
range
cache
range metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111472676.7A
Other languages
English (en)
Inventor
任宏晖
王瀚墨
陈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yunxi Technology Co ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202111472676.7A priority Critical patent/CN114218326A/zh
Publication of CN114218326A publication Critical patent/CN114218326A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种分布式数据库提升数据路由效率的方法,涉及分布式数据库系统技术领域;基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,并通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。

Description

一种分布式数据库提升数据路由效率的方法
技术领域
本发明公开一种方法,涉及分布式数据库系统技术领域,具体地说是一种分布式数据库提升数据路由效率的方法。
背景技术
分布式数据库系统通常在逻辑上是一个统一的整体,在物理上则是分别存储在不同的物理节点上,其主要设计目标是可扩展,强一致和高可靠。数据库中的数据分别在不同的局部数据库中存储、由不同的数据库管理系统进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。
为了使集群中的所有数据都可以从任何节点访问,将数据存储在KV对的整体有序map中。集群集中所有range的位置都存储在keyspace开头的两级索引中,称为meta range,其中第一级(meta1)寻址第二级,第二级(meta2)索引集群中的用户数据。meta range被视为正常range,并且可以像集群的KV数据的其他元素一样进行访问和复制,每个节点都有关于meta1 range的位置信息,并且该range从不分割,而meta2 range可能位于集群的某几个节点中。当节点收到Sql请求时,它会首先查看meta1 range确定key属于哪个meta2range的范围,通过将请求中的key与其meta2 range内的key进行比较,找出将请求路由到哪个节点。随后该请求被发送到给节点完成相关操作。由此可知,每次完成请求都需要从存储介质中查找meta range来确定路由节点,当集群压力较大时,该操作响应时间可能会很长,影响数据库读写效率。
发明内容
本发明针对现有技术的问题,提供一种分布式数据库提升数据路由效率的方法,提升分布式数据库集群数据路由效率。
本发明提出的具体方案是:
一种分布式数据库提升数据路由效率的方法,基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
并通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
进一步,所述的一种分布式数据库提升数据路由效率的方法中所述路由缓存存储用于标识数据范围的keyspace和节点的range元数据信息。
进一步,所述的一种分布式数据库提升数据路由效率的方法中所述通过查找路由缓中获得range元数据信息之前,包括:
遍历路由缓存查找是否存在相应的range元数据信息的缓存数据,若存在则后续将数据请求发送到对应节点完成操作,若不存在则从存储介质中查找相应的keyspace范围和节点的range元数据信息更新至路由缓存中。
进一步,所述的一种分布式数据库提升数据路由效率的方法中所述增加路由缓存,包括:
设置路由缓存的容量,并根据最近最少使用原则删除最少使用的缓存数据。
进一步,所述的一种分布式数据库提升数据路由效率的方法中所述range元数据信息通过键值对KV map存储,并且每条range元数据信息都存在时间戳。
进一步,所述的一种分布式数据库提升数据路由效率的方法中所述更新规则包括:
根据range元数据信息的起始key读取路由缓存,判断对应的range元数据信息是否存在,
若存在但是range元数据信息的时间戳比路由缓存更新,则将此时range元数据信息更新到路由缓存中。
本发明还提供一种分布式数据库提升数据路由效率的系统,包括路由缓存模块和更新模块,
路由缓存模块基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
更新模块通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
本发明还提供一种分布式数据库提升数据路由效率的装置,包括至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行所述的一种分布式数据库提升数据路由效率的方法。
本发明的有益之处是:
本发明公开了一种分布式数据库提升数据路由效率的方法,在Shared Nothing架构的分布式数据库集群内将接入节点收到数据请求通过路由缓存获得元数据信息将请求路由到适当的节点来完成操作,避免每次数据路由都从存储介质中查找造成的响应时间冗长和系统资源消耗,同时通过数据同步协议将每个节点的range元数据扩散到整个集群,根据更新规则将range元数据更新到路由缓存中,从而提升数据路由效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明提供一种分布式数据库提升数据路由效率的方法,基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
并通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
本发明方法增加路由缓存,该缓存保存着一部分从存储介质中最近被读出的对应节点元数据信息,每次数据请求发起路由时先遍历路由缓存,如果缓存已有该信息则直接完成数据路由。其次通过数据同步协议将集群内各个节点拥有的range元数据同步到整个集群内,这样每个节点都可以知晓整个集群的所有range元数据。当节点收到range元数据后会根据一定的更新规则进行对比决定是否更新到路由缓存,由此提高路由缓存效率。
实际应用中,Shared nothing架构是一种常见的分布式数据库架构。这种架构中的每一个节点都是独立、自给的,而且整个系统中没有单点竞争。每个节点都有自己私有的CPU、内存、硬盘等,不存在共享资源,各处理单元之间通过协议通信,并行处理和扩展能力更好。各节点相互独立,各自处理自己的数据,处理后的结果可能向上层汇总或在节点间流转。
分布式数据库系统中的每台存储服务器称为节点,每个节点包含一个或多个Store,每个Store独享一块磁盘,每个Store对应一个存储实例。系统将用户数据组织成有序的Key-Value键值对形成一个KV map,KV map逻辑上按照范围被切分成大量的Key空间,每个Key空间称为Range,每个Store包含一批Range。
为了使集群中的所有数据都可以从任何节点访问,将数据存储在KV对的整体有序map中。群集中所有range的位置都存储在keyspace开头的两级索引中,称为meta range,其中第一级(meta1)寻址第二级,第二级(meta2)索引集群中的用户数据。meta range被视为正常range,并且可以像集群的KV数据的其他元素一样进行访问和复制,每个节点都有关于meta1 range的位置信息,并且该range从不分割,而meta2 range可能位于集群的某几个节点中。当节点收到Sql请求时,它会首先查看meta1 range确定key属于哪个meta2 range的范围,通过将请求中的key与其meta2 range内的key进行比较,找出将请求路由到哪个节点。随后该请求被发送到给节点完成相关操作。由此可知,每次完成请求都需要从存储介质中查找meta range来确定路由节点,当集群压力较大时,该操作响应时间可能会很长,影响数据库读写效率。
而在本发明方法的一些实施例中,增加路由缓存,存储着用于标识数据范围的keyspace和Range元数据信息,Range元数据信息通过一个统一的键值对KV map来存储,除了存储元数据信息,还需要为每条数据增加时间戳,时间戳用来判断该条数据是否需要被同步。
所述路由缓存在节点启动时为空,当节点启动完成开始提供服务后逐步添加缓存条目,节点下线或断电后被清空。收到第一条业务请求时,该请求首先遍历路由缓存查找是否有满足其所处理的数据key范围要求的缓存数据,此时由于缓存为空会查找失败,则开始一次从存储介质中查找meta range的流程,查找成功后此次请求发送到对应节点完成操作,查找成功的meta range中的keyspace范围和节点元数据信息则被更新到路由缓存中,之后如果有符合keyspace范围的请求再次发起路由时直接通过路由缓存查找并发送到相应节点执行。当其他请求的key不在该缓存范围中时,则重复之前的操作从存储介质中查找meta range完成路由然后将其更新到路由缓存。
上述过程中,考虑到集群用户数据规模较大时meta range也会随之规模较大,如果将range元数据全部存入路由缓存占用内存空间太大,并且遍历效率不高,则设置有限容量的路由缓存,并采用最近最少使用原则删除最少使用的缓存,将最新使用的meta range条目更新到缓存中。
当集群节点通过数据同步协议收到range元数据信息同步数据时,根据range元数据信息的起始key读取路由缓存,判断对应的range元数据信息是否存在,若存在但是range元数据信息的时间戳比路由缓存更新,则将此时range元数据信息更新到路由缓存中的更新原则进行路由缓存的更新。
利用上述过程,进行相同的服务器上分别部署提升路由效率前后的分布式数据库对比,在一台72核384G内存的服务器上启动100个节点,优化前CPU利用率在35%-40%左右。采用优化后的方案后,集群平稳后的CPU利用率为10%-15%,系统CPU资源消耗得到了极大的改善。
通过在5台服务器上搭建共250节点大规模的集群对比测试发现,优化方案下集群运行时服务器平均CPU利用率为13%,优化前的平均CPU利用率为38%。向集群中插入10000仓2TB的数据后,运行TPCC测试通过对比tpmC值来衡量集群的性能发现,本发明方案的tpmC值在81000左右,而优化前方案下仅为37000左右,进一步证明本发明方案可以提升数据路由效率,节省系统资源。
此外集群节点通过数据同步协议同步range元数据信息的过程,可参考如下:
分布式数据库系统的节点启动时会指定该节点的IP地址以及端口号,这两个地址构成了一个独一无二的网络地址以标识该节点。节点启动后会指定连接一个当前集群内的其他节点地址,这样本节点充客户端角色,被连接的节点充当服务端角色,两者通过远程过程调用的方式建立双向连接流。当客户端的KV map新插入range元数据时,触发客户端遍历当前的KV map根据时间戳从中取出最新未同步的数据发送给服务端,当服务端收到该元数据后存入自身的KV map,同时遍历KV map将自身未同步的数据返回给客户端,这样完成一次数据的同步。为了加快数据的同步速度,服务端在没有收到客户端请求时,也会监听自己的KV map的变化,当发生变化时将未更新的元数据主动同步给客户端。
当第三个节点加入集群时,通常它会选择连接当前的某个服务端,这时一个服务端会对应两个客户端。客户端分别把自身range元数据信息发送给服务端,再被服务端同步到另一个客户端,达到range元数据同步到整个集群的目的。随着更多节点的加入,一个服务端连接的客户端会不断增多,为了保证服务端的同步效率,需要限制服务端可连接的客户端数目。客户端数目达到上限后再收到新增结点客户端的连接请求,服务端会从已连接的客户端中随机选取一个返回给发起连接的节点,该节点会连接收到的应答中的节点地址作为自己的服务端。这样一个节点可能既是服务端又是客户端,客户端和服务端之间不断交互元数据信息,将自身拥有的最新元数据以增量的方式不断同步出去,最终集群内所有节点都会拥有所有的range元数据信息,且每个节点都是完全相同的。
同时本发明还提供一种分布式数据库提升数据路由效率的系统,包括路由缓存模块和更新模块,
路由缓存模块基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
更新模块通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
上述系统内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
同样地,本发明系统可以在Shared Nothing架构的分布式数据库集群内将接入节点收到数据请求通过路由缓存获得元数据信息将请求路由到适当的节点来完成操作,避免每次数据路由都从存储介质中查找造成的响应时间冗长和系统资源消耗,同时通过数据同步协议将每个节点的range元数据扩散到整个集群,根据更新规则将range元数据更新到路由缓存中,从而提升数据路由效率。
以及本发明还提供一种分布式数据库提升数据路由效率的装置,包括至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行所述的一种分布式数据库提升数据路由效率的方法。
上述装置内的处理器的信息交互、执行可读程序过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
同样地,本发明装置可以在Shared Nothing架构的分布式数据库集群内将接入节点收到数据请求通过路由缓存获得元数据信息将请求路由到适当的节点来完成操作,避免每次数据路由都从存储介质中查找造成的响应时间冗长和系统资源消耗,同时通过数据同步协议将每个节点的range元数据扩散到整个集群,根据更新规则将range元数据更新到路由缓存中,从而提升数据路由效率。
需要说明的是,上述各流程和各系统结构中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (8)

1.一种分布式数据库提升数据路由效率的方法,其特征是基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
并通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
2.根据权利要求1所述的一种分布式数据库提升数据路由效率的方法,其特征是所述路由缓存存储用于标识数据范围的keyspace和节点的range元数据信息。
3.根据权利要求1或2所述的一种分布式数据库提升数据路由效率的方法,其特征是所述通过查找路由缓中获得range元数据信息之前,包括:
遍历路由缓存查找是否存在相应的range元数据信息的缓存数据,若存在则后续将数据请求发送到对应节点完成操作,若不存在则从存储介质中查找相应的keyspace范围和节点的range元数据信息更新至路由缓存中。
4.根据权利要求3所述的一种分布式数据库提升数据路由效率的方法,其特征是所述增加路由缓存,包括:
设置路由缓存的容量,并根据最近最少使用原则删除最少使用的缓存数据。
5.根据权利要求2所述的一种分布式数据库提升数据路由效率的方法,其特征是所述range元数据信息通过键值对KV map存储,并且每条range元数据信息都存在时间戳。
6.根据权利要求5所述的一种分布式数据库提升数据路由效率的方法,其特征是所述更新规则包括:
根据range元数据信息的起始key读取路由缓存,判断对应的range元数据信息是否存在,
若存在但是range元数据信息的时间戳比路由缓存更新,则将此时range元数据信息更新到路由缓存中。
7.一种分布式数据库提升数据路由效率的系统,其特征是包括路由缓存模块和更新模块,
路由缓存模块基于Shared Nothing架构的分布式数据库集群,增加路由缓存,通过查找路由缓中获得range元数据信息将接入节点收到的数据请求根据元数据信息路由到适当的节点完成操作,
更新模块通过数据同步协议将每个节点的range元数据信息同步到整个集群,根据更新规则将range元数据信息更新到路由缓存中。
8.一种分布式数据库提升数据路由效率的装置,其特征是包括至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至6中任一项所述的一种分布式数据库提升数据路由效率的方法。
CN202111472676.7A 2021-12-06 2021-12-06 一种分布式数据库提升数据路由效率的方法 Pending CN114218326A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111472676.7A CN114218326A (zh) 2021-12-06 2021-12-06 一种分布式数据库提升数据路由效率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111472676.7A CN114218326A (zh) 2021-12-06 2021-12-06 一种分布式数据库提升数据路由效率的方法

Publications (1)

Publication Number Publication Date
CN114218326A true CN114218326A (zh) 2022-03-22

Family

ID=80699689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111472676.7A Pending CN114218326A (zh) 2021-12-06 2021-12-06 一种分布式数据库提升数据路由效率的方法

Country Status (1)

Country Link
CN (1) CN114218326A (zh)

Similar Documents

Publication Publication Date Title
CN109783438B (zh) 基于librados的分布式NFS系统及其构建方法
US9201742B2 (en) Method and system of self-managing nodes of a distributed database cluster with a consensus algorithm
EP2501108B1 (en) Massively scalable object storage system
EP2498476B1 (en) Massively scalable object storage system
US7440977B2 (en) Recovery method using extendible hashing-based cluster logs in shared-nothing spatial database cluster
CN109547512B (zh) 一种基于NoSQL的分布式Session管理的方法及装置
US10599677B2 (en) Methods and systems of splitting database indexes and digests
US9367261B2 (en) Computer system, data management method and data management program
JP2008533564A (ja) データ管理のための方法および装置
AU2010250536A1 (en) Meta-information sharing distributed database system in virtual single memory storage
US20170097941A1 (en) Highly available network filer super cluster
US11263270B1 (en) Heat balancing in a distributed time-series database
EP3935515A1 (en) Metadata routing in a distributed system
CN107180034A (zh) MySQL数据库的集群系统
US11409771B1 (en) Splitting partitions across clusters in a time-series database
CN113032356A (zh) 一种客舱分布式文件存储系统及实现方法
CN117271583A (zh) 优化大数据查询的系统及方法
CN109726211B (zh) 一种分布式时序数据库
CN107908713B (zh) 一种基于Redis集群的分布式动态杜鹃过滤系统及其过滤方法
US11366598B1 (en) Dynamic lease assignments in a time-series database
CN112328685A (zh) 一种全对等分布式数据库数据同步方法
US20230205638A1 (en) Active-active storage system and data processing method thereof
CN114218326A (zh) 一种分布式数据库提升数据路由效率的方法
CN115562849A (zh) 一种基于高可用的缓存数据方法及系统
US20240176762A1 (en) Geographically dispersed hybrid cloud cluster

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221216

Address after: Room 305-22, Building 2, No. 1158 Zhangdong Road and No. 1059 Dangui Road, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Applicant after: Shanghai Yunxi Technology Co.,Ltd.

Address before: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park

Applicant before: Inspur cloud Information Technology Co.,Ltd.

TA01 Transfer of patent application right