CN116431615A - 一种面向复杂业务场景的灵活数据分区路由方法 - Google Patents

一种面向复杂业务场景的灵活数据分区路由方法 Download PDF

Info

Publication number
CN116431615A
CN116431615A CN202310573742.2A CN202310573742A CN116431615A CN 116431615 A CN116431615 A CN 116431615A CN 202310573742 A CN202310573742 A CN 202310573742A CN 116431615 A CN116431615 A CN 116431615A
Authority
CN
China
Prior art keywords
data
pieces
node
nodes
slices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310573742.2A
Other languages
English (en)
Inventor
欧伟杰
郑嘉星
李怿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Computing Sciences
Original Assignee
Shenzhen Institute of Computing Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Computing Sciences filed Critical Shenzhen Institute of Computing Sciences
Priority to CN202310573742.2A priority Critical patent/CN116431615A/zh
Publication of CN116431615A publication Critical patent/CN116431615A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种面向复杂业务场景的灵活数据分区路由方法,所述方法应用于分布式关系数据库中;其中,所述分布式关系数据库中包括若干服务器节点,所述服务器节点相互连接;所述方法包括:当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。通过将数据分片成数据片,解决了复杂业务场景下数据均衡性存在的局限性,有效避免了数据不均的问题。

Description

一种面向复杂业务场景的灵活数据分区路由方法
技术领域
本申请涉及数据库数据路由技术领域,特别是一种面向复杂业务场景的灵活数据分区路由方法。
背景技术
随着业务的复杂性提升,对数据库的扩展能力要求也越来越高。分布式数据库通过将数据分布在不同存储节点中实现横向扩展,但如何分布才能解决数据均衡性且在扩展时搬迁代价较小成为了一个问题。
不少分布式数据库系统通过特定字段的取值范围分区实现数据路由,但可能会数据分布不均,需要进一步切分分区;也有一些系统为了最小化数据搬迁而使用了一致性hash算法DHT来生成数据路由,但必须设置虚拟节点来避免数据倾斜等问题。因此,现有的数据分区路由方法存在搬迁开销高和数据不均等问题。
发明内容
鉴于所述问题,提出了本申请以便提供克服所述问题或者至少部分地解决所述问题的一种面向复杂业务场景的灵活数据分区路由方法,包括:
一种面向复杂业务场景的灵活数据分区路由方法,所述方法应用于分布式关系数据库中;其中,所述分布式关系数据库中包括若干服务器节点,所述服务器节点相互连接;所述方法包括:
当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;
根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
进一步地,所述通过分片hash算法将所述数据分片生成数据片的步骤,包括:
将所述数据转换为Hash环并切分为相同大小的数据片;
确定所述数据的分布键;
通过分片hash算法将所述分布键的值映射为hash值;
通过所述hash值对所述数据空间中的所述数据片的数量取模,得到分片id。
所述根据所述数据所处的数据空间将所述数据片分配至对应的数据节点的步骤,包括:
根据所述数据所处的数据空间确定所述数据片对应的数据节点;
将所述数据片分配至所述数据节点内的存储节点。
进一步地,所述将所述数据片分配至所述数据节点内的存储节点的步骤,包括:
生成存储节点,获取所述存储节点的id;
根据所述id的顺序分配所述数据片。
进一步地,所述当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量的步骤,包括:
根据所述数据片的数量和所述存储节点的数量为所述存储节点分配所述数据片。
进一步地,所述方法还包括:
当监听到外部查询时,所述通信节点生成访问计划并确定参与的存储节点。
进一步地,所述方法还包括:
通过移动节点管理数据路由。
一种面向复杂业务场景的灵活数据分区路由装置,所述装置包括:
数据分片模块,用于当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的属性确定所述数据片的数量;
数据分配模块,用于根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
扩容分区模块,用于当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
一种计算机设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据分区路由方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据分区路由方法的步骤。
本申请具有以下优点:
在本申请的实施例中,针对于现有技术中的数据不均的问题,本申请提供了针对数据分区静态分配和扩容动态调整的解决方案,具体为:当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。通过将数据分片成数据片,使得当一个节点退出时,不需要把其负责的分片顺时针交给其后节点,可以更加灵活的将整个分片交给任意节点,解决了复杂业务场景下数据均衡性存在的局限性,有效避免了数据不均的问题。
附图说明
为了更清楚地说明本申请的技术方案,下面将对本申请的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由方法的步骤流程图;
图2是本申请一实施例提供的数据片的数量为10时数据分配的步骤流程图;
图3是本申请一实施例提供的数据片的数量为10时扩容分区的步骤流程图;
图4是本申请一实施例提供的数据片的数量为100时扩容分区的步骤流程图;
图5是本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由网络的步骤流程图;
图6是本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由装置的结构框图;
图7是本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的所述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
发明人通过分析现有技术发现:不少分布式数据库系统通过特定字段的取值范围分区实现数据路由,但当实际业务发生变化时,可能会导致数据分布不均,需要进一步切分分区;也有一些系统为了最小化数据搬迁而使用了一致性hash算法DHT来生成数据路由,但必须设置虚拟节点来避免数据倾斜等问题。因此,现有的数据分区路由方法存在搬迁开销高和数据不均等问题,其对于复杂业务场景下数据均衡性及数据搬迁的开销均存在一定的局限性。
参照图1,示出了本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由方法,所述方法应用于分布式关系数据库中;其中,所述分布式关系数据库中包括若干服务器节点,所述服务器节点相互连接;所述方法包括:
S110、当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;
S120、根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
S130、当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
在本申请的实施例中,针对于现有技术中的数据不均的问题,本申请提供了针对数据分区静态分配和扩容动态调整的解决方案,具体为:当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。通过将数据分片成数据片,使得当一个节点退出时,不需要把其负责的分片顺时针交给其后节点,可以更加灵活的将整个分片交给任意节点,解决了复杂业务场景下数据均衡性存在的局限性,有效避免了数据不均的问题。
下面,将对本示例性实施例中一种面向复杂业务场景的灵活数据分区路由方法作进一步地说明。
需要说明的是,本申请针对于现有技术中的搬迁开销高的问题,通过将数据分片成数据片,使得当一个节点退出时,不需要把其负责的分片顺时针交给其后节点,可以更加灵活的将整个分片交给任意节点,还解决了复杂业务场景下数据搬迁的开销的局限性,有效降低了搬迁开销的问题。
需要说明的是,本申请应用于分布式关系数据库中,所述分布式关系数据库用于向客户端提供透明的数据服务;其中,所述分布式关系数据库中包括若干服务器节点,所述服务器节点相互连接。
如上述步骤S110所述,当获取到数据时,通过分片hash算法将所述数据分片生成数据片。
在本发明一实施例中,可以结合下列描述进一步说明步骤S110所述“通过分片hash算法将所述数据分片生成数据片”的具体过程。
如下列步骤所述,将所述数据转换为Hash环并切分为相同大小的数据片;
如下列步骤所述,确定所述数据的分布键;
如下列步骤所述,通过分片hash算法将所述分布键的值映射为hash值;
如下列步骤所述,通过所述hash值对所述数据空间中的所述数据片的数量取模,得到分片id。
作为一种示例,通过hash算法将所述数据转换为Hash环,将所述Hash环切分为相同大小的若干数据片,其中,所述数据片的数量可以根据所述数据的扩张预期确定。确定所述数据的分布键,具体地,分布键通常是人为指定的,一般取数据最分散的那一列,如电商数据的订单号,这样可以使数据尽可能均匀地分布在所有数据片上。通过hash算法计算得到上述分布键的值对应的hash值,由于hash值的取值范围远大于数据片的数量,所以还需要将hash值对数据片的数量取模,计算结果就是数据片id([0,数据片数量-1]),从而为每一条数据确定一个唯一分片。
需要说明的是,在本申请中数据片是数据迁移、故障恢复、副本复制的最小单位。所述数据片分片的粒度决定了查询效率和管理成本,因此所述数据片的数量需要根据用户业务扩展的需求确定。同时,所述数据片分片的数量也会决定所述数据库所支持的存储节点数。
在一具体实现中,本实施例设置数据片的数量为10个时,所述数据库最大支持10个存储节点。
在另一具体实现中,本实施例设置数据片的数量为100个时,所述数据库最大支持100个存储节点。
如上述步骤S120所述,根据所述数据所处的数据空间将所述数据片分配至对应的数据节点。
在本发明一实施例中,可以结合下列描述进一步说明步骤S120所述“根据所述数据所处的数据空间将所述数据片分配至对应的数据节点”的具体过程。
如下列步骤所述,根据所述数据所处的数据空间确定所述数据片对应的数据节点;
如下列步骤所述,将所述数据片分配至所述数据节点内的存储节点。
作为一种示例,获取所述数据所处的数据空间和由所述数据生成的所述数据片,依据所述数据空间确定其对应的数据节点,获取所述数据节点内的若干存储节点,将所述数据片分配至所述存储节点;其中,所述存储节点不少于2个。
在本发明一实施例中,可以结合下列描述进一步说明“根据所述数据所处的数据空间确定所述数据片对应的数据节点”的具体过程。
如下列步骤所述,生成存储节点,获取所述存储节点的id;
如下列步骤所述,根据所述id的顺序分配所述数据片。
作为一种示例,确定所述数据片的数量,生成若干个DN Group作为存储节点,获取所述存储节点的id,其中,所述存储节点的数量可以根据需要存储的数据大小确定,其中,所述存储节点至少需要存储1个所述数据片,因此所述存储节点的数量不能超过所述数据片的数量。将所述数据片的数量除以所述存储节点的数量并向下取整,求出每个所述存储节点至少要分配的所述数据片的数量。将所述数据片的数量除以所述存储节点的数量并取余,确定还需要额外分配一个所述数据片的所述存储节点的数量。先按照每个所述存储节点至少要分配的所述数据片的数量为每个所述存储节点分配所述数据片,再按照所述存储节点的id从小到大的顺序,依次为所述存储节点分配一个额外的所述数据片直至所有所述数据片分配完成。
在一具体实现中,参照图2,本实施例生成3个DN Group作为存储节点并获取所述存储节点的id,且本实施例中数据片的数量为10个。通过计算可以得出每个所述存储节点至少要分配2个所述数据片,且有1个所述存储节点需要额外分配一个数据片。先按照为每个所述存储节点分配2个所述数据片,再按照所述存储节点的id从小到大的顺序,将额外的所述数据片分配至所述存储节点的id最小的所述存储节点。
如上述步骤S130所述,当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
在本发明一实施例中,可以结合下列描述进一步说明步骤S130所述“当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量”的具体过程。
如下列步骤所述,根据所述数据片的数量和所述存储节点的数量为所述存储节点分配所述数据片。
作为一种示例,当发生扩容时,获取所述数据片的数量和所述存储节点扩容前的数量,通过所述存储节点扩容前的数量和扩容的节点数量计算出需分配的存储节点数。其中,所述需分配的存储节点数不能超过所述数据片的数量。将所述数据片的数量除以所述存储节点数并向下取整,得到每个所述存储节点至少要分配的所述数据片的数量。将所述数据片的数量除以所述存储节点数并取余,确定还有几个所述存储节点需要额外分配一个所述数据片。先按照每个所述存储节点至少要分配的所述数据片的数量为每个所述存储节点分配所述数据片,再为所述存储节点分配额外的所述数据片。
需要说明的是,在分配额外的所述数据片时,所述存储节点原来存储的所述数据片的数量越大,优先级越高,但是每个所述存储节点最多只能分配一个额外的所述数据片。原来存储的所述数据片的数量相同的所述存储节点之间,则按照所述存储节点的id从小到大依次分配额外的所述数据片。
在一具体实现中,参照图3,本实施例的数据片的数量为10个,所述存储节点扩容前的数量为3个,扩容的节点数量为1个,则可通过计算得出每个所述存储节点至少要分配2个所述数据片,且有2个所述存储节点需要额外分配一个数据片。其中,有1个所述存储节点原来存有4个所述数据片(A类),有2个所述存储节点原来存有3个所述数据片(B类),有1个新增的所述存储节点原来没有存储所述数据片(C类)。那么,A类的所述存储节点会优先分配1个额外的所述数据片,2个B类的所述存储节点则按照所述存储节点的id从小到大的优先顺序,将剩余的1个额外的所述数据片分配至所述存储节点的id更小的所述存储节点。
在一具体实现中,参照图4,本实施例的数据片的数量为100个,所述存储节点扩容前的数量为1个,扩容的节点数量为9个,则可通过计算得出每个所述存储节点至少要分配10个所述数据片。扩容完成后,每个所述存储节点中都存储有10个所述数据片。再次进行扩容,此时,所述存储节点在此次扩容前的数量为10个,扩容的节点数量为10个,可通过计算得出每个所述存储节点至少要分配5个所述数据片。
在本发明一实施例中,所述方法还包括:
如下列步骤所述,当监听到外部查询时,所述通信节点生成访问计划并确定参与的存储节点。
作为一种示例,当监听到外部查询时,根据元数据确定查询的数据表所属的数据空间,其中,每个数据空间维护一张路由表,所述路由表包含了对应数据空间下的数据片和数据节点的对应关系(数据片一定存在于一个数据节点上)。若所述查询没有附带过滤条件,则到所述数据空间下的所有数据节点上去查询。若所述查询指定了分布键值的条件,那么优化器会根据指定的分布键值计算出对应的数据片id,再依据所述数据片id到特定的数据节点上去查询,以此实现分布剪枝。
在本发明一实施例中,所述方法还包括:
如下列步骤所述,通过移动节点管理数据路由。
作为一种示例,本实施例通过移动节点管理数据路由,具体地,先通过Hash定位数据在哪一个数据片上,然后再找到数据片对应的存储节点信息。
参照图5,示出了本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由网络结构,包括:协调组、DTF(Digital Transmission Facility,数字传输设备)和若干计算组;
所述协调组包括通讯节点和若干监听节点;所述计算组包括若干存储节点,所述存储节点由若干处理器节点组成。
作为一种示例,所述监听节点用于监听外部查询。
作为一种示例,1个所述计算组对应1个数据空间。
作为一种示例,所述存储节点通过内部的若干处理器节点实现负荷分担。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
参照图6,示出了本申请一实施例提供的一种面向复杂业务场景的灵活数据分区路由装置;
具体包括:
数据分片模块610,用于当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的属性确定所述数据片的数量;
数据分配模块620,用于根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
扩容分区模块630,用于当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
在本发明一实施例中,所述数据分片模块610,包括:
环切子模块,用于将所述数据转换为Hash环并切分为相同大小的数据片;
分布键确定模块,用于确定所述数据的分布键;
hash映射子模块,用于通过分片hash算法将所述分布键的值映射为hash值;
分片id获取子模块,用于通过所述hash值对所述数据空间中的所述数据片的数量取模,得到分片id。
在本发明一实施例中,所述数据分配模块620,包括:
节点确定子模块,用于根据所述数据所处的数据空间确定所述数据片对应的数据节点;
存储子模块,用于将所述数据片分配至所述数据节点内的存储节点。
在本发明一实施例中,所述存储子模块,包括:
节点生成单元,用于生成存储节点,获取所述存储节点的id;
数据分片单元,用于根据所述id的顺序分配所述数据片。
在本发明一实施例中,所述扩容分区模块630,包括:
扩容子模块,用于根据所述数据片的数量和所述存储节点的数量为所述存储节点分配所述数据片。
在本发明一实施例中,所述装置还包括:
通信模块,用于当监听到外部查询时,所述通信节点生成访问计划并确定参与的存储节点;
路由模块,用于通过移动节点管理数据路由。
参照图7,示出了本发明的一种面向复杂业务场景的灵活数据分区路由方法及装置的计算机设备,具体可以包括如下:
上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质界面与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得操作人员能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)界面22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图7所示,网络适配器20通过总线18与计算机设备12的其他模块通信。应当明白,尽管图7中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种面向复杂业务场景的灵活数据分区路由方法。
也即,上述处理单元16执行上述程序时实现:当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的一种面向复杂业务场景的灵活数据分区路由方法:
也即,给程序被处理器执行时实现:当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在操作人员计算机上执行、部分地在操作人员计算机上执行、作为一个独立的软件包执行、部分在操作人员计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到操作人员计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种面向复杂业务场景的灵活数据分区路由方法,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种面向复杂业务场景的灵活数据分区路由方法,所述方法应用于分布式关系数据库中;其中,所述分布式关系数据库中包括若干服务器节点,所述服务器节点相互连接;其特征在于,所述方法包括:
当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的扩张预期确定所述数据片的数量;
根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
2.根据权利要求1所述的方法,其特征在于,所述通过分片hash算法将所述数据分片生成数据片的步骤,包括:
将所述数据转换为Hash环并切分为相同大小的数据片;
确定所述数据的分布键;
通过分片hash算法将所述分布键的值映射为hash值;
通过所述hash值对所述数据空间中的所述数据片的数量取模,得到分片id。
3.根据权利要求1所述的方法,其特征在于,所述根据所述数据所处的数据空间将所述数据片分配至对应的数据节点的步骤,包括:
根据所述数据所处的数据空间确定所述数据片对应的数据节点;
将所述数据片分配至所述数据节点内的存储节点。
4.根据权利要求3所述的方法,其特征在于,所述将所述数据片分配至所述数据节点内的存储节点的步骤,包括:
生成存储节点,获取所述存储节点的id;
根据所述id的顺序分配所述数据片。
5.根据权利要求1所述的方法,其特征在于,所述当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量的步骤,包括:
根据所述数据片的数量和所述存储节点的数量为所述存储节点分配所述数据片。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当监听到外部查询时,所述通信节点生成访问计划并确定参与的存储节点。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过移动节点管理数据路由。
8.一种面向复杂业务场景的灵活数据分区路由装置,其特征在于,所述装置包括:
数据分片模块,用于当获取到数据时,通过分片hash算法将所述数据分片生成数据片;其中,根据所述数据的属性确定所述数据片的数量;
数据分配模块,用于根据所述数据所处的数据空间将所述数据片分配至对应的数据节点;
扩容分区模块,用于当发生扩容时,根据数据量和负载大小决定搬迁所述数据片的数量。
9.一种计算机设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
CN202310573742.2A 2023-05-19 2023-05-19 一种面向复杂业务场景的灵活数据分区路由方法 Pending CN116431615A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310573742.2A CN116431615A (zh) 2023-05-19 2023-05-19 一种面向复杂业务场景的灵活数据分区路由方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310573742.2A CN116431615A (zh) 2023-05-19 2023-05-19 一种面向复杂业务场景的灵活数据分区路由方法

Publications (1)

Publication Number Publication Date
CN116431615A true CN116431615A (zh) 2023-07-14

Family

ID=87079952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310573742.2A Pending CN116431615A (zh) 2023-05-19 2023-05-19 一种面向复杂业务场景的灵活数据分区路由方法

Country Status (1)

Country Link
CN (1) CN116431615A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392067A (zh) * 2021-06-11 2021-09-14 北京金山云网络技术有限公司 一种针对分布式数据库的数据处理方法、装置及系统
CN114625716A (zh) * 2022-01-20 2022-06-14 湖南亚信安慧科技有限公司 数据库分库分表扩容方法、装置及计算机可读存储介质
CN115412610A (zh) * 2022-08-29 2022-11-29 中国工商银行股份有限公司 故障场景下的流量调度方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392067A (zh) * 2021-06-11 2021-09-14 北京金山云网络技术有限公司 一种针对分布式数据库的数据处理方法、装置及系统
CN114625716A (zh) * 2022-01-20 2022-06-14 湖南亚信安慧科技有限公司 数据库分库分表扩容方法、装置及计算机可读存储介质
CN115412610A (zh) * 2022-08-29 2022-11-29 中国工商银行股份有限公司 故障场景下的流量调度方法及装置

Similar Documents

Publication Publication Date Title
US10360199B2 (en) Partitioning and rebalancing data storage
JP6542909B2 (ja) ファイル操作方法及び装置
KR20180027326A (ko) 확장 가능한 멀티-스테이지 데이터 처리 시스템들에서의 효율적인 데이터 캐싱 관리
CN111324606B (zh) 数据分片的方法及装置
US9785515B2 (en) Directed backup for massively parallel processing databases
CN111930713B (zh) Ceph放置组的分配方法、装置、服务器及存储介质
CN111857539B (zh) 用于管理存储系统的方法、设备和计算机可读介质
CN110633046A (zh) 一种分布式系统的存储方法、装置、存储设备及存储介质
US8903871B2 (en) Dynamic management of log persistence
JP2024507055A (ja) コンピューティング環境内のアプリケーション展開
US10474653B2 (en) Flexible in-memory column store placement
CN111444148A (zh) 基于MapReduce的数据传输方法和装置
CN116431615A (zh) 一种面向复杂业务场景的灵活数据分区路由方法
US11704314B2 (en) Multiplexing data operation
CN114840562A (zh) 业务数据的分布式缓存方法、装置、电子设备及存储介质
CN113535673B (zh) 生成配置文件及数据处理的方法和装置
US11249952B1 (en) Distributed storage of data identifiers
US10712959B2 (en) Method, device and computer program product for storing data
CN113297327A (zh) 生成分布式id的系统和方法
CN111782634A (zh) 数据分布式存储方法、装置、电子设备及存储介质
CN112148461A (zh) 应用的调度方法、装置
US11550793B1 (en) Systems and methods for spilling data for hash joins
US20230409575A1 (en) Database query processing with database clients
WO2023078760A1 (en) Database synchronization employing parallel poll threads
CN117216028A (zh) 一种资源划分方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination