CN115391337A - 数据库分区的方法、装置、存储介质及电子设备 - Google Patents

数据库分区的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115391337A
CN115391337A CN202210939685.0A CN202210939685A CN115391337A CN 115391337 A CN115391337 A CN 115391337A CN 202210939685 A CN202210939685 A CN 202210939685A CN 115391337 A CN115391337 A CN 115391337A
Authority
CN
China
Prior art keywords
partition
target
request
splitting
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210939685.0A
Other languages
English (en)
Inventor
任弘迪
李凯
董欢庆
邢勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202210939685.0A priority Critical patent/CN115391337A/zh
Publication of CN115391337A publication Critical patent/CN115391337A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了数据库分区的方法、装置、存储介质及电子设备,由于在针对目标分区进行分裂时,先将目标分区在逻辑上分裂为各逻辑分区,并在确定目标分区对应的事务全部完成后,再对目标分区进行实际的分裂,进而可以避免在目标分区进行分裂的过程中,出现数据或日志写错分区的情况。

Description

数据库分区的方法、装置、存储介质及电子设备
技术领域
本申请涉及数据库技术领域,尤其涉及一种数据库分区的方法及装置。
背景技术
目前,在数据库领域中,为了应对数据库所面临的越来越高的读写负载和存储需求,通常会采用分布式数据库来对数据进行存储,而数据在分布式数据库中通常会按照主键或索引键的顺序划分为多个分区,其中,分区在确定后并不是一成不变的,而是需要随着分布式数据库的读写负载和存储需求的增大,而分裂(即,将一个大的分区分裂为多个小的分区)。
而当分布式数据库使用日志结构合并树(Log Structured Merge Tree,LSM)作为存储引擎时,一个节点(即,一台计算机)中的多个分区会使用多个LSM实例(例如:一个分区对应一个LSM实例),因此,在对分区进行分裂的过程中,需要在分裂开始前停止对分区的读写,直到分裂结束后恢复,但是这样做会因为分区读写功能被停止的原因,对线上服务造成影响,而如果在分区分裂的过程中不停止读写,又会造成数据或日志写错分区(例如:属于新分区的数据写入到旧分区中)等问题出现。
因此,如何能够针对具有多个LSM实例的分布式数据库的分区进行分裂,则是一个亟待解决的问题。
发明内容
本申请提供数据库分区的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本申请采用下述技术方案:
本申请提供了一种数据库分区的方法,其特征在于,包括:
获取对数据库的目标分区进行分裂的分裂请求;
响应于所述分裂请求,创建共用所述目标分区对应的日志结构合并树LSM实例的各逻辑分区;
判断所述目标分区对应的事务是否完成执行;
若是,按照所述LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到所述数据库的各新分区。
可选地,获取对数据库的目标分区进行分裂的分裂请求,具体包括:
确定所述数据库中目标分区的分裂点,所述分裂点是指基于目标分区分裂得到的各新分区之间的数据范围边界点;
根据所述分裂点,确定所述目标分区进行分裂的分裂请求。
可选地,创建各逻辑分区之前,所述方法还包括:
针对所述目标分区对应的各节点,获取该节点针对所述分裂请求返回的应答信息;
根据每个节点返回的所述应答信息,确定可以对所述目标分区进行分裂的节点占各节点的比值;
根据所述比值,判断是否针对所述目标分区进行分裂操作。
可选地,创建共用所述目标分区的日志结构合并树LSM实例的各逻辑分区之前,所述方法还包括:
判断是否存在回放重做日志操作;
若是,则针对所述重做日志中包含的每个操作指令,判断该操作指令是否晚于所述分裂请求执行;
若是,则停止执行该操作指令。
可选地,创建共用所述目标分区的日志结构合并树LSM实例的各逻辑分区之前,所述方法还包括:
停止执行用于修改或复制所述目标分区对应的磁盘文件的操作指令。
可选地,所述方法还包括:
确定所述各逻辑分区对应的版本号,作为目标版本号;
若接收到创建事务请求,判断该创建事务请求中包含的版本号是否为所述目标版本号;
若否,则拒绝响应该创建事务请求,以使发送该创建事务请求的设备将该创建事务请求中包含的版本号,更新为所述目标版本号,并重新发送创建事务请求。
可选地,将与该逻辑分区对应的磁盘文件划分到该逻辑分区中,具体包括:
针对每个逻辑分区,根据该逻辑分区对应的数据范围,判断所述目标分区对应的LSM实例所包含的各排序字符串表SST文件中,是否存在与该逻辑分区对应的SST文件;
若是,则将与该逻辑分区对应的SST文件,划分到该逻辑分区中。
本申请提供了一种数据库分区的装置,包括:
获取模块,其配置为获取对数据库的目标分区进行分裂的分裂请求;
准备模块,其配置为响应于所述分裂请求,创建共用所述目标分区对应的日志结构合并树LSM实例的各逻辑分区;
判断模块,其配置为判断所述目标分区对应的事务是否完成执行;
分裂模块,其配置为若判所述目标分区对应的事务完成执行,按照所述LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到所述数据库的各新分区。
本申请提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据库分区的方法。
本申请提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数据库分区的方法。
本申请采用的上述至少一个技术方案能够达到以下有益效果:
在本申请提供的数据库分区的方法,首先获取对数据库的目标分区进行分裂的分裂请求,响应于分裂请求,创建共用目标分区对应的日志结构合并树LSM实例的各逻辑分区,然后,判断目标分区对应的事务是否完成执行,若是,按照LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,进而针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到数据库的各新分区。
从上述方法中可以看出,由于在针对目标分区进行分裂时,先将目标分区在逻辑上分裂为各逻辑分区,并在确定目标分区对应的事务全部完成后,再对目标分区进行实际的分裂,进而可以避免在目标分区进行分裂的过程中,出现数据或日志写错分区的情况。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请中提供的一种数据库分区的方法的流程示意图;
图2为本申请中提供的数据库分区的过程的示意图;
图3为本申请提供的一种数据库分区的装置的示意图;
图4为本申请提供的一种对应于图1的电子设备的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请中提供的一种数据库分区的方法的流程示意图,包括以下步骤:
S101:获取对数据库的目标分区进行分裂的分裂请求。
目前,在分布式数据库中,为了便于存储和查询数据,往往会按照数据的主键或索引键的顺序,将数据分为多个分区,例如:一个分布式数据库中保存有某公司十年内录用的员工的工作信息,则可以将这十年内录用的员工的工作信息,按照录用时间顺序,将员工的工作信息分为十个分区,其中,每个分区中包含有该公司一年内录用的员工的工作信息。
进一步地,随着的分布式数据库的使用时间的增长,每个分区的负载和存储的数据量都在增长,因此,需要对负载大或者数据量多的分区进行分裂操作,例如:某公司在第A年录用的员工的工作信息,往往会随着这些员工的工作年限的增长而增长,因此,在一段时间后,可以将A年录用的员工的工作信息对应的分区分裂为A年1~6月录用的员工的工作信息和A年7~12月录用的员工的工作信息两个分区,以便于后续对某公司在第A年录用的员工的工作信息的管理。
但是,由于在分布式数据库中,一个节点可能涉及多个日志结构合并树实例,例如,每个分区都使用一个LSM实例,进而就导致在分区分裂的过程中可能会出现数据写错分区,重做日志写错分区的情况。
需要说明的是,本申请中提供的数据库分区的方法是应用于分布式数据库使用日志结构合并树作为存储引擎的情况下的,其中,LSM是数据库中保存数据的一种数据结构,在分布式数据库读写数据时,可以将对数据的增删改查(增加、删除、修改、查询)操作记录,保存在记忆表MemTable中,当Memtable保存的操作记录达到一定量后,可以将该Memtable压缩为一种用于在磁盘中保存数据的数据结构,即,排序字符串表(Sorted String Table,SST)从而完成持久化存储数据,这样就大大提高的数据库的写性能。
上述内容中,记忆表MemTable是LSM的内存组件,是在内存中的一种数据结构,另外,由于内存并不是可靠的存储,在设备故障时会丢失,因此还需要通过预写式日志(Write-ahead logging,WAL)来保证数据的可靠性。
需要说明的是,在分布式数据库中,一个分区对应有多个节点,一个节点即为一个存储有数据库的部分数据的设备,例如:服务器、终端设备等,其中,能够读取和写入该分区的数据的节点,即为主节点,保存有分区的副本的节点,即为从节点,从节点是只能读取该分区的数据的节点,在主节点出现故障后,从节点可以作为主节点使用。
基于此,在本申请中,需要进行分裂的目标分区的主节点,可以确定目标分区对应的各分裂点(基于目标分区分裂得到的各新分区的之间的数据范围边界点),从而可以根据确定出的分裂点,生成对目标分区进行分裂的分裂请求,目标分区的每个从节点在获取到对数据库中包含的目标分区进行分裂的分裂请求后,可以根据该从节点的磁盘信息(例如:磁盘容量是否充足、磁盘是否损坏等),判断是否可以针对目标分区进行分裂,并返回该从节点是否可以进行分裂的应答消息,进而可以根据每个节点返回的应答信息,确定可以对目标分区进行分裂的节点占各节点的比值,并根据比值是否超过预设阈值,确定各节点是否执行对目标分区进行分裂的分裂操作。例如:若可以针对目标分区进行分裂的节点占各节点的比值超过0.5,则确定各节点执行对目标分区进行分裂的分裂操作。
其中,主节点提交分裂请求的方式可以有很多,例如:将主节点确定出的分裂点,作为分裂日志的内容提交,相应的,各节点在读取到分裂日志中的记录的分裂点时,即视为获取到对数据库的目标分区进行分裂的分裂请求。
需要说明的是,确定哪些数据分区是需要进行分裂的目标分区的方法可以有很多,例如:可以是根据开发人员通过业务平台提供的客户端发送的操作指令确定的目标分区,也可以是业务平台根据采集到的各数据分区的访问次数确定的目标分区,还可以是各数据分区中保存的数据量确定的目标分区。
在本申请中,用于实现数据库分区的方法的执行主体,可以是指服务器等设置分布式数据库的节点中的指定设备,也可以是指诸如台式电脑、笔记本电脑等指定设备,为了便于描述,下面仅以服务器是执行主体为例,对本申请提供的数据库分区的方法进行说明。
上述内容中,设置于分布式数据库各节点的服务器在获取到对数据库的目标分区进行分裂的分裂请求后,可以通过执行以下步骤,来针对目标分区或目标分区的副本进行目标分区的分裂操作。
S102:响应于所述分裂请求,创建共用所述目标分区对应的日志结构合并树LSM实例的各逻辑分区。
在本申请中,为了避免在目标分区分裂过程中,出现数据或重做日志写错分区等情况的出现,服务器可以响应于分裂请求,创建共用目标分区的日志结构合并树LSM实例的各逻辑分区,其中,这里的逻辑分区是指根据预先确定的分裂点,将目标分区所包含的数据范围,在逻辑上进行分裂后得到的各逻辑分区。
进一步地,在分布式数据库中,一个数据分区对应有一个主节点和多个从节点,从节点中保存有该数据分区的副本文件,以使从节点能够在主节点出现故障后,顶替主节点继续完成分区数据的读写任务,这就要求,从节点对应的副本文件中的数据需要与主节点对应的数据分区的数据保持一致,而为了使主节点中的数据分区和从节点中的数据分区的副本文件中的数据保持一致,通常会采用回放重做日志的方法。
具体地,重做日志中记载了主节点响应于用户的操作指令,对分区数据进行的增删查改等操作,主节点在每次执行数据的增删查改等操作的同时,会将这次操作记录在重做日志中,从节点可以持续读取重做日志,并按照重做日志,并发执行这些操作,以使从节点对应的分区的副本文件中的数据与主节点对应的分区数据保持一致,这就是回放重做日志。
基于此,为了避免在目标分区分裂过程中,从节点进行回放重做日志,以导致从节点中保存的副本文件中的数据错误,服务器还可以响应于分裂请求,检测服务器所对应的节点中是否存在回放重做日志操作,若是,则针对所述重做日志中包含的每个操作指令,判断该操作指令是否晚于分裂请求执行,若该操作指令是否晚于分裂请求执行,则暂停执行该操作指令,若该操作指令早于分裂请求或与分裂请求同时进行的,则继续回放该操作指令。
进一步地,为了避免在目标分区分裂期间,磁盘文件中的数据出现错误,服务器还可以停止执行用于修改或复制目标分区对应的磁盘文件的操作,其中,停止执行用于修改或复制目标分区对应的磁盘数据的操作可以是诸如:触发新的LSM的合并操作,一致性协议的快照等。
上述内容中的合并操作是指,在LSM为了避免LSM中SST数量的膨胀,通常采用合并SST的方法将各SST中冗余的数据删除。
上述内容中的一致性协议的快照是指,用于复制分区当前的数据状态,以生成新的副本的操作。
需要说明的是,上述内容中的暂停回放重做日志,以及停止执行用于修改或复制目标分区对应的磁盘文件的操作指令,均是在针对目标分区进行实际分裂操作之前暂时停止的,也就是说,在服务器确认目标分区对应的事务全部都被执行完之后,就不再停止回放重做日志,以及不再停止执行用于修改或复制目标分区对应的磁盘文件的操作指令了。
进一步地,服务器可以更新目标分区对应的版本号(可以理解为更新目标分区分裂前后的数据范围)。例如:假设目标分区的数据范围为A到F,目标分区分裂为分区1和分区2,其中,分区1的数据范围为A~C,分区2的数据范围为C~F,则目标分区分裂前对应的版本号就对应着A~F,更新后的版本号就对应着A~C和C~F,这里的A~C和C~F是前开后闭区间。
具体地,服务器可以将确定的目标分区分裂后的各逻辑分区对应的版本号,作为目标版本号,进而在确定目标版本号之后,针对接收到的每个创建事务请求,判断该创建事务请求中包含的版本号是否为目标版本号,若否,则拒绝响应该创建事务请求,以使发送该创建事务请求的设备将该创建事务请求中包含的版本号,更新为目标版本号,并重新发送创建事务请求。
需要说明的是,若是在确定目标版本号之前已经创建但还没有完成执行的事务(可以理解为,还没有结束的事务),可以继续处理。
S103:判断所述目标分区对应的事务是否完成执行。
S104:若是,按照所述LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到所述数据库的各新分区。
在服务器执行完创建各逻辑分区的操作后,可以检查目标分区对应的事务是否全部完成执行了,若是,则可以按照LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到数据库的各新分区,其中,这里的事务包含的各操作指令用于修改目标分区中保存的数据。
需要说明的是,服务器在按照LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改之前,可以提交一条日志信息,其他节点的服务器在获取到该日志信息后,可以根据该节点的事务执行情况,判断是否返回确认信息,进而可以根据返回确认信息的节点的数量占各节点的比值,确定是否按照LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改。
在上述内容中,服务器将与该逻辑分区对应的磁盘文件划分到该逻辑分区中的方法可以是,针对每个逻辑分区,根据该逻辑分区对应的数据范围,判断目标分区对应的LSM实例所包含的各SST文件中,是否存在与该逻辑分区对应的SST文件对应的SST文件,若是,则将与该逻辑分区对应的SST文件划分到该逻辑分区中,以得到数据库的各新分区。
其中,将与该逻辑分区对应的SST文件划分到该逻辑分区中的方式可以是,通过将SST文件对应的元数据为各逻辑分区对应的元数据。
为了进一步地对本申请中提供的数据库分区的方法进行说明,以下结合图2详细说明数据库分区的过程。
图2为本申请中提供的数据库分区的过程的示意图。
在图2中的a阶段中,目标分区保存着A-G这7个变量,当前版本号为版本1,此时目标分区的磁盘文件包括sst-0,sst-1,sst-2,当前存在两个事务,事务一是将变量A的值修改为1,事务二是将变量B的值修改为2,其中,事务一是在目标分区进行分裂之前就已经完成执行的事务,事务二是在目标分区进行分裂之前就已经创建了,但还没有完成执行的事务。
进一步地,服务器开始分裂准备阶段,在此阶段中,服务器在检测服务器所对应的节点中是否存在回放重做日志操作,并停止执行用于修改或复制目标分区对应的磁盘文件的操作之后,创建共用目标分区的日志结构合并树LSM实例的各逻辑分区,并更新版本号,即图2中的b阶段,其中,服务器将版本号修改为版本2,并且,创建了三个逻辑分区,三个逻辑分区的数据范围分别是A-C,C-F,F-G。
服务器在确定与目标分区对应的事务均已完成执行后,开始进行分裂提交阶段,如图2中的c阶段,此时,事务二已经提交,服务器将按照LSM实例的内存组件中保存的操作指令对磁盘文件进行修改,针对每个逻辑分区,创建该逻辑分区对应的内存组件(即,MemTable),以生成该逻辑分区对应的LSM实例,并将与该逻辑分区对应的磁盘文件划分到该逻辑分区中,如图2中的d阶段,在d阶段中,目标分区已经分裂为三个新分区,并且,由于目标分区在分裂过程中执行了事务二,所以在新分区A-C对应的sst-0文件被更新为sst-3。
从上述内容中可以看出,服务器可以在针对目标分区进行分裂时,先进行分裂准备阶段,在此阶段中将目标分区在逻辑上分裂为各逻辑分区,并在确定目标分区对应的事务均已完成执行后,再进入分裂提交阶段,将目标分区对应的LSM实例的内存组件中保存的操作指令写入磁盘中,并创建各逻辑分区对应的LSM实例,从而可以通过这种两阶段分裂的方式,避免在目标分区进行分裂的过程中,出现数据或日志写错分区的情况出现。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家响应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
以上为本申请的一个或多个实施例提供的数据库分区的方法,基于同样的思路,本申请还提供了相应的数据库分区的装置,如图3所示。
图3为本申请提供的一种数据库分区的装置的示意图,包括:
获取模块301,其配置为获取对数据库的目标分区进行分裂的分裂请求;
准备模块302,其配置为响应于分裂请求,创建共用目标分区对应的日志结构合并树LSM实例的各逻辑分区;
判断模块303,其配置为判断目标分区对应的事务是否完成执行;
分裂模块304,其配置为在确定目标分区对应的事务完成执行时,按照LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到数据库的各新分区。
获取模块301,其配置为确定数据库中目标分区的分裂点,分裂点是指基于目标分区分裂得到的各新分区之间的数据范围边界点;根据分裂点,确定目标分区进行分裂的分裂请求。
准备模块302,其配置为针对目标分区对应的各节点,获取该节点针对分裂请求返回的应答信息;根据每个节点返回的应答信息,确定可以对目标分区进行分裂的节点占各节点的比值;根据比值,判断是否针对目标分区进行分裂操作。
准备模块302,其配置为判断是否存在回放重做日志操作;若是,则针对重做日志中包含的每个操作指令,判断该操作指令是否晚于分裂请求执行;若是,则停止执行该操作指令。
准备模块302,其配置为停止执行用于修改或复制目标分区对应的磁盘文件的操作指令。
准备模块302,其配置为确定各逻辑分区对应的版本号,作为目标版本号;若接收到创建事务请求,判断该创建事务请求中包含的版本号是否为目标版本号;若否,则拒绝响应该创建事务请求,以使发送该创建事务请求的设备将该创建事务请求中包含的版本号,更新为目标版本号,并重新发送创建事务请求。
分裂模块304,其配置为针对每个逻辑分区,根据该逻辑分区对应的数据范围,判断目标分区对应的LSM实例所包含的各排序字符串表SST文件中,是否存在与该逻辑分区对应的SST文件;若是,则将与该逻辑分区对应的SST文件,划分到该逻辑分区中。
由于在针对目标分区进行分裂时,通过上述装置可以先将目标分区在逻辑上分裂为各逻辑分区,并在确定目标分区对应的事务全部完成后,再对目标分区进行实际的分裂,进而可以避免在目标分区进行分裂的过程中,出现数据或日志写错分区的情况。
本申请还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种数据库分区的方法。
本申请还提供了图4所示的一种对应于图1的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的数据库分区的方法。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据库分区的方法,其特征在于,包括:
获取对数据库的目标分区进行分裂的分裂请求;
响应于所述分裂请求,创建共用所述目标分区对应的日志结构合并树LSM实例的各逻辑分区;
判断所述目标分区对应的事务是否完成执行;
若是,按照所述LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到所述数据库的各新分区。
2.如权利要求1所述的方法,其特征在于,获取对数据库的目标分区进行分裂的分裂请求,具体包括:
确定所述数据库中目标分区的分裂点,所述分裂点是指基于目标分区分裂得到的各新分区之间的数据范围边界点;
根据所述分裂点,确定所述目标分区进行分裂的分裂请求。
3.如权利要求1所述的方法,其特征在于,创建各逻辑分区之前,所述方法还包括:
针对所述目标分区对应的各节点,获取该节点针对所述分裂请求返回的应答信息;
根据每个节点返回的所述应答信息,确定可以对所述目标分区进行分裂的节点占各节点的比值;
根据所述比值,判断是否针对所述目标分区进行分裂操作。
4.如权利要求1所述的方法,其特征在于,创建共用所述目标分区的日志结构合并树LSM实例的各逻辑分区之前,所述方法还包括:
判断是否存在回放重做日志操作;
若是,则针对所述重做日志中包含的每个操作指令,判断该操作指令是否晚于所述分裂请求执行;
若是,则停止执行该操作指令。
5.如权利要求1所述的方法,其特征在于,创建共用所述目标分区的日志结构合并树LSM实例的各逻辑分区之前,所述方法还包括:
停止执行用于修改或复制所述目标分区对应的磁盘文件的操作指令。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述各逻辑分区对应的版本号,作为目标版本号;
若接收到创建事务请求,判断该创建事务请求中包含的版本号是否为所述目标版本号;
若否,则拒绝响应该创建事务请求,以使发送该创建事务请求的设备将该创建事务请求中包含的版本号,更新为所述目标版本号,并重新发送创建事务请求。
7.如权利要求1所述的方法,其特征在于,将与该逻辑分区对应的磁盘文件划分到该逻辑分区中,具体包括:
针对每个逻辑分区,根据该逻辑分区对应的数据范围,判断所述目标分区对应的LSM实例所包含的各排序字符串表SST文件中,是否存在与该逻辑分区对应的SST文件;
若是,则将与该逻辑分区对应的SST文件,划分到该逻辑分区中。
8.一种数据库分区的装置,其特征在于,包括:
获取模块,其配置为获取对数据库的目标分区进行分裂的分裂请求;
准备模块,其配置为响应于所述分裂请求,创建共用所述目标分区对应的日志结构合并树LSM实例的各逻辑分区;
判断模块,其配置为判断所述目标分区对应的事务是否完成执行;
分裂模块,其配置为若判所述目标分区对应的事务完成执行,按照所述LSM实例的内存组件中保存的事务包含的各操作指令对磁盘文件进行修改,并针对每个逻辑分区,创建该逻辑分区对应的LSM实例,并将与每个逻辑分区对应的磁盘文件划分到各逻辑分区中,以得到所述数据库的各新分区。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
CN202210939685.0A 2022-08-05 2022-08-05 数据库分区的方法、装置、存储介质及电子设备 Pending CN115391337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210939685.0A CN115391337A (zh) 2022-08-05 2022-08-05 数据库分区的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210939685.0A CN115391337A (zh) 2022-08-05 2022-08-05 数据库分区的方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115391337A true CN115391337A (zh) 2022-11-25

Family

ID=84117801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210939685.0A Pending CN115391337A (zh) 2022-08-05 2022-08-05 数据库分区的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115391337A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541407A (zh) * 2023-07-07 2023-08-04 之江实验室 一种数据处理的方法、装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541407A (zh) * 2023-07-07 2023-08-04 之江实验室 一种数据处理的方法、装置、存储介质及电子设备
CN116541407B (zh) * 2023-07-07 2023-10-10 之江实验室 一种数据处理的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
JP3270216B2 (ja) ファイル名検出方式
JP4419884B2 (ja) データ複製装置、方法及びプログラム並びに記憶システム
CN107016016B (zh) 一种数据处理的方法及装置
US10628298B1 (en) Resumable garbage collection
US11630741B2 (en) System and method for backing up data in a load-balanced clustered environment
CN109284066B (zh) 一种数据处理方法、装置、设备及系统
CN111897493B (zh) 存储空间管理方法、装置及电子设备、存储介质
CN111752633A (zh) 代码加载方法、装置及设备
CN111708787A (zh) 多中心业务数据管理系统
US11500738B2 (en) Tagging application resources for snapshot capability-aware discovery
CN110019063B (zh) 计算节点数据容灾回放的方法、终端设备及存储介质
CN115391337A (zh) 数据库分区的方法、装置、存储介质及电子设备
CN111158858A (zh) 一种虚拟机的克隆方法和装置,及计算机可读存储介质
CN110895545B (zh) 共享数据同步方法及装置
CN111399780B (zh) 一种数据的写入方法、装置以及设备
US20210334165A1 (en) Snapshot capability-aware discovery of tagged application resources
CN115658391A (zh) 基于QianBase MPP数据库的WAL机制的备份恢复方法
US7949632B2 (en) Database-rearranging program, database-rearranging method, and database-rearranging apparatus
CN112699129A (zh) 一种数据处理系统、方法及装置
CN111339117B (zh) 数据处理方法、装置及设备
CN114328018A (zh) 快照的创建方法、计算设备及存储介质
CN115114258A (zh) 数据复制方法、装置、电子设备及计算机存储介质
CN112084171A (zh) 基于Cassandra数据库的操作日志写入方法、装置、设备及介质
CN112286572A (zh) 一种业务流程的配置方法及装置
WO2020247455A1 (en) Systems and methods for storage block replication in a hybrid storage environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination