CN103518364A - 分布式存储系统的数据更新方法及服务器 - Google Patents
分布式存储系统的数据更新方法及服务器 Download PDFInfo
- Publication number
- CN103518364A CN103518364A CN201380000766.3A CN201380000766A CN103518364A CN 103518364 A CN103518364 A CN 103518364A CN 201380000766 A CN201380000766 A CN 201380000766A CN 103518364 A CN103518364 A CN 103518364A
- Authority
- CN
- China
- Prior art keywords
- node
- key assignments
- version number
- root node
- father
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 title claims abstract description 340
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000009825 accumulation Methods 0.000 claims description 157
- 239000011248 coating agent Substances 0.000 claims description 101
- 238000000576 coating method Methods 0.000 claims description 101
- 238000012545 processing Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 7
- 238000012986 modification Methods 0.000 abstract description 6
- 230000004048 modification Effects 0.000 abstract description 6
- 230000010076 replication Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 230000002085 persistent effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供分布式键值对Key-Value存储系统的数据更新方法,通过将需要更新的节点、父节点、上级节点、根节点复制至Key-Value存储系统的缓冲层中,并修改需要更新的节点、父节点和上级节点的键值及内容,修改根节点的内容,使得这些节点有别于存储层中原来的节点。本发明方法先将需要更新的节点、父节点、上级节点存储到存储层中,再将根节点存储到键值对系统。由于缓冲层中的需更新的节点先于缓冲层中的根节点存储到存储层,因此,在需更新的节点在存储过程中发生的读操作将无法读取到需更新的节点,从而避免读取到脏数据。本发明还提供了相应的读取索引节点的方法及服务器。
Description
技术领域
本发明涉及数据处理领域,特别是涉及处理索引节点的方法及服务器。
背景技术
随着电子通信技术的发展,电子数据的存储量不断增大,用户对于数据存储系统的容量要求也不断提高。作为具有具备高可用性、高可扩展性以及大容量特点的分布式键值对Key-Value存储系统受到广大用户的欢迎。
分布式键值对Key-Value存储系统是以键值对Key-Value作为数据的组织方式,按照一定的哈希算法,将这些Key-Value分配在海量的节点上的存储系统。对于分布式Key-Value存储系统中的节点数据的处理,可以通过基于分布式Key-Value存储系统之上的分布式简单数据库系统SimpleDB实施查询及增加、修改、删除等操作。在对节点数据实施查询及增加、修改、删除等操作过程中,需要通过分布式索引来查找分布式Key-Value存储系统中的节点数据,该分布式索引是由大量的Key-Value构成,通常呈树状结构,存在一个根节点,对应于分布式索引中的节点上的数据存储在分布式Key-Value系统中。当通过分布式索引进行处理节点数据时,存在同时进行写和读请求的情况,这将导致读取的数据可能是脏数据,而非所要读取的修改前或修改后的数据。
为了避免读取到脏数据,目前主要是采用分布式锁控制并发的方法进行读和写操作。具体的,当实施读请求时,需要获取一个分布式的共享锁,对目标节点加共享锁,使得在读操作时,对该目标节点的写请求被阻塞;当实施写请求时,需要获取一个分布式的排他锁,对目标节点加排他锁,使得在写操作时,对该目标节点的读请求被阻塞。因此,采用分布式锁控制并发的方法进行读和写操作,可以防止节点数据在修改的过程中被读取,确保读取到完整的节点数据。然而,上述方法虽然能够避免读取脏数据,但是并发性差,不能够同时进行读和写操作,这削弱了分布式Key-Value存储系统的可用性。例如,在通过分布式索引进行写操作时,该写操作可能耗时数秒,甚至数分钟,这导致读操作被大幅延迟,严重影响了分布式Key-Value存储系统的可用性。
发明内容
本发明提供了一种分布式键值对Key-Value存储系统的数据更新方法以及相应的服务器。使用本发明方法,不仅可以避免读取到脏数据,而且实现了读写并发。
本发明第一方面提供一种新增索引节点的方法,包括:
所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第一数据更新请求,其中,所述第一数据更新请求包括需要在所述第一存储树中增加第一节点的键值和内容;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
确定所述第一节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
结合第一方面,在第一种可能的实现方式中,所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还包括:
为复制的第一根节点分配新的版本号;
则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明第二方面提供一种分布式键值对Key-Value存储系统的数据更新方法,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;
确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
结合本发明的第二方面,在本发明第二方面的第一种可能的实现方式中,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还包括:
为所述复制的第一根节点分配新的版本号;
则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明第三方面提供一种分布式键值对Key-Value存储系统的数据更新方法,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
结合本发明的第三方面,在本发明第三方面的第一种可能的实现方式中,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合第三方面的第一种可能的实现方式,在第二种可能的实现方式中,复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还包括:
为所述复制的第一根节点分配新的版本号;则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明的第四方面提供一种读索引节点的方法,包括:
读取索引中的根节点;
获取与当前读取的根节点的版本号对应的共享锁;
在获取所述共享锁之后,重新读取所述根节点;
验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
结合第四方面,在第一种可能的方式中,所述读索引节点的方法还包括:若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,返回所述获取与当前读取的根节点的版本号相对应的共享锁的步骤。
本发明第五方面提供一种服务器,包括:
获取单元,用于获取第一数据更新请求,其中,所述第一数据更新请求包括需要在分布式Key-Value存储系统中的存储层中的第一存储树中增加第一节点的键值和内容,所述第一存储树包括第一根节点;
处理单元,用于复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第一节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;以及用于在将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述存储层之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
结合本发明第五方面,在本发明第五方面的第一种可能的实现方式中,所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合本发明第五方面的第二种可能的实现方式,在本发明第五方面的第二种可能的实现方式中,所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明第六方面提供一种服务器,包括:
获取单元,用于获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容;
处理单元,用于复制分布式Key-Value存储系统的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;还用于确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述存储层中之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
结合本发明的第六方面,在本发明第六方面的第一种可能的实现方式中,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合第六方面的第一可能的实现方式,在第二种可能的实现方式中,所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明第七方面提供一种服务器,包括:
获取单元,用于获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点;
处理单元,用于复制分布式Key-Value存储系统中的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中之后,将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
结合本发明的第七方面,在本发明第七方面的第一种可能的实现方式中,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
结合第七方面的第一种可能的实现方式,在第二种可能的实现方式中,所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
本发明的第八方面提供一种服务器,包括:
第一读取单元,用于读取索引中的根节点;
获取单元,用于获取与当前读取的根节点的版本号对应的共享锁;
第二读取单元,用于在获取所述共享锁之后,重新读取所述根节点;
验证单元,用于验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
读操作单元,用于在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Va1ue系统的存储层中读取所述根节点下的目标节点的操作。
结合第八方面,在第一可能的方式中,所述验证单元还用于若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,使得所述获取单元获取与当前读取的根节点的版本号相对应的共享锁。
本发明的第九方面提供一种服务器,包括处理器、存储器、总线和通信接口;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,当所述服务器运行时,所述处理器执行所述存储器存储的所述计算机执行指令,并通过所述通信接口与所述服务器部的设备进行通信,以使所述服务器执行如上第一方面、第二方面、第三方面及各种可能方式所述的分布式键值对Key-Value存储系统的数据更新方法。
本发明的第十方面提供一种计算机可读介质,包括计算机执行指令,以供计算机的处理器执行所述计算机执行指令时,所述计算机执行如上第一方面、第二方面、第三方面及各种可能方式所述的分布式键值对Key-Value存储系统的数据更新方法。
在本发明第一方面提供的一种分布式键值对Key-Value存储系统的数据更新方法中,在缓冲层中的第一根节点存储到所述存储层之前,所述Key-Value系统的存储层中没有能够用于查找所述第一节点的根节点,无法读取到所述Key-Value系统中的所述第一节点。当缓冲层中的第一根节点存储到所述存储层之后,所述第一节点也已经存储到所述存储层中,此时所述第一节点的数据已经确定,从而避免从所述第一节点中读取到脏数据。
在本发明第二方面提供的一种分布式键值对Key-Value存储系统的数据更新方法中,在Key-Value存储系统的缓冲层中的根节点存储到存储层前,只能够根据存储层中的根节点,查找到未更新的第二节点,而不能在存储层中读取到更新后的第二节点的数据。在所述缓冲层中的根节点存储到所述存储层后,由于更新后的第二节点也已经存储到所述存储层,而且可以根据新存储的根节点查找到更新后的第二节点,从而避免从所述第二节点中读取到脏数据。因此,在所述缓冲层中的第一根节点存储到所述存储层之前,以及在将第二节点存储到所述存储层的过程中,可以进行读操作,该读操作可以读取到存储于所述存储层中的未更新的第二节点,而不会读取到脏数据。
在本发明第三方面提供的一种分布式键值对Key-Value存储系统的数据更新方法中,在将缓冲层的第一根节点存储到所述存储层之前,可以根据存储层中的第一根节点查找到所述存储层中的第三节点,可以对其进行读操作,而且可以读取到完整的第三节点的数据,从而实现节点删除和读操作的并发,同时又避免读取到脏数据。当缓冲层的第一根节点存储到所述存储层之后,则无法根据新存储到所述存储层中的第一根节点查找到第三节点。
在本发明提供的读索引节点的方法中,当获取的与当前读取的共享锁对应的版本号与重新读取后的根节点的版本号一致,则说明根节点未改变,可以对该根节点下的目标节点加所述共享锁,再执行读操作。当获取的共享锁对应的版本号与重新读取后的根节点的版本号不一致,则说明在获取到共享锁后,根节点的版本号有所改变,该获取的共享锁失效,需要重新获取与该重新读取后的根节点的版本号对应的共享锁。因此,应用本发明提供的读索引节点的方法可以确保验证通过的共享锁能够对目标节点成功加锁。
附图说明
图1是一种海量存储的系统架构示意图;
图2是本发明实施例1提供的一种分布式键值对Key-Value存储系统的数据更新方法的流程示意图;
图3是本发明实施例1提供的节点分布示意图;
图4是本发明实施例2提供的一种分布式键值对Key-Value存储系统的数据更新方法的流程示意图;
图5是本发明实施例2提供的节点分布示意图;
图6是本发明实施例3提供的一种分布式键值对Key-Value存储系统的数据更新方法的流程示意图;
图7是本发明实施例3提供的节点分布示意图;
图8是本发明实施例4提供的读取索引节点的方法的流程示意图;
图9是本发明实施例5提供的一种服务器结构框图;
图10是本发明实施例6提供的一种服务器结构框图;
图11是本发明实施例7提供的一种服务器结构框图;
图12是本发明实施例8提供的一种服务器结构框图;
图13是本发明提供的一种服务器的总线连接结构示意图;
图14是本发明提供的又一种服务器的总线连接结构示意图。
具体实施方式
本发明实施例提供了一种分布式键值对Key-Value存储系统的数据更新方法。以下先介绍本发明实施例可以应用的场景。如图1所示。图1展示了可以实施本发明实施例的系统架构,该系统架构包括简单数据库SDB的客户端101、网络层Web layer102、缓冲层Cache layer103和存储层Store layer104,其中,存储层104为Key-Value存储系统,缓冲层103主要提供许可服务LC(License Client)Server。在本发明实施例中,对分布式索引的操作(如新增索引节点、修改索引节点等)是在缓冲层执行,将需要存储的节点数据持久化存储于存储层中。以下对本发明实施例进行详细介绍。
如图2所示,实施例1提供了一种分布式键值对Key-Value存储系统的数据更新方法,本实施例以增加索引节点为例,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
201、获取第一数据更新请求,其中,所述第一数据更新请求包括需要在所述第一存储树中增加第一节点的键值和内容。
202、复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中。
203、确定所述第一节点在所述第一存储树中的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向。其中,所述父节点的新键值与所述父节点的原始键值不同。
在所述缓冲层中,对所述第一存储树中的父节点的键值和内容进行修改,使得修改后的父节点的新键值不同于原始键值,而且其内容增加了对所述第一节点的指向。
204、依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向。其中,所述每个上级节点的新键值与其对应的原始键值不同。
在本步骤中,在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向包括了最接近所述父节点的上级节点的内容中也增加了对分配了新键值的父节点的指向。
205、在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向。其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点。
例如,可以将所述第一根节点的内容中的对分配新键值前的所述上级节点的第一级节点的指向修改为对分配新键值后的所述上级节点的第一级节点的指向。
206、将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中。
此时,由于缓冲层中的第一根节点还未存储到存储层中,而存储层中原有的第一根节点、父节点和上级节点的内容中并没有对第一节点的指向,因此,若在所述第一节点在存储过程中发生读操作,根据存储层中的第一根节点将无法查找到第一节点,自然不会读到第一节点的脏数据。
207、将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
当缓冲层中的第一根节点存储到存储层后,第一节点已经完成存储,此时若发生读操作,则可以根据新存储到存储层中的第一根节点读取到完整的第一节点的数据。
如图3所示,左侧的节点301、302和306组成持久存储在存储层的第一存储树,R表示第一根节点301,B表示第一父节点302,需要在第一父节点302下增加新的叶子节点。右侧的存储树表示在缓冲层新建的第二存储树,R1表示第二根节点303,B1表示第二父节点304,A表示新增的叶子节点305,这里的第二根节点303根据第一根节点R复制得到,保证其键值不变,但内容有所修改,即增加对第二父节点304的指向,第二父节点304根据第一父节点302复制得到,并为第二父节点304分配了新键值,该新的键值与第二父节点304的原始键值不同,第二父节点304的内容需要进行修改,以增加对新叶子节点305的指向,新增的叶子节点305即为第一节点。
在所述第二存储树建立之后,将所述第二存储树持久化存储到分布式Key-Value存储系统中的存储层,即先将第二父节点304和新增的叶子节点305存储到所述分布式Key-Value存储系统中的存储层中,再将第二根节点303存储到所述分布式Key-Value存储系统中的存储层中。
在第二根节点存储到所述Key-Value系统的存储层之后,由于所述第二根节点与第一根节点键值相同,所述第一根节点将被第二根节点覆盖,在所述存储层中,所述第一存储树将被更新,新增的叶子节点305被存储到存储层中,即完成数据更新。
在所述第二根节点303存储到所述存储层之前,由于所述Key-Value系统还不存在第二根节点303,而所述Key-Value系统中的第一根节点301的指向和内容都不会有改变,此时进行数据查询,读操作不可能读取到相关正在更新的叶子节点的脏数据。第二根节点303在第二父节点304和新增的叶子节点305之后才存储到存储层中,这样即使新增的所述叶子节点305已经存储到所述存储层中,仍然不能在所述存储层中读取到所述叶子节点305。由此可见,在所述叶子节点305新增过程中,读操作不能够读取到所述叶子节点305的脏数据。当所述叶子节点305相关的第二存储树完全建立完毕之后,才把所述第二根节点303存储到所述存储层,这样,由于第二根节点303覆盖了第一根节点301,第二根节点303指向的是第二父节点304,因此,能够根据索引查找到所述第二父节点304,并根据第二父节点304查询到新增的叶子节点305,保证了数据的唯一性并避免读取到脏数据。同时,本发明实施例的存储方法保证读写数据可以同时进行,提高了系统的处理效率。
在上述实施例1提供的方法中,所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值,以避免与所述第一存储树中的节点的键值重复。
在上述实施例1提供的方法中,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还可以包括:
为复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
例如,所述第一存储树中的第一根节点的原分配的版本号为第一版本号,复制的第一根节点分配的新的版本号为第二版本号,所述第一版本号与所述第二版本号不同,所述第二版本号可以大于或小于所述第一版本号。如所述第一版本号为*****v1,所述第二版本号为*****v2。需要说明的是,上述新增索引节点的方法中的版本号并不局限于某一种形式,例如,所述第一版本号为*****vA,所述第二版本号为*****vB。
由于可能需要在一个父节点下多次增加叶子节点,为了避免版本号重复,优选的,所述第二版本号比所述第一版本号大1。即在原版本号的基础上加1,使得版本号数量不受限制且不重复。
上述键值+版本号的分配方法,可以保证键值在分布式存储系统中的唯一性。
如图4所示,本发明实施例2提供了一种分布式键值对Key-Value存储系统的数据更新方法,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
401、获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容。
402、复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中。
403、复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容。其中,所述第二节点的新键值与所述第二节点的原始键值不同。
404、确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向。其中,所述父节点的新键值与所述父节点的原始键值不同。
405、依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向。其中,所述每个上级节点的新键值与其对应的原始键值不同。
在本步骤中,在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向包括了最接近所述父节点的上级节点的内容中也增加了对分配了新键值的父节点的指向。
406、在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点。
例如,将所述第一根节点的内容中的对分配新键值前的所述上级节点的第一级节点的指向修改为对分配新键值后的所述上级节点的第一级节点的指向。
407、将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中。
此时,由于缓冲层中的第一根节点还未存储到存储层中,而存储层中原有的第一根节点、父节点和上级节点的内容中并没有对更新后的第二节点的指向,因此,若在更新后的第二节点存储过程中发生读操作,根据存储层中的第一根节点将无法查找到第一节点,自然不会读到第二节点的脏数据。
408、将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
当缓冲层中的第一根节点存储到存储层后,更新后的第二节点已经完成存储,此时若发生读操作,则可以根据新存储到存储层中的第一根节点读取到完整的更新后的第二节点的数据。
如图5所示,左侧的节点501、502、506和507组成持久存储在存储层的第一存储树,R表示第一根节点501,B表示第一父节点502,A表示第一叶子节点506,需要修改第一叶子节点。右侧的存储树表示在缓冲层新建的第二存储树,R1表示第二根节点503,B1表示第二父节点504,A1表示第二叶子节点505。这里的第二根节点503根据第一根节点R复制得到,保证其键值不变,但内容有所修改,即增加对第二父节点504的指向,第二父节点504根据第一父节点502复制得到,并为第二父节点504分配了新键值,该新的键值与第二父节点504的原始键值不同,第二父节点504的内容需要进行修改,以增加对第二叶子节点505的指向。第二叶子节点505根据第一叶子节点506复制得到,并为第二叶子节点505分配了新键值,该新的键值与第二叶子节点505的原始键值不同,以及将第二叶子节点505的原始内容更新为第二叶子节点505的新内容。
在所述第二存储树建立之后,将所述第二存储树持久化存储到分布式Key-Value存储系统中的存储层,其中,先将第二父节点504和第二叶子节点505存储到所述分布式Key-Value存储系统中的存储层中,再将第二根节点503存储到所述分布式Key-Value存储系统中的存储层中。
在第二根节点503存储到所述Key-Value系统的存储层之后,由于所述第二根节点503与第一根节点501键值相同,所述第一根节点501将被第二根节点503覆盖,在所述存储层中,所述第一存储树将被更新,第二叶子节点505被存储到存储层中,即完成数据更新。
在所述第二根节点503存储到所述存储层之前,由于所述Key-Value系统还不存在第二根节点503,而所述Key-Value系统中的第一根节点501的指向和内容都不会有改变,此时进行数据查询,读操作不可能读取到相关正在更新的叶子节点的脏数据。第二根节点503在第二父节点504和第二叶子节点505之后才存储到存储层中,这样即使所述第二叶子节点505已经存储到所述存储层中,仍然不能根据第一存储树在所述存储层中读取到第二叶子节点505。由此可见,在叶子节点的更新过程中,读操作不能够读取到所需更新的叶子节点的脏数据。当第二叶子节点505相关的第二存储树完全建立完毕之后,才把所述第二根节点503存储到所述存储层,这样,由于第二根节点503覆盖了第一根节点501,第二根节点503指向的是第二父节点504,因此,能够根据索引查找到所述第二父节点504,并根据第二父节点504查询到第二叶子节点505,保证了数据的唯一性并避免读取到脏数据。同时,本发明实施例的存储方法保证读写数据可以同时进行,提高了系统的处理效率。
在上述实施例2提供的方法中,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值,以避免与所述第一存储树中的节点的键值重复。
在上述实施例2提供的方法中,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还可以包括:
为所述复制的第一根节点分配新的版本号,则所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
例如,所述第一存储树中的第一根节点的原分配的版本号为第一版本号,复制的第一根节点分配的新的版本号为第二版本号。所述第一版本号与所述第二版本号不同,所述第二版本号可以大于或小于所述第一版本号。如所述第一版本号为*****v1,所述第二版本号为*****v2。需要说明的是,上述方法中的版本号并不局限于某一种形式,例如,所述第一版本号为*****vA,所述第二版本号为*****vB。
由于可能需要在一个父节点下多次修改叶子节点,为了避免版本号重复,优选的,所述第二版本号比所述第一版本号大1。即在原版本号的基础上加1,使得版本号数量不受限制且不重复。
上述键值+版本号的分配方法,可以保证键值在分布式存储系统中的唯一性。
在实施例2提供的方法中,当将所述第二节点的键值中的第一版本号修改为不同于所述第一版本号的第二版本号时,为了删除冗余数据,在将所述第二根节点存储到所述Key-Value系统的存储层中之后,读取所述第一版本号;申请与所述第一版本号对应的排他锁;在申请到所述排他锁之后,对所述第一版本号加排他锁;在对所述第一版本号加排他锁之后,从所述Key-Value系统的存储层中删除所述第一存储树中原有的第二节点、父节点、上级节点和第一根节点。由于原有的第二节点、父节点、上级节点和第一根节点的键值中都包含有所述第一版本号,因此,在对所述第一版本号加排他锁后,就不能对上述这些节点进行读操作,从而可以将它们删除。
如图6所示,本发明实施例3提供了一种分布式键值对Key-Value存储系统的数据更新方法,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
601、获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点。
602、复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中。
603、确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向。其中,所述父节点的新键值与所述父节点的原始键值不同。
604、依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向。其中,所述每个上级节点的新键值与其对应的原始键值不同。
在本步骤中,在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向包括了最接近所述父节点的上级节点的内容中也增加了对分配了新键值的父节点的指向。
605、在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点。
例如,可以将所述第一根节点的内容中的对分配新键值前的所述上级节点的第一级节点的指向修改为对分配新键值后的所述上级节点的第一级节点的指向。
606、将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中。
此时,由于缓冲层中的第一根节点还未存储到存储层中,而存储层中原有的第三节点仍然存在,因此,若在缓冲层中的第一根节点存储到存储层之前发生读操作,根据存储层中的第一根节点将读到原有的第三节点的完整数据。
607、将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
当缓冲层中的第一根节点存储到存储层后,根据新存储到存储层中的第一根节点将无法查找到第三节点,自然无法读取到第三节点的数据。
如图7所示,左侧的节点701、702、705和706组成持久存储在存储层的第一存储树,R表示第一根节点701,B表示第一父节点702,A表示需删除的叶子节点705。右侧的存储树表示在缓冲层新建的第二存储树,R1表示第二根节点703,B1表示第二父节点704。这里的第二根节点703根据第一根节点R复制得到,保证其键值不变,但内容有所修改,即增加对第二父节点704的指向,第二父节点704根据第一父节点702复制得到,并为第二父节点704分配了新键值,该新的键值与第二父节点304的原始键值不同,删除第二父节点704的内容中对需删除的所述叶子节点705的指向。
在所述第二存储树建立之后,将所述第二存储树持久化存储到分布式Key-Value存储系统中的存储层,即先将第二父节点704存储到所述分布式Key-Value存储系统中的存储层中,再将第二根节点703存储到所述分布式Key-Value存储系统中的存储层中。
在第二根节点存储到所述Key-Value系统的存储层之后,由于所述第二根节点与第一根节点键值相同,所述第一根节点将被第二根节点覆盖,在所述存储层中,所述第一存储树将被更新,第二存储树中将不再包含所述叶子节点705,即完成数据更新。
在所述第二根节点703存储到所述存储层之前,由于所述Key-Value系统还不存在第二根节点703,而所述Key-Value系统中的第一根节点701的指向和内容都不会有改变,此时进行数据查询,读操作不可能读取到相关正在更新的叶子节点的脏数据。第二根节点703在第二父节点704之后才存储到存储层中,这样即使第二父节点704已经存储到所述存储层中,仍然不能在所述存储层中读取到所述叶子节点705。由此可见,在删除所述叶子节点705的过程中,读操作不能够读取到所述叶子节点705的脏数据。当所述第二存储树完全建立完毕之后,才把所述第二根节点703存储到所述存储层,这样,由于第二根节点703覆盖了第一根节点701,第二根节点703指向的是第二父节点704,但第二父节点704并不指向所述叶子节点705,不能够根据第二父节点704查询到所述叶子节点705,保证了数据的唯一性并避免读取到脏数据。同时,本发明实施例的存储方法保证读写数据可以同时进行,提高了系统的处理效率。
在上述实施例3提供的方法中,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值,以避免与所述第一存储树中的节点的键值重复。
在上述实施例3提供的方法中,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,所述方法还可以包括:
为所述复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
例如,所述第一存储树中的第一根节点的原分配的版本号为第一版本号,复制的第一根节点分配的新的版本号为第二版本号,所述第一版本号与所述第二版本号不同,所述第二版本号可以大于或小于所述第一版本号。如所述第一版本号为*****vl,所述第二版本号为*****v2。需要说明的是,上述方法中的版本号并不局限于某一种形式,例如,所述第一版本号为*****vA,所述第二版本号为*****vB。
由于可能需要在一个父节点下删除多个叶子节点,为了避免版本号重复,优选的,所述第二版本号比所述第一版本号大1。即在原版本号的基础上加1,使得版本号数量不受限制且不重复。
上述键值+版本号的分配方法,可以保证键值在分布式存储系统中的唯一性。
在实施例3提供的方法中,当将所述第一父节点的键值中的第一版本号修改为不同于所述第一版本号的第二版本号,为了删除冗余数据,在将所述第二根节点持久化存储到所述Key-Value系统中的存储层之后,读取所述第一版本号;申请与所述第一版本号对应的排他锁;在申请到所述排他锁之后,对所述第一版本号加排他锁;在对所述第一版本号加排他锁之后,从所述Key-Value系统中的存储层中删除所述第一存储树中原有的第三节点、父节点、上级节点和第一根节点。由于原有的第三节点、父节点、上级节点和第一根节点都包含有所述第一版本号,因此,在对所述第一版本号加排他锁后,就不能对上述这些节点进行读操作,从而可以将它们删除。
为了在实施上述新增、修改、删除索引节点过程中进行读操作,如图8所示,实施例4提供了一种读索引节点的方法,包括:
801、读取索引中的根节点。
802、获取与当前读取的根节点的版本号对应的共享锁。
803、在获取所述共享锁之后,重新读取所述根节点。
804、验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致。
若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则执行步骤805:对所述重新读取后的根节点加所述共享锁。
若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,返回所述获取与当前读取的根节点的版本号相对应的共享锁的步骤,即返回步骤802。
806、在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
由于获取所述共享锁需要一定等待时间,在这段等待时间中,所述根节点有可能发生修改,其版本号可能发生变化,因此,在获取所述共享锁之后,还需要验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若一致,则表明根节点未发生改变,该所述共享锁有效,可以对其加所述共享锁。在对所述根节点加共享锁后,可以避免在读操作过程中,所述根节点下的目标节点中的数据被删除。若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则表明所述根节点发生变化,所述共享锁对所述根节点失效,此时,需要重新获取与所述根节点的版本号对应的共享锁,重新进行验证。
在获取与所述根节点的版本号对应的共享锁时,获取所述共享锁的请求采用立即超时的方式,即当第一时间获取不到所述共享锁时,立即抛出超时异常。
本发明实施例还提供了应用上述方法的服务器,该服务器可以为简单数据库Simple DB服务器。
对应于实施例1中的一种分布式键值对Key-Value存储系统的数据更新方法,如图9所示,实施例5提供了一种服务器,其包括:
获取单元901,用于获取第一数据更新请求,其中,所述第一数据更新请求包括需要在分布式Key-Value存储系统中的存储层中的第一存储树中增加第一节点的键值和内容,所述第一存储树包括第一根节点;
处理单元902,用于复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第一节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元903,用于将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;以及用于在将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述存储层之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
在实施例5提供的服务器中,所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理单元902还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例2中的一种分布式键值对Key-Value存储系统的数据更新方法,如图10所示,实施例6提供了一种服务器,其包括:
获取单元1001,用于获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容;
处理单元1002,用于复制分布式Key-Value存储系统的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;还用于确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元1003,用于将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述存储层中之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
在实施例6提供的服务器中,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例3中的一种分布式键值对Key-Value存储系统的数据更新方法,如图11所示,实施例7提供了一种服务器,其包括:
获取单元1101,用于获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点;
处理单元1102,用于复制分布式Key-Value存储系统中的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元1103,用于将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中之后,将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
在实施例7提供的服务器中,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例4中的读取索引节点的方法,如图12所示,实施例8提供了一种服务器,其包括:
第一读取单元1201,用于读取索引中的根节点;
获取单元1202,用于获取与当前读取的根节点的版本号对应的共享锁;
第二读取单元1203,用于在获取所述共享锁之后,重新读取所述根节点;
验证单元1204,用于验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
读操作单元1205,用于在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
所述验证单元1204还用于若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,使得所述获取单元获取与当前读取的根节点的版本号相对应的共享锁。
对应于实施例1中的一种分布式键值对Key-Value存储系统的数据更新方法,如图13所示,实施例9提供了一种服务器,其包括:输入装置1301、输出装置1302、缓冲存储器1303和处理器1304(该服务器中的处理器1304的数量可以为一个或者多个,图13以一个处理器为例)。本实施例中输入装置1301、输出装置1302、缓冲存储器1303和处理器1304可以通过总线或其他方式连接,其中,图13以总线连接方式为例。
在本实施例中,所述输入装置1301用于获取第一数据更新请求,其中,所述第一数据更新请求包括需要在分布式Key-Value存储系统中的存储层中的第一存储树中增加第一节点的键值和内容,所述第一存储树包括第一根节点;
所述处理器1304用于执行如下步骤:用于复制所述第一根节点到所述缓冲存储器1303中;还用于确定所述第一节点的父节点,复制所述父节点到所述缓冲存储器1303中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述缓冲存储器1303中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;还用于将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;以及用于在将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述存储层之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
在实施例9提供的服务器中,所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理器还用于在复制所述第一根节点到所述缓冲存储器1303之后,为复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例2中的一种分布式键值对Key-Value存储系统的数据更新方法,如图13所示,实施例10提供了一种服务器,其包括:其包括:输入装置1301、输出装置1302、缓冲存储器1303和处理器1304(该服务器中的处理器1304的数量可以为一个或者多个,图13以一个处理器为例)。本实施例中输入装置1301、输出装置1302、缓冲存储器1303和处理器1304可以通过总线或其他方式连接,其中,图13以总线连接方式为例。
在本实施例中,所述输入装置1301用于获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容。
所述处理器1304用于执行如下步骤:用于复制分布式Key-Value存储系统的存储层中的第一存储树中的第一根节点到所述缓冲存储器1303中;还用于复制所述第二节点的原始键值和原始内容到所述缓冲存储器1303中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;还用于确定所述第二节点的父节点,复制所述父节点到所述缓冲存储器1303中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述缓冲存储器1303中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;还用于将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述存储层中之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
在实施例10提供的服务器中,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理器1304还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例3中的一种分布式键值对Key-Value存储系统的数据更新方法,如图13所示,实施例11提供了一种服务器,其包括:其包括:输入装置1301、输出装置1302、缓冲存储器1303和处理器1304(该服务器中的处理器1304的数量可以为一个或者多个,图13以一个处理器为例)。本实施例中输入装置1301、输出装置1302、缓冲存储器1303和处理器1304可以通过总线或其他方式连接,其中,图13以总线连接方式为例。
在本实施例中,所述输入装置1301用于获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点。
所述处理器1304用于执行如下步骤:用于复制分布式Key-Value存储系统中的存储层中的第一存储树中的第一根节点到所述缓冲存储器1303中;还用于确定所述第三节点的父节点,复制所述父节点到所述缓冲存储器1303中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述缓冲存储器1303中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;还用于将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中之后,将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
在实施例11提供的一种服务器中,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
优选的,所述处理器1304还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
对应于实施例4中的读取索引节点的方法,如图13所示,实施例12提供了一种服务器,其包括:其包括:输入装置1301、输出装置1302、缓冲存储器1303和处理器1304(该服务器中的处理器1304的数量可以为一个或者多个,图13以一个处理器为例)。本实施例中输入装置1301、输出装置1302、缓冲存储器1303和处理器1304可以通过总线或其他方式连接,其中,图13以总线连接方式为例。
在本实施例中,所述处理器1304用于执行如下步骤:读取索引中的根节点到所述缓冲存储器1303;
获取与当前读取的根节点的版本号对应的共享锁;
在获取所述共享锁之后,重新读取所述根节点;
验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
优选的,所述处理器1304还用于执行:若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,返回所述获取与当前读取的根节点的版本号相对应的共享锁的步骤。
图14为本发明的服务器的又一实施例的结构组成示意图。如图14可知,具体实现中,本发明实施例的服务器1405还可由处理器1401、存储器1402、总线1403和通信接口1404等物理模块构成,其中,所述存储器1402用于存储计算机执行指令,所述处理器1401与所述存储器1402通过所述总线连接,当所述服务器1405运行时,所述处理器1401执行所述存储器1402存储的所述计算机执行指令,并通过所述通信接口1404与所述集群管理设备外部的设备进行通信,以使所述服务器执行本发明各实施例所述的数据更新方法。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,给程序执行时可包括本发明提供的基于虚拟组网的交换机配置方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上对本发明实施例所提供的一种分布式键值对Key-Value存储系统的数据更新方法、一种读取索引节点的方法,以及相应的服务器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (24)
1.一种分布式键值对Key-Value存储系统的数据更新方法,其特征在于,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第一数据更新请求,其中,所述第一数据更新请求包括需要在所述第一存储树中增加第一节点的键值和内容;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
确定所述第一节点在所述第一存储树中的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
2.如权利要求1所述的方法,其特征在于,所述父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
3.如权利要求2所述的方法,其特征在于,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,还包括:
为复制的第一根节点分配新的版本号;
则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
4.一种分布式键值对Key-Value存储系统的数据更新方法,其特征在于,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;
确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
5.如权利要求4所述的方法,其特征在于,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
6.如权利要求5所述的方法,其特征在于,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,还包括:
为所述复制的第一根节点分配新的版本号;
则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
7.一种分布式键值对Key-Value存储系统的数据更新方法,其特征在于,所述分布式Key-Value存储系统中的存储层包括第一存储树,所述第一存储树包括第一根节点,所述方法包括:
获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点;
复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;
确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;
依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;
在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;
将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
8.如权利要求7所述的方法,其特征在于,所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
9.如权利要求8所述的方法,其特征在于,在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,还包括:
为所述复制的第一根节点分配新的版本号;
则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
10.一种读索引节点的方法,其特征在于,包括:
读取索引中的根节点;
获取与当前读取的根节点的版本号对应的共享锁;
在获取所述共享锁之后,重新读取所述根节点;
验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
11.根据权利要求10所述的读索引节点的方法,其特征在于,还包括:若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,返回所述获取与当前读取的根节点的版本号相对应的共享锁的步骤。
12.一种服务器,其特征在于,包括:
获取单元,用于获取第一数据更新请求,其中,所述第一数据更新请求包括需要在分布式Key-Value存储系统中的存储层中的第一存储树中增加第一节点的键值和内容,所述第一存储树包括第一根节点;
处理单元,用于复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第一节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,在所述父节点的内容中增加对所述第一节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中,所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;以及用于在将所述第一节点、所述第一节点的父节点以及所述父节点的上级节点存储到所述存储层之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
13.根据权利要求12所述的服务器,其特征在于,
所述父节点新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
14.根据权利要求13所述的服务器,其特征在于,
所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为复制的第一根节点分配新的版本号,则所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
15.一种服务器,其特征在于,包括:
获取单元,用于获取第二数据更新请求,其中,所述第二数据更新请求包括需要更新的第二节点的新内容;
处理单元,用于复制分布式Key-Value存储系统的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于复制所述第二节点的原始键值和原始内容到所述分布式Key-Value存储系统的缓冲层中,为所述第二节点分配新的键值,并将所述第二节点的原始内容更新为所述第二节点的新内容,其中,所述第二节点的新键值与所述第二节点的原始键值不同;还用于确定所述第二节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,将所述父节点的内容中对具有原始键值的第二节点的指向修改为具有新键值的第二节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第二节点、所述第二节点的父节点以及所述父节点的上级节点存储到所述存储层中之后,将所述第一根节点存储到所述存储层中的所述第一存储树中。
16.根据权利要求15所述的服务器,其特征在于,所述第二节点的新键值、父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
17.根据权利要求16所述的服务器,其特征在于,
所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述第二节点的新键值为将所述第二节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
18.一种服务器,其特征在于,包括:
获取单元,用于获取第三数据更新请求,其中,所述第三数据更新请求包括需要删除的第三节点;
处理单元,用于复制分布式Key-Value存储系统中的存储层中的第一存储树中的第一根节点到所述分布式Key-Value存储系统的缓冲层中;还用于确定所述第三节点的父节点,复制所述父节点到所述分布式Key-Value存储系统的缓冲层中,为所述父节点分配新键值,删除所述父节点的内容中对所述第三节点的指向,其中,所述父节点的新键值与所述父节点的原始键值不同;还用于依次复制所述父节点到所述第一根节点的分支上的其它上级节点到所述分布式Key-Value存储系统的缓冲层中,直到到达所述根节点,并为每个上级节点分配新键值,以及在所述每个上级节点的内容中分别增加对分配新键值的下一级节点的指向,其中,所述每个上级节点的新键值与其对应的原始键值不同;还用于在所述第一根节点的内容中增加对所述上级节点的第一级节点的指向,其中所述第一级节点为所述父节点到所述第一根节点的分支上距离所述根节点最近的节点;
存储单元,用于将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层中;还用于在将所述第三节点的父节点以及所述父节点的上级节点存储到所述分布式Key-Value存储系统中的存储层之后,将所述第一根节点存储到所述分布式Key-Value存储系统中的存储层中的所述第一存储树中。
19.根据权利要求18所述的服务器,其特征在于,
所述第三节点的父节点的新键值和每个所述上级节点的新键值都是所述第一存储树中的唯一键值。
20.根据权利要求19所述的服务器,其特征在于,
所述处理单元还用于在复制所述第一根节点到所述分布式Key-Value存储系统的缓冲层中之后,为所述复制的第一根节点分配新的版本号;则,所述父节点的新的键值为将所述父节点的原始键值中的版本号更换为所述新的版本号后得到的键值,所述每个上级节点的新的键值为将所述每个上级节点对应的原始键值中的版本号更换为所述新的版本号后得到的键值。
21.一种服务器,其特征在于,包括:
第一读取单元,用于读取索引中的根节点;
获取单元,用于获取与当前读取的根节点的版本号对应的共享锁;
第二读取单元,用于在获取所述共享锁之后,重新读取所述根节点;
验证单元,用于验证所述共享锁对应的版本号与重新读取后的根节点的版本号是否一致,若所述共享锁对应的版本号与重新读取后的根节点的版本号一致,则对所述重新读取后的根节点加所述共享锁;
读操作单元,用于在对所述重新读取后的根节点加所述共享锁之后,执行从键值对Key-Value系统的存储层中读取所述根节点下的目标节点的操作。
22.根据权利要求21所述的服务器,其特征在于,所述验证单元还用于若所述共享锁对应的版本号与重新读取后的根节点的版本号不一致,则将所述重新读取后的根节点的版本号作为当前读取的根节点的版本号,使得所述获取单元获取与当前读取的根节点的版本号相对应的共享锁。
23.一种服务器,其特征在于,包括处理器、存储器、总线和通信接口;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述总线连接,当所述服务器运行时,所述处理器执行所述存储器存储的所述计算机执行指令,并通过所述通信接口与所述服务器部的设备进行通信,以使所述服务器执行如权利要求1-9中任一所述的分布式键值对Key-Value存储系统的数据更新方法。
24.一种计算机可读介质,其特征在于,包括计算机执行指令,以供计算机的处理器执行所述计算机执行指令时,所述计算机执行如权利要求1-9中任一所述的分布式键值对Key-Value存储系统的数据更新方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2013/072840 WO2014146240A1 (zh) | 2013-03-19 | 2013-03-19 | 分布式存储系统的数据更新方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103518364A true CN103518364A (zh) | 2014-01-15 |
CN103518364B CN103518364B (zh) | 2016-03-09 |
Family
ID=49899392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380000766.3A Active CN103518364B (zh) | 2013-03-19 | 2013-03-19 | 分布式存储系统的数据更新方法及服务器 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103518364B (zh) |
WO (1) | WO2014146240A1 (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104461384A (zh) * | 2014-11-28 | 2015-03-25 | 华为技术有限公司 | 一种数据写入方法及存储设备 |
CN104794196A (zh) * | 2015-04-21 | 2015-07-22 | 浙江大学 | 一种树形结构数据的采集和更新方法 |
CN105208105A (zh) * | 2015-08-26 | 2015-12-30 | 北京奇虎科技有限公司 | 索引更新方法和装置 |
CN105391755A (zh) * | 2015-09-30 | 2016-03-09 | 华为技术有限公司 | 一种分布式系统中数据处理方法、装置及系统 |
CN105721527A (zh) * | 2014-12-04 | 2016-06-29 | 金蝶软件(中国)有限公司 | 一种数据处理方法以及服务器 |
CN106354565A (zh) * | 2016-09-21 | 2017-01-25 | 努比亚技术有限公司 | 一种分布式锁客户端及控制方法 |
CN106534049A (zh) * | 2015-09-11 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 基于服务器的数据下发方法、客户端、服务器及系统 |
CN106557278A (zh) * | 2015-09-30 | 2017-04-05 | 腾讯科技(深圳)有限公司 | 一种缓存数据持久化的方法 |
CN106708608A (zh) * | 2015-11-16 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种分布式锁服务方法、获取方法及相应装置 |
CN106844676A (zh) * | 2017-01-24 | 2017-06-13 | 北京奇虎科技有限公司 | 数据存储方法及装置 |
CN107294828A (zh) * | 2017-06-15 | 2017-10-24 | 广州天源信息科技有限公司 | 跨区域分布式站点交互与数据同步方法 |
CN107438096A (zh) * | 2016-05-25 | 2017-12-05 | 思科技术公司 | 针对分布式存储的拥塞感知负载平衡 |
CN107463512A (zh) * | 2017-06-26 | 2017-12-12 | 上海高顿教育培训有限公司 | 分布式高速存储系统的数据更新方法 |
CN108446376A (zh) * | 2018-03-16 | 2018-08-24 | 众安信息技术服务有限公司 | 数据存储方法与装置 |
CN108694219A (zh) * | 2017-04-12 | 2018-10-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
CN108809838A (zh) * | 2018-06-28 | 2018-11-13 | 北京顺丰同城科技有限公司 | 一种基于树形结构的服务发现处理方法及装置 |
CN109033278A (zh) * | 2018-07-11 | 2018-12-18 | 江苏通付盾科技有限公司 | 数据处理方法、装置、电子设备及计算机存储介质 |
CN109657114A (zh) * | 2018-08-21 | 2019-04-19 | 国家计算机网络与信息安全管理中心 | 一种抽取网页半结构化数据的方法 |
CN111538864A (zh) * | 2020-03-25 | 2020-08-14 | 新华三技术有限公司合肥分公司 | 一种减少Buildrun消耗的方法及装置 |
WO2020211236A1 (zh) * | 2019-04-17 | 2020-10-22 | 平安科技(深圳)有限公司 | 基于b+树的读写冲突解决方法、装置及存储介质 |
CN112579602A (zh) * | 2020-12-22 | 2021-03-30 | 杭州趣链科技有限公司 | 多版本数据存储方法、装置、计算机设备及存储介质 |
CN113535851A (zh) * | 2019-03-28 | 2021-10-22 | 北京忆芯科技有限公司 | 分布式kv存储系统的更新与查询 |
CN113704255A (zh) * | 2021-08-04 | 2021-11-26 | 深圳市蜜蜂互联网络科技有限公司 | 数据插入方法及装置、数据验证方法及装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107800738B (zh) * | 2016-09-05 | 2021-03-05 | 华为数字技术(苏州)有限公司 | 数据更新的方法与装置 |
EP3776250B1 (en) | 2019-12-05 | 2022-08-24 | Alipay (Hangzhou) Information Technology Co., Ltd. | Performing map iterations in blockchain-based system |
AU2019379711B2 (en) | 2019-12-05 | 2022-04-07 | Alipay (Hangzhou) Information Technology Co., Ltd. | Performing map iterations in a blockchain-based system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065670A1 (en) * | 2001-06-08 | 2008-03-13 | Sap Ag. | Cache-conscious concurrency control scheme for database systems |
CN101339538A (zh) * | 2007-07-04 | 2009-01-07 | 三星电子株式会社 | 使用页结构的数据树存储方法、系统和计算机程序产品 |
CN102495838A (zh) * | 2011-11-03 | 2012-06-13 | 成都市华为赛门铁克科技有限公司 | 数据处理方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100832222B1 (ko) * | 2001-06-09 | 2008-05-23 | 자프 아게 | 메인 메모리 데이터베이스 시스템의 색인 구조를 위한캐쉬에 최적화된 동시성 제어방법 |
CN102843396B (zh) * | 2011-06-22 | 2018-03-13 | 中兴通讯股份有限公司 | 一种分布式缓存系统中的数据写入及读取方法及装置 |
US8375012B1 (en) * | 2011-08-10 | 2013-02-12 | Hewlett-Packard Development Company, L.P. | Computer indexes with multiple representations |
-
2013
- 2013-03-19 WO PCT/CN2013/072840 patent/WO2014146240A1/zh active Application Filing
- 2013-03-19 CN CN201380000766.3A patent/CN103518364B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065670A1 (en) * | 2001-06-08 | 2008-03-13 | Sap Ag. | Cache-conscious concurrency control scheme for database systems |
CN101339538A (zh) * | 2007-07-04 | 2009-01-07 | 三星电子株式会社 | 使用页结构的数据树存储方法、系统和计算机程序产品 |
CN102495838A (zh) * | 2011-11-03 | 2012-06-13 | 成都市华为赛门铁克科技有限公司 | 数据处理方法及装置 |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104461384A (zh) * | 2014-11-28 | 2015-03-25 | 华为技术有限公司 | 一种数据写入方法及存储设备 |
CN104461384B (zh) * | 2014-11-28 | 2017-11-24 | 华为技术有限公司 | 一种数据写入方法及存储设备 |
WO2016082559A1 (zh) * | 2014-11-28 | 2016-06-02 | 华为技术有限公司 | 一种数据写入方法及存储设备 |
CN105721527A (zh) * | 2014-12-04 | 2016-06-29 | 金蝶软件(中国)有限公司 | 一种数据处理方法以及服务器 |
CN104794196A (zh) * | 2015-04-21 | 2015-07-22 | 浙江大学 | 一种树形结构数据的采集和更新方法 |
CN104794196B (zh) * | 2015-04-21 | 2018-07-31 | 浙江大学 | 一种树形结构数据的采集和更新方法 |
CN105208105A (zh) * | 2015-08-26 | 2015-12-30 | 北京奇虎科技有限公司 | 索引更新方法和装置 |
CN105208105B (zh) * | 2015-08-26 | 2019-03-08 | 北京奇虎科技有限公司 | 索引更新方法和装置 |
CN106534049B (zh) * | 2015-09-11 | 2020-10-20 | 腾讯科技(深圳)有限公司 | 基于服务器的数据下发方法、客户端、服务器及系统 |
CN106534049A (zh) * | 2015-09-11 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 基于服务器的数据下发方法、客户端、服务器及系统 |
CN106557278A (zh) * | 2015-09-30 | 2017-04-05 | 腾讯科技(深圳)有限公司 | 一种缓存数据持久化的方法 |
CN105391755B (zh) * | 2015-09-30 | 2018-10-19 | 华为技术有限公司 | 一种分布式系统中数据处理方法、装置及系统 |
CN105391755A (zh) * | 2015-09-30 | 2016-03-09 | 华为技术有限公司 | 一种分布式系统中数据处理方法、装置及系统 |
CN106708608A (zh) * | 2015-11-16 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种分布式锁服务方法、获取方法及相应装置 |
CN106708608B (zh) * | 2015-11-16 | 2020-08-11 | 阿里巴巴集团控股有限公司 | 一种分布式锁服务方法、获取方法及相应装置 |
CN107438096A (zh) * | 2016-05-25 | 2017-12-05 | 思科技术公司 | 针对分布式存储的拥塞感知负载平衡 |
CN106354565B (zh) * | 2016-09-21 | 2019-08-20 | 努比亚技术有限公司 | 一种分布式锁客户端及控制方法 |
CN106354565A (zh) * | 2016-09-21 | 2017-01-25 | 努比亚技术有限公司 | 一种分布式锁客户端及控制方法 |
CN106844676B (zh) * | 2017-01-24 | 2020-07-07 | 北京奇虎科技有限公司 | 数据存储方法及装置 |
CN106844676A (zh) * | 2017-01-24 | 2017-06-13 | 北京奇虎科技有限公司 | 数据存储方法及装置 |
CN108694219A (zh) * | 2017-04-12 | 2018-10-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及装置 |
CN107294828A (zh) * | 2017-06-15 | 2017-10-24 | 广州天源信息科技有限公司 | 跨区域分布式站点交互与数据同步方法 |
CN107463512B (zh) * | 2017-06-26 | 2020-11-13 | 上海高顿教育培训有限公司 | 分布式高速存储系统的数据更新方法 |
CN107463512A (zh) * | 2017-06-26 | 2017-12-12 | 上海高顿教育培训有限公司 | 分布式高速存储系统的数据更新方法 |
CN108446376A (zh) * | 2018-03-16 | 2018-08-24 | 众安信息技术服务有限公司 | 数据存储方法与装置 |
CN108446376B (zh) * | 2018-03-16 | 2022-04-08 | 众安信息技术服务有限公司 | 数据存储方法与装置 |
CN108809838A (zh) * | 2018-06-28 | 2018-11-13 | 北京顺丰同城科技有限公司 | 一种基于树形结构的服务发现处理方法及装置 |
CN108809838B (zh) * | 2018-06-28 | 2020-11-27 | 北京顺丰同城科技有限公司 | 一种基于树形结构的服务发现处理方法及装置 |
CN109033278A (zh) * | 2018-07-11 | 2018-12-18 | 江苏通付盾科技有限公司 | 数据处理方法、装置、电子设备及计算机存储介质 |
CN109657114A (zh) * | 2018-08-21 | 2019-04-19 | 国家计算机网络与信息安全管理中心 | 一种抽取网页半结构化数据的方法 |
CN109657114B (zh) * | 2018-08-21 | 2023-11-03 | 国家计算机网络与信息安全管理中心 | 一种抽取网页半结构化数据的方法 |
CN113535851A (zh) * | 2019-03-28 | 2021-10-22 | 北京忆芯科技有限公司 | 分布式kv存储系统的更新与查询 |
WO2020211236A1 (zh) * | 2019-04-17 | 2020-10-22 | 平安科技(深圳)有限公司 | 基于b+树的读写冲突解决方法、装置及存储介质 |
CN111538864B (zh) * | 2020-03-25 | 2023-03-31 | 新华三技术有限公司合肥分公司 | 一种减少Buildrun消耗的方法及装置 |
CN111538864A (zh) * | 2020-03-25 | 2020-08-14 | 新华三技术有限公司合肥分公司 | 一种减少Buildrun消耗的方法及装置 |
CN112579602A (zh) * | 2020-12-22 | 2021-03-30 | 杭州趣链科技有限公司 | 多版本数据存储方法、装置、计算机设备及存储介质 |
CN113704255A (zh) * | 2021-08-04 | 2021-11-26 | 深圳市蜜蜂互联网络科技有限公司 | 数据插入方法及装置、数据验证方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103518364B (zh) | 2016-03-09 |
WO2014146240A1 (zh) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103518364B (zh) | 分布式存储系统的数据更新方法及服务器 | |
US8112463B2 (en) | File management method and storage system | |
CN107045422B (zh) | 分布式存储方法和设备 | |
US10789217B2 (en) | Hierarchical namespace with strong consistency and horizontal scalability | |
US10031935B1 (en) | Customer-requested partitioning of journal-based storage systems | |
US10853242B2 (en) | Deduplication and garbage collection across logical databases | |
US9792309B2 (en) | Write operations in a tree-based distributed file system | |
Mendes et al. | Charon: A secure cloud-of-clouds system for storing and sharing big data | |
US10133770B2 (en) | Copying garbage collector for B+ trees under multi-version concurrency control | |
CN111427841A (zh) | 数据管理方法、装置、计算机设备和存储介质 | |
CN110402441B (zh) | 引用访问控制列表 | |
CN104765661B (zh) | 一种云存储服务中元数据服务节点的多节点热备方法 | |
US10013312B2 (en) | Method and system for a safe archiving of data | |
CN106326239A (zh) | 分布式文件系统及其文件元信息管理方法 | |
US20140082316A1 (en) | Selecting pages implementing leaf nodes and internal nodes of a data set index for reuse | |
CN105278922A (zh) | 一种数据分发方法、系统及装置 | |
CN105493080B (zh) | 基于上下文感知的重复数据删除的方法和装置 | |
JP2009259007A (ja) | 分散格納方法、分散格納システム及び分散格納装置 | |
CN104423982A (zh) | 请求的处理方法和处理设备 | |
CN115277145A (zh) | 分布式存储访问授权管理方法、系统、设备和可读介质 | |
US20150169229A1 (en) | Storage device and storage system | |
EP3958139B1 (en) | Method and system for creating files in a file system | |
CN110019057A (zh) | 请求处理方法及装置 | |
WO2014147811A1 (ja) | ファイルストレージシステムおよびユーザデータ管理方法 | |
Kshemkalyani et al. | Approximate causal consistency for partially replicated geo-replicated cloud storage |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220216 Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province Patentee after: Huawei Cloud Computing Technologies Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TR01 | Transfer of patent right |