CN103412897A

CN103412897A - 一种基于分布式结构的并行数据处理方法

Info

Publication number: CN103412897A
Application number: CN2013103172039A
Authority: CN
Inventors: 郭皓明; 丁治明; 刘奎恩; 许佳捷; 徐怀野; 李亚光; 张天为
Original assignee: Institute of Software of CAS
Current assignee: Institute of Software of CAS
Priority date: 2013-07-25
Filing date: 2013-07-25
Publication date: 2013-11-27
Anticipated expiration: 2033-07-25
Also published as: CN103412897B

Abstract

本发明涉及一种基于分布式结构的并行数据处理方法，其存储步骤包括：1）根据主键值类型在主节点抽取得到数据主键值，在主节点中根据数据属性取值与区间对比结果确定数据分发的定向从节点，同时建立全局关键字B+树索引；2）根据全局关键字B+树索引基于share-nothing原则将数据分发到主键值对应的从节点；3）在从节点接受数据分发请求，在本地基于share-everything原则将数据存储在子节点中。本发明中结合有效的索引机制，提高系统数据存储与管理的效率；一方面保证数据合理分布，降低从节点存储吞吐，提高局部查询性能，利用从节点高可扩展性保证系统弹性；另一方面通过局部多副本复制保证局部副本安全。

Description

一种基于分布式结构的并行数据处理方法

技术领域

本发明面向地理信息系统、时空数据管理、位置相关服务、大规模传感器流数据管理等领域，针对云计算环境中超大规模海量数据的存储、检索与高效访问需求，提出了一种集键-值数据库（Key-Value Store）和关系数据库双方优势的RDB-KV并行云数据库存储与检索方法，实现兼备键值存储高效访问特性与数据库完整特性的海量数据存储技术。

背景技术

云计算是当前信息技术发展的重要方向。基于云平台的计算与存储服务因底层架构基础设施的变化，在应用模式、应用范围以及技术需求上发生了重大变革。云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念，是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时，云计算系统中就需要配置大量的存储设备，那么云计算系统就转变成为一个云存储系统，所以云存储是一个以数据存储和管理为核心的云计算系统。

分布、并行是云存储的基本特点。在云存储的环境中，存储节点之间构成复杂的互相依赖关系。为了有效利用资源、提高存储服务的性能，数据通常根据一定原则分布在特定集群节点范围内容。这些集群节点通过“数据池”等方式将片段数据存储在本地环境中。为了保障数据的安全，集群节点内部又将这一特定片段数据进行多副本复制与分发。集群内部的储存设备之间构成多个副本。这样从整体上，保证数据的有效分散与安全。

云存储的推广带动了存储技术的发展。云存储的高弹性、并行性等特点可以很好的满足日益膨胀的企业应用发展。企业业务在向云环境的迁移过程中，需要将相关数据植入云存储的分布式并行存储环境中。在传统的企业应用中，数据支撑环境通常构建在关系数据库中。在关系数据模型的基础上，依据业务逻辑设计基本库表结构。在设计阶段，以独立事物对象或业务单步活动为数据粒度划分的原则。将一组属性构成基本粒度数据的表征全集，以此构成一个独立二维表的基本结构。为满足复杂逻辑中数据一致性与完全性，在库表设计的过程中，不同表项之间通常存在复杂的约束与依赖关系；在数据更新的过程中，利用这些表项之间的约束关系，实现全局范围内数据一致性的校核。另一方面，在业务数据查询的过程中，通常一个查询任务涉及多个基本粒度数据模型的交叉、组合。这些任务以关系代数为基础构造查，利用jion等复杂操作满足查询任务的基本要求。在传统的存储环境中，成熟的关系数据库管理系统依托关系数据库模型，借助于集合代数等概念和方法来处理数据库中的数据。此类关系数据库建立在严格的数学概念的基础上的。关系模型的概念单一，无论实体还是实体之间的联系都用关系表示，操作的对象和操作的结果都是关系，所以其数据结构简单、清晰，用户易懂易用。关系模型的存取路径对用户透明，从而具有更高的数据独立性、更好的安全保密性，也简化了程序员的工作和数据库开发建立的工作。

随着企业应用规模的不断膨胀，关系数据库的在性能方便的瓶颈问题日益凸显，因数据海量性、异构性、高并发性等特点导致的数据集成环境性能低下的问题成为影响企业发展以及信息技术推广的一个核心问题。

另一方面，云存储的兴起为海量高并发数据的应用与管理提供了物质支持。云存储因其自身高弹性，高伸缩性、高并发性等特点可以很好的为企业应用的迅速扩展提供服务。然而，传统的云存储在技术层面以none-sql等模式为基础。在应对以关系代数为基础的传统数据库迁移的过程中，存在以下基本问题：

1）海量数据对传统存储架构的挑战：传统的数据管理系统以关系代数与关系数据为存储架构的设计依据。在传统的应用中，由于关系数据之间存在复杂的依赖与约束关系；这些数据管理系统多以集中式的架构实现存储管理。随着数据规模的膨胀，部分成熟数据管理系统利用分布式结构、以多副本平行复制、CDN等方式在多节点之间实现数据的统一组织与管理。以oracle rac等为代表，在数据查询等活动中，在本质上，节点局部内仍以数据全集为基本范围执行查询任务。这就导致系统查询性能存在瓶颈制约。同时，系统中数据吞吐量严重影响了整体稳定性与可靠性。这一不足之处严重影响了服务计算规模与处理质量的提升；

2）基于RDB的查询与可支持KV查询矛盾：键-值查询是云存储的一个基本特点，同时也是云存储高性能实现的技术保证。在非结构化数据管理的过程中数据本体用于基本存储。数据属性经过抽象后，形成对本体取值描述的key。数据管理系统通过key的排列、组合形成有序的键索引机制。在查询过程中，依据一定的排序规则通过key的比对、匹配实现数据本体的快速定位与访问。另一方面，结构化数据本身具有明确的数据项结构定义。在数据组织与存储的过程中，数据本体经过处理其取值存放在所属表项行目中。各个表中的数据存储过程中，不存在统一的特征抽取、key值排序的步骤。从全局的角度出发，不能支持全部表对象统一的key值对应数据本体查询；这一矛盾导致RDB查询与KV查询结合的困难；

3）海量数据分析对高性能查询的挑战：服务计算涉及大量复杂要素、对象属性、监测数据、多媒体数据、遥感数据以及各种非结构化数据的复杂访问。另一方面，围绕服务计算中数据的空间分布性特点，底层数据多以分布式方式实现组织与管理。因此高性能并行查询成为提高数据访问工作性能的必然手段。然而，在传统GIS平台依赖的数据管理系统中，由于架构上存在先天性的不足，导致在高性能查询方面存在无法逾越的机制限制。这就导致GIS平台在面对日益膨胀的地理数据，在基本查询方面就存在缺陷。因此，需要在并行存储架构的技术上，实现高性能并行查询的任务组织、调度，数据汇聚与过滤的相关技术，满足服务计算对海量数据高性能访问的核心需求；

发明内容

针对上述问题，本发明的目的在于提供一种基于分布式环境的并行数据集群处理方法，其目的是在分布式环境并行架构的基础上，实现海量数据的有序组织、检索与查询服务，实现集键-值数据库（Key-Value Store）和关系数据库双方优势的RDB-KV云数据库存储与检索。提供兼备键值存储高效访问特性与数据库完整特性的海量数据存储技术；满足如物联网传感器数据、多媒体数据、交通网络数据、移动对象时空数据等数据的管理与查询。

为了实现上述目的，本发明所采用的技术方案为：一种基于分布式结构的并行数据存储方法，其步骤包括：

1）根据主键值类型在主节点抽取得到数据主键值，在所述主节点中根据数据属性取值与区间对比结果确定数据分发的定向从节点，同时建立全局关键字B+树索引；

2）根据所述全局关键字B+树索引基于share-nothing原则将数据分发到所述主键值对应的从节点；

3）在所述从节点接受数据分发请求，在本地基于share-everything原则将数据存储在子节点中。

更进一步，根据所述share-nothing原则将数据从主节点转发到各个从节点，且从节点间的数据不互为副本；根据所述share-everything原则将子节点中之间的数据在本地集群中进行多副本复制且子节点间的数据互为副本。

更进一步，将数据分发到所述主键值对应的从节点的步骤如下：

1）利用预先注册的分发策略从当前数据中提取指定的列对应的数据内容构成当前数据属性，根据策略类型抽取属性作为当前数据的主键值；

2）所述分发策略信息注册在全局关键字分区表中，根据当前数据表对应类型的全局关键字B+树获取当前数据键值对应的映射关系对；

3）通过这一映射关系对绑定特定的从节点，实现基于主键值取值的定向发送。

更进一步，主键值类型包括文本属性取值、数值区间取值以及空间栅格三种基本类型；不同类型主键值的抽取与构造按照如下一种或者多种方式进行：

文本属性取值策略：数据在注册阶段将当前表以特定列取值作为全局关键词的依据；在分发过程中，文本全局关键字树和与其对应的全局关键字分区表中会记录当前表中对应文本取值的数据定向发送的节点标识从节点，当前表中所有特定列取值为该文本的数据定向发送到个节点中；

和/或者数值区间取值策略：数据在注册阶段将前表以特定列取值作为全局关键值的依据，所述特定列的数据由数值型构成；在分发过程中，数值全局关键字树和与其对应的全局关键字分区表中会记录当前表中对应数值取值区间的数据定向发送的节点标识从节点，当前表中所有特定列取值为该数值取值的数据定向发送到个节点中；

和/或者空间栅格策略：数据在注册阶段将确空间取值对应的特定列，所述特定列的数据由空间地理坐标等数据类型构成；在分发过程中，空间栅格全局关键字和与其对应的全局关键字分区表中会记录当前表中对应空间栅格取值区间编码的数据定向发送的节点标识从节点，当前表中所有特定列取值为空间栅格的数据定向发送到个节点中。

更进一步，全局关键字B+树由一存放在根结点的全局关键字分区表和一组关键字到分发从节点标识的映射组成；

根据所述主键值类型建立与全局关键字B+树索引一一对应的B+树索引包括：关键词/字索引、关键值索引以及空间栅格索引三种基本类型。

更进一步，所述全局关键字B+树按照不同的分布原则分为：缺省全局关键字树、文本全局关键字树、数值区间全局关键字树以及空间栅格全局关键字树四个基本类型。

更进一步，所述全局关键字B+树索引根据数据自动增加新的数据关系对，通过判断当前叶结点中主键值映射关系对的数量是否会超过阈值，对树进行局部优化过程如下：

1）为当前叶节点构造一组子节点，将构造的该组子节点放置在当前叶节点的子节点集合中；

2）将当前叶节点的映射关系对列表清空；从当前子节点中提取与主键值对应的子节点，设置为当前叶节点；

3）查看当前叶节点中是否已经存储了主键值与当前映射关系对，如果已经存储则结束当前操作，否则将当前主键值与映射关系对放置在当前叶节点中，完成平衡操作。

更进一步，通过并行方法实现步骤如下：

（1）提取当前查询sql语句中的计算符将sql语句分解为若干子sql语句；

（2）构造并行二叉任务树，将计算符作为任务数的叶节点；将分解的字句作为叶结点的子节点；

（3）遍历当前任务树，从最底层计算符节点开始执行左右单步查询任务，完成当前计算节点的左右单步查询任务节点结果集汇聚与处理后向上逐级执行。

更进一步，根据全局关键字B+树索引提取数据对象的属性集合作为该特定取值的属性集记录在索引数据表中，利用所述索引数据表进行查询的步骤为：

（1）根据查询请求提交的主键值，在属性取值策略所对应的全局关键字分区表中利用RDB查询与当前关键词匹配的索引记录列提取全部匹配命中的索引记录行信息；

（2）根据所述行信息中记录的数据表名进行分组，同时统计每个数据表所涉及的节点标示；

（3）根据不同的数据表，建立并行查询任务。

更进一步，在查询任务的执行过程中在多个从节点的对应数据表中执行，并完成结果集的汇聚与合并，查询步骤如下：

（1）根据注册的从节点信息，构造子任务对象，

（2）依次启动子任务对象线程，直到当前任务进入等待状态后子任务完成本地查询，将查询结果集汇聚回当前任务结果集中，完成汇聚后通知当前任务执行完毕信息；

（3）当全部子任务执行完毕后，当前任务完成全部数据结果集汇聚结束任务。

与现有技术相比，本发明的积极效果为：

（1）针对大数据海量性、异构性的特点，提出一种高性能数据并行云存储方法。在现有技术的框架中一般采用share-nothing原则简单的分为两级分散存储，或者采用share-everything原则单级多副本并行存储。本发明中的存储管理方法利用两级三层的基本框架，结合有效的索引机制，提高系统数据存储与管理的效率；一方面保证数据合理分布，降低从节点存储吞吐，提高局部查询性能，利用从节点高可扩展性保证系统弹性；另一方面通过局部多副本复制保证局部副本安全。

（2）提出了一种新型的、集“键-值”型数据存储与关系数据库二者优势于一体的云计算数据库存储模型。在实现海量数据快速“键-值”访问的同时，提供完整的关系数据库功能特性。

（3）基于某市道路交通数据的实验表明，系统在对全集数据查询的过程中效率提高5.2%；对单个对象的流数据查询、提取效率提高了11.6%。

附图说明

图1是本发明采取的分布式数据集群管理架构示意图；

图2是本发明一实施例中分布式环境中数据转发、存储的基本流程示意图；

图3是本发明一实施例中主节点数据分发中全局key索引树的基本结构示意图；

图4是本发明一实施例中数据更新过程中全局key索引树维护流程示意图；

图5是图4所示的key索引树中数据更新过程中全局key索引树平衡流程；

图6是本发明一实施例中并行查询任务基本组织流程示意图；

图7是本发明一实施例中并行任务二叉树查询语句的示例图；

图8是本发明一实施例中并行任务执行节点阻塞关系示意图；

图9是本发明一实施例中并行查询任务结果集汇聚组织示意图；

图10是本发明一实施例中全局关键词索引树示例示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，可以理解的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明所采用的技术方案如下：

第一步：针对云存储环境的特点，提供一种并行数据处理方法。整个数据集群处理系统采用两级三层的数据组织、管理架构。在这一系统中，数据的组织过程经过全局分发与局部存储两个基本步骤。在全局分发的过程中，首先将当前数据根据当前数据注册的特征列提取数值作为特征，经过选择哈希编码、取值区间量化编码、空间栅格编码三种编码方式中的一种处理后形成当前数据主key，而后，基于share-nothing的原则根据按照B+树或者其他索引的规则，将数据分发到与主key对应的从节点中，保证不同节点之间数据没有交集。从节点接受这一数据分发请求后，在本地以share-everything的原则，存储在本地数据集群构成的子节点中。子节点中的数据互为副本。互为副本的意思就是在子节点中，每一个节点中的数据集是完全一样的，这样在访问的时候可以根据任意选择一个子节点进行访问，查询或者提取数据。

第二步：在数据的分发与存储过程中，根据属性取值与区间对比确定数据分发的定向节点。利用这一以属性取值区间为原则的分发策略构成全局索引。全局索引的目的是缩小实际需要执行查询的叶结点范围。主节点中，数据分发过程中各个数据属性取值与区间定义的对比结果构成主key，这一主key在全局关键字B+树（Global Full-Text Keyword B+-Tree，简称GFTKB+-Tree）。GFTKB+-Tree对全局关键字进行统一管理，同时建立索引机制。在整个系统中，根据数据取值的类型提供关键词/字索引、关键值索引以及空间栅格索引三种基本类型的服务。每一种基本类型对应一种B+树；

第三步：在数据查询的过程中，在系统中，首先解析、分解当前查询请求的sql语句。根据查询语句中的join、union、in、not in等关系，将复杂查询sql分解为一组简单sql语句。利用二叉树树构造复杂查询任务。这一任务树的根节点为任务汇聚根节点。其由一组子节点构成。子节点为一个表结果集处理计算符，为join、union等。表结果集处理计算符表示对其所约束的表查询语句结果集的处理计算方式。表结果集处理计算符子节点包含一组子节点。这组子节点既可以是表结果集处理计算符节点也可以是单步查询的简单任务节点。

针对KV-RDB查询，根据提交的key，在主节点的全局GKR-table中利用RDB查询与当前关键词匹配的索引记录列。提取全部匹配命中的索引记录行信息。根据行信息中记录的数据表名进行分组。同时，统计每个数据表所涉及的节点标示；而后根据不同的数据表，建立并行查询任务。并行查询任务的从节点范围由以上统计节点结果确定。完成查询任务创建后，既执行该任务。多个表所对应的查询结果集以xml的方式实现汇聚与展示；

第一步：建立分布式并行数据集群管理架构

本发明的目的是在云基础平台的基础上，构建云存储环境，这一环境满足云环境中海量、异构数据统一组织、管理、访问的基本要求；提供兼备键值存储高效访问特性与数据库完整特性的海量数据存储技术；满足云存储环境高并发、高可用的基本要求，同时，基于云计算的基本要求，提供有效的安全管理机制，保障云存储数据的安全性。图1中展示了这一架构的基本组织结构。

图1中展示了本发明的基本层次关系。整体而言整个数据管理系统采用两级三层的数据组织、管理架构。在这一系统中，数据的组织过程经过全局分发与局部存储两个基本步骤。

在全局分发的过程中，首先将当前数据特征抽取，经过哈希或其他手段处理为主key，而后，基于share-nothing的原则根据按照B+树或者其他索引的规则，将数据分发到与key对应的从节点中。在局部存储过程中，从节点接受这一数据分发请求后，在本地以share-everything的原则，存在在本地数据集群构成的子节点中。子节点中的数据互为副本。

整个云存储数据库包括三个基本层次：控制层、组织层与数据层，其中：

控制层：控制层承担整个云存储系统数据更新请求分发与组织；数据访问请求解析、并行任务构造与执行；全局key维护与管理；全局安全统一认证与访问等基本任务。控制层由一个主节点构成。

组织层：组织层是数据组织与管理的核心。在本发明中组织层中部署大量从节点。这些数据节点具有高度的可扩充性与弹性；在数据更新过程中，组织层对上接收数据更新请求。这一请求在从节点本地的数据集群中进行统一更新。组织层的从节点之间数据不存在互为副本的关系。不同从节点的数据完全没有交集；在查询过程中，从节点根据当前的查询任务在本地数据集群中提取结果集并汇聚给主节点。当本地执行局部查询或者数据更新时。从节点通过管理层的统一访问控制首先对请求权限进行校核，保证组织层中局部数据安全；

数据层：数据层由一组互为副本的数据集群构成。这一数据集群中的节点之间数据完全一致，互为副本；在数据更新的过程中从节点利用数据库复制、一致性维护等手段实现数据副本的统一制作与管理维护。在数据查询过程中，依赖cdn、负载均衡等手段，合理执行查询任务；在整个云存储换中，数据层中的集群节点可以根据实际情况进行灵活扩展。通过这一方式，提高从节点的稳定性与安全性，保证企业应用的顺利开展；

在本发明中并行分布是数据存储与管理的基本特点。在并行分布的过程中，系统遵守两级分布的基本策略。既：根据share-noting的原则实现从节点之间的分布；根据share-everything原则实现从节点中局部数据的多副本式分布。保证数据合理分布，降低从节点存储吞吐，提高局部查询性能，利用从节点高可扩展性保证系统弹性；另一方面通过局部多副本复制保证局部副本安全。图2中展示了数据更新的基本流程：

这一基本流程如下：

1.提取当前数据对应的表映射注册信息；

2.根据映射注册信息从当前数据中提取属性特征列对应的数据集作为属性；

3.将当前数据属性转化为对应分布策略的主key

4.根据当前策略，选择并绑定特定从节点；

5.存储或者更新当前数据的属性特征与key以及与从节点定向对应信息；

6.将当前数据更新请求发送给从节点；

7.从节点接受数据请求进行全局一致性检查，通过检查则执行步骤9，否则执行步骤8；

8.抛出异常报告一致性检查错误信息，结束当前操作；

9.从节点本地进行数据更新操作；

10.从节点在本地数据集群中进行副本同步更新；

11.结束当前操作

在云存储系统中，每个从结点slavenode对应于一个特定数据属性取值区（例如：地理位置、ID、采样取值等记为α(snode)）而主结点中存贮属性取值分区定向映射表，（Attribute Key Mapping Table，简称AKM-Table）。

数据对象根据它们的特定属性取值分布在不同的叶结点中。对于任意一个数据对象data，如果其属性取值是固定不变的，则它仅对应于一个元组，该元组存贮在属性取值区包含data的从结点中；如果数据的属性的动态变化的，则它对应于多个元组-元组的基本信息。在对象属性取值所覆盖的从结点中进行分割并分布式存放在这些从结点中。对于一个从结点site，它仅存放属性与α(site)在取值上相交的部分。

第二步：数据存储过程中实现定向分布与全局数据索引

在云存储环境中数据分发过程中根据属性取值与区间对比确定分发节点。利用这一以属性取值区间为原则的分发策略构成全局索引。为了支持全局的查询处理，在RDB-KV云存储系统中需要建立相应的全局索引。全局索引的目的是缩小实际需要执行查询的叶结点范围。

主节点中，数据分发过程中各个数据属性取值与区间定义的对比结果构成主key这一主key在全局关键字B+树（Global Full-Text Keyword B+-Tree，简称

GFTKB+-Tree）。GFTKB+-Tree对全局关键字进行统一管理，同时建立索引机制。下图中给出了GFTKB+-Tree的基本结构：

如图3所示，GFTKB+-Tree实际上包含一个存放在根结点的全局关键字分区表Range Table，简称GKR-Table）和一组keyword到slaveNodeID的映射B+树（keyword to SiteID Mapping B+-Tree，简称KSMB+-Tree）。

GKR-table由一个一组全局关键字映射关系对构成；

GKR-table={km_i|i=1,2，……,n};其中km为关键字映射关系对，其由一个四元组构成：

km={key,attGroup，slaveID,dataRef};

其中key为当前关系对中数据属性主key取值，这一取值根据分发策略share-nothing的不同可以为哈希编码hashcode、空间栅格地理编码、取值区间编码、文本取值等构成；

attGroup为属性集合；

slaveID为当前key取值对应的分发从节点标识；在不同的策略下主key对应的从节点方法存在一定的区别；

dataRef为数据存储指针映射，其由一个二元组构成：

dataRef={localPointer，tabname}其中：

localPointer为数据在从节点中存储的指针；

tabname为当前数据所对应的数据表名称。

在系统中，对应不同的分布策略，GFTKB+-Tree包括缺省全局关键字树、文本全局关键字树、数值区间全局关键字树以及空间栅格全局关键字树四个基本类型。在结构上这四个全局关键字树类型是一致的。一个全局关键字树GFTKB+-Tree由一个多元组构成，其根节点包括一组叶结点构成：

Root={leaf_i|i=1，2，……n}

Leaf为叶节点。一个叶结点对应一个取值区间。其由一个多元组构成：

Leaf={ID，keymax，keymin，kkms，leafs，size}

其中：ID为当前叶结点对应的标识，这一标识全局唯一；

Keymax为当前叶结点对应的关键词取值上限；

Keymin为当前叶结点对应的关键词取值下限；

kKms为关键字映射关系对集合，其为一组kkm构成:

kkms={kkm_i|i=1,2……,n};kkm={key,{km₁，km₂，….km_j}

key为关键词取值

km其定义与GKR-table中的定义完全一致；

Leafs为当前叶节点的子节点集合。当当前叶结点没有子节点时，其kms中存放全部关系对；当当前叶结点包含子节点时，其kms中没有任何关系对存在。本级节点中的关系对集合通过遍历其子节点中的关系对集合获取；

Size为当前叶结点中关系对的个数。在索引的维护过程中，为了保证平衡性，当一个叶结点的size超过阈值时，就将这一叶结点进行拆分；

在数据更新的过程中，系统首先提取当前数据对象对应的注册信息，根据这一注册信息提取属性集与主key取值。而后与全局索引中进行的叶节点进行对比，如果当前叶结点中已经存在了这一主key对应的取值，则将这一主key取值中的映射关系对中与tabname相匹配的关系对提取，并获取其中的slaveID，根据slaveID与对应的slave节点建立连接关系，将当前的数据更新请求转发给slave节点。完成后，将slave节点返回的局部指针在关系对中进行更新；

在这一过程中，如果不存在这一关系对，则建立当前tabname对应的关系对，根据当前分布策略选择一个从节点，完成从节点中数据更新后，将这一从节点的slaveID与对应的信息作为新的关系对存储在GKR-table表中，同时，对当前GFTKB+-Tree的叶节点进行更新。

图4中展示了这一过程的基本流程：

这一流程的基本过程如下：

1.提取当前数据表注册的分布类型全局索引树GFTKB-TREE；成功则执行步骤3，否则执行步骤2；

2.构造当前数据库内该类型所对应的全局索引树；

3.获取当前数据对应表注册的分布策略信息；

4.根据策略信息从当前数据中提取属性集与当前数据的主key；

5.根据当前数据的主key从当前GFTKB-TREE中提取对应的映射关系对，如果映射关系对提取成功则执行步骤9，否则执行步骤6；

6.根据当前映射关系对，提取对应的从节点slavenode，并绑定；

7.将当前数据更新请求发送给步骤6中绑定的slavenode；slavenode完成本地数据更新以及局部集群中的数据同步；

8.更新当前GFTKB-TREE中主key的对应内容；执行步骤13；

9.根据当前分布策略动态选择一个slavenode节点并绑定；

10.将当前数据更新请求发送给步骤9中绑定的slavenode；slavenode完成本地数据更新以及局部集群中的数据同步；

11.在当前类型对应的GKR-table中存储新的key与映射关系对的信息；

12.在当前类型对应的GFTKB-TREE中存储新的key与映射关系对的信息；

13.更新当前GFTKB-TREE中主key的相关内容；

14.结束

在上述的数据更新过程中，全局GFTKB-TREE根据数据更新增量，自动增加新的数据关系对。在这一过程中叶节点根据一定的数据平衡原则，对树的局部进行数结构优化。如图5所示这一过程如下所示：

这一流程基本如下：

1.获取当前树种key与映射关系对增量请求；

2.从当前数中提取主key对应取值区间的叶节点；提取成功则执行步骤4，否则执行步骤3；

3.创建新的叶节点，将当前主key与映射关系对放置在这一叶节点中，结束当前操作；

4.查看当前叶节点中的映射关系对数量是否超过阈值设置，如果超过则执行步骤5，否则执行步骤9；

5.根据平衡原则，为当前叶节点构造一组子节点；

6.将构造的这一组子节点放置在当前叶节点的子节点集合中；

7.将当前叶节点的映射关系对列表清空；

8.从当前子节点中提取与key对应的子节点，设置为当前叶节点；

9.查看当前叶节点中是否已经存储了主key与当前映射关系对，如果已经存储则结束当前操作，否则执行步骤10；

10.将当前key与映射关系对放置在当前叶节点中，完成平衡操作；第三步：实现高性能并行数据查询与全局KV-RBD查询

本发明云存储系统是采用并行架构的云存储系统，数据根据特定的分布测量分散在不同从节点中，从全局的角度出发，从节点中的局部数据为数据全集的一个子集。通过降低从节点中的数据吞吐量，实现单节点数据高效组织与查询，以及数据吞吐量的规模。另一方面，在数据查询过程中，系统充分利用分布式数据的特点，采用并行处理模式提高查询过程的速度与性能。

本发明采用数据无交叉分布的原则，在查询过程中，利用并行架构实现数据任务的组织、结果集的汇聚与过滤。图6中展示了数据查询任务整体组织过程

在系统中，首先解析、分解当前查询请求的sql语句。根据查询语句中的join、union、in、not in等关系，将复杂查询sql分解为一组简单sql语句。利用二叉树树构造复杂查询任务。这一任务树的根节点为任务汇聚根节点。其由一组子节点构成。子节点为一个表结果集处理计算符，为join、union等。表结果集处理计算符表示对其所约束的表查询语句结果集的处理计算方式。表结果集处理计算符子节点包含一组子节点。这组子节点既可以是表结果集处理计算符节点也可以是单步查询的简单任务节点。任务树的定义如下：

QueryTree={ID，childNodes}；其中：

ID为当前任务树的标示；

childNodes为当前任务树的子子节点集合，childNodes={cni|i=1,2，......,n},

cn为子节点定义，其取值为计算符型节点ccn或单步查询简单任务节点scn，计算符型节点定义如下：

ccn={factor，leftNode,rightNode}；其中：

factor为当前计算符取值，其取值为union、join、in、not in等；

leftNode为当前计算符节点的左子节点，其定义与前述一致；

rightNode为当前计算符节点的右子节点，其定义与前述一致；

scn={sqlstate}；其中：

Sqlstate为当前单步查询简单任务节点的单步查询sql语句

在任务树中，复杂查询任务的sql语句被分解为一组计算符与单步查询sql语句，例如：

select*from GPStable where location in(select roadlineTable.location from roadlineTable,maptable where maptable.areacode<>’haidian’and maptable.Areacode=roadlineTable.areacode);

图7展示了这一复杂查询分解为任务树后的组织情况：

在任务的执行过程中，系统遍历当前任务树，从最底层计算符节点开始执行左右单步查询任务。完成当前计算节点的左右单步查询任务节点结果集汇聚与处理后向上逐级执行。最终完成整个二叉树的任务执行与结果汇聚、处理；

一个计算符节点包括左右两个单步查询任务节点。其首先执行左节点查询任务。在左子节点任务执行过程中，在本地创建左任务临时数据表，通过并行查询左任务的结果集被存储在临时数据表中，这一临时数据表通过表复制的方式，复制在从节点中。而后，再利用并行查询执行右任务，右任务的结果集汇聚到本地后创建右任务临时数据表，将汇聚结果存储在右临时数据表中，至此完成当前计算符节点的全部查询任务请求。执行其上级节点其他任务；这一过程如图8所示，

在任务树的执行过程中，为了提高执行效率,当一个计算符型子节点的右子节点同样为计算符型子节点时。当前节点的两个子任务以并行方式执行，即如下结构：

在查询任务的执行过程中，单步查询简单任务是一个不包含表关联操作的单表查询任务。本发明采用数据并行的策略。因此，一个简单查询任务需要在多个从节点的对应数据表中执行，并完成结果集的汇聚与合并。再启动一个单步查询简单查询节点的任务时。图9中展示了这一任务的基本组织形式：

在执行过程中，首先根据系统注册的从节点信息，构造子任务对象，而后依次启动子任务对象线程。当前任务进入等待状态，子任务完成本地查询后，将结果集汇聚回当前任务结果集中，完成汇聚后通知当前任务执行完毕信息。当全部子任务执行完毕后，当前任务完成全部数据结果集汇聚结束任务。

在本发明中，数据更新过程中，根据不同的数据分布策略建立相应的全局索引树。这些索引树中记录了当前数据表特定列的取值或区间划分对应情况。同时，提取数据对象的属性集合作为该特定取值的属性集记录在索引数据表中。利用这一索引数据表，可以实现RDB-KV相结合的高效查询。这一查询根据提交的key，在属性取值策略所对应的GKR-table中利用RDB查询与当前关键词匹配的索引记录列。提取全部匹配命中的索引记录行信息。根据行信息中记录的数据表名进行分组。同时，统计每个数据表所涉及的节点标示；而后根据不同的数据表，建立并行查询任务。并行查询任务的从节点范围由以上统计节点结果确定。完成查询任务创建后，既执行该任务。多个表所对应的查询结果集以xml的方式实现汇聚与展示；

在数据环境中根据云存储环境中数据特点，构造全局关键词、全局关键值以及空间栅格等三种不同基本类型的分布策略与索引服务。下面以全局关键词为例介绍本发明的方法。

第一步，用户创建数据表staffTable，其由三个基本字段构成：{ID、name、job}，其中：ID为当前员工的标示；name为当前员工的名称；job为当前员工的岗位描述。

第二步，用户将当前数据表注册为全局关键词类型；

第三步，用户插入一条记录：（‘k001’，‘李白’，‘senior’），主节点接受这一数据更新请求后，首先根据注册信息判定当前数据表为全局关键词型。而后访问全局关键词对应的GFTKB-TREE；因是初始状态当前全局GFTKB-TREE不存在，系统根据对应GKR-Table的内容构造GFTKB-TREE；

第四步，在当前GFTKB-TREE中未发现‘李白’为主key的叶节点。系统为当前数据选择一个从节点（slave01），绑定；将当前数据更新请求发送给slave01节点，完成局部更新后，在当前类型GKR-Table中插入主key李白所对应的映射关系对信息；并在当前GFTKB-TREE中构造新的叶节点，将主key李白所对应的映射关系对信息放置在新的叶节点中；

第五步，在后续的数据更新操作中，用户插入新的数据：（‘k001’，‘李白’，‘vp）；系统访问当前类型对应的全局GFTKB-TREE，获取其中李白作为主key的叶节点；通过叶节点提取映射关系对信息，从映射关系对中获取绑定的从节点（slave01）；将当前数据定向发送给slave01节点，完成局部数据更新；如图10所示

本发明通过分布式云存储环境实现数据管理与索引组织。通过并行查询方法提供高性能查询服务。

在实验中通过海量传感器数据对系统性能进行测试，测试环境如下所示：

在测试过程中，通过对4从节点与8从节点分组测试来测试对海量传感器数据读写操作的基本性能

表1空间数据查询

表2关键词数据查询

表3关键词数据查询

针对当前云存储领域中传统关系数据库的局限性，本发明提供集键-值数据库（Key-Value Store）和关系数据库双方优势的RDB-KV云数据库存储与检索系统。提供兼备键值存储高效访问特性与数据库完整特性的海量数据存储技术。

Claims

1.一种基于分布式结构的并行数据存储方法，其步骤包括：

2.如权利要求1所述的基于分布式结构的并行数据存储方法，其特征在于，根据所述share-nothing原则将数据从主节点转发到各个从节点，且从节点间的数据不互为副本；根据所述share-everything原则将子节点中之间的数据在本地集群中进行多副本复制且子节点间的数据互为副本。

3.如权利要求1所述的基于分布式结构的并行数据存储方法，其特征在于，将数据分发到所述主键值对应的从节点的步骤如下：

4.如权利要求1所述的基于分布式结构的并行数据存储方法，其特征在于，主键值类型包括文本属性取值、数值区间取值以及空间栅格三种基本类型；不同类型主键值的抽取与构造按照如下一种或者多种方式进行：

5.如权利要求1所述的基于分布式结构的并行数据存储方法，其特征在于，全局关键字B+树由一存放在根结点的全局关键字分区表和一组关键字到分发从节点标识的映射组成；

6.如权利要求5所述的基于分布式结构的并行数据存储方法，其特征在于，所述全局关键字B+树按照不同的分布原则分为：缺省全局关键字树、文本全局关键字树、数值区间全局关键字树以及空间栅格全局关键字树四个基本类型。

7.如权利要求1所述的基于分布式结构的并行数据存储方法，其特征在于，所述全局关键字B+树索引根据数据自动增加新的数据关系对，通过判断当前叶结点中主键值映射关系对的数量是否会超过阈值，对树进行局部优化过程如下：

8.如权利要求1所述的基于分布式结构的并行存储数据对应的查询方法，其特征在于，通过并行方法实现步骤如下：

9.如权利要求1所述的基于分布式结构的并行存储数据对应的查询方法，其特征在于，根据全局关键字B+树索引提取数据对象的属性集合作为该特定取值的属性集记录在索引数据表中，利用所述索引数据表进行查询的步骤为：

（3）根据不同的数据表，建立并行查询任务。

10.如权利要求1所述的基于分布式结构的并行存储数据对应的查询方法，其特征在于，在查询任务的执行过程中在多个从节点的对应数据表中执行，并完成结果集的汇聚与合并，查询步骤如下：

（1）根据注册的从节点信息，构造子任务对象，