CN104199986B - 基于hbase和geohash的矢量数据空间索引方法 - Google Patents

基于hbase和geohash的矢量数据空间索引方法 Download PDF

Info

Publication number
CN104199986B
CN104199986B CN201410509173.6A CN201410509173A CN104199986B CN 104199986 B CN104199986 B CN 104199986B CN 201410509173 A CN201410509173 A CN 201410509173A CN 104199986 B CN104199986 B CN 104199986B
Authority
CN
China
Prior art keywords
grid
vector data
row
line
geohash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410509173.6A
Other languages
English (en)
Other versions
CN104199986A (zh
Inventor
陈强
梁曼舒
林承华
汤振立
罗富财
吴丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUZHOU BAIRONG SOFTWARE Co Ltd
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd
State Grid Fujian Electric Power Co Ltd
Original Assignee
FUZHOU BAIRONG SOFTWARE Co Ltd
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd
State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUZHOU BAIRONG SOFTWARE Co Ltd, State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd, State Grid Fujian Electric Power Co Ltd filed Critical FUZHOU BAIRONG SOFTWARE Co Ltd
Priority to CN201410509173.6A priority Critical patent/CN104199986B/zh
Publication of CN104199986A publication Critical patent/CN104199986A/zh
Application granted granted Critical
Publication of CN104199986B publication Critical patent/CN104199986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于hbase和geohash的矢量数据空间索引方法。该方法:首先,为需存储的矢量数据进行网格定级;其次,进行网格路径计算;再而,进行网格列表结构设计以及索引编码的建立;最后,对需查询的空间范围进行空间索引。本发明通过对点、线、面二维矢量数据映射到一维的字符串型rowkey索引,使之能够用hbase存储海量矢量数据,提供高性能空间查询分析服务。

Description

基于hbase和geohash的矢量数据空间索引方法
技术领域
本发明涉及涉及在hbase上进行海量GIS矢量数据空间索引编码及建立的方法,更特定言之,本发明涉及对点、线、面二维矢量数据映射到一维的字符串型rowkey索引,使之能够用hbase存储海量矢量数据,提供高性能空间查询分析服务,特别是一种基于hbase和geohash的矢量数据空间索引方法。
背景技术
随着,移动网络技术和GIS技术的快速发展,空间数据的急剧增长,海量空间数据的存储管理成为难题。
用云计算来解决空间查询的难题,成了一个新的考虑方向。近几年来,为了解决大规模数据的存储和管理的问题,许多公司和机构提出了一系列基于“云计算”技术的可扩展的大规模数据管理方案,如Bigtable、HBase、Cassandra、Hypertable等等。HBase是一个分布式的、面向列的开源数据库,它基于Hadoop这个包含了海量存储和计算的分布式系统架构,提供了在廉价PC Server上搭建起大规模结构化存储集群的能力。
目前已有许多针对空间查询的研究,并已提出了一系列解决方法,这些方法大多使用R树和倒排表相结合的混合索引结构对空间信息进行索引,以为空间查询提供支持。
相关的空间索引的专利有审批中的“基于HBase的矢量空间大数据存储方法”,该方法以所述矢量数据记录的ID作为行键RowKey,以所述矢量数据记录的数据字段和除ID以外的属性字段作为列建立数据记录,以所述矢量数据记录的空间范围编号作为行键RowKey,以所述空间范围编号下的所有矢量空间数据的ID作为列建立索引。
相关论文有“基于R树的分布式并行空间索引机制研究”,采用多层并行R树空间索引结构,以高效率的并行空间数据划分策略为基础,以经典的并行计算方法论为依据,使其结构设计在保证能够获得较好的负载平衡性能的前提下,更适合于海量空间数据的并行化处理。
现有的空间索引技术多基于R树及其变种的空间索引机制,它并不适用于动态插入数据,R树的结构会有较大的变化。
Geohash对于线、面数据的支持有一些弊端,比如若查询区域对于的划分次数过大,可能会导致查询区域包含的单元网格过多而使检索条件过于琐碎,增大数据库的压力,降低了查询效率;若查询区域对应的划分次数过小,可能会使查询区域只为某单元网格的一小部分,导致依据Geohash编码检索的结果包含太多查询区域不相交的数据,降低查准率。
发明内容
本发明的目的在于提供一种通过对点、线、面二维矢量数据映射到一维的字符串型rowkey索引,使之能够用hbase存储海量矢量数据,提供高性能空间查询分析服务的基于hbase和geohash的矢量数据空间索引方法。
为实现上述目的,本发明的技术方案是:一种基于hbase和geohash的矢量数据空间索引方法,包括如下步骤,
S1:网格定级:为需存储入Hbase数据库中的矢量数据按照点、线、面的数据分类划分网格,确定存储矢量数据的网格层数,即确定需要划分的网格数;
S2:网格路径计算:确定一个空间投影坐标系,以确定起止经度lng、lng和纬度lat、lat,并计算出每一层每个网格的长、宽度数,以便于经度lng、纬度lat与网格行号row、列号col之间的相互转换;所述网格路径计算包括点所在网格计算、线经过网格计算和面覆盖网格计算;
S3:网格列表结构设计:建立存储索引数据的空间索引表和存储矢量数据的要素表,所述空间索引表的每一行存储一个网格的矢量索引,所述要素表的每一行存储一个矢量数据;
S4:索引编码:将每个矢量数据按所述步骤S2的网格路径计算,获得网格列表,计算每个网格的geohash值,并生成空间索引表的rowkey,rowkey=空间投影坐标系编码+矢量分类编码+geohash编码,将相应要素表中的rowkey即矢量数据的要素ID写入空间索引表的列data:FIDi(i=1,2,...)中,这里不同矢量数据可能经过同一个网格,即一条索引可能包含多个要素ID,这些要素ID按照存入的顺序依次存入data:FIDi(i=1,2,...)中;
S5:空间查询:设需查询空间范围为R,根据需查询的矢量数据的空间投影坐标系编码和矢量分类编码,并根据矢量所在层求出该矢量数据在相应层上经过的网格列表,将每个网格转换为geohash编码,即可得出所需矢量数据的rowkey=空间投影坐标系编码+矢量分类编码+geohash编码;根据该rowkey查询空间索引表,得到要素ID,再用要素ID查询要素表,即可得所需的空间查询结果。
在本发明实施例中,所述步骤S2中,所述点所在网格计算的方法如下:
设网格列表中每一层每个网格的长、宽度数分别为dx、dy,则点所在网格的计算公式为:
在本发明实施例中,所述步骤S2中,所述线经过网格计算的方法如下:
设线段起点为p1,终点为p2,根据点所在网格的计算公式,计算得出p1所在网格行列号row1、col1,p2所在网格行列号row2、col2;根据行列号计算起点和终点所在网格右上角坐标(xStart,yStart)、(xEnd,yEnd)
分两种情况确定线段经过的网格:
第一种:线段处于水平或垂直位置时,即起点和终点的行号相等或者列号相等时,那么线经过的网格的行坐标为row1,列坐标为col1~col2;或者线经过的网格的行坐标为row1~row2,列坐标为col1;
第二种:线段不处于水平或垂直位置时,将终点与起点的相对位置分为四个象限,确定终点所在象限,根据线段与网格经线的交点,对比交点和网格右上角位置,若交点在网格右上角的上方,则线段经过当前格子的上一个格子;若交点在网格右上角的下方,则线段经过当前格子的右边一个格子;若交点落在网格右上角上,则线段经过当前节点的右上方格子。
在本发明实施例中,所述步骤S2中,所述面覆盖网格计算的方法如下:
获取面的最小外包矩形MBR,计算最小外包矩形MBR所经过的行号和列号的范围,再将此范围内的每一个网格与面的多边形进行两个条件的判断:①网格矩形是否与面状目标构成的多边形相交;② 网格矩形是否在面构成的多边形内;若每一个网格与面的多边形满足两个条件中的任意一个,则面经过此网格。
相较于现有技术,本发明具有以下有益效果:
1、本发明提出了使用空间对象所经过的网格路径将二维矢量数据映射到一维的geohash字符串索引的方法,从而将geohash方法进一步推广到对线、面对象的支持;
2、将空间对象的字符串索引与hbase结合,实现了对海量空间数据的分布式管理,提供高效的空间数据查询服务;
3、提出了多层索引,针对点、线、面数据的大小,分别在多种尺度上对空间对象进行层次划分,建立多层索引,从而提升了查询性能。
附图说明
图1为本发明空间查询步骤图。
图2为本发明确定线段经过的网格示意图。
图3为HBase数据模型示意图。
图4为 Geohase划分及编码示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明一种基于hbase和geohash的矢量数据空间索引方法,包括如下步骤,
S1:网格定级:为需存储入Hbase数据库中的矢量数据按照点、线、面的数据分类划分网格,确定存储矢量数据的网格层数,即确定需要划分的网格数;
S2:网格路径计算:确定一个空间投影坐标系,以确定起止经度lng、lng和纬度lat、lat,并计算出每一层每个网格的长、宽度数,以便于经度lng、纬度lat与网格行号row、列号col之间的相互转换;所述网格路径计算包括点所在网格计算、线经过网格计算和面覆盖网格计算;
所述步骤S2中,所述点所在网格计算的方法如下:
设网格列表中每一层每个网格的长、宽度数分别为dx、dy,则点所在网格的计算公式为:
所述步骤S2中,所述线经过网格计算的方法如下:
设线段起点为p1,终点为p2,根据点所在网格的计算公式,计算得出p1所在网格行列号row1、col1,p2所在网格行列号row2、col2;根据行列号计算起点和终点所在网格右上角坐标(xStart,yStart)、(xEnd,yEnd)
分两种情况确定线段经过的网格:
第一种:线段处于水平或垂直位置时,即起点和终点的行号相等或者列号相等时,那么线经过的网格的行坐标为row1,列坐标为col1~col2;或者线经过的网格的行坐标为row1~row2,列坐标为col1;
第二种:线段不处于水平或垂直位置时,将终点与起点的相对位置分为四个象限,确定终点所在象限,根据线段与网格经线的交点,对比交点和网格右上角位置,若交点在网格右上角的上方,则线段经过当前格子的上一个格子;若交点在网格右上角的下方,则线段经过当前格子的右边一个格子;若交点落在网格右上角上,则线段经过当前节点的右上方格子;
所述步骤S2中,所述面覆盖网格计算的方法如下:
获取面的最小外包矩形MBR,计算最小外包矩形MBR所经过的行号和列号的范围,再将此范围内的每一个网格与面的多边形进行两个条件的判断:①网格矩形是否与面状目标构成的多边形相交;② 网格矩形是否在面构成的多边形内;若每一个网格与面的多边形满足两个条件中的任意一个,则面经过此网格。
S3:网格列表结构设计:建立存储索引数据的空间索引表和存储矢量数据的要素表,所述空间索引表的每一行存储一个网格的矢量索引,所述要素表的每一行存储一个矢量数据;
S4:索引编码:将每个矢量数据按所述步骤S2的网格路径计算,获得网格列表,计算每个网格的geohash值,并生成空间索引表的rowkey,rowkey=空间投影坐标系编码+矢量分类编码+geohash编码,将相应要素表中的rowkey即矢量数据的要素ID写入空间索引表的列data:FIDi(i=1,2,...)中,这里不同矢量数据可能经过同一个网格,即一条索引可能包含多个要素ID,这些要素ID按照存入的顺序依次存入data:FIDi(i=1,2,...)中;
S5:空间查询:设需查询空间范围为R,根据需查询的矢量数据的空间投影坐标系编码和矢量分类编码,并根据矢量所在层求出该矢量数据在相应层上经过的网格列表,将每个网格转换为geohash编码,即可得出所需矢量数据的rowkey=空间投影坐标系编码+矢量分类编码+geohash编码;根据该rowkey查询空间索引表,得到要素ID,再用要素ID查询要素表,即可得所需的空间查询结果。
以下为本发明的具体实施例。
本发明由网格定级、网格路径计算、索引编码、表结构设计及空间查询组成,空间查询的步骤如图1所示。
1、网格定级
为矢量数据划分网格,将矢量数据冗余存储在对应网格的geohash编码中。矢量数据以点、线、面为主,考虑到,点数据可能会比较密集,可以将网格定得密集些,线数据跨度可能会比较大,可将网格定义得高层一些,面数据通常不大,网格可定义得稍密集。因此,将点数据的网格层数设计为22层,线数据的网格层数设计为17层,面数据的层数设计为20层。
、网格路径计算
确定一个空间投影坐标系,可以确定起止经、纬度(lng、lng、lat、lat),并可以计算出每一层每个格的长、宽的度数,从而经度lng、纬度lat可以和网格行号row、列号col互相转换。
2.1点所在网格计算
设点坐标(lng,lat),点所在层lod设为22,这一层每格的长宽的度数为dx、dy,点所在网格的计算公式为:
2.2线经过网格计算
线由一系列首尾相连的线段组成,对每一条线段建立了索引则相应的线状目标的索引也建立了。因此这里给出一条线段的网格计算方法。
设线段起点为p1,终点为p2,根据2.1算出p1所在网格行列号row1、col1,p2所在网格行列号row2、col2。根据行列号计算起点和终点所在网格右上角坐标(xStart,yStart)、(xEnd,yEnd)。
分两种情况确定线段经过的网格。第一种,线段处于水平或垂直位置时,即起点和终点的行号相等或者列号相等时,假设row1=row2,那么线经过的网格的行坐标为row1,列坐标为col1~col2。第二种,线段不处于水平或垂直位置时,将终点相对起点的相对位置分为四个象限,确定终点坐在象限,以第一象限为例。计算线段斜率,则线段经过一个网格的递增量,由此可以算出线段与网格经线的交点,如图2所示,。对比交点和格子右上角位置,如果交点在网格右上角的上方,则线段经过当前格子的上一个格子;如果交点在网格右上角的下方,则线段经过当前格子的右边一个格子;如果刚好交点在网格右上角上,如A’点,则线段经过当前节点的右上方格子。
2.3面覆盖网格计算
获取面的最小包围矩形MBR,计算最小包围矩形所经过的行号和列号的范围,再将这个范围内的每一个网格与面状目标的多边形进行“ 网格矩形是否与面状目标构成的多边形相交” 以及“ 网格矩形是否在面状目标构成的多边形内” 的判断,网格与面状目标相交或是在面状目标内则说明面状目标经过这个格子。
、表结构设计
3.1HBase简介:
HBase的数据模型可以定义为一种稀疏的、长期存储的、分布式的、多维排序的映射表。表中的行关键字rowkey可以是任意的字符串,对同一个行关键字的读或者写操作都是原子的,表通过rowkey的字典顺序来组织数据。表中的每个行都可以动态分区,每个分区叫做一个“Tablet”,Tablet是数据分布和负载均衡调整的最小单位。列关键字组成的集合叫做“列族”,列族是访问控制的基本单位,命名语法为:“列族:限定词”。表的每一个数据项都可以包含同一份数据的不同版本;不同版本的数据通过时间戳timestamp来索引,时间戳的类型是64位整型。映射表中通过rowkey、columnkey以及时间戳来三维索引一个cell。如图3所示。
HBase以Tablet作为数据分布和负责均衡的最小单位,并以Tablet为单位放在不同的服务器上,这样,当操作只读取行中很少几列的数据时效率很高,通常只需要很少几次机器间的通信即可完成。
具有相同rowkey前缀的数据的存放位置接近,在读取的时候,可以把这些数据一次读取出来。而数据的索引也是基于rowkey的,可以以前缀匹配的方式快速查找到rowkey索引的数据。
3.2矢量数据存储表结构
HBase按照rowkey字典序来存放数据,它的索引是建立在rowkey的基础上的。考虑矢量数据的存储,为了加快查找速度,将矢量数据按照空间位置建立rowkey索引。空间位置的编码采用Geohash实现,创建一个空间索引表,如表1所示,采用索引数据冗余的存储方式,矢量数据在所在层的所经过的每个网格都可被索引到,每个矢量数据可能在多行中被索引到,一个网格中有多条同一类的矢量数据则利用HBase可动态增加列的特点存在data的不同列。创建一个要素表,如表2所示,存储矢量数据,每个矢量数据存储一行。
空间索引表的列data:FIDi即为要素表的rowkey,要素表的rowkey=classifyCode(4位)+id,这里classifyCode为矢量分类编码,id为分类内部编码。空间索引表的rowkey=srsCode(1位)+classifyCode(4位)+geohash,这里srsCode为投影坐标系编码,classifyCode为矢量分类编码,geohash为空间位置编码点数据为22层geohash为44次划分须9位,线数据为17层geohash为34次划分须7位,面数据为20层geohash为40次划分须8位。
、索引编码
4.1编码原理
Geohash是一种地理编码,它可以把二维的经纬度坐标编码成一维的字符串,作为全球唯一的标识,可以在数据库中表达点数据。通过Geohash编码,空间上相邻的位置在编码上可能具有相同的前缀,使之在解决附近地点搜索的问题上具有明显优势。
Geohash的思想是把地球沿经度和纬度方向不断地交替进行二分,每次二分称为一次划分,把每5次划分作为一个层次。当层数为奇数时,每次划分的结果与第1层类似;当层数为偶数时,每次划分的结果与第2层类似。一直循环划分到任意精度。用0或1表示每次划分产生的区域,具体为:当沿经度方向进行二分时,左侧区域的编码为0,右侧区域的编码为1;当沿纬度方向进行二分时,下面区域的编码为0,上面区域的编码为1。Geohash的划分及编码如图4。
之后,将每5次划分的二进制编码转换成32进制编码,用数字0-9和除a、i、l、o外的英文小写字母表示,即为Geohash某一层网格的编码。Geohash采用的base32编码表,如表3。
4.2 rowkey编码
矢量数据经过网格分配路径的计算,得到一个网格列表,为列表中每个格子计算geohash值,并生成rowkey,将相应要素表的rowkey填入表1的data:FIDi。
、空间查询
假设需要查询的空间范围为R,需要查询的矢量数据的投影坐标系编码为srs,分类为classify,求出R在该矢量数剧的相应层上经过的格子列表G,将这些格子转换为geohash编码,于是可以拼出所需数据的rowkey的前缀。用这些前缀查找空间索引表可以找到G内包含的所有该分类数据,将这些数据第一遍过滤去除重复,第二遍过滤去除掉与R没有交集的,得到的即为空间查询的结果。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (4)

1.一种基于hbase和geohash的矢量数据空间索引方法,其特征在于:包括如下步骤,
S1:网格定级:为需存储入Hbase数据库中的矢量数据按照点、线、面的数据分类划分网格,确定存储矢量数据的网格层数,即确定需要划分的网格数;
S2:网格路径计算:确定一个空间投影坐标系,以确定起止经度lng、lng和纬度lat、lat,并计算出每一层每个网格的长、宽度数,以便于经度lng、纬度lat与网格行号row、列号col之间的相互转换;所述网格路径计算包括点所在网格计算、线经过网格计算和面覆盖网格计算;
S3:网格列表结构设计:建立存储索引数据的空间索引表和存储矢量数据的要素表,所述空间索引表的每一行存储一个网格的矢量索引,所述要素表的每一行存储一个矢量数据;
S4:索引编码:将每个矢量数据按所述步骤S2的网格路径计算,获得网格列表,计算每个网格的geohash值,并生成空间索引表的rowkey,rowkey=空间投影坐标系编码+矢量分类编码+geohash编码,将相应要素表中的rowkey即矢量数据的要素ID写入空间索引表的列data:FIDi(i=1,2,...)中,这里不同矢量数据可能经过同一个网格,即一条索引可能包含多个要素ID,这些要素ID按照存入的顺序依次存入data:FIDi(i=1,2,...)中;
S5:空间查询:设需查询空间范围为R,根据需查询的矢量数据的空间投影坐标系编码和矢量分类编码,并根据矢量所在层求出该矢量数据在相应层上经过的网格列表,将每个网格转换为geohash编码,即可得出所需矢量数据的rowkey=空间投影坐标系编码+矢量分类编码+geohash编码;根据该rowkey查询空间索引表,得到要素ID,再用要素ID查询要素表,即可得所需的空间查询结果。
2.根据权利要求1所述的基于hbase和geohash的矢量数据空间索引方法,其特征在于:所述步骤S2中,所述点所在网格计算的方法如下:
设网格列表中每一层每个网格的长、宽度数分别为dx、dy,则点所在网格的计算公式为:
3.根据权利要求2所述的基于hbase和geohash的矢量数据空间索引方法,其特征在于:所述步骤S2中,所述线经过网格计算的方法如下:
设线段起点为p1,终点为p2,根据点所在网格的计算公式,计算得出p1所在网格行列号row1、col1,p2所在网格行列号row2、col2;根据行列号计算起点和终点所在网格右上角坐标(xStart,yStart)、(xEnd,yEnd),
分两种情况确定线段经过的网格:
第一种:线段处于水平或垂直位置时,即起点和终点的行号相等或者列号相等时,那么线经过的网格的行坐标为row1,列坐标为col1~col2;或者线经过的网格的行坐标为row1~row2,列坐标为col1;
第二种:线段不处于水平或垂直位置时,将终点与起点的相对位置分为四个象限,确定终点所在象限,根据线段与网格经线的交点,对比交点和网格右上角位置,若交点在网格右上角的上方,则线段经过当前格子的上一个格子;若交点在网格右上角的下方,则线段经过当前格子的右边一个格子;若交点落在网格右上角上,则线段经过当前节点的右上方格子。
4.根据权利要求3所述的基于hbase和geohash的矢量数据空间索引方法,其特征在于:所述步骤S2中,所述面覆盖网格计算的方法如下:
获取面的最小外包矩形MBR,计算最小外包矩形MBR所经过的行号和列号的范围,再将此范围内的每一个网格与面的多边形进行两个条件的判断:①网格矩形是否与面状目标构成的多边形相交;② 网格矩形是否在面构成的多边形内;若每一个网格与面的多边形满足两个条件中的任意一个,则面经过此网格。
CN201410509173.6A 2014-09-29 2014-09-29 基于hbase和geohash的矢量数据空间索引方法 Active CN104199986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410509173.6A CN104199986B (zh) 2014-09-29 2014-09-29 基于hbase和geohash的矢量数据空间索引方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410509173.6A CN104199986B (zh) 2014-09-29 2014-09-29 基于hbase和geohash的矢量数据空间索引方法

Publications (2)

Publication Number Publication Date
CN104199986A CN104199986A (zh) 2014-12-10
CN104199986B true CN104199986B (zh) 2017-06-06

Family

ID=52085279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410509173.6A Active CN104199986B (zh) 2014-09-29 2014-09-29 基于hbase和geohash的矢量数据空间索引方法

Country Status (1)

Country Link
CN (1) CN104199986B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918461A (zh) * 2019-01-28 2019-06-21 北京瓴域航空技术研究院有限公司 一种多维度的网格空域应用方法及系统

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022790B (zh) * 2015-06-19 2018-04-06 中国科学院遥感与数字地球研究所 一种面向对象的城市实体地理编码整合方法
CN104915450B (zh) * 2015-07-01 2017-11-28 武汉大学 一种基于HBase的大数据存储与检索方法及系统
CN106649359B (zh) * 2015-10-30 2021-05-18 方正国际软件(北京)有限公司 一种空间点数据的处理方法及装置
CN105760529B (zh) * 2016-03-03 2018-12-25 福州大学 一种移动端矢量数据的空间索引和缓存构建方法
CN106156332B (zh) * 2016-07-06 2020-01-31 中电福富信息科技有限公司 基于选定时间段及选定区域筛选进出车辆的方法
CN106649425B (zh) * 2016-08-01 2019-12-17 中国地质大学(武汉) 一种顾及空间邻近性的矢量空间数据编码方法
CN106844534B (zh) * 2016-12-30 2019-11-22 西安电子科技大学 面向NoSQL数据库的将地理空间数据一维化的GeoHash编码方法
CN106991149B (zh) * 2017-03-28 2020-11-10 桂林电子科技大学 一种融合编码和多版本数据的海量空间对象存储方法
CN107273414B (zh) * 2017-05-05 2019-01-22 广州恒巨信息科技有限公司 一种基于地理位置的搜索方法
CN107423422B (zh) * 2017-08-01 2019-09-24 武大吉奥信息技术有限公司 基于网格的空间数据分布式存储及检索方法和系统
CN107766433B (zh) * 2017-09-19 2021-05-14 昆明理工大学 一种基于Geo-BTree的范围查询方法及装置
CN107943927B (zh) * 2017-11-21 2018-10-16 清华大学 一种分布式存储系统中多维数据的存储模式转换方法
CN108804602A (zh) * 2018-05-25 2018-11-13 武汉大学 一种基于spark的分布式空间数据存储计算方法
CN108920684B (zh) * 2018-07-11 2021-03-23 中国科学院地理科学与资源研究所 一种科技资源空间数据整编方法和系统
CN109063194A (zh) * 2018-08-30 2018-12-21 广东南方数码科技股份有限公司 基于空间编码的数据检索方法及装置
CN109614454B (zh) * 2018-11-26 2020-12-01 武汉大学 一种基于mpi的矢量大数据并行空间叠置分析方法
CN109597922B (zh) * 2019-01-03 2023-02-28 北京顺源开华科技有限公司 时区确定方法、装置、可穿戴设备及系统
CN110059067B (zh) * 2019-04-04 2022-09-27 南京南瑞水利水电科技有限公司 一种水利空间矢量大数据存储管理方法
CN109992640B (zh) * 2019-04-11 2021-04-23 北京百度网讯科技有限公司 位置网格的确定方法及装置、设备及存储介质
CN110175175B (zh) * 2019-05-29 2023-05-09 大连大学 一种基于spark的分布式空间二级索引与范围查询算法
CN110297952B (zh) * 2019-06-05 2021-12-21 西南交通大学 一种基于网格索引的并行化高速铁路勘测数据检索方法
CN110309974B (zh) * 2019-06-28 2022-08-09 江苏满运软件科技有限公司 物流运输目的地预测方法、装置、电子设备、存储介质
CN110765331B (zh) * 2019-07-08 2024-03-26 中国人民解放军战略支援部队信息工程大学 一种时空数据的检索方法及系统
CN111737375B (zh) * 2019-10-14 2022-06-07 北部湾大学 一种基于Geohash分区的区域内容空间对象索引方法
CN110825830B (zh) * 2019-10-30 2022-05-27 广州海格星航信息科技有限公司 一种网格空间的数据检索方法
CN110990512B (zh) * 2019-11-29 2021-06-29 农业农村部规划设计研究院 矢量要素与行政区域全覆盖检查的方法和装置
CN111130569B (zh) * 2019-12-17 2021-11-30 佛山科学技术学院 一种空间信息数据自适应容错处理方法及系统
CN111125119A (zh) * 2019-12-30 2020-05-08 中科星图股份有限公司 一种基于HBase的时空数据存储与索引方法
CN111563080A (zh) * 2020-04-09 2020-08-21 农业农村部规划设计研究院 一种空间数据索引和拓扑方法、装置及存储介质
CN112685616A (zh) * 2020-12-22 2021-04-20 北京旋极伏羲科技有限公司 一种基于空间网格和建筑信息模型的精准化电力部件管理方法
CN113626437B (zh) * 2021-08-09 2022-04-01 北京东方通科技股份有限公司 一种海量矢量数据快速查询方法及系统
CN113626448B (zh) * 2021-10-12 2021-12-24 武大吉奥信息技术有限公司 基于HBase分布式存储的空间矢量数据索引与查询方法
CN115794938B (zh) * 2023-02-06 2023-04-28 中国人民解放军国防科技大学 地理矢量线数据的可视化方法、装置和计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116610A (zh) * 2013-01-23 2013-05-22 浙江大学 基于HBase的矢量空间大数据存储方法
CN103473267A (zh) * 2013-08-09 2013-12-25 深圳市中科新业信息科技发展有限公司 数据存储查询方法及系统
CN104008212A (zh) * 2014-06-23 2014-08-27 中国科学院重庆绿色智能技术研究院 一种地理位置信息相关联的物联网时间序列数据存取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116610A (zh) * 2013-01-23 2013-05-22 浙江大学 基于HBase的矢量空间大数据存储方法
CN103473267A (zh) * 2013-08-09 2013-12-25 深圳市中科新业信息科技发展有限公司 数据存储查询方法及系统
CN104008212A (zh) * 2014-06-23 2014-08-27 中国科学院重庆绿色智能技术研究院 一种地理位置信息相关联的物联网时间序列数据存取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HBase下时态信息索引策略研究;陈磊等;《广东工业大学学报》;20140919;第31卷(第3期);全文 *
HGrid:A Data Model for Large Geospatial Data Sets in HBase;Dan Han etc.;《Cloud Computing(CLOUD),2013 IEEE Sixth International Conference on》;20140217;全文 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918461A (zh) * 2019-01-28 2019-06-21 北京瓴域航空技术研究院有限公司 一种多维度的网格空域应用方法及系统
CN109918461B (zh) * 2019-01-28 2020-10-30 北京瓴域航空技术研究院有限公司 一种多维度的网格空域应用方法

Also Published As

Publication number Publication date
CN104199986A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN104199986B (zh) 基于hbase和geohash的矢量数据空间索引方法
CN107423368B (zh) 一种非关系数据库中的时空数据索引方法
CN104281701B (zh) 分布式多尺度空间数据查询方法及系统
Han et al. Hgrid: A data model for large geospatial data sets in hbase
CN107153711A (zh) 地理信息数据处理方法及装置
CN109992636A (zh) 时空编码方法、时空索引及查询方法及装置
CN105630968B (zh) 面向Cassandra的分布式可扩展四叉树索引方法
CN106528773A (zh) 一种基于Spark平台支持空间数据管理的图计算系统及方法
CN108804602A (zh) 一种基于spark的分布式空间数据存储计算方法
CN106909644A (zh) 一种面向海量遥感影像的多级组织和索引方法
CN106503196B (zh) 云环境下可扩展存储索引结构的构建和查询方法
CN107766433A (zh) 一种基于Geo‑BTree的范围查询方法及装置
CN107515952A (zh) 点云数据存储、并行计算和实时检索的方法及其系统
CN106933833A (zh) 一种基于空间索引技术的位置信息快速查询方法
CN106991149B (zh) 一种融合编码和多版本数据的海量空间对象存储方法
CN103377237B (zh) 高维数据的近邻搜索方法以及快速近似图像搜索方法
CN109492060A (zh) 一种基于MBTiles的地图瓦片存储方法
CN110147377A (zh) 大规模空间数据环境下基于二级索引的通用查询算法
Du et al. Spatio-temporal data index model of moving objects on fixed networks using hbase
CN111104457A (zh) 基于分布式数据库的海量时空数据管理方法
CN107391745A (zh) 大规模空间数据分级快速索引方法和装置
CN110069500A (zh) 一种非关系型数据库动态混合索引方法
Amirkhanyan et al. Real-time clustering of massive geodata for online maps to improve visual analysis
CN116775661A (zh) 基于北斗网格技术的空间大数据存储与管理方法
CN107679127A (zh) 基于地理位置的点云信息并行提取方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant