CN108614836A - 一种基于Hbase的时空数据管理方法 - Google Patents
一种基于Hbase的时空数据管理方法 Download PDFInfo
- Publication number
- CN108614836A CN108614836A CN201611145919.5A CN201611145919A CN108614836A CN 108614836 A CN108614836 A CN 108614836A CN 201611145919 A CN201611145919 A CN 201611145919A CN 108614836 A CN108614836 A CN 108614836A
- Authority
- CN
- China
- Prior art keywords
- sensor
- timeslice
- hbase
- time
- temporal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于Hbase的时空数据管理方法,用于Hbase数据库内传感器数据的管理,该Hbase数据库包括两级索引结构,第一级索引结构为时间片索引树,第二级索引结构为时间片内的时空索引树,时空索引树采用四维R树,所述四维R树的四维信息分别为传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据,该方法包括基于两级索引结构的传感器数据存储方法和传感器数据检索方法。与现有技术相比,本发明具有高扩展性、高可用、支持高效时空检索的优点。
Description
技术领域
本发明涉及一种时空检索方法,尤其是涉及一种基于Hbase的时空数据管理方法。
背景技术
NoSQL,泛指非关系型的数据库。NoSQL数据库的四大分类:键值存储数据库、列存储数据库、文档型数据库和图形数据库,NoSQL数据库在以下的这几种情况下比较适用:1、数据模型比较简单;2、需要灵活性更强的IT系统;3、对数据库性能要求较高;4、不需要高度的数据一致性;5、对于给定key,比较容易映射复杂值的环境。
HBase是一个分布式的、面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
城市传感数据具有以下特性:①海量性、②结点及采样数据的异构性、③时空相关性。针对于传感数据的海量性,传统的关系型数据库的可扩展性差,但是常用的NoSQL数据库的检索能力较差,故针对于城市传感数据,本发明提出一种基于Hbase的时空数据管理方法。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于Hbase的时空数据管理方法,具有高扩展性、高可用、支持高效时空检索的优点。
本发明的目的可以通过以下技术方案来实现:
一种基于Hbase的时空数据管理方法,用于Hbase数据库内传感器数据的管理,该Hbase数据库包括两级索引结构,第一级索引结构为时间片索引树,第二级索引结构为时间片内的时空索引树,时空索引树采用四维R树,所述四维R树的四维信息分别为传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据,该方法包括基于两级索引结构的传感器数据存储方法和传感器数据检索方法。
所述基于两级索引结构的传感器数据存储方法包括以下步骤:
设置Δt为时间片的间隔长度,以每个时间片内的时间片采样时间和传感器的标志ID作为行主键rowkey,以每个时间片内的传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据建立四维R树,并作为列值value,得到索引表table_idx,即时间片索引树,经历时间间隔Δh后,将索引表table_idx存入Hbase数据库;
建立索引表table_idx的同时,建立数据表table,数据表table以传感器的采样时间、传感器的空间三维坐标以及传感器的标志ID打包作为行主键rowkey,传感器数据作为列值value,存入Hbase数据库。
所述基于两级索引结构的传感器数据检索方法包括基于时间片索引树的时间检索检索方法和基于时间片索引树和四维R树的时空检索方法。
所述基于时间片索引树的时间检索检索方法为:时间检索时,根据检索的时间范围定位到索引表table_idx内的列值value,作为时间检索结果。
所述基于时间片索引树和四维R树的时空检索方法为:时空检索时,根据检索的时间范围定位到索引表table_idx内的列值value,利用列值value中的四维R树进行空间检索,根据空间检索到的结果在数据表table内获取相应的传感器数据,作为空间检索结果。
与现有技术相比,本发明具有以下优点:
1)设置两级索引结构,用于Hbase数据库内大数据(传感器数据)的管理,利用时间片索引树可快速定位到相应的时间片,利用时空索引树可实现时空数据的检索,检索效率高,克服现有的NoSQL数据的检索能力差的缺陷。
2)设置Δt为时间片的间隔长度,建立各间隔长度内的索引表table_idx,经历时间间隔Δh后,将索引表table_idx存入Hbase数据库,实现分布式存储,具有高扩展性,克服传统关系型数据库的扩展性差的缺陷。
3)现有的Hbase存储,是以key-value的方式进行存储的,通过key值来检索数据,无法实现时空检索。本发明以传感器数据的采样时间和传感器的空间三维坐标,建立四维R树,支持高效时空检索。
4)索引表table_idx与数据表table分开存储,适用于不同的检索需求,当需要时间检索时,利用Hbase表特性,定位到索引表的value值,即存储的包含时间和空间value,当需要时空检索时,再根据R树的特性进行空间检索,再获取数据表内相应的数据,层次清晰,通用性好,适用范围广。
附图说明
图1为本发明方法存储传感器数据过程的示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
一种基于Hbase的时空数据管理方法,用于Hbase数据库内传感器数据的管理,该Hbase数据库包括两级索引结构,第一级索引结构为时间片索引树,时间片索引树为以时间片段为基础建立的索引树,第二级索引结构为时间片内的时空索引树,时空索引树采用四维R树,四维R树的四维信息分别为传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据,该方法包括基于两级索引结构的传感器数据存储方法和传感器数据检索方法。
基于两级索引结构的传感器数据存储方法包括以下步骤:
如图1所示,传感器采集并发送数据date,记t0为时间片Slice1数据传入的初始时刻,设置Δt为时间片的间隔长度,以每个时间片内的时间片采样时间和传感器的标志ID作为行主键rowkey,以每个时间片内的传感器的标志ID、传感器的采样时间、传感器的空间三维坐标(x,y,z)和传感器数据建立四维R树,并作为列值value,得到索引表table_idx,即时间片索引树,对应图1中的区块Spatialindex,经历时间间隔Δh后,将索引表table_idx存入Hbase数据库,四维R树为四维存储结构,四维R树内的传感器数据对应的具体数值需存储在数据表table中;
建立索引表table_idx的同时,建立数据表table,数据表table以传感器的采样时间、传感器的空间三维坐标(x,y,z)以及传感器的标志ID打包作为行主键rowkey,传感器数据对应的具体数值作为列值value,存入Hbase数据库。
传感器的空间三维坐标(x,y,z)是传感器部署地点的经度、维度和海拔信息。
基于两级索引结构的传感器数据检索方法包括基于时间片索引树的时间检索检索方法和基于时间片索引树和四维R树的时空检索方法。
基于时间片索引树的时间检索检索方法为:时间检索时,因Hbase的区块是根据时间进行有序分布的,输入检索开始和结束的时间,以此时间范围进行检索,利用Hbase表特性,定位到索引表table_idx内的列值value(存储的包含时间和空间value),作为时间检索结果。
基于时间片索引树和四维R树的时空检索方法为:时空检索时,输入检索开始和结束的时间,以此时间范围进行检索,利用Hbase表特性,定位到索引表table_idx内的列值value,value值是以R树的原理进行存储的,利用列值value中的四维R树进行空间检索,得到相应的传感器的ID、采样时间和传感器的空间三维坐标,根据空间检索到的传感器数据的的ID、采样时间和传感器的空间三维坐标在数据表table内获取相应的传感器数据对应的具体数值,作为空间检索结果。索引表只存储时间空间信息,没有存放任何可直接读取的数据,可去读取的数据是存放在数据表中的,时空检索最后定位的还是数据。
Claims (5)
1.一种基于Hbase的时空数据管理方法,其特征在于,用于Hbase数据库内传感器数据的管理,该Hbase数据库包括两级索引结构,第一级索引结构为时间片索引树,第二级索引结构为时间片内的时空索引树,时空索引树采用四维R树,所述四维R树的四维信息分别为传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据,该方法包括基于两级索引结构的传感器数据存储方法和传感器数据检索方法。
2.根据权利要求1所述的一种基于Hbase的时空数据管理方法,其特征在于,所述基于两级索引结构的传感器数据存储方法包括以下步骤:
设置Δt为时间片的间隔长度,以每个时间片内的时间片采样时间和传感器的标志ID作为行主键rowkey,以每个时间片内的传感器的标志ID、传感器的采样时间、传感器的空间三维坐标和传感器数据建立四维R树,并作为列值value,得到索引表table_idx,即时间片索引树,经历时间间隔Δh后,将索引表table_idx存入Hbase数据库;
建立索引表table_idx的同时,建立数据表table,数据表table以传感器的采样时间、传感器的空间三维坐标以及传感器的标志ID打包作为行主键rowkey,传感器数据对应的具体数值作为列值value,存入Hbase数据库。
3.根据权利要求2所述的一种基于Hbase的时空数据管理方法,其特征在于,所述基于两级索引结构的传感器数据检索方法包括基于时间片索引树的时间检索检索方法和基于时间片索引树和四维R树的时空检索方法。
4.根据权利要求3所述的一种基于Hbase的时空数据管理方法,其特征在于,所述基于时间片索引树的时间检索检索方法为:时间检索时,根据检索的时间范围定位到索引表table_idx内的列值value,作为时间检索结果。
5.根据权利要求3所述的一种基于Hbase的时空数据管理方法,其特征在于,所述基于时间片索引树和四维R树的时空检索方法为:时空检索时,根据检索的时间范围定位到索引表table_idx内的列值value,利用列值value中的四维R树进行空间检索,根据空间检索到的结果在数据表table内获取相应的传感器数据对应的具体数值,作为空间检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611145919.5A CN108614836A (zh) | 2016-12-13 | 2016-12-13 | 一种基于Hbase的时空数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611145919.5A CN108614836A (zh) | 2016-12-13 | 2016-12-13 | 一种基于Hbase的时空数据管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108614836A true CN108614836A (zh) | 2018-10-02 |
Family
ID=63643374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611145919.5A Pending CN108614836A (zh) | 2016-12-13 | 2016-12-13 | 一种基于Hbase的时空数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108614836A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110737807A (zh) * | 2019-10-18 | 2020-01-31 | 深圳市华宝电子科技有限公司 | 一种数据存储方法、行车记录仪、服务器和存储介质 |
CN112100525A (zh) * | 2020-11-02 | 2020-12-18 | 中国人民解放军国防科技大学 | 多源异构航天信息资源存储方法、检索方法和装置 |
WO2023232120A1 (zh) * | 2022-06-02 | 2023-12-07 | 阿里云计算有限公司 | 数据处理方法、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101241511A (zh) * | 2008-03-05 | 2008-08-13 | 北京邮电大学 | 一种基于时空数据的快速索引方法 |
CN103324642A (zh) * | 2012-03-23 | 2013-09-25 | 日电(中国)有限公司 | 为数据建立索引的系统和方法以及数据查询方法 |
CN104090949A (zh) * | 2014-07-02 | 2014-10-08 | 河海大学 | 面向水利数据整合与共享的索引方法 |
CN104331432A (zh) * | 2014-10-22 | 2015-02-04 | 江苏瑞中数据股份有限公司 | 一种适用于截面访问模式的电网海量时序数据存取方法 |
CN104731922A (zh) * | 2015-03-26 | 2015-06-24 | 江苏物联网研究发展中心 | 基于分布式数据库HBase的结构化数据的快速检索系统及方法 |
CN104750708A (zh) * | 2013-12-27 | 2015-07-01 | 华为技术有限公司 | 一种时空数据的索引建立方法、查询方法、装置及设备 |
CN105426506A (zh) * | 2015-11-27 | 2016-03-23 | 中国科学院重庆绿色智能技术研究院 | 一种海量动态数据管理方法 |
CN105608126A (zh) * | 2015-12-16 | 2016-05-25 | 成都创智云科技股份有限公司 | 一种建立海量数据库二级索引的方法和装置 |
-
2016
- 2016-12-13 CN CN201611145919.5A patent/CN108614836A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101241511A (zh) * | 2008-03-05 | 2008-08-13 | 北京邮电大学 | 一种基于时空数据的快速索引方法 |
CN103324642A (zh) * | 2012-03-23 | 2013-09-25 | 日电(中国)有限公司 | 为数据建立索引的系统和方法以及数据查询方法 |
CN104750708A (zh) * | 2013-12-27 | 2015-07-01 | 华为技术有限公司 | 一种时空数据的索引建立方法、查询方法、装置及设备 |
CN104090949A (zh) * | 2014-07-02 | 2014-10-08 | 河海大学 | 面向水利数据整合与共享的索引方法 |
CN104331432A (zh) * | 2014-10-22 | 2015-02-04 | 江苏瑞中数据股份有限公司 | 一种适用于截面访问模式的电网海量时序数据存取方法 |
CN104731922A (zh) * | 2015-03-26 | 2015-06-24 | 江苏物联网研究发展中心 | 基于分布式数据库HBase的结构化数据的快速检索系统及方法 |
CN105426506A (zh) * | 2015-11-27 | 2016-03-23 | 中国科学院重庆绿色智能技术研究院 | 一种海量动态数据管理方法 |
CN105608126A (zh) * | 2015-12-16 | 2016-05-25 | 成都创智云科技股份有限公司 | 一种建立海量数据库二级索引的方法和装置 |
Non-Patent Citations (1)
Title |
---|
类兴邦等: "《基于融合数据库的海量传感器信息存储架构》", 《计 算 机 科 学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110737807A (zh) * | 2019-10-18 | 2020-01-31 | 深圳市华宝电子科技有限公司 | 一种数据存储方法、行车记录仪、服务器和存储介质 |
CN112100525A (zh) * | 2020-11-02 | 2020-12-18 | 中国人民解放军国防科技大学 | 多源异构航天信息资源存储方法、检索方法和装置 |
WO2023232120A1 (zh) * | 2022-06-02 | 2023-12-07 | 阿里云计算有限公司 | 数据处理方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101516B (zh) | 一种数据查询方法和服务器 | |
CN104750681B (zh) | 一种海量数据的处理方法及装置 | |
Sharma et al. | Performance analysis of RDBMS and no SQL databases: PostgreSQL, MongoDB and Neo4j | |
CN106779417A (zh) | 工程勘察信息数字化采集、管理及综合应用方法 | |
CN103294790B (zh) | 一种面向gps轨迹数据的时空语义索引与检索方法 | |
Holzschuher et al. | Querying a graph database–language selection and performance considerations | |
CN108614836A (zh) | 一种基于Hbase的时空数据管理方法 | |
CN103440350B (zh) | 一种基于八叉树的三维数据检索方法及装置 | |
CN112214472B (zh) | 气象格点数据的存储及查询方法、装置及存储介质 | |
US11860846B2 (en) | Methods, systems and apparatus to improve spatial-temporal data management | |
CN109299202B (zh) | 一种基于GeoSciML的地质空间数据共享方法 | |
CN106933833A (zh) | 一种基于空间索引技术的位置信息快速查询方法 | |
CN103795811A (zh) | 一种基于元数据保存存储信息及统计管理数据的方法 | |
CN104021210B (zh) | 以GeoJSON格式半结构化方式存储地理数据的MongoDB集群的地理数据读写方法 | |
CN104008209B (zh) | 以GeoJSON格式结构化方式存储地理数据的MongoDB集群的地理数据读写方法 | |
CN106648977A (zh) | 一种安卓系统文件的恢复方法及装置 | |
de Souza Baptista et al. | NoSQL geographic databases: an overview | |
CN104408183B (zh) | 数据系统的数据导入方法和装置 | |
WO2016136189A1 (ja) | Sarデータ検索装置、方法および記録媒体 | |
CN108804625A (zh) | 一种lsm树的优化方法、装置及计算机设备 | |
CN104778212A (zh) | 地图数据生成方法和装置、地图数据读取方法和装置 | |
CN105205095B (zh) | 一种非规则格网数据的快速存储与查询方法 | |
CN110019518B (zh) | 数据处理方法及设备 | |
US10282376B2 (en) | Semi-structured spatial data conversion | |
CN107480220B (zh) | 一种基于在线聚集的快速文本查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181002 |
|
RJ01 | Rejection of invention patent application after publication |