CN102799679B - 基于Hadoop的海量空间数据索引更新系统及方法 - Google Patents

基于Hadoop的海量空间数据索引更新系统及方法 Download PDF

Info

Publication number
CN102799679B
CN102799679B CN201210255699.7A CN201210255699A CN102799679B CN 102799679 B CN102799679 B CN 102799679B CN 201210255699 A CN201210255699 A CN 201210255699A CN 102799679 B CN102799679 B CN 102799679B
Authority
CN
China
Prior art keywords
index
index file
node
module
leaf node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210255699.7A
Other languages
English (en)
Other versions
CN102799679A (zh
Inventor
冯钧
韦冕
唐志贤
徐黎明
顾忠国
朱忠华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Aerial View Wilch Space Technology Co.,Ltd.
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201210255699.7A priority Critical patent/CN102799679B/zh
Publication of CN102799679A publication Critical patent/CN102799679A/zh
Application granted granted Critical
Publication of CN102799679B publication Critical patent/CN102799679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于Hadoop的海量空间数据索引更新系统及方法,属于信息技术处理领域。所述系统包括:数据更新模块、索引操作缓存模块、索引文件更新模块、索引文件创建模块、索引文件读取模块。所述方法中:数据更新模块用于获取空间数据的更新情况,并将相应的索引更新信息写入索引操作缓存模块;索引文件创建模块用于按照索引节点为单位在磁盘上创建物理文件;索引更新模块再利用索引读取模块读取的节点信息对比索引缓存的节点信息,将满足条件的索引节点信息写入新索引文件。本发明解决了由于Hadoop平台仅支持对文件的追加写操作而造成对更新频繁的动态空间数据支持不足的问题,实时可靠地更新Hadoop平台中空间索引信息。

Description

基于Hadoop的海量空间数据索引更新系统及方法
技术领域
本发明涉及基于Hadoop的海量空间数据索引更新系统及方法,属于信息技术处理领域。
背景技术
随着信息技术的飞速发展,地理信息系统(GIS)、计算机辅助设计与制造(CAD/CAM)、数字化城市、定位服务等领域等处理的空间数据急剧增加;鉴于海量空间数据及其查询处理的复杂性,传统的集中式数据存储与处理方法已经无法满足这些领域应用程序的需求。云计算技术是近年来计算机领域出现的具有很好可扩展性的处理大规模计算的新技术;其建立在大量廉价硬件之上的分布式文件系统,能提供高吞吐量的数据访问;其MapReduce并行计算框架采用“分而治之”的思想,将大量的数据操作分散给各个计算节点并行处理,达到提高整个云计算平台处理能力的目的。云计算所具备的高伸缩性、高扩展性、高容错性和强大并行处理能力使其成为海量数据高效存储与处理的理想方案。作为开源的云计算平台,Hadoop以其扩容能力强、成本低廉、效率高、高可靠性、免费及良好的可移植性等优点,迅速成为当前热门的分布式计算框架和大规模数据存储解决方案。
空间数据索引是空间数据查询与处理的基础,其性能是影响数据服务质量的关键因素,如何高效地索引海量空间数据,一直是数据库领域的研究热点。但是,Hadoop的分布式文件系统(HDFS)仅支持对文件的追加写操作,对于更新频繁的动态数据,传统的随机读写磁盘更新索引的方式不再适用于HDFS,必须针对HDFS的特点进行索引更新策略的设计。
发明内容
本发明所要解决的技术问题是针对HDFS不支持随机写文件,提供了基于Hadoop的海量空间数据索引更新系统及方法。
本发明为实现上述发明目的采用如下技术方案:
基于Hadoop的海量空间数据索引更新系统,包括:数据更新模块、索引操作缓存模块、索引文件更新模块、索引文件创建模块、索引文件读取模块;其中:所述数据更新模块的输入端接收空间数据更新信息,输出端与索引操作缓存模块的输入端连接;所述索引文件更新模块的第一输入端与所述索引文件读取模块的输出端连接,第二输入端与索引操作缓存模块的输出端连接,输出端与所述索引文件创建模块的输入端连接;所述索引文件创建模块的输出端输出新建的索引文件;
所述数据更新模块用于获取空间数据的更新信息,并将与空间数据更新信息相应的索引更新信息写入索引操作缓存模块;
所述索引操作缓存模块用于缓存与空间数据更新信息相应的索引更新信息;
所述索引文件读取模块用于读取原索引文件;
所述索引文件更新模块用于获取原索引节点,再与索引操作缓存模块中的索引更新信息对比,得到待创建新索引文件的内部节点信息、叶节点信息;
所述索引文件创建模块用于创建新索引文件。
基于Hadoop的海量空间数据索引更新方法,包括如下步骤:
步骤A,数据更新模块获取空间数据的更新信息;
步骤B,索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存中,并判断索引操作缓存容量;
步骤C,重复步骤A至步骤B,直至索引操作缓存容量已满,进入步骤D;
步骤D,索引文件创建模块创建新索引文件,所述新索引文件仅包含头文件信息;
步骤E,创建新索引节点的根节点:索引文件更新模块将原始索引文件中的根节点信息写入步骤D所创建的新索引文件中;
步骤F,创建新索引文件的内部节点,具体包含如下步骤:
步骤F-1,索引文件读取模块逐个读取原索引文件内部节点:
若索引操作缓存模块存储有所述原索引文件内部节点的ID,将与索引操作缓存模块中存储的ID相对应的内部节点信息写入所述新索引文件;
否则,将从原索引文件中读取的内部节点信息写入所述新索引文件;
步骤F-2,遍历索引操作缓存模块中所有新增加的内部节点,依次写入新增加的内部节点至新索引文件中;
步骤G,创建新索引文件的叶节点,具体包含如下步骤:
步骤G-1,索引文件更新模块逐个读取原索引文件叶节点:
若索引操作缓存模块存储有所述原索引文件叶节点的ID,将与索引操作缓存模块中存储的ID相对应的叶节点信息写入所述新索引文件;
否则,将从原索引文件中读取的叶节点信息写入所述新索引文件;
步骤G-2,遍历索引操作缓存模块中所有新增加的叶节点,依次写入新增加的叶节点至新索引文件中;
步骤H,索引文件更新模块用新索引文件替换原索引文件,并删除原索引文件。
所述基于Hadoop的海量空间数据索引更新方法的步骤B中,索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存的具体实施如下:
步骤B-1,判断更新的空间数据对应的索引节点更新类型:若为叶节点分裂,则进入步骤B-2:若为叶节点合并,则进入步骤B-3;
步骤B-2,更新待分裂叶节点L0对应的索引信息,具体包含如下步骤:
步骤B-2-1,新增4个叶节点的磁盘页,依次给4个叶节点磁盘页编号,删除分裂叶节点L0的磁盘页;
步骤B-2-2,新建一个内部节点I0的磁盘页,并将内部节点I0中4个子节点的指针指向步骤B-2-1新增的4个叶节点;
步骤B-2-3,将分裂叶节点L0父节点中指向分裂叶节点L0的指针,指向步骤B-2-2新建的内部节点I0
步骤B-2-4,将分裂后得到的各节点的信息写入索引操作缓存模块;
步骤B-3,更新待合并叶节点对应的索引信息,具体包含如下步骤:
步骤B-3-1,新建一个叶节点磁盘页,所述磁盘页包含所述待合并叶节点的空间点;
步骤B-3-2,删除所述待合并叶节点的磁盘页,删除所述待合并叶节点的父节点(NP)的磁盘页;
步骤B-3-3,将指向待合并叶节点的父节点(NP)的指针,指向步骤B-3-1中新建的叶节点;
步骤B-3-4,将步骤B-3-3中所述的叶节点信息写入索引操作缓存模块。
本发明采用上述技术方案,具有以下有益效果:解决了Hadoop分布式文件系统中不支持随机写文件的问题,提供了一种高效的更新索引文件的方法,保证了Hadoop平台中空间索引更新的实时性与可靠性。
附图说明
图1为基于Hadoop海量空间数据索引更新系统的结构图。
图2为基于Hadoop海量空间数据索引更新方法流程图。
图3为基于Hadoop海量空间数据索引的逻辑结构图。
图4为Hadoop平台中的四叉树索引更新系统与其他应用的交互示意图。
图5为基于Hadoop的海量空间数据四叉树索引文件的物理格式。
图6为基于Hadoop的海量空间数据四叉树索引文件的文件头格式。
图7为基于Hadoop的海量空间数据四叉树索引文件的内部节点格式。
图8为基于Hadoop的海量空间数据四叉树索引文件的叶节点格式。
图9为叶节点分裂引起索引文件变化的示意图。
图10为叶节点合并引起索引文件变化的示意图。
具体实施方式
下面结合附图对发明的技术方案进行详细说明:
如图1所示,本发明所涉及基于Hadoop的海量空间数据索引更新系统,包括:数据更新模块、索引操作缓存模块、索引文件更新模块、索引文件创建模块、索引文件读取模块。数据更新模块的输入端接收空间数据更新信息,输出端与索引操作缓存模块的输入端连接。索引文件更新模块的第一输入端与所述索引文件读取文件的输出端连接,第二输入端与索引操作缓存模块的输出端连接,输出端与所述索引文件创建模块的输入端连接。索引文件创建模块的输出端输出新建的索引文件。
数据更新模块用于获取空间数据的更新信息,并将与空间数据更新信息相应的索引更新信息写入索引操作缓存模块。
索引操作缓存模块用于缓存与空间数据更新信息相应的索引更新信息。索引操作缓存由5个类组成,用来表示3种更新操作。5个类如下:
AddLeaf:增加叶节点的操作;
DelLeaf:删除叶节点的操作;
AddInter:增加内部节点的操作;
DelInter:删除内部节点的操作;
ModLeaf:更新叶节点中空间点信息;
每个类都包含一个HashMap类成员变量,用于保存索引节点增删操作,key为原节点ID,新建节点的原节点ID为0,value为更改后的索引节点对象(叶节点分裂成为内部节点、内部节点合并成为叶节点)。则索引的更新操作可以用这五个类的一系列操作表示:
插入空间点引起节点分裂:
DelLeaf.add(原叶节点);AddInter.add(内部节点);4次AddLeaf.add(叶节点);
删除空间点引起节点合并:
4次DelLeaf.add(叶节点);DelInter.add(原内部节点);AddInter.add(原内部节点);
插入或删除空间点节点未分裂、合并:
ModLeaf.add(更改的叶节点);
所有缓存类的容量相同,只要有一个缓存容量满了,则开始更新索引操作;
索引文件读取模块用于读取原索引文件。
索引文件更新模块用于获取原索引节点,再与索引操作缓存模块中的索引更新信息对比,得到待创建新索引文件的内部节点信息、叶节点信息。
索引文件创建模块用于以索引节点为单位在磁盘上创建物理文件。新索引文件格式同原来的索引文件格式,包括文件头和节点信息部分。具体的索引文件格式如图4和图5所示。图4描述的是索引文件整体结构:文件头、内部节点和叶节点。图5描述的是文件头信息:包括索引版本号、树深度、桶大小、内部节点大小和内部节点数、叶节点大小和叶节点数。新创建的索引文件仅包括索引文件名和索引的版本号,其中版本号要大于原索引文件的版本号;
上面介绍了空间数据更新所引起的索引更新的情况,下面介绍索引更新的具体流程,如图2所示,索引更新方法的步骤如下:
步骤A,数据更新模块获取空间数据的更新信息。
步骤B,索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存中,并判断索引操作缓存容量;索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存的具体实施如下:
步骤B-1,判断更新的空间数据对应的索引节点更新类型:若为叶节点分裂,则进入步骤B-2:若为叶节点合并,则进入步骤B-3;
步骤B-2,更新待分裂叶节点L0对应的索引信息,具体包含如下步骤:
步骤B-2-1,新增4个叶节点的磁盘页,依次给4个叶节点磁盘页编号,删除分裂叶节点L0的磁盘页;
步骤B-2-2,新建一个内部节点I0的磁盘页,并将内部节点I0中4个子节点的指针指向步骤B-2-1新增的4个叶节点;
步骤B-2-3,将分裂叶节点L0父节点中指向分裂叶节点L0的指针,指向步骤B-2-2新建的内部节点I0
步骤B-2-4,将分裂后得到的各节点的信息写入索引操作缓存模块;
步骤B-3,更新待合并叶节点对应的索引信息,具体包含如下步骤:
步骤B-3-1,新建一个叶节点磁盘页,所述磁盘页包含所述待合并叶节点的空间点;
步骤B-3-2,删除所述待合并叶节点的磁盘页,删除所述待合并叶节点的父节点(NP)的磁盘页;
步骤B-3-3,将NP父节点中指向NP的指针,指向步骤B-3-1中新建的叶节点;
步骤B-3-4,将步骤B-3-3中所述的叶节点信息写入索引操作缓存模块。
步骤C,重复步骤A至步骤B,直至索引操作缓存容量已满,进入步骤D。
步骤D,索引文件创建模块创建新索引文件,所述新索引文件仅包含头文件信息;新索引文件的文件头信息主要用于记录更新内部节点信息和叶节点信息,文件头信息格式如图6所示;
步骤E,创建新索引节点的根节点:索引文件更新模块将原始索引文件中的根节点信息写入步骤D所创建的新索引文件中;
步骤F,创建新索引文件的内部节点(内部节点信息格式如图7所示),具体包含如下步骤:
步骤F-1,索引文件更新模块逐个读取原索引文件内部节点:
若索引操作缓存模块存储有所述元索引文件内部节点的ID,将与索引操作缓存模块中存储的ID相对应的内部节点信息写入所述新索引文件;
否则,将从原索引文件中读取的内部节点信息写入所述新索引文件;
步骤F-2,遍历索引操作缓存模块中所有新增加的内部节点,依次写入新增加的内部节点至新索引文件中;
步骤G,创建新索引文件的叶节点(叶节点信息格式如图8所示),具体包含如下步骤:
步骤G-1,索引文件更新模块逐个读取原索引文件叶节点:
若索引操作缓存模块存储有所述原索引文件叶节点的ID,将与索引操作缓存模块中存储的ID相对应的叶节点信息写入所述新索引文件;
否则,将从原索引文件中读取的叶节点信息写入所述新索引文件;
步骤G-2,遍历索引操作缓存模块中所有新增加的叶节点,依次写入新增加的叶节点至新索引文件中;
步骤H,索引文件更新模块利用Hadoop系统中的系统应用程序接口替换原索引文件,并删除原索引文件。
如图3所示,本发明所述索引文件在逻辑上为四叉树结构,包含根节点、内部节点和叶节点组成,每个内部节点包括四个子节点分别对应东北(NE)、西北(NW)、西南(SW)、东南(SE)四个空间象限;在物理上由文件头、根节点、内部节点和叶节点等磁盘页组成。空间数据指欧氏空间中的点数据。空间数据更新情况包含空间数据的插入引起索引叶节点分裂和空间数据的删除引起的叶节点合并等两种情况,叶节点合并是指四个叶节点节点合并成为一个叶节点。
如图4所示,索引更新系统与整个索引系统的其他程序交互过程中,当空间点发生变化引起索引节点的增删改操作时,并不直接更新至HDFS文件系统中,而是利用“操作缓存”记录下相应的更新操作,从而延迟对HDFS写操作。查询模块不直接读取索引文件而是读取“查询缓存”,为了保证查询准确性,索引节点相应的更新操作需要同步到“查询缓存”。当“操作缓存”中的节点数目达到一定阈值后,将执行“拷贝写”操作生成更新后的索引文件;“拷贝写”将对比原始索引文件和“节点操作缓存”来完成新索引文件的生成,若原始索引文件与“操作缓存”不一致则将“操作缓存”中的数据写入新的索引文件;具体操作是:1)增加节点,则在索引文件内部节点或者叶节点后追加写入新节点信息;2)更新节点,利用“操作缓存”的数据替换原始索引;3)删除节点,写新索引文件时跳过该节点所在磁盘页,将后面的节点ID前移。当“拷贝写”操作完成后,将利用HDFS的API用新的索引文件替换旧索引文件,然后删除旧的索引文件。“拷贝写”机制实现了索引更新的透明性,并保证查询结果的一致性。
当用户开始增删空间点目标时,引起空间索引的变化,系统中将三种索引更新操作:更改、增加和删除保存在更新操作缓存中。其中增加和删除空间点会引起叶节点的分裂和合并,下面结合附图说明下这两种情况四叉树其索引文件在磁盘上的变化。
如图5所示,索引文件固定大小为128B的内部节点存储在一起,其ID为从1至NI顺序编号,NI为内部节点数;后面为若干叶节点,其ID从-1至-M顺序编号,M为叶节点数目。当数据的插入引起叶节点L0分裂后,索引的文件更新流程:
1)新增4个叶节点(-M-1,-M-2,-M-3,-M-4)的磁盘页,ID从叶节点数目M顺序编号
2)删除L0的磁盘页
3)新建一个内部节点I0磁盘页,并将4个子节点指针指向(-M-1,-M-2,-M-3,-M-4)
4)更新L0父节点NP指向L0的指针,将其指向I0
如图9所示,当ID为N叶节点发生分裂,产生4个新的子节点:(-M-1,-M-2,-M-3,-M-4),同时原来的叶节点(L0)变为内部节点,内部节点是集中存储的,因此要先删除原来的叶节点,然后新建一个内部节点I0,并加入四个指针指向新的4个叶节点;而内部节点NP(叶节点L0的父节点)指向的叶节点已经变成内部节点I0,需要同步更新。
空间数据点的删除会导致叶节点合并,索引文件物理结构同样要发生变化。如图10所示,当删除空间节点后造成内部节点I0的叶节点(-M+3,-M+2,-M+1,-M)合并,索引文件更新操作如下。
1)新建一个叶节点(-M-1)磁盘页,包含待删除的4个叶节点里的空间目标。
2)删除(-M+3,-M+2,-M+1,-M)。
3)删除I0
4)更新节点I0的父节点的子节点指针,使其指向(-M-1)所对应的磁盘页。
如图10所示,当内部节点I0的4个叶节点(-M+3,-M+2,-M+1,-M)合并后,I0变为叶节点,由于内部节点和叶节点是分别存储在磁盘上,因此,先删除原来的内部节点,然后新建一个叶节点-M-1,新的叶节点里包含了原来4个子节点所有的空间点对象,原来的4个叶节点也删除。同时,I0的父节点(NP)指向子节点I0的指针改为叶节点-M-1。
写内部节点的过程见算法1,流程如下:依次读取原索引文件中的每个内部节点,如果被删除,则跳过继续处理下一个节点;否则,更新子节点和父节点的指针信息,并写入新的内部节点至新索引文件中。读取完原索引文件内部节点后,遍历缓存对象addInter,增加新的内部节点。这些内部节点是由分裂的叶节点转变而成。
如算法2所示,为向索引文件写入叶节点信息的流程,首先遍历原索引文件中的叶节点,如果被删除则继续处理下一个叶节点,否则更新节点信息和父节点ID,写入新的索引中。接着遍历缓存addLeaf对象,里面包含由于分裂或者合并产生的新叶节点,更新父节点ID后顺序写入新的索引文件中。
综上所述,本发明所涉及的机遇Hadoop的海量空间数据索引更新系统及方法,解决了Hadoop分布式文件系统中不支持随机写文件的问题,提供了一种高效的更新索引文件的方法,保证了Hadoop平台中空间索引更新的实时性与可靠性。本发明实施例中所涉及的编程仅为本发明的一个实施例,凡是符合本发明发明宗旨的具体实施例均在本发明的保护范围之内。

Claims (3)

1.基于Hadoop的海量空间数据索引更新系统,其特征在于包括:数据更新模块、索引操作缓存模块、索引文件更新模块、索引文件创建模块、索引文件读取模块;其中:所述数据更新模块的输入端接收空间数据更新信息,输出端与索引操作缓存模块的输入端连接;所述索引文件更新模块的第一输入端与所述索引文件读取模块的输出端连接,第二输入端与索引操作缓存模块的输出端连接,输出端与所述索引文件创建模块的输入端连接;所述索引文件创建模块的输出端输出新建的索引文件;
所述数据更新模块用于获取空间数据的更新信息,并将与空间数据更新信息相应的索引更新信息写入索引操作缓存模块;
所述索引操作缓存模块用于缓存与空间数据更新信息相应的索引更新信息;
所述索引文件读取模块用于读取原索引文件;
所述索引文件更新模块用于获取原索引节点,再与索引操作缓存模块中的索引更新信息对比,得到待创建新索引文件的内部节点信息、叶节点信息;
所述索引文件创建模块用于创建新索引文件。
2.基于Hadoop的海量空间数据索引更新方法,其特征在于包括如下步骤:
步骤A,数据更新模块获取空间数据的更新信息;
步骤B,索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存中,并判断索引操作缓存容量;
步骤C,重复步骤A至步骤B,直至索引操作缓存容量已满,进入步骤D;
步骤D,索引文件创建模块创建新索引文件,所述新索引文件仅包含头文件信息;
步骤E,创建新索引节点的根节点:索引文件更新模块将原始索引文件中的根节点信息写入步骤D所创建的新索引文件中;
步骤F,创建新索引文件的内部节点,具体包含如下步骤:
步骤F-1,索引文件读取模块逐个读取原索引文件内部节点:
若索引操作缓存模块存储有所述原索引文件内部节点的ID,将与索引操作缓存模块中存储的ID相对应的内部节点信息写入所述新索引文件;
否则,将从原索引文件中读取的内部节点信息写入所述新索引文件;
步骤F-2,遍历索引操作缓存模块中所有新增加的内部节点,依次写入新增加的内部节点至新索引文件中;
步骤G,创建新索引文件的叶节点,具体包含如下步骤:
步骤G-1,索引文件更新模块逐个读取原索引文件叶节点:
若索引操作缓存模块存储有所述原索引文件叶节点的ID,将与索引操作缓存模块中存储的ID相对应的叶节点信息写入所述新索引文件;
否则,将从原索引文件中读取的叶节点信息写入所述新索引文件;
步骤G-2,遍历索引操作缓存模块中所有新增加的叶节点,依次写入新增加的叶节点至新索引文件中;
步骤H,索引文件更新模块用新索引文件替换原索引文件,并删除原索引文件。
3.如权利要求2所述基于Hadoop的海量空间数据索引更新方法,其特征在于所述步骤B中,索引操作缓存模块将与空间数据更新信息相应的索引更新信息缓存于内存的具体实施如下:
步骤B-1,判断更新的空间数据对应的索引节点更新类型:若为叶节点分裂,则进入步骤B-2:若为叶节点合并,则进入步骤B-3;
步骤B-2,更新待分裂叶节点L0对应的索引信息,具体包含如下步骤:
步骤B-2-1,新增4个叶节点的磁盘页,依次给4个叶节点磁盘页编号,删除分裂叶节点L0的磁盘页;
步骤B-2-2,新建一个内部节点I0的磁盘页,并将内部节点I0中4个子节点的指针指向步骤B-2-1新增的4个叶节点;
步骤B-2-3,将分裂叶节点L0父节点中指向分裂叶节点L0的指针,指向步骤B-2-2新建的内部节点I0
步骤B-2-4,将分裂后得到的各节点的信息写入索引操作缓存模块;
步骤B-3,更新待合并叶节点对应的索引信息,具体包含如下步骤:
步骤B-3-1,新建一个叶节点磁盘页,所述磁盘页包含所述待合并叶节点的空间点;
步骤B-3-2,删除所述待合并叶节点的磁盘页,删除所述待合并叶节点的父节点(NP)的磁盘页;
步骤B-3-3,将指向待合并叶节点的父节点(NP)的指针,指向步骤B-3-1中新建的叶节点;
步骤B-3-4,将步骤B-3-3中所述的叶节点信息写入索引操作缓存模块。
CN201210255699.7A 2012-07-24 2012-07-24 基于Hadoop的海量空间数据索引更新系统及方法 Active CN102799679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210255699.7A CN102799679B (zh) 2012-07-24 2012-07-24 基于Hadoop的海量空间数据索引更新系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210255699.7A CN102799679B (zh) 2012-07-24 2012-07-24 基于Hadoop的海量空间数据索引更新系统及方法

Publications (2)

Publication Number Publication Date
CN102799679A CN102799679A (zh) 2012-11-28
CN102799679B true CN102799679B (zh) 2014-10-22

Family

ID=47198789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210255699.7A Active CN102799679B (zh) 2012-07-24 2012-07-24 基于Hadoop的海量空间数据索引更新系统及方法

Country Status (1)

Country Link
CN (1) CN102799679B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252364B (zh) * 2013-06-25 2017-09-12 腾讯科技(深圳)有限公司 增量更新的方法、设备及系统
CN104679773A (zh) * 2013-11-29 2015-06-03 中国科学院深圳先进技术研究院 海量交易数据中频繁项目集的挖掘方法及查询方法
US9715515B2 (en) 2014-01-31 2017-07-25 Microsoft Technology Licensing, Llc External data access with split index
CN106469172B (zh) * 2015-08-19 2019-07-23 阿里巴巴集团控股有限公司 分布式文件系统的数据更新方法和装置
CN107729566B (zh) * 2017-11-14 2021-02-23 郑州天迈科技股份有限公司 一种用于公交车载硬盘音视频数据存取的索引重建方法
CN108595459B (zh) * 2017-12-30 2022-02-15 北京百度网讯科技有限公司 关系索引更新方法、装置和电子设备
CN110018784B (zh) 2018-01-09 2023-01-10 阿里巴巴集团控股有限公司 数据处理方法、装置及计算设备
CN110119381A (zh) * 2019-05-17 2019-08-13 北京思维造物信息科技股份有限公司 一种索引更新方法、装置、设备及介质
CN112395253B (zh) * 2020-11-17 2024-03-12 抖音视界有限公司 索引文件生成方法、终端设备、电子设备及介质
CN113536058A (zh) * 2021-08-03 2021-10-22 上海达梦数据库有限公司 一种空间索引修改方法、装置、设备及存储介质
CN115757438B (zh) * 2023-01-06 2023-05-12 本原数据(北京)信息技术有限公司 数据库的索引节点处理方法和装置、计算机设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101557A1 (en) * 2001-06-09 2002-12-19 Transact In Memory, Inc. Cache-conscious concurrency control scheme for database systems
CN101354726A (zh) * 2008-09-17 2009-01-28 中国科学院计算技术研究所 一种机群文件系统的内存元数据管理方法
CN102004778A (zh) * 2010-11-19 2011-04-06 清华大学 一种云环境中的文本索引在线更新方法
CN102238202A (zh) * 2010-04-23 2011-11-09 华为技术有限公司 索引信息的存储、查找方法及装置
CN102332029A (zh) * 2011-10-15 2012-01-25 西安交通大学 一种基于Hadoop的海量可归类小文件关联存储方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101557A1 (en) * 2001-06-09 2002-12-19 Transact In Memory, Inc. Cache-conscious concurrency control scheme for database systems
CN101354726A (zh) * 2008-09-17 2009-01-28 中国科学院计算技术研究所 一种机群文件系统的内存元数据管理方法
CN102238202A (zh) * 2010-04-23 2011-11-09 华为技术有限公司 索引信息的存储、查找方法及装置
CN102004778A (zh) * 2010-11-19 2011-04-06 清华大学 一种云环境中的文本索引在线更新方法
CN102332029A (zh) * 2011-10-15 2012-01-25 西安交通大学 一种基于Hadoop的海量可归类小文件关联存储方法

Also Published As

Publication number Publication date
CN102799679A (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
CN102799679B (zh) 基于Hadoop的海量空间数据索引更新系统及方法
CN107423422B (zh) 基于网格的空间数据分布式存储及检索方法和系统
CN101916299B (zh) 一种基于文件系统的三维空间数据存储管理方法
CN106777351B (zh) 基于art树分布式系统图存储计算系统及其方法
US20200372004A1 (en) Indexing for evolving large-scale datasets in multi-master hybrid transactional and analytical processing systems
CN112363979B (zh) 一种基于图数据库的分布式索引方法和系统
CN104866497A (zh) 分布式文件系统列式存储的元数据更新方法、装置、主机
WO2015024474A1 (zh) 基于缓存数据多线程处理的电力可靠性指标快速计算方法
CN106775476A (zh) 混合内存系统及其管理方法
JP2015512604A (ja) 暗号ハッシュ・データベース
Zhang et al. An implementation approach to store GIS spatial data on NoSQL database
CN106682110B (zh) 一种基于哈希格网索引的影像文件存储和管理系统及方法
CN105389367A (zh) 基于Mongo数据库的电网图形多时态多级分布式存储方法
CN105069151A (zh) HBase二级索引构建装置和方法
US10818083B1 (en) Pyramid generation via depth-first walk
CN104778077A (zh) 基于随机和连续磁盘访问的高速核外图处理方法及系统
CN103294799B (zh) 一种数据并行批量导入只读查询系统的方法及系统
JP2023543004A (ja) ヒルベルト曲線に基づくr木インデックスのマージ更新方法、装置及び媒体
CN102567419B (zh) 基于树结构的海量数据存储装置及方法
CN107798063A (zh) 快照处理方法和快照处理装置
de Souza Baptista et al. NoSQL geographic databases: an overview
CN104794567B (zh) 一种基于HBase的传染病数据管理方法
CN107273443B (zh) 一种基于大数据模型元数据的混合索引方法
CN104462095A (zh) 一种查询语句公共部分的提取方法及装置
Li et al. FluteDB: An efficient and scalable in-memory time series database for sensor-cloud

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190509

Address after: 210037 Jinqiao Lighting Market F552, 98 Jianning Road, Gulou District, Nanjing City, Jiangsu Province

Patentee after: Nanjing Aerial View Wilch Space Technology Co.,Ltd.

Address before: 211100 No. 1 Xikang Road, Gulou District, Nanjing City, Jiangsu Province

Patentee before: HOHAI University