CN1838124A - 海量数据内存数据库中快速定位的网格+t树索引的方法 - Google Patents

海量数据内存数据库中快速定位的网格+t树索引的方法 Download PDF

Info

Publication number
CN1838124A
CN1838124A CNA2006100383786A CN200610038378A CN1838124A CN 1838124 A CN1838124 A CN 1838124A CN A2006100383786 A CNA2006100383786 A CN A2006100383786A CN 200610038378 A CN200610038378 A CN 200610038378A CN 1838124 A CN1838124 A CN 1838124A
Authority
CN
China
Prior art keywords
tree
grid
data
memory database
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100383786A
Other languages
English (en)
Other versions
CN100418092C (zh
Inventor
罗义斌
袁胜
朱兴宇
刘泉
顾恺宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Linkage Tech Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Linkage Tech Group Co Ltd filed Critical Linkage Tech Group Co Ltd
Priority to CNB2006100383786A priority Critical patent/CN100418092C/zh
Priority to US11/380,481 priority patent/US7428551B2/en
Publication of CN1838124A publication Critical patent/CN1838124A/zh
Application granted granted Critical
Publication of CN100418092C publication Critical patent/CN100418092C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2264Multidimensional index structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

内存数据库中的网格+T树多维索引的方法,将整个记录集按照范围划分到不同的网格单元中,每个网格数据单元都通过网格目录与一个装载记录的数据桶相联系,每个数据单元只对应着一个数据桶;对于内存数据库将这些数据单元按某一字段建立一颗T树,从而使每一个数据桶按一字段建立一颗T树,将网格目录由一个k维(关键字的维数)数组来表示,这些数组单元所代表的字段范围称为刻度(scale),刻度是每颗T树的存储范围。本发明较好地解决了目前内存数据库索引不能有效利用内存空间和不适合多维的缺点,利用T树在内存空间的使用率上比k-d树和R树要高很多,但又是在网格分割中多个一维的结构,便于关键字中的某一个字段作为索引。

Description

海量数据内存数据库中快速定位的网格+T树索引的方法
                          技术领域
本发明涉及内存数据库中的数据库系统中建立多维索引的方法,尤其是网格+T树技术在内存数据库中的实现方法。
                          背景技术
在电信业务支撑系统中,通常需要处理数千万条记录以上的数据,而有限的主机资源(CPU、内存等)是非常宝贵的。如何用最少的资源,较高的效率完成相关的数据库操作是内存数据库技术研究的一个重点,也是一个难点。采用好的索引结构是保证内存数据库操作效率的有效保证。
在对索引结构多年的研究过程中,树形结构一直都是数据库系统中建立多维索引最有效的方法之一,在这些建立多维索引的结构中,比较流行的有k-d树,R树、T树。
k-d树:k-d树是一种k维空间中的二叉查找树,它主要存储的是点数据,在每个内部节点中,它用一个k-1维的超平面将节点所表示的k维空间分成两个部分,这些超平面在k个可能的方向上交替出现,而且在每一个超平面中至少要包括一个点数据,图1是一个k-d树的例子。
从操作上来说,k-d树的查找和插入是很简单的,而删除操作则有点复杂,因为一个点的删除可能会导致它的子树重建。由于k-d树只能处理点数据,因此对其他具有一定形状的数据只好用它们的中心点来代替。需要指出的是当数据插入的顺序不同时,k-d树的结构也不同,而且数据会分散出现在树的任何地方,而不会只出现在叶子节点。
由以上介绍可以看出,k-d树是一种多维二叉树结构,因此对于传统基于磁盘的数据库系统,有很好的索引效率。但由于每个节点仅包含一个数据节点和两个指向左右孩子的指针,这对内存空间极为宝贵的内存数据库来说存储效率太低。
R树:R树是一种类似于B+树的多维索引结构。它的每个中间节点存储的不是数据,而是所有子节点的最小外接矩形(MBR),实际数据都保存在叶子节点中,所有的叶子节点都出现在同一层上。如图2所示:R树的查找算法是从根节点出发,对内部节点,检查每一项是否与要查找的区域重叠,如果重叠,则检查该项所指向的子节点,直至找到叶子节点。插入操作首先从根结点开始,在经过的每一个内部节点中选择为容纳下插入节点其MBR的面积扩大最小的项,到达叶子节点后插入节点,并按原路径返回依次修改其祖先节点的MBR。删除操作首先进行一次精确查询,如果找到该节点,则将其删除,并依次修改其祖先节点的MBR。
由以上介绍可以看出,R树的结构类似于B+树,因此它满足减少磁盘访问次数,和检索速度快的要求。但由于它将所有数据保存在叶子节点,中间节点只保存子节点的相关信息,所以R树的内存空间的浪费是很大。
AVL树是最先发明的 自平衡二叉查找树。存AVL树中任何节点的两个子树的高度最大差别为一,所以它也被称为 高度平衡树。查找、插入和删除在平均和最坏情况下都是 O(log n)。增加和删除可能需要通过一次或多次 树旋转来重新平衡这个树。
T树:T树与AVL树一样,它的左子树与右子树之差不超过1,与AVL树不同的是在一个存储节点可以保存多个键值,它的最左与最右键值分别为这个节点的最小与最大键值,它的左子树仅仅包含那些键值小于它的记录,同理右子树只包括那些键值大于它的记录。图3是T树的结构示意图:
从T树的结构可以看出,T树具有同k-d树和R树相同的时间复杂度O(Log2N),但是它们最大的不同就是T树的每个节点包含多个键值,而且只有左右子节点的指针两个额外的附加信息,从而提高了节点的利用率。
T树的平衡处理与AVL树的平衡处理相同,都是通过左单旋(LL),左双旋(LR),右单旋(RL)和右双旋(RR)四种旋转操作来完成,唯一的不同在于T树的LR或RL旋转操作可能使得一个叶结点成为只含一个元素的内部结点,这时需要将它的一个子结点的元素移动到该结点,保证它仍旧是满足定义的T树。AVL树得名于它的节点的平衡因子是它的右子树的高度减去它的左子树的高度。带有平衡因子1、0或-1的节点被认为是平衡的。带有平衡因子-2或2的节点被认为是不平衡的,并需要重新平衡这个树。平衡因子可以直接存储在每个节点中,或从可能存储在节点中的子树高度计算出来。
在平衡的的二叉排序树BBST上插入一个新的数据元素e的递归算法可描述如下:
1.若BBST为空树,则插入一个数据元素为e的新结点作为BBST的根结点,树的深度增1;
2.若e的关键字和BBST的根结点的关键字相等,则不进行;
若e的关键字小于BBST的根结点的关键字,而且在BBST的左子树中不存在和e有相同关键字的结点,则将e插入在BBST的左子树上,并且当插入之后的左子树深度增加(+1)时,分别就下列不同情况处理之:
1.BBST的根结点的平衡因子为-1(右子树的深度大于左子树的深度,则将根结点的平衡因子更改为0,BBST的深度不变;
2.BBST的根结点的平衡因子为0(左、右子树的深度相等):则将根结点的平衡因子更改为1,BBST的深度增1;
3.BBST的根结点的平衡因子为1(左子树的深度大于右子树的深度):则若BBST的左子树根结点的平衡因子为1:则需进行单向右旋平衡处理,并且在右旋处理之后,将根结点和其右子树根结点的平衡因子更改为0,树的深度不变;
3.若e的关键字大于BBST的根结点的关键字,而且在BBST的右子树中不存在和e有相同关键字的结点,则将e插入在BBST的右子树上,并且当插入之后的右子树深度增加(+1)时,分别就不同情况处理之。
把T树作为MMDB高效的存储数据结构。T树是基于Adel′son Vel′skii and Landis.11的AVL树。与在AVL树中一样,T树的左子树和右子树高多数情况下可以相差1。
T树在内存空间的使用率上比k-d树和R树要高很多,但也存在着缺陷。因为T树在一维索引情况下无论是确切查询还是范围查询都有良好的搜索效果,但是在多维的情况下缺陷却非常明显,因为它只能以关键字中的某一个字段作为索引。例如:某表的关键字由<key1,key2,key3>三个字段组成,假设以key1的值为索引建立T树,如果某个时刻内存中的记录集为C=f{<i,j,k>,0<i<10000;0<j<1000;0<k<100}的所有组合组成,即1000000000条记录,则查询的时候至少要比较1000*100条记录,由此可见查询的效率太低。
从上面分析知道,在这些建立多维索引的结构中,k-d树和R树相对于内存空间极为宝贵的内存数据库来说,它们都有浪费内存的缺点。而T树作为虽然具有存取速度快,节约空间的优点,但是对于多维索引的情况它的效率却不高。
                          发明内容
1.发明目的:
本发明目的是提出一种内存数据库中的网格+T树多维索引的方法。尤其是具有较高的效率和较低的存储,相对于内存数据库目前使用的典型的索引结构的多维索引的方法,提出网格+T树索引在内存数据库方面的应用;解决现有内存数据库方面的应用多维索引的方法存在的不足。
2.技术方案
本发明的技术解决方案是:内存数据库中的网格+T树多维索引的方法,在内存数据库中的网格+T树多维索引的方法,将整个记录集按照范围划分到不同的网格单元中,每个网格数据单元都通过网格目录(grid directory)与一个装载记录的数据桶相联系,每个数据单元只对应着一个数据桶;对于内存数据库将这些数据单元按某一字段建立一颗T树,从而使每一个数据桶按一字段建立一颗T树,将网格目录由一个k维(关键字的维数)数组来表示,这些数组单元所代表的字段范围称为刻度(scale),刻度是每颗T树的存储范围。
本发明所述内存数据库中的网格+T树多维索引的方法的改进是:在网格+T树构成的内存数据库中数据单元可动态分配。所述动态分配;即:这些数据单元内存数据库初始化预先划分好的一个内存空间,并根据需要在程序中动态地使用和释放。
对于磁盘数据库,一般一个数据桶对应硬盘上的一个磁盘页,占用的内存空间由建立网格所用的数组空间与建立T树所花费的空间组成。设有K维索引<I1,I2……Ik>,分别用刻度将其取值范围等分为P1,P2…Pk份。
3.发明特点
本发明较好的解决了目前内存数据库索引不能有效利用内存空间和不适合多维的缺点,从而使内存数据库技术能在电信运营支撑系统中得到广泛的应用。尤其是利用T树在内存空间的使用率上比k-d树和R树要高很多,且T树在一维索引情况下无论是确切查询还是范围查询都有良好的搜索效果;但又是在网格分割中多个一维的结构,便于关键字中的某一个字段作为索引。
                          附图说明
图1是本发明现有技术k-d树结构示意图
图2是现有技术R树结构示意图
图3是现有技术T树结构示意图
图4是本发明网格+T树结构示意图
图5是本发明网格+T树结构查询示意图
                         具体实施方式
如图1、4所示。网格+T树多维索引的方法是从一种传统磁盘数据库的索引方法--网格文件(grid file)演化而来,它是一种典型的基于哈希的存取方法。
图4为网格+T树的结构示意图:如图所示,将整个记录集按照(某种)范围划分到不同的网格单元中,每个网格单元都通过网格目录(grid directory)与一个装载记录的数据桶相联系,每个单元只对应着一个数据桶。对于磁盘数据库,一般一个数据桶对应硬盘上的一个磁盘页,对于内存数据库将这些数据单元按某一字段建立一颗T树,从而使每一个桶的大小变为可动态分配的。内存数据库将网格目录通常由一个k维(关键字的维数)数组来表示,这些数组单元所代表的字段范围称为刻度(scale)。
网格+T树的查询、插入和删除操作都类似,下面以查询为例说明其算法。查询操作:
网格+T树结构的查询非常简单。当进行精确查询时,首先用这些刻度来定位要查找记录所在的网格,然后通过网格目录找到要查询的T树,并按前面介绍的T树搜索方式进行搜索。
如下例:userid--用户标识prcplnid--套餐标识;假设某个数据库的关键字由两个字段<userid,prcplnid>组成,其中字段userid的取值范围为1...50000,字段prcplnid的取值范围为1...12,网格的刻度划分为X(userid)=(1,10000,20000,30000,40000,50000);Y(prcplnid)=(1,3,6,9,12),则执行精确查找FIND(35000,7)的示意图如图5所示。
其中字段值35000在X轴上的刻度为X(4),字段值7在Y轴上的刻度为Y(3),则二维数组G(4,3)所指向的地址就是要查找记录所在的T树的根地址。对于范围查询,首先找到关键字的每个字段所在的刻度值,这些刻度值的交叉点所对应的网格单元即为所要查找的T树的集合。
网格分割原则(较高效率)
网格分割的原则为尽量分割取值范围较少的键值,如果有可能将其划分为1,而将范围较大的作为建立T树的索引,这样可以降低关键字的维度,使在同一个区域内出现键值相同的情况降到最低,最终使搜索时比较的次数大大减少。最坏的情况是所有N个记录都被划分到一个网格中,那么内存中只有一颗T树建立,则时间复杂度为O(log2N);通常情况为所有记录均匀分布到各个网格中,则每个网格中记录数为N/(P1*P2*……*Pk),时间复杂度为O(log2(N/(P1*P2*……*Pk)))。
例如:对上例中的C={<i,j,k>,0<i<10000;0<j<1000;0<k<100}的所有组合组成的记录集进行网格分割,仍以key1作为建立T树的索引,分别采用A=(1000,1,1);B=(10,10,10);C=(1,10,100)三种不同的分割方式将记录划分到1000个区域。则分割后对于某个给定的关键字的比较次数依次为100000,1000,100。网格+T树结构是在建立一颗庞大的T树与直接用多维数组进行索引之间所选择的一个折衷方案,在时间,空间的关系上找到一个平衡点,即节约了搜索时间,又节约了内存空间。
空间复杂性(较低的存储)
占用的内存空间由建立网格所用的数组空间与建立T树所花费的空间组成。设有K维索引<I1,I2……Ik>,分别用刻度将其取值范围等分为P1,P2…Pk份,则建立网格所用的内存空间M1=C*P1*P2*……*Pk,其中C为一个地址所占用的字节数,如果为32位操作系统,则C=4;在T树的节点中采用保存记录地址来取代保存记录关键字的方法,通过多进行一次内存读操作来节约内存空间。由于T树节点中的数据项占用的空间远大于指向左右子节点的指针占用的空间,所以在这里只考虑数据项占用的空间,则M2=C*N,其中C同上,N为记录数。
所以总占用的内存空间为M=M1+M2=C*(P1*P2*……*Pk+N)。
下面以查询操作为例来说明实施效果:
userid(15位)--用户标识prcplnid(8位)--套餐标识;
假设某个数据库的关键字由两个字段<userid,prcplnid>组成,其中字段userid的取值范围为1...50000,字段prcplnid的取值范围为1...12,现在内存数据库中共有100万条记录。执行走索引的查询操作测试结果如下:
索引类型        内存大小(单位兆)        效率(秒)
K-D树               36M                  5.12
R树                 40M                  4.33
T树                 50M                  3.32
网格+T树            26M                  3.31
从实际使用效果来看,网格+T树具有相对较低的存储开销同时具有很高的执行效率。

Claims (4)

1、内存数据库中的网格+T树多维索引的方法,其特征是将整个记录集按照范围划分到不同的网格单元中,每个网格数据单元都通过网格目录(grid directory)与一个装载记录的数据桶相联系,每个数据单元只对应着一个数据桶;对于内存数据库将这些数据单元按某一字段建立一颗T树,从而使每一个数据桶按一字段建立一颗T树,将网格目录由一个k维(关键字的维数)数组来表示,这些数组单元所代表的字段范围称为刻度(scale),刻度是每颗T树的存储范围。
2、由权利要求1所述的内存数据库中的网格+T树多维索引的方法,其特征是在网格+T树构成的内存数据库中数据单元可动态分配;即:这些数据单元内存数据库初始化预先划分好的一个内存空间,并根据需要在程序中动态地使用和释放。
3、由权利要求1所述的内存数据库中的网格+T树多维索引的方法,其特征是对于磁盘数据库,一般一个数据桶对应硬盘上的一个磁盘页,占用的内存空间由建立网格所用的数组空间与建立T树所花费的空间组成。设有K维索引<I1,I2……Ik>,分别用刻度将其取值范围等分为P1,P2…Pk份。
4、由权利要求1所述的内存数据库中的网格+T树多维索引的方法,其特征是网格分割时分割取值范围是较少的键值,如果有可能其将其划分为1,而将范围较大的作为建立T树的索引。
CNB2006100383786A 2006-02-20 2006-02-20 海量数据内存数据库中快速定位的网格+t树索引的方法 Active CN100418092C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNB2006100383786A CN100418092C (zh) 2006-02-20 2006-02-20 海量数据内存数据库中快速定位的网格+t树索引的方法
US11/380,481 US7428551B2 (en) 2006-02-20 2006-04-27 “Gird plus T Tree” index method for quick orientation in massive memory database

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100383786A CN100418092C (zh) 2006-02-20 2006-02-20 海量数据内存数据库中快速定位的网格+t树索引的方法

Publications (2)

Publication Number Publication Date
CN1838124A true CN1838124A (zh) 2006-09-27
CN100418092C CN100418092C (zh) 2008-09-10

Family

ID=37015520

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100383786A Active CN100418092C (zh) 2006-02-20 2006-02-20 海量数据内存数据库中快速定位的网格+t树索引的方法

Country Status (2)

Country Link
US (1) US7428551B2 (zh)
CN (1) CN100418092C (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315628B (zh) * 2007-06-01 2011-01-05 华为技术有限公司 内存数据库系统及实现内存数据库的方法和装置
CN102156744A (zh) * 2011-04-18 2011-08-17 北京神州数码思特奇信息技术股份有限公司 一种内存话单剔重方法
CN101478567B (zh) * 2009-01-09 2011-09-21 南京联创科技集团股份有限公司 基于网格划分的内存管理方法
CN102339284A (zh) * 2010-07-16 2012-02-01 凌群电脑股份有限公司 数据库索引的建立方法及其电脑系统
CN102479189A (zh) * 2010-11-23 2012-05-30 上海宝信软件股份有限公司 一种内存中海量时间戳型数据高速均匀访问的索引方法
CN102609440A (zh) * 2011-12-23 2012-07-25 浙江大学 一种高维环境中资源分配问题的查询方法
CN103106276A (zh) * 2013-02-17 2013-05-15 南京师范大学 一种基于小角编码的矢量数据网格索引方法
CN103902693A (zh) * 2014-03-28 2014-07-02 西安交通大学 一种读优化的内存数据库t树索引结构的方法
CN105117417A (zh) * 2015-07-30 2015-12-02 西安交通大学 一种读优化的内存数据库Trie树索引方法
CN106445403A (zh) * 2015-08-11 2017-02-22 张凡 针对海量数据成对存储的分布式存储方法和系统
CN106445927A (zh) * 2015-08-04 2017-02-22 北京京东金融科技控股有限公司 数据分页查询方法及装置
CN106484750A (zh) * 2015-09-01 2017-03-08 爱思开海力士有限公司 数据处理系统
CN106503092A (zh) * 2016-10-13 2017-03-15 浪潮(苏州)金融技术服务有限公司 一种使用多维化技术构建空间多维度搜索树的方法
CN108628969A (zh) * 2018-04-24 2018-10-09 咪咕文化科技有限公司 一种空间关键字索引方法及平台、存储介质
CN109101608A (zh) * 2018-08-03 2018-12-28 郑州云海信息技术有限公司 一种数据存储方法、数据查询方法及装置
CN112181991A (zh) * 2020-10-15 2021-01-05 中国人民解放军国防科技大学 基于快速构建kd树的地球模拟系统网格重映射方法
CN113901156A (zh) * 2021-09-08 2022-01-07 燕山大学 三维自适应网格r+树混合索引构建、维护、查询方法
CN114896620A (zh) * 2022-07-07 2022-08-12 安徽华典大数据科技有限公司 一种基于量子加密数据库索引方法、设备及存储介质
CN117331947A (zh) * 2023-12-01 2024-01-02 中国人民解放军93184部队 一种多维自适应增量r树索引构建方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972177B2 (en) 2008-02-26 2015-03-03 Microsoft Technology Licensing, Llc System for logging life experiences using geographic cues
US8078394B2 (en) * 2008-02-26 2011-12-13 Microsoft Corp. Indexing large-scale GPS tracks
US8015144B2 (en) 2008-02-26 2011-09-06 Microsoft Corporation Learning transportation modes from raw GPS data
US8966121B2 (en) 2008-03-03 2015-02-24 Microsoft Corporation Client-side management of domain name information
US9063226B2 (en) 2009-01-14 2015-06-23 Microsoft Technology Licensing, Llc Detecting spatial outliers in a location entity dataset
US8713426B2 (en) 2009-06-25 2014-04-29 Oracle International Corporation Technique for skipping irrelevant portions of documents during streaming XPath evaluation
US9009177B2 (en) 2009-09-25 2015-04-14 Microsoft Corporation Recommending points of interests in a region
US9165086B2 (en) * 2010-01-20 2015-10-20 Oracle International Corporation Hybrid binary XML storage model for efficient XML processing
US9261376B2 (en) 2010-02-24 2016-02-16 Microsoft Technology Licensing, Llc Route computation based on route-oriented vehicle trajectories
US10288433B2 (en) 2010-02-25 2019-05-14 Microsoft Technology Licensing, Llc Map-matching for low-sampling-rate GPS trajectories
US9593957B2 (en) 2010-06-04 2017-03-14 Microsoft Technology Licensing, Llc Searching similar trajectories by locations
US8645380B2 (en) * 2010-11-05 2014-02-04 Microsoft Corporation Optimized KD-tree for scalable search
US9036925B2 (en) 2011-04-14 2015-05-19 Qualcomm Incorporated Robust feature matching for visual search
US8706711B2 (en) 2011-06-22 2014-04-22 Qualcomm Incorporated Descriptor storage and searches of k-dimensional trees
US9754226B2 (en) 2011-12-13 2017-09-05 Microsoft Technology Licensing, Llc Urban computing of route-oriented vehicles
US20130166188A1 (en) 2011-12-21 2013-06-27 Microsoft Corporation Determine Spatiotemporal Causal Interactions In Data
JP5862417B2 (ja) * 2012-03-29 2016-02-16 ブラザー工業株式会社 管理デバイス
US9367938B2 (en) * 2013-02-28 2016-06-14 Nokia Technologies Oy Method and apparatus for automated real-time detection of overlapping painted markup elements
CN107678979A (zh) * 2017-10-19 2018-02-09 浪潮金融信息技术有限公司 数据存储方法及装置
CN108564637B (zh) * 2018-04-19 2022-03-29 北京知道创宇信息技术股份有限公司 几何模型排布方法及装置
CN110765128B (zh) * 2019-09-17 2024-02-23 江苏海平面数据科技有限公司 基于大规模gps数据的优化存储方法
CN111427978B (zh) * 2019-11-22 2023-07-07 中国测绘科学研究院 基于城市形态学和r树的三维模型索引方法
CN111488341B (zh) * 2020-03-27 2023-08-22 北京金山云网络技术有限公司 数据库索引的管理方法、装置及电子设备
CN112395288B (zh) * 2020-09-25 2022-07-12 浙江大学 基于希尔伯特曲线的r树索引合并更新方法、装置及介质
CN114004175B (zh) * 2021-10-29 2023-09-22 中船奥蓝托无锡软件技术有限公司 一种快速查找全域壁面距离和无量纲壁面距离的方法
CN114998513B (zh) * 2022-05-12 2024-01-30 中国人民解放军国防科技大学 基于kd树的带循环边界的地球模拟系统网格重映射方法
CN118097055A (zh) * 2024-04-26 2024-05-28 中山大学 一种三维地质结构模型的网格化表示方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144773A (en) * 1996-02-27 2000-11-07 Interval Research Corporation Wavelet-based data compression
US6122645A (en) * 1997-08-25 2000-09-19 Lucent Technologies, Inc. System and method for physically versioning data in a main memory database
US6252857B1 (en) * 1998-03-04 2001-06-26 At&T Corp. Method and apparatus for provisioned and dynamic quality of service in a communications network
US7293028B2 (en) * 2001-06-08 2007-11-06 Sap Ag Cache-conscious concurrency control scheme for database systems
US7007027B2 (en) * 2002-12-02 2006-02-28 Microsoft Corporation Algorithm for tree traversals using left links
US7765211B2 (en) * 2003-04-29 2010-07-27 International Business Machines Corporation System and method for space management of multidimensionally clustered tables
US7966301B2 (en) * 2003-05-09 2011-06-21 Planeteye Company Ulc System and method for employing a grid index for location and precision encoding

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315628B (zh) * 2007-06-01 2011-01-05 华为技术有限公司 内存数据库系统及实现内存数据库的方法和装置
CN101478567B (zh) * 2009-01-09 2011-09-21 南京联创科技集团股份有限公司 基于网格划分的内存管理方法
CN102339284B (zh) * 2010-07-16 2015-06-17 凌群电脑股份有限公司 数据库索引的建立方法及其电脑系统
CN102339284A (zh) * 2010-07-16 2012-02-01 凌群电脑股份有限公司 数据库索引的建立方法及其电脑系统
CN102479189A (zh) * 2010-11-23 2012-05-30 上海宝信软件股份有限公司 一种内存中海量时间戳型数据高速均匀访问的索引方法
CN102479189B (zh) * 2010-11-23 2016-08-03 上海宝信软件股份有限公司 一种内存中海量时间戳型数据高速均匀访问的索引方法
CN102156744A (zh) * 2011-04-18 2011-08-17 北京神州数码思特奇信息技术股份有限公司 一种内存话单剔重方法
CN102609440A (zh) * 2011-12-23 2012-07-25 浙江大学 一种高维环境中资源分配问题的查询方法
CN102609440B (zh) * 2011-12-23 2013-10-23 浙江大学 一种高维环境中资源分配问题的查询方法
CN103106276A (zh) * 2013-02-17 2013-05-15 南京师范大学 一种基于小角编码的矢量数据网格索引方法
CN103106276B (zh) * 2013-02-17 2016-03-30 南京师范大学 一种基于小角编码的矢量数据网格索引方法
CN103902693A (zh) * 2014-03-28 2014-07-02 西安交通大学 一种读优化的内存数据库t树索引结构的方法
CN103902693B (zh) * 2014-03-28 2017-06-20 西安交通大学 一种读优化的内存数据库t树索引结构的方法
CN105117417A (zh) * 2015-07-30 2015-12-02 西安交通大学 一种读优化的内存数据库Trie树索引方法
CN105117417B (zh) * 2015-07-30 2018-04-17 西安交通大学 一种读优化的内存数据库Trie树索引方法
CN106445927A (zh) * 2015-08-04 2017-02-22 北京京东金融科技控股有限公司 数据分页查询方法及装置
CN106445403A (zh) * 2015-08-11 2017-02-22 张凡 针对海量数据成对存储的分布式存储方法和系统
CN106445403B (zh) * 2015-08-11 2020-11-13 张一凡 针对海量数据成对存储的分布式存储方法和系统
CN106484750B (zh) * 2015-09-01 2020-10-16 爱思开海力士有限公司 数据处理系统
CN106484750A (zh) * 2015-09-01 2017-03-08 爱思开海力士有限公司 数据处理系统
CN106503092A (zh) * 2016-10-13 2017-03-15 浪潮(苏州)金融技术服务有限公司 一种使用多维化技术构建空间多维度搜索树的方法
CN108628969A (zh) * 2018-04-24 2018-10-09 咪咕文化科技有限公司 一种空间关键字索引方法及平台、存储介质
CN109101608A (zh) * 2018-08-03 2018-12-28 郑州云海信息技术有限公司 一种数据存储方法、数据查询方法及装置
CN112181991A (zh) * 2020-10-15 2021-01-05 中国人民解放军国防科技大学 基于快速构建kd树的地球模拟系统网格重映射方法
CN112181991B (zh) * 2020-10-15 2021-06-15 中国人民解放军国防科技大学 基于快速构建kd树的地球模拟系统网格重映射方法
CN113901156A (zh) * 2021-09-08 2022-01-07 燕山大学 三维自适应网格r+树混合索引构建、维护、查询方法
CN113901156B (zh) * 2021-09-08 2024-05-10 燕山大学 三维自适应网格r+树混合索引构建、维护、查询方法
CN114896620A (zh) * 2022-07-07 2022-08-12 安徽华典大数据科技有限公司 一种基于量子加密数据库索引方法、设备及存储介质
CN117331947A (zh) * 2023-12-01 2024-01-02 中国人民解放军93184部队 一种多维自适应增量r树索引构建方法
CN117331947B (zh) * 2023-12-01 2024-03-08 中国人民解放军93184部队 一种多维自适应增量r树索引构建方法

Also Published As

Publication number Publication date
US20070198568A1 (en) 2007-08-23
CN100418092C (zh) 2008-09-10
US7428551B2 (en) 2008-09-23

Similar Documents

Publication Publication Date Title
CN1838124A (zh) 海量数据内存数据库中快速定位的网格+t树索引的方法
US7822776B2 (en) Multidimensional dynamic clustering (MDDC)
EP1866775B1 (en) Method for indexing in a reduced-redundancy storage system
US8108411B2 (en) Methods and systems for merging data sets
Weber et al. An approximation based data structure for similarity search
US20060271540A1 (en) Method and apparatus for indexing in a reduced-redundancy storage system
US20050222978A1 (en) Method and apparatus for querying spatial data
US9292554B2 (en) Thin database indexing
CN107330094B (zh) 动态存储键值对的布鲁姆过滤器树结构及键值对存储方法
Cha et al. The GC-tree: a high-dimensional index structure for similarity search in image databases
CN111723096B (zh) 一种集成GeoHash和Quadtree的空间数据索引方法
CN111801665A (zh) 用于大数据应用的分层局部敏感哈希(lsh)分区索引
Challa et al. DD-Rtree: A dynamic distributed data structure for efficient data distribution among cluster nodes for spatial data mining algorithms
Wheatman et al. Streaming sparse graphs using efficient dynamic sets
Vu et al. R*-grove: Balanced spatial partitioning for large-scale datasets
Grandi et al. Frame-sliced partitioned parallel signature files
Barsky et al. A new method for indexing genomes using on-disk suffix trees
CN100347698C (zh) 基于分区的高维相似性结合方法
US9292553B2 (en) Queries for thin database indexing
Al-Badarneh et al. A new enhancement to the R-tree node splitting
CN114416741A (zh) 基于多级索引的kv数据写入读取方法、装置及存储介质
KR20030022091A (ko) 온라인 분석 처리 시스템의 질의 처리 고속화를 위한 비트맵 인덱스 구조
Van Le Distributed Moving Objects Database Based on Key-Value Stores.
Song et al. FacetsBase: A key-value store optimized for querying on scholarly data
CN117312239A (zh) 一种基于组合方式存储数据索引的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: LIAN Technology (Nanjing) Co., Ltd.

Assignor: Linkage System Integration Co., Ltd.

Contract fulfillment period: 2008.11.4 to 2026.11.29

Contract record no.: 2008320001106

Denomination of invention: Grid and T-tree index method for rapid positioning in main memory database

Granted publication date: 20080910

License type: exclusive license

Record date: 20081124

LIC Patent licence contract for exploitation submitted for record

Free format text: EXCLUSIVE LICENSE; TIME LIMIT OF IMPLEMENTING CONTACT: 2008.11.4 TO 2026.11.29; CHANGE OF CONTRACT

Name of requester: LIANCHUANG SCIENCE ( NANJING ) CO., LTD.

Effective date: 20081124

ASS Succession or assignment of patent right

Owner name: LIANCHUANG SCIENCE ( NANJING ) CO., LTD.

Free format text: FORMER OWNER: NANJING LIANCHUANG SCIENCE CO., LTD.

Effective date: 20091127

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20091127

Address after: Building 16, world window software park, No. 12 Huai gate, Jiangsu, Nanjing

Patentee after: LIAN Technology (Nanjing) Co., Ltd.

Address before: 16 floor, No. 12 Huai gate, Nanjing, Jiangsu

Patentee before: Linkage System Integration Co., Ltd.

C56 Change in the name or address of the patentee

Owner name: LINKAGE-ASIAINFO TECHNOLOGY (NANJING) CO., LTD.

Free format text: FORMER NAME: LINKAGE TECHNOLOGY (NANJING) CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 210013 No. 16 building, world window software park, No. 12 Huai gate, Jiangsu, Nanjing

Patentee after: LINKAGE-ASIAINFO TECHNOLOGIES (NANJING), INC.

Address before: 210013 No. 16 building, world window software park, No. 12 Huai gate, Jiangsu, Nanjing

Patentee before: Linkage System Integration Co., Ltd.

C56 Change in the name or address of the patentee

Owner name: ASIALNFO TECHNOLOGY (NANJING) CO., LTD.

Free format text: FORMER NAME: LINKAGE-ASIAINFO TECHNOLOGY (NANJING) CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 210013 No. 16 building, world window software park, No. 12 Huai gate, Jiangsu, Nanjing

Patentee after: Asialnfo Technology (Nanjing) Co., Ltd.

Address before: 210013 No. 16 building, world window software park, No. 12 Huai gate, Jiangsu, Nanjing

Patentee before: LINKAGE-ASIAINFO TECHNOLOGIES (NANJING), INC.

TR01 Transfer of patent right

Effective date of registration: 20220509

Address after: 100193 Room 101, 1 / F, building 19, East District, yard 10, northwest Wangdong Road, Haidian District, Beijing

Patentee after: ASIAINFO TECHNOLOGIES (CHINA), Inc.

Address before: Building 16, window of the world software park, 12 Dinghuaimen, Nanjing, Jiangsu 210013

Patentee before: ASIAINFO TECHNOLOGY (NANJING) CO.,LTD.

TR01 Transfer of patent right