CN103366015B - 一种基于Hadoop的OLAP数据存储与查询方法 - Google Patents
一种基于Hadoop的OLAP数据存储与查询方法 Download PDFInfo
- Publication number
- CN103366015B CN103366015B CN201310330472.9A CN201310330472A CN103366015B CN 103366015 B CN103366015 B CN 103366015B CN 201310330472 A CN201310330472 A CN 201310330472A CN 103366015 B CN103366015 B CN 103366015B
- Authority
- CN
- China
- Prior art keywords
- data
- index
- file
- hcfile
- olap
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于Hadoop的OLAP海量数据的存储与查询方法,在数据存储上,首先定义了新的列文件存储格式HCFile,然后给出了基于HCFile的数据表存储方法,在该方案中,读取一列数据只需读取若干HCFile,无需访问其它列数据,I/O效率与按行存储相比大大提高;同时,添加一列数据只需添加新的文件,极易扩展。在聚集计算上,首先创建了基于倒排结构的数据索引,然后利用MapReduce实现了OLAP的基本聚集计算,包括求和、最大/最小值和计数等,其它聚集计算可由这些基本聚集计算实现,得益于高效的数据索引,聚集计算的性能显著提升。本发明与现有技术相比,不仅有效的提高了数据存储与查询的效率,而且节省了硬件资源,降低了时间和硬件成本,同时,运用更方便灵活。
Description
技术领域
本发明属于海量数据管理领域,特别涉及一种基于Hadoop的OLAP数据存储与查询方法。
背景技术
首先对本发明中用到的缩写及名词进行说明:
OLAP:OnlineAnalyticalProcessing,联机分析处理;
Hadoop:一个分布式系统基础架构;
HDFS:HadoopDistributedFileSystem,Hadoop分布式文件系统;
HCFile:HadoopColumnFile,Hadoop列存储文件;
MapReduce:一种并行编程框架;
随着信息处理技术和数据库技术的不断发展,各行各业已逐渐建立起了自己的信息处理系统。随着时间的推移,企业积累了大量历史数据,其规模已发展到TB级甚至PB级,而且仍在加速增长。如今市场竞争日趋激烈,企业决策者迫切需要分析处理这些大规模数据以准确把握企业内部和外部的发展,从而做出正确的决策。然而传统关系型数据库主要用于事务处理,它对分析处理的支持一直不能令人满意,在此背景下,专为决策服务的OLAP(On-LineAnalyticalProcessing,联机分析处理)系统应运而生。
OLAP是多维数据分析工具的集合。分析人员通过提交多维的OLAP聚集查询从多种角度对数据进行汇总和抽象,从而更深入地了解数据,发觉数据背后的信息。OLAP具有分析功能灵活、数据操作直观和分析结果可视化表示等突出优点,因此被广泛应用到科学实验统计、环境气象、生物信息计算等应用中。
为了能够在若干秒内响应决策支持查询,OLAP系统必须具备高效的数据存取技术和聚集查询处理技术。目前,传统的OLAP解决方案在这两个方面都遇到了瓶颈。首先,OLAP系统的分析任务包含大量的只读操作,一个任务通常需要在部分列上读取MB甚至GB级的数据。传统OLAP解决方案按行存储数据,在读取部分列的数据时需要扫描全表,额外的I/O开销高,而且随着数据量的增大而增大。其次,随着OLAP应用数据量的不断扩大以及用户查询请求的复杂化,聚集计算的输入输出的体积日益膨胀,计算复杂度不断提升,传统的聚集计算方法需要消耗大量资源,时间开销也十分昂贵,而且灵活性不足,难以应对查询模式的频繁变化。
发明内容
发明目的:针对上述现有技术存在的问题和不足,本发明提供了一种明显提升了OLAP在海量数据环境下的分析效率的基于Hadoop的OLAP数据存储与查询方法。
技术方案:为实现上述发明目的,本发明采用的技术方案为一种基于Hadoop的OLAP海量数据的存储与查询方法,包括步骤如下:
步骤100:定义列文件存储格式为HCFile,使用HCFile格式按列存储数据表;
步骤200:构建基于倒排结构的数据索引;
步骤300:在数据查询过程中,读取步骤200中构建的数据索引,利用MapReduce实现OLAP聚集计算。
其中,所述步骤100中数据表存储在表目录中,数据表中的每列数据存储在列目录中,一列数据存储在列目录下的多个HCFile中。这样修改一列属性只需访问响应列目录下的HCFile,添加一列属性只需添加一个列目录并向其中写入HCFile,这两种操作都无需访问其他列的数据,有效提高了I/O效率。
再者,所述HCFile格式包括数据文件和索引文件,其中所述数据文件包含文件头和数据分组,所述文件头用于记录文件版本、压缩算法和列数据的类型的元数据;数据分组包含固定个数的记录;所述索引文件包括一级索引、二级索引和文件尾;所述每个数据分组产生一个一级索引,一级索引用于记录数据分组在数据文件中的起始位置和长度;所述二级索引项的结构为(n,offset),n为一级索引序号,offset为一级索引在索引文件中的起始位置;所述文件尾用于记录数据分组的总数、记录的总数和二级索引在索引文件中的起始位置。
在所述步骤200中数据索引包括多个数据索引项,所述数据索引项包括索引键和索引值,索引键是维表记录的编码,索引值为维表记录在事实表中的位置列表;一张维表的索引作为一列数据存储在表目录中。用户可以选择将最常用的度量属性冗余在索引中,即将事实表中的位置与该位置对应的度量值一同保存在索引值中,以避免维表与事实表间频繁的连接操作,从而显著提升了查询性能。
进一步,所述步骤300中的聚集计算包括如下步骤:
步骤301:在Map阶段完成多维数据过滤;
步骤302:利用Shuffle机制完成过滤结果求交;
步骤303:在Reduce阶段完成求交结果聚集。
有益效果:本发明在数据存储上,首先定义了新的列文件存储格式HCFile,然后给出了基于HCFile的数据表存储方法,在该方案中,读取一列数据只需读取若干HCFile,无需访问其它列数据,I/O效率与按行存储相比大大提高;同时,添加一列数据只需添加新的文件,极易扩展。在聚集计算上,首先创建了基于倒排结构的数据索引,然后利用MapReduce实现了OLAP的基本聚集计算,包括求和、最大/最小值和计数等,其它聚集计算可由这些基本聚集计算实现,得益于高效的数据索引,聚集计算的性能显著提升。本发明与现有技术相比,不仅有效的提高了数据存储与查询的效率,而且节省了硬件资源,降低了时间和硬件成本,同时,运用更方便灵活。
附图说明
图1为本发明中HCFile结构示意图;
图2为本发明中的基于HCFile的数据表存储结构示意图;
图3是本发明中数据索引的物理存储结构示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明。
本发明提供基于Hadoop的OLAP海量数据的存储与查询方法,包括步骤如下:
步骤100:定义列文件存储格式为HCFile,使用HCFile格式,按列存储数据表;
如图1所示,HCFile由数据文件和索引文件组成。数据文件包含一个文件头和多个数据分组。文件头记录了文件版本、压缩算法、列数据的类型等元数据。数据分组包含固定个数的记录。记录的长度可变,所以数据分组不定长。一个HDFS数据块通常包含多个数据分组。索引文件由一级索引、二级索引和文件尾组成。每个数据分组产生一个一级索引,一级索引记录数据分组在数据文件中的起始位置和长度。如果数据文件有序,一级索引还记录数据分组中第一个数据的值,以便利用二分查找来提高按值检索的速度。
HDFS上的文件可能很大,一级索引过多以致无法一次性全部载入内存,因此如果一级索引超过一定个数,HCFile将创建二级索引。二级索引是一个稀疏的范围索引,它每隔一定数目的一级索引项创建一个二级索引项,二级索引项的结构为(n,offset),n为一级索引项序号,offset为一级索引在索引文件中的起始位置。索引文件尾记录数据分组的总数、记录的总数和二级索引在索引文件中的起始位置。
写入数据时,数据首先被缓存在内存中,一级索引也被缓存在内存中。当缓存中记录的个数达到阈值后,数据被写入数据文件,当缓存中一级索引的个数达到阈值后,一级索引被写入索引文件。
一个HCFile存储二维关系数据表中的一列或部分列数据。传统的列存储结构使用key-value对形式,将记录的主键(key)冗余到每一个属性(value)中,每个列存储文件实际存储两列数据,与此不同,HCFile只记录属性值。属性间的关系通过位置信息来确定。在多个HCFile中,位于不同文件相同位置的属性值来源于同一记录。HCFile上可以进行快速的基于位置的随机定位。假定每个数据分组存储k个属性值,那么第1至第k个属性值存储在数组分组1中,K+1…2k存在数组分组2中,则第n个属性值在数组分组[n/k]中,[n/k]的含义是先计算n除以k的值,对得到的值进行向上取整,取第一个不小于该值的整数做为[n/k]的结果。例如[10/3],首先计算10/3=3.3,然后对3.3进行向上取整,得到第一个不小于3.3的整数4做为[10/3]的值,所以[10/3]=4。当读取第n个属性值时,首先将索引文件读入内存,然后确定第n个属性值所在数据分组[n/k],从第n/k个索引项中获得该数据分组的起始位置,将其读入内存,然后返回其中第n%k个属性值,其中%表示取余数,例如计算10%3,10=3*3+1,所以10%3=1。如果数据文件有序,只有在按位置进行数据检索时,索引才会被读入内存,否则直接顺序扫描数据文件。
HCFile支持数据压缩。压缩算法可以使用Hadoop平台上所有通用的压缩算法,包括Gzip,Bzip2和Lzo。数据压缩以数据分组为单位进行。文件读取时,每次从磁盘中读取若干个压缩后的数据分组,然后在内存中解压。
使用HCFile格式,按列存储数据表的具体方法,海量数据按星型模式进行存储。数据表存储在一个同名目录即表目录中。每列数据存储在表目录下的同名子目录即列目录中。一列数据存储在列目录下的多个HCFile文件中。
向数据表追加数据时,新数据被按列拆分,每列数据写入一个新的HCFile,存储到相应的列目录中。这些HCFile的文件名包含相同的序号,以指明它们的内容来自于同一批原始记录集。
如图2所示,以包含编号、洲、国家和城市的地区维第三次加载为例。地区维Region存储在同名目录Region/中。Region/下包含四个列目录,分别是地区编号、洲、国家和城市,分别存储地区编号、洲、国家和城市属性。在第三次数据加载前,每个列目录中包含两个HCFile文件,分别存储第一次和第二次加载的数据,第三次加载将数据写入各个目录下的第三个HCFile中,文件名都包含编号3。
OLAP系统很难应对频繁的数据表结构的变化,尤其是事实表的结构变化。本发明的存储方法能轻松的应对这些变化。在数据表中修改一列数据只需修改一个列目录下的存储文件,无需访问其它文件。添加一列数据只需创建新的列目录,然后写入新的HCFile。删除一列数据只需删除一个列目录。
步骤200:构建基于倒排结构的数据索引;
数据索引在维表上创建,可以为每一张具有层次性的维表创建数据索引。创建索引前,首先将维表中的记录进行编码,编码具有前缀性质,即在具有层次性的属性之间,高层属性的编码是低层属性编码的前缀。然后创建数据索引,每条维表记录产生一个数据索引项,数据索引项的包括维表记录编码和维表记录在事实表中出现的位置列表,其中第一部分称为索引键,第二部分称为索引值。数据索引按索引键有序进行。用户可以选择将最常用的度量属性冗余在索引中,即将事实表中的位置与该位置对应的度量值一同保存在索引值中,以避免维表与事实表间频繁的连接操作,从而显著提升查询性能。
数据索引作为维表的一列数据存储在表目录下的一个列目录中,该目录称为索引目录。索引目录中包括一个索引键文件和多个索引值文件,分别用于存储索引项的索引键和索引值,存储格式均为HCFile。
如图3所示,以包含8条数据的地区维为例,最外层虚线框代表索引目录。索引目录最左边一列为索引键文件,用于存储索引键,即维表中每条记录的编码。索引目录右边包含三个索引值文件,分别记录三次数据加载中产生的索引信息,即维表记录在事实表中的位置列表。属于同一索引项的索引键和索引值通过指针链接起来,构成一个链表。
读取数据索引时,首先在索引键文件中利用二分查找得到索引值链表的链表头,然后顺序遍历链表,读取所有的索引值。为了提高索引读取的效率,事实表每加载一定次数后,将索引目录中的多个索引值文件合并成一个索引值文件。
步骤300:在数据查询过程中,读取步骤200中构建的数据索引,利用MapReduce实现OLAP聚集计算。
其中,聚集计算的一般模式为“SELECTAGG(COLUMN)FROMTABLEWHERECONDITIONS”,表示在TABLE表中选择符合CONDITIONS条件的记录,对这些记录的COLUMN的属性值进行AGG聚集操作并将结果返回;其中,AGG表示聚集运算,基本的聚集运算包括计数COUNT、求和SUM、求平均值AVG、求最大值MAX以及求最小值MIN,其它高级聚集运算均可由基本聚集运算组合而成;COLUMN表示被聚集的列,TABLE表示COLUMN所属的表,CONDITIONS表示查询条件,例如Time=’2012-09-02’,在多维数据环境下,查询条件通常有多个。
本发明将多维聚集计算划分为多维数据过滤、过滤结果求交和执行聚集三个步骤。
301:在Map阶段,多维数据过滤。多维查询条件被拆分成各个维上的子查询条件,如“time=2011-10-10andregion=Asia-China-Nanjing”被分解为“time=2011-10-10和region=Asia-China-Nanjing”。在各个维上利用数据索引多个map任务并行地在多张维表上执行数据过滤,筛选出符合子查询条件的索引项,输出其索引值即事实表中的位置列表。
302:利用Shuffle机制完成过滤结果求交。对第一步的过滤结果即位置列表进行求交,得到符合全部查询条件的记录在事实表中的位置列表。
303:在Reduce阶段完成执行聚集。根据聚集的类别,在求交后的位置列表上执行聚集运算。如果待聚集的度量值已经冗余在索引中,则Reduce任务无需访问事实数据,直接进行聚集,否则,需要在事实表中根据位置提取度量值。
Claims (4)
1.一种基于Hadoop的OLAP海量数据的存储与查询方法,其特征在于:包括步骤如下:
步骤100:定义列文件存储格式为HCFile,使用HCFile格式,按列存储数据表;
步骤200:构建基于倒排结构的数据索引;
步骤300:在数据查询过程中,读取步骤200中构建的数据索引,利用MapReduce实现OLAP聚集计算;
所述步骤100中HCFile格式包括数据文件和索引文件,其中所述数据文件包含文件头和数据分组,所述文件头用于记录文件版本、压缩算法和列数据的类型的元数据;数据分组包含固定个数的记录;所述索引文件包括一级索引、二级索引和文件尾;所述每个数据分组产生一个一级索引,一级索引用于记录数据分组在数据文件中的起始位置和长度;所述二级索引的结构为(n,offset),n为一级索引序号,offset为一级索引在索引文件中的起始位置;所述文件尾用于记录数据分组的总数、记录的总数和二级索引在索引文件中的起始位置。
2.根据权利要求1所述的基于Hadoop的OLAP海量数据的存储与查询方法,其特征在于:所述步骤100中数据表存储在表目录中,数据表中的每列数据存储在列目录中,一列数据存储在列目录下的多个HCFile中。
3.根据权利要求1所述的基于Hadoop的OLAP海量数据的存储与查询方法,其特征在于:所述步骤200中数据索引包括多个数据索引项,所述数据索引项包括索引键和索引值,索引键是维表记录的编码,索引值为维表记录在事实表中的位置列表;一张维表的索引作为一列数据存储在表目录中。
4.根据权利要求1所述的基于Hadoop的OLAP海量数据的存储与查询方法,其特征在于:所述步骤300中的聚集计算包括如下步骤:
步骤301:在Map阶段完成多维数据过滤;
步骤302:利用Shuffle机制完成过滤结果求交;
步骤303:在Reduce阶段完成求交结果聚集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310330472.9A CN103366015B (zh) | 2013-07-31 | 2013-07-31 | 一种基于Hadoop的OLAP数据存储与查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310330472.9A CN103366015B (zh) | 2013-07-31 | 2013-07-31 | 一种基于Hadoop的OLAP数据存储与查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103366015A CN103366015A (zh) | 2013-10-23 |
CN103366015B true CN103366015B (zh) | 2016-04-27 |
Family
ID=49367356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310330472.9A Expired - Fee Related CN103366015B (zh) | 2013-07-31 | 2013-07-31 | 一种基于Hadoop的OLAP数据存储与查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103366015B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866508B (zh) * | 2014-02-26 | 2019-05-03 | 中国电信股份有限公司 | 在云环境下管理文件的方法与装置 |
CN104112011B (zh) * | 2014-07-16 | 2017-09-15 | 深圳国泰安教育技术股份有限公司 | 一种海量数据提取的方法及装置 |
CN104133867A (zh) * | 2014-07-18 | 2014-11-05 | 中国科学院计算技术研究所 | 分布式顺序表片内二级索引方法及系统 |
CN104579357B (zh) * | 2015-01-13 | 2018-06-22 | 北京京东尚科信息技术有限公司 | 处理压缩文件的方法和装置 |
CN104657426B (zh) * | 2015-01-22 | 2018-07-03 | 江苏瑞中数据股份有限公司 | 一种基于统一视图的行列混合数据存储模型的建立方法 |
CN104715039B (zh) * | 2015-03-23 | 2018-10-19 | 星环信息科技(上海)有限公司 | 基于硬盘和内存的列式存储和查询方法及设备 |
CN105095520B (zh) * | 2015-09-23 | 2018-07-27 | 电子科技大学 | 面向结构化数据的分布式内存数据库索引方法 |
CN105354251B (zh) * | 2015-10-19 | 2018-10-30 | 国家电网公司 | 电力系统中基于Hadoop的电力云数据管理索引方法 |
CN105631003B (zh) * | 2015-12-28 | 2019-02-22 | 北京赛思信安技术股份有限公司 | 支持海量数据分组统计的智能索引构建、查询及维护方法 |
CN106471501B (zh) * | 2016-03-24 | 2020-04-14 | 华为技术有限公司 | 数据查询的方法、数据对象的存储方法和数据系统 |
CN105956071A (zh) * | 2016-04-28 | 2016-09-21 | 乐视控股(北京)有限公司 | Olap聚合运算时的内存优化方法和装置 |
CN106599052B (zh) * | 2016-11-15 | 2020-07-17 | 上海跬智信息技术有限公司 | 一种基于Apache Kylin的数据查询系统及其方法 |
CN107562946A (zh) * | 2017-09-26 | 2018-01-09 | 南京哈卢信息科技有限公司 | 一种大数据系统中创建索引表的方法 |
CN107590270A (zh) * | 2017-09-26 | 2018-01-16 | 南京哈卢信息科技有限公司 | 一种快速数据分析而生文本格式的方法 |
CN110233798B (zh) | 2018-03-05 | 2021-02-26 | 华为技术有限公司 | 数据处理方法、装置及系统 |
NL2022612B1 (en) * | 2019-02-21 | 2020-08-31 | Exel Ind | Agricultural device and method for dispensing a liquid |
CN110263038B (zh) * | 2019-06-11 | 2021-06-15 | 中国人民大学 | 一种基于分组向量的哈希多表连接实现方法 |
CN111159140B (zh) * | 2019-12-31 | 2023-09-19 | 咪咕文化科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113407587B (zh) * | 2021-07-19 | 2023-10-27 | 北京百度网讯科技有限公司 | 用于联机分析处理引擎的数据处理方法、装置、设备 |
CN114748875B (zh) * | 2022-05-20 | 2023-03-24 | 一点灵犀信息技术(广州)有限公司 | 数据存盘方法、装置、设备、存储介质及程序产品 |
CN115203159B (zh) * | 2022-07-25 | 2024-06-04 | 北京字跳网络技术有限公司 | 一种数据存储方法、装置、计算机设备和存储介质 |
CN116521063B (zh) * | 2023-03-31 | 2024-03-26 | 北京瑞风协同科技股份有限公司 | 一种hdf5的试验数据高效读写方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183368A (zh) * | 2007-12-06 | 2008-05-21 | 华南理工大学 | 联机分析处理中分布式计算及查询海量数据的方法和系统 |
CN102663117A (zh) * | 2012-04-18 | 2012-09-12 | 中国人民大学 | 面向数据库与Hadoop混合平台的OLAP查询处理方法 |
CN102982103A (zh) * | 2012-11-06 | 2013-03-20 | 东南大学 | 一种olap海量多维数据维存储方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8024288B2 (en) * | 2008-08-27 | 2011-09-20 | Oracle International Corporation | Block compression using a value-bit format for storing block-cell values |
-
2013
- 2013-07-31 CN CN201310330472.9A patent/CN103366015B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183368A (zh) * | 2007-12-06 | 2008-05-21 | 华南理工大学 | 联机分析处理中分布式计算及查询海量数据的方法和系统 |
CN102663117A (zh) * | 2012-04-18 | 2012-09-12 | 中国人民大学 | 面向数据库与Hadoop混合平台的OLAP查询处理方法 |
CN102982103A (zh) * | 2012-11-06 | 2013-03-20 | 东南大学 | 一种olap海量多维数据维存储方法 |
Non-Patent Citations (2)
Title |
---|
A MapReduceMerge-based Data Cube Construction Method;Yuxiang Wang等;《Grid and Cooperative Computing (GCC), 2010 9th International Conference on》;20101105;全文 * |
OLAP聚集计算中的维存储技术;宋爱波等;《东南大学学报(自然科学版)》;20120930;第42卷(第5期);第798页左栏和右栏,第800页左栏,表1,2,3 * |
Also Published As
Publication number | Publication date |
---|---|
CN103366015A (zh) | 2013-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103366015B (zh) | 一种基于Hadoop的OLAP数据存储与查询方法 | |
CN102521406B (zh) | 海量结构化数据复杂查询任务的分布式查询方法和系统 | |
CN102521405B (zh) | 支持高速加载的海量结构化数据存储、查询方法和系统 | |
CN102214176B (zh) | 超大维表的切分与表连接方法 | |
CN104199816B (zh) | 单独可访问数据单元的管理存储 | |
US10013440B1 (en) | Incremental out-of-place updates for index structures | |
CN102402617A (zh) | 一种利用分片及稀疏位图的易压缩数据库索引存储系统及其相应的构建、调度和查询处理方法 | |
US9141666B2 (en) | Incremental maintenance of range-partitioned statistics for query optimization | |
CN102982103A (zh) | 一种olap海量多维数据维存储方法 | |
US20160253382A1 (en) | System and method for improving a query response rate by managing a column-based store in a row-based database | |
CN102663116A (zh) | 面向列存储数据仓库的多维olap查询处理方法 | |
CN110990402B (zh) | 由行存储到列存储的格式转化方法、查询方法及装置 | |
CN110309233A (zh) | 数据存储的方法、装置、服务器和存储介质 | |
CN103886011A (zh) | 一种基于索引文件的社会关系网络创建与检索系统及方法 | |
Rozsnyai et al. | Large-scale distributed storage system for business provenance | |
CN103744913A (zh) | 一种基于搜索引擎技术的数据库检索方法 | |
WO2010084754A1 (ja) | データベースシステム、データベース管理方法、データベース構造および記憶媒体 | |
CN105630934A (zh) | 一种数据统计方法及系统 | |
CN103198150A (zh) | 一种大数据索引方法及系统 | |
EP3767486A1 (en) | Multi-record index structure for key-value stores | |
CN101963993A (zh) | 一种数据库单表记录快速查找的方法 | |
Weintraub et al. | Needle in a haystack queries in cloud data lakes. | |
Nørvåg | Supporting temporal text-containment queries in temporal document databases | |
Colosi et al. | Time series data management optimized for smart city policy decision | |
CN102253947B (zh) | 可渐进传输的矢量数据聚集化存储与访问的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160427 Termination date: 20180731 |
|
CF01 | Termination of patent right due to non-payment of annual fee |