CN106682073A - 基于ElasticSearch的HBase模糊检索系统 - Google Patents
基于ElasticSearch的HBase模糊检索系统 Download PDFInfo
- Publication number
- CN106682073A CN106682073A CN201611015320.XA CN201611015320A CN106682073A CN 106682073 A CN106682073 A CN 106682073A CN 201611015320 A CN201611015320 A CN 201611015320A CN 106682073 A CN106682073 A CN 106682073A
- Authority
- CN
- China
- Prior art keywords
- hbase
- data
- elasticsearch
- module
- rowkey
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于ElasticSearch的HBase模糊检索系统,包括:Web接口模块:调用Elasticsearch模块和Hbase数据服务模块;Elasticsearch检索模块:根据Web接口模块的输入条件检索获取rowkeys集合;数据同步模块:用作HBase的协处理器,实现数据初始化和同步操作;HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。本发明将HBase与Elasticsearch结合起来,大大提高检索效率,满足大批量数据的实时查询分析。
Description
技术领域
本发明涉及一种数据库检索系统,尤其涉及一种基于ElasticSearch的HBase模糊检索系统。
背景技术
HBase是一个分布式数据库,具有快速查询海量数据的特点。一方面用Rowkey基于字典序的快速检索。另一方面利用filter过滤的全表扫描查询,支持子字符和正则匹配的模糊查询。HBase全称hadoop database,是Apache的一个开源项目。HBase是一个分布式的列式数据库,基于底层HDFS分布式分拣系统。提供原生Java Api访问方式,使用ThriftServer对外支持多种语言访问。在检索上,使用rowkey做快速检索,而rowkey作为hbase的唯一键值,即hbase没有第二索引。
Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎,Elasticsearch使用Java开发并使用Lucene为核心来实现所有的搜索和索引的功能,通过Rest Api的方式来隐藏Lucene的复杂性,并对外提供操作的服务。内置丰富的搜索方法,如:词条查询、match查询、通配符查询、more_like_this查询、范围查询、正则表达式查询等等。
在Github上有两个开源项目,一个是利用elasticsearch的river实现的定时扫描数据插入到ES中,另一个是利用HBase repilication机制,模拟一个replication节点将数据同步到elasticsearch中。
Lily HBase Indexer基于HBase的replication机制,把HBase中的数据操作,抽象成为一系列的Evernt,通过实现Listener来处理Event,然后同步到Solr中。应用于CLoudera内置的Cloudera Search项目。
现有技术存在如下缺点:
Elasticsearch-HBase-River并未实现支持rowkey的模糊检索,实现了HBase到Elasticsearch的数据同步,然而对大批量数据而言,数据的同步是非常消耗性能和时间的,特别是在资源使用较为紧张时尤为突出。该方案提供了一种数据从HBase到elasticsearch的解决方案,却不是结合HBase做存储查询的良好方案。短期分析可以,长久使用该方案必然会造成性能消耗过大,数据冗余,分析实时性较差。
Lily HBase Indexer并未实现支持rowkey的模糊检索,利用HBase replication机制将HBase的数据同步到solr中,其中将HBase上的数据操作抽象成一系列的Event,用户可以通过实现自己的Listener来处理Event。该解决方案提供了一种技术将数据同步到HBase中,同时可以监听HBase的数据操作进行实施更新,然而相比使用Elasticsearch的人数在逐年减少,热度和支持度不够Elasticsearch的好。
由上可见,使用原生的HBase查询可以分为两种,一种是基于rowkey的查询,另一种是基于filter的过滤查询。然而这两种查询都有其局限性,对于rowkey查询,能快速响应查询请求,查询条件不够灵活;而对于filter查询,目前支持DependentColumnFilter,FamilyFilter,QualifierFilter,RowFilter,ValueFilter等过滤器,基于filter过滤查询其性能不高,最糟糕的情况是全表扫描,随着数据量的增大其查询效率逐渐降低。
发明内容
本发明所要解决的技术问题是提供一种基于ElasticSearch的HBase模糊检索系统,能够大大提高检索效率,满足大批量数据的实时查询分析需求,并有效保证数据的一致性。
本发明为解决上述技术问题而采用的技术方案是提供一种基于ElasticSearch的HBase模糊检索系统,包括:Web接口模块:先根据检索条件调用Elasticsearch模块,获取rowkey集合,再根据获取的rowkey集合调用HBase数据服务模块来获取HBase的数据;Elasticsearch检索模块:根据Web接口模块的输入条件作为检索条件,获取rowkeys集合;数据同步模块:用作HBase的协处理器,将Hbase中的数据与Elasticsearch建立索引,并实现数据初始化、数据操作更新同步和定时同步操作;HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;所述Elasticsearch检索模块部署在Elasticsearch集群上,所述HBase数据服务模块部署在HBase集群的服务器上,所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述Web接口模块通过解析web请求,获取检索条件,并通过HttpClient来获取Elasticsearch中rowkey数据的集合。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述Elasticsearch检索模块将Web接口模块的输入条件依次进行字符过滤、分词器分词和分词过滤后再进行检索。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述数据同步模块注册到HBase数据服务模块中作为HBase的协处理器;当HBase启动时,进行数据同步操作;当数据操作更新时,进行数据同步操作;所述数据同步模块定时检索命中率较高的表,按最近最少使用算法定期更新索引。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述HBase数据服务模块根据每个表的业务数据大小配置预分区,根据数据的使用周期配置TTl,并为rowkey建立字段的联系。
本发明对比现有技术有如下的有益效果:本发明提供的基于ElasticSearch的HBase模糊检索系统,通过将HBase与Elasticsearch结合起来,大大提高检索效率,能够满足大批量数据的实时查询分析需求,并有效保证数据的一致性。
附图说明
图1为本发明基于ElasticSearch的HBase模糊检索系统架构示意图;
图2为本发明的Web接口模块实现流程图;
图3为本发明的Elasticsearch检索模块实现流程图;
图4为本发明的HBase协处理实现流程图;
图5为本发明的HBase中的rowkey存放示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明基于Elasticsearch的DSL查询架构示意图。
请参见图1,本发明提供的基于ElasticSearch的HBase模糊检索系统,通过HBase与Elasticsearch接口模块将ES和HBase结合起来,该接口模块由Web接口模块、Elasticsearch检索模块、数据同步模块和HBase数据服务模块组成。各模块的主要功能及实现如下。
1、Web接口模块
根据检索条件调用Elasticsearch模块,获取封装rowkey集合,从而调用HBase数据服务模块返回检索数据。Web接口调用流程如图2所示,包括如下过程:
解析web请求,获取检索条件;
通过HttpClient来获取Elasticsearch中rowkey数据的集合;
根据上一步获取的rowkey集合来获取HBase的数据。
2、Elasticsearch检索模块
根据web模块的输入条件作为检索,获取rowkeys集合。Elasticsearch检索流程如图3所示,根据请求检索的条件,拼装成url,通过httpclient来获取结果,解析结果集。
3、数据同步模块
通过该模块分别实现数据初始化、数据操作更新同步、定时同步三大功能。HBase协处理实现流程如图4所示:
将协处理的实现注册到HBase中;
当注册到HBase中后,当HBase启动时,进行数据同步操作;
当数据操作更新时,进行数据同步;
定时检索命中率较高的表,按最近最少使用算法定期更新索引。
4、HBase数据服务模块
HBase的存储和查询都要经过rowkey,所以rowkey的设计关系到整个数据的使用周期,本发明将组成rowkey的字段,分别以colume的形式存放于表中,以方便数据更新、数据同步及数据初始化时用于更新索引,如图5所示。
根据每个表的业务数据大小配置预分区;
根据数据的使用周期配置TTl;
为rowkey建立字段的联系。
本发明通过上述四个模块来完成基于Elasticsearch的HBase模糊检索,在集成的过程中将Web接口模块部署于可以同时访问Elasticsearch集群和HBase集群的服务器上。
HBase是一个基于Hadoop的新型非关系数据库,对于数据量比较大的查询和存储性能较高。它以rowkey为唯一键值查询,千万上亿级别的数据查询效率都是在毫秒级返回结果,然而hbase中没有二级索引,此时对rowkey的模糊检索会加载大量的数据到内存中,检索效率不高,所以本发明将HBase与Elasticsearch结合大大提高了检索效率。
ElasticSearch用于全文检索,具有较高的性能和灵活度,它对外发布Restful接口,方便用户使用,同时支持多种语言接口有很好的平台支持。这里通过使用Elasticsearch来检索出对应的rowkey,从而快速定位到HBase中的数据,快速返回结果。
Hbase和Elasticsearch之间本身是没有关联,本发明的数据存储层使用HBase分布式存储服务,接口层采用实现obverser协处理器的方式,数据检索层采用Elasticsearch综合检索。本发明分别从数据初始化、数据定时同步、数据操作这三方面实现HBase的协处理器,通过协处理器将HBase中的数据与Elasticsearch建立索引。应用Elasticsearch优秀的检索能力,快速模糊匹配到所查询的rowkey,从而实现基于Elasticsearch的HBase模糊检索。本发明结合了Elasticsearch的全文检索和HBase的分布式存储能力,Elasticsearch灵活快速检索能力弥补了HBase在检索这块不够灵活的局限,而HBase作为分布式存储数据库其性能比市面上大多数存储系统好,两者优势互补。通过数据操作和数据同步协处理器实现数据同步,保证数据的一致性。本发明通过构建rowkey解析模型,支持模糊检索,快速定位查询rowkey列表,并发起hbase查询请求,以满足实时查询响应低时延的要求;以插件的形式将本发明的技术方案实现无缝接入到现有的生产系统,第一次部署后续无需人工干预;并可兼容Elasticsearch 2.0及2.x和HBase 1.0及1.x版本。具体优点如下:1)提供web服务,通过rest api的形式屏蔽底层使用的技术,降低了使用的复杂度;2)对比传统的HBase模糊索引,无需消耗大代价的全表扫描,可以通过快速定位到需要检索的rowkey,实时返回结果,降低性能的损耗;3)通过最近最少使用算法来定期更新Elasticsearch索引与HBase数据关系的方法,无需全量对HBase进行更新,减少消耗;4)利用Restful的方式对外提供服务,支持用户使用多种语言进行查询服务,易于扩展;5)通过修改配置文件,统一部署易于操作,维护性强。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。
Claims (5)
1.一种基于ElasticSearch的HBase模糊检索系统,其特征在于,包括:
Web接口模块:先根据检索条件调用Elasticsearch模块,获取rowkey集合,再根据获取的rowkey集合调用HBase数据服务模块来获取HBase的数据;
Elasticsearch检索模块:根据Web接口模块的输入条件作为检索条件,获取rowkeys集合;
数据同步模块:用作HBase的协处理器,将Hbase中的数据与Elasticsearch建立索引,并实现数据初始化、数据操作更新同步和定时同步操作;
HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;
所述Elasticsearch检索模块部署在Elasticsearch集群上,所述HBase数据服务模块部署在HBase集群的服务器上,所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。
2.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述Web接口模块通过解析web请求,获取检索条件,并通过HttpClient来获取Elasticsearch中rowkey数据的集合。
3.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述Elasticsearch检索模块将Web接口模块的输入条件依次进行字符过滤、分词器分词和分词过滤后再进行检索。
4.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述数据同步模块注册到HBase数据服务模块中作为HBase的协处理器;当HBase启动时,进行数据同步操作;当数据操作更新时,进行数据同步操作;所述数据同步模块定时检索命中率较高的表,按最近最少使用算法定期更新索引。
5.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述HBase数据服务模块根据每个表的业务数据大小配置预分区,根据数据的使用周期配置TTl,并为rowkey建立字段的联系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611015320.XA CN106682073A (zh) | 2016-11-14 | 2016-11-14 | 基于ElasticSearch的HBase模糊检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611015320.XA CN106682073A (zh) | 2016-11-14 | 2016-11-14 | 基于ElasticSearch的HBase模糊检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106682073A true CN106682073A (zh) | 2017-05-17 |
Family
ID=58839509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611015320.XA Pending CN106682073A (zh) | 2016-11-14 | 2016-11-14 | 基于ElasticSearch的HBase模糊检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106682073A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480164A (zh) * | 2017-06-20 | 2017-12-15 | 华迪计算机集团有限公司 | 一种查询物流数据的方法和系统 |
CN107506464A (zh) * | 2017-08-30 | 2017-12-22 | 武汉烽火众智数字技术有限责任公司 | 一种基于ES实现HBase二级索引的方法 |
CN107590251A (zh) * | 2017-09-19 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种数据管理方法及其装置 |
CN108667929A (zh) * | 2018-05-08 | 2018-10-16 | 浪潮软件集团有限公司 | 一种基于HBase协处理器同步数据到elasticsearch的方法 |
CN108763436A (zh) * | 2018-05-25 | 2018-11-06 | 福州大学 | 一种基于ElasticSearch与HBase的分布式数据存储系统 |
CN109086451A (zh) * | 2018-08-24 | 2018-12-25 | 江苏神州信源系统工程有限公司 | 一种图片存储与检索方法与装置 |
CN109271437A (zh) * | 2018-09-27 | 2019-01-25 | 智庭(北京)智能科技有限公司 | 一种海量房租信息的实时查询方法 |
CN109840251A (zh) * | 2018-12-29 | 2019-06-04 | 北京奥鹏远程教育中心有限公司 | 一种大数据聚合查询方法 |
CN110020333A (zh) * | 2017-07-27 | 2019-07-16 | 北京嘀嘀无限科技发展有限公司 | 数据分析方法及装置、电子设备、存储介质 |
CN110083627A (zh) * | 2019-04-28 | 2019-08-02 | 江苏满运软件科技有限公司 | 数据处理方法、系统、计算机设备和存储介质 |
CN110297827A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种集合Lucene和Hbase的电力数据检索系统 |
CN110457346A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN110543517A (zh) * | 2019-08-26 | 2019-12-06 | 汉纳森(厦门)数据股份有限公司 | 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质 |
CN110609845A (zh) * | 2018-06-15 | 2019-12-24 | 网宿科技股份有限公司 | 大数据冗余灾备方法、大数据服务系统及查询方法 |
CN110737839A (zh) * | 2019-10-22 | 2020-01-31 | 京东数字科技控股有限公司 | 短文本的推荐方法、装置、介质及电子设备 |
CN111680043A (zh) * | 2020-06-05 | 2020-09-18 | 南京莱斯信息技术股份有限公司 | 一种针对海量数据进行快速检索方法 |
CN112181986A (zh) * | 2020-10-10 | 2021-01-05 | 武汉中科通达高新技术股份有限公司 | 一种基于Flink框架的数据分析方法及装置 |
CN114090589A (zh) * | 2022-01-20 | 2022-02-25 | 苏州浪潮智能科技有限公司 | 基于HBase的数据查询方法、装置和计算机设备 |
CN116303628A (zh) * | 2023-05-25 | 2023-06-23 | 南京中孚信息技术有限公司 | 基于Elasticsearch的告警数据查询方法、系统及设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
-
2016
- 2016-11-14 CN CN201611015320.XA patent/CN106682073A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
Non-Patent Citations (2)
Title |
---|
CMDSSD1: "使用协处理器将HBase数据索引到Elasticsearch集群", 《CSDN博客》 * |
JUN BAI等: "Feasibility Analysis of Big Log Data Real Time Search Based on Hbase and ElasticSearch", 《2013 NINTH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC)》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480164A (zh) * | 2017-06-20 | 2017-12-15 | 华迪计算机集团有限公司 | 一种查询物流数据的方法和系统 |
CN110020333A (zh) * | 2017-07-27 | 2019-07-16 | 北京嘀嘀无限科技发展有限公司 | 数据分析方法及装置、电子设备、存储介质 |
CN107506464A (zh) * | 2017-08-30 | 2017-12-22 | 武汉烽火众智数字技术有限责任公司 | 一种基于ES实现HBase二级索引的方法 |
CN107590251A (zh) * | 2017-09-19 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种数据管理方法及其装置 |
CN108667929A (zh) * | 2018-05-08 | 2018-10-16 | 浪潮软件集团有限公司 | 一种基于HBase协处理器同步数据到elasticsearch的方法 |
CN108763436A (zh) * | 2018-05-25 | 2018-11-06 | 福州大学 | 一种基于ElasticSearch与HBase的分布式数据存储系统 |
CN110609845A (zh) * | 2018-06-15 | 2019-12-24 | 网宿科技股份有限公司 | 大数据冗余灾备方法、大数据服务系统及查询方法 |
CN109086451A (zh) * | 2018-08-24 | 2018-12-25 | 江苏神州信源系统工程有限公司 | 一种图片存储与检索方法与装置 |
CN109271437A (zh) * | 2018-09-27 | 2019-01-25 | 智庭(北京)智能科技有限公司 | 一种海量房租信息的实时查询方法 |
CN109840251A (zh) * | 2018-12-29 | 2019-06-04 | 北京奥鹏远程教育中心有限公司 | 一种大数据聚合查询方法 |
CN109840251B (zh) * | 2018-12-29 | 2023-11-03 | 北京奥鹏远程教育中心有限公司 | 一种大数据聚合查询方法 |
CN110083627A (zh) * | 2019-04-28 | 2019-08-02 | 江苏满运软件科技有限公司 | 数据处理方法、系统、计算机设备和存储介质 |
CN110297827A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种集合Lucene和Hbase的电力数据检索系统 |
CN110457346A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN110457346B (zh) * | 2019-07-05 | 2024-04-30 | 中国平安财产保险股份有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN110543517A (zh) * | 2019-08-26 | 2019-12-06 | 汉纳森(厦门)数据股份有限公司 | 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质 |
CN110543517B (zh) * | 2019-08-26 | 2022-05-10 | 汉纳森(厦门)数据股份有限公司 | 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质 |
CN110737839A (zh) * | 2019-10-22 | 2020-01-31 | 京东数字科技控股有限公司 | 短文本的推荐方法、装置、介质及电子设备 |
CN111680043A (zh) * | 2020-06-05 | 2020-09-18 | 南京莱斯信息技术股份有限公司 | 一种针对海量数据进行快速检索方法 |
CN111680043B (zh) * | 2020-06-05 | 2023-11-28 | 南京莱斯信息技术股份有限公司 | 一种针对海量数据进行快速检索方法 |
CN112181986A (zh) * | 2020-10-10 | 2021-01-05 | 武汉中科通达高新技术股份有限公司 | 一种基于Flink框架的数据分析方法及装置 |
CN114090589A (zh) * | 2022-01-20 | 2022-02-25 | 苏州浪潮智能科技有限公司 | 基于HBase的数据查询方法、装置和计算机设备 |
CN116303628A (zh) * | 2023-05-25 | 2023-06-23 | 南京中孚信息技术有限公司 | 基于Elasticsearch的告警数据查询方法、系统及设备 |
CN116303628B (zh) * | 2023-05-25 | 2023-09-22 | 南京中孚信息技术有限公司 | 基于Elasticsearch的告警数据查询方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106682073A (zh) | 基于ElasticSearch的HBase模糊检索系统 | |
CN102521406B (zh) | 海量结构化数据复杂查询任务的分布式查询方法和系统 | |
EP2898435B1 (en) | System and method for flexible distributed massively parallel processing (mpp) | |
WO2023087673A1 (zh) | 一种层次数据检索方法、装置和设备 | |
CN105045932B (zh) | 一种基于降序存储的数据分页查询方法 | |
CN102184222B (zh) | 一种在大数据量存储中快速检索的方法 | |
CN106649378A (zh) | 一种数据同步方法及装置 | |
EP2746970B1 (en) | Timeline index for managing temporal data | |
CN109670089A (zh) | 知识图谱系统及其图服务器 | |
CN111881223B (zh) | 数据管理方法、设备、系统及存储介质 | |
CN103646051B (zh) | 一种基于列存储的大数据并行处理系统及方法 | |
CN107506464A (zh) | 一种基于ES实现HBase二级索引的方法 | |
CN101419616A (zh) | 一种数据同步方法及装置 | |
CN105335479B (zh) | 一种基于sql的文本数据统计实现方法 | |
CN102298631B (zh) | 一种新型元数据管理系统和一种元数据属性混合索引方法 | |
CN107656951B (zh) | 一种同步异构数据库系统中实时数据的方法 | |
CN109684349A (zh) | 一种基于sql与图计算交互式分析的查询方法和系统 | |
CN106599052A (zh) | 一种基于ApacheKylin的数据查询系统及其方法 | |
CN103177094A (zh) | 一种物联网数据清洗方法 | |
Ding et al. | Massive heterogeneous sensor data management in the Internet of Things | |
CN102982034B (zh) | 互联网站内信息的搜索方法和搜索系统 | |
CN101620600A (zh) | 一种海量数据的处理方法 | |
D’silva et al. | Secondary indexing techniques for key-value stores: Two rings to rule them all | |
CN101094428A (zh) | 一种智能网业务数据库查询统计系统及其方法 | |
CN102945270A (zh) | 并行化分布式网络舆情数据管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170517 |