CN106682073A - 基于ElasticSearch的HBase模糊检索系统 - Google Patents

基于ElasticSearch的HBase模糊检索系统 Download PDF

Info

Publication number
CN106682073A
CN106682073A CN201611015320.XA CN201611015320A CN106682073A CN 106682073 A CN106682073 A CN 106682073A CN 201611015320 A CN201611015320 A CN 201611015320A CN 106682073 A CN106682073 A CN 106682073A
Authority
CN
China
Prior art keywords
hbase
data
elasticsearch
module
rowkey
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611015320.XA
Other languages
English (en)
Inventor
程永新
宋辉
冼土彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qingwei Software Co Ltd
Original Assignee
Shanghai Qingwei Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qingwei Software Co Ltd filed Critical Shanghai Qingwei Software Co Ltd
Priority to CN201611015320.XA priority Critical patent/CN106682073A/zh
Publication of CN106682073A publication Critical patent/CN106682073A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于ElasticSearch的HBase模糊检索系统,包括:Web接口模块:调用Elasticsearch模块和Hbase数据服务模块;Elasticsearch检索模块:根据Web接口模块的输入条件检索获取rowkeys集合;数据同步模块:用作HBase的协处理器,实现数据初始化和同步操作;HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。本发明将HBase与Elasticsearch结合起来,大大提高检索效率,满足大批量数据的实时查询分析。

Description

基于ElasticSearch的HBase模糊检索系统
技术领域
本发明涉及一种数据库检索系统,尤其涉及一种基于ElasticSearch的HBase模糊检索系统。
背景技术
HBase是一个分布式数据库,具有快速查询海量数据的特点。一方面用Rowkey基于字典序的快速检索。另一方面利用filter过滤的全表扫描查询,支持子字符和正则匹配的模糊查询。HBase全称hadoop database,是Apache的一个开源项目。HBase是一个分布式的列式数据库,基于底层HDFS分布式分拣系统。提供原生Java Api访问方式,使用ThriftServer对外支持多种语言访问。在检索上,使用rowkey做快速检索,而rowkey作为hbase的唯一键值,即hbase没有第二索引。
Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎,Elasticsearch使用Java开发并使用Lucene为核心来实现所有的搜索和索引的功能,通过Rest Api的方式来隐藏Lucene的复杂性,并对外提供操作的服务。内置丰富的搜索方法,如:词条查询、match查询、通配符查询、more_like_this查询、范围查询、正则表达式查询等等。
在Github上有两个开源项目,一个是利用elasticsearch的river实现的定时扫描数据插入到ES中,另一个是利用HBase repilication机制,模拟一个replication节点将数据同步到elasticsearch中。
Lily HBase Indexer基于HBase的replication机制,把HBase中的数据操作,抽象成为一系列的Evernt,通过实现Listener来处理Event,然后同步到Solr中。应用于CLoudera内置的Cloudera Search项目。
现有技术存在如下缺点:
Elasticsearch-HBase-River并未实现支持rowkey的模糊检索,实现了HBase到Elasticsearch的数据同步,然而对大批量数据而言,数据的同步是非常消耗性能和时间的,特别是在资源使用较为紧张时尤为突出。该方案提供了一种数据从HBase到elasticsearch的解决方案,却不是结合HBase做存储查询的良好方案。短期分析可以,长久使用该方案必然会造成性能消耗过大,数据冗余,分析实时性较差。
Lily HBase Indexer并未实现支持rowkey的模糊检索,利用HBase replication机制将HBase的数据同步到solr中,其中将HBase上的数据操作抽象成一系列的Event,用户可以通过实现自己的Listener来处理Event。该解决方案提供了一种技术将数据同步到HBase中,同时可以监听HBase的数据操作进行实施更新,然而相比使用Elasticsearch的人数在逐年减少,热度和支持度不够Elasticsearch的好。
由上可见,使用原生的HBase查询可以分为两种,一种是基于rowkey的查询,另一种是基于filter的过滤查询。然而这两种查询都有其局限性,对于rowkey查询,能快速响应查询请求,查询条件不够灵活;而对于filter查询,目前支持DependentColumnFilter,FamilyFilter,QualifierFilter,RowFilter,ValueFilter等过滤器,基于filter过滤查询其性能不高,最糟糕的情况是全表扫描,随着数据量的增大其查询效率逐渐降低。
发明内容
本发明所要解决的技术问题是提供一种基于ElasticSearch的HBase模糊检索系统,能够大大提高检索效率,满足大批量数据的实时查询分析需求,并有效保证数据的一致性。
本发明为解决上述技术问题而采用的技术方案是提供一种基于ElasticSearch的HBase模糊检索系统,包括:Web接口模块:先根据检索条件调用Elasticsearch模块,获取rowkey集合,再根据获取的rowkey集合调用HBase数据服务模块来获取HBase的数据;Elasticsearch检索模块:根据Web接口模块的输入条件作为检索条件,获取rowkeys集合;数据同步模块:用作HBase的协处理器,将Hbase中的数据与Elasticsearch建立索引,并实现数据初始化、数据操作更新同步和定时同步操作;HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;所述Elasticsearch检索模块部署在Elasticsearch集群上,所述HBase数据服务模块部署在HBase集群的服务器上,所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述Web接口模块通过解析web请求,获取检索条件,并通过HttpClient来获取Elasticsearch中rowkey数据的集合。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述Elasticsearch检索模块将Web接口模块的输入条件依次进行字符过滤、分词器分词和分词过滤后再进行检索。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述数据同步模块注册到HBase数据服务模块中作为HBase的协处理器;当HBase启动时,进行数据同步操作;当数据操作更新时,进行数据同步操作;所述数据同步模块定时检索命中率较高的表,按最近最少使用算法定期更新索引。
上述的基于ElasticSearch的HBase模糊检索系统,其中,所述HBase数据服务模块根据每个表的业务数据大小配置预分区,根据数据的使用周期配置TTl,并为rowkey建立字段的联系。
本发明对比现有技术有如下的有益效果:本发明提供的基于ElasticSearch的HBase模糊检索系统,通过将HBase与Elasticsearch结合起来,大大提高检索效率,能够满足大批量数据的实时查询分析需求,并有效保证数据的一致性。
附图说明
图1为本发明基于ElasticSearch的HBase模糊检索系统架构示意图;
图2为本发明的Web接口模块实现流程图;
图3为本发明的Elasticsearch检索模块实现流程图;
图4为本发明的HBase协处理实现流程图;
图5为本发明的HBase中的rowkey存放示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明基于Elasticsearch的DSL查询架构示意图。
请参见图1,本发明提供的基于ElasticSearch的HBase模糊检索系统,通过HBase与Elasticsearch接口模块将ES和HBase结合起来,该接口模块由Web接口模块、Elasticsearch检索模块、数据同步模块和HBase数据服务模块组成。各模块的主要功能及实现如下。
1、Web接口模块
根据检索条件调用Elasticsearch模块,获取封装rowkey集合,从而调用HBase数据服务模块返回检索数据。Web接口调用流程如图2所示,包括如下过程:
解析web请求,获取检索条件;
通过HttpClient来获取Elasticsearch中rowkey数据的集合;
根据上一步获取的rowkey集合来获取HBase的数据。
2、Elasticsearch检索模块
根据web模块的输入条件作为检索,获取rowkeys集合。Elasticsearch检索流程如图3所示,根据请求检索的条件,拼装成url,通过httpclient来获取结果,解析结果集。
3、数据同步模块
通过该模块分别实现数据初始化、数据操作更新同步、定时同步三大功能。HBase协处理实现流程如图4所示:
将协处理的实现注册到HBase中;
当注册到HBase中后,当HBase启动时,进行数据同步操作;
当数据操作更新时,进行数据同步;
定时检索命中率较高的表,按最近最少使用算法定期更新索引。
4、HBase数据服务模块
HBase的存储和查询都要经过rowkey,所以rowkey的设计关系到整个数据的使用周期,本发明将组成rowkey的字段,分别以colume的形式存放于表中,以方便数据更新、数据同步及数据初始化时用于更新索引,如图5所示。
根据每个表的业务数据大小配置预分区;
根据数据的使用周期配置TTl;
为rowkey建立字段的联系。
本发明通过上述四个模块来完成基于Elasticsearch的HBase模糊检索,在集成的过程中将Web接口模块部署于可以同时访问Elasticsearch集群和HBase集群的服务器上。
HBase是一个基于Hadoop的新型非关系数据库,对于数据量比较大的查询和存储性能较高。它以rowkey为唯一键值查询,千万上亿级别的数据查询效率都是在毫秒级返回结果,然而hbase中没有二级索引,此时对rowkey的模糊检索会加载大量的数据到内存中,检索效率不高,所以本发明将HBase与Elasticsearch结合大大提高了检索效率。
ElasticSearch用于全文检索,具有较高的性能和灵活度,它对外发布Restful接口,方便用户使用,同时支持多种语言接口有很好的平台支持。这里通过使用Elasticsearch来检索出对应的rowkey,从而快速定位到HBase中的数据,快速返回结果。
Hbase和Elasticsearch之间本身是没有关联,本发明的数据存储层使用HBase分布式存储服务,接口层采用实现obverser协处理器的方式,数据检索层采用Elasticsearch综合检索。本发明分别从数据初始化、数据定时同步、数据操作这三方面实现HBase的协处理器,通过协处理器将HBase中的数据与Elasticsearch建立索引。应用Elasticsearch优秀的检索能力,快速模糊匹配到所查询的rowkey,从而实现基于Elasticsearch的HBase模糊检索。本发明结合了Elasticsearch的全文检索和HBase的分布式存储能力,Elasticsearch灵活快速检索能力弥补了HBase在检索这块不够灵活的局限,而HBase作为分布式存储数据库其性能比市面上大多数存储系统好,两者优势互补。通过数据操作和数据同步协处理器实现数据同步,保证数据的一致性。本发明通过构建rowkey解析模型,支持模糊检索,快速定位查询rowkey列表,并发起hbase查询请求,以满足实时查询响应低时延的要求;以插件的形式将本发明的技术方案实现无缝接入到现有的生产系统,第一次部署后续无需人工干预;并可兼容Elasticsearch 2.0及2.x和HBase 1.0及1.x版本。具体优点如下:1)提供web服务,通过rest api的形式屏蔽底层使用的技术,降低了使用的复杂度;2)对比传统的HBase模糊索引,无需消耗大代价的全表扫描,可以通过快速定位到需要检索的rowkey,实时返回结果,降低性能的损耗;3)通过最近最少使用算法来定期更新Elasticsearch索引与HBase数据关系的方法,无需全量对HBase进行更新,减少消耗;4)利用Restful的方式对外提供服务,支持用户使用多种语言进行查询服务,易于扩展;5)通过修改配置文件,统一部署易于操作,维护性强。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。

Claims (5)

1.一种基于ElasticSearch的HBase模糊检索系统,其特征在于,包括:
Web接口模块:先根据检索条件调用Elasticsearch模块,获取rowkey集合,再根据获取的rowkey集合调用HBase数据服务模块来获取HBase的数据;
Elasticsearch检索模块:根据Web接口模块的输入条件作为检索条件,获取rowkeys集合;
数据同步模块:用作HBase的协处理器,将Hbase中的数据与Elasticsearch建立索引,并实现数据初始化、数据操作更新同步和定时同步操作;
HBase数据服务模块:将组成rowkey的字段,分别以colume的形式存放于表中;
所述Elasticsearch检索模块部署在Elasticsearch集群上,所述HBase数据服务模块部署在HBase集群的服务器上,所述Web接口模块部署于可同时访问Elasticsearch集群和HBase集群的服务器上。
2.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述Web接口模块通过解析web请求,获取检索条件,并通过HttpClient来获取Elasticsearch中rowkey数据的集合。
3.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述Elasticsearch检索模块将Web接口模块的输入条件依次进行字符过滤、分词器分词和分词过滤后再进行检索。
4.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述数据同步模块注册到HBase数据服务模块中作为HBase的协处理器;当HBase启动时,进行数据同步操作;当数据操作更新时,进行数据同步操作;所述数据同步模块定时检索命中率较高的表,按最近最少使用算法定期更新索引。
5.如权利要求1所述的基于ElasticSearch的HBase模糊检索系统,其特征在于,所述HBase数据服务模块根据每个表的业务数据大小配置预分区,根据数据的使用周期配置TTl,并为rowkey建立字段的联系。
CN201611015320.XA 2016-11-14 2016-11-14 基于ElasticSearch的HBase模糊检索系统 Pending CN106682073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611015320.XA CN106682073A (zh) 2016-11-14 2016-11-14 基于ElasticSearch的HBase模糊检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611015320.XA CN106682073A (zh) 2016-11-14 2016-11-14 基于ElasticSearch的HBase模糊检索系统

Publications (1)

Publication Number Publication Date
CN106682073A true CN106682073A (zh) 2017-05-17

Family

ID=58839509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611015320.XA Pending CN106682073A (zh) 2016-11-14 2016-11-14 基于ElasticSearch的HBase模糊检索系统

Country Status (1)

Country Link
CN (1) CN106682073A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480164A (zh) * 2017-06-20 2017-12-15 华迪计算机集团有限公司 一种查询物流数据的方法和系统
CN107506464A (zh) * 2017-08-30 2017-12-22 武汉烽火众智数字技术有限责任公司 一种基于ES实现HBase二级索引的方法
CN107590251A (zh) * 2017-09-19 2018-01-16 郑州云海信息技术有限公司 一种数据管理方法及其装置
CN108667929A (zh) * 2018-05-08 2018-10-16 浪潮软件集团有限公司 一种基于HBase协处理器同步数据到elasticsearch的方法
CN108763436A (zh) * 2018-05-25 2018-11-06 福州大学 一种基于ElasticSearch与HBase的分布式数据存储系统
CN109086451A (zh) * 2018-08-24 2018-12-25 江苏神州信源系统工程有限公司 一种图片存储与检索方法与装置
CN109271437A (zh) * 2018-09-27 2019-01-25 智庭(北京)智能科技有限公司 一种海量房租信息的实时查询方法
CN109840251A (zh) * 2018-12-29 2019-06-04 北京奥鹏远程教育中心有限公司 一种大数据聚合查询方法
CN110020333A (zh) * 2017-07-27 2019-07-16 北京嘀嘀无限科技发展有限公司 数据分析方法及装置、电子设备、存储介质
CN110083627A (zh) * 2019-04-28 2019-08-02 江苏满运软件科技有限公司 数据处理方法、系统、计算机设备和存储介质
CN110297827A (zh) * 2019-05-31 2019-10-01 国网上海市电力公司 一种集合Lucene和Hbase的电力数据检索系统
CN110457346A (zh) * 2019-07-05 2019-11-15 中国平安财产保险股份有限公司 数据查询方法、装置及计算机可读存储介质
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN110609845A (zh) * 2018-06-15 2019-12-24 网宿科技股份有限公司 大数据冗余灾备方法、大数据服务系统及查询方法
CN110737839A (zh) * 2019-10-22 2020-01-31 京东数字科技控股有限公司 短文本的推荐方法、装置、介质及电子设备
CN111680043A (zh) * 2020-06-05 2020-09-18 南京莱斯信息技术股份有限公司 一种针对海量数据进行快速检索方法
CN112181986A (zh) * 2020-10-10 2021-01-05 武汉中科通达高新技术股份有限公司 一种基于Flink框架的数据分析方法及装置
CN114090589A (zh) * 2022-01-20 2022-02-25 苏州浪潮智能科技有限公司 基于HBase的数据查询方法、装置和计算机设备
CN116303628A (zh) * 2023-05-25 2023-06-23 南京中孚信息技术有限公司 基于Elasticsearch的告警数据查询方法、系统及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036025A (zh) * 2014-06-27 2014-09-10 蓝盾信息安全技术有限公司 一种基于分布式的海量日志采集系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036025A (zh) * 2014-06-27 2014-09-10 蓝盾信息安全技术有限公司 一种基于分布式的海量日志采集系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CMDSSD1: "使用协处理器将HBase数据索引到Elasticsearch集群", 《CSDN博客》 *
JUN BAI等: "Feasibility Analysis of Big Log Data Real Time Search Based on Hbase and ElasticSearch", 《2013 NINTH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION (ICNC)》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480164A (zh) * 2017-06-20 2017-12-15 华迪计算机集团有限公司 一种查询物流数据的方法和系统
CN110020333A (zh) * 2017-07-27 2019-07-16 北京嘀嘀无限科技发展有限公司 数据分析方法及装置、电子设备、存储介质
CN107506464A (zh) * 2017-08-30 2017-12-22 武汉烽火众智数字技术有限责任公司 一种基于ES实现HBase二级索引的方法
CN107590251A (zh) * 2017-09-19 2018-01-16 郑州云海信息技术有限公司 一种数据管理方法及其装置
CN108667929A (zh) * 2018-05-08 2018-10-16 浪潮软件集团有限公司 一种基于HBase协处理器同步数据到elasticsearch的方法
CN108763436A (zh) * 2018-05-25 2018-11-06 福州大学 一种基于ElasticSearch与HBase的分布式数据存储系统
CN110609845A (zh) * 2018-06-15 2019-12-24 网宿科技股份有限公司 大数据冗余灾备方法、大数据服务系统及查询方法
CN109086451A (zh) * 2018-08-24 2018-12-25 江苏神州信源系统工程有限公司 一种图片存储与检索方法与装置
CN109271437A (zh) * 2018-09-27 2019-01-25 智庭(北京)智能科技有限公司 一种海量房租信息的实时查询方法
CN109840251A (zh) * 2018-12-29 2019-06-04 北京奥鹏远程教育中心有限公司 一种大数据聚合查询方法
CN109840251B (zh) * 2018-12-29 2023-11-03 北京奥鹏远程教育中心有限公司 一种大数据聚合查询方法
CN110083627A (zh) * 2019-04-28 2019-08-02 江苏满运软件科技有限公司 数据处理方法、系统、计算机设备和存储介质
CN110297827A (zh) * 2019-05-31 2019-10-01 国网上海市电力公司 一种集合Lucene和Hbase的电力数据检索系统
CN110457346A (zh) * 2019-07-05 2019-11-15 中国平安财产保险股份有限公司 数据查询方法、装置及计算机可读存储介质
CN110457346B (zh) * 2019-07-05 2024-04-30 中国平安财产保险股份有限公司 数据查询方法、装置及计算机可读存储介质
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN110543517B (zh) * 2019-08-26 2022-05-10 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN110737839A (zh) * 2019-10-22 2020-01-31 京东数字科技控股有限公司 短文本的推荐方法、装置、介质及电子设备
CN111680043A (zh) * 2020-06-05 2020-09-18 南京莱斯信息技术股份有限公司 一种针对海量数据进行快速检索方法
CN111680043B (zh) * 2020-06-05 2023-11-28 南京莱斯信息技术股份有限公司 一种针对海量数据进行快速检索方法
CN112181986A (zh) * 2020-10-10 2021-01-05 武汉中科通达高新技术股份有限公司 一种基于Flink框架的数据分析方法及装置
CN114090589A (zh) * 2022-01-20 2022-02-25 苏州浪潮智能科技有限公司 基于HBase的数据查询方法、装置和计算机设备
CN116303628A (zh) * 2023-05-25 2023-06-23 南京中孚信息技术有限公司 基于Elasticsearch的告警数据查询方法、系统及设备
CN116303628B (zh) * 2023-05-25 2023-09-22 南京中孚信息技术有限公司 基于Elasticsearch的告警数据查询方法、系统及设备

Similar Documents

Publication Publication Date Title
CN106682073A (zh) 基于ElasticSearch的HBase模糊检索系统
CN102521406B (zh) 海量结构化数据复杂查询任务的分布式查询方法和系统
EP2898435B1 (en) System and method for flexible distributed massively parallel processing (mpp)
WO2023087673A1 (zh) 一种层次数据检索方法、装置和设备
CN105045932B (zh) 一种基于降序存储的数据分页查询方法
CN102184222B (zh) 一种在大数据量存储中快速检索的方法
CN106649378A (zh) 一种数据同步方法及装置
EP2746970B1 (en) Timeline index for managing temporal data
CN109670089A (zh) 知识图谱系统及其图服务器
CN111881223B (zh) 数据管理方法、设备、系统及存储介质
CN103646051B (zh) 一种基于列存储的大数据并行处理系统及方法
CN107506464A (zh) 一种基于ES实现HBase二级索引的方法
CN101419616A (zh) 一种数据同步方法及装置
CN105335479B (zh) 一种基于sql的文本数据统计实现方法
CN102298631B (zh) 一种新型元数据管理系统和一种元数据属性混合索引方法
CN107656951B (zh) 一种同步异构数据库系统中实时数据的方法
CN109684349A (zh) 一种基于sql与图计算交互式分析的查询方法和系统
CN106599052A (zh) 一种基于ApacheKylin的数据查询系统及其方法
CN103177094A (zh) 一种物联网数据清洗方法
Ding et al. Massive heterogeneous sensor data management in the Internet of Things
CN102982034B (zh) 互联网站内信息的搜索方法和搜索系统
CN101620600A (zh) 一种海量数据的处理方法
D’silva et al. Secondary indexing techniques for key-value stores: Two rings to rule them all
CN101094428A (zh) 一种智能网业务数据库查询统计系统及其方法
CN102945270A (zh) 并行化分布式网络舆情数据管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170517