CN110555152A - 基于Elasticsearch框架的分布式搜索系统 - Google Patents
基于Elasticsearch框架的分布式搜索系统 Download PDFInfo
- Publication number
- CN110555152A CN110555152A CN201810277705.6A CN201810277705A CN110555152A CN 110555152 A CN110555152 A CN 110555152A CN 201810277705 A CN201810277705 A CN 201810277705A CN 110555152 A CN110555152 A CN 110555152A
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- framework
- elasticissearch
- search system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002776 aggregation Effects 0.000 claims abstract description 11
- 238000004220 aggregation Methods 0.000 claims abstract description 11
- 230000008676 import Effects 0.000 abstract description 11
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于大数据基础架构领域,涉及一种分布式搜索系统,尤其涉及一种基于Elasticsearch框架的分布式搜索系统。本发明提出的基于Elasticsearch框架的分布式搜索系统解决了大数据量条件下的实时搜索查询问题。数据导入Java数据库和API接口与外部配置文件,对数据源、目标集群及索引进行灵活搭配,达到了通用性和易维护性。源数据层通过数据聚合层与支撑连接层连接,支撑连接层与数据应用层连接,经测试上述连接极大提升数据导入性能,数据导入速度达到每小时2500万条左右。采用API接口使搜索接口更贴近于具体业务并且使web端开发与Elasticsearch解耦,降低了学习成本大大提高了开发效率。
Description
技术领域
本发明属于大数据基础架构领域,涉及一种分布式搜索系统,尤其涉及一种基于Elasticsearch框架的分布式搜索系统。
背景技术
Elasticsearch是目前主流的全文检索框架,解决了大数据量条件下的实时全文检索问题,并且支持基于get/post方法的json参数接口以及多种可视化插件和分词器,使搜索技术更容易的被应用于IT应用系统当中。
然而,Elasticsearch仅提供了数据导入及搜索的接口,并没有解决从数据源到应用端的一系列问题,而且Elasticsearch原生的搜索接口比较复杂,学习成本比较高,对于开发人员的掌握有一定困难,开发难度大。现有检索数据仅支持单一数据库,无法适用多种数据库。
发明内容
本发明解决现有技术不足提供一种适用范围广、开发难度低、实施便捷的基于Elasticsearch框架的分布式搜索系统。
为解决上述技术问题本发明采用如下技术方案:
基于Elasticsearch框架的分布式搜索系统,包括数据应用层、支撑连接层、数据聚合层和源数据层;源数据层通过数据聚合层与支撑连接层连接,支撑连接层与数据应用层连接;所述数据应用层为Web应用程序,所述支撑连接层为API接口,所述数据聚合层为Elasticsearch搜索服务器,所述源数据层为hadoop、Hive、Oracle和Mysql数据库;Elasticsearch搜索服务器通过API接口与Web应用程序连接。
所述API接口通过Java数据库与Elasticsearch搜索服务器连接。
所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述Web应用程序为Java语言架构编辑。
所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述Web应用程序录入检索字段,检索字段通过Java数据库和Elasticsearch搜索服务器调用源数据层。
所述源数据层为hadoop、Hive、Oracle和Mysql数据库的一种或几种。
本发明的有益效果为:
本发明提出的基于Elasticsearch框架的分布式搜索系统解决了大数据量条件下的实时搜索查询问题。数据导入Java数据库和API接口与外部配置文件,对数据源、目标集群及索引进行灵活搭配,达到了通用性和易维护性。源数据层通过数据聚合层与支撑连接层连接,支撑连接层与数据应用层连接,经测试上述连接极大提升数据导入性能,数据导入速度达到每小时2500万条左右。采用API接口使搜索接口更贴近于具体业务并且使web端开发与Elasticsearch解耦,降低了学习成本大大提高了开发效率。
附图说明
图1为本发明的结构示意图。
具体实施方式
基于Elasticsearch框架的分布式搜索系统,包括数据应用层、支撑连接层、数据聚合层和源数据层;源数据层通过数据聚合层与支撑连接层连接,支撑连接层与数据应用层连接;所述数据应用层为Web应用程序,所述支撑连接层为API接口,所述数据聚合层为Elasticsearch搜索服务器,所述源数据层为hadoop、Hive、Oracle和Mysql数据库;Elasticsearch搜索服务器通过API接口与Web应用程序连接。
所述API接口通过Java数据库与Elasticsearch搜索服务器连接。所述Web应用程序为Java语言架构编辑。所述Web应用程序录入检索字段,检索字段通过Java数据库和Elasticsearch搜索服务器调用源数据层。所述源数据层为hadoop、Hive、Oracle和Mysql数据库的一种或几种。
实施例1
系统包括如下模块:
Hive数据源,为上层服务提供数据来源和支撑。
数据导入Java数据库,负责将数据源的数据导入到Elasticsearch集群中。连接Hive数据源并调用API接口将数据导入到特定的索引中。
Elasticsearch集群,提供基础的检索服务。
Web应用,负责调用搜索服务接口实现可视化的系统业务使用界面。
实施例2
系统包括如下模块:
Oracle数据源,为上层服务提供数据来源和支撑。
数据导入Java数据库,负责将数据源的数据导入到Elasticsearch集群中。连接Oracle数据源并调用API接口将数据导入到特定的索引中。
Elasticsearch集群,提供基础的检索服务。
Web应用,负责调用搜索服务接口实现可视化的系统业务使用界面。
实施例3
系统包括如下模块:
hadoop、Hive、Oracle和Mysql数据库,为上层服务提供数据来源和支撑。
数据导入Java数据库,负责将数据源的数据导入到Elasticsearch集群中。同时连接hadoop、Hive、Oracle和Mysql数据库并调用API接口将数据导入到特定的索引中。
Elasticsearch集群,提供基础的检索服务。
Web应用,负责调用搜索服务接口实现可视化的系统业务使用界面。
Claims (5)
1.基于Elasticsearch框架的分布式搜索系统,其特征在于包括数据应用层、支撑连接层、数据聚合层和源数据层;源数据层通过数据聚合层与支撑连接层连接,支撑连接层与数据应用层连接;所述数据应用层为Web应用程序,所述支撑连接层为API接口,所述数据聚合层为Elasticsearch搜索服务器,所述源数据层为hadoop、Hive、Oracle和Mysql数据库;Elasticsearch搜索服务器通过API接口与Web应用程序连接。
2.根据权利要求1所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述API接口通过Java数据库与Elasticsearch搜索服务器连接。
3.根据权利要求1所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述Web应用程序为Java语言架构编辑。
4.根据权利要求3所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述Web应用程序录入检索字段,检索字段通过Java数据库和Elasticsearch搜索服务器调用源数据层。
5.根据权利要求4所述基于Elasticsearch框架的分布式搜索系统,其特征在于所述源数据层为hadoop、Hive、Oracle和Mysql数据库的一种或几种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810277705.6A CN110555152A (zh) | 2018-03-31 | 2018-03-31 | 基于Elasticsearch框架的分布式搜索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810277705.6A CN110555152A (zh) | 2018-03-31 | 2018-03-31 | 基于Elasticsearch框架的分布式搜索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110555152A true CN110555152A (zh) | 2019-12-10 |
Family
ID=68733779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810277705.6A Pending CN110555152A (zh) | 2018-03-31 | 2018-03-31 | 基于Elasticsearch框架的分布式搜索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555152A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112131295A (zh) * | 2020-09-27 | 2020-12-25 | 平安医疗健康管理股份有限公司 | 基于Elasticsearch的数据处理方法及设备 |
CN113204588A (zh) * | 2021-05-18 | 2021-08-03 | 绿漫科技有限公司 | 一种基于ElasticSearch快速搭建搜索平台的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154861A1 (en) * | 2006-12-22 | 2008-06-26 | Hon Hai Precision Industry Co., Ltd. | System and method for retrieving data from different types of data sources |
CN102075560A (zh) * | 2010-11-19 | 2011-05-25 | 福建富士通信息软件有限公司 | 一种基于系统耦合的福富企业搜索引擎技术 |
CN103412933A (zh) * | 2013-08-20 | 2013-11-27 | 南京物联网应用研究院有限公司 | 一种云搜索平台 |
CN103984745A (zh) * | 2014-05-23 | 2014-08-13 | 何震宇 | 分布式视频垂直搜索方法及系统 |
CN106021619A (zh) * | 2016-07-14 | 2016-10-12 | 微额速达(上海)金融信息服务有限公司 | 全网搜索系统 |
WO2017063048A1 (en) * | 2015-10-15 | 2017-04-20 | Big Ip Pty Ltd | A system, method, computer program and data signal for the provision of a database of information for lead generating purposes |
CN107329987A (zh) * | 2017-06-02 | 2017-11-07 | 广州启辰电子科技有限公司 | 一种基于mongo数据库的搜索系统 |
-
2018
- 2018-03-31 CN CN201810277705.6A patent/CN110555152A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080154861A1 (en) * | 2006-12-22 | 2008-06-26 | Hon Hai Precision Industry Co., Ltd. | System and method for retrieving data from different types of data sources |
CN102075560A (zh) * | 2010-11-19 | 2011-05-25 | 福建富士通信息软件有限公司 | 一种基于系统耦合的福富企业搜索引擎技术 |
CN103412933A (zh) * | 2013-08-20 | 2013-11-27 | 南京物联网应用研究院有限公司 | 一种云搜索平台 |
CN103984745A (zh) * | 2014-05-23 | 2014-08-13 | 何震宇 | 分布式视频垂直搜索方法及系统 |
WO2017063048A1 (en) * | 2015-10-15 | 2017-04-20 | Big Ip Pty Ltd | A system, method, computer program and data signal for the provision of a database of information for lead generating purposes |
CN106021619A (zh) * | 2016-07-14 | 2016-10-12 | 微额速达(上海)金融信息服务有限公司 | 全网搜索系统 |
CN107329987A (zh) * | 2017-06-02 | 2017-11-07 | 广州启辰电子科技有限公司 | 一种基于mongo数据库的搜索系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112131295A (zh) * | 2020-09-27 | 2020-12-25 | 平安医疗健康管理股份有限公司 | 基于Elasticsearch的数据处理方法及设备 |
CN113204588A (zh) * | 2021-05-18 | 2021-08-03 | 绿漫科技有限公司 | 一种基于ElasticSearch快速搭建搜索平台的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190012575A1 (en) | Method, apparatus and system for updating deep learning model | |
CN104899295B (zh) | 一种异构数据源数据关联分析方法 | |
CN112579626A (zh) | 多源异构sql查询引擎的构建方法及装置 | |
CN107622055B (zh) | 一种快速实现数据服务发布的方法 | |
US9563650B2 (en) | Migrating federated data to multi-source universe database environment | |
CN110019116B (zh) | 数据追溯方法、装置、数据处理设备及计算机存储介质 | |
CN111078729B (zh) | 医疗数据溯源方法、装置、系统、存储介质以及电子设备 | |
US10127617B2 (en) | System for analyzing social media data and method of analyzing social media data using the same | |
CN104462161A (zh) | 基于分布式数据库的结构化数据查询方法 | |
CN112948492A (zh) | 一种数据处理系统、方法、装置、电子设备及存储介质 | |
CN110555152A (zh) | 基于Elasticsearch框架的分布式搜索系统 | |
CN106383701A (zh) | 基于通用多协议数据访问接口技术的数据服务系统 | |
CN105138561A (zh) | 一种暗网空间数据采集方法及装置 | |
KR20150017052A (ko) | 워크플로우의 실행 방법 및 시스템 | |
CN104516985A (zh) | 一种基于HBase数据库的海量数据快速导入方法 | |
CN103678396B (zh) | 一种基于数据模型的数据备份方法和装置 | |
CN103324764A (zh) | 一种多条件任意关键字多字段模糊查询方法的Web实现 | |
CN115168398A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN109408580A (zh) | 一种跨数据源的sql编译装置及方法 | |
CN109145009A (zh) | 一种基于SQL检索ElasticSearch的方法 | |
CN113962597A (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
CN113419740A (zh) | 程序数据流的分析方法、装置、电子设备及可读存储介质 | |
CN113779349A (zh) | 数据检索系统、装置、电子设备和可读存储介质 | |
CN110764769B (zh) | 处理用户请求的方法和装置 | |
Tu et al. | Architecture design of distributed medical big data platform based on spark |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191210 |
|
RJ01 | Rejection of invention patent application after publication |