CN107622094A - 一种基于搜索引擎的大批量数据导出系统和方法 - Google Patents

一种基于搜索引擎的大批量数据导出系统和方法 Download PDF

Info

Publication number
CN107622094A
CN107622094A CN201710765285.1A CN201710765285A CN107622094A CN 107622094 A CN107622094 A CN 107622094A CN 201710765285 A CN201710765285 A CN 201710765285A CN 107622094 A CN107622094 A CN 107622094A
Authority
CN
China
Prior art keywords
data
module
search engine
guiding system
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710765285.1A
Other languages
English (en)
Inventor
刘培彬
胡旭辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Long Mobile Network Technology Co Ltd
Original Assignee
Suzhou Long Mobile Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Long Mobile Network Technology Co Ltd filed Critical Suzhou Long Mobile Network Technology Co Ltd
Priority to CN201710765285.1A priority Critical patent/CN107622094A/zh
Publication of CN107622094A publication Critical patent/CN107622094A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于搜索引擎的大批量数据导出系统,包括服务端、搜索引擎、数据仓库以及FTP服务器,所述服务端设置有登录模块、数据检索模块、订单处理模块以及数据处理模块,所述登录模块用于对用户身份进行握手校验,所述数据检索模块用于访问搜索引擎执行数据交换,所述订单处理模块用于数字化批量管理数据检索业务需求,所述数据处理模块用于访问FTP服务器执行数据导出。通过上述方式,本发明提供一种基于搜索引擎的大批量数据导出系统,通过搜索引擎检索数据,关联数据库数据,从而实现实时高效的数据查询功能和大批量数据导出功能。

Description

一种基于搜索引擎的大批量数据导出系统和方法
技术领域
本发明涉及数据处理领域,尤其涉及一种基于搜索引擎的大批量数据导出系统。
背景技术
现有市场需求数据条件模糊,由此导致数据库对模糊查询支持较差,同时受到查询条件固定原因的影响,无法较好地大批量导出有价值的商业数据。
发明内容
本发明主要解决的技术问题是提供一种基于搜索引擎的大批量数据导出系统,通过搜索引擎检索数据,关联数据库数据,从而实现实时高效的数据查询功能和大批量数据导出功能。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于搜索引擎的大批量数据导出系统,包括服务端、搜索引擎、数据仓库以及FTP服务器,所述服务端设置有登录模块、数据检索模块、订单处理模块以及数据处理模块,所述登录模块用于对用户身份进行握手校验,所述数据检索模块用于访问搜索引擎执行数据交换,所述订单处理模块用于数字化批量管理数据检索业务需求,所述数据处理模块用于访问FTP服务器执行数据导出。
一种基于搜索引擎的大批量数据导出系统的导出数据方法,该方法包括:
S1,用户登录,
所述登录模块获取用户输入的用户名和密码进行身份校验;
S2,数据检索,
身份校验通过后,所述数据检索模块获取用户输入的检索关键字并发送至搜索引擎处理搜索请求,随后将搜索引擎返回的结果数据由前端页面展示,供用户分析筛选出价值数据项;
S3,订单处理,
所述订单处理模块获取价值数据项,同时创建空白订单文件,将价值数据项的数据量、检索条件、数据交付价格等信息写入订单文件,待用户确认后将订单文件提交至数据处理模块;
S4,导出数据,
所述数据处理模块根据获得的订单文件访问数据仓库,提取订单文件中指定数据上传至FTP服务器,并生成链接供外部用户下载。
在本发明一个较佳实施例中,所述搜索引擎设置有索引刷新模块,所述索引刷新模块用于不间断执行脚本来更新数据仓库索引。
在本发明一个较佳实施例中,所述S4步骤中,指定数据的导出过程采用多表并发处理方式。
本发明的有益效果是:本发明提供的一种基于搜索引擎的大批量数据导出系统,通过搜索引擎检索数据,关联数据库数据,从而实现实时高效的数据查询功能和大批量数据导出功能。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本发明一种基于搜索引擎的大批量数据导出系统的一较佳实施例的结构图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明实施例包括:
一种基于搜索引擎的大批量数据导出系统,包括服务端、搜索引擎、数据仓库以及FTP服务器,所述服务端设置有登录模块、数据检索模块、订单处理模块以及数据处理模块,所述登录模块用于对用户身份进行握手校验,所述数据检索模块用于访问搜索引擎执行数据交换,所述订单处理模块用于数字化批量管理数据检索业务需求,所述数据处理模块用于访问FTP服务器执行数据导出。
一种基于搜索引擎的大批量数据导出系统的导出数据方法,该方法包括:
S1,用户登录,
所述登录模块获取用户输入的用户名和密码进行身份校验;
S2,数据检索,
身份校验通过后,所述数据检索模块获取用户输入的检索关键字并发送至搜索引擎处理搜索请求,随后将搜索引擎返回的结果数据由前端页面展示,供用户分析筛选出价值数据项;
S3,订单处理,
所述订单处理模块获取价值数据项,同时创建空白订单文件,将价值数据项的数据量、检索条件、数据交付价格等信息写入订单文件,待用户确认后将订单文件提交至数据处理模块;
S4,导出数据,
所述数据处理模块根据获得的订单文件访问数据仓库,提取订单文件中指定数据上传至FTP服务器,并生成链接供外部用户下载。
其中,所述搜索引擎设置有索引刷新模块,所述索引刷新模块用于不间断执行脚本来更新数据仓库索引。
进一步的,所述S4步骤中,指定数据的导出过程采用多表并发处理方式。
优选地,前端页面提供可视化查询界面,用户在界面选填数据筛选条件进行数据查询,同时,前端会显示出指定条件下的具体数据量。用户可个性化选择导出的数据维度、数据格式和数据量。
由于数据量的庞大以及涉及性能数据的处理,且数据表众多、数据量庞大,采用的方案是:将搜索引擎查询取得的数据主键作为关联,关联其他表数据,数据表索引和大批量单表数据分批处理,多表数据并发处理,实现高效率离线导出数据。
导出数据的格式可自定义为excel文档格式或文本文档格式。
综上所述,本发明提供了一种基于搜索引擎的大批量数据导出系统,通过搜索引擎检索数据,关联数据库数据,从而实现实时高效的数据查询功能和大批量数据导出功能。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于搜索引擎的大批量数据导出系统,其特征在于,包括服务端、搜索引擎、数据仓库以及FTP服务器,所述服务端设置有登录模块、数据检索模块、订单处理模块以及数据处理模块,所述登录模块用于对用户身份进行握手校验,所述数据检索模块用于访问搜索引擎执行数据交换,所述订单处理模块用于数字化批量管理数据检索业务需求,所述数据处理模块用于访问FTP服务器执行数据导出。
2.根据权利要求1所述的基于搜索引擎的大批量数据导出系统的导出数据方法,其特征在于,该方法包括:
S1,用户登录,
所述登录模块获取用户输入的用户名和密码进行身份校验;
S2,数据检索,
身份校验通过后,所述数据检索模块获取用户输入的检索关键字并发送至搜索引擎处理搜索请求,随后将搜索引擎返回的结果数据由前端页面展示,供用户分析筛选出价值数据项;
S3,订单处理,
所述订单处理模块获取价值数据项,同时创建空白订单文件,将价值数据项的数据量、检索条件、数据交付价格等信息写入订单文件,待用户确认后将订单文件提交至数据处理模块;
S4,导出数据,
所述数据处理模块根据获得的订单文件访问数据仓库,提取订单文件中指定数据上传至FTP服务器,并生成链接供外部用户下载。
3.根据权利要求1所述的基于搜索引擎的大批量数据导出系统,其特征在于,所述搜索引擎设置有索引刷新模块,所述索引刷新模块用于不间断执行脚本来更新数据仓库索引。
4.根据权利要求2所述的基于搜索引擎的大批量数据导出系统的导出数据方法,其特征在于,所述S4步骤中,指定数据的导出过程采用多表并发处理方式。
CN201710765285.1A 2017-08-30 2017-08-30 一种基于搜索引擎的大批量数据导出系统和方法 Pending CN107622094A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710765285.1A CN107622094A (zh) 2017-08-30 2017-08-30 一种基于搜索引擎的大批量数据导出系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710765285.1A CN107622094A (zh) 2017-08-30 2017-08-30 一种基于搜索引擎的大批量数据导出系统和方法

Publications (1)

Publication Number Publication Date
CN107622094A true CN107622094A (zh) 2018-01-23

Family

ID=61089442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710765285.1A Pending CN107622094A (zh) 2017-08-30 2017-08-30 一种基于搜索引擎的大批量数据导出系统和方法

Country Status (1)

Country Link
CN (1) CN107622094A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046113A (zh) * 2019-12-12 2020-04-21 上海德拓信息技术股份有限公司 用于不同类型数据仓库的数据检索装置及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853287A (zh) * 2010-05-24 2010-10-06 南京高普科技有限公司 数据压缩快速检索文件系统及其方法
CN102096685A (zh) * 2009-12-11 2011-06-15 阿里巴巴集团控股有限公司 分布式数据同步到数据仓库的方法及装置
CN103500196A (zh) * 2013-09-22 2014-01-08 成都交大光芒科技股份有限公司 多并发大数据量环境下excel数据导出方法及其导出装置
CN104123669A (zh) * 2014-07-12 2014-10-29 浙商银行股份有限公司 一种基于多表复制和实时监听的客户回单生成方法
CN104572895A (zh) * 2014-12-24 2015-04-29 天津南大通用数据技术股份有限公司 MPP数据库与Hadoop集群数据互通方法、工具及实现方法
CN107025308A (zh) * 2017-05-11 2017-08-08 职宏坤 一种铁路列车时刻网络查询方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096685A (zh) * 2009-12-11 2011-06-15 阿里巴巴集团控股有限公司 分布式数据同步到数据仓库的方法及装置
CN101853287A (zh) * 2010-05-24 2010-10-06 南京高普科技有限公司 数据压缩快速检索文件系统及其方法
CN103500196A (zh) * 2013-09-22 2014-01-08 成都交大光芒科技股份有限公司 多并发大数据量环境下excel数据导出方法及其导出装置
CN104123669A (zh) * 2014-07-12 2014-10-29 浙商银行股份有限公司 一种基于多表复制和实时监听的客户回单生成方法
CN104572895A (zh) * 2014-12-24 2015-04-29 天津南大通用数据技术股份有限公司 MPP数据库与Hadoop集群数据互通方法、工具及实现方法
CN107025308A (zh) * 2017-05-11 2017-08-08 职宏坤 一种铁路列车时刻网络查询方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046113A (zh) * 2019-12-12 2020-04-21 上海德拓信息技术股份有限公司 用于不同类型数据仓库的数据检索装置及方法
CN111046113B (zh) * 2019-12-12 2023-04-18 上海德拓信息技术股份有限公司 用于不同类型数据仓库的数据检索装置及方法

Similar Documents

Publication Publication Date Title
CN105183912B (zh) 异常日志确定方法和装置
US20140278575A1 (en) Systems And Methods Of Processing Insurance Data Using A Web-Scale Data Fabric
CA2909257C (en) Combinatorial business intelligence
US20090319515A1 (en) System and method for managing entity knowledgebases
CN112364223B (zh) 一种数字档案馆系统
US11170022B1 (en) Method and device for processing multi-source heterogeneous data
CN104361111A (zh) 一种档案自动编研方法
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
CN105786961A (zh) 一种基于金融资讯的数据分类处理方法
CN112258061B (zh) 一种项目全过程风险智能分析预警系统及预警方法
CN113032420A (zh) 数据查询方法、装置和服务器
CN109522537A (zh) 专利编撰与分析应用软件
CN107622094A (zh) 一种基于搜索引擎的大批量数据导出系统和方法
CN104679736A (zh) 一种能够统计低错的翻译系统
CN116541578A (zh) 资产数字化多维度管理方法及系统
US8229946B1 (en) Business rules application parallel processing system
US11567961B2 (en) Using flat data input for simultaneous application of multiple separate calculations rule sets to obtain multiple output results
Cai et al. Design and implementation of online mall system based on java web
Guo Design and Implementation of Travel Website Based on Java Web
CN109710674A (zh) 一种半结构化文本数据的规则引擎系统及前置接入方法
Liu Network crawler technology based on Python under information
CN105701599B (zh) 角色特性对比处理方法
Huang Design of Online Bidding Management System
CN116862698A (zh) 一种会计凭证处理方法、装置、计算机设备及存储介质
Wang Library Information Resource Management Based on Metadata Storage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180123

RJ01 Rejection of invention patent application after publication