CN106066895B - 一种智能查询系统 - Google Patents

一种智能查询系统 Download PDF

Info

Publication number
CN106066895B
CN106066895B CN201610514153.7A CN201610514153A CN106066895B CN 106066895 B CN106066895 B CN 106066895B CN 201610514153 A CN201610514153 A CN 201610514153A CN 106066895 B CN106066895 B CN 106066895B
Authority
CN
China
Prior art keywords
module
query
database
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610514153.7A
Other languages
English (en)
Other versions
CN106066895A (zh
Inventor
徐少强
余虎
高才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Eshore Technology Co Ltd
Original Assignee
Guangdong Eshore Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Eshore Technology Co Ltd filed Critical Guangdong Eshore Technology Co Ltd
Priority to CN201610514153.7A priority Critical patent/CN106066895B/zh
Publication of CN106066895A publication Critical patent/CN106066895A/zh
Application granted granted Critical
Publication of CN106066895B publication Critical patent/CN106066895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种智能查询系统,该系统包括模型配置模块、数据存储模块、计算引擎模块、规则引擎模块、数据导出模块、文件存储模块、页面查询模块、系统管理模块和系统监控模块。通过将多维模型按时间序列存储,在保障不改变业务处理逻辑的情况下,有效的减少了计算的数据量;前端页面展现通过文本文件实现,避免了频繁操作数据库,有效的降低了数据库的资源利用情况。这两方面的改进,都能大大提升智能查询的性能,让用户能快速的获取数据,解决取数沟通成本高、周期长、响应慢等问题,实现业务部门智能取数、加快工作效率、加快市场响应速度需求。

Description

一种智能查询系统
技术领域
本发明涉及数据库技术领域,尤其涉及一种智能查询系统。
背景技术
随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆(T)字节和千兆兆(P)字节;同时用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而是要对表中千万条、甚至上亿条记录的数据进行数据分析和信息汇总,目前,这类涉及多维度的自定义查询功能主要是通过多维报表工具或智能查询工具来实现,用户通过界面任意选择维度和指标进行组合查询,系统返回汇总级的统计数据,系统可实现对多个维度进行数据切片、旋转、聚合等操作。通过智能查询系统,企业的业务部门能够减少对IT部门的依赖,利用自己熟悉的业务语言来展现数据、分析数据,提高了取数的效率;而企业的IT部门则从“授人以鱼”向“授人以渔”转型,不但提供满足业务需求的报表应用,而且降低了IT部门的支撑成本。
如图1所示为现有技术中的智能查询系统架构图。现在智能查询的处理方案一般分成后台数据处理和前端OLAP分析两大部分。后台处理通过数据采集和数据汇聚构建统一的企业数据模型,再根据主题分析的需要,构建多维分析模型。前端OLAP分析连接数据仓库的多维模型,将用户发起的多维查询请求转换成查询多维模型的结构化SQL查询语句,并将语句放到数据仓库中执行,取出多维模型的结果数据,并将数据查询结果转换成多维数据结果并返回给用户。
上述做法存在的问题是查询的性能较差,由于前台查询界面的每一个智能查询报表只能对应后台数据仓的一个多维模型,当后端的多维模型数据量大,存储周期长时,模型的数据量太大,导致数据的关联查询、数据汇总操作的时间过长,从而造成智能查询的效率过低。
发明内容
本发明的目的是为了克服现有技术的缺陷,提供一种智能查询系统,从而能够实现快速提升查询性能。
为实现上述目的,本发明提供了一种智能查询系统,该系统包括模型配置模块、数据存储模块、计算引擎模块、规则引擎模块、数据导出模块、文件存储模块、页面查询模块、系统管理模块和系统监控模块。
模型配置模块包括数据库适配器、语义层定义模块;数据库适配器实现对多种数据库的连接;语义层定义模块实现对多维模型的配置。
数据存储模块采用时间序列分表存储,可采用按月或年周期存储。
规则引擎模块实现将前端用户选择的维度、指标以及过滤的条件转化成后端的SQL查询语句,并且根据用户的查询条件,智能选择后端数据库的不同物理表,并将SQL语句传到计算引擎模块。
计算引擎模块负责将规则引擎模块生成的SQL语句提交给数据库执行,生成满足用户查询要求的结果数据。
数据导出模块负责将计算引擎模块的计算结果导出成文本文件。
文件存储模块,负责将导出的文本文件存储到应用服务器,并进行文件的生命周期管理,将用户查询后不需要再使用的文件进行删除。
页面查询模块以导出的文本文件为数据源,将文本文件的数据按用户的要求展现到前端web页面上,实现用户的快速智能查询。
系统管理模块包括对智能查询系统的用户进行管理;对模型的权限进行管理;对模型的目录进行管理。
系统监控模块实现对模型的访问日志进行监控。
进一步地,数据库适配器实现对多种数据库的连接,包括常规的Oracle数据库和分布式数据库,例如Mysql、GreenPLum。
进一步地,多维模型的配置包括配置多维模型展现的名称与数据库表的映射关系,定义数据库表字段的属性,即定义为维度还是指标;实现对维表的配置,配置模型维度字段与维表的对应关系;实现对维度的定义和指标的定义,配置字段展现名称与数据库表字段对应关系。
进一步地,系统监控模块的监控包括监控用户在什么时间点访问过哪些模型,查看模型的维度和指标,通过这些监控信息,将模型的价值进行分类,为后续模型的优化提供依据,也能够实现对模型的生命周期管理,全面提升智能查询系统的可用性。
本发明技术方案带来的有益效果:
本发明通过将多维模型按时间序列存储,在保障不改变业务处理逻辑的情况下,有效的减少了计算的数据量;前端页面展现通过文本文件实现,避免了频繁操作数据库,有效的降低了数据库的资源利用情况。这两方面的改进,都能大大提升智能查询的性能,让用户能快速的获取数据,解决取数沟通成本高、周期长、响应慢等问题,实现业务部门智能取数、加快工作效率、加快市场响应速度需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的现有技术中智能查询系统架构图;
图2是本发明的智能查询系统架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于时间序列存储及文本处理的智能查询系统,主要是针对现有多维报表工具存在的查询性能不够高效而设计的。该系统包括多维查询、口径查看、模板功能、搜索与推荐、数据库适配器管理、语义层定义等功能,借助该系统,无需IT人员帮助,业务人员即可开展自助式数据查询与分析,具有高效、易用、灵活优势,查询上亿级清单30秒内返回结果,助力企业提升运营效率。
如图2所示为本发明的智能查询系统架构图。
该系统包括模型配置模块、数据存储模块、计算引擎模块、规则引擎模块、数据导出模块、文件存储模块、页面查询模块、系统管理模块和系统监控模块。
模型配置模块包括数据库适配器、语义层定义。数据库适配器可以实现对多种数据库的连接,包括常规的Oracle数据库和Mysql、GreenPLum等分布式数据库。语义层定义模块实现对多维模型的配置,配置多维模型展现的名称与数据库表的映射关系,定义数据库表字段的属性(即定义为维度还是指标);实现对维表的配置,配置模型维度字段与维表的对应关系;实现对维度的定义和指标的定义,配置字段展现名称与数据库表字段对应关系。
数据存储模块采用时间序列分表存储,可采用按月或年周期存储,例如,当数据采用按月周期存储后,数据量急剧下降,原来存储3年的数据量,从亿级的数据量下降为百万级的数据量,从而能够实现快速提升查询性能。当然也可以采用按年周期存储。
规则引擎模块实现将前端用户选择的维度、指标以及过滤的条件转化成后端的SQL查询语句,并且根据用户的查询条件,智能选择后端数据库的不同物理表,并将SQL语句传到计算引擎模块。
计算引擎模块负责将规则引擎模块生成的SQL语句提交给数据库执行,生成满足用户查询要求的结果数据。
数据导出模块负责将计算引擎模块的计算结果导出成文本文件。
文件存储模块,负责将导出的文本文件存储到应用服务器,并进行文件的生命周期管理,将用户查询后不需要再使用的文件进行删除。
页面查询模块以导出的文本文件为数据源,将文本文件的数据按用户的要求展现到前端web页面上,实现用户的快速智能查询。
系统管理模块包括对智能查询系统的用户进行管理;对模型的权限进行管理;对模型的目录进行管理。
系统监控模块实现对模型的访问日志进行监控,包括监控用户在什么时间点访问过哪些模型,查看模型的维度和指标,通过这些监控信息,将模型的价值进行分类,为后续模型的优化提供依据,也能够实现对模型的生命周期管理,全面提升智能查询系统的可用性。
本发明的智能查询系统基于时间序列存储及文本处理,跟常规的智能查询方法相比,主要有以下的发明改进:
1.该智能查询系统后端数据库采用Mysql集群搭建,数据多维模型按时间序列存储,有效的减少了单个物理表数据量过大的问题。按月分析的模型,假设存储3年的数据,采用按月周期存储后,数据量为原来的1/36,一个上亿级数据量的模型即可变成百万级的模型,计算的数据量急剧下降,从而能够实现快速提升查询性能。
2.前端页面展现基于文本文件实现,采用Java技术开发,实现OLAP的在线分析查询,用户可实现任意选择维度、选择某个维度值、选择指标等进行组合查询,并可导出文件进行保存,避免了对数据库的频繁操作,每个查询会话与数据库只有一次交互,将用户的查询要求转换成SQL后,通过高效的数据导出方法将数据导出成文本文件,后续用户的翻页查询,模板定制,数据导出等操作,都是通过操作文本文件实现,有效降低了数据库的资源利用情况,从而提升查询的性能。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种智能查询系统,其特征在于,该系统包括模型配置模块、数据存储模块、计算引擎模块、规则引擎模块、数据导出模块、文件存储模块、页面查询模块、系统管理模块和系统监控模块;
模型配置模块包括数据库适配器、语义层定义模块;数据库适配器实现对多种数据库的连接;语义层定义模块实现对多维模型的配置;
数据存储模块采用时间序列分表存储,可采用按月或年周期存储;
规则引擎模块实现将前端用户选择的维度、指标以及过滤的条件转化成后端的SQL查询语句,并且根据用户的查询条件,智能选择后端数据库的不同物理表,并将SQL语句传到计算引擎模块;
计算引擎模块负责将规则引擎模块生成的SQL语句提交给数据库执行,生成满足用户查询要求的结果数据;
数据导出模块负责将计算引擎模块的计算结果导出成文本文件;
文件存储模块,负责将导出的文本文件存储到应用服务器,并进行文件的生命周期管理,将用户查询后不需要再使用的文件进行删除;
页面查询模块以导出的文本文件为数据源,将文本文件的数据按用户的要求展现到前端web页面上,实现用户的快速智能查询;
系统管理模块包括对智能查询系统的用户进行管理;对模型的权限进行管理;对模型的目录进行管理;
系统监控模块实现对模型的访问日志进行监控。
2.根据权利要求1所述的系统,其特征在于,数据库适配器实现对多种数据库的连接,包括常规的Oracle数据库和分布式数据库,其中,分布式数据库包括Mysql、GreenPLum。
3.根据权利要求1所述的系统,其特征在于,多维模型的配置包括配置多维模型展现的名称与数据库表的映射关系,定义数据库表字段的属性,即定义为维度还是指标;实现对维表的配置,配置模型维度字段与维表的对应关系;实现对维度的定义和指标的定义,配置字段展现名称与数据库表字段对应关系。
4.根据权利要求1所述的系统,其特征在于,系统监控模块的监控包括监控用户在什么时间点访问过哪些模型,查看模型的维度和指标,通过这些监控信息,将模型的价值进行分类,为后续模型的优化提供依据,也能够实现对模型的生命周期管理,全面提升智能查询系统的可用性。
CN201610514153.7A 2016-06-30 2016-06-30 一种智能查询系统 Active CN106066895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610514153.7A CN106066895B (zh) 2016-06-30 2016-06-30 一种智能查询系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610514153.7A CN106066895B (zh) 2016-06-30 2016-06-30 一种智能查询系统

Publications (2)

Publication Number Publication Date
CN106066895A CN106066895A (zh) 2016-11-02
CN106066895B true CN106066895B (zh) 2020-01-24

Family

ID=57206461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610514153.7A Active CN106066895B (zh) 2016-06-30 2016-06-30 一种智能查询系统

Country Status (1)

Country Link
CN (1) CN106066895B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280082A (zh) * 2017-01-06 2018-07-13 北京京东尚科信息技术有限公司 一种统计数据的即席查询方法及系统
CN108932242A (zh) * 2017-05-23 2018-12-04 中兴通讯股份有限公司 数据过滤方法及装置
CN107527070B (zh) * 2017-08-25 2020-03-24 南京小睿软件有限公司 维度数据和指标数据的识别方法、存储介质及服务器
CN108874926B (zh) * 2018-05-31 2023-07-25 康键信息技术(深圳)有限公司 海量数据查询方法、装置、计算机设备和存储介质
CA3116777A1 (en) * 2018-07-17 2020-01-23 Vantage Agora, Inc. Business operating system engine
CN109800225A (zh) * 2018-12-24 2019-05-24 北京奇艺世纪科技有限公司 业务指标的获取方法、装置、服务器及计算机可读存储介质
CN109871381A (zh) * 2019-01-22 2019-06-11 积成电子股份有限公司 电网运行数据自适应存储和查询的方法
CN111459965B (zh) * 2019-12-24 2023-05-05 中国科学院沈阳自动化研究所 一种面向边缘计算的信息监控系统
CN111241211A (zh) * 2020-01-16 2020-06-05 青岛特来电云科技有限公司 一种适配多类大数据库的多维分析方法
CN112559550B (zh) * 2020-10-30 2021-09-07 北京智源人工智能研究院 基于语义规则和多维模型的多数据源nl2sql系统
CN113468246B (zh) * 2021-07-20 2023-06-23 上海齐屹信息科技有限公司 一种基于oltp的智能数据统计及订阅系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682118A (zh) * 2012-05-15 2012-09-19 北京久其软件股份有限公司 一种多维数据模型访问方法及装置
CN104408186A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 基于数据立方体的可视化数据的二维显示方法和装置
CN104899291A (zh) * 2015-06-05 2015-09-09 北京京东尚科信息技术有限公司 关系型数据库的多维分析的方法及装置
CN105205085A (zh) * 2014-06-30 2015-12-30 中兴通讯股份有限公司 一种海量数据的多维分析方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682118A (zh) * 2012-05-15 2012-09-19 北京久其软件股份有限公司 一种多维数据模型访问方法及装置
CN105205085A (zh) * 2014-06-30 2015-12-30 中兴通讯股份有限公司 一种海量数据的多维分析方法及装置
CN104408186A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 基于数据立方体的可视化数据的二维显示方法和装置
CN104899291A (zh) * 2015-06-05 2015-09-09 北京京东尚科信息技术有限公司 关系型数据库的多维分析的方法及装置

Also Published As

Publication number Publication date
CN106066895A (zh) 2016-11-02

Similar Documents

Publication Publication Date Title
CN106066895B (zh) 一种智能查询系统
US20230376487A1 (en) Processing database queries using format conversion
AU2015219103B2 (en) Transparent discovery of semi-structured data schema
CN103455540B (zh) 从数据仓库模型生成内存模型的系统和方法
US11941034B2 (en) Conversational database analysis
EP2577507B1 (en) Data mart automation
US20110087708A1 (en) Business object based operational reporting and analysis
US20130311454A1 (en) Data source analytics
WO2017019879A1 (en) Multi-query optimization
CN111767303A (zh) 一种数据查询方法、装置、服务器及可读存储介质
US9177037B2 (en) In-memory runtime for multidimensional analytical views
US11809468B2 (en) Phrase indexing
CN114218218A (zh) 基于数据仓库的数据处理方法、装置、设备及存储介质
CN113934750A (zh) 基于编译方式的数据血缘关系分析方法
CN114064660B (zh) 基于ElasticSearch的数据结构化分析方法
US20170195449A1 (en) Smart proxy for datasources
CN111125045B (zh) 一种轻量级etl处理平台
CN114077652A (zh) 一种基于多维数据立方体的数据处理方法及电子装置
CN112527620A (zh) 数据库性能分析方法及装置、电子设备、介质、产品
Dvoretskyi et al. Data Utility Assessment while Optimizing the Structure and Minimizing the Volume of a Distributed Database Node.
US10311049B2 (en) Pattern-based query result enhancement
CN107844546A (zh) 一种文件系统元数据管理系统及方法
JP2017010376A (ja) マートレス検証支援システムおよびマートレス検証支援方法
Sheng et al. Fast Access and Retrieval of Big Data Based on Unique Identification.
US20220358129A1 (en) Visualization Data Reuse In A Data Analysis System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant