CN103955502A - 一种可视化olap的应用实现方法及系统 - Google Patents
一种可视化olap的应用实现方法及系统 Download PDFInfo
- Publication number
- CN103955502A CN103955502A CN201410167265.0A CN201410167265A CN103955502A CN 103955502 A CN103955502 A CN 103955502A CN 201410167265 A CN201410167265 A CN 201410167265A CN 103955502 A CN103955502 A CN 103955502A
- Authority
- CN
- China
- Prior art keywords
- olap
- visual
- data
- visualized
- impala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种可视化OLAP的应用实现方法及系统,该方法及系统将OLAP分析的业务数据存储于支持分布式、面向列的Hadoop集群,通过Hive和Impala支持的SQL查询引擎,实现在线分析平台与大数据存储平台的有效对接。该发明使存储容量增大,提高了存储扩展性和安全性,且有效地进行千亿乃至万亿数据级别的在线多维统计分析和机器学习。
Description
技术领域
本发明涉及大数据环境下的在线分析性处理的方法及系统,具体是一种可以直接对海量明细数据进行建模,并实时分析的方法及系统。
背景技术
OLAP即联机分析处理,联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。近年来,OLAP已成为处理数据仓库和商业智能使用的多维数据的流行方法,但是OLAP还存在如下问题:
OLAP分析需要进行大量的数据分组和表间关联,这些虽然是传统关系型数据库的强项,但是在大数据环境下,在线分析的实时性能将是传统数据库OLAP的瓶颈。
OLAP存在的最大问题还有业务灵活多变,必然导致业务模型随之经常发生变化,而业务维度和度量一旦发生变化,技术人员需要把整个多维立方体(Cube)重新定义并重新生成,业务人员只能在此Cube上进行多维分析,这样就限制了业务人员快速改变问题分析的角度,从而使所谓的BI系统成为死板的日常报表系统。
面对实时性能瓶颈问题,虽然可以使用特定的针对BI优化的数据库,比如采用了列存储或混合存储、压缩、延迟加载、对存储数据块预统计、分片索引等技术。但还是无法解决TB级数据量的在线多维分析。
发明内容
本发明的目的在于提供一种基于Hadoop数据存储平台的可视化OLAP的应用实现方法及系统,将OLAP分析的数据以结构化形式存储于Hadoop集群,使其存储容量增大,提高存储扩展性和安全性。
为实现上述目的,本发明采用以下技术方案:
一种可视化OLAP的应用实现方法,包括如下步骤:
S1.通过ETL工具,将海量的关系型数据和数据文件进行高速传输和合并形成业务数据,将业务数据存储在支持分布式、列式存储的Hadoop集群中;
S2.通过可视化定义工具在业务数据中定义维度和度量,并自动生成多维分析的MDX语言,同时使用可视化的分析器通过GUI执行已经定义的多维分析命令;
S3.多维分析服务器接收提交的分析命令,使用Impala对提交的命令进行分析,分析以后将Hadoop中的数据抽取到内存中,进行分布式计算,最后将返回的结果生成用户自定义报表。
其中,步骤S1中所述的ETL工具为Storm、Kafka、Flume、Kettle、Sqoop中的一种或几种。
其中,步骤S1中所述的业务数据存储在Hadoop的Hdfs和Hbase中。
其中,步骤S3中多维分析处理过程为:首先多维分析服务器与Impala结合,通过hive2server JDBC驱动连接Impala服务,执行其SQL查询引擎访问存储在Hbase中的事实数据,其次使用Mondrian Server应用聚合策略,通过分布式的分组查询,将聚合数据读取到内存中形成缓存数据,最后通过可视化工具,对聚合后的缓存数据进行展示。
优选地,所述的可视化工具为Pivot表,饼图,线状图,条形图和分析图中的一种或几种。
本发明还公开了一种可视化OLAP的应用实现系统,包括模式管理器,带可视化工具的表现单元,解析、校验、执行MDX查询的计算单元,维护创建聚合缓存的聚合单元,及存储单元,所述的表现单元置于Tomcat服务器上,所述的模式管理器、聚合单元和计算单元设于同一台包含核心框架的服务器上,所述的存储单元放置在Hadoop集群服务器上,通过远程Hive和Impala的Java API连接访问。
其中,所述的计算单元包括集成连接的维度度量定义模块,多维分析执行模块及可视化分析查询器。
采用以上技术方案后,本发明具有以下有益效果:
1.解决了在线分析的性能问题,利用分布式强大的并行化处理能力,通过Hive和Impala进行数据交互,有效解决在线分析性处理在关系型数据库的性能短板。可有效进行千亿乃至万亿数据级别的在线多维统计分析和机器学习。
2.解决了分析维度难以改变的问题。由于采集来的数据本身就是包含大量冗余信息的,利用Hadoop中数据存储结构的特征,可以将大量冗余的维度信息整合到事实表中,这样可以在冗余维度下灵活地改变问题分析的角度,有效满足OLAP分析中的维度不断变化的需求。
3.相比于基于传统关系型数据库或者数据仓库的在线分析性处理,可以优化其计算性能,满足TB级数据量的在线多维分析。
4.相比于常规Hadoop多维分析平台,解决了MapReduce以蛮力去扫描大部分数据进行计算而无法像BI产品那样进行优化条件查询,同时本应用也存在着缓存的概念,优化二次查询的性能。
附图说明
图1为本发明方法步骤处理示意图;
图2为本发明系统示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
如图1示,本发明公开了一种可视化OLAP的应用实现方法。
该方法包括如下步骤:
S1. 通过ETL工具,将海量的关系型数据及数据文件进行高速传输和合并形成业务数据,存储至支持分布式,面向列的Hadoop集群中;
该步骤中,关系型数据及数据文件包括媒体数据、消息数据、日志数据、邮件数据,关系型数据等内容。通过大数据环境下的ETL技术对数据源进行抽取、转换和加载。源数据ETL后形成所需的业务数据并存储在Hadoop的Hafs和Hbase中。
S2. 通过可视化定义工具从业务数据中定义维度和度量,并可自动生成多维分析的MDX语言,同时使用可视化的分析器通过GUI执行已经定义的多维分析命令;
该步骤用户可自定义维度度量内容,解决了使用Mondrian Server解析基于CWM标准的Schema xml的瓶颈,即解决了Schema对大数据平台下的标准的限制,能自动生成大数据平台下多维分析的MDX语言,构建动态的可支持Impala的SQL标准。
S3. 多维分析服务器接收提交的分析命令,使用Impala对提交的命令进行分析,分析以后将Hadoop数据抽取到内存中,进行分布式计算,最后将返回的结果生成用户自定义报表。
该步骤中多维分析处理过程为:首先多维分析服务器与Impala结合,通过hive2server JDBC驱动连接Impala服务,执行其SQL查询引擎访问存储在Hbase中的事实数据,其次使用Mondrian Server应用聚合策略,通过分布式的分组查询,将聚合数据读取到内存中形成缓存数据,最后通过可视化工具,对聚合后的缓存数据进行展示。展示工具为Pivot表,饼图,线状图,条形图和分析图以及一些高级的可视化工具,对分析数据结果集进行展示。
该方法将OLAP分析的源数据以结构化形式存储于Hadoop集群,通过Hive和Impala的SQL查询引擎,实现在线分析平台与大数据存储平台的有效对接。
如图2示,本发明还公开了采用上述方法的可视化OLAP的应用实现系统,包括模式管理器1,表现单元2,计算单元3,聚合单元4,及存储单元5。表现单元2置于Tomcat服务器上,模式管理器1、聚合单元4和计算单元3设于同一台包含核心框架的服务器上,存储单元5放置在Hadoop集群服务器上,通过远程Hive和Impala的Java API连接访问。
表现单元2,决定了最终用户所看到的内容,提供多客户端方式展示多维数据集,如常用的浏览器展示Pivot表,饼图,线状图,条形图和分析图等,还有一些高级的可视化工具,例如可点击的地图和动态图形。这些表现手段可以用Swing或Jsp来实现的,图形用gif或jpeg格式渲染,通过调用restful服务并返回结果集到客户端的应用。
计算单元3,包括维度度量定义模块,多维分析执行模块及可视化分析查询器。用于解析、校验和执行MDX查询,首先计算坐标轴,然后是坐标轴中单元格的值。为了提高效率,计算单元批量发送到聚合单元。查询转换器接受应用操作已经存在的查询,而不是为每个MDX语句从头建立查询。
聚合单元4,主要是维护和创建聚合缓存。聚合单元4的Aggregation是内存中的cell单元的度量值,被维度值所限制。由维度层发送的cell请求,如果请求的cell不在星型层的缓存中,或者需要通过rolling up缓存中的聚合计算,则聚合管理器将请求发送至存储层。
存储单元5,是Hadoop的Hdfs和Hbase,职责是存储ETL后的数据,已经聚合的单元数据,以及维度表中的member。聚合单元4是通过Hive和Impala技术访问存储在Hbase中的事实数据。
如图2示,Schema XML文件定义了事实数据到多维数据的映射,模式管理器1突破了解析基于CWM标准的Schema XML File的限制,将Schema配置文件解析成维度模型、星型模型、以及Sql模型;与Impala结合,通过hive2server JDBC驱动连接Impala服务,访问Hadoop中的事实数据和维度数据;利用Hadoop的分布式并行计算出度量数据。用户可自定义维度度量内容;系统提供多维分析引擎,计算出聚合数据,返回给表现单元2,供用户查看。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (7)
1.一种可视化OLAP的应用实现方法,其特征在于,包括如下步骤:
S1.通过ETL工具,将海量的关系型数据和数据文件进行高速传输和合并形成业务数据,将业务数据存储在支持分布式、列式存储的Hadoop集群中;
S2.通过可视化定义工具在业务数据中定义维度和度量,并自动生成多维分析的MDX语言,同时使用可视化的分析器通过GUI执行已经定义的多维分析命令;
S3.多维分析服务器接收提交的分析命令,使用Impala对提交的命令进行分析,分析以后将Hadoop中的数据抽取到内存中,进行分布式计算,最后将返回的结果生成用户自定义报表。
2.如权利要求1所述的可视化OLAP的应用实现方法,其特征在于:步骤S1中所述的ETL工具为Storm、Kafka、Flume、Kettle、Sqoop中的一种或几种。
3.如权利要求1或2所述的可视化OLAP的应用实现方法,其特征在于:步骤S1中所述的业务数据存储在Hadoop的Hdfs和Hbase中。
4.如权利要求3所述的可视化OLAP的应用实现方法,其特征在于:步骤S3中多维分析处理过程为:首先多维分析服务器与Impala结合,通过hive2server JDBC驱动连接Impala服务,执行其SQL查询引擎访问存储在Hbase中的事实数据,其次使用Mondrian Server应用聚合策略,通过分布式的分组查询,将聚合数据读取到内存中形成缓存数据,最后通过可视化工具,对聚合后的缓存数据进行展示。
5.如权利要求4所述的可视化OLAP的应用实现方法,其特征在于:所述的可视化工具为Pivot表,饼图,线状图,条形图和分析图中的一种或几种。
6.一种可视化OLAP的应用实现系统,其特征在于:包括模式管理器,带可视化工具的表现单元,解析、校验、执行MDX查询的计算单元,维护创建聚合缓存的聚合单元,及存储单元;所述的表现单元置于Tomcat服务器上,所述的模式管理器、聚合单元和计算单元设于同一台包含核心框架的服务器上,所述的存储单元放置在Hadoop集群服务器上,通过远程Hive和Impala的Java API连接访问。
7.如权利要求6所述的可视化OLAP的应用实现系统,其特征在于:所述的计算单元包括集成连接的维度度量定义模块,多维分析执行模块及可视化分析查询器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410167265.0A CN103955502B (zh) | 2014-04-24 | 2014-04-24 | 一种可视化olap的应用实现方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410167265.0A CN103955502B (zh) | 2014-04-24 | 2014-04-24 | 一种可视化olap的应用实现方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103955502A true CN103955502A (zh) | 2014-07-30 |
CN103955502B CN103955502B (zh) | 2017-07-28 |
Family
ID=51332777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410167265.0A Active CN103955502B (zh) | 2014-04-24 | 2014-04-24 | 一种可视化olap的应用实现方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103955502B (zh) |
Cited By (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104219088A (zh) * | 2014-08-21 | 2014-12-17 | 南京邮电大学 | 一种基于Hive的网络告警信息OLAP方法 |
CN104639558A (zh) * | 2015-02-25 | 2015-05-20 | 浪潮集团有限公司 | 一种数据抽取方法和系统以及云平台 |
CN104965886A (zh) * | 2015-06-16 | 2015-10-07 | 广州市勤思网络科技有限公司 | 数据维度处理方法 |
CN105069113A (zh) * | 2015-08-11 | 2015-11-18 | 北京京东尚科信息技术有限公司 | 一种数据流量实时可视化的方法及系统 |
CN105138686A (zh) * | 2015-09-17 | 2015-12-09 | 国家电网公司 | 一种用于多级存储数据的即时应用方法 |
CN105205105A (zh) * | 2015-08-27 | 2015-12-30 | 浪潮集团有限公司 | 一种基于storm的数据ETL系统及处理方法 |
CN105335822A (zh) * | 2015-10-29 | 2016-02-17 | 中国电力科学研究院 | 一种面向大数据分析的智能电网统一数据模型建模方法 |
CN105404634A (zh) * | 2014-09-15 | 2016-03-16 | 南京理工大学 | 基于Key-Value数据块的数据管理方法及系统 |
WO2016041372A1 (zh) * | 2014-09-16 | 2016-03-24 | 中兴通讯股份有限公司 | 一种数据展现的方法及装置 |
CN105488048A (zh) * | 2014-09-16 | 2016-04-13 | 中兴通讯股份有限公司 | 一种数据查询的方法及装置 |
CN105512162A (zh) * | 2015-09-28 | 2016-04-20 | 杭州圆橙科技有限公司 | 一种基于Storm的流数据实时智能化处理框架 |
CN105512868A (zh) * | 2016-02-26 | 2016-04-20 | 广州品唯软件有限公司 | 一种管控平台 |
CN105701649A (zh) * | 2016-02-26 | 2016-06-22 | 广州品唯软件有限公司 | 一种数据管控系统 |
CN105912605A (zh) * | 2016-04-05 | 2016-08-31 | Tcl集团股份有限公司 | Bi报表的统计方法及系统 |
CN106021580A (zh) * | 2016-06-03 | 2016-10-12 | 用友网络科技股份有限公司 | Impala 基于Hadoop集群日志分析方法和系统 |
CN106126604A (zh) * | 2016-06-20 | 2016-11-16 | 华南理工大学 | 一种基于分布式数据仓库的社保数据联机分析处理系统 |
CN106250410A (zh) * | 2016-07-21 | 2016-12-21 | 广州安望信息科技有限公司 | 一种基于flume系统的数据处理方法及其装置 |
CN106339512A (zh) * | 2016-11-21 | 2017-01-18 | 北京恒华伟业科技股份有限公司 | 一种基于电网地理信息系统的信息分析方法 |
CN106372114A (zh) * | 2016-08-23 | 2017-02-01 | 电子科技大学 | 一种基于大数据的联机分析处理系统和方法 |
CN106383886A (zh) * | 2016-09-21 | 2017-02-08 | 深圳市博瑞得科技有限公司 | 一种基于大数据分布式编程框架的大数据预统系统及方法 |
CN106407216A (zh) * | 2015-07-31 | 2017-02-15 | 国网能源研究院 | 基于语义网构建路径开发的线索追溯稽核系统及其构建方法 |
CN106570153A (zh) * | 2016-10-28 | 2017-04-19 | 上海斐讯数据通信技术有限公司 | 一种海量url的数据提取方法及系统 |
CN106648934A (zh) * | 2016-12-27 | 2017-05-10 | 中科天玑数据科技股份有限公司 | 一种Impala与HBase之间的高效数据传输方法及系统 |
CN106649854A (zh) * | 2016-12-30 | 2017-05-10 | 上海熠源数据科技有限公司 | 可视化数据认知系统 |
CN106682071A (zh) * | 2016-11-17 | 2017-05-17 | 安徽华博胜讯信息科技股份有限公司 | 一种基于大数据的高校图书馆数字资源共享方法 |
CN106708917A (zh) * | 2016-06-30 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及olap系统 |
WO2017092444A1 (zh) * | 2015-12-02 | 2017-06-08 | 中兴通讯股份有限公司 | 基于Hadoop的日志数据挖掘方法及系统 |
CN106897293A (zh) * | 2015-12-17 | 2017-06-27 | 中国移动通信集团公司 | 一种数据处理方法和装置 |
CN107153709A (zh) * | 2017-05-17 | 2017-09-12 | 郑州云海信息技术有限公司 | 一种数据导入方法及装置 |
CN107239894A (zh) * | 2017-05-26 | 2017-10-10 | 云南电网有限责任公司信息中心 | 一种基于专业化需求的系统实用化监控方法 |
CN107301206A (zh) * | 2017-06-01 | 2017-10-27 | 华南理工大学 | 一种基于预运算的分布式olap分析方法及系统 |
CN107368478A (zh) * | 2016-05-11 | 2017-11-21 | 北京京东尚科信息技术有限公司 | 一种在服务器处理web应用请求的方法和装置 |
CN107391550A (zh) * | 2017-06-06 | 2017-11-24 | 广东广业开元科技有限公司 | 一种基于大数据模板技术的报表生成方法及系统 |
CN107704608A (zh) * | 2017-10-17 | 2018-02-16 | 北京览群智数据科技有限责任公司 | 一种olap多维分析和数据挖掘系统 |
CN107943863A (zh) * | 2017-11-09 | 2018-04-20 | 北京许继电气有限公司 | 基于商业智能的敏捷建模方法和系统 |
CN108062407A (zh) * | 2017-12-28 | 2018-05-22 | 成都飞机工业(集团)有限责任公司 | 一种项目可视化管控数据抽取方法 |
CN109002440A (zh) * | 2017-06-06 | 2018-12-14 | 北京京东尚科信息技术有限公司 | 用于大数据多维分析的方法、装置及系统 |
CN109284298A (zh) * | 2018-11-09 | 2019-01-29 | 上海晏鼠计算机技术股份有限公司 | 一种基于机器学习和大数据处理的内容生产系统 |
CN109710663A (zh) * | 2018-12-29 | 2019-05-03 | 北京神舟航天软件技术有限公司 | 一种数据统计图表生成方法 |
CN109828989A (zh) * | 2019-01-31 | 2019-05-31 | 泰康保险集团股份有限公司 | 客户营销方法及装置 |
CN110020834A (zh) * | 2019-04-15 | 2019-07-16 | 浩鲸云计算科技股份有限公司 | 一种建模和调试融合的在线智能大数据开发方法 |
CN110359919A (zh) * | 2019-07-26 | 2019-10-22 | 中铁隧道局集团有限公司 | 一种盾构机施工风险防控方法及系统 |
CN112347200A (zh) * | 2020-11-24 | 2021-02-09 | 武汉烽火众智数字技术有限责任公司 | 一种基于大数据的车辆同行分析方法 |
CN113157191A (zh) * | 2021-02-21 | 2021-07-23 | 上海帕科信息科技有限公司 | 一种基于olap系统的数据可视化方法 |
CN116089518A (zh) * | 2023-04-07 | 2023-05-09 | 广州思迈特软件有限公司 | 一种数据模型抽取方法及系统、终端、介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245797B (zh) * | 2019-06-18 | 2021-07-20 | 哈尔滨汇拓投资中心(有限合伙) | 基于Omid事务分析系统的联机分析处理的方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477572A (zh) * | 2009-01-12 | 2009-07-08 | 深圳市里王智通软件有限公司 | 基于tds过渡数据存储技术的动态数据仓库的方法与系统 |
US20090210430A1 (en) * | 2008-02-20 | 2009-08-20 | Panorama Software Inc. | Creating pivot tables from tabular data |
CN102521246A (zh) * | 2011-11-11 | 2012-06-27 | 国网信息通信有限公司 | 一种云数据仓库系统 |
US20120216104A1 (en) * | 2009-10-30 | 2012-08-23 | Bi Matrix Co., Ltd. | System and method for preparing excel(tm)-based analysis reports |
CN102663117A (zh) * | 2012-04-18 | 2012-09-12 | 中国人民大学 | 面向数据库与Hadoop混合平台的OLAP查询处理方法 |
CN103678590A (zh) * | 2013-12-12 | 2014-03-26 | 用友软件股份有限公司 | 基于olap的报表采集装置和报表采集方法 |
-
2014
- 2014-04-24 CN CN201410167265.0A patent/CN103955502B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210430A1 (en) * | 2008-02-20 | 2009-08-20 | Panorama Software Inc. | Creating pivot tables from tabular data |
CN101477572A (zh) * | 2009-01-12 | 2009-07-08 | 深圳市里王智通软件有限公司 | 基于tds过渡数据存储技术的动态数据仓库的方法与系统 |
US20120216104A1 (en) * | 2009-10-30 | 2012-08-23 | Bi Matrix Co., Ltd. | System and method for preparing excel(tm)-based analysis reports |
CN102521246A (zh) * | 2011-11-11 | 2012-06-27 | 国网信息通信有限公司 | 一种云数据仓库系统 |
CN102663117A (zh) * | 2012-04-18 | 2012-09-12 | 中国人民大学 | 面向数据库与Hadoop混合平台的OLAP查询处理方法 |
CN103678590A (zh) * | 2013-12-12 | 2014-03-26 | 用友软件股份有限公司 | 基于olap的报表采集装置和报表采集方法 |
Cited By (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104219088A (zh) * | 2014-08-21 | 2014-12-17 | 南京邮电大学 | 一种基于Hive的网络告警信息OLAP方法 |
CN105404634B (zh) * | 2014-09-15 | 2019-02-22 | 南京理工大学 | 基于Key-Value数据块的数据管理方法及系统 |
CN105404634A (zh) * | 2014-09-15 | 2016-03-16 | 南京理工大学 | 基于Key-Value数据块的数据管理方法及系统 |
CN105488048A (zh) * | 2014-09-16 | 2016-04-13 | 中兴通讯股份有限公司 | 一种数据查询的方法及装置 |
WO2016041372A1 (zh) * | 2014-09-16 | 2016-03-24 | 中兴通讯股份有限公司 | 一种数据展现的方法及装置 |
CN104639558A (zh) * | 2015-02-25 | 2015-05-20 | 浪潮集团有限公司 | 一种数据抽取方法和系统以及云平台 |
CN104639558B (zh) * | 2015-02-25 | 2017-10-13 | 浪潮集团有限公司 | 一种数据抽取方法和系统以及云平台 |
CN104965886A (zh) * | 2015-06-16 | 2015-10-07 | 广州市勤思网络科技有限公司 | 数据维度处理方法 |
CN104965886B (zh) * | 2015-06-16 | 2019-01-29 | 广州市勤思网络科技有限公司 | 数据维度处理方法 |
CN106407216A (zh) * | 2015-07-31 | 2017-02-15 | 国网能源研究院 | 基于语义网构建路径开发的线索追溯稽核系统及其构建方法 |
CN105069113A (zh) * | 2015-08-11 | 2015-11-18 | 北京京东尚科信息技术有限公司 | 一种数据流量实时可视化的方法及系统 |
CN105205105A (zh) * | 2015-08-27 | 2015-12-30 | 浪潮集团有限公司 | 一种基于storm的数据ETL系统及处理方法 |
CN105205105B (zh) * | 2015-08-27 | 2019-04-16 | 浪潮集团有限公司 | 一种基于storm的数据ETL系统及处理方法 |
CN105138686B (zh) * | 2015-09-17 | 2018-09-28 | 国家电网公司 | 一种用于多级存储数据的即时应用方法 |
CN105138686A (zh) * | 2015-09-17 | 2015-12-09 | 国家电网公司 | 一种用于多级存储数据的即时应用方法 |
CN105512162B (zh) * | 2015-09-28 | 2019-04-16 | 杭州圆橙科技有限公司 | 一种基于Storm的流数据实时智能化处理框架 |
CN105512162A (zh) * | 2015-09-28 | 2016-04-20 | 杭州圆橙科技有限公司 | 一种基于Storm的流数据实时智能化处理框架 |
CN105335822B (zh) * | 2015-10-29 | 2021-01-15 | 中国电力科学研究院 | 一种面向大数据分析的智能电网统一数据模型建模方法 |
CN105335822A (zh) * | 2015-10-29 | 2016-02-17 | 中国电力科学研究院 | 一种面向大数据分析的智能电网统一数据模型建模方法 |
WO2017092444A1 (zh) * | 2015-12-02 | 2017-06-08 | 中兴通讯股份有限公司 | 基于Hadoop的日志数据挖掘方法及系统 |
CN106897293B (zh) * | 2015-12-17 | 2020-09-11 | 中国移动通信集团公司 | 一种数据处理方法和装置 |
CN106897293A (zh) * | 2015-12-17 | 2017-06-27 | 中国移动通信集团公司 | 一种数据处理方法和装置 |
CN105512868A (zh) * | 2016-02-26 | 2016-04-20 | 广州品唯软件有限公司 | 一种管控平台 |
CN105701649A (zh) * | 2016-02-26 | 2016-06-22 | 广州品唯软件有限公司 | 一种数据管控系统 |
CN105912605A (zh) * | 2016-04-05 | 2016-08-31 | Tcl集团股份有限公司 | Bi报表的统计方法及系统 |
CN107368478A (zh) * | 2016-05-11 | 2017-11-21 | 北京京东尚科信息技术有限公司 | 一种在服务器处理web应用请求的方法和装置 |
CN106021580B (zh) * | 2016-06-03 | 2019-12-20 | 用友网络科技股份有限公司 | Impala基于Hadoop集群日志分析方法和系统 |
CN106021580A (zh) * | 2016-06-03 | 2016-10-12 | 用友网络科技股份有限公司 | Impala 基于Hadoop集群日志分析方法和系统 |
CN106126604A (zh) * | 2016-06-20 | 2016-11-16 | 华南理工大学 | 一种基于分布式数据仓库的社保数据联机分析处理系统 |
CN106708917A (zh) * | 2016-06-30 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及olap系统 |
CN106708917B (zh) * | 2016-06-30 | 2019-03-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及olap系统 |
CN106250410A (zh) * | 2016-07-21 | 2016-12-21 | 广州安望信息科技有限公司 | 一种基于flume系统的数据处理方法及其装置 |
CN106250410B (zh) * | 2016-07-21 | 2020-01-07 | 深圳软通动力信息技术有限公司 | 一种基于flume系统的数据处理方法及其装置 |
CN106372114B (zh) * | 2016-08-23 | 2019-09-10 | 电子科技大学 | 一种基于大数据的联机分析处理系统和方法 |
CN106372114A (zh) * | 2016-08-23 | 2017-02-01 | 电子科技大学 | 一种基于大数据的联机分析处理系统和方法 |
CN106383886A (zh) * | 2016-09-21 | 2017-02-08 | 深圳市博瑞得科技有限公司 | 一种基于大数据分布式编程框架的大数据预统系统及方法 |
CN106570153A (zh) * | 2016-10-28 | 2017-04-19 | 上海斐讯数据通信技术有限公司 | 一种海量url的数据提取方法及系统 |
CN106682071A (zh) * | 2016-11-17 | 2017-05-17 | 安徽华博胜讯信息科技股份有限公司 | 一种基于大数据的高校图书馆数字资源共享方法 |
CN106339512A (zh) * | 2016-11-21 | 2017-01-18 | 北京恒华伟业科技股份有限公司 | 一种基于电网地理信息系统的信息分析方法 |
CN106648934B (zh) * | 2016-12-27 | 2019-12-03 | 中国科学院计算技术研究所 | 一种Impala与HBase之间的高效数据传输方法及系统 |
CN106648934A (zh) * | 2016-12-27 | 2017-05-10 | 中科天玑数据科技股份有限公司 | 一种Impala与HBase之间的高效数据传输方法及系统 |
CN106649854A (zh) * | 2016-12-30 | 2017-05-10 | 上海熠源数据科技有限公司 | 可视化数据认知系统 |
CN107153709B (zh) * | 2017-05-17 | 2020-09-04 | 浪潮云信息技术股份公司 | 一种数据导入方法及装置 |
CN107153709A (zh) * | 2017-05-17 | 2017-09-12 | 郑州云海信息技术有限公司 | 一种数据导入方法及装置 |
CN107239894A (zh) * | 2017-05-26 | 2017-10-10 | 云南电网有限责任公司信息中心 | 一种基于专业化需求的系统实用化监控方法 |
CN107301206A (zh) * | 2017-06-01 | 2017-10-27 | 华南理工大学 | 一种基于预运算的分布式olap分析方法及系统 |
CN107391550A (zh) * | 2017-06-06 | 2017-11-24 | 广东广业开元科技有限公司 | 一种基于大数据模板技术的报表生成方法及系统 |
CN109002440A (zh) * | 2017-06-06 | 2018-12-14 | 北京京东尚科信息技术有限公司 | 用于大数据多维分析的方法、装置及系统 |
CN107704608A (zh) * | 2017-10-17 | 2018-02-16 | 北京览群智数据科技有限责任公司 | 一种olap多维分析和数据挖掘系统 |
CN107943863A (zh) * | 2017-11-09 | 2018-04-20 | 北京许继电气有限公司 | 基于商业智能的敏捷建模方法和系统 |
CN107943863B (zh) * | 2017-11-09 | 2021-09-28 | 北京许继电气有限公司 | 基于商业智能的敏捷建模方法和系统 |
CN108062407A (zh) * | 2017-12-28 | 2018-05-22 | 成都飞机工业(集团)有限责任公司 | 一种项目可视化管控数据抽取方法 |
CN109284298A (zh) * | 2018-11-09 | 2019-01-29 | 上海晏鼠计算机技术股份有限公司 | 一种基于机器学习和大数据处理的内容生产系统 |
CN109710663A (zh) * | 2018-12-29 | 2019-05-03 | 北京神舟航天软件技术有限公司 | 一种数据统计图表生成方法 |
CN109828989A (zh) * | 2019-01-31 | 2019-05-31 | 泰康保险集团股份有限公司 | 客户营销方法及装置 |
CN110020834A (zh) * | 2019-04-15 | 2019-07-16 | 浩鲸云计算科技股份有限公司 | 一种建模和调试融合的在线智能大数据开发方法 |
CN110359919A (zh) * | 2019-07-26 | 2019-10-22 | 中铁隧道局集团有限公司 | 一种盾构机施工风险防控方法及系统 |
CN112347200A (zh) * | 2020-11-24 | 2021-02-09 | 武汉烽火众智数字技术有限责任公司 | 一种基于大数据的车辆同行分析方法 |
CN113157191A (zh) * | 2021-02-21 | 2021-07-23 | 上海帕科信息科技有限公司 | 一种基于olap系统的数据可视化方法 |
CN116089518A (zh) * | 2023-04-07 | 2023-05-09 | 广州思迈特软件有限公司 | 一种数据模型抽取方法及系统、终端、介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103955502B (zh) | 2017-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103955502A (zh) | 一种可视化olap的应用实现方法及系统 | |
US11537635B2 (en) | Hadoop OLAP engine | |
US20220035815A1 (en) | Processing database queries using format conversion | |
KR102627690B1 (ko) | Sql 질의 플랜들을 최적화하기 위한 차원 콘텍스트 전파 기술들 | |
US10664497B2 (en) | Hybrid database table stored as both row and column store | |
US10346383B2 (en) | Hybrid database table stored as both row and column store | |
US8768927B2 (en) | Hybrid database table stored as both row and column store | |
AU2008300503B2 (en) | ETL-less zero redundancy system and method for reporting OLTP data | |
US7917463B2 (en) | System and method for data warehousing and analytics on a distributed file system | |
CN105989129B (zh) | 实时数据统计方法和装置 | |
US10824614B2 (en) | Custom query parameters in a database system | |
US9760604B2 (en) | System and method for adaptive filtering of data requests | |
US11200223B2 (en) | System and method for dependency analysis in a multidimensional database environment | |
US9189489B1 (en) | Inverse distribution function operations in a parallel relational database | |
US11803865B2 (en) | Graph based processing of multidimensional hierarchical data | |
CN102800014A (zh) | 一种用于供应链融资的金融数据处理方法 | |
CN105138686A (zh) | 一种用于多级存储数据的即时应用方法 | |
CN109299089B (zh) | 一种画像标签数据的计算及存储方法和计算及存储系统 | |
EP1770555A1 (en) | Efficient handling of multipart queries against relational data | |
Hashem et al. | Pre-processing and modeling tools for bigdata | |
Kazemzadeh et al. | Data stream query processing on mobile devices | |
Vyawahare et al. | NoSql Database | |
Rajadnye | Is Datawarehouse Relevant in the Era of Big Data? | |
CN113722280A (zh) | 一种针对海量电力网络大数据的存储分析方法 | |
Munir | Optimization of Data Warehouse Design and Architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |