CN107590181A - 一种大数据的智能分析系统 - Google Patents

一种大数据的智能分析系统 Download PDF

Info

Publication number
CN107590181A
CN107590181A CN201710646452.0A CN201710646452A CN107590181A CN 107590181 A CN107590181 A CN 107590181A CN 201710646452 A CN201710646452 A CN 201710646452A CN 107590181 A CN107590181 A CN 107590181A
Authority
CN
China
Prior art keywords
big data
analysis
data
module
intelligent analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710646452.0A
Other languages
English (en)
Inventor
徐秋养
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Deep Research Information Technology Co Ltd
Original Assignee
Foshan Deep Research Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Deep Research Information Technology Co Ltd filed Critical Foshan Deep Research Information Technology Co Ltd
Priority to CN201710646452.0A priority Critical patent/CN107590181A/zh
Publication of CN107590181A publication Critical patent/CN107590181A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种大数据的智能分析系统,所述系统包括:大数据平台,用于存放接收已采集的大数据;大数据预处理模块,用于对所述已采集的大数据进行预处理;所述预处理用于实现负载均衡、资源虚拟化和分布式数据存储管理;智能分析模块,用于根据接收到的指令进行所述大数据的分析,并综合利用大数据预处理模块提供的数据,进行事件因果分析;信息展示模块,用于生成数据分析任务传递给智能业务分析模块并接收所述智能分析模块返回的结果;通过可交互的可视化技术将企业信息的分析评估结果、各类详情数据分层级进行综合、实时的展现。应用本发明实施例,解决了传统数据处理方法实时性、高效性和交互性较差的问题。

Description

一种大数据的智能分析系统
技术领域
本发明涉及数据处理领域,特别是涉及一种大数据的智能分析系统。
背景技术
随着社会工业化、信息化水平的不断提高,如今数据已取代计算成为信息计算的中心,云计算、大数据正在成为一种趋势和潮流,包括存储容量、可用性、I/O 性能、数据安全性、可扩展性等诸多方面。大数据是规模非常巨大和复杂的数据集。大数据有4V:Volume(大量),数据量持续快速增加;Velocity(高速),数据I/O速度更快;Variety(多样),数据类型和来源多样化;Value(价值),其存在各方面的可用价值。如何从海量的数据中提取、获得想要的知识或感兴趣的信息,这是利用好大数据,进而更好地服务于社会发展的要求。因此,数据挖掘方法应运而生。
数据挖掘是作为一门学科诞生于20世纪80年代,从技术的角度看就是从大量复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值的信息和知识的过程。在大数据应用领域,往往可以根据用户的各种行为特征将用户群体划分成若干类,以便于针对用户群的特征进行精准式、个性化的服务。聚类是对用户群体进行划分一种方式。聚类是将数据对象分成类的过程,使同一个类中的对象具有很高的相似度,而使不同类中的对象高度相异。相异度通常使用距离来进行度量。
但是,聚类操作中针对用户行为特征对用户群体进行划分的效果在很大程度上依赖于基础数据的质量,现有的基于聚类算法的用户群体划分往往不能够很好的反映用户的行为特征,存在聚类不准确的问题,难以利用聚类结果对用户群进行精准式、个性化的服务。
发明内容
本发明实施例的目的在于提供一种大数据的智能分析系统,解决了传统数据处理方法实时性、高效性和交互性较差的问题,帮助用户实时地感知企业情况,从而提高企业管理效率和业务处理水平。
为了达到上述目的,本发明实施例公开了一种大数据的智能分析系统,所述系统包括:
大数据平台,用于存放接收已采集的大数据;
大数据预处理模块,用于对所述已采集的大数据进行预处理;所述预处理用于实现负载均衡、资源虚拟化和分布式数据存储管理;
智能分析模块,用于根据接收到的指令进行所述大数据的分析,并综合利用大数据预处理模块提供的数据,进行事件因果分析;
信息展示模块,用于生成数据分析任务传递给智能业务分析模 块并接收所述智能分析模块返回的结果;通过可交互的可视化技术将企业信息的分析 评估结果、各类详情数据分层级进行综合、实时的展现,以及为用户提供操作界面。
可选的,所述操作界面至少包括以下功能中的一种或多种: 具有可视化图表、分析报告、内容检索和消息推送/订阅。
可选的,所述大数据预处理模块
通过分布式系统基础架构Hadoop存储所述已采集的大数据,并且用于实现负载均衡、资源虚拟化、分布 式数据存储管理和应用程序编程接口API接口功能。
可选的,所述分析模块,用于实现即席查询/组合条件查询、多维OLAP、KPI指标、MDX查询等分析功能,同时实现分类、聚类、关联规则 等数据挖掘功能,以及灵活的参数配置功能;
指标评估模块,用于根据预设数据信息进行实时公司情况实时 评估;所述预设数据信息包括:人力、财务、物质和业务。
本发明实施例提供的大数据的智能分析系统,与现有技术相比,本发明有如下优点:
1、处理速度快:系统架构方案采用大数据技术对计算、存储任 务进行合理调度,可以充分发挥系统中每一个集群节点的运算能力; 业务需求增长时,能够方便地通过添加集群节点来扩展系统规模、 提升系统性能。
2、用户体验较好:系统支持多种终端运行,支持各级校情指标 的实时可视化,提供简单直观的交互方式;
3、灵活度高:可以根据本企业的实际情况灵活创建、配置分析 模型;系统采用分层设计,易于部署实施、升级维护。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的大数据的智能分析系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的大数据的智能分析系统的流程示意图,该方法包括步骤:
大数据平台11,用于存放接收已采集的大数据;
大数据预处理模块12,用于对所述已采集的大数据进行预处理;所述预处理用于实现负载均衡、资源虚拟化和分布式数据存储管理;
智能分析模块13,用于根据接收到的指令进行所述大数据的分析,并综合利用大数据预处理模块提供的数据,进行事件因果分析;
信息展示模块14,用于生成数据分析任务传递给智能业务分析模 块并接收所述智能分析模块返回的结果;通过可交互的可视化技术将企业信息的分析 评估结果、各类详情数据分层级进行综合、实时的展现,以及为用户提供操作界面。
本实施例中,整个分析平台是基于开源的Hadoop架构实现云 平台,集群硬件配置如下:16核32线程的CPU,64或128的GB 的内存,由CPU的主板控制器直接连接的多张预设转速的硬盘(总 存储达24TB),并采用千兆以太网构建集群。其中,硬盘的数量和 转速可以根据需要进行设置,如数量为20,转速为3600r/s等。
其中,Hadoop集群有四种基本任务角色:名称节点(包括备用 名称节点)、工作追踪节点、任务执行节点和数据节点。名称节点负 责协调集群上的数据存储;作业追踪节点负责协调数据处理任务; 任务执行节点负责进行数据采集、数据处理等任务;数据节点负责 存储数据。集群内大部分的节点需要同时作为数据节点和任务执行 节点。
在Hadoop集群的基础上,通过Map/Reduce来实现对分布式并 行任务处理的支持。Map/Reduce是一个用于大数据量并行计算的编 程模型,同时也是一种高效的任务调度模型,它将一个大任务分成 很多更细粒度的子任务,通过在空闲的处理节点之间进行子任务调 度,避免处理速度慢的节点延长整个任务的完成时间。
本发明中,整个智能分析平台包括三大部分,如大数据预处理模块11、智能分析模块12和信息展示模块14;其中,大数据预处 理模块11内搭建了大数据仓库,用于存储ETL过程抽取的数据源 中的关键原始数据,在大数据仓库的基础上构建多维数据集(Cube), 为系统分析、展示提供数据支持。
大数据预处理模块12还用于通过云平台管理模块实现对底 层节点设备的负载均衡、资源虚拟化、分布式数据存储管理、容错 策略管理和提供API接口等功能,实现了大数据处理和管理。
上述的数据源是企业各业务部门独立所有的业务系统及数据 库,包括人事处数据、财务处数据、研发部门数据、财务处数据、 市场部数据、评估处数据、互联网部数据和综合管理数据;其中, 上述部分可能会细分很多小部门,如市场部可能还包括秘书组,市 场组等,此时的数据均包括在市场部中。大数据预处理模块,通过分布式系统基础架构Hadoop存储所述已采集的大数据,并且用于实现负载均衡、资源虚拟化、分布 式数据存储管理和应用程序编程接口API接口功能。
所述智能分析模块13,用于实现即席查询/组合条件查询、多维OLAP、KPI指标、MDX查询等分析功能,同时实现分类、聚类、关联规则 等数据挖掘功能,以及灵活的参数配置功能;指标评估模块,用于根据预设数据信息进行实时公司情况实时 评估;所述预设数据信息包括:人力、财务、物质和业务。
上述的大数据仓库基于HDFS和Hive实现,采用分布式存储 方式集中了企业各相互独立的业务系统中的海量数据,为多维数据 集提供数据。进一步的,大数据仓库中的数据以维度和事实表的形 式存储,这里的维度是数据的属性,表示分析数据的角度,类型有一般维度、时间维度和渐变维度;事实表是存储所要分析的数据的 主表,只包括主键、外键和度量值。
操作界面至少包括以下功能中的一种或多种:具有可视化图表、分析报告、内容检索和消息推送/订阅。
本发明实施例中,信息展示模块14采用Javaweb技术搭建了 B/S模式的系统客户端,实现了单点登录控制,为用户提供展示、 操作界面;采用开源的ExtJS框架创建丰富的图形和图表,将企业 信息分析评估结果、各类详情数据分层级进行综合、实时的展现; 系统客户端具有可视化图表、分析报告、内容检索、消息推送/订阅 等功能,可以通过浏览器运行在移动端、PC端。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (4)

1.一种大数据的智能分析系统,其特征在于,所述系统包括:
大数据平台,用于存放接收已采集的大数据;
大数据预处理模块,用于对所述已采集的大数据进行预处理;所述预处理用于实现负载均衡、资源虚拟化和分布式数据存储管理;
智能分析模块,用于根据接收到的指令进行所述大数据的分析,并综合利用大数据预处理模块提供的数据,进行事件因果分析;
信息展示模块,用于生成数据分析任务传递给智能业务分析模 块并接收所述智能分析模块返回的结果;通过可交互的可视化技术将企业信息的分析 评估结果、各类详情数据分层级进行综合、实时的展现,以及为用户提供操作界面。
2.根据权利要求1所述的大数据的智能分析系统,其特征在于,所述操作界面至少包括以下功能中的一种或多种: 具有可视化图表、分析报告、内容检索和消息推送/订阅。
3.根据权利要求1所述的大数据的智能分析系统,其特征在于,所述大数据预处理模块
通过分布式系统基础架构Hadoop存储所述已采集的大数据,并且用于实现负载均衡、资源虚拟化、分布 式数据存储管理和应用程序编程接口API接口功能。
4.根据权利要求1所述的大数据的智能分析系统,其特征在于,所述分析模块,用于实现即席查询/组合条件查询、多维OLAP、KPI指标、MDX查询等分析功能,同时实现分类、聚类、关联规则 等数据挖掘功能,以及灵活的参数配置功能;
指标评估模块,用于根据预设数据信息进行实时公司情况实时 评估;所述预设数据信息包括:人力、财务、物质和业务。
CN201710646452.0A 2017-08-01 2017-08-01 一种大数据的智能分析系统 Withdrawn CN107590181A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710646452.0A CN107590181A (zh) 2017-08-01 2017-08-01 一种大数据的智能分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710646452.0A CN107590181A (zh) 2017-08-01 2017-08-01 一种大数据的智能分析系统

Publications (1)

Publication Number Publication Date
CN107590181A true CN107590181A (zh) 2018-01-16

Family

ID=61041963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710646452.0A Withdrawn CN107590181A (zh) 2017-08-01 2017-08-01 一种大数据的智能分析系统

Country Status (1)

Country Link
CN (1) CN107590181A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280213A (zh) * 2018-01-31 2018-07-13 佛山市聚成知识产权服务有限公司 一种大数据的分析系统
CN108304549A (zh) * 2018-02-01 2018-07-20 广东聚晨知识产权代理有限公司 一种大数据智能化处理系统
CN108363756A (zh) * 2018-01-31 2018-08-03 佛山市聚成知识产权服务有限公司 一种智能交通大数据处理系统
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统
CN108399208A (zh) * 2018-02-01 2018-08-14 广东聚晨知识产权代理有限公司 一种大数据的信息展示系统
CN108628964A (zh) * 2018-04-18 2018-10-09 江苏运时数据软件股份有限公司 一种智能场景化企业大数据系统
CN108984718A (zh) * 2018-07-10 2018-12-11 四川汇源吉迅数码科技有限公司 一种基于大数据技术的数字内容交互系统及交互方法
CN109976289A (zh) * 2019-04-25 2019-07-05 伟创力电子设备(深圳)有限公司 生产线kpi监测方法、装置、电子设备及可读介质
CN110309232A (zh) * 2018-02-07 2019-10-08 北京第一视角科技有限公司 可视化的医学数据分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915793A (zh) * 2015-06-30 2015-09-16 北京西塔网络科技股份有限公司 基于大数据分析挖掘的公共信息智能分析平台
CN105205055A (zh) * 2014-06-06 2015-12-30 上海商会网网络信息技术有限公司 大数据分析系统
CN105631012A (zh) * 2015-12-29 2016-06-01 湖北睛彩视讯科技有限公司 一种新媒体大数据智能分析系统
CN106326321A (zh) * 2015-07-10 2017-01-11 中兴通讯股份有限公司 大数据交换方法及装置
CN106682784A (zh) * 2017-01-04 2017-05-17 成都四方伟业软件股份有限公司 一种智能电网大数据的分析方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205055A (zh) * 2014-06-06 2015-12-30 上海商会网网络信息技术有限公司 大数据分析系统
CN104915793A (zh) * 2015-06-30 2015-09-16 北京西塔网络科技股份有限公司 基于大数据分析挖掘的公共信息智能分析平台
CN106326321A (zh) * 2015-07-10 2017-01-11 中兴通讯股份有限公司 大数据交换方法及装置
CN105631012A (zh) * 2015-12-29 2016-06-01 湖北睛彩视讯科技有限公司 一种新媒体大数据智能分析系统
CN106682784A (zh) * 2017-01-04 2017-05-17 成都四方伟业软件股份有限公司 一种智能电网大数据的分析方法与系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统
CN108280213A (zh) * 2018-01-31 2018-07-13 佛山市聚成知识产权服务有限公司 一种大数据的分析系统
CN108363756A (zh) * 2018-01-31 2018-08-03 佛山市聚成知识产权服务有限公司 一种智能交通大数据处理系统
CN108304549A (zh) * 2018-02-01 2018-07-20 广东聚晨知识产权代理有限公司 一种大数据智能化处理系统
CN108399208A (zh) * 2018-02-01 2018-08-14 广东聚晨知识产权代理有限公司 一种大数据的信息展示系统
CN110309232A (zh) * 2018-02-07 2019-10-08 北京第一视角科技有限公司 可视化的医学数据分析方法及系统
CN108628964A (zh) * 2018-04-18 2018-10-09 江苏运时数据软件股份有限公司 一种智能场景化企业大数据系统
CN108628964B (zh) * 2018-04-18 2021-08-06 江苏运时数据软件股份有限公司 一种智能场景化企业大数据系统
CN108984718A (zh) * 2018-07-10 2018-12-11 四川汇源吉迅数码科技有限公司 一种基于大数据技术的数字内容交互系统及交互方法
CN109976289A (zh) * 2019-04-25 2019-07-05 伟创力电子设备(深圳)有限公司 生产线kpi监测方法、装置、电子设备及可读介质

Similar Documents

Publication Publication Date Title
CN107590181A (zh) 一种大数据的智能分析系统
CN109766374B (zh) 一种信用联合监管平台
CN110199273B (zh) 用于在多维数据库环境中的一次扫描中进行加载、聚合和批量计算的系统和方法
CN104573071A (zh) 一种基于大数据技术的校情智能分析系统及方法
US20190005104A1 (en) Systems and methods for interest-driven data visualization systems utilizing visualization image data and trellised visualizations
US9934299B2 (en) Systems and methods for interest-driven data visualization systems utilizing visualization image data and trellised visualizations
CN104915793A (zh) 基于大数据分析挖掘的公共信息智能分析平台
CN111523003A (zh) 一种以时序动态图谱为核心的数据应用方法及平台
CN107533453A (zh) 用于生成数据可视化应用的系统和方法
CN108322548A (zh) 一种基于云计算的工业过程数据解析平台
CN104134121A (zh) 一种电网信息系统业务数据可视化的实现方法
CN108228775A (zh) 基于云平台的国土资源数据管理系统
CN110928740A (zh) 云计算中心运维数据集中可视化方法及其系统
CN107895046A (zh) 一种异构数据集成平台
CN108399208A (zh) 一种大数据的信息展示系统
CN105867951A (zh) 数据处理方法、装置及屏幕设计器
CN103198099A (zh) 基于云计算的面向电信业务的数据挖掘应用方法
Hu E-commerce big data computing platform system based on distributed computing logistics information
CN108363756A (zh) 一种智能交通大数据处理系统
CN108304549A (zh) 一种大数据智能化处理系统
CN108306916A (zh) 大数据多网融合科研一体机平台装置
CN110489732A (zh) 报表数据处理方法及设备
CN110008597A (zh) 基于并行计算框架的建筑信息模型三角剖分方法及装置
Singh et al. A comparative analysis of distributed clustering algorithms: A survey
Gorawski et al. Materialized ar-tree in distributed spatial data warehouse

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180116