CN104731852A - 一种大数据系统 - Google Patents

一种大数据系统 Download PDF

Info

Publication number
CN104731852A
CN104731852A CN201410783126.0A CN201410783126A CN104731852A CN 104731852 A CN104731852 A CN 104731852A CN 201410783126 A CN201410783126 A CN 201410783126A CN 104731852 A CN104731852 A CN 104731852A
Authority
CN
China
Prior art keywords
data
mining
unit
module
control platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410783126.0A
Other languages
English (en)
Inventor
章伟
赵迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhu Leruisi Information Consulting Co Ltd
Original Assignee
Wuhu Leruisi Information Consulting Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhu Leruisi Information Consulting Co Ltd filed Critical Wuhu Leruisi Information Consulting Co Ltd
Priority to CN201410783126.0A priority Critical patent/CN104731852A/zh
Publication of CN104731852A publication Critical patent/CN104731852A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,具体地说是一种结构合理、处理效率高的大数据系统,设有管控平台以及至少一个移动终端,其中移动终端经无线通信网络与管控平台实现数据沟通,其特征在于管控平台中设有用于抽取关键数据的数据采集单元、用于对采集到的数据进行降噪处理的数据预处理单元、用于对预处理后的数据进行挖掘分析的数据挖掘单元,本发明与现有技术相比,结合了现有的移动网络,能够获取较完整的原始数据,同时通过多属性挖掘,有效提高数据利用率。

Description

一种大数据系统
技术领域:
本发明涉及数据处理技术领域,具体地说是一种结构合理、处理效率高的大数据系统。
背景技术:
随着社会发展和经济进步,移动通信终端以及一些智能家居被广泛的使用,移动通信终端承载了个体之间的通信沟通职能,在此过程中移动终端采集、上传并存储大量用户使用信息。
大数据技术或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理的时间内达到汲取、管理、处理并整理成为帮助企业经营决策更积极目的资讯。大数据计数的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化的处理,换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“加工能力”,通过加工数据实现增值。
如何从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、事先不知道的、但有时潜在有用的信息的过程被称为数据挖掘,显而易见,数据挖掘时大数据技术的关键。
发明内容:
本发明针对现有技术存在的缺点和不足,提出了一种结构合理、处理效率高的大数据系统。
本发明通过以下措施达到:
一种大数据系统,设有管控平台以及至少一个移动终端,其中移动终端经无线通信网络与管控平台实现数据沟通,其特征在于管控平台中设有用于抽取关键数据的数据采集单元、用于对采集到的数据进行降噪处理的数据预处理单元、用于对预处理后的数据进行挖掘分析的数据挖掘单元。
本发明所述数据采集单元设有地理位置信息提取模块,能够采集用户的地理位置信息,并将其上传至数据预处理单元,与此同时数据采集单元还将当前用户的使用习惯等用户数据上传至数据预处理单元。
本发明所述数据预处理单元中还设有离散化处理单元,将降噪处理后的数据信息进行离散化处理,方便存储和进一步分析。
本发明所述数据挖掘单元设有多路并行的数据挖掘模块,用于从不同角度对输入的信息进行多方面挖掘,还设有挖掘结果融合模块以及融合信息分析模块,其中挖掘结果融合模块用于对多路并行的数据挖掘模块输出的挖掘结果进行汇总,融合信息分析模块对汇总后的数据进行最终处理。
本发明在使用时,利用现有移动终端记录使用者的地理位置信息以及当前用户数据,并将两部分信息打包上传至管控平台的数据采集单元,数据采集单元对接收的信息进行抽取后,将其送入数据预处理单元,数据预处理单元首先对数据进行降噪处理,然后将其离散化,使其更便于存储和分析,预处理后的数据被送入数据挖掘单元中的多路并行的数据挖掘模块,从不同属性不同角度对数据进行多方位挖掘,从而获得当前某一区域内人流量、当前某一用户的生活习惯需求、当前某一地区的道路拥堵状况等数据分析结果。
本发明与现有技术相比,结合了现有的移动网络,能够获取较完整的原始数据,同时通过多属性挖掘,有效提高数据利用率。
附图说明:
附图1是本发明的结构示意图。
附图标记:管控平台1、移动终端2、数据采集单元3、数据预处理单元4、数据挖掘单元5。
具体实施方式:
下面结合附图对本发明作进一步的说明。
如附图1所示,本发明提出了一种大数据系统,设有管控平台1以及至少一个移动终端2,其中移动终端2经无线通信网络与管控平台实现数据沟通,其特征在于管控平台2中设有用于抽取关键数据的数据采集单元3、用于对采集到的数据进行降噪处理的数据预处理单元4、用于对预处理后的数据进行挖掘分析的数据挖掘单元5。
本发明所述数据采集单元3设有地理位置信息提取模块,能够采集用户的地理位置信息,并将其上传至数据预处理单元,与此同时数据采集单元还将当前用户的使用习惯等用户数据上传至数据预处理单元。
本发明所述数据预处理单元4中还设有离散化处理单元,将降噪处理后的数据信息进行离散化处理,方便存储和进一步分析。
本发明所述数据挖掘单元5设有多路并行的数据挖掘模块,用于从不同角度对输入的信息进行多方面挖掘,还设有挖掘结果融合模块以及融合信息分析模块,其中挖掘结果融合模块用于对多路并行的数据挖掘模块输出的挖掘结果进行汇总,融合信息分析模块对汇总后的数据进行最终处理。
本发明在使用时,利用现有移动终端记录使用者的地理位置信息以及当前用户数据,并将两部分信息打包上传至管控平台的数据采集单元,数据采集单元对接收的信息进行抽取后,将其送入数据预处理单元,数据预处理单元首先对数据进行降噪处理,然后将其离散化,使其更便于存储和分析,预处理后的数据被送入数据挖掘单元中的多路并行的数据挖掘模块,从不同属性不同角度对数据进行多方位挖掘,从而获得当前某一区域内人流量、当前某一用户的生活习惯需求、当前某一地区的道路拥堵状况等数据分析结果。
本发明与现有技术相比,结合了现有的移动网络,能够获取较完整的原始数据,同时通过多属性挖掘,有效提高数据利用率。

Claims (4)

1.一种大数据系统,设有管控平台以及至少一个移动终端,其中移动终端经无线通信网络与管控平台实现数据沟通,其特征在于管控平台中设有用于抽取关键数据的数据采集单元、用于对采集到的数据进行降噪处理的数据预处理单元、用于对预处理后的数据进行挖掘分析的数据挖掘单元。
2.根据权利要求1所述的一种大数据系统,其特征在于所述数据采集单元设有地理位置信息提取模块,能够采集用户的地理位置信息,并将其上传至数据预处理单元,与此同时数据采集单元还将当前用户的使用习惯等用户数据上传至数据预处理单元。
3.根据权利要求1所述的一种大数据系统,其特征在于所述数据预处理单元中还设有离散化处理单元,将降噪处理后的数据信息进行离散化处理,方便存储和进一步分析。
4.根据权利要求1所述的一种大数据系统,其特征在于所述数据挖掘单元设有多路并行的数据挖掘模块,用于从不同角度对输入的信息进行多方面挖掘,还设有挖掘结果融合模块以及融合信息分析模块,其中挖掘结果融合模块用于对多路并行的数据挖掘模块输出的挖掘结果进行汇总,融合信息分析模块对汇总后的数据进行最终处理。
CN201410783126.0A 2014-12-16 2014-12-16 一种大数据系统 Pending CN104731852A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410783126.0A CN104731852A (zh) 2014-12-16 2014-12-16 一种大数据系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410783126.0A CN104731852A (zh) 2014-12-16 2014-12-16 一种大数据系统

Publications (1)

Publication Number Publication Date
CN104731852A true CN104731852A (zh) 2015-06-24

Family

ID=53455740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410783126.0A Pending CN104731852A (zh) 2014-12-16 2014-12-16 一种大数据系统

Country Status (1)

Country Link
CN (1) CN104731852A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005604A (zh) * 2015-07-06 2015-10-28 苏州金立方通讯科技有限公司 一种大数据系统
CN106055557A (zh) * 2015-12-25 2016-10-26 中国科学技术信息研究所 一种互联网环境下大数据分类预处理方法及系统
CN106354772A (zh) * 2016-08-23 2017-01-25 成都卡莱博尔信息技术股份有限公司 具有数据清洗的海量数据系统
CN107357873A (zh) * 2017-07-04 2017-11-17 深圳齐心集团股份有限公司 一种大数据存储管理系统
CN115114353A (zh) * 2022-08-29 2022-09-27 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201197193Y (zh) * 2008-05-15 2009-02-18 花江宁 一种区域内针对移动终端的信息发布装置
CN101799809A (zh) * 2009-02-10 2010-08-11 中国移动通信集团公司 数据挖掘方法和数据挖掘系统
CN102393928A (zh) * 2011-11-22 2012-03-28 广州市交通规划研究所 基于宏、中、微观交通仿真平台交互使用的交通仿真集成系统
CN103258049A (zh) * 2013-05-27 2013-08-21 重庆邮电大学 一种基于海量数据的关联规则挖掘方法
EP2728382A2 (en) * 2012-11-06 2014-05-07 CGG Services SA Spatial expansion seismic data processing method and apparatus.
CN103886074A (zh) * 2014-03-24 2014-06-25 江苏名通信息科技有限公司 基于社交媒体的商品推荐系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201197193Y (zh) * 2008-05-15 2009-02-18 花江宁 一种区域内针对移动终端的信息发布装置
CN101799809A (zh) * 2009-02-10 2010-08-11 中国移动通信集团公司 数据挖掘方法和数据挖掘系统
CN102393928A (zh) * 2011-11-22 2012-03-28 广州市交通规划研究所 基于宏、中、微观交通仿真平台交互使用的交通仿真集成系统
EP2728382A2 (en) * 2012-11-06 2014-05-07 CGG Services SA Spatial expansion seismic data processing method and apparatus.
CN103258049A (zh) * 2013-05-27 2013-08-21 重庆邮电大学 一种基于海量数据的关联规则挖掘方法
CN103886074A (zh) * 2014-03-24 2014-06-25 江苏名通信息科技有限公司 基于社交媒体的商品推荐系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005604A (zh) * 2015-07-06 2015-10-28 苏州金立方通讯科技有限公司 一种大数据系统
CN106055557A (zh) * 2015-12-25 2016-10-26 中国科学技术信息研究所 一种互联网环境下大数据分类预处理方法及系统
CN106354772A (zh) * 2016-08-23 2017-01-25 成都卡莱博尔信息技术股份有限公司 具有数据清洗的海量数据系统
CN107357873A (zh) * 2017-07-04 2017-11-17 深圳齐心集团股份有限公司 一种大数据存储管理系统
CN115114353A (zh) * 2022-08-29 2022-09-27 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统
CN115114353B (zh) * 2022-08-29 2022-12-13 湖南警云智慧信息科技有限公司 一种大数据的筛选方法和系统

Similar Documents

Publication Publication Date Title
CN104731852A (zh) 一种大数据系统
CN104461551A (zh) 基于数据并行处理的大数据处理系统
CN104462456A (zh) 基于生活数据处理的大数据系统
CN102902752B (zh) 一种日志监控方法及系统
CN102682024B (zh) 未残缺jpeg文件碎片重组的方法
CN111126873A (zh) 一种基于Hadoop集群架构的盾构TBM大数据平台系统及建设方法
CN107807891A (zh) 信息采集方法及终端设备
CN103077021A (zh) 一种通用的手机软件综合发展数据分析系统及分析方法
CN105005604A (zh) 一种大数据系统
CN103401904A (zh) 一种备份移动终端数据的方法
CN104484412A (zh) 基于多形式处理的大数据分析系统
CN102222112B (zh) 资源管理装置和资源管理方法
CN109345628A (zh) 一种模型轻量化处理方法、装置及电子设备
CN106789347A (zh) 一种基于告警数据实现告警关联和网络故障诊断的方法
CN103812679A (zh) 一种海量日志统计分析系统和方法
CN105426407A (zh) 一种基于内容分析的web数据采集方法
CN204790999U (zh) 一种工业大数据收集和处理系统
CN109344333A (zh) 一种互联网大数据分析提取方法及系统
CN104484409A (zh) 用于大数据处理的数据挖掘方法
CN103729397A (zh) 基于时间轨迹实现电子证据数据分析的方法
CN102571481B (zh) 一种客户端监控状态分析的方法及系统
CN103812676A (zh) 一种实现日志数据实时关联装置及方法
CN204926085U (zh) 一种计算机数据采集挖掘系统
CN113704215B (zh) 业务过程事件日志采样方法、系统、存储介质及计算设备
CN103853933A (zh) 面向Android数字取证的用户行为分析方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150624