CN109299082A - 一种大数据分析方法及系统 - Google Patents

一种大数据分析方法及系统 Download PDF

Info

Publication number
CN109299082A
CN109299082A CN201811068797.3A CN201811068797A CN109299082A CN 109299082 A CN109299082 A CN 109299082A CN 201811068797 A CN201811068797 A CN 201811068797A CN 109299082 A CN109299082 A CN 109299082A
Authority
CN
China
Prior art keywords
analytic unit
big data
analysis
preset
obtains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811068797.3A
Other languages
English (en)
Other versions
CN109299082B (zh
Inventor
汪小东
王磊
罗引
曹家
刘静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Song Polytron Technologies Inc
Original Assignee
Beijing Zhongke Song Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Song Polytron Technologies Inc filed Critical Beijing Zhongke Song Polytron Technologies Inc
Priority to CN201811068797.3A priority Critical patent/CN109299082B/zh
Publication of CN109299082A publication Critical patent/CN109299082A/zh
Application granted granted Critical
Publication of CN109299082B publication Critical patent/CN109299082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种大数据分析方法及系统,包括:采集大数据;根据预设的分析组件对所述大数据进行预处理;分析预处理后的大数据,得到可视化的分析组件;根据用户需求选择分析组件的类型;将所述分析组件进行合成,得到整个分析场景。本发明提供的技术方案可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。

Description

一种大数据分析方法及系统
技术领域
本发明属于大数据分析领域,尤其涉及一种大数据分析方法及系统。
背景技术
大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
大数据分析,是通过众多的数据来分析得出有用的结论,而这些数据是通过一种技术手段做成一个系统来收集的,这个系统叫做大数据引擎。大数据引擎是对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”。
现有的大数据分析技术是比较固化的分析,分析很难根据场景的变化自动适配,一旦场景发生变化,就必须重新开发分析程序。
因此,需要提供一种大数据分析方法及系统来解决现有技术的不足。
发明内容
为了解决现有技术存在的问题,本发明提供了一种大数据分析方法及系统,通过分析合成解决数据分析问题,适应各种应用场景。
一种大数据分析方法,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景。
进一步的,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
进一步的,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
进一步的,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
一种大数据分析系统,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景。
进一步的,所述处理模块,用于,
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
进一步的,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
进一步的,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
本发明提供的技术方案与最接近的现有技术相比具有如下优点:
本发明提供的技术方案根据预设的分析组件对采集大数据进行预处理,然后分析预处理后的数据得到可视化的分析组件,再根据用户的需求选择一个或一个以上的分析组件进行合成,得到整个分析场景。本发明可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。
附图说明
图1是本发明流程图;
图2是本发明实施例中分析场景展示示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种大数据分析方法,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景。
在本申请实施例中,首先根据预设的分析组件对采集大数据进行预处理,然后分析预处理后的数据得到可视化的分析组件,再根据用户的需求选择一个或一个以上的分析组件进行合成,得到整个分析场景。本发明可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。
在本申请的一些实施例中,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
通过完成分析对象数据集的抽取、过滤、清洗工作,保证分析对象数据的纯度和数据质量。
首先采集用于分析合成的数据,从信源、渠道、内容分类、语种、情感分类、标签分类、关键字、时间范围等维度对数据进行过滤、清洗、提取,提取出来的数据形成一个个数据集合,用于后续的数据绑定。
在本申请的一些实施例中,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
组件分析阶段主要是各组件根据对应的算法和模型,完成分析结果的可视化展现。
其中,预先建立的模型是基于深度学习建立的。
在本申请的一些实施例中,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
其中,组件的种类可以包括如下几类:信源分析、信息内容、新闻发现、跨语言分析、实体分析、趋势变化、地域分析、传播分析、媒体特征、情感分析、互动分析、安全性分析。
每一种组件包括多种分析维度,用户可以根据自身的需求,选择一种或是一种以上的分析维度作为场景进行检索,可以得到包含需求的多个可视化组件,多个可视化组件可以根据用户的需求进行排序,然后展示在预设平台上,例如在动态屏上进行展示。
针对每一类组件设定组件的属性,给组件绑定数据源,设定分析结果的可视化展现种类,数据范围。可以选择一个或多个数据源集合进行自由组合。分析中的组件可以编辑、删除、重新添加。在手机、PC上的展示可以自由组合、自动适配。组件数据绑定完成后,根据数据的变化自动进行分析,分析结果实时更新。各个组件的分析由底层分析引擎来实现。分析结果以高级可视化的方式展现,提供动态更新,可以人机交互。分析的结果可以以多种形式输出,输出形式包括Web页专题、报告、动态屏等形式。其中报告可以提供下载。动态屏支持切换模板。
如图2所示,是两个电影的一些相关数据的分析场景展示示意图,用户想了解爱情公寓和一出好戏的媒体曝光率、总声量渠道对比以及各自渠道声量分布的场景展示。
首先用户可以在搜索引擎输入“爱情公寓vs一出好戏”,通过本申请的大数据分析方法就可以分析出用户所需要的数据,并通过可视化组件按顺序展示到搜索界面,让用户可以直接的看出这几个维度的数据分布。
基于相同的发明构思本发明还提供了一种大数据分析系统,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景。
可选的,所述处理模块,用于,
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
可选的,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
可选的,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种大数据分析方法,其特征在于,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景。
2.根据权利要求1所述的一种大数据分析方法,其特征在于,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
3.根据权利要求2所述的一种大数据分析方法,其特征在于,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
4.根据权利要求1所述的一种大数据分析方法,其特征在于,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
5.一种大数据分析系统,其特征在于,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景。
6.根据权利要求5所述的一种大数据分析系统,其特征在于,所述处理模块,用于,
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
7.根据权利要求6所述的一种大数据分析系统,其特征在于,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
8.根据权利要求5所述的一种大数据分析系统,其特征在于,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
CN201811068797.3A 2018-09-13 2018-09-13 一种大数据分析方法及系统 Active CN109299082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811068797.3A CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811068797.3A CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Publications (2)

Publication Number Publication Date
CN109299082A true CN109299082A (zh) 2019-02-01
CN109299082B CN109299082B (zh) 2021-09-14

Family

ID=65166964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811068797.3A Active CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN109299082B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190513A (zh) * 2019-12-03 2020-05-22 腾讯云计算(北京)有限责任公司 可视化事件分析方法、装置、计算机设备以及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020459A (zh) * 2012-12-19 2013-04-03 中国科学院计算技术研究所 一种多维度用电行为的感知方法及系统
US20140327608A1 (en) * 2013-05-06 2014-11-06 Microsoft Corporation Transforming visualized data through visual analytics based on interactivity
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和系统
CN105824975A (zh) * 2016-04-19 2016-08-03 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
US20160231915A1 (en) * 2015-02-10 2016-08-11 Microsoft Technology Licensing, Llc. Real-time presentation of customizable drill-down views of data at specific data points
CN107424015A (zh) * 2017-08-09 2017-12-01 星光物语(北京)电子商务有限公司 支持海量商品按客户维度定价的系统及方法
CN107943827A (zh) * 2017-10-19 2018-04-20 广东创我科技发展有限公司 一种数据的快速自定义图表展现方法及装置
CN108073706A (zh) * 2017-12-20 2018-05-25 北京四方继保自动化股份有限公司 一种仿真系统历史库纵向数据横向化展示的方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020459A (zh) * 2012-12-19 2013-04-03 中国科学院计算技术研究所 一种多维度用电行为的感知方法及系统
US20140327608A1 (en) * 2013-05-06 2014-11-06 Microsoft Corporation Transforming visualized data through visual analytics based on interactivity
CN104166681A (zh) * 2014-07-15 2014-11-26 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和系统
US20160231915A1 (en) * 2015-02-10 2016-08-11 Microsoft Technology Licensing, Llc. Real-time presentation of customizable drill-down views of data at specific data points
CN105824975A (zh) * 2016-04-19 2016-08-03 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN107424015A (zh) * 2017-08-09 2017-12-01 星光物语(北京)电子商务有限公司 支持海量商品按客户维度定价的系统及方法
CN107943827A (zh) * 2017-10-19 2018-04-20 广东创我科技发展有限公司 一种数据的快速自定义图表展现方法及装置
CN108073706A (zh) * 2017-12-20 2018-05-25 北京四方继保自动化股份有限公司 一种仿真系统历史库纵向数据横向化展示的方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
汤斯亮等: "基于概率主题建模的新闻文本可视化综述", 《计算机辅助设计与图形学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190513A (zh) * 2019-12-03 2020-05-22 腾讯云计算(北京)有限责任公司 可视化事件分析方法、装置、计算机设备以及存储介质
CN111190513B (zh) * 2019-12-03 2021-09-28 腾讯云计算(北京)有限责任公司 可视化事件分析方法、装置、计算机设备以及存储介质

Also Published As

Publication number Publication date
CN109299082B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
KR101939425B1 (ko) 미디어 세트의 계층적인, 줌 가능한 프레젠테이션 기법
US11989244B2 (en) Shared user driven clipping of multiple web pages
CN104991965A (zh) 用于基于标准问创建扩展问的方法和装置
CN110008378A (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN101183380B (zh) 内容过滤方法及其装置
CN104735468A (zh) 一种基于语义分析将图像合成新视频的方法及系统
CN109271594A (zh) 电子书的推荐方法、电子设备及计算机存储介质
US8949721B2 (en) Personalization of web content
US8701025B2 (en) Interactive ring-shaped interface
EP3367266A1 (en) Page construction method, terminal, computer-readable storage medium and page construction device
CN112035727A (zh) 信息获取方法、装置、设备、系统及可读存储介质
KR100575581B1 (ko) 우선순위 그래프를 이용한 제품 계열의 기능 분석 및테스팅 경로 분석 장치 및 그 방법
CN107632974B (zh) 适用于多领域的中文分析平台
CN116881353A (zh) 金融数据的展示方法及装置、存储介质和电子设备
CN109446209A (zh) 一种动态屏的生成和显示方法及系统
CN109299082A (zh) 一种大数据分析方法及系统
CN112364185A (zh) 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN111428117B (zh) 应用程序的数据获取方法和装置
CN111310017B (zh) 一种时效性场景内容的生成方法及装置
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN111737606B (zh) 搜索结果的展现方法、装置、设备及可读存储介质
CN103838873A (zh) 一种应用匹配机主信息自动搜索的方法及系统
CN105488054B (zh) 一种浏览图片的方法及装置
KR102487672B1 (ko) 분석 대상에 대한 고객의 니즈를 분석하는 방법 및 장치
TW201619852A (zh) 用於感知情境並推薦資訊之電子計算裝置、其方法及其電腦程式產品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant