CN109299082B - 一种大数据分析方法及系统 - Google Patents

一种大数据分析方法及系统 Download PDF

Info

Publication number
CN109299082B
CN109299082B CN201811068797.3A CN201811068797A CN109299082B CN 109299082 B CN109299082 B CN 109299082B CN 201811068797 A CN201811068797 A CN 201811068797A CN 109299082 B CN109299082 B CN 109299082B
Authority
CN
China
Prior art keywords
analysis
big data
data
component
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811068797.3A
Other languages
English (en)
Other versions
CN109299082A (zh
Inventor
汪小东
王磊
罗引
曹家
刘静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Wenge Technology Co ltd
Original Assignee
Beijing Zhongke Wenge Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Wenge Technology Co ltd filed Critical Beijing Zhongke Wenge Technology Co ltd
Priority to CN201811068797.3A priority Critical patent/CN109299082B/zh
Publication of CN109299082A publication Critical patent/CN109299082A/zh
Application granted granted Critical
Publication of CN109299082B publication Critical patent/CN109299082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种大数据分析方法及系统,包括:采集大数据;根据预设的分析组件对所述大数据进行预处理;分析预处理后的大数据,得到可视化的分析组件;根据用户需求选择分析组件的类型;将所述分析组件进行合成,得到整个分析场景。本发明提供的技术方案可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。

Description

一种大数据分析方法及系统
技术领域
本发明属于大数据分析领域,尤其涉及一种大数据分析方法及系统。
背景技术
大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
大数据分析,是通过众多的数据来分析得出有用的结论,而这些数据是通过一种技术手段做成一个系统来收集的,这个系统叫做大数据引擎。大数据引擎是对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”。
现有的大数据分析技术是比较固化的分析,分析很难根据场景的变化自动适配,一旦场景发生变化,就必须重新开发分析程序。
因此,需要提供一种大数据分析方法及系统来解决现有技术的不足。
发明内容
为了解决现有技术存在的问题,本发明提供了一种大数据分析方法及系统,通过分析合成解决数据分析问题,适应各种应用场景。
一种大数据分析方法,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景。
进一步的,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
进一步的,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
进一步的,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
一种大数据分析系统,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景。
进一步的,所述处理模块,用于,
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
进一步的,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
进一步的,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
本发明提供的技术方案与最接近的现有技术相比具有如下优点:
本发明提供的技术方案根据预设的分析组件对采集大数据进行预处理,然后分析预处理后的数据得到可视化的分析组件,再根据用户的需求选择一个或一个以上的分析组件进行合成,得到整个分析场景。本发明可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。
附图说明
图1是本发明流程图;
图2是本发明实施例中分析场景展示示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种大数据分析方法,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景。
在本申请实施例中,首先根据预设的分析组件对采集大数据进行预处理,然后分析预处理后的数据得到可视化的分析组件,再根据用户的需求选择一个或一个以上的分析组件进行合成,得到整个分析场景。本发明可以自由选择所需要的分析组件,解决各种数据分析问题,适应各种应用场景。
在本申请的一些实施例中,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
通过完成分析对象数据集的抽取、过滤、清洗工作,保证分析对象数据的纯度和数据质量。
首先采集用于分析合成的数据,从信源、渠道、内容分类、语种、情感分类、标签分类、关键字、时间范围等维度对数据进行过滤、清洗、提取,提取出来的数据形成一个个数据集合,用于后续的数据绑定。
在本申请的一些实施例中,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
组件分析阶段主要是各组件根据对应的算法和模型,完成分析结果的可视化展现。
其中,预先建立的模型是基于深度学习建立的。
在本申请的一些实施例中,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
其中,组件的种类可以包括如下几类:信源分析、信息内容、新闻发现、跨语言分析、实体分析、趋势变化、地域分析、传播分析、媒体特征、情感分析、互动分析、安全性分析。
每一种组件包括多种分析维度,用户可以根据自身的需求,选择一种或是一种以上的分析维度作为场景进行检索,可以得到包含需求的多个可视化组件,多个可视化组件可以根据用户的需求进行排序,然后展示在预设平台上,例如在动态屏上进行展示。
针对每一类组件设定组件的属性,给组件绑定数据源,设定分析结果的可视化展现种类,数据范围。可以选择一个或多个数据源集合进行自由组合。分析中的组件可以编辑、删除、重新添加。在手机、PC上的展示可以自由组合、自动适配。组件数据绑定完成后,根据数据的变化自动进行分析,分析结果实时更新。各个组件的分析由底层分析引擎来实现。分析结果以高级可视化的方式展现,提供动态更新,可以人机交互。分析的结果可以以多种形式输出,输出形式包括Web页专题、报告、动态屏等形式。其中报告可以提供下载。动态屏支持切换模板。
如图2所示,是两个电影的一些相关数据的分析场景展示示意图,用户想了解爱情公寓和一出好戏的媒体曝光率、总声量渠道对比以及各自渠道声量分布的场景展示。
首先用户可以在搜索引擎输入“爱情公寓vs一出好戏”,通过本申请的大数据分析方法就可以分析出用户所需要的数据,并通过可视化组件按顺序展示到搜索界面,让用户可以直接的看出这几个维度的数据分布。
基于相同的发明构思本发明还提供了一种大数据分析系统,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景。
可选的,所述处理模块,用于,
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
可选的,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
可选的,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种大数据分析方法,其特征在于,包括:
采集大数据;
根据预设的分析组件对所述大数据进行预处理,其中,分析组件是包含多种分析维度的组件;
分析预处理后的大数据,得到可视化的分析组件;
根据用户需求选择分析组件的类型;
将所述分析组件进行合成,得到整个分析场景;
所述将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件根据所述用户需求进行排序,并展示在预设平台上;
给所述用户选择的分析组件绑定数据源,并设定分析结果的可视化展示种类和数据范围;
在组件数据绑定完成后,根据数据的变化自动进行分析,所述分析结果实时更新。
2.根据权利要求1所述的一种大数据分析方法,其特征在于,所述根据预设的分析组件对所述大数据进行预处理,包括:
根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
3.根据权利要求2所述的一种大数据分析方法,其特征在于,所述分析预处理后的大数据,得到可视化的分析组件,包括:
通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
4.根据权利要求1所述的一种大数据分析方法,其特征在于,将所述分析组件进行合成,得到整个分析场景,包括:
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
5.一种大数据分析系统,其特征在于,包括:
获取模块,用于采集大数据;
处理模块,用于根据预设的分析组件对所述大数据进行预处理,其中,分析组件是包含多种分析维度的组件;
可视化模块,用于分析预处理后的大数据,得到可视化的分析组件;
选择模块,用于根据用户需求选择分析组件的类型;
合成模块,用于将所述分析组件进行合成,得到整个分析场景;
所述合成模块,还用于:
将用户选择的分析组件根据所述用户需求进行排序,并展示在预设平台上;
给所述用户选择的分析组件绑定数据源,并设定分析结果的可视化展示种类和数据范围;
在组件数据绑定完成后,根据数据的变化自动进行分析,所述分析结果实时更新。
6.根据权利要求5所述的一种大数据分析系统,其特征在于,所述处理模块,用于根据预设的分析组件对所述大数据进行过滤、清洗和提取,得到与所述分析组件相对应的数据集。
7.根据权利要求6所述的一种大数据分析系统,其特征在于,所述可视化模块包括:
分析子模块,用于通过预先设立模型对所述分析组件相对应的数据集进行分析,得到所述数据集的分析结果;
可视化子模块,用于将所述分析结果按照预先设定的可视化展现种类进行展示,得到可视化的分析组件。
8.根据权利要求5所述的一种大数据分析系统,其特征在于,所述合成模块,用于,
将用户选择的分析组件按照预先设定的顺序进行拼接,得到整个分析场景。
CN201811068797.3A 2018-09-13 2018-09-13 一种大数据分析方法及系统 Active CN109299082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811068797.3A CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811068797.3A CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Publications (2)

Publication Number Publication Date
CN109299082A CN109299082A (zh) 2019-02-01
CN109299082B true CN109299082B (zh) 2021-09-14

Family

ID=65166964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811068797.3A Active CN109299082B (zh) 2018-09-13 2018-09-13 一种大数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN109299082B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190513B (zh) * 2019-12-03 2021-09-28 腾讯云计算(北京)有限责任公司 可视化事件分析方法、装置、计算机设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020459A (zh) * 2012-12-19 2013-04-03 中国科学院计算技术研究所 一种多维度用电行为的感知方法及系统
CN105824975A (zh) * 2016-04-19 2016-08-03 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN107424015A (zh) * 2017-08-09 2017-12-01 星光物语(北京)电子商务有限公司 支持海量商品按客户维度定价的系统及方法
CN108073706A (zh) * 2017-12-20 2018-05-25 北京四方继保自动化股份有限公司 一种仿真系统历史库纵向数据横向化展示的方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9377864B2 (en) * 2013-05-06 2016-06-28 Microsoft Technology Licensing, Llc Transforming visualized data through visual analytics based on interactivity
CN104166681B (zh) * 2014-07-15 2017-11-17 中电科华云信息技术有限公司 可视化匹配及实时展现的实现方法和系统
US20160231915A1 (en) * 2015-02-10 2016-08-11 Microsoft Technology Licensing, Llc. Real-time presentation of customizable drill-down views of data at specific data points
CN107943827A (zh) * 2017-10-19 2018-04-20 广东创我科技发展有限公司 一种数据的快速自定义图表展现方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020459A (zh) * 2012-12-19 2013-04-03 中国科学院计算技术研究所 一种多维度用电行为的感知方法及系统
CN105824975A (zh) * 2016-04-19 2016-08-03 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN107424015A (zh) * 2017-08-09 2017-12-01 星光物语(北京)电子商务有限公司 支持海量商品按客户维度定价的系统及方法
CN108073706A (zh) * 2017-12-20 2018-05-25 北京四方继保自动化股份有限公司 一种仿真系统历史库纵向数据横向化展示的方法
CN108364124A (zh) * 2018-01-26 2018-08-03 天津中科智能识别产业技术研究院有限公司 基于大数据的国际产能合作风险评估与决策服务系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于概率主题建模的新闻文本可视化综述;汤斯亮等;《计算机辅助设计与图形学学报》;20150515;第3-14页 *

Also Published As

Publication number Publication date
CN109299082A (zh) 2019-02-01

Similar Documents

Publication Publication Date Title
WO2018072071A1 (zh) 知识图谱构建系统及方法
TW201834462A (zh) 視訊資料的推薦方法、裝置和伺服器
CN107463700B (zh) 用于获取信息的方法、装置及设备
CN111008253B (zh) 数据模型生成方法和数据仓库生成方法、装置及电子设备
US11204957B2 (en) Multi-image input and sequenced output based image search
WO2020155750A1 (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN104836720A (zh) 交互式通信中进行信息推荐的方法及装置
CN109582945A (zh) 文章生成方法、装置及存储介质
CN114254158B (zh) 视频生成方法及其装置、神经网络的训练方法及其装置
CN106802913A (zh) 一种播放内容推荐方法及其装置
CN111460179A (zh) 多媒体信息展示方法及装置、计算机可读介质及终端设备
JP2022538702A (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
Burghardt et al. Beyond shot lengths–using language data and color information as additional parameters for quantitative movie analysis
US20190095393A1 (en) Sharing method and device for video and audio data presented in interacting fashion
CN108241598A (zh) 一种演示文稿的制作方法和装置
CN102265610A (zh) 已编辑信息提供设备、已编辑信息提供方法、程序以及存储介质
CN112929746A (zh) 视频生成方法和装置、存储介质和电子设备
Soffritti Multimodal corpora in audiovisual translation studies
CN109344325B (zh) 基于智能会议平板的信息的推荐方法和装置
CN109299082B (zh) 一种大数据分析方法及系统
KR20200090572A (ko) 작품 이미지와 텍스트를 매칭하여 도서를 제작하는 도서 제작 시스템
CN109446209A (zh) 一种动态屏的生成和显示方法及系统
JP6868576B2 (ja) 事象提示システムおよび事象提示装置
CN113407678B (zh) 知识图谱构建方法、装置和设备
WO2022089427A1 (zh) 视频生成方法、装置、电子设备以及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant