CN112817951A - 一种用于新媒体营销的数据分析方法 - Google Patents
一种用于新媒体营销的数据分析方法 Download PDFInfo
- Publication number
- CN112817951A CN112817951A CN202110069397.XA CN202110069397A CN112817951A CN 112817951 A CN112817951 A CN 112817951A CN 202110069397 A CN202110069397 A CN 202110069397A CN 112817951 A CN112817951 A CN 112817951A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- new media
- marketing
- analysis method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
- G06Q30/0643—Graphical representation of items or shoppers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及计算机数据处理领域以及新媒体营销与数据分析的融合,更具体地,本发明涉及一种用于新媒体营销的数据分析方法。所述新媒体营销的数据分析方法,包括:数据采集模块,数据存储模块,数据整合模块,数据解析模块,数据模型,客户端。通过使用spark框架与python编程,能够将实时采集的数据与离线数据相结合,当数据量较大时使用离线数据分析处理,同时使用实时采集的数据对离线数据进行补充,以更好的应用于要求结果立即反馈的场景。同时,通过对数据的整合与解析,能够将多平台直播数据同时对比呈现,以便于实现多平台数据的对比统计与趋势预测。
Description
技术领域
本发明涉及计算机数据处理领域以及新媒体营销与数据分析的融合,更具体地,本发明涉及一种用于新媒体营销的数据分析方法。
背景技术
随着自媒体行业的快速发展,网络直播也逐渐成为一个热门产业,吸引人们在这个平台上展示自己,同时从中获利,而直播平台最重要的就是数据分析,运营直播平台如何更好的对自己的直播流量进行统计与分析,并将流量更好的变现成为现阶段需要研究的一个重要问题。目前各直播平台层出不穷,但是后台数据处理平台对的信息的整合与发布并不统一,主播也无法快速找到现阶段的热门商品,供应商也需要从多个平台,大海捞针才能找到心仪的主播,因此,如何搭建一个可以实时采集个直播平台数据的综合型平台,同时将各平台数据进行分类与整个,实现各直播平台信息的统一对比分析,成为一个急需解决的重要问题。
发明内容
针对现有技术中存在的一些问题,本发明提供了一种用于新媒体营销的数据分析方法,包括:
数据采集模块,用于采集网络直播平台数据,并将采集的数据传送至数据存储模块;
数据存储模块,用于存储采集的数据,以应用于后续数据的整合,数据解析与数据模型的构建;
数据整合模块,用以对数据存储模块中存储的数据进行整合,并传送至数据解析模块;
数据解析模块,用以对数据整合模块中整合后的数据进行分类,并定义分类后的数据标签与标签属性,将标签属性数据传送至数据模型;
数据模型,建立线性回归数学模型,以用于数据筛选与数据变化趋势分析;
客户端,将分析得到的数据功能可视化。
作为本发明的一种优选的技术方案,所述的网络直播平台,具体包括抖音、快手、小红书、斗鱼TV、哔哩哔哩、虎牙直播、战旗直播,花椒直播网络平台。
作为本发明的一种优选的技术方案,所述的数据采集模块使用spark框架与python联合编程,用以数据采集与分析。
作为本发明的一种优选的技术方案,所述的数据整合模块,包括数据清洗,用以清洗数据中偏离大部分值的异常值和离群点;数据过滤,用以滤除数据中出现多次的重复数据;数据转换,用于对不同字段的数据转换为同一字段;数据合并,用以对不同网络直播平台采集的数据进行整理。
作为本发明的一种优选的技术方案,所述的数据解析模块对数据整合模块中整合后的数据进行分类,并定义标签与标签属性,通过对标签属性进行定位,从而提取出标签属性中存储的数据,以应用于数学模型。
作为本发明的一种优选的技术方案,所述的数据模型,通过建立基于线性回归的数学模型,对标签属性中提取的存储数据进行分析,得到数据的变化趋势。
作为本发明的一种优选的技术方案,所述的客户端包括主播端和品牌方端。
作为本发明的一种优选的技术方案,所述的主播端包括各平台直播实时监视模块,数据流量监控模块,后台流量变现模块。
作为本发明的一种优选的技术方案,所述的品牌方端包括热门商品排名推送,主播带货排名推送,单一平台商品销售额统计及预测,多平台商品销售额排名及预测,各平台日流量排名及预测。
作为本发明的一种优选的技术方案,所述的主播端数据与品牌方端数据可形成数据互联的商业模式,主播端的流量数据可在品牌方端显示出来,品牌方端的商品信息也可在主播端进行实时查看。
本发明与现有技术相比具有一下有益效果:
(1)本发明所述的数据采集模块,使用spark框架与python编程,能够将实时采集的数据与离线数据相结合,当数据量较大时使用离线数据分析处理,同时使用实时采集的数据对离线数据进行补充,以更好的应用于要求结果立即反馈的场景。
(2)本发明所述的数据解析模块,通过对数据的整合与解析,能够将多平台直播数据同时呈现,以便于实现多平台数据的对比统计与趋势预测。
附图说明
图1为本发明所述新媒体营销的数据分析方法流程示意图;
图2为本发明所述客户端的示意图。
具体实施方式
本发明提供了一种用于新媒体营销的数据分析方法,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明作进一步详细说明。应当理解的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,所述新媒体营销的数据分析方法,包括:
数据采集模块,用于采集网络直播平台数据,并将采集的数据传送至数据存储模块;
数据存储模块,用于存储采集的数据,以应用于后续数据的整合,数据解析与数据模型的构建;
数据整合模块,用以对数据存储模块中存储的数据进行整合,并传送至数据解析模块;
数据解析模块,用以对数据整合模块中整合后的数据进行分类,并定义分类后的数据标签与标签属性,将标签属性数据传送至数据模型;
数据模型,建立线性回归数学模型,以用于数据筛选与数据变化趋势分析;
客户端,将分析得到的数据功能可视化。
<数据采集模块>
本发明所述的网络直播平台,具体包括抖音、快手、小红书、斗鱼TV、哔哩哔哩、虎牙直播、战旗直播,花椒直播网络平台。
在一种实施方式中,所述的数据采集模块,通过确定各平台用户不同数据的API接口,以实现对不同数据包的读取与采集。
本发明所述的数据采集模块使用spark框架与python联合编程,用以数据采集与分析。
在一种实施方式中,所述的spark框架是一种专为大规模数据处理而设计的快速通用的计算引擎,它是一种面向对象、函数式编程语言,能够像操作本地集合对象一样轻松地操作分布式数据集,并具有运行速度块,易用性好,支持多种编程语言的特点。
<数据整合模块>
本发明所述的数据整合模块,包括数据清洗,用以清洗数据中偏离大部分值的异常值和离群点;数据过滤,用以滤除数据中出现多次的重复数据;数据转换,用于对不同字段的数据转换为同一字段;数据合并,用以对不同网络直播平台采集的数据进行整理。
<数据解析模块>
本发明所述的数据解析模块对数据整合模块中整合后的数据进行分类,并定义标签与标签属性,通过对标签属性进行定位,从而提取出标签属性中存储的数据,以应用于数学模型。
在一种实施方式中,所述的提取出标签属性中存储的数据,通过使用BS4模块方法进行数据解析,将本地的html文档中的数据加载到一个实例化对象中,通过调用对象中相关书信或方法进行标签定位和数据提取。所述的数学模型包括,跨平台直播数据,统计直播类型统计,所在领域,粉丝数,评论,转发,分享,时长,直播销量,直播流量的数据统计。所述的BS4模块是一种使用python语言编写的工具箱,以用来处理数据搜索、数据修改分析树等功能。
<数据模型>
本发明所述的数据模型,通过建立基于线性回归的数学模型,对标签属性中提取的存储数据进行分析,得到数据的变化趋势。
在一种实施方式中,所述的数据变化的分析与预测包括对单一平台,跨平台直播数据进行数据峰值,数据排名,粉丝最多账号,最火视频,销售额最高商品,对粉丝点赞,评论变化趋势进行不同时段的分析与预测。并通过对数据的标签的筛选,以用于同行竞品数据的自动筛选与分析,并筛选出相似领域的数据,以实现对直播时粉丝的年龄,性别,地域进行相应的划分,所述的跨平台直播数据预测与分析,包括同时对多家直播平台的数据进行统一的分析与预测。
本发明所述的客户端包括主播端和品牌方端。
本发明所述的主播端包括各平台直播实时监视模块,数据流量监控模块,后台流量变现模块。
本发明所述的品牌方端包括热门商品排名推送,主播带货排名推送,单一平台商品销售额统计及预测,多平台商品销售额排名及预测,各平台日流量排名及预测。
本发明所述的主播端数据与品牌方端数据可形成数据互联的商业模式,主播端的流量数据可在品牌方端显示出来,品牌方端的商品信息也可在主播端进行实时查看。
综上所述,本发明提供了一种用于新媒体营销的数据分析方法,通过数据采集模块,采集互联网直播数据并传送至数据存储模块,通过数据整合模块,用以对数据存储模块中存储的数据进行整合,并传送至数据解析模块,通过在数据解析模块中对整理后的数据解析,以用于提取数据标签属性,并进行数学模型,通过建立线性回归数学模型,用于数据筛选与数据变化趋势分析,并最终将分析后的数据传送至客户端,从而实现数据功能的可视化。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有的这些替换或改变都应属于本发明所附的权利要求书的保护范围。
Claims (10)
1.一种用于新媒体营销的数据分析方法,其特征在于,包括:
数据采集模块,用于采集网络直播平台数据,并将采集的数据传送至数据存储模块;
数据存储模块,用于存储采集的数据,以应用于后续数据的整合,数据解析与数据模型的构建;
数据整合模块,用以对数据存储模块中存储的数据进行整合,并传送至数据解析模块;
数据解析模块,用以对数据整合模块中整合后的数据进行分类,并定义分类后的数据标签与标签属性,将标签属性数据传送至数据模型;
数据模型,建立线性回归数学模型,以用于数据筛选与数据变化趋势分析;
客户端,将分析得到的数据功能可视化。
2.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的网络直播平台,具体包括抖音、快手、小红书、斗鱼TV、哔哩哔哩、虎牙直播、战旗直播,花椒直播网络平台。
3.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的数据采集模块使用spark框架与python联合编程,用以数据采集与分析。
4.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的数据整合模块,包括数据清洗,用以清洗数据中偏离大部分值的异常值和离群点;数据过滤,用以滤除数据中出现多次的重复数据;数据转换,用于对不同字段的数据转换为同一字段;数据合并,用以对不同网络直播平台采集的数据进行整理。
5.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的数据解析模块对数据整合模块中整合后的数据进行分类,并定义标签与标签属性,通过对标签属性进行定位,从而提取出标签属性中存储的数据,以应用于数学模型中。
6.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的数据模型,通过建立基于线性回归的数学模型,对标签属性中提取的存储数据进行分析,得到数据的变化趋势。
7.根据权利要求1所述的用于新媒体营销的数据分析方法,其特征在于,所述的客户端包括主播端和品牌方端。
8.根据权利要求7所述的用于新媒体营销的数据分析方法,其特征在于,所述的主播端包括各平台直播实时监视模块,数据流量监控模块,后台流量变现模块。
9.根据权利要求7所述的用于新媒体营销的数据分析方法,其特征在于,所述的品牌方端包括热门商品排名推送,主播带货排名推送,单一平台商品销售额统计及预测,多平台商品销售额排名及预测,各平台日流量排名及预测。
10.根据权利要求7所述的用于新媒体营销的数据分析方法,其特征在于,所述的主播端数据与品牌方端数据可形成数据互联的商业模式,主播端的流量数据可在品牌方端显示出来,品牌方端的商品信息也可在主播端进行实时查看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069397.XA CN112817951A (zh) | 2021-01-19 | 2021-01-19 | 一种用于新媒体营销的数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069397.XA CN112817951A (zh) | 2021-01-19 | 2021-01-19 | 一种用于新媒体营销的数据分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112817951A true CN112817951A (zh) | 2021-05-18 |
Family
ID=75870153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110069397.XA Pending CN112817951A (zh) | 2021-01-19 | 2021-01-19 | 一种用于新媒体营销的数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112817951A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745328A (zh) * | 2023-12-29 | 2024-03-22 | 深圳市南方网通网络技术开发有限公司 | 一种基于多平台的网络营销数据处理方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111629221A (zh) * | 2020-05-28 | 2020-09-04 | 杭州双笙信息科技有限公司 | 一种基于互联网的流量主播推荐系统 |
CN111695974A (zh) * | 2020-06-18 | 2020-09-22 | 上海适享文化传播有限公司 | 在直播中随时随地使用零售知识数据库的方法 |
CN111787370A (zh) * | 2020-08-05 | 2020-10-16 | 淮阴工学院 | 一种电商多平台同步直播方法与装置 |
CN111831636A (zh) * | 2020-07-28 | 2020-10-27 | 平安国际融资租赁有限公司 | 一种数据处理方法、装置、计算机系统及可读存储介质 |
CN112001783A (zh) * | 2020-10-28 | 2020-11-27 | 杭州次元岛科技有限公司 | 基于商品信息进行网络直播带货的信息处理方法及系统 |
CN112102037A (zh) * | 2020-09-16 | 2020-12-18 | 汤涛 | 一种基于大数据的直播电商平台商品内容智能推送管理系统 |
-
2021
- 2021-01-19 CN CN202110069397.XA patent/CN112817951A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111629221A (zh) * | 2020-05-28 | 2020-09-04 | 杭州双笙信息科技有限公司 | 一种基于互联网的流量主播推荐系统 |
CN111695974A (zh) * | 2020-06-18 | 2020-09-22 | 上海适享文化传播有限公司 | 在直播中随时随地使用零售知识数据库的方法 |
CN111831636A (zh) * | 2020-07-28 | 2020-10-27 | 平安国际融资租赁有限公司 | 一种数据处理方法、装置、计算机系统及可读存储介质 |
CN111787370A (zh) * | 2020-08-05 | 2020-10-16 | 淮阴工学院 | 一种电商多平台同步直播方法与装置 |
CN112102037A (zh) * | 2020-09-16 | 2020-12-18 | 汤涛 | 一种基于大数据的直播电商平台商品内容智能推送管理系统 |
CN112001783A (zh) * | 2020-10-28 | 2020-11-27 | 杭州次元岛科技有限公司 | 基于商品信息进行网络直播带货的信息处理方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745328A (zh) * | 2023-12-29 | 2024-03-22 | 深圳市南方网通网络技术开发有限公司 | 一种基于多平台的网络营销数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038178B (zh) | 舆情分析方法和装置 | |
JP6449351B2 (ja) | ブロードキャストメッセージに対するオンラインユーザの反応を特定するためのデータマイニング | |
CN103942337B (zh) | 一种基于图像识别与匹配的视频搜索系统 | |
CN109104639A (zh) | 直播系统、确定直播视频主题的方法、装置以及电子设备 | |
CN113132752B (zh) | 视频处理方法及装置 | |
Schwenzow et al. | Understanding videos at scale: How to extract insights for business research | |
CN113301360B (zh) | 一种信息的提示方法、计算设备及存储介质 | |
US20170004569A1 (en) | Visually generated consumer product presentation | |
CN109903127A (zh) | 一种群组推荐方法、装置、存储介质及服务器 | |
Vandal et al. | Event detection: Ultra large-scale clustering of facial expressions | |
CN104424201A (zh) | 用于提供食品安全信息的方法和装置 | |
CN112601105B (zh) | 一种应用于直播评论的信息提取方法及装置 | |
Narassiguin et al. | Data Science for Influencer Marketing: feature processing and quantitative analysis | |
JP2023507043A (ja) | データ処理方法、装置、機器、記憶媒体及びコンピュータプログラム | |
Xiang et al. | Salad: A multimodal approach for contextual video advertising | |
CN108491496A (zh) | 一种推广信息的处理方法及装置 | |
CN112817951A (zh) | 一种用于新媒体营销的数据分析方法 | |
JP5425333B1 (ja) | マーケティング支援システム、マーケティング支援方法、プログラム及びコンピュータ記憶媒体 | |
KR20140010679A (ko) | 추천 시스템 및 추천 방법 | |
JP4308683B2 (ja) | ユーザ活動履歴可視化・分析方法、ユーザ活動履歴可視化・分析装置、および、プログラム | |
Dadashnia et al. | Identification of distinct usage patterns and prediction of customer behavior | |
WO2018196171A1 (zh) | 远程查看方法及远程查看系统、终端 | |
WO2018171234A1 (zh) | 视频的处理方法及装置 | |
Ramos et al. | An integration of image processing solutions for social media listening | |
JP5801104B2 (ja) | Html文書に基づく短編動画作品の自動制作 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |