CN113011913A - 一种改进sae-bp的时间序列视频收益预测方法 - Google Patents
一种改进sae-bp的时间序列视频收益预测方法 Download PDFInfo
- Publication number
- CN113011913A CN113011913A CN202110188641.4A CN202110188641A CN113011913A CN 113011913 A CN113011913 A CN 113011913A CN 202110188641 A CN202110188641 A CN 202110188641A CN 113011913 A CN113011913 A CN 113011913A
- Authority
- CN
- China
- Prior art keywords
- sae
- video
- model
- layer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 238000010606 normalization Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims description 22
- 210000002569 neuron Anatomy 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000002354 daily effect Effects 0.000 claims description 4
- 238000013475 authorization Methods 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Library & Information Science (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
一种改进SAE‑BP的时间序列视频收益预测方法,该方法包括以下步骤:步骤1,获取用户基础数据;步骤2,对采集的用户基础数据进行归一化处理,获得数据矩阵;步骤3,训练稀疏自编码器模型;步骤4,训练基于SAE‑BP的视频收益预测模型;步骤5,对预训练的堆栈稀疏自编码器进行微调,以提高模型的精确性;步骤6,对预训练的SAE‑BP进行微调,以提高模型的精确性;步骤7,将训练获得的SAE‑BP模型嵌入平台系统中,并实际应用。本发明在系统平台采集数据的基础上,提出了一种改进SAE‑BP的时间序列视频收益预测方法。通过SAE算法可以自动提取数据的SAE特征,并将SAE的隐含层作为BP的输入层,对视频收益进行预测,提高了模型的准确率,有助于文创工作者判断自己作品的影响力。
Description
技术领域
本发明涉及视频收益预测领域,特别是涉及一种改进SAE-BP的时间序列视频收益预测方法。
背景技术
大数据技术起源于20世纪90年代,理论随着谷歌公开发表两篇论文《谷歌文件系统》和《基于集群的简单数据处理:MapReduce》成熟于2008年,之后此项技术广泛应用于商业、科技、医疗、政府、教育、经济、交通、物流及社会的各个领域。随着数据理论不断成熟,数据获取方式不断进步,数据研究工具不断完善,数据的分析工作由大型公司转为小型团队成为可能。
因而我们希望通过这个项目将科技的力量投放到文化创造中去。目前各流量平台(例如:抖音、快手、哔哩哔哩)上的文化创作者在面对大量观众与大量富有竞争力的其他文创工作者时,他们不得不选择那些自带流量的题材,并通过多样化呈现方式、艺术化表现手法等方式打造个性化的内容,来提高个体ip的辨识度。我们不难发现一个好的文创作品的工作量繁重,难度巨大。首先,文创工作者们为了选择一个合适的题材,他们不得不每日琢磨观众喜好并且还需发现并利用好当下热点素材的素质。其次,为了提高观众对文创工作者的内容接受度与满意度,文创工作者们不得不花费大量时间来“包装”内容,使之变得更加趣味性,让观众更容易接受。再者,当下流量平台大都有一套内容推送方式,而这种方式只会将易使观众接受的内容优先推送,从而让文创工作者面临着目标观众黏度低,内容收益不稳定的困境。尤其使随着个体文创工作者的大量涌入,必然会出现文创作品的内容相似度高,风格辨识度低,观众群体极不稳、个人IP难以被发掘等问题。
本发明通过定时爬虫对文创工作者的视频信息进行监控分析,并预测出未来几天的视频收益,有助于文创工作者判断自己作品的影响力。
发明内容
为解决上述问题,本发明系统平台采集数据的基础上,提出了一种改进SAE-BP的时间序列视频收益预测方法。通过训练稀疏自编码网络提取数据的SAE特征,并结合BP神经网络对视频收益进行预测分析,揭示各文创工作者在文创发展过程中存在的规律与特点。为达此目的,本发明提供一种改进SAE-BP的时间序列视频收益预测方法,具体步骤如下,其特征在于:
步骤1,获取用户基础数据:经授权允许后,系统平台采集用户的基本信息,以及往期用户每日发布的视频数量、粉丝涨幅数据、视频点赞量、视频收藏量和视频播放量;
步骤2,数据预处理:为了减少模型训练时间,对采集的用户基础数据进行归一化处理,获得数据矩阵;
步骤3,训练稀疏自编码器模型:将归一化处理后的数据矩阵作为输入数据,重构数据矩阵,并将稀疏自编码器第二层神经元的输出作为数据稀疏特征;
步骤4,训练基于SAE-BP的视频收益预测模型:将将稀疏自编码器第二层作为BP神经网络的输入层,训练BP神经网络;
步骤5,对预训练的SAE-BP进行微调,以提高模型的精确性;
步骤6,将训练获得的SAE-BP模型嵌入平台系统中,并实际应用;
步骤7,文创工作者输入b站账号并登陆成功后,可以通过图表的方式直观的看到未来几天上传作品的预期收益。
进一步,步骤2中数据预处理的过程可以表示为:
为了减少模型的训练时间,对步骤1中提取用户每日的视频更新量、粉丝量、视频点赞量、视频收藏量和视频播放量数据分别进行归一化处理,归一化处理后的特征值区间在[-1,1],归一化公式如下:
式中,x’是归一化处理后的特征矩阵,x是步骤1中提取的数据矩阵,xmax和xmin分别特征的最大值和最小值矩阵。
进一步,步骤3中训练稀疏自编码器模型如下:
首先设计三层稀疏自编码器模型,包括输入层、隐藏层和输出层,输入层和输出层的维度相同,输出层可将隐藏层输出的稀疏特征还原成数据矩阵,假设数据矩阵样本集为x’,则编码器网络运算公式为:
hi=f(W(1)x′+b(1)) (2)
hi是第二层隐藏层输出的稀疏特征,则解码器网络的运算公式为:
其中:W(1)和W(2)是网络模型权重,b(1)和b(2)是网络模型偏置,f()是网络的激活函数,本发明使用sigmoid函数作为激活函数。
进一步,步骤4中训练基于SAE-BP的视频收益预测模型的过程可以表示为:
将SAE隐藏层的输出hi作为BP神经网络输入对应的视频收益值yi作为BP神经网络的输出训练神经网络,bj,j=[0,1,…,l-1]是隐含层第j个神经元的输出,l是隐含层的节点个数,vij和wjk分别表示输入层第i个神经元节点到隐含层第j个节点权值和隐含层第j个神经元节点到输出层第k个节点权值,可得:
其中η为常数,是BP神经网络的学习率;通过式4和式5可算出误差反向传播后隐含层和输出层的权值,同理可得隐含层和输出层的阈值调整值;权值和阈值通过公式计算更新后进入新一轮的正向传播过程,满足条件后得到训练完成的BP神经网络,最终获得SAE-BP的视频收益预测模型。
本发明一种改进SAE-BP的时间序列视频收益预测方法,有益效果:本发明的技术效果在于:
1.本发明通过SAE算法提取数据矩阵的稀疏特征,可减少数据矩阵由异常波动带来的模型误差,并自动提取SAR图像特征;
2.本发明利用采集的用户时序数据预测了用户未来的视频收益,改进了SAE和BP网络模型,提高了模型的精确度;
3.本发明对用户视频收益进行预测分析,揭示各文创工作者在文创发展过程中存在的规律与特点。
附图说明
图1为本发明的流程图;
图2为本发明的系统登录界面图;
图3为本发明的系统视频收益分析图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提出了一种改进SAE-BP的时间序列视频收益预测方法,旨在提高多维力传感器在噪声环境下数据解耦的鲁棒性,同时提高数据解耦的稳定性和准确性。图1为本发明的流程图。下面结合流程图对本发明的步骤作详细介绍。
步骤1,获取用户基础数据:经授权允许后,系统平台采集用户的基本信息,以及往期用户每日发布的视频数量、粉丝涨幅数据、视频点赞量、视频收藏量和视频播放量;
步骤2,数据预处理:为了减少模型训练时间,对采集的用户基础数据进行归一化处理,获得数据矩阵;
步骤2中数据预处理的过程可以表示为:
为了减少模型的训练时间,对步骤1中提取用户每日的视频更新量、粉丝量、视频点赞量、视频收藏量和视频播放量数据分别进行归一化处理,归一化处理后的特征值区间在[-1,1],归一化公式如下:
式中,x’是归一化处理后的特征矩阵,x是步骤1中提取的数据矩阵,xmax和xmin分别特征的最大值和最小值矩阵。
步骤3,训练稀疏自编码器模型:将归一化处理后的数据矩阵作为输入数据,重构数据矩阵,并将稀疏自编码器第二层神经元的输出作为数据稀疏特征;
步骤3中训练稀疏自编码器模型如下:
首先设计三层稀疏自编码器模型,包括输入层、隐藏层和输出层,输入层和输出层的维度相同,输出层可将隐藏层输出的稀疏特征还原成数据矩阵,假设数据矩阵样本集为x’,则编码器网络运算公式为:
hi=f(W(1)x′+b(1)) (2)
hi是第二层隐藏层输出的稀疏特征,则解码器网络的运算公式为:
其中:W(1)和W(2)是网络模型权重,b(1)和b(2)是网络模型偏置,f()是网络的激活函数,本发明使用sigmoid函数作为激活函数。
步骤4,训练基于SAE-BP的视频收益预测模型:将将稀疏自编码器第二层作为BP神经网络的输入层,训练BP神经网络;
步骤4中训练基于SAE-BP的视频收益预测模型的过程可以表示为:
将SAE隐藏层的输出hi作为BP神经网络输入对应的视频收益值yi作为BP神经网络的输出训练神经网络,bj,j=[0,1,…,l-1]是隐含层第j个神经元的输出,l是隐含层的节点个数,vij和wjk分别表示输入层第i个神经元节点到隐含层第j个节点权值和隐含层第j个神经元节点到输出层第k个节点权值,可得:
其中η为常数,是BP神经网络的学习率;通过式4和式5可算出误差反向传播后隐含层和输出层的权值,同理可得隐含层和输出层的阈值调整值;权值和阈值通过公式计算更新后进入新一轮的正向传播过程,满足条件后得到训练完成的BP神经网络,最终获得SAE-BP的视频收益预测模型。
步骤5,对预训练的SAE-BP进行微调,以提高模型的精确性;
步骤6,将训练获得的SAE-BP模型嵌入平台系统中,并实际应用;
步骤7,文创工作者输入b站账号并登陆成功后如图2所示,可以通过图表的方式直观的看到未来几天上传作品的预期收益如图3所示。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (4)
1.一种改进SAE-BP的时间序列视频收益预测方法,具体步骤如下,其特征在于:
步骤1,获取用户基础数据:经授权允许后,系统平台采集用户的基本信息,以及往期用户每日发布的视频数量、粉丝涨幅数据、视频点赞量、视频收藏量和视频播放量;
步骤2,数据预处理:为了减少模型训练时间,对采集的用户基础数据进行归一化处理,获得数据矩阵;
步骤3,训练稀疏自编码器模型:将归一化处理后的数据矩阵作为输入数据,重构数据矩阵,并将稀疏自编码器第二层神经元的输出作为数据稀疏特征;
步骤4,训练基于SAE-BP的视频收益预测模型:将将稀疏自编码器第二层作为BP神经网络的输入层,训练BP神经网络;
步骤5,对预训练的SAE-BP进行微调,以提高模型的精确性;
步骤6,将训练获得的SAE-BP模型嵌入平台系统中,并实际应用;
步骤7,文创工作者输入b站账号并登陆成功后,可以通过图表的方式直观的看到未来几天上传作品的预期收益。
4.根据权利要求1所述的一种改进SAE-BP的时间序列视频收益预测方法,其特征在于:步骤4中训练基于SAE-BP的视频收益预测模型的过程可以表示为:
将SAE隐藏层的输出hi作为BP神经网络输入对应的视频收益值yi作为BP神经网络的输出训练神经网络,bj,j=[0,1,…,l-1]是隐含层第j个神经元的输出,l是隐含层的节点个数,vij和wjk分别表示输入层第i个神经元节点到隐含层第j个节点权值和隐含层第j个神经元节点到输出层第k个节点权值,可得:
其中η为常数,是BP神经网络的学习率;通过式4和式5可算出误差反向传播后隐含层和输出层的权值,同理可得隐含层和输出层的阈值调整值;权值和阈值通过公式计算更新后进入新一轮的正向传播过程,满足条件后得到训练完成的BP神经网络,最终获得SAE-BP的视频收益预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110188641.4A CN113011913A (zh) | 2021-02-19 | 2021-02-19 | 一种改进sae-bp的时间序列视频收益预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110188641.4A CN113011913A (zh) | 2021-02-19 | 2021-02-19 | 一种改进sae-bp的时间序列视频收益预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113011913A true CN113011913A (zh) | 2021-06-22 |
Family
ID=76402903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110188641.4A Pending CN113011913A (zh) | 2021-02-19 | 2021-02-19 | 一种改进sae-bp的时间序列视频收益预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011913A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110561191A (zh) * | 2019-07-30 | 2019-12-13 | 西安电子科技大学 | 基于pca与自编码器的数控机床刀具磨损数据处理方法 |
CN111814878A (zh) * | 2020-07-09 | 2020-10-23 | 仲恺农业工程学院 | 基于ssda-helm-softmax的农业投入品实时分类预测方法 |
CN111950465A (zh) * | 2020-08-13 | 2020-11-17 | 金陵科技学院 | 基于sae-cnn的sar图像洪水检测和预防方法 |
-
2021
- 2021-02-19 CN CN202110188641.4A patent/CN113011913A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110561191A (zh) * | 2019-07-30 | 2019-12-13 | 西安电子科技大学 | 基于pca与自编码器的数控机床刀具磨损数据处理方法 |
CN111814878A (zh) * | 2020-07-09 | 2020-10-23 | 仲恺农业工程学院 | 基于ssda-helm-softmax的农业投入品实时分类预测方法 |
CN111950465A (zh) * | 2020-08-13 | 2020-11-17 | 金陵科技学院 | 基于sae-cnn的sar图像洪水检测和预防方法 |
Non-Patent Citations (1)
Title |
---|
陈艳 等: "基于稀疏自编码器的金融市场指数预测模型", 数理统计与管理, vol. 40, no. 1, pages 93 - 104 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luo et al. | Audio Sentiment Analysis by Heterogeneous Signal Features Learned from Utterance-Based Parallel Neural Network. | |
CN111414461B (zh) | 一种融合知识库与用户建模的智能问答方法及系统 | |
KR102601848B1 (ko) | 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치 | |
CN111274398B (zh) | 一种方面级用户产品评论情感分析方法及系统 | |
CN108549658B (zh) | 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统 | |
CN110222163A (zh) | 一种融合cnn与双向lstm的智能问答方法及系统 | |
CN108170848B (zh) | 一种面向中国移动智能客服的对话场景分类方法 | |
CN111563770A (zh) | 一种基于特征差异化学习的点击率预估方法 | |
CA2486128A1 (en) | System and method for using meta-data dependent language modeling for automatic speech recognition | |
KR20200010672A (ko) | 딥러닝을 이용한 스마트 상품 검색 방법 및 시스템 | |
CN110619540A (zh) | 一种神经网络的点击流预估方法 | |
CN117094291B (zh) | 基于智能写作的自动新闻生成系统 | |
CN114693397A (zh) | 一种基于注意力神经网络的多视角多模态商品推荐方法 | |
CN115393933A (zh) | 一种基于帧注意力机制的视频人脸情绪识别方法 | |
Fan et al. | Soundscape emotion recognition via deep learning | |
Hagiwara | Aves: Animal vocalization encoder based on self-supervision | |
CN109740012A (zh) | 基于深度神经网络对图像语义进行理解和问答的方法 | |
Zhao et al. | Transferring age and gender attributes for dimensional emotion prediction from big speech data using hierarchical deep learning | |
CN105678340A (zh) | 一种基于增强型栈式自动编码器的自动图像标注方法 | |
CN117668262A (zh) | 基于人工智能语音与图像识别技术的声像档案利用系统 | |
CN110363074B (zh) | 一种针对复杂抽象化事物的类人化识别交互方法 | |
CN117312982A (zh) | 一种基于大模型进行人机对话过程中真人检测的方法 | |
CN113011913A (zh) | 一种改进sae-bp的时间序列视频收益预测方法 | |
CN111125539A (zh) | 一种基于人工智能的cdn有害信息阻断方法及系统 | |
CN108520740B (zh) | 基于多种特征的音频内容一致性分析方法和分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210622 |
|
RJ01 | Rejection of invention patent application after publication |