CN114548523B - 用户观影信息预测方法、装置、设备及存储介质 - Google Patents
用户观影信息预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114548523B CN114548523B CN202210096163.9A CN202210096163A CN114548523B CN 114548523 B CN114548523 B CN 114548523B CN 202210096163 A CN202210096163 A CN 202210096163A CN 114548523 B CN114548523 B CN 114548523B
- Authority
- CN
- China
- Prior art keywords
- preset
- viewing
- user
- days
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000011156 evaluation Methods 0.000 claims abstract description 96
- 238000013528 artificial neural network Methods 0.000 claims abstract description 86
- 238000012549 training Methods 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 19
- 230000006399 behavior Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- 230000003203 everyday effect Effects 0.000 abstract description 6
- 230000014759 maintenance of location Effects 0.000 abstract description 6
- 230000004913 activation Effects 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000000007 visual effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了用户观影信息预测方法、装置、设备及存储介质,该方法包括:获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子;根据获取的维度值和权重因子,确定预设天数中不同时间段对应的观评价指标;将不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到预设天数对应的观影得分;根据观影得分预测用户的观影概率和流失概率。本发明可以通过用户观影概率准确的体现用户流失概率,然后基于用户流失概率对不同的用户群体进行精准分类,有利于通过细化和针对性的营销策略,为用户留存和促活提供指导和依据。
Description
技术领域
本发明涉及数据分析和机器学习技术领域,尤其涉及一种用户观影信息预测方法、装置、设备及存储介质。
背景技术
用户是互联网企业的立业之本,如何留存和促活用户对互联网运营具有极其重要的价值和意义。用户留存就是避免用户流失,用户留存是指从正向角度让用户留下来,避免用户流失。用户促活是指促进用户的活跃度,是互联网做好一定的稳定性,是用户留存后所必不可少的一项步骤。
为了避免用户流失,运营人员通常需要对用户群体进行分群和分类,并基于分类结果制定相应的用户维护和运营策略以实现用户留存和促活。目前主要采用运营人员主观判断的手段对用户群体进行分类,掺杂了人为感情,导致用户群体分类的准确性不高。
发明内容
本发明实施例通过提供一种用户观影信息预测方法、装置、设备及存储介质,旨在解决采用运营人员主观判断的手段对用户群体进行分类,导致用户群体分类的准确性不高的技术问题。
本发明实施例提供了一种用户观影信息预测方法,所述用户观影信息预测方法包括:
获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子;
根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标;
将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;以及,
根据所述观影得分预测用户的观影概率和流失概率。
在一实施例中,所述确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子的步骤包括:
获取所述维度值对应的观影天数以及所述观影天数对应的观影日期;
根据所述观影天数确定预设时间衰减权重因子;以及,
根据所述观影日期确定预设节假日权重因子。
在一实施例中,所述根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标的步骤包括:
根据所述预设时间衰减权重因子与不同时间段内的所述观影天数确定不同时间段对应的时间权重值;
根据所述预设节假日权重因子与不同时间段内的所述观影日期确定不同时间段对应的节假日权重值;
对所述时间权重值、所述节假日权重值以及所述维度值进行加权运算得到不同时间段对应的观影评价指标。
在一实施例中,所述将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分的步骤包括:
采用所述全连接神经网络的隐含层对不同时间段对应的观影评价指标进行加权运算,得到所述隐含层输出的第一运算结果;
采用所述全连接神经网络的输出层对所述第一运算结果进加权运算,以得到所述输出层输出的第二运算结果;
根据所述第二运算结果确定所述观影得分。
在一实施例中,所述全连接神经网络的训练过程包括:
获取标注有标签的训练样本集,并根据所述训练样本集确定待训练神经网络;
采用所述训练样本集对所述待训练神经网络进行迭代训练;
在所述待训练神经网络的网络模型的损失函数小于或者等于预设损失阈值时,停止所述待训练神经网络的训练,并将停止训练的所述待训练神经网络保存为所述全连接神经网络。
在一实施例中,所述根据所述训练样本集确定待训练神经网络的步骤包括:
获取训练样本集中训练样本的第一数量;
根据所述第一数量确定所述待训练神经网络的输入层节点的第一个数和隐藏层节点的第二个数;
根据所述标签的第二数量确定所述待训练神经网络的输出层节点的第三个数;
根据第一个数的所述输入层节点、第二个数的所述隐藏层节点和第三个数的所述输出层节点构建所述待训练神经网络。
在一实施例中,所述根据所述观影得分预测用户的观影概率和流失概率的步骤包括:
采用预设损失函数对所述观影得分进行回归,得到所述用户的观影概率和流失概率。
此外,为实现上述目的,本发明还提供了一种用户观影信息预测装置,所述用户观影信息预测装置包括:
第一获取模块,用于获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子;
第二获取模块,用于根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标;
数据处理模块,用于将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;
数据预测模块,用于根据所述观影得分预测用户的观影概率和流失概率。
此外,为实现上述目的,本发明还提供了一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户观影信息预测程序,所述用户观影信息预测程序被所述处理器执行时实现上述的用户观影信息预测方法的步骤。
此外,为实现上述目的,本发明还提供了一种存储介质,其上存储有用户观影信息预测程序,所述用户观影信息预测程序被处理器执行时实现上述的用户观影信息预测方法的步骤。
本发明实施例中提供的一种用户观影信息预测方法、装置、设备及存储介质的技术方案,至少具有如下技术效果或优点:
本发明通过采用获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子,根据获取的维度值以及预设时间衰减权重因子和预设节假日权重因子,确定预设天数中不同时间段对应的观影评价指标,将不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到预设天数对应的观影得分,根据观影得分预测用户的观影概率,以及通过用户的观影概率准确的体现用户的流失概率,然后基于用户的流失概率对不同的用户群体进行精准分类,有利于通过细化和针对性的营销策略,为用户留存和促活提供指导和依据,解决采用运营人员主观判断的手段对用户群体进行分类,导致用户群体分类的准确性不高的技术问题。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
图2为本发明用户观影信息预测方法的一实施例的流程示意图;
图3为全连接神经网络的网络结构示意图;
图4为本发明用户观影信息预测装置的功能模块图。
具体实施方式
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,图1为本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图1即可为终端设备的硬件运行环境的结构示意图。
如图1所示,该终端设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端设备结构并不构成对终端设备限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及用户观影信息预测程序。其中,操作系统是管理和控制终端设备硬件和软件资源的程序,用户观影信息预测程序以及其它软件或程序的运行。
在图1所示的终端设备中,用户接口1003主要用于连接终端,与终端进行数据通信;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的用户观影信息预测程序。
在本实施例中,终端设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器上运行的用户观影信息预测程序,其中:
处理器1001调用存储器1005中存储的用户观影信息预测程序时,执行以下操作:
获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子;
根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标;
将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;以及,
根据所述观影得分预测用户的观影概率和流失概率。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
获取所述维度值对应的观影天数以及所述观影天数对应的观影日期;
根据所述观影天数确定预设时间衰减权重因子;以及,
根据所述观影日期确定预设节假日权重因子。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
根据所述预设时间衰减权重因子与不同时间段内的所述观影天数确定不同时间段对应的时间权重值;
根据所述预设节假日权重因子与不同时间段内的所述观影日期确定不同时间段对应的节假日权重值;
对所述时间权重值、所述节假日权重值以及所述维度值进行加权运算得到不同时间段对应的观影评价指标。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
采用所述全连接神经网络的隐含层对不同时间段对应的观影评价指标进行加权运算,得到所述隐含层输出的第一运算结果;
采用所述全连接神经网络的输出层对所述第一运算结果进加权运算,以得到所述输出层输出的第二运算结果;
根据所述第二运算结果确定所述观影得分。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
获取标注有标签的训练样本集,并根据所述训练样本集确定待训练神经网络;
采用所述训练样本集对所述待训练神经网络进行迭代训练;
在所述待训练神经网络的网络模型的损失函数小于或者等于预设损失阈值时,停止所述待训练神经网络的训练,并将停止训练的所述待训练神经网络保存为所述全连接神经网络。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
获取训练样本集中训练样本的第一数量;
根据所述第一数量确定所述待训练神经网络的输入层节点的第一个数和隐藏层节点的第二个数;
根据所述标签的第二数量确定所述待训练神经网络的输出层节点的第三个数;
根据第一个数的所述输入层节点、第二个数的所述隐藏层节点和第三个数的所述输出层节点构建所述待训练神经网络。
处理器1001调用存储器1005中存储的用户观影信息预测程序时,还执行以下操作:
采用预设损失函数对所述观影得分进行回归,得到所述用户的观影概率和流失概率。
本发明实施例提供了用户观影信息预测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图2所示,在本发明的第一实施例中,本发明的用户观影信息预测方法,包括以下步骤:
步骤S210:获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子。
本实施例中,预设天数是根据实际需求设置的用户过去连续观影的天数,例如预设天数设置为以当前时间开始往前推算的N天时间,也可以称为近N天。预设用户观影评价维度是衡量用户观影情况的指标,预设用户观影评价维度也可以理解为观影行为指标,可以是一个,也可以是多个,例如,预设用户观影评价维度包括开启影视终端(如电视机)的次数、观影次数、观影时长等。维度值是指预设用户观影评价维度的具体数据,维度值可以通过用户的历史观影行为数据中获取得到。例如,预设用户观影评价维度是观影时长,过去某天的具体数据是2小时,所述观影时长的维度值为2小时。
具体的,获取预设天数内每天的预设用户观影评价维度对应的维度值,可以理解为通过用户的历史观影行为数据中获取近N天内每天的预设用户观影评价维度对应的维度值。如,预设用户观影评价维度是观影时长,N=5,近5天的历史观影统计数中由当前到之前算起,当前时间是X年10月10日,10月9日的观影时长是2小时,10月8日的观影时长是1小时,10月7日的观影时长是2.5小时,10月6日的观影时长是0.5小时,10月5日的观影时长是3小时,那么近5天内每天的观影时长分别是2小时、1小时、2.5小时、0.5小时、3小时。
获取预设天数内每天的预设用户观影评价维度对应的维度值之后,确定预设用户观影评价维度对应的预设权重因子,预设权重因子包括预设时间衰减权重因子和预设节假日权重因子,预设权重因子通过机器学习的方法经过迭代训练得到。研究发现,近1天的预设用户观影评价维度比近N天的预设用户观影评价维度对用户未来的观影评估影响更大,即用户过去(历史)每天的观影行为指标具有时间衰减的权重,因此结合用户过去观影时间距离当前时间的时间间隔,选择线性衰减的权重因子作为预设用户观影评价维度对应的一个预设权重因子,所述线性衰减的权重因子是根据用户过去观影时间距离当前时间的时间间隔确定的,所以线性衰减的权重因子称为预设时间衰减权重因子,表示为ω,ω为浮点型数值。
另外,研究发现节假日也是影响观影行为指标的重要因素,通常用户在节假日的观影行为是比工作日频繁的,因此根据节假日设置了节假日的权重因子,节假日的权重因子称为预设节假日权重因子,表示α。
具体的,确定预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子包括获取维度值对应的观影天数以及所述观影天数对应的观影日期,然后根据所述观影天数确定预设时间衰减权重因子,以及根据所述观影日期确定预设节假日权重因子。例如,预设用户观影评价维度是观影时长,观影时长为2小时,则确定的预设时间衰减权重因子为ω,观影时长为2小时对应的观影天数当天观影日期是X年10月9日,是星期六,确定预设节假日权重因子为α。
步骤S220:根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标。
本实施例中,预先将预设天数划分为了不同的时间段,每一时间段对应用户在该时间段内的观影评价指标,所述观影评价指标通过权重值进行表示。假设,预设天数设置为了近N天,不同的时间段分别是近1天、近2天、...、近3天。具体的,根据预设用户观影评价维度对应的预设时间衰减权重因子、预设节假日权重因子以及预设天数内每天的预设用户观影评价维度对应的维度值,计算出各个时间段对应的观影评价权重,将各个时间段对应的观影评价权重作为各个时间段内用户的观影评价指标。
具体的,步骤S220包括:
根据所述预设时间衰减权重因子与不同时间段内的所述观影天数确定不同时间段对应的时间权重值;
根据所述预设节假日权重因子与不同时间段内的所述观影日期确定不同时间段对应的节假日权重值;
对所述时间权重值、所述节假日权重值以及所述维度值进行加权运算得到不同时间段对应的观影评价指标。
对于预设天数中每一时间段对应的观影评价指标由每一时间段对应的时间权重值、节假日权重值和维度值确定。对于每一时间段中每天的时间权重值为ωt1+b,ωt2+b,...,ωtn+b,tn表示天数,t1=2时表示2天。例如,预设天数中近1天对应的每天的时间权重值为ω+b,预设天数中近2天对应的每天的时间权重值为ω+b,2ω+b。对于每一时间段中每天的节假日权重值为αf(t1),αf(t2),...,αf(tn),f(tn)表示节假日判断函数。不同时间段对应的观影评价指标采用观影评价权重公式计算得到,观影评价权重公式为:
其中,X表示观影评价指标(观影评价权重),xi表示维度值。例如,预设天数为距离当前的过去3天,过去3天的观影时长分别是1小时、2小时和3小时,第一时间段是近1天,近1天的对应的观影评价指标为αf(t1)(ω+b),近2天的对应的观影评价指标为αf(t1)(ω+b)+αf(t2)(2ω+b),近3天的对应的观影评价指标为αf(t1)(ω+b)+αf(t2)(2ω+b)+αf(t3)(3ω+b)。
步骤S230:将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分。
本实施例中,全连接神经网络是预先训练好的,全连接神经网络的最终输出结果为一个,将不同时间段对应的观影评价指标作为全连接神经网络的输入,也就是将多个观影评价指标一起输入全连接神经网络,全连接神经网络处理后输出预设天数对应的用户的观影得分,然后通过得到的观影得分确定用户流失概率。
具体的,步骤S230包括:
采用所述全连接神经网络的隐含层对不同时间段对应的观影评价指标进行加权运算,得到所述隐含层输出的第一运算结果;
采用所述全连接神经网络的输出层对所述第一运算结果进加权运算,以得到所述输出层输出的第二运算结果;
根据所述第二运算结果确定所述观影得分。
由于预设天数被划分为了多个时间段,通过步骤S220可以得到各个时间段对应的观影评价指标,也就是全连接神经网络的输入层对各个时间段内每天预设用户观影评价维度对应的维度值进行处理后,得到多个观影评价指标,然后采用全连接神经网络的隐含层对多个观影评价指标进行加权运算,隐含层输出第一运算结果。进而,全连接神经网络的输出层对第一运算结果进加权运算,输出层输出第二运算结果,第二运算结果就是所述观影得分。其中,多个观影评价指标分别为X1、X2、...、Xn,X1、X2、...、Xn对应每个节点的输入,共n个输入层节点。隐藏层节点的数量为2n,对应每个隐藏层节点的输出为H1、H2、...、Hn、...、H2n,即第一运算结果为H1、H2、...、Hn、...、H2n。以H1为例,输入节点与其对应的权重依次表示为:ω11、ω21、...、ωn1,那么H1为:H1、H2、...、Hn、...、H2n的计算方式与H1的计算方式同理。输出层包括一个输出层节点,即第二运算结果为一个。其中,隐藏层节点与其对应的权重依次表示为:α11、α21、...、αm1、...、α2m1,输出层的输出结果即第二运算结果为:/>
步骤S240:根据所述观影得分预测用户的观影概率和流失概率。
根据所述观影得分预测用户的观影概率和流失概率具体是采用预设损失函数对观影得分进行回归,得到用户的观影概率和流失概率。其中,全连接神经网络输出的观影得分是较大的数值,不容易反映用户未来观影的情况,通过预设损失函数(如Softmax())对观影得分进行归一化以将观影得分映射到[0,1]的区间上,得到变换结果,变换结果是介于0-1之间的小数值,通过变换结果可以反映每位用户未来的观影概率,进而通过用户的观影概率体现用户的流失概率,即观影概率=流失概率,观影概率越大,用户未来的观影几率越大,表示用户未来的流失情况越小,反之,观影概率越小,用户未来的观影几率越小,表示用户未来的流失情况越大。
本实施例根据上述技术方案,通过引入线性衰减的权重因子和节假日的权重因子可以全面的对用户过去的观影行为指标进行分析,得到准确的不同时间段对应的观影评价指标,从而基于全连接神经网络预测出准确的用户的观影概率和流失概率,然后根据用户流失概率对不同的用户群体进行精准分类,有利于通过细化和针对性的营销策略,为用户留存和促活提供指导和依据。
如图3所示,全连接神经网络的训练过程包括:
获取标注有标签的训练样本集,并根据训练样本集确定待训练神经网络;
采用训练样本集对待训练神经网络进行迭代训练;
在待训练神经网络的网络模型的损失函数小于或者等于预设损失阈值时,停止待训练神经网络的训练,并将停止训练的待训练神经网络保存为全连接神经网络。
具体的,全连接神经网络包括输入层、隐藏层和输出层,全连接神经网络通过对待训练神经网络训练得到。训练样本集具有若干个,每个训练样本集包括不同时间段对应的训练样本,训练样本是预设用户观影评价维度对应的维度值,每个训练样本集标注有标签,标签为对比结果。根据训练样本确定待训练神经网络的步骤包括:获取训练样本集中训练样本的第一数量,然后根据第一数量确定待训练神经网络的输入层节点的第一个数和隐藏层节点的第二个数,其中,可以设置隐藏层节点的第二个数为输入层节点的第一个数的2倍。例如,每个训练样本集中包括n个训练样本,那么输入层节点为n个,隐藏层节点为2n个。根据标签的第二数量确定待训练神经网络的输出层节点的第三个数,其中,每个训练样本集上的标签是一个,即全连接神经网络的最终输出结果为1个,即输出层节点为1个。然后根据第一个数的输入层节点、第二个数的隐藏层节点和第三个数的输出层节点构建待训练神经网络,即待训练神经网络的输入层节点为n个,隐藏层节点为2n个,输出层节点为1个,n个输入层节点形成输入层,n个隐藏层节点形成隐藏层,1个输出层节点形成输出层,输入层与隐藏层连接,隐藏层与输出层连接,从而构建成待训练神经网络。
构建成待训练神经网络之后,使用多个训练样本集对待训练神经网络进行迭代训练,每一次训练之后,确定待训练神经网络的网络模型的损失函数,然后比较网络模型损失与预设损失阈值,如果网络模型的损失函数大于预设损失阈值,表示训练后的待训练神经网络的输出结果误差较大,需要继续进行训练;如果网络模型损失小于或者等于预设损失阈值,表示训练后的待训练神经网络的输出结果误差较小,符合实际需要,进而停止对待训练神经网络进行训练,然后将停止训练的待训练神经网络保存为全连接神经网络。构建的全连接神经网络的网络结构如图3所示,图3中的A表示输入层,B表示隐藏层、C表示输出层。
如图4所示,本发明提供的一种用户观影信息预测装置,所述用户观影信息预测装置包括:
第一获取模块310,用于获取预设天数内每天的预设用户观影评价维度对应的维度值,并确定所述预设用户观影评价维度对应的预设时间衰减权重因子和预设节假日权重因子;
第二获取模块320,用于根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标;
数据处理模块330,用于将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;
数据预测模块340,用于根据所述观影得分预测用户的观影概率和流失概率。
本发明用户观影信息预测装置具体实施方式与上述用户观影信息预测方法各实施例基本相同,在此不再赘述。
进一步的,本发明还提供了一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户观影信息预测程序,所述用户观影信息预测程序被所述处理器执行时实现上述的用户观影信息预测方法的步骤。
进一步的,本发明还提供了一种存储介质,其上存储有用户观影信息预测程序,所述用户观影信息预测程序被处理器执行时实现上述的用户观影信息预测方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种用户观影信息预测方法,其特征在于,所述用户观影信息预测方法包括:
获取预设天数内每天的预设用户观影评价维度对应的维度值,所述预设用户观影评价维度是衡量用户观影行为的指标,其中,预设天数是根据实际需求设置的用户过去连续观影的天数;
并确定所述预设用户观影评价维度对应的预设时间衰减权重因子ω和预设节假日权重因子α,包括:
获取所述维度值对应的观影天数以及所述观影天数对应的观影日期;
根据所述观影天数确定所述预设时间衰减权重因子;以及,
根据所述观影日期确定所述预设节假日权重因子;
所述预设时间衰减权重因子是线性衰减的权重因子,是根据用户过去观影时间距离当前时间的时间间隔确定的;
根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标,包括:
根据所述预设时间衰减权重因子与不同时间段内的所述观影天数确定不同时间段对应的时间权重值ωti+b,其中ti表示天数;
根据所述预设节假日权重因子与不同时间段内的所述观影日期确定不同时间段对应的节假日权重值αf(ti),其中f(ti)表示节假日判断函数;
对所述时间权重值、所述节假日权重值以及所述维度值进行加权运算得到不同时间段对应的观影评价指标,观影评价权重公式为:
;
其中,X为所述观影评价指标,xi为所述维度值,预设天数为近N天,划分为所述不同时间段;
将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;以及,
根据所述观影得分预测用户的观影概率和流失概率。
2.如权利要求1所述的方法,其特征在于,所述将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分的步骤包括:
采用所述全连接神经网络的隐含层对不同时间段对应的观影评价指标进行加权运算,得到所述隐含层输出的第一运算结果;
采用所述全连接神经网络的输出层对所述第一运算结果进加权运算,以得到所述输出层输出的第二运算结果;
根据所述第二运算结果确定所述观影得分。
3.如权利要求1所述的方法,其特征在于,所述全连接神经网络的训练过程包括:
获取标注有标签的训练样本集,并根据所述训练样本集确定待训练神经网络;
采用所述训练样本集对所述待训练神经网络进行迭代训练;
在所述待训练神经网络的网络模型的损失函数小于或者等于预设损失阈值时,停止所述待训练神经网络的训练,并将停止训练的所述待训练神经网络保存为所述全连接神经网络。
4.如权利要求3所述的方法,其特征在于,所述根据所述训练样本集确定待训练神经网络的步骤包括:
获取训练样本集中训练样本的第一数量;
根据所述第一数量确定所述待训练神经网络的输入层节点的第一个数和隐藏层节点的第二个数;
根据所述标签的第二数量确定所述待训练神经网络的输出层节点的第三个数;
根据第一个数的所述输入层节点、第二个数的所述隐藏层节点和第三个数的所述输出层节点构建所述待训练神经网络。
5.如权利要求1所述的方法,其特征在于,所述根据所述观影得分预测用户的观影概率和流失概率的步骤包括:
采用预设损失函数对所述观影得分进行回归,得到所述用户的观影概率和流失概率。
6.一种用户观影信息预测装置,其特征在于,所述用户观影信息预测装置包括:
第一获取模块,用于获取预设天数内每天的预设用户观影评价维度对应的维度值,所述预设用户观影评价维度是衡量用户观影行为的指标,其中,预设天数是根据实际需求设置的用户过去连续观影的天数;并确定所述预设用户观影评价维度对应的预设时间衰减权重因子ω和预设节假日权重因子α,包括:获取所述维度值对应的观影天数以及所述观影天数对应的观影日期;根据所述观影天数确定所述预设时间衰减权重因子;以及,根据所述观影日期确定所述预设节假日权重因子;所述预设时间衰减权重因子是线性衰减的权重因子,是根据用户过去观影时间距离当前时间的时间间隔确定的;
第二获取模块,用于根据获取的所述维度值、所述预设时间衰减权重因子和所述预设节假日权重因子,确定所述预设天数中不同时间段对应的观影评价指标,包括:根据所述预设时间衰减权重因子与不同时间段内的所述观影天数确定不同时间段对应的时间权重值ωti+b,其中ti表示天数;根据所述预设节假日权重因子与不同时间段内的所述观影日期确定不同时间段对应的节假日权重值αf(ti),其中f(ti)表示节假日判断函数;对所述时间权重值、所述节假日权重值以及所述维度值进行加权运算得到不同时间段对应的观影评价指标,观影评价权重公式为:
;
其中,X为所述观影评价指标,xi为所述维度值,预设天数为近N天,划分为所述不同时间段;
数据处理模块,用于将所述不同时间段对应的观影评价指标输入预先训练的全连接神经网络,得到所述预设天数对应的观影得分;
数据预测模块,用于根据所述观影得分预测用户的观影概率和流失概率。
7.一种终端设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户观影信息预测程序,所述用户观影信息预测程序被所述处理器执行时实现如权利要求1-5中任一项所述的用户观影信息预测方法的步骤。
8.一种存储介质,其特征在于,其上存储有用户观影信息预测程序,所述用户观影信息预测程序被处理器执行时实现权利要求1-5中任一项所述的用户观影信息预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210096163.9A CN114548523B (zh) | 2022-01-26 | 2022-01-26 | 用户观影信息预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210096163.9A CN114548523B (zh) | 2022-01-26 | 2022-01-26 | 用户观影信息预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114548523A CN114548523A (zh) | 2022-05-27 |
CN114548523B true CN114548523B (zh) | 2023-11-07 |
Family
ID=81674518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210096163.9A Active CN114548523B (zh) | 2022-01-26 | 2022-01-26 | 用户观影信息预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114548523B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944738A (zh) * | 2017-12-07 | 2018-04-20 | 税友软件集团股份有限公司 | 一种税务信用积分计算方法及装置 |
CN108717442A (zh) * | 2018-05-16 | 2018-10-30 | 成都市极米科技有限公司 | 基于机器学习的相似影视推荐方法 |
CN110502635A (zh) * | 2019-08-13 | 2019-11-26 | 北京创鑫旅程网络技术有限公司 | 信息质量评价方法及装置 |
US10635973B1 (en) * | 2016-06-28 | 2020-04-28 | Amazon Technologies, Inc. | Recommendation system using improved neural network |
CN111242602A (zh) * | 2020-01-19 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 支付设备的控制方法、装置、计算机可读存储介质和设备 |
CN112862546A (zh) * | 2021-04-25 | 2021-05-28 | 平安科技(深圳)有限公司 | 用户流失预测方法、装置、计算机设备及存储介质 |
CN113034264A (zh) * | 2020-09-04 | 2021-06-25 | 深圳大学 | 客户流失预警模型的建立方法、装置、终端设备及介质 |
CN113420887A (zh) * | 2021-06-22 | 2021-09-21 | 平安资产管理有限责任公司 | 预测模型构建方法、装置、计算机设备及可读存储介质 |
CN113827977A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种基于bp神经网络的游戏流失用户预测方法和系统 |
-
2022
- 2022-01-26 CN CN202210096163.9A patent/CN114548523B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10635973B1 (en) * | 2016-06-28 | 2020-04-28 | Amazon Technologies, Inc. | Recommendation system using improved neural network |
CN107944738A (zh) * | 2017-12-07 | 2018-04-20 | 税友软件集团股份有限公司 | 一种税务信用积分计算方法及装置 |
CN108717442A (zh) * | 2018-05-16 | 2018-10-30 | 成都市极米科技有限公司 | 基于机器学习的相似影视推荐方法 |
CN110502635A (zh) * | 2019-08-13 | 2019-11-26 | 北京创鑫旅程网络技术有限公司 | 信息质量评价方法及装置 |
CN111242602A (zh) * | 2020-01-19 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 支付设备的控制方法、装置、计算机可读存储介质和设备 |
CN113034264A (zh) * | 2020-09-04 | 2021-06-25 | 深圳大学 | 客户流失预警模型的建立方法、装置、终端设备及介质 |
CN112862546A (zh) * | 2021-04-25 | 2021-05-28 | 平安科技(深圳)有限公司 | 用户流失预测方法、装置、计算机设备及存储介质 |
CN113420887A (zh) * | 2021-06-22 | 2021-09-21 | 平安资产管理有限责任公司 | 预测模型构建方法、装置、计算机设备及可读存储介质 |
CN113827977A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种基于bp神经网络的游戏流失用户预测方法和系统 |
Non-Patent Citations (1)
Title |
---|
基于聚合支付平台交易数据的商户流失预测;徐一文;黎潇阳;董启文;钱卫宁;周昉;;华东师范大学学报(自然科学版)(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114548523A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111602148B (zh) | 正则化神经网络架构搜索 | |
US11645319B1 (en) | Systems and methods for identifying issues in electronic documents | |
US11734566B2 (en) | Systems and processes for bias removal in a predictive performance model | |
CN109740048B (zh) | 一种课程推荐方法及装置 | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
US20150161566A1 (en) | Workforce planning and analytics | |
CN110971659A (zh) | 推荐消息的推送方法、装置及存储介质 | |
CN111382248B (zh) | 一种问题回复方法、装置、存储介质及终端设备 | |
CN113656687B (zh) | 基于教研数据的教师画像构建方法 | |
CN111814056A (zh) | 基于信息处理的供应商推荐方法及相关设备 | |
CN105164672A (zh) | 内容分类 | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN110263136B (zh) | 基于强化学习模型向用户推送对象的方法和装置 | |
CN113424207B (zh) | 高效地训练可理解模型的系统和方法 | |
CN114548523B (zh) | 用户观影信息预测方法、装置、设备及存储介质 | |
JP2019164738A (ja) | 予測装置、予測方法、予測プログラム、生成装置、生成方法及び生成プログラム | |
CN117151794A (zh) | 一种广告任务推荐方法及相关装置 | |
CN109816120B (zh) | 机房运维管理方法、电子装置及存储介质 | |
CN111652282A (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
US20230401591A1 (en) | Anomaly detection systems and methods | |
CN115292167A (zh) | 生命周期预测模型构建方法、装置、设备及可读存储介质 | |
CN109800942B (zh) | 机房运维管理方法、电子装置及存储介质 | |
CN113837220A (zh) | 基于在线持续学习的机器人目标识别方法、系统及设备 | |
CN113743615A (zh) | 简化机器学习的特征移除框架 | |
Demchenko et al. | Data Scientist Professional Revisited: Competences Definition and Assessment, Curriculum and Education Path Design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |