CN114969436A - 一种视频热度预测方法及装置、存储介质及电子设备 - Google Patents

一种视频热度预测方法及装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114969436A
CN114969436A CN202210615382.3A CN202210615382A CN114969436A CN 114969436 A CN114969436 A CN 114969436A CN 202210615382 A CN202210615382 A CN 202210615382A CN 114969436 A CN114969436 A CN 114969436A
Authority
CN
China
Prior art keywords
video
new online
video data
data samples
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210615382.3A
Other languages
English (en)
Inventor
周杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan MgtvCom Interactive Entertainment Media Co Ltd
Original Assignee
Hunan MgtvCom Interactive Entertainment Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan MgtvCom Interactive Entertainment Media Co Ltd filed Critical Hunan MgtvCom Interactive Entertainment Media Co Ltd
Priority to CN202210615382.3A priority Critical patent/CN114969436A/zh
Publication of CN114969436A publication Critical patent/CN114969436A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种视频热度预测方法及装置、存储介质及电子设备,该方法通过预先构建随机森林模型,随机森林模型包括多棵决策树,每棵决策树的每个叶子节点用于存储标签维度属性和该标签维度属性对应的热度值,将新上线视频的视频标签输入至随机森林模型中,从而随机森林模型包括的每棵决策树可决策得到新上线视频对应的热度值,进而对每棵决策树所决策的新上线视频热度值进行计算,得到新上线视频的热度预测结果。实现了对新上线视频进行热度预测,从而增加了用户黏性和提升了用户体验。

Description

一种视频热度预测方法及装置、存储介质及电子设备
技术领域
本申请涉及机器学习技术领域,尤其涉及一种视频热度预测方法及装置、存储介质及电子设备。
背景技术
随着互联网技术和视频业务的发展,对新上线视频进行热度预测,可以带来很多好处,如,增加用户黏性和提升用户体验。
因此,如何提供一种对新上线视频进行热度预测的技术方案,是目前本领域技术人员亟需解决的技术问题。
发明内容
本申请提供了一种视频热度预测方法及装置、存储介质及电子设备,目的在于实现对新上线视频进行热度预测。
为了实现上述目的,本申请提供了以下技术方案:
一种视频热度预测方法,包括:
获取每个新上线视频的视频标签;
针对每个新上线视频,将所述新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到所述随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值;其中,所述随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,所述视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,所述随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及所述标签维度属性对应的热度值,所述视频维度属性对应的热度值基于所述标签维度属性对应的视频数据样本包括的视频播放量所确定;
针对每个新上线视频,对每棵决策树所决策的所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果。
上述的方法,可选的,所述对每棵决策树所决策所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果,包括:
对每棵决策树所决策所述新上线视频的热度值进行求和计算,得到所述新上线视频的热度预测结果。
上述的方法,可选的,所述得到所述新上线视频的热度预测结果之后,还包括:
基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频;
基于各个目标视频的视频信息,生成新上线视频播单;
利用视频播放器展示所述新上线视频播单。
上述的方法,可选的,所述随机森林模型的构建过程,包括:
获取视频数据样本集合;
从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本;所述N为正整数,所述N不大于所述视频数据样本集合包括的视频数据样本的数量;
从标签维度属性集合包括的各个标签维度属性子集合中选取一个标签维度属性子集合作为目标集合;
基于所述目标集合包括的各层级标签维度属性,构建所述目标集合对应的决策树;所述目标视集合的层级数与所述决策树的层级数相同,所述决策树包括的每一层节点用于存储对应层级的标签维度属性;
针对所构建的决策树包括的每个叶子节点,将所选取出的N个视频数据样本中,所述叶子节点存储的标签维度属性对应的视频标签所属视频数据样本确定目标视频数据样本,并对各个目标视频数据样本包括的播放量进行计算,得到热度值,并将所述热度值存储至所述叶子节点中;
判断所述标签维度属性集合是否为空集;
若所述标签维度属性集合不为空集,则返回执行所述从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个样本的步骤;
若所述标签维度属性集合为空集,则将各个决策树组成随机森林模型。
上述的方法,可选的,所述从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本,包括:
启动计数器开始初始计数;
随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本;
对所述计数器的计数结果进行加一处理,并将所述视频数据样本放回至所述视频数据样本集合中;
判断所述计数器当前的计数结果是否等于N;
若所述计数器当前的计数结果不为N,则返回执行所述随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本的步骤,直至所述计数器当前的计数结果为N。
上述的方法,可选的,所述获取每个新上线视频的视频标签,包括:
获取每个新上线视频的视频内容;
利用预先构建的视频标签识别系统,对每个新上线视频的视频内容进行视频标签识别;
针对每个新上线视频,将所述视频标签识别系统识别出的视频标签作为所述新上线视频的视频标签。
上述的方法,可选的,所述将所述视频标签识别系统识别出的视频标签作为所述新上线视频的视频标签之前,还包括:
将所述视频标签识别系统识别出的视频标签发送至审核终端,以便于审核人员对所述视频标签识别系统识别出的视频标签进行修正。
一种视频热度预测装置,包括:
获取单元,用于获取每个新上线视频的视频标签;
输入单元,用于针对每个新上线视频,将所述新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到所述随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值;其中,所述随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,所述视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,所述随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及所述标签维度属性对应的热度值,所述视频维度属性对应的热度值基于所述标签维度属性对应的视频数据样本包括的视频播放量所确定;
计算单元,用于针对每个新上线视频,对每棵决策树所决策的所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果。
一种存储介质,所述存储介质存储有指令集,其中,所述指令集被处理器执行时实现如上述的视频热度预测方法。
一种电子设备,包括:
存储器,用于存储至少一组指令集;
处理器,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如上述的视频热度预测方法。
与现有技术相比,本申请包括以下优点:
本申请提供了一种视频热度预测方法及装置、存储介质及电子设备,该方法通过预先构建随机森林模型,随机森林模型包括多棵决策树,每棵决策树的每个叶子节点用于存储标签维度属性和该标签维度属性对应的热度值,将新上线视频的视频标签输入至随机森林模型中,从而随机森林模型包括的每棵决策树可决策得到新上线视频对应的热度值,进而对每棵决策树所决策的新上线视频热度值进行计算,得到新上线视频的热度预测结果。实现了对新上线视频进行热度预测,从而增加了用户黏性和提升了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种视频热度预测方法的方法流程图;
图2为本申请提供的一种视频热度预测方法的又一方法流程图;
图3为本申请提供的一种视频热度预测方法的又一方法流程图;
图4为本申请提供的一种视频热度预测方法的又一方法流程图;
图5为本申请提供的一种视频热度预测方法的又一方法流程图;
图6为本申请提供的一种视频热度预测装置的结构示意图;
图7为本申请提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本申请公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本申请实施例提供了一种视频热度预测方法,该方法的流程图如图1所示,具体包括:
S101、获取每个新上线视频的视频标签。
本实施例中,获取每个新上线视频的视频标签,具体的,按预设的时间周期,获取当前时间周期内的每个新上线视频的视频标签。优选的,预设的时间周期为24小时。
具体的,参阅图2,获取每个新上线视频的视频标签的过程,包括以下步骤:
S201、获取每个新上线视频的视频内容。
本实施例中,获取每个新上线视频的视频内容。
S202、利用预先构建的视频标签识别系统,对每个新上线视频的视频内容进行视频标签识别。
本实例中,预先构建视频标签识别系统,分别将每个新上线视频的视频内容输入至视频标签识别系统中,视频标签识别系统对视频内容进行视频标签识别,并输出识别结果,其中,识别结果中包括新上线视频的视频标签。
S203、针对每个新上线视频,将视频标签识别系统识别出的视频标签作为新上线视频的视频标签。
本实施例中,针对每个新上线视频,将视频标签识别系统识别出的视频标签作为新上线视频的视频标签。
可选的,在步骤S203之前,还可以包括以下步骤:
将视频标签识别系统识别出的视频标签发送至审核终端,以便于审核人员对视频标签识别系统识别出的视频标签进行修正。
本实施例中,在将视频标签识别系统识别出的视频标签作为新上线视频的视频标签之前,还可以将视频标签识别系统识别出的视频标签发送出审核系统,以便于审核人员对视频标签识别系统识别出的视频标签进行修正,从而将修正后的视频标签确定为新上线视频的视频标签。
S102、针对每个新上线视频,将新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值。
本实施例中,预先构建随机森林模型,该随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及该标签维度属性对应的热度值,视频标签对应的热度值基于标签维度属性对应的视频数据样本包括的视频播放量确定。
参阅图3,随机森林模型的构建过程,具体包括以下步骤:
S301、获取视频数据样本集合。
本实施例中,获取视频数据样本集合,其中,视频数据样本集合中包括多个历史视频对应的视频数据样本,也就是说,视频数据样本集合中包括多个视频数据样本。
其中,视频数据样本包括该视频数据样本所属历史视频具有的所有视频标签和视频播放量;需要说明的是,视频数据样本包括视频播放量和至少一个视频标签。
S302、从视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本。
本实施例中,每次从视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本,其中,N为正整数,N不大于视频数据用能能集合包括的视频数据样本的数量。
本实施例中,参阅图4,从视频数据一样笨集合包括的各个视频数据样本中,随机选取N个视频数据样本的过程,具体包括以下步骤:
S401、启动计数器开始初始计数。
本实施例中,每次开始随机选取N个视频数据样本之前,先启动计数器开始初始计数为0。
S402、随机从视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本。
本实施例中,随机从视频数据样本集合包括的各个数据视频数据样本中选取一个视频数据样本。
S403、对计数器的计数结果进行加一处理,并将视频数据样本放回至视频数据样本集合中。
本实施例中,在完成一个视频数据样本的选取后,对计数器的计数结果进行加一处理,并将视频数据样本返回至视频数据样本集合中,实现有放回的选取。
S404、判断计数器当前的计数结果是否等于N,若否,返回执行S402,若是,确定完成N个视频数据样本的选取,并结束。
本实施例中,判断计数器当前的计数结果是否等于N,也就是判断是否完成N个视频数据样本的选取。
本实施例中,若计数器当前的计数结果不等于N,也就是计数器当前的计数结果小于N,则说明未完成N个视频数据样本的选取,并返回执行步骤S402,若计数器当前的计数结果等于N,则说明已完成N个视频数据样本的选取。
S303、从标签维度属性集合包括的各个标签维度属性子集合中选取一个标签维度属性子集合作为目标集合。
本实施例中,预先构建标签维度属性集合,标签维度属性集合包括多个标签维度属性子集合,标签维度属性子集合包括多个层级的标签维度属性,例如,标签维度集合包括第一个层级的标签维度属性:题材,第二个层级的标签维度属性:体育,以及第三个层级的标签维度属性:球类和田径类。需要说明的是,相邻层级的标签维度属性存在种属关系,例如,球类是体育的一种,田径也是体育的一种。
需要说明的是,标签维度属性子集合包括的第一层级的标签维度属性的数量为一个,标签维度属性子集合中除第一层级外的其他层级的标签维度属性的数量为至少一个。
本实施例中,每次从标签维度属性集合包括的各个标签维度属性子集合中选取一个标签维度属性子集合作为目标集合。
需要说明的是,从视标签维度属性集合包括的各个标签维度属性子集合中选取标签维度属性子集合为无放回的选取。
S304、基于目标集合包括的各层级标签维度属性,构建目标集合对应的决策树。
本实施例中,基于目标集合包括的各层级标签维度属性,构建该目标集合对应的决策树。
需要说明的是,目标集合包括的第一个层级的标签维度属性存储于所述构建的决策树的根节点,目标视集合的层级数与决策树的层级数相同,决策树包括的每一层节点用于存储对应层级的标签维度属性。
S305、针对所构建的决策树包括的每个叶子节点,将所选取出的N个视频数据样本中,叶子节点存储的标签维度属性对应的视频标签所属视频数据样本确定目标视频数据样本,并对各个目标视频数据样本包括的播放量进行计算,得到热度值,并将热度值存储至叶子节点中。
本实施例中,针对所构建的决策树包括的每个叶子节点,将所选取出的N个视频数据样本中,叶子节点存储的标签维度属性对应的视频标签所属视频数据样本确定目标视频数据样本,也就是说,确定决策树包括的每个叶子节点对应的目标视频数据样本,每个叶子节点对应的目标视频数据样本所具备的视频标签中存在该叶子节点所存储的标签维度属性对应的视频标签。
本实施例中,针对每个叶子节点,对该叶子节点对应的目标视频数据样本包括的播放量进行计算,具体的,预设播放量区间与热度值的对应的关系,确定每个目标视频数据样本包括的播放量所处的播放量区间,从而将该播放量对应的热度值确定为该目标视频数据样本对应的热度值,对每个目标视频数据样本对应的热度值进行求和计算,从而得到该叶子节点对应热度值,并将该叶子节点对应的热度值存储至该叶子节点中。
对上述提及的对各个目标视频数据样本包括的播放量进行计算,得到热度值的过程进行举例说明如下:
若目标视频数据样本1包括的视频播放量为10W,目标视频样本2包括的视频播放量为4W,预设的播放量区间与热度值的对应关系为:在[1,2W)播放量区间内的热度值为1,在[2W,5W)播放量区间内的热度值为2,在[5W,20W)播放量区间内的热度值为3。从而确定目标视频数据样本1对应的热度值为3,目标视频数据样本2对应的热度值为2,总的热度值为5,也就是对各个目标视频数据样本包括的播放量进行计算,得到热度值为5。
S306、判断标签维度属性是否为空集,若是,执行S307,若否,返回执行S302。
本实施例中,判断标签维度属性集合是否为空集,若标签维度属性集合为空集,则执行步骤S307,若标签维度属性集合不为空集,则返回执行步骤S302。
S307、将各个决策树组成随机森林模型。
本实施例中,若标签维度属性集合为空集,则将所构建的各个决策树组成随机森林模型。
需要说明的是,可以按预设的更新周期,对所构建的随机森林模型进行更新。
本实施例中,针对每个新上线视频,将新上线视频的视频标签分别输入至随机森林模型中,随机森林模型中的每棵决策树决策与自身的叶子节点所存储的标签维度属性对应的视频标签,若决策到与自身的叶子对应的视频标签,则输出该叶子节点所存储的热度值。
S103、针对每个新上线视频,对每棵决策树所决策的新上线视频的热度值进行计算,得到新上线视频的热度预测结果。
本实施例中,针对每个新上线视频,对每棵决策树所决策的新上线视频的热度值进行计算,具体的,对每棵决策树所决策所述新上线视频的热度值进行求和计算,从而得到新上线视频的热度预测结果。
例如,若新上线视频的视频标签为足球和调侃,决策树决策足球标签得到的热度值为15,决策树决策调侃标签得到的热度值为12,那该新上线视频的热度值预测结果为27。
本申请实施例提供的视频热度预测方法,通过预先构建随机森林模型,随机森林模型包括多棵决策树,每棵决策树的每个叶子节点用于存储标签维度属性和该标签维度属性对应的热度值,将新上线视频的视频标签输入至随机森林模型中,从而随机森林模型包括的每棵决策树可决策得到新上线视频对应的热度值,进而对每棵决策树所决策的新上线视频热度值进行计算,得到新上线视频的热度预测结果。实现了对新上线视频进行热度预测,从而增加了用户黏性和提升了用户体验。
参阅图5,本申请实施例提供的视频热度预测方法,在步骤S103之后,还可以包括以下步骤:
S501、基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频。
本实施例中,在获取到每个新上线视频的热度预测结果后,基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频,具体的,基于每个新上线视频的热度预测结果,按照热度预测结果从大到小或从小到大的顺序,对各个新上线视频进行排序,并将已排序的新上线视频中按从前到后的顺序或按从后到前的顺序,依次选取预设数目的新上线视频作为目标视频。需要说明的是,若新上线视频是按照热度预测结果从大到小的顺序排序,则相应的,选取预设数目的新上线视频是按照从前到后的顺序选取,若新上线视频是按照热度预测结果从小到大的顺序排序,则相应的,选取预设数目的新上线视频是按照从后到前的顺序选取。
S502、基于各个目标视频的视频信息,生成新上线视频播单。
基于各个目标视频的视频信息,生成新上线视频播单,其中,视频信息包括但不小于视频名称。
需要说明的,新上线视频播单中的各个目标视频是按照热度预测结果从大到小的顺序排布的。
S503、利用视频播放器展示新上线视频播单。
本实施例中,在生成新上线视频播单后,可以利用视频播放器展示新上线视频播单,从而用户可以通过新上线视频播单,快速找到感兴趣的新上线视频,进而提升用户体验和用户黏性。
本申请实施例提供的视频热度预测方法中,在获取到每个新上线视频的热度预测结果后,基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频,并基于各个目标视频的视频信息,生成新上线视频播单,利用视频播放器展示新上线视频播单,从而用户可以通过新上线视频播单,快速找到感兴趣的新上线视频,进而提升用户体验和用户黏性。
需要说明的是,虽然采用特定次序描绘了各指令,但是这不应当理解为要求这些指令以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
应当理解,本申请公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请公开的范围在此方面不受限制。
与图1所述的方法相对应,本申请实施例还提供了一种视频热度预测装置,用于对图1中方法的具体实现,其结构示意图如图6所示,具体包括:
获取单元601,用于获取每个新上线视频的视频标签;
输入单元602,用于针对每个新上线视频,将所述新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到所述随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值;其中,所述随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,所述视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,所述随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及所述标签维度属性对应的热度值,所述视频维度属性对应的热度值基于所述标签维度属性对应的视频数据样本包括的视频播放量所确定;
计算单元603,用于针对每个新上线视频,对每棵决策树所决策的所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果。
本申请实施例提供的视频热度预测装置,通过预先构建随机森林模型,随机森林模型包括多棵决策树,每棵决策树的每个叶子节点用于存储标签维度属性和该标签维度属性对应的热度值,将新上线视频的视频标签输入至随机森林模型中,从而随机森林模型包括的每棵决策树可决策得到新上线视频对应的热度值,进而对每棵决策树所决策的新上线视频热度值进行计算,得到新上线视频的热度预测结果。实现了对新上线视频进行热度预测,从而增加了用户黏性和提升了用户体验。
在本申请的一个实施例中,基于前述方案,计算单元603具体用于:
对每棵决策树所决策所述新上线视频的热度值进行求和计算,得到所述新上线视频的热度预测结果。
在本申请的一个实施例中,基于前述方案,还可以配置为:
确定单元,用于基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频;
生成单元,用于基于各个目标视频的视频信息,生成新上线视频播单;
展示单元,用于利用视频播放器展示所述新上线视频播单。
在本申请的一个实施例中,基于前述方案,输入单元602在随机森林模型的构建过程时,具体用于:
获取视频数据样本集合;
从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本;所述N为正整数,所述N不大于所述视频数据样本集合包括的视频数据样本的数量;
从标签维度属性集合包括的各个标签维度属性子集合中选取一个标签维度属性子集合作为目标集合;
基于所述目标集合包括的各层级标签维度属性,构建所述目标集合对应的决策树;所述目标视集合的层级数与所述决策树的层级数相同,所述决策树包括的每一层节点用于存储对应层级的标签维度属性;
针对所构建的决策树包括的每个叶子节点,将所选取出的N个视频数据样本中,所述叶子节点存储的标签维度属性对应的视频标签所属视频数据样本确定目标视频数据样本,并对各个目标视频数据样本包括的播放量进行计算,得到热度值,并将所述热度值存储至所述叶子节点中;
判断所述标签维度属性集合是否为空集;
若所述标签维度属性集合不为空集,则返回执行所述从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个样本的步骤;
若所述标签维度属性集合为空集,则将各个决策树组成随机森林模型。
在本申请的一个实施例中,基于前述方案,输入单元602在从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本时,具体用于:
启动计数器开始初始计数;
随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本;
对所述计数器的计数结果进行加一处理,并将所述视频数据样本放回至所述视频数据样本集合中;
判断所述计数器当前的计数结果是否等于N;
若所述计数器当前的计数结果不为N,则返回执行所述随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本的步骤,直至所述计数器当前的计数结果为N。
在本申请的一个实施例中,基于前述方案,获取单元501具体用于:
获取每个新上线视频的视频内容;
利用预先构建的视频标签识别系统,对每个新上线视频的视频内容进行视频标签识别;
针对每个新上线视频,将所述视频标签识别系统识别出的视频标签作为所述新上线视频的视频标签。
在本申请的一个实施例中,基于前述方案,获取单元601还用于:
将所述视频标签识别系统识别出的视频标签发送至审核终端,以便于审核人员对所述视频标签识别系统识别出的视频标签进行修正。
本申请实施例还提供了一种存储介质,所述存储介质存储有指令集,其中,在所述指令集运行时执行如上文任一实施例公开的视频热度预测方法。
本申请实施例还提供了一种电子设备,其结构示意图如图7所示,具体包括存储器701,用于存储至少一组指令集;处理器702,用于执行所述存储器中存储的指令集,通过执行如上文任一实施例公开的视频热度预测方法。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本申请公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种视频热度预测方法,其特征在于,包括:
获取每个新上线视频的视频标签;
针对每个新上线视频,将所述新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到所述随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值;其中,所述随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,所述视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,所述随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及所述标签维度属性对应的热度值,所述视频维度属性对应的热度值基于所述标签维度属性对应的视频数据样本包括的视频播放量所确定;
针对每个新上线视频,对每棵决策树所决策的所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对每棵决策树所决策所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果,包括:
对每棵决策树所决策所述新上线视频的热度值进行求和计算,得到所述新上线视频的热度预测结果。
3.根据权利要求1或2所述的方法,其特征在于,所述得到所述新上线视频的热度预测结果之后,还包括:
基于各个新上线视频的热度预测结果,从各个新上线视频中确定目标视频;
基于各个目标视频的视频信息,生成新上线视频播单;
利用视频播放器展示所述新上线视频播单。
4.根据权利要求1所述的方法,其特征在于,所述随机森林模型的构建过程,包括:
获取视频数据样本集合;
从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本;所述N为正整数,所述N不大于所述视频数据样本集合包括的视频数据样本的数量;
从标签维度属性集合包括的各个标签维度属性子集合中选取一个标签维度属性子集合作为目标集合;
基于所述目标集合包括的各层级标签维度属性,构建所述目标集合对应的决策树;所述目标视集合的层级数与所述决策树的层级数相同,所述决策树包括的每一层节点用于存储对应层级的标签维度属性;
针对所构建的决策树包括的每个叶子节点,将所选取出的N个视频数据样本中,所述叶子节点存储的标签维度属性对应的视频标签所属视频数据样本确定目标视频数据样本,并对各个目标视频数据样本包括的播放量进行计算,得到热度值,并将所述热度值存储至所述叶子节点中;
判断所述标签维度属性集合是否为空集;
若所述标签维度属性集合不为空集,则返回执行所述从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个样本的步骤;
若所述标签维度属性集合为空集,则将各个决策树组成随机森林模型。
5.根据权利要求4所述的方法,其特征在于,所述从所述视频数据样本集合包括的各个视频数据样本中,随机选取N个视频数据样本,包括:
启动计数器开始初始计数;
随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本;
对所述计数器的计数结果进行加一处理,并将所述视频数据样本放回至所述视频数据样本集合中;
判断所述计数器当前的计数结果是否等于N;
若所述计数器当前的计数结果不为N,则返回执行所述随机从所述视频数据样本集合包括的各个视频数据样本中选取一个视频数据样本的步骤,直至所述计数器当前的计数结果为N。
6.根据权利要求1所述的方法,其特征在于,所述获取每个新上线视频的视频标签,包括:
获取每个新上线视频的视频内容;
利用预先构建的视频标签识别系统,对每个新上线视频的视频内容进行视频标签识别;
针对每个新上线视频,将所述视频标签识别系统识别出的视频标签作为所述新上线视频的视频标签。
7.根据权利要求6所述的方法,其特征在于,所述将所述视频标签识别系统识别出的视频标签作为所述新上线视频的视频标签之前,还包括:
将所述视频标签识别系统识别出的视频标签发送至审核终端,以便于审核人员对所述视频标签识别系统识别出的视频标签进行修正。
8.一种视频热度预测装置,其特征在于,包括:
获取单元,用于获取每个新上线视频的视频标签;
输入单元,用于针对每个新上线视频,将所述新上线视频的视频标签分别输入至预先构建的随机森林模型中,得到所述随机森林模型包括的每棵决策树所决策的所述新上线视频对应的热度值;其中,所述随机森林模型基于视频数据样本集合包括的视频数据样本预先训练得到,所述视频数据样本包括其所属的历史视频具有的视频标签和视频播放量,所述随机森林模型包括的每棵决策树的每个叶子节点用于存储标签维度属性,以及所述标签维度属性对应的热度值,所述视频维度属性对应的热度值基于所述标签维度属性对应的视频数据样本包括的视频播放量所确定;
计算单元,用于针对每个新上线视频,对每棵决策树所决策的所述新上线视频的热度值进行计算,得到所述新上线视频的热度预测结果。
9.一种存储介质,其特征在于,所述存储介质存储有指令集,其中,所述指令集被处理器执行时实现如权利要求1-7任意一项所述的视频热度预测方法。
10.一种电子设备,其特征在于,包括:
存储器,用于存储至少一组指令集;
处理器,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如权利要求1-7任意一项所述的视频热度预测方法。
CN202210615382.3A 2022-06-01 2022-06-01 一种视频热度预测方法及装置、存储介质及电子设备 Pending CN114969436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210615382.3A CN114969436A (zh) 2022-06-01 2022-06-01 一种视频热度预测方法及装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210615382.3A CN114969436A (zh) 2022-06-01 2022-06-01 一种视频热度预测方法及装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114969436A true CN114969436A (zh) 2022-08-30

Family

ID=82960633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210615382.3A Pending CN114969436A (zh) 2022-06-01 2022-06-01 一种视频热度预测方法及装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114969436A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062209A1 (zh) * 2013-10-29 2015-05-07 华为技术有限公司 随机森林分类模型的可视化优化处理方法及装置
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN109522470A (zh) * 2018-11-06 2019-03-26 汪浩 一种视频热度预测方法、装置、设备及存储介质
US10284585B1 (en) * 2016-06-27 2019-05-07 Symantec Corporation Tree rotation in random classification forests to improve efficacy
CN113052375A (zh) * 2021-03-19 2021-06-29 上海森宇文化传媒股份有限公司 一种预测剧集播放量的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062209A1 (zh) * 2013-10-29 2015-05-07 华为技术有限公司 随机森林分类模型的可视化优化处理方法及装置
US10284585B1 (en) * 2016-06-27 2019-05-07 Symantec Corporation Tree rotation in random classification forests to improve efficacy
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN109522470A (zh) * 2018-11-06 2019-03-26 汪浩 一种视频热度预测方法、装置、设备及存储介质
CN113052375A (zh) * 2021-03-19 2021-06-29 上海森宇文化传媒股份有限公司 一种预测剧集播放量的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭赛赛;李君怡;: "并行绘制系统中基于随机森林的预测算法改进", 现代计算机, 25 February 2020 (2020-02-25) *

Similar Documents

Publication Publication Date Title
CN110248258B (zh) 视频片段的推荐方法、装置、存储介质和计算机设备
CN103823908B (zh) 基于用户偏好的内容推荐方法和服务器
CN107463698B (zh) 基于人工智能推送信息的方法和装置
US20190394529A1 (en) Resource recommendation method, device, apparatus and computer readable storage medium
CN104247441B (zh) 自动推荐内容
CN106131601A (zh) 视频推荐方法及装置
CN110737859B (zh) 一种up主匹配方法及装置
CN106294830A (zh) 多媒体资源的推荐方法及装置
CN106649316A (zh) 一种视频推送方法及装置
CN104081429A (zh) 基于视频同现统计数据的视频推荐
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN106611366A (zh) 自动选品的方法及装置
CN110413867A (zh) 用于内容推荐的方法及系统
US20230269432A1 (en) System, method and computer-readable medium for recommending streaming data
CN112287167A (zh) 视频推荐召回方法及装置
CN106156351A (zh) 多媒体资源推荐信息生成方法及装置
CN104967690A (zh) 一种信息推送方法及装置
CN110213660A (zh) 节目的分发方法、系统、计算机设备和存储介质
CN107281754B (zh) 一种应用标识匹配方法及其设备、存储介质、服务器
CN109451334A (zh) 用户画像生成处理方法、装置及电子设备
CN114969436A (zh) 一种视频热度预测方法及装置、存储介质及电子设备
CN109451332B (zh) 一种用户属性标记方法、装置、计算机设备及介质
CN116823058A (zh) 广告投放参考依据的生成方法、装置、电子设备及介质
CN115269919A (zh) 一种短视频质量的确定方法、装置、电子设备及存储介质
US20220067545A1 (en) Automated taxonomy classification system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination