CN111597383A - 一种视频热度级别预测方法及装置 - Google Patents
一种视频热度级别预测方法及装置 Download PDFInfo
- Publication number
- CN111597383A CN111597383A CN202010334231.1A CN202010334231A CN111597383A CN 111597383 A CN111597383 A CN 111597383A CN 202010334231 A CN202010334231 A CN 202010334231A CN 111597383 A CN111597383 A CN 111597383A
- Authority
- CN
- China
- Prior art keywords
- heat
- video
- level
- decision tree
- heat level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000003066 decision tree Methods 0.000 claims description 99
- 238000012549 training Methods 0.000 claims description 28
- 230000001419 dependent effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 4
- 238000013486 operation strategy Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请实施例提供的一种视频热度级别的预测方法及装置,确定待预测视频所属的内容类别,将内容类别输入预设的热度指标确定模型,输出与内容类型对应的热度指标,获取待预测视频与上线预设时长内与热度指标对应的热度指标值,根据预设热度指标值与热度级别的对应关系,确定与待预测视频的热度指标值对应的热度级别,以作为待预测视频的热度级别。通过本方案可以在视频上线预设时长后利用视频的热度指标值预测视频的热度级别,无需等到视频完结,进一步的可以根据预测的热度级别对未完结的视频的运营策略进行调整,从而提升视频的热度。
Description
技术领域
本申请涉及预测领域,尤其涉及一种视频热度级别预测方法及装置。
背景技术
随着终端设备的普及,以及海量应用的产生,其带给了人们更佳的生活体验。在视频观看领域亦产生了众多的视频应用,其安装于终端设备上,用户可以通过该视频应用观看电视剧、电影、综艺、电视直播节目等。
现在很多视频应用中通常会有一些定期更新的电视剧和综艺,其中电视剧又有日播剧和周播剧,另外现有的很多视频应用通常会设置普通模式和VIP模式,在VIP模式下用户又可以对一些周播剧享有抢先看或看全集的权限,综上通常可以将视频分为综艺、日播剧、会员抢先看周播剧、全集上周播剧视频这四种内容类别。
为了更好的了解视频的热度,通常会对视频进行热度级别划分,按照级别的高低通常可以划分为S级、A+级、A级和B级四种热度级别,热度级别越低说明视频热度越低,也就说明视频的运营效果不好,因此为了避免视频级别过低,可以在视频完结前对视频的热度级别进行预测,根据预测的结果及时对视频的运行策略进行调整,但是现有的视频热度级别都是需要在视频完结后,再根据视频的VV(Video View,播放数)和/或视频的前台流量等播放指标来确定,无法预测,因此现在急需一种预测视频热度级别的方法。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种视频热度级别预测方法及装置。
第一方面,本申请提供了一种视频热度级别预测方法,包括:
确定待预测视频所属的内容类型;
将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
在一种可能的实现方式中,所述热度指标确定模型采用下述方式设置:
获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本;
获取所述视频样本在上线预设时长内的多个播放指标对应的值;
针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量;
针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标;
根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
在一种可能的实现方式中,所述决策树模型采用下述方式设置:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
在一种可能的实现方式中,训练后的决策树模型的准确率采用下述方式计算:
获取通过训练后的决策树模型得到的视频样本的预测热度级别;
根据所述视频样本已知的热度级别和所述预测热度级别,分别计算所述训练后的决策树模型针对各个热度级别的预测准确率;
根据所述训练后的决策树模型针对各个热度级别的预测准确率,按照下式计算所述训练后的决策树模型的准确率:
其中,Pm表示决策树模型m的准确率,Pmi表示决策树模型m针对第i种热度级别的预测准确率,Ai表示预设的第i种热度级别的权重,n表示热度级别的种类数。
在一种可能的实现方式中,所述热度指标值与热度级别的对应关系,采用下述方式设置:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别;
根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
第二方面,本发明实施例还提供了一种视频热度级别预测装置,包括:
类型确定模块,用于确定待预测视频所属的内容类型;
热度指标确定模块,用于将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
热度指标值获取模块,用于获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
热度级别确定模块,用于根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
在一种可能的实现方式中,所述装置还包括用于构建热度指标确定模型的模型构建模块,所述模型构建模块包括:
样本集合获取子模块,用于获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本;
指标值获取子模块,用于获取所述视频样本在上线预设时长内的多个播放指标对应的值;
决策树训练子模块,用于针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量;
对应关系确定子模块,用于针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标;
模型生成子模块,用于根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
在一种可能的实现方式中,所述决策树模型采用下述方式设置:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
在一种可能的实现方式中,所述对应关系确定子模块还用于:
获取通过训练后的决策树模型得到的视频样本的预测热度级别;
根据所述视频样本已知的热度级别和所述预测热度级别,分别计算所述训练后的决策树模型针对各个热度级别的预测准确率;
根据所述训练后的决策树模型针对各个热度级别的预测准确率,按照下式计算所述训练后的决策树模型的准确率:
其中,Pm表示决策树模型m的准确率,Pmi表示决策树模型m针对第i种热度级别的预测准确率,Ai表示预设的第i种热度级别的权重,n表示热度级别的种类数。
在一种可能的实现方式中,所述装置还包括用于设置热度指标值与热度级别的对应关系的对应关系设置模块,所述对应关系设置模块具体用于:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别;
根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的数据处理程序,以实现第一方面所述视频热度级别预测方法。
第四方面,本发明实施例还提供了一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面所述视频热度级别预测方法。
本申请实施例提供的一种视频热度级别的预测方法,确定待预测视频所属的内容类别,将内容类别输入预设的热度指标确定模型,输出与内容类型对应的热度指标,获取待预测视频与上线预设时长内与热度指标对应的热度指标值,根据预设热度指标值与热度级别的对应关系,确定与待预测视频的热度指标值对应的热度级别,以作为待预测视频的热度级别。通过本方案可以在视频上线预设时长后利用视频的热度指标值预测视频的热度级别,无需等到视频完结,进一步的可以根据预测的热度级别对未完结的视频的运营策略进行调整,从而提升视频的热度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种视频热度级别预测方法的流程图;
图2为本发明实施例提供的一种视频热度级别预测装置的框图;
图3为本发明实施例提供的一种电子设备的示意图;
图4为本发明实施例提供的一种视频热度级别预测方法的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一种视频热度级别预测方法的流程图,如图1所示,该方法包括如下步骤:
S11.确定待预测视频所属的内容类型。
其中待预测视频即为需要进行热度等级预测的视频,内容类型为根据实际情况为视频划分的类型,例如内容类型可以划分为综艺、日播剧、会员抢先看周播剧、会员全集上周播剧等。
在一种可能的情况下,每个视频的内容类型可以是预先采用人工或机器算法等方式设置好的,每个视频都有用于标识其所属内容类型的内容标签,因此在执行S11时可以通过获取待预测视频的内容标签来确定待预测视频所述的内容类型。
在另一种可能的情况下,待预测视频所属的内容类型可以通过预训练的内容类型确定模型来确定,将待预测视频输入预训练的内容类型确定模型,输出待预测视频所属的内容类型,其中内容类型确定模型可以为采用大量内容类型已知的视频作为训练集训练得到的以视频为输入,以视频所属的内容类型为输出的分类模型。
S12.将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标。
其中,热度指标即为用于预测视频热度级别的北极星指标,北极星指标(NorthStar Metric),也叫作第一关键指标(One Metric That Matters),是指在产品的当前阶段与业务/战略相关的绝对核心指标,一旦确立就像北极星一样闪耀在空中,指引团队向同一个方向迈进(提升这一指标)。
预先构建以内容类型为输入以热度指标为输出的热度指标确定模型,在知道视频的内容类型的情况下可以快速、准确的确定出与其对应的热度指标。
S13.获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值。
在本实施例中,热度指标指的是指标的名称,而热度指标值则指的是热度指标对应的具体数值,例如热度指标为前台流量,则热度指标值就是前台流量的具体数值。
其中,视频上线即为视频发布,视频上线预设时长就是视频发布预设时长,预设时长可以根据实际需求设定,例如三天等。
S14.根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
其中,热度级别根据需求可以划分为多个级别,例如可以划分为S级、A+级、A级、B级四个级别,其中S级的级别最高,B级的级别最低,A级和级别低于A+级。
预先设置各个热度指标值与热度级别的对应关系,从而使得根据热度指标值即可确定热度级别,其中热度指标值与热度级别的对应关系根据实际情况设定。
本实施例提供的一种视频热度级别的预测方法,确定待预测视频所属的内容类别,将内容类别输入预设的热度指标确定模型,输出与内容类型对应的热度指标,获取待预测视频与上线预设时长内与热度指标对应的热度指标值,根据预设热度指标值与热度级别的对应关系,确定与待预测视频的热度指标值对应的热度级别,以作为待预测视频的热度级别。通过本方案可以在视频上线预设时长后利用视频的热度指标值预测视频的热度级别,无需等到视频完结,进一步的可以根据预测的热度级别对未完结的视频的运营策略进行调整,从而提升视频的热度。
在上述实施例的基础上,若S11采用内容类型确定模型来确定待预测视频的内容类型,则可以将内容类型确定模型和热度指标确定模型集成为一个以视频为输入以热度指标为输出的模型,通过将两个模型集成为一个模型简化的操作流程,使热度级别的预测更加简便。
在上述实施例的基础上,S12中的热度指标确定模型,可以采用下述方式构建:
S121.获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本。
一个视频样本集合中包含的所有视频样本所属的内容类别都是相同的,也就是说一个视频样本集合对应一种内容类别。
S122.获取所述视频样本在上线预设时长内的多个播放指标对应的值。
因为视频通常会有多个播放指标,这些播放指标可以反映视频的一些情况,例如流量、播放次数等等,但是对视频的所有播放指标均进行监控和分析,将会花费很多的人力和物力,因此本申请为了简化视频热度级别预测的难度,从多个播放指标中筛选出最适合用于确定热度级别的播放指标作为热度指标。
此处的预设时长与S13中的预设时长相同,播放指标为表示视频播放次数、前台流量等的一些指标,例如视频每日的内容热度、会员/非会员正片VV(Video View,播放数)、会员/非会员正片UV(Unique Visitor,访客数)、会员/非会员前台流量、新增UV、第1集VV、第2集VV、第1集UV、第2集UV等,以及由上述特征新构建的复合指标(主要通过四则运算对上述指标进行四则运算得到),例如第2日前台流量与第1日前台流量的差值,等等,这些指标的值可以从数据库直接获取。
S123.针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量。
本实施例针对每个内容类别分别进行训练,从而得到每个内容类型各自对应的热度指标。
其中预设的决策树模型可以以1个播放指标为变量,也可以以2个或多个播放指标为变量。
在对决策树模型的训练过程中利用视频样本已知的热度级别对决策树模型进行有监督的训练,具体的训练方法为现有的有监督训练方法。
S124.针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标。
其中准确率为决策树模型输出的热度级别针对视频样本已知的热度级别的准确率。
决策树模型的准确率越高,则说明其对应的变量与因变量之间的联系越紧密,因此本实施例选取各个视频样本集合对应的准确率最高的决策树模型的变量,作为视频样本集合中视频样本所属的内容类型对应的热度指标。
S125.根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
在本实施例中,决策树模型可以认为是if-then规则的集合,其主要优点是模型具有可解释性,通过上述方式确定出与内容类型对应的热度指标,保证根据热度指标对视频进行热度级别预测时,预测结果最准确。
在上述实施例的基础上,为了简化视频热度预测的复杂程度,可以采用下述方式设置决策树模型:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
其中预设的决策树算法可以为现有的决策树算法,例如Python中的sklearn机器学习包中的决策树算法。
在本实施例中,通过上述方式构建决策树模型保证每个决策树模型的变量不超过两个,则对上述构建的决策树模型执行S123-S125可以使得最后得到的热度指标的数量不超过两个,从而使得利用热度指标进行热度级别预测时获取少量数据即可得到预测结果,使得预测更加简单。
在上述实施例的基础上,因为热度级别包含多种级别,所以同一个视频样本集合中包含的视频样本对应的热度级别可能不同,因此在计算整个决策树模型的准确率是需要综合考虑决策树模型对各种级别的预测的准确率,因此S124计算训练后的各个决策树模型的准确率,可以包括如下步骤:
步骤1:获取通过各个决策树模型得到的各个样本视频的预测热度级别。
步骤2:根据所述视频样本已知的热度级别和所述预测热度级别,分别计算各个决策树模型针对各个热度级别的预测准确率。
步骤3:根据各个决策树模型针对各个热度级别的预测准确率,按照下式分别计算训练后的决策树模型的准确率:
其中,Pm表示决策树模型m的准确率,Pmi表示决策树模型m针对第i种热度级别的预测准确率,Ai表示预设的第i种热度级别的权重,n标识热度级别的种类数。
例如热度级别分为S级、A+级、A级和B级四种级别,则n为4,可以预先设定S级为第1种热度级别,A+级为第2种热度级别,A级为第3种热度级别,B级为第4种热度级别,则当i为1时,则Pm1就表示决策树模型m针对S级的预测准确率,A1表示预设的S级的权重。
在本实施例中,通过上述方式计算的决策树模型的准确率综合考虑了决策树模型针对各种热度级别的预测准确性,保证了最终根据决策树模型的准确率得到的热度指标更加准确。
在上述实施例的基础上,热度指标值与热度级别的对应关系可以采用下述方式确定:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别,根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
具体的,针对各个视频样本集合,根据视频样本集合中的视频样本的热度级别,对视频样本进行分组,同一组中的视频样本的热度级别相同,针对每一组分别对视频样本的热度指标值进行分析,确定热度指标值的取值范围,建立各组对应的热度指标值的取值范围与各组对应的热度级别的对应关系,从而得到热度指标值与热度级别的对应关系。
如果内容类型对应的热度指标为一个,则生成的对应关系的格式可以为:热度指标取值范围:热度级别。
如果内容类型对应的热度指标为两个或更多个,则生成的对应关系的格式可以为:第一热度指标取值范围&……&第n热度指标取值范围:热度级别,其中n大于等于2。
即当有多个热度指标时需要综合考虑各个热度指标值来确定热度级别。
在本实施例中,针对各内容类型的视频,通过对决策树模型进行训练,确定各内容类型对应的用于预测视频热度级别的指标,也就是热度指标,从而根据待预测视频的内容类型即可确定对应的热度指标,然后获取与热度指标对应的热度指标值,根据预设的热度指标值与热度级别的对应关系,即可确定视频的热度级别,仅利用少量的指标值即可预测视频的热度级别,简单、方便。
一个具体的例子
图4为本发明实施例提供的一种视频热度级别预测方法的示意图,先通过各内容类型的样本视频在上线预设时长内的播放指标值,对对应的决策树模型进行训练,得到各内容类型与热度指标的对应关系,确定待预测视频所述的内容类别,根据内容类别和热度指标的对应关系得到用于预测待预测视频的热度级别的热度指标,获取待预测视频上线预设时长内的热度指标值,根据预设的热度指标值与热度级别的对应关系,得到待预测视频的预测热度级别。
本发明实施例还提供了一种视频热度级别预测装置,如图2所示,该装置可以包括:
类型确定模块201,用于确定待预测视频所属的内容类型;
热度指标确定模块202,用于将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
热度指标值获取模块203,用于获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
热度级别确定模块204,用于根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
在上述实施例的基础上,所述装置还包括用于构建热度指标确定模型的模型构建模块,所述模型构建模块包括:
样本集合获取子模块,用于获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本;
指标值获取子模块,用于获取所述视频样本在上线预设时长内的多个播放指标对应的值;
决策树训练子模块,用于针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量;
对应关系确定子模块,用于针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标;
模型生成子模块,用于根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
在上述实施例的基础上,所述决策树模型采用下述方式设置:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
在上述实施例的基础上,所述对应关系确定子模块还用于:
获取通过训练后的决策树模型得到的视频样本的预测热度级别;
根据所述视频样本已知的热度级别和所述预测热度级别,分别计算所述训练后的决策树模型针对各个热度级别的预测准确率;
根据所述训练后的决策树模型针对各个热度级别的预测准确率,按照下式计算所述训练后的决策树模型的准确率:
其中,Pm表示决策树模型m的准确率,Pmi表示决策树模型m针对第i种热度级别的预测准确率,Ai表示预设的第i种热度级别的权重,n表示热度级别的种类数。
在上述实施例的基础上,所述装置还包括用于设置热度指标值与热度级别的对应关系的对应关系设置模块,所述对应关系设置模块具体用于:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别;
根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
在本申请另一实施例中,还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
确定待预测视频所属的内容类型;
将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
上述电子设备提到的通信总线304可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口302用于上述电子设备与其他设备之间的通信。
存储器303可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器301可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请另一实施例中,还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理方法程序,所述数据处理方法程序被处理器执行时实现上述任一所述的数据处理方法的步骤。
本发明实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种视频热度级别预测方法,其特征在于,包括:
确定待预测视频所属的内容类型;
将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
2.根据权利要求1所述的方法,其特征在于,所述热度指标确定模型采用下述方式设置:
获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本;
获取所述视频样本在上线预设时长内的多个播放指标对应的值;
针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量;
针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标;
根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
3.根据权利要求2所述的方法,其特征在于,所述决策树模型采用下述方式设置:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
5.根据权利要求2所述方法,其特征在于,所述热度指标值与热度级别的对应关系,采用下述方式设置:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别;
根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
6.一种视频热度级别预测装置,其特征在于,包括:
类型确定模块,用于确定待预测视频所属的内容类型;
热度指标确定模块,用于将所述内容类型输入预设的热度指标确定模型,输出与所述内容类型对应的用于预测所述待预测视频的热度级别的热度指标;
热度指标值获取模块,用于获取所述待预测视频上线预设时长内的热度指标值,所述热度指标值为与所述热度指标对应的值;
热度级别确定模块,用于根据预设的热度指标值与热度级别的对应关系,确定与所述待预测视频的热度指标值对应的热度级别,以作为所述待预测视频的热度级别。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括用于构建热度指标确定模型的模型构建模块,所述模型构建模块包括:
样本集合获取子模块,用于获取多个视频样本集合,每个视频样本集合中分别包含一种内容类型的多个热度级别已知的视频样本;
指标值获取子模块,用于获取所述视频样本在上线预设时长内的多个播放指标对应的值;
决策树训练子模块,用于针对各个视频样本集合,分别以包含的视频样本的多个播放指标的值为训练样本,对预设的多个决策树模型进行训练,所决策树模型以至少一个播放指标为变量,以视频的热度级别为因变量;
对应关系确定子模块,用于针对各个视频样本集合,分别选取训练后准确率最高的决策树模型的变量,作为包含的视频样本所属的内容类型对应的热度指标;
模型生成子模块,用于根据内容类型与对应的热度指标,生成以内容类型为输入以对应的热度指标为输出的热度指标确定模型。
8.根据权利要求7所述的装置,其特征在于,所述决策树模型采用下述方式设置:
使用预设的决策树算法建立以任意一个或两个播放指标为变量,以视频的热度级别为因变量的决策树模型。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括用于设置热度指标值与热度级别的对应关系的对应关系设置模块,所述对应关系设置模块具体用于:
针对各个视频样本集合,分别确定包含的各个视频样本对应的热度指标值和热度级别;
根据所述各个视频样本对应的热度指标值和热度级别,确定热度级别与热度指标值的对应关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334231.1A CN111597383A (zh) | 2020-04-24 | 2020-04-24 | 一种视频热度级别预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334231.1A CN111597383A (zh) | 2020-04-24 | 2020-04-24 | 一种视频热度级别预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111597383A true CN111597383A (zh) | 2020-08-28 |
Family
ID=72181754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010334231.1A Pending CN111597383A (zh) | 2020-04-24 | 2020-04-24 | 一种视频热度级别预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597383A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651356A (zh) * | 2020-12-30 | 2021-04-13 | 杭州菲助科技有限公司 | 视频难度定级模型获取方法及视频难度定级方法 |
CN112866724A (zh) * | 2020-12-31 | 2021-05-28 | 山东远桥信息科技有限公司 | 一种基于软件定义网络和边缘计算技术的视频业务处理方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707964A (zh) * | 2016-08-08 | 2018-02-16 | 华为软件技术有限公司 | 预测视频内容热度的方法和装置 |
CN108898415A (zh) * | 2018-05-29 | 2018-11-27 | 北京奇艺世纪科技有限公司 | 一种视频剧集的流量相关指标预测方法及装置 |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
CN109672939A (zh) * | 2019-01-07 | 2019-04-23 | 北京奇艺世纪科技有限公司 | 一种标记视频内容热度的方法及装置 |
CN110019939A (zh) * | 2017-12-28 | 2019-07-16 | Tcl集团股份有限公司 | 视频热度预测方法、装置、终端设备及介质 |
-
2020
- 2020-04-24 CN CN202010334231.1A patent/CN111597383A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707964A (zh) * | 2016-08-08 | 2018-02-16 | 华为软件技术有限公司 | 预测视频内容热度的方法和装置 |
CN110019939A (zh) * | 2017-12-28 | 2019-07-16 | Tcl集团股份有限公司 | 视频热度预测方法、装置、终端设备及介质 |
CN108898415A (zh) * | 2018-05-29 | 2018-11-27 | 北京奇艺世纪科技有限公司 | 一种视频剧集的流量相关指标预测方法及装置 |
CN109522470A (zh) * | 2018-11-06 | 2019-03-26 | 汪浩 | 一种视频热度预测方法、装置、设备及存储介质 |
CN109672939A (zh) * | 2019-01-07 | 2019-04-23 | 北京奇艺世纪科技有限公司 | 一种标记视频内容热度的方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651356A (zh) * | 2020-12-30 | 2021-04-13 | 杭州菲助科技有限公司 | 视频难度定级模型获取方法及视频难度定级方法 |
CN112651356B (zh) * | 2020-12-30 | 2024-01-23 | 杭州菲助科技有限公司 | 视频难度定级模型获取方法及视频难度定级方法 |
CN112866724A (zh) * | 2020-12-31 | 2021-05-28 | 山东远桥信息科技有限公司 | 一种基于软件定义网络和边缘计算技术的视频业务处理方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110311902B (zh) | 一种异常行为的识别方法、装置及电子设备 | |
CN110856037B (zh) | 一种视频封面确定方法、装置、电子设备及可读存储介质 | |
CN111163338A (zh) | 视频清晰度评估模型训练方法、视频推荐方法及相关装置 | |
CN109165691B (zh) | 用于识别作弊用户的模型的训练方法、装置及电子设备 | |
CN111340233B (zh) | 机器学习模型的训练方法及装置、样本处理方法及装置 | |
CN111222553B (zh) | 机器学习模型的训练数据处理方法、装置和计算机设备 | |
CN109800328B (zh) | 视频推荐方法、其装置、信息处理设备及存储介质 | |
CN110489574B (zh) | 一种多媒体信息推荐方法、装置和相关设备 | |
CN111597383A (zh) | 一种视频热度级别预测方法及装置 | |
CN110046278B (zh) | 视频分类方法、装置、终端设备及存储介质 | |
CN111062527B (zh) | 一种视频集流量预测方法及装置 | |
CN110933492B (zh) | 一种播放时长预测方法及装置 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111144451A (zh) | 一种图像分类模型的训练方法、装置及设备 | |
CN113656681A (zh) | 一种对象评价方法、装置、设备及存储介质 | |
CN108683949B (zh) | 一种直播平台潜在用户的提取方法及装置 | |
CN111404835A (zh) | 流量控制方法、装置、设备及存储介质 | |
CN112507216B (zh) | 一种数据对象推荐方法、装置、设备和存储介质 | |
US10893312B2 (en) | Digital content provision | |
CN113536138A (zh) | 一种网络资源推荐方法、装置、电子设备及可读存储介质 | |
CN110717109B (zh) | 推荐数据的方法、装置、电子设备及存储介质 | |
CN112906805A (zh) | 图像训练样本筛选和任务模型训练方法、装置及电子设备 | |
CN113971454A (zh) | 深度学习模型的量化方法和相关装置 | |
CN113762403B (zh) | 图像处理模型量化方法、装置、电子设备及存储介质 | |
CN116932657A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |