CN110019937B - 视频热度的预测方法及装置 - Google Patents

视频热度的预测方法及装置 Download PDF

Info

Publication number
CN110019937B
CN110019937B CN201711209868.2A CN201711209868A CN110019937B CN 110019937 B CN110019937 B CN 110019937B CN 201711209868 A CN201711209868 A CN 201711209868A CN 110019937 B CN110019937 B CN 110019937B
Authority
CN
China
Prior art keywords
video
heat
matrix
training
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711209868.2A
Other languages
English (en)
Other versions
CN110019937A (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201711209868.2A priority Critical patent/CN110019937B/zh
Publication of CN110019937A publication Critical patent/CN110019937A/zh
Application granted granted Critical
Publication of CN110019937B publication Critical patent/CN110019937B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供了一种视频热度的预测方法及装置,方法包括:获取第一视频类型的视频对象在t个采样时间对应的热度矩阵;获取第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵;将t个采样时间对应的热度矩阵以及至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与t个采样时间对应的T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。采用本发明,可以充分挖掘影响视频热度与时间、空间、视频类型以及其他特征等多种因素之间的关系,提高视频热度预测模型的精确度,同时实现多个各空间区域以及多种视频类型的视频热度的批量预测。

Description

视频热度的预测方法及装置
技术领域
本发明涉及电子技术领域,尤其涉及一种视频热度的预测方法及装置。
背景技术
目前视频业务在全球范围内发展迅速,建立视频内容热度模型,并对视频内容热度进行预测,可以带来很多好处。如:CDN(Content Delivery Network,内容分发网络)厂商通过提前注入高热度的视频资源,可在降低运营成本的同时提升用户体验,增加用户黏性;广告商根据最热的视频内容设计最精准的广告,以提升广告投放效果;视频内容投资商可根据对视频内容热度的预测结果,选择最佳的时间和地点上映,以满足用户的需求并为投资者赢得更多的收益。然而,现有对视频内容热度的预测方法考虑的特征不够全面,且准确率较低,无法为基于视频内容热度的应用提供较好的支持。因此,设计一种高精度的视频内容热度预测方法成为目前亟待解决的问题。
发明内容
本发明实施例提供了一种视频热度的预测方法及装置,以期充分挖掘影响视频热度与时间、空间、视频类型以及其他特征等多种因素之间的关系,提高视频热度预测模型的精确度,同时实现多个各空间区域以及多种视频类型的视频热度的批量预测。
第一方面,本发明实施例提供了一种视频热度的预测方法,包括:
视频热度的预测装置获取第一视频类型的视频对象在t个采样时间对应的热度矩阵,热度矩阵为第一视频类型的视频对象分别在多个空间区域中对应采样时间的视频热度值所构成的矩阵;获取第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵,特征矩阵为第一视频类型的视频对象分别在多个空间区域的对应视频特征维度的视频特征值所构成的矩阵;将t个采样时间对应的热度矩阵以及至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与t个采样时间对应的T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。
在该技术方案中,视频热度的预测装置利用视频热度预测模型通过热度矩阵和特征矩阵对第一视频类型的视频对象分别在某一时刻时多个空间区域对应的视频热度进行预测,充分挖掘影响视频热度与时间、空间、视频类型以及其他特征等多种因素之间的关系,提高视频热度预测模型的精确度,从而提高对视频热度值的预测准确率。进一步地,热度矩阵和特征矩阵可以包含多个空间区域以及多种视频类型,无需针对每个空间区域或视频类型建立单独的视频热度预测模型,可以仅用本发明实施例中的视频热度预测模型就批量预测出各空间区域以及各种视频类型的热度预测值。
在第一方面的第一种可能的实现方式中,第一视频类型包括多个视频类型。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,多个空间区域中对应采样时间的视频热度值在热度矩阵中的位置与多个空间区域的地理位置分布对应。
在该技术方案中,视频热度值在热度矩阵中的位置与多个空间区域的地理位置分布对应,使视频热度预测模型确定地理位置的分布与视频热度值的关系。
结合第一方面或第一方面的第一种至第二种中任一可能的实现方式,在第一方面的第三种可能的实现方式中,视频热度预测模型包括时空热度模型、特征热度模型以及融合函数;视频热度的预测装置将t个采样时间对应的热度矩阵输入时空热度模型以获取第一输出矩阵;将至少一个视频特征维度的特征矩阵输入特征热度模型以获取第二输出矩阵;通过融合函数对第一输出矩阵以及第二输出矩阵进行融合,以获取T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,时空热度模型为卷积神经网络模型,特征热度模型为全连接神经网络模型。
结合第一方面或第一方面的第一种至第四种中任一可能的实现方式,在第一方面的第五种可能的实现方式中,获取第一视频类型的视频对象在t个采样时间对应的热度矩阵之前,视频热度的预测装置还获取多组训练样本,训练样本包括第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵、第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵和与t个训练采样时间对应的T0时刻的训练热度矩阵;其中,每组训练样本中的T0时刻的训练热度矩阵为与该组训练样本中的t个训练采样时间的训练热度矩阵对应的输出矩阵;t个训练采样时间与T0时刻的对应关系与t个采样时间与T1时刻的对应关系一致;基于训练样本,对构建的视频热度预测模型进行训练,确定训练后的视频热度预测模型。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,多组训练样本包括第一视频类型的相同视频对象的多组训练样本和第一视频类型的不同视频对象的多组训练样本中的至少一个。
结合第一方面的第五种或第六种可能的实现方式,在第一方面的第七种可能的实现方式中,视频热度的预测装置根据训练样本和构建的视频热度预测模型进行多次迭代。
结合第一方面的第五种至第七种中任一可能的实现方式,在第一方面的第八种可能的实现方式中,当训练的迭代次数达到次数阈值时,视频热度的预测装置结束对构建的视频热度预测模型的训练;或,当训练得到的视频热度预测模型的预测误差小于误差阈值时,视频热度的预测装置结束对构建的视频热度预测模型的训练,预测误差为训练得到的视频热度预测模型输出的热度预测值与训练样本中作为输出矩阵的热度矩阵对应的视频热度值之间的差值;确定当前训练得到的视频热度预测模型为训练后的视频热度预测模型。
结合第一方面或第一方面的第一种至第八种中任一可能的实现方式,在第一方面的第九种可能的实现方式中,获取第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵之前,视频热度的预测装置还获取第一视频类型的视频对象分别在多个空间区域的对应视频特征维度的视频特征参数信息;对视频特征参数信息进行数据预处理,得到处理后的视频特征值以构成特征矩阵,预处理包括数值类型转换和归一化处理中的至少一项。
在该技术方案中,视频热度的预测装置通过预处理使特征矩阵中的视频特征值是标准化的。
本发明第二方面提供了一种视频热度的预测装置。包括处理器、存储器以及收发器。处理器连接到存储器和收发器,例如处理器可以通过总线连接到存储器和收发器。收发器用于与其他设备进行通信。存储器用于存储程序代码等。处理器用于执行第一方面的部分或全部流程。
本发明第三方面提供了另一种视频热度的预测装置,包括获取模块和预测模块,可选的还包括模型训练模块和预处理模块,上述模块用于实现第二方面中的处理器。该视频热度的预测装置通过上述模块实现第一方面的部分或全部方法。
本发明的第四方面,提供了一种存储介质,该存储介质中存储了程序代码,该程序代码被计算设备运行时,执行第一方面或第一方面的任意一种实现方式提供的视频热度的预测方法。该存储介质包括但不限于快闪存储器(英文:flash memory),硬盘(英文:harddisk drive,缩写:HDD)或固态硬盘(英文:solid state drive,缩写:SSD)。
本发明的第五方面,提供了一种计算机程序产品,该计算机产品被计算设备运行时,执行第一方面或第一方面的任意一种实现方式提供的视频热度的预测方法。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1是本发明实施例提供的一种视频热度预测模型的示意图;
图2是本发明实施例提供的一种视频热度的预测方法的流程图;
图3是本发明实施例提供的一种热度矩阵的构造示意图;
图4是本发明实施例提供的另一种热度矩阵的构造示意图;
图5是本发明实施例提供的一种特征矩阵的构造示意图;
图6是本发明实施例提供的另一种特征矩阵的构造示意图;
图7是本发明实施例提供的一种视频热度预测的预测示例图;
图8是本发明实施例提供的一种视频热度的预测装置的结构示意图;
图9是本发明实施例提供了另一种视频热度的预测装置的结构示意图。
具体实施方式
下面结合本发明实施例中的附图对本发明实施例进行描述。
本申请实施例的技术方案适用于各种需要对视频热度值进行预测的场景中。本申请实施例中的方法和装置可以实现于各种终端设备、服务器、网络设备等,这里不作具体限定。
本发明实施例中的视频热度的预测装置中包括视频热度预测模型,视频热度预测模型是一种基于深度学习的预测装置。深度学习是机器学习中一种基于对数据进行表征学习的方法,其概念源于人工神经网络的研究。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
请参阅图1,图1是本发明实施例提供的一种视频热度预测模型。在本发明实施例中,视频热度预测模型具体可以包括时空热度模型、特征热度模型以及融合函数。其中,时空热度模型用于建立视频热度值与时间、空间之间的函数关系,特征热度模型用于建立视频热度值与视频特征值之间的函数关系,融合函数用于对经过时空热度模型和特征热度模型运算后的输出矩阵进行融合,以得到热度预测值构成的预测结果矩阵。进一步的,视频热度的预测装置还可以包括激活函数,激活函数的具体形式可以根据需要进行设计,激活函数用于保留视频热度值的部分特征,去除其他冗余特征,从而调整热度预测值得到符合要求的调整后的热度预测值。
在本发明实施例中,视频热度的预测装置在获取到热度矩阵和特征矩阵后,可以将上述两个矩阵输入视频热度预测模型中,从而获取到经过视频热度预测模型预测的热度预测值。
在本发明实施例中的一种可选的实现方案中,时空热度模型可以为卷积神经网络模型(Convolutional Neural Network,CNN),特征热度模型可以为全连接神经网络模型(Fully Connected Neural Network,FCNN)。
本发明实施例通过输入大量的样本数据对预先构建的视频热度预测模型进行训练学习,再对学习结果进行“再学习”,对不精确的热度预测值进行纠正,而对精确的热度预测值加以巩固,不断地进行迭代以逼近样本数据的结果,进而形成调整后的视频热度预测模型来实现预测。
请参见图2,图2是本发明实施例提供的一种视频热度的预测方法,该方法包括但不限于如下步骤:
S201,获取第一视频类型的视频对象在t个采样时间对应的热度矩阵。
第一视频类型可以指一种视频类型,也可以包括多种视频类型。例如,第一视频类型可以是喜剧类型这一种视频类型,第一视频类型也可以是喜剧类型、动作类型以及动画类型这三种视频类型。第一视频类型的视频对象则是指第一视频类型对应的电影、短片、广告等视频内容。例如,动作类型的视频对象就可以是007、速度与激情、王牌特工等动作电影。在本发明实施例中,第一视频类型的视频对象可以是相同的,也可以是不同的,根据需要预测的具体内容而定。例如,如果想要预测的是确切的某一类型的某一个视频的视频热度值,那么第一视频类型的视频对象就是该视频;如果想要预测的是某一类型所有视频的视频热度值,那么第一视频类型的视频对象可以是该类型中的任何视频。
在本发明实施例中,第一视频类型可以指待预测的视频对象的视频类型,也即当前需要视频热度的预测装置预测关于某个或者某些视频类型的视频对象的视频热度值时,就可以将该视频类型作为第一视频类型。
待预测视频热度值的区域可以被划分为多个空间区域,针对第一视频类型的视频对象,每个空间区域在不同的采样时间则会分别对应该空间区域在该采样时间的视频热度值。这里,在划分空间时,可以根据地理位置的边界来划分,也可以直接按照几何图形的边界来划分。例如,待预测视频热度值的区域可以为深圳市,那么可以根据南山区、福田区、罗湖区等区域的边界来将深圳市划分成多个空间区域;也可以根据深圳市的地图,以固定大小形状的正方形来将深圳市划分成多个空间区域。
热度矩阵是第一视频类型的视频对象分别在多个空间区域中对应采样时间的视频热度值所构成的矩阵。在本发明实施例中,热度矩阵是M*M的方阵,M是正整数,M的数值与待预测的空间区域的数量有关,可以自行设定。可以理解的,热度矩阵并不一定是单一的矩阵,t个采样时间对应的t个热度矩阵均为热度矩阵,也即热度矩阵的数量与采样时间的数量是一致的。
在本发明实施例中,t可以是大于或等于1的整数,也即热度矩阵可以是一个也可以是多个。具体来说,当t大于1时,t个采样时间之间的间隔可以根据需要预测的时间点来确定。例如,第一个采样时间为2017年1月1日1点,第二个采样时间点为2017年1月1日2点,第三个采样时间点为2017年1月1日3点,则预测出的视频热度值就可以是认为是2017年1月1日4点的热度预测值。又例如,第一个采样时间为2017年的第一周周一,第二个采样时间点为2017年的第二周周一,第三个采样时间点为2017年的第三周周一,则预测出的视频热度值就可以是认为是2017年的第四周周一的热度预测值。
需要说明的是,多个空间区域中对应采样时间的视频热度值在热度矩阵中的位置与多个空间区域的地理位置分布是对应的。例如,空间区域B在空间区域A的右边相邻位置,则在相应的热度矩阵中,空间区域B对应的视频热度值也在空间区域A的视频热度值的右边相邻位置。
进一步地,当第一视频类型包括多种时,每个空间区域则存在多种第一视频类型分别对应的视频热度值,同一空间区域的多种第一视频类型分别对应的视频热度值可以构成一个分块矩阵,那么不同空间区域的各第一视频类型分别对应的视频热度值在其对应的分块矩阵中的位置也是一致的。即在采样时间t1时,空间区域A中视频类型1对应的视频热度值在空间区域A对应的分块矩阵A1的第一个元素的位置,则空间区域B中视频类型1对应的视频热度值也在空间区域B对应的分块矩阵B1的第一个元素的位置,以此类推。需要说明的是,第一视频类型包括多种时,依然要使热度矩阵成为行列数相同的方阵,因此,分块矩阵实际也是方阵。这里需要说明的是,当第一视频类型的种类数量不足以构成方阵时,可以以补“0”的方式以满足方阵的条件。
举例来说,假设第一视频类型仅为一种,如图3所示,第一区域为当前待预测视频热度值的区域且被划分为4个空间区域,分别为空间区域A、空间区域B、空间区域C和空间区域D,其中,在采样时间t1采集到的数据中,第一视频类型的视频对象在空间区域A对应的视频热度值为1,第一视频类型的视频对象在空间区域B对应的视频热度值为1,第一视频类型的视频对象在空间区域C对应的视频热度值为3,第一视频类型的视频对象在空间区域D对应的视频热度值为7。那么,可以由此可以得到第一视频类型仅为一种的情况下,采样时间a对应的热度矩阵为如图3所示的矩阵。
假设第一视频类型包括四种,视频类型1—视频类型4,如图4所示,第一区域为当前待预测视频热度值的区域且被划分为4个空间区域,分别为空间区域A、空间区域B、空间区域C和空间区域D,其中,在采样时间t1采集到的数据中,视频类型1—视频类型4的视频对象在空间区域A对应的视频热度值分别为5、3、6、1,视频类型1—视频类型4的视频对象在空间区域B对应的视频热度值分别为1、2、3、1,视频类型1—视频类型4的视频对象在空间区域C对应的视频热度值分别为2、7、2、8,视频类型1—视频类型4的视频对象在空间区域D对应的视频热度值分别为4、4、9、7。那么,可以由此可以得到第一视频类型包括四种的情况下,采样时间a对应的热度矩阵为如图4所示的矩阵。
可以理解的,其他采样时间对应的热度矩阵的形式也与图3或图4相似,区别仅在于不同的采样时间下,视频热度值也可能不同,因此造成各采样时间对应的热度矩阵也不同。
在本发明实施例中,视频热度的预测装置可以先获取第一视频类型的视频对象在t个采样时间分别对应的视频热度值,并按照以上提到的对应关系构造成数量为t个的热度矩阵。
S202,获取第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵。
一个视频特征维度是指第一视频类型的视频对象的某一种视频特征,多个视频特征维度则是指第一视频类型的视频对象的多种视频特征。其中,本发明实施例中的视频特征维度是与视频对象的固定属性有关的一些视频特征类型,例如,视频对象的时长、视频对象的质量、视频对象的投资规模以及视频对象出品方等等。
特征矩阵为第一视频类型的视频对象分别在多个空间区域的对应视频特征维度的视频特征值所构成的矩阵。可以理解的,特征矩阵的数量与视频特征维度的数量是一致的,也即一个特征矩阵反映的是某一个视频特征维度的视频特征值,例如,视频对象的时长的视频特征维度对应第一特征矩阵,第一特征矩阵包含的是第一视频类型的视频对象分别在多个空间区域的视频对象的时长的视频特征值;视频对象的质量的视频特征维度对应第二特征矩阵,第二特征矩阵包含的是第一视频类型的视频对象分别在多个空间区域的视频对象的质量的视频特征值。
需要说明的是,特征矩阵也是M*M的方阵,M是正整数,M的数值可以自行设定,但须与热度矩阵保持一致。
在本发明实施例中,特征矩阵中的多个空间区域是与视频热度值中的多个空间区域一致的,并且每个空间区域对应的视频热度值与视频特征值分别在视频热度值与特征矩阵中的位置也是一致的,例如,空间区域A对应的视频热度值在热度矩阵中位于第一个矩阵元素,则空间区域A对应的视频特征值在特征矩阵中也位于第一个矩阵元素。
进一步地,与热度矩阵相似的,当第一视频类型包括多种时,每个空间区域则存在多种第一视频类型分别对应的视频特征值,同一空间区域的多种第一视频类型分别对应的视频特征值可以构成一个分块矩阵,那么不同空间区域的各第一视频类型分别对应的视频特征值在其对应的分块矩阵中的位置也是一致的。
需要说明的是,第一视频类型包括多种时,依然要使特征矩阵成为行列数相同的方阵,因此,分块矩阵实际也是方阵。这里需要说明的是,当第一视频类型的种类数量不足以构成方阵时,可以以补“0”的方式以满足方阵的条件。
特征矩阵的具体构造过程可以参见图5和图6,具体的说明可以参考S201中图3和图4所示的热度矩阵的构造过程,区别仅在于图3和图4展示的是采样时间t1时的热度矩阵的构造过程,而图5和图6展示的是视频特征维度a1下的特征矩阵的构造过程。
可以理解的,其他视频特征维度对应的特征矩阵的形式也与图5或图6相似,区别仅在于不同的视频特征维度下,视频特征值也可能不同,因此造成各视频特征维度对应的特征矩阵也不同。
在本发明实施例中,视频热度的预测装置可以先获取第一视频类型的视频对象分别在多个空间区域的对应视频特征维度的视频特征参数信息;然后,对视频特征参数信息进行数据预处理,得到处理后的视频特征值以构成特征矩阵。
其中,视频特征参数信息是指反映视频特征的各种信息,视频特征参数信息可能是字符类型、文字类型、连续变量类型等等,例如,视频对象的质量这个视频特征维度的视频特征参数信息可能是“质量优秀”、“质量中等”、“质量差”这样的文字类型。视频热度的预测装置获取到视频特征参数信息后,可以对视频特征参数信息进行数据预处理,从而将视频特征参数信息转化为视频特征值,并按照以上提到的对应关系构造成与至少一个视频特征维度相同数量的特征矩阵。具体来说,数据预处理可以包括数值类型转换和归一化处理中的至少一项。数值类型转换可以将字符类型、文字类型等非数值类型的视频特征参数信息转换成为数值类型,例如,将“质量优秀”、“质量中等”、“质量差”分别转换为“0.8”、“0.5”“0.2”这样的数值作为视频特征值。归一化处理可以将连续变量类型等的视频特征参数信息转换为[0,1]的区间内的数值作为视频特征值。从而使特征矩阵中的视频特征值是标准化的。
S203,将t个采样时间对应的热度矩阵以及至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与t个采样时间对应的T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。
视频热度预测模型是根据预先获取的多组训练样本训练得到的用于进行视频热度预测的模型,具体结构可以参见图1。视频热度的预测装置将t个采样时间对应的热度矩阵以及至少一个视频特征维度的特征矩阵输入视频热度预测模型,视频热度预测模型就可以输出与t个采样时间对应的T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。在一种可能的设计中,时空热度模型可以为卷积神经网络模型,特征热度模型为全连接神经网络模型。
具体来说,视频热度的预测装置可以将t个采样时间对应的热度矩阵输入时空热度模型以获取第一输出矩阵;将至少一个视频特征维度的特征矩阵输入特征热度模型以获取第二输出矩阵;通过融合函数对第一输出矩阵以及第二输出矩阵进行融合,以获取第一视频类型的视频对象分别在多个空间区域对应的热度预测值。其中,融合函数会根据之前训练出的权重值,对第一输出矩阵以及第二输出矩阵中的视频热度值依照权重值进行调整,然后进行融合。进一步的,视频热度的预测装置还可以包括激活函数,激活函数对融合后的视频热度值再进一步调整,得到最终的T1时刻时的热度预测值。这里,T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值可以以矩阵的形式输出,即第三输出矩阵,第三输出矩阵中的热度预测值与空间区域和视频类型的对应关系与热度矩阵和特征矩阵是一致的。
需要说明的是,t个采样时间与T1时刻的对应关系是根据视频热度预测模型在训练时建立的t个训练采样时间与T0时刻(即预测时刻)的对应关系确定的,例如,如果训练视频热度预测模型时构造的输入是2017年的第一周周一、2017年的第二周周一以及2017年的第三周周一这三个训练采样时间的训练热度矩阵,构造的输出是2017年的第四周周一,那么训练得到的视频热度预测模型就会根据这样的对应关系来预测。那么,如果想要用这个视频热度预测模型得到2017年的第八周周一的热度预测值,就可以输入第五周周一、2017年的第六周周一以及2017年的第七周周一这三个采样时间的热度矩阵。
结合图3-图6的举例,如图7所示,将t个采样时间对应的热度矩阵以及m个视频特征维度的特征矩阵输入视频热度预测模型,视频热度预测模型就可以输出第三输出矩阵,其中第三输出矩阵包括T1时刻时第一视频类型的视频对象分别在多个空间区域对应的热度预测值。
在此,将步骤S203中提及的视频热度预测模型的训练方法进行具体描述。
首先,视频热度的预测装置可以获取多组训练样本;
然后,基于所述训练样本,对构建的视频热度预测模型进行训练,确定训练后的视频热度预测模型。
在本发明实施例中,训练样本是用于训练视频热度预测模型的已知的训练特征矩阵和训练热度矩阵的集合,每组训练样本具体可以包括第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵、第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵和与t个训练采样时间对应的T0时刻的训练热度矩阵。其中,每组训练样本中的T0时刻的训练热度矩阵为与该组训练样本中的t个训练采样时间的训练热度矩阵对应的输出矩阵。需要说明的是,t个训练采样时间与T0时刻的对应关系与t个采样时间与T1时刻的对应关系是一致的,也就是说,在训练时,视频热度预测模型建立的是视频热度值在输入的t个训练采样时间与输出的T0时刻的关系,那么在预测时,视频热度预测模型也将根据该对应关系,确定输入的t个采样时间对应的预测时刻为T1。其中,训练热度矩阵和训练特征矩阵的具体构造可以参见图3-图6中热度矩阵和特征矩阵的构造。
也就是说,可以先构建一个视频热度预测模型,将训练样本中的第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵以及第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵作为视频热度预测模型的输入矩阵,将训练样本中的T0时刻的训练热度矩阵作为视频热度预测模型的输出矩阵,然后根据训练样本和构建的视频热度预测模型进行多次迭代,以使训练后的视频热度预测模型对训练样本中的输入矩阵进行预测得到的预测矩阵,能够最大程度地接近训练样本中的输出矩阵。
在本发明实施例中,多组训练样本可以包括第一视频类型的相同视频对象的多组训练样本和第一视频类型的不同视频对象的多组训练样本中的至少一个。可以这样理解,假设当前有两组训练样本,假设第一视频类型为喜剧类型,在一种可能中,第一组训练样本可以包括喜剧视频A在t个训练采样时间对应的训练热度矩阵,第二组训练样本可以包括喜剧视频B在t个训练采样时间对应的训练热度矩阵;在另一种可能中,第一组训练样本可以包括喜剧视频A在t个训练采样时间对应的训练热度矩阵,第二组训练样本可以包括喜剧视频A在其他t个训练采样时间对应的训练热度矩阵。也就是说,第一视频类型的视频对象可以是相同的,也可以是不同的,只要是第一视频类型的视频都可以作为视频对象。
在一种可能的设计中,当训练的迭代次数达到次数阈值时,可以结束对构建的视频热度预测模型的训练,并确定当前训练得到的视频热度预测模型为训练后的用于预测的视频热度预测模型。
在另一种可能的设计中,当训练得到的视频热度预测模型的预测误差小于误差阈值时,结束对构建的视频热度预测模型的训练。其中,预测误差为训练得到的视频热度预测模型输出的热度预测值与训练样本中作为输出矩阵的训练热度矩阵对应的视频热度值之间的差值。例如,设误差阈值为0.05,假设训练样本中的输出矩阵中的目标视频热度值为2,训练得到的视频热度预测模型的预测矩阵中与目标视频热度值对应的热度预测值为1.98,两者的差值即为0.02,小于误差阈值0.05,则可以将当前训练得到的视频热度预测模型作为训练后的用于预测的视频热度预测模型,完成对视频热度预测模型的训练。
进一步地,还可以测试数据集对视频热度预测模型的精度进行评估,测试数据集是用来测试模型预测能力的特征矩阵和热度矩阵的集合,可以和样本数据一样,也可以不一样。
在训练完成后,视频热度的预测装置就可以利用视频热度预测模型执行S201-S203的步骤,对视频热度进行预测。
在本发明实施例中,视频热度的预测装置利用视频热度预测模型通过热度矩阵和特征矩阵对第一视频类型的视频对象分别在某一时刻时多个空间区域对应的视频热度进行预测,充分挖掘影响视频热度与时间、空间、视频类型以及其他特征等多种因素之间的关系,提高视频热度预测模型的精确度,从而提高对视频热度值的预测准确率。进一步地,本发明方案的热度矩阵和特征矩阵可以包含多个空间区域以及多种视频类型,无需针对每个空间区域或视频类型建立单独的视频热度预测模型,可以仅用本发明实施例中的视频热度预测模型就批量预测出各空间区域以及各种视频类型的热度预测值。
上文主要从不同网元之间交互的角度对本发明实施例提供的方案进行了介绍。可以理解的是,视频热度的预测装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。结合本发明中所公开的实施例描述的各示例的单元及算法步骤,本发明实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的技术方案的范围。
本发明实施例可以根据上述方法示例对视频热度的预测装置进行功能模块或功能单元的划分,例如,可以对应各个功能划分各个功能模块或功能单元,也可以将两个或两个以上的功能集成在一个处理模块或处理单元中。上述集成的模块或单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块或单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。请参见以下具体介绍。
请参阅图8,图8是本发明实施例提供的一种视频热度的预测装置的结构示意图。该装置可以用于实现上述图2-图7的实施例中的视频热度的预测装置。如图8所示,该装置包括:
获取模块801,用于获取第一视频类型的视频对象在t个采样时间对应的热度矩阵,所述热度矩阵为第一视频类型的视频对象分别在多个空间区域中对应采样时间的视频热度值所构成的矩阵;
所述获取模块801还用于:获取所述第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵,所述特征矩阵为所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征值所构成的矩阵;
预测模块802,用于将所述t个采样时间对应的热度矩阵以及所述至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与所述t个采样时间对应的T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值。
可选的,所述第一视频类型包括多个视频类型。
可选的,所述多个空间区域中对应采样时间的视频热度值在所述热度矩阵中的位置与所述多个空间区域的地理位置分布对应。
可选的,所述视频热度预测模型包括时空热度模型、特征热度模型以及融合函数;
所述预测模块802具体用于:
将所述t个采样时间对应的热度矩阵输入所述时空热度模型以获取第一输出矩阵;
将所述至少一个视频特征维度的特征矩阵输入所述特征热度模型以获取第二输出矩阵;
通过所述融合函数对所述第一输出矩阵以及所述第二输出矩阵进行融合,以获取所述T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值。
可选的,所述时空热度模型为卷积神经网络模型,所述特征热度模型为全连接神经网络模型。
可选的,所述获取模块801还用于:获取多组训练样本,所述训练样本包括所述第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵、所述第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵和与所述t个训练采样时间对应的T0时刻的训练热度矩阵;其中,每组训练样本中的所述T0时刻的训练热度矩阵为与该组训练样本中的所述t个训练采样时间的训练热度矩阵对应的输出矩阵;所述t个训练采样时间与所述T0时刻的对应关系与所述t个采样时间与T1时刻的对应关系一致;
所述装置还包括:
模型训练模块803,用于基于所述训练样本,对构建的视频热度预测模型进行训练,确定训练后的所述视频热度预测模型。
可选的,所述多组训练样本包括所述第一视频类型的相同视频对象的多组训练样本和所述第一视频类型的不同视频对象的多组训练样本中的至少一个。
可选的,所述模型训练模块803具体用于:
根据所述训练样本和所述构建的视频热度预测模型进行多次迭代。
可选的,所述模型训练模块803具体用于:
当训练的迭代次数达到次数阈值时,结束对所述构建的视频热度预测模型的训练;或,当训练得到的视频热度预测模型的预测误差小于误差阈值时,结束对所述构建的视频热度预测模型的训练,所述预测误差为所述训练得到的视频热度预测模型的输出热度值与所述训练样本中作为输出样本的热度矩阵对应的视频热度值之间的差值;
确定当前训练得到的视频热度预测模型为训练后的所述视频热度预测模型。
可选的,所述获取模块801还用于:获取所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征参数信息;
所述装置还包括:
预处理模块804,用于对所述视频特征参数信息进行数据预处理,得到处理后的所述视频特征值以构成所述特征矩阵,所述预处理包括数值类型转换和归一化处理中的至少一项。
上述图9所示实施例中的视频热度的预测装置可以以图9所示的视频热度的预测装置900实现。如图9所示,为本发明实施例提供了另一种视频热度的预测装置的结构示意图,图9所示的视频热度的预测装置900包括:处理器901和收发器903,所述收发器903用于支持视频热度的预测装置900与其他设备之间的信息传输。处理器901和收发器903通信连接,例如通过总线相连。所述视频热度的预测装置900还可以包括存储器902。存储器902用于存储供视频热度的预测装置900执行的程序代码和数据,处理器901用于执行存储器902中存储的应用程序代码,以实现图2-图7所示实施例提供的视频热度的预测装置的动作。
需要说明的是,实际应用中视频热度的预测装置可以包括一个或者多个处理器,该视频热度的预测装置900的结构并不构成对本发明实施例的限定。
处理器901可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP),硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器902可以包括易失性存储器(volatile memory),例如随机存取存储器(random access memory,RAM);存储器902也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器902还可以包括上述种类的存储器的组合。
在本发明实施例中还提供了一种计算机存储介质,可以用于存储图8所示实施例中所述视频热度的预测装置所用的计算机软件指令,其包含用于执行上述实施例中为视频热度的预测装置所设计的程序。该存储介质包括但不限于快闪存储器、硬盘、固态硬盘。
在本发明实施例中还提供了一种计算机程序产品,该计算机产品被计算设备运行时,可以执行上述图8实施例中为视频热度的预测装置所设计的视频热度的预测方法。

Claims (18)

1.一种视频热度的预测方法,其特征在于,所述方法包括:
获取第一视频类型的视频对象在t个采样时间对应的热度矩阵,所述热度矩阵为第一视频类型的视频对象分别在多个空间区域中对应采样时间的视频热度值所构成的矩阵;
获取所述第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵,所述特征矩阵为所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征值所构成的矩阵;
将所述t个采样时间对应的热度矩阵以及所述至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与所述t个采样时间对应的T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值;
其中,所述视频热度预测模型包括时空热度模型、特征热度模型以及融合函数;
所述将所述t个采样时间对应的热度矩阵以及所述至少一个视频特征维度的特征矩阵输入视频热度预测模型,包括:
将所述t个采样时间对应的热度矩阵输入所述时空热度模型以获取第一输出矩阵;
将所述至少一个视频特征维度的特征矩阵输入所述特征热度模型以获取第二输出矩阵;
通过所述融合函数对所述第一输出矩阵以及所述第二输出矩阵进行融合,以获取所述T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值。
2.如权利要求1所述的方法,其特征在于,所述第一视频类型包括多个视频类型。
3.如权利要求1所述的方法,其特征在于,所述多个空间区域中对应采样时间的视频热度值在所述热度矩阵中的位置与所述多个空间区域的地理位置分布对应。
4.如权利要求1所述的方法,其特征在于,所述时空热度模型为卷积神经网络模型,所述特征热度模型为全连接神经网络模型。
5.如权利要求1-4任一项所述的方法,其特征在于,所述获取第一视频类型的视频对象在t个采样时间对应的热度矩阵之前,还包括:
获取多组训练样本,所述训练样本包括所述第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵、所述第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵和与所述t个训练采样时间对应的T0时刻的训练热度矩阵;其中,每组训练样本中的所述T0时刻的训练热度矩阵为与该组训练样本中的所述t个训练采样时间的训练热度矩阵对应的输出矩阵;所述t个训练采样时间与所述T0时刻的对应关系与所述t个采样时间与T1时刻的对应关系一致;
基于所述训练样本,对构建的视频热度预测模型进行训练,确定训练后的所述视频热度预测模型。
6.如权利要求5所述的方法,其特征在于,所述多组训练样本包括所述第一视频类型的相同视频对象的多组训练样本和所述第一视频类型的不同视频对象的多组训练样本中的至少一个。
7.如权利要求6所述的方法,其特征在于,所述基于所述训练样本,对构建的视频热度预测模型进行训练包括:
根据所述训练样本和所述构建的视频热度预测模型进行多次迭代。
8.如权利要求7所述的方法,其特征在于,所述确定训练后的所述视频热度预测模型包括:
当训练的迭代次数达到次数阈值时,结束对所述构建的视频热度预测模型的训练;或,当训练得到的视频热度预测模型的预测误差小于误差阈值时,结束对所述构建的视频热度预测模型的训练,所述预测误差为所述训练得到的视频热度预测模型输出的热度预测值与所述训练样本中作为输出矩阵的热度矩阵对应的视频热度值之间的差值;
确定当前训练得到的视频热度预测模型为训练后的所述视频热度预测模型。
9.如权利要求1-4任一项所述的方法,其特征在于,所述获取所述第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵之前,还包括:
获取所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征参数信息;
对所述视频特征参数信息进行数据预处理,得到处理后的所述视频特征值以构成所述特征矩阵,所述预处理包括数值类型转换和归一化处理中的至少一项。
10.一种视频热度的预测装置,其特征在于,所述装置包括:
获取模块,用于获取第一视频类型的视频对象在t个采样时间对应的热度矩阵,所述热度矩阵为第一视频类型的视频对象分别在多个空间区域中对应采样时间的视频热度值所构成的矩阵;
所述获取模块还用于:获取所述第一视频类型的视频对象对应的至少一个视频特征维度的特征矩阵,所述特征矩阵为所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征值所构成的矩阵;
预测模块,用于将所述t个采样时间对应的热度矩阵以及所述至少一个视频特征维度的特征矩阵输入视频热度预测模型,获取与所述t个采样时间对应的T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值;
其中,所述视频热度预测模型包括时空热度模型、特征热度模型以及融合函数;
所述预测模块具体用于:
将所述t个采样时间对应的热度矩阵输入所述时空热度模型以获取第一输出矩阵;
将所述至少一个视频特征维度的特征矩阵输入所述特征热度模型以获取第二输出矩阵;
通过所述融合函数对所述第一输出矩阵以及所述第二输出矩阵进行融合,以获取所述T1时刻时所述第一视频类型的视频对象分别在所述多个空间区域对应的热度预测值。
11.如权利要求10所述的装置,其特征在于,所述第一视频类型包括多个视频类型。
12.如权利要求10所述的装置,其特征在于,所述多个空间区域中对应采样时间的视频热度值在所述热度矩阵中的位置与所述多个空间区域的地理位置分布对应。
13.如权利要求10所述的装置,其特征在于,所述时空热度模型为卷积神经网络模型,所述特征热度模型为全连接神经网络模型。
14.如权利要求10-13任一项所述的装置,其特征在于,
所述获取模块还用于:获取多组训练样本,所述训练样本包括所述第一视频类型的视频对象对应的至少一个视频特征维度的训练特征矩阵、所述第一视频类型的视频对象在t个训练采样时间对应的训练热度矩阵和与所述t个训练采样时间对应的T0时刻的训练热度矩阵;其中,每组训练样本中的所述T0时刻的训练热度矩阵为与该组训练样本中的所述t个训练采样时间的训练热度矩阵对应的输出矩阵;所述t个训练采样时间与所述T0时刻的对应关系与所述t个采样时间与T1时刻的对应关系一致;
所述装置还包括:
模型训练模块,用于基于所述训练样本,对构建的视频热度预测模型进行训练,确定训练后的所述视频热度预测模型。
15.如权利要求14所述的装置,其特征在于,所述多组训练样本包括所述第一视频类型的相同视频对象的多组训练样本和所述第一视频类型的不同视频对象的多组训练样本中的至少一个。
16.如权利要求15所述的装置,其特征在于,所述模型训练模块具体用于:
根据所述训练样本和所述构建的视频热度预测模型进行多次迭代。
17.如权利要求16所述的装置,其特征在于,所述模型训练模块具体用于:
当训练的迭代次数达到次数阈值时,结束对所述构建的视频热度预测模型的训练;或,当训练得到的视频热度预测模型的预测误差小于误差阈值时,结束对所述构建的视频热度预测模型的训练,所述预测误差为所述训练得到的视频热度预测模型的输出热度值与所述训练样本中作为输出样本的热度矩阵对应的视频热度值之间的差值;
确定当前训练得到的视频热度预测模型为训练后的所述视频热度预测模型。
18.如权利要求10-13任一项所述的装置,其特征在于,
所述获取模块还用于:获取所述第一视频类型的视频对象分别在所述多个空间区域的对应视频特征维度的视频特征参数信息;
所述装置还包括:
预处理模块,用于对所述视频特征参数信息进行数据预处理,得到处理后的所述视频特征值以构成所述特征矩阵,所述预处理包括数值类型转换和归一化处理中的至少一项。
CN201711209868.2A 2017-11-24 2017-11-24 视频热度的预测方法及装置 Active CN110019937B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711209868.2A CN110019937B (zh) 2017-11-24 2017-11-24 视频热度的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711209868.2A CN110019937B (zh) 2017-11-24 2017-11-24 视频热度的预测方法及装置

Publications (2)

Publication Number Publication Date
CN110019937A CN110019937A (zh) 2019-07-16
CN110019937B true CN110019937B (zh) 2023-11-03

Family

ID=67186800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711209868.2A Active CN110019937B (zh) 2017-11-24 2017-11-24 视频热度的预测方法及装置

Country Status (1)

Country Link
CN (1) CN110019937B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113347464B (zh) * 2021-04-30 2022-09-30 北京奇艺世纪科技有限公司 一种视频播放流量预测方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN105787049A (zh) * 2016-02-26 2016-07-20 浙江大学 一种基于多源信息融合分析的网络视频热点事件发现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169040A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for recommending video

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN105787049A (zh) * 2016-02-26 2016-07-20 浙江大学 一种基于多源信息融合分析的网络视频热点事件发现方法

Also Published As

Publication number Publication date
CN110019937A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US20160259857A1 (en) User recommendation using a multi-view deep learning framework
KR102135477B1 (ko) 이미지 자동분류 방법 및 시스템
US11809455B2 (en) Automatically generating user segments
KR20180004749A (ko) 서비스 시나리오 매칭 방법 및 시스템
CN110070140B (zh) 基于多类别信息的用户相似性确定方法及装置
Bahubalendruni et al. An efficient stable subassembly identification method towards assembly sequence generation
CN105049290A (zh) 页面访问监测方法及装置
WO2024114034A1 (zh) 内容推荐方法、装置、设备、介质和程序产品
CN111460290A (zh) 信息的推荐方法、装置、设备和存储介质
CN113312563B (zh) 信息推荐方法、装置、设备及存储介质
CN112529068B (zh) 一种多视图图像分类方法、系统、计算机设备和存储介质
CN112989169A (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN110019937B (zh) 视频热度的预测方法及装置
CN115145391A (zh) 一种基于ai深度学习的虚拟现实跑步机自适应方法及系统
CN113407254B (zh) 表单生成方法、装置、电子设备及存储介质
CN103888498B (zh) 信息推送方法、装置、终端及服务器
CN107368923A (zh) 景点热度预测方法及装置
CN105022746A (zh) 一种字库生成的方法、服务器及系统
CN103559195A (zh) 一种搜索方法和终端
US10169508B2 (en) Efficient deployment of table lookup (TLU) in an enterprise-level scalable circuit simulation architecture
CN111062159B (zh) 一种无人机虚拟试验方法
CN112905892A (zh) 应用于用户画像挖掘的大数据处理方法及大数据服务器
CN112055076A (zh) 基于互联网的多功能智能监控方法、装置及服务器
CN115203577B (zh) 对象推荐方法、对象推荐模型的训练方法及装置
CN110928977A (zh) 语音信息的分享方法、系统、可读存储介质、服务端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant