CN111125429B - 一种视频推送方法、装置和计算机可读存储介质 - Google Patents

一种视频推送方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN111125429B
CN111125429B CN201911322216.9A CN201911322216A CN111125429B CN 111125429 B CN111125429 B CN 111125429B CN 201911322216 A CN201911322216 A CN 201911322216A CN 111125429 B CN111125429 B CN 111125429B
Authority
CN
China
Prior art keywords
video
time
pushed
pushing
aging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911322216.9A
Other languages
English (en)
Other versions
CN111125429A (zh
Inventor
朱朝悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911322216.9A priority Critical patent/CN111125429B/zh
Publication of CN111125429A publication Critical patent/CN111125429A/zh
Application granted granted Critical
Publication of CN111125429B publication Critical patent/CN111125429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种视频推送方法、装置和计算机可读存储介质;本发明实施例在接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;该方案可以提高视频推送的准确性。

Description

一种视频推送方法、装置和计算机可读存储介质
技术领域
本发明涉及通信技术领域,具体涉及一种视频推送方法、装置和计算机可读存储介质。
背景技术
近年来,随着互联网的飞速发展,越来越多的视频通过网络进行传播,传播过程通常是将视频内容上传或发布到内容平台,内容平台再将视频推送至第三方或者用户。由于不同的视频内容包含时效不一样的数据,视频的时效长短直接影响到视频推送的质量,因此,需要根据视频的时效确定推送时间来推送视频。现有的推送方法主要采用预设规则来匹配视频标题或者标签的时间关键词来确定视频的时效,或者通过时效识别模型识别视频内容的时效,基于视频的时效,确定推送时间来推送视频。
在对现有技术的研究和实践过程中,本发明的发明人发现采用预设规则匹配来确定时效时,规则覆盖面相对较小,而采用时效识别模型识别时效主要通过对视频内容的时效性进行分类,识别效果受到分类数量的影响较大,因此,会导致识别视频时效性的准确率降低,进而影响视频推送的准确性。
发明内容
本发明实施例提供一种视频推送方法、装置和计算机可读存储介质。可以提高视频推送的准确性。
一种视频推送方法,包括:
接收视频推送请求,所述视频推送请求携带待推送视频和待推送视频对应的特征信息;
对所述待推送视频内容的时效进行识别,得到所述待推送视频的初始推送时效;
在预设事件信息中筛选出所述特征信息对应的目标时间参数;
基于所述目标时间参数,对所述初始推送时效进行调整,得到所述待推送视频的推送时效;
根据所述推送时效,确定所述待推送视频的推送时间,并在所述推送时间将所述待推送视频进行推送。
相应的,本发明实施例提供一种视频推送装置,包括:
接收单元,用于接收视频推送请求,所述视频推送请求携带待推送视频和待推送视频对应的特征信息;
识别单元,用于对所述待推送视频内容的时效进行识别,得到所述待推送视频的初始推送时效;
筛选单元,用于在预设事件信息中筛选出所述特征信息对应的目标时间参数;
调整单元,用于基于所述目标时间参数,对所述初始推送时效进行调整,得到所述待推送视频的推送时效;
推送单元,用于根据所述推送时效,确定所述待推送视频的推送时间,并在所述推送时间将所述待推送视频进行推送。
可选的,在一些实施例中,所述筛选单元,具体可以用于在所述特征信息中提取关键词文本;在所述预设事件库中筛选出所述关键词文本对应的目标事件;在所述预设时间参数集中筛选出所述目标事件对应的时间参数,将所述时间参数作为所述特征信息对应的目标时间参数。
可选的,在一些实施例中,所述筛选单元,具体可以用于在所述预设事件库中筛选出存在所述关键词的至少一个候选事件;计算所述关键词文本与所述候选事件的事件名称的匹配度;根据所述匹配度,在所述候选事件中确定所述特征信息对应的目标事件。
可选的,在一些实施例中,所述筛选单元,具体可以用于根据所述匹配度的大小,对所述候选事件进行排序;在排序后的候选事件中筛选出所述匹配度最大,且所述匹配度超过预设匹配度阈值的事件名称对应的筛选后事件,将所述筛选后事件作为所述特征信息对应的目标事件。
可选的,在一些实施例中,所述筛选单元,具体可以用于计算所述关键词与所述候选事件的事件名称的初始匹配度;获取所述关键词的加权系数;根据所述关键词的加权系数,对所述初始匹配度进行加权,得到所述关键词的初始匹配度的加权值;将所述加权值进行累加,得到所述关键词文本与所述候选事件的事件名称的匹配度。
可选的,在一些实施例中,所述识别单元,具体可以用于采用训练后识别模型对所述待推送视频内容的时效进行识别,得到所述待推送视频的粗粒度时效;在所述特征信息和待推送视频内容中筛选出时间关键词,所述时间关键词为与时间相关的词;基于所述时间关键词,对所述粗粒度时效进行调整,得到所述待推送视频的初始推送时效。
可选的,在一些实施例中,所述识别单元,具体可以用于获取所述粗粒度时效对应的第一时间范围;识别所述时间关键词对应的第二时间范围;将所述第一时间范围和所述第二时间范围进行融合;根据融合后时间范围,确定所述待推送视频的初始推送时效。
可选的,在一些实施例中,所述调整单元,具体可以用于在所述目标时间参数中获取基准时间;计算所述基准时间与当前时间的差值;获取所述初始推送时效的第三时间范围;根据所述差值和所述基准时间,对所述第三时间范围进行调整,以得到待推送视频的推送时效。
可选的,在一些实施例中,所述推送单元,具体可以用于根据所述基准时间,在预设推送等级中匹配所述推送时效对应的目标推送等级;获取所述推送时效对应的第四时间范围;根据所述目标推送等级,在所述第四时间范围内,选择所述待推送视频的推送时间;在所述推送时间将所述待推送视频进行推送。
此外,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的视频推送方法。
此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种视频推送方法中的步骤。
本发明实施例在接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;由于该方案在对视频内容的时效进行识别的基础上,采用了在预设事件库中筛选的目标时间参数对初始推送时效进行调整,从而得到视频的推送时效,提高了识别视频时效的准确率,进而根据推送时效确定该视频的推送时间,并进行推送,可以大大提高视频推送的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的视频推送方法的场景示意图;
图2是本发明实施例提供的视频推送方法的流程示意图;
图3是本发明实施例提供的识别视频内容时效的流程示意图;
图4是本发明实施例提供的视频推送方法的另一流程示意图;
图5是本发明实施例提供的视频推送请求页面的示意图;
图6是本发明实施例提供的视频推送装置的结构示意图;
图7是本发明实施例提供的视频推送装置的识别单元的结构示意图;
图8是本发明实施例提供的视频推送装置的筛选单元的结构示意图;
图9是本发明实施例提供的视频推送装置的推送单元的结构示意图;
图10是本发明实施例提供的视频推送装置的另一接收示意图;
图11是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种视频推送方法、装置和计算机可读存储介质。其中,该视频推送装置可以集成在电子设备中,该电子设备可以是服务器。
例如,参见图1,以视频推送装置集成在电子设备中为例,电子设备接收用户或第三方信息流平台发送的视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息。一方面,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,另一方面,在预设事件信息中筛选出特征信息对应的目标时间参数(用于对时效进行精准判断和调整用的参数)。基于筛选出的目标时间参数对初始推送时效进行调整,得到待推送视频的推送时效。根据推送时效,确定待推送视频的推送时间,然后,在推送时间将待推送视频推送至用户终端或者第三方推荐平台等。
所谓推送时效,可以理解为视频内容在一段时间内具有一定效果,效果是依靠用户对视频内容的感兴趣度来衡量。比如,以体育赛事视频内容为例,假设待推送视频为比赛前的赛前采访视频,赛前采访视频从产生一直到比赛前,用户都会对它感兴趣,到了比赛时,很显然用户更加关心的是比赛中的相关视频,此时,赛前采访视频的时效已经过期,在此,可以得出该赛前采访视频的时效可以为从它产生到比赛开始之前的这一段时间,如果该视频是在比赛前5小时前产生的,则可以认为该赛前采访视频的时效为5小时。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从视频推送装置的角度进行描述,该视频推送装置具体可以集成在电子设备中,该电子设备可以是服务器。
一种视频推送方法,包括:
接收视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
如图2所示,该视频推送方法的具体流程如下:
101、接收视频推送请求。
其中,视频推送请求携带待推送视频和待推送视频对应的特征信息。待推送视频可以为视频生产者将视频上传至网络之后,经过审核、分类和贴标签等操作后,还未确定推送时间而未推送的视频。该视频可以为体育、财经、动画和游戏等各类符合国家法律法规的视频。待推送视频对应的特征信息可以为该视频的作者、标题、上传时间、上传该视频的终端的身份标识、分类结果或标签等。
例如,接收视频推送请求的方式可以有多种,比如,可以通过视频推送页面接收视频推送请求,用户在视频推送页面录入特征信息,并上传待推送视频。又比如,还可以通过视频数据库或第三方信息平台接收视频推送请求,譬如,用户将待推送视频和特征信息上传至视频数据库或第三方信息平台,视频数据库或者第三方信息平台再发送视频推送请求至视频推送装置,用户还可以只上传待推送视频,由第三方信息平台对待推送视频进行特征提取,提取到特征信息,将特征信息和待推送视频发送至视频推送装置。
102、对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效。
其中,时效可以理解为用户对视频感兴趣的有效期,比如,存在用户在一段时间内对该视频感兴趣,则可以认为这一段时间为该视频的有效期。针对当下实事或者热点话题,都存在一个关注度的问题,时效可以理解为关注度持续的时间。
例如,可以采用时效识别模型和规则匹配相融合的方式来识别待推送视频的初始推送时效,识别过程如图3所示,具体可以如下:
S1、采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效。
其中,粗粒度时效可以为时间范围较大且可以存在多个时间范围的时效,粗粒度时效的准确性可能存在一定的误差。
例如,可以提取待推送视频的视频帧,对视频帧的内容进行识别,识别过程主要为视频帧的内容进行时效性分类,比如,可以采用逻辑回归识别模型(logistic regression,LR)、梯度提升决策树识别模型(Gradient Boosting Decision Tree,GBDT)、随机森林识别模型、卷积神经网络、循环神经网络(Recurrent Neural Network,RNN)等识别模型对视频帧的内容进行时效性分类,比如,预先设定多个时效类型,譬如,十分钟、半小时、一小时、两小时、五小时、八小时、十小时、一天、两天、一周、一个月等时效类型。采用识别模型对待推送视频的视频帧的内容的时效进行分类,判断该待推送视频的视频帧对应的时效类型,最后融合所有视频帧的时效分类,可以得到待推送视频的粗粒度时效。
其中,训练后识别模型可以由多个视频内容样本训练而成,具体可以由其他设备进行训练后,提供给该视频推送装置,或者,也可以由该视频推送装置自行训练,即步骤“采用训练后识别模型对视频内容的时效进行识别”之前,该视频推送方法还可以包括:
采集多个视频内容样本,该视频内容样本包括已标注时效分类的视频内容,采用预设识别模型对视频内容样本的时效进行预测,得到视频内容样本的时效分类的预测结果,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。
例如,可以通过数据库、网络或者视频内容采集设备采集多个视频作为原始视频内容样本,对原始视频内容样本进行预处理,比如,对视频进行裁剪、压缩或分帧等操作,以得到满足该预设识别模型的输入标注的视频内容样本,然后对这些预处理后的视频内容样本进行时效分类的标注,得到标记后的视频内容样本。采用预设识别模型对视频内容样本的时效分类进行预测,得到该视频内容样本的预测结果。可以通过插值损失函数,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。
S2、在特征信息中和待推送视频内容中筛选出时间关键词。
其中,时间关键词可以为与时间相关的词,比如,一天、十分钟、今天、明天或后天等词。
例如,在特征信息中,可以将预设时间关键词作为查询条件,在特征信息中查询,当查询到特征信息中存在与预设时间关键词中任一词相同的词,将这类词作为时间关键词。在视频内容中,可以通过对视频帧中的文本进行识别,将识别出的文本与预设时间关键词进行匹配,将匹配成功的词作为时间关键词。
S3、基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。
例如,根据当前时间,获取粗粒度时效对应的第一时间范围,第一时间范围可以为当前时间至距离当前时间长度为粗粒度时效的时间。识别时间关键词对应的第二时间范围,第二时间范围可以当前时间至时间关键词对应的时效的时间。将第一时间范围和第二时间范围进行融合,融合的过程主要是对时间范围的右边时间进行调整,在调整之前,需要比较第一时间范围和第二时间范围的右边时间的关系,再来调整,当调整完成后,可以得到待推送视频的初始推送时效。
103、在预设事件信息中筛选出特征信息对应的目标时间参数。
其中,目标时间参数可以为预设事件的发生时间、结束时间和持续时间等时间参数。比如,某一项体育赛事的开始时间、赛事持续时间和结束时间等参数。
例如,通过在预设事件信息的预设事件库中筛选出特征信息对应的目标事件,然后,在预设时间参数集中筛选出目标事件对应的时间参数,将该时间参数作为特征信息对应的目标时间参数,具体过程如下:
C1、在特征信息中提取关键词文本。
其中,关键词文本可以为关键词的文本信息,通常包括多个关键词。
所谓关键词,可以为待推送视频的标题和标签中存在的词,比如,以待推送视频的标题为第二十届成年男子足球比赛为例,则关键词可以为第二十届、成年男子、足球和比赛等。又比如,以待推送视频的标签为男足和比赛,则关键词可以为男足和比赛等。
例如,对特征信息进行分类,提取待推送视频的标题和标签等信息,将这些信息作为关键词文本。在分类中筛选出待推送视频的标题和标签等信息,将这些信息作为关键词文本。
C2、在预设事件库中筛选出关键词文本对应的目标事件。
其中,预设事件库为预先设置的存储有多个事件的数据库。比如,以体育赛事为例,预设赛事库可以为在当前时间之前或之后一段时间内所有赛事信息,赛事库中包括赛事的名称、举办地点和赛事简介等信息。
所谓事件,可以为预先约定会发生的事情,比如,可以为比赛的赛程信息,还可以为会议信息、节日信息等。
例如,在预设事件库中筛选出关键词文本对应的目标事件,具体过程可以如下:
(1)在预设事件库中筛选出存在关键词的至少一个候选事件。
例如,以关键词为查询条件,在预设事件库中筛选出存在关键词的至少一个候选事件。
(2)计算关键词文本与候选事件的事件名称的匹配度。
其中,匹配度可以为关键词文本与候选事件的事件名称的相关度。
例如,计算关键词文本与候选事件的事件名称的匹配度,比如,可以采用BM25算法(一种对相关度进行打分的算法)来计算关键词文本与事件名称的匹配度,具体计算过程可以如下:
D1、计算关键词与候选事件的事件名称的初始匹配度。
例如,关键词文本中包括多个关键词,所以需要计算每个关键词与候选事件的事件名称的初始匹配度。具体计算公式如下:
Figure GDA0004175989090000091
Figure GDA0004175989090000092
其中,R(qi,d)为关键词qi与事件名称d的初始匹配度,k1、k2和b为调节因子,通过根据经验设置,一般取k1=2,k2=1,b=0.75,fi为关键词在事件名称中出现的频率,qfi为关键词在关键词文本中出现的频率,通常qfi=1,dl为事件名称的文本长度,avgdl为所有候选事件的事件名称的平均文本长度。因此,公式可以简化为:
Figure GDA0004175989090000101
根据公式计算出关键词文本对候选事件中每一个事件名称的初始匹配度。
D2、获取关键词的加权系数。
例如,获取关键词的加权系数,比如,通常采用每个关键词在事件名称中的IDF值(一种加权值),具体公式如下:
Figure GDA0004175989090000102
其中,N为事件名称的总数,n(qi)为包含该关键词的事件名称的文档数,0.5为调教系数,主要是为了避免n(qi)为0的情况。
其中,IDF值主要通过词频-逆向文件频率算法(Term Frequency–InverseDocument Frequency,TF-IDF)计算得来,其中TF为词频,IDF为逆向文件频率。
Figure GDA0004175989090000103
其中,ni,j为关键词在总的事件名称中出现的次数,∑knk,j为事件名称中所有关键词出现的次数。
Figure GDA0004175989090000104
其中,|D|为候选事件库的事件名称总数,|{j:ti∈dj}|表示包含关键词ti的事件名称的数量。
根据上述公式可以得到关键词文本中每个关键词的加权系数。
D3、根据关键词的加权系数,对初始匹配度进行加权,得到关键词的初始匹配度的加权值,并将加权值进行累加,得到关键词文本与候选事件的事件名称的匹配度。
例如,根据关键词的加权系数,对初始匹配度进行加权,得到关键词的初始匹配度的加权值,并将加权值进行累加,具体公式如下:
Figure GDA0004175989090000111
其中,Score(q,d)为关键词文本与候选事件中一个事件的事件名称的匹配度,wi为加权系数,一般默认为IDF值,R(qi,d)为关键词文本中每个关键词对该事件名称的初始匹配度。
当候选事件中存在多个事件时,可以计算关键词文本对每个事件的事件名称的匹配度。
(3)根据匹配度,在候选事件中确定特征信息对应的目标事件。
例如,可以根据匹配度的大小,对候选事件进行排序,在排序后的候选事件中筛选出匹配度最大,且匹配度超过预设匹配度阈值的事件名称对应的筛选后事件,将筛选后事件作为特征信息对应的目标事件。
C3、在预设时间参数集中筛选出目标事件对应的时间参数,将该时间参数作为特征信息对应的目标时间参数。
其中,预设时间参数集与预设事件库存在映射关系,比如,以预设事件库为体育赛事库,则预设事件参数集中主要包括每场比赛对应的时间参数,譬如,开赛时间、比赛持续时间和比赛结束时间等参数信息。
例如,在预设时间参数集中筛选出目标事件对应的时间参数,比如,也预设事件库为体育赛事库为例,根据确定的特征信息对应的目标赛事,在预设时间参数集中筛选出该目标赛事对应的开赛时间、结束时间和持续时间等时间参数。将这些时间参数作为目标时间参数。
104、基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效。
例如,在目标时间参数中获取基准时间,比如,在目标时间参数中可以用作基准的时间,以会议库为例,基准时间可以为会议开幕时间和闭幕时间。计算基准时间与当前时间的差值,主要计算距离当前时间,会议还有多长时间开幕和闭幕。获取初始推送时效的第三时间范围,根据基准时间与当前时间的差值和基准时间,对第三时间范围进行调整,调整过程主要是通过第三时间范围的右边时间与基准时间进行对比,来判断待推送视频属于会议的哪一个阶段的视频,比如,可以为会议开幕前视频、会议进行中的视频和会议闭幕后视频等。如果待推送视频为会议前视频,则可以将第三时间范围中的右边时间调整至会议开幕前的时间,同理,待推送视频为会议进行中视频,则可以将第三时间的右边时间调整至会议闭幕时间之前;待推送视频为会议后视频,则可以在预设会议信息中筛选下一次会议举办的时间,可以适当将第三时间范围的右边时间延长至下次会议开幕时间之前。
105、根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
(1)根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级。
其中,推送等级可以为对待推送视频推送的优先等级,比如,可以设定为三级,第一等级可以为最高等级,最高等级对应的推送条件为立即推送,第二等级次之,对应的推送条件为5分钟或者10分钟之内推送,第三等级为最低等级,最低等级对应的推送条件可以为半小时或者一小时内推送。推送等级可以根据实际应用需要进行设定,相对于的推送条件也可以根据实际应用需要来进行设定。
例如,根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级,比如,可以根据待推送视频的时效和视频内存大小赋予不同的加权系数,根据加权系数,对推送时效进行加权,将加权值与预设推送等级对应的值进行比较,根据比较结果,获取待推送视频对应的目标推送等级。
(2)获取推送时效对应的第四时间范围,
例如,以推送时效为10小时,当前时间为下午15:00为例,则推送时效对应的第四时间范围为今天下午15:00至明天上午1:00。
(3)根据目标推送等级,在第四时间范围内容,选择待推送视频的推送时间。
例如,按照目标推送等级对应的推送条件,在第四时间范围内选择待推送视频的推送时间,推送时间可以为一个特定的时间点,还可以为一段时间范围。当待推送视频的时效短,内存小时,可以选择一个特定的时间点,将该待推送视频进行推送。当待待推送视频的时效长或者内存大时,由于受到外部传输速度等的影像,不能保证在特定时间点传输的话,可以设定一个时间范围进行推送。
(4)在推送时间将待推送视频进行推送。
例如,根据选择的推送时间进行推送,假设,推送时间为一个特点的时间点,可以在这个时间点将待推送视频进行推送,推送给需要该视频的用户终端或者第三方推荐平台等,如果待推送视频的内存超过预设内存阈值时,可以将待推送视频存储至视频数据库,将待推送视频的特征信息和存储地址推送至用户终端或者第三方推荐平台,还可以对待推送视频进行压缩,将压缩后的待推送视频推送至用户终端或者第三方推荐平台。假设,推送时间为一个时间范围时,可以根据待推送视频的内存大小,在时间段内分别进行推送,内存大的可以优先推送,推送方式与上文一样,可以直接推送,也可以压缩后再推送,还可以存储至第三方数据库,至推送特征信息和存储地址即可。
由以上可知,本申请实施例在接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;由于该方案在对视频内容的时效进行识别的基础上,采用了在预设事件库中筛选的目标时间参数对初始推送时效进行调整,从而得到视频的推送时效,提高了识别视频时效的准确率,进而根据推送时效确定该视频的推送时间,并进行推送,可以大大提高视频推送的准确性。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该视频推送装置具体集成在电子设备,预设事件信息为预设体育赛事信息,预设事件库为体育赛事库为例进行说明,该电子设备可以为服务器等设备。
如图4所示,一种视频推送方法,具体流程如下:
201、电子设备接收视频推送请求。
例如,电子设备可以通过视频推送页面接收视频推送请求,譬如,采用如图5所述的视频推送请求页面,用户在视频推送请求页面的基础特征录入接口录入待推送视频的特征信息,该特征信息可以为视频作者、标题,在个性特征选择控件中选择该待推送视频的分类结果和标签类型等信息,在视频推送请求页面的视频上传控件上传待推送视频,视频推送装置接收到该视频推送请求,并将用户在视频推送请求页面录入的基础特征和选择的个性特征作为特征信息。又比如,还可以通过视频数据库或第三方信息流平台接收视频推送请求,譬如,用户将待推送视频上传至视频分享平台或者第三方信息流平台,视频分享平台或者第三方信息流平台对该待推送视频进行审核、提取特征信息、分类和贴标签等操作后,生成视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息,将视频推送请求发发送至视频推送装置,如果待推送视频内存较大时,视频分享平台或第三方信息流平台还可以将待推送视频进行压缩等预处理后发送至视频推送平台,视频分享平台或第三方信息流平台还可以不在视频推送请求中添加待推送视频,而是添加待推送视频在视频数据库中的存储地址,视频推送装置根据存储地址在视频数据库中获取该待推送视频等。
202、电子设备采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效。
例如,电子设备可以提取待推送视频的视频帧,对视频帧的内容进行识别,识别过程主要为视频帧的内容进行时效性分类,比如,可以采用LR、GBDT、随机森林识别模型、卷积神经网络、RNN等识别模型对视频帧的内容进行时效性分类,电子设备采用识别模型对待推送视频的视频帧的内容的时效进行分类,判断该待推送视频的视频帧对应的时效类型,最后融合所有视频帧的时效分类,可以得到待推送视频的粗粒度时效,比如,在图像帧中识别与时间相关的图像或关键词等,根据识别的与时间相关的图像或关键词,得到每一个视频帧的时效分类,还可以直接在视频帧中筛选存在与时间相关的图像或关键词的候选视频帧,对候选视频帧的内容进行分析,得到候选视频帧的粗粒度时效,譬如,第一帧的时效分类为2小时,第二帧的时效分类为3小时,第三帧的时效分类为2小时。将视频帧的时效进行融合,将融合后的时效分类作为待推送视频的粗粒度时效,比如,可以选择出现次数最多的时效分类作为融合后的粗粒度时效,譬如,在2小时、3小时和2小时中选择两小时为粗粒度时效,还可以选在时效分类最大的时效为粗粒度时效,譬如,在2小时、3小时和2小时中,选择3小时为粗粒度时效,还可以对三个时效分类求平均值,譬如,计算2小时、3小时和2小时的平均值为2.33小时,将2.33小时作为粗粒度时效。
其中,训练后识别模型可以由多个视频内容样本训练而成,具体可以由其他设备进行训练后,提供给该视频推送装置,或者,也可以由该视频推送装置自行训练,即步骤“采用训练后识别模型对视频内容的时效进行识别”之前,该视频推送方法还可以包括:
采集多个视频内容样本,该视频内容样本包括已标注时效分类的视频内容,采用预设识别模型对视频内容样本的时效进行预测,得到视频内容样本的时效分类的预测结果,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。
例如,可以通过数据库、网络或者视频内容采集设备采集多个视频作为原始视频内容样本,对原始视频内容样本进行预处理,比如,对视频进行裁剪、压缩或分帧等操作,以得到满足该预设识别模型的输入标注的视频内容样本,然后对这些预处理后的视频内容样本进行时效分类的标注,得到标记后的视频内容样本。采用预设识别模型对视频内容样本的时效分类进行预测,得到该视频内容样本的预测结果。可以通过插值损失函数,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。比如,具体可以如下:
采用Dice函数(一种损失函数),根据该视频内容样本的标注结果和预测结果对该预设识别模型中用于时效分类的参数进行调整,得到训练后识别模型。
可选的,为了提高时效分类的精确性,除了采用Dice函数之外,还可以采用其他的损失函数如交叉熵损失函数来进行收敛,具体可以如下:
采用交叉熵损失函数,根据该视频内容样本的标注结果和预测结果对该预设识别模型中用于时效分类的参数进行调整,以及通过插值损失函数,根据该视频内容样本的标注结果和预测结果对该预设识别模型中用于时效分类的参数进行调整,得到训练后识别模型。
203、电子设备在特征信息和待推送视频内容中筛选出时间关键词。
例如,电子设备对于特征信息中的时间关键词的筛选,可以设定与时间相关的词作为查询条件,根据查询条件,在特征信息中查询命中查询条件的词,将这些词作为时间关键词,比如,可以设定一天、十分钟、今天、明天或后天等词作为查询条件,在特征信息中查询是否存在上述查询条件中预设的词,如果存在相同的词,将这些词作为时间关键词。电子设备对于待推送视频内容中时间关键词的筛选,可以通过对待推送视频的图像帧中的文本进行识别,将识别出的文本与预设时间关键词进行匹配,比如,可以将一天、十分钟、今天、明天或后天等有时间相关的词作为预设时间关键词进行匹配,将匹配成功的词作为时间关键词。
204、电子设备基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。
例如,以粗粒度时效为一天为例,假设当前时间为15:00,则粗粒度时效对应的时间范围为今天15:00至明天15:00。识别时间关键词对应的第二时间范围,比如,对应的时间关键词为三小时后,还是以当前时间为15:00为例,则时间关键词对应的第二时间范围为今天15:00至18:00。将第一时间范围和第二时间范围进行融合,比如,时间范围的左边值为今天15:00,时间范围的右边值分别为今天18:00和明天15:00,比较这两个时间,可以发现今天18:00在明天15:00之前,此时融合过程,可以为将粗粒度时效对应的第一时间范围进行缩小,缩小至今天18:00,可以得到融合后时间范围为今天15:00至今天18:00。根据融合后时间范围,确定待推送视频的初始推送时效,比如,融合后时间范围为今天15:00至今天18:00,时间长度为3小时,可以确定待推送视频的初始推送时效就为3小时。
205、电子设备在预设体育赛事中筛选出特征信息对应的目标时间参数。
例如,电子设备可以通过在预设体育赛事信息的体育赛事库中筛选出特征信息对应的目标赛事,然后,在预设时间参数集中筛选出目标赛事对应的时间参数,将该时间参数作为特征信息对应的目标时间参数,具体过程如下:
E1、电子设备在特征信息中提取关键词文本。
例如,电子设备对特征信息中的内容进行分类,可以分为标题、作者、上传终端的身份标识、视频内容分类结果、标签等,在分类中筛选出待推送视频的标题和标签等信息,将这些信息作为关键词文本。
E2、在体育赛事库库中筛选出关键词文本对应的目标赛事。
例如,在体育赛事库中筛选出关键词文本对应的目标赛事,具体过程可以如下:
(1)电子设备在体育赛事库中筛选出存在关键词的至少一个候选赛事。
例如,以关键词为查询条件,在体育赛事库中筛选出存在关键词的至少一个候选赛事,比如,以关键词为球员张X、教练李X和球队名称为第一队为例,在体育赛事库中查询包含这三个关键词中任一个的事件,将查询到的事件作为候选事件,譬如,查询到第一事件中包含球员张X,第二事件中包含教练李X和球队名称为第一队,第三事件中包含球员张X、教练李X和球队名称为第一队,则可以将第一事件、第二事件和第三事件作为候选事件。
(2)电子设备计算关键词文本与候选赛事的赛事名称的匹配度。
例如,计算关键词文本与候选赛事的赛事名称的匹配度,比如,可以采用BM25算法来计算关键词文本与赛事名称的匹配度,具体计算过程可以如下:
A1、电子设备计算关键词与候选赛事的赛事名称的初始匹配度。
例如,关键词文本中包括多个关键词,所以需要计算每个关键词与候选赛事的赛事名称的初始匹配度。具体计算公式如下:
Figure GDA0004175989090000171
/>
Figure GDA0004175989090000172
其中,R(qi,d)为关键词qi与赛事名称d的初始匹配度,k1、k2和b为调节因子,通过根据经验设置,一般取k1=2,k2=1,b=0.75,fi为关键词在赛事名称中出现的频率,qfi为关键词在关键词文本中出现的频率,通常qfi=1,dl为赛事名称的文本长度,avgdl为所有候选赛事的赛事名称的平均文本长度。因此,公式可以简化为:
Figure GDA0004175989090000181
根据公式计算出关键词文本对候选赛事中每一个赛事名称的初始匹配度。
A2、电子设备获取关键词的加权系数。
例如,电子设备获取关键词的加权系数,比如,通常采用每个关键词在赛事名称中的IDF值,具体公式如下:
Figure GDA0004175989090000182
其中,N为赛事名称的总数,n(qi)为包含该关键词的赛事名称的文档数,0.5为调教系数,主要是为了避免n(qi)为0的情况。
其中,IDF值主要通过词频-逆向文件频率算法(Term Frequency–InverseDocument Frequency,TF-IDF)计算得来,其中TF为词频,IDF为逆向文件频率。
Figure GDA0004175989090000183
其中,ni,j为关键词在总的赛事名称中出现的次数,∑knk,j为赛事名称中所有关键词出现的次数。
Figure GDA0004175989090000184
其中,|D|为候选赛事库的赛事名称总数,|{j:ti∈dj}|表示包含关键词ti的赛事名称的数量。
根据上述公式可以得到关键词文本中每个关键词的加权系数。
A3、电子设备根据关键词的加权系数,对初始匹配度进行加权,得到关键词的初始匹配度的加权值,并将加权值进行累加,得到关键词文本与候选赛事的赛事名称的匹配度。
例如,根据关键词的加权系数,对初始匹配度进行加权,得到关键词的初始匹配度的加权值,并将加权值进行累加,具体公式如下:
Figure GDA0004175989090000191
其中,Score(q,d)为关键词文本与候选赛事中一个赛事的赛事名称的匹配度,wi为加权系数,一般默认为IDF值,R(qi,d)为关键词文本中每个关键词对该赛事名称的初始匹配度。
当候选赛事中存在多个赛事时,可以计算关键词文本对每个赛事的赛事名称的匹配度。
(3)根据匹配度,电子设备在候选赛事中确定特征信息对应的目标赛事。
例如,可以根据匹配度的大小,对候选赛事进行排序,在排序后的候选赛事中筛选出匹配度最大,且匹配度超过预设匹配度阈值的赛事名称对应的筛选后赛事,比如,候选赛事中存在三个赛事,第一赛事、第二赛事和第三赛事,其中,第一赛事的匹配度为75%,第二赛事的匹配度为40%,第三赛事的匹配度为60%,则筛选出匹配度最大的赛事为第一赛事,还需要检验第一赛事的匹配度是否超过预设匹配阈值,假设预设匹配阈值为70%,则可以认定第一赛事为筛选后赛事,将筛选后赛事作为特征信息对应的目标赛事。
E3、电子设备在预设时间参数集中筛选出目标事件对应的时间参数,将该时间参数作为特征信息对应的目标时间参数。
例如,电子设备根据确定的特征信息对应的目标赛事,在预设时间参数集中筛选出该目标赛事对应的开赛时间、结束时间和持续时间等时间参数。将这些时间参数作为目标时间参数。
其中,针对预设体育信息的构建,电子设备可以采用爬取体育平台上的赛事信息,比如,可以从直播吧等体育平台上去爬取该体育平台上的赛事信息,将赛事信息进行分类,根据赛事信息中的赛事名称、举办地点、举办组织和赛事简介等信息构建体育赛事库,将比赛相对应的开赛时间、结束时间和持续时间等构建预设时间参数集,在此,可以确定体育赛事库和预设时间参数集存在映射关系,体育赛事库中的目标赛事存在对应的预设目标时间参数。在爬取体育平台的赛事信息时,可以设置为定期爬取,比如,每隔一小时或者每隔一天爬取一次,根据爬取到的赛事信息对预设事件信息中的体育赛事库和预设时间参数集进行更新。
206、基于目标时间参数,电子设备对初始推送时效进行调整,得到待推送视频的推送时效。
例如,电子设备在目标时间参数中获取可以用作基准的时间,以体育赛事库为例,基准时间可以为体育赛事开赛时间和结束时间,计算基准时间与当前时间的差值,比如,计算开赛事时间与当前时间的差值,可以得到当前距离开赛还有多长时间,计算结束时间与当前时间的差值,可以得到当前距离完赛还有多长时间。获取初始推送时效的第三时间范围,比如,初始推送时效为三小时,当前时间为下午15:00,则第三时间范围可以为下午15:00至下午18:00。根据基准时间与当前时间的差值和基准时间,对第三时间范围进行调整,以得到待推送视频的推送时效,比如,以基准时间为体育比赛的开赛时间为19:05,当前时间为17:00,基准时间与当前时间的差值为2小时05分钟,第三时间范围为17:00-19:00为例,将第三时间范围的右边时间值与基准时间进行比较,可以得到19:00早于基准时间19:05,则可以认定待推送视频为赛前视频,因此,待推送视频的时效可以为当前时间至开赛时间之前,所以,可以对第三时间范围进行调整,调整第三时间范围的右边时间,调整为19:05,得到待推送视频调整后的时间范围为17:00至19:05,基于调整后的时间范围,可以得到待推送视频的推送时效为2小时5分钟,与基准时间和当前时间的差值相同。
可选的,当基准时间为开赛时间19:05,结束时间为21:10,当前时间为20:00,第三时间范围20:00至21:00时,将第三时间范围的右边时间与开始时间和结束时间进行比较,可以得出该待推送视频为赛事进行中的视频,即为赛中视频,因此,待推送视频的时效可以为当前时间至比赛结束之前,所以,对待推送视频的第三时间范围进行调整,调整第三时间范围的右边时间,调整为21:10,基于调整后的时间范围,可以得到待推送视频的推送时效为1小时10分钟。
可选的,当基准时间为比赛结束时间19:00,当前时间为19:10,第三时间范围为19:10-21:00,将第三时间范围的右边时间与比赛结束时间进行对比,可以得到该待推送视频可以为比赛结束后视频,即赛后视频,此时,可以在预设体育赛事库中查询该场比赛之后的下一场比赛,譬如,目标事件为中超的第四轮比赛,可以在预设体育赛事库中查询中超的第五轮比赛对应的目标时间参数,在第五轮的目标事件参数中查询到基准时间,比如,第五轮的开赛时间为当前时间三天后的下午17:00,则可以基于这个时间对第三时间范围的右边时间进行调整,调整为第三天的下午17:00,此时,调整后的第三时间范围为今天19:10至第三天的17:00,可以得到待推送视频的推送时效为69小时50分钟。
207、电子设备根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
(1)根据基准时间,电子设备在预设推送等级中匹配推送时效对应的目标推送等级。
例如,电子设备根据基准时间,已经确定待推送视频的类型,譬如,赛前、赛中和赛后视频,对赛前、赛中和赛后视频分别赋予不同的加权系数,根据加权系数,对推送时效进行加权,对加权值与预设推送等级对应的值进行比较,当加权值超过第一等级的阈值时,确定该待推送视频的推送等级为第一等级,当加权值超过第二等级的阈值,且未超过第一等级的阈值时,确定该待推送视频的推送等级为第二等级,当加权值未超过第二等级的阈值时,确定该待推送视频的推送等级为第三等级。假设推送等级越高,推送速度越快,则在划分推送等级时,推送时效越短,相对应的推送等级越高。
(2)电子设备获取推送时效对应的第四时间范围
例如,以推送时效为10小时,当前时间为下午15:00为例,则推送时效对应的第四时间范围为今天下午15:00至明天上午1:00。
(3)电子设备根据目标推送等级,在第四时间范围内容,选择待推送视频的推送时间。
例如,按照目标推送等级对应的推送条件,在第四时间范围内选择待推送视频的推送时间,比如,当目标推送等级为第一等级,即最高等级时,以最高等级为立即推送,当前时间为下午15:00,则待推送视频的推送时间为下午15:00;当目标推送等级为第二等级,第二等级对应的推送条件为5分钟之内推送,当前时间为下午15:00,因此,推送时间可以为15:00至15:05;当目标推送等级为第三等级,第三等级对应的推送条件为1小时内推送,当前时间为下午15:00,,因此,推送时间为15:00至16:00。
(4)电子设备在推送时间将待推送视频进行推送。
例如,在推送时间将待推送视频进行推送,比如,针对推送等级为第一等级的待推送视频,可以直接将待推送视频推送至用户终端或者推送至第三方推荐平台,对于内存较大的待推送视频,可以对待推送视频进行压缩,或者先进行存储,然后,将存储该待推送视频的存储地址和待推送视频的缩略图推送给用户终端或者第三方推荐平台。针对推送等级为第二等级或第三等级的待推送视频,由于不需要立即推送出去,则可以将待推送视频存储视频数据库,根据待推送视频的内存大小,在推送时间内将待推送视频推送至用户终端或者第三方推荐平台。
由以上可知,本实施例电子设备在在接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;由于该方案在对视频内容的时效进行识别的基础上,采用了在预设事件库中筛选的目标时间参数对初始推送时效进行调整,从而得到视频的推送时效,提高了识别视频时效的准确率,进而根据推送时效确定该视频的推送时间,并进行推送,可以大大提高视频推送的准确性。
为了更好地实施以上方法,本发明实施例还提供一种视频推送装置,该视频推送装置可以集成在电子设备,该电子设备可以为服务器等设备。
例如,如图6所示,该文本标签生成装置可以包括接收单元301、识别单元302、筛选单元303、调整单元304和推送单元305,如下:
(1)接收单元301;
接收单元301,用于接收视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息。
例如,接收单元301,具体可以用于通过视频推送页面接收视频推送请求,还可以通过视频数据库或第三方信息流平台接收视频推送请求。
(2)识别单元302;
识别单元302,用于对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效。
其中,识别单元302可以包括识别子单元3021、第一筛选子单元3022和调整子单元3023,如图7所示,具体可以如下:
识别子单元3021,用于采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效;
第一筛选子单元3022,用于在特征信息中筛选出时间关键词,该时间关键词为与时间相关的词;
调整子单元3023,用于基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。
例如,识别子单元3021采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效,第一筛选子单元3022在特征信息中筛选出时间关键词,该时间关键词为与时间相关的词,调整子单元3023基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。
(3)筛选单元303;
筛选单元303,用于在预设事件信息中筛选出特征信息对应的目标时间参数。
其中,筛选单元303还可以包括提取子单元3031、第二筛选子单元3032和第三筛选子单元3033,如图8所示,具体可以如下:
提取子单元3031,用于在特征信息中提取关键词文本;
第二筛选子单元3032,用于在预设事件库中筛选出关键词文本对应的目标事件;
第三筛选子单元3033,用于在预设时间参数集中筛选出目标事件对应的时间参数,将时间参数作为特征信息对应的目标时间参数。
例如,提取子单元3031在特征信息中提取关键词文本,第二筛选子单元3032在预设事件库中筛选出关键词文本对应的目标事件,第三筛选子单元3033在预设时间参数集中筛选出目标事件对应的时间参数,将时间参数作为特征信息对应的目标时间参数。
(4)调整单元304;
调整单元304,用于基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效。
例如,调整单元304,具体可以用于在目标时间参数中获取基准时间,计算基准时间与当前时间的差值,获取初始推送时效的第三时间范围,根据差值和基准时间,对第三时间范围进行调整,以得到待推送视频的推送时效。
(5)推送单元305;
推送单元305,用于根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
其中,推送单元305可以包括匹配子单元3051、获取子单元3052、选择子单元3053和推送子单元3054,如图9所示,具体可以如下:
匹配子单元3051,用于根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级;
获取子单元3052,用于获取推送时效对应的第四时间范围;
选择子单元3053,用于根据目标推送等级,在第四时间范围内,选择待推送视频的推送时间;
推送子单元3054,用于在推送时间将待推送视频进行推送。
例如,匹配子单元3051根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级,获取子单元3052获取推送时效对应的第四时间范围,选择子单元3053根据目标推送等级,在第四时间范围内,选择待推送视频的推送时间,推送子单元3054在推送时间将待推送视频进行推送。
可选的,视频推送装置还可以包括采集单元306和训练单元307,如图10所示,具体可以如下:
采集单元306,用于采集多个视频内容样本,该视频内容样本包括已标注时效分类的视频内容;
训练单元307,用于采用预设识别模型对视频内容样本的时效进行预测,得到视频内容样本的时效分类的预测结果,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。
例如,采集单元306采集多个视频内容样本,该视频内容样本包括已标注时效分类的视频内容,训练单元307采用预设识别模型对视频内容样本的时效进行预测,得到视频内容样本的时效分类的预测结果,根据预测结果与标注结果对预设识别模型进行收敛,得到训练后识别模型。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由以上可知,本实施例在301接收单元接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,识别单元302对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,筛选单元303在预设事件信息中筛选出特征信息对应的目标时间参数,调整单元304基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,推送单元305根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;由于该方案在对视频内容的时效进行识别的基础上,采用了在预设事件库中筛选的目标时间参数对初始推送时效进行调整,从而得到视频的推送时效,提高了识别视频时效的准确率,进而根据推送时效确定该视频的推送时间,并进行推送,可以大大提高视频推送的准确性。
本发明实施例还提供一种电子设备,如图11所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图11中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体检测。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
接收视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
例如,通过视频推送页面、视频数据库或第三方信息流平台接收视频推送请求,采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效,在特征信息中筛选出时间关键词,该时间关键词为与时间相关的词,基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。在特征信息中提取关键词文本,在预设事件库中筛选出关键词文本对应的目标事件,在预设时间参数集中筛选出目标事件对应的时间参数,将时间参数作为特征信息对应的目标时间参数。在目标时间参数中获取基准时间,计算基准时间与当前时间的差值,获取初始推送时效的第三时间范围,根据差值和基准时间,对第三时间范围进行调整,以得到待推送视频的推送时效。根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级,获取推送时效对应的第四时间范围,根据目标推送等级,在第四时间范围内,选择待推送视频的推送时间,在推送时间将待推送视频进行推送。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由以上可知,本申请实施例在接收视频推送请求后,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,然后,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送;由于该方案在对视频内容的时效进行识别的基础上,采用了在预设事件库中筛选的目标时间参数对初始推送时效进行调整,从而得到视频的推送时效,提高了识别视频时效的准确率,进而根据推送时效确定该视频的推送时间,并进行推送,可以大大提高视频推送的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种文本标签生成方法中的步骤。例如,该指令可以执行如下步骤:
接收视频推送请求,该视频推送请求携带待推送视频和待推送视频对应的特征信息,对待推送视频内容的时效进行识别,得到待推送视频的初始推送时效,在预设事件信息中筛选出特征信息对应的目标时间参数,基于目标时间参数,对初始推送时效进行调整,得到待推送视频的推送时效,根据推送时效,确定待推送视频的推送时间,并在推送时间将待推送视频进行推送。
例如,通过视频推送页面、视频数据库或第三方信息流平台接收视频推送请求,采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效,在特征信息中筛选出时间关键词,该时间关键词为与时间相关的词,基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。在特征信息中提取关键词文本,在预设事件库中筛选出关键词文本对应的目标事件,在预设时间参数集中筛选出目标事件对应的时间参数,将时间参数作为特征信息对应的目标时间参数。在目标时间参数中获取基准时间,计算基准时间与当前时间的差值,获取初始推送时效的第三时间范围,根据差值和基准时间,对第三时间范围进行调整,以得到待推送视频的推送时效。根据基准时间,在预设推送等级中匹配推送时效对应的目标推送等级,获取推送时效对应的第四时间范围,根据目标推送等级,在第四时间范围内,选择待推送视频的推送时间,在推送时间将待推送视频进行推送。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本发明实施例所提供的任一种视频推送方法中的步骤,因此,可以实现本发明实施例所提供的任一种视频推送方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种视频推送方法、装置和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种视频推送方法,其特征在于,包括:
接收视频推送请求,所述视频推送请求携带待推送视频和待推送视频对应的特征信息;
对所述待推送视频内容的时效进行识别,得到所述待推送视频的初始推送时效,包括:采用训练后识别模型对所述待推送视频内容的时效进行识别,得到所述待推送视频的粗粒度时效;在所述特征信息和待推送视频内容中筛选出时间关键词,所述时间关键词为与时间相关的词;基于所述时间关键词,对所述粗粒度时效进行调整,得到所述待推送视频的初始推送时效;
在预设事件信息中筛选出所述特征信息对应的目标事件,并从所述目标事件中筛选出目标时间参数;
基于所述目标时间参数,对所述初始推送时效进行调整,得到所述待推送视频的推送时效;
根据所述推送时效,确定所述待推送视频的推送时间,并在所述推送时间将所述待推送视频进行推送。
2.根据权利要求1所述的视频推送方法,其特征在于,所述预设事件信息包括预设事件库和预设时间参数集,所述预设事件库和预设时间参数集之间存在映射关系,所述在预设事件信息中筛选出所述特征信息对应的目标事件,并从所述目标事件中筛选出目标时间参数,包括:
在所述特征信息中提取关键词文本;
在所述预设事件库中筛选出所述关键词文本对应的目标事件;
在所述预设时间参数集中筛选出所述目标事件对应的时间参数,将所述时间参数作为所述特征信息对应的目标时间参数。
3.根据权利要求2所述的视频推送方法,其特征在于,所述关键词文本至少包括一个关键词,所述在所述预设事件库中筛选出所述关键词文本对应的目标事件,包括
在所述预设事件库中筛选出存在所述关键词的至少一个候选事件;
计算所述关键词文本与所述候选事件的事件名称的匹配度;
根据所述匹配度,在所述候选事件中确定所述特征信息对应的目标事件。
4.根据权利要求3所述的视频推送方法,其特征在于,所述根据所述匹配度,在所述候选事件中确定所述特征信息对应的目标事件,包括:
根据所述匹配度的大小,对所述候选事件进行排序;
在排序后的候选事件中筛选出所述匹配度最大,且所述匹配度超过预设匹配度阈值的事件名称对应的筛选后事件,将所述筛选后事件作为所述特征信息对应的目标事件。
5.根据权利要求3所述的视频推送方法,其特征在于,所述计算所述关键词文本与所述候选事件的事件名称的匹配度,包括:
计算所述关键词与所述候选事件的事件名称的初始匹配度;
获取所述关键词的加权系数;
根据所述关键词的加权系数,对所述初始匹配度进行加权,得到所述关键词的初始匹配度的加权值;
将所述加权值进行累加,得到所述关键词文本与所述候选事件的事件名称的匹配度。
6.根据权利要求1所述的视频推送方法,其特征在于,所述基于所述时间关键词,对所述粗粒度时效进行调整,得到所述待推送视频的初始推送时效,包括:
获取所述粗粒度时效对应的第一时间范围;
识别所述时间关键词对应的第二时间范围;
将所述第一时间范围和所述第二时间范围进行融合;
根据融合后时间范围,确定所述待推送视频的初始推送时效。
7.根据权利要求1所述的视频推送方法,其特征在于,所述基于所述目标时间参数,对所述初始推送时效进行调整,得到所述待推送视频的推送时效,包括:
在所述目标时间参数中获取基准时间;
计算所述基准时间与当前时间的差值;
获取所述初始推送时效的第三时间范围;
根据所述差值和所述基准时间,对所述第三时间范围进行调整,以得到待推送视频的推送时效。
8.根据权利要求7所述的视频推送方法,其特征在于,所述根据所述推送时效,确定所述待推送视频的推送时间,并在所述推送时间将所述待推送视频进行推送,包括:
根据所述基准时间,在预设推送等级中匹配所述推送时效对应的目标推送等级;
获取所述推送时效对应的第四时间范围;
根据所述目标推送等级,在所述第四时间范围内,选择所述待推送视频的推送时间;
在所述推送时间将所述待推送视频进行推送。
9.一种视频推送装置,其特征在于,包括:
接收单元,用于接收视频推送请求,所述视频推送请求携带待推送视频和待推送视频对应的特征信息;
识别单元,用于对所述待推送视频内容的时效进行识别,得到所述待推送视频的初始推送时效;
筛选单元,用于在预设事件信息中筛选出所述特征信息对应的目标事件,并从所述目标事件中筛选出目标时间参数;
调整单元,用于基于所述目标时间参数,对所述初始推送时效进行调整,得到所述待推送视频的推送时效;
推送单元,用于根据所述推送时效,确定所述待推送视频的推送时间,并在所述推送时间将所述待推送视频进行推送;
其中,所述识别单元包括:
识别子单元,用于采用训练后识别模型对待推送视频内容的时效进行识别,得到待推送视频的粗粒度时效;
第一筛选子单元,用于在特征信息中筛选出时间关键词,该时间关键词为与时间相关的词;
调整子单元,用于基于时间关键词,对粗粒度时效进行调整,得到待推送视频的初始推送时效。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的视频推送方法中的步骤。
CN201911322216.9A 2019-12-20 2019-12-20 一种视频推送方法、装置和计算机可读存储介质 Active CN111125429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911322216.9A CN111125429B (zh) 2019-12-20 2019-12-20 一种视频推送方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911322216.9A CN111125429B (zh) 2019-12-20 2019-12-20 一种视频推送方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111125429A CN111125429A (zh) 2020-05-08
CN111125429B true CN111125429B (zh) 2023-05-30

Family

ID=70500426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911322216.9A Active CN111125429B (zh) 2019-12-20 2019-12-20 一种视频推送方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111125429B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112153424B (zh) * 2020-09-23 2024-01-26 腾讯科技(深圳)有限公司 内容推送方法、装置、电子设备和存储介质
CN112131482B (zh) * 2020-10-10 2023-12-08 腾讯科技(深圳)有限公司 一种时效确定方法和相关装置
CN114330295A (zh) * 2021-08-04 2022-04-12 腾讯科技(深圳)有限公司 信息的时效识别、模型训练、推送方法、装置及介质
CN113642536B (zh) * 2021-10-13 2021-12-24 腾讯科技(深圳)有限公司 数据处理方法、计算机设备以及可读存储介质
CN114095763B (zh) * 2021-11-25 2024-03-12 上海幻电信息科技有限公司 视频列表推送方法及播放质量评估方法
CN114816826B (zh) * 2022-06-28 2022-09-23 杭银消费金融股份有限公司 一种应用系统的推送缺陷识别方法及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915446A (zh) * 2015-06-29 2015-09-16 华南理工大学 基于新闻的事件演化关系自动提取方法及其系统
CN104980327A (zh) * 2014-04-03 2015-10-14 腾讯科技(深圳)有限公司 一种消息推送方法及装置
CN106507143A (zh) * 2016-10-21 2017-03-15 北京小米移动软件有限公司 视频推荐方法及装置
CN107968842A (zh) * 2017-12-26 2018-04-27 百度在线网络技术(北京)有限公司 基于分布式系统的新闻推送方法、装置及设备
CN108667716A (zh) * 2018-04-16 2018-10-16 深圳壹账通智能科技有限公司 一种消息推送方法、装置及计算机可读存储介质
WO2019047849A1 (zh) * 2017-09-05 2019-03-14 腾讯科技(深圳)有限公司 新闻处理方法、装置、存储介质及计算机设备
CN109922357A (zh) * 2019-03-29 2019-06-21 乐蜜有限公司 视频推荐的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618803B (zh) * 2014-02-26 2018-05-08 腾讯科技(深圳)有限公司 信息推送方法、装置、终端及服务器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104980327A (zh) * 2014-04-03 2015-10-14 腾讯科技(深圳)有限公司 一种消息推送方法及装置
CN104915446A (zh) * 2015-06-29 2015-09-16 华南理工大学 基于新闻的事件演化关系自动提取方法及其系统
CN106507143A (zh) * 2016-10-21 2017-03-15 北京小米移动软件有限公司 视频推荐方法及装置
WO2019047849A1 (zh) * 2017-09-05 2019-03-14 腾讯科技(深圳)有限公司 新闻处理方法、装置、存储介质及计算机设备
CN107968842A (zh) * 2017-12-26 2018-04-27 百度在线网络技术(北京)有限公司 基于分布式系统的新闻推送方法、装置及设备
CN108667716A (zh) * 2018-04-16 2018-10-16 深圳壹账通智能科技有限公司 一种消息推送方法、装置及计算机可读存储介质
CN109922357A (zh) * 2019-03-29 2019-06-21 乐蜜有限公司 视频推荐的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于聚类层次模型的视频推荐算法;金亮等;《计算机应用》;第37卷(第10期);全文 *

Also Published As

Publication number Publication date
CN111125429A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111125429B (zh) 一种视频推送方法、装置和计算机可读存储介质
CN108304379B (zh) 一种文章识别方法、装置及存储介质
CN106503014B (zh) 一种实时信息的推荐方法、装置和系统
US9087297B1 (en) Accurate video concept recognition via classifier combination
US10515133B1 (en) Systems and methods for automatically suggesting metadata for media content
WO2017096877A1 (zh) 一种推荐方法和装置
US20170323178A1 (en) Learning highlights using event detection
CN111090813B (zh) 一种内容处理方法、装置和计算机可读存储介质
CN110704674A (zh) 一种视频播放完整度预测方法及装置
CN108304490B (zh) 基于文本的相似度确定方法、装置及计算机设备
JP4797069B2 (ja) キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法
CN110457566B (zh) 信息筛选方法、装置、电子设备及存储介质
US8706655B1 (en) Machine learned classifiers for rating the content quality in videos using panels of human viewers
CN102737029A (zh) 搜索方法及系统
CN107846611A (zh) 一种基于年龄段的电视节目推送方法及系统
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN111861550B (zh) 一种基于ott设备的家庭画像构建方法及系统
CN111062527B (zh) 一种视频集流量预测方法及装置
CN110263854A (zh) 直播标签确定方法、装置及存储介质
CN110413881B (zh) 一种识别标签准确性的方法、装置、网络设备和存储介质
CN111858969A (zh) 多媒体数据推荐方法、装置、计算机设备和存储介质
CN112565775A (zh) 用于音视频转码的方法、装置及存储介质
CN112202849A (zh) 内容分发方法、装置、电子设备和计算机可读存储介质
CN108334518A (zh) 一种广告加载方法及装置
CN110958472A (zh) 视频点击量评级预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant