CN112579913A - 一种视频推荐方法、装置、设备和计算机可读存储介质 - Google Patents
一种视频推荐方法、装置、设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN112579913A CN112579913A CN202011606676.7A CN202011606676A CN112579913A CN 112579913 A CN112579913 A CN 112579913A CN 202011606676 A CN202011606676 A CN 202011606676A CN 112579913 A CN112579913 A CN 112579913A
- Authority
- CN
- China
- Prior art keywords
- video
- candidate
- attribute information
- videos
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012216 screening Methods 0.000 claims abstract description 29
- 238000004891 communication Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 14
- 238000012549 training Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种视频推荐方法、装置、设备和计算机可读存储介质。该方法包括:接收来自客户端的视频播放请求;根据视频播放请求,确定客户端对应的用户属性信息以及目标视频对应的目标视频属性信息;在视频数据库中,筛选与用户属性信息和/或目标视频属性信息相匹配的多个候选视频;根据目标视频属性信息以及各候选视频对应的候选视频属性信息,确定各候选视频对应的推荐指数;根据推荐指数对各候选视频进行排序,基于得到的排序结果从候选视频中选择推荐视频;生成推荐视频对应的推荐信息,并将推荐信息发送至客户端。本发明在推荐视频时考虑了用户需求和视频属性,使得推荐视频更加多元化,更加符合用户需求并且对视频来源的粘性更加友好。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种视频推荐方法、装置、设备和计算机可读存储介质。
背景技术
在客户端向服务器请求播放目标视频之后,服务器除了向客户端发送目标视频流,还会向客户端推荐视频,推荐视频一般是与目标视频的标题相同或类似的视频。例如:用户点击了2020年欧洲杯预选赛,除在视频播放页面为用户播放2020年欧洲杯预选赛的视频,还会在同一页面向用户展示2020年欧洲杯小组赛的视频的标题和封面。
发明人发现,现有的视频推荐方式仅考虑客户端请求播放的目标视频的标题,即用户在视频播放页面中的推荐视频里只能看到标题与“2020年欧洲杯预选赛”类似的标题,例如可能展示标题为“2020年欧洲杯小组赛”的视频标题和封面、标题为“2019年欧洲杯预选赛”的视频标题和封面等。虽然基于该方法可以保证推荐视频的数量,但推荐的视频内容过于单一。而且用户可能是基于好奇点击了某视频,但并非对该视频感兴趣,此时若给用户整个播放页面都推荐与该目标视频的标题类似的视频,很可能会引起用户反感。
因此,发明人认为,在视频播放页面上基于标题是否类似的推荐方法,来推荐视频的方法较为单一。
发明内容
本发明实施例的目的在于提供一种视频推荐方法、装置、设备和计算机可读存储介质,以解决现有视频推荐方式仅考虑客户端请求播放的目标视频的主题,使得推荐到客户端的视频较为单一的问题。具体技术方案如下:
在本发明实施例的第一个方面,提供了一种视频推荐方法,包括:接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频;根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息;在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频;根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数;根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频;生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
其中,所述在视频数据库中,筛选与所述用户属性信息相匹配的多个候选视频,包括:基于所述用户属性信息对应的历史播放记录分析用户偏好信息;从所述视频数据库中,筛选与所述用户偏好信息相匹配的候选视频;所述在视频数据库中,筛选与所述目标视频属性信息相匹配的多个候选视频,包括:基于所述目标视频属性信息中的内容信息和/或来源信息,从所述视频数据库中筛选与所述内容信息和/或来源信息相匹配的候选视频。
其中,所述根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数,包括:将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
其中,所述方法还包括:获取验证样本集,所述验证样本集包括:样本目标视频及所述样本目标视频对应的样本候选视频;获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息;将所述样本目标视频属性信息和多个样本候选视频属性信息输入所述多目标模型,获得所述多目标模型输出的每个所述样本候选视频对应的相似度及消费指数;针对每个所述样本候选视频,对所述样本候选视频对应的相似度及消费指数进行加权计算,得到所述样本候选视频对应的推荐指数;在多个所述样本候选视频中,按照推荐指数从大到小的获取方向,获取N个所述样本候选视频;其中,在N个所述样本候选视频中,每个所述样本候选视频对应的样本候选视频属性信息的重复次数小于预设的重复阈值;N≥1;将N个所述样本候选视频分别对应的推荐指数及样本候选视频属性信息输入多样性模型,由所述多样性模型基于所述样本候选视频属性信息计算样本候选视频之间的相似度,并根据所述推荐指数及所述样本候选视频之间的相似度对N个所述样本候选视频执行重排序;其中,在重排序后的N个所述样本候选视频中,相邻样本候选视频之间的相似度满足预设条件:前一个所述样本候选视频与后一个所述样本候选视频的相似度小于前一个所述样本候选视频分别与其余每个所述样本候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;在重排序后的N个所述样本候选视频中,将前M个所述样本候选视频确定为样本推荐视频;1≤M≤N;计算每个所述样本推荐视频与所述样本目标视频的相似度,得到M个所述相似度;在M个所述相似度符合预设的模型重训练条件时,重新对所述多目标模型进行训练。
其中,所述M个所述相似度符合预设的模型重训练条件,包括:M个所述相似度的平均值小于预设的平均值阈值;和/或,M个所述相似度中属于预设数值区间的相似度的个数与M的比值小于预设阈值。
其中,所述根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频,包括:在多个所述候选视频中,按照推荐指数从大到小的获取方向,获取N个所述候选视频;其中,在N个所述候选视频中,每个所述候选视频对应的候选视频属性信息的重复次数小于预设的重复阈值;N≥1;将N个所述候选视频分别对应的推荐指数及候选视频属性信息输入多样性模型,由所述多样性模型基于所述候选视频属性信息计算候选视频之间的相似度,并根据所述推荐指数及所述候选视频之间的相似度对N个所述候选视频进行重排序;其中,在重排序后的N个所述候选视频中,相邻候选视频之间的相似度满足预设条件:所述相邻候选视频中前一个候选视频与后一个候选视频的相似度小于前一个候选视频分别与其余每个所述候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;在重排序后的N个所述候选视频中,将前M个所述候选视频确定为推荐视频;1≤M≤N。
在本发明实施例的第二个方面,提供了一种视频推荐装置,包括:接收模块,用于接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频;第一确定模块,用于根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息;筛选模块,用于在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频;第二确定模块,用于根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数;选择模块,用于根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频;生成和发送模块,用于生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
其中,所述第二确定模块,用于:将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
在本发明实施例的第三个方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一所述的方法步骤。
在本发明实施例的第四个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的视频推荐方法。
在本发明实施例的第五个方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频推荐方法。
本发明实施例提供的一种视频推荐方法、装置、设备和计算机可读存储介质,在接收到视频播放请求之后,获取与用户属性信息匹配的候选视频以及与目标视频属性信息匹配的候选视频;根据目标视频属性信息以及每个候选视频的候选视频属性信息,来确定每个候选视频对应的推荐指数,进而根据推荐指数决定向客户端发送的推荐信息。本发明实施例在推荐视频时考虑了用户属性和视频属性,使得推荐视频更加多元化,更加符合用户需求并且对视频来源的粘性更加友好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是根据本发明一实施例的视频推荐方法的流程图;
图2是根据本发明一实施例的筛选候选视频的步骤流程图;
图3是根据本发明一实施例的多样性打散处理的步骤流程图;
图4是根据本发明一实施例的多目标模型的训练步骤流程图;
图5是根据本发明一实施例的推荐结果的准确性确定的步骤流程图;
图6是根据本发明一实施例的视频推荐装置的结构图;
图7是根据本发明一实施例的电子设备的结构图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
根据本发明实施例,提供了一种视频推荐方法。本实施例的执行主体为服务器。如图1所示,是根据本发明一实施例的视频推荐方法的流程图。
步骤S110,接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频。
客户端用于播放视频。其中,客户端提供登录接口,以便通过该登录接口接收用户登录信息并与服务器进行交互,用以执行用户登录操作。
视频播放页为视频详情页或者视频列表页。
目标视频是指用户希望在视频播放页进行播放的视频。
具体而言,在接收到来自于客户端的视频播放请求之后,解析该视频播放请求,在该视频播放请求中提取目标视频基本信息。
目标视频基本信息包括但不限于:目标视频的视频ID(Identity Document,编码)。在本发明实施例中,视频ID具有唯一性。
进一步地,向客户端发送目标视频基本信息对应的目标视频流,以便客户端根据接收到的目标视频流在视频播放页中播放目标视频;并且,根据目标视频基本信息,获取目标视频对应的推荐信息,将推荐信息发送给客户端,以便客户端在视频播放页面播放目标视频的过程中,根据推荐信息,在视频播放页面中展示推荐视频的信息。
推荐信息包括但不限于:推荐视频的视频ID,视频标题和封面页图像。
推荐视频是指:与目标视频的内容相匹配,与目标视频的来源相匹配,和/或符合登录用户偏好的视频。来源是指视频的上传者(推主)。
下面将对如何获取目标视频对应的推荐信息的过程进行描述。
步骤S120,根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息。
用户属性信息,包括但不限于:客户端对应的用户登录信息。用户登录信息可以是登录用户的用户ID。
目标视频属性信息,包括但不限于:目标视频对应的来源信息和内容信息。其中,内容信息包括但不限于:点击量,完播率,标题信息,封面图信息,视频时长,视频标签,视频主题,视频所属频道以及视频类别。当然,内容信息还可以包括:主要演员,配音演员,导演,拍摄位置等。
由于在视频播放请求中包括:客户端登录用户的用户ID和目标视频基本信息(视频ID)。所以,用户属性信息可以直接获得,目标视频属性信息可以根据目标视频基本信息确定。
步骤S130,在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频。
视频数据库,用于存储多个视频以及每个视频的视频属性信息。
在视频数据库中,筛选视频属性信息与用户属性信息相匹配的视频,以及筛选视频属性信息与目标视频属性信息相匹配的视频,将筛选出的视频都作为候选视频。
进一步地,可以基于所述目标视频属性信息中的内容信息和/或来源信息,从所述视频数据库中筛选与所述内容信息和/或来源信息相匹配的候选视频。具体的匹配步骤将在后面进行介绍,在此不做赘述。
步骤S140,根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数。
候选视频属性信息,包括但不限于:候选视频对应的来源信息和内容信息。其中,内容信息包括但不限于:点击量,完播率,标题信息,封面图信息,视频时长,视频标签,视频主题,视频所属频道以及视频类别。当然,内容信息还可以包括:主要演员,配音演员,导演,拍摄位置等。
推荐指数是指候选视频的推荐程度。候选视频对应的推荐指数越高,越优先推荐该候选视频。候选视频对应的推荐指数越低,越不优先推荐该候选视频。
如何根据目标视频属性信息以及各候选视频对应的候选视频属性信息,确定候选视频对应的推荐指数的步骤,将在后面进行介绍,故在此步骤赘述。
步骤S150,根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频。
按照推荐指数从大到小的顺序,对多个候选视频进行排序,在排序序列中,获取预设数量的候选视频作为推荐视频。
当然,还可以通过其他排序方式,在候选视频中选择推荐视频,其他排序方式将在后面进行描述,在此不做赘述。
步骤S160,生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
在客户端侧,客户端在接收到推荐信息之后,在视频播放页展示推荐信息。其中,推荐信息包括但不限于:推荐视频的封面图信息和标题信息。
在视频播放页为视频详情页的情况下,在视频详情页的预设推荐视频展示区域中,展示推荐信息对应的视频信息。进一步地,推荐视频展示区域用于展示至少一个推荐信息。
在视频播放页为视频列表页的情况下,在目标视频对应的播放控件下方插入预设的播放控件,利用插入的播放控件展示推荐信息对应的视频信息。进一步地,每个播放控件用于展示一个推荐信息。可以在目标视频对应的播放控件下方插入至少一个播放控件。
在本发明实施例中,在接收到视频播放请求之后,获取与用户属性信息匹配的候选视频以及与目标视频属性信息匹配的候选视频;根据目标视频属性信息以及每个候选视频的候选视频属性信息,来确定每个候选视频对应的推荐指数,进而根据推荐指数决定向客户端发送的推荐信息。本发明实施例在推荐视频时考虑了用户属性和视频属性,使得推荐视频更加多元化,更加符合用户需求并且对视频来源的粘性更加友好。
进一步地,本发明实施例使用目标视频属性信息挖掘内容相关视频信息,目标视频属性信息中的信息不限于视频的主题,在目标视频属性信息中增加了点击量,完播率,标题信息,封面图信息,视频时长,视频标签,视频类别等信息,增加了视频内容的挖掘深度。
本实施例中涉及的视频包括不限于:短视频、长视频和序列视频。短视频的视频时长小于长视频的视频时长并且小于序列视频的视频时长。序列视频是指多个连续视频中的一个视频。序列视频例如是电视剧中的一集视频。长视频例如是电影。短视频例如是视频时长小于等于5分钟的视频。
为了使本发明更加容易理解,下面将对本发明进行进一步地描述。
首先,对筛选候选视频的过程进行进一步地描述。
图2是根据本发明一实施例的筛选候选视频的步骤流程图。
步骤S210,根据视频播放请求,确定用户属性信息,并且确定目标视频对应的目标视频属性信息;其中,目标视频属性信息包括:目标视频的内容信息和来源信息。
用户属性信息包括但不限于:用户登录信息。用户登录信息为用户静态信息,包括但不限于:用户ID,用户年龄,用户性别,登录地域和用户收入。
目标视频属性信息是指目标视频的视频属性信息。视频属性信息包括但不限于:来源信息,点击量,完播率,标题信息,封面图信息,视频时长,视频标签,视频主题,频道信息以及视频类别。其中,点击量和完播率用于表示目标视频的消费特征。消费特征用于反映视频被播放的情况。
在视频播放请求中携带用户登录信息和目标视频基本信息;在视频播放请求中提取用户登录信息和目标视频基本信息。该目标视频基本信息包括但不限于:目标视频的视频ID。
步骤S220,获取所述用户属性信息对应的历史视频播放记录。
历史视频播放记录包括但不限于:预设历史时间段内播放过的视频基本信息和视频属性信息。视频属性信息包括:视频内容信息和来源信息。
步骤S230,基于所述用户属性信息对应的历史视频播放记录,分析用户偏好信息,并从视频数据库中,筛选与所述用户偏好信息相匹配的候选视频。
用户偏好信息包括但不限于:标签偏好信息,频道偏好信息,主题偏好信息和类别偏好信息。标签偏好信息为登录用户播放频率最高的标签信息。频道偏好信息为登录用户播放频率最高的频道信息。主题偏好信息为登录用户播放频率最高的主题信息。类别偏好信息为登录用户播放频率最高的类别信息。
步骤S240,根据所述目标视频属性信息的内容信息和/或来源信息,从视频数据库中筛选与所述内容信息和/或来源信息相匹配的候选视频。
内容信息包括但不限于:点击量,完播率,标题信息,封面图信息,视频时长,视频标签,视频主题,视频所属频道以及视频类别。
在本实施例中,在预设的视频数据库中,查询与目标视频属性信息的内容信息的相似度大于预设的相似度阈值的视频属性信息,获取该视频属性信息对应的视频作为候选视频。进一步地,该相似度用于衡量目标视频和候选视频之间的相关程度。视频相似度越大,目标视频和候选视频越相关。视频相似度越小,目标视频和候选视频越不相关。
可以利用预设的相似度算法,确定目标视频属性信息与视频属性信息集合中的每个视频属性信息之间的视频相似度。
相似度算法包括但不限于:Jaccard相似系数(Jaccard Coefficient)算法,余弦相似度(Cosine Similarity)算法,Tanimoto系数算法。
进一步地,针对视频数据库中的每个视频属性信息,比较该视频属性信息的内容信息和目标视频属性信息的内容信息,确定该视频属性信息的内容信息和目标视频属性信息的内容信息的交集数量和并集数量,将交集数量与并集数量的比值作为相似度。交集数量是指内容信息中相同的信息数量。并集数量是指内容信息中相同的信息数量和不同的信息数量的和。
在本实施例中,在视频数据库中,获取与目标视频的来源信息相同的视频,并且获取与目标视频的来源信息类型相同的其他来源信息的视频,将获取的视频作为候选视频。来源信息为上传者的信息。来源信息包括但不限于:上传者ID。如:主推ID。来源信息的类型例如:美妆类,体育类,游戏解说类。
在本发明实施例中,视频播放页推荐的召回内容引入了同来源(UP主)的拓展内容和个性化的内容(用户偏好信息匹配的视频)。这些内容不只和主视频(目标视频)有一定的相似性,而且和用户的兴趣具有相似性,这样可以在观看完主视频之后,用户可以进行更深入的内容消费。而且,这些内容具有一定的拓展性,并且不远离主视频的主题和用户的兴趣。
在筛选出候选视频之后,下面对确定候选视频对应的推荐指数的步骤进行进一步地描述。
将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;;获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数。进一步地,多目标模型的种类包括但不限于:MMoE(Multi-gateMixture-of-Experts)模型和ESMM(Entire Space Multi-Task Model)模型。
消费指数是指在播放目标视频的过程,候选视频被播放的概率。
候选视频对应的推荐指数是可以是消费指数和相似度的加权求和值。
在本发明实施例中,在对召回内容(候选视频)进行排序之前,可以采用基于相似度和消费指标的多目标模型确定召回内容的推荐指标,使得推荐指数既保证了候选视频和目标视频的内容相关,又保证了候选视频的消费指数,进一步增加了候选视频被用户播放的可能性。
在确定候选视频对应的推荐指数之后,为了避免多个候选视频之间存在重复的问题,本发明对候选视频进行多样性打散处理,使得最终推荐结果更加符合用户的个性化需求。
如图3所示,是根据本发明一实施例的多样性打散处理的步骤流程图。
步骤S310,在多个候选视频中,按照推荐指数从大到小的获取方向,获取N个所述候选视频;其中,在N个所述候选视频中,每个所述候选视频对应的候选视频属性信息的重复次数小于预设的重复阈值;N≥1。
重复阈值为经验值或者实验值。例如:重复阈值为10。
按照推荐指数从大到小的顺序,对多个候选视频进行排序;在排序序列中,从第一个候选视频开始,获取候选视频对应的候选视频属性信息,根据候选视频属性信息,对候选视频进行去重排序。进一步地,在获取候选视频对应的候选视频属性信息时,确定当前获取的候选视频属性信息是否与前面获取的候选视频属性信息相同;在当前获取的候选视频属性信息与前面获取的候选视频属性信息相同的情况下,确定该候选视频属性信息对应的计数值是否小于重复阈值;如果小于重复阈值,则对该计数值进行累计,并获取下一个候选视频对应的候选视频属性信息;如果大于等于重复阈值,则将当前候选视频舍弃或者放置到排序序列的最后;在当前获取的候选视频属性信息与前面获取的候选视频属性信息不同的情况下,则获取下一个候选视频对应的候选视频属性信息。
在排序序列中的所有候选视频分别对应的候选视频属性信息都被获取之后,得到去重排序后的排序序列,在该去重排序后的排序序列中获取前N个候选视频,或者,在去重排序过程中,确定排序序列中的候选视频个数,在候选视频的个数达到N个时,停止继续去重排序。
例如:按照多目标模型输出的推荐指数对候选视频进行排序,依次检查每个候选视频的类别、标签、UP主是否和前面已经检查过的候选视频重复,记录重复的次数,如果重复次数超过重复阀值(例如10次),那么后面再出现该候选视频将被过滤掉(例如舍弃),在所有候选视频过滤完成后,获取前TopN个候选视频。
步骤S320,将N个所述候选视频分别对应的推荐指数及候选视频属性信息输入多样性模型,由所述多样性模型基于所述候选视频属性信息计算候选视频之间的相似度,并根据所述推荐指数及所述候选视频之间的相似度对N个所述候选视频进行重排序。
多样性模型用于对N个所述候选视频进行多样性打散(重排序),使得在重排序后的N个所述候选视频中,相邻候选视频之间的相似度满足预设条件:所述相邻候选视频中前一个候选视频与后一个候选视频的相似度小于前一个候选视频分别与其余每个所述候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值。
多样性模型的种类包括但不限于:DPP(Determinantal Point Process,行列式点过程)模型,MMR(Maximal Marginal Relevance,最大边缘相关多样性算法)模型。
DPP模型根据推荐指数排序N个候选视频,将推荐指数最大的候选视频A定位成重排序的第一个候选视频,并且从推荐指数最大的候选视频开始,计算该候选视频A与其余每个候选视频之间的距离,两个候选视频之间的距离越近,表示这两个候选视频越相似,将与该候选视频A距离最近的候选视频定位成第二个候选视频,再计算该第二个候选视频与剩余每个候选视频之间的距离,以便定位第三个候选视频,以此类推,直到N个候选视频都定位完成为止。MMR模型的计算过程与DPP模型类似。
这样,多样性模型最终输出为前N个候选视频的重排序序列,由于前N个候选视频的推荐指数在所有候选视频中较为靠前,所以该排序序列保证了消费指数较大,并且保证了相邻两个候选视频的相似度最低(距离最远),在消费指数较大的候选视频中,起到了候选视频打散的作用,进一步增加了视频推荐的多样性和个性化。
步骤S330,在重排序后的N个所述候选视频中,将前M个所述候选视频确定为推荐视频;1≤M≤N。
这样,就可以确定M个推荐信息。该M个推荐信息可以发送给客户端,由客户端进行展示,以供用户选择播放。
在本发明实施例中,多目标模型是预先训练获得的,下面对多目标模型的训练过程进行进一步地描述。
如图4所示,是根据本发明一实施例的多目标模型的训练步骤流程图。
步骤S410,获取训练样本集,所述训练样本集包括:样本目标视频及所述样本目标视频对应的样本候选视频。
预先标注每个样本候选视频与样本目标视频的相似度,以及每个样本候选视频的消费指数。
步骤S420,获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息。
步骤S430,将所述样本目标视频属性信息和多个样本候选视频属性信息输入所述多目标模型,获得所述多目标模型输出的每个所述样本候选视频对应的相似度及消费指数。
步骤S440,确定所述多目标模型是否收敛;在所述多目标模型尚未收敛的情况下,继续根据所述训练样本集,获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息,以便继续训练所述多目标模型,直到所述多目标模型收敛为止。
针对每个样本候选视频,利用预设的损失函数,确定多目标模型输出的推荐指数和相似度与预先为该样本候选视频标注的推荐指数和相似度之间的损失值,确定损失值是否小于预设的收敛阈值;如果是,则确定多目标模型收敛;如果否,则确定多目标模型未收敛,并对多目标模型中的参数进行调整,继续根据所述训练样本集,获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息,继续进行下一次训练。
在所述多目标模型收敛之后,为了进一步提升最终推荐结果的准确性,还可以对本发明实施例的视频推荐方法(多目标模型)的准确性进行验证。当然,为了持续保证视频推荐方法的准确性,可以在使用多目标模型的过程中,周期性地验证视频推荐方法的准确性。
图5是根据本发明一实施例的推荐结果的准确性确定的步骤流程图。
步骤S510,获取验证样本集,所述验证样本集包括:样本目标视频及所述样本目标视频对应的样本候选视频。
验证样本集与训练样本集可以是相同的集合,也可以是分别设置的集合。
步骤S520,获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息。
步骤S530,将所述样本目标视频属性信息和多个样本候选视频属性信息输入所述多目标模型,获得所述多目标模型输出的每个所述样本候选视频对应的相似度及消费指数。
步骤S540,针对每个所述样本候选视频,对所述样本候选视频对应的相似度及消费指数进行加权计算,得到所述样本候选视频对应的推荐指数。
步骤S550,在多个所述样本候选视频中,按照推荐指数从大到小的获取方向,获取N个所述样本候选视频;其中,在N个所述样本候选视频中,每个所述样本候选视频对应的样本候选视频属性信息的重复次数小于预设的重复阈值;N≥1。
步骤S560,将N个所述样本候选视频分别对应的推荐指数及样本候选视频属性信息输入多样性模型,由所述多样性模型基于所述样本候选视频属性信息计算样本候选视频之间的相似度,并根据所述推荐指数及所述样本候选视频之间的相似度对N个所述样本候选视频执行重排序。
步骤S570,在重排序后的N个所述样本候选视频中,将前M个所述样本候选视频确定为样本推荐视频;1≤M≤N。
步骤S580,计算每个所述样本推荐视频与所述样本目标视频的相似度,得到M个所述相似度;在M个所述相似度符合预设的模型重训练条件时,重新对所述多目标模型进行训练。
所述M个所述相似度符合预设的模型重训练条件,包括:M个所述相似度的平均值小于预设的平均值阈值;和/或,M个所述相似度中属于预设数值区间的相似度的个数与M的比值小于预设阈值。
M个相似度可以体现相似度分布特征,即M个相似度在多个连续数值区间中,每个所述数值区间包括M个相似度中的个数,预设数值区间为位于多个连续数值区间中间的数值区间。该多个连续数值区间是指相邻的数值区间的端值的是连续的。例如:多个连续数值区间为[0,9),[10,19),[20,29),9和10为连续数值,19和20为连续数值,[10,19)为预设数值区域。
在M个所述相似度符合预设的模型重训练条件时,重新对所述多目标模型进行训练。
在M个所述相似度不符合预设的模型重训练条件时,判定推荐结果准确,允许进行视频推荐,即允许将本实施例应用在视频推荐中。
为了确保本发明实施例的视频推荐方法的准确性,本发明实施例还可以通过人工评价和算法计算并行的方式进行。在算法计算的M个相似度符合模型重训练条件的情况下,再使用人工评价的方式确定M个相似度,如果人工评价的M个相似度也符合模型重训练条件,则允许应用多目标模型进行视频推荐;反之,则重新对多目标模型进行训练。
进一步地,可以通过算法计算M个相似度的平均值;通过人工评价M个相似度的分布特征。在通过人工评价M个相似度的分布特征时,可以先通过预设的评价规则,来评价每个相似度。该评价规则为预先为一组视频属性设置相似度,在两个视频的视频属性信息中都包括该组视频属性时,确定这两个视频的相似度为该组视频数据对象的相似度。评价规则可以根据需求而定。
例如:评价规则包括:财经频道(相同频道)、财经评论(相同类别)、原油行情分析(相同主题)的两个视频的相似度为5;财经频道(相同频道)、财经评论(相同类别)的两个视频的相似度为4。
本发明实施例在视频推荐时,在视频播放页,召回内容除了内容相关视频的召回,还引入了相同来源,同类型来源的拓展视频的召回以及个性化视频的召回。然后通过多目标模型确定候选视频对应的相似度和消费指数,以便确定候选视频的推荐指数,基于推荐指数对候选视频排序,最后经过多样性策略确定最终推荐结果。由于相似性有一定的主观性,本发明在多目标模型收敛之后,再次评估最终推荐结果的准确性,从而确保了相似性符合标准。
本发明实施例还提供了一种视频推荐装置。如图6所示,是根据本发明一实施例的视频推荐装置的结构图。
该视频推荐装置,包括:接收模块610,第一确定模块620,筛选模块630,第二确定模块640,选择模块650和生成和发送模块660。
接收模块610,用于接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频。
第一确定模块620,用于根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息。
筛选模块630,用于在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频。
第二确定模块640,用于根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数。
选择模块650,用于根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频。
生成和发送模块660,用于生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
所述第二确定模块640,用于:将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
本发明实施例所述的装置的功能已经在上述方法实施例中进行了描述,故本发明实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器710、通信接口720、存储器730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。
存储器730,用于存放计算机程序。
处理器710,用于执行存储器730上所存放的程序时,实现如下步骤:接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频;根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息;在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频;根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数;根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频;生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
其中,所述在视频数据库中,筛选与所述用户属性信息相匹配的多个候选视频,包括:基于所述用户属性信息对应的历史播放记录分析用户偏好信息;从所述视频数据库中,筛选与所述用户偏好信息相匹配的候选视频;所述在视频数据库中,筛选与所述目标视频属性信息相匹配的多个候选视频,包括:基于所述目标视频属性信息中的内容信息和/或来源信息,从所述视频数据库中筛选与所述内容信息和/或来源信息相匹配的候选视频。
其中,所述根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数,包括:将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
其中,所述方法还包括:获取验证样本集,所述验证样本集包括:样本目标视频及所述样本目标视频对应的样本候选视频;获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息;将所述样本目标视频属性信息和多个样本候选视频属性信息输入所述多目标模型,获得所述多目标模型输出的每个所述样本候选视频对应的相似度及消费指数;针对每个所述样本候选视频,对所述样本候选视频对应的相似度及消费指数进行加权计算,得到所述样本候选视频对应的推荐指数;在多个所述样本候选视频中,按照推荐指数从大到小的获取方向,获取N个所述样本候选视频;其中,在N个所述样本候选视频中,每个所述样本候选视频对应的样本候选视频属性信息的重复次数小于预设的重复阈值;N≥1;将N个所述样本候选视频分别对应的推荐指数及样本候选视频属性信息输入多样性模型,由所述多样性模型基于所述样本候选视频属性信息计算样本候选视频之间的相似度,并根据所述推荐指数及所述样本候选视频之间的相似度对N个所述样本候选视频执行重排序;其中,在重排序后的N个所述样本候选视频中,相邻样本候选视频之间的相似度满足预设条件:前一个所述样本候选视频与后一个所述样本候选视频的相似度小于前一个所述样本候选视频分别与其余每个所述样本候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;在重排序后的N个所述样本候选视频中,将前M个所述样本候选视频确定为样本推荐视频;1≤M≤N;计算每个所述样本推荐视频与所述样本目标视频的相似度,得到M个所述相似度;在M个所述相似度符合预设的模型重训练条件时,重新对所述多目标模型进行训练。
其中,所述M个所述相似度符合预设的模型重训练条件,包括:M个所述相似度的平均值小于预设的平均值阈值;和/或,M个所述相似度中属于预设数值区间的相似度的个数与M的比值小于预设阈值。
其中,所述根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频,包括:在多个所述候选视频中,按照推荐指数从大到小的获取方向,获取N个所述候选视频;其中,在N个所述候选视频中,每个所述候选视频对应的候选视频属性信息的重复次数小于预设的重复阈值;N≥1;将N个所述候选视频分别对应的推荐指数及候选视频属性信息输入多样性模型,由所述多样性模型基于所述候选视频属性信息计算候选视频之间的相似度,并根据所述推荐指数及所述候选视频之间的相似度对N个所述候选视频进行重排序;其中,在重排序后的N个所述候选视频中,相邻候选视频之间的相似度满足预设条件:所述相邻候选视频中前一个候选视频与后一个候选视频的相似度小于前一个候选视频分别与其余每个所述候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;在重排序后的N个所述候选视频中,将前M个所述候选视频确定为推荐视频;1≤M≤N。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频推荐方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频推荐方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种视频推荐方法,其特征在于,包括:
接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频;
根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息;
在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频;
根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数;
根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频;
生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
2.根据权利要求1所述的方法,其特征在于,
所述在视频数据库中,筛选与所述用户属性信息相匹配的多个候选视频,包括:
基于所述用户属性信息对应的历史播放记录分析用户偏好信息;
从所述视频数据库中,筛选与所述用户偏好信息相匹配的候选视频;
所述在视频数据库中,筛选与所述目标视频属性信息相匹配的多个候选视频,包括:
基于所述目标视频属性信息中的内容信息和/或来源信息,从所述视频数据库中筛选与所述内容信息和/或来源信息相匹配的候选视频。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数,包括:
将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;
获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;
针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取验证样本集,所述验证样本集包括:样本目标视频及所述样本目标视频对应的样本候选视频;
获取所述样本目标视频对应的目标视频属性信息和各样本候选视频分别对应的样本候选视频属性信息;
将所述样本目标视频属性信息和多个样本候选视频属性信息输入所述多目标模型,获得所述多目标模型输出的每个所述样本候选视频对应的相似度及消费指数;
针对每个所述样本候选视频,对所述样本候选视频对应的相似度及消费指数进行加权计算,得到所述样本候选视频对应的推荐指数;
在多个所述样本候选视频中,按照推荐指数从大到小的获取方向,获取N个所述样本候选视频;其中,在N个所述样本候选视频中,每个所述样本候选视频对应的样本候选视频属性信息的重复次数小于预设的重复阈值;N≥1;
将N个所述样本候选视频分别对应的推荐指数及样本候选视频属性信息输入多样性模型,由所述多样性模型基于所述样本候选视频属性信息计算样本候选视频之间的相似度,并根据所述推荐指数及所述样本候选视频之间的相似度对N个所述样本候选视频执行重排序;其中,在重排序后的N个所述样本候选视频中,相邻样本候选视频之间的相似度满足预设条件:前一个所述样本候选视频与后一个所述样本候选视频的相似度小于前一个所述样本候选视频分别与其余每个所述样本候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;
在重排序后的N个所述样本候选视频中,将前M个所述样本候选视频确定为样本推荐视频;1≤M≤N;
计算每个所述样本推荐视频与所述样本目标视频的相似度,得到M个所述相似度;
在M个所述相似度符合预设的模型重训练条件时,重新对所述多目标模型进行训练。
5.根据权利要求4所述的方法,其特征在于,所述M个所述相似度符合预设的模型重训练条件,包括:
M个所述相似度的平均值小于预设的平均值阈值;和/或,
M个所述相似度中属于预设数值区间的相似度的个数与M的比值小于预设阈值。
6.根据权利要求1所述的方法,其特征在于,所述根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频,包括:
在多个所述候选视频中,按照推荐指数从大到小的获取方向,获取N个所述候选视频;其中,在N个所述候选视频中,每个所述候选视频对应的候选视频属性信息的重复次数小于预设的重复阈值;N≥1;
将N个所述候选视频分别对应的推荐指数及候选视频属性信息输入多样性模型,由所述多样性模型基于所述候选视频属性信息计算候选视频之间的相似度,并根据所述推荐指数及所述候选视频之间的相似度对N个所述候选视频进行重排序;其中,在重排序后的N个所述候选视频中,相邻候选视频之间的相似度满足预设条件:所述相邻候选视频中前一个候选视频与后一个候选视频的相似度小于前一个候选视频分别与其余每个所述候选视频的相似度,和/或,所述相邻选视频之间的相似度小于或等于相似度阈值;
在重排序后的N个所述候选视频中,将前M个所述候选视频确定为推荐视频;1≤M≤N。
7.一种视频推荐装置,其特征在于,包括:
接收模块,用于接收来自客户端的视频播放请求;其中,所述视频播放请求用于请求在所述客户端的视频播放页播放目标视频;
第一确定模块,用于根据所述视频播放请求,确定所述客户端对应的用户属性信息以及所述目标视频对应的目标视频属性信息;
筛选模块,用于在视频数据库中,筛选与所述用户属性信息和/或所述目标视频属性信息相匹配的多个候选视频;
第二确定模块,用于根据所述目标视频属性信息以及各所述候选视频对应的候选视频属性信息,确定各所述候选视频对应的推荐指数;
选择模块,用于根据所述推荐指数对各所述候选视频进行排序,基于得到的排序结果从所述候选视频中选择推荐视频;
生成和发送模块,用于生成所述推荐视频对应的推荐信息,并将所述推荐信息发送至所述客户端,以便所述客户端在所述视频播放页播放所述目标视频时,根据所述推荐信息进行视频推荐。
8.根据权利要求7所述的装置,其特征在于,所述第二确定模块,用于:
将所述目标视频属性信息以及各所述候选视频属性信息输入多目标模型;其中,所述多目标模型用于计算所述目标视频与每个所述候选视频的相似度,以及每个所述候选视频的消费指数;
获得所述多目标模型输出的每个所述候选视频对应的相似度及消费指数;
针对每个所述候选视频,对所述候选视频对应的相似度和所述消费指数进行加权计算,得到所述候选视频对应的推荐指数。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6中任一所述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606676.7A CN112579913A (zh) | 2020-12-30 | 2020-12-30 | 一种视频推荐方法、装置、设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606676.7A CN112579913A (zh) | 2020-12-30 | 2020-12-30 | 一种视频推荐方法、装置、设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112579913A true CN112579913A (zh) | 2021-03-30 |
Family
ID=75144389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011606676.7A Pending CN112579913A (zh) | 2020-12-30 | 2020-12-30 | 一种视频推荐方法、装置、设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112579913A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268660A (zh) * | 2021-04-28 | 2021-08-17 | 重庆邮电大学 | 一种基于生成对抗网络的多样性推荐方法、装置及服务器 |
CN113312511A (zh) * | 2021-06-11 | 2021-08-27 | 北京百度网讯科技有限公司 | 用于推荐内容的方法、装置、设备和计算机可读存储介质 |
CN113674833A (zh) * | 2021-08-23 | 2021-11-19 | 成都拟合未来科技有限公司 | 健身视频生成方法、系统、终端及存储介质 |
CN113886633A (zh) * | 2021-10-11 | 2022-01-04 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的视频推荐、装置、设备及存储介质 |
CN114222186A (zh) * | 2022-01-28 | 2022-03-22 | 普春玲 | 基于大数据深度挖掘的信息推送系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160004991A1 (en) * | 2014-07-07 | 2016-01-07 | Lurniture Corp. | System and method for delivering sales training videos |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106815285A (zh) * | 2016-12-05 | 2017-06-09 | 乐视控股(北京)有限公司 | 基于视频网站的视频推荐的方法、装置及电子设备 |
CN108228824A (zh) * | 2017-12-29 | 2018-06-29 | 暴风集团股份有限公司 | 一种视频的推荐方法、装置、电子设备、介质和程序 |
CN109543066A (zh) * | 2018-10-31 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN110717069A (zh) * | 2018-07-11 | 2020-01-21 | 北京优酷科技有限公司 | 视频推荐方法及装置 |
US20200090279A1 (en) * | 2013-03-15 | 2020-03-19 | Cfph, Llc | Dollar Depository Receipts and Electronic Friends Trading and Repo Transactions |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
CN111131884A (zh) * | 2020-01-19 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种视频剪辑的方法、相关装置、设备以及存储介质 |
US20200356781A1 (en) * | 2018-01-09 | 2020-11-12 | Beijing Allook Technologies Co., Ltd. | Method and apparatus for performing categorised matching of videos, and selection engine |
-
2020
- 2020-12-30 CN CN202011606676.7A patent/CN112579913A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200090279A1 (en) * | 2013-03-15 | 2020-03-19 | Cfph, Llc | Dollar Depository Receipts and Electronic Friends Trading and Repo Transactions |
US20160004991A1 (en) * | 2014-07-07 | 2016-01-07 | Lurniture Corp. | System and method for delivering sales training videos |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106815285A (zh) * | 2016-12-05 | 2017-06-09 | 乐视控股(北京)有限公司 | 基于视频网站的视频推荐的方法、装置及电子设备 |
CN108228824A (zh) * | 2017-12-29 | 2018-06-29 | 暴风集团股份有限公司 | 一种视频的推荐方法、装置、电子设备、介质和程序 |
US20200356781A1 (en) * | 2018-01-09 | 2020-11-12 | Beijing Allook Technologies Co., Ltd. | Method and apparatus for performing categorised matching of videos, and selection engine |
CN110717069A (zh) * | 2018-07-11 | 2020-01-21 | 北京优酷科技有限公司 | 视频推荐方法及装置 |
CN109543066A (zh) * | 2018-10-31 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
CN111131884A (zh) * | 2020-01-19 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种视频剪辑的方法、相关装置、设备以及存储介质 |
Non-Patent Citations (4)
Title |
---|
XUETING WANG 等: "User Group based Viewpoint Recommendation using User Attributes for Multiview Videos", 《MUSA2 \'17: PROCEEDINGS OF THE WORKSHOP ON MULTIMODAL UNDERSTANDING OF SOCIAL, AFFECTIVE AND SUBJECTIVE ATTRIBUTES》, 27 October 2017 (2017-10-27), pages 3 - 9 * |
YUAN YAO 等: "Judging similarity: a user-centric study of related item recommendations", 《RECSYS \'18: PROCEEDINGS OF THE 12TH ACM CONFERENCE ON RECOMMENDER SYSTEMS》, 27 September 2018 (2018-09-27), pages 288, XP058544421, DOI: 10.1145/3240323.3240351 * |
张海粟 等: "基于在线百科全书的群体兴趣及其关联性挖掘", 《计算机学报》, vol. 34, no. 11, 15 November 2011 (2011-11-15), pages 2234 - 2242 * |
李勇宏: "大规模在线内容推荐系统关键算法的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01, 15 January 2019 (2019-01-15), pages 138 - 5014 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268660A (zh) * | 2021-04-28 | 2021-08-17 | 重庆邮电大学 | 一种基于生成对抗网络的多样性推荐方法、装置及服务器 |
CN113268660B (zh) * | 2021-04-28 | 2023-04-07 | 重庆邮电大学 | 一种基于生成对抗网络的多样性推荐方法、装置及服务器 |
CN113312511A (zh) * | 2021-06-11 | 2021-08-27 | 北京百度网讯科技有限公司 | 用于推荐内容的方法、装置、设备和计算机可读存储介质 |
CN113312511B (zh) * | 2021-06-11 | 2024-02-27 | 北京百度网讯科技有限公司 | 用于推荐内容的方法、装置、设备和计算机可读存储介质 |
CN113674833A (zh) * | 2021-08-23 | 2021-11-19 | 成都拟合未来科技有限公司 | 健身视频生成方法、系统、终端及存储介质 |
CN113674833B (zh) * | 2021-08-23 | 2024-02-06 | 成都拟合未来科技有限公司 | 健身视频生成方法、系统、终端及存储介质 |
CN113886633A (zh) * | 2021-10-11 | 2022-01-04 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的视频推荐、装置、设备及存储介质 |
CN114222186A (zh) * | 2022-01-28 | 2022-03-22 | 普春玲 | 基于大数据深度挖掘的信息推送系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112579913A (zh) | 一种视频推荐方法、装置、设备和计算机可读存储介质 | |
CN110929052B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN108875022B (zh) | 一种视频推荐方法及装置 | |
KR101792587B1 (ko) | 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치 | |
KR101061234B1 (ko) | 정보처리 장치와 방법, 및 기록 매체 | |
CN104317835B (zh) | 视频终端的新用户推荐方法 | |
Bright et al. | The life and death of political news: Measuring the impact of the audience agenda using online data | |
CN109982155B (zh) | 一种播单推荐方法及系统 | |
CN109511015B (zh) | 多媒体资源推荐方法、装置、存储介质及设备 | |
CN112364202A (zh) | 视频推荐方法、装置及电子设备 | |
JP4370850B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
US10897638B2 (en) | Generation apparatus, generation method, and non-transitory computer readable storage medium | |
CN111858969B (zh) | 多媒体数据推荐方法、装置、计算机设备和存储介质 | |
CN111062527B (zh) | 一种视频集流量预测方法及装置 | |
CN113656681B (zh) | 一种对象评价方法、装置、设备及存储介质 | |
CN112199582A (zh) | 一种内容推荐方法、装置、设备及介质 | |
CN111314790A (zh) | 一种视频播放记录的排序方法、装置和电子设备 | |
CN109033443B (zh) | 推荐对象确定方法、装置、存储介质及计算机设备 | |
CN112073757B (zh) | 情绪波动指数获取方法、显示方法及多媒体内容制作方法 | |
CN113220974A (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN113127720A (zh) | 一种热搜词确定方法及装置 | |
CN110913249B (zh) | 一种节目的推荐方法及系统 | |
CN116610858A (zh) | 一种信息分发方法、装置、电子设备以及存储介质 | |
CN111565322B (zh) | 一种用户情感倾向信息获得方法、装置及电子设备 | |
US11539994B2 (en) | Generating media content keywords based on video-hosting website content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |