CN111212304A - 一种视频推荐方法及服务器 - Google Patents

一种视频推荐方法及服务器 Download PDF

Info

Publication number
CN111212304A
CN111212304A CN202010124722.3A CN202010124722A CN111212304A CN 111212304 A CN111212304 A CN 111212304A CN 202010124722 A CN202010124722 A CN 202010124722A CN 111212304 A CN111212304 A CN 111212304A
Authority
CN
China
Prior art keywords
recommendation
video
target terminal
user
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010124722.3A
Other languages
English (en)
Inventor
杨云龙
隋雪芹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Jukanyun Technology Co ltd
Original Assignee
Qingdao Jukanyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Jukanyun Technology Co ltd filed Critical Qingdao Jukanyun Technology Co ltd
Priority to CN202010124722.3A priority Critical patent/CN111212304A/zh
Publication of CN111212304A publication Critical patent/CN111212304A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请提供了一种视频推荐方法及服务器,所述方法包括:接收目标终端发送的推荐请求;发送推荐结果给所述目标终端,其中,所述推荐结果根据用户行为特征确定,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。本申请提供的视频推荐方法及服务器利用用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重,较高的权重表明用户更感兴趣,从而使获得推荐结果更能针对用户的喜好,实现更加个性化的视频推荐。

Description

一种视频推荐方法及服务器
技术领域
本申请涉及信息处理技术领域,尤其涉及一种视频推荐方法及服务器。
背景技术
目前,随着视频应用的越来越流行,视频应用的服务器为提升用户体验,可以向视频应用的客户端推荐视频。当用户在客户端中打开视频应用后,可以从服务器推荐的各视频进行选择观看。
服务器向视频应用的客户端推荐视频旨在为用户推荐其可能喜欢的视频。服务器向视频应用的客户端推荐视频通常采用协同过滤的推荐方法,主要是服务器获取客户端的观看记录,根据观看记录确定该客户端对应的用户对不同类型视频的喜欢程度,再根据用户对不同类型视频的喜欢程度对服务器中的各个视频按用户的喜欢程度进行排序,按照排序将一些排序靠前的视频推荐给相应用户的客户端。
协同过滤的推荐方法可以根据用户历史的行为数据进行较好的推荐,然而协同过滤的方法会受到数据稀疏的影响,并且会有冷启动的问题。例如,新入网用户会无历史行为数据,从而服务器无法获得新入网用户的历史数据,进而无法利用历史行为数据为用户进行推荐,从而将会影响用户对视频应用的使用体验。
发明内容
本申请提供了一种视频推荐方法及服务器,实现个性化视频推荐。
第一方面,本申请提供了一种视频推荐方法,所述方法包括:
接收目标终端发送的推荐请求;
发送推荐结果给所述目标终端,其中,所述推荐结果根据用户行为特征确定,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
第二方面,本申请还提供了一种服务器,包括处理器、通信接口、存储器和通信总线;其中,所述处理器、所述通信结构、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用户执行所述存储器上存放的计算机程序,实现第一方面所述的视频推荐方法。
本申请提供的视频推荐方法及服务器,在接收到目标终端发送的推荐请求时,发送推荐结果给该目标终端,推荐结果根据用户行为特征确定并且用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。利用用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重,较高的权重表明用户更感兴趣,从而使获得推荐结果更能针对用户的喜好,实现更加个性化的视频推荐。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种视频推荐方法的结构流程图;
图2为本申请实施例提供的另一种视频推荐方法的结构流程图;
图3为本申请实施例提供的深度学习模型的构建过程的结构示意图;
图4为本申请实施例提供的视频推荐方法的推荐流程;
图5为本申请实施例提供的服务器的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为能够有效解决用户数据稀疏时,传统利用用户历史行为数据进行推荐的问题,本申请实施例提供了一种视频推荐方法及服务器。
下面首先对本申请实施例所提供的视频推荐方法进行介绍。
附图1为本申请实施例提供的一种视频推荐方法的流程图,所述视频推荐方法主要用于视频应用中,视频应用可安装在电视、手机等目标终端中,其中本申请提供的视频推荐方法的执行主体为视频应用的服务器。如附图1所示,本申请实施例提供的视频推荐方法,包括:
S100:接收目标终端发送的推荐请求。
在本申请实施例中,当用户启动目标终端视频应用时,视频应用通过目标终端向服务器端发送http请求,用于向服务器请求推荐结果。其中,http请求携带用户的id、电视机型、牌照等用户信息。应用服务器中的推荐引擎接收视频应用发送http请求。
S200:发送推荐结果给所述目标终端,其中,所述推荐结果根据用户行为特征确定,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
当服务器接收到目标终端发送的推荐请求,将获得的推荐结果发送至目标终端。推荐结果根据用户行为特征确定,并且用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
目标终端用户的用户行为特征包括用户观看的视频、观看每一个视频的次数、时长、最后一次观看视频的时间。统计目标终端用户所观看视频对应所有用户的平均观看次数、平均观看时长等。比较用户所看视频的观看次数与平均次数或观看时间与平均时间,用户观看视频的观看次数大于或等于平均次数或者观看时间大于或等于平均时间的推荐权重大于用户观看视频的观看次数小于次数且者观看时间小于平均时间的推荐权重。如所有用户对视频一的平均观看次数为10次、视频二的观看次数为15次,那么当用户的观看视频次数为6次、观看视频二的次数为16次,则用户观看视频一的推荐权重则小于用户观看视频二的推荐权重。
可选的,如果目标终端观看视频的观看次数大于或等于所述视频的平均观看次数或目标终端观看视频的观看时长大于或等于所述视频的平均观看时长,则所述视频的推荐权重为正;
如果目标终端观看视频的观看次数小于所述视频的平均观看次数且目标终端观看视频的观看时长小于所述视频的平均观看时长,则所述视频的推荐权重为负。避免推荐权重为负的视频及相关的视频。
本申请实施例提供的视频推荐方法中,在发送推荐结果给目标终端之前,还包括:根据目标终端对应的历史行为数据获取推荐结果;其中,在推荐结果的确定过程中,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
附图2为本申请实施例提供另一种视频推荐方法。本实施例包括上述实施例中内容。更具体的,如图2所示,本申请实施例提供的视频推荐方法中,根据目标终端对应的历史行为数据获取推荐结果,包括:
S301:从目标终端对应的历史行为数据中抽取用户行为特征和媒资特征,所述用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
在本实施例中,用户历史行为数据主要从用户在电视、手机等终端产生的行为日志中获取有效的用户行为数据,其中在电视、手机等终端产生的行为日志主要是用户在终端点击、观看某些视频产生的日志。
可选的,在收集用户行为数据时,收集用户浏览视频时产生的日志,获取用户最近一个月的用户行为数据,所述用户行为数据包括用户观看视频的媒资信息以及观看的时间和时长;根据视频的观看次数和观看时长过滤所述用户行为数据,将过滤后的用户行为数据保存至用户行为数据库,并不断更新用户行为数据库。
具体的,对用户行为进行清洗,过滤掉其中观看次数和观看时长均低于阈值的数据,获取其中观看次数或观看时长高于或等于阈值的行为数据。其中,阈值可根据实际需要进行选择。例如,次数阈值可以设置为所有用户就任意视频观看次数的平均值/2,即可以过滤掉观看次数小于平均值/2的行为数据。假设所有用户对某一个视频的平均观看次数在10次,若某一用户的观看次数为小于5次,如3次、2次……,则可以认为该用户对该视频不感兴趣,在收集该用户行为数据时,可以将该用户有关该视频的行为数据进行删除。
在本申请实施例中,用户行为数据中包括用户的地域、电视的型号、软件版本、电视牌照信息、用户观看的视频媒资信息等。其中,用户观看的视频媒资信息包括观看每一个视频媒资的次数、观看时长、最后一次观看时间、媒资id、媒资类型、媒资标签,上线时间等。随着视频应用的使用,用户行为数据需要不断的更新。
从用户行为数据库中相应用户的行为数据中抽取该用户的用户特征和媒资特征。其中:用户特征包括基础特征和用户行为特征,基础特征主要包括用户的地域、电视的型号、软件版本和电视牌照信息;用户行为特征主要包括用户观看每一个视频媒资的次数、观看时长和最后一次观看时间。媒资特征主要包括用户观看的媒资id、媒资类型、媒资标签,上线时间。媒资特征主要是和视频媒资相关的信息。
在本申请实施例中,用户特征中的用户的地域、电视的型号、软件版本和电视牌照信息等基础特征,一般情况下不会发生变化,可以每月获取一次;用户特征中的用户观看每一个视频媒资的次数、观看时长和最后一次观看时间等用户离线行为特征,经常的变化,变化的幅度和频率是不受控制而且实时计算难度较大,一般以天或者小时为单位进行抽取更新。媒资特征中的媒资id、媒资类型、媒资标签,上线时间等;除了标签信息外,基本不会发生变化,可以每天进行一次更新。
S302:根据所述媒资特征从知识图谱中抽取知识特征,所述知识图谱用于存储视频媒资不同维度的属性信息,所述知识特征用于表征与所述媒资特征存在关系的媒资。
在本申请实施例中,知识图谱可通过爬虫技术爬取百度百科、时光网等视频信息网站构建。可选的,本申请实施例提供的知识图谱构建过程如下。
通过爬虫技术爬取视频媒资不同维度的属性信息,主要包括视频媒资的基本属性(标题、分类、主题、国家、语言等),时间属性(出品时间),人物信息(演员、导演、主演),其他信息(评分、所获奖项)。爬取的网站主要来自百度百科、360百科等百科类网站以及豆瓣网、时光网等影评类网站。
视频媒资库中会存储来自如爱奇艺、腾讯等内容提供商提供的视频媒资信息,是真实准确的媒资。将这些真实的媒资数据进行编排,给媒资指定唯一确定的媒资ID,不同媒资的标题可能相同,但ID是唯一的。将爬取的视频媒资数据和现有知识图谱中视频媒资的ID进行对应。可选的,当通过爬虫技术爬取到视频媒资不同维度的属性信息时,将通过爬虫爬取到的信息和现有知识图谱中的信息做一个映射,进而更新知识图谱。
可选的,在本申请实施例中,通过标题匹配以及实体消岐的方法对爬取的视频媒资数据与现有知识图谱中视频媒资进行实体映射。获取爬取到的视频媒资不同维度的属性信息中的媒资标题;根据所述媒资标题,通过搜索引擎检索知识图谱中视频媒资的媒资标题;当检索到存在与所述媒资标题具有匹配关系的媒资标题,获取与所述媒资标题匹配度最高的视频媒资,所述将所述视频媒资不同维度的属性信息映射到所述视频媒资;当未检索到与所述媒资标题匹配的媒资标题,将所述视频媒资不同维度的属性信息添加至所述知识图谱。
具体的:对爬虫爬取的媒资标题通过搜索引擎检索我们媒资库中的视频标题,如果检索到完全匹配的媒资标题,则爬虫爬取的该媒资信息直接映射到该媒资的ID;如果检索无结果,则爬虫爬取的媒资将视为一个全新的媒资数据,然后进行ID的分配和入库保存,分配的ID必须是以前未出现的ID;如果检索到的媒资标题存在多个,需要进行实体消歧,保留匹配度最高的媒资作为消歧之后的媒资,将爬虫爬取的该媒资信息映射到该媒资的ID。
如果检索到的媒资标题存在多个,则表示存在重名或相近名称的媒资,直接对这种媒资进行映射有可能导致映射到错误的媒资信息,需要利用媒资已有的信息和候选的媒资进行消岐。
假设爬虫爬取的媒资为S,媒资库候选的媒资集合为X={X1,X2,...,Xn},其中Xi表示候选的媒资。实体消歧的具体方法如下所示:
抽取候选媒资Xi和待消歧的媒资S的相关特征,包括媒资标题、媒资描述信息,上下文信息、类别信息等。并将这些特征进行向量化,将每一个特征表示为一个低维、稠密的向量。候选媒资Xi的特征向量为xi,待消歧的媒资特征向量为s。则向量之间的相似度可以用余弦距离进行计算:
Figure BDA0002394058880000041
其中:·表示向量点乘操作,||s||表示向量s的模长。取相似度最大的候选媒资作为最终的媒资,将爬虫爬取的媒资的属性进行同步并保存到数据库中。
因此本申请提供的知识图谱,经过上述信息爬取、实体映射以及实体消岐的过程之后,最终可以获得拥有多种属性信息的媒资。
知识获取的过程基于已经构建好的知识图谱,即从知识图谱中提取知识三元组。通常一条知识可以利用知识图谱中的一个三元组的形式进行表示,定义三元组为(h,r,t),其中h和t表示两个实体,r表示两个实体之间的关系。例如,在知识图谱中有如下一个三元组(简川訸,导演,11020128365),其中“11020128365”为媒资“都挺好”在数据库中存储的ID。这个三元组就构成了一条先验知识即“电视剧都挺好的导演是简川訸”,采用ID进行表示媒资能够唯一确定对应的媒资,避免采用标题表示媒资出现多个不同媒资具有相同标题的情况发生。
通过知识获取过程获得的所有三元组将作为训练数据输入到知识表示学习算法中,用于学习知识表示,从而获取实体和关系的向量表示。
知识表示学习旨在将知识库中实体和关系的语义信息表示为一个低维、稠密的实值向量,通过将实体或关系投影到低维向量空间,我们能够实现对实体和关系的语义表示,并高效的计算出实体、关系以及它们之间复杂的语义关联。
知识表示学习的主流方式是基于翻译模型的方法,该方法把知识库中的关系看作实体间的某种平移向量,用于建模实体和关系之间的语义关系。以TransE方法为例,对于每一个三元组数据(h,r,t),TransE用关系r的向量lr作为头实体向量lh到尾实体向量lt之间的平移,我们也可以将lr看作从lh到lt的翻译。对于每一个三元组,TransE定义如下能量函数用于计算关系和实体之间的相似得分:
fr(h,t)=|lh+lr-lt|L2
即计算向量之间的L2距离作为得分,根据此得分TransE定义了如下进行优化的目标函数,进行迭代计算,获得实体和关系的向量。
Figure BDA0002394058880000051
其中,S表示正确的三元组集合,S′表示错误的三元组集合,α表示正确三元组集合和错误三元组集合得分之间的间隔距离。TransE将S中每个三元组的头实体、关系、尾实体其中之一随机替换为其他实体或者关系来得到错误的三元组。
本申请实施例中,采用TransE模型用于建模知识库中实体和关系的语义联系,具体模型的计算步骤如下:
1.input:训练集包括正确的三元组集合S和错误的三元组组合S′,间隔距离α,学习率λ
2.initialize:随机初始化实体和关系的向量,维度为d。初始化的方法可以采用正态分布或者均匀分布,并对向量做正则化处理。
3.loop:每次随机抽取一个固定batch大小的数据进行迭代,计算batch内所有样本的损失,然后进行实体和关系向量的更新。
4.等损失已经收敛或者达到最大的迭代次数,停止计算;得到最终的实体和关系的向量表示。
在本申请实施例中,从知识图谱中抽取与各用户对应的知识特征,针对用户观看的视频,在知识图谱中抽取候选的知识集合。知识集合的定义为,和该实体具有相邻一阶关系的实体的集合,如此可能得到很多的实体作为候选知识集合。可选的,本申请实施例中采用基于PageRank的方法进行计算候选实体的权重,只抽取topM的实体加入到知识集合。
具体的:
以用户的历史行为抽取基础的候选实体集合,并通过相应的过滤条件,例如观看时长、观看次数对日志中媒资实体进行过滤。根据知识图谱的知识信息,抽取与候选实体集合内实体有直接边相连的所有媒资实体。例如,媒资实体战狼和媒资实体战狼2均存在媒资实体演员吴京这个关系,通过吴京可以将两部电影进行连接;因此认为战狼和战狼2属于有直接边相连的实体,需要从知识图谱进行抽取。这些媒资实体就构成了与用户对应的候选知识特征集合。将候选知识特征集合中的边视为有向边,媒资实体视为节点。在本申请实施例中,初始化有向图每个节点的权重为1/N,其中N为节点的总数。
根据权重公式迭代计算各用户对应的候选知识特征集合内媒资实体的权重直至媒资实体的权重不再发生变化,获得各用户对应的候选知识特征集合内媒资实体的权重。
其中,权重公式如下公式(1):
Figure BDA0002394058880000052
其中,W(pi)表示当前节点pi的权重,
Figure BDA0002394058880000053
表示所有对节点pi有出边的节点集合,W(pj)为
Figure BDA0002394058880000061
中pi外的其他媒资实体的权重,L(pj)是指节点pj的出边数量,N是用户对应的候选知识特征集合内节点总数。可选的,α为权重系数一般可以取0.85,用于平衡候选知识特征集合内媒资实体的权重。
在本申请实施例中,根据公式(1)计算候选知识特征集合内N个媒资实体的权重,作为一次迭代;重复迭代过程,直至候选知识特征集合内N个媒资实体的权重不在发生变化。
按照权重从大到小将目标终端对应的候选知识特征集合内媒资实体进行排序,抽取目标终端的候选知识特征集合内媒资实体的权重排列前M的候选知识特征,用作目标终端对应的知识特征,其中M≤N。在本申请实施例中,M可根据N进行选择,如M=N/4,或者根据候选知识特征集合内媒资实体的权重的分布情况,选择权重拐点前的对应的候选知识特征用作与用户对应的知识特征。
S303:将所述用户行为特征、媒资特征和知识特征输入到深度学习模型,获取推荐结果;其中,所述深度学习模型是根据样本用户的用户行为特征、媒资特征及知识特征基于卷积神经网络训练得到的模型。
本申请实施例中的深度学习模型基于候选视频的知识集合和用户行为日志数据获得,用于建模用户行为和知识之间的联系,进而实现针对每一个用户进行视频推荐。
在本申请实施例中,根据样本用户的用户行为特征、媒资特征及知识特征来构建训练和测试的数据集。可选的,训练和测试集合的占比一般为8:2,其遵循相同或相似的数据分布,进行正负样本的划分,以用户日志为例,可以选取用户观看次数、观看时长大于阈值的作为正样本,认为用户喜欢该视频并可以进行推荐;用户观看次数、观看时长小于阈值的作为负样本,不能给用户推荐该视频和/或与该视频类似的视频。
可选的,深度学习模型的构建过程如附图3所示。具体的;样本用户的用户行为特征和媒资特征分别通过不同的投影矩阵映射为低维、实值的向量,知识特征采用知识表示学习学习出的实体和关系向量;这三部分的向量分别输入到三个不同的卷积神经网络(CNN)模型中进行卷积、池化操作,其中卷积层的参数是共享的,这样可以保证不同的CNN之间可以学习到各部分潜在的语义联系。池化之后获得三部分语义表示的向量,然后拼接在一起输入到感知机模型进行分类,进而获得深度学习模型。
在根据已经训练完成的深度学习模型获得与用户对应的推荐结果时,将与用户对应的用户行为特征、媒资特征及知识特征输入到深度学习模型,获得与用户对应的推荐结果。
或者,本申请实施例提供的视频推荐方法中,发送推荐结果给目标终端,包括将预先获取的推荐结果发送给目标终端,在预先确定所述推荐结果的过程中,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
在本申请实施例中,服务器预先根据各用户的用户行为特征、媒资特征及知识特征输入到深度学习模型,定期获得各用户的推荐结果。可选的,将预先各用户的推荐结果存储到codis集群。在本申请实施例中,codis集群的各用户的推荐结果可定期进行更新。可选的。当用户的用户行为特征、媒资特征及知识特征更新后,重新获取各用户的推荐结果,进而更新codis集群的各用户的推荐结果。进而当接收到目标终端发送的推荐请求,可从codis集群中获取对应该目标的推荐结果。
可选的,在本申请实施例中,推荐引擎根据http请求中的信息,拼接需要召回用户信息的key(关键、线索),根据用户信息的key获取与该用户对应的视频推荐结果,将该视频推荐结果返回给该用户。用户信息包括用户ID、设备机型和牌照信息等。可选的,用户信息的key的结构为产品id_用户id_机型_牌照。
进一步,在本申请实施例中,当推荐引擎在获取到与用户对应的视频推荐结果后,根据用户信息中包括设备机型、牌照信息和软件版本过滤获取到的视频推荐结果,过滤到使用于用户设备的视频结果,将过滤后的视频推荐结果的视频根据视频的热度和曝光率进行重排序,将重排序后的视频推荐结果返回给该用户。
在本申请实施例中,为便于完成为新用户推荐视频,统计历史中各用户的用户行为特征、媒资特征和知识特征,分别获得用户行为特征、媒资特征和知识特征的平均值;将该用户行为特征、媒资特征和知识特征的平均值输入到深度学习模型,获取平均视频推荐结果;当接收的用户的推荐请求为新用户的推荐请求时,将该平均视频推荐结果返回给该新用户。
进一步,当将平均视频推荐结果返回给用户前,也将针对该新用户的用户信息对平均视频推荐结果进行过滤以及按照热度、曝光率等维度进行重排序,将重排序后的平均视频推荐结果返回给该新用户。
本实施例提供的视频推荐方法,提取各用户的用户行为特征和媒资特征以及与各用户对应的知识特征,结合运用样本用户的用户特征、媒资特征及知识特征基于卷积神经网络训练得到的深度学习模型,离线获取与各用户对应的视频结果,当接收到用户的推荐请求时,根据用户的推荐请求从离线获取与各用户对应的视频结果中获取与该用户对应的视频推荐结果,将该视频推荐结果返回给该用户。本实施例提供的视频推荐方法中,利用用户行为与视频媒资之间实体和关系的知识特征,能够有效解决用户数据稀疏时的视频推荐问题,进而能够更加准确的为用户进行更加个性化的视频推荐。
本申请实施例提供的视频推荐方法的推荐流程如附图4所示,服务器离线提取各用户的用户特征和媒资特征以及与各用户对应的知识特征,将提取到的各用户的用户特征、媒资特征和知识特征输入到深度学习模型获得针对各用户的视频推荐结果,当接收到用户的访问请求时,搜索与该用户对应的视频推荐结果,对搜索到的视频推荐结果进行过滤、重排序,将过滤、重排序后的视频推荐结果返回给相应的目标终端。
本申请实施例还提供了一种服务器,附图5为本申请实施例提供的一种服务器的结构示意图。
如附图5所示,本申请提供的服务器,包括:包括处理器501、通信接口502、存储器503和通信总线504;其中,所述处理器501、所述通信接口502、所述存储器503通过所述通信总线504完成相互间的通信;
所述存储器503,用于存放计算机程序;
所述处理器501,用户执行所述存储器上存放的计算机程序,实现上述实施例所述的视频推荐方法。
上述服务器提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处,相关之处参见方法实施例的部分说明即可。本领域技术人员在考虑说明书及实践这里的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种视频推荐方法,其特征在于,所述方法包括:
接收目标终端发送的推荐请求;
发送推荐结果给所述目标终端,其中,所述推荐结果根据用户行为特征确定,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
2.根据权利要求1所述的视频推荐方法,其特征在于,在发送推荐结果给所述目标终端之前,所述方法还包括:
根据目标终端对应的历史行为数据获取推荐结果;其中,在推荐结果的确定过程中,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
3.根据权利要求1所述的视频推荐方法,其特征在于,所述发送推荐结果给所述目标终端,包括:
将预先获取的推荐结果发送给所述目标终端,在预先确定所述推荐结果的过程中,用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重。
4.根据权利要求2所述的视频推荐方法,其特征在于,根据目标终端对应的历史行为数据确定推荐结果,包括:
从目标终端对应的历史行为数据中抽取用户行为特征和媒资特征,所述用户行为特征小于平均值时的推荐权重小于用户行为特征大于平均值时的推荐权重;
根据所述媒资特征从知识图谱中抽取知识特征,所述知识图谱用于存储视频媒资不同维度的属性信息,所述知识特征用于表征与所述媒资特征存在关系的媒资;
将所述用户行为特征、媒资特征和知识特征输入到深度学习模型,获取推荐结果;其中,所述深度学习模型是根据样本用户的用户行为特征、媒资特征及知识特征基于卷积神经网络训练得到的模型。
5.根据权利要求2所述的视频推荐方法,其特征在于,在发送推荐结果给所述目标终端之前,所述方法还包括:
根据所述推荐请求拼接用户信息,所述推荐请求中携带用户信息,所述用户信息中包括设备机型、牌照信息和软件版本;
发送推荐结果给所述目标终端,包括:
根据所述机型、牌照信息和软件版本过滤获取到的推荐结果,发送过滤后的推荐结果给所述目标终端。
6.根据权利要求4所述的视频推荐方法,其特征在于,从目标终端对应的历史行为数据中抽取用户行为特征和媒资特征之前,所述方法包括:
收集目标终端浏览视频时产生的日志,获取所述目标终端最近一个月的历史行为数据,所述历史行为数据包括目标终端观看视频的媒资信息以及观看的时间和时长;
根据目标终端观看视频的观看次数或观看时长过滤所述用户行为数据,保存过滤后的用户行为数据。
7.根据权利要求6所述的视频推荐方法,其特征在于,根据目标终端观看视频的观看次数或观看时长过滤所述用户行为数据,包括:
获取所述视频的平均观看次数或平均观看时长;
如果目标终端观看视频的观看次数大于或等于所述视频的平均观看次数或目标终端观看视频的观看时长大于或等于所述视频的平均观看时长,则所述视频的推荐权重为正;
如果目标终端观看视频的观看次数小于所述视频的平均观看次数且目标终端观看视频的观看时长小于所述视频的平均观看时长,则所述视频的推荐权重为负。
8.根据权利要求4所述的视频推荐方法,其特征在于,根据所述媒资特征从知识图谱中抽取知识特征,包括:
根据所述媒资特征从知识图谱中抽取与所述媒资特征有直接边相连的所有媒资实体,获取与目标终端对应的候选知识特征集合;
根据权重公式
Figure FDA0002394058870000021
迭代计算目标终端对应的候选知识特征集合内媒资实体的权重直至媒资实体的权重不再发生变化,其中,W(pi)为媒资实体pi的权重,
Figure FDA0002394058870000023
表示所有对媒资实体pi有出边的媒资实体集合,W(pj)为
Figure FDA0002394058870000022
中pi外的其他媒资实体的权重,L(pj)是指媒资实体pj的出边数量,N是各用户对应的候选知识特征集合内媒资实体总数,候选知识特征集合内各媒资实体的初始权重为1/N,α为权重系数;
按照权重从大到小将目标终端对应的候选知识特征集合内媒资实体进行排序,抽取目标终端对应的候选知识特征集合内媒资实体的权重排列前M的候选知识特征,用作目标终端对应的知识特征,其中M≤N。
9.根据权利要求1所述的视频推荐方法,其特征在于,发送推荐结果给所述目标终端,包括:
如果所述目标终端为新用户,获取平均推荐结果,发送所述平均推荐结果给所述目标终端;
所述平均推荐结果根据平均用户行为特征确定。
10.一种服务器,其特征在于,包括处理器、通信接口、存储器和通信总线;其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用户执行所述存储器上存放的计算机程序,实现权利要求1-9任意一项所述的视频推荐方法。
CN202010124722.3A 2020-02-27 2020-02-27 一种视频推荐方法及服务器 Withdrawn CN111212304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010124722.3A CN111212304A (zh) 2020-02-27 2020-02-27 一种视频推荐方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010124722.3A CN111212304A (zh) 2020-02-27 2020-02-27 一种视频推荐方法及服务器

Publications (1)

Publication Number Publication Date
CN111212304A true CN111212304A (zh) 2020-05-29

Family

ID=70789864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010124722.3A Withdrawn CN111212304A (zh) 2020-02-27 2020-02-27 一种视频推荐方法及服务器

Country Status (1)

Country Link
CN (1) CN111212304A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818222A (zh) * 2021-01-26 2021-05-18 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN113190758A (zh) * 2021-05-21 2021-07-30 聚好看科技股份有限公司 服务器及媒资推荐方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818222A (zh) * 2021-01-26 2021-05-18 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN112818222B (zh) * 2021-01-26 2024-02-23 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN113190758A (zh) * 2021-05-21 2021-07-30 聚好看科技股份有限公司 服务器及媒资推荐方法
CN113190758B (zh) * 2021-05-21 2023-01-20 聚好看科技股份有限公司 服务器及媒资推荐方法

Similar Documents

Publication Publication Date Title
CN110321422B (zh) 在线训练模型的方法、推送方法、装置以及设备
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN108304512B (zh) 一种视频搜索引擎粗排序方法、装置及电子设备
EP2438539B1 (en) Co-selected image classification
US10459975B1 (en) Method and system for creating an automatic video summary
US9405746B2 (en) User behavior models based on source domain
CN110717099B (zh) 一种推荐影片的方法及终端
CN111666448B (zh) 搜索方法、装置、电子设备及计算机可读存储介质
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
EP2452274A1 (en) Systems and methods for making recommendations using model-based collaborative filtering with user communities and items collections
CN113672793A (zh) 一种信息召回方法、装置、电子设备及存储介质
CN111212304A (zh) 一种视频推荐方法及服务器
CN113032589A (zh) 多媒体文件推荐方法、装置、电子设备及可读存储介质
CN115982467A (zh) 一种去偏化用户多兴趣推荐方法、装置及存储介质
Su et al. Hybrid recommender system based on deep learning model
CN115687690A (zh) 一种视频推荐方法、装置、电子设备及存储介质
US20210200799A1 (en) System and method for improved content discovery
CN111339435A (zh) 一种基于潜在因子的矩阵分解补全混合推荐方法
CN117061796A (zh) 影片推荐方法、装置、设备及可读存储介质
Yang et al. Generating knowledge-based attentive user representations for sparse interaction recommendation
CN112749296A (zh) 一种视频推荐方法、装置、服务器及存储介质
CN114329167A (zh) 超参数学习、智能推荐、关键词和多媒体推荐方法及装置
CN115278374B (zh) 视频召回方法及装置
CN116881483B (zh) 多媒体资源推荐方法、装置及存储介质
CN116777529B (zh) 一种对象推荐的方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200529