CN108647293B - 视频推荐方法、装置、存储介质和服务器 - Google Patents
视频推荐方法、装置、存储介质和服务器 Download PDFInfo
- Publication number
- CN108647293B CN108647293B CN201810427835.3A CN201810427835A CN108647293B CN 108647293 B CN108647293 B CN 108647293B CN 201810427835 A CN201810427835 A CN 201810427835A CN 108647293 B CN108647293 B CN 108647293B
- Authority
- CN
- China
- Prior art keywords
- user
- video
- videos
- users
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种视频推荐方法、装置、存储介质和服务器,所述视频推荐方法包括:获取目标用户的特征值;根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别;根据所述用户类别,向目标用户推荐视频。本发明可达到个性化推荐的目的,提高推荐视频的点击率,降低用户流失率。
Description
技术领域
本发明涉及信息处理技术,尤其是一种视频推荐方法、装置、存储介质和服务器。
背景技术
视频是目前非常流行的娱乐方式,在视频平台上,视频的数量也非常众多,如何让用户快速找到感兴趣的视频,如何提高系统推荐视频的点击率,是很多视频平台面临的问题。现有的视频推荐方式一般根据排行榜进行推荐或推荐预先设定的节目,这些推荐方式较为单一,无法为不同用户推荐个性化的视频,不利于提高推荐视频的点击率。
发明内容
本发明旨在至少解决上述技术缺陷之一,特别是解决针对不同用户无法推荐个性化视频的问题。
本发明提供了一种视频推荐方法,包括:
获取目标用户的特征值;
根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别;
根据所述用户类别,向目标用户推荐视频。
优选地,所述推荐方法还包括:
获取种子用户的特征值;
根据聚类个数k、聚类算法与所述种子用户的特征值,得到所述聚类模型,所述聚类模型中包括k个聚类和每个聚类的中心值,每个聚类对应一个用户类别,k为预置值。
优选地,所述获取种子用户的特征值之前,还包括:
获取历史用户的视频观看数据,视频观看数据包括预置时间段内用户登录天数和视频观看次数;
从历史用户中选定预置时间段内用户登录天数在预设天数以上的用户,从选定用户中,把视频观看次数最多的预置百分比用户作为种子用户。
优选地,所述根据所述特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别,包括:
计算目标用户的特征值与所述每个聚类的中心值的距离;将所述距离最小的聚类对应的用户类别作为所述目标用户的用户类别。
优选地,所述根据所述用户类别,向目标用户推荐视频,包括:
获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库;
根据推荐视频库向目标用户推荐视频。
优选地,所述获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库,包括:
获取每个聚类中种子用户对每个视频的观看总次数,按照观看总次数从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;或
获取每个聚类中种子用户对每个视频的观看总次数、观看总时长、用户点赞数量;将视频的观看总次数、观看总时长、用户点赞数量分别进行归一化处理,得到三个数值;将三个数值分别乘以预定权重后相加,得到综合值;按照综合值从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库。
优选地,所述根据所述用户类别,向目标用户推荐视频,包括:
根据所述用户类别,获取第一预定数量视频,从所述目标用户订阅的主播中获取最新发布的第二预定数量视频;向所述目标用户推荐所述第一预定数量视频和第二预定数量视频。
优选地,所述获取目标用户的特征值之前,还包括:
判断所述目标用户是否为聚类模型中的用户;
若是,则推荐最新发布的视频;若否,则继续所述获取目标用户的特征值的步骤。
优选地,所述根据所述用户类别,向目标用户推荐视频,包括:
根据所述用户类别,确定向所述目标用户推荐的视频集合;
判断视频集合中是否有目标用户未观看的视频;
若是,向所述目标用户推荐未观看过的视频;
若否,推荐最新发布的视频。
优选地,所述特征值包括用户登录次数、用户登录时段、每次直播观看时长、每天直播观看时长、观看直播次数、用户登录天数中的一个或多个。
本发明还提出一种视频推荐装置,包括:
获取模块,用于获取目标用户的特征值;
分类模块,用于根据所述特征值确定目标用户与聚类模型中各聚类的相似度,得到目标用户所属聚类对应的用户类别;
推荐模块,用于根据所述用户类别,向目标用户推荐视频。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时,实现前述任一项所述视频推荐方法的步骤。
本发明还提出一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任一项所述视频推荐方法的步骤。
本发明的有益效果如下:
1、本发明根据目标用户的特征值和聚类模型得到目标用户所属聚类对应的用户类别,再根据用户类别推荐视频,可达到个性化推荐的目的,既节约了用户挑选视频的时间,也有利于降低用户的流失率和提高推荐视频的点击率。
2、本发明可根据种子用户的特征值建立聚类模型,以将目标用户的特征值与种子用户的聚类中心值进行比较,得到与种子用户的聚类最相似的用户类别,使得用户的分类更科学。
3、本发明可根据种子用户的视频观看数据得到每个用户类别对应的推荐视频库,使得推荐至目标用户的视频更符合目标用户的观看喜好,提升了用户体验,进一步提高了视频的点击率;而且,根据种子用户的视频观看数据得到推荐视频库,有利于提高不具备标签信息的视频的点击量,以挖掘出不具备标签信息的优质视频,进而提高用户上传视频或直播的积极性。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明视频推荐方法第一实施例的流程示意图;
图2为本发明视频推荐方法一个实施例的流程示意图;
图3为本发明视频推荐方法另一个实施例的流程示意图;
图4为本发明视频推荐方法另一个实施例的流程示意图;
图5为本发明所述服务器的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”到另一元件时,它可以直接连接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提出一种视频推荐方法,以向用户推荐个性化的视频,如图1所示的第一实施例,包括如下步骤:
步骤S10:获取目标用户的特征值;
步骤S20:根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别;
步骤S30:根据所述用户类别,向目标用户推荐视频。
每个步骤具体如下:
步骤S10:获取目标用户的特征值。
目标用户的特征值包括用户信息中可能与用户观看视频内容相关联的个性特征值,例如:用户的属性信息、用户的历史观看行为信息等。所述属性信息包括用户性别、所在地、籍贯、用户等级、用户年龄等。例如:女性对化妆、明星、手工制作等相关的视频可能较为感兴趣,男性对游戏、户外、军事等相关的视频可能较为感兴趣,故用户性别可作为所述特征值之一;同理,用户亦可能对与其所在地或籍贯所在地相关的视频较为感兴趣,或,与特定年代相关的视频对其具有更强的吸引力,而该特定年代与用户的年龄具有一定关系,故用户的所在地、籍贯或年龄亦可作为所述特征值之一。所述用户的历史观看行为信息包括用户的登录时段、登录次数、观看时长、累计观看次数等。例如:用户登录次数较为频繁,可能代表碎片时间较多的用户群,所述用户群观看的视频可能具有某类共性特点,故所述用户登录次数可作为特征值之一。
本发明还提出另一实施例,所述特征值包括用户登录次数、用户登录时段、每次直播观看时长、每天直播观看时长、观看直播次数、用户登录天数等行为特征值中的一个或多个。所述行为特征值为与用户的历史观看行为信息相关联的特征值,通过统计与计算所述行为特征值,可使后续的用户分类与用户观看视频的行为更加密切,从而向分类后的用户推荐与其观看行为更相关的视频,从而提高推荐的视频的点击率,提高用户体验。
步骤S20:根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别。
聚类是将数据分类到不同类别的过程,同一个类别中的数据有很大的相似性,不同类别之间的数据有很大的相异性。聚类不依赖于预先定义的类别或带有类别标记的训练实例,而是由聚类学习算法自动确定标记,将样本数据自动进行分类。聚类模型是基于聚类算法的聚类分析模型,本实施例利用的聚类算法可以是:K-mean聚类算法、层次聚类算法和最大期望EM算法。
建立所述聚类模型时,可将与目标用户的特征值类似或相同的历史用户的特征值作为训练样本数据,以得到与目标用户的特征值相关联的聚类模型,并基于所述历史用户的聚类结果,得到待分类的目标用户的分类结果。根据不同的聚类模型,所述用户的类别数量可预先设定,亦可由所述聚类模型学习得出。
本发明还提出如下实施例,以建立所述聚类模型:
所述推荐方法还包括:
获取种子用户的特征值;
根据聚类个数k、聚类算法与所述种子用户的特征值,得到所述聚类模型,所述聚类模型中包括k个聚类和每个聚类的中心值,每个聚类对应一个用户类别,k为预置值。
所述种子用户可为视频平台的优质用户,例如,具有较高的观看视频频率的用户,或具有较高的上传视频频率或直播视频频率的用户,或在视频平台消费较高的用户,或在线观看时长较长的用户,或者弹幕发送次数较多的用户等。所述种子用户可基于历史用户的登录次数、登录频率、观看总时长、每次观看平均时长等参数中的一个或多个确定。例如,从所述历史用户的视频观看数据中获取每个用户的观看总时长,根据所述观看总时长,对历史用户进行排序,将排序前30%的历史用户作为种子用户;或,从所述历史用户的视频观看数据中获取每个用户的登录频率和每次观看平均时长,根据所述登录频率和每次观看平均时长得到用户使用指数,根据所述用户指数对历史用户进行排序,将排序前20%的历史用户作为种子用户。
本实施例通过预设聚类个数k可将所述种子用户分为k个用户类别,每个用户类别中的种子用户的特征值之间可具有最小方差,以保证了每个用户类别中的种子用户特征具有较高的相似性。当所述特征值为种子用户的行为特征值时,每个用户类别中的种子用户在行为上具有较高的相似性,从而可将待分类的目标用户划分至与其行为具有更高相似性的用户类别中,从而为所述用户推荐更适合的视频,提高用户体验,并提高推荐视频的点击量。
更进一步地,本实施例可采用K-means聚类算法,以提高类聚效率;并可定期快速迭代聚类模型,提高聚类结果的准确性,以使得到的用户类别具有更高的共性特征。
采用K-means聚类算法时,在确定聚类个数k之前,可分别预设若干个不同的预置值k1、k2……,并分别根据种子用户的特征值进行聚类,以根据多个聚类的结果,确定聚类个数k的最佳取值。
步骤S30:根据所述用户类别,向目标用户推荐视频。
本步骤根据目标用户所属的用户类别推荐视频,可向属于不同用户类别的目标用户推荐不同的视频,达到了个性化推荐的目的,提高了推荐视频的点击量;而且,通过预设不同的推荐视频库或多组推荐视频,本步骤还可根据用户类别切换推荐的视频,避免了推荐视频的单一性问题,也节约了用户从大量视频中挑选感兴趣视频的时间,提升了用户体验,降低了用户流失率。
为确定种子用户,本发明还提出如下实施例:
获取种子用户的特征值之前,还包括:
获取历史用户的视频观看数据,视频观看数据包括预置时间段内用户登录天数和视频观看次数;
从历史用户中选定预置时间段内用户登录天数在预设天数以上的用户,从选定用户中,把视频观看次数最多的预置百分比用户作为种子用户。
所述把视频观看次数最多的预置百分比用户作为种子用户,为按视频观看次数从大到小对选定的用户进行排序,获取排序中前面的占总选定用户数量预置百分比的选定用户,作为种子用户。本实施例中的预置时间段可为最近一周或两周,所述预设天数为小于或等于所述预置时间段的天数;例如,所述预置时间段为7天,所述预设天数为3天,则从历史用户中选定最近7天内用户登录天数在3天以上的用户。本实施例将登陆天数和视频观看次数作为确定所述种子用户的参数,有利于筛选出登陆次数较多且观看视频较多的优质用户作为种子用户,还可得到与种子用户的用户类别相对应的、点击率较高的所述推荐视频库;进一步地,本实施例根据所述预制百分比确定种子用户的数量,相较于固定数量的种子用户来说,本实施例可根据符合条件的历史用户总数动态确定种子用户的数量,避免了用户量级变化时,因所述种子用户的数量固定而导致聚类结果出现偏差的情况,保证了用户分类的精度,避免了用户分类的絮乱。
在本发明的另一实施例中,所述根据所述特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别,包括:
计算目标用户的特征值与所述每个聚类的中心值的距离;
将所述距离最小的聚类对应的用户类别作为所述目标用户的用户类别。
在部分聚类算法中,例如K-means聚类算法,每个聚类具有质心,每个样本数据将归类到与所述质心距离最近的聚类中,在样本的统计数据中,每个所述质心对应于一个中心值。本实施例根据目标用户的特征值计算目标用户到每个聚类的中心值的距离,以得到与之距离最小的聚类,再将所述距离最小的聚类对应的用户类别作为所述目标用户的用户类别,从而确保将目标用户划分至与其特征值最接近的用户类别中。
向目标用户推荐视频时,可将视频标签、视频发布者的信息或视频内容等信息,与所述用户类别进行匹配,以向不同用户类别的目标用户推荐不同的视频;或,从建立所述聚类模型的种子用户的视频观看数据中获取信息,向目标用户推荐对应用户类别的种子用户观看过的视频。为方便向目标用户推荐视频,在推荐视频之前,本发明可预先建立若干推荐视频库;每个推荐视频库对应于不同的用户类别,以向不同用户类别的目标用户推荐不同的视频或视频清单。故,本发明还提出如下实施例:
所述根据所述用户类别,向目标用户推荐视频,包括:
获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库;
根据推荐视频库向目标用户推荐视频。
本实施例中的推荐视频库基于所述种子用户的视频观看数据得到,以向目标用户推荐对应用户类别的种子用户感兴趣的视频,可提高推荐的视频与用户行为或属性的匹配程度,优化了视频推荐的质量,提高了用户体验,提高了推荐视频的点击率。
在建立所述聚类模型时,可获得每个聚类中对应的种子用户观看过的视频,并对所述种子用户观看过的视频进行筛选,以得到每个聚类对应的用户类别的推荐视频库。当待分类的目标用户通过所述聚类模型确定特定的用户类别时,亦可得到该特定的用户类别对应的推荐视频库。
本实施例尤其适用于视频平台中具有大量不具备标签信息的视频的情况;通过种子用户的视频观看数据,本实施例即可确定不具备标签信息的视频的潜在推荐目标用户,既丰富了向目标用户推荐视频的内容,也有利于提高不具备标签信息的视频的点击量,进而提高用户上传视频或直播的积极性;而且,通过种子用户的视频观看数据,亦有利于挖掘出不具备标签信息的优质视频,从而向更多用户展现更多的优质视频。
根据推荐视频库向目标用户推荐视频时,由于所述种子用户观看过的视频并不是每一个均为优质视频或是受欢迎的视频,为筛选出更受目标用户喜爱的视频,基于上一实施例,本发明还提出另一个实施例:
所述获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库,包括:
获取每个用户类别对应聚类的种子用户对每个视频的观看总次数,按照观看总次数从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;或
获取每个用户类别对应聚类的种子用户对每个视频的观看总次数、观看总时长、用户点赞数量;将视频的观看总次数、观看总时长、用户点赞数量分别进行归一化处理,得到三个数值;将三个数值分别乘以预定权重后相加,得到综合值;按照综合值从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库。
如图2所示,其根据所述用户类别,向目标用户推荐视频的具体步骤包括:
步骤S21:获取种子用户的特征值;
步骤S22:根据聚类个数k、聚类算法与所述种子用户的特征值,得到所述聚类模型,所述聚类模型中包括k个聚类和每个聚类的中心值,每个聚类对应一个用户类别,k为预置值;
步骤S23:获取每个聚类中种子用户对每个视频的观看总次数,按照观看总次数从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;或
获取每个聚类中种子用户对每个视频的观看总次数、观看总时长、用户点赞数量;将视频的观看总次数、观看总时长、用户点赞数量分别进行归一化处理,得到三个数值;将三个数值分别乘以预定权重后相加,得到综合值;按照综合值从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;
步骤S31:根据推荐视频库向目标用户推荐视频。
本实施例提出两种得到推荐视频库的方式,以从所述视频观看数据中确定预定数量的视频作为该用户类别对应的推荐视频库。所述按照观看总次数从大到小对视频进行排序算法简单,可较快得出排序结果,并可快速调整排序结果;所述按照综合值从大到小对视频进行排序,可提高排序结果的质量,使用户获得更优质的视频推荐结果。
本发明亦可按照所述观看总时长或用户点赞数量从大到小进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;或,将所述观看总次数、观看总时长、用户点赞数量等参数进行两两组合,以得到新的综合值,再按照所述新的综合值从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库。当然,本发明还可将其它用户观看视频的参数作为视频排序的参照,在此不再赘述。
根据用户类别得到的、可向目标用户推荐的视频数量,一般超过一次向目标用户推荐的预计视频数量;例如,根据用户类别得到的对应推荐视频库中具有200个视频,但一次向目标用户推荐的视频数量为20个。故,本发明提出如下实施例:所述根据所述用户类别,向目标用户推荐视频,包括:
根据所述用户类别,获取第一预定数量视频,从所述目标用户订阅的主播中获取最新发布的第二预定数量视频;向所述目标用户推荐所述第一预定数量视频和第二预定数量视频。
本实施例根据所述第一预定数量视频和第二预定数量视频,可将与所述用户类别相对应的较多视频分成多组推荐给目标用户,以使目标用户可手动切换至另一组推荐视频,或通过系统设置自动触发切换至另一组推荐视频,以为用户提供更多个性化的选择,提升了用户体验;而且,在每次的视频推荐中,本实施例不仅根据目标用户的用户类推荐视频,还根据目标用户的定制信息推荐视频,进一步丰富了向目标用户推荐视频的来源,提高了目标用户点击推荐视频的概率。所述定制信息可包括所述目标用户订阅的主播信息、目标用户预设的视频关键词信息等。
进一步地,所述根据所述用户类别,获取第一预定数量视频,亦可为:根据所述用户类别,获取对应的所述推荐视频库,从所述推荐视频库中获取排序在前的第一预定数量视频。本实施例可进一步提高推荐的视频与目标用户特征值的匹配程度,以使目标用户迅速获到更优质的视频。
下面以一个具体实施例说明本发明的完整推荐步骤:
(1)开发聚类模型的特征指标
可根据用户最近7天的使用行为,挖掘较为活跃的6个用户使用习惯特征指标:用户APP登录次数(denglv)、用户登录时段(diff_watch)、每次直播观看时长(watch_times)、每次天直播观看时长(luid_cn)、观看直播次数(watch_cishu)、用户登录天数(days),将所述六个特征指标的参数值作为聚类模型的特征值。
(2)挖掘种子用户
将最近7天中有3天登录、且视频观看次数最多的5%的用户做为种子用户,这些种子用户观看过的视频做为最受欢迎的视频。
(3)对种子用户进行聚类
根据所述聚类模型的6个特征指标,对所述种子用户进行K-means算法聚类,得到5个聚类的种子类别及每个聚类的中心值,所述聚类可分别用A1、A2、A3、A4、A5标识,每个聚类对应一个所述用户类别;最终各个聚类的中心值可如下表一所示:
表一:最终聚类类别的中心值
(4)对目标用户进行聚类划分
将每个待分类的目标用户的特征值与所述聚类的中心值进行对比,根据聚类算法,分别计算目标用户与5个种子类别的中心值的距离,将距离最近的一个种子类别作为目标用户的用户类别;即:将每个待分类的目标用户划分到所述5个种子类别中。距离最近指目标用户和其划分到的种子类别的中心值之间的距离最近。
(5)建立种子用户的推荐视频库
分别挖掘5个聚类(A1到A5)中种子用户观看总次数较多的视频,并将所述视频按照用户观看总次数从大到小进行排序,作为视频的受欢迎度排名;从所述排名中抽取前300名的视频作为每个用户类别的推荐视频库;所述推荐视频库可分别用B1、B2、B3、B4、B5标识。
(6)向目标用户推荐视频的逻辑
每次从推荐视频库中向目标用户推荐16个视频,并同时向目标用户推荐订阅的主播最新发布的4个视频,所述16个视频为该目标用户所属的用户类别对应的推荐视频库中排名最前的16个视频;例如,目标用户属于A1聚类时,则从B1推荐视频库中推荐排名最前的16个视频;当用户属于A2类别时,则从B2推荐视频库中推荐排名最前的16个视频。当用户没有订阅的主播时,可只推荐16个视频;当用户订阅的主播最新发布的视频不足4个时,可推荐用户订阅的主播最新发布的全部视频;即:每轮推荐数量最少为推荐视频库中排名最前的16个视频,推荐数量最多为推荐视频库中排名最前的16个视频与订阅的主播最新发布的4个视频,每刷新一次则更换一批新视频;更换的一批新视频可为排名在前一批推荐视频之后的16个视频,即按照所述推荐视频库中的排名顺序依次向目标用户推荐,若推荐至所述推荐视频库中的最后一个视频,可从排名第一的视频开始循环。
当所述目标用户为聚类模型中的用户时,例如目标用户为建立所述聚类模型的种子用户时,若继续根据种子用户的视频观看数据向其推送视频,则向该种子用户推荐的视频中,出现其已观看过的视频的概率较高。为避免此种情况,本发明可向所述种子用户推荐最新发布的视频,即采用与非种子用户不同的推荐机制,以确保向种子用户推荐的视频均为种子用户未观看过的视频。故本发明还提出如图3所示的实施例:所述获取目标用户的特征值之前,还包括:
步骤S01:判断所述目标用户是否为聚类模型中的用户;
若是,则执行步骤S02:若否,则继续执行步骤S10;
步骤S02:推荐最新发布的视频;
步骤S10:获取目标用户的特征值。
所述步骤S02中,向目标用户推荐的视频可以全部为最新发布的视频,也可为最新发布的若干个视频与目标用户订阅的主播发布的若干个视频的组合。本实施例在获取所述特征值之前,先判断目标用户是否为聚类模型中的用户,以避免向目标用户重复推荐已观看过的视频,保证了聚类模型中的用户的视频推荐体验。
为避免向目标用户重复推荐已观看过的视频,本发明还提出如图4所示的实施例:
所述根据所述用户类别,向目标用户推荐视频,包括:
步骤S33:根据所述用户类别,确定向所述目标用户推荐的视频集合;
步骤S34:判断视频集合中是否有目标用户未观看的视频;若是,则执行步骤S35;若否,则执行步骤S02;
步骤S35:向所述目标用户推荐未观看过的视频;
步骤S02:推荐最新发布的视频。
所述视频集合为与用户类别相对应的多个视频集,例如,根据用户的所述个性特征值或属性信息确定的视频集合;或,所述视频集合为前述实施例中所述的推荐视频库,即:获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库,将该推荐视频库作为所述视频集合。本发明在推荐之前,先判断向所述目标用户推荐的视频集合中是否有目标用户未观看的视频,若有目标用户未观看的视频,则从所述视频集合中,依次向目标用户推荐未观看过的视频;若所述视频集合中的视频均是目标用户已观看过的,则向目标用户推荐最新发布的视频。本实施例可避免向目标用户推荐已观看过的视频,尤其是目标用户为建立聚类模型的种子用户时,本实施例可向该种子用户推送其它种子用户观看过、但自身未观看过的视频,既可向种子用户推送受欢迎的视频,又不会重复推送种子用户已观看过的视频,保证了推荐质量。
本发明还提出一种视频推荐装置,包括:
获取模块,用于获取目标用户的特征值;
分类模块,用于根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别;
推荐模块,用于根据所述用户类别,向目标用户推荐视频。
基于所述视频推荐方法,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时,实现前述任一项所述视频推荐方法的步骤。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
本发明还提出一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任一项所述视频推荐方法的步骤。
图5为本发明服务器的结构示意图,包括处理器320、存储装置330、输入单元340以及显示单元350等器件。本领域技术人员可以理解,图5示出的结构器件并不构成对所有服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储装置330可用于存储应用程序310以及各功能模块,处理器320运行存储在存储装置330的应用程序310,从而执行设备的各种功能应用以及数据处理。存储装置330可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储装置包括但不限于这些类型的存储装置。本发明所公开的存储装置330只作为例子而非作为限定。
输入单元340用于接收信号的输入,以及接收统计日期的用户信息以及对指定目标的访问信息。输入单元340可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元350可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元350可采用液晶显示器、有机发光二极管等形式。处理器320是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储装置330内的软件程序和/或模块,以及调用存储在存储装置内的数据,执行各种功能和处理数据。
在一实施方式中,服务器包括一个或多个处理器320,以及一个或多个存储装置330,一个或多个应用程序310,其中所述一个或多个应用程序310被存储在存储装置330中并被配置为由所述一个或多个处理器320执行,所述一个或多个应用程序310配置用于执行以上实施例所述视频推荐方法的步骤。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种视频推荐方法,其特征在于,包括:
获取目标用户的特征值;
根据所述目标用户的特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别;其中,每个所述聚类对应一个用户类别,每个用户类别中的种子用户的特征值之间具有最小方差;
根据所述用户类别,向目标用户推荐视频,包括:获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库;根据推荐视频库向目标用户推荐视频;
其中,所述聚类模型的构建包括:
获取历史用户的视频观看数据,视频观看数据包括预置时间段内用户登录天数和视频观看次数;
从历史用户中选定最近的预置时间段内用户登录天数在预设天数以上的用户,从选定用户中把视频观看次数最多的预置百分比用户作为种子用户;
获取种子用户的特征值;
基于聚类算法与种子用户的特征值构建聚类模型,将种子用户聚类形成多个用户类别。
2.根据权利要求1所述的推荐方法,其特征在于,所述基于聚类算法与种子用户的特征值构建聚类模型,包括:
根据聚类个数k、聚类算法与所述种子用户的特征值,得到所述聚类模型,所述聚类模型中包括k个聚类和每个聚类的中心值,k为预置值。
3.根据权利要求1所述的推荐方法,其特征在于,所述根据所述特征值确定目标用户与聚类模型中各聚类的距离,得到目标用户所属聚类对应的用户类别,包括:
计算目标用户的特征值与所述每个聚类的中心值的距离;将所述距离最小的聚类对应的用户类别作为所述目标用户的用户类别。
4.根据权利要求1所述的推荐方法,其特征在于,所述获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库,包括:
获取每个聚类中种子用户对每个视频的观看总次数,按照观看总次数从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库;或
获取每个聚类中种子用户对每个视频的观看总次数、观看总时长、用户点赞数量;将视频的观看总次数、观看总时长、用户点赞数量分别进行归一化处理,得到三个数值;将三个数值分别乘以预定权重后相加,得到综合值;按照综合值从大到小对视频进行排序,把排序在前的预定数量的视频作为该用户类别对应的推荐视频库。
5.根据权利要求1所述的推荐方法,其特征在于,所述根据所述用户类别,向目标用户推荐视频,包括:
根据所述用户类别,获取第一预定数量视频,从所述目标用户订阅的主播中获取最新发布的第二预定数量视频;向所述目标用户推荐所述第一预定数量视频和第二预定数量视频。
6.根据权利要求1所述的推荐方法,其特征在于,所述获取目标用户的特征值之前,还包括:
判断所述目标用户是否为聚类模型中的用户;
若是,则推荐最新发布的视频;若否,则继续所述获取目标用户的特征值的步骤。
7.根据权利要求1所述的推荐方法,其特征在于,所述根据所述用户类别,向目标用户推荐视频,包括:
根据所述用户类别,确定向所述目标用户推荐的视频集合;
判断视频集合中是否有目标用户未观看的视频;
若是,向所述目标用户推荐未观看过的视频;
若否,推荐最新发布的视频。
8.根据权利要求1所述的推荐方法,其特征在于,所述特征值包括用户登录次数、用户登录时段、每次直播观看时长、每天直播观看时长、观看直播次数、用户登录天数中的一个或多个。
9.一种视频推荐装置,其特征在于,包括:
获取模块,用于获取目标用户的特征值;
分类模块,用于根据所述特征值确定目标用户与聚类模型中各聚类的相似度,得到目标用户所属聚类对应的用户类别;其中,每个所述聚类对应一个用户类别,每个用户类别中的种子用户的特征值之间具有最小方差;
推荐模块,用于根据所述用户类别,向目标用户推荐视频,包括:获取每个聚类中种子用户对应的视频观看数据,根据所述视频观看数据得到每个用户类别对应的推荐视频库;根据推荐视频库向目标用户推荐视频;
其中,所述聚类模型的构建包括:
获取历史用户的视频观看数据,视频观看数据包括预置时间段内用户登录天数和视频观看次数;
从历史用户中选定最近的预置时间段内用户登录天数在预设天数以上的用户,从选定用户中把视频观看次数最多的预置百分比用户作为种子用户;
获取种子用户的特征值;
基于聚类算法与种子用户的特征值构建聚类模型,将种子用户聚类形成多个用户类别。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时,实现权利要求1至8任一项所述视频推荐方法的步骤。
11.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至8任一项所述视频推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810427835.3A CN108647293B (zh) | 2018-05-07 | 2018-05-07 | 视频推荐方法、装置、存储介质和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810427835.3A CN108647293B (zh) | 2018-05-07 | 2018-05-07 | 视频推荐方法、装置、存储介质和服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647293A CN108647293A (zh) | 2018-10-12 |
CN108647293B true CN108647293B (zh) | 2022-02-01 |
Family
ID=63749261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810427835.3A Active CN108647293B (zh) | 2018-05-07 | 2018-05-07 | 视频推荐方法、装置、存储介质和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647293B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658129A (zh) * | 2018-11-22 | 2019-04-19 | 北京奇虎科技有限公司 | 一种用户画像的生成方法及装置 |
CN109522426B (zh) * | 2018-12-05 | 2021-06-22 | 北京达佳互联信息技术有限公司 | 多媒体数据推荐方法、装置、设备及计算机可读存储介质 |
CN111385659B (zh) * | 2018-12-29 | 2021-08-17 | 广州市百果园信息技术有限公司 | 一种视频推荐方法、装置、设备及存储介质 |
CN109729377B (zh) * | 2019-01-02 | 2021-06-08 | 广州虎牙信息科技有限公司 | 一种主播信息的推送方法、装置、计算机设备和存储介质 |
CN109729376B (zh) * | 2019-01-02 | 2021-12-14 | 广州虎牙信息科技有限公司 | 一种生命周期的处理方法、装置、设备和存储介质 |
CN109886300A (zh) * | 2019-01-17 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 一种用户聚类方法、装置及设备 |
CN111859097B (zh) * | 2019-04-30 | 2024-01-05 | 北京达佳互联信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112565903B (zh) * | 2019-09-10 | 2022-11-22 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN110750718A (zh) * | 2019-10-10 | 2020-02-04 | 深圳Tcl新技术有限公司 | 基于推荐系统的用户引导方法、装置、设备及存储介质 |
CN111310731B (zh) * | 2019-11-15 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 基于人工智能的视频推荐方法、装置、设备及存储介质 |
CN111538860B (zh) * | 2020-07-07 | 2020-11-03 | 北京搜狐新媒体信息技术有限公司 | 视频推荐方法及装置、存储介质及电子设备 |
CN112270564A (zh) * | 2020-10-23 | 2021-01-26 | 司富钱 | 一种信息推送方法和系统 |
CN112653907B (zh) * | 2020-12-15 | 2022-11-15 | 泰康保险集团股份有限公司 | 一种视频的推荐方法及装置 |
CN112579822A (zh) * | 2020-12-25 | 2021-03-30 | 百果园技术(新加坡)有限公司 | 一种视频数据的推送方法、装置、计算机设备和存储介质 |
CN113709507B (zh) * | 2021-07-28 | 2023-09-05 | 北京达佳互联信息技术有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN113613081B (zh) * | 2021-09-29 | 2021-12-03 | 深圳佳力拓科技有限公司 | 一种基于目标节目推荐模型的节目推荐方法与装置 |
CN114513687B (zh) * | 2022-02-14 | 2024-02-27 | 青岛聚看云科技有限公司 | 服务器及媒资推荐方法 |
CN114926771A (zh) * | 2022-06-01 | 2022-08-19 | 北京字节跳动网络技术有限公司 | 一种视频识别方法及装置 |
CN116401567B (zh) * | 2023-06-02 | 2023-09-08 | 支付宝(杭州)信息技术有限公司 | 一种聚类模型训练、用户聚类、信息推送方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1711773A (zh) * | 2002-11-18 | 2005-12-21 | 皇家飞利浦电子股份有限公司 | 通过基于节目特征的聚类来创建原型简档 |
CN102651033A (zh) * | 2012-04-09 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 一种在线资源的推荐方法和装置 |
CN105426548A (zh) * | 2015-12-29 | 2016-03-23 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106028071A (zh) * | 2016-05-17 | 2016-10-12 | Tcl集团股份有限公司 | 一种视频推荐方法及系统 |
CN107071578A (zh) * | 2017-05-24 | 2017-08-18 | 中国科学技术大学 | Iptv节目推荐方法 |
CN107846629A (zh) * | 2017-10-11 | 2018-03-27 | 五八有限公司 | 向用户推荐视频的方法、装置和服务器 |
CN107885889A (zh) * | 2017-12-13 | 2018-04-06 | 聚好看科技股份有限公司 | 搜索结果的反馈方法、展示方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077412B (zh) * | 2014-07-14 | 2018-04-13 | 福州大学 | 一种基于多Markov链的微博用户兴趣预测方法 |
US10003847B2 (en) * | 2016-04-22 | 2018-06-19 | Google Llc | Watch-time clustering for improving video searches, selection and provision |
-
2018
- 2018-05-07 CN CN201810427835.3A patent/CN108647293B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1711773A (zh) * | 2002-11-18 | 2005-12-21 | 皇家飞利浦电子股份有限公司 | 通过基于节目特征的聚类来创建原型简档 |
CN102651033A (zh) * | 2012-04-09 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 一种在线资源的推荐方法和装置 |
CN105426548A (zh) * | 2015-12-29 | 2016-03-23 | 海信集团有限公司 | 一种基于多用户的视频推荐方法及装置 |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106028071A (zh) * | 2016-05-17 | 2016-10-12 | Tcl集团股份有限公司 | 一种视频推荐方法及系统 |
CN107071578A (zh) * | 2017-05-24 | 2017-08-18 | 中国科学技术大学 | Iptv节目推荐方法 |
CN107846629A (zh) * | 2017-10-11 | 2018-03-27 | 五八有限公司 | 向用户推荐视频的方法、装置和服务器 |
CN107885889A (zh) * | 2017-12-13 | 2018-04-06 | 聚好看科技股份有限公司 | 搜索结果的反馈方法、展示方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于沙漏模型的移动互联网用户行为分析;胡宇辰等;《管理世界》;20130715;第184-185页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108647293A (zh) | 2018-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647293B (zh) | 视频推荐方法、装置、存储介质和服务器 | |
CN109543111B (zh) | 推荐信息筛选方法、装置、存储介质及服务器 | |
US11714816B2 (en) | Information search method and apparatus, device and storage medium | |
CN110012060B (zh) | 移动终端的信息推送方法、装置、存储介质和服务器 | |
CN110543598B (zh) | 信息推荐方法、装置及终端 | |
WO2020011068A1 (zh) | 用于执行机器学习过程的方法和系统 | |
CN107038213B (zh) | 一种视频推荐的方法及装置 | |
CN110941740A (zh) | 视频推荐方法及计算机可读存储介质 | |
CN110781391A (zh) | 一种信息推荐方法、装置、设备及存储介质 | |
US11977594B2 (en) | Custom compilation videos | |
US10949000B2 (en) | Sticker recommendation method and apparatus | |
US20170061286A1 (en) | Supervised Learning Based Recommendation System | |
US20200201493A1 (en) | Systems and methods for analyzing visual content items | |
CN108829771A (zh) | 主播推荐方法、装置、计算机存储介质及服务器 | |
CN111400603A (zh) | 一种信息推送方法、装置、设备及计算机可读存储介质 | |
US20120066028A1 (en) | Methods and systems for activity-based recommendations | |
CN111782957A (zh) | 一种推荐内容的方法、装置、计算设备及存储介质 | |
US9088811B2 (en) | Information providing system, information providing method, information providing device, program, and information storage medium | |
CN104081429A (zh) | 基于视频同现统计数据的视频推荐 | |
CN108021708B (zh) | 内容推荐方法、装置与计算机可读存储介质 | |
EP3972709A1 (en) | Content-item recommendations | |
CN111400546B (zh) | 一种视频召回方法、视频推荐方法及装置 | |
CN110472016B (zh) | 文章推荐方法、装置、电子设备及存储介质 | |
CN110598120A (zh) | 基于行为数据的理财推荐方法及装置、设备 | |
CN112016773A (zh) | 一种确定潜力主播的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |