CN110555157B - 内容推荐方法、内容推荐装置和电子设备 - Google Patents
内容推荐方法、内容推荐装置和电子设备 Download PDFInfo
- Publication number
- CN110555157B CN110555157B CN201810258889.1A CN201810258889A CN110555157B CN 110555157 B CN110555157 B CN 110555157B CN 201810258889 A CN201810258889 A CN 201810258889A CN 110555157 B CN110555157 B CN 110555157B
- Authority
- CN
- China
- Prior art keywords
- content
- tag
- label
- user
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及一种内容推荐方法、内容推荐装置和电子设备。该内容推荐方法包括:获取用户对于第一内容和第二内容的行为数据,第一内容和第二内容具有相同类型和不同子类型;确定第一内容的至少一个第一标签和第二内容的至少一个第二标签;以协同过滤算法获得至少一个第一标签中的每个第一标签和至少一个第二标签中的每个第二标签之间的标签相似度;以及,基于标签相似度向用户提供内容。这样,可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。
Description
技术领域
本申请总的来说涉及数据处理领域,且更为具体地,涉及一种内容推荐方法、内容推荐装置和电子设备。
背景技术
随着文化产业的发展,越来越多的内容被生产出来,以满足人们日益增长的需求。并且,随着内容表现形式的丰富,越来越多的内容被以诸如多媒体的形式表现出来。
当用户需要获取自己所需的内容时,针对网络上的海量内容,用户需要花费大量的时间才能找到自己想要的内容。如果用户需要浏览大量无关的内容,这个过程显然会使得用户感到不便。
尤其是,即使对于相同类型的内容,例如视频,随着其类型的进一步细分,也出现了更精细的子类型。例如,许多平台将视频分类为UGC(用户生产内容)、PGC(专业生产内容)和OGC(品牌生产内容)。
因此,需要根据用户的兴趣特点,向用户推荐用户可能感兴趣的内容。特别是,当仅掌握用户对于某一子类型的内容的兴趣特点时,也需要据此向用户推荐其它子类型的内容。
因此,需要改进的内容推荐方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种内容推荐方法、内容推荐装置和电子设备,其可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。
根据本申请的一方面,提供了一种内容推荐方法,包括:获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度;以及,基于所述标签相似度向用户提供内容。
在上述内容推荐方法中,获取用户对于第一内容和第二内容的行为数据包括:获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
在上述内容推荐方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述内容推荐方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述内容推荐方法中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
根据本申请的另一方面,提供了一种内容推荐装置,包括:数据获取单元,用于获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;标签确定单元,用于确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;相似度计算单元,用于以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度;以及,内容提供单元,用于基于所述标签相似度向用户提供内容。
在上述内容推荐装置中,所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
在上述内容推荐装置中,所述相似度计算单元用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述内容推荐装置中,所述相似度计算单元用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述内容推荐方法中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
根据本申请的又一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的内容推荐方法。
本申请提供的内容推荐方法、内容推荐装置和电子设备可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。
附图说明
通过阅读下文优选的具体实施方式中的详细描述,本申请各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。显而易见地,下面描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。而且在整个附图中,用相同的附图标记表示相同的部件。
图1图示了根据本申请实施例的内容推荐方法的流程图;
图2图示了根据本申请实施例的内容推荐方法中计算标签相似度的流程图;
图3图示了根据本申请实施例的内容推荐装置的框图;
图4图示了根据本申请实施例的内容推荐装置中的相似度计算单元的框图;
图5图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,随着内容形式的不断丰富,即使对于某一类型的内容,比如视频,各个视频平台在视频内容上也会出现不同的视频子类型(比如,UGC视频、PGC视频或者OGC视频)。并且,在视频平台上,既会向用户推荐UGC视频,也会给用户推荐PGC视频,从而满足用户的不同需求。但是,在推荐策略上,不同子类型的视频,例如UGC视频和PGC视频在视频内容上有一定的区别,从而使得用于推荐视频的内容标签和内容分布上的差异较大。这种不同子类型的内容数据也可以被称为异构数据。
因此,如何在内容平台内利用用户对于某一子类型的内容的行为,推荐出用户感兴趣的另一子类型的内容,满足用户对不同子类型的内容的需求,显得尤为重要。
针对上述技术问题,本申请的基本构思是收集用户对于不同子类型的内容的行为数据,例如观看不同子类型的视频的观看行为数据,并基于上述观看行为数据以协同过滤算法获得不同子类型的内容的标签数据之间的标签相似度,以向用户推荐内容。因此,在获得了不同子类型的内容的标签数据之间的标签相似度之后,就可以针对某一子类型的内容的用户标签画像计算出用户对于另一子类型的内容的标签画像,从而实现用户的画像迁移,以推荐出用户感兴趣的内容。
基于此,本申请提出了一种内容推荐方法、内容推荐装置和电子设备,其首先获取用户对于不同子类型的内容的行为数据,再确定内容对应的标签,并以协同过滤算法获得不同标签之间的相似度,从而向用户推荐内容。因此,可以利用用户针对不同子类型的内容的行为数据进行用户的画像迁移,提高预测用户对于不同子类型的内容的喜好的准确度,提高用户体验。
需要说明的是,本申请的上述基本构思可以应用于各种用于推荐内容的推荐系统和相应的产品,包括视频内容、音频内容、文字内容以及其它内容的推荐系统和相应的产品等。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1图示了根据本申请实施例的内容推荐方法的流程图。
如图1所示,根据本申请实施例的内容推荐方法包括:S110,获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;S120,确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;S130,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度;以及S140,基于所述标签相似度向用户提供内容。
在步骤S110中,获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型。如上所述,由于内容的进一步细分,即使对于同一类型的内容,例如视频,也可以细分为不同的子类型。例如,各个视频平台向用户提供的视频可以细分为UGC(用户生产内容)、PGC(专业生产内容)和OGC(品牌生产内容)。
具体地,UGC指的是用户原创内容,是伴随着以提倡个性化为主要特点的网络2.0(Web2.0)概念而兴起的。UGC反映的不仅是某一种具体的业务,也是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。PGC指的是专业生产内容(例如,视频网站)或者专家生产内容(例如,微博)。其特点时内容个性化、视角多元化、传播民主化、社会关系虚拟化。OGC指的是品牌生产内容,主要通过具有一定知识和专业背景的行业人士生产内容,并且这些人士会领取相应的报酬。例如,媒体平台的记者、编辑等,既有新闻的专业背景,也以写稿为职业领取报酬。
因此,在根据本申请实施例的内容推荐方法中,所述第一内容和所述第二内容是类型相同的内容,例如,都属于视频、音频或者文本等,但是其进一步细分的子类型不同,例如,在所述第一内容和所述第二内容都是视频的情况下,所述第一内容可以是如上所述的UGC、PGC和OGC视频中的一个,且所述第二内容是UGC、PGC和OGC视频中的另一个。
此外,现在的内容平台除了向用户提供内容以外,也会向用户推送广告,例如,视频平台会向用户推送视频广告。并且,为了提升广告推送的精确性,也会对广告设置标签。因此,在根据本申请实施例的内容推荐方法中,所述第一内容和所述第二内容也可以是一般内容和广告。
在根据本申请实施例的内容推荐方法中,用户对于第一内容和第二内容的行为数据指的是用户基于推荐系统的推荐选择特定内容的行为,以视频为例,是用户观看特定视频的行为。以用户对UGC和PGC视频的观看行为为例,可以用uv代表UGC视频,pv代表PGC视频,则用户的行为数据可以表示为h={pv1,pv2,…,pvN,uv1,uv2,…,uvM}。
这里,为了准确地反映用户的行为,用户对于第一内容和第二内容的行为数据指的是使用内容平台的所有用户的行为数据。即,内容平台可以获取在一段时间内所有用户的行为数据,例如视频平台获取近15天内所有用户观看特定视频的行为数据。
但是,由于用户对于内容的行为数据反映了用户对于内容的兴趣,且用户对于内容的兴趣并不是一成不变的。举例来说,如果用户在一个视频网站上观看视频,一个月前观看动漫相关视频,但是一个月后可能开始观看游戏相关视频。为了能够获得用户相对稳定的兴趣,在根据本申请实施例的内容推荐方法中,通过时间的切分获取用户的短时稳定兴趣。也就是说,假定用户的兴趣在短时间内是稳定的,但是在长时间上是变化的。因此,可以根据用户一段时期内针对内容的行为,将此行为按照时间切分为多个行为序列。
也就是说,在根据本申请实施例的内容推荐方法中,获取用户对于第一内容和第二内容的行为数据包括:获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
这里,所述预定时段可以是12个小时,即,将用户针对内容的行为按照12个小时的间隔进行切分,划分为多个行为序列,例如视频观看序列,并记为hs。
在步骤S120中,确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签。例如,针对上述视频观看序列hs={pv1,pv2,…,pvN,uv1,uv2,…,uvM},确定相应的标签序列,例如表示为hst={pt1,pt2,…,ptN,ut1,ut2,…,utM},其中pt表示PGC视频标签,ut表示UGC视频标签。
在步骤S130中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度。这里,协同过滤算法的原理是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息。其中,回应不一定局限于特别感兴趣的信息,特别不感兴趣的信息的纪录也相当重要。
为了以协同过滤算法获得标签之间的相似度,首先将在步骤S120中获得的标签转换为标签对。例如,如上所述,相应的标签序列为hst={pt1,pt2,…,ptN,ut1,ut2,…,utM},则转换成的标签对为{pt1,ut1},{pt1,ut2},…,{pt1,utM},{pt2,ut1},{pt2,ut2},…,{pt2,utM},{ptN,ut1},{ptN,ut2},…,{ptN,utM}。也就是说,每个组合成的标签对中包括一个第一标签和一个第二标签。
接下来,计算每个标签对中的第一标签和第二标签的标签相似度。在根据本申请实施例的内容推荐方法中,可以使用选定标签的用户数来表示上述协同过滤算法的原理中提到的个人对于信息的回应。也就是说,通过用户对于与标签对应的内容的选定行为,例如观看视频,收听音频等来作为协同过滤算法中的用户投票机制,从而计算标签之间的相似度。具体来说,采用以下公式来计算标签相似度p(ut|pt):
p(ut|pt)=(count({ut,pt}))/(count(ut)*count(pt))
其中,count({ut,pt})是同时选定{ut,pt}标签对的用户数目,例如,针对视频来说,同时观看了标签ut和pt的用户数目。count(ut)是单独选定ut标签的用户数目,例如,针对视频来说,观看了标签ut的用户数目。且count(pt)是单独选定pt标签的用户数目,例如,针对视频来说,观看了标签pt的用户数目。
这样,针对所转换成的标签对中的每个标签对,通过以上方式得到标签对中的一个第一标签和一个第二标签之间的相似度。通过相同的方式,可以获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度。
也就是说,在根据本申请实施例的内容推荐方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
图2图示了根据本申请实施例的内容推荐方法中计算标签相似度的流程图。如图2所示,根据本申请实施例的内容推荐方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:S210,生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;S220,从用户的历史数据获取同时选定所述标签对的第一用户数目;S230,从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及S240,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
上述方式尤其适于短视频,因为用户一般不会重复观看一个视频,并且在实际的推荐系统中,用户观看过的短视频,是不会重复推荐的。但是,因为可能存在用户反复观看视频的行为,并且不同视频也可能具有相同的标签。在另一示例中,根据本申请实施例的内容推荐方法以对标签的选定数目代替用户数目来计算标签相似度。
也就是说,在根据本申请实施例的内容推荐方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
最后,在步骤S140中,基于所述标签相似度向用户提供内容。
这里,虽然在上文中,以视频平台向用户推荐视频为例进行了说明。但是,本领域技术人员可以理解,根据本申请实施例的内容推荐方法可以应用于各种内容平台向用户推荐内容,也因此用于通过其它类型的异构数据进行针对特定内容的用户画像的迁移。本申请并不意在对此进行任何限制。
示例性装置
图3图示了根据本申请实施例的内容推荐装置的框图。
如图3所示,根据本申请实施例的内容推荐装置300包括:数据获取单元310,用于获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;标签确定单元320,用于确定所述数据获取单元310所获取的第一内容的至少一个第一标签和第二内容的至少一个第二标签;相似度计算单元330,用于以协同过滤算法获得所述标签确定单元320所确定的至少一个第一标签中的每个第一标签和至少一个第二标签中的每个第二标签之间的标签相似度;以及,内容提供单元340,用于基于所述相似度计算单元330所计算的标签相似度向用户提供内容。
在一个示例中,在上述内容推荐装置300中,所述数据获取单元310用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
在一个示例中,在上述内容推荐装置300中,所述相似度计算单元330用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
图4图示了根据本申请实施例的内容推荐装置中的相似度计算单元的框图。如图4所示,根据本申请实施例的内容推荐装置400包括相似度计算单元410,用于以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度。所述相似度计算单元410包括:数据统计模块411,用于通过从用户的历史数据获取同时选定所述标签对的第一用户数目,以及分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及数据计算模块412,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在一个示例中,在上述内容推荐装置300中,所述相似度计算单元330用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在一个示例中,在上述内容推荐装置300中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
这里,本领域技术人员可以理解,上述内容推荐装置300中的各个单元和模块的具体功能和操作已经在上面参考图1和图2描述的内容推荐方法中详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的内容推荐装置300可以实现在各种终端设备中,例如各种内容平台的服务器。在一个示例中,根据本申请实施例的内容推荐装置300可以作为一个软件模块和/或硬件模块而集成到所述终端设备中。例如,该内容推荐装置300可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该内容推荐装置300同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该内容推荐装置300与该终端设备也可以是分立的设备,并且该内容推荐装置300可以通过有线和/或无线网络连接到该验证设备,并且按照约定的数据格式来传输交互信息。
替代实施例
这里,本领域技术人员可以理解,本申请的实质在于以协同过滤算法计算不同内容的标签之间的相似度。因此,通过以上方式得到的标签相似度除了用于推荐内容以外,还可以用于计算其它参数或者实现其它功能,例如间接判定内容的相似性以实现内容聚类等。
因此,在替代实施例中,本申请实施例的提供了一种标签相似度计算方法,包括:获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;以及,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度。
在上述标签相似度计算方法中,获取用户对于第一内容和第二内容的行为数据包括:获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
在上述标签相似度计算方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述标签相似度计算方法中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述标签相似度计算方法中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
在另一方面中,提供了一种标签相似度计算装置,包括:数据获取单元,用于获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;标签确定单元,用于确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;以及,相似度计算单元,用于以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度。
在上述标签相似度计算装置中,所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
在上述标签相似度计算装置中,所述相似度计算单元用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一用户数目;从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及,将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述标签相似度计算装置中,所述相似度计算单元用于:生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;从用户的历史数据获取同时选定所述标签对的第一选定数目;从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及,将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
在上述标签相似度计算装置中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。
图5图示了根据本申请实施例的电子设备的框图。
如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的内容推荐方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如内容数据、标签数据等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,该输入装置13可以是例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括向用户推荐的内容等。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的内容推荐方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (11)
1.一种内容推荐方法,包括:
获取用户对于第一内容和第二内容的行为数据,所述行为数据是由至少一个所述第一内容和至少一个所述第二内容组成的序列,且所述第一内容和所述第二内容具有相同类型和不同子类型;
确定所述行为数据中的所述至少一个第一内容的至少一个第一标签和所述至少一个第二内容的至少一个第二标签;
以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度;以及
基于所述标签相似度向用户提供内容。
2.根据权利要求1所述的内容推荐方法,其中,获取用户对于第一内容和第二内容的行为数据包括:
获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
3.根据权利要求1所述的内容推荐方法,其中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:
生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;
从用户的历史数据获取同时选定所述标签对的第一用户数目;
从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及
将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
4.根据权利要求1所述的内容推荐方法,其中,以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度包括:
生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;
从用户的历史数据获取同时选定所述标签对的第一选定数目;
从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及
将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
5.根据权利要求1到4中任意一项所述的内容推荐方法,其中,
所述第一内容和所述第二内容是视频内容;
所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及
所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
6.一种内容推荐装置,包括:
数据获取单元,用于获取用户对于第一内容和第二内容的行为数据,所述行为数据是由至少一个所述第一内容和至少一个所述第二内容组成的序列,且所述第一内容和所述第二内容具有相同类型和不同子类型;
标签确定单元,用于确定所述行为数据中的所述至少一个第一内容的至少一个第一标签和所述至少一个第二内容的至少一个第二标签;
相似度计算单元,用于以协同过滤算法获得所述至少一个第一标签中的每个第一标签和所述至少一个第二标签中的每个第二标签之间的标签相似度;以及
内容提供单元,用于基于所述标签相似度向用户提供内容。
7.根据权利要求6所述的内容推荐装置,其中,所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。
8.根据权利要求6所述的内容推荐装置,其中,所述相似度计算单元用于:
生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;
从用户的历史数据获取同时选定所述标签对的第一用户数目;
从所述历史数据分别获取选定所述一个第一标签的第二用户数目和选定所述一个第二标签的第三用户数目;以及
将所述第一用户数目除以所述第二用户数目与所述第三用户数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
9.根据权利要求6所述的内容推荐装置,其中,所述相似度计算单元用于:
生成所述至少一个第一标签中的一个第一标签和所述至少一个第二标签中的一个第二标签的标签对;
从用户的历史数据获取同时选定所述标签对的第一选定数目;
从所述历史数据分别获取选定所述一个第一标签的第二选定数目和选定所述一个第二标签的第三选定数目;以及
将所述第一选定数目除以所述第二选定数目与所述第三选定数目之积以获得所述一个第一标签和所述一个第二标签之间的标签相似度。
10.根据权利要求6到9任意一项所述的内容推荐装置,其中,
所述第一内容和所述第二内容是视频内容;
所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及
所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。
11.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-5中任一项所述的内容推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810258889.1A CN110555157B (zh) | 2018-03-27 | 2018-03-27 | 内容推荐方法、内容推荐装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810258889.1A CN110555157B (zh) | 2018-03-27 | 2018-03-27 | 内容推荐方法、内容推荐装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110555157A CN110555157A (zh) | 2019-12-10 |
CN110555157B true CN110555157B (zh) | 2023-04-07 |
Family
ID=68733892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810258889.1A Active CN110555157B (zh) | 2018-03-27 | 2018-03-27 | 内容推荐方法、内容推荐装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555157B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1203315A1 (en) * | 1999-06-15 | 2002-05-08 | Kanisa Inc. | System and method for document management based on a plurality of knowledge taxonomies |
WO2008033840A2 (en) * | 2006-09-12 | 2008-03-20 | Eyespot Corporation | System and methods for creating, collecting, and using metadata |
WO2008073594A1 (en) * | 2006-12-09 | 2008-06-19 | Motorola, Inc. | A content recommendation system and a method of operation therefor |
CN102047277A (zh) * | 2008-05-29 | 2011-05-04 | 诺基亚公司 | 通过利用社会图信息进行内容使用分配的方法、装置和计算机程序产品 |
WO2011064675A1 (en) * | 2009-11-30 | 2011-06-03 | France Telecom | Method and system to recommend applications from an application market place |
CN103744849A (zh) * | 2011-12-27 | 2014-04-23 | 北京奇虎科技有限公司 | 一种应用自动推荐的方法及装置 |
CA2821177A1 (en) * | 2013-01-10 | 2014-07-10 | Spielo International Canada Ulc | Systems and methods for recommending games using distributed storage |
CN106055617A (zh) * | 2016-05-26 | 2016-10-26 | 乐视控股(北京)有限公司 | 一种数据推送方法及装置 |
CN106294502A (zh) * | 2015-06-09 | 2017-01-04 | 北京搜狗科技发展有限公司 | 一种电子书信息处理方法及装置 |
CN107733984A (zh) * | 2017-09-14 | 2018-02-23 | 深圳市金立通信设备有限公司 | 一种推送锁屏信息的方法、终端及计算机可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898753B2 (en) * | 2007-09-27 | 2018-02-20 | Excalibur Ip, Llc | Methods for cross-market brand advertising, content metric analysis, and placement recommendations |
US20140129373A1 (en) * | 2012-11-02 | 2014-05-08 | Ebay Inc. | Item recommendations based on true fit determination |
CN103177093B (zh) * | 2013-03-13 | 2016-08-17 | 北京开心人信息技术有限公司 | 一种基于对象标签的通用推荐方法及系统 |
RU2665239C2 (ru) * | 2014-01-15 | 2018-08-28 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое извлечение именованных сущностей из текста |
CN104156472B (zh) * | 2014-08-25 | 2018-05-08 | 北京四达时代软件技术股份有限公司 | 一种视频推荐方法及系统 |
US9558244B2 (en) * | 2014-10-22 | 2017-01-31 | Conversable, Inc. | Systems and methods for social recommendations |
CN104598518B (zh) * | 2014-12-10 | 2017-02-22 | 深圳市腾讯计算机系统有限公司 | 一种内容的推送方法和装置 |
CN106708829B (zh) * | 2015-07-31 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法及推荐系统 |
CN105959374B (zh) * | 2016-05-12 | 2019-05-03 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法及其设备 |
CN106649848B (zh) * | 2016-12-30 | 2020-12-29 | 阿里巴巴(中国)有限公司 | 视频推荐方法及装置 |
-
2018
- 2018-03-27 CN CN201810258889.1A patent/CN110555157B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1203315A1 (en) * | 1999-06-15 | 2002-05-08 | Kanisa Inc. | System and method for document management based on a plurality of knowledge taxonomies |
WO2008033840A2 (en) * | 2006-09-12 | 2008-03-20 | Eyespot Corporation | System and methods for creating, collecting, and using metadata |
WO2008073594A1 (en) * | 2006-12-09 | 2008-06-19 | Motorola, Inc. | A content recommendation system and a method of operation therefor |
CN102047277A (zh) * | 2008-05-29 | 2011-05-04 | 诺基亚公司 | 通过利用社会图信息进行内容使用分配的方法、装置和计算机程序产品 |
WO2011064675A1 (en) * | 2009-11-30 | 2011-06-03 | France Telecom | Method and system to recommend applications from an application market place |
CN103744849A (zh) * | 2011-12-27 | 2014-04-23 | 北京奇虎科技有限公司 | 一种应用自动推荐的方法及装置 |
CA2821177A1 (en) * | 2013-01-10 | 2014-07-10 | Spielo International Canada Ulc | Systems and methods for recommending games using distributed storage |
CN106294502A (zh) * | 2015-06-09 | 2017-01-04 | 北京搜狗科技发展有限公司 | 一种电子书信息处理方法及装置 |
CN106055617A (zh) * | 2016-05-26 | 2016-10-26 | 乐视控股(北京)有限公司 | 一种数据推送方法及装置 |
CN107733984A (zh) * | 2017-09-14 | 2018-02-23 | 深圳市金立通信设备有限公司 | 一种推送锁屏信息的方法、终端及计算机可读存储介质 |
Non-Patent Citations (3)
Title |
---|
宋美娜 ; 赵雪君 ; 鄂海红 ; .基于分类的多属性实体推荐.系统仿真学报.2018,(第02期),第62-70页. * |
朱征宇 ; 张小林 ; 熊茜 ; 谢祈鸿 ; .基于用户兴趣子类的协作推荐算法.计算机科学.2005,(第10期),第178-182页. * |
游贵荣 ; 陈杰 ; .一种高校图书馆新书个性化推荐方法.兰州文理学院学报(自然科学版).2017,(第05期),第70-74页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110555157A (zh) | 2019-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455465B2 (en) | Book analysis and recommendation | |
US9330162B2 (en) | Method and apparatus for providing temporal context for recommending content for consumption by a user device | |
CN109033149B (zh) | 信息推荐方法、装置、服务器及存储介质 | |
JP2021103543A (ja) | ライブストリームコンテンツを推奨するための機械学習の使用 | |
JP6873321B2 (ja) | 自動コンテンツ認識のための広告フレームのフラッギング | |
US11748408B2 (en) | Analyzing user searches of verbal media content | |
US8380727B2 (en) | Information processing device and method, program, and recording medium | |
CN109511015B (zh) | 多媒体资源推荐方法、装置、存储介质及设备 | |
US20210174234A1 (en) | Systems, apparatus, and methods for generating prediction sets based on a known set of features | |
CN105095508A (zh) | 一种多媒体内容推荐方法和多媒体内容推荐装置 | |
CN106462632B (zh) | 具有内容规范层的媒体商店 | |
US20150032740A1 (en) | Personal trends module | |
CN110309414B (zh) | 内容推荐方法、内容推荐装置和电子设备 | |
CN107562848B (zh) | 一种视频推荐方法和装置 | |
CN110851712B (zh) | 书籍信息的推荐方法、设备以及计算机可读介质 | |
CN114896454B (zh) | 一种基于标签分析的短视频数据推荐方法及系统 | |
CN116821475B (zh) | 基于客户数据的视频推荐方法、装置及计算机设备 | |
CN107332905A (zh) | 信息推送方法、装置及服务器 | |
CN111046292A (zh) | 直播推荐方法、装置、计算机可读存储介质及电子设备 | |
CN110555135B (zh) | 内容推荐方法、内容推荐装置和电子设备 | |
US20110161838A1 (en) | Virtual space providing apparatus and method | |
CN111898022A (zh) | 商标类别推荐方法和装置、以及存储介质和电子设备 | |
CN110555131B (zh) | 内容推荐方法、内容推荐装置和电子设备 | |
CN107341172B (zh) | 视频收益计算建模装置与方法及视频推荐装置与方法 | |
CN110555157B (zh) | 内容推荐方法、内容推荐装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200520 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C Applicant before: Youku network technology (Beijing) Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |