CN111046230B - 内容推荐方法及装置、电子设备和可存储介质 - Google Patents

内容推荐方法及装置、电子设备和可存储介质 Download PDF

Info

Publication number
CN111046230B
CN111046230B CN201911240619.9A CN201911240619A CN111046230B CN 111046230 B CN111046230 B CN 111046230B CN 201911240619 A CN201911240619 A CN 201911240619A CN 111046230 B CN111046230 B CN 111046230B
Authority
CN
China
Prior art keywords
content
vector
similarity
recommendation
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911240619.9A
Other languages
English (en)
Other versions
CN111046230A (zh
Inventor
孙逸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201911240619.9A priority Critical patent/CN111046230B/zh
Publication of CN111046230A publication Critical patent/CN111046230A/zh
Application granted granted Critical
Publication of CN111046230B publication Critical patent/CN111046230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种内容推荐方法,所述方法包括:获取账户的N个历史播放内容中每个历史播放内容的向量;基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。本发明实施例提供了一种内容推荐方法能够实现应用软件向用户推荐的内容与用户感兴趣的内容相似度高的效果。

Description

内容推荐方法及装置、电子设备和可存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种内容推荐方法及装置、电子设备和可存储介质。
背景技术
随着电子信息技术的不断发展,用户使用电子设备浏览各应用软件的时间也越来越长。由于每个用户具有不同的内容喜好,为了提高用户浏览应用的体验,目前应用软件普遍开发了向用户推荐内容的新功能,便于用户在浏览应用的过程中能够快速找到感兴趣的内容。
现有技术中,应用软件向用户推荐的内容与用户感兴趣的内容之间的相似度较小,导致应用软件存在内容推荐效果不佳的问题。
发明内容
本发明实施例的目的在于提供一种内容推荐方法及装置,以实现提高应用软件向用户推荐内容的效果。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种内容推荐方法,所述方法包括:
获取账户的N个历史播放内容中每个历史播放内容的向量;
基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;
计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
在本发明实施的第二方面,还提供了一种内容推荐装置,包括:
获取模块,用于获取账户的N个历史播放内容中每个历史播放内容的向量;
第一计算模块,用于基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;
第二计算模块,用于计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
输出模块,用于基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的内容推荐方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的内容推荐方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的内容推荐方法。
本发明实施例提供的内容推荐方法,基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量,受到候选推荐内容的影响能够弱化推荐向量与不相关极的历史播放内容的向量(与候选推荐内容之间相似性较低的历史播放内容的向量)之间的关系,强化推荐向量与相关极的历史播放内容的向量(与候选推荐内容之间相似性较高的历史播放内容的向量)之间的关系,使推荐向量可以作为用户对候选推荐内容是否感兴趣的参考,通过将候选推荐内容与其对应的推荐向量进行相似度的计算,基于相似度将认为用户会感兴趣的推荐内容向账户输出以在登录有所述账户的客户端显示所述推荐内容给用户,能够提高应用软件对内容的推荐效果,提高用户对推荐内容的点击量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明一实施例提供的内容推荐方法的流程图;
图2为相关技术中通过历史播放内容计算平均向量的向量图;
图3为本发明另一实施例提供的内容推荐方法的流程图;
图4为本发明另一实施例提供的内容推荐方法中信号流向示意图;
图5为本发明一实施例提供的内容推荐装置的结构示意图;
图6为本发明另一实施例提供的内容推荐装置的结构示意图;
图7为本发明另一实施例提供的内容推荐装置的结构示意图;
图8为本发明另一实施例提供的内容推荐装置的结构示意图;
图9为本发明另一实施例提供的内容推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
本发明实施例提供一种内容推荐方法,如图1所示,所述方法包括:
步骤101:获取账户的N个历史播放内容中每个历史播放内容的向量;
步骤102:基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;
步骤103:计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
步骤104:基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
本发明实施例中,为了方便计算内容之间的相似度,以及在工程上的可行性,每个内容均可以通过预设的模型转换为一组向量(embedding),每一向量可以包括多个代表内容特征的维度,每个维度又具有在其特征中表示相应含义的向量值。
例如:内容为电影视频文件,则电影视频文件可以包括题材维度、导演维度、语言维度等等,假设视频1和视频2均为动作电影,则视频1和视频2在题材维度中的参数值相同,另外,根据题材之间的相似程度的大小与对应题材维度之间的参数值相关,假设视频3为动作电影、视频4为战争电影、视频5为文艺电影,则视频3在题材维度中的参数值与视频4在题材维度中的参数值之间的差值小于视频3在题材维度中的参数值与视频5在题材维度中的参数值之间的差值。本发明实施例中,每个维度的参数值可以处于0-1之间。
以上仅仅列举几个维度进行说明,实际上每个内容可能存在几十甚至上百个维度,但是每个维度的原理与上述举例相同,可以通过合理推导得到其他维度的关系,此处不再重复说明。
由于用户感兴趣的内容并不是单一的,通常是呈多极分化的,若每极的历史播放内容对候选推荐内容的影响相同,会导致对用户输出的内容与用户感兴趣的内容之间误差较大的问题,例如:候选推荐内容与其中某一极的历史播放内容之间相似度非常高(即用户对该候选推荐内容感兴趣的可能性非常大)的情况下,由于其他极的历史播放内容与该候选推荐内容之间的相似度低,而导致该候选推荐内容的整体相似度较低,最终不被输出的情况。
例如:如图2所示,内容均为视频为例,视频1为游戏视频,向量为[0.98,0.1]、视频2为资讯视频,向量为[0.1,0.9],用户只对资讯视频和游戏视频比较感兴趣,即历史播放内容中包括游戏视频和资讯视频,若每一极的历史播放内容对候选推荐内容的影响相同,即采用N个候选推荐内容的平均向量与历史播放内容的向量进行相似度的比较,则历史播放内容的向量的平均向量为[0.54,0.5],这个时候平均向量可能与体育视频向量[0.7,0.77]相似度比较接近,这时体育视频会被输出而资讯视频和游戏视频反而不会被输出。
为解决上述问题,本发明实施例中,基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量,受到候选推荐内容的影响能够弱化推荐向量与不相关极的历史播放内容的向量之间的关系,强化推荐向量与相关极的历史播放内容的向量之间的关系,使推荐向量可以作为用户对候选推荐内容是否感兴趣的参考,通过将候选推荐内容与其对应的推荐向量进行相似度的计算,基于相似度将认为用户会感兴趣的推荐内容向账户输出以在登录有所述账户的客户端显示所述推荐内容给用户,能够提高应用软件对内容的推荐效果,提高用户对推荐内容的点击量。
其中,相关极的历史播放内容为用户历史播放内容呈多极分化下与候选推荐内容相似度高的至少一极的历史播放内容;不相关极的历史播放内容为用户历史播放内容呈多极分化下与候选推荐内容相似度低的至少一极的历史播放内容。
用户将自己的账户在应用软件上登录后,应用软件能够从账户中确定用户观看过的历史播放内容,从而能够获取每个历史播放内容的向量。以内容为视频为例,应用软件能够从底层基础平台的用户观影行为库中抽取用户的历史观影记录。
候选推荐内容可以是与N个历史播放内容中至少一个历史播放内容相似度最高的内容;也可以是与N个历史播放内容中至少一个历史播放内容相似度大于或等于第一预设相似度的至少一个内容;还可以是与至少一个历史播放内容关联的多个内容,例如:历史播放内容为电视剧,推荐内容可以为该电视剧的拍摄花絮或者续集电视剧等,此处不作限定。
所述推荐向量为N个历史播放内容的向量根据一个候选推荐内容的向量计算得到的向量,N个历史播放内容是用户感兴趣的内容,通过N个历史播放内容计算出的推荐向量可以作为用户对候选推荐内容是否感兴趣的参考。其中,推荐向量具体的计算方式可以是:
先利用欧式距离算法(在欧式距离算法中两个向量终点的空间距离越近,这两个向量之间的相似度越高),按照每一历史播放内容的向量的终点与候选推荐内容的向量的终点的距离,对每一历史播放内容的向量分配权重值,将每一历史播放内容的向量与其对应的权重值的乘积求累加和,再除以历史播放内容的总数N,即可得到候选推荐内容对应的推荐向量,其中,历史播放内容的向量的终点与候选推荐内容的向量的终点的距离越近,分配的权重值越高,权重值可以处于0-1之间,这样,能够弱化推荐向量与不相关极的历史播放内容的向量之间的关系,强化推荐向量与相关极的历史播放内容的向量之间的关系。
当然,推荐向量的计算还可以采用其他方式,例如:在计算推荐向量时利用余弦相似度算法(在余弦相似度算法中两个向量之间的夹角越小,这两个向量之间的相似度越高)将与候选推荐内容的向量之间的夹角大于60°的历史播放内容的向量的权重值设为0,来计算得到推荐向量,这样,也能够弱化推荐向量与不相关极的历史播放内容的向量之间的关系,强化推荐向量与相关极的历史播放内容的向量之间的关系。本发明实施例并不限定推荐向量的计算方式。
通过计算每一候选推荐内容的向量与其对应的推荐向量之间的相似度,能够判断每一候选推荐内容是否是用户感兴趣的内容,应用软件是否应当输出候选推荐内容。
其中,每一候选推荐内容的向量和其对应的推荐向量之间的相似度的计算方式除了可以采用上述提到的欧式距离算法、余弦相似度算法进行计算之外,还可以是皮尔逊相关系数的方式进行计算、还可以是Tanimoto系数、马氏距离等方式进行计算,此处不作限定。
本发明实施例中,应用软件选择输出的推荐内容可以是候选推荐内容与其对应的推荐向量相似度最高的预设个数的候选推荐内容;也可以是候选推荐内容与其对应的推荐向量相似度大于或等于第二预设相似度的至少一个候选推荐内容;还可以是候选推荐内容与其对应的推荐向量相似度大于或等于第三预设相似度且与任一历史播放内容的相似度大于或等于第四预设相似度的至少一个候选推荐内容。当然,还可以通过其他的方式选择输出的候选推荐内容,本发明实施例并不限定具体采用何种方式选择输出的推荐内容。
本发明另一实施例还提供一种内容推荐方法,如图3所示,所述方法包括:
步骤301:获取账户的N个历史播放内容中每个历史播放内容的向量;
步骤302:分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;
步骤303:根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量;
步骤304:计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
步骤305:基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
本实施例中,通过分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量。这样,能够弱化推荐向量与不相关极的历史播放内容的向量之间的关系,强化推荐向量与相关极的历史播放内容的向量之间的关系,从而能够使推荐向量作为用户对候选推荐内容是否感兴趣的参考,便于实现应用软件向用户推荐的内容与用户感兴趣的内容相似度高的效果。
具体的,在获取每一历史播放内容的向量和目标候选推荐内容的向量后,分别计算目标候选推荐内容与N个历史播放内容之间的相似度,得到目标候选推荐内容与N个历史播放内容之间的相似度。其中,相似度的计算方式可以是采用余弦相似度的方式进行计算、也可以是皮尔逊相关系数的方式进行计算、还可以是Tanimoto系数、马氏距离等方式进行计算,此处不作限定。
通过上述计算,能够从历史播放内容中筛选出第一历史播放内容和第二历史播放内容,其中,第一历史播放内容与目标候选推荐内容的相似度较高(即相关极中的历史播放内容),第二历史播放内容与目标候选推荐内容的相似度较低(即不相关极中的历史播放内容)。
在步骤303中计算推荐向量时,弱化第二历史播放内容的向量对推荐向量的影响,强化第一历史播放内容的向量对推荐向量的影响,从而计算得到与目标候选推荐内容对应的推荐向量。
例如:在计算目标候选推荐内容对应的推荐向量时,先将各历史播放内容的向量乘以自身与目标候选推荐内容之间的相似度,之后再求和除以总的历史播放内容的数量N,得到目标候选推荐内容对应的推荐向量。
在一可选的实施方式中,步骤303可以包括:
分别根据目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度,对每一历史播放内容分配权重值,所述相似度大于或等于预设阈值时,历史播放内容的权重值大于第一权重值,所述相似度小于预设阈值时,历史播放内容的权重值小于第二权重值,所述第一权重值大于所述第二权重值;
基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量。
本实施例中,在计算推荐向量时,为每一历史播放内容配置了权重值,其中,若历史播放内容与目标候选推荐内容之间的相似度大于第五预设相似度,则该历史播放内容的权重值大于第一权重值;若历史播放内容与目标候选推荐内容之间的相似度小于第五预设相似度,则该历史播放内容的权重值小于第二权重值。
例如:历史播放内容1与目标候选推荐内容之间的相似度大于0.8(第五预设相似度),则历史播放内容1的权重值大于0.7(第一权重值);历史播放内容2与目标候选推荐内容之间的相似度小于0.8(第五预设相似度),则历史播放内容2的权重值小于0.3(第二权重值)。
以上仅仅只是举例说明,为了弱化与目标候选推荐内容相似性低的第二历史播放内容的向量的影响,第二权重值还可以为0.2甚至更低;另外为了强化与目标候选推荐内容相似性高的第一历史播放内容的影响,第一权重值还可以为0.8甚至更高,此处对于第一权重值和第二权重值的选择不作限定。
其中,所述基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量的步骤,可以包括:
计算所述N个历史播放内容的向量中目标维度的参数值与其权重值乘积之和,再除以历史播放内容的总数N,得到与所述目标候选推荐内容对应的推荐向量中目标维度的参数值。
这样,在计算得到的推荐向量与目标候选推荐内容相似度高第一历史播放内容具有较高的相关性,与目标候选推荐内容相似度低的第二历史播放内容具有较低的相关性,使得计算得到的推荐向量具备作为用户是否对候选推荐内容感兴趣的参考作用。
结合图2中的举例,候选推荐视频3是游戏视频,向量为[0.95,0.05],则候选推荐视频对应的推荐向量=a1[0.98,0.1]+a2[0.1,0.9],其中a1是视频1和视频3的相似度,a2是视频2跟视频3的相似度。
以相似度计算为余弦相似度为例,a1=(0.98*0.95+0.1*0.05)/(sprt(0.98^2+0.1^2)*sprt(0.95^2+0.05^2))=0.998,同理,a2=0.16。
若第五预设相似度为0.75,则a2小于0.75,将a2设为0(低于第二权重值),这样候选推荐视频对应的推荐向量等于[0.48902,0.0499],约等于[0.49,0.05],则视频3的向量与其推荐向量之间的相似度为0.999,从而认为视频3是用户感兴趣的,应用软件输出该视频3。
如果候选推荐视频3是图2说明处提到的体育视频,向量为[0.7,0.77],那么这个时候算出来的a1=0.74,a2=0.81,由于a1达不到0.75,所以被设为0,因此整个推荐向量约为[0.04,0.36],则候选推荐视频与其推荐向量的相似度为0.80。
可以看到,游戏视频与其推荐向量的相似度要优于体育视频与其推荐向量的相似度,游戏视频能够优先被推荐,即用户更感兴趣的内容被推荐。
在另一可选的实施例中,在所述基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量的步骤之前,还包括:
基于所述历史播放内容的向量,筛选出内容的向量中与所述历史播放内容的向量存在至少一个相同参数的候选推荐内容,两个向量存在相同参数表示两个向量中同一维度的参数值相同。
本实施方式中,预先会从内容总池中找到部分内容作为候选推荐内容,其中,每个候选推荐内容的向量与至少一个历史播放内容的向量存在相同的参数。例如:历史播放内容3为电影视频A,则候选推荐内容可以为相同导演的电影视频B,也可以为相同演员的电影视频C,还可以为相同题材的电影视频D。
进一步地,还可以将候选推荐内容的数量限定在预设数量内,例如:从内容总池中取200个内容作为候选推荐内容。当然,预设数量还可以是150、100等等,此处不作限定。
通过在内容总池中筛选出候选推荐内容,避免对每个内容都进行推荐向量的计算,降低应用软件的计算量,提高应用软件的响应速度。
进一步地,本实施例中的所述历史播放内容为第一文件格式时,所述候选推荐内容为第一文件格式或第二文件格式,其中,所述第一文件格式为视频、音频、文本、图片中的一项,所述第二文件格式为视频、音频、文本、图片中的另一项。
即在历史播放内容为视频文件时,候选推荐内容可以为视频文件、也可以为音频文件、文本文件或图片文件。
进一步地,所述计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度的步骤,包括:
计算每一候选推荐内容的向量和其对应的推荐向量之间的余弦相似度。
由于余弦相似度计算得到的相似度大小仅与两个向量之间的夹角有关,这样余弦相似度为0时即可判断两个向量之间不相关,余弦相似度接近1时即可判断两个向量之间相似性大。而其他相似度计算方式,例如:距离算法,在计算出两个向量终点之间的距离后,需要额外的标准明确距离多大时两个向量之间相似性大,即这种计算方式更适用于比较两个向量与同一向量之间的相似度大小,而非计算相似度。
因此,本实施例中,利用余弦相似度算法来计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度相比其他相似度的方式而言更为可靠。
如图4所示,以内容为视频文件,每个向量包括3个维度进行说明,用户将自己的账户(id)登录客户端后,应用程序通过外部调用接口从用户历史行为库中抽取用户的历史播放视频,若历史播放视频包括视频a、视频b、视频c和视频d,则历史播放视频的向量为下方的数字矩阵:
通过给定用户的历史行为从视频总池中召回与历史播放视频类似的视频作为候选推荐视频,之后一一对候选推荐视频进行打分,具体的:
若候选推荐视频x的向量为[x1,x2,x3];
则将历史播放视频的向量跟候选推荐视频向量进行权重计算,假设第一个视频的权重记为wa,则有:wa_pre=(a1*x1+a2*x2+a3*x3)/(sprt(a1^2+a2^2+a3^2)*sprt(x1^2+x2^2+x3^2));
在wa_pre大于第五预设相似度时,wa=wa_pre(大于第一权重值),否则wa=0(小于第二权重值);
同理计算出视频b的权重值wb、视频c的权重值wc和视频d的权重值wd。
其中,第五预设相似度可以是用户自行设定的,也可以是通过模型训练后得到的,此处不作限定。
则候选推荐视频x的推荐向量[u1,u2,u3]=wa[a1,a2,a3]+wb[b1,b2,b3]+wc[c1,c2,c3]+wd[d1,d2,d3];
最后,将[u1,u2,u3]和[x1,x2,x3]的余弦相似度作为候选推荐视频x的得分。
基于各候选推荐视频的得分对各候选推荐视频的得分进行排序,输出得分最高的预设个数(n个)的视频至用户的账户,使得登录有用户账户的客户端显示得分最高的预设个数的视频。
如图5所示,本发明实施例还提供一种内容推荐装置500,包括:
获取模块510,用于获取账户的N个历史播放内容中每个历史播放内容的向量;
第一计算模块520,用于基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;
第二计算模块530,用于计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
输出模块540,用于基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
可选的,如图6所示,所述第一计算模块520,包括:
第一计算子模块521,用于分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;
第二计算子模块522,用于根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量。
可选的,如图7所示,所述第二计算子模块522,包括:
分配单元5221,用于分别根据目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度,对每一历史播放内容分配权重值,所述相似度大于或等于预设阈值时,历史播放内容的权重值大于第一权重值,所述相似度小于预设阈值时,历史播放内容的权重值小于第二权重值,所述第一权重值大于所述第二权重值;
计算单元5222,用于基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量。
可选的,如图7所示,所述计算单元532,还用于计算所述N个历史播放内容的向量中目标维度的参数值与其权重值乘积之和,再除以历史播放内容的总数N,得到与所述目标候选推荐内容对应的推荐向量中目标维度的参数值。
可选的,如图8所示,所述内容推荐装置500还包括筛选模块550,
所述筛选模块550,用于基于所述历史播放内容的向量,筛选出内容的向量中与所述历史播放内容的向量存在至少一个相同参数的候选推荐内容,两个向量存在相同参数表示两个向量中同一维度的参数值相同。
如图5所示,所述第二计算模块530,还用于计算每一候选推荐内容的向量和其对应的推荐向量之间的余弦相似度。
发明实施例的内容推荐装置500能够实现图1至图4的方法实施例中内容推荐方法实现的各个过程,为避免重复,这里不再赘述。
本发明实施例的内容推荐装置500,能够实现应用软件向用户推荐的内容与用户感兴趣的内容相似度高的效果。
本发明实施例还提供了一种电子设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:
获取账户的N个历史播放内容中每个历史播放内容的向量;
基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量;
计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
可选的,所述基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量的步骤,包括:
分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;
根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量。
可选的,所述根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量的步骤,包括:
分别根据目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度,对每一历史播放内容分配权重值,所述相似度大于或等于预设阈值时,历史播放内容的权重值大于第一权重值,所述相似度小于预设阈值时,历史播放内容的权重值小于第二权重值,所述第一权重值大于所述第二权重值;
基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量。
可选的,所述基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量的步骤,包括:
计算所述N个历史播放内容的向量中目标维度的参数值与其权重值乘积之和,再除以历史播放内容的总数N,得到与所述目标候选推荐内容对应的推荐向量中目标维度的参数值。
可选的,在所述基于每一候选推荐内容的向量和所述N个历史播放内容中每个历史播放内容的向量,分别计算每一候选推荐内容对应的推荐向量的步骤之前,还包括:
基于所述历史播放内容的向量,筛选出内容的向量中与所述历史播放内容的向量存在至少一个相同参数的候选推荐内容,两个向量存在相同参数表示两个向量中同一维度的参数值相同。
可选的,所述历史播放内容为第一文件格式时,所述候选推荐内容为第一文件格式或第二文件格式,其中,所述第一文件格式为视频、音频、文本、图片中的一项,所述第二文件格式为视频、音频、文本、图片中的另一项。
可选的,所述计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度的步骤,包括:
计算每一候选推荐内容的向量和其对应的推荐向量之间的余弦相似度。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容推荐方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容推荐方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种内容推荐方法,其特征在于,所述方法包括:
获取账户的N个历史播放内容中每个历史播放内容的向量,每一所述向量包括多个代表内容特征的维度;
分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;
根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量;
计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量的步骤,包括:
分别根据目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度,对每一历史播放内容分配权重值,所述相似度大于或等于预设阈值时,历史播放内容的权重值大于第一权重值,所述相似度小于预设阈值时,历史播放内容的权重值小于第二权重值,所述第一权重值大于所述第二权重值;
基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量。
3.根据权利要求2所述的方法,其特征在于,所述基于每一历史播放内容的向量和每一历史播放内容的权重值,计算所述目标候选推荐内容对应的推荐向量的步骤,包括:
计算所述N个历史播放内容的向量中目标维度的参数值与其权重值乘积的累加和,再除以历史播放内容的总数N,得到与所述目标候选推荐内容对应的推荐向量中目标维度的参数值。
4.根据权利要求1所述的方法,其特征在于,在所述分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度的步骤之前,还包括:
基于所述历史播放内容的向量,筛选出内容的向量中与所述历史播放内容的向量存在至少一个相同参数的候选推荐内容,两个向量存在相同参数表示两个向量中同一维度的参数值相同。
5.根据权利要求1所述的方法,其特征在于,所述历史播放内容为第一文件格式时,所述候选推荐内容为第一文件格式或第二文件格式,其中,所述第一文件格式为视频、音频、文本、图片中的一项,所述第二文件格式为视频、音频、文本、图片中的另一项。
6.根据权利要求1所述的方法,其特征在于,所述计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度的步骤,包括:
计算每一候选推荐内容的向量和其对应的推荐向量之间的余弦相似度。
7.一种内容推荐装置,其特征在于,包括:
获取模块,用于获取账户的N个历史播放内容中每个历史播放内容的向量,每一所述向量包括多个代表内容特征的维度;
第一计算模块,所述第一计算模块包括:第一计算子模块和第二计算子模块,所述第一计算子模块用于分别计算目标候选推荐内容的向量与所述N个历史播放内容中每一历史播放内容的向量之间的相似度,所述目标候选推荐内容为任一候选推荐内容;所述第二计算子模块用于根据所述目标候选推荐内容的向量与每一历史播放内容的向量之间的相似度和每一历史播放内容的向量,计算所述目标候选推荐内容对应的推荐向量;
第二计算模块,用于计算每一候选推荐内容的向量和其对应的推荐向量之间的相似度;
输出模块,用于基于所述相似度,向所述账户输出推荐内容,以在登录有所述账户的客户端显示所述推荐内容。
8.根据权利要求7所述的内容推荐装置,其特征在于,所述内容推荐装置还包括筛选模块,
所述筛选模块,用于基于所述历史播放内容的向量,筛选出内容的向量中与所述历史播放内容的向量存在至少一个相同参数的候选推荐内容,两个向量存在相同参数表示两个向量中同一维度的参数值相同。
9.根据权利要求7所述的内容推荐装置,其特征在于,所述历史播放内容为第一文件格式时,所述候选推荐内容为第一文件格式或第二文件格式,其中,所述第一文件格式为视频、音频、文本、图片中的一项,所述第二文件格式为视频、音频、文本、图片中的另一项。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201911240619.9A 2019-12-06 2019-12-06 内容推荐方法及装置、电子设备和可存储介质 Active CN111046230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911240619.9A CN111046230B (zh) 2019-12-06 2019-12-06 内容推荐方法及装置、电子设备和可存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911240619.9A CN111046230B (zh) 2019-12-06 2019-12-06 内容推荐方法及装置、电子设备和可存储介质

Publications (2)

Publication Number Publication Date
CN111046230A CN111046230A (zh) 2020-04-21
CN111046230B true CN111046230B (zh) 2023-09-15

Family

ID=70235043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911240619.9A Active CN111046230B (zh) 2019-12-06 2019-12-06 内容推荐方法及装置、电子设备和可存储介质

Country Status (1)

Country Link
CN (1) CN111046230B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680219B (zh) * 2020-06-09 2023-10-20 深圳市雅阅科技有限公司 内容推荐方法、装置、设备及可读存储介质
CN111949893B (zh) * 2020-08-21 2024-03-29 深圳市活力天汇科技股份有限公司 一种基于协同过滤算法的机票推荐方法
CN114040216B (zh) * 2021-11-03 2023-07-11 杭州网易云音乐科技有限公司 直播间推荐方法、介质、装置和计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN108319622A (zh) * 2017-01-18 2018-07-24 腾讯科技(北京)有限公司 一种媒体内容推荐方法及装置
CN109670113A (zh) * 2018-12-20 2019-04-23 重庆锐云科技有限公司 一种房源推荐方法、装置及服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160071182A1 (en) * 2014-09-10 2016-03-10 Microsoft Corporation Multimedia recommendation based on artist similarity

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN108319622A (zh) * 2017-01-18 2018-07-24 腾讯科技(北京)有限公司 一种媒体内容推荐方法及装置
CN109670113A (zh) * 2018-12-20 2019-04-23 重庆锐云科技有限公司 一种房源推荐方法、装置及服务器

Also Published As

Publication number Publication date
CN111046230A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN111046230B (zh) 内容推荐方法及装置、电子设备和可存储介质
CN107534796B (zh) 视频处理系统和数字视频分发系统
CN106326391B (zh) 多媒体资源推荐方法及装置
CN109302619A (zh) 一种信息处理方法及装置
TWI510064B (zh) 視訊推薦系統及其方法
WO2018000624A1 (zh) 视频播放控制方法及装置
CN108647245B (zh) 多媒体资源的匹配方法、装置、存储介质及电子装置
CN110121098B (zh) 视频播放方法、装置、存储介质和电子装置
CN107295362B (zh) 基于图像的直播内容筛选方法、装置、设备及存储介质
CN109714639B (zh) 违规处理方法、装置、服务器以及存储介质
US10762122B2 (en) Method and device for assessing quality of multimedia resource
CN109120949B (zh) 视频集合的视频消息推送方法、装置、设备及存储介质
CN110072140B (zh) 一种视频信息提示方法、装置、设备及存储介质
CN111095939A (zh) 识别媒体项目的先前流传输部分以避免重复重放
US20170169062A1 (en) Method and electronic device for recommending video
CN112507163A (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
US20170168660A1 (en) Voice bullet screen generation method and electronic device
CN113613075A (zh) 一种视频推荐方法、装置及云服务器
CN104967690A (zh) 一种信息推送方法及装置
CN112291634B (zh) 视频处理方法及装置
CN108154120A (zh) 视频分类模型训练方法、装置、存储介质及电子设备
CN105956061B (zh) 一种用户间相似度确定方法及装置
CN107688587B (zh) 一种媒体信息展示方法及装置
CN108769831A (zh) 视频预告的生成方法及装置
CN112073817B (zh) 媒体文件的播放控制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant