CN109063137A - 一种推荐对象确定方法、装置、设备及可读存储介质 - Google Patents

一种推荐对象确定方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN109063137A
CN109063137A CN201810877742.0A CN201810877742A CN109063137A CN 109063137 A CN109063137 A CN 109063137A CN 201810877742 A CN201810877742 A CN 201810877742A CN 109063137 A CN109063137 A CN 109063137A
Authority
CN
China
Prior art keywords
user
target
neighbour
score value
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810877742.0A
Other languages
English (en)
Inventor
张莉
李泽鹏
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201810877742.0A priority Critical patent/CN109063137A/zh
Publication of CN109063137A publication Critical patent/CN109063137A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种推荐对象确定方法,该方法包括以下步骤:在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数;将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值;当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。本发明实施例所提供的技术方案确定的推荐对象与用户具有较高的匹配性,个性化更强。可适用于稀疏性较强的应用场景中,提升推荐效果。本发明还公开了一种推荐对象确定装置、设备及可读存储介质,具有相应的技术效果。

Description

一种推荐对象确定方法、装置、设备及可读存储介质
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种推荐对象确定方法、装置、设备及可读存储介质。
背景技术
随着计算机技术的快速发展,大量的音频、视频、图片或文字,以上各种媒体对象的任意组合如电影、电视、短视频、新闻等被计算机应用所呈现,丰富了人们的工作、学习和生活。由于计算机网络的资源共享功能,存在大量的媒体资源,如何在这些媒体资源中找到喜欢的媒体对象确是一个难题。
目前,各类媒体的个性化推荐技术应运而生,以解决在海量信息中寻找关键点,向用户推荐出符合用户要求的媒体对象。目前,余弦相似度,Pearson相似度、SPCC、JMSD相似性计算已经广泛应用于个性化推荐技术中。这些相似性度量通常取决于共同项目。这里,共同评估的项目代表是至少由两个用户评定的常见项目组成。共同项目的依赖性是造成大多数传统相似性度量主要稀疏问题的原因之一。一些领域的评级数据集(如电子商务和社交网络)是稀疏的。稀疏数据集使共同项目极为罕见,这将降低预测精度。传统的相似性度量不太适合稀疏的数据集。因此,在用户和媒体的数量不断增加的同时,稀疏性也越来越明显,计算复杂性也相继提高,传统的个性化推荐方法难以提升推荐效果。
综上所述,如何有效地解决媒体个性化推荐等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种推荐对象确定方法、装置、设备及可读存储介质,以进行个性化推荐。
为解决上述技术问题,本发明提供如下技术方案:
一种推荐对象确定方法,包括:
在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,所述目标对象为向所述目标用户进行推荐的备选集合中的任意一个对象;
获取并利用每个所述近邻用户与所述目标用户的相似性,计算出每个所述近邻用户对应的权重系数;
将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值;
当所述预估分值大于推荐阈值时,将所述目标对象确定为推荐给所述目标用户的推荐对象。
优选地,在所述获取目标用户的每个近邻用户对目标对象的印象分值之前,还包括:
将印象分值大于预设阈值的对象添加至全局表中;
在所述全局表中,将与目标用户交集数量大于预设近邻阈值的用户添加至所述目标用户的近邻用户集合中。
优选地,所述获取每个所述近邻用户与所述目标用户的相似性,包括:
利用所述目标用户的历史记录和每个所述近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个所述近邻用户与所述目标用户的相似性;
或,直接读取预先计算出的获取每个所述近邻用户与所述目标用户的相似性。
优选地,利用所述目标用户的历史记录和每个所述近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个所述近邻用户与所述目标用户的相似性,包括:
利用所述目标用户的历史记录和每个所述近邻用户的历史记录数目,分别计算出所述目标用户与每个所述近邻用户的不对称程度;
统计所述目标用户的历史记录和每个所述近邻用户的历史记录中对相同对象的印象分值,获得印象分值相似度;
对所述目标用户的历史记录和每个所述近邻用户的历史记录中的对象进行相似度分析,获得对象相似度;
对每个所述近邻用户对应的印象分值相似度、印象分值相似度和对象相似度相乘,获得出每个所述近邻用户与所述目标用户的相似性。
优选地,所述将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值,包括:
对所述目标用户的历史记录中每个印象分值求平均值,获得所述目标用户对应的印象均值;
将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值,计算出每个所述近邻用户对所述目标用户对所述目标对象的预估影响值;
将所有所述预估影响值与所述印象均值的和作为所述目标用户对所述目标对象的预估分值。
优选地,所述目标对象包括视频、文字、网页、图片、音频中的一种或多种的组合形式的媒体对象。
优选地,所述印象分值为对包括用户评分、观看次数、观看时长、分享次数中的至少一个记录统计获得。
一种推荐对象确定装置,包括:
印象分值获取模块,用于在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,所述目标对象为向所述目标用户进行推荐的备选集合中的任意一个对象;
权重系数计算模块,用于获取并利用每个所述近邻用户与所述目标用户的相似性,计算出每个所述近邻用户对应的权重系数;
预估分值计算模块,用于将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值;
推荐对象确定模块,用于当所述预估分值大于推荐阈值时,将所述目标对象确定为推荐给所述目标用户的推荐对象。
一种推荐对象确定设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述推荐对象确定方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述推荐对象确定方法的步骤。
应用本发明实施例所提供的方法,在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,目标对象为向目标用户进行推荐的备选集合中的任意一个对象;获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数;将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值;当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。
在为目标用户确定进行推荐的推荐对象时,对于待选对象集合中的目标对象,首先获取目标用户对应的近邻用户集合中的每个近邻用户对应目标对象的印象分值。其中,近邻用户为与目标用户相似度较大的用户。也就是说,目标用户与其近邻用户具有相似喜好。利用该相似喜好,可以用近邻用户对目标对象的印象分值来预估目标用户对目标对象的印象分值。具体的,即计算每个近邻用户与目标用户之间的相似性,然后利用每个近邻用户分别对应的相似性计算出权重系数。将每个近邻用户对应的权重系数和对目标对象的印象分值输入到预测估分计算模型中进行计算,计算出目标用户对目标对象的预估分值。计算出预估分值之后,判断预估分值是否大于推荐阈值,如果是,则表明目标对象对目标对象感兴趣,则可以将目标对象确定为推荐对象。将目标对象确定推荐对象之后,可以适时向目标用户推荐。由于推荐对象的确定,由近邻用户集合中的每个近邻用户与目标用户之间的相似性,以及每个近邻用户对目标对象的印象分值,对目标用户对目标对象的印象分值进行预估,并在预估印象分值达到预设阈值之后,才将其确定为推荐对象。因而,相较于现有的仅基于单一相似度计算而确定出的推荐对象而言,本发明实施例所提供的技术方案确定的推荐对象与用户具有较高的匹配性,个性化更强。可适用于稀疏性较强的应用场景中,提升推荐效果。
相应地,本发明实施例还提供了与上述推荐对象确定方法相对应的推荐对象确定装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种推荐对象确定方法的实施流程图;
图2为本发明实施例中一种推荐对象确定装置的结构示意图;
图3为本发明实施例中一种推荐对象确定设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例中一种推荐对象确定方法的流程图,该方法包括以下步骤:
S101、在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值。
其中,目标对象为向目标用户进行推荐的备选集合中的任意一个对象。
当需要确定推荐给目标用户的推荐对象时,可以在备选集合中随机选择一个对象作为目标对象。然后在全局表中,获取与目标用户对应的近邻用户集合中每个近邻用户分别对目标对象的印象分值。其中,目标对象可以为视频、文字、网页、图片、音频中的一种或多种的组合形式的媒体对象。例如,目标对象可以为一首歌、一部电影、一个网页链接、一个图集或一篇文档。近邻用户为预先计算出的与目标用户具有统计相似性的用户。其中,印象分值为对包括用户评分、观看次数、观看时长、分享次数中的至少一个记录统计获得。例如,当目标对象为电影时,印象分值可以为用户的评分,也可以为用户的观影时长、观看次数,推荐好友次数等一个或多个参考值的组合。具体的,当印象分值仅为一个参考值时,即可将该参考值对应的数据作为印象分值,以标识用户对该电影的喜爱程度(如印象分值即为用户评分的分值);当印象分值为两个及两个以上的参考值时,可以将两个参考值进行统计分值,将统计结果作为印象分值。例如,当印象分值为分享次数和观影时长时,可为不同观影时长设置不同的权重比例,计算出百分比,然后使用分享次数对百分比进行修正。例如分享一次,将百分比至加5%,百分比上限为100%,然后将该百分比作为印象分值。
优选地,在执行步骤S101之前,还可以预先设置全局表。为了提高计算速度,可执行以下步骤的操作,设置全局表和确定近邻用户集合:
步骤一、将印象分值大于预设阈值的对象添加至全局表中;
步骤二、在全局表中,将与目标用户交集数量大于预设近邻阈值的用户添加至目标用户的近邻用户集合中。
为了便于描述,下面将上述两个步骤结合起来进行说明。
由于待推荐的对象往往数据量较大,且相互之间的关联性较差,即用于推荐对象确定的历史数据之间具有较强的稀疏性。为了增强数据之间的关联性,降低计算量。可以将历史数据进行整理。
下面以电影个性化推荐为例进行说明,其他类型的对象的推荐处理方法可参照本发明实施例所描述的电影个性化推荐。需要说明是,电影个性化推荐,可将用户评分、用户观影时长、观影次数、好友推荐次数等类型作为印象分值。下面以将用户评分直接作为印象评分为例进行介绍,其他类型的印象分值可对应参照,在此不再赘述。
首先,输入一个电影评分矩阵其中rij∈{0,1,2,3,4,5}表示用户ui对电影mj的评分,l和n分别表示用户数量和电影数量。rij取值为0表示用户对电影未评价;取值为1到5,表示用户对电影的喜欢程度从低到高,如取值为5时,表示用户很喜欢该电影。在本发明实施例中,以评分大于等于3表示用户对该电影感兴趣。令集合U={u1,…,ul}和M={m1,...,mn}分别代表用户集合与电影集合。
然后,创建近邻树,即确定目标用户的近邻用户集合。具体的,将用户评分rij≥3的电影,都视为用户感兴趣的电影。由此,可以构建一个全局表来存储每个用户感兴趣的电影集合,然后在此全局表中搜索与每个用户交集较多的用户作为该用户的近邻。对用户ui,假设其近邻用户集为其中ki≤K为用户ui的近邻用户个数,K为预设的近邻用户上限。则对l个用户,有l个近邻用户集N1,…,N1
如此,便可在全局表中确定出每个近邻用户对目标电影的分值。
获取每个近邻用户对目标对象的印象分值之后,可执行步骤S102的操作。
S102、获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数。
在实际应用中,可采用以下两种获取方式,获取每个近邻用户与目标用户的相似性。其中,在本发明实施例中,相似性为对统计相似性。
获取方式一、利用目标用户的历史记录和每个近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个近邻用户与目标用户的相似性;
获取方式二、直接读取预先计算出的获取每个近邻用户与目标用户的相似性。
其中,获取方式一,即在每次确定推荐对象时,计算目标用户与近邻用户之间的相似性,当数据变化较频繁时,可使得最终计算结果符合实时变化的应用场景的需求。获取方式二则在获取目标用户与近邻用户之间的相似性时,无需每次启动推荐对象都进行相似性计算,而是将预先统计计算结果直接读取应用,减少计算计算量,可用于数据变化频率较低的应用场景中。在实际应用中,可根据具体的应用场景的数据变化特点,选择最佳的获取方式。
下面对计算目标用户与近邻用户的相似性的过程,即上述获取方式一和获取方式二均可应用的计算过程进行详细描述。
步骤一、利用目标用户的历史记录和每个近邻用户的历史记录数目,分别计算出目标用户与每个近邻用户的不对称程度;
步骤二、统计目标用户的历史记录和每个近邻用户的历史记录中对相同对象的印象分值,获得印象分值相似度;
步骤三、对目标用户的历史记录和每个近邻用户的历史记录中的对象进行相似度分析,获得对象相似度;
步骤四、对每个近邻用户对应的印象分值相似度、印象分值相似度和对象相似度相乘,获得出每个近邻用户与目标用户的相似性。
为了便于描述,下面将上述四个计算步骤集合起来进行说明。
使用S(ug,ui)表示目标用户ug和近邻用户ui的相似性,其计算方式为:
其中,是用户ug已经评过分的电影集合,即S2(ug,ui)表示ug和近邻用户ui不对称程度,计算方式为:
其中,S3(ug,ui)表示用户的评分喜好程度(即印象分值相似度),计算方式为:
其中σg是用户ug非零评分的标准差。Sitem(mj,mq)是电影mj和电影mq之间的相似度(即电影相似度),计算方式为:
其中DS(mj,mq)是J散度。S1(rgj,riq)表示用户ug对电影mj评分与用户ui对电影mq评分的相似度,计算方式为:
其中rmed为所有非零评分的中值,μj代表对电影mj有评分的平均值。
利用上述计算过程,可计算出每个近邻用户与目标用户之间的相似性。在计算出每个近邻用户与目标用户之间的相似性之后,可以基于该相似性对每一个近邻用户分别对应的权重系数。例如,计算近邻用户A的权重系数时,可将近邻用户A对应的相似性作为分子,将目标用户的所有近邻用户的相似性累加和作为分母,所得到的比值系数即可使用近邻用户A的权重系数。
S103、将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值。
在本发明实施例中,可以预先设置一个估分计算模型,即在计算目标用户对目标对象的预估分值时,可以利用每个近邻用户权重系数,然后将近邻用户对目标对象的印象分值进行求和,将最终的加权求和结果作为目标用户对目标对象的预估分值。例如,当有目标用户有4个近邻有用户时,每个近邻用户对应的权重系数为Ai,每个近邻用户对目标对象的印象分值为Bi,则目标用户对目标对象的预估分值
优选地,为了使得推荐对象受目标用户欢迎,可以利用目标用户的历史记录,计算出与目标用户更为匹配的预估分值。具体如下:
步骤一、对目标用户的历史记录中每个印象分值求平均值,获得目标用户对应的印象均值;
步骤二、将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值,计算出每个近邻用户对目标用户对目标对象的预估影响值;
步骤三、将所有预估影响值与印象均值的和作为目标用户对目标对象的预估分值。
为便于描述,下面将上述三个步骤结合起来进行说明。
首先,将目标用户对应的历史记录中非零印象均值相加求平均值,即获得印象均值。然后,将每个近邻用户对象与目标用户的相似性和对目标对象的印象分值,计算出基于近邻用户集合对目标用户对目标对象的预估影响值。最后将预估影响值与目标用户的印象均值进行累加,获得预估分值。
例如,假设目标用户为ug∈U,为目标用户ug推荐目标电影ma∈{mj|mj∈M∧rgj=0},也就是预测目标用户ug对目标电影ma的评分
其中表示目标用户ug对电影非零评分的平均值,表示用户ui对电影非零评分的平均值;Ng是目标用户ug的近邻用户集合,S(ug,ui)表示目标用户ug和近邻用户ui的相似性。表示近邻用户ui对目标电影的评分减去该近邻用户非零评分的均值。
S104、当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。
当预估分值大于推荐阈值时,可以视为目标用户对目标电影感兴趣,可将目标对象作为推荐给目标用户的推荐对象。确定好推荐对象之后,可以向目标用户推荐。
应用本发明实施例所提供的方法,。在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,目标对象为向目标用户进行推荐的备选集合中的任意一个对象;获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数;将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值;当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。
在为目标用户确定进行推荐的推荐对象时,对于待选对象集合中的目标对象,首先获取目标用户对应的近邻用户集合中的每个近邻用户对应目标对象的印象分值。其中,近邻用户为与目标用户相似度较大的用户。也就是说,目标用户与其近邻用户具有相似喜好。利用该相似喜好,可以用近邻用户对目标对象的印象分值来预估目标用户对目标对象的印象分值。具体的,即计算每个近邻用户与目标用户之间的相似性,然后利用每个近邻用户分别对应的相似性计算出权重系数。将每个近邻用户对应的权重系数和对目标对象的印象分值输入到预测估分计算模型中进行计算,计算出目标用户对目标对象的预估分值。计算出预估分值之后,判断预估分值是否大于推荐阈值,如果是,则表明目标对象对目标对象感兴趣,则可以将目标对象确定为推荐对象。将目标对象确定推荐对象之后,可以适时向目标用户推荐。由于推荐对象的确定,由近邻用户集合中的每个近邻用户与目标用户之间的相似性,以及每个近邻用户对目标对象的印象分值,对目标用户对目标对象的印象分值进行预估,并在预估印象分值达到预设阈值之后,才将其确定为推荐对象。因而,相较于现有的仅基于单一相似度计算而确定出的推荐对象而言,本发明实施例所提供的技术方案确定的推荐对象与用户具有较高的匹配性,个性化更强。可适用于稀疏性较强的应用场景中,提升推荐效果。
为了便于本领域技术人员更好的理解本发明实施例所提供的技术方案,下面结合具体的应用数据和推荐结果,对本发明实施例所提供的技术方案进行详细描述。
选取Movielens数据集ML_100k数据进行了测试,该数据集由942个用户,1682个电影数量,一共评分记录多达100000。该数据集评分范围为{1,2,3,4,5},1表示讨厌的电影,5表示很喜欢的电影。稀疏程度达到93.7%构成942*1682的数据集,对未评价过的电影用0表示。划出80%作为训练集,剩余部分作为测试集。
将上述实施例所提供的技术方案模块后,具体如下:
输入模块:
输入一个电影评分矩阵其中rij∈{0,1,2,3,4,5}表示用户ui对电影mj的评分,l和n分别表示用户数量和电影数量。rij取值为0表示用户对电影未评价;取值为1到5,表示用户对电影的喜欢程度从低到高。如取值为5时,表示用户很喜欢该电影。一般来说,评分大于等于3则表示用户对该电影感兴趣。令集合U={u1,…,ul}和M={m1,...,mn}分别代表用户集合与电影集合。这里l=942,n=1682。
近邻树模块:
把用户评分rij≥3的电影,都视为用户感兴趣的电影。由此,可以构建一个全局表来存储每个用户感兴趣的电影集合,然后再此全局表中搜索与每个用户交集较多的用户作为该用户的近邻。对用户ui,假设其近邻用户集为其中ki≤K为用户ui的近邻用户个数,K为预设的近邻用户上限。则对l个用户,有l个近邻用户集N1,…,Nl
推荐模块:
假设目标用户为ug∈U,本模块的目的是为目标用户ug推荐某部电影ma∈{mj|mj∈M∧rgj=0},也就是预测目标用户ug对电影ma的评分
其中表示用户ui对电影非零评分的平均值;Ng是目标用户ug的近邻用户集合,S(ug,ui)表示目标用户ug和近邻用户ui的相似性,其计算方式为:
其中是用户ug已经评过分的电影集合,即S2(ug,ui)表示ug和近邻用户ui不对称的程度,计算方式为:
S3(ug,ui)表示用户的评分喜好程度,计算方式为:
其中σg是用户ug非零评分的标准差。Sitem(mj,mq)是电影mj和电影mq之间的相似度,计算方式为:
其中DS(mj,mq)是J散度。S1(rgj,riq)表示用户ug对电影mj评分与用户ui对电影mq评分的相似度,计算方式为:
其中rmed为所有非零评分的中值,μj代表对电影mj有评分的平均值。
然后,计算出预估评分之后,将预估评分大于等于3的电影推荐给目标用户。
其推荐效果可以通过如下实验验证:对数据集随机划分5次训练集和测试集。在推荐预测中,对比方法包括本发明实施例所提供的计算方案、基于用户Pearson相似度和基于电影Pearson相似度的算法(UCF_Per,MCF_Per)。采用绝对值误差指标(MAE)和平方误差指标(RMSE)还有召回率(Recall)对推荐效果进行评估:
其中l'和n'为测试集上的用户数和电影数量,IRgt为测试集上用户喜欢的电影集合,IRgp为推荐给用户喜欢的电影集合。
结果如表1所示。
推荐 MAE RMSE Recall
本发明实施例 0.8039 1.1127 0.6977
UCF_Per 0.9838 1.1174 0.2607
MCF_Per 0.8716 1.0196 0.0571
表1
从表1可以看出,应用了本发明实施例所提供的技术方案之后,绝对值误差指标(MAE)和平方误差指标(RMSE)还有召回率(Recall)均得到提升。
相应于上面的方法实施例,本发明实施例还提供了一种推荐对象确定装置,下文描述的推荐对象确定装置与上文描述的推荐对象确定方法可相互对应参照。
参见图2所示,该装置包括以下模块:
印象分值获取模块101,用于在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,目标对象为向目标用户进行推荐的备选集合中的任意一个对象;
权重系数计算模块102,用于获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数;
预估分值计算模块103,用于将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值;
推荐对象确定模块104,用于当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。应用本发明实施例所提供的装置,在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,目标对象为向目标用户进行推荐的备选集合中的任意一个对象;获取并利用每个近邻用户与目标用户的相似性,计算出每个近邻用户对应的权重系数;将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值输入到预设估分计算模型中,获得目标用户对目标对象的预估分值;当预估分值大于推荐阈值时,将目标对象确定为推荐给目标用户的推荐对象。
在为目标用户确定进行推荐的推荐对象时,对于待选对象集合中的目标对象,首先获取目标用户对应的近邻用户集合中的每个近邻用户对应目标对象的印象分值。其中,近邻用户为与目标用户相似度较大的用户。也就是说,目标用户与其近邻用户具有相似喜好。利用该相似喜好,可以用近邻用户对目标对象的印象分值来预估目标用户对目标对象的印象分值。具体的,即计算每个近邻用户与目标用户之间的相似性,然后利用每个近邻用户分别对应的相似性计算出权重系数。将每个近邻用户对应的权重系数和对目标对象的印象分值输入到预测估分计算模型中进行计算,计算出目标用户对目标对象的预估分值。计算出预估分值之后,判断预估分值是否大于推荐阈值,如果是,则表明目标对象对目标对象感兴趣,则可以将目标对象确定为推荐对象。将目标对象确定推荐对象之后,可以适时向目标用户推荐。由于推荐对象的确定,由近邻用户集合中的每个近邻用户与目标用户之间的相似性,以及每个近邻用户对目标对象的印象分值,对目标用户对目标对象的印象分值进行预估,并在预估印象分值达到预设阈值之后,才将其确定为推荐对象。因而,相较于现有的仅基于单一相似度计算而确定出的推荐对象而言,本发明实施例所提供的技术方案确定的推荐对象与用户具有较高的匹配性,个性化更强。可适用于稀疏性较强的应用场景中,提升推荐效果。
在本发明的一种具体实施方式中,还包括:
近邻用户集合确定模块,用于在获取目标用户的每个近邻用户对目标对象的印象分值之前将印象分值大于预设阈值的对象添加至全局表中;在全局表中,将与目标用户交集数量大于预设近邻阈值的用户添加至目标用户的近邻用户集合中。
在本发明的一种具体实施方式中,权重系数计算模块102,包括:
相似性计算获取单元,用于利用目标用户的历史记录和每个近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个近邻用户与目标用户的相似性;
相似性读取单元,用于直接读取预先计算出的获取每个近邻用户与目标用户的相似性。
在本发明的一种具体实施方式中,相似性计算获取单元,包括:
不对称程度计算子单元,用于利用目标用户的历史记录和每个近邻用户的历史记录数目,分别计算出目标用户与每个近邻用户的不对称程度;
印象分值相似度计算子单元,用于统计目标用户的历史记录和每个近邻用户的历史记录中对相同对象的印象分值,获得印象分值相似度;
对象相似度计算子单元,用于对目标用户的历史记录和每个近邻用户的历史记录中的对象进行相似度分析,获得对象相似度;
相似性计算子单元,用于对每个近邻用户对应的印象分值相似度、印象分值相似度和对象相似度相乘,获得出每个近邻用户与目标用户的相似性。
在本发明的一种具体实施方式中,预估分值计算模块103,包括:
印象均值计算单元,用于对目标用户的历史记录中每个印象分值求平均值,获得目标用户对应的印象均值;
预估影响值计算单元,用于将每个近邻用户的权重系数和每个近邻用户对目标对象的印象分值,计算出每个近邻用户对目标用户对目标对象的预估影响值;
预估分值计算单元,用于将所有预估影响值与印象均值的和作为目标用户对目标对象的预估分值。
在本发明的一种具体实施方式中,目标对象包括视频、文字、网页、图片、音频中的一种或多种的组合形式的媒体对象。
在本发明的一种具体实施方式中,印象分值为对包括用户评分、观看次数、观看时长、分享次数中的至少一个记录统计获得。
相应于上面的方法实施例,本发明实施例还提供了一种推荐对象确定设备,下文描述的一种推荐对象确定设备与上文描述的一种推荐对象确定方法可相互对应参照。
参见图3所示,该推荐对象确定设备包括:
存储器D1,用于存储计算机程序;
处理器D2,用于执行计算机程序时实现上述方法实施例的推荐对象确定方法的步骤。
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种推荐对象确定方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的推荐对象确定方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

Claims (10)

1.一种推荐对象确定方法,其特征在于,包括:
在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,所述目标对象为向所述目标用户进行推荐的备选集合中的任意一个对象;
获取并利用每个所述近邻用户与所述目标用户的相似性,计算出每个所述近邻用户对应的权重系数;
将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值;
当所述预估分值大于推荐阈值时,将所述目标对象确定为推荐给所述目标用户的推荐对象。
2.根据权利要求1所述的推荐对象确定方法,其特征在于,在所述获取目标用户的每个近邻用户对目标对象的印象分值之前,还包括:
将印象分值大于预设阈值的对象添加至全局表中;
在所述全局表中,将与目标用户交集数量大于预设近邻阈值的用户添加至所述目标用户的近邻用户集合中。
3.根据权利要求1所述的推荐对象确定方法,其特征在于,所述获取每个所述近邻用户与所述目标用户的相似性,包括:
利用所述目标用户的历史记录和每个所述近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个所述近邻用户与所述目标用户的相似性;
或,直接读取预先计算出的获取每个所述近邻用户与所述目标用户的相似性。
4.根据权利要求3所述的推荐对象确定方法,其特征在于,利用所述目标用户的历史记录和每个所述近邻用户的历史记录,按照预设混合相似性计算规则,计算出每个所述近邻用户与所述目标用户的相似性,包括:
利用所述目标用户的历史记录和每个所述近邻用户的历史记录数目,分别计算出所述目标用户与每个所述近邻用户的不对称程度;
统计所述目标用户的历史记录和每个所述近邻用户的历史记录中对相同对象的印象分值,获得印象分值相似度;
对所述目标用户的历史记录和每个所述近邻用户的历史记录中的对象进行相似度分析,获得对象相似度;
对每个所述近邻用户对应的印象分值相似度、印象分值相似度和对象相似度相乘,获得出每个所述近邻用户与所述目标用户的相似性。
5.根据权利要求1所述的推荐对象确定方法,其特征在于,所述将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值,包括:
对所述目标用户的历史记录中每个印象分值求平均值,获得所述目标用户对应的印象均值;
将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值,计算出每个所述近邻用户对所述目标用户对所述目标对象的预估影响值;
将所有所述预估影响值与所述印象均值的和作为所述目标用户对所述目标对象的预估分值。
6.根据权利要求1至5任一项所述的推荐对象确定方法,其特征在于,所述目标对象包括视频、文字、网页、图片、音频中的一种或多种的组合形式的媒体对象。
7.根据权利要求6所述的推荐对象确定方法,其特征在于,所述印象分值为对包括用户评分、观看次数、观看时长、分享次数中的至少一个记录统计获得。
8.一种推荐对象确定装置,其特征在于,包括:
印象分值获取模块,用于在全局表中,获取目标用户的每个近邻用户对目标对象的印象分值;其中,所述目标对象为向所述目标用户进行推荐的备选集合中的任意一个对象;
权重系数计算模块,用于获取并利用每个所述近邻用户与所述目标用户的相似性,计算出每个所述近邻用户对应的权重系数;
预估分值计算模块,用于将每个所述近邻用户的权重系数和每个所述近邻用户对所述目标对象的印象分值输入到预设估分计算模型中,获得所述目标用户对所述目标对象的预估分值;
推荐对象确定模块,用于当所述预估分值大于推荐阈值时,将所述目标对象确定为推荐给所述目标用户的推荐对象。
9.一种推荐对象确定设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述推荐对象确定方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述推荐对象确定方法的步骤。
CN201810877742.0A 2018-08-03 2018-08-03 一种推荐对象确定方法、装置、设备及可读存储介质 Pending CN109063137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810877742.0A CN109063137A (zh) 2018-08-03 2018-08-03 一种推荐对象确定方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810877742.0A CN109063137A (zh) 2018-08-03 2018-08-03 一种推荐对象确定方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN109063137A true CN109063137A (zh) 2018-12-21

Family

ID=64831398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810877742.0A Pending CN109063137A (zh) 2018-08-03 2018-08-03 一种推荐对象确定方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109063137A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139746A (zh) * 2021-05-13 2021-07-20 深圳他米科技有限公司 基于人工智能的酒店续住方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182518A (zh) * 2014-08-25 2014-12-03 苏州大学 一种协同过滤推荐方法及装置
CN104657336A (zh) * 2015-03-10 2015-05-27 湖北大学 一种基于半余弦函数的个性化推荐算法
CN106779825A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 一种物品推荐方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182518A (zh) * 2014-08-25 2014-12-03 苏州大学 一种协同过滤推荐方法及装置
CN104657336A (zh) * 2015-03-10 2015-05-27 湖北大学 一种基于半余弦函数的个性化推荐算法
CN106779825A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 一种物品推荐方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YONG WANG 等: "A hybrid user similarity model for collaborative filtering", 《INFORMATION SCIENCES》 *
贺子岳: "《数字出版形态研究》", 31 December 2015, 武汉大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139746A (zh) * 2021-05-13 2021-07-20 深圳他米科技有限公司 基于人工智能的酒店续住方法、装置、设备及存储介质
CN113139746B (zh) * 2021-05-13 2023-11-14 深圳他米科技有限公司 基于人工智能的酒店续住方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
WO2017181612A1 (zh) 个性化视频推荐方法及装置
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN103455515B (zh) Sns社区中的用户推荐方法和系统
JP2021103543A (ja) ライブストリームコンテンツを推奨するための機械学習の使用
CN105574045B (zh) 一种视频推荐方法和服务器
CN107679249A (zh) 好友推荐方法及设备
CN108683952B (zh) 基于交互视频的视频内容片段推送方法及装置
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
TWI629899B (zh) Method and device for evaluating quality of multimedia resources
US9009298B2 (en) Methods and apparatus to determine audience engagement indices associated with media presentations
CN106454536B (zh) 信息推荐度的确定方法及装置
CN104615741B (zh) 一种基于云计算的冷启动项目推荐的方法及装置
WO2021047119A1 (zh) 一种信息推送方法、系统、电子设备及存储介质
US20230300417A1 (en) Video content recommendation method and apparatus, and computer device
CN111523050B (zh) 内容推荐方法、服务器及存储介质
CN105956061B (zh) 一种用户间相似度确定方法及装置
CN110113673A (zh) 一种弹幕显示方法、装置及电子设备
CN109451334A (zh) 用户画像生成处理方法、装置及电子设备
CN109063137A (zh) 一种推荐对象确定方法、装置、设备及可读存储介质
CN116680480A (zh) 产品推荐方法、装置、电子设备及可读存储介质
Wasilewski et al. Are you reaching your audience? Exploring item exposure over consumer segments in recommender systems
CN105138574A (zh) 用于推荐旅游休闲出行地的基于人机交互的混合推荐系统
CN115705379A (zh) 智能推荐方法及装置、设备、存储介质
Li et al. A combined collaborative filtering model for social influence prediction in event-based social networks
US11727046B2 (en) Media item matching using search query analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221

RJ01 Rejection of invention patent application after publication