CN103116614B - 一种协同过滤推荐方法、装置及系统 - Google Patents

一种协同过滤推荐方法、装置及系统 Download PDF

Info

Publication number
CN103116614B
CN103116614B CN201310030471.2A CN201310030471A CN103116614B CN 103116614 B CN103116614 B CN 103116614B CN 201310030471 A CN201310030471 A CN 201310030471A CN 103116614 B CN103116614 B CN 103116614B
Authority
CN
China
Prior art keywords
user
targeted customer
trajectory
neighbour
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310030471.2A
Other languages
English (en)
Other versions
CN103116614A (zh
Inventor
晋向前
傅一峰
王敏
张磊
杨子斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201310030471.2A priority Critical patent/CN103116614B/zh
Publication of CN103116614A publication Critical patent/CN103116614A/zh
Application granted granted Critical
Publication of CN103116614B publication Critical patent/CN103116614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于用户轨迹的协同过滤推荐方法,用于在用户浏览挑选网页或视频时,为用户提供更有效的推荐,该方法包括:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标;对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;获得并保存用户的浏览记录;根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。本发明还公开了一种基于用户轨迹的协同过滤推荐装置及系统。

Description

一种协同过滤推荐方法、装置及系统
技术领域
本发明涉及网络技术领域,具体涉及一种协同过滤推荐方法、装置及系统。
背景技术
随着互联网技术的不断发展,用户能够获得的信息量不断增加,用户面临着信息过载的问题。例如,当用户以休闲为目的没有明确需求时浏览视频网站或视频客户端时,面对数不胜数的视频文件,用户会面对不知如何进行选择的问题。因此,需要推荐系统帮助用户进行信息过滤。协同过滤推荐是信息过滤和信息系统中的一项重要技术。
在现有技术中,协同过滤推荐算法的步骤包括:记录并统计用户的浏览记录;利用存在相似兴趣的用户群体或与用户兴趣相似的信息做推荐;当用户产生新的浏览行为时,推荐系统对用户没有看过但可能感兴趣的信息队列重新排序,推荐给用户。
但是,协同过滤推荐算法在线运算中往往需要考虑到实际服务器的压力来简化算法。在拥有千万级用户的网站中,如果要维护一个用户相似度矩阵,从存储和计算的角度来说,维护成本很高。因此在实际应用中在线计算通常不会遍历所有的用户或者用户所有的浏览记录,只能截取一小部分用户及一小部分用户的浏览记录,依据几个共同的浏览记录来判断相似兴趣的用户群体,而这些浏览记录的产生很可能是偶然发生而非兴趣类似导致。因此,以此为据进行推荐往往准确率不高,并且很难将推荐理由介绍给被推荐用户。另外,对于新用户来说,由于缺乏该用户的浏览记录,故很难预测其感兴趣的内容,推荐系统会遇到冷启动现象。
发明内容
有鉴于此,本发明的主要目的是提供一种协同过滤推荐方法、装置及系统,以解决现有技术中协同过滤推荐方法推荐准确率不高的问题。
为解决上述问题,本发明提供的技术方案如下:
一种协同过滤推荐方法,所述方法包括:
获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
获得并保存所述用户的浏览记录;
根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
相应的,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
相应的,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:
根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
相应的,所述方法还包括:
当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
相应的,所述方法还包括:
将所述用户化分为若干组;
在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种协同过滤推荐装置,所述装置包括:
第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
第一获得单元,用于获得并保存所述用户的浏览记录;
推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
相应的,所述第三确定单元包括:
第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
相应的,所述推荐单元包括:
计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
相应的,所述装置还包括:
第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
相应的,所述装置还包括:
划分单元,用于将所述用户化分为若干组;
设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
第二获得单元,用于获得不同组的目标用户的推荐结果转化率;
第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种协同过滤推荐系统,所述系统包括:
若干个移动终端以及推荐服务器;
所述推荐服务器是权利要求6-10任一项所述的协同过滤推荐装置;
所述移动终端,用于向所述推荐服务器发送位置信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。
由此可见,本发明具有如下有益效果:
本发明利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
附图说明
图1为本发明协同过滤推荐方法的流程图;
图2为本发明中用户轨迹的示意图;
图3为本发明中近邻用户的示意图;
图4为本发明协同过滤推荐方法的一种实施例流程图;
图5为本发明中用户-物品排列表以及物品-用户排列表的示意图;
图6为本发明中用户相似度矩阵表的示意图;
图7为本发明协同过滤推荐方法的一种具体实施例的流程图;
图8为本发明协同过滤推荐装置的示意图;
图9为本发明协同过滤推荐装置中的第三确定单元的示意图;
图10为本发明协同过滤推荐装置中的推荐单元的示意图;
图11为本发明协同过滤推荐装置的一种具体实施例的示意图;
图12为本发明实现协同过滤推荐系统的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
本发明协同过滤推荐方法,主要是针对现有技术中协同过滤推荐方法推荐准确率低的问题。由于兴趣特征类似的用户在空间上的活动也往往存在区域高度重叠的现象,如:某重点大学的学生人群、某IT公司的职员,这些人群在兴趣上有分别,在活动范围上各自保持一定的区域,区域间的人群很少相互重叠,而同一群体内的人活动范围基本类似。因此,提出引入地理位置服务获取用户位置信息后,通过用户轨迹分析,可以从看似杂乱无章的用户位置集合中确定出用户的主要活动区域,并根据重叠区域找出近邻用户,将其它近邻用户的兴趣爱好联系用户目标,使用户在浏览、挑选网页信息时,例如浏览视频时,给出用户更有效的推荐,使移动在线浏览与传统的PC在线浏览形成差异。
基于上述思想,参见图1所示,本发明协同过滤推荐方法,包括以下步骤:
步骤101:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标。
对同意开启该功能的用户,在用户开启该功能时,为每个用户使用的移动终端分配不同的经过加密的唯一编号,匿名统计该移动终端(即代表该用户)的位置信息。具体的,位置信息可以通过GPS、wifi网络或移动运营商基站获得。将位置地理转换为地理位置坐标,如经纬度坐标。该地理位置坐标与实际地址无关,即采用“双匿名”模式,既可以保护用户的隐私,有可以获得用户的位置信息,完成用户行为分析。
步骤102:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。
用户的地理位置坐标可以形成位置点的集合,对这些位置点进行聚类,形成用户的用户轨迹,即用户主要活动的区域,可以以此来描述该用户的属性,每个用户形成的用户轨迹可以为若干个“点簇”。具体的,可以设置第二阈值,将密度大于第二阈值的位置点集聚类,将密度小于或等于第二阈值的位置点集抛弃,并考虑到点集的连续性,尽量减少形成“点簇”的数量,最后形成用户的轨迹。聚类的同时考虑到最大聚合半径(第一阈值),该参数可以不断进行调整,保证聚类而成的每个“点簇”不会无限制的扩大,从而保证协同的效果。
参见图2所示,对由地理位置坐标确定的位置点进行聚类后确定的用户轨迹,可以抽象为若干个“点簇”,例如,一个用户常见的用户轨迹通常会包括两个“点簇”:“居住地区3公里以内”以及“工作地区3公里以内”,其它零星点由于其位置点集密度不能达到第二阈值,则可以被抛弃。
步骤103:比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户。
具体的,该步骤可以包括:比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
在步骤102中,获得了每个用户的用户轨迹,可以通过判断每个用户的用户轨迹直接的相交情况,确定近邻用户。参见图3所示,例如,一个用户目标A与其他用户B-H在居住地区的用户轨迹如图所示,当目标用户的用户轨迹与其他用户的用户轨迹直接相交面积区域大于第三阈值时,例如,用户A与用户C、D,则用户C、D为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域大于第四阈值时,例如,用户A与用户B、E,则用户B、E为用户A的近邻用户;当目标用户的用户轨迹与其他用户的用户轨迹相切或不相交时,为非近邻用户,例如用户H;当目标用户的用户轨迹与其他用户的用户轨迹间接相交面积区域小于或等于第四阈值时,为非近邻用户,例如用户F、G。这样,可以获得目标用户的所有近邻用户,另外,也可以说这些用户互为近邻用户,例如,用户A、B、C、D、E之间互为近邻用户。
步骤104:获得并保存用户的浏览记录。
用户对网站的操作可定义为用户行为,用户行为可以包括所有能表示用户喜好的与网站系统交互的操作,用户行为在网站中的通常用用户日志的形式保存。具体的,可以通过用户日志获得并保存用户在网站中的浏览记录。
步骤105:根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
协同过滤算法是研究预测用户行为的一类算法,一般是指在个性化推荐系统中,当一个目标用户A需要个性化推荐时,可以先找到和他有相似特征的人群,然后把那些用户喜欢而用户A没有听说过的物品推荐给A,或者根据A以往喜好过的物品,将类似的物品推荐给用户,这种方法称协同过滤算法。
在上述实施例中,步骤101-103可以与步骤104并行执行。
本发明利用目标用户与近邻用户的浏览记录,为目标用户提供推荐结果,将兴趣爱好类似的用户在空间上进行划分,帮助用户发现对自己有价值的信息,为用户提供更好的使用体验。
参见图4所示,在上述实施例中,根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果,具体可以包括:
步骤1051:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。
假设有用户U和用户V,令N(u)为用户U的浏览记录的集合,N(v)为用户V的浏览记录的集合,根据用户矩阵表,用户U和用户V的兴趣相似度WUV为:参见图5所示,可以在近邻用户中获得用户-物品排列表,例如用户A-E,浏览记录I-V,可以将用户-物品排列表转换为物品-用户排列表。参见图6所示,以5个用户为例,根据物品-用户排列表可以得到用户矩阵表,表格中的数值为用户之间的兴趣相似度示例,例如对物品I,用户A、B、E都操作过,因此AB、BA、AE、EA、BE、EB的相似度加1,以此类推,当扫描完全部浏览记录后,即可以得到WUV的分子部分。
本发明的方法在近邻用户中计算兴趣相似度,可以简化用户矩阵,大幅降低服务器的计算压力,同时,降低新用户冷启动现象,提高推荐结果。
步骤1052:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。
步骤1053:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
假设用户U对物品i感兴趣的程度为:其中,S(u,K)表示和用户U兴趣最接近的K个用户,N(i)是对物品i有过行为的用户集合,wuv表示用户U和用户V之间的兴趣相似度,rvi表示用户V对物品i的兴趣。即可通过兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
本发明用户轨迹的协同过滤推荐方法还可以包括:
当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
当地理位置坐标数据不断增加时,用户经常活动区域更加突出,可以调整第一阈值和/或第二阈值的取值范围,即可以调整“点簇”半径,并进一步控制最大近邻数目,使得协同推荐结果更加准确。
另外,本发明用户轨迹的协同过滤推荐方法还可以包括:
将用户化分为若干组;
在为不同组用户中的目标用户分别提供推荐结果的过程中,设置不同的第三阈值、第四阈值和/或第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。
该方法是一种在线算法测评试验方法,当用户访问时,将用户划分为若干个组,将部分用户在使用推荐功能时设置新的参数值,而另一部分用户在使用推荐功能时依然使用原有的参数值,通过对推荐结果转化率的分析,评估新的参数值是否优于旧的参数值,并确定优于现有参数值的方法进行调整。例如,对视频信息对用户进行推荐,推荐结果转化率是指视频播放次数与视频展示次数之间的比值。可以由推荐结果转化率对推荐结果进行评价,不断逼近最优的推荐算法参数取值范围。具体的,第三阈值、第四阈值和/或第五阈值也可以利用机器学习进行调整。
参见图7所示,本发明用户轨迹的协同过滤推荐方法的一种具体实施例,包括以下步骤:
步骤201:获得移动终端的位置信息,根据位置信息确定用户的地理位置坐标。
步骤202:对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域。
步骤203:当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
步骤204:在为不同组用户中的目标用户分别提供推荐结果的过程中,将用户化分为若干组,设置不同的第三阈值、第四阈值和/或第五阈值。
步骤205:比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值和/或间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
步骤206:获得并保存用户的浏览记录。
步骤207:根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度。
步骤208:确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户。
步骤209:根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
步骤210:获得不同组的目标用户的推荐结果转化率。
步骤211:根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值,之后可以返回步骤204,获得最优的第三阈值、第四阈值以及第五阈值取值范围。
这样,利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
相应的,本发明还提供一种协同过滤推荐装置,参见图8所示,该装置包括:
第一确定单元11、第二确定单元12、第三确定单元13、第一获得单元14以及推荐单元15。
其中,第一确定单元11,用于获取移动终端的位置信息,根据位置信息确定用户的地理位置坐标;
第二确定单元12,用于对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;
第三确定单元13,用于比较目标用户与其他用户的用户轨迹,确定目标用户的近邻用户,目标用户为用户中待提供推荐结果的用户;
第一获得单元14,用于获得并保存用户的浏览记录;
推荐单元15,用于根据目标用户与近邻用户的浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
在上述实施例中,参见图9所示,第三确定单元13可以包括:
第一确定子单元131,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为目标用户的近邻用户;
第二确定子单元132,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户。
参见图10所示,推荐单元15可以包括:
计算子单元151,用于根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度;
第三确定子单元152,用于确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户;
推荐子单元153,用于根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
参见图11所示,本发明一种协同过滤推荐装置还可以包括:
第一调整单元16,用于当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
划分单元17,用于将用户化分为若干组。
设置单元18,用于在为不同组用户中的目标用户分别提供推荐结果的过程中,设置不同的第三阈值、第四阈值和/或第五阈值。
第二获得单元19,用于获得不同组的目标用户的推荐结果转化率。
第二调整单元110,用于根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。
相应的,本发明还提供一种协同过滤推荐系统,参见图12所示,该系统包括:
若干个移动终端2以及推荐服务器1。
其中,推荐服务器1可以是上述实施例提供的协同过滤推荐装置;
移动终端2,用于向推荐服务器发送位置信息以及用户的浏览记录并获得推荐服务器为目标用户提供的推荐结果。
该移动终端中可以包括客户端,例如视频客户端,用户使用该移动终端在客户端软件中浏览、选择视频,由该客户端为用户提供推荐结果。
本系统的工作原理是:
在移动终端使用时可以根据用户的移动将位置信息以及用户的浏览记录发送推荐服务器,在推荐服务器形成日志。推荐服务器根据位置信息确定用户的地理位置坐标;对由地理位置坐标确定的位置点进行聚类,确定用户的用户轨迹,用户轨迹为半径小于第一阈值且位置点密度大于第二阈值的区域;当地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围;在为不同组用户中的目标用户分别提供推荐结果的过程中,将用户化分为若干组,设置不同的第三阈值、第四阈值和/或第五阈值;比较目标用户与其他用户的用户轨迹,将用户轨迹与目标用户的用户轨迹直接相交区域面积大于第三阈值和/或间接相交区域面积大于第四阈值的其他用户确定为目标用户的近邻用户;根据目标用户与近邻用户的浏览记录,计算目标用户与每个近邻用户的兴趣相似度;确定近邻用户中与目标用户中兴趣相似度大于第五阈值的用户为目标用户的兴趣相似用户;根据兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果;获得不同组的目标用户的推荐结果转化率;根据不同组的目标用户的推荐结果转化率,调整第三阈值、第四阈值和/或第五阈值。移动终端最终获得推荐服务器为目标用户提供的推荐结果。
这样,本发明利用移动设备对用户的地理位置坐标进行聚类,产生用户轨迹,利用用户轨迹确定近邻用户,可以将兴趣相似的用户在空间上进行划分,进而通过近邻用户及其浏览记录,将用户线上行为和线下行为相结合,利用协同过滤算法获得推荐结果。由于用户的活动范围可以反映该用户的自身属性,同时将全国范围内的用户相似度计算大幅度降低为附近区域高度重叠的用户相似度计算,降低了计算难度,提高了推荐准确率。另外,一个新用户只要产生用户轨迹,就可以在其浏览记录不足够的情况下,利用其近邻用户的浏览记录为该新用户提供推荐结果,避免了推荐系统冷启动的现象。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种协同过滤推荐方法,其特征在于,所述方法包括:
获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户,所述近邻用户为其用户轨迹与所述目标用户的用户轨迹直接或间接相交的用户;
获得并保存所述用户的浏览记录;
根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:
根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述用户划分为若干组;
在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
6.一种协同过滤推荐装置,其特征在于,所述装置包括:
第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户,所述近邻用户为其用户轨迹与所述目标用户的用户轨迹直接或间接相交的用户;
第一获得单元,用于获得并保存所述用户的浏览记录;
推荐单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
7.根据权利要求6所述的装置,其特征在于,所述第三确定单元包括:
第一确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
第二确定子单元,用于比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
8.根据权利要求7所述的装置,其特征在于,所述推荐单元包括:
计算子单元,用于根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
第三确定子单元,用于确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
推荐子单元,用于根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一调整单元,用于当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
划分单元,用于将所述用户划分为若干组;
设置单元,用于在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
第二获得单元,用于获得不同组的目标用户的推荐结果转化率;
第二调整单元,用于根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
11.一种协同过滤推荐系统,其特征在于,所述系统包括:
若干个移动终端以及推荐服务器;
所述推荐服务器是权利要求6-10任一项所述的协同过滤推荐装置;
所述移动终端,用于向所述推荐服务器发送位置信息以及用户的浏览记录并获得所述推荐服务器为目标用户提供的推荐结果。
CN201310030471.2A 2013-01-25 2013-01-25 一种协同过滤推荐方法、装置及系统 Active CN103116614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310030471.2A CN103116614B (zh) 2013-01-25 2013-01-25 一种协同过滤推荐方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310030471.2A CN103116614B (zh) 2013-01-25 2013-01-25 一种协同过滤推荐方法、装置及系统

Publications (2)

Publication Number Publication Date
CN103116614A CN103116614A (zh) 2013-05-22
CN103116614B true CN103116614B (zh) 2016-04-13

Family

ID=48414987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310030471.2A Active CN103116614B (zh) 2013-01-25 2013-01-25 一种协同过滤推荐方法、装置及系统

Country Status (1)

Country Link
CN (1) CN103116614B (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412948B (zh) * 2013-08-27 2017-10-24 北京交通大学 基于聚类的协同过滤的商品推荐方法及系统
CN103824214A (zh) * 2014-03-17 2014-05-28 联想(北京)有限公司 信息处理方法、装置及电子设备
CN103986603A (zh) * 2014-05-23 2014-08-13 上海新炬网络技术有限公司 基于用户群消费体验的sp业务监控方法
CN104572937B (zh) * 2014-12-30 2017-12-22 杭州云象网络技术有限公司 一种基于室内生活圈的线下好友推荐方法
CN104574146A (zh) * 2014-12-31 2015-04-29 浙江大学 一种业务推荐的方法和系统
CN104596507B (zh) * 2015-02-09 2017-10-03 成都小步创想畅联科技有限公司 一种移动终端出行轨迹的确定方法
CN104778231B (zh) * 2015-03-31 2018-09-11 北京奇艺世纪科技有限公司 一种地理区域的特征识别方法和装置
CN104899265B (zh) * 2015-05-21 2018-07-20 广东小天才科技有限公司 信息推荐方法及系统
CN104951963A (zh) * 2015-06-11 2015-09-30 联想(北京)有限公司 一种信息处理方法及电子设备
CN105117424B (zh) * 2015-07-31 2019-08-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法
CN105206041B (zh) * 2015-08-12 2017-05-24 东南大学 一种考虑时序dbscan的智能手机轨迹链簇识别方法
WO2017028096A1 (zh) * 2015-08-16 2017-02-23 常平 根据网站浏览时间推荐附近用户的方法和用户推荐系统
CN108369586A (zh) * 2015-10-20 2018-08-03 阿克森维伯股份公司 用于检测网络中的交互和影响的系统和方法
CN105550950A (zh) * 2015-11-20 2016-05-04 广东工业大学 一种基于位置服务的旅游推荐方法
CN107341162B (zh) * 2016-05-03 2022-11-25 北京搜狗科技发展有限公司 网页处理方法和装置、用于网页处理的装置
CN106776959B (zh) * 2016-12-05 2019-12-17 东北大学 一种基于线上线下双重社交关系的活动推荐系统及方法
CN108241630A (zh) * 2016-12-23 2018-07-03 武汉四维图新科技有限公司 一种行车目的地推荐方法及装置
CN106488405B (zh) * 2016-12-29 2019-07-12 电子科技大学 一种融合个体与近邻移动规律的位置预测方法
CN107172455B (zh) * 2017-07-04 2020-09-04 易视腾科技股份有限公司 视频推荐信息获取方法及系统
CN107689991B (zh) * 2017-08-24 2020-11-20 创新先进技术有限公司 信息推送方法和装置、服务器
CN107506455A (zh) * 2017-08-29 2017-12-22 重庆邮电大学 一种融合用户社交圈相似度的好友推荐方法
CN107798557B (zh) * 2017-09-30 2020-09-25 平安科技(深圳)有限公司 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN108170795B (zh) * 2017-12-28 2022-02-15 百度在线网络技术(北京)有限公司 信息推送方法、装置及设备
CN108415960B (zh) * 2018-02-06 2019-12-03 北京三快在线科技有限公司 一种地理位置服务的实现方法及装置,电子设备
CN108596815A (zh) * 2018-04-08 2018-09-28 深圳市和讯华谷信息技术有限公司 基于移动终端的用户行为相似度识别方法、系统及装置
CN108763314B (zh) 2018-04-26 2021-01-19 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN110928914A (zh) * 2018-08-30 2020-03-27 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
US20220051273A1 (en) * 2018-09-10 2022-02-17 Eureka Analytics Pte Ltd Telecommunications Data Used For Lookalike Analysis
CN109544266A (zh) * 2018-10-19 2019-03-29 中国平安人寿保险股份有限公司 产品数据推送方法、装置及计算机可读存储介质
CN109447762B (zh) * 2018-11-12 2022-06-10 深圳市喂车科技有限公司 商品推荐方法及其装置、服务器、商品推荐系统
CN109461505A (zh) * 2018-11-16 2019-03-12 河南省疾病预防控制中心 一种利用空间信息降低狂犬病防控成本的方法
CN110148032A (zh) * 2019-04-15 2019-08-20 平安普惠企业管理有限公司 基于地理位置的产品推荐方法、装置、存储介质和服务器
CN110287419A (zh) * 2019-06-28 2019-09-27 重庆金窝窝网络科技有限公司 一种商品推荐方法、装置、服务器及存储介质
CN111368211B (zh) * 2020-02-20 2023-05-16 腾讯科技(深圳)有限公司 关系链确定方法、装置及存储介质
CN112948872B (zh) * 2021-02-02 2023-03-24 华南理工大学 一种基于分段聚类的路网轨迹语义隐私保护方法
CN113468419A (zh) * 2021-06-28 2021-10-01 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐系统及方法
CN102436625A (zh) * 2010-11-15 2012-05-02 微软公司 在地图上显示产品推荐
CN102521362A (zh) * 2011-12-15 2012-06-27 北京航空航天大学 Web服务推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666909B2 (en) * 2007-11-02 2014-03-04 Ebay, Inc. Interestingness recommendations in a computing advice facility

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐系统及方法
CN102436625A (zh) * 2010-11-15 2012-05-02 微软公司 在地图上显示产品推荐
CN102521362A (zh) * 2011-12-15 2012-06-27 北京航空航天大学 Web服务推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于基因表达式编程的Web个性化推荐技术研究;蔡宏果;《中国优秀硕士学位论文全文数据库》;20110615(第06期);第1~53页 *

Also Published As

Publication number Publication date
CN103116614A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN103116614B (zh) 一种协同过滤推荐方法、装置及系统
US20220122097A1 (en) Method and system for providing business intelligence based on user behavior
Hu et al. Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction
US10304036B2 (en) Social media profiling for one or more authors using one or more social media platforms
US9485318B1 (en) System and method for identifying influential social media and providing location-based alerts
KR102040784B1 (ko) 위치 센서의 정밀도 향상을 위한 시스템 및 방법
US9858610B2 (en) Product recommendation based on geographic location and user activities
US20110083013A1 (en) Privacy vault for maintaining the privacy of user profiles
US20130166494A1 (en) Hierarchical behavioral profile
US20150081617A1 (en) Out of home media measurement
Liu et al. Invisible hand: A privacy preserving mobile crowd sensing framework based on economic models
KR20150130282A (ko) 실시간 비딩용 지능형 플랫폼
WO2014124310A1 (en) A system for improving shape-based targeting by using interest level data
WO2014022231A1 (en) Location retargeting system for online advertising
Lymberopoulos et al. Location-aware click prediction in mobile local search
US20160037299A1 (en) Media device that uses geolocated hotspots to deliver content data on a hyper-local basis
JP2020521232A (ja) デジタル通信ネットワーク上の複数のデバイスにわたるデジタルタッチポイントを確立するための分散ノードクラスタ
Degeling et al. Tracking and tricking a profiler: Automated measuring and influencing of bluekai's interest profiling
US20100125872A1 (en) System and Method for Actively Programming Aggregated Media On-Demand Networks
WO2007105909A1 (en) Method for targeting web advertisement clickers based on click pattern by using a collaborative filtering system with neural networks and system thereof
CN104200380A (zh) 推广信息的定位方法及装置
Öztoprak Profiling subscribers according to their internet usage characteristics and behaviors
US8745074B1 (en) Method and system for evaluating content via a computer network
Baye et al. Should Mobile Marketers Collect Data Other Than Geo‐Location?
Yu et al. Personalized POI groups recommendation in location-based social networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant