CN107766462A - 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 - Google Patents
基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN107766462A CN107766462A CN201710899405.7A CN201710899405A CN107766462A CN 107766462 A CN107766462 A CN 107766462A CN 201710899405 A CN201710899405 A CN 201710899405A CN 107766462 A CN107766462 A CN 107766462A
- Authority
- CN
- China
- Prior art keywords
- place
- targeted customer
- information
- candidate recommendation
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000010586 diagram Methods 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 16
- 238000002474 experimental method Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,包括以下步骤:获取所有用户及候选推荐地点的历史签到信息,计算目标用户对候选推荐地点的地点偏好度TFIDFu,l;计算相似度Simu,v;获取所有用户的社交网络信息,计算出相似用户的社交信誉度Repu;获取目标用户的位置信息,计算目标用户的地理距离影响因子g(disu,l);基于候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l);计算目标用户的推荐分数Scoreu,l;基于推荐分数Scoreu,l生成推荐信息。本发明公开的技术方案可以根据不同用户的偏好、社交信誉度和地理位置为用户适合准确地推荐兴趣点。
Description
技术领域
本发明涉及一种兴趣点推荐方法,尤其涉及基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法。
背景技术
随着移动互联网的快速发展,基于位置的社交网络(location-based socialnetwork)逐渐兴起,如Foursquare和Brightkite。签到逐渐成为一种新的生活方式,所谓签到是指人们在社交平台分享自己的位置信息,并发表评论的行为。目前,信息爆炸现象使用户在信息海洋中很难找到符合自己需求的东西,推荐系统作为解决信息过载的一种方式有效缓解了这一现象,其中,用户兴趣点推荐是社交网络中较为常见的推荐方式。兴趣点推荐系统通过统计用户的历史签到数据,为用户推荐未去过且可能感兴趣的地点。
目前,在对地点推荐的研究中,主要是根据协同过滤(user based collaborativefiltering,user-CF)算法为用户推荐兴趣点。协同过滤算法的步骤为:根据用户在某一地点的签到频次来形成用户的特征向量,然后使用皮尔逊相关性公式等方式计算不同用户的相似度,找到与待推荐用户相似的用户,最后将相似用户去过而待推荐用户没有去过的地点作为候选地点进行推荐。协同过滤技术因具有简单、易拓展性,在学术界和工业界已被广泛使用,但其中仍然存在一些问题需要改进:
1、现有技术中,仅仅使用0/1或者签到频次方式来表示用户对地点的偏好特征向量。实际上,0/1方式用1表示在某个地点签到过,0则表示没有在该地点签到过,这种方法并不能说明用户对这个地点的偏好程度,而签到频次这种方式说明的是用户在某个地点的签到次数,并不完全等价于用户对该地点的偏好程度。
2、现有技术中,在根据用户偏好特征向量来计算用户间的相似度时,默认用户共同签到过的地点的重要程度是一样的,然而,由于每个用户对不同地点具有不同程度的偏好,这种计算方式会导致计算结果不准确。
3、现有技术中,直接从社交网络中朋友访问过的地点集合中为用户生成推荐候选集列表,由于用户偏好存在差异过大情况,根据Brightkite数据集分析结果得知,社交网络上朋友间共同访问的地点比例很低,说明即使是朋友之间,用户偏好也可能会差别很大。因此直接从朋友处获取推荐列表存在不适用的情况,会导致推荐结果不准确。
发明内容
针对现有技术存在的上述不足,本发明要解决的技术问题是:如何提供一种能够为每个用户准确推荐兴趣点的方法,可以根据不同用户的偏好、社交信誉度和地理位置为每个用户适合准确地推荐兴趣点。
为解决上述技术问题,本发明采用了如下的技术方案:
基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,包括以下步骤:
获取所有用户及候选推荐地点的历史签到信息,基于所述所有用户的历史签到信息采用TF-IDF计算所述目标用户对所述候选推荐地点的地点偏好度TFIDFu,l,所述所有用户包括目标用户及相似用户;
基于所述目标用户的历史签到信息、所述相似用户的历史签到信息及所述地点偏好度TFIDFu,l计算相似度Simu,v;
获取所有用户的社交网络信息,基于所述社交网络信息采用PageRank算法计算出所述相似用户的社交信誉度Repv;
获取所述目标用户的位置信息,基于所述目标用户与所述候选推荐地点之间的距离信息计算所述目标用户的地理距离影响因子g(disu,l);
基于所述候选推荐地点的历史签到信息计算所述候选推荐地点的流行度p(l);
基于公式计算所述目标用户的推荐分数Scoreu,l,Cv,l为所述相似用户在所述候选推荐地点的签到频次;
基于所述推荐分数Scoreu,l生成推荐信息。
优选地,所述获取所有用户及候选推荐地点的历史签到信息,基于所述所有用户的历史签到信息采用TF-IDF计算所述目标用户对候选推荐地点的地点偏好度TFIDFu,l包括:
获取所述所有用户的总人数|U|、所述目标用户在所述候选推荐地点的签到频次Cu,l、所述目标用户的总签到次数totalu、所述候选推荐地点的总签到人数totall;
基于公式计算所述目标用户的地点偏好度TFIDFu,l。
优选地,所述基于所述目标用户的历史签到信息、所述相似用户的历史签到信息及所述地点偏好度TFIDFu,l计算相似度Simu,v包括:
所述所有用户的历史签到信息包括所述目标用户在所述候选推荐地点的签到频次Cu,l;
基于公式计算所述目标用户的相似度Simu,v,L表示所有的候选推荐地点的集合。
优选地,所述获取所有用户的社交网络信息,基于所述社交网络信息采用PageRank算法计算出所述相似用户的社交信誉度Repv包括:
获取社交网络上所有用户的社交网络信息;
基于所有用户的社交网络信息生成每个用户的社交网络图;
基于PageRank算法计算出所述社交网络图中每个用户的PageRank值;
基于公式计算所述相似用户的社交信誉度Repv,PageRankv为所述相似用户的PageRank值,max(PRU)为所述所有用户中最大的PageRank值。
优选地,所述获取所述目标用户的位置信息,基于所述目标用户与候选推荐地点间地理距离信息计算所述地理地理距离影响因子g(disu,l)包括:
基于K-mediods聚类算法确认所述目标用户的位置;
基于所述目标用户的位置计算所述目标用户与所述候选推荐地点的距离disu,l;
基于公式计算所述目标用户的地理地理距离影响因子g(disu,l),a和b为幂率分布参数,e为自然常数。
优选地,所述基于所述候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l)包括:
所述候选推荐地点的签到信息包括所述候选推荐地点的总签到次数totalCKl及所述候选推荐地点的签到总人数totall;
基于公式计算所述目标用户的所述候选推荐地点的流行度p(l),max(totalCKl∈L)为所有所述候选推荐地点中签到次数最多的候选推荐地点的签到次数,max(totall∈L)为所有所述候选推荐地点中签到人数最多的候选推荐地点的签到人数。
优选地,所述基于所述推荐分数Scoreu,l生成推荐信息包括:
按照所述推荐分数Scoreu,l由高到低的顺序选取预设个数的所述候选推荐地点;
按照所述推荐分数Scoreu,l由高到低的顺序基于所述选取的候选推荐地点生成推荐列表。
综上所述,本发明公开了基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,包括以下步骤:获取所有用户及候选推荐地点的历史签到信息,基于所有用户的历史签到信息采用TF-IDF计算目标用户对候选推荐地点的地点偏好度TFIDFu,l,所有用户包括目标用户及相似用户;基于目标用户的历史签到信息、相似用户的历史签到信息及地点偏好度TFIDFu,l计算相似度Simu,v;获取所有用户的社交网络信息,基于社交网络信息采用PageRank算法计算出相似用户的社交信誉度Repv;获取目标用户的位置信息,基于目标用户与候选推荐地点之间的距离信息计算目标用户的地理距离影响因子g(disu,l);基于候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l);
基于公式计算目标用户的推荐分数Scoreu,l,Cv,l为相似用户在候选推荐地点的签到频次;基于推荐分数Scoreu,l生成推荐信息。。本发明公开的技术方案可以根据不同用户的偏好、社交信誉度和地理位置为用户适合准确地推荐兴趣点。
附图说明
为了使发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明公开的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法的流程图;
图2为本发明公开实验1的效果对比图;
图3为本发明公开实验2的效果对比图;
图4为本发明公开实验3的效果对比图;
图5为本发明公开实验4的效果对比图。
具体实施方式
下面结合附图对本发明作进一步的详细说明。
如图1所示,为本发明公开的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法的流程图,包括以下步骤:
S101、获取所有用户及候选推荐地点的历史签到信息,基于所有用户的历史签到信息采用TF-IDF计算目标用户对候选推荐地点的地点偏好度TFIDFu,l,所有用户包括目标用户及相似用户;
S102、基于目标用户的历史签到信息、相似用户的历史签到信息及地点偏好度TFIDFu,l计算相似度Simu,v;
S103、获取所有用户的社交网络信息,基于社交网络信息采用PageRank算法计算出相似用户的社交信誉度Repu;
S104、获取目标用户的位置信息,基于目标用户与候选推荐地点之间的距离信息计算目标用户的地理距离影响因子g(disu,l);
S105、基于候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l);
S106、基于公式计算目标用户的推荐分数Scoreu,l,Cv,l为相似用户在候选推荐地点的签到频次;
S107、基于推荐分数Scoreu,l生成推荐信息。
在实际应用中,用户产生签到行为时,移动设备会通过GPS、蓝牙定位或者蜂窝基站等定位技术获取到用户当前位置。然后包含用户信息、地点信息、签到时间以及评论信息的签到记录将会上传至一个数据库。在使用本方法时,可以先收集大量的用户数据以及地点数据,形成一个数据库,本方法中提到的目标用户、相似用户及候选推荐地点的各种信息均可以从数据库中采集得到。此外,也可以采用其他方式从互联网上直接获取各种信息。需要注意的是,使用本方法,可单独为一个目标用户生成推荐信息,也可同时为多个目标用户生成推荐信息。每一个用户,对自身而言可以作为目标用户,同时也可作为其他用户的相似用户,也可出现在其他用户的社交网络信息中。
本发明利用“集体智慧”思想,考虑签到行为相似的用户具有相似偏好。在传统用户相似度的基础上,首创的使用一种改进的用户偏好表征方法,在计算用户间相似度时,考虑用户对每个地点的偏好不同,赋予用户间共同访问地点不同的权重,从而使用户间相似度的计算更加符合实际意义。同时,考虑到用户在社交网络中的信誉度,信誉度大的用户往往会产生更加可靠的建议,在为用户产生推荐时,其他用户根据信誉度自身来产生不等的贡献度。并且,在实际生活中,人们更加偏向于去比较近的地方,而且大多数人往往对比较流行的地点感兴趣,因此,本发明也考虑影响用户决策过程的地理距离和地点流行度因素。最后,本发明将以上提到几种因素融入user-CF中,为用户产生更加合理的推荐。克服了现有技术中各种推荐方法使用的分析数据较为单一,分析不全面,从而造成的生成的推荐结果不准确的缺点,能够向用户推荐更加符合用户心意的推荐点,提升了用户的体验感。
综上所述,本发明公开了基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,包括以下步骤:获取所有用户及候选推荐地点的历史签到信息,基于所有用户的历史签到信息采用TF-IDF计算目标用户对候选推荐地点的地点偏好度TFIDFu,l,所有用户包括目标用户及相似用户;基于目标用户的历史签到信息、相似用户的历史签到信息及地点偏好度TFIDFu,l计算相似度Simu,v;获取所有用户的社交网络信息,基于社交网络信息采用PageRank算法计算出相似用户的社交信誉度Repv;获取目标用户的位置信息,基于目标用户与候选推荐地点之间的距离信息计算目标用户的地理距离影响因子g(disu,l);基于候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l);
基于公式计算目标用户的推荐分数Scoreu,l,Cv,1为相似用户在候选推荐地点的签到频次;基于推荐分数Scoreu,l生成推荐信息。。本发明公开的技术方案可以根据不同用户的偏好、社交信誉度和地理位置为用户适合准确地推荐兴趣点。
为进一步优化上述技术方案,获取所有用户及候选推荐地点的历史签到信息,基于所有用户的历史签到信息采用TF-IDF计算目标用户对候选推荐地点的地点偏好度TFIDFu,l包括:
获取所有用户的总人数|U|、目标用户在候选推荐地点的签到频次Cu,l、目标用户的总签到次数totalu、候选推荐地点的总签到人数totall;
基于公式计算目标用户的地点偏好度TFIDFu,l。
在计算用户间相似度时,需要考虑用户对每个地点的偏好程度,每个地点根据用户偏好程度其重要性是不同的。那么很重要的工作就是如何有效度量用户对每个地点的偏好程度。TF-IDF是一种用于信息检索、文本处理和数据挖掘等领域的常用技术,用以评估字词对于一份文档的重要程度。字词的重要性随着它在文件中出现的次数成正比,但同时会随着它在语料库中出现的频率成反比下降。这个概念与用户对地点的偏好程度正好符合,因此将TF-IDF技术迁移到表示用户偏好的过程中,与现有技术相比可以更加准确的计算出用户对于地点的偏好程度。使用本方法,可以计算出任一用户对任一已访问地点的地点偏好度。
为进一步优化上述技术方案,基于目标用户的历史签到信息、相似用户的历史签到信息及地点偏好度TFIDFu,l计算相似度Simu,v包括:
所有用户的历史签到信息包括目标用户在候选推荐地点的签到频次Cu,l;
基于公式计算目标用户的相似度Simu,v,L表示所有的候选推荐地点的集合。
在计算出目标用户对每个地点的偏好程度之后,就可以将该信息引入目标用户的相似度计算过程。相似用户可以为所有用户中任意非目标用户的其他用户,相似用户及目标用户的身份并非固定不变的,任一用户既可以作为相似用户,也可以作为目标用户,但是不能同时充当这两种角色。这种方式考虑到每个用户对不同地点的偏好程度不同,更加符合推荐系统个性化的要求,最终得到的推荐结果更加符合目标用户的实际需要。
为进一步优化上述技术方案,获取所有用户的社交网络信息,基于社交网络信息采用PageRank算法计算出相似用户的社交信誉度Repv包括:
获取社交网络上所有用户的社交网络信息;
基于所有用户的社交网络信息生成每个用户的社交网络图;
基于PageRank算法计算出社交网络图中每个用户的PageRank值;
基于公式计算相似用户的社交信誉度Repv,PageRankv为相似用户的PageRank值,max(PRU)为所有用户中最大的PageRank值。
本技术方案先得到所有用户中每个用户的社交网络图,并求出每个用户的PageRank值,最终得到相似用户的社交信誉度Repv,max(PRU)是所有用户中PageRank值最高的用户的PageRank值。
一些观点认为社交朋友之间偏好会很相似,因此直接根据用户朋友访问过的地点为用户生成推荐候选集列表,然而,由Brightkite数据集分析结果得知,社交网络上朋友间共同访问的地点比例很低,说明即使是朋友之间,用户偏好也可能会差别很大。因此直接从朋友处获取推荐列表存在不适用的情况。在实际生活中,人们往往会根据信誉度的不同决定是否考虑他人的建议或推荐。此处,信誉度定义为每个用户在社交网络中的重要程度。PageRank是一种链接分析算法,通过网络浩瀚的超链接关系来确定一个页面的等级。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。鉴于此,本发明首先获取目标用户在社交网络中的朋友间的社交关系形成社交网络图,然后采用PageRank计算出社交网络图中每个人的重要程度,并进行归一化处理,以此表示每个目标用户在社交网络中的信誉度。与直接根据用户朋友访问过的地点为用户生成推荐候选集列表的做法相比,准确度更高。
为进一步优化上述技术方案,获取目标用户的位置信息,基于目标用户与候选推荐地点间地理距离信息计算地理地理距离影响因子g(disu,l)包括:
基于K-mediods聚类算法确认目标用户的位置;
基于目标用户的位置计算目标用户与候选推荐地点的距离disu,l;
基于公式计算目标用户的地理地理距离影响因子g(disu,l),a和b为幂率分布参数,e为自然常数。
本发明将目标用户的签到中心点作为目标用户的位置。这里很重要的工作就是如何寻找用目标户签到中心点。考虑到签到离群点的影响,本发明采用K-mediods聚类方法寻找用目标户签到中心点,然后计算签到中心点与候选推荐地点之间的地理距离。
为进一步优化上述技术方案,基于候选推荐地点的签到信息计算候选推荐地点的流行度p(l)包括:
候选推荐地点的签到信息包括所述候选推荐地点的总签到次数totalCKl及所述候选推荐地点的签到总人数totall;
基于公式计算所述目标用户的所述候选推荐地点的流行度p(l),max(totalCKl∈L)为所有所述候选推荐地点中签到次数最多的候选推荐地点的签到次数,max(totall∈L)为所有所述候选推荐地点中签到人数最多的候选推荐地点的签到人数。
考虑到现实生活中,人们对流行度比较高的地点通常会有比较高的兴趣,因此引入地点流行度计算方法,可进一步提高推荐的准确性。
为进一步优化上述技术方案,基于推荐分数Scoreu,l生成推荐信息包括:
按照推荐分数Scoreu,l由高到低的顺序选取预设个数的候选推荐地点;
按照推荐分数Scoreu,l由高到低的顺序基于选取的候选推荐地点生成推荐列表。
综上所述,本发明从多个角度入手,综合的考虑了各种因素从而向用户推荐兴趣点,比现有技术中单独考虑任意一个因素推荐兴趣点的方法更加准确,用户满意度更高。
在本发明中,U表示所有用户的集合,L表示所有的候选推荐地点的集合。
下面为本发明与现有技术中的方案进行的实验对比:
本发明在Brightkite数据集上进行实验,随机选取70%数据作为训练集剩下30%作为测试集,评价标准为准确度Pre@N和召回率Rec@N,N为推荐列表长度,设计4个实验验证:
实验1、基于TFIDF技术的用户相似度与传统相似度的效果比较:
在user-CF基础上,分别采用TF-IDF的用户偏好表示方法与基于签到频次的用户偏好表示方法计算用户间相似度,然后分别为用户生成推荐,实验结果如图2所示,采用基于TF-IDF的用户偏好表示方法在Pre@N和Rec@N上效果均优于传统基于签到频次的相似度方法,说明本发明提出的TF-IDF方法的确能够有效表示用户偏好,提升推荐效果。
实验2、不同地理距离模型的效果对比
本实验对地理距离与签到概率之间的关系分别采用反比例函数、幂率分布和指数函数建模,然后在user-CF基础上进行实验,实验结果如图3所示,采用反比例函数的模型效果优于其他两种模型,说明反比例模型能够更加准确的表明地理距离与签到概率之间的关系。
实验3、地理信息与社交信誉度效果对比
本实验中,在基于TF-IDF的用户相似度基础上,将分别使用地理距离、流行度和社交信誉度进行对比实验,确定各个因素对推荐结果的影响。本发明所提出的方法表示为TSG,对比方法如下所示:
TD:仅考虑基于TF-IDF的用户相似度与地理距离;
TP:仅考虑基于TF-IDF的用户相似度与流行度;
user-CF:传统的基于用户的协同过滤方法
实验结果如图4所示,相比于user-CF,三种方法均能提升推荐效果,本发明所提出的融合模型效果最好。其中,地理距离因素对推荐结果的影响最大。相比于地理距离和流行度,社交信誉度虽然也能提升推荐效果,但是效果比较有限。
实验4、本发明提出的融合框架模型与其他推荐方法的比较
本实验中,对比推荐方法如下所示:
FCF:此方法仅从用户朋友签到过的地点集合中为用户生成推荐
GM-FCF:此方法在FCF的基础上,考虑地理距离的影响
USG:此方法线性加权融合user-CF、FCF和用户在某个地点签到的概率三种方式产生的推荐结果
User-CF:传统的基于用户的协同过滤方法
实验结果如图5所示,在Pre@N和Rec@N指标上,本发明的融合模型均优于其他目前典型推荐算法,说明本发明提出的融合基于TF-IDF用户偏好、地理信息和社交信誉度三种上下文的模型能够产生较好的推荐效果。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。
Claims (7)
1.基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,包括以下步骤:
获取所有用户及候选推荐地点的历史签到信息,基于所述所有用户的历史签到信息采用TF-IDF计算所述目标用户对所述候选推荐地点的地点偏好度TFIDFu,l,所述所有用户包括目标用户及相似用户;
基于所述目标用户的历史签到信息、所述相似用户的历史签到信息及所述地点偏好度TFIDFu,l计算相似度Simu,v;
获取所有用户的社交网络信息,基于所述社交网络信息采用PageRank算法计算出所述相似用户的社交信誉度Repv;
获取所述目标用户的位置信息,基于所述目标用户与所述候选推荐地点之间的距离信息计算所述目标用户的地理距离影响因子g(disu,l);
基于所述候选推荐地点的历史签到信息计算所述候选推荐地点的流行度p(l);
基于公式计算所述目标用户的推荐分数Scoreu,l,Cv,l为所述相似用户在所述候选推荐地点的签到频次;
基于所述推荐分数Scoreu,l生成推荐信息。
2.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述获取所有用户及候选推荐地点的历史签到信息,基于所述所有用户的历史签到信息采用TF-IDF计算所述目标用户对候选推荐地点的地点偏好度TFIDFu,l包括:
获取所述所有用户的总人数|U|、所述目标用户在所述候选推荐地点的签到频次Cu,l、所述目标用户的总签到次数totalu、所述候选推荐地点的总签到人数totall;
基于公式计算所述目标用户的地点偏好度TFIDFu,l。
3.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述基于所述目标用户的历史签到信息、所述相似用户的历史签到信息及所述地点偏好度TFIDFu,l计算相似度Simu,v包括:
所述所有用户的历史签到信息包括所述目标用户在所述候选推荐地点的签到频次Cu,l;
基于公式计算所述目标用户的相似度Simu,v,L表示所有的候选推荐地点的集合。
4.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述获取所有用户的社交网络信息,基于所述社交网络信息采用PageRank算法计算出所述相似用户的社交信誉度Repv包括:
获取社交网络上所有用户的社交网络信息;
基于所有用户的社交网络信息生成每个用户的社交网络图;
基于PageRank算法计算出所述社交网络图中每个用户的PageRank值;
基于公式计算所述相似用户的社交信誉度Repv,PageRankv为所述相似用户的PageRank值,max(PRU)为所述所有用户中最大的PageRank值。
5.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述获取所述目标用户的位置信息,基于所述目标用户与候选推荐地点间地理距离信息计算所述地理地理距离影响因子g(disu,l)包括:
基于K-mediods聚类算法确认所述目标用户的位置;
基于所述目标用户的位置计算所述目标用户与所述候选推荐地点的距离disu,l;
基于公式或或计算所述目标用户的地理地理距离影响因子g(disu,l),a和b为幂率分布参数,e为自然常数。
6.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述基于所述候选推荐地点的历史签到信息计算候选推荐地点的流行度p(l)包括:
所述候选推荐地点的签到信息包括所述候选推荐地点的总签到次数totalCKl及所述候选推荐地点的签到总人数totall;
基于公式计算所述目标用户的所述候选推荐地点的流行度p(l),max(totalCKl∈L)为所有所述候选推荐地点中签到次数最多的候选推荐地点的签到次数,max(totall∈L)为所有所述候选推荐地点中签到人数最多的候选推荐地点的签到人数。
7.如权利要求1所述的基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法,其特征在于,所述基于所述推荐分数Scoreu,l生成推荐信息包括:
按照所述推荐分数Scoreu,l由高到低的顺序选取预设个数的所述候选推荐地点;
按照所述推荐分数Scoreu,l由高到低的顺序基于所述选取的候选推荐地点生成推荐列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710899405.7A CN107766462B (zh) | 2017-09-28 | 2017-09-28 | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710899405.7A CN107766462B (zh) | 2017-09-28 | 2017-09-28 | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107766462A true CN107766462A (zh) | 2018-03-06 |
CN107766462B CN107766462B (zh) | 2020-03-13 |
Family
ID=61266939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710899405.7A Active CN107766462B (zh) | 2017-09-28 | 2017-09-28 | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107766462B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108694625A (zh) * | 2018-07-02 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 权益偏好预估方法、装置及服务器 |
CN108874877A (zh) * | 2018-05-03 | 2018-11-23 | 浙江大学城市学院 | 一种面向位置社交网络的基于图链接分析的兴趣点推荐方法 |
CN108958247A (zh) * | 2018-07-02 | 2018-12-07 | 深圳市益鑫智能科技有限公司 | 一种引导机器人 |
CN109213926A (zh) * | 2018-07-12 | 2019-01-15 | 南京邮电大学 | 一种基于社区划分和多源信息融合的地点推荐方法 |
CN109727056A (zh) * | 2018-07-06 | 2019-05-07 | 平安科技(深圳)有限公司 | 金融机构推荐方法、设备、存储介质及装置 |
CN110110244A (zh) * | 2019-04-26 | 2019-08-09 | 广东技术师范大学 | 一种融合多源信息的兴趣点推荐方法 |
CN110309274A (zh) * | 2018-03-14 | 2019-10-08 | 北京三快在线科技有限公司 | 引导语推荐方法、装置及电子设备 |
CN110473040A (zh) * | 2018-05-10 | 2019-11-19 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN110489669A (zh) * | 2018-05-11 | 2019-11-22 | 中移(苏州)软件技术有限公司 | 一种信息推送方法及装置 |
CN110781415A (zh) * | 2019-09-16 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种兴趣点推荐方法、装置、设备及介质 |
CN110796509A (zh) * | 2018-08-03 | 2020-02-14 | 阿里巴巴集团控股有限公司 | 商品推荐方法及装置 |
CN111026957A (zh) * | 2019-11-21 | 2020-04-17 | 北京网聘咨询有限公司 | 基于多维相似度的推荐系统及其方法 |
CN111310060A (zh) * | 2020-05-13 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、电子设备及计算机可读存储介质 |
CN111538904A (zh) * | 2020-04-27 | 2020-08-14 | 北京百度网讯科技有限公司 | 用于推荐兴趣点的方法和装置 |
CN111813084A (zh) * | 2020-07-10 | 2020-10-23 | 重庆大学 | 一种基于深度学习的机械装备故障诊断方法 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112800347A (zh) * | 2021-01-21 | 2021-05-14 | 河北金融学院 | 一种基于智媒体服务平台的智能推荐系统及方法 |
CN112967101A (zh) * | 2021-04-07 | 2021-06-15 | 重庆大学 | 一种基于社交用户多交互信息的协同过滤物品推荐方法 |
CN113158078A (zh) * | 2021-04-19 | 2021-07-23 | 辽宁工程技术大学 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
CN113268669A (zh) * | 2021-06-01 | 2021-08-17 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN114640476A (zh) * | 2022-05-20 | 2022-06-17 | 中国科学院合肥物质科学研究院 | 去中心化身份证书发证方信誉评价方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100153292A1 (en) * | 2008-12-11 | 2010-06-17 | Microsoft Corporation | Making Friend and Location Recommendations Based on Location Similarities |
US20100185579A1 (en) * | 2009-01-22 | 2010-07-22 | Kwang Seok Hong | User-based collaborative filtering recommendation system and method for amending similarity using information entropy |
CN106339483A (zh) * | 2016-08-30 | 2017-01-18 | 电子科技大学 | 一种移动社交网络中的社交活动推荐算法 |
CN106776928A (zh) * | 2016-12-01 | 2017-05-31 | 重庆大学 | 基于内存计算框架、融合社交环境及时空数据的位置推荐方法 |
CN106971345A (zh) * | 2016-01-08 | 2017-07-21 | 车海莺 | 一种基于位置社交网络的地点推荐方法 |
-
2017
- 2017-09-28 CN CN201710899405.7A patent/CN107766462B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100153292A1 (en) * | 2008-12-11 | 2010-06-17 | Microsoft Corporation | Making Friend and Location Recommendations Based on Location Similarities |
US20100185579A1 (en) * | 2009-01-22 | 2010-07-22 | Kwang Seok Hong | User-based collaborative filtering recommendation system and method for amending similarity using information entropy |
CN106971345A (zh) * | 2016-01-08 | 2017-07-21 | 车海莺 | 一种基于位置社交网络的地点推荐方法 |
CN106339483A (zh) * | 2016-08-30 | 2017-01-18 | 电子科技大学 | 一种移动社交网络中的社交活动推荐算法 |
CN106776928A (zh) * | 2016-12-01 | 2017-05-31 | 重庆大学 | 基于内存计算框架、融合社交环境及时空数据的位置推荐方法 |
Non-Patent Citations (2)
Title |
---|
刘传振: "社会网络服务中好友推荐算法研究", 《科技传播》 * |
王珊珊等: "面向移动社会网络的好友推荐方法", 《计算机应用》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309274A (zh) * | 2018-03-14 | 2019-10-08 | 北京三快在线科技有限公司 | 引导语推荐方法、装置及电子设备 |
CN110309274B (zh) * | 2018-03-14 | 2021-09-07 | 北京三快在线科技有限公司 | 引导语推荐方法、装置及电子设备 |
CN108874877A (zh) * | 2018-05-03 | 2018-11-23 | 浙江大学城市学院 | 一种面向位置社交网络的基于图链接分析的兴趣点推荐方法 |
CN108874877B (zh) * | 2018-05-03 | 2022-03-18 | 浙江大学城市学院 | 一种面向位置社交网络的基于图链接分析的兴趣点推荐方法 |
CN110473040B (zh) * | 2018-05-10 | 2021-11-19 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN110473040A (zh) * | 2018-05-10 | 2019-11-19 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN110489669B (zh) * | 2018-05-11 | 2021-11-30 | 中移(苏州)软件技术有限公司 | 一种信息推送方法及装置 |
CN110489669A (zh) * | 2018-05-11 | 2019-11-22 | 中移(苏州)软件技术有限公司 | 一种信息推送方法及装置 |
CN108958247A (zh) * | 2018-07-02 | 2018-12-07 | 深圳市益鑫智能科技有限公司 | 一种引导机器人 |
CN108694625A (zh) * | 2018-07-02 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 权益偏好预估方法、装置及服务器 |
CN109727056A (zh) * | 2018-07-06 | 2019-05-07 | 平安科技(深圳)有限公司 | 金融机构推荐方法、设备、存储介质及装置 |
CN109727056B (zh) * | 2018-07-06 | 2023-04-18 | 平安科技(深圳)有限公司 | 金融机构推荐方法、设备、存储介质及装置 |
CN109213926A (zh) * | 2018-07-12 | 2019-01-15 | 南京邮电大学 | 一种基于社区划分和多源信息融合的地点推荐方法 |
CN110796509A (zh) * | 2018-08-03 | 2020-02-14 | 阿里巴巴集团控股有限公司 | 商品推荐方法及装置 |
CN110796509B (zh) * | 2018-08-03 | 2024-03-22 | 阿里巴巴集团控股有限公司 | 商品推荐方法及装置 |
CN110110244A (zh) * | 2019-04-26 | 2019-08-09 | 广东技术师范大学 | 一种融合多源信息的兴趣点推荐方法 |
CN110781415A (zh) * | 2019-09-16 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种兴趣点推荐方法、装置、设备及介质 |
CN111026957B (zh) * | 2019-11-21 | 2023-05-05 | 北京网聘咨询有限公司 | 基于多维相似度的推荐系统及其方法 |
CN111026957A (zh) * | 2019-11-21 | 2020-04-17 | 北京网聘咨询有限公司 | 基于多维相似度的推荐系统及其方法 |
CN111538904A (zh) * | 2020-04-27 | 2020-08-14 | 北京百度网讯科技有限公司 | 用于推荐兴趣点的方法和装置 |
CN111538904B (zh) * | 2020-04-27 | 2023-03-17 | 北京百度网讯科技有限公司 | 用于推荐兴趣点的方法和装置 |
CN111310060A (zh) * | 2020-05-13 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、电子设备及计算机可读存储介质 |
CN111813084A (zh) * | 2020-07-10 | 2020-10-23 | 重庆大学 | 一种基于深度学习的机械装备故障诊断方法 |
CN112508725B (zh) * | 2020-12-04 | 2023-02-17 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112508725A (zh) * | 2020-12-04 | 2021-03-16 | 首都师范大学 | 一种基于社区结构的位置感知影响力最大化方法 |
CN112800347A (zh) * | 2021-01-21 | 2021-05-14 | 河北金融学院 | 一种基于智媒体服务平台的智能推荐系统及方法 |
CN112967101A (zh) * | 2021-04-07 | 2021-06-15 | 重庆大学 | 一种基于社交用户多交互信息的协同过滤物品推荐方法 |
CN113158078A (zh) * | 2021-04-19 | 2021-07-23 | 辽宁工程技术大学 | 一种结合地点类别和社交网络的兴趣点推荐方法 |
CN113268669B (zh) * | 2021-06-01 | 2022-09-23 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN113268669A (zh) * | 2021-06-01 | 2021-08-17 | 重庆大学 | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 |
CN114640476B (zh) * | 2022-05-20 | 2022-08-30 | 中国科学院合肥物质科学研究院 | 去中心化身份证书发证方信誉评价方法、系统及介质 |
CN114640476A (zh) * | 2022-05-20 | 2022-06-17 | 中国科学院合肥物质科学研究院 | 去中心化身份证书发证方信誉评价方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107766462B (zh) | 2020-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766462A (zh) | 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法 | |
CN106303955B (zh) | 用于对无线热点和poi进行匹配的方法和装置 | |
Liu et al. | Point-of-interest recommendation in location based social networks with topic and location awareness | |
CN104935963B (zh) | 一种基于时序数据挖掘的视频推荐方法 | |
CN107424043A (zh) | 一种产品推荐方法及装置,电子设备 | |
WO2019233258A1 (zh) | 信息发送方法、装置、系统和计算机可读存储介质 | |
Ying et al. | Urban point-of-interest recommendation by mining user check-in behaviors | |
CN106919641A (zh) | 一种兴趣点搜索方法及装置、电子设备 | |
CN103514255B (zh) | 一种基于项目层次类别的协同过滤推荐方法 | |
KR102340463B1 (ko) | 샘플 가중치 설정방법 및 장치, 전자 기기 | |
CN103916436B (zh) | 信息推送方法、装置、终端及服务器 | |
US11490220B2 (en) | System and method for accurately and efficiently generating ambient point-of-interest recommendations | |
CN105373597A (zh) | 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法 | |
CN108550068A (zh) | 一种基于用户行为分析的个性化商品推荐方法及系统 | |
CN109145245A (zh) | 预测点击率的方法、装置、计算机设备及存储介质 | |
Lu et al. | Personalized location recommendation by aggregating multiple recommenders in diversity | |
CN104239496B (zh) | 一种结合模糊权重相似性度量和聚类协同过滤的方法 | |
CN104899246A (zh) | 基于模糊机制用户评分邻域信息的协同过滤推荐方法 | |
CN104166732B (zh) | 一种基于全局评分信息的项目协同过滤推荐方法 | |
TWI677838B (zh) | 點擊率預估模型建立方法、裝置及資訊提供方法、系統 | |
CN106610970A (zh) | 基于协同过滤的内容推荐系统与方法 | |
Ying et al. | Semantic trajectory-based high utility item recommendation system | |
CN107203530A (zh) | 信息推荐方法 | |
CN105095476A (zh) | 基于Jaccard均衡距离的协同过滤推荐方法 | |
Zhou et al. | Relevance feature mapping for content-based multimedia information retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240104 Address after: Room 201, Building C, No. 16 Huifeng East Second Road, Zhongkai High tech Zone, Huizhou City, Guangdong Province, 516000 Patentee after: Guangdong Bo Rui Digital Space Technology Co.,Ltd. Address before: 400044 No. 174 Sha Jie street, Shapingba District, Chongqing Patentee before: Chongqing University |