CN110543601B - 一种基于中智集的上下文感知兴趣点推荐方法及系统 - Google Patents

一种基于中智集的上下文感知兴趣点推荐方法及系统 Download PDF

Info

Publication number
CN110543601B
CN110543601B CN201910575834.8A CN201910575834A CN110543601B CN 110543601 B CN110543601 B CN 110543601B CN 201910575834 A CN201910575834 A CN 201910575834A CN 110543601 B CN110543601 B CN 110543601B
Authority
CN
China
Prior art keywords
information
group
user
noose
interest points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910575834.8A
Other languages
English (en)
Other versions
CN110543601A (zh
Inventor
郑美光
李祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201910575834.8A priority Critical patent/CN110543601B/zh
Publication of CN110543601A publication Critical patent/CN110543601A/zh
Application granted granted Critical
Publication of CN110543601B publication Critical patent/CN110543601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及社交媒体分析领域,公开了一种基于中智集的上下文感知兴趣点推荐方法及系统,以充分挖掘用户签到信息中既模糊又随机的信息发现用户偏好的兴趣点;本发明方法包括获取社交网络中待分析候选兴趣点的相关信息,根据相关信息将待分析候选兴趣点分为单维属性信息组和多维属性信息组;对单维属性信息组中的信息采用基于相似度的中智集转化得到第一中智集组,对多维属性信息组中的信息采用基于情感识别度的中智集转化得到第二中智集组;根据第一中智集组和第二中智集组得到中智集矩阵;优化中智集矩阵得到按照优先级排序的候选兴趣点,将所有兴趣点按照优先级的先后顺序推荐给用户。

Description

一种基于中智集的上下文感知兴趣点推荐方法及系统
技术领域
本发明涉及社交媒体分析领域,尤其涉及一种基于中智集的上下文感知兴趣点推荐方法及系统。
背景技术
随着基于位置的社交网络(Location-Based Social Network,LBSN)的发展和普及,越来越多的用户以签到记录的形式发布他们签到的兴趣点(Point-of-Interest,POI)的实际位置、访问次数、评价等。典型的是基于位置的社交网站,如Foursquare、Yelp、Gowalla、以及大众点评等,人们利用LBSN可以发现自己感兴趣的POI,对当前访问的POI签到,并与好友分享自己的签到信息和体验。用户面对LBSN中的大量信息时,推荐系统应利用POI与用户签到数据中包含大量有价值的信息,帮助用户发现潜在感兴趣的POI,从而做出满意的决策。与LBSN中的大量POI相对,用户可访问的POI仅占非常小的比例,用户的签到数据是高稀疏的,POI推荐面临数据稀疏性问题。
个性化POI推荐仍然存在诸多难点问题,集中体现在以下几个方面:(1)POI推荐的数据稀疏性使得推荐需要融合多种上下文信息,用户做出POI选择决策应是多维属性共同影响的结果。然而,当前的POI推荐研究中大多数模型所考虑影响用户选择的属性不够全面。(2)由于各种属性数据的异构性,难以设计一个多维属性的统一框架。(3)用户的签到行为背后是一个复杂的决策过程,受到许多上下文信息的影响,不同属性的影响程度也各不相同,需要合理建模这些上下文信息对用户决策的影响以及将它们有效地结合。
因此,如何针对用户单个属性偏好程度难以衡量的问题,建立不同属性的中智集转化模型,并基于充分挖掘用户签到信息中既模糊又随机的信息发现用户偏好的兴趣点成为一个急需解决的问题。
发明内容
本发明目的在于提供一种基于中智集的上下文感知兴趣点推荐方法及系统,以针对用户单个属性偏好程度难以衡量的问题,建立不同属性的中智集转化模型,并基于充分挖掘用户签到信息中既模糊又随机的信息发现用户偏好的兴趣点。
为实现上述目的,本发明提供了一种基于中智集的上下文感知兴趣点推荐方法,包括以下步骤:
S1:获取社交网络中待分析候选兴趣点的相关信息,根据所述相关信息将所述待分析候选兴趣点分为单维属性信息组和多维属性信息组;
S2:对所述单维属性信息组中的信息采用基于相似度的中智集转化得到第一中智集组,对所述多维属性信息组中的信息采用基于情感识别度的中智集转化得到第二中智集组;根据所述第一中智集组和所述第二中智集组得到中智集矩阵;
S3:优化所述中智集矩阵得到按照优先级排序的候选兴趣点,将所有兴趣点按照优先级的先后顺序推荐给用户。
优选地,所述S1中,所述相关信息包括至少四种,分别为地理数据信息、文本数据信息、评论数据信息、以及社交数据信息。
优选地,单维属性信息组由所述地理数据信息和所述文本数据信息组成;多维属性信息组由所述评论数据信息和所述社交数据信息组成。
优选地,所述S2中,所述相似度通过核函数计算得到,其中,相似度的计算公式为:
Figure GDA0002250419080000021
式中,d(j,g)为兴趣点lj和lg之间的距离,b为核函数的宽度参数,I为指示函数。
优选地,所述情感识别度通过vader方法计算得到。
优选地,所述S1完成之后,还包括以下步骤:
对所述单维属性信息组和所述多维属性信息组进行数据清洗。
优选地,所述S3中,采用离差最大法优化所述中智集矩阵。
作为一个总的技术方案,本发明还提供一种基于中智集的上下文感知兴趣点推荐系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
本发明具有以下有益效果:
本发明提供一种基于中智集的上下文感知兴趣点推荐方法及系统,全面考虑了社交网络中的兴趣点的地理位置、兴趣主题、社会关系、以及流行度属性信息,将兴趣点推荐问题转化成一个多维属性决策问题,充分挖掘了用户签到信息中即模糊又随机的信息,采用基于相似度和基于情感识别度的中智集转化方法,是多种不同结构的属性数据可以通过聚合算子有效融合,能快速且有效地得到按照优先级排序的候选兴趣点。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的基于中智集的上下文感知兴趣点推荐方法流程图;
图2是本发明优选实施例的基于中智集的上下文感知兴趣点推荐方法的模型框架图;
图3是本发明优选实施例的推荐列表长度不同时,本发明方法与其他方法的NDCG值变化对比图;
图4是本发明优选实施例的推荐列表长度不同时,本发明方法与基线方法的NDCG值变化对比图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
除非另有定义,下文中所使用的所有专业术语与本领域技术人员通常理解的含义相同。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而仅仅是为了便于对相应零部件进行区别。同样,“一个”或者“一”等类似词语不表示数量限制,而是表示存在至少一个。
需要说明的是,本发明中采用的中智集(neutrosophic set,NS)是对传统模糊集的扩展,采用隶属度、非隶属度和不确定度三个度量来表征模糊决策信息,可以细腻准确地描述客观事物的模糊本质。应当指明的是,本发明中,设X为对象集,x为其中任意1个元素(每个元素即为一个待候选的兴趣点),X上的一个单值中智集(single-valuedneutrosophic set,SVNS)可以由真实程度函数TA(x),不确定程度函数IA(x)及谬误程度函数FA(x)表示,其中TA(x),IA(x),FA(x)∈[0,1],且0≤TA(x)+IA(x)+FA(x)≤3。
一个SVNS表示为A={TA(x),IA(x),FA(x)|x∈X}。为简便起见,SVNS中的一个值可以表示为a={T,I,F},a称为单值中智数(single-valued neutrosophic number,SVNN)。
设a1={T1,I1,F1}和a2={T2,I2,F2}是2个单值中智数,则中智数的运算规则如下:
(1)λa1=<1-(1-T1)λ,(I1)λ,(F1)λ>;λ>0。
(2)
Figure GDA0002250419080000031
λ>0。
(3)
Figure GDA0002250419080000032
(4)
Figure GDA0002250419080000033
(5)a1的补集
Figure GDA0002250419080000034
设a1={T1,I1,F1}和a2={T2,I2,F2}是2个单值中智数,则a1和a2之间的欧式距离为:
Figure GDA0002250419080000035
设Ai=<Ti,Ii,Fi>(i=1,2,…,n)是一组单值中智数,则单值中智加权平均集结(SVNSWA)算子为:
Figure GDA0002250419080000041
ω=(ω12,…,ωn)是Ai的权重,并且
Figure GDA0002250419080000042
设Ai=<Ti,Ii,Fi>(i=1,2,…,n)是一组单值中智数,则由SVNSWA算子得到的聚合值也是单值中智数,其中:
Figure GDA0002250419080000043
其中:ω=(ω12,…,ωn)是Ai的权重,并且
Figure GDA0002250419080000044
实施例1
如图1所示,本实施例提供一种基于中智集的上下文感知兴趣点推荐方法,包括以下步骤:
S1:获取社交网络中待分析候选兴趣点的相关信息,根据相关信息将待分析候选兴趣点分为单维属性信息组和多维属性信息组;
S2:对单维属性信息组中的信息采用基于相似度的中智集转化得到第一中智集组,对多维属性信息组中的信息采用基于情感识别度的中智集转化得到第二中智集组;根据第一中智集组和第二中智集组得到中智集矩阵;
S3:优化中智集矩阵得到按照优先级排序的候选兴趣点,将所有兴趣点按照优先级的先后顺序推荐给用户。
上述的基于中智集的上下文感知兴趣点推荐方法,全面考虑了社交网络中的兴趣点的地理位置、兴趣主题、社会关系、以及流行度属性信息,将兴趣点推荐问题转化成一个多维属性决策问题,充分挖掘了用户签到信息中即模糊又随机的信息,采用基于相似度和基于情感识别度的中智集转化方法,是多种不同结构的属性数据可以通过聚合算子有效融合,能快速且有效地得到按照优先级排序的候选兴趣点。
作为本实施例优选的实施方式,S1中,相关信息包括至少四种,分别为地理数据信息、文本数据信息、评论数据信息、以及社交数据信息。如图2所示。
本实施例中,单维属性信息组由地理数据信息和文本数据信息组成;多维属性信息组由评论数据信息和社交数据信息组成。需要说明的是,本实施例中,单维属性定位为可通过单个属性对该信息进行确定,多维属性定位为需要通过至少两个属性对该信息进行确定,例如,地理位置可以仅仅通过具体的位置值进行确定;兴趣主题可以通过两个以上的描述语进行确定。
具体地,通过计算候选POI与用户已访问的POI单维属性的相似度,可以较好地度量用户在单一属性方面的偏好程度。本实施例涉及地理位置和兴趣主题两类单维属性。首先需要进行单维属性的相似度计算。
对于地理位置,访问频繁的地理位置更符合移动用户的地理位置偏好,因此,可以根据移动用户已访问的POI和未访问的POI之间的地理关联关系,来确定候选POI的地理位置相似度。本实施例采用Triangular核函数计算POI之间的地理位置相似度。相比于传统的相似度计算方法,例如cosine相似度,核函数具有无参估计、能更好地模拟POI之间的距离分布等优点,而相比于其他核函数,例如Gaussian核函数,Triangular核函数具有和其他核函数相似的拟合效果的同时,能够过滤掉那些相关程度较低的POI。任意两个POI lj和lg之间的相似度KEb(j,g)计算如下:
Figure GDA0002250419080000051
式中,d(j,g)为利用POI的经纬度信息,通过球面半正矢公式计算的POIlj和lg之间的距离,b是核函数的宽度参数,I是指示函数。当POI之间的距离超过b时,相似度KEb(j,g)的值为0;当POI之间的距离小于b时,POI之间的距离越近相似度KEb(j,g)的值越大。
对于兴趣主题,用户喜欢的兴趣主题类别并不唯一,某个POI包含的主题也不是唯一的。用户可能对某个POI的一部分主题感兴趣,另一部分不感兴趣,还有一部分处于模糊状态。因此,可以计算用户喜欢的兴趣主题和候选POI包含的兴趣主题之间的相似度。本实施例采用主题模型挖掘文本信息中的主题信息。首先,聚集有关同一POI的所有评论和介绍文本为POI文档
Figure GDA0002250419080000052
同样聚集所有同一用户的文本评论到一个用户文档
Figure GDA0002250419080000053
由此,得到一个大的文档集合,每个文档对应一个POI或一个用户。获取每个文档的主题分布后,要确定用户感兴趣的主题和某个POI的主题的相似程度,比较用户文档和某个POI文档的主题分布是否相同,即n个主题分布值是否相等,可得到用户和POI的n个主题分布的相似度。
在使用主题模型对
Figure GDA0002250419080000054
Figure GDA0002250419080000055
进行处理之前先进行相关的数据清洗,然后将处理过的文档内容输入主题模型,釆用Gibbs抽样算法近似估算进行迭代后,得出用户ui的主题分布
Figure GDA0002250419080000056
Figure GDA0002250419080000057
和POIlj的主题分布
Figure GDA0002250419080000058
每个主题分布值表达该主题在文档所有主题中所占的百分比。对于每个文档,存在n个主题分布值之和等于1的约束关系。
则所有主题分布差值集合为:
Figure GDA0002250419080000059
这里
Figure GDA00022504190800000510
对Dij按下式进行标准化处理:
Figure GDA00022504190800000511
对于相似度集合
Figure GDA0002250419080000061
第k个元素
Figure GDA0002250419080000062
表示用户和POI第K个主题的相似度。
得到单维属性相似度后,可根据相似度大小得到相似集、差异集和不确定集。目的是将单维属性的偏好部分、非偏好部分和不确定部分与SVNS中的隶属度、非隶属度和不确定度三个概念相对应,得出单维属性的SVNS。釆用广泛使用的黄金分割作为三个集合间的两个阈值,即当相似度的值位于[0,0.382],(0.382,0.618)和[0.618,1]时,分别认为POIlj和lg在某个属性上的相似程度分别为较低、不确定和较高的状态。
对于候选POIlj用户已访问过的POIlg∈L,L为用户访问过的POI集合,相似集为
Figure GDA0002250419080000063
Figure GDA0002250419080000064
相应的,其相似度为:
Figure GDA0002250419080000065
不确定集为
Figure GDA0002250419080000066
则不确定度为:
Figure GDA0002250419080000067
差异集为
Figure GDA0002250419080000068
则差异度为:
Figure GDA0002250419080000069
上述相似度、不确定度和差异度三个数值对应着中智数的隶属度、非隶属度和不确定度,通过以上公式最终得出某个用户关于POIlj的地理位置中智数Aj1=<Tj1,Ij1,Fj1>和兴趣主题中智数Aj2=<Tj2,Ij2,Fj2>。
不同于上述的单维属性,包括流行度、社交关系在内的多维属性数据往往源于多用户的多元关系网络,在此多元关系中所体现出的情感信息有助于多维属性的偏好分析。
对于流行度,POI的流行度取决于大众对这个POI的口碑,口碑可通过用户评价来体现。对于社交关系,分析朋友对POI的评价,考虑朋友之间好评和差评对用户影响截然不同的特点。这两类多维属性都需要对用户评论数据进行分析。需要说明的是,用户评论往往蕴含着用户对POI的偏好,首先识别评论中的积极、消极和不确定的情感倾向程度与SVNS中的隶属度、非隶属度和不确定度三个概念相对应,得出每条评论对应的SVNN。
通常评论比较简短且蕴含的情感较为强烈和鲜明,适合使用基于情感词典的方法进行分析。首先进行文本处理抽取情感词(包括形容词,名词,副词等),根据词语间的关系和情感词的情感极性和强度来量化评论的情感色彩,计算该评论的情感倾向,最终分析效果很大程度取决于情感词库的有效性。
作为本实施例优选的实施方式,本实施例中使用vader方法,该方法基于词库和语法规则来进行文本情感识别的方法,可以有效识别句子的情感倾向,区别与其他已提出的情感词典,vader的词典还考虑了常用颜文字和缩写词的情感。本实施例中的Vader词典与现有技术中其他七个已经被广泛使用的词典相比,在社交媒体领域表现得最好,并且具有良好的通用性。具体详见如下实验验证。
通过识别每一篇评论
Figure GDA0002250419080000071
中关于POI的积极、中性或负面情绪倾向,可以得到表示句子的情感取向的基本向量
Figure GDA0002250419080000072
其中
Figure GDA0002250419080000073
分别表示积极、中性和消极情绪导向的指标变量。则每条评论对应的SVNNs为
Figure GDA0002250419080000074
其中,
Figure GDA0002250419080000075
得到评论对应的SVNN后,根据多维属性的不同特性给每类SVNN分别赋予不同的权重。因此,多维属性的中智集转化的核心问题是对各类中智数进行权重计算。例如,流行度中智数需要考虑评论发表时间的不同计算权重;社交关系中智数,则需要通过用户和朋友的熟悉程度和行为相似度的不同计算权重。
本实施例中,流行度权重计算方法如下:
由于评论发表的时间会对它的可参考性产生影响,所以要依据评论发出时间的不同给每个评论赋予权重
Figure GDA0002250419080000076
表示评论
Figure GDA0002250419080000077
的重要程度,计算公式为:
Figure GDA0002250419080000078
式中,
Figure GDA0002250419080000079
表示评论
Figure GDA00022504190800000710
发出的时间,Rj表示POIlj出现的时间,Rc表示现在的时间,其中,h=1,2,…,qj
本实施例中,社交关系权重计算方法如下:
通常用户间的社交影响程度可以通过他们是不是好友来决定,但是,在实际的推荐过程中,社交网络上的用户并非与其所有好友的签到行为具有相似性,并不是所有的好友都起正面的作用,有些用户尽管是社交好友,但是他们之间的兴趣相差极大。例如,用户可能会在社交网络中与长辈互相关注,但他们的偏好相差极大,就像现实生活中一样,好友可能有很多,但兴趣品味相一致的只有少数几个,所以对于不同的好友,其签到评价信息对用户的影响应该赋予不同的权重。
构建权重时,一方面,考虑好友之间的行为相似度
Figure GDA00022504190800000711
另一方面,应当明确的是,好友之间的推荐也不是同等重要的,一个点头之交建议的可信度与关系密切的好友的建议的可信度显然不一样,所以也需要好友之间的熟悉程度
Figure GDA0002250419080000081
朋友uf对用户ui的影响因子
Figure GDA0002250419080000082
由相似程度和熟悉程度两部分组成,计算公式为:
Figure GDA0002250419080000083
式中,
Figure GDA0002250419080000084
有多种度量方法,如Cosine、Jaccard相似度以及皮尔逊相似度,本实施例中采用Cosin度量相似度。采用该方法计算相似度可以快速方便地得到计算结果,且计算结果准确。
其中,
Figure GDA0002250419080000085
tib表示用户ui在POIlg的访问状态,若tib=1代表用户已在此处签到,tib=0则代表用户未在此处签到。好友间的熟悉程度
Figure GDA0002250419080000086
由于是用户集合之间的计算,本实施例中采用Jaccard相似度计算好友的熟悉程度,用户间共同好友数量越多,说明两者之间的关系越密切。
最后,使用SVNSWA聚合算子进行聚合即可得到候选POI多维属性对应的中智数,即最终可得到用户ui关于POIlj的流行度中智数,计算公式为:
Figure GDA0002250419080000087
社交关系中智数地计算公式为:
Figure GDA0002250419080000088
需要说明的是,每个属性对用户选择POI的影响程度是不同的,应根据每个属性对用户选择的贡献程度赋予不同的权重。由于许多实际的MCDM问题都是复杂、不确定的,关于属性权重的信息往往不完整。本实施例采用离差最大法建立优化模型,利用中智集矩阵的信息,推算出单值中智集环境下各属性的最优权重,客观地赋以各属性权重系数。
需要说明的是,每一个属性都反映了候选POI的某个特征,而每一个中智数都是候选POI某个属性符合用户偏好程度的量化表示,如果某个属性对所有候选POI而言均无差别,则此属性对POI的排序将不起作用,这样的属性可令其权系数为0;反之,如果此属性使所有候选POI的属性值有较大差异,这样的属性对POI的排序将起较大作用,此时应该给其赋予较大的权系数。
D(ω)计算为四类属性下所有候选POI之间的加权总离差,表示如下:
Figure GDA0002250419080000089
Figure GDA0002250419080000091
其中,属性的权向量为ω=(ω12,…,ωz),Ajz和Asz都表示单值中智集,d(Ajz,Asz)表示两个单值中智集之间的欧氏距离,Djz表示对于属性cz,候选POIlj和所有其他备选POI的偏差,Dz表示对于属性cz,所有候选POI两两之间总的偏差值,D(ω)表示所有属性下所有候选POI之间的加权总离差,根据上述分析,加权向量ω的选择,应使所有属性下所有POI之间的总离差最大,为此,本实施例构造非线性规划模型,使得求解权向量ω等价于求解如下的最优化模型:
Figure GDA0002250419080000092
Figure GDA0002250419080000093
通过构造拉格朗日函数,求偏导得到目标函数的最优解为:
Figure GDA0002250419080000094
再对求得的最优解
Figure GDA0002250419080000095
进行归一化处理,采用公式为:
Figure GDA0002250419080000096
根据上述公式可知,每个属性的权重是在这个属性下POI之间的离差与所有属性下POI之间的总离差的比值。因此如果在某个属性下POI之间的离差越大,表明候选POI在这个属性上的差异性很大,则该属性对用户选择POI的影响就越大,即它的权重就大,反之则小。通过权重的计算公式所得到的权重能客观真实的反映每个POI属性在用户选择POI中的贡献。
将各类属性的数据进行中智集处理转化后,得到候选POI各属性的中智集矩阵Y=(Ajz)m×4,计算公式为:
Figure GDA0002250419080000097
其中,m为候选POI的数量,4为属性的数量。
使用上述的SVNSWA聚合算子,集成候选POI lj各属性的中智集,得到各个候选POI的中智集如下:
Figure GDA0002250419080000101
进一步地,为了计算每一个候选POI的优先级,TOPSIS方法中以各候选方案与正理想解和负理想解的距离相对远近来进行选择。分别定义候选POI的一个正理想解A+和一个负理想解A-如下:
Figure GDA0002250419080000102
Figure GDA0002250419080000103
计算POIli对应的中智数与理想解A+和负理想解的具体步骤为:
A-之间的汉明距离分别为:
Figure GDA0002250419080000104
Figure GDA0002250419080000105
然后根据下式计算每个POI的优先级。
Figure GDA0002250419080000106
Figure GDA0002250419080000107
为负向距离与正负向距离之和的比值,根据
Figure GDA0002250419080000108
的大小对候选POI进行排序。最后,向用户推荐POI排序列表lr1>lr2>…>lrm-1>lrm。本列表中排名最高的服务最符合用户的需求,比排名低的服务更有可能被当前用户采用。
本发明方法针对签到数据中体现的用户偏好模糊、不确定的特征,从用户决策的角度考虑,将POI的推荐问题转化为多维属性决策问题,提出一个基于中智集的上下文感知的POI推荐方法。有效地融合地理位置,兴趣主题,流行度,社交关系四方面属性,基于中智集将影响POI选择的各种属性转化为相同的表示,提供了一种高效的模型来研究POI推荐问题。基于相似度计算构建地理位置和兴趣主题中智集转化模型,基于情感分析技术构建流行度和社交关系中智集转化模型,为用户对各个属性偏好提供了有效的定量建模方法。各属性中智集可以明确得到每个POI每个属性的隶属度、非隶属度和不确定度,提高了推荐结果的可解释性,使得可以从用户决策角度来研究和分析POI符合用户偏好的程度。
实施例2
实验验证。本实施例中,通过实验验证上述实施例1中的方法步骤。本实施例中,使用来源于yelp网的数据集。应当指出的是,Yelp是目前最流行的LBSN之一,用户不仅可以使用Yelp进行签到,还可以查询POI的详细信息。本实施例中用到的Yelp数据集包括三个部分:POI数据集、评论数据集、用户数据集,社会关系包括在用户数据集中。表1为实验数据集的统计情况。
表1本文用到的实验数据集的统计
条目 数量
POI 188,593
用户 1,518,169
评论数据 5,996,996
每个POI的平均签入次数 31.79
每个用户访问的平均POI数 8.05
为了保证实验结果的有效性,首先过滤掉在Yelp原始数据集中签到次数少于10次,社交关系数少于10的用户,以及被访问次数少于20次的兴趣点。
本实施例中采用的评价目标是Discounted Cumulative Gain(DCG)指标,它的定义如下:
Figure GDA0002250419080000111
其中,k表示推荐列表的长度,ri则是POI在推荐列表中的排名,reli是不同推荐场景下定义的排名分数,用来衡量相关性程度,在POI推荐中可以根据用户访问的顺序确定reli,其中,reli∈{1,2,…,n},越早被访问的POI相关度越高。I是指示函数,当参数条件ri≤k满足时返回1,其余返回0。不同用户之间的DCG受reli的影响,不具备可比性,为此,对DCG的最大值进行归一化处理,得到归一化DCG(Normalized DCG,NDCG),定义如下:
Figure GDA0002250419080000112
其中,
Figure GDA0002250419080000113
是推荐结果下的POI排名,r(rel)是理想状态下的POI排名。NDCG是一个0到1之间的数,值越大排序效果越好。本实施例中使用NDCG作为评价标准。
为了证明PRNS的有效性,将本发明的方法与以下两种类型的方法做对比:(a)其它方法(b)基线方法。
本实施例中的其他方法包括UserCF(usercollaborative filtering)、ItemCF(item collaborative filtering)、PMF(probabilistic matrix factorization)、以及RankNet,基线方法包括PRNS-WG(without geography),PRNS-WI(without interest),PRNS-WP(without popularity),PRNS-WS(without society)和PRNS-WPW(Withoutpersonalized weighting)。需要说明的是,通过上述5种基线方法进一步验证地理位置,兴趣主题,流行度和社交关系分别对推荐结果的影响,具体地,本实施例中的PRNS-WG没有考虑地理位置信息,PRNS-WI没有考虑兴趣主题信息,PRNS-WP没有考虑流行度信息,PRNS-WS没有考虑社交关系信息,PRNS-WPW使用PRNS的框架,但它为所有属性分配相同的权重。为了更清晰地对本发明实施例提出的模型进行说明,首先随机选择用户数据集中id为jhpYtJj6mijxNGWRARt7ew的用户,为其推荐POI。在实验中,假设用户使用Yelp网的过滤功能筛选出了符合其要求的候选POI列表,选取一个m=8的候选服务列表P1,P2…P8,然后基于上下文信息对POI列表的排列顺序进行优化,为了方便评估实验结果,设置其中P1,P2,P3为用户已访问过的POI。根据上述中智集转化模型,可以将地理位置数据,内容文本数据,评论数据,社交关系数据分别处理转化为中智集,产生的结果如表2所示。
表2中智集结果对应表
Figure GDA0002250419080000121
最终得到服务排序列表:P3>P2>P8>P5>P1>P6>P4>P7
即P3是最佳候选兴趣点,并将被优先推荐给用户。根据计算,P3的NDCG1=0.96。更重要的是,该POI列表中排名前两位的兴趣点是符合用户偏好的。
本发明的方法可以帮助用户找到各方面都最符合用户偏好的候选POI。POI 3成为最优的候选是因为其在每个属性上都表现出了较高的隶属度和较低的非隶属度和不确定度,POI 7成为最差的候选是因为其在每个属性上都表现出了较低的隶属度和较高的非隶属度和不确定度。
本发明提出的离差最大法可以有效地体现候选POI之间的差异,同一个属性在不同的推荐场景中的影响程度是不同的.权重的计算结果取决于该属性的分布情况,如果候选POI在某个属性上差异较小,那么该属性对推荐结果的影响就小,该属性的权重就小。
具体地,当推荐列表长度不同时,PRNS和其它方法的NDCG值的变化情况如图3所示。
在图3中,PRNS的NDCG值始终最大,NDCG值越大,符合用户偏好的POI出现在更靠前的位置。即PRNS优于其它方法。UserCF和ItemCF的性能表现一般,因为在这两种方法中,仅根据其他用户的意见推荐POI,而不是考虑用户个性化的偏好。PMF表现最差,因为它是为用户电影评级等显式反馈数据开发的,它不适用于POI推荐,签到数据是隐式反馈。RankNet把排序问题转换成一个排序概率问题,根据每个用户的历史偏好进行训练,推导算出每两个POI之间的排序概率。然而,这种方法的效果提升也是有限的,因为没有考虑到个性化的偏好。
当推荐列表长度不同时,PRNS和实验设置的基线方法的NDCG值得变化情况如图4所示。图4中,PRNS的NDCG值都优于其它方法,从融合四个属性时NDCG值都优于融合3个属性可以看出,四种属性的融合对于POI推荐是至关重要的,有助于提高推荐精度。得出上述结论的原因在于:用户在实际生活中受到了多方面情景信息的影响,而不能片面地从某一个方面来对用户的偏好预测进行建模,因此POI推荐应当充分利用POI的各种情景信息,且每一种属性对提高推荐结果的影响程度是不同的。
在图3中,PRNS的性能优于PRNS-WPW,PRNS为不同用户的每个属性分配了个性化的权重,这表明了权重计算的有效性。本发明的PRNS基于四种属性对用户的偏好进行建模,并利用中智集聚合算子将它们与个性化权重融合,该方法在NDCG上总是能达到最佳的推荐质量,该结果验证了融合多个属性的优越性。
实施例3
与上述方法实施例相对应地,本实施例提供一种基于中智集的上下文感知兴趣点推荐系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于中智集的上下文感知兴趣点推荐方法,其特征在于,包括以下步骤:
S1:获取社交网络中待分析候选兴趣点的相关信息,根据所述相关信息将所述待分析候选兴趣点分为单维属性信息组和多维属性信息组;
S2:对所述单维属性信息组中的信息采用基于相似度的中智集转化得到第一中智集组,对所述多维属性信息组中的信息采用基于情感识别度的中智集转化得到第二中智集组;根据所述第一中智集组和所述第二中智集组得到中智集矩阵;
S3:优化所述中智集矩阵得到按照优先级排序的候选兴趣点,将所有兴趣点按照优先级的先后顺序推荐给用户。
2.根据权利要求1所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,所述S1中,所述相关信息包括至少四种,分别为地理数据信息、文本数据信息、评论数据信息、以及社交数据信息。
3.根据权利要求2所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,单维属性信息组由所述地理数据信息和所述文本数据信息组成;多维属性信息组由所述评论数据信息和所述社交数据信息组成。
4.根据权利要求1所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,所述S2中,所述相似度通过核函数计算得到,其中,相似度的计算公式为:
Figure FDA0002112033910000011
式中,d(j,g)为兴趣点lj和lg之间的距离,b为核函数的宽度参数,I为指示函数。
5.根据权利要求1所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,所述情感识别度通过vader方法计算得到。
6.根据权利要求1所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,所述S1完成之后,还包括以下步骤:
对所述单维属性信息组和所述多维属性信息组进行数据清洗。
7.根据权利要求1所述的基于中智集的上下文感知兴趣点推荐方法,其特征在于,所述S3中,采用离差最大法优化所述中智集矩阵。
8.一种基于中智集的上下文感知兴趣点推荐系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-7任一所述方法的步骤。
CN201910575834.8A 2019-06-28 2019-06-28 一种基于中智集的上下文感知兴趣点推荐方法及系统 Active CN110543601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910575834.8A CN110543601B (zh) 2019-06-28 2019-06-28 一种基于中智集的上下文感知兴趣点推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910575834.8A CN110543601B (zh) 2019-06-28 2019-06-28 一种基于中智集的上下文感知兴趣点推荐方法及系统

Publications (2)

Publication Number Publication Date
CN110543601A CN110543601A (zh) 2019-12-06
CN110543601B true CN110543601B (zh) 2022-11-15

Family

ID=68709685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910575834.8A Active CN110543601B (zh) 2019-06-28 2019-06-28 一种基于中智集的上下文感知兴趣点推荐方法及系统

Country Status (1)

Country Link
CN (1) CN110543601B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577185B (zh) * 2022-11-15 2023-04-07 湖南师范大学 基于混合推理和中智群决策的慕课推荐方法及装置
CN116977034B (zh) * 2023-09-22 2023-12-08 北京世纪飞讯科技有限公司 一种基于大数据的互联网品牌用户管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677804A (zh) * 2015-12-31 2016-06-15 百度在线网络技术(北京)有限公司 权威站点的确定以及权威站点数据库的建立方法和装置
CN106023245A (zh) * 2016-04-28 2016-10-12 绍兴文理学院 基于中智集相似度量测的静态背景下运动目标检测方法
CN109710848A (zh) * 2018-12-26 2019-05-03 巨轮智能装备股份有限公司 一种基于模糊优选神经网络的个性化信息推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677804A (zh) * 2015-12-31 2016-06-15 百度在线网络技术(北京)有限公司 权威站点的确定以及权威站点数据库的建立方法和装置
CN106023245A (zh) * 2016-04-28 2016-10-12 绍兴文理学院 基于中智集相似度量测的静态背景下运动目标检测方法
CN109710848A (zh) * 2018-12-26 2019-05-03 巨轮智能装备股份有限公司 一种基于模糊优选神经网络的个性化信息推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An adaptive point-of-interest recommendation method for location-based social networks based on user activity and spatial features;Yali Si, FuzhiZhang, WenyuanLiu;《Knowledge-Based Systems》;20190101;全文 *
基于模糊兴趣模型的个性化推荐算法;唐灿;《中国优秀硕士学位论文全文数据库_信息科技辑》;20070115;全文 *
基于用户情境的POI个性化推荐模型;邓鹏,等;《测绘地理信息》;20150522;全文 *

Also Published As

Publication number Publication date
CN110543601A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
Christensen et al. Social group recommendation in the tourism domain
Gasparetti et al. Community detection in social recommender systems: a survey
Bobadilla et al. Recommender systems survey
CN103377250B (zh) 基于邻域的top‑k推荐方法
Pang et al. Collaborative filtering recommendation for MOOC application
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
Eliyas et al. Recommendation systems: Content-based filtering vs collaborative filtering
CN106126549A (zh) 一种基于概率矩阵分解的社区信任推荐方法及其系统
CN108647800B (zh) 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
CN109460520A (zh) 基于地理-社会关系与深隐式兴趣挖掘的兴趣点推荐方法
CN104851025A (zh) 一种基于案例推理的电商网站商品的个性化推荐方法
CN116244513B (zh) 随机群组poi推荐方法、系统、设备及存储介质
CN115422441A (zh) 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法
CN111241425A (zh) 一种基于层次注意力机制的poi推荐方法
CN111475744A (zh) 一种基于集成学习的个性化位置推荐方法
CN114036376A (zh) 一种基于k均值聚类的时间感知自适应兴趣点推荐方法
Cheung et al. Characterizing user connections in social media through user-shared images
CN110543601B (zh) 一种基于中智集的上下文感知兴趣点推荐方法及系统
Fu et al. Collaborative filtering recommendation algorithm towards intelligent community
Kim et al. Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network
Zhu et al. A fuzzy clustering‐based denoising model for evaluating uncertainty in collaborative filtering recommender systems
CN118071400A (zh) 基于图计算技术在信息消费领域的应用方法及系统
Lee et al. Exploiting uninteresting items for effective graph-based one-class collaborative filtering
CN117251626A (zh) 一种课程推荐方法、系统及电子设备
CN110727867A (zh) 一种基于模糊机制的语义实体推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant