CN112733039A - 一种个性化推荐方法、系统及电子设备 - Google Patents
一种个性化推荐方法、系统及电子设备 Download PDFInfo
- Publication number
- CN112733039A CN112733039A CN202110111463.5A CN202110111463A CN112733039A CN 112733039 A CN112733039 A CN 112733039A CN 202110111463 A CN202110111463 A CN 202110111463A CN 112733039 A CN112733039 A CN 112733039A
- Authority
- CN
- China
- Prior art keywords
- item
- recommended
- user
- spatial
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims abstract description 36
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 230000000694 effects Effects 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000010276 construction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 20
- 238000013507 mapping Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012732 spatial analysis Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 235000012054 meals Nutrition 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012821 model calculation Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000486463 Eugraphe sigma Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于信息推荐技术领域,提供了一种个性化推荐方法、系统及电子设备,所述方法包括:构建空间异构信息网,并根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重构建基于项目协同过滤的语义路径个性化推荐模型:利用所述模型计算待推荐项目的推荐指数,并根据计算结果向用户进行推荐。本发明将空间特性融入具有语义特性的异构信息网中,构建空间异构信息网络,将语义信息和空间信息以权重的方式融合进基于项目的协同过滤算法中,构建考虑语义和空间特性的基于项目的协同过滤推荐模型,有利于提高推荐效率和精度。
Description
技术领域
本发明涉及信息推荐技术领域,尤其涉及一种个性化推荐方法、系统及电子设备。
背景技术
个性化推荐(Personal Recommender System)作为一种泛信息检索,最早于20世纪90年代被提出,目前主要应用于电子商务领域。可以从用户积累的历史数据中挖掘出一定规律,为用户自动过滤掉一些不必要的信息,并根据用户的喜好来主动推送最为合适的信息。
数据是个性化推荐系统的基础和载体,目前个性化推荐系统中的数据表达采用二部图的方式,即,以用户和推荐项目为中心,包含两者间关系和各自属性特征的异构信息网(Heterogeneous Information Network)。然而,现有的基于异构信息网的个性化推荐系统至少存在以下技术缺陷:
1、目前的推荐模型在计算相似性(包括用户之间的相似性以及项目之间的相似性)时,是将属性关系转化为特征向量,然后基于共有属性或向量角度来度量。然而,只是将属性当做一种标记,并没有考虑属性语义上的含义,没有上升到语义层次。例如,针对餐厅推荐系统的中餐厅来说,一个餐厅被标记为中餐,而另一个餐厅被标记为川菜,在传统的相似计算计算中,中餐和川菜被当做两个完全独立的标签,而在语义层次这两者是存在包含关系的。因此,在异构信息网中的节点或连边虽然表达出了语义信息,但在参与相似性计算的时候还只是停留在网络的不同类节点和连边层面上,并没有考虑语义信息在概念层次上的关联。
2、目前的推荐系统直接将地理相关信息作为一种属性字段来进行存储和计算。例如,上海闵行区有很多商店,这些商店分布在闵行区的各个地方,各自都有唯一的位置信息,然而在计算商店相似性时,所有的商店位置信息都被闵行区替代了。因此,从商店层面来说,彼此之间在地理空间上无法进行区分,而从整个数据层面来说,地理位置属性也就缺乏存在的意义了。
综上所述,随着大数据时代的到来,以及对推荐系统的深入研究,用户迫切地需要能更加理解语义信息的智能化推荐模型;而另一方面,随着线下服务业与线上互联网的结合,地理环境中的空间要素也逐渐成为推荐系统中不可忽略的重要信息之一。
发明内容
针对上述现有技术中存在的技术问题,本发明提供了一种个性化推荐方法、系统及电子设备,将空间特性融入具有语义特性的异构信息网中,构建空间异构信息网络,将语义信息和空间信息以权重的方式融合进基于项目的协同过滤算法中,构建考虑语义和空间特性的基于项目的协同过滤推荐模型,根据模型计算的结果对用户进行个性化智能推荐,提高推荐效率和精度。
具体的,主要通过以下技术方案来实现:
一种个性化推荐方法,包括:
构建空间异构信息网,并根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重构建基于项目协同过滤的语义路径个性化推荐模型:
利用所述模型计算待推荐项目的推荐指数,并根据计算结果向用户进行推荐。
优选地,所述模型为其中,θq表示第q个语义路径相似性的权重,UI为用户与历史项目之间的关联关系,SI为历史项目与待推荐项目之间的语义路径相似性,SW为待推荐项目的空间权重,R为待推荐项目的推荐指数,q、L为正整数。
优选地,用户与历史项目之间的关联关系UI为:
优选地,在所述空间异构信息网中结合语义路径的历史项目与待推荐项目之间的语义信息计算SI:
其中pi→j,pi→i和pj→j分别表示节点i到j,i到i和j到j的元路径实例。
优选地,语义路径的历史项目与待推荐项目之间的语义信息包括基于本体的历史项目与待推荐项目之间的语义信息以及基于本体的历史项目与待推荐项目之间的层次关系。
优选地,基于本体的历史项目与待推荐项目之间的语义信息,通过下式计算SI:
其中,Dis(Ci,Cj)为语义距离:
其中,表示Ck的层次深度,表示Ck的局部密度,和分别表示Ck与其父节点的连接关系类型和关系强度,Sp(Ci,Cj)为Ci和Cj的最短路径,pPmin为Ci和Cj的最小公共父节点,Ci和Cj为本体的节点,k为正整数。
优选地,对用户访问过的历史项目信息进行空间分析,获得用户的空间活动范围,再利用用户在相应的空间活动范围内的空间活跃度预测针对该用户待推荐项目的空间权重SW,所述历史项目信息包括项目属性和项目的地理位置。
优选地,根据用户u访问过的历史项目信息得到历史项目集Iu,f,计算用户u空间活动范围的集聚程度,得到一张栅格图,所述栅格图每个像素的值为用户u在相应的空间活动范围内的空间活跃度Ru(a,b):
根据历史项目的地理位置投影至用户u空间活动范围的栅格图对应的栅格上,将对应的空间活跃度值作为针对该用户待推荐项目的空间权重,并将所得到的所有待推荐项目的空间权重进行归一化处理。
一种个性化推荐系统,包括构建模块、个性化推荐模型以及推荐模块,个性化推荐模型分别与构建模块和推荐模块进行连接;构建模块,用于构建空间异构信息网;个性化推荐模型,基于构建的空间异构信息网,根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重计算待推荐项目的推荐指数:推荐模块,根据个性化推荐模型的计算结果向用户进行推荐。
优选的,个性化推荐模型为:
优选的,个性化推荐模型还包括用户模块,具体用于计算用户与历史项目之间的关联关系UI为:
优选的,个性化推荐模型还包括项目模块,具体用于计算历史项目与待推荐项目之间的语义路径相似性SI,包括:
在所述空间异构信息网中结合语义路径的历史项目与待推荐项目之间的语义信息计算SI:
其中pi→j,pi→i和pj→j分别表示节点i到j,i到i和j到j的元路径实例。
优选的,项目模块具体用于基于本体的历史项目与待推荐项目之间的语义信息,通过下式计算SI:
其中,Dis(Ci,Cj)为语义距离:
其中,表示Ck的层次深度,表示Ck的局部密度,和分别表示Ck与其父节点的连接关系类型和关系强度,Sp(Ci,Cj)为Ci和Cj的最短路径,pPmin为Ci和Cj的最小公共父节点,Ci和Cj为本体的节点,k为正整数。
优选的,项目模块还用于,对用户访问过的历史项目信息进行空间分析,获得用户的空间活动范围,再利用用户在相应的空间活动范围内的空间活跃度预测针对该用户待推荐项目的空间权重SW,所述历史项目信息包括项目属性和项目的地理位置。
优选的,项目模块根据用户u访问过的历史项目信息得到历史项目集Iu,f,计算用户u空间活动范围的集聚程度,得到一张栅格图,所述栅格图每个像素的值为用户u在相应的空间活动范围内的空间活跃度Ru(a,b):
根据历史项目的地理位置投影至用户u空间活动范围的栅格图对应的栅格上,将对应的空间活跃度值作为针对该用户待推荐项目的空间权重,并将所得到的所有待推荐项目的空间权重进行归一化处理。
一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种个性化推荐方法的部分或全部步骤。
本发明相较于现有技术具有以下有益效果:
1、将信息在空间上所表现的特性进行定量化表达,并参与模型计算,使得模型不仅仅只考虑用户和项目本身,同时还考虑用户和项目的空间关系,扩展了地理学对推荐系统的认知,更加能体现推荐模型的智能性;
2、空间异构信息网相较于现有的异构信息网新增了地理层,同时用本体完善了知识层节点属性的语义信息,能更加全面地表达数据信息时间、空间和属性三方面特性;
3、以及,利用空间异构信息网中的本体信息,改进了传统的元路径相似性,提出了语义路径相似性,该语义路径相似性进一步考虑了知识层节点属性之间的父子和兄弟关系等概念层次的语义信息,使得节点的相似性计算结果更加准确和精细化;
4、采用空间分析和用户历史记录,基于用户空间活跃度预测被推荐项目的空间权重,将空间特性从属性域转移到了空间域来计算,使得空间信息得到了更加充分的利用,解决了传统推荐模型中简单地将空间特性作为一种属性来计算相似性而导致相似性计算结果不准确的问题;
5、以空间异构信息网为数据组织基础,采用语义路径计算项目的相似性,并采用空间活跃度预测项目的空间权重,对相似性加以校正,同时,考虑了语义和空间活跃度的算法在一定程度上提高了推荐的准确度,而且空间活跃度对推荐效果的提高比语义更明显,随着数据量的增加,语义信息和空间活跃度对推荐结果的提高效果越好;
6、将语义信息和空间信息以权重的方式融合进基于项目的协同过滤算法中,构建考虑语义和空间特性的基于项目的协同过滤推荐模型,根据模型计算的结果对用户进行个性化智能推荐,提高推荐效率和精度。
附图说明
1、图1为本发明提供的空间异构信息网示意图;
2、图2为本发明提供的个性化推荐模型示意图;
3、图3为本发明提供的计算项目空间权重示意图;
4、图4为本发明提供的一种个性化推荐系统的结构示意图;
5、图5为本发明提供的电子设备结构示意图。
具体实施方式
为了使本领域技术人员更清楚的理解本发明的核心思想,下面将结合附图对其进行详细的说明。
实施例一
本发明实施例提供了一种个性化推荐方法,具体包括:
构建空间异构信息网,并根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重构建基于项目协同过滤的语义路径个性化推荐模型:
利用所述模型计算待推荐项目的推荐指数,并根据计算结果向用户进行推荐。
需要说明的是,传统的数据表达主要是利用诸如标签等结构化数据来描述信息的组成,得到的数据表达结构为异构信息网,而传统的异构信息网针对项目的描述往往都是直接将空间域作为某种特殊的属性加载在属性域中的,使得空间上的一些特性难以体现。因此,需要将空间特性融入具有一定语义信息的异构信息网,构建空间异构信息网作为个性化推荐的数据模型。
本发明以传统异构信息网为基础,通过将其与传统的空间点数据进行关联,赋予一定的人类活动属性,使其组成一个空间异构信息网,如图1所示,构建的空间异构信息网由三部分组成,分别是:知识层,用于表示节点类型之间关联的抽象概念;实例层,是在知识层映射下用以描述实际情况的异构网络;地理层,是以项目实例地理位置为关联在地图上展示出一定分布形态的空间层。
具体的,设有m个用户U={u1,u2,…,um}和n个项目构成异构信息网I={e1,e2,…,en},并将其扩展为空间异构信息网,即空间信息落到空间域,该网络由实例有向图GI=(V,E)、知识有向图GT=(T,R)和地理环境有向图GE=(S,Q)三部分构成,则节点映射关系φ:V→T和连边映射关系ψ:E→R,使得对都有φ(v)∈T,对都有ψ(e)∈R,且和使得节点v*经过关系e*连接地理位置(lat,lon),将节点v*映射为地理环境有向图中带地理位置的节点s*,其中s*∈S,而实例图中的连边关系e*对应s*的地理位置关系,Q则是地理层节点s*之间的空间关系。那么,当|T|>1或|R|>1时,称该网络为空间异构信息网。
由上可知,知识层到实例层是一个全映射,精确到属性层次,是拓扑空间的一种映射关系;实例层到地理层是一个有选择的单一映射,精确到个体层次,只有带有地理属性的对象才能从实例层映射到地理层。而知识层是不可能直接映射到地理层的,只能通过实例层来映射到地理层。联系实例层和地理层的映射关系最常用的是地理位置,而在地理层的其他一些空间分布和空间关系等组合效应也都是由于各种从实例层映射个体的地理位置引起的,空间域里面的各种空间特性最基础的特征就是地理位置。不同的层次根据其特性应该采取不同领域的知识来做计算等处理,知识层偏语义信息,应该采用诸如本体和语义网等知识来计算;实例层偏数据结构,常常表现为关系表或网络结构,是传统数据处理中最常用的表现形式,应该采用诸如数学和计算机领域的知识来计算,比如图论;地理层偏现实世界的数据抽象,常常以个体的形式表达,应该采用空间领域的知识来处理,比如空间分析。
如图2所示,在基于构建的空间异构信息网中,根据用户与历史项目之间的关联关系UI、历史项目与待推荐项目之间的语义路径相似性SI以及待推荐项目的空间权重SW构建基于项目协同过滤的个性化推荐模型。
在一个优选的实施例中,所述模型为:
其中,θq表示第q个语义路径相似性的权重,UI为用户与历史项目之间的关联关系,SI为历史项目与待推荐项目之间的语义路径相似性,SW为待推荐项目的空间权重,R为待推荐项目的推荐指数,q、L为正整数。
具体的,本发明的推荐模型由用户与历史项目之间的关联关系UI,历史项目与待推荐项目之间的语义相似性SI,以及待推荐项目的空间权重SW三部分组成。
设有m个用户U={u1,u2,…,um}和n个项目构成I={e1,e2,…,en},定义一条语义路径为其中Rs-1,s表示从Ts-1到Ts的连边关系,Ks,s表示Ts节点实例之间的语义关系,而是两者之间的运算算子,在此表示为析取∨。将此语义路径映射到实例有向图GI=(V,E),则
设有一条路径PK,则针对同类项目节点i和j,两者基于语义路径的相似性SI为:
其中pi→j,pi→i和pj→j分别表示节点i到j,i到i和j到j的元路径实例。
而扩展的Path矩阵计算满足:
在扩展相似性的时候,选择最大的那个相似点来扩展没有连接边的相似性。
由于本体可以在语义层次描述某一信息,因此本发明将基于本体来计算语义路径中的语义信息,即基于本体的节点语义相似性度量,所得到的是一个对称矩阵然而,仅仅用该对称矩阵来补充语义路径中的语义信息是不足的,例如下表1中的例子,展示的是r1-r4四家餐厅的标签情况:
表1
则针对现有技术中的元路径相似性公式,计算四家餐厅之间的相似性如下表2所示,下面以r2和r3为例展示两个项目之间相似性的计算过程:
元路径定义:设知识有向图GT=(T,R),则P=T1(R1,2)T2…Ts-1(Rs-1,s)Ts定义为一条元路径,其中Rs-1,s表示从节点Ts-1到节点Ts的连边关系。将此元路径映射到实例有向图GI=(V,E),得到相应的元路径实例p=v1(e1,2)v2…vs-1(es-1,s)vs,其中对都会有φ(vs)∈Ts,对都有ψ(es)∈Rs。
设有一条元路径P,则针对同类节点i和j,两者的相似性定义为:
其中pi→j,pi→i和pj→j分别表示节点i到j,i到i和j到j的元路径实例。
针对路径P,可以抽象出一个关系矩阵RP,矩阵的行是相似性计算的对象,矩阵的列是路径的取值,这该元路径相似性可以改写成矩阵形式:
其中针对P=T1(R1,2)T2K Ts-1(Rs-1,s)Ts,关系矩阵RP=R1,搾×R搾,3×…×Rs-1,s。
同理,计算所有项目之间相似性如下表2所示:
表2
但如本发明上述语义路径相似性计算公式,经过本发明基于本体的语义相似性计算,可以得到t1-t3之间的对称矩阵如下表3所示。
表3
由于从推荐角度来说,喜欢中餐的必然可以推荐川菜,而喜欢川菜不能推荐所有中餐。这反应出,某个餐厅在面对川菜和中餐这种含有父子关系的标签时,是处于不对称的地位的。从餐厅的角度来说,即一个餐厅属于川菜则必然属于中餐,而该餐厅如果属于中餐则不一定属于川菜。然而由表3可知,假如有1家餐厅被标记为川菜馆,那么该餐厅被标记为中餐厅的可能性不应该为0.8,而是1。由此可以看出,在度量语义路径中语义信息的时候,除了要考虑节点语义相似性外,还要考虑节点之间的父子关系,即项目之间的层次关系。
因此,在一个优选的实施例中,语义路径的历史项目与待推荐项目之间的语义信息包括基于本体的历史项目与待推荐项目之间的语义信息以及基于本体的历史项目与待推荐项目之间的层次关系。
父子关系体现在本体的构建过程中,表达为一个非对称的相似矩阵其中子节点归属于父节点,因此子节点与父节点的相似性是1,反之则不然。在科学本体论中,父节点的内涵比子节点更小,但外延比子节点更大,因此当一个对象标记为父节点时,我们考虑的是该子节点与父节点内涵重叠的部分,因此相似性必然小于1。在语义路径中表现为:如果某一个项目被标记为某一标签,则该项目也可以直接被标记为该标签的父标签,例如某餐馆属于川菜,则也一定属于川菜的父类中餐厅。
如果同时考虑父子关系和非父子关系,则需要将父子关系矩阵和非父子关系先进行一次运算,作为合并的语义矩阵来参与语义路径相似性度量的计算,计算公式如下:
则
进而得到
因此,由上可知,在扩展相似性的时候,在所有父子和非父子的相似性中选择值最大的那个来扩展没有连接边的相似性。
继续上面的举例说明,计算标签t1中餐、t2川菜和t3湘菜之间的语义关系,从标签名词的含义可以看出,t2和t3之间不存在父子关系,但是都是t1的儿子节点,因此同时存在父子关系矩阵KF和非父子关系矩阵KS,具体计算结果如下表4所示:
表4
考虑语义信息后,扩展了Path矩阵中的连接关系,使得最终的计算结果部分发生了改变。例如在表2的连接矩阵中,r1并没有直接与t2相连,但是t2与t1、t3都具有一定的相似性,这种相似性间接隐含了r1与t2连线可能性大小。通过引入这种隐含的关系,将path矩阵扩展为一个全连矩阵,不仅丰富了连接信息,而且强化了连接的强度,这种强度始终保持一定的原则,那就是之前没有连边的强度一定小于之前有连边的强度,如表5所示。
表5
按照语义路径相似性的公式(2)计算得到表6的语义路径相似性结果,对比表2的元路径相似性计算结果可以发现,对同一个项目而言,与其相似的项目的整体排序虽然影响不大,但由于语义信息的加入使得之前一些难以区分的项目产生了相似性差异。例如,针对r1而言,元路径相似性的计算结果排序是r3=r4>r2,r3和r4的相似性无法区分,但在语义路径相似性中计算结果排序却变成r4>r3>r2,在保证大排序的前提下,顺利区分了r3和r4的重要性。
表6
在一个优选的实施例中,基于本体的历史项目与待推荐项目之间的语义信息,通过下式计算SI:
其中,Dis(Ci,Cj)为语义距离:
其中,表示Ck的层次深度,表示Ck的局部密度,和分别表示Ck与其父节点的连接关系类型和关系强度,Sp(Ci,Cj)为Ci和Cj的最短路径,pPmin为Ci和Cj的最小公共父节点,Ci和Cj为本体的节点,k为正整数。
具体的,层次深度因子DC如下式:
其中,γ是调节因子,γ≥0,Dep(C)为层次深度,相似度随层次深度增加而增加,故Dep(C)对语义距离的影响随着深度的增加而减小。
局部密度因子EC如下式:
局部密度越大则相似度越大,因此语义距离随着局部密度增大而减小。
根据信息量理论,将每个节点的信息量设为:
IC(C)=log-1P(C) (16)
根据概念格的生成特点,每个节点只出现一次,所以freq(C)表示C节点本身及所有子节点,N表示节点总数。
每一个节点都是对其父节点的详细化,则关系强度LS(C,PC)为:
LS(C,PC)=log(P(C|PC))=IC(C)-IC(PC) (17)
在一个优选的实施例中,对用户访问过的历史项目信息进行空间分析,获得用户的空间活动范围,再利用用户在相应的空间活动范围内的空间活跃度预测针对该用户待推荐项目的空间权重SW,所述历史项目信息包括项目属性和项目的地理位置。
具体的,首先需要针对单个用户从空间异构信息网中抽取其访问过的历史项目,作为该用户的基础数据;然后是地图匹配,按照项目的地址将其匹配到地图上加以显示,本发明实施例以用户为中心,因此最终会根据用户访问过的历史项目得到每个用户各自对应的一副空间活动分布图,该空间分布图即为用户的空间活动热度,而分布图上某一位置所对应的值即代表该用户在该位置的空间活跃度。
具体的,如图3所示,本发明实施例采用基于密度的核密度估计法(kerneldensity estimation,KDE)根据用户u访问过的项目集Iu,f来计算其活动区域的集聚程度,得到一张带数值的栅格图Ru,该栅格图中的每个像素的值Ru(a,b)表示该用户去地点(a,b)的频繁度,频繁度越高则活跃度越大,即代表去这个地方的可能性越大,通过下式计算用户u在相应的空间活动范围内的空间活跃度Ru(a,b):
点密度估计值的计算公式为:
其中,k(·)为核函数,τ>0为带宽,(s-si)表示估计点s到事件si处的距离。
需要说明的是,在计算的过程一定要保证控制变量,确保KDE模型的各个参数都是一致的,即采用相同的核函数和带宽;同时需要控制处理区域相同,保证所有的用户得到的空间活动范围和对应的空间活跃度都是在同一个范围和尺度。
根据上述计算出来的用户空间活动范围分布图,来预测项目集Iu中项目的空间权重SW。
具体的,首先根据项目的地理位置(lon,lat)将其投影到该用户的空间活动分布图上对应栅格(a,b),然后将对应的活跃度值Ru(a,b)作为该项目的空间权重:
最终得到一个m个用户和n个项目之间的m×n的空间权重矩阵SW*,将该矩阵按行(用户)以最大最小化的标准化方法标准化到[0,1]区间:
在标准化后得到最终的空间权重矩阵SW,该矩阵将取代传统方法中直接将地理位置作为属性参与计算的方式。
综上所述,历史项目与待推荐项目之间的语义路径相似性SI的计算,可以得到SI={SI(1),SI(2),…,SI(L)}这L条语义路径相似性集合,集合中每个元素都是n个项目之间的相似矩阵基于用户活动空间范围预测待推荐项目空间权重和地理环境有向图GE,可以得到m个用户关于n个待推荐项目的空间权重矩阵
综合考虑待推荐项目的空间权重SW、用户与历史项目之间的关联关系UI,以及历史项目与待推荐项目之间的语义路径相似性SI,构建本发明提供的基于项目协同过滤的个性化推荐模型(式1),由于不同的语义路径相似矩阵SI(q)的权重θq匹配会得到不同的推荐结果,因此寻找最优θq组合是推荐模型的关键。
具体的,推荐模型中参数θq的最佳组合求解是一个最优化问题,本发明实施例可采用贝叶斯参数进行求解,对用户的偏好先做如下的假设:针对用户已经访问过的历史项目所构成的用户与历史项目关系矩阵UI,假设用户ui对项目ej评价的权重wij越大,则用户ui对项目ej的偏好性越大。
设概率p(ea>eb;ui|θ)用来表示在一定的参数模型下用户ui相比项目ea更喜欢eb的喜爱程度,(ea,eb)表示项目对,则该优化问题转化为最大化以下后延概率为:
p(θ|UI)∝p(UI|Θ)p(Θ) (21)
其中Θ={θ1,θ2,...,θL}即为推荐模型参数,而p(Θ|UI)表示根据用户与历史项目之间的关系矩阵UI得到所有正确排序的项目对的概率。
根据假设和后延概率优化原理,可以得到最大似然函数p(UI|Θ)如下所示:
其中(ea>eb)∈UIi代表用户ui的在关系矩阵UI中所有正确排序的项目对。为了方便计算,设p(ea>eb;ui|θ)表示:
p(ea>eb;ui|Θ)=σ(R(ui,ea)-R(ui,eb)) (23)
其中σ函数表示逻辑函数,即σ(x)=1/(1+e-x)。综合以上可以得到优化的目标为:
其中Ri,ab=R(ui,ea)-R(ui,eb)。根据以上的梯度公式,采用随机梯度下降的方法进行求解,并求得最终的参数组合,计算得到待推荐项目相对于用户的推荐指数,按照现有推荐系统的思路,根据计算得到的推荐指数将待推荐项目进行排序,以便于向用户进行推荐。
实施例二
一种个性化推荐系统,如图4所示,包括包括构建模块、个性化推荐模型以及推荐模块,个性化推荐模型分别与构建模块和推荐模块进行连接;构建模块,用于构建空间异构信息网;个性化推荐模型,基于构建的空间异构信息网,根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重计算待推荐项目的推荐指数:推荐模块,根据个性化推荐模型的计算结果向用户进行推荐。
优选的,个性化推荐模型为:
优选的,个性化推荐模型具体用于计算用户与历史项目之间的关联关系UI为:
优选的,个性化推荐模型具体还用于计算历史项目与待推荐项目之间的语义路径相似性SI,包括:
在所述空间异构信息网中结合语义路径的历史项目与待推荐项目之间的语义信息计算SI:
其中pi→j,pi→i和pj→j分别表示节点i到j,i到i和j到j的元路径实例。
优选的,个性化模型具体还用于基于本体的历史项目与待推荐项目之间的语义信息,通过下式计算SI:
其中,Dis(Ci,Cj)为语义距离:
其中,表示Ck的层次深度,表示Ck的局部密度,和分别表示Ck与其父节点的连接关系类型和关系强度,Sp(Ci,Cj)为Ci和Cj的最短路径,pPmin为Ci和Cj的最小公共父节点,Ci和Cj为本体的节点,k为正整数。
优选的,个性化模型具体还用于对用户访问过的历史项目信息进行空间分析,获得用户的空间活动范围,再利用用户在相应的空间活动范围内的空间活跃度预测针对该用户待推荐项目的空间权重SW,所述历史项目信息包括项目属性和项目的地理位置。
优选的,个性化模型具体还用于根据用户u访问过的历史项目信息得到历史项目集Iu,f,计算用户u空间活动范围的集聚程度,得到一张栅格图,所述栅格图每个像素的值为用户u在相应的空间活动范围内的空间活跃度Ru(a,b):
点密度估计值的计算公式为:
其中,k(·)为核函数,τ>0为带宽,(s-si)表示估计点s到事件si处的距离。
根据历史项目的地理位置投影至用户u空间活动范围的栅格图对应的栅格上,将对应的空间活跃度值作为针对该用户待推荐项目的空间权重,并将所得到的所有待推荐项目的空间权重进行归一化处理。
本发明实施例的一种个性化推荐系统与上述实施例的一种个性化推荐方法相对应,实现相应的功能,具体的实施方式可参照上述实施例,此处不再赘述。
实施例三
一种电子设备,如图5所示,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种个性化推荐方法的部分或全部步骤。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种个性化推荐方法,其特征在于,包括:
构建空间异构信息网,并根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重构建基于项目协同过滤的语义路径个性化推荐模型:
利用所述模型计算待推荐项目的推荐指数,并根据计算结果向用户进行推荐。
5.如权利要求4所述的一种个性化推荐方法,其特征在于,语义路径的历史项目与待推荐项目之间的语义信息包括基于本体的历史项目与待推荐项目之间的语义信息以及基于本体的历史项目与待推荐项目之间的层次关系。
7.如权利要求2所述的一种个性化推荐方法,其特征在于,对用户访问过的历史项目信息进行空间分析,获得用户的空间活动范围,再利用用户在相应的空间活动范围内的空间活跃度预测针对该用户待推荐项目的空间权重SW,所述历史项目信息包括项目属性和项目的地理位置。
9.一种个性化推荐系统,其特征在于,包括构建模块、个性化推荐模型以及推荐模块,个性化推荐模型分别与构建模块和推荐模块进行连接;构建模块,用于构建空间异构信息网;个性化推荐模型,基于构建的空间异构信息网,根据用户与历史项目之间的关联关系、历史项目与待推荐项目之间的语义路径相似性以及待推荐项目的空间权重计算待推荐项目的推荐指数:推荐模块,根据个性化推荐模型的计算结果向用户进行推荐。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的一种个性化推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110111463.5A CN112733039A (zh) | 2021-01-27 | 2021-01-27 | 一种个性化推荐方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110111463.5A CN112733039A (zh) | 2021-01-27 | 2021-01-27 | 一种个性化推荐方法、系统及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112733039A true CN112733039A (zh) | 2021-04-30 |
Family
ID=75594145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110111463.5A Pending CN112733039A (zh) | 2021-01-27 | 2021-01-27 | 一种个性化推荐方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733039A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN109271582A (zh) * | 2018-08-20 | 2019-01-25 | 东南大学 | 一种基于带属性元路径的个性化信息推荐方法 |
-
2021
- 2021-01-27 CN CN202110111463.5A patent/CN112733039A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN109271582A (zh) * | 2018-08-20 | 2019-01-25 | 东南大学 | 一种基于带属性元路径的个性化信息推荐方法 |
Non-Patent Citations (1)
Title |
---|
徐敏政: "空间异构信息网中基于语义路径的个性化推荐", 《中国科学院地理科学与资源研究所-研究生部知识库,HTTP://IR.IGSNRR.AC.CN/HANDLE/311030/38099》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Multiple attribute decision‐making method for dealing with heterogeneous relationship among attributes and unknown attribute weight information under q‐rung orthopair fuzzy environment | |
Kermany et al. | A hybrid multi-criteria recommender system using ontology and neuro-fuzzy techniques | |
Scheider et al. | Geo-analytical question-answering with GIS | |
CN107193967A (zh) | 一种多源异构行业领域大数据处理全链路解决方案 | |
Ying et al. | A temporal-aware POI recommendation system using context-aware tensor decomposition and weighted HITS | |
CN107103000A (zh) | 一种基于关联规则与贝叶斯网络集成的推荐技术 | |
Kashef | Enhancing the role of large-scale recommendation systems in the IoT context | |
Yao et al. | A spatial co-location mining algorithm that includes adaptive proximity improvements and distant instance references | |
Chen et al. | Dynamic evolutionary clustering approach based on time weight and latent attributes for collaborative filtering recommendation | |
Rahimi et al. | Behavior-based location recommendation on location-based social networks | |
Iqbal et al. | A new fuzzy time series forecasting method based on clustering and weighted average approach | |
Li et al. | Multi-layer network community detection model based on attributes and social interaction intensity | |
Hung et al. | Self-updating clustering algorithm for estimating the parameters in mixtures of von Mises distributions | |
Sivaramakrishnan et al. | An effective user clustering-based collaborative filtering recommender system with grey wolf optimisation | |
Wang et al. | Hierarchical and overlapping social circle identification in ego networks based on link clustering | |
Shi et al. | Mining significant crisp-fuzzy spatial association rules | |
Honarparvar et al. | Improvement of a location-aware recommender system using volunteered geographic information | |
Zheng et al. | What you like, what i am: online dating recommendation via matching individual preferences with features | |
Chai et al. | Dominance-based decision rule induction for multicriteria ranking | |
Wang et al. | Collaboration prediction based on multilayer all-author tripartite citation networks: A case study of gene editing | |
Almomani et al. | Application of choice models in tourism recommender systems | |
Ivanov | An algorithm for on-the-fly K shortest paths finding in multi-storey buildings using a hierarchical topology model | |
Varma et al. | Jaccard based similarity index in graphs: A multi-hop approach | |
CN112528130A (zh) | 一种信息推荐方法、装置、设备及计算机可读存储介质 | |
CN112733039A (zh) | 一种个性化推荐方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210430 |