CN108197241B - 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器 - Google Patents

一种基于用户偏好的路径搜索方法、系统、存储介质和处理器 Download PDF

Info

Publication number
CN108197241B
CN108197241B CN201711478536.4A CN201711478536A CN108197241B CN 108197241 B CN108197241 B CN 108197241B CN 201711478536 A CN201711478536 A CN 201711478536A CN 108197241 B CN108197241 B CN 108197241B
Authority
CN
China
Prior art keywords
search
path
user
poi
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711478536.4A
Other languages
English (en)
Other versions
CN108197241A (zh
Inventor
周福才
王强
易海
吴淇毓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711478536.4A priority Critical patent/CN108197241B/zh
Publication of CN108197241A publication Critical patent/CN108197241A/zh
Application granted granted Critical
Publication of CN108197241B publication Critical patent/CN108197241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户偏好的路径搜索方法、系统、存储介质和处理器,其包括:输入搜索条件进行路径筛选;在路径筛选过程中调用离线POI数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径;存储全部的POI数据并生成候选路径集合;更改搜索半径重复搜索直至存在与所述搜索信息匹配的候选的路径;调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序;显示由排序后各个候选路径所构成的排序结果以供用户选择;记录用户所选择的路径并同步更新用户偏好数据集。通过本发明解决了现有技术中在路径搜索过程中没有出现将路径搜索与个性化推荐结合在一起的问题,提高了搜索的效率。

Description

一种基于用户偏好的路径搜索方法、系统、存储介质和处理器
技术领域
本发明属于数据处理技术领域,具体的说是涉及一种基于用户偏好的路径搜索方法、系统、存储介质和处理器。
背景技术
21世纪的到来,信息产业正在飞速的发展,通过网络实现的信息共享,自 web2.0以来其发展出空前的繁盛时代。网络集结了广大使用者贡献的数据资源,形成当前信息大爆炸的局面。在当前的网络环境中每个用户都是信息的创造者,同时也是信息的传播者、使用者。剧增在网络上的信息,增强了信息的多元化多样化,方便用户获取所需的各类线上资源,同时信息化步伐也带动传统的线下操作转到线上实现,获将线上线下相结合,地图无疑是当下人们使用很多的一款应用,用户靠它来寻找自己感兴趣的地点(Point ofInterest,POI)。但寻找一个自己感兴趣的POI还是个比较简单的场景,还有很多用户希望能有这样一种应用,它能够实现对路径的搜索与规划,这样做的好处就是不必用户自己一个个的搜索POI,然后再自己进行选择、规划。
因此,随着用户的需求不断变化,对于城市中路径的搜索也越来越受到人们的重视,同时随着人们生活水平的提高,用户也越来越在意搜索结果是否满足其个性化需要。
不过目前几乎没有出现在大众视野内的提供了路径搜索服务的服务,基于用户偏好的路径搜索服务更是在市场上难以见到。虽然对这个领域的研究不少,不过大多数研究者要么仅仅提供一个高效的路径搜索算法,要么仅仅提供一个个性化的推荐算法,并没有出现将路径搜索与个性化推荐结合在一起技术。
发明内容
鉴于已有技术存在的缺陷,本发明的目的是要提供一种基于用户偏好的路径搜索方法、装置、存储介质和处理器,以解决现有技术中的问题。
为了实现上述目的,本发明的技术方案:
根据本发明实施例的一个方面,提供了一种基于用户偏好的路径搜索方法,其特征在于,包括如下步骤:
S1、输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;
S2、在路径筛选过程中调用离线POI数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则执行S3,否则执行S4,其中,所述离线POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI 大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI数据能够包含所述搜索条件中的全部关键字;
S3、存储全部的POI数据并生成候选路径集合;
S4、更改S2中的搜索半径重复S2,直至存在与所述搜索信息匹配的候选的路径;
S5、调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;
S6、显示由排序后各个候选路径所构成的排序结果以供用户选择;
S7、记录用户所选择的路径并同步更新用户偏好数据集。
基于上述方案,进一步地,
所述S2中的搜索过程是指基于所输入的搜索条件中的空间信息为中心,以设定的搜索距离为搜索半径搜索其所构成的搜索区域中所包含POI数据。
基于上述方案,进一步地,
所述S4中搜索半径的更改条件是按照一定比率扩大当前的搜索半径继续搜索,直至存在与所述搜索信息匹配的候选的路径。
基于上述方案,进一步地,
所述S3中以遍历所存储的全部的POI数据方式查找每一符合搜索条件的候选路径并生成候选路径集合同时判断用户是否给定生成候选路径时对应的POI 的访问顺序,是则以用户给定的POI的访问顺序确认出相应的候选路径并生成候选路径集合;否则以路径长度最短为准则确认出相应的候选路径并生成候选路径集合。
基于上述方案,进一步地,
在所述S5中根据用户偏好以及对路径长度的敏感程度对所述候选路径集合中的每一候选路径进行综合评分以获得相应的评分结果,其中,所述评分结果由被配置有不同加权系数的POI评分值以及路径长度评分值相加构成,所述POI 评分值由被配置有不同加权系数的POI大众评分值以及关键字偏好评分值相加构成,所述POI大众评分值是通过提取离线POI数据集中某一大众评分网站所获取的对当前候选路径上各POI数据的大众打分数据即POI大众评分获得,所述关键字偏好评分值由被配置有不同加权系数的关键词搜索记录评分值以及关键词选择记录评分值相加构成,所述关键词搜索记录评分值是通过提取出关键字偏好数据中的关键字搜索记录后以搜索记录中的用户所搜索的关键字以及用户所搜索的关键字所属类别进行加权计算获得,所述关键词选择记录评分值是通过对关键字偏好数据中的关键字记录进行统计计算获得;所述路径长度评分值即为用户偏好数据集中的距离敏感度,所述距离敏感度由候选路径的路径长度评分以及反馈用户对路径长度的忍耐度的长度记录评分相乘构成。
基于上述方案,进一步地,
在所述S6中所述用户偏好数据集的更新过程包括:更新关键字选择记录评分、更新路径长度评分以及更新用户在进行下一搜索时步骤S2中对应的初始搜索半径,
其中,关键字选择记录评分基于第一更新计算公式进行更新,所述第一更新计算公式为
更新后关键字选择记录评分
Figure GDA0002358376470000031
其中,KSRS(u,k)是更新前,用户u对于关键字k的关键字选择记录评分,ps.s是用户选择的POI的大众评分,
Figure GDA0002358376470000041
是搜索结果中关键字k对应的平均POI大众评分,αKSRS(∈(0,1))是关键字选择记录评分的学习率,
路径长度评分基于第二更新计算公式进行更新,所述第二更新计算公式为更新后的路径长度评分
Figure GDA0002358376470000042
其中,DRS(u)是更新前的路径长度评分,αDRS(∈(0,1))是长度记录评分的学习率,
Figure GDA0002358376470000043
是路径搜索结果中的长度评分的平均值,DS(rs)是用户选择的路径rs的长度评分;
搜索半径基于第三更新计算公式进行更新,所述第三更新计算公式为
更新后的搜索半径
Figure GDA0002358376470000044
其中,R是更新前的搜索半径,αR为搜索半径R的学习率,
Figure GDA0002358376470000045
和DS(rs)分别代表路径搜索结果中的长度评分的平均值以及用户选择的路径rs的长度评分。
基于上述方案,进一步地,
所述方法还通过剪枝算法在路径筛选过程中移除不符合要求的路径。
根据本发明实施例的另一个方面,提供了一种基于用户偏好的路径搜索系统,其特征在于,包括:
搜索条件输入单元,其用于输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;
路径筛选单元,其用于在路径筛选过程中调用离线POI数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则启动第一生成候选路径单元,否则启动第二生成候选路径单元,其中,所述离线 POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI 数据能够包含所述搜索条件中的全部关键字;
第一生成候选路径单元,其用于存储全部的POI数据并生成候选路径集合;
第二生成候选路径单元,其用于更改路径筛选单元中的搜索半径并使得路径筛选单元重新按照更改后的搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,直至存在与所述搜索信息匹配的候选的路径;
候选路径评分排序单元,其用于调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;
显示单元,其用于显示由排序后各个候选路径所构成的排序结果以供用户选择;
记录及更新单元,其用于记录用户所选择的路径并同步更新用户偏好数据集。
基于上述方案,进一步地,
所述路径筛选单元中的搜索过程是指基于所输入的搜索条件中的空间信息为中心,以设定的搜索距离为搜索半径搜索其所构成的搜索区域中所包含POI 数据。
基于上述方案,进一步地,
所述第二生成候选路径单元中搜索半径的更改条件是按照一定比率扩大当前的搜索半径继续搜索,直至存在与所述搜索信息匹配的候选的路径。
基于上述方案,进一步地,
所述第二生成候选路径单元能够以遍历所存储的全部的POI数据方式查找每一符合搜索条件的候选路径并生成候选路径集合同时判断用户是否给定生成候选路径时对应的POI的访问顺序,是则以用户给定的POI的访问顺序确认出相应的候选路径并生成候选路径集合;否则以路径长度最短为准则确认出相应的候选路径并生成候选路径集合。
基于上述方案,进一步地,
候选路径评分排序单元能够根据用户偏好以及对路径长度的敏感程度对所述候选路径集合中的每一候选路径进行综合评分以获得相应的评分结果,其中,所述评分结果由被配置有不同加权系数的POI评分值以及路径长度评分值相加构成,所述POI评分值由被配置有不同加权系数的POI大众评分值以及关键字偏好评分值相加构成,所述POI大众评分值是通过提取离线POI数据集中某一大众评分网站所获取的对当前候选路径上各POI数据的大众打分数据即POI大众评分获得,所述关键字偏好评分值由被配置有不同加权系数的关键词搜索记录评分值以及关键词选择记录评分值相加构成,所述关键词搜索记录评分值是通过提取出关键字偏好数据中的关键字搜索记录后以搜索记录中的用户所搜索的关键字以及用户所搜索的关键字所属类别进行加权计算获得,所述关键词选择记录评分值是通过对关键字偏好数据中的关键字记录进行统计计算获得;所述路径长度评分值即为用户偏好数据集中的距离敏感度,所述距离敏感度由候选路径的路径长度评分以及反馈用户对路径长度的忍耐度的长度记录评分相乘构成。
基于上述方案,进一步地,
记录及更新单元对用户偏好数据集的更新过程包括:更新关键字选择记录评分、更新路径长度评分以及更新用户在进行下一搜索时步骤S2中对应的初始搜索半径,
其中,关键字选择记录评分基于第一更新计算公式进行更新,所述第一更新计算公式为
更新后关键字选择记录评分
Figure GDA0002358376470000061
其中,KSRS(u,k)是更新前,用户u对于关键字k的关键字选择记录评分,ps.s是用户选择的POI的大众评分,
Figure GDA0002358376470000062
是搜索结果中关键字k对应的平均POI大众评分,αKSRS(∈(0,1))是关键字选择记录评分的学习率,
路径长度评分基于第二更新计算公式进行更新,所述第二更新计算公式为更新后的路径长度评分
Figure GDA0002358376470000071
其中,DRS(u)是更新前的路径长度评分,αDRS(∈(0,1))是长度记录评分的学习率,
Figure GDA0002358376470000072
是路径搜索结果中的长度评分的平均值,DS(rs)是用户选择的路径rs的长度评分;
搜索半径基于第三更新计算公式进行更新,所述第三更新计算公式为
更新后的搜索半径
Figure GDA0002358376470000073
其中,R是更新前的搜索半径,αR为搜索半径R的学习率,
Figure GDA0002358376470000074
和DS(rs)分别代表路径搜索结果中的长度评分的平均值以及用户选择的路径rs的长度评分。
基于上述方案,进一步地,
所述系统还包括能够在路径筛选过程中移除不符合要求的路径的剪枝单元。
根据本发明实施例的再一个方面,提供了一种存储介质,其特征在于,包括:所述存储介质上保存有程序,所述程序被运行时执行上述方案中任一项所述的方法。
根据本发明实施例的最后一个方面,提供了一种处理器,处理器载有执行程序,所述程序被运行时执行上述方案中任一项所述的方法。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
在附图中:
图1是根据本发明实施例的一种基于用户偏好的路径搜索方法的流程图;
图2是根据本发明实施例的一种基于用户偏好的路径搜索系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种基于用户偏好的路径搜索方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
下面对本实施例中出现的一些名词进行定义:
POI:是Point of Interest的缩写,其一般代表地图中的地点,对于用户来说则是其感兴趣的地点,POI一般包括三方面的信息,分别是:空间信息、关键字、 POI大众评分,它被定义为:
p=(p.λ,p.ψ,p.s)
其中,p为该POI,p.λ为该POI的空间信息(即经纬度信息),p.ψ为该POI 的关键字,p.s为POI大众评分;值得说明的是,每个POI可能会包含多个关键字以通过这些关键字可以得到POI相关的基本信息。例如,有一个POI的名字为好口味川菜馆,则该POI的关键字包括:美食、川菜。因此,POI的这些关键字可以被定义为:
p.ψ=k1,k2,...,ki,...,k|p|
其中,ki为该POI的第i个关键字,|p|表示POI的关键字数量。
POI大众评分是由大众进行评分的,其代表人们对于某一个POI的喜爱程度,具体的此类打分可以从大众点评、口碑网等网站上得到,在这些网站上,人们在访问过POI后对其进行打分和评价。
搜索条件:为用户所给定的与其所感兴趣的路径相关的空间信息以及感兴趣的关键字信息;它被定义为:
q=(q.λ,q.ψ)
其中,q为搜索条件,q.λ为其所感兴趣的路径相关的空间信息,即经纬度,而q.ψ为其所感兴趣的关键字。由于关键字是用户想要搜索到的路径中的POI所要包含的信息,且其关键字数量可能大于1,则所述关键字被定义为:
q.ψ=k1,k2,...,ki,...,k|q|
其中,ki是搜索条件中的第i个关键字,|q|为搜索条件中关键字的数量。
值得说明的是,根据用户的不同需求,搜索条件中的空间信息可以有以下三种情况:
(1)空间信息的经纬度仅作为用户出发的起点,不对终点以及POI的访问顺序做限制,例如:用户搜索要求路径的起点是市府广场(经纬度数据),想要访问电影院和川菜馆;
(2)空间信息包含用户为路径指定的起点与终点,但不限制POI的访问顺序,举例来说:用户指定起点是市府广场,终点是光明小区,在此区间内访问电影院和川菜馆;
(3)空间信息包含了路径的指定起点与终点以及POI访问顺序,从市府广场出发,先访问电影院,再访问川菜馆,最后到达光明小区。
路径:是指包含若干个POI的集合即数据集,集合中各个POI具有一定的顺序并能够形成路径,则某一路径被定义为:
r={p1,p2,...,pi,...p|r|}
其中,pi为路径中的第i个POI,|r|为某一路径中POI的数量。
因为路径既包含了若干个POI,也同时包含了其中与所有POI相关的关键字ψ,即其可以表现为如下形式:
Figure GDA0002358376470000101
匹配:当某一或者几个路径其所对应的关键字ψ满足了搜索条件中的所有关键字,可以描述为:
Figure GDA0002358376470000102
从上式可以看到,搜索条件中的关键字是路径的关键字的子集。
路径的长度与总长度:路径的长度在实际生活中,是应该根据道路网络信息计算的,不过本方法中的路径长度仅由欧氏距离计算而得;这样做的原因是:首先直接计算欧氏距离能够简化计算的过程,提高算法效率;其次,在城市中的路网绝大多数都比较发达,所以欧氏距离与考虑道路网络信息这两种计算方法,在实际的计算与路径的比较中应该是差不多的;最后,还由于方法中加入了长度记录评分这一项,它将在下文进行详细介绍,受到这一指标的影响,最终路径长度实际上在方法中被弱化了,且路径长度使用简单的欧氏距离计算而造成的误差也是可以接受的。
路径总长度其实不仅包含路径的长度,还要根据用户搜索条件中空间信息的不同情况,包含用户所输入的搜索条件中对应的起点、终点和或到路径的起点、到终点的距离,总长度的计算则包含了两种情况:
(1)若空间信息只包含路径的起点,则总长度的定义如下:
Figure GDA0002358376470000103
其中,len(r)为总长度,
Figure GDA0002358376470000104
为搜索条件的起点到路径的起点长度,
Figure GDA0002358376470000105
为路径中第一个POI到第二个POI的距离;
(2)若空间信息包含路径的起点和终点,则总长度的定义如下:
Figure GDA0002358376470000106
其中,len(r)为长度,
Figure GDA0002358376470000107
为搜索条件的起点到路径的起点长度,
Figure GDA0002358376470000108
为路径中第一个POI到第二个POI的距离,
Figure GDA0002358376470000109
为路径中最后一个POI到搜索条件终点的长度。
如图1所提供的一种基于用户偏好的路径搜索方法,其特征在于,包括如下步骤:
S1、输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;
S2、在路径筛选过程中调用离线POI数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则执行S3,否则执行S4,其中,所述离线POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI 大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI数据能够包含所述搜索条件中的全部关键字;
S3、存储全部的POI数据并生成候选路径集合;
S4、更改S2中的搜索半径重复S2,直至存在与所述搜索信息匹配的候选的路径;
S5、调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;
S6、显示由排序后各个候选路径所构成的排序结果以供用户选择;
S7、记录用户所选择的路径并同步更新用户偏好数据集。
作为一种可选的实施方式中,当给定搜索条件时,以搜索条件的空间信息为中心,以R为初始搜索半径进行搜索,将搜索到的满足搜索条件的POI加入候选POI集合中;如果在半径R中搜索到的POI可以包括搜索条件中的关键字,则搜索结束,具体的,所述S2中的搜索过程是指基于所输入的搜索条件中的空间信息为中心,以设定的搜索距离为搜索半径搜索其所构成的搜索区域中所包含POI数据以完成POI匹配,所匹配的POI目标是在数据中搜索到包含搜索条件关键字的POI,这些POI将在接下来的候选路径生成中使用。
为了避免如果半径R的区域内的POI不能匹配搜索条件的关键字的情况:
作为一种可选的实施方式中,所述S4中搜索半径的更改条件是按照一定比率扩大当前的搜索半径继续搜索,直至存在与所述搜索信息匹配的候选的路径即候选POI集合中的POI可以满足搜索条件的关键字;
具体的,在搜索过程中,搜索半径R将按照如下的方式进行扩大:
Figure GDA0002358376470000121
其中,R为扩大前的搜索半径,
Figure GDA0002358376470000122
为扩大后的搜索半径,
Figure GDA0002358376470000123
为搜索半径扩大调节参数,其由用户设定;同时R的初始值会在用户做出选择后进行更新,这部分内容将在用户偏好数据集更新的描述中进行详细介绍。
作为一种可选的实施方式中,在进行POI匹配后,符合搜索条件的POI被暂存在候选POI集合中,现假设候选POI集合中有N个POI,并根据候选POI集合生成候选路径;具体的所述S3中以遍历所存储的全部的POI数据方式查找每一符合搜索条件的候选路径并生成候选路径集合;否则以路径长度最短为准则确认出相应的候选路径并生成候选路径集合。显然,最终的候选路径应该包含搜索条件中的所有关键字,不过在候选POI集合中,可能有多个POI对应了搜索条件中的某一关键字,所以候选路径便是在候选POI集合中找到若干条路径,这些路径都要符合搜索条件,本实施方式中之所以采用遍历候选POI集合的方式生成候选路径,是因为虽然效率稍低,但可以确保得到所有可能的路径,避免有遗漏路径的情况,这里用一个简单的例子,用以说明如何生成候选路径,同时这个例子将贯穿整个候选路径集合并生成流程:
现有一个搜索条件,其中包含3个关键字,记做q.ψ=(k1,k2,k3),在候选POI 集合中包含了5个POI,它们是A(k1),B(k2),C(k2),D(k3),E(k3);A、B、C、D、E 是POI的名字,括号里为其包含的关键字,它们可以由下面的表格表示:
k<sub>1</sub> k<sub>2</sub> k<sub>3</sub>
A B D
C E
在表中,第一行是搜索条件中包含的关键词,每一列代表包含该关键词的 POI名字,由表中可以清楚的看到,包含k1的POI有A,包含k2的POI有B和C,包含k3的关键字有D和E;随后通过遍历方法得到所有可能的候选路径,所以在本例当中,有搜索条件和候选POI集合,可以遍历得到候选路径的初步结果如下:
A→B→D
A→C→D
A→B→E
A→C→E
但需要说明的是,这个初步结果中的每条候选路径都是满足搜索条件的,即候选路径中包含的关键字满足用户的搜索条件,不过因为初步的候选路径中 POI的访问顺序会影响路径的总长度,所以还需要根据用户对空间信息的要求,对初步路径中的POI顺序进行调整,使得初步结果中的每一条路径长度最短。在初步结果中的候选路径经过调整后,将其加入到候选路径集合中;接着之前的例子,我们假设经过了POI顺序的调整,最后得到了4条候选路径,结果如下:
B→A→D 3km
A→D→C 4km
A→B→E 5km
E→A→C 4km
可以看到4条候选路径的POI顺序有的发生了变化,以得到路径的最小长度,同时路径的后面还显示了调整后候选路径的长度;
作为一种可选的实施方式中,如果用户已经指定了POI的访问顺序,为了达到用户的要求,候选路径生成的过程中,调整POI顺序将受到很大的限制,不能将路径长度最短作为候选路径生成的最终标准,而是以满足用户要求优先;即生成候选路径集合时还需要同时判断用户是否给定生成候选路径时对应的 POI的访问顺序,是则以用户给定的POI的访问顺序确认出相应的候选路径并生成候选路径集合。
作为一种可选的实施方式中,在所述S5中根据用户偏好以及对路径长度的敏感程度对所述候选路径集合中的每一候选路径进行综合评分以获得相应的评分结果,
其中,所述评分结果依据用户偏好对整条路径进行的综合评分,它是最终结果的排序依据,它由两部分组成:POI评分与路径长度评分值,并通过被配置有不同加权系数的POI评分值以及路径长度评分值相加构成,
所述评分结果由此被定义为:
Figure GDA0002358376470000141
其中,PS(u,pi)为用户u对于pi的POI评分(POI Score),|q.ψ|表示用户搜索条件中关键字的数量,同时该值与路径中POI的数量相等,所以
Figure GDA0002358376470000142
为候选路径中POI评分的均值,RDS(u,r)是用户u对于候选路径r的长度评分 (Route Distance Score),
Figure GDA0002358376470000143
为候选路径评分的调节参数,它的含义是候选路径评分中对于POI评分和路径长度评分的不同侧重。需要注意的是,PS和 RDS是在0到1之间的。
基于上式可以看到对路径评分时考虑到了两点:一、POI评分代表了用户对于POI的偏好,而对POI的偏好主要体现在POI所包含的关键字的偏爱程度;二、路径长度评分代表了用户对路径长度的敏感程度,换言之,用户是否愿意为了更佳的POI而接受更长的路径长度。
作为一种可选的实施方式中,鉴于POI评分值是用路径评分中很重要的一部分,它代表了用户对于POI的偏好,也是影响用户最终选择的关键因素,则 POI评分由两部组成:POI大众评分和关键字偏好评分;其中POI大众评分是由大众打分的,打分可以从大众点评、口碑网等类似的网站获取,它表示大众对于POI的喜爱程度;关键字偏好评分代表用户对于关键字的偏好情况,其是通过自用户偏好数据集中调用用户的搜索记录进行计算得到;具体的所述POI评分值由被配置有不同加权系数的POI大众评分值以及关键字偏好评分值相加构成,并定义对应的POI评分公式为
PS(u,p)=PPS(p)·KPS(u,p)
其中,PS(u,p)是用户u对于POI p的POI评分(POI Score),PPS(p)是POI p的POI大众评分(POI Popularity Score),KPS(u,p)是用户u对于POI p的关键字偏好评分(KeywordPreference Score),同时,PS(u,p)和PPS(p)都是0到1之间。可以从公式中看出,通过相乘的关系,POI大众评分被用户的关键字偏好评分加权,这会出现两种情况:假设一个POI的大众评分稍低,不过用户对其包含的关键词有强烈的偏爱,所以该POI的评分可能因为用户的偏爱而更高一些;反之,一个POI的大众评分很高,不过用户对其不是很喜欢,所以最终该POI的评分可能不会太高。
作为一种可选的实施方式中,POI大众评分是由大众打分得到,存储在离线模块的POI数据集中,它通常可以从大众点评、口碑网等用户点评类的网站获得,在此类网站中,用户可以对POI进行点评、打分,网站根据众多用户的评分,通过一定的算法而给每个POI一个大众评分,这个评分值得参考,它反映了大众用户对POI的评价,分数越高越受到用户的欢迎;基于上述原理,则设定所述POI大众评分值是通过提取离线POI数据集中某一大众评分网站所获取的对当前候选路径上各POI数据的大众打分数据即POI大众评分获得;
不过,由于不同的网站都有不同的评价评分算法,但总体来说基本类似,最主要的不同便是总分的差异,有的网站是5分制,有的则是10分制甚至是百分制,所以在保证POI大众评分数据来自于同一网站的基础上,都需要对其进行一次预处理,来使得本算法适应所有点评类网站的数据。
则定义POI大众评分公式为:
Figure GDA0002358376470000151
其中,PPS是POI大众评分(POI Popularity Score),p.s是POI p在点评类网站中的评分,而Fullscore表示该点评类网站的总分;举一个简单的例子,假设有个POI在大众点评网站的评分是4分,而大众点评是5分制,即总分为5分,所有最后该POI大众评分为4/5=0.8分。经过这样的预处理,所有的点评类网站的评分都能转换为0到1的分数,这个分数作为POI大众评分存储在离线模块数据集中。
作为一种可选的实施方式中,鉴于关键字评分代表了用户对于不同关键字的偏好程度,则关键字评分可以包括两部分:关键词搜索记录评分和关键词选择记录评分;包含的这两种评分是通过用户偏好数据集的历史关键词偏好数据计算而得,这些历史数据都保存在离线模块中;具体的,所述关键字偏好评分值由被配置有不同加权系数的关键词搜索记录评分值以及关键词选择记录评分值相加构成,对应的关键字偏好评分定义为:
Figure GDA0002358376470000161
其中,KQRS(u,p)为用户u对于POIp的关键字搜索记录评分(Keyword QueryRecord Score),KSRS(u,p)为用户u对于POIp的关键字选择记录评分(Keyword SelectRecord Score);而
Figure GDA0002358376470000162
为关键字偏好评分的调节参数,它表示对于关键字评分中的KQRS(u,p)和KSRS(u,p)之间的调节,
Figure GDA0002358376470000163
越大,则对KQRS(u,p)更加偏重,反之则是对KSRS(u,p)更加偏重。
作为一种可选的实施方式中,鉴于用户的每一次搜索都会被记录下来,保存在离线模块中,恰好这些搜索记录能够反映用户的偏好,而关键字搜索记录评分KQRS(u,p)就是通过用户的搜索记录进行计算的;换句话说,如果一个用户频繁的搜索某一关键字,这便反映出该用户对于这一关键字的偏爱,比如一个用户总是搜索川菜,这可以看出用户比较喜欢吃川菜,也就更重视川菜相关POI 的质量。同时,每个关键字可以被分到某一类中,比如篮球可以被分到体育类中,川菜可以被分到餐饮类中,用户搜索的关键词所属类别,也可以反映出用户对于一类关键字的偏好,比如一个用户经常搜索体育类的关键字,这便说明该用户比较喜欢运动,所以该用户一定会更重视体育类的POI;
基于以上的分析,关键字搜索记录评分可以被两方面因素影响,一是关键字偏好数据中的关键字搜索记录关于用户搜索的关键字,二是用户搜索的关键字所属类别,则使得所述关键词搜索记录评分值是通过提取出关键字偏好数据中的关键字搜索记录后以搜索记录中的用户所搜索的关键字以及用户所搜索的关键字所属类别进行加权计算获得,定义键字搜索记录评分KQRS(u,p)对应的公式为:
Figure GDA0002358376470000171
其中,KQFS(u,ki)是用户u对于关键字ki的关键字搜索频率评分(Keyword QueriedFrequency Score),CQFS(u,ki)是用户u对于关键字ki的类别搜索频率评分 (CategoryQueried Frequency Score),
Figure GDA0002358376470000172
是关键字搜索记录评分的调节参数,同之前的调节参数类似,它调节了公式中两方面评分之间的比重;因为每个POI可能会含有多个关键字,所以在此次评分计算中只选择POI所有关键字中频率最高的,即
Figure DEST_PATH_BDA0001533333680000173
表示POI p中对于用户u而言最大的KQFS(u,ki)值,同理可知
Figure GDA0002358376470000175
的具体含义;
作为一种可选的实施方式中,接下来详细的介绍一下KQFS(u,k)和 CQFS(u,k):
定义KQFS(u,k)的公式如下:
Figure GDA0002358376470000176
其中,f(u,k)是用户u对关键词k搜索频次,而Maximumf(u)是用户u搜索的所有关键字记录中的最高频次;条同时为了解决冷启动问题,需要注意的是使得每个关键字的f(u,k)初值都为1,同时通过KQFS(u,k)的定义可知,它的取值范围在0到1之间;另外,f(u,k)会在用户每次进行搜索后进行更新,用户u如果搜索了关键词k,则f(u,k)会进行加一操作,并更新离线模块中的用户偏好数据。对应的定义CQFS(u,k)公式如下:
Figure GDA0002358376470000181
其中,fc(u,k)是用户u对关键词k所属类别的搜索频次,而Maximumfc(u)是用户u搜索所有类别中的最高频次;与f(u,k)相同的是,fc(u,k)的初始值也为1,CQFS(u,k)的取值范围也在0到1之间;fc(u,k)会在用户进行搜索之后进行更新,用户u如果搜索了某个关键字k,它所处的类别c的fc(u,k)会进行加一操作,并更新离线模块中的数据。
作为一种可选的实施方式中,用户进行搜索后,本方法会将结果返回给用户,供其选择,在用户做出自己的选择之后,关键字选择记录评分KSRS(u,p)便通过用户的选择情况进行更新计算,该值表示用户通过做出选择而体现出的对于不同关键字的偏好情况,而它的更新计算便是对用户的偏好进行学习的过程;所述学习过程包括:使得所述关键词选择记录评分值KSRS(u,p)是通过对关键字偏好数据中的关键字记录进行统计计算获得,对应的公式为
Figure GDA0002358376470000182
其中,KSRS(u,p)表示用户u对于POIp的关键字选择记录评分,KSRS(u,ki)是用户u对于关键字ki的KSRS值,
Figure GDA0002358376470000183
表示用户u对于POIp中的所有 KSRS的最大值;由于每个POI中可能会包含多个关键字,对于一个POI而言,其KSRS值便是POI中所有关键字KSRS最大的。同时,KSRS(u,p)的取值范围在 0到1之间,而且还需要设定一个初始值,如假设其初始值为0.2。
作为一种可选的实施方式中,为了区别现有搜索算法都将路径长度作为很重要的因素考虑,路径长度越短的容易排名靠前的设计思想,本方法则更重视的是路径中的POI是否可以很好的满足用户的偏好,因此在对路径长度评分时除了路径长度这一客观因素以外,主要考虑的是用户对于路径长度的忍耐度,换句话说,路径长度评分很大程度上取决于用户是否愿意为了质量更高的POI 而选择路径长度更长的路径;具体方案为使得所述路径长度评分值即为用户偏好数据集中的距离敏感度,所述距离敏感度由候选路径的路径长度评分以及反馈用户对路径长度的忍耐度的长度记录评分相乘构成,对应的公式为
RDS(u,r)=DS(r)·DRS(u)
其中,DS(r)是路径r的长度评分(Distance Score),DRS(u)是用户u的长度记录评分(Distance Record Score)。DS(r)由路径的客观长度计算得到,该值随着路径长度的增大而减小,而DRS(u)则是对用户偏好数据集中的选择记录计算得到;从RDS的公式中可以看到,通过乘法的方式DS(r)被DRS(u)加强了。举例来说,对于一个用户u,他的DRS(u)值足够大,说明其对路径长度并不敏感,愿意为了更高质量的POI而花费更多的时间在路上,所以就算DS(r)很小,即路径的长度比较大,RDS依旧能够得到比较大的值,换句话说,如果DRS(u)足够大的话,路径长度较大也并没有过多的影响到最终RDS的值。
作为一种可选的实施方式中,由于长度评分DS(r)直接反应了路径的客观长度,对应的公式为
Figure GDA0002358376470000191
其中,
Figure GDA0002358376470000192
为长度评分的调节参数,len(r)为路径r的长度;当然,len(r)是包括以下几个部分:包括从搜索条件的起点到路径的第一个POI、路径本身的长度、从路径最后一个POI到搜索条件的终点;由长度评分的公式可知,DS(r) 是在0到1之间的,当然,长度评分DS(r)随着长度len(r)的增大而减小。同时鉴于长度记录评分DRS(u)反映了用户对于路径长度的忍耐度,该值会在用户做出选择之后进行更新,这个更新的过程就是学习用户对于路径长度的忍耐度的过程。
作为一种可选的实施方式中,在对候选路径进行评分与排序后,显示排序结果以供用户选择时会将排在前k的路径结果返回给用户进行选择;同时在路径的搜索结果显示中,还可以展示一些额外的信息给用户,包括路径中每个POI 的大众评分与路径的长度,按照之前的例子,此时列出前4条路径的结果:
1 B(4)→A(5)→D(3)3km
2 A(5)→D(3)→C(5)4km
3 A(5)→B(4)→E(4)5km
4 E(4)→A(5)→C(5)4km
从结果中可以看到,每个POI名称后面的括号中显示了该POI的大众评分,每条路径后均显示了整条路径的总长度;这两种信息将会影响到用户的选择,用户可根据这两个信息以及排序结果做出一个选择,这个选择应该是用户最满意的一个。
作为一种可选的实施方式中,由于用户通过路径搜索结果提供的信息,可根据自己的偏好进行选择;在用户进行选择之后,所选路径包含的这两种信息可以反应出用户的偏好,POI大众评分反应出用户对POI的关键字的偏爱程度,路径长度反应了用户对于路径长度的忍耐度,之前算法中的若干变量也将根据用户的选择进行更新,这个变量更新的过程也可以理解为是对用户偏好的学习,更新后的变量也将应用于用户的下一次搜索,随着用户对于路径搜索的不断使用,算法内变量也将逐步适应用户的偏好,使得搜索算法根据不同用户的偏好而越来越准确;则可以得出在所述S6中所述用户偏好数据集的更新过程包括:更新关键字选择记录评分、更新路径长度评分以及更新用户在进行下一搜索时步骤S2中对应的初始搜索半径;
作为一种可选的实施方式中,用户的偏好可以在用户进行选择之后了解到,所以关键字选择记录评分KSRS(u,p)在用户进行选择后进行更新,以此来学习用户的偏好。先回到我们之前举的例子,为了更容易进行说明,现将路径搜索结果换一种方式展示:
Figure GDA0002358376470000201
Figure GDA0002358376470000211
表中第一行为搜索条件的关键字,例子中共有三个关键字,从表中可以看出,路径搜索结果由POI访问顺序的形式,改成了以关键字为划分的形式,搜索结果中相同关键字的POI都处于一列,而每个POI后面括号中显示的是其大众评分。第三条路径是用户选择的,而这也相当于,用户选择了第三条路径中的每一个POI。
则基于上述内容,关键字选择记录评分基于第一更新计算公式进行更新,所述第一更新计算公式为
更新后关键字选择记录评分
Figure GDA0002358376470000212
其中,KSRS(u,k)是更新前,用户u对于关键字k的关键字选择记录评分,ps.s是用户选择的POI的大众评分,
Figure GDA0002358376470000213
是搜索结果中关键字k对应的平均POI大众评分,αKSRS(∈(0,1))是关键字选择记录评分的学习率,其是关键字选择记录评分的学习率,学习率越大,对用户偏好的学习也就越快,用户的选择对于关键字选择记录评分的影响也就越大。需要说明的是,KSRS(u,k)被定义在0到1之间,换言之,当它为1时便不能再增大,它为0时不能再减小。
现在再次回到例子中,通过具体数值来说明关键词k2和k3对应的KSRS(u,k2) 和KSRS(u,k3)的更新方法;首先假设学习率αKSRS=0.1,同时现在关键字选择记录评分的值如下:KSRS(u,k2)=0.2以及KSRS(u,k3)=0.2;从表中可以看到,对于k2而言,用户选择的POI为B,它的POI大众评分为ps.s=4,平均POI大众评分为
Figure GDA0002358376470000214
所以,KSRS(u,k2)的更新为:
KSRS(u,k2)←0.2+0.1·(4-4.5)=0.15
对于k3而言,用户选择的POI为E,它的POI大众评分为ps.s=4,平均POI 大众评分为
Figure GDA0002358376470000215
所以,KSRS(u,k3)的更新为:
KSRS(u,k3)←0.2+0.1·(4-3.5)=0.25
通过以上的计算可知,KSRS(u,k2)的值减少了0.05,而KSRS(u,k3)的值增加了0.05。这是由于在关键字k2中,用户选择的POI的大众评分低于关键字k2下的平均POI大众评分,这也说明用户对于关键字k2没那么重视;而在关键字k3中,用户选择的POI的大众评分高于关键字k3下的平均POI大众评分,这便说明用户对于关键字k3更加的偏爱。综上可知虽然在用户做出选择之前,KSRS(u,k2)和 KSRS(u,k3)的值都为0.2,所以算法中对于k2和k3的重视程度是一样的;但当用户做出选择之后,通过用户的选择对KSRS(u,k2)和KSRS(u,k3)进行了更新,更新后, KSRS(u,k2)为0.15,而KSRS(u,k3)为0.25,因此通过这次选择,算法学习到用户更偏爱于关键字k3,在用户下一次搜索中,包含关键词k3的POI将获得更高的评分。
作为一种可选的实施方式中,路径长度评分的更新方法和KSRS(u,k)是类似的,在用户经过选择之后,它将按照第二更新计算公式进行更新,所述第二更新计算公式为
更新后的路径长度评分
Figure GDA0002358376470000221
其中,DRS(u)是更新前的路径长度评分,αDRS(∈(0,1))是长度记录评分的学习率,
Figure GDA0002358376470000222
是路径搜索结果中的长度评分的平均值,DS(rs)是用户选择的路径rs的长度评分;需要说明的是,DRS(u)需要有初始值,一般设为0.5即可。同时,DRS(u) 的值一直处于0到1之间,也就是说,当DRS(u)为1时,它不能再增长了,这说明用户对于路径长度的忍耐度相当的强,用户可以接受几乎任何长度的路径结果,同样DRS(u)也不能减小至小于0。
作为一种可选的实施方式中,在POI匹配时,需要在一个半径R内进行搜索,它决定了POI搜索的初步范围,这个初步范围也是与用户对于路径长度的忍耐度有关;换言之,如果用户可以忍耐更长的路径,在POI匹配时,便可以扩大搜索半径,从而增加搜索到质量更高的POI的概率。所以,半径R也可以像DRS(u)一样,在用户做出选择之后进行更新,则使得搜索半径基于第三更新计算公式进行更新,所述第三更新计算公式为
更新后的搜索半径
Figure GDA0002358376470000231
其中,R是更新前的搜索半径,αR为搜索半径R的学习率,
Figure GDA0002358376470000232
和DS(rs)分别代表路径搜索结果中的长度评分的平均值以及用户选择的路径rs的长度评分。
作为一种可选的实施方式中,为了减少对候选路径评分过程中的计算量,所述方法还通过剪枝算法在路径筛选过程中移除不符合要求的路径;本例给出两个剪枝算法对候选POI集合以及候选路径集合进行筛选,将不符合要求的路径移除;这种移除一定会使得一些优秀的结果不显示在最终的搜索结果中,但剪枝算法根据用户的偏好,在候选路径生成和在计算路径评分之前,就可以移除一些用户在最终也不会选择的路径。具体的通过定义两种下界评分规则使得当执行剪枝算法的时候,低于这两个下界评分的路径将会被移除。
其一,POI大众评分下界:将第一个剪枝算法中用到的下界评分被称为POI 大众评分下界,它将在候选路径生成之前执行。在候选POI集合中,如果有某个POI的大众评分低于POI大众评分下界(PPS(p)<LBPPS),这个POI将被移除。
但需要注意的是,对于搜索条件中的任意一个关键字,候选路径中都必须有一个POI包含该关键字,否则在路径生成时将没有任何路径可以满足搜索条件。所以对于搜索条件中的某一关键字而言,如果候选POI集合中包含该关键字的POI都不满足POI大众评分下界,则保留这些POI中大众评分最高的一个,作为后续步骤。POI大众评分下界是由关键词偏好评分计算而得,这个下界代表用户能够忍受的POI最低评分。如果用户的关键词偏好评分比较高,说明用户对该类POI比较重视,所以用户也就能够接受稍微低一些的POI,POI大众评分下界也应该稍低一些,更少的POI会经过剪枝算法而被移除,搜索结果中可以尽量提供更多的POI供用户进行选择。因此,POI大众评分下界被定义为:
Figure GDA0002358376470000241
其中,LBPPS(u,p)是用户u对于POIp的POI大众评分下界,
Figure GDA0002358376470000242
是调节参数, KPS(u,p)是用户u对于POIp的关键字偏好评分。由定义可知,LBPPS(u,p)是随着 KPS(u,p)的增大而减小,且LBPPS(u,p)的取值范围在0到1之间。
其二,长度评分下界:长度评分下界作为第二个剪枝算法用到的标准,它是在候选路径生成之后执行;对于候选路径集合中的路径,如果有某条路径,它的长度评分低于长度评分下界的(DS(r)<LBDS),它就会被移除。当然,候选路径集合中的路径一定要大于k,因为这是最终要返回给用户的路径数量。如果经过本剪枝算法的执行,使得候选路径集合中的路径数量少于k,则直接保留候选路径集合中长度评分排在前k的即可,剩下的路径全部被移除掉。而长度评分下界是由用户的长度记录评分计算得到的,该下界代表用户对路径长度忍耐的底线,如果用户有一个比较高的长度记录评分,说明用户能够忍受路径长度更长的路径,所以长度评分下界便会随之降低到较低的水平,因而执行完剪枝算法后,将有更多的路径得以保留,在最终的搜索结果中提供给用户进行选择。因此,长度评分下界被定义为:
Figure GDA0002358376470000243
其中,LBDS(u)是用户u的长度评分下界,
Figure GDA0002358376470000244
为调节参数,DRS(u)是用户u的长度记录评分。
如图2,根据本发明实施例的另一个方面,还提供了一种基于用户偏好的路径搜索系统,其特征在于,包括:搜索条件输入单元,其用于输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;路径筛选单元,其用于在路径筛选过程中调用离线POI 数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则启动第一生成候选路径单元,否则启动第二生成候选路径单元,其中,所述离线POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI数据能够包含所述搜索条件中的全部关键字;第一生成候选路径单元,其用于存储全部的POI数据并生成候选路径集合;第二生成候选路径单元,其用于更改路径筛选单元中的搜索半径并使得路径筛选单元重新按照更改后的搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,直至存在与所述搜索信息匹配的候选的路径;候选路径评分排序单元,其用于调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;显示单元,其用于显示由排序后各个候选路径所构成的排序结果以供用户选择;以及记录及更新单元,其用于记录用户所选择的路径并同步更新用户偏好数据集。
由于所述系统与上述方法基于同一设计原理构造,因此对于其对应的可选的实施方式不再赘述,仅对上述方案作以简单说明;所述系统中所涉及的POI 数据集以及用户偏好数据集可以集中在离线模块中进行存储,用户对于距离的敏感度,换言之便是,就是用户是否可以忍受路径较远的距离;搜索条件输入单元、路径筛选单元、第一生成候选路径单元、第二生成候选路径单元、候选路径评分排序单元、显示单元以及记录及更新单元均可以集成于在线模块中供用户使用。
根据本发明实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述方法。
根据本发明实施例的另一个方面,还一种处理器,处理器包括处理器的程序,其中,在程序运行时控制处理器所在设备执行上述方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的系统实施例仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括: U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于用户偏好的路径搜索方法,其特征在于,包括如下步骤:
S1、输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;
S2、在路径筛选过程中调用离线POI数据集,搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则执行S3,否则执行S4,其中,所述离线POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI数据能够包含所述搜索条件中的全部关键字;所述S2中的搜索过程是指基于所输入的搜索条件中的空间信息为中心,以设定的搜索距离为搜索半径搜索其所构成的搜索区域中所包含POI数据;所述S4中搜索半径的更改条件是按照一定比率扩大当前的搜索半径继续搜索,直至存在与所述搜索信息匹配的候选的路径;
S3、存储全部的POI数据并生成候选路径集合;
S4、更改S2中的搜索半径重复S2,直至存在与所述搜索信息匹配的候选的路径;
S5、调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;
S6、显示由排序后各个候选路径所构成的排序结果以供用户选择;
S7、记录用户所选择的路径并同步更新用户偏好数据集;
在所述S7中所述用户偏好数据集的更新过程包括:更新关键字选择记录评分、更新路径长度评分以及更新用户在进行下一搜索时步骤S2中对应的初始搜索半径,
其中,关键字选择记录评分基于第一更新计算公式进行更新,所述第一更新计算公式为
更新后关键字选择记录评分
Figure FDA0002358376460000021
其中,KSRS(u,k)是更新前,用户u对于关键字k的关键字选择记录评分,ps.s是用户选择的POI的大众评分,
Figure FDA0002358376460000026
是搜索结果中关键字k对应的平均POI大众评分,αKSRS(∈(0,1))是预设的关键字选择记录评分的学习率,
路径长度评分基于第二更新计算公式进行更新,所述第二更新计算公式为更新后的路径长度评分
Figure FDA0002358376460000022
其中,DRS(u)是更新前的路径长度评分,αDRS(∈(0,1))是长度记录评分的学习率,
Figure FDA0002358376460000023
是路径搜索结果中的长度评分的平均值,DS(rs)是用户选择的路径rs的长度评分;
搜索半径基于第三更新计算公式进行更新,所述第三更新计算公式为
更新后的搜索半径
Figure FDA0002358376460000024
其中,R是更新前的搜索半径,αR为搜索半径R的学习率,
Figure FDA0002358376460000025
和DS(rs)分别代表路径搜索结果中的长度评分的平均值以及用户选择的路径rs的长度评分。
2.根据权利要求1所述的路径搜索方法,其特征在于:
所述S3中以遍历所存储的全部的POI数据方式查找每一符合搜索条件的候选路径并生成候选路径集合同时判断用户是否给定生成候选路径时对应的POI的访问顺序,是则以用户给定的POI的访问顺序确认出相应的候选路径并生成候选路径集合;否则以路径长度最短为准则确认出相应的候选路径并生成候选路径集合。
3.根据权利要求1所述的路径搜索方法,其特征在于:
在所述S5中根据用户偏好以及对路径长度的敏感程度对所述候选路径集合中的每一候选路径进行综合评分以获得相应的评分结果,其中,所述评分结果由被配置有不同加权系数的POI评分值以及路径长度评分值相加构成,所述POI评分值由被配置有不同加权系数的POI大众评分值以及关键字偏好评分值相加构成,所述POI大众评分值是通过提取离线POI数据集中某一大众评分网站所获取的对当前候选路径上各POI数据的大众打分数据即POI大众评分获得,所述关键字偏好评分值由被配置有不同加权系数的关键词搜索记录评分值以及关键词选择记录评分值相加构成,所述关键词搜索记录评分值是通过提取出关键字偏好数据中的关键字搜索记录后以搜索记录中的用户所搜索的关键字以及用户所搜索的关键字所属类别进行加权计算获得,所述关键词选择记录评分值是通过对关键字偏好数据中的关键字记录进行统计计算获得;所述路径长度评分值即为用户偏好数据集中的距离敏感度,所述距离敏感度由候选路径的路径长度评分以及反馈用户对路径长度的忍耐度的长度记录评分相乘构成。
4.根据权利要求1所述的路径搜索方法,其特征在于:
所述方法还通过剪枝算法在路径筛选过程中移除不符合要求的路径。
5.一种基于用户偏好的路径搜索系统,其特征在于,包括:
搜索条件输入单元,其用于输入搜索条件进行路径筛选,其中所述搜索条件用于用户给定与其所感兴趣的路径相关的空间信息以及关键字信息;
路径筛选单元,其用于在路径筛选过程中调用离线POI数据集,以设定的初始搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,是则启动第一生成候选路径单元,否则启动第二生成候选路径单元,其中,所述离线POI数据集是预存储的用户所在城市所对应的若干POI数据的集合,该POI数据至少以若干用户所在城市所对应的空间信息、关键字以及POI大众评分为数据元素所构成的数据包,所述匹配是指在所述离线POI数据集中所搜索到的POI数据能够包含所述搜索条件中的全部关键字;所述路径筛选单元中的搜索过程是指基于所输入的搜索条件中的空间信息为中心,以设定的搜索距离为搜索半径搜索其所构成的搜索区域中所包含POI数据;所述第二生成候选路径单元中搜索半径的更改条件是按照一定比率扩大当前的搜索半径继续搜索,直至存在与所述搜索信息匹配的候选的路径;
第一生成候选路径单元,其用于存储全部的POI数据并生成候选路径集合;
第二生成候选路径单元,其用于更改路径筛选单元中的搜索半径并使得路径筛选单元重新按照更改后的搜索半径搜索并判断是否存在与所述搜索信息匹配的候选的路径,直至存在与所述搜索信息匹配的候选的路径;
候选路径评分排序单元,其用于调用离线POI数据集以及用户偏好数据集对所述候选路径集合中的每一候选路径进行评分并排序,其中,所述用户偏好数据集至少为以用户在其搜索历史中所提取的关键字偏好数据以及距离敏感度为数据元素所构成的数据包;
显示单元,其用于显示由排序后各个候选路径所构成的排序结果以供用户选择;
记录及更新单元,其用于记录用户所选择的路径并同步更新用户偏好数据集;记录及更新单元对用户偏好数据集的更新过程包括:更新关键字选择记录评分、更新路径长度评分以及更新用户在进行下一搜索时步骤S2中对应的初始搜索半径,
其中,关键字选择记录评分基于第一更新计算公式进行更新,所述第一更新计算公式为
更新后关键字选择记录评分
Figure FDA0002358376460000041
其中,KSRS(u,k)是更新前,用户u对于关键字k的关键字选择记录评分,ps.s是用户选择的POI的大众评分,
Figure FDA0002358376460000044
是搜索结果中关键字k对应的平均POI大众评分,αKSRS(∈(0,1))是关键字选择记录评分的学习率,
路径长度评分基于第二更新计算公式进行更新,所述第二更新计算公式为更新后的路径长度评分
Figure FDA0002358376460000042
其中,DRS(u)是更新前的路径长度评分,αDRS(∈(0,1))是长度记录评分的学习率,
Figure FDA0002358376460000043
是路径搜索结果中的长度评分的平均值,DS(rs)是用户选择的路径rs的长度评分;
搜索半径基于第三更新计算公式进行更新,所述第三更新计算公式为更新后的搜索半径
Figure FDA0002358376460000051
其中,R是更新前的搜索半径,αR为搜索半径R的学习率,
Figure FDA0002358376460000052
和DS(rs)分别代表路径搜索结果中的长度评分的平均值以及用户选择的路径rs的长度评分。
6.根据权利要求5所述的路径搜索系统,其特征在于:
所述第二生成候选路径单元能够以遍历所存储的全部的POI数据方式查找每一符合搜索条件的候选路径并生成候选路径集合同时判断用户是否给定生成候选路径时对应的POI的访问顺序,是则以用户给定的POI的访问顺序确认出相应的候选路径并生成候选路径集合;否则以路径长度最短为准则确认出相应的候选路径并生成候选路径集合;候选路径评分排序单元能够根据用户偏好以及对路径长度的敏感程度对所述候选路径集合中的每一候选路径进行综合评分以获得相应的评分结果,其中,所述评分结果由被配置有不同加权系数的POI评分值以及路径长度评分值相加构成,所述POI评分值由被配置有不同加权系数的POI大众评分值以及关键字偏好评分值相加构成,所述POI大众评分值是通过提取离线POI数据集中某一大众评分网站所获取的对当前候选路径上各POI数据的大众打分数据即POI大众评分获得,所述关键字偏好评分值由被配置有不同加权系数的关键词搜索记录评分值以及关键词选择记录评分值相加构成,所述关键词搜索记录评分值是通过提取出关键字偏好数据中的关键字搜索记录后以搜索记录中的用户所搜索的关键字以及用户所搜索的关键字所属类别进行加权计算获得,所述关键词选择记录评分值是通过对关键字偏好数据中的关键字记录进行统计计算获得;所述路径长度评分值即为用户偏好数据集中的距离敏感度,所述距离敏感度由候选路径的路径长度评分以及反馈用户对路径长度的忍耐度的长度记录评分相乘构成。
7.一种存储介质,其特征在于,所述存储介质上保存有程序,所述程序被运行时执行权利要求1至4中任一项所述的方法。
8.一种处理器,处理器载有执行程序,其特征在于,所述程序被运行时执行权利要求1至4中任一项所述的方法。
CN201711478536.4A 2017-12-29 2017-12-29 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器 Active CN108197241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711478536.4A CN108197241B (zh) 2017-12-29 2017-12-29 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711478536.4A CN108197241B (zh) 2017-12-29 2017-12-29 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器

Publications (2)

Publication Number Publication Date
CN108197241A CN108197241A (zh) 2018-06-22
CN108197241B true CN108197241B (zh) 2020-05-01

Family

ID=62586550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711478536.4A Active CN108197241B (zh) 2017-12-29 2017-12-29 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器

Country Status (1)

Country Link
CN (1) CN108197241B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109254983B (zh) * 2018-09-19 2021-07-13 九江学院 一种众包TOP-k查询中的降低成本方法
CN110426052A (zh) * 2019-07-05 2019-11-08 中国平安财产保险股份有限公司 路径获取方法、系统、设备及计算机可读存储介质
CN110672101B (zh) * 2019-09-20 2021-09-28 北京百度网讯科技有限公司 导航模型训练方法、装置、电子设备及存储介质
CN112364238B (zh) * 2020-10-12 2023-04-07 山东大学 一种基于深度学习的用户兴趣点推荐方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102077056A (zh) * 2008-06-27 2011-05-25 株式会社丰田It开发中心 路径搜索装置和路径搜索方法
CN106021305A (zh) * 2016-05-05 2016-10-12 北京邮电大学 一种模式与偏好感知的poi推荐方法及系统
CN106033589A (zh) * 2015-03-10 2016-10-19 上海昕鼎网络科技有限公司 一种旅游路线个性化服务方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325894A1 (en) * 2012-06-01 2013-12-05 CityMaps Logo-enabled interactive map integrating social networking applications

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102077056A (zh) * 2008-06-27 2011-05-25 株式会社丰田It开发中心 路径搜索装置和路径搜索方法
CN106033589A (zh) * 2015-03-10 2016-10-19 上海昕鼎网络科技有限公司 一种旅游路线个性化服务方法及系统
CN106021305A (zh) * 2016-05-05 2016-10-12 北京邮电大学 一种模式与偏好感知的poi推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于用户偏好的个性化路径挖掘研究";蒋晓玲;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160315;第I138-7709页 *

Also Published As

Publication number Publication date
CN108197241A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN108197241B (zh) 一种基于用户偏好的路径搜索方法、系统、存储介质和处理器
WO2016107417A1 (zh) 基于旅游目标地域来挖掘旅游路线的方法和设备
US8315953B1 (en) Activity-based place-of-interest database
US7136845B2 (en) System and method for query refinement to enable improved searching based on identifying and utilizing popular concepts related to users&#39; queries
US6041311A (en) Method and apparatus for item recommendation using automated collaborative filtering
US20190340537A1 (en) Personalized Match Score For Places
US6092049A (en) Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US7809721B2 (en) Ranking of objects using semantic and nonsemantic features in a system and method for conducting a search
US9754306B2 (en) Recommendation engine with profile analysis
US7921108B2 (en) User interface and method in a local search system with automatic expansion
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN103793403B (zh) 推送与搜索结果相关联信息的方法与装置
CN104199875B (zh) 一种搜索推荐方法及装置
US20140207795A1 (en) Searching and determining active area
KR101453382B1 (ko) 사용자별 검색어 추천 시스템과 방법 및 이를 구현할 수 있는 컴퓨터로 읽을 수 있는 기록 매체
JP6725718B2 (ja) 位置基盤情報探索方法およびコンピュータ装置
JP2010039710A (ja) 情報収集装置、旅行案内装置、旅行案内システム及びコンピュータプログラム
US20150248720A1 (en) Recommendation engine
US9141657B2 (en) Content delivery system with profile generation mechanism and method of operation thereof
WO2009064314A1 (en) Selection of reliable key words from unreliable sources in a system and method for conducting a search
Ge et al. MPG: not so random exploration of a city
WO2019179208A1 (zh) 下拉提示
US20230085500A1 (en) Method, apparatus, and computer program product for point-of-interest recommendations
CN109299368A (zh) 一种用于环境信息资源ai智能个性化推荐的方法及系统
Dixit et al. Proposed similarity measure using Bhattacharyya coefficient for context aware recommender system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant