CN108717447B - 一种交互式多用户空间关键词查询方法 - Google Patents

一种交互式多用户空间关键词查询方法 Download PDF

Info

Publication number
CN108717447B
CN108717447B CN201810476520.8A CN201810476520A CN108717447B CN 108717447 B CN108717447 B CN 108717447B CN 201810476520 A CN201810476520 A CN 201810476520A CN 108717447 B CN108717447 B CN 108717447B
Authority
CN
China
Prior art keywords
user
interest
point
result set
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810476520.8A
Other languages
English (en)
Other versions
CN108717447A (zh
Inventor
王勇
郝玉洁
林劼
庞子卯
高泽仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810476520.8A priority Critical patent/CN108717447B/zh
Publication of CN108717447A publication Critical patent/CN108717447A/zh
Application granted granted Critical
Publication of CN108717447B publication Critical patent/CN108717447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种交互式多用户空间关键词查询方法,其包括空间关键词数据处理步骤S1、构造查询请求步骤S2、查询初始化步骤S3、数据查询步骤S4、用户交互步骤S5;本发明提供了一种交互式空间关键词查询方法,能够适用于多用户查询的场景中,且能够通过与用户交互的方式度量查询用户潜藏的个人偏好信息,为用户提供更加准确地查询结果,提高用户查询满意度。

Description

一种交互式多用户空间关键词查询方法
技术领域
本发明涉及空间关键词查询领域,尤其涉及一种交互式多用户空间关键词查询方法。
背景技术
随着位置服务和智能终端的普及,基于位置的社交网络应用与人们的生活息息相关。在这类网络中,用户会发起多种多样的查询请求以满足自己的查询需求,例如:top-k查询、skyline查询和范围查询等。然而,这些查询仅能支持单用户发起的查询请求,却对多用户情景下的查询请求无能为力。此外,在查询处理过程中,用户往往具有某些潜藏的偏好信息。然而,这些查询却无法有效度量这些偏好信息,使得其查询结果不能精确满足用户偏好。因此,用户需要一种能够有效度量自己潜藏的偏好信息的多用户空间关键词查询方法。
专利申请号CN201610195409.2公开了一种多用户决定的空间数据查询验证方法,该方法能够提供一种多用户决定的空间数据查询验证方法,能够应用于多用户决定的场景中;一组用户可以提供自己所在的位置和偏好来得到一组满足用户需求的兴趣点;该方法可以在空间数据外包的服务模式下执行,为查询用户提供高效且准确的查询功能。该方法要求用户提供能够完美量化其偏好信息的数值向量,而非专业用户很难用一个数值向量量化其偏好信息;进而,对用户偏好信息不精确的量化会使查询产生不精确乃至错误的结果。
专利申请号CN201710556401.9公开了一种针对具备地理社交信息的群组推荐方法,该方法能为一组用户根据其查询历史推荐兴趣点;在考虑用户权重的基础上,该方法分析了每个用户的个人偏好、群组成员和社交关系,通过群组用户建模和群组推荐的方式为一组用户推荐兴趣点。该方法过于依赖用户过去的查询历史及其相关信息,无法解决冷启动等一系列的问题。
发明内容
为了解决上述问题,本发明提出一种交互式多用户空间关键词查询方法。
具体的,本发明的目的通过以下技术方案来实现:一种交互式多用户空间关键词查询方法,其特征在于,包括以下步骤:
S1.空间关键词数据处理:将携带关键词的空间地点数据视为兴趣点p,根据兴趣点p的空间邻近关系进行分组;每个分组作为一个最小边界矩形,每个最小边界矩形作为一个叶子结点ei,较大的最小边界矩形索引覆盖一个或多个叶子结点ei作为中间结点ej构造IR树;每个叶子结点ei和中间结点ej都分别关联一个关键词表;
S2.构造查询请求:给定四元数组Q={U,k,Ω,T},U代表一组查询用户组,k代表查询结束后返回的兴趣点p的个数,Ω为兴趣点p的集合,T代表根据查询用户潜藏的偏好构造的用户反馈集合;在查询提交时,用户反馈集合T被置为空集;
U={u0,u1,...,uj,...,un-1},式中ui表示用户组U中第i+1个用户,n表示用户组U中用户的个数;每一个用户ui均可表示为<uid,λ,ψ>,u.uid为用户ui的唯一标识;u.λ为其位置信息,表示为u.λ=<u.x,u.y>,u.x和u.y分别为用户ui所在的经纬度;u.ψ为用户ui的关键词需求;将用户提供的所有关键词称为查询关键词,记为Qψ
Ω={p0,p1,...,pi,...,ps},式中pi,i=1,2,3.....s,表示兴趣点p集合Ω中第i+1个兴趣点,s+1表示兴趣点p集合Ω中地点兴趣点的个数;
定义如下概念:
标准谷歌距离:给定两个关键词x和y,二者间的标准谷歌距离为:
Figure BDA0001664622220000021
式中f(x)和f(y)分别为谷歌搜索关键词x和y时返回的网页数目,f(x,y)为谷歌同时搜索关键词x和y的网页数目,N为谷歌索引的网页总数目;两个关键词的标准谷歌距离越小,其文本相关性越高;
文本相关度:给定兴趣点p和用户ui,兴趣点p所携带的关键词与用户ui所提供的关键词需求的文本相关度为:TXR(p,ui)=maxx∈p·ψ,y∈u.ψ(NGD(x,y));
空间距离:给定兴趣点pi,pj和用户ui,dN(pi,ui)和dN(pi,pj)分别代表兴趣点pi到用户ui和兴趣点pi到兴趣点pj的空间距离;
平衡向量:给定用户ui和兴趣点p元组<pτi,pιi>,在二维坐标系下构造用户ui的平衡向量
Figure BDA0001664622220000022
其中,点
Figure BDA0001664622220000023
和点
Figure BDA0001664622220000024
的坐标分别为
Figure BDA0001664622220000025
Figure BDA0001664622220000031
式中
Figure BDA0001664622220000032
Figure BDA0001664622220000033
用户满意度:给定用户ui和兴趣点元组
Figure BDA0001664622220000034
首先在二维坐标系下构造用户ui的平衡向量
Figure BDA0001664622220000035
然后绘制两条垂直于衡向量
Figure BDA0001664622220000036
的直线且两条直线分别经过点
Figure BDA0001664622220000037
Figure BDA0001664622220000038
将整个平面被这两条直线分割为A,B,C三个区域,如图3所示;给定兴趣点pj,在维坐标系下绘制点
Figure BDA0001664622220000039
然后由点
Figure BDA00016646222200000310
向平衡向量
Figure BDA00016646222200000311
及其延长线作垂线,垂足为
Figure BDA00016646222200000312
用户ui对兴趣点pj的用户满意度Mij根据点
Figure BDA00016646222200000313
的位置分布分以下三种情况:
(1)如果点
Figure BDA00016646222200000314
位于区域A中,如图3(a)所示,垂足
Figure BDA00016646222200000315
位于平衡向量
Figure BDA00016646222200000316
的延长线上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000317
(2)如果点
Figure BDA00016646222200000318
位于区域B中,如图3(b)所示,垂足
Figure BDA00016646222200000319
位于平衡向量
Figure BDA00016646222200000320
上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000321
(3)如果点
Figure BDA00016646222200000322
位于区域C中,如图3(c)所示,垂足
Figure BDA00016646222200000323
位于平衡向量
Figure BDA00016646222200000324
的延长线上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000325
给定结果集R,用户ui对结果集R的满意度为:
Figure BDA00016646222200000326
所述|R|为结果集R里兴趣点的个数,且M′i的数值越低,用户ui对结果集R的满意程度越高;
平均满意程度:给定结果集R,整个用户组U对结果集R的平均满意程度为:
Figure BDA0001664622220000041
变异系数:给定结果集R和用户组U,用户组U对结果集R的变异系数为:
Figure BDA0001664622220000042
代价函数Cost(R,Q,T):给定结果集R、三元数组Q′={U,k,T}和用户反馈集合T,代价函数Cost(R,Q′,T)为:Cost(R,Q′,T)=(C1(R,Q′)+C2(R))·C3(R,T),式中C1(R,Q′)为maxp∈R(dN(p,U))+maxp∈R(TXR(p,U)),C2(R)为
Figure BDA0001664622220000043
C3(R,T)为:
Figure BDA0001664622220000044
理想结果是最终k个兴趣点存储在结果集R中,且代价函数Cost(R,Q,T)最小;
S3.查询初始化:定义结果集R,并将其初始化为空;根据用户反馈集合T计算IR树中叶子结点、中间结点和兴趣点p的价值Val;
S4.数据查询:定义一个堆H以价值Val的升序扫描IR树的结点:先将IR树的根结点放入堆H中,每一次扫描,均将堆H的堆顶元素current弹出,并根据其状态对其进行处理;直到堆H为空或者结果集R中兴趣点p的个数达到k个,完成一次基本查询,并将结果集R返回给用户;
S5.用户交互:当查询用户组U收到返回的结果集R后,根据每一位用户潜藏的偏好信息构造用户反馈集合T,查询用户组U根据自己的满意度决定是否继续执行用户交互过程。
进一步地,步骤S1包括以下子步骤:
S11.兴趣点p的构造:每一个兴趣点p均可表示为<id,λ,ψ>,其中,p.id是兴趣点p的唯一标识,p.λ表示兴趣点p的位置,所述位置由经纬度构成,p.ψ为一组描述兴趣点p的关键词;所述p.λ=(e,||p,v||),表示兴趣点p位于道路网络G的边e上,其距离边e的端点v的长度为||p,v||;
S12.IR树的构造:将兴趣点p根据其空间位置关系信息进行分组聚集,IR树的叶子结点ei索引覆盖一个最小边界矩形,每个最小边界矩形根据空间邻近关系覆盖一组兴趣点p,并关联一个关键词表
Figure BDA0001664622220000051
所述关键词表
Figure BDA0001664622220000052
包含叶子结点索引覆盖的所有兴趣点p携带的不同关键词;IR树的中间节点ej索引一个较大的最小边界矩形,其覆盖一组较小的最小边界矩形,并关联一个关键词表
Figure BDA0001664622220000053
所述关键词表
Figure BDA0001664622220000054
为其索引覆盖的所有叶子结点ei的关键词表
Figure BDA0001664622220000055
的并集。
进一步地,所述的步骤S3包括以下子步骤:
S31.结果集R初始化:定义结果集R,并将其初始化为空;
S32.价值Val计算:根据用户反馈集合T计算IR树中叶子结点、中间结点和兴趣点p的价值Val:
给定兴趣点p和计算兴趣点p价值时的结果集R′,兴趣点p的价值Valp为:Valp=(C1(R′∪p,Q)+C2(R′∪p))·C3(R′∪p,T);
给定叶子结点ei和计算结点ei价值时的结果集R′,叶子结点ei价值
Figure BDA0001664622220000056
为:
Figure BDA0001664622220000057
给定中间结点ej和计算结点ej价值时的结果集R′,中间结点ej价值
Figure BDA0001664622220000058
为:
Figure BDA0001664622220000059
进一步地,对于任意一个结点来说,不论这个结点是叶子结点还是中间结点,它的价值Val一定低于或者等于其所有孩子结点的价值Val的最小值。
优选地,步骤S4中对堆顶元素current的状态处理分为以下两种情况:
(1)如果弹出的堆顶元素current是IR树的中间结点或者叶子结点,则计算current的所有孩子结点的价值,然后根据其所有孩子结点的价值,将这些孩子结点插入最小堆H中;
(2)如果弹出的堆顶元素current是一个兴趣点p,则兴趣点p为此时最小堆H中价值最小的元素,会被直接加入到结果集R中;最小堆H中的所有元素会根据新的结果集R更新自己的价值,最小堆H也会根据其包含的元素的价值执行更新操作。
进一步地,所述的步骤S5包括以下子步骤:
S51.交互停止条件:查询用户组U收到结果集R后,判断结果集R是否满足下列两个停止条件中的一个:
(1)用户组的每一个用户均对得到的结果集R满意;
(2)用户组的每一个用户均认为继续用户交互过程无法得到令他们满意的结果集R;
如果结果集R满足上述两个停止条件之一,用户交互过程停止,结果集R为最终结果集,否则,跳转至步骤S52;
S52.用户反馈集合的构造:根据每一位用户潜藏的偏好信息构造用户反馈集合T,其中,
Figure BDA0001664622220000061
元组
Figure BDA0001664622220000062
由用户从结果集R中根据自己的偏好信息筛选得出,兴趣点
Figure BDA0001664622220000063
Figure BDA0001664622220000064
分别表示用户在结果集R中最喜欢和最不喜欢的兴趣点p;
S53.重新执行查询:跳转至步骤S3,重新执行查询。
本发明的有益效果在于:允许用户在不提供精确的数值向量来量化其潜藏的偏好信息的情况下,通过用户交互的方式有效度量用户组的偏好信息,为用户提供更加准确地查询结果,提高用户查询满意度;比原有的空间关键词查询方法具有更快的查询速度和更短的响应时间,减少了用户的开支。
附图说明
图1是本发明的步骤图;
图2是本发明的流程图;
图3是本发明中计算用户满意度时的平面划分图;
图4是本发明的数据查询过程中的扫描流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
如图1所示,一种交互式多用户空间关键词查询方法,其特征在于,包括以下步骤:
S1.空间关键词数据处理:将携带关键词的空间地点数据视为兴趣点p,根据兴趣点p的空间邻近关系进行分组;每个分组作为一个最小边界矩形,每个最小边界矩形作为一个叶子结点ei,较大的最小边界矩形索引覆盖一个或多个叶子结点ei作为中间结点ej构造IR树;每个叶子结点ei和中间结点ej都分别关联一个关键词表;
S2.构造查询请求:给定四元数组Q={U,k,Ω,T},U代表一组查询用户组,k代表查询结束后返回的兴趣点p的个数,Ω为兴趣点p的集合,T代表根据查询用户潜藏的偏好构造的用户反馈集合;在查询提交时,用户反馈集合T被置为空集;
U={u0,u1,...,ui,...,un-1},式中ui表示用户组U中第i+1个用户,n表示用户组U中用户的个数;每一个用户ui均可表示为<uid,λ,ψ>,u.uid为用户ui的唯一标识;u.λ为其位置信息,表示为u.λ=<u.x,u.y>,u.x和u.y分别为用户ui所在的经纬度;u.ψ为用户ui的关键词需求;将用户提供的所有关键词称为查询关键词,记为Qψ
Ω={p0,p1,...,pi,...,ps},式中pi,i=1,2,3.....s,表示兴趣点p集合Ω中第i+1个兴趣点,s+1表示兴趣点p集合Ω中地点兴趣点的个数;
定义如下概念:
标准谷歌距离:给定两个关键词x和y,二者间的标准谷歌距离为:
Figure BDA0001664622220000071
式中f(x)和f(y)分别为谷歌搜索关键词x和y时返回的网页数目,f(x,y)为谷歌同时搜索关键词x和y的网页数目,N为谷歌索引的网页总数目;两个关键词的标准谷歌距离越小,其文本相关性越高;
文本相关度:给定兴趣点p和用户ui,兴趣点p所携带的关键词与用户ui所提供的关键词需求的文本相关度为:TXR(p,ui)=maxx∈p.ψ,y∈u.ψ(NGD(x,y));
空间距离:给定兴趣点pi,pj和用户ui,dN(pi,ui)和dN(pi,pj)分别代表兴趣点pi到用户ui和兴趣点pi到兴趣点pj的空间距离;
平衡向量:给定用户ui和兴趣点p元组
Figure BDA0001664622220000072
在二维坐标系下构造用户ui的平衡向量
Figure BDA0001664622220000073
其中,点
Figure BDA0001664622220000074
和点
Figure BDA0001664622220000075
的坐标分别为
Figure BDA0001664622220000076
Figure BDA0001664622220000077
式中
Figure BDA0001664622220000078
Figure BDA0001664622220000081
用户满意度:给定用户ui和兴趣点元组
Figure BDA0001664622220000082
首先在二维坐标系下构造用户ui的平衡向量
Figure BDA0001664622220000083
然后绘制两条垂直于衡向量
Figure BDA0001664622220000084
的直线且两条直线分别经过点
Figure BDA0001664622220000085
Figure BDA0001664622220000086
将整个平面被这两条直线分割为A,B,C三个区域,如图3所示;给定兴趣点pj,在维坐标系下绘制点
Figure BDA0001664622220000087
然后由点
Figure BDA0001664622220000088
向平衡向量
Figure BDA0001664622220000089
及其延长线作垂线,垂足为
Figure BDA00016646222200000810
用户ui对兴趣点pj的用户满意度Mij根据点
Figure BDA00016646222200000811
的位置分布分以下三种情况:
(4)如果点
Figure BDA00016646222200000812
位于区域A中,如图3(a)所示,垂足
Figure BDA00016646222200000813
位于平衡向量
Figure BDA00016646222200000814
的延长线上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000815
(5)如果点
Figure BDA00016646222200000816
位于区域B中,如图3(b)所示,垂足
Figure BDA00016646222200000817
位于平衡向量
Figure BDA00016646222200000818
上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000819
(6)如果点
Figure BDA00016646222200000820
位于区域C中,如图3(c)所示,垂足
Figure BDA00016646222200000821
位于平衡向量
Figure BDA00016646222200000822
的延长线上;用户ui对兴趣点pj的满意度为:
Figure BDA00016646222200000823
给定结果集R,用户ui对结果集R的满意度为:
Figure BDA00016646222200000824
所述|R|为结果集R里兴趣点的个数,且M′i的数值越低,用户ui对结果集R的满意程度越高;
平均满意程度:给定结果集R,整个用户组U对结果集R的平均满意程度为:
Figure BDA0001664622220000091
变异系数:给定结果集R和用户组U,用户组U对结果集R的变异系数为:
Figure BDA0001664622220000092
代价函数Cost(R,Q,T):给定结果集R、三元数组Q′={U,k,T}和用户反馈集合T,代价函数Cost(R,Q′,T)为:Cost(R,Q′,T)=(C1(R,Q′)+C2(R))·C3(R,T),式中C1(R,Q′)为maxp∈R(dN(p,U))+maxp∈R(TXR(p,U)),C2(R)为
Figure BDA0001664622220000093
C3(R,T)为:
Figure BDA0001664622220000094
理想结果是最终k个兴趣点存储在结果集R中,且代价函数Cost(R,Q,T)最小;
S3.查询初始化:定义结果集R,并将其初始化为空;根据用户反馈集合T计算IR树中叶子结点、中间结点和兴趣点p的价值Val;
S4.数据查询:定义一个堆H以价值Val的升序扫描IR树的结点:先将IR树的根结点放入堆H中,每一次扫描,均将堆H的堆顶元素current弹出,并根据其状态对其进行处理;直到堆H为空或者结果集R中兴趣点p的个数达到k个,完成一次基本查询,并将结果集R返回给用户;
S5.用户交互:当查询用户组U收到返回的结果集R后,根据每一位用户潜藏的偏好信息构造用户反馈集合T,查询用户组U根据自己的满意度决定是否继续执行用户交互过程。
进一步地,步骤S1包括以下子步骤:
S11.兴趣点p的构造:每一个兴趣点p均可表示为<id,λ,ψ>,其中,p.id是兴趣点p的唯一标识,p.λ表示兴趣点p的位置,所述位置由经纬度构成,p.ψ为一组描述兴趣点p的关键词;所述p.λ=(e,||p,v||),表示兴趣点p位于道路网络G的边e上,其距离边e的端点v的长度为||p,v||;
S12.IR树的构造:将兴趣点p根据其空间位置关系信息进行分组聚集,IR树的叶子结点ei索引覆盖一个最小边界矩形,每个最小边界矩形根据空间邻近关系覆盖一组兴趣点p,并关联一个关键词表
Figure BDA0001664622220000101
所述关键词表
Figure BDA0001664622220000102
包含叶子结点索引覆盖的所有兴趣点p携带的不同关键词;IR树的中间节点ej索引一个较大的最小边界矩形,其覆盖一组较小的最小边界矩形,并关联一个关键词表
Figure BDA0001664622220000103
所述关键词表
Figure BDA0001664622220000104
为其索引覆盖的所有叶子结点ei的关键词表
Figure BDA0001664622220000105
的并集。
进一步地,所述的步骤S3包括以下子步骤:
S31.结果集R初始化:定义结果集R,并将其初始化为空;
S32.价值Val计算:根据用户反馈集合T计算IR树中叶子结点、中间结点和兴趣点p的价值Val:
给定兴趣点p和计算兴趣点p价值时的结果集R′,兴趣点p的价值Valp为:Valp=(C1(R′∪p,Q)+C2(R′∪p))·C3(R′∪p,T);
给定叶子结点ei和计算结点ei价值时的结果集R′,叶子结点ei价值
Figure BDA0001664622220000106
为:
Figure BDA0001664622220000107
给定中间结点ej和计算结点ej价值时的结果集R′,中间结点ej价值
Figure BDA0001664622220000108
为:
Figure BDA0001664622220000109
进一步地,对于任意一个结点来说,不论这个结点是叶子结点还是中间结点,它的价值Val一定低于或者等于其所有孩子结点的价值Val的最小值。
优选地,步骤S4中对堆顶元素current的状态处理分为以下两种情况:
(1)如果弹出的堆顶元素current是IR树的中间结点或者叶子结点,则计算current的所有孩子结点的价值,然后根据其所有孩子结点的价值,将这些孩子结点插入最小堆H中;
(2)如果弹出的堆顶元素current是一个兴趣点p,则兴趣点p为此时最小堆H中价值最小的元素,会被直接加入到结果集R中;最小堆H中的所有元素会根据新的结果集R更新自己的价值,最小堆H也会根据其包含的元素的价值执行更新操作。
进一步地,所述的步骤S5包括以下子步骤:
S51.交互停止条件:查询用户组U收到结果集R后,判断结果集R是否满足下列两个停止条件中的一个:
(1)用户组的每一个用户均对得到的结果集R满意;
(2)用户组的每一个用户均认为继续用户交互过程无法得到令他们满意的结果集R;
如果结果集R满足上述两个停止条件之一,用户交互过程停止,结果集R为最终结果集,否则,跳转至步骤S52;
S52.用户反馈集合的构造:根据每一位用户潜藏的偏好信息构造用户反馈集合T,其中,
Figure BDA0001664622220000111
元组
Figure BDA0001664622220000112
由用户从结果集R中根据自己的偏好信息筛选得出,兴趣点
Figure BDA0001664622220000113
Figure BDA0001664622220000114
分别表示用户在结果集R中最喜欢和最不喜欢的兴趣点p;
S53.重新执行查询:跳转至步骤S3,重新执行查询。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、ROM、RAM等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (7)

1.一种交互式多用户空间关键词查询方法,其特征在于,包括以下步骤:
S1.空间关键词数据处理:将携带关键词的空间地点数据视为兴趣点p,根据兴趣点p的空间邻近关系进行分组;每个分组作为一个最小边界矩形,每个最小边界矩形作为一个叶子结点ei,较大的最小边界矩形索引覆盖一个或多个叶子结点ei作为中间结点ej构造IR树;每个叶子结点ei和中间结点ej都分别关联一个关键词表;
S2.构造查询请求:给定四元数组Q={U,k,Ω,T},U代表一组查询用户组,k代表查询结束后返回的兴趣点p的个数,Ω为兴趣点p的集合,T代表根据查询用户潜藏的偏好构造的用户反馈集合;在查询提交时,用户反馈集合T被置为空集;
S3.查询初始化:定义结果集R,并将其初始化为空;根据用户反馈集合T计算IR树中叶子结点、中间结点和兴趣点p的价值Val;
价值Val计算的方法为:
给定兴趣点p和计算兴趣点p价值时的结果集R′,兴趣点p的价值Valp为:Valp=(C1(R′∪p,Q)+C2(R′∪p))·C3(R′∪p,T);
给定叶子结点ei和计算结点ei价值时的结果集R′,叶子结点ei价值
Figure FDA0003282858300000011
为:
Figure FDA0003282858300000012
给定中间结点ej和计算结点ej价值时的结果集R′,中间结点ej价值
Figure FDA0003282858300000013
为:
Figure FDA0003282858300000014
对于任意一个结点来说,不论这个结点是叶子结点还是中间结点,它的价值Val一定低于或者等于其所有孩子结点的价值Val的最小值;
S4.数据查询:定义一个堆H以价值Val的升序扫描IR树的结点:先将IR树的根结点放入堆H中,每一次扫描,均将堆H的堆顶元素current弹出,并根据其状态对其进行处理;直到堆H为空或者结果集R中兴趣点p的个数达到k个,完成一次基本查询,并将结果集R返回给用户;
S5.用户交互:当查询用户组U收到返回的结果集R后,根据每一位用户潜藏的偏好信息构造用户反馈集合T,查询用户组U根据自己的满意度决定是否继续执行用户交互过程。
2.根据权利要求1所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的步骤S1包括以下子步骤:
S11.兴趣点p的构造:每一个兴趣点p均可表示为<id,λ,ψ>,其中,p.id是兴趣点p的唯一标识,p.λ表示兴趣点p的位置,所述位置由经纬度构成,p.ψ为一组描述兴趣点p的关键词;所述p.λ=(e,||p,v||),表示兴趣点p位于道路网络G的边e上,其距离边e的端点v的长度为||p,v||;
S12.IR树的构造:将兴趣点p根据其空间位置关系信息进行分组聚集,IR树的叶子结点ei索引覆盖一个最小边界矩形,每个最小边界矩形根据空间邻近关系覆盖一组兴趣点p,并关联一个关键词表
Figure FDA0003282858300000021
所述关键词表
Figure FDA0003282858300000022
包含叶子结点索引覆盖的所有兴趣点p携带的不同关键词;IR树的中间节点ej索引一个较大的最小边界矩形,其覆盖一组较小的最小边界矩形,并关联一个关键词表
Figure FDA0003282858300000023
所述关键词表
Figure FDA0003282858300000024
为其索引覆盖的所有叶子结点ei的关键词表
Figure FDA0003282858300000025
的并集。
3.根据权利要求1所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的步骤S2所述的查询用户组U和兴趣点p的集合Ω分别表示为:
U={u0,u1,…,ui,…,un-1},式中ui表示用户组U中第i+1个用户,n表示用户组U中用户的个数;
Ω={p0,p1,...,pi,...,ps},式中pi,i=1,2,3.....s,表示兴趣点p集合Ω中第i+1个兴趣点,s+1表示兴趣点p集合Ω中地点兴趣点的个数。
4.根据权利要求3所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的每一个用户ui均可表示为<uid,λ,ψ>,u.uid为用户ui的唯一标识;u.λ为其位置信息,表示为u.λ=<u.x,u.y>,u.x和u.y分别为用户ui所在的经纬度;u.ψ为用户ui的关键词需求;将用户提供的所有关键词称为查询关键词,记为Qψ
5.根据权利要求1所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的步骤S4中对堆顶元素current的状态处理分为以下两种情况:
情况1:如果弹出的堆顶元素current是IR树的中间结点或者叶子结点,则计算current的所有孩子结点的价值,然后根据其所有孩子结点的价值,将这些孩子结点插入最小堆H中;
情况2:如果弹出的堆顶元素current是一个兴趣点p,则兴趣点p为此时最小堆H中价值最小的元素,会被直接加入到结果集R中;最小堆H中的所有元素会根据新的结果集R更新自己的价值,最小堆H也会根据其包含的元素的价值执行更新操作。
6.根据权利要求1所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的步骤S5包括以下子步骤:
S51.交互停止条件:查询用户组U收到结果集R后,判断结果集R是否满足下列两个停止条件中的一个:
条件1:用户组的每一个用户均对得到的结果集R满意;
条件2:用户组的每一个用户均认为继续用户交互过程无法得到令他们满意的结果集R;
如果结果集R满足上述两个停止条件之一,用户交互过程停止,结果集R为最终结果集,否则,跳转至步骤S52;
S52.用户反馈集合的构造:根据每一位用户潜藏的偏好信息构造用户反馈集合T,其中,
Figure FDA0003282858300000031
元组
Figure FDA0003282858300000032
由用户从结果集R中根据自己的偏好信息筛选得出,兴趣点
Figure FDA0003282858300000033
Figure FDA0003282858300000034
分别表示用户在结果集R中最喜欢和最不喜欢的兴趣点p;
S53.重新执行查询:跳转至步骤S3,重新执行查询。
7.根据权利要求6所述的一种交互式多用户空间关键词查询方法,其特征在于,所述的步骤S2定义如下概念:
标准谷歌距离:给定两个关键词x和y,二者间的标准谷歌距离为:
Figure FDA0003282858300000035
式中f(x)和f(y)分别为谷歌搜索关键词x和y时返回的网页数目,f(x,y)为谷歌同时搜索关键词x和y的网页数目,N为谷歌索引的网页总数目;两个关键词的标准谷歌距离越小,其文本相关性越高;
文本相关度:给定兴趣点p和用户ui,兴趣点p所携带的关键词与用户ui所提供的关键词需求的文本相关度为:TXR(p,ui)=maxx∈p.ψ,y∈u.ψ(NGD(x,y));
空间距离:给定兴趣点pi,pj和用户ui,dN(pi,ui)和dN(pi,pj)分别代表兴趣点pi到用户ui和兴趣点pi到兴趣点pj的空间距离;
平衡向量:给定用户ui和兴趣点p元组
Figure FDA0003282858300000036
在二维坐标系下构造用户ui的平衡向量
Figure FDA0003282858300000041
其中,点
Figure FDA0003282858300000042
和点
Figure FDA0003282858300000043
的坐标分别为
Figure FDA0003282858300000044
Figure FDA0003282858300000045
式中
Figure FDA0003282858300000046
Figure FDA0003282858300000047
用户满意度:给定用户ui和兴趣点元组
Figure FDA0003282858300000048
首先在二维坐标系下构造用户ui的平衡向量
Figure FDA0003282858300000049
然后绘制两条垂直于衡向量
Figure FDA00032828583000000410
的直线且两条直线分别经过点
Figure FDA00032828583000000411
Figure FDA00032828583000000412
将整个平面被这两条直线分割为A,B,C三个区域;给定兴趣点pj,在维坐标系下绘制点
Figure FDA00032828583000000413
然后由点
Figure FDA00032828583000000414
向平衡向量
Figure FDA00032828583000000415
及其延长线作垂线,垂足为
Figure FDA00032828583000000416
用户ui对兴趣点pj的用户满意度Mij根据点
Figure FDA00032828583000000417
的位置分布分以下三种情况:
情况1:如果点
Figure FDA00032828583000000418
位于区域A中,垂足
Figure FDA00032828583000000419
位于平衡向量
Figure FDA00032828583000000420
的延长线上;用户ui对兴趣点pj的满意度为:
Figure FDA00032828583000000421
情况2:如果点
Figure FDA00032828583000000422
位于区域B中,垂足
Figure FDA00032828583000000423
位于平衡向量
Figure FDA00032828583000000424
上;用户ui对兴趣点pj的满意度为:
Figure FDA00032828583000000425
情况3:如果点
Figure FDA00032828583000000426
位于区域C中,垂足
Figure FDA00032828583000000427
位于平衡向量
Figure FDA00032828583000000428
的延长线上;用户ui对兴趣点pj的满意度为:
Figure FDA00032828583000000429
给定结果集R,用户ui对结果集R的满意度为:
Figure FDA00032828583000000430
所述|R|为结果集R里兴趣点的个数,且M′i的数值越低,用户ui对结果集R的满意程度越高;
平均满意程度:给定结果集R,整个用户组U对结果集R的平均满意程度为:
Figure FDA0003282858300000051
变异系数:给定结果集R和用户组U,用户组U对结果集R的变异系数为:
Figure FDA0003282858300000052
代价函数Cost(R,Q,T):给定结果集R、三元数组Q′={U,k,T}和用户反馈集合T,代价函数Cost(R,Q′,T)为:Cost(R,Q′,T)=(G1(R,Q′)+C2(R))·C3(R,T),式中C1(R,Q′)为maxp∈R(dN(p,U))+maxp∈R(TXR(p,U)),C2(R)为
Figure FDA0003282858300000053
C3(R,T)为:
Figure FDA0003282858300000054
CN201810476520.8A 2018-05-17 2018-05-17 一种交互式多用户空间关键词查询方法 Active CN108717447B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810476520.8A CN108717447B (zh) 2018-05-17 2018-05-17 一种交互式多用户空间关键词查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810476520.8A CN108717447B (zh) 2018-05-17 2018-05-17 一种交互式多用户空间关键词查询方法

Publications (2)

Publication Number Publication Date
CN108717447A CN108717447A (zh) 2018-10-30
CN108717447B true CN108717447B (zh) 2022-02-11

Family

ID=63899875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810476520.8A Active CN108717447B (zh) 2018-05-17 2018-05-17 一种交互式多用户空间关键词查询方法

Country Status (1)

Country Link
CN (1) CN108717447B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977309B (zh) * 2019-03-21 2021-05-04 杭州电子科技大学 基于多关键字和用户偏好的组合兴趣点查询方法
CN111597582B (zh) * 2020-05-18 2023-07-21 北京思特奇信息技术股份有限公司 一种构建加密倒序矩形树方法、一种空间关键词查询方法
CN115563155A (zh) * 2022-10-10 2023-01-03 深圳计算科学研究院 一种基于线性规划的增量式查询方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069094A (zh) * 2015-08-06 2015-11-18 苏州大学 一种基于语义理解的空间关键字索引方法
CN107506490A (zh) * 2017-09-22 2017-12-22 深圳大学 滑动窗口下基于位置top‑k关键词查询的优先查询算法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009177B2 (en) * 2009-09-25 2015-04-14 Microsoft Corporation Recommending points of interests in a region
US9104770B2 (en) * 2013-02-28 2015-08-11 Oracle International Corporation Methods for query processing of topological relationships among complex spatial objects

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069094A (zh) * 2015-08-06 2015-11-18 苏州大学 一种基于语义理解的空间关键字索引方法
CN107506490A (zh) * 2017-09-22 2017-12-22 深圳大学 滑动窗口下基于位置top‑k关键词查询的优先查询算法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Inverted Linear Quadtree: Efficient Top K Spatial Keyword Search";Chengyuan Zhang等;《IEEE Transactions on Knowledge and Data Engineering》;20160707;第28卷(第7期);第1706-1721页 *
"基于对象集合的空间关键词查询";梁银,董永权;《计算机应用》;20140710;第34卷(第7期);第1992-1996页 *
"空间关键词查询研究综述";李维丹;《现代计算机(专业版)》;20150425(第12期);第34-39页 *
社交网络服务中基于位置的Top-k查询方法;夏英等;《重庆邮电大学学报(自然科学版)》;20131015(第05期);第644-650页 *

Also Published As

Publication number Publication date
CN108717447A (zh) 2018-10-30

Similar Documents

Publication Publication Date Title
JP7065122B2 (ja) 推奨情報の取得方法及び装置、電子機器
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN110245160B (zh) 一种确定房屋装修方案的方法及系统
US8041729B2 (en) Categorizing queries and expanding keywords with a coreference graph
JP5897019B2 (ja) 候補製品のリンクリストを判定する方法および装置
US10452662B2 (en) Determining search result rankings based on trust level values associated with sellers
US10042940B2 (en) Enhancing rankings of search results for member profile queries
US9754306B2 (en) Recommendation engine with profile analysis
CN108717447B (zh) 一种交互式多用户空间关键词查询方法
US9866565B2 (en) Method and apparatus for controlling data permissions
WO2019047346A1 (zh) 网站漏洞扫描方法、装置、计算机设备及存储介质
KR20140091530A (ko) 소셜 네트워크 피쳐들을 갖는 이름 및 기타 검색 질의의 적합도
CN108446297B (zh) 一种推荐方法及装置,电子设备
CN107577736B (zh) 一种基于bp神经网络的文件推荐方法及系统
US20150248720A1 (en) Recommendation engine
Park et al. Fast Collaborative Filtering with a k-nearest neighbor graph
Hong et al. Context-aware recommendation using role-based trust network
CN111078997B (zh) 一种资讯推荐方法及装置
JP2004515837A (ja) サーチプロファイルの比較方法
CN109635004A (zh) 一种数据库的对象描述提供方法、装置及设备
US9785676B2 (en) Systems and methods for providing ordered results for search queries
CN114065016A (zh) 一种推荐方法、装置、设备及计算机可读存储介质
CN108197288B (zh) 根据用户特征偏好的房源推送方法、装置、设备及介质
Hooda et al. Social commerce hybrid product recommender
Fonteles et al. Towards matching improvement between spatio-temporal tasks and workers in mobile crowdsourcing market systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant