CN115146020A - 一种基于最小聚合距离的多源skyline查询方法及系统 - Google Patents

一种基于最小聚合距离的多源skyline查询方法及系统 Download PDF

Info

Publication number
CN115146020A
CN115146020A CN202210828365.8A CN202210828365A CN115146020A CN 115146020 A CN115146020 A CN 115146020A CN 202210828365 A CN202210828365 A CN 202210828365A CN 115146020 A CN115146020 A CN 115146020A
Authority
CN
China
Prior art keywords
distance
interest
query
point
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210828365.8A
Other languages
English (en)
Inventor
柳毅
宋志远
马慧
李斯
杨振国
申建芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202210828365.8A priority Critical patent/CN115146020A/zh
Publication of CN115146020A publication Critical patent/CN115146020A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于最小聚合距离的多源skyline查询方法及系统,该方法包括:给定一个道路网、查询点集和兴趣点集;对道路网划分建立QG‑tree索引结构;基于QG‑tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。该系统包括:设置模块、索引结构构建模块、聚合距离计算模块、检索模块和输出模块。通过使用本发明,能够提高查询效率与查询结果的精简性与有效性,为用户提供更有效的信息。本发明作为一种基于最小聚合距离的多源skyline查询方法及系统,可广泛应用于数据查询技术领域。

Description

一种基于最小聚合距离的多源skyline查询方法及系统
技术领域
本发明涉及数据查询技术领域,尤其涉及一种基于最小聚合距离的多源skyline查询方法及系统。
背景技术
Skyline查询,用于解决多目标决策问题。随着GPS和移动定位设备的快速普及,基于位置的服务(Location Based Services,LBS)在生活中被广泛运用。基于位置的Skyline查询可以根据用户的位置信息,帮助用户解决决策问题。空间Skyline查询作为基于位置的Skyline查询的一种重要的查询类型,考虑兴趣点与查询点间的距离(即空间属性维度)。然而现有的空间skyline查询算法大多基于欧式空间,无法为用户提供精确有效的查询结果。道路网环境下基于路网距离的skyline查询更符合用户实际的查询需求,与此同时,传统单一查询点的skyline查询已不能满足用户逐渐增加的查询需要,于是道路网环境下多源skyline查询引起了广泛关注,考虑兴趣点与多个查询点间的路网距离。
目前道路网环境下的多源skyline查询中,由于复杂的道路网络,现有的算法存在的主要问题是聚合距离的计算效率较低,并且查询点的增加会对查询效率和查询结果造成影响。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于最小聚合距离的多源skyline查询方法及系统,能够提高查询效率与查询结果的精简性与有效性,为用户提供更有效的信息。
本发明所采用的第一技术方案是:一种基于最小聚合距离的多源skyline查询方法,包括以下步骤:
给定一个道路网G、查询点集Q和兴趣点集P;
对道路网划分建立QG-tree索引结构;
基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
进一步,所述对道路网划分建立QG-tree索引结构这一步骤,其具体包括:
自顶向下将道路网G递归地划分为子网络Gi,每个子网络对应一个QG-tree节点,建立QG-tree;
自底向上地计算每个QG-tree树节点的边界点和建立距离矩阵MGi
针对查询点集中的每个查询点,建立查询距离矩阵;
基于边界点和距离矩阵,采用基于装配的方法计算任意两点间的最短路径距离。
进一步,所述基于边界点和距离矩阵,采用基于装配的方法计算任意两点间的最短路径距离这一步骤,其具体包括:
基于QG-tree索引结构分别确定兴趣点p和查询点q所在的叶子节点,并确定从查询点q到兴趣点p所经过的树节点路径;
从查询点q开始沿着树节点路径,根据距离矩阵依次计算查询点q到树节点路径中树节点内各边界点的最短路径距离;
根据兴趣点p所在叶子节点的距离矩阵,计算该叶子节点内边界点到兴趣点p的最短路径距离;
动态装配路径距离信息,计算任意两点间的最短路径距离。
进一步,所述采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点这一步骤,其具体包括:
自顶向下遍历QG-tree,迭代访问聚合距离最小的树节点,利用优先队列PQ存储树节点Gi的聚合距离信息并按聚合距离升序排列,直到找到最小聚合距离兴趣点PA和最小聚合距离DA
初始化最小聚合距离兴趣点PA为-1和最小聚合距离DA为∞,将树节点G0的聚合信息插入优先队列PQ;
依次取出队首树节点并出队;
如果队首树节点的聚合距离dA(Gi,Q)小于最小聚合距离DA,输出最小聚合距离兴趣点PA与最小聚合距离DA
若队首树节点为非叶子节点Gi,扩展其孩子树节点,计算孩子树节点的查询距离矩阵与聚合距离,将孩子树节点插入队列;
若队首树节点为叶子节点Gi,遍历叶子节点内的兴趣点,结合查询距离矩阵和距离矩阵并基于装配的方法计算叶子节点内各兴趣点的聚合距离;
更新具有最小聚合距离的兴趣点PA和最小聚合距离DA
进一步,所述采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集这一步骤,其具体包括:
对兴趣点的所有属性维度建立倒排索引结构,将非空间属性维度中的兴趣点按属性值由优到劣排序,聚合距离维度初始为空;
对于不同维度中兴趣点的检索,使用i.count变量表示维度i上已检索兴趣点的数量,p.num变量表示兴趣点p被检索的次数,Ri表示维度i的查询结果集;
第一次检索聚合距离维度中的兴趣点,计算出一个具有最小聚合距离的兴趣点作为检索的兴趣点,并插入聚合距离维度的查询结果集;
依次检索count最小的维度中的兴趣点,得到候选点集;
针对num=0且兴趣点非空间属性维度检索到的兴趣点,计算候选点集中兴趣点的聚合距离。
进一步,所述针对num=0且兴趣点非空间属性维度检索到的兴趣点,计算候选点集中兴趣点的聚合距离这一步骤,其具体包括:
分别确定兴趣点p和查询点q所在的叶子节点Gp和Gq
如果p、q位于同一叶子节点,利用该叶子节点的距离矩阵计算p和q聚合距离;
如果p、q不位于同一叶子节点,找到p、q的公共树节点Gt,先利用基于装配的方法在预处理的距离矩阵的基础上计算兴趣点p到Gt内边界点的聚合距离dist(p,v),v为树节点Gt的边界点,再根据预处理的初始查询距离矩阵计算查询点q到Gt内边界点的dist(v,q),结合dist(p,v)、dist(v,q)得到dist(p,q);
针对查询点集Q中的每个查询点,重复以上步骤,计算得到兴趣点p的聚合距离dagg(p,Q)=∑q∈Qdist(p,q)。
进一步,所述对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集这一步骤,其具体包括:
将候选点集中num=1且不被候选点集与该维度的查询结果集中兴趣点道路网支配的兴趣点作为Skyline点,并插入对应维度的查询结果集;
判断是否存在一个兴趣点满足结束条件,输出最终的查询结果集。
进一步,所述判断是否存在一个兴趣点满足结束条件,输出最终的查询结果集这一步骤,其具体包括:
判断是否存在一个兴趣点的num变量等于兴趣点的属性维度总数d;
若存在,则输出最终的查询结果集R=R1∪R2∪…∪Rd
本发明所采用的第二技术方案是:一种基于最小聚合距离的多源skyline查询系统,包括:
设置模块,用于给定一个道路网G、查询点集Q和兴趣点集P;
索引结构构建模块,用于对道路网划分建立QG-tree索引结构;
聚合距离计算模块,基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
检索模块,用于采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
输出模块,用于对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
本发明方法及系统的有益效果是:本发明通过对道路网进行划分建模,建立有效的QG-tree索引结构,加快了兴趣点的聚合距离的计算效率,减少了聚合距离计算所消耗的时间。同时,采用倒排索引结构对兴趣点进行管理以及剪枝策略,加快查找算法结束点的效率,避免检索整个兴趣点集,降低了时间成本消耗,提高了查询效率。
附图说明
图1是本发明一种基于最小聚合距离的多源skyline查询方法的步骤流程图;
图2是本发明具体实施例查询方法总体流程图;
图3是本发明具体实施例道路网络示例图;
图4是本发明具体实施例基于装配的计算方法示例图;
图5是本发明具体实施例QG-tree索引示例图;
图6是本发明具体实施例倒排索引结构示例图;
图7是本发明具体实施例兴趣点的检索示例图;
图8是本发明一种基于最小聚合距离的多源skyline查询系统的结构框图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
参照图1和图2,本发明提供了一种基于最小聚合距离的多源skyline查询方法,该方法包括以下步骤:
S1、对道路网划分建立QG-tree索引结构;
S1.1、给定一个道路网G、查询点集Q和兴趣点集P;
具体地,道路网络G=<V,E,W>为一个无向加权图,V是道路网顶点集,E是道路网边集,W为道路网边长集。查询点集Q={q1,q2,...,qi}和兴趣点集P={p1,p2,...,pj}均分布在道路网边上,兴趣点p是一个具有n维属性的点(即p=<p[1],p[2],...,p[n]>,p[n]表示兴趣点p在维度n上的属性值),道路网络示例如图3所示。
为了便于解释,假设兴趣点p和查询点q都位于道路网的顶点上。如果p或者q不是道路网顶点,可以把p或者q映射到道路网中与其距离最近的顶点。
S1.2、自顶向下将道路网G划分为子网络Gi,每个子网络对应一个QG-tree节点,建立QG-tree;
S1.3、自底向上地计算每个QG-tree树节点的边界点和建立距离矩阵
Figure BDA0003744981940000051
边界点:给定一个子网络Gi和一个顶点v1∈Vi,如果存在一个边(v1,v2)∈E,且
Figure BDA0003744981940000052
则v1称为Gi的边界点。B(Gi)表示Gi的边界点集。同时,定义UB(Gi)=∪B(Gc),Gc为Gi的孩子节点,当Gi为叶子节点时,UB(Gi)=Gi
具体地,距离矩阵
Figure BDA0003744981940000053
用于存储树节点内道路顶点间的路网距离信息。对于叶子节点Gi,距离矩阵
Figure BDA0003744981940000054
存储该节点内边界点集B(Gi)中边界点与道路网顶点间的最短路径距离;对于非叶子节点Gi,距离矩阵
Figure BDA0003744981940000055
存储该节点内边界点集UB(Gi)中边界点间的最短路径距离。
S1.4、针对查询点集中的每个查询点,建立查询距离矩阵;
具体地,查询距离矩阵
Figure BDA0003744981940000056
用于存储查询点与树节点内边界点的最短路径距离,对于每个查询点q∈Q有:
Figure BDA0003744981940000057
设定一个查询路径QP(q)来存储查询点q所在叶子节点到根节点G0所经过的树节点集合。并且预处理的距离矩阵的基础上,对每个查询点对应的查询路径中的树节点建立初始查询距离矩阵
Figure BDA0003744981940000058
对于树节点外部的查询点,后续外部查询点访问到该树节点时才进行查询距离计算。
建立的QG-tree索引(包括道路网划分、QG-tree、距离矩阵、初始查询距离矩阵)如图5所示。
S1.5、基于边界点和距离矩阵,采用基于装配的方法计算任意两点间的最短路径距离。
S1.5.1、基于QG-tree索引结构分别确定兴趣点p和查询点q所在的叶子节点,并确定从查询点q到兴趣点p所经过的树节点路径;
S1.5.2、从查询点q开始沿着树节点路径,根据距离矩阵依次计算查询点q到树节点路径中树节点内各边界点的最短路径距离;
S1.5.3、根据兴趣点p所在叶子节点的距离矩阵,计算该叶子节点内边界点到兴趣点p的最短路径距离;
S1.5.4、动态装配路径距离信息,计算任意两点间的最短路径距离。
具体地,基于装配的方法动态地计算道路网中任意兴趣点p与查询点q间的最短路径距离dist(p,q),基于装配的计算方法示例如图4所示,在此基础上,才可以实现各种聚合距离dagg(p,Q)=∑q∈Qdist(p,q)计算。
S2、基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
S2.1、自顶向下遍历QG-tree,迭代访问聚合距离最小的树节点,利用优先队列PQ存储树节点Gi的聚合距离信息并按聚合距离升序排列,直到找到最小聚合距离兴趣点PA和最小聚合距离DA
具体地,利用优先队列PQ存储树节点Gi的信息<树节点,聚合距离>(Gi的聚合距离
Figure BDA0003744981940000061
并且以聚合距离升序排序。
S2.2、初始化最小聚合距离兴趣点PA为-1和最小聚合距离DA为∞,将树节点G0的聚合信息插入优先队列PQ;
S2.3、依次取出队首树节点并出队;
S2.4、如果队首树节点的聚合距离dA(Gi,Q)小于最小聚合距离DA,输出最小聚合距离兴趣点PA与最小聚合距离DA
S2.5、若队首树节点为非叶子节点Gi,扩展其孩子树节点,计算孩子树节点的查询距离矩阵与聚合距离,将孩子树节点插入队列;
S2.6、若队首树节点为叶子节点Gi,遍历叶子节点内的兴趣点,结合查询距离矩阵和距离矩阵并基于装配的方法计算叶子节点内各兴趣点的聚合距离;
具体地,根据叶子节点的距离矩阵
Figure BDA0003744981940000062
计算兴趣点到叶子节点内边界点的dist(p,v),v∈B(Gi),再根据查询距离矩阵
Figure BDA0003744981940000063
计算叶子节点内边界点到查询点集中每个查询点的dist(v,q),q∈Q,结合得到dist(p,q)。因此,兴趣点p的聚合距离dagg(p,Q)=∑q∈Qdist(p,q)。
S2.7若dagg(p,Q)小于DA,更新具有最小聚合距离的兴趣点PA和最小聚合距离DA
S3、采用倒排索引对整个兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
S3.1、对兴趣点的所有属性维度建立倒排索引结构,将非空间属性维度中的兴趣点按属性值由优到劣排序,聚合距离维度初始为空;
具体地,本方法将原来的兴趣点的空间属性维度用一个聚合距离代替,降低了兴趣点的属性维度,提高了查询结果的精简性和有效性,提高查询效率。(一个兴趣点与查询点集中的每个查询点间都有一个最短路径距离:对于一个兴趣点,有n个查询点,就有n个最短路径距离,支配判定需要考虑n个最短路径距离,分别作为一个属性维度,兴趣点属性维度增加,降低兴趣点被支配的概率,查询结果集中兴趣点的数量随之增加,影响查询结果的精简性和有效性,影响查询效率。因此,使用一个聚合距离dagg(p,Q)=∑q∈Qdist(p,q)代替兴趣点的空间属性维度,减少上述影响)。
S3.2、对于不同维度中兴趣点的检索,使用i.count变量表示维度i上已检索兴趣点的数量,p.num变量表示兴趣点p被检索的次数,Ri表示维度i的查询结果集;
具体地,每个维度有一个查询结果集Ri,倒排索引结构示例如图6所示。
S3.3、第一次检索聚合距离维度中的兴趣点,调用步骤S2计算出一个具有最小聚合距离的兴趣点作为检索的兴趣点,并插入聚合距离维度的查询结果集;
S3.4、依次检索count最小的维度中的兴趣点,得到候选点集;
具体地,如果count最小的维度为聚合距离维度,则调用步骤S2计算具有最小聚合距离的兴趣点插入候选点集。如果count最小的维度为非空间属性维度,将排序最前的兴趣点插入候选点集中。
S3.5、针对num=0且兴趣点非空间属性维度检索到的兴趣点,计算候选点集中兴趣点的聚合距离。
S3.5.1、分别确定兴趣点p和查询点q所在的叶子节点Gp和Gq
S3.5.2、如果p、q位于同一叶子节点,利用该叶子节点的距离矩阵计算p和q聚合距离;
S3.5.3、如果p、q不位于同一叶子节点,找到p、q的公共树节点Gt,先利用基于装配的方法在预处理的距离矩阵的基础上计算兴趣点p到Gt内边界点的聚合距离dist(p,v),v为树节点Gt的边界点,再根据预处理的初始查询距离矩阵计算查询点q到Gt内边界点的dist(v,q),结合dist(p,v)、dist(v,q)得到dist(p,q);
S3.5.4、针对查询点集Q中的每个查询点,重复以上步骤,计算得到兴趣点p的聚合距离dagg(p,Q)=∑q∈Qdist(p,q)。
S4、对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
S4.1、将候选点集中num=1且不被候选点集与该维度的查询结果集中兴趣点道路网支配的兴趣点作为Skyline点,并插入对应维度的查询结果集;
S4.2、判断是否存在一个兴趣点满足结束条件,输出最终的查询结果集。
S4.2.1、判断是否存在一个兴趣点的num变量等于兴趣点的属性维度总数d;
S4.2.2、若存在,则输出最终的查询结果集R=R1∪R2∪…∪Rd
具体地,若不存在兴趣点的num<d(d为兴趣点的维度总数),则返回步骤S3.2,兴趣点的检索示例如图7所示。
本发明主要包括三个过程:首先对道路网进行划分建模建立QG-tree索引结构用于计算兴趣点的聚合距离,并且采用倒排索引结构管理兴趣点;接着采用剪枝策略遍历各维度中的兴趣点,计算兴趣点的聚合距离,进行道路网支配判定;最后判定满足结束条件的兴趣点,将各维度结果集合并输出最终查询结果集。
如图8所示,一种基于最小聚合距离的多源skyline查询系统,包括:
设置模块,用于给定一个道路网G、查询点集Q和兴趣点集P;
索引结构构建模块,用于对道路网划分建立QG-tree索引结构;
聚合距离计算模块,基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
检索模块,用于采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
输出模块,用于对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
一种基于最小聚合距离的多源skyline查询装置:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种基于最小聚合距离的多源skyline查询方法。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于实现如上所述一种基于最小聚合距离的多源skyline查询方法。
上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (9)

1.一种基于最小聚合距离的多源skyline查询方法,其特征在于,包括以下步骤:
给定一个道路网G、查询点集Q和兴趣点集P;
对道路网G划分建立QG-tree索引结构;
基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
采用倒排索引对兴趣点集P进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
2.根据权利要求1所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述对道路网划分建立QG-tree索引结构这一步骤,其具体包括:
自顶向下将道路网G递归地划分为子网络Gi,每个子网络对应一个QG-tree节点,建立QG-tree;
自底向上地计算每个QG-tree树节点的边界点和建立距离矩阵
Figure FDA0003744981930000011
针对查询点集中的每个查询点,建立查询距离矩阵;
基于边界点和距离矩阵,采用基于装配的方法计算任意两点间的最短路径距离。
3.根据权利要求2所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述基于边界点和距离矩阵,采用基于装配的方法计算任意两点间的最短路径距离这一步骤,其具体包括:
基于QG-tree索引结构分别确定兴趣点p和查询点q所在的叶子节点,并确定从查询点q到兴趣点p所经过的树节点路径;
从查询点q开始沿着树节点路径,根据距离矩阵依次计算查询点q到树节点路径中树节点内各边界点的最短路径距离;
根据兴趣点p所在叶子节点的距离矩阵,计算该叶子节点内边界点到兴趣点p的最短路径距离;
动态装配路径距离信息,计算任意两点间的最短路径距离。
4.根据权利要求3所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点这一步骤,其具体包括:
自顶向下遍历QG-tree,迭代访问聚合距离最小的树节点,利用优先队列PQ存储树节点Gi的聚合距离信息并按聚合距离升序排列,直到找到最小聚合距离兴趣点PA和最小聚合距离DA
初始化最小聚合距离兴趣点PA为-1和最小聚合距离DA为∞,将树节点G0的聚合信息插入优先队列PQ;
依次取出队首树节点并出队;
如果队首树节点的聚合距离dA(Gi,Q)小于最小聚合距离DA,输出最小聚合距离兴趣点PA与最小聚合距离DA
若队首树节点为非叶子节点Gi,扩展其孩子树节点,计算孩子树节点的查询距离矩阵与聚合距离,将孩子树节点插入队列;
若队首树节点为叶子节点Gi,遍历叶子节点内的兴趣点,结合查询距离矩阵和距离矩阵并基于装配的方法计算叶子节点内各兴趣点的聚合距离;
更新具有最小聚合距离的兴趣点PA和最小聚合距离DA
5.根据权利要求4所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集这一步骤,其具体包括:
对兴趣点的所有属性维度建立倒排索引结构,将非空间属性维度中的兴趣点按属性值由优到劣排序,聚合距离维度初始为空;
对于不同维度中兴趣点的检索,使用i.count变量表示维度i上已检索兴趣点的数量,p.num变量表示兴趣点p被检索的次数,Ri表示维度i的查询结果集;
第一次检索聚合距离维度中的兴趣点,计算出一个具有最小聚合距离的兴趣点作为检索的兴趣点,并插入聚合距离维度的查询结果集;
依次检索count最小的维度中的兴趣点,得到候选点集;
针对num=0且兴趣点非空间属性维度检索到的兴趣点,计算候选点集中兴趣点的聚合距离。
6.根据权利要求4所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述针对num=0且兴趣点非空间属性维度检索到的兴趣点,计算候选点集中兴趣点的聚合距离这一步骤,其具体包括:
分别确定兴趣点p和查询点q所在的叶子节点Gp和Gq
如果p、q位于同一叶子节点,利用该叶子节点的距离矩阵计算p和q聚合距离;
如果p、q不位于同一叶子节点,找到p、q的公共树节点Gt,先利用基于装配的方法在预处理的距离矩阵的基础上计算兴趣点p到Gt内边界点的聚合距离dist(p,v),v为树节点Gt的边界点,再根据预处理的初始查询距离矩阵计算查询点q到Gt内边界点的dist(v,q),结合dist(p,v)、dist(v,q)得到dist(p,q);
针对查询点集Q中的每个查询点,重复以上步骤,计算得到兴趣点p的聚合距离dagg(p,Q)=∑q∈Qdist(p,q)。
7.根据权利要求4所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集这一步骤,其具体包括:
将候选点集中num=1且不被候选点集与该维度的查询结果集中兴趣点道路网支配的兴趣点作为Skyline点,并插入对应维度的查询结果集;
判断是否存在一个兴趣点满足结束条件,输出最终的查询结果集。
8.根据权利要求7所述一种基于最小聚合距离的多源skyline查询方法,其特征在于,所述判断是否存在一个兴趣点满足结束条件,输出最终的查询结果集这一步骤,其具体包括:
判断是否存在一个兴趣点的num变量等于兴趣点的属性维度总数d;
若存在,则输出最终的查询结果集R=R1∪R2∪…∪Rd
9.一种基于最小聚合距离的多源skyline查询系统,其特征在于,包括:
设置模块,用于给定一个道路网G、查询点集Q和兴趣点集P;
索引结构构建模块,用于对道路网划分建立QG-tree索引结构;
聚合距离计算模块,基于QG-tree索引,采用最小聚合距离优先策略计算具有最小聚合距离的兴趣点;
检索模块,用于采用倒排索引对兴趣点集进行管理,结合剪枝策略对兴趣点的各个维度进行检索,得到候选点集;
输出模块,用于对候选点集中的兴趣点进行道路网支配判定,输出最终查询结果集。
CN202210828365.8A 2022-07-13 2022-07-13 一种基于最小聚合距离的多源skyline查询方法及系统 Pending CN115146020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210828365.8A CN115146020A (zh) 2022-07-13 2022-07-13 一种基于最小聚合距离的多源skyline查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210828365.8A CN115146020A (zh) 2022-07-13 2022-07-13 一种基于最小聚合距离的多源skyline查询方法及系统

Publications (1)

Publication Number Publication Date
CN115146020A true CN115146020A (zh) 2022-10-04

Family

ID=83412358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210828365.8A Pending CN115146020A (zh) 2022-07-13 2022-07-13 一种基于最小聚合距离的多源skyline查询方法及系统

Country Status (1)

Country Link
CN (1) CN115146020A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116860901A (zh) * 2023-07-07 2023-10-10 中国科学院地理科学与资源研究所 一种基于图网络层次划分的地理知识关联索引与检索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116860901A (zh) * 2023-07-07 2023-10-10 中国科学院地理科学与资源研究所 一种基于图网络层次划分的地理知识关联索引与检索方法

Similar Documents

Publication Publication Date Title
Papadias et al. Aggregate nearest neighbor queries in spatial databases
US8832073B2 (en) Method and apparatus for efficient aggregate computation over data streams
WO2022205833A1 (zh) 无线网络协议知识图谱构建分析方法、系统、设备及介质
KR101015324B1 (ko) 데이터 맵핑 방법과 md 데이터 객체 검색을 위한 컴퓨터로 구현되는 방법, 컴퓨터로 구현되는 시스템 및 컴퓨터 판독가능 기록매체
Liu et al. Finding top-k optimal sequenced routes
US7149735B2 (en) String predicate selectivity estimation
CN111460234B (zh) 图查询方法、装置、电子设备及计算机可读存储介质
CN111444317B (zh) 一种语义敏感的知识图谱随机游走采样方法
CN109992590B (zh) 交通网络中带数字属性的近似空间关键字查询方法及系统
CN115146020A (zh) 一种基于最小聚合距离的多源skyline查询方法及系统
CN101662489B (zh) 语义Web服务的发现方法、装置及系统
Zhu et al. Top-k reliability search on uncertain graphs
CN116304213B (zh) 基于图神经网络的rdf图数据库子图匹配查询优化方法
CN113407669B (zh) 一种基于活动影响力的语义轨迹查询方法
US20220215021A1 (en) Data Query Method and Apparatus, Computing Device, and Storage Medium
CN113535803B (zh) 一种基于关键字索引的区块链高效检索及可靠性验证方法
Sun et al. Riso-tree: An efficient and scalable index for spatial entities in graph database management systems
Xu et al. Scalable top-k keyword search in relational databases
CN113360546A (zh) 一种基于超立方体均衡划分的近似近邻元素检索方法及系统
CN107688620B (zh) 一种面向Top-k查询的查询结果即时多样化的方法
Zhao et al. Graph indexing for spatial data traversal in road map databases
CN114064995B (zh) 一种路网环境下基于位置的静态skyline查询方法
CN115994254A (zh) 基于带标签路网的高效最短路径索引动态维护方法
CN111913987B (zh) 一种基于维组-时空-概率过滤的分布式查询系统及方法
US20230315702A1 (en) Constraint-based index tuning in database management systems utilizing reinforcement learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination