CN110377795A - 一种基于Blogel的分布式时态图可达性查询处理方法 - Google Patents

一种基于Blogel的分布式时态图可达性查询处理方法 Download PDF

Info

Publication number
CN110377795A
CN110377795A CN201910566655.8A CN201910566655A CN110377795A CN 110377795 A CN110377795 A CN 110377795A CN 201910566655 A CN201910566655 A CN 201910566655A CN 110377795 A CN110377795 A CN 110377795A
Authority
CN
China
Prior art keywords
vertex
label
minv
temporal diagram
reachable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910566655.8A
Other languages
English (en)
Inventor
高云君
张天明
陈刚
浦世亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Zhejiang University ZJU
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Hangzhou Hikvision Digital Technology Co Ltd filed Critical Zhejiang University ZJU
Priority to CN201910566655.8A priority Critical patent/CN110377795A/zh
Publication of CN110377795A publication Critical patent/CN110377795A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于Blogel的分布式时态图可达性查询处理方法。本发明提出了三种时态图可达性查询,一为普通时态图可达性查询;二为最短时间间隔查询;三为最早到达时间查询。本发明基于Blogel分布式计算框架,利用时态顶点标签索引TVL,有效组织时态图的时态信息和图拓扑结构;利用批量和并行技术,提升TVL索引的构建效率;利用索引判定方法和剪枝技术,缩小图搜索空间,提升查询效率。本发明先在TVL索引构建阶段为每个顶点计算其可达的规范顶点标签集合Lout和可达此顶点的规范顶点标签集合Lin。而后本发明在查询阶段利用剪枝技术有效地缩减查询搜索空间,依据索引判定方法快速返回查询结果。本发明极大地提高了可达性查询处理效率,提供了最佳的性能。

Description

一种基于Blogel的分布式时态图可达性查询处理方法
技术领域
本发明涉及计算机数据库领域中图可达性查询处理技术,特别是涉及一种基于Blogel的 分布式时态图可达性查询处理方法。
背景技术
图数据用于建模实体之间的关系。针对普通图上的可达性查询方法,目前国内外学者已 经做出了大量的工作。普通图模型在查询过程中忽略时态信息以简化计算。然而,现实世界 图常常附带时态信息,顶点之间的关系在某一时刻发生并持续一段时间结束,此种类型的图 称之为时态图。例如,在电话通信网络中,用户在不同的时间段进行多次通话。在社交网络 中,朋友选择在不同的时间段聚会。在交通调度网络中,火车(或者飞机)在特定时间段内 从始发点到终点目的地。
随着大数据时代的到来,时态图数据的规模呈指数型增长,单台机器已经无法有效地存 储整张时态图并高效地对时态图进行查询处理。因此,以Pregel为代表的分布式图迭代处理 系统应运而生。Pregel是Google提出的以顶点为中心的大规模分布式图计算平台,其遵循 Bulk Synchronous Parallel(BSP)模型,整个计算过程由若干顺序运行的超级步(SuperStep) 组成,系统从一个“超级步”迈向下一个“超级步”,直到达到算法的终止条件。Blogel系统 对Pregel进行了优化,其可支持以块(block)为中心的计算模型,进一步提升了分布式框架 处理效率。本发明基于Blogel系统,设计一个具有高可扩展性、高效率的时态图可达性查询 处理方法成为了学术界与工业界的迫切需求。
针对基于Blogel的分布式时态图可达性查询处理,一种基本方法是直接在时态图上进行 广度优先搜索。然而,这种方法需要遍历整张图才能得到最终的查询结果,查询时间复杂度 高。另一种方法是将时态图转化为普通图,然后利用普通图上已有的可达性查询算法进行处 理。这种方法得到的转化图规模是时态图的几十倍甚至几百倍,这导致基于普通图构建的索 引规模大,构建效率低,查询效率低。
发明内容
针对现有技术的不足,本发明提供一种基于Blogel的分布式时态图可达性查询处理方法, 该方法基于Blogel分布式计算框架,先在TVL索引构建阶段为每个顶点计算其可达的规范顶 点标签集合Lout和可达此顶点的规范顶点标签集合Lin。而后在查询阶段利用剪枝技术有效 地缩减查询搜索空间,依据索引判定方法快速返回查询结果。
为了达到上述目的,本发明所采用技术方案如下:一种基于Blogel的分布式时态图可达 性查询处理方法,该方法的步骤如下:
(1)为时态图中的每个顶点v分配一个唯一重要值ρ(v);
(2)用户提交k值;
(3)根据步骤(1)得到的顶点重要值ρ(v)和步骤(2)提交的k值,构建TVL(TemporalVertex Labeling)索引;
(4)用户提交查询源顶点,查询目的顶点,查询时间间隔,并且选择查询类型;
(5)根据步骤(4)选择的查询类型;在时态图上进行并行的广度优先遍历,利用剪枝 技术缩小每轮迭代中的子图搜索空间,利用TVL索引判定方法快速返回指定查询类型的结 果。
进一步的,所述步骤(1)为时态图中的每个顶点v分配一个唯一重要值ρ(v)的具体步骤 如下:
用G=(V,E)表示一个时态图,其中V是顶点集合,E是时态边集合;在时态图中,两个 顶点u与v之间存在多条时态边;用S(u,v)表示u与v之间的所有时态边集合,|S(u,v)|表示 u与v之间的时态边数目;
顶点v的入度Din(v)表示为:
顶点v的出度Dout(v)表示为:
其中,Nin(v)表示v的入度邻居顶点集合;Nout(v)表示v的出度邻居顶点集合;
顶点v的度为Din(v)+Dout(v);将时态图的所有顶点按照度的大小降序排列,则顶点v的 重要值ρ(v)为v的排列位置。
进一步的,所述步骤(2)中k是用户指定的控制TVL索引大小的参数值。
进一步的,所述的步骤(3)构建TVL索引的具体步骤如下:
用e=(u,v,st,at)表示时态图中从顶点u到顶点v的一条时态边,其中st表示从u出发时 刻,at表示到达v的时刻;
(3.1)用p(u,υ)表示从顶点u到顶点v的一条时态路径,根据p(u,v)计算得到一个可达v 的顶点标签lin=(minV,ρ(minV),st,at),其中minV表示路径p(u,v)上具有最小重要值的顶 点,并且minV≠v;st表示从顶点minV出发的时间,at表示到达顶点v的时间;
(3.2)用p(v,w)示从顶点v到顶点w的一条时态路径,根据p(v,w)计算得到一个v可达 的顶点标签lo=(minV′,ρ(minV′),s′t,a′t),其中minV'表示路径p(v,w)上具有最小重要值的顶 点,并且minV′≠v;s′t表示从顶点v出发的时间,a′t表示到达顶点minV'的时间;
(3.3)对于一个可达v的顶点标签lin=(minV,ρ(minV),st,at),如果在所有可达v的顶 点标签中,不存在标签满足则 lin被认为是一个可达v的规范顶点标签,其中分别表示从顶点minV出发的时间和到达 顶点v的时间;
(3.4)对于一个v可达的顶点标签lo=(minV′,ρ(minV′),s′t,a′t),如果在所有v可达的顶 点标签中,不存在标签满足则lo被认为是一个v可达的规范顶点标签,其中,表示从顶点v出发的时间,表示到达顶点 minV'的时间;
(3.5)为时态图中的每个顶点v迭代计算标签集合Lin(v),Lin(v)中保存具有前k个最小 重要值的可达v的规范顶点标签;
(3.6)为时态图中的每个顶点v迭代计算标签集合Lout(v),Lout(v)中保存具有前k个最 小重要值的v可达的规范顶点标签;
(3.7)时态图中所有顶点的Lin集合和Lout集合组成TVL索引。
进一步的,所述的步骤(4)用户提交查询源顶点s,查询目的顶点t,查询时间间隔I=[ws, wa],ws和wa分别表示查询时间间隔的开始时间戳和结束时间戳,用户选择查询类型,其中 查询类型有三种:
1)普通时态图可达性查询,其在查询时间间隔I=[ws,wa]内,查询源顶点s到目的顶点 t是否可达;
2)最短时间间隔查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最 短时间间隔;
3)最早到达时间查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最 早到达时间。
进一步的,所述步骤(5)具体为:
(5.1)在时态图上从源顶点s开始进行并行的广度优先遍历,利用TVL索引判定方法返 回指定查询类型的结果;
(5.2)TVL索引判定方法无法判断查询结果时,利用剪枝技术缩小子图搜索空间;
(5.3)递归遍历时态子图,再次利用步骤(5.1)的TVL索引判定方法或步骤(5.2)的剪枝技术加速查询,直至遍历到目的顶点t得到最终查询结果为止。
进一步的,所述TVL索引判定方法是指:
1)若Lout(s)中存在标签ls,Lin(t)中存在标签lt,如果ls.minV=lt.minV,ls.st≥ws, lt.at≤wa,ls.at≤lt.st,则s到t在时间间隔I=[ws,wa]内可达;
2)若Lout(s)中存在标签ls使得ls.minV=t,ls.st≥ws,ls.at≤wa,则s到t在时间间隔 I=[ws,wa]内可达;
3)若Lin(t)中存在标签lt使得lt.minV=s,lt.st≥ws,lt.at≤wa,则s到t在时间间隔I= [ws,wa]内可达;
4)将Lout(s)分为多个子集合,每个子集合中的标签具有相同的minV;在每个子集合的 标签中,查找记录大于ws时刻的最早出发时间的标签,而后在得到的标签中,计算最小顶点 重要值ρs;将Lin(t)分为多个子集合,每个子集合中的标签具有相同的minV;在每个子集合 的标签中,查找记录小于wa时刻的最晚到达时间的标签,而后在得到的标签中,计算最小顶 点重要值ρt,如ρs大于ρt,则s到t在时间间隔I=[ws,wa]内不可达。
进一步的,所述的剪枝技术是指:
若递归遍历到的顶点u的到达时间大于wa或者递归遍历过程中无时态路径,则以u为起 点关联的子图搜索空间被剪枝。
进一步的,所述时态图可以为交通路网调度图、通信网络图、社交网络图等等。
本发明具有的有益效果是:本发明在Blogel分布式计算框架下,充分利用了计算机数据 库领域中与图可达性查询处理相关的技术,利用时态顶点标签索引TVL,有效组织时态图的 时态信息和图拓扑结构;利用批量和并行技术,提升TVL索引的构建效率;利用索引判定方 法和剪枝技术,缩小图搜索空间,使得查询效率得到显著提高。本发明的方法无需图转化, 直接在时态图上采用消息传播的方法构建索引。索引附带有时态信息,构建速度快,存储代 价低,可扩展性高。
附图说明
图1是本发明的实施步骤流程图;
图2为TVL索引输入时态图示意图。
具体实施方式
现结合附图和具体实施对本发明的技术方案作进一步说明:
如图1所示,本发明具体实施过程和工作原理如下:
步骤(1):为时态图中的每个顶点v分配一个唯一重要值ρ(v)。具体步骤如下:
用G=(V,E)表示一个时态图,其中V是顶点集合,E是时态边集合。在时态图中,两个 顶点u与v之间存在多条时态边。用S(u,v)表示u与v之间的所有时态边集合,|S(u,v)|表示 u与v之间的时态边数目。需要说明的是,针对具体应用场景,时态图可以为交通路网调度 图,通信网络图,社交网络图等等。
顶点v的入度Din(v)可以表示为:
顶点v的出度Dout(v)可以表示为:
其中,Nin(v)表示v的入度邻居顶点集合;Nout(v)表示v的出度邻居顶点集合。
顶点v的度为Din(v)+Dout(v)。将时态图的所有顶点按照度的大小降序排列,则顶点v的 重要值ρ(v)为v的排列位置。
步骤(2):用户提交k值。k是用户指定的控制TVL索引大小的参数值。
步骤(3):根据步骤(1)得到的顶点重要值ρ(v)和步骤(2)提交的k值,构建TVL索引。下面以图2为例对TVL索引构建进行说明,其中输入的时态图G=(V,E)如图2所示, V={v1,v2,v3,v4,v5},E={e1,e2,…,e11},每一条边上附带的二元组表示出发时刻与到达 时刻,每个顶点的重要值如表1第二列ρ(vi)所示,即ρ(v1)=1,ρ(v2)=2,ρ(v3)=3,ρ(v4)=4, ρ(v5)=5。
表1:顶点重要值以及TVL索引
(3.1)对于每一个顶点vi,根据可达vi的时态路径,计算得到可达vi的顶点标签 lin=(minV,ρ(minV),st,at),其中minV表示路径上具有最小重要值的顶点,并且minV≠vi。 st表示从顶点minV出发的时间,at表示到达顶点vi的时间。计算结果为:
可达v1的顶点标签为
可达v2的顶点标签为(v1,1,5,6),(v1,1,5,7);
可达v3的顶点标签为(v1,1,3,4);
可达v4的顶点标签为(v1,1,2,4),(v1,1,6,7);
可达v5的顶点标签为(v4,4,2,3);
(3.2)对于每一个顶点vi,根据vi可达的时态路径,计算得到vi可达的顶点标签 lo=(minV′,ρ(minV′),s′t,a′t),其中minV'表示路径上具有最小重要值的顶点,并且 minV′≠vi。s′t表示从顶点vi出发的时间,a′t表示到达顶点minV'的时间。计算结果为:
v1可达的顶点标签为
v2可达的顶点标签为
v3可达的顶点标签为(v1,1,4,6),(v2,2,8,9);
v4可达的顶点标签为(v1,1,4,5),(v2,2,2,9),(v3,3,2,8);
v5可达的顶点标签为(v2,2,1,8),(v2,2,7,9),(v3,3,7,8);
(3.3)对于一个可达vi的顶点标签lin=(minV,ρ(minV),st,at),如果在所有可达vi的顶 点标签中,不存在标签满足则 lin被认为是一个可达vi的规范顶点标签,计算结果为:
可达v1的规范顶点标签为
可达v2的规范顶点标签为(v1,1,5,6);
可达v3的规范顶点标签为(v1,1,3,4);
可达v4的规范顶点标签为(v1,1,2,4),(v1,1,6,7);
可达v5的规范顶点标签为(v4,4,2,3);
(3.4)对于一个vi可达的顶点标签lo=(minV′,ρ(minV′),s′t,a′t),如果在所有vi可达的顶 点标签中,不存在标签满足则lo被认为是一个vi可达的规范顶点标签,计算结果为:
v1可达的规范顶点标签为
v2可达的规范顶点标签为
v3可达的规范顶点标签为(v1,1,4,6),(v2,2,8,9);
v4可达的规范顶点标签为(v1,1,4,5),(v2,2,2,9),(v3,3,2,8);
v5可达的规范顶点标签为(v2,2,1,8),(v2,2,7,9),(v3,3,7,8);
(3.5)为时态图中的每个顶点vi迭代计算标签集合Lin(vi),Lin(vi)中保存具有前k个最 小重要值的可达v的规范顶点标签,假设步骤(2)用户提交的k值为2,则Lin(vi)计算结果 为:
Lin(v2)={(v1,1,5,6)};Lin(v3)={(v1,1,3,4)};
Lin(v4)={(v1,1,2,4),(v1,1,6,7)};Lin(v5)={(v4,4,2,3)};
(3.6)为时态图中的每个顶点vi迭代计算标签集合Lout(vi),Lout(vi)中保存具有前k个 最小重要值的vi可达的规范顶点标签,Lout(vi)计算结果为:
Lout(v3)={(v1,1,4,6),(v2,2,8,9)};
Lout(v4)={(v1,1,4,5),(v2,2,2,9)};
Lout(v5)={(v2,2,1,8),(v2,2,7,9),(v3,3,7,8)};
(3.7)时态图中所有顶点的Lin集合和Lout集合组成TVL索引,如表1第三列Lin(vi) 和第四列Lout(vi)所示。
步骤(4):用户提交查询源顶点s,查询目的顶点t,查询时间间隔I=[ws,wa],并且选 择查询类型,其中查询类型有三种:
1)普通时态图可达性查询,其在查询时间间隔I=[ws,wa]内,查询源顶点s到目的顶点 t是否可达。
2)最短时间间隔查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最 短时间间隔。
3)最早到达时间查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最 早到达时间。
步骤(5):根据步骤(4)选择的查询类型;在时态图上进行并行的广度优先遍历,利用 剪枝技术缩小每轮迭代中的子图搜索空间,利用TVL索引判定方法快速返回指定查询类型的 结果。具体步骤包括:
(5.1)在时态图上从源顶点s开始进行并行的广度优先遍历,利用TVL索引判定方法快 速返回指定查询类型的结果。
(5.2)TVL索引判定方法无法判断查询结果时,利用剪枝技术缩小子图搜索空间。
(5.3)递归遍历时态子图,再次利用步骤(5.1)的TVL索引判定方法或步骤(5.2)的剪枝技术加速查询,直至遍历到目的顶点t得到最终查询结果为止。
步骤(5)中TVL索引判定方法是指:
1)若Lout(s)中存在标签ls,Lin(t)中存在标签lt,如果ls.minV=lt.minV,ls.st≥ws, lt.at≤wa,ls.at≤lt.st,则s到t在时间间隔I=[ws,wa]内可达。
2)若Lout(s)中存在标签ls使得ls.minV=t,ls.st≥ws,ls.at≤wa,则s到t在时间间隔I=[ws,wa]内可达。
3)若Lin(t)中存在标签lt使得lt.minV=s,lt.st≥ws,lt.at≤wa,则s到t在时间间隔 I=[ws,wa]内可达。
4)将Lout(s)分为多个子集合,每个子集合中的标签具有相同的minV。在每个子集合的 标签中,查找记录大于ws时刻的最早出发时间的标签,而后在得到的标签中,计算最小顶点 重要值ρs。将Lin(t)分为多个子集合,每个子集合中的标签具有相同的minV。在每个子集合 的标签中,查找记录小于wa时刻的最晚到达时间的标签,而后在得到的标签中,计算最小顶 点重要值ρt,如ρs大于ρt,则s到t在时间间隔I=[ws,wa]内不可达。
步骤(5)中剪枝技术是指:若递归遍历到的顶点u的到达时间大于wa或者递归遍历过 程中无时态路径,则以u为起点关联的子图搜索空间被剪枝。
本问题有很强的现实应用价值,在交通路网中,时态图的可达性查询可用于查询两个地 点之间在指定的时间段内是否可达,可达的最短时间以及最早到达时间。在通信网络中,时 态图的可达性查询可用于研究流言、信息的传播扩散。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明 说明书及附图内容所作的等效流程变换,或直接或间接运用在其他相关的技术领域,均同理 包括在本发明的专利保护范围内。

Claims (9)

1.一种基于Blogel的分布式时态图可达性查询处理方法,其特征在于,该方法的步骤如下:
(1)为时态图中的每个顶点v分配一个唯一重要值ρ(υ);
(2)用户提交k值;
(3)根据步骤(1)得到的顶点重要值ρ(υ)和步骤(2)提交的k值,构建TVL(TemporalVertex Labeling)索引;
(4)用户提交查询源顶点,查询目的顶点,查询时间间隔,并且选择查询类型;
(5)根据步骤(4)选择的查询类型;在时态图上进行并行的广度优先遍历,利用剪枝技术缩小每轮迭代中的子图搜索空间,利用TVL索引判定方法快速返回指定查询类型的结果。
2.根据权利要求1所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述步骤(1)为时态图中的每个顶点v分配一个唯一重要值ρ(υ)的具体步骤如下:
用G=(V,E)表示一个时态图,其中V是顶点集合,E是时态边集合;在时态图中,两个顶点u与v之间存在多条时态边;用S(u,υ)表示u与v之间的所有时态边集合,|S(u,υ)|表示u与v之间的时态边数目;
顶点v的入度Din(v)表示为:
顶点v的出度Dout(v)表示为:
其中,Nin(v)表示v的入度邻居顶点集合;Nout(v)表示v的出度邻居顶点集合;
顶点v的度为Din(v)+Dout(v);将时态图的所有顶点按照度的大小降序排列,则顶点v的重要值ρ(υ)为v的排列位置。
3.根据权利要求1所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述步骤(2)中k是用户指定的控制TVL索引大小的参数值。
4.根据权利要求1所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述的步骤(3)构建TVL索引的具体步骤如下:
用e=(u,υ,st,at)表示时态图中从顶点u到顶点v的一条时态边,其中st表示从u出发时刻,at表示到达v的时刻;
(3.1)用p(u,υ)表示从顶点u到顶点v的一条时态路径,根据p(u,υ)计算得到一个可达v的顶点标签lin=(minV,ρ(minV),st,at),其中minV表示路径p(u,υ)上具有最小重要值的顶点,并且minV≠υ;st表示从顶点minV出发的时间,at表示到达顶点v的时间;
(3.2)用p(υ,w)示从顶点v到顶点w的一条时态路径,根据p(υ,w)计算得到一个v可达的顶点标签lo=(minV′,ρ(minV′),s′t,a′t),其中minV'表示路径p(υ,w)上具有最小重要值的顶点,并且minV′≠υ;s′t表示从顶点v出发的时间,a′t表示到达顶点minV'的时间;
(3.3)对于一个可达v的顶点标签lin=(minV,ρ(minV),st,at),如果在所有可达v的顶点标签中,不存在标签满足则lin被认为是一个可达v的规范顶点标签,其中分别表示从顶点minV出发的时间和到达顶点v的时间;
(3.4)对于一个v可达的顶点标签lo=(minV′,ρ(minV′),s′t,a′t),如果在所有v可达的顶点标签中,不存在标签满足则lo被认为是一个v可达的规范顶点标签,其中,表示从顶点v出发的时间,表示到达顶点minV'的时间;
(3.5)为时态图中的每个顶点v迭代计算标签集合Lin(v),Lin(v)中保存具有前k个最小重要值的可达v的规范顶点标签;
(3.6)为时态图中的每个顶点v迭代计算标签集合Lout(v),Lout(v)中保存具有前k个最小重要值的v可达的规范顶点标签;
(3.7)时态图中所有顶点的Lin集合和Lout集合组成TVL索引。
5.根据权利要求1所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述的步骤(4)用户提交查询源顶点s,查询目的顶点t,查询时间间隔I=[ws,wa],ws和wa分别表示查询时间间隔的开始时间戳和结束时间戳,用户选择查询类型,其中查询类型有三种:
1)普通时态图可达性查询,其在查询时间间隔I=[ws,wa]内,查询源顶点s到目的顶点t是否可达;
2)最短时间间隔查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最短时间间隔;
3)最早到达时间查询,其在时间间隔I=[ws,wa]内,查询源顶点s到达目的顶点t的最早到达时间。
6.根据权利要求1所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述步骤(5)具体为:
(5.1)在时态图上从源顶点s开始进行并行的广度优先遍历,利用TVL索引判定方法返回指定查询类型的结果;
(5.2)TVL索引判定方法无法判断查询结果时,利用剪枝技术缩小子图搜索空间;
(5.3)递归遍历时态子图,再次利用步骤(5.1)的TVL索引判定方法或步骤(5.2)的剪枝技术加速查询,直至遍历到目的顶点t得到最终查询结果为止。
7.根据权利要求6所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述TVL索引判定方法是指:
1)若Lout(s)中存在标签ls,Lin(t)中存在标签lt,如果ls.minV=lt.minV,ls.st>ws,lt.at≤wa,ls.at≤lt.st,则s到t在时间间隔I=[ws,wa]内可达;
2)若Lout(s)中存在标签ls使得ls.minV=t,ls.st≥ws,ls.at≤wa,则s到t在时间间隔I=[ws,wa]内可达;
3)若Lin(t)中存在标签lt使得lt.minV=s,lt.st≥ws,lt.at≤wa,则s到t在时间间隔I=[ws,wa]内可达;
4)将Lout(s)分为多个子集合,每个子集合中的标签具有相同的minV;在每个子集合的标签中,查找记录大于ws时刻的最早出发时间的标签,而后在得到的标签中,计算最小顶点重要值ρs;将Lin(t)分为多个子集合,每个子集合中的标签具有相同的minV;在每个子集合的标签中,查找记录小于wa时刻的最晚到达时间的标签,而后在得到的标签中,计算最小顶点重要值ρt,如ρs大于ρt,则s到t在时间间隔I=[ws,wa]内不可达。
8.根据权利要求6所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述的剪枝技术是指:
若递归遍历到的顶点u的到达时间大于wa或者递归遍历过程中无时态路径,则以u为起点关联的子图搜索空间被剪枝。
9.根据权利要求1-8任一项所述的基于Blogel的分布式时态图可达性查询处理方法,其特征在于:所述时态图可以为交通路网调度图、通信网络图、社交网络图等等。
CN201910566655.8A 2019-06-27 2019-06-27 一种基于Blogel的分布式时态图可达性查询处理方法 Pending CN110377795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910566655.8A CN110377795A (zh) 2019-06-27 2019-06-27 一种基于Blogel的分布式时态图可达性查询处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910566655.8A CN110377795A (zh) 2019-06-27 2019-06-27 一种基于Blogel的分布式时态图可达性查询处理方法

Publications (1)

Publication Number Publication Date
CN110377795A true CN110377795A (zh) 2019-10-25

Family

ID=68250766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910566655.8A Pending CN110377795A (zh) 2019-06-27 2019-06-27 一种基于Blogel的分布式时态图可达性查询处理方法

Country Status (1)

Country Link
CN (1) CN110377795A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449153A (zh) * 2021-06-28 2021-09-28 湖南大学 索引构建方法、装置、计算机设备和存储介质
WO2023124253A1 (zh) * 2021-12-28 2023-07-06 深圳前海微众银行股份有限公司 一种图搜索方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449153A (zh) * 2021-06-28 2021-09-28 湖南大学 索引构建方法、装置、计算机设备和存储介质
CN113449153B (zh) * 2021-06-28 2023-09-26 湖南大学 索引构建方法、装置、计算机设备和存储介质
WO2023124253A1 (zh) * 2021-12-28 2023-07-06 深圳前海微众银行股份有限公司 一种图搜索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10102268B1 (en) Efficient index for low latency search of large graphs
CN105117421B (zh) 基于图结构匹配的社交网络分析方法
CN107291807B (zh) 一种基于图遍历的sparql查询优化方法
CN102521364B (zh) 一种图上两点间最短路径查询方法
CN104462260B (zh) 一种基于k-核的社交网络中的社区搜索方法
CN110059264B (zh) 基于知识图谱的地点检索方法、设备及计算机存储介质
CN110377795A (zh) 一种基于Blogel的分布式时态图可达性查询处理方法
CN103778251A (zh) 面向大规模rdf图数据的sparql并行查询方法
US20230082563A1 (en) Data processing method and data processing apparatus
CN103593433A (zh) 一种面向海量时序数据的图数据处理方法及系统
CN105138600A (zh) 基于图结构匹配的社交网络分析方法
CN106599190A (zh) 基于云计算的动态Skyline查询方法
CN105119834A (zh) 一种基于复合trie树结构的源地址目的地址联合查找方法
CN111881160A (zh) 一种基于关系代数的等价展开方法的分布式查询优化方法
CN110689174B (zh) 基于公共交通的人员路线规划方法及装置
CN103164495A (zh) 一种基于周边搜索的半连接查询优化方法及其系统
CN111897971A (zh) 一种适用于电网调度控制领域的知识图谱管理方法及系统
CN104657385A (zh) 一种节点的查找方法及装置
CN102012908A (zh) 障碍物环境中可视移动近邻的查询方法
CN108319604B (zh) 一种hive中大小表关联的优化方法
CN105354263A (zh) 基于HBase分布式环境下移动对象并行网格索引同步方法
CN102420812A (zh) 一种支持分布并行处理的Web服务自动QoS组合方法
CN105045879B (zh) 一种数据并行处理方法
CN105005627A (zh) 基于Spark分布式系统的最短路径关键点查询方法
CN110297950A (zh) 一种基于Blogel的分布式图受限可达性查询处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191025

RJ01 Rejection of invention patent application after publication