CN106447097A - 一种受限最长频繁路径的查询方法 - Google Patents
一种受限最长频繁路径的查询方法 Download PDFInfo
- Publication number
- CN106447097A CN106447097A CN201610835918.7A CN201610835918A CN106447097A CN 106447097 A CN106447097 A CN 106447097A CN 201610835918 A CN201610835918 A CN 201610835918A CN 106447097 A CN106447097 A CN 106447097A
- Authority
- CN
- China
- Prior art keywords
- path
- footprint
- frequent
- summit
- limited
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种受限最长频繁路径的查询方法,其步骤为:1)设计线性概略化足迹索引,并通过足迹索引构造出足迹图,计算足迹图中每条边的权重,最终将边的权重归一化;2)在上述足迹图中,采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径;3)在上述足迹图和最频繁路径的基础上,采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图,最终找出满足条件的受限最长频繁路径。本发明可以保证受限最长频繁路径的合理性和高效性。该发明的最终结果可以提供给相关领域的用户使用,例如导航系统、城市路径规划等领域,可以保证是最频繁路径的合理替代路径。
Description
技术领域
本发明涉及移动对象数据挖掘研究与应用领域,具体涉及一种受限最长频繁路径的查询方法,即最频繁路径的替代路径的查询方法。
背景技术
近年来,路径选择的研究备受关注,车辆的行驶轨迹是驾驶员的经验与当前交通状况相结合而产生的多次路径选择,蕴含了丰富的路径规划信息,也体现了道路交通状况。由于受到驾驶员的经验的影响,大多数轨迹并非是最短或最快路径,这为我们提供了基于历史进行受限最长频繁路径选择的依据。受限最长频繁路径,即最频繁路径的替代路径,该路径虽然不是最频繁的,但是很接近最频繁,并且频繁边的数量最大化,属于非传统的最频繁路径的合理替代路径。受限最长频繁路径不仅反映了驾驶员的路径选择偏好,而且也为最频繁路径寻找了最合理的替代路径,具有重要的研究价值与广泛的应用场景。
与传统的最短路径或最快路径相似,基于历史轨迹的最频繁路径也具备极值约束条件和良好的子问题结构,现有的算法或其改进算法都能快速解决此类最优化路径规划问题,例如Dijkstra算法[1]和用启发式对其扩展的A*算法[2],以及基于其他预先计算数据的更快的启发式扩展算法[3-4]和动态规划算法等,这些算法中可以在超大型路网中(如欧洲路网)访问上千网络顶点即可找出远距离的两点之间以单目标最优化路径。具有代表性的研究包括:陈在本等人用严谨的可吸收马尔可夫链数学模型形式化定义了最流行路径MPR[5],该模型倾向于选择最短路径,并给出了基于A*算法的高效启发式算法,用于启发式的数据无需在线计算;罗吴蔓等人用路径频繁度偏序序列模型形式化描述了给定时间段内最频繁路径TPMFP[6],该定义具有后缀最优、避免瓶颈路段和不受路径长度影响等良好特性,并给出了相应的动态规划算法,由于该问题依赖特定时间段,只能采取在线计算模式。
然而,现有方法得到的最频繁路径,虽然按照各自的路径频繁度定义来看是最频繁的,但是从路径的整体频繁度来看未必是最合适的。路径频繁度以及受限最长频繁路径的合理定义与描述、高效的轨迹索引方法、路径查询算法等,没有得到有效的研究与解决,对这些关键技术问题有待进一步的研究。
发明内容
针对上述尚没有解决的关键问题,本发明提出了一种基于历史轨迹的受限最长频繁路径查询方法,目的是为最频繁路径的替代路径提供一种可行的解决方案。
为实现上述目的,本发明采用如下的技术方案:
一种受限最长频繁路径的查询方法包括以下步骤:
步骤1、设计线性概略化足迹索引,并通过足迹索引构造出足迹图,计算足迹图中每条边的权重,最终将边的权重归一化;
步骤2、在所述足迹图中,采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径;
步骤3、在所述足迹图和最频繁路径的基础上,采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图,最终找出满足条件的受限最长频繁路径。
作为优选,所述足迹图用Gf=(Vf,Ef)表示,Gf是道路网络G=(V,E)中的一个有向图,并且Gf满足:对于顶点u,v∈V且边(u,v)∈E,当且仅当边的权重时,顶点u,v∈Vf且边(u,v)∈Ef,其中fmax=max(u,v)∈G{F(u,v)},fmin=min(u,v)∈G{F(u,v)};所述权重wu,v是指边(u,v)的频繁度分数F’(u,v),表示为如下形式:其中F(u,v)是边(u,v)的频繁度,所述频繁度F(u,v)是经过(u,v)的足迹数量;所述足迹Υ′是一条非空轨迹片段,并且Υ′满足:(1)vi在顶点vs和vd的δ扩展最小包容矩形MBR(vs,vd,δ)中,其中δ扩展最小包容矩形MBR(vs,vd,δ)是包容以线段[vs,vd]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形;(2)其中Υ′.ts,Υ′.td是Υ′的起止时间,T是给定时间段;所述最频繁路径P*是足迹图Gf中以vs和vd为起点和终点的所有路径中路径分数最小的路径,其中路径P的路径分数S(P)表示为如下形式:S(P)=∑(u,v)∈Pwu,v;所述路径P的频繁边的数量Kp定义为如下形式:KP=∑(u,v)∈Pku,v,当时ku,v取值为1否则为0,即KP是路径P中边的权重不大于的数量,其中是足迹图Gf中边的平均权重,表示为如下形式:θ是权重参数;所述受限最长频繁路径Pc足迹图Gf中以vs和vd为起点和终点的路径中满足如下条件的路径:(1)Pc的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数,即S(Pc)≤(1+ε)S(P*);(2)Pc的频繁边的数量是所有路径中最大的,即
作为优选,步骤1构建足迹图的方法包括如下:
步骤1-1、初始化道路网络G中边的频繁度矩阵F,并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(vs,vd,δ)中的足迹集合Υ;
步骤1-2、逐条处理足迹集合Υ中的每条足迹Υ′,根据时间段T选择Υ′中的有效足迹片段Υaf′,并将Υaf′中的每条边的频繁度自增1;
步骤1-3、将计算所得的频繁度矩阵F归一化处理为频繁度分数F’;
步骤1-4、依据G中计算所得的顶点,边,频繁度分数,构造足迹图Gf。
作为优选,步骤1-1所述线性概略化足迹索引的构建方法包括如下:
步骤1-1-1、对于空间区域,采用z-order空间填充方法,为每个空间区域编号,匹配每条足迹中的顶点到对应的空间区域,该顶点的编号即为该空间编号;
步骤1-1-2、对于不同的时间段,采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号,保证不同时间段内同一空间区域的编号不同,即对于第i个时间段,顶点v的编号为 是初始化状态,则其中max(z0)是所有顶点中初始化编号最大值;
步骤1-1-3、采用B+树来索引足迹中的每个顶点,并以顶点的编号作为索引项,一个足迹可以对应多个索引项,每个叶结点的入口为(z-order,v.id,Υaf′.id),其中z-order是顶点对应的编号,v.id为图中顶点唯一编号,Υaf′.id是足迹唯一编号。
作为优选,步骤2所述采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法包括如下:
步骤2-1、通过逆Dijkstra单源最短路径算法可获得所有以vd为终点的最频繁路径,包括不以vs为起点的和以vs为起点的P*;
步骤2-2、在足迹图的每个顶点中,记录当前顶点的下一个顶点,并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。
作为优选,步骤3所述采用剪枝算法找出受限最长频繁路径的方法包括如下:
步骤3-1、初始化优化队列Q,将起点vs的单顶点路径添加至Q中;
步骤3-2、依次检查Q中尚未到达终点vd的路径P,从P的尾顶点P.d的邻接顶点Vp.d出发扩展该路径,并按优先级插入到优先队列Q中;
步骤3-3、当Q中添加了新路径,采用剪枝策略对Q进行剪枝,保证Q中的路径为没有被任意其余路径统治。
作为优选,步骤3-2所述将扩展路径按照优先级插入到优先队列Q的方法包括如下:
步骤3-2-1、如果Q中的两条路径P1和P2频繁边数分别为和路径分数为S(P1)和S(P2);
步骤3-2-2、若不等式成立,则P1优先级高于P2,在Q中P1比P2更靠前。
作为优选,步骤3-3所述剪枝策略如下:
(1)剪枝策略1,在最频繁路径中,如果则经过vi的所有最频繁路径都不满足受限最长频繁路径;
(2)剪枝策略2,当路径P1扩展至顶点vi时,如果则扩展至vi的路径不可行;
(3)剪枝策略3,假设vs和vi之间有两条共顶点的路径P1和P2,若则可在Q中剪除路径P2对应分支;
(4)剪枝策略4,假设路径P1=vs→L→vm和P2=vs→…→vn,并且除了vs和vd,P1和P2之间无共同顶点,且满足如果则可在Q中剪除路径P2对应分支,其中
(5)剪枝策略5,假设从vs到vd的最频繁路径为P*,如果KP′的上界小于KP*,则可在Q中剪除路径P’对应分支。
本发明所采用的技术方案是三阶段框架,首先设计了线性概略化足迹索引,并在此基础上快速构造了足迹图,然后通过逆向Dijkstra算法找出所有到终点的最长频繁路径,最后结合多条剪枝策略,采用Best-First搜索算法在足迹图中查找受限最长频繁路径。
综合以上分析,本发明可以保证受限最长频繁路径的合理性和高效性。该发明的最终结果可以提供给相关领域的用户使用,例如导航系统、城市路径规划等领域,可以保证是最频繁路径的合理替代路径。
附图说明
图1为道路网络G和δ扩展最小包容矩形MBR(v3,v9,δ)的示意图;
图2为在给定输入Ω=(G,vs,vd,T,δ,ε,θ)下的足迹的示意图;
图3(a)为空间填充曲线示意图;
图3(b)为图2中时间段[ts,te]内的足迹索引的示意图;
图4为对图2中在时间[ts,te]∈T内足迹进行有效提取的足迹图;
图5是采用剪枝策略剪掉不必要的路径的示意图;
图6(a)是受限最长频繁路径与最短路径的对比关系图,图6(b)是受限最长频繁路径与最少边路径的对比关系图;
图7(a)是小数据集与足迹图的构建时间关系图,图7(b)是中数据集与足迹图的构建时间关系图,图7(c)是大数据集与足迹图的构建时间,图7(d)是足迹图的构建时间与权重参数的关系图;
图8(a)是查询时间与权重参数的关系图,图8(b)是查询时间与受限参数的关系图;
图9为本发明受限最长频繁路径的查询方法的流程图。
具体实施方式
下面结合附图,通过实例进一步说明本发明,但不以任何方式限制本发明的范围。
如图9所示,本发明实施例提供一种受限最长频繁路径的查询方法,其步骤包括:
1)设计线性概略化足迹索引,并通过足迹索引构造出足迹图,计算足迹图中每条边的权重,最终将边的权重归一化;
2)在所述足迹图中,采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径;
3)在所述足迹图和最频繁路径的基础上,采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图,最终找出满足条件的受限最长频繁路径;
更进一步,所述足迹图Gf是道路网络G=(V,E)中的一个有向图,记做Gf=(Vf,Ef),并且满足:对于顶点u,v∈V且边(u,v)∈E,当且仅当边的权重时,顶点u,v∈Vf且边(u,v)∈Ef,其中fmax=max(u,v)∈G{F(u,v)},fmin=min(u,v)∈G{F(u,v)};
更进一步,所述边的权重wu,v是指边(u,v)的频繁度分数F’(u,v),定义为如下形式:其中F(u,v)是边(u,v)的频繁度;
更进一步,所述边的频繁度F(u,v)是经过(u,v)的足迹数量;
更进一步,所述的足迹Υ′是一条非空轨迹片段,并且Υ′满足:
(1)vi在顶点vs和vd的δ扩展最小包容矩形MBR(vs,vd,δ)中;
(2)其中Υ′.ts,Υ′.td是Υ′的起止时间,T是给定时间段;
更进一步,所述δ扩展最小包容矩形MBR(vs,vd,δ)是包容以线段[vs,vd]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形;
更进一步,所述最频繁路径P*是足迹图Gf中以vs和vd为起点和终点的所有路径中路径分数最小的路径;
更进一步,所述路径P的路径分数S(P)定义为如下形式:S(P)=∑(u,v)∈Pwu,v;
更进一步,所述路径P的频繁边的数量Kp定义为如下形式:KP=∑(u,v)∈Pku,v,当时ku,v取值为1否则为0,即KP是路径P中边的权重不大于的数量,其中是足迹图Gf中边的平均权重,θ是权重参数;
更进一步,所述足迹图Gf中边的平均权重定义为如下形式:
更进一步,所述受限最长频繁路径Pc足迹图Gf中以vs和vd为起点和终点的路径中满足如下条件的路径:
(1)Pc的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数,即S(Pc)≤(1+ε)S(P*);
(2)Pc的频繁边的数量是所有路径中最大的,即
更进一步,步骤1)中构建足迹图的方法如下:
1-1)初始化道路网络G中边的频繁度矩阵F,并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(vs,vd,δ)中的足迹集合Υ;
1-2)逐条处理足迹集合Υ中的每条足迹Υ′,根据时间段T选择Υ′中的有效足迹片段Υaf′,并将Υaf′中的每条边的频繁度自增1;
1-3)将计算所得的频繁度矩阵F归一化处理为频繁度分数F’;
1-4)依据G中计算所得的顶点,边,频繁度分数,构造足迹图Gf;
更进一步,步骤1-1)中所述线性概略化足迹索引的构建方法如下:
(1)对于空间区域,采用z-order空间填充方法,为每个空间区域编号,匹配每条足迹中的顶点到对应的空间区域,该顶点的编号即为该空间编号;
(2)对于不同的时间段,采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号,保证不同时间段内同一空间区域的编号不同,即对于第i个时间段,顶点v的编号为 是初始化状态,则其中max(z0)是所有顶点中初始化编号最大值;
(3)采用B+树来索引足迹中的每个顶点,并以顶点的编号作为索引项,一个足迹可以对应多个索引项,每个叶结点的入口为(z-order,v.id,Υaf′.id),其中z-order是顶点对应的编号,v.id为图中顶点唯一编号,Υaf′.id是足迹唯一编号;
更进一步,步骤1-1)中所述基于线性概略化足迹索引的查询方法如下:
(1)将要查询的时空范围规范化为一个或多个整数范围;
(2)根据上述整数范围进行查询,将得到的全局足迹编号进行去重复处理;
更进一步,步骤2)中采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法如下:
2-1)通过逆Dijkstra单源最短路径算法可获得所有以vd为终点的最频繁路径,包括不以vs为起点的和以vs为起点的P*;
2-2)在足迹图的每个顶点中,记录当前顶点的下一个顶点,并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量;
更进一步,步骤3)中采用Best-First剪枝算法找出受限最长频繁路径的方法如下:
3-1)初始化优化队列Q,将起点vs的单顶点路径添加至Q中;
3-2)依次检查Q中尚未到达终点vd的路径P,从P的尾顶点P.d的邻接顶点Vp.d出发扩展该路径,并按优先级插入到优先队列Q中;
3-3)一旦Q中添加了新路径,采用剪枝策略对Q进行剪枝,保证Q中的路径为没有被任意其余路径统治;
更进一步,所述步骤3-2)中将扩展路径按照优先级插入到优先队列Q中,如果Q中的两条路径P1和P2频繁边数分别为和路径分数为S(P1)和S(P2),若不等式成立,则P1优先级高于P2,在Q中P1比P2更靠前;
更进一步,所述步骤3-3)中的路径P1统治路径P2是指S(P1)≤S(P2)且记作
更进一步,所述步骤3-3)中的剪枝策略如下:
(1)剪枝策略1,在最频繁路径中,如果则经过vi的所有最频繁路径都不满足受限最长频繁路径;
(2)剪枝策略2,当路径P1扩展至顶点vi时,如果则扩展至vi的路径不可行;
(3)剪枝策略3,假设vs和vi之间有两条共顶点的路径P1和P2,若则可在Q中剪除路径P2对应分支;
(4)剪枝策略4,假设路径P1=vs→L→vm和P2=vs→…→vn,并且除了vs和vd,P1和P2之间无共同顶点,且满足如果则可在Q中剪除路径P2对应分支,其中
(5)剪枝策略5,假设从vs到vd的最频繁路径为P*,如果KP′的上界小于KP*,则可在Q中剪除路径P’对应分支。
本发明的原理是:
首先,在一系列移动对象的足迹集合中,建立线性概略化足迹索引,通过足迹索引,可以方便的构建出足迹图。本发明中足迹Υ′是一条非空轨迹片段,并且Υ′满足:(1)vi在顶点vs和vd的δ扩展最小包容矩形MBR(vs,vd,δ)中;(2)其中Υ′.ts,Υ′.td是Υ′的起止时间,T是给定时间段,其中δ扩展最小包容矩形MBR(vs,vd,δ)是包容以线段[vs,vd]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形。图1给出了道路网络G和δ扩展最小包容矩形MBR(v3,v9,δ),其中v3和v9的最小包容矩形包含v3,v6,v7,v9和v10五个顶点,而MBR(v3,v9,δ)包含从v2到v10的9个顶点。图2给出了在给定输入Ω=(G,vs,vd,T,δ,ε,θ)下的足迹,其中vs=v1,vd=v11,[ts,te]∈T。
线性概略化足迹索引采用z-order空间填充方法,为每个空间区域编号,匹配每条足迹中的顶点到对应的空间区域,该顶点的编号即为该空间编号。对于不同的时间段,采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号,保证不同时间段内同一空间区域的编号不同,即对于第i个时间段,顶点v的编号为 是初始化状态,则其中max(z0)是所有顶点中初始化编号最大值。最后采用B+树来索引足迹中的每个顶点,并以顶点的编号作为索引项,一个足迹可以对应多个索引项,每个叶结点的入口为(z-order,v.id,Υaf′.id),其中z-order是顶点对应的编号,v.id为图中顶点唯一编号,Υaf′.id是足迹唯一编号。图3给出了空间填充曲线和该z-order下的足迹索引。在图3(b)中,在图2中时间段[ts,te]内的足迹索引,图中入口项为zΥ′.id,两行叶结点入口数据为从左至右、从上而下非递减排列。
足迹图的构造首先初始化道路网络G中边的频繁度矩阵F,并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(vs,vd,δ)中的足迹集合Υ,基于足迹索引进行时空范围查询时,首先将要查询的时空范围规范化为一个或多个整数范围,并以这些整数范围发起查询,并将得到的全局足迹编号进行去重复处理。然后逐条处理足迹集合Υ中的每条足迹Υ′,根据时间段T选择Υ′中的有效足迹片段Υaf′,并将Υaf′中的每条边的频繁度自增1,图2在给定输入Ω=(G,vs,vd,T,δ,ε,θ)下的有效足迹共7条,其中vs=v1,vd=v11,[ts,te]∈T,分别是:Υ′1=v2→v5→v9,Υ′2=v1→v2→v6→v9,Υ′3=v3→v6→v9→v11,Υ′4=v1→v3→v7→v10→v11,Υ′5=v7→v10,Υ′6=v6→v9,Υ′7=v6→v3→v4。再将计算所得的频繁度矩阵F归一化处理为频繁度分数F’,最后依据G中计算所得的顶点,边,频繁度分数,构造足迹图Gf,图4是对图2中在时间[ts,te]∈T内足迹进行有效提取的足迹图。
然后,采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径,并在足迹图的每个顶点中,记录当前顶点的下一个顶点,并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。
最后,采用Best-First算法搜索足迹图,为了尽早丢弃不满足受限频繁路径的搜索路径,尽可能朝着可能解的方向搜索,我们提出了相应的剪枝策略。其中剪枝策略1,在最频繁路径中,如果则经过vi的所有最频繁路径都不满足受限最长频繁路径;剪枝策略2,当路径P1扩展至顶点vi时,如果则扩展至vi的路径不可行;剪枝策略3,假设vs和vi之间有两条共顶点的路径P1和P2,若则可在Q中剪除路径P2对应分支;剪枝策略4,假设路径P1=vs→L→vm和P2=vs→…→vn,并且除了vs和vd,P1和P2之间无共同顶点,且满足如果则可在Q中剪除路径P2对应分支,其中剪枝策略5,假设从vs到vd的最频繁路径为P*,如果KP′的上界小于KP*,则可在Q中剪除路径P’对应分支。图5是采用剪枝策略3剪掉不必要的路径,其中两条路径P1=vs→vi→vk和P2=vs→vj→vk,则P2会被剪枝策略3所剪枝掉。
受限最长频繁路径查找的具体过程包括:
第一步:在一系列移动对象的足迹集合中,建立线性概略化足迹索引,通过足迹索引,构建出足迹图。具体方法如下:
1.建立线性概略化足迹索引,具体方法如下:
⑴采用z-order空间填充方法,为每个空间区域编号,匹配每条足迹中的顶点到对应的空间区域,该顶点的编号即为该空间编号。
⑵对于不同的时间段,采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号,保证不同时间段内同一空间区域的编号不同,具体方法如下:
①对于第i个时间段,顶点v的编号为 是初始化状态。
②计算其中max(z0)是所有顶点中初始化编号最大值。
⑶采用B+树来索引足迹中的每个顶点,并以顶点的编号作为索引项,一个足迹可以对应多个索引项,每个叶结点的入口为(z-order,v.id,Υaf′.id),其中z-order是顶点对应的编号,v.id为图中顶点唯一编号,Υaf′.id是足迹唯一编号。
2.通过线性概略化足迹索引,构建出足迹图,具体方法如下:
⑴初始化道路网络G中边的频繁度矩阵F。
⑵在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(vs,vd,δ)中的足迹集合Υ,具体方法如下:
①将要查询的时空范围规范化为一个或多个整数范围,并以这些整数范围发起查询。
②将得到的全局足迹编号进行去重复处理。
⑶逐条处理足迹集合Υ中的每条足迹Υ′,根据时间段T选择Υ′中的有效足迹片段Υaf′,并将Υaf′中的每条边的频繁度自增1。
⑷将计算所得的频繁度矩阵F归一化处理为频繁度分数F’,并依据G中计算所得的顶点、边、频繁度分数,构造足迹图Gf。
例如,图1给出了道路网络G和δ扩展最小包容矩形MBR(v3,v9,δ),其中v3和v9的最小包容矩形包含v3,v6,v7,v9和v10五个顶点,而MBR(v3,v9,δ)包含从v2到v10的9个顶点。图2给出了在给定输入Ω=(G,vs,vd,T,δ,ε,θ)下的足迹,其中vs=v1,vd=v11,[ts,te]∈T。图3给出了空间填充曲线和该z-order下的足迹索引。其中图3(b)是在图2中时间段[ts,te]内的足迹索引,图中入口项为zΥ′.id,两行叶结点入口数据为从左至右、从上而下非递减排列。图2在给定输入Ω=(G,vs,vd,T,δ,ε,θ)下的有效足迹共7条,其中vs=v1,vd=v11,[ts,te]∈T,分别是:Υ′1=v2→v5→v9,Υ′2=v1→v2→v6→v9,Υ′3=v3→v6→v9→v11,Υ′4=v1→v3→v7→v10→v11,Υ′5=v7→v10,Υ′6=v6→v9,Υ′7=v6→v3→v4。图4是对图2中在时间[ts,te]∈T内足迹进行有效提取的足迹图。
第二步:采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径,并在足迹图的每个顶点中,记录当前顶点的下一个顶点,并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。
第三步:采用Best-First剪枝算法找出受限最长频繁路径。具体方法如下:
1.初始化优化队列Q,将起点vs的单顶点路径添加至Q中。
2.依次检查Q中尚未到达终点vd的路径P,从P的尾顶点P.d的邻接顶点Vp.d出发扩展该路径,并按优先级插入到优先队列Q中。具体方法如下:
⑴将扩展路径按照优先级插入到优先队列Q中。
⑵如果Q中的两条路径P1和P2频繁边数分别为和路径分数为S(P1)和S(P2),若不等式成立,则P1优先级高于P2,在Q中P1比P2更靠前。
3.一旦Q中添加了新路径,采用剪枝策略对Q进行剪枝,保证Q中的路径为没有被任意其余路径统治。具体步骤如下:
⑴对于路径P1和路径P2,如果S(P1)≤S(P2)且则路径P1统治路径P2,则将剪除路径P2。具体的剪枝策略如下:
①剪枝策略1,在最频繁路径中,如果则经过vi的所有最频繁路径都不满足受限最长频繁路径。
②剪枝策略2,当路径P1扩展至顶点vi时,如果则扩展至vi的路径不可行;
③剪枝策略3,假设vs和vi之间有两条共顶点的路径P1和P2,若则可在Q中剪除路径P2对应分支;
④剪枝策略4,假设路径P1=vs→L→vm和P2=vs→…→vn,并且除了vs和vd,P1和P2之间无共同顶点,且满足如果则可在Q中剪除路径P2对应分支,其中
⑤剪枝策略5,假设从vs到vd的最频繁路径为P*,如果KP′的上界小于KP*,则可在Q中剪除路径P’对应分支;
例如,图5是采用剪枝策略3剪掉不必要的路径,其中两条路径P1=vs→vi→vk和P2=vs→vj→vk,则P2会被剪枝策略3所剪枝掉。
本发明提出了一种受限最长频繁路径的查询方法,受限最长频繁路径是最频繁路径的合理替代路径,即时间区域和最频繁路径限制下的频繁边的数量最大的受限最长频繁路径。与现有的频繁路径问题无法从整体角度合理地表示频繁度相比,本发明具有如下优势:
(1)本发明提出了频繁路径的合理替代路径受限最长频繁路径。如图6(a)—6(b)所示,图6(a),6(b)分别将受限最长频繁路径与最短路径和最少边路径的对比关系图,说明了受限最长频繁路径的合理性,其中纵坐标Number of query results表示路径数量,Total表示路径总数,TPLFP表示受限最长频繁路径,STP表示最短路径,MFP表示最频繁路径,All are pairwise different表示每两个之间都是很不一样的。
(2)本发明采用线性概略化足迹索引构建足迹图,提高了效率。如图7(a)—7(d)所示,图7(a),7(b),7(c)分别是在小、中、大数据集上足迹图的构建时间,其中纵坐标Response Time表示执行时间,横坐标Number of footmark表示数据集大小,using LSFIfor Gf表示采用线性概略化足迹索引构建足迹图,Full scan for Gf表示未采用线性概略化足迹索引构建足迹图,图7(d)是足迹图的构建时间与权重参数θ的关系图,其中纵坐标Response Time表示执行时间,横坐标θ表示权重参数。
(3)本发明采用剪枝策略降低了受限最长频繁路径的查找时间,提高了效率。如图8(a)—8(b)所示,图8(a),8(b)分别是查询时间与权重参数θ和受限参数ε的关系图,其中纵坐标Response Time表示执行时间,横坐标ε表示受限参数,θ表示权重参数,using Gf表示采用足迹图,using Gaf表示采用改进的足迹图。
综合以上分析,本发明可以保证受限最长频繁路径的合理性和高效性。该发明的最终结果可以提供给相关领域的用户使用,例如导航系统、城市路径规划等领域,可以保证是最频繁路径的合理替代路径。
以上通过实施例对本发明进行了详细的描述,本领域的技术人员应当理解,在不超出本发明的精神和实质的范围内,对本发明做出一定的修改和变动,比如建立其他索引方法代替本发明中的方法快速构建足迹图,或采用其他剪枝策略代替本发明中的剪枝策略丢弃不满足受限频繁路径的搜索路径,仍然可以实现本发明的目的。
Claims (8)
1.一种受限最长频繁路径的查询方法,其特征在于,包括以下步骤:
步骤1、设计线性概略化足迹索引,并通过足迹索引构造出足迹图,计算足迹图中每条边的权重,最终将边的权重归一化;
步骤2、在所述足迹图中,采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径;
步骤3、在所述足迹图和最频繁路径的基础上,采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图,最终找出满足条件的受限最长频繁路径。
2.如权利要求1所述的受限最长频繁路径的查询方法,其特征在于,所述足迹图用Gf=(Vf,Ef)表示,Gf是道路网络G=(V,E)中的一个有向图,并且Gf满足:对于顶点u,v∈V且边(u,v)∈E,当且仅当边的权重时,顶点u,v∈Vf且边(u,v)∈Ef,其中,fmax=max(u,v)∈G{F(u,v)},fmin=min(u,v)∈G{F(u,v)};所述权重wu,v是指边(u,v)的频繁度分数F’(u,v),表示为如下形式:其中F(u,v)是边(u,v)的频繁度,所述频繁度F(u,v)是经过(u,v)的足迹数量;所述足迹Υ'是一条非空轨迹片段,并且Υ'满足:(1) vi在顶点vs和vd的δ扩展最小包容矩形MBR(vs,vd,δ)中,其中δ扩展最小包容矩形MBR(vs,vd,δ)是包容以线段[vs,vd]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形;(2)其中Υ'.ts,Υ'.td是Υ'的起止时间,T是给定时间段;所述最频繁路径P*是足迹图Gf中以vs和vd为起点和终点的所有路径中路径分数最小的路径,其中路径P的路径分数S(P)表示为如下形式:S(P)=∑(u,v)∈Pwu,v;所述路径P的频繁边的数量Kp定义为如下形式:KP=Σ(u,v)∈Pku,v,当时ku,v取值为1否则为0,即KP是路径P中边的权重不大于的数量,其中是足迹图Gf中边的平均权重,表示为如下形式:θ是权重参数;所述受限最长频繁路径Pc足迹图Gf中以vs和vd为起点和终点的路径中满足如下条件的路径:(1)Pc的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数,即S(Pc)≤(1+ε)S(P*);(2)Pc的频繁边的数量是所有路径中最大的,即
3.如权利要求1所述的受限最长频繁路径的查询方法,其特征在于,步骤1构建足迹图的方法包括如下:
步骤1-1、初始化道路网络G中边的频繁度矩阵F,并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(vs,vd,δ)中的足迹集合Υ;
步骤1-2、逐条处理足迹集合Υ中的每条足迹Υ',根据时间段T选择Υ'中的有效足迹片段Υaf',并将Υaf'中的每条边的频繁度自增1;
步骤1-3、将计算所得的频繁度矩阵F归一化处理为频繁度分数F’;
步骤1-4、依据G中计算所得的顶点,边,频繁度分数,构造足迹图Gf。
4.如权利要求3所述的受限最长频繁路径的查询方法,其特征在于,步骤1-1所述线性概略化足迹索引的构建方法包括如下:
步骤1-1-1、对于空间区域,采用z-order空间填充方法,为每个空间区域编号,匹配每条足迹中的顶点到对应的空间区域,该顶点的编号即为该空间编号;
步骤1-1-2、对于不同的时间段,采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号,保证不同时间段内同一空间区域的编号不同,即对于第i个时间段,顶点v的编号为 是初始化状态,则其中max(z0)是所有顶点中初始化编号最大值;
步骤1-1-3、采用B+树来索引足迹中的每个顶点,并以顶点的编号作为索引项,一个足迹可以对应多个索引项,每个叶结点的入口为(z-order,v.id,Υaf'.id),其中z-order是顶点对应的编号,v.id为图中顶点唯一编号,Υaf'.id是足迹唯一编号。
5.如权利要求1所述的受限最长频繁路径的查询方法,其特征在于,步骤2所述采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法包括如下:
步骤2-1、通过逆Dijkstra单源最短路径算法可获得所有以vd为终点的最频繁路径,包括不以vs为起点的和以vs为起点的P*;
步骤2-2、在足迹图的每个顶点中,记录当前顶点的下一个顶点,并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。
6.如权利要求1所述的受限最长频繁路径的查询方法,其特征在于,步骤3所述采用剪枝算法找出受限最长频繁路径的方法包括如下:
步骤3-1、初始化优化队列Q,将起点vs的单顶点路径添加至Q中;
步骤3-2、依次检查Q中尚未到达终点vd的路径P,从P的尾顶点P.d的邻接顶点Vp.d出发扩展该路径,并按优先级插入到优先队列Q中;
步骤3-3、当Q中添加了新路径,采用剪枝策略对Q进行剪枝,保证Q中的路径为没有被任意其余路径统治。
7.如权利要求16所述的受限最长频繁路径的查询方法,其特征在于,步骤3-2所述将扩展路径按照优先级插入到优先队列Q的方法包括如下:
步骤3-2-1、如果Q中的两条路径P1和P2频繁边数分别为和路径分数为S(P1)和S(P2);
步骤3-2-2、若不等式成立,则P1优先级高于P2,在Q中P1比P2更靠前。
8.如权利要求16所述的受限最长频繁路径的查询方法,其特征在于,步骤3-3所述剪枝策略如下:
(1)剪枝策略1,在最频繁路径中,如果则经过vi的所有最频繁路径都不满足受限最长频繁路径;
(2)剪枝策略2,当路径P1扩展至顶点vi时,如果则扩展至vi的路径不可行;
(3)剪枝策略3,假设vs和vi之间有两条共顶点的路径P1和P2,若P1≥P2,则可在Q中剪除路径P2对应分支;
(4)剪枝策略4,假设路径P1=vs→L→vm和P2=vs→…→vn,并且除了vs和vd,P1和P2之间无共同顶点,且满足P1≥P2,如果则可在Q中剪除路径P2对应分支,其中
(5)剪枝策略5,假设从vs到vd的最频繁路径为P*,如果KP'的上界小于KP*,则可在Q中剪除路径P’对应分支。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610835918.7A CN106447097A (zh) | 2016-09-20 | 2016-09-20 | 一种受限最长频繁路径的查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610835918.7A CN106447097A (zh) | 2016-09-20 | 2016-09-20 | 一种受限最长频繁路径的查询方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106447097A true CN106447097A (zh) | 2017-02-22 |
Family
ID=58165621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610835918.7A Pending CN106447097A (zh) | 2016-09-20 | 2016-09-20 | 一种受限最长频繁路径的查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106447097A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463672A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于带序兴趣区域的轨迹查询的扩张搜索扩展算法 |
CN107463674A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于带序兴趣区域的轨迹查询的匀速搜索扩展算法 |
CN107463673A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于兴趣区域的轨迹查询的扩张搜索算法 |
CN107480231A (zh) * | 2017-08-04 | 2017-12-15 | 深圳大学 | 基于带序兴趣区域的轨迹查询的启发式扩张搜索扩展算法 |
CN107526788A (zh) * | 2017-08-04 | 2017-12-29 | 深圳大学 | 基于兴趣区域的轨迹查询的匀速搜索算法 |
CN111222667A (zh) * | 2018-11-27 | 2020-06-02 | 中国移动通信集团辽宁有限公司 | 路线规划方法、装置、设备及存储介质 |
-
2016
- 2016-09-20 CN CN201610835918.7A patent/CN106447097A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463672A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于带序兴趣区域的轨迹查询的扩张搜索扩展算法 |
CN107463674A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于带序兴趣区域的轨迹查询的匀速搜索扩展算法 |
CN107463673A (zh) * | 2017-08-04 | 2017-12-12 | 深圳大学 | 基于兴趣区域的轨迹查询的扩张搜索算法 |
CN107480231A (zh) * | 2017-08-04 | 2017-12-15 | 深圳大学 | 基于带序兴趣区域的轨迹查询的启发式扩张搜索扩展算法 |
CN107526788A (zh) * | 2017-08-04 | 2017-12-29 | 深圳大学 | 基于兴趣区域的轨迹查询的匀速搜索算法 |
WO2019024345A1 (zh) * | 2017-08-04 | 2019-02-07 | 深圳大学 | 基于带序兴趣区域的轨迹查询的匀速搜索扩展算法 |
WO2019024346A1 (zh) * | 2017-08-04 | 2019-02-07 | 深圳大学 | 基于兴趣区域的轨迹查询的扩张搜索算法 |
WO2019024348A1 (zh) * | 2017-08-04 | 2019-02-07 | 深圳大学 | 基于兴趣区域的轨迹查询的匀速搜索算法 |
CN111222667A (zh) * | 2018-11-27 | 2020-06-02 | 中国移动通信集团辽宁有限公司 | 路线规划方法、装置、设备及存储介质 |
CN111222667B (zh) * | 2018-11-27 | 2023-09-19 | 中国移动通信集团辽宁有限公司 | 路线规划方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106447097A (zh) | 一种受限最长频繁路径的查询方法 | |
CN103837154B (zh) | 路径规划的方法及系统 | |
CN101329183B (zh) | 路径搜索方法以及路径搜索系统 | |
CN100470554C (zh) | 在大规模社会网络中基于路径评分的个人关系发现方法 | |
CN105589461A (zh) | 一种基于改进蚁群算法的泊车系统路径规划方法 | |
CN104463730A (zh) | 基于旅游目标地域来挖掘旅游路线的方法和设备 | |
CN110276008A (zh) | 一种基于用户旅行决策过程的景点推荐方法及装置 | |
US20190122315A1 (en) | Itinerary Portfolio Evaluation Tool | |
CN106197449A (zh) | 一种基于网络路径选择算法的地图路径规划方法及系统 | |
CN102033918A (zh) | 基于时间位置信息搜索目标用户的方法及系统 | |
CN106528589A (zh) | 数据管理方法及装置 | |
CN105606116B (zh) | 一种对路导航的导航方法、导航装置及其系统 | |
CN109447312A (zh) | 路线规划方法、装置、电子设备及可读存储介质 | |
CN104881472A (zh) | 一种基于网络数据收集的旅游线路景点组合推荐方法 | |
CN104866903B (zh) | 基于遗传算法的最美路径导航算法 | |
CN109284443A (zh) | 一种基于爬虫技术的旅游推荐方法及系统 | |
CN105740964A (zh) | 一种城市路网数据组织与最短路径快速计算方法 | |
CN109492150A (zh) | 基于语义轨迹大数据的反向最近邻查询方法及装置 | |
CN106446242A (zh) | 一种高效的多关键词匹配最优路径查询方法 | |
KR102370988B1 (ko) | 사용자 빅데이터를 활용한 여행 정보 제공 시스템 | |
CN104794175B (zh) | 基于度量k最近对的景点和酒店最佳配对方法 | |
CN113808424A (zh) | 基于双向Dijkstra的城市路网K条最短路径的获取方法 | |
Pluchinotta et al. | Integrating problem structuring methods and concept-knowledge theory for an advanced policy design: lessons from a case study in cyprus | |
Puška et al. | An assessment of improving the sustainable agro-touristic offer in an emerging country using the integrative approach based on fuzzy logic | |
Houissa et al. | A learning algorithm to minimize the expectation time of finding a parking place in urban area |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |
|
RJ01 | Rejection of invention patent application after publication |