CN106447097A

CN106447097A - 一种受限最长频繁路径的查询方法

Info

Publication number: CN106447097A
Application number: CN201610835918.7A
Authority: CN
Inventors: 郭黎敏; 高需; 丁治明; 陈军成; 苏醒
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2016-09-20
Filing date: 2016-09-20
Publication date: 2017-02-22

Abstract

本发明公开一种受限最长频繁路径的查询方法，其步骤为：1)设计线性概略化足迹索引，并通过足迹索引构造出足迹图，计算足迹图中每条边的权重，最终将边的权重归一化；2)在上述足迹图中，采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径；3)在上述足迹图和最频繁路径的基础上，采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图，最终找出满足条件的受限最长频繁路径。本发明可以保证受限最长频繁路径的合理性和高效性。该发明的最终结果可以提供给相关领域的用户使用，例如导航系统、城市路径规划等领域，可以保证是最频繁路径的合理替代路径。

Description

一种受限最长频繁路径的查询方法

技术领域

本发明涉及移动对象数据挖掘研究与应用领域，具体涉及一种受限最长频繁路径的查询方法，即最频繁路径的替代路径的查询方法。

背景技术

近年来，路径选择的研究备受关注，车辆的行驶轨迹是驾驶员的经验与当前交通状况相结合而产生的多次路径选择，蕴含了丰富的路径规划信息，也体现了道路交通状况。由于受到驾驶员的经验的影响，大多数轨迹并非是最短或最快路径，这为我们提供了基于历史进行受限最长频繁路径选择的依据。受限最长频繁路径，即最频繁路径的替代路径，该路径虽然不是最频繁的，但是很接近最频繁，并且频繁边的数量最大化，属于非传统的最频繁路径的合理替代路径。受限最长频繁路径不仅反映了驾驶员的路径选择偏好，而且也为最频繁路径寻找了最合理的替代路径，具有重要的研究价值与广泛的应用场景。

与传统的最短路径或最快路径相似，基于历史轨迹的最频繁路径也具备极值约束条件和良好的子问题结构，现有的算法或其改进算法都能快速解决此类最优化路径规划问题，例如Dijkstra算法[1]和用启发式对其扩展的A*算法[2]，以及基于其他预先计算数据的更快的启发式扩展算法[3-4]和动态规划算法等，这些算法中可以在超大型路网中(如欧洲路网)访问上千网络顶点即可找出远距离的两点之间以单目标最优化路径。具有代表性的研究包括：陈在本等人用严谨的可吸收马尔可夫链数学模型形式化定义了最流行路径MPR[5]，该模型倾向于选择最短路径，并给出了基于A*算法的高效启发式算法，用于启发式的数据无需在线计算；罗吴蔓等人用路径频繁度偏序序列模型形式化描述了给定时间段内最频繁路径TPMFP[6]，该定义具有后缀最优、避免瓶颈路段和不受路径长度影响等良好特性，并给出了相应的动态规划算法，由于该问题依赖特定时间段，只能采取在线计算模式。

然而，现有方法得到的最频繁路径，虽然按照各自的路径频繁度定义来看是最频繁的，但是从路径的整体频繁度来看未必是最合适的。路径频繁度以及受限最长频繁路径的合理定义与描述、高效的轨迹索引方法、路径查询算法等，没有得到有效的研究与解决，对这些关键技术问题有待进一步的研究。

发明内容

针对上述尚没有解决的关键问题，本发明提出了一种基于历史轨迹的受限最长频繁路径查询方法，目的是为最频繁路径的替代路径提供一种可行的解决方案。

为实现上述目的，本发明采用如下的技术方案：

一种受限最长频繁路径的查询方法包括以下步骤：

步骤1、设计线性概略化足迹索引，并通过足迹索引构造出足迹图，计算足迹图中每条边的权重，最终将边的权重归一化；

步骤2、在所述足迹图中，采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径；

步骤3、在所述足迹图和最频繁路径的基础上，采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图，最终找出满足条件的受限最长频繁路径。

作为优选，所述足迹图用G_f＝(V_f,E_f)表示，G_f是道路网络G＝(V,E)中的一个有向图，并且G_f满足：对于顶点u,v∈V且边(u,v)∈E，当且仅当边的权重时，顶点u,v∈V_f且边(u,v)∈E_f，其中f_max＝max_(u,v)∈G{F(u,v)}，f_min＝min_(u,v)∈G{F(u,v)}；所述权重w_u,v是指边(u,v)的频繁度分数F’(u,v)，表示为如下形式：其中F(u,v)是边(u,v)的频繁度，所述频繁度F(u,v)是经过(u,v)的足迹数量；所述足迹Υ′是一条非空轨迹片段，并且Υ′满足：(1)v_i在顶点v_s和v_d的δ扩展最小包容矩形MBR(v_s,v_d,δ)中，其中δ扩展最小包容矩形MBR(v_s,v_d,δ)是包容以线段[v_s，v_d]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形；(2)其中Υ′.t_s，Υ′.t_d是Υ′的起止时间，T是给定时间段；所述最频繁路径P*是足迹图G_f中以v_s和v_d为起点和终点的所有路径中路径分数最小的路径，其中路径P的路径分数S(P)表示为如下形式：S(P)＝∑_(u,v)∈Pw_u,v；所述路径P的频繁边的数量K_p定义为如下形式：K_P＝∑_(u,v)∈Pk_u,v，当时ku,v取值为1否则为0，即K_P是路径P中边的权重不大于的数量，其中是足迹图G_f中边的平均权重，表示为如下形式：θ是权重参数；所述受限最长频繁路径P^c足迹图G_f中以v_s和v_d为起点和终点的路径中满足如下条件的路径：(1)P^c的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数，即S(P^c)≤(1+ε)S(P^*)；(2)P^c的频繁边的数量是所有路径中最大的，即

作为优选，步骤1构建足迹图的方法包括如下：

步骤1-1、初始化道路网络G中边的频繁度矩阵F，并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(v_s,v_d,δ)中的足迹集合Υ；

步骤1-2、逐条处理足迹集合Υ中的每条足迹Υ′，根据时间段T选择Υ′中的有效足迹片段Υ_af′，并将Υ_af′中的每条边的频繁度自增1；

步骤1-3、将计算所得的频繁度矩阵F归一化处理为频繁度分数F’；

步骤1-4、依据G中计算所得的顶点，边，频繁度分数，构造足迹图G_f。

作为优选，步骤1-1所述线性概略化足迹索引的构建方法包括如下：

步骤1-1-1、对于空间区域，采用z-order空间填充方法，为每个空间区域编号，匹配每条足迹中的顶点到对应的空间区域，该顶点的编号即为该空间编号；

步骤1-1-2、对于不同的时间段，采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号，保证不同时间段内同一空间区域的编号不同，即对于第i个时间段，顶点v的编号为是初始化状态，则其中max(z⁰)是所有顶点中初始化编号最大值；

步骤1-1-3、采用B+树来索引足迹中的每个顶点，并以顶点的编号作为索引项，一个足迹可以对应多个索引项，每个叶结点的入口为(z-order，v.id，Υ_af′.id)，其中z-order是顶点对应的编号，v.id为图中顶点唯一编号，Υ_af′.id是足迹唯一编号。

作为优选，步骤2所述采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法包括如下：

步骤2-1、通过逆Dijkstra单源最短路径算法可获得所有以v_d为终点的最频繁路径，包括不以v_s为起点的和以v_s为起点的P^*；

步骤2-2、在足迹图的每个顶点中，记录当前顶点的下一个顶点，并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。

作为优选，步骤3所述采用剪枝算法找出受限最长频繁路径的方法包括如下：

步骤3-1、初始化优化队列Q，将起点v_s的单顶点路径添加至Q中；

步骤3-2、依次检查Q中尚未到达终点v_d的路径P，从P的尾顶点P.d的邻接顶点V_p.d出发扩展该路径，并按优先级插入到优先队列Q中；

步骤3-3、当Q中添加了新路径，采用剪枝策略对Q进行剪枝，保证Q中的路径为没有被任意其余路径统治。

作为优选，步骤3-2所述将扩展路径按照优先级插入到优先队列Q的方法包括如下：

步骤3-2-1、如果Q中的两条路径P₁和P₂频繁边数分别为和路径分数为S(P₁)和S(P₂)；

步骤3-2-2、若不等式成立，则P₁优先级高于P₂，在Q中P₁比P₂更靠前。

作为优选，步骤3-3所述剪枝策略如下：

(1)剪枝策略1，在最频繁路径中，如果则经过v_i的所有最频繁路径都不满足受限最长频繁路径；

(2)剪枝策略2，当路径P₁扩展至顶点v_i时，如果则扩展至v_i的路径不可行；

(3)剪枝策略3，假设v_s和v_i之间有两条共顶点的路径P₁和P₂，若则可在Q中剪除路径P₂对应分支；

(4)剪枝策略4，假设路径P₁＝v_s→L→v_m和P₂＝v_s→…→v_n，并且除了v_s和v_d，P₁和P₂之间无共同顶点，且满足如果则可在Q中剪除路径P₂对应分支，其中

(5)剪枝策略5，假设从v_s到v_d的最频繁路径为P*，如果K_P′的上界小于K_P*，则可在Q中剪除路径P’对应分支。

本发明所采用的技术方案是三阶段框架，首先设计了线性概略化足迹索引，并在此基础上快速构造了足迹图，然后通过逆向Dijkstra算法找出所有到终点的最长频繁路径，最后结合多条剪枝策略，采用Best-First搜索算法在足迹图中查找受限最长频繁路径。

综合以上分析，本发明可以保证受限最长频繁路径的合理性和高效性。该发明的最终结果可以提供给相关领域的用户使用，例如导航系统、城市路径规划等领域，可以保证是最频繁路径的合理替代路径。

附图说明

图1为道路网络G和δ扩展最小包容矩形MBR(v₃,v₉,δ)的示意图；

图2为在给定输入Ω＝(G,v_s,v_d,T,δ,ε,θ)下的足迹的示意图；

图3(a)为空间填充曲线示意图；

图3(b)为图2中时间段[t_s,t_e]内的足迹索引的示意图；

图4为对图2中在时间[t_s,t_e]∈T内足迹进行有效提取的足迹图；

图5是采用剪枝策略剪掉不必要的路径的示意图；

图6(a)是受限最长频繁路径与最短路径的对比关系图，图6(b)是受限最长频繁路径与最少边路径的对比关系图；

图7(a)是小数据集与足迹图的构建时间关系图，图7(b)是中数据集与足迹图的构建时间关系图，图7(c)是大数据集与足迹图的构建时间，图7(d)是足迹图的构建时间与权重参数的关系图；

图8(a)是查询时间与权重参数的关系图，图8(b)是查询时间与受限参数的关系图；

图9为本发明受限最长频繁路径的查询方法的流程图。

具体实施方式

下面结合附图，通过实例进一步说明本发明，但不以任何方式限制本发明的范围。

如图9所示，本发明实施例提供一种受限最长频繁路径的查询方法，其步骤包括：

1)设计线性概略化足迹索引，并通过足迹索引构造出足迹图，计算足迹图中每条边的权重，最终将边的权重归一化；

2)在所述足迹图中，采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径；

3)在所述足迹图和最频繁路径的基础上，采用路径的频繁边数量作为上下界剪枝条件搜索整个所述足迹图，最终找出满足条件的受限最长频繁路径；

更进一步，所述足迹图G_f是道路网络G＝(V,E)中的一个有向图，记做G_f＝(V_f,E_f)，并且满足：对于顶点u,v∈V且边(u,v)∈E，当且仅当边的权重时，顶点u,v∈V_f且边(u,v)∈E_f，其中f_max＝max_(u,v)∈G{F(u,v)}，f_min＝min_(u,v)∈G{F(u,v)}；

更进一步，所述边的权重w_u,v是指边(u,v)的频繁度分数F’(u,v)，定义为如下形式：其中F(u,v)是边(u,v)的频繁度；

更进一步，所述边的频繁度F(u,v)是经过(u,v)的足迹数量；

更进一步，所述的足迹Υ′是一条非空轨迹片段，并且Υ′满足：

(1)v_i在顶点v_s和v_d的δ扩展最小包容矩形MBR(v_s,v_d,δ)中；

(2)其中Υ′.t_s，Υ′.t_d是Υ′的起止时间，T是给定时间段；

更进一步，所述δ扩展最小包容矩形MBR(v_s,v_d,δ)是包容以线段[v_s，v_d]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形；

更进一步，所述最频繁路径P*是足迹图G_f中以v_s和v_d为起点和终点的所有路径中路径分数最小的路径；

更进一步，所述路径P的路径分数S(P)定义为如下形式：S(P)＝∑_(u,v)∈Pw_u,v；

更进一步，所述路径P的频繁边的数量K_p定义为如下形式：K_P＝∑_(u,v)∈Pk_u,v，当时k_u,v取值为1否则为0，即K_P是路径P中边的权重不大于的数量，其中是足迹图G_f中边的平均权重，θ是权重参数；

更进一步，所述足迹图G_f中边的平均权重定义为如下形式：

更进一步，所述受限最长频繁路径P^c足迹图G_f中以v_s和v_d为起点和终点的路径中满足如下条件的路径：

(1)P^c的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数，即S(P^c)≤(1+ε)S(P^*)；

(2)P^c的频繁边的数量是所有路径中最大的，即

更进一步，步骤1)中构建足迹图的方法如下：

1-1)初始化道路网络G中边的频繁度矩阵F，并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(v_s,v_d,δ)中的足迹集合Υ；

1-2)逐条处理足迹集合Υ中的每条足迹Υ′，根据时间段T选择Υ′中的有效足迹片段Υ_af′，并将Υ_af′中的每条边的频繁度自增1；

1-3)将计算所得的频繁度矩阵F归一化处理为频繁度分数F’；

1-4)依据G中计算所得的顶点，边，频繁度分数，构造足迹图G_f；

更进一步，步骤1-1)中所述线性概略化足迹索引的构建方法如下：

(1)对于空间区域，采用z-order空间填充方法，为每个空间区域编号，匹配每条足迹中的顶点到对应的空间区域，该顶点的编号即为该空间编号；

(2)对于不同的时间段，采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号，保证不同时间段内同一空间区域的编号不同，即对于第i个时间段，顶点v的编号为是初始化状态，则其中max(z⁰)是所有顶点中初始化编号最大值；

(3)采用B+树来索引足迹中的每个顶点，并以顶点的编号作为索引项，一个足迹可以对应多个索引项，每个叶结点的入口为(z-order，v.id，Υ_af′.id)，其中z-order是顶点对应的编号，v.id为图中顶点唯一编号，Υ_af′.id是足迹唯一编号；

更进一步，步骤1-1)中所述基于线性概略化足迹索引的查询方法如下：

(1)将要查询的时空范围规范化为一个或多个整数范围；

(2)根据上述整数范围进行查询，将得到的全局足迹编号进行去重复处理；

更进一步，步骤2)中采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法如下：

2-1)通过逆Dijkstra单源最短路径算法可获得所有以v_d为终点的最频繁路径，包括不以v_s为起点的和以v_s为起点的P^*；

2-2)在足迹图的每个顶点中，记录当前顶点的下一个顶点，并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量；

更进一步，步骤3)中采用Best-First剪枝算法找出受限最长频繁路径的方法如下：

3-1)初始化优化队列Q，将起点v_s的单顶点路径添加至Q中；

3-2)依次检查Q中尚未到达终点v_d的路径P，从P的尾顶点P.d的邻接顶点V_p.d出发扩展该路径，并按优先级插入到优先队列Q中；

3-3)一旦Q中添加了新路径，采用剪枝策略对Q进行剪枝，保证Q中的路径为没有被任意其余路径统治；

更进一步，所述步骤3-2)中将扩展路径按照优先级插入到优先队列Q中，如果Q中的两条路径P₁和P₂频繁边数分别为和路径分数为S(P₁)和S(P₂)，若不等式成立，则P₁优先级高于P₂，在Q中P₁比P₂更靠前；

更进一步，所述步骤3-3)中的路径P₁统治路径P₂是指S(P₁)≤S(P₂)且记作

更进一步，所述步骤3-3)中的剪枝策略如下：

本发明的原理是：

首先，在一系列移动对象的足迹集合中，建立线性概略化足迹索引，通过足迹索引，可以方便的构建出足迹图。本发明中足迹Υ′是一条非空轨迹片段，并且Υ′满足：(1)v_i在顶点v_s和v_d的δ扩展最小包容矩形MBR(v_s,v_d,δ)中；(2)其中Υ′.t_s，Υ′.t_d是Υ′的起止时间，T是给定时间段，其中δ扩展最小包容矩形MBR(v_s,v_d,δ)是包容以线段[v_s，v_d]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形。图1给出了道路网络G和δ扩展最小包容矩形MBR(v₃,v₉,δ)，其中v₃和v₉的最小包容矩形包含v₃，v₆，v₇，v₉和v₁₀五个顶点，而MBR(v₃,v₉,δ)包含从v₂到v₁₀的9个顶点。图2给出了在给定输入Ω＝(G,v_s,v_d,T,δ,ε,θ)下的足迹，其中v_s＝v₁，v_d＝v₁₁，[t_s,t_e]∈T。

线性概略化足迹索引采用z-order空间填充方法，为每个空间区域编号，匹配每条足迹中的顶点到对应的空间区域，该顶点的编号即为该空间编号。对于不同的时间段，采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号，保证不同时间段内同一空间区域的编号不同，即对于第i个时间段，顶点v的编号为是初始化状态，则其中max(z⁰)是所有顶点中初始化编号最大值。最后采用B+树来索引足迹中的每个顶点，并以顶点的编号作为索引项，一个足迹可以对应多个索引项，每个叶结点的入口为(z-order，v.id，Υ_af′.id)，其中z-order是顶点对应的编号，v.id为图中顶点唯一编号，Υ_af′.id是足迹唯一编号。图3给出了空间填充曲线和该z-order下的足迹索引。在图3(b)中，在图2中时间段[t_s,t_e]内的足迹索引，图中入口项为z_Υ′.id，两行叶结点入口数据为从左至右、从上而下非递减排列。

足迹图的构造首先初始化道路网络G中边的频繁度矩阵F，并且在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(v_s,v_d,δ)中的足迹集合Υ，基于足迹索引进行时空范围查询时，首先将要查询的时空范围规范化为一个或多个整数范围，并以这些整数范围发起查询，并将得到的全局足迹编号进行去重复处理。然后逐条处理足迹集合Υ中的每条足迹Υ′，根据时间段T选择Υ′中的有效足迹片段Υ_af′，并将Υ_af′中的每条边的频繁度自增1，图2在给定输入Ω＝(G,v_s,v_d,T,δ,ε,θ)下的有效足迹共7条，其中v_s＝v₁，v_d＝v₁₁，[t_s,t_e]∈T，分别是：Υ′₁＝v₂→v₅→v₉，Υ′₂＝v₁→v₂→v₆→v₉，Υ′₃＝v₃→v₆→v₉→v₁₁，Υ′₄＝v₁→v₃→v₇→v₁₀→v₁₁，Υ′₅＝v₇→v₁₀，Υ′₆＝v₆→v₉，Υ′₇＝v₆→v₃→v₄。再将计算所得的频繁度矩阵F归一化处理为频繁度分数F’，最后依据G中计算所得的顶点，边，频繁度分数，构造足迹图G_f，图4是对图2中在时间[t_s,t_e]∈T内足迹进行有效提取的足迹图。

然后，采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径，并在足迹图的每个顶点中，记录当前顶点的下一个顶点，并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。

最后，采用Best-First算法搜索足迹图，为了尽早丢弃不满足受限频繁路径的搜索路径，尽可能朝着可能解的方向搜索，我们提出了相应的剪枝策略。其中剪枝策略1，在最频繁路径中，如果则经过v_i的所有最频繁路径都不满足受限最长频繁路径；剪枝策略2，当路径P₁扩展至顶点v_i时，如果则扩展至v_i的路径不可行；剪枝策略3，假设v_s和v_i之间有两条共顶点的路径P₁和P₂，若则可在Q中剪除路径P₂对应分支；剪枝策略4，假设路径P₁＝v_s→L→v_m和P₂＝v_s→…→v_n，并且除了v_s和v_d，P₁和P₂之间无共同顶点，且满足如果则可在Q中剪除路径P₂对应分支，其中剪枝策略5，假设从v_s到v_d的最频繁路径为P*，如果K_P′的上界小于K_P*，则可在Q中剪除路径P’对应分支。图5是采用剪枝策略3剪掉不必要的路径，其中两条路径P₁＝v_s→v_i→v_k和P₂＝v_s→v_j→v_k，则P₂会被剪枝策略3所剪枝掉。

受限最长频繁路径查找的具体过程包括：

第一步：在一系列移动对象的足迹集合中，建立线性概略化足迹索引，通过足迹索引，构建出足迹图。具体方法如下：

1.建立线性概略化足迹索引，具体方法如下：

⑴采用z-order空间填充方法，为每个空间区域编号，匹配每条足迹中的顶点到对应的空间区域，该顶点的编号即为该空间编号。

⑵对于不同的时间段，采用编号对应的数值乘以时间相关的因子表示不同时间段内的空间区域的编号，保证不同时间段内同一空间区域的编号不同，具体方法如下：

①对于第i个时间段，顶点v的编号为是初始化状态。

②计算其中max(z⁰)是所有顶点中初始化编号最大值。

⑶采用B+树来索引足迹中的每个顶点，并以顶点的编号作为索引项，一个足迹可以对应多个索引项，每个叶结点的入口为(z-order，v.id，Υ_af′.id)，其中z-order是顶点对应的编号，v.id为图中顶点唯一编号，Υ_af′.id是足迹唯一编号。

2.通过线性概略化足迹索引，构建出足迹图，具体方法如下：

⑴初始化道路网络G中边的频繁度矩阵F。

⑵在线性概略化足迹索引中搜索在时间段T内δ扩展最小包容矩形MBR(v_s,v_d,δ)中的足迹集合Υ，具体方法如下：

①将要查询的时空范围规范化为一个或多个整数范围，并以这些整数范围发起查询。

②将得到的全局足迹编号进行去重复处理。

⑶逐条处理足迹集合Υ中的每条足迹Υ′，根据时间段T选择Υ′中的有效足迹片段Υ_af′，并将Υ_af′中的每条边的频繁度自增1。

⑷将计算所得的频繁度矩阵F归一化处理为频繁度分数F’，并依据G中计算所得的顶点、边、频繁度分数，构造足迹图G_f。

例如，图1给出了道路网络G和δ扩展最小包容矩形MBR(v₃,v₉,δ)，其中v₃和v₉的最小包容矩形包含v₃，v₆，v₇，v₉和v₁₀五个顶点，而MBR(v₃,v₉,δ)包含从v₂到v₁₀的9个顶点。图2给出了在给定输入Ω＝(G,v_s,v_d,T,δ,ε,θ)下的足迹，其中v_s＝v₁，v_d＝v₁₁，[t_s,t_e]∈T。图3给出了空间填充曲线和该z-order下的足迹索引。其中图3(b)是在图2中时间段[t_s,t_e]内的足迹索引，图中入口项为z_Υ′.id，两行叶结点入口数据为从左至右、从上而下非递减排列。图2在给定输入Ω＝(G,v_s,v_d,T,δ,ε,θ)下的有效足迹共7条，其中v_s＝v₁，v_d＝v₁₁，[t_s,t_e]∈T，分别是：Υ′₁＝v₂→v₅→v₉，Υ′₂＝v₁→v₂→v₆→v₉，Υ′₃＝v₃→v₆→v₉→v₁₁，Υ′₄＝v₁→v₃→v₇→v₁₀→v₁₁，Υ′₅＝v₇→v₁₀，Υ′₆＝v₆→v₉，Υ′₇＝v₆→v₃→v₄。图4是对图2中在时间[t_s,t_e]∈T内足迹进行有效提取的足迹图。

第二步：采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径，并在足迹图的每个顶点中，记录当前顶点的下一个顶点，并且记录包括当前顶点在内的后缀路径中频繁度分值小于的边数量。

第三步：采用Best-First剪枝算法找出受限最长频繁路径。具体方法如下：

1.初始化优化队列Q，将起点v_s的单顶点路径添加至Q中。

2.依次检查Q中尚未到达终点v_d的路径P，从P的尾顶点P.d的邻接顶点V_p.d出发扩展该路径，并按优先级插入到优先队列Q中。具体方法如下：

⑴将扩展路径按照优先级插入到优先队列Q中。

⑵如果Q中的两条路径P₁和P₂频繁边数分别为和路径分数为S(P₁)和S(P₂)，若不等式成立，则P₁优先级高于P₂，在Q中P₁比P₂更靠前。

3.一旦Q中添加了新路径，采用剪枝策略对Q进行剪枝，保证Q中的路径为没有被任意其余路径统治。具体步骤如下：

⑴对于路径P₁和路径P₂，如果S(P₁)≤S(P₂)且则路径P₁统治路径P₂，则将剪除路径P₂。具体的剪枝策略如下：

①剪枝策略1，在最频繁路径中，如果则经过v_i的所有最频繁路径都不满足受限最长频繁路径。

②剪枝策略2，当路径P₁扩展至顶点v_i时，如果则扩展至v_i的路径不可行；

③剪枝策略3，假设v_s和v_i之间有两条共顶点的路径P₁和P₂，若则可在Q中剪除路径P₂对应分支；

④剪枝策略4，假设路径P₁＝v_s→L→v_m和P₂＝v_s→…→v_n，并且除了v_s和v_d，P₁和P₂之间无共同顶点，且满足如果则可在Q中剪除路径P₂对应分支，其中

⑤剪枝策略5，假设从v_s到v_d的最频繁路径为P*，如果K_P′的上界小于K_P*，则可在Q中剪除路径P’对应分支；

例如，图5是采用剪枝策略3剪掉不必要的路径，其中两条路径P₁＝v_s→v_i→v_k和P₂＝v_s→v_j→v_k，则P₂会被剪枝策略3所剪枝掉。

本发明提出了一种受限最长频繁路径的查询方法，受限最长频繁路径是最频繁路径的合理替代路径，即时间区域和最频繁路径限制下的频繁边的数量最大的受限最长频繁路径。与现有的频繁路径问题无法从整体角度合理地表示频繁度相比，本发明具有如下优势：

(1)本发明提出了频繁路径的合理替代路径受限最长频繁路径。如图6(a)—6(b)所示，图6(a)，6(b)分别将受限最长频繁路径与最短路径和最少边路径的对比关系图，说明了受限最长频繁路径的合理性，其中纵坐标Number of query results表示路径数量，Total表示路径总数，TPLFP表示受限最长频繁路径，STP表示最短路径，MFP表示最频繁路径，All are pairwise different表示每两个之间都是很不一样的。

(2)本发明采用线性概略化足迹索引构建足迹图，提高了效率。如图7(a)—7(d)所示，图7(a)，7(b)，7(c)分别是在小、中、大数据集上足迹图的构建时间，其中纵坐标Response Time表示执行时间，横坐标Number of footmark表示数据集大小，using LSFIfor G_f表示采用线性概略化足迹索引构建足迹图，Full scan for G_f表示未采用线性概略化足迹索引构建足迹图，图7(d)是足迹图的构建时间与权重参数θ的关系图，其中纵坐标Response Time表示执行时间，横坐标θ表示权重参数。

(3)本发明采用剪枝策略降低了受限最长频繁路径的查找时间，提高了效率。如图8(a)—8(b)所示，图8(a)，8(b)分别是查询时间与权重参数θ和受限参数ε的关系图，其中纵坐标Response Time表示执行时间，横坐标ε表示受限参数，θ表示权重参数，using G_f表示采用足迹图，using G_af表示采用改进的足迹图。

以上通过实施例对本发明进行了详细的描述，本领域的技术人员应当理解，在不超出本发明的精神和实质的范围内，对本发明做出一定的修改和变动，比如建立其他索引方法代替本发明中的方法快速构建足迹图，或采用其他剪枝策略代替本发明中的剪枝策略丢弃不满足受限频繁路径的搜索路径，仍然可以实现本发明的目的。

Claims

1.一种受限最长频繁路径的查询方法，其特征在于，包括以下步骤：

2.如权利要求1所述的受限最长频繁路径的查询方法，其特征在于，所述足迹图用G_f＝(V_f,E_f)表示，G_f是道路网络G＝(V,E)中的一个有向图，并且G_f满足：对于顶点u,v∈V且边(u,v)∈E，当且仅当边的权重时，顶点u,v∈V_f且边(u,v)∈E_f，其中，f_max＝max_(u,v)∈G{F(u,v)}，f_min＝min_(u,v)∈G{F(u,v)}；所述权重w_u,v是指边(u,v)的频繁度分数F’(u,v)，表示为如下形式：其中F(u,v)是边(u,v)的频繁度，所述频繁度F(u,v)是经过(u,v)的足迹数量；所述足迹Υ'是一条非空轨迹片段，并且Υ'满足：(1) v_i在顶点v_s和v_d的δ扩展最小包容矩形MBR(v_s,v_d,δ)中，其中δ扩展最小包容矩形MBR(v_s,v_d,δ)是包容以线段[v_s，v_d]中心为圆心、线段长度的(1+δ)/2倍为半径的圆的最小包容矩形；(2)其中Υ'.t_s,Υ'.t_d是Υ'的起止时间，T是给定时间段；所述最频繁路径P*是足迹图G_f中以v_s和v_d为起点和终点的所有路径中路径分数最小的路径，其中路径P的路径分数S(P)表示为如下形式：S(P)＝∑_(u,v)∈Pw_u,v；所述路径P的频繁边的数量K_p定义为如下形式：K_P＝Σ_(u,v)∈Pk_u,v，当时k_u,v取值为1否则为0，即K_P是路径P中边的权重不大于的数量，其中是足迹图G_f中边的平均权重，表示为如下形式：θ是权重参数；所述受限最长频繁路径P^c足迹图G_f中以v_s和v_d为起点和终点的路径中满足如下条件的路径：(1)P^c的路径分数受限于限制参数ε限制的最频繁路径P*的路径分数，即S(P^c)≤(1+ε)S(P^*)；(2)P^c的频繁边的数量是所有路径中最大的，即

3.如权利要求1所述的受限最长频繁路径的查询方法，其特征在于，步骤1构建足迹图的方法包括如下：

步骤1-2、逐条处理足迹集合Υ中的每条足迹Υ'，根据时间段T选择Υ'中的有效足迹片段Υ_af'，并将Υ_af'中的每条边的频繁度自增1；

4.如权利要求3所述的受限最长频繁路径的查询方法，其特征在于，步骤1-1所述线性概略化足迹索引的构建方法包括如下：

步骤1-1-3、采用B+树来索引足迹中的每个顶点，并以顶点的编号作为索引项，一个足迹可以对应多个索引项，每个叶结点的入口为(z-order，v.id，Υ_af'.id)，其中z-order是顶点对应的编号，v.id为图中顶点唯一编号，Υ_af'.id是足迹唯一编号。

5.如权利要求1所述的受限最长频繁路径的查询方法，其特征在于，步骤2所述采用逆Dijkstra单源最短路径算法找出任意顶点到终点的最频繁路径的方法包括如下：

6.如权利要求1所述的受限最长频繁路径的查询方法，其特征在于，步骤3所述采用剪枝算法找出受限最长频繁路径的方法包括如下：

7.如权利要求16所述的受限最长频繁路径的查询方法，其特征在于，步骤3-2所述将扩展路径按照优先级插入到优先队列Q的方法包括如下：

8.如权利要求16所述的受限最长频繁路径的查询方法，其特征在于，步骤3-3所述剪枝策略如下：

(3)剪枝策略3，假设v_s和v_i之间有两条共顶点的路径P₁和P₂，若P₁≥P₂，则可在Q中剪除路径P₂对应分支；

(4)剪枝策略4，假设路径P₁＝v_s→L→v_m和P₂＝v_s→…→v_n，并且除了v_s和v_d，P₁和P₂之间无共同顶点，且满足P₁≥P₂，如果则可在Q中剪除路径P₂对应分支，其中

(5)剪枝策略5，假设从v_s到v_d的最频繁路径为P*，如果K_P'的上界小于K_P*，则可在Q中剪除路径P’对应分支。