CN105184088A

CN105184088A - 基于内插网格序列规则的移动对象位置预测方法

Info

Publication number: CN105184088A
Application number: CN201510606759.9A
Authority: CN
Inventors: 张海涛; 葛国栋; 陈泽伟; 刘钊; 胡栋; 朱云虹; 武晨雪
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2015-09-22
Filing date: 2015-09-22
Publication date: 2015-12-23
Anticipated expiration: 2035-09-22
Also published as: CN105184088B

Abstract

本发明公开了基于内插网格序列规则的移动对象位置预测方法，该方法首先对原始轨迹数据进行空间离散与内插处理得到对应的内插网格序列数据，然后从所有内插网格序列数据中挖掘得到频繁序列模式，并进一步得到内插网格序列规则，最后基于移动对象当前所在网格与所有内插网格序列规则进行多项式匹配，并基于匹配结果预测移动对象的后续位置。本发明与传统方法相比，具有匹配率高、预测速度快的优势。

Description

基于内插网格序列规则的移动对象位置预测方法

技术领域

本发明属于移动对象数据挖掘与预测技术的研究领域，具体涉及了基于内插网格序列规则的移动对象位置预测方法。

背景技术

随着民用GPS等定位设备在车载以及移动终端上的普遍使用，以及基于位置的服务(LBS：Location-basedService)和移动社交网络的迅速发展，大量的移动对象数据在日常生活中正在日益积累并为不同类型的应用所服务，同时也成为众多领域的科学研究工作者开展科学研究的新型数据源。由于移动对象数据中的每一个轨迹点反映空间上的一个位置以及时间上的一个事件，通过对大量的移动对象数据的分析，预测移动对象群体的运动趋势，可为基于位置的智能广告推送，市交通规划、实时交通导航等众多行业应用提供辅助决策功能。

传统的移动对象位置预测主要采用统计建模的方法，例如：决策树、贝叶斯推理、隐马尔科夫模型等，优点是预测的精度高，但模型计算的复杂度高，难以应用于实时处理性能要求较高的移动计算环境。近年来，基于数据挖掘的位置预测技术成为主流研究方法：首先采用简单的统计模型，从大量的移动对象数据中挖掘中反映移动对象群体所共同遵循的规则，然后基于移动对象当前路径与挖掘的规则的匹配预算对移动对象的后续位置进行预测。这种使用简单统计模型以及离线数据挖掘、在线预测相结合的方式，可以大大提高移动对象位置预测的速度，满足应用系统对于实时处理性能的要求。

但是，现有的基于数据挖掘的位置预测方法存在一个共性的问题：挖掘出来的用于位置预测的规则的可用性不高，也即规则与移动对象位置的匹配率较低。研究发现其主要原因包括：(1)原始轨迹数据以位置测量为最小单位进行空间坐标的自然离散，会使得从原始轨迹数据挖掘的规则粒度级别太小，不具有通用特性。(2)规则包含的位置不能保证具有空间连续性，当移动对象的位置处于规则包含位置的中间区域时，就不能进行有效的位置预测。本发明提出了一种基于内插网格序列规则的移动对象位置预测方法，可以有效的解决匹配率低的问题，且具有较高的运算性能。

发明内容

为了解决上述背景技术提出的技术问题，本发明旨在提供基于内插网格序列规则的移动对象位置预测方法，解决了传统技术匹配率低的问题。

为了实现上述技术目的，本发明的技术方案为：

基于内插网格序列规则的移动对象位置预测方法，包括以下步骤：

步骤1：采用空间等间隔的划分方法，将所有原始轨迹数据的空间分布范围划分为一系列的二维网格；

所述原始轨迹数据表示一个移动对象连续位置测量的有序列表，其定义为T_ID＝(p₁,p₂,...,p_n)，其中，下标ID表示原始轨迹的序列号，p_i＝(x,y),1≤i≤n表示一个轨迹点，x,y表示轨迹点的横、纵坐标值；

对于一个包含所有原始轨迹数据的离散二维空间R²＝{p_i|1≤i≤n}，其对应的二维网格为DR²＝{Cell|1≤Cell·col≤col_count,1≤Cell·row≤row_count}，其中，Cell表示一个网格，Cell·col、Cell·row分别表示网格Cell在二维空间划分中所处的列号、行号，col_count、row_count分别是根据设定的空间分辨率而设定划分的列数、行数；

所述空间等间隔的划分方法满足如下条件：

(1)如果网格Cell满足条件：(Cell·row＝1)∧(Cell·col＝1)，则Cell为起始网格，且Cell·LB·x＝Min(p_i·x),Cell·LB·y＝Min(p_i·y)，Cell·LB·x表示网格Cell左下角的横坐标值，Cell·LB·y表示网格Cell左下角的纵坐标值，其中，“∧”表示“并且”关系；

(2)Cell·RT·x＝Cell·LB·x+Δx，Cell·RT·y＝Cell·LB·y+Δy分别表示网格Cell右上角的横、纵坐标值；其中，

Δ x = \frac{M a x (p_{i} \cdot x) - M i n (p_{i} \cdot x)}{c o l_c o u n t}, Δ y = \frac{M a x (p_{i} \cdot y) - M i n (p_{i} \cdot y)}{r o w_c o u n t}

分别表示网格在空间范围上的横、纵跨度；

(3)如果网格Cell_k与网格Cell_j满足条件则称Cell_k是Cell_j的左方网格，两者的坐标关系满足Cell_j·LB·x＝Cell_k·RT·x，Cell_j·LB·y＝Cell_k·LB·y；

(4)如果网格Cell_k与网格Cell_j满足条件则称Cell_k是Cell_j的下方网格，两者的坐标关系满足Cell_j·LB·x＝Cell_k·LB·x，Cell_j·LB·y＝Cell_k·RT·y；

(5)如果网格Cell_k与网格Cell_j满足条件则称Cell_k是Cell_j的左下方网格，两者的坐标关系满足Cell_j·LB·x＝Cell_k·RT·x，Cell_j·LB·y＝Cell_k·RT·y；

步骤2：根据原始轨迹数据与二维网格的匹配，对原始轨迹数据进行空间离散化，得到对应的网格序列；

所述网格序列是，对于任一网格Cell_i∈DR²,1≤i≤n，都满足条件即原始轨迹点p_i包含于网格Cell_i；

步骤3：对网格序列中空间不相邻的两个网格进行内插处理，得到对应的内插网格序列；

步骤4：根据设定的支持度阈值，从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式；

定义SePIntpC＝(Cell₁,Cell₂,...,Cell_n)为一个内插网格序列模式，其中，Cell_i∈C,1≤i≤n，n表示模式的长度，任意两个连续的网格Cell_i,Cell_j,1≤i≤n,1≤j≤n,j＝(i+1)，必须满足空间邻近条件：(0≤|Cell_i·col-Cell_j·col|≤1)∧(0≤|Cell_i·row-Cell_j·row|≤1)；

对于一个内插网格序列SeIntpC＝(Cell₁,Cell₂,...,Cell_m)和一个内插网格序列模式SePIntpC＝(Cell₁,Cell₂,...,Cell_n)，如果满足条件：(1)n≤m；(2)SeIntpC中存在连续的子序列(Cell_k,Cell_k+1,...,Cell_k+n-1)与SePIntpC完全匹配，则称SeIntpC包含SePIntpC，记为

对于一个内插网格序列模式P和一个内插网格序列数据库D＝(SeIntpC₁,SeIntpC₂,...,SeIntpC_n)，D对P的支持度定义为：

{Supp}_{D}^{P} = \frac{| {{SeIntpC}_{i} | {SeIntpC}_{i} &SupersetEqual; P, {SeIntpC}_{i} &Element; D} |}{n} \times 100 %

其中，1≤i≤n，

| {{SeIntpC}_{i} | {SeIntpC}_{i} &SupersetEqual; P, {SeIntpC}_{i} &Element; D} |

表示D中包含P的内插网格序列的数量，如果α是设定的支持度阈值，则称P为在D中频繁序列模式；

步骤5：对长度为K的任意两个频繁序列模式，进行中重合的关系判断，并基于判断结果生成长度为K+1的候选序列模式，其中，长度为K的频繁序列模式由长度为1的频繁序列模式组合生成，K＝2,3,4…

对两个内插网格序列模式

A = ({Cell}_{i_{1}}, {Cell}_{i_{2}}, ..., {Cell}_{i_{n}}), B = ({Cell}_{j_{1}}, {Cell}_{j_{2}}, ..., {Cell}_{j_{n}}),

如果A的子序列与B的子序列完全匹配，则称A与B中重合；

步骤6：扫描所有内插网格序列数据，计算长度为K+1的所有候选序列模式的支持度，并与设定的支持度阈值比较，得到所有长度为K+1的频繁序列模式；

步骤7：根据长度大于1的频繁序列模式，生成候选的内插网格序列规则，并根据候选的内插网络序列规则及其前项，计算候选的内插网格序列规则的置信度；

对于一个网格空间DR²和一个内插网格序列数据库D，

S e R I n t p C = ({Cell}_{1} &RightArrow; {Cell}_{2} &RightArrow;, ..., &RightArrow; {Cell}_{m} &DoubleRightArrow; {Cell}_{m + 1} &RightArrow; {Cell}_{m + 2} &RightArrow;, ..., &RightArrow; {Cell}_{m + n})

称为一个内插网格序列规则，其中，Cell_i∈DR²,1≤i≤m+n，(Cell₁,Cell₂,...,Cell_m+n)是D中是一个频繁序列模式，SeRIntpC的置信度

{Conf}_{D}^{S e R I n t p C} = \frac{{Supp}_{D}^{({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{m + n})}}{{Supp}_{D}^{({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{m})}} \times 100 %;

Cell₁→Cell₂→,...,→Cell_m称为SeRIntpC的前项，记为SeRIntpC·antecedent，m表示SeRIntpC·antecedent中的网格数，称为SeRIntpC·antecedent的长度，记为SeRIntpC·antecedent·length；Cell_m是SeRIntpC·antecedent中的最后一个网格，记为SeRIntpC·antecedent·lastCell；Cell_m+1→Cell_m+2→,...,→Cell_m+n称为SeRIntpC的后项，记为SeRIntpC的后项，记为SeRIntpC·descendant，n表示SeRIntpC·descendant中的网格数，称为SeRIntpC·descendant的长度，记为SeRIntpC·descendant·length；

步骤8：选出所有置信度大于等于设定的置信度阈值β的候选的内插网格序列规则作为内插网络序列规则；

步骤9：获取移动对象当前所在的网格，并将该网格与所有内插网格序列规则进行匹配，得到匹配集，并根据匹配集计算多项式匹配集，基于多项式匹配集对移动对象的后续位置进行预测；

对于一个内插网格序列规则集合RuleSet＝{SeRIntpC₁,SeRIntpC₂,...,SeRIntpC_n}和一个网格Cell，Cell与RuleSet的匹配集定义为

{MatchSet}_{R u l e S e t}^{C e l l} = {{SeRIntpC}_{i} | \begin{matrix} {SeRIntpC}_{i} &Element; R u l e S e t, 1 \leq i \leq n, \\ R u l e S e t \cdot a n t e c e d e n t \cdot l a s t C e l l = C e l l \end{matrix}} s,

其中，1≤i≤n，SeRIntpC_i·antecedent·lastCell＝Cell表示内插网格序列规则SeRIntpC_i前项的最后一个网格与网格Cell相同；

定义多项式匹配集：

{MMatchSet}_{R u l e S e t}^{C e l l} = \underset{S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}}{\arg \max} | \frac{1}{2} (\begin{matrix} \sqrt{\frac{S e R I n t p C \cdot a n t e c e d e n t \cdot l e n g t h}{a \max}} \\ + \sqrt{\frac{S e R I n t p C \cdot d e \sec e n d a n t \cdot l e n g t h}{d \max}} \end{matrix}) * {Conf}_{D}^{S e R I n t p C}

其中，

a \max = \max {S e R I n t p C \cdot a n t e c e d e n t \cdot l e n g t h | S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}},

表示匹配内插网格序列规则中最长前项包含的网格数；

d \max = \max {S e R I n t p C \cdot d e \sec e n d a n t \cdot l e n g t h | S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}},

表示匹配内插网格序列规则中最长后项包含的网格数。

进一步地，步骤3的具体过程为：

对于一个网格序列SeC_ID＝(Cell₁,Cell₂,...,Cell_n),其包含的任意两个连续的网格Cell_i,Cell_j,1≤i≤n,1≤j≤n,j＝(i+1)，如果空间不邻近，则需要在网格Cell_i和Cell_j之间进行内插，内插的具体公式如下：

{Intp}_{{Cell}_{i}}^{{Cell}_{j}} \cdot c o l = r o u n d ({Cell}_{i} \cdot c o l + k \times \frac{{Cell}_{j} \cdot c o l - {Cell}_{i} \cdot c o l}{m}),

{Intp}_{{Cell}_{i}}^{{Cell}_{j}} \cdot r o w = r o u n d ({Cell}_{i} \cdot r o w + k \times \frac{{Cell}_{j} \cdot r o w - {Cell}_{i} \cdot r o w}{m}),

其中，1≤k≤m-1,

r = \sqrt{{({Cell}_{i} \cdot c o l - {Cell}_{j} \cdot c o l)}^{2} + {({Cell}_{i} \cdot r o w - {Cell}_{j} \cdot r o w)}^{2}},

分别表示内插网格的列号、行号，round()是四舍五入函数，是向下取整的函数，生成的内插网格序列为

{SeIntpC}_{I D} = ({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{i}, {Intp}_{{Cell}_{i}}^{{Cell}_{j}}, {Cell}_{j}, {Cell}_{j + 1}, ..., {Cell}_{n}) .

对于一个网格序列SeC_ID＝(Cell₁,Cell₂,...,Cell_n),其包含的任意两个连续的网格Cell_i,Cell_j,1≤i≤n,1≤j≤n,j＝(i+1)，如果空间不邻近，就是不满足条件：(0≤|Cell_i·col-Cell_j·col|≤1)∧(0≤|Cell_i·row-Cell_j·row|≤1)。

采用上述技术方案带来的有益效果：

(1)匹配率高：本发明采用网格对原始轨迹数据进行空间离散，使得内插网格序列规则的空间覆盖范围得到了泛化；对空间离散后的网格序列进行内插处理，并在内插网格序列规则挖掘过程中保证内插网格单元的连续性，进一步提高了内插网格序列规则的覆盖度。

(2)预测速度快：本发明在内插网格序列规则挖掘过程中，使用网格距离进行网格之间邻接关系判断；在位置预测过程中，也使用网格单元进行多项式匹配运算。这两方面都可大大减少计算开销，提高预测的效率。

附图说明

图1为实施例中T_a～T_j共10条原始轨迹离散二维空间的表达示意图；

图2为实施例中依据图1中10条原始轨迹划分的二维网格空间示意图；

图3为实施例中图1中的原始轨迹T_a和图2中二维网格空间进行匹配得到网格序列示意图；

图4为实施例中对图3中网格序列进行内插处理后得到内插网格序列示意图；

图5为实施例中当移动对象位于网格(4,5)时预测后续位置为网格(4,4)示意图。

具体实施方式

以下将结合附图，对本发明的技术方案进行详细说明。

第一阶段：对原始轨迹数据进行空间离散、内插预处理

步骤1：采用空间等间隔的划分的方法，将所有原始轨迹数据的空间分布范围划分为一系列的二维网格。

在本实施例中，共有10条原始轨迹，具体数据信息为：

T_a＝((113,283),(214,386),(425,591),(588,732))，

T_b＝((55,166),(235,341),(455,571),(542,663),(630,733))，

T_c＝((143,220),(365,439),(545,623),(654,623))，

T_d＝((152,483),(461,483),(546,568))，

T_e＝((265,672),(265,557),(361,373),(542,373),(649,548))，

T_f＝((235,465),(461,456),(668,456))，

T_g＝((38,423),(461,423),(586,374))，

T_h＝((81,557),(248,557),(343,353),(658,353),(764,466))，

T_i＝((111,521),(238,521),(338,332),(749,332))，

T_j＝((38,354),(242,411),(461,411),(461,275))。

10条原始轨迹在2维空间的表达如图1所示。10条原始轨迹中横坐标的最小值是38，最大值是764，横坐标范围的跨度是726，我们以100作为1个划分，把横坐标范围分为8个划分，即0作为起点，0～100为划分1,100～200为划分2,…,700～800为划分8。10条原始轨迹中纵坐标的最小值是166，最大值是733，纵坐标范围的跨度是567，同样，我们以100作为1个划分，把纵坐标范围也分为8个划分，即0作为起点，0～100为划分1，100～200为划分2,…,700～800为划分8。最终，空间包含10条原始轨迹的二维网格空间如图2所示。

步骤2：根据原始轨迹数据与二维网格的匹配，对原始轨迹数据进行空间离散化，得到对应的网格序列。

将图1中10条原始轨迹与图2中的二维网格进行匹配。我们以T_a为例，给出一条原始轨迹通过匹配得到一条网格序列的过程。T_a中第一个轨迹点为(113,283)，网格(2,3)的左下角坐标为(100,200)、右上角坐标为(200,300)。因此，网格(2,3)与轨迹点(113,283)存在包含关系，即满足关系：(100≤113≤200)∧(200≤283≤300)。因此，轨迹点(113,283)匹配的网格为(2,3)。

以此类推，可以得到原始轨迹T_a的其他轨迹点相匹配的网格，最终得到T_a匹配的网格序列为：SeC_a＝((2,3),(3,4),(5,6),(6,8))，匹配过程示意如图3所示。同理，可以得到其他原始轨迹的网格序列，具体信息如下：

SeC_b＝((1,2),(3,4),(5,6),(6,7),(7,8))，

SeC_c＝((2,3),(4,5),(6,7),(7,7))，

SeC_d＝((2,5),(5,5),(6,6))，

SeC_e＝((3,7),(3,6),(4,4),(6,4),(7,6))，

SeC_f＝((3,5),(5,5),(7,5))，

SeC_h＝((1,6),(3,6),(4,4),(7,4),(8,5))，

SeC_i＝((2,6),(3,6),(4,4),(8,4))，

SeC_j＝((1,4),(3,5),(5,5),(5,3))。

步骤3：对网格序列中空间不相邻的两个网格进行内插处理，得到对应内插网格序列。

以SeC_a＝((2,3),(3,4),(5,6),(6,8))为例对内插处理进行说明。由于SeC_a中的网格(2,5)与(5,3)以及网格(5,3)与网格(7,3)都不满足空间邻近条件，必须进行内插处理。

网格(3,4)与(5,6)的内插网格的计算过程如下：

a)计算

r = \sqrt{{(| 5 - 3 |)}^{2} + {(| 6 - 4 |)}^{2}} = 2.828,

b)得到

c)得到k＝1，

d)得到

{Cell}_{1} \cdot c o l = r o u n d (3 + 1 \times \frac{5 - 3}{2}) = 4, {Cell}_{1} \cdot r o w = r o u n d (4 + 1 \times \frac{6 - 4}{2}) = 5.

同理，对网格(5,6)与网格(6,8)进行内插处理，过程如下：

a)计算

r = \sqrt{{(| 5 - 6 |)}^{2} + {(| 6 - 8 |)}^{2}} = 2.236,

b)得到

c)得到k＝1，

d)得到

{Cell}_{1} \cdot c o l = r o u n d (5 + 1 \times \frac{6 - 5}{2}) = 6, {Cell}_{1} \cdot r o w = r o u n d (6 + 1 \times \frac{8 - 6}{2}) = 7.

最终得到SeC_a对应的内插网格序列为：

SeIntpC_a＝((2,3),(3,4),(4,5),(5,6),(6,7),(6,8))，内插过程示意如图4所示。

其他网格序列的内插结果如下：

SeIntpC_b＝((1,2),(2,3),(3,4),(4,5),(5,6),(6,7),(7,8))，

SeIntpC_c＝((2,3),(3,4),(4,5),(5,6),(6,7),(7,7))，

SeIntpC_d＝((2,5),(3,5),(4,5),(5,5),(6,6))，

SeIntpC_e＝((3,7),(3,6),(4,5),(4,4),(5,4),(6,4),(7,5),(7,6))，

SeIntpC_f＝((3,5),(4,5),(5,5),(6,5),(7,5))，

SeIntpC_g＝((1,5),(2,5),(3,5),(4,5),(5,5),(6,4))，

SeIntpC_h＝((1,6),(2,6),(3,6),(4,5),(4,4),(5,4),(6,4),(7,4),(8,5))，

SeIntpC_i＝((2,6),(3,6),(4,5),(4,4),(5,4),(6,4),(7,4),(8,4))，

SeIntpC_j＝((1,4),(2,5),(3,5),(4,5),(5,5),(5,4),(5,3))。

第二阶段：采用逐级增长方式从所有内插网格序列数据中挖掘频繁序列模式

步骤4：根据用户设定的支持度阈值，从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式。

SeIntpC_a～SeIntpC_j中的每个网格可认为是一个长度为1的内插网格序列模式，其支持度为包含该网格的内插网格序列数与所有内插网格序列数的比值，例如：对于只包含网格(2,3)的内插网格序列模式，内插网格序列SeIntpC_a、SeIntpC_b、SeIntpC_c均包含该模式，同时本实例共有10条内插网格序列，因此内插网格序列模式(2,3)的支持度为3/10×100％＝30％。同理，可得所有长度为1的内插网格序列模式及其支持度，如表1所示。在本实施例中，我们设定支持度阈值为30％，得到长度为1的频繁序列模式及其支持度如表2所示。

表1

模式	支持度	模式	支持度	模式	支持度	模式	支持度
								(2,3)	30％	(7,7)	10％	(4,4)	30％	(1,6)	10％
(3,4)	30％	(2,5)	30％	(5,4)	40％	(2,6)	20％
								(4,5)	100％	(3,5)	40％	(6,5)	10％	(7,4)	20％
(5,6)	30％	(5,5)	40％	(7,6)	10％	(8,4)	10％
								(6,7)	30％	(6,6)	10％	(7,5)	20％	(1,4)	10％
(6,8)	10％	(3,7)	10％	(1,5)	10％	(5,3)	10％
								(1,2)	10％	(3,6)	30％	(6,4)	40％	(8,5)	10％
(7,8)	10％

表2

模式

支持度

模式

支持度

模式

支持度

模式

支持度

(2,3)

30％

(5,6)

30％

(3,5)

40％

(4,4)

30％

(3,4)

30％

(6,7)

30％

(5,5)

40％

(5,4)

40％

(4,5)

100％

(2,5)

30％

(3,6)

30％

(6,4)

40％

步骤5：对长度为K的任意两个频繁序列模式，进行中重合的关系判断，并基于判断结果生成长度为K+1的候选序列模式，K＝2,3,4…

以K＝2为例给出具体计算过程，表2中共包括12个长度为1频繁序列模式，长度为2的内插网格序列模式可以通过组合长度为1频繁序列模式进行生成，但是必须满足连续网格必须空间邻近的要求，例如对于频繁序列模式(2,3)与其空间邻近的频繁序列模式只有(3,4)，两者组合可以生成长度2的内插网格序列模式((2,3),(3,4))。

步骤6：扫描所有内插网格序列数据，计算长度为K+1的所有候选序列模式的支持度，并与设定支持度阈值比较，得到所有长度为K+1的频繁序列模式；

在本实施例中，10条内插网格序列中，只有内插网格序列SeIntpC_a、SeIntpC_b、SeIntpC_c均包含该模式，因此其支持度为30％。同理，可以得到所有长度为2的内插网格序列模式及其支持度，如表3所示。设定支持度阈值为30％，进一步得到所有长度为2的频繁序列模式及其支持度如表4所示。

表3

模式	支持度	模式	支持度	模式	支持度
						((2,3),(3,4))	30％	((5,6),(5,5))	0	((3,6),(4,5))	30％
((3,4),(2,3))	0	((6,7),(5,6))	0	((3,6),(2,5))	0
						((3,4),(4,5))	30％	((2,5),(3,4))	0	((3,6),(3,5))	0
((3,4),(2,5))	0	((2,5),(3,5))	30％	((4,4),(3,4))	0
						((3,4),(3,5))	0	((2,5),(3,6))	0	((4,4),(4,5))	0
((3,4),(4,4))	0	((3,5),(3,4))	0	((4,4),(3,5))	0
						((4,5),(3,4))	0	((3,5),(4,5))	40％	((4,4),(5,5))	0
((4,5),(5,6))	30％	((3,5),(2,5))	0	((4,4),(5,4))	30％
						((4,5),(3,5))	0	((3,5),(3,6))	0	((5,4),(4,5))	0
((4,5),(5,5))	40％	((3,5),(4,4))	0	((5,4),(5,5))	0
						((4,5),(3,6))	0	((5,5),(4,5))	0	((5,4),(4,4))	0
((4,5),(4,4))	30％	((5,5),(5,6))	0	((5,4),(6,4))	30％
						((4,5),(5,4))	0	((5,5),(4,4))	0	((6,4),(5,6))	0

((5,6),(4,5))	0	((5,5),(5,4))	10％	((6,4),(5,5))	0
						((5,6),(6,7))	30％	((5,5),(6,4))	10％	((6,4),(5,4))	0

表4

模式	支持度	模式	支持度	模式	支持度
						((2,3),(3,4))	30％	((4,5),(4,4))	30％	((3,6),(4,5))	30％
((3,4),(4,5))	30％	((5,6),(6,7))	30％	((4,4),(5,4))	30％
						((4,5),(5,6))	30％	((2,5),(3,5))	30％	((5,4),(6,4))	30％
((4,5),(5,5))	40％	((3,5),(4,5))	40％

K＝3时，以内插网格序列模式中重合为限定条件，从长度为2的频繁序列模式生成长度为3的频繁序列模式。例如，对于频繁序列模式((2,3),(3,4))，表4中与其满足中重合关系的频繁序列模式只有((3,4),(4,5))。因此，两者联合生成长度为3的内插网格序列模式((2,3),(3,4),(4,5))，计算其支持度为30％。同理，依次可以得到所有的长度为3的内插网格序列模式及其支持度，如表5所示。进一步，得到所有长度为3的频繁序列模式及其支持度如表6所示。

表5

模式	支持度	模式	支持度
				((2,3),(3,4),(4,5))	30％	((3,5),(4,5),(5,6))	0
((3,4),(4,5),(5,6))	30％	((3,5),(4,5),(5,5))	40％
				((3,4),(4,5),(5,5))	0	((3,5),(4,5),(4,4))	0
((3,4),(4,5),(4,4))	0	((3,6),(4,5),(5,6))	0
				((4,5),(5,6),(6,7))	30％	((3,6),(4,5),(5,5))	0
((4,5),(4,4),(5,4))	30％	((3,6),(4,5),(4,4))	30％
				((2,5),(3,5),(4,5))	30％	((4,4),(5,4),(6,4))	30％

表6

模式	支持度	模式	支持度
				((2,3),(3,4),(4,5))	30％	((2,5),(3,5),(4,5))	30％
((3,4),(4,5),(5,6))	30％	((3,5),(4,5),(5,5))	40％
				((4,5),(5,6),(6,7))	30％	((3,6),(4,5),(4,4))	30％
((4,5),(4,4),(5,4))	30％	((4,4),(5,4),(6,4))	30％

同理，K＝4时，以内插网格序列模式中重合为限定条件，联合表6中长度为3的频繁序列模式，可以得到长度为4的频繁序列模式如表7所示。

表7

模式	支持度	模式	支持度
				((2,3),(3,4),(4,5),(5,6))	30％	((3,6),(4,5),(4,4),(5,4))	30％
((3,4),(4,5),(5,6),(6,7))	30％	((2,5),(3,5),(4,5),(5,5))	30％
				((4,5),(4,4),(5,4),(6,4))	30％

最后，K＝5时，以内插网格序列模式中重合为限定条件，联合表7中长度为4的频繁序列模式，得到长度为5的频繁序列模式如表8所示。

表8

模式	支持度
		((3,6),(4,5),(4,4),(5,4),(6,4))	30％

第三阶段：基于频繁序列模式生成内插网格序列规则

步骤7：根据长度大于1的频繁序列模式，生成候选的内插网格序列规则，并根据候选的内插网络序列规则及其前项，计算候选的内插网格序列规则的置信度。

首先从表4中长度为2的频繁序列模式生成候选内插网格序列规则，例如，对于频繁序列模式((2,3),(3,4))，其可生成候选的内插网格序列规则

((2, 3) &DoubleRightArrow; (3, 4)) .

在本实施例中，候选的内插网格序列规则对应的内插网格序列模式为((2,3),(3,4))，支持度为30％。前项对应的内插网格序列模式为(2,3)，支持度也为30％。因此，的置信度为100％。

同理，可以计算生成所有长度为2的频繁序列模式对应的候选内插网格序列规则，如表9所示。

表9

进一步，可以分别得到所有长度为3、4、5的频繁序列模式对应的候选内插网格序列规则，如表10、11、12所示。

表10

表11

表12

步骤8：选出所有置信度大于等于设定的置信度阈值的候选的内插网格序列规则作为内插网络序列规则。

在本实施例中，设定置信度阈值为40％，分别从表9～12中的候选内插网格序列规则得到内插网格序列规则，结果分别如表13～16所示。

表13

表14

表15

表16

第四阶段：根据移动对象当前所在的网格与所有内插网格序列规则的多项式匹配，预测移动对象的后续位置

步骤9：获取移动对象当前所在的网格，并将该网格与所有内插网格序列规则进行匹配，得到匹配集，并根据匹配集计算多项式匹配集，基于多项式匹配集对移动对象的后续位置进行预测。

在本实施例中，移动对象当前所在的网格为(4,5)，将网格(4,5)分别与表13～表16进行匹配，得到的匹配集如表17所示。

表17

计算表17中匹配集合中每条内插网格序列规则的匹配值，其中，amax＝3、dmax＝3。因此，对于内插网格序列规则其匹配值为同理，可得其他规则的匹配值，如表18所示。有表18可知，网格(4,5)的多项式匹配集为规则因此，移动对象的后续位置为网格(4,4)，预测过程的示意如图5所示。

表18

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.基于内插网格序列规则的移动对象位置预测方法，其特征在于，包括以下步骤：

所述原始轨迹数据表示一个移动对象连续位置测量的有序列表，其定义为T_ID＝(p₁,p₂,...,p_n)，其中，下标ID表示原始轨迹的序列号，p_i＝(x,y),1≤i≤n表示一个轨迹点，x,y表示轨迹点的横纵坐标值；

所述空间等间隔的划分方法满足如下条件：

Δ x = \frac{M a x (p_{i} \cdot x) - M i n (p_{i} \cdot x)}{c o l_c o u n t}, Δ y = \frac{M a x (p_{i} \cdot y) - M i n (p_{i} \cdot y)}{r o w_c o u n t}

分别表示网格在空间范围上的横、纵跨度；

定义SePIntpC＝(Cell₁,Cell₂,...,Cell_n)为一个内插网格序列模式，其中，

Cell_i∈C,1≤i≤n，n表示模式的长度，任意两个连续的网格

Cell_i,Cell_j,1≤i≤n,1≤j≤n,j＝(i+1)，必须满足空间邻近条件：(0≤|Cell_i·col-Cell_j·col|≤1)∧(0≤|Cell_i·row-Cell_j·row|≤1)；

{Supp}_{D}^{P} = \frac{| {{SeIntpC}_{i} | {SeIntpC}_{i} &SupersetEqual; P, {SeIntpC}_{i} &Element; D} |}{n} \times 100 %

其中，1≤i≤n，表示D中包含P的内插网格序列的数量，如果α是设定的支持度阈值，则称P为在D中频繁序列模式；

对两个内插网格序列模式

A = ({Cell}_{i_{1}}, {Cell}_{i_{2}}, ..., {Cell}_{i_{n}}), B = ({Cell}_{j_{1}}, {Cell}_{j_{2}}, ..., {Cell}_{j_{n}}),

如果A的子序列

({Cell}_{i_{2}}, {Cell}_{i_{3}}, ..., {Cell}_{i_{n - 1}})

与B的子序列

({Cell}_{j_{1}}, {Cell}_{j_{2}}, ..., {Cell}_{j_{n}})

完全匹配，则称A与B中重合；

对于一个网格空间DR²和一个内插网格序列数据库D，

S e R I n t p C = ({Cell}_{1} &RightArrow; {Cell}_{2} &RightArrow;, ..., &RightArrow; {Cell}_{m} &DoubleRightArrow; {Cell}_{m + 1} &RightArrow; {Cell}_{m + 2} &RightArrow;, ..., &RightArrow; {Cell}_{m + n})

{Conf}_{D}^{S e R I n t p C} = \frac{{Supp}_{D}^{({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{m + n})}}{{Supp}_{D}^{({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{m})}} \times 100 %;

{MatchSet}_{R u l e S e t}^{C e l l} = {{SeRIntpC}_{i} |\begin{matrix} {SeRIntpC}_{i} &Element; R u l e S e t, 1 \leq i \leq n, \\ {SeRIntpC}_{i} \cdot a n t e c e d e n t \cdot l a s t C e l l = C e l l \end{matrix}},

定义多项式匹配集：

{MMatchSet}_{R u l e S e t}^{C e l l} = \underset{S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}}{\arg \max} | \frac{1}{2} (\begin{matrix} \sqrt{\frac{S e R I n t p C \cdot a n t e c e d e n t \cdot l e n g t h}{a \max}} \\ + \sqrt{\frac{S e R I n t p C \cdot d e s c e n d a n t \cdot l e n g t h}{d \max}} \end{matrix}) * {Conf}_{D}^{S e R I n t p C}

其中，

a \max = \max {S e R I n t p C \cdot a n t e c e d e n t \cdot l e n g t h | S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}},

表示匹配内插网格序列规则中最长前项包含的网格数；

d \max = \max {S e R I n t p C \cdot d e s c e n d a n t \cdot l e n g t h | S e R I n t p C &Element; {MatchSet}_{R u l e S e t}^{C e l l}},

表示匹配内插网格序列规则中最长后项包含的网格数。

2.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法，其特征在于，步骤3的具体过程为：

{Intp}_{{Cell}_{i}}^{{Cell}_{j}} \cdot c o l = r o u n d ({Cell}_{i} \cdot c o l + k \times \frac{{Cell}_{j} \cdot c o l - {Cell}_{i} \cdot c o l}{m}),

{Intp}_{{Cell}_{i}}^{{Cell}_{j}} \cdot r o w = r o u n d ({Cell}_{i} \cdot r o w + k \times \frac{{Cell}_{j} \cdot r o w - {Cell}_{i} \cdot r o w}{m}),

其中，分别表示内插网格的列号、行号，round()是四舍五入函数，是向下取整的函数，生成的内插网格序列为

{SeIntpC}_{I D} = ({Cell}_{1}, {Cell}_{2}, ..., {Cell}_{i}, {Intp}_{{Cell}_{i}}^{{Cell}_{j}}, {Cell}_{j}, {Cell}_{j + 1}, ..., {Cell}_{n}) .

3.根据权利要求2所述基于内插网格序列规则的移动对象位置预测方法，其特征在于：对于一个网格序列SeC_ID＝(Cell₁,Cell₂,...,Cell_n),其包含的任意两个连续的网格Cell_i,Cell_j,1≤i≤n,1≤j≤n,j＝(i+1)，如果空间不邻近，就是不满足条件：(0≤|Cell_i·col-Cell_j·col|≤1)∧(0≤|Cell_i·row-Cell_j·row|≤1)。

4.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法，其特征在于：步骤4中的支持度阈值α＝30％。

5.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法，其特征在于：步骤8中的置信度阈值β＝40％。