CN105184088A - 基于内插网格序列规则的移动对象位置预测方法 - Google Patents

基于内插网格序列规则的移动对象位置预测方法 Download PDF

Info

Publication number
CN105184088A
CN105184088A CN201510606759.9A CN201510606759A CN105184088A CN 105184088 A CN105184088 A CN 105184088A CN 201510606759 A CN201510606759 A CN 201510606759A CN 105184088 A CN105184088 A CN 105184088A
Authority
CN
China
Prior art keywords
cell
grid
interpolation
sequence
centerdot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510606759.9A
Other languages
English (en)
Other versions
CN105184088B (zh
Inventor
张海涛
葛国栋
陈泽伟
刘钊
胡栋
朱云虹
武晨雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201510606759.9A priority Critical patent/CN105184088B/zh
Publication of CN105184088A publication Critical patent/CN105184088A/zh
Application granted granted Critical
Publication of CN105184088B publication Critical patent/CN105184088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明公开了基于内插网格序列规则的移动对象位置预测方法,该方法首先对原始轨迹数据进行空间离散与内插处理得到对应的内插网格序列数据,然后从所有内插网格序列数据中挖掘得到频繁序列模式,并进一步得到内插网格序列规则,最后基于移动对象当前所在网格与所有内插网格序列规则进行多项式匹配,并基于匹配结果预测移动对象的后续位置。本发明与传统方法相比,具有匹配率高、预测速度快的优势。

Description

基于内插网格序列规则的移动对象位置预测方法
技术领域
本发明属于移动对象数据挖掘与预测技术的研究领域,具体涉及了基于内插网格序列规则的移动对象位置预测方法。
背景技术
随着民用GPS等定位设备在车载以及移动终端上的普遍使用,以及基于位置的服务(LBS:Location-basedService)和移动社交网络的迅速发展,大量的移动对象数据在日常生活中正在日益积累并为不同类型的应用所服务,同时也成为众多领域的科学研究工作者开展科学研究的新型数据源。由于移动对象数据中的每一个轨迹点反映空间上的一个位置以及时间上的一个事件,通过对大量的移动对象数据的分析,预测移动对象群体的运动趋势,可为基于位置的智能广告推送,市交通规划、实时交通导航等众多行业应用提供辅助决策功能。
传统的移动对象位置预测主要采用统计建模的方法,例如:决策树、贝叶斯推理、隐马尔科夫模型等,优点是预测的精度高,但模型计算的复杂度高,难以应用于实时处理性能要求较高的移动计算环境。近年来,基于数据挖掘的位置预测技术成为主流研究方法:首先采用简单的统计模型,从大量的移动对象数据中挖掘中反映移动对象群体所共同遵循的规则,然后基于移动对象当前路径与挖掘的规则的匹配预算对移动对象的后续位置进行预测。这种使用简单统计模型以及离线数据挖掘、在线预测相结合的方式,可以大大提高移动对象位置预测的速度,满足应用系统对于实时处理性能的要求。
但是,现有的基于数据挖掘的位置预测方法存在一个共性的问题:挖掘出来的用于位置预测的规则的可用性不高,也即规则与移动对象位置的匹配率较低。研究发现其主要原因包括:(1)原始轨迹数据以位置测量为最小单位进行空间坐标的自然离散,会使得从原始轨迹数据挖掘的规则粒度级别太小,不具有通用特性。(2)规则包含的位置不能保证具有空间连续性,当移动对象的位置处于规则包含位置的中间区域时,就不能进行有效的位置预测。本发明提出了一种基于内插网格序列规则的移动对象位置预测方法,可以有效的解决匹配率低的问题,且具有较高的运算性能。
发明内容
为了解决上述背景技术提出的技术问题,本发明旨在提供基于内插网格序列规则的移动对象位置预测方法,解决了传统技术匹配率低的问题。
为了实现上述技术目的,本发明的技术方案为:
基于内插网格序列规则的移动对象位置预测方法,包括以下步骤:
步骤1:采用空间等间隔的划分方法,将所有原始轨迹数据的空间分布范围划分为一系列的二维网格;
所述原始轨迹数据表示一个移动对象连续位置测量的有序列表,其定义为TID=(p1,p2,...,pn),其中,下标ID表示原始轨迹的序列号,pi=(x,y),1≤i≤n表示一个轨迹点,x,y表示轨迹点的横、纵坐标值;
对于一个包含所有原始轨迹数据的离散二维空间R2={pi|1≤i≤n},其对应的二维网格为DR2={Cell|1≤Cell·col≤col_count,1≤Cell·row≤row_count},其中,Cell表示一个网格,Cell·col、Cell·row分别表示网格Cell在二维空间划分中所处的列号、行号,col_count、row_count分别是根据设定的空间分辨率而设定划分的列数、行数;
所述空间等间隔的划分方法满足如下条件:
(1)如果网格Cell满足条件:(Cell·row=1)∧(Cell·col=1),则Cell为起始网格,且Cell·LB·x=Min(pi·x),Cell·LB·y=Min(pi·y),Cell·LB·x表示网格Cell左下角的横坐标值,Cell·LB·y表示网格Cell左下角的纵坐标值,其中,“∧”表示“并且”关系;
(2)Cell·RT·x=Cell·LB·x+Δx,Cell·RT·y=Cell·LB·y+Δy分别表示网格Cell右上角的横、纵坐标值;其中,
Δ x = M a x ( p i · x ) - M i n ( p i · x ) c o l _ c o u n t , Δ y = M a x ( p i · y ) - M i n ( p i · y ) r o w _ c o u n t 分别表示网格在空间范围上的横、纵跨度;
(3)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·LB·y;
(4)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·LB·x,Cellj·LB·y=Cellk·RT·y;
(5)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·RT·y;
步骤2:根据原始轨迹数据与二维网格的匹配,对原始轨迹数据进行空间离散化,得到对应的网格序列;
所述网格序列是,对于任一网格Celli∈DR2,1≤i≤n,都满足条件即原始轨迹点pi包含于网格Celli
步骤3:对网格序列中空间不相邻的两个网格进行内插处理,得到对应的内插网格序列;
步骤4:根据设定的支持度阈值,从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式;
定义SePIntpC=(Cell1,Cell2,...,Celln)为一个内插网格序列模式,其中,Celli∈C,1≤i≤n,n表示模式的长度,任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),必须满足空间邻近条件:(0≤|Celli·col-Cellj·col|≤1)∧(0≤|Celli·row-Cellj·row|≤1);
对于一个内插网格序列SeIntpC=(Cell1,Cell2,...,Cellm)和一个内插网格序列模式SePIntpC=(Cell1,Cell2,...,Celln),如果满足条件:(1)n≤m;(2)SeIntpC中存在连续的子序列(Cellk,Cellk+1,...,Cellk+n-1)与SePIntpC完全匹配,则称SeIntpC包含SePIntpC,记为
对于一个内插网格序列模式P和一个内插网格序列数据库D=(SeIntpC1,SeIntpC2,...,SeIntpCn),D对P的支持度定义为:
Supp D P = | { SeIntpC i | SeIntpC i ⊇ P , SeIntpC i ∈ D } | n × 100 %
其中,1≤i≤n, | { SeIntpC i | SeIntpC i ⊇ P , SeIntpC i ∈ D } | 表示D中包含P的内插网格序列的数量,如果α是设定的支持度阈值,则称P为在D中频繁序列模式;
步骤5:对长度为K的任意两个频繁序列模式,进行中重合的关系判断,并基于判断结果生成长度为K+1的候选序列模式,其中,长度为K的频繁序列模式由长度为1的频繁序列模式组合生成,K=2,3,4…
对两个内插网格序列模式 A = ( Cell i 1 , Cell i 2 , ... , Cell i n ) , B = ( Cell j 1 , Cell j 2 , ... , Cell j n ) , 如果A的子序列与B的子序列完全匹配,则称A与B中重合;
步骤6:扫描所有内插网格序列数据,计算长度为K+1的所有候选序列模式的支持度,并与设定的支持度阈值比较,得到所有长度为K+1的频繁序列模式;
步骤7:根据长度大于1的频繁序列模式,生成候选的内插网格序列规则,并根据候选的内插网络序列规则及其前项,计算候选的内插网格序列规则的置信度;
对于一个网格空间DR2和一个内插网格序列数据库D, S e R I n t p C = ( Cell 1 → Cell 2 → , ... , → Cell m ⇒ Cell m + 1 → Cell m + 2 → , ... , → Cell m + n ) 称为一个内插网格序列规则,其中,Celli∈DR2,1≤i≤m+n,(Cell1,Cell2,...,Cellm+n)是D中是一个频繁序列模式,SeRIntpC的置信度 Conf D S e R I n t p C = Supp D ( Cell 1 , Cell 2 , ... , Cell m + n ) Supp D ( Cell 1 , Cell 2 , ... , Cell m ) × 100 % ; Cell1→Cell2→,...,→Cellm称为SeRIntpC的前项,记为SeRIntpC·antecedent,m表示SeRIntpC·antecedent中的网格数,称为SeRIntpC·antecedent的长度,记为SeRIntpC·antecedent·length;Cellm是SeRIntpC·antecedent中的最后一个网格,记为SeRIntpC·antecedent·lastCell;Cellm+1→Cellm+2→,...,→Cellm+n称为SeRIntpC的后项,记为SeRIntpC的后项,记为SeRIntpC·descendant,n表示SeRIntpC·descendant中的网格数,称为SeRIntpC·descendant的长度,记为SeRIntpC·descendant·length;
步骤8:选出所有置信度大于等于设定的置信度阈值β的候选的内插网格序列规则作为内插网络序列规则;
步骤9:获取移动对象当前所在的网格,并将该网格与所有内插网格序列规则进行匹配,得到匹配集,并根据匹配集计算多项式匹配集,基于多项式匹配集对移动对象的后续位置进行预测;
对于一个内插网格序列规则集合RuleSet={SeRIntpC1,SeRIntpC2,...,SeRIntpCn}和一个网格Cell,Cell与RuleSet的匹配集定义为 MatchSet R u l e S e t C e l l = { SeRIntpC i | SeRIntpC i ∈ R u l e S e t , 1 ≤ i ≤ n , R u l e S e t · a n t e c e d e n t · l a s t C e l l = C e l l } s , 其中,1≤i≤n,SeRIntpCi·antecedent·lastCell=Cell表示内插网格序列规则SeRIntpCi前项的最后一个网格与网格Cell相同;
定义多项式匹配集:
MMatchSet R u l e S e t C e l l = arg max S e R I n t p C ∈ MatchSet R u l e S e t C e l l | 1 2 S e R I n t p C · a n t e c e d e n t · l e n g t h a max + S e R I n t p C · d e sec e n d a n t · l e n g t h d max * Conf D S e R I n t p C
其中, a max = max { S e R I n t p C · a n t e c e d e n t · l e n g t h | S e R I n t p C ∈ MatchSet R u l e S e t C e l l } , 表示匹配内插网格序列规则中最长前项包含的网格数; d max = max { S e R I n t p C · d e sec e n d a n t · l e n g t h | S e R I n t p C ∈ MatchSet R u l e S e t C e l l } , 表示匹配内插网格序列规则中最长后项包含的网格数。
进一步地,步骤3的具体过程为:
对于一个网格序列SeCID=(Cell1,Cell2,...,Celln),其包含的任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),如果空间不邻近,则需要在网格Celli和Cellj之间进行内插,内插的具体公式如下:
Intp Cell i Cell j · c o l = r o u n d ( Cell i · c o l + k × Cell j · c o l - Cell i · c o l m ) ,
Intp Cell i Cell j · r o w = r o u n d ( Cell i · r o w + k × Cell j · r o w - Cell i · r o w m ) ,
其中,1≤k≤m-1, r = ( Cell i · c o l - Cell j · c o l ) 2 + ( Cell i · r o w - Cell j · r o w ) 2 , 分别表示内插网格的列号、行号,round()是四舍五入函数,是向下取整的函数,生成的内插网格序列为 SeIntpC I D = ( Cell 1 , Cell 2 , ... , Cell i , Intp Cell i Cell j , Cell j , Cell j + 1 , ... , Cell n ) .
对于一个网格序列SeCID=(Cell1,Cell2,...,Celln),其包含的任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),如果空间不邻近,就是不满足条件:(0≤|Celli·col-Cellj·col|≤1)∧(0≤|Celli·row-Cellj·row|≤1)。
采用上述技术方案带来的有益效果:
(1)匹配率高:本发明采用网格对原始轨迹数据进行空间离散,使得内插网格序列规则的空间覆盖范围得到了泛化;对空间离散后的网格序列进行内插处理,并在内插网格序列规则挖掘过程中保证内插网格单元的连续性,进一步提高了内插网格序列规则的覆盖度。
(2)预测速度快:本发明在内插网格序列规则挖掘过程中,使用网格距离进行网格之间邻接关系判断;在位置预测过程中,也使用网格单元进行多项式匹配运算。这两方面都可大大减少计算开销,提高预测的效率。
附图说明
图1为实施例中Ta~Tj共10条原始轨迹离散二维空间的表达示意图;
图2为实施例中依据图1中10条原始轨迹划分的二维网格空间示意图;
图3为实施例中图1中的原始轨迹Ta和图2中二维网格空间进行匹配得到网格序列示意图;
图4为实施例中对图3中网格序列进行内插处理后得到内插网格序列示意图;
图5为实施例中当移动对象位于网格(4,5)时预测后续位置为网格(4,4)示意图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
第一阶段:对原始轨迹数据进行空间离散、内插预处理
步骤1:采用空间等间隔的划分的方法,将所有原始轨迹数据的空间分布范围划分为一系列的二维网格。
在本实施例中,共有10条原始轨迹,具体数据信息为:
Ta=((113,283),(214,386),(425,591),(588,732)),
Tb=((55,166),(235,341),(455,571),(542,663),(630,733)),
Tc=((143,220),(365,439),(545,623),(654,623)),
Td=((152,483),(461,483),(546,568)),
Te=((265,672),(265,557),(361,373),(542,373),(649,548)),
Tf=((235,465),(461,456),(668,456)),
Tg=((38,423),(461,423),(586,374)),
Th=((81,557),(248,557),(343,353),(658,353),(764,466)),
Ti=((111,521),(238,521),(338,332),(749,332)),
Tj=((38,354),(242,411),(461,411),(461,275))。
10条原始轨迹在2维空间的表达如图1所示。10条原始轨迹中横坐标的最小值是38,最大值是764,横坐标范围的跨度是726,我们以100作为1个划分,把横坐标范围分为8个划分,即0作为起点,0~100为划分1,100~200为划分2,…,700~800为划分8。10条原始轨迹中纵坐标的最小值是166,最大值是733,纵坐标范围的跨度是567,同样,我们以100作为1个划分,把纵坐标范围也分为8个划分,即0作为起点,0~100为划分1,100~200为划分2,…,700~800为划分8。最终,空间包含10条原始轨迹的二维网格空间如图2所示。
步骤2:根据原始轨迹数据与二维网格的匹配,对原始轨迹数据进行空间离散化,得到对应的网格序列。
将图1中10条原始轨迹与图2中的二维网格进行匹配。我们以Ta为例,给出一条原始轨迹通过匹配得到一条网格序列的过程。Ta中第一个轨迹点为(113,283),网格(2,3)的左下角坐标为(100,200)、右上角坐标为(200,300)。因此,网格(2,3)与轨迹点(113,283)存在包含关系,即满足关系:(100≤113≤200)∧(200≤283≤300)。因此,轨迹点(113,283)匹配的网格为(2,3)。
以此类推,可以得到原始轨迹Ta的其他轨迹点相匹配的网格,最终得到Ta匹配的网格序列为:SeCa=((2,3),(3,4),(5,6),(6,8)),匹配过程示意如图3所示。同理,可以得到其他原始轨迹的网格序列,具体信息如下:
SeCb=((1,2),(3,4),(5,6),(6,7),(7,8)),
SeCc=((2,3),(4,5),(6,7),(7,7)),
SeCd=((2,5),(5,5),(6,6)),
SeCe=((3,7),(3,6),(4,4),(6,4),(7,6)),
SeCf=((3,5),(5,5),(7,5)),
SeCh=((1,6),(3,6),(4,4),(7,4),(8,5)),
SeCi=((2,6),(3,6),(4,4),(8,4)),
SeCj=((1,4),(3,5),(5,5),(5,3))。
步骤3:对网格序列中空间不相邻的两个网格进行内插处理,得到对应内插网格序列。
以SeCa=((2,3),(3,4),(5,6),(6,8))为例对内插处理进行说明。由于SeCa中的网格(2,5)与(5,3)以及网格(5,3)与网格(7,3)都不满足空间邻近条件,必须进行内插处理。
网格(3,4)与(5,6)的内插网格的计算过程如下:
a)计算 r = ( | 5 - 3 | ) 2 + ( | 6 - 4 | ) 2 = 2.828 ,
b)得到
c)得到k=1,
d)得到
Cell 1 · c o l = r o u n d ( 3 + 1 × 5 - 3 2 ) = 4 , Cell 1 · r o w = r o u n d ( 4 + 1 × 6 - 4 2 ) = 5.
同理,对网格(5,6)与网格(6,8)进行内插处理,过程如下:
a)计算 r = ( | 5 - 6 | ) 2 + ( | 6 - 8 | ) 2 = 2.236 ,
b)得到
c)得到k=1,
d)得到
Cell 1 · c o l = r o u n d ( 5 + 1 × 6 - 5 2 ) = 6 , Cell 1 · r o w = r o u n d ( 6 + 1 × 8 - 6 2 ) = 7.
最终得到SeCa对应的内插网格序列为:
SeIntpCa=((2,3),(3,4),(4,5),(5,6),(6,7),(6,8)),内插过程示意如图4所示。
其他网格序列的内插结果如下:
SeIntpCb=((1,2),(2,3),(3,4),(4,5),(5,6),(6,7),(7,8)),
SeIntpCc=((2,3),(3,4),(4,5),(5,6),(6,7),(7,7)),
SeIntpCd=((2,5),(3,5),(4,5),(5,5),(6,6)),
SeIntpCe=((3,7),(3,6),(4,5),(4,4),(5,4),(6,4),(7,5),(7,6)),
SeIntpCf=((3,5),(4,5),(5,5),(6,5),(7,5)),
SeIntpCg=((1,5),(2,5),(3,5),(4,5),(5,5),(6,4)),
SeIntpCh=((1,6),(2,6),(3,6),(4,5),(4,4),(5,4),(6,4),(7,4),(8,5)),
SeIntpCi=((2,6),(3,6),(4,5),(4,4),(5,4),(6,4),(7,4),(8,4)),
SeIntpCj=((1,4),(2,5),(3,5),(4,5),(5,5),(5,4),(5,3))。
第二阶段:采用逐级增长方式从所有内插网格序列数据中挖掘频繁序列模式
步骤4:根据用户设定的支持度阈值,从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式。
SeIntpCa~SeIntpCj中的每个网格可认为是一个长度为1的内插网格序列模式,其支持度为包含该网格的内插网格序列数与所有内插网格序列数的比值,例如:对于只包含网格(2,3)的内插网格序列模式,内插网格序列SeIntpCa、SeIntpCb、SeIntpCc均包含该模式,同时本实例共有10条内插网格序列,因此内插网格序列模式(2,3)的支持度为3/10×100%=30%。同理,可得所有长度为1的内插网格序列模式及其支持度,如表1所示。在本实施例中,我们设定支持度阈值为30%,得到长度为1的频繁序列模式及其支持度如表2所示。
表1
模式 支持度 模式 支持度 模式 支持度 模式 支持度
(2,3) 30% (7,7) 10% (4,4) 30% (1,6) 10%
(3,4) 30% (2,5) 30% (5,4) 40% (2,6) 20%
(4,5) 100% (3,5) 40% (6,5) 10% (7,4) 20%
(5,6) 30% (5,5) 40% (7,6) 10% (8,4) 10%
(6,7) 30% (6,6) 10% (7,5) 20% (1,4) 10%
(6,8) 10% (3,7) 10% (1,5) 10% (5,3) 10%
(1,2) 10% (3,6) 30% (6,4) 40% (8,5) 10%
(7,8) 10%
表2
模式 支持度 模式 支持度 模式 支持度 模式 支持度
(2,3) 30% (5,6) 30% (3,5) 40% (4,4) 30%
(3,4) 30% (6,7) 30% (5,5) 40% (5,4) 40%
(4,5) 100% (2,5) 30% (3,6) 30% (6,4) 40%
步骤5:对长度为K的任意两个频繁序列模式,进行中重合的关系判断,并基于判断结果生成长度为K+1的候选序列模式,K=2,3,4…
以K=2为例给出具体计算过程,表2中共包括12个长度为1频繁序列模式,长度为2的内插网格序列模式可以通过组合长度为1频繁序列模式进行生成,但是必须满足连续网格必须空间邻近的要求,例如对于频繁序列模式(2,3)与其空间邻近的频繁序列模式只有(3,4),两者组合可以生成长度2的内插网格序列模式((2,3),(3,4))。
步骤6:扫描所有内插网格序列数据,计算长度为K+1的所有候选序列模式的支持度,并与设定支持度阈值比较,得到所有长度为K+1的频繁序列模式;
在本实施例中,10条内插网格序列中,只有内插网格序列SeIntpCa、SeIntpCb、SeIntpCc均包含该模式,因此其支持度为30%。同理,可以得到所有长度为2的内插网格序列模式及其支持度,如表3所示。设定支持度阈值为30%,进一步得到所有长度为2的频繁序列模式及其支持度如表4所示。
表3
模式 支持度 模式 支持度 模式 支持度
((2,3),(3,4)) 30% ((5,6),(5,5)) 0 ((3,6),(4,5)) 30%
((3,4),(2,3)) 0 ((6,7),(5,6)) 0 ((3,6),(2,5)) 0
((3,4),(4,5)) 30% ((2,5),(3,4)) 0 ((3,6),(3,5)) 0
((3,4),(2,5)) 0 ((2,5),(3,5)) 30% ((4,4),(3,4)) 0
((3,4),(3,5)) 0 ((2,5),(3,6)) 0 ((4,4),(4,5)) 0
((3,4),(4,4)) 0 ((3,5),(3,4)) 0 ((4,4),(3,5)) 0
((4,5),(3,4)) 0 ((3,5),(4,5)) 40% ((4,4),(5,5)) 0
((4,5),(5,6)) 30% ((3,5),(2,5)) 0 ((4,4),(5,4)) 30%
((4,5),(3,5)) 0 ((3,5),(3,6)) 0 ((5,4),(4,5)) 0
((4,5),(5,5)) 40% ((3,5),(4,4)) 0 ((5,4),(5,5)) 0
((4,5),(3,6)) 0 ((5,5),(4,5)) 0 ((5,4),(4,4)) 0
((4,5),(4,4)) 30% ((5,5),(5,6)) 0 ((5,4),(6,4)) 30%
((4,5),(5,4)) 0 ((5,5),(4,4)) 0 ((6,4),(5,6)) 0
((5,6),(4,5)) 0 ((5,5),(5,4)) 10% ((6,4),(5,5)) 0
((5,6),(6,7)) 30% ((5,5),(6,4)) 10% ((6,4),(5,4)) 0
表4
模式 支持度 模式 支持度 模式 支持度
((2,3),(3,4)) 30% ((4,5),(4,4)) 30% ((3,6),(4,5)) 30%
((3,4),(4,5)) 30% ((5,6),(6,7)) 30% ((4,4),(5,4)) 30%
((4,5),(5,6)) 30% ((2,5),(3,5)) 30% ((5,4),(6,4)) 30%
((4,5),(5,5)) 40% ((3,5),(4,5)) 40%
K=3时,以内插网格序列模式中重合为限定条件,从长度为2的频繁序列模式生成长度为3的频繁序列模式。例如,对于频繁序列模式((2,3),(3,4)),表4中与其满足中重合关系的频繁序列模式只有((3,4),(4,5))。因此,两者联合生成长度为3的内插网格序列模式((2,3),(3,4),(4,5)),计算其支持度为30%。同理,依次可以得到所有的长度为3的内插网格序列模式及其支持度,如表5所示。进一步,得到所有长度为3的频繁序列模式及其支持度如表6所示。
表5
模式 支持度 模式 支持度
((2,3),(3,4),(4,5)) 30% ((3,5),(4,5),(5,6)) 0
((3,4),(4,5),(5,6)) 30% ((3,5),(4,5),(5,5)) 40%
((3,4),(4,5),(5,5)) 0 ((3,5),(4,5),(4,4)) 0
((3,4),(4,5),(4,4)) 0 ((3,6),(4,5),(5,6)) 0
((4,5),(5,6),(6,7)) 30% ((3,6),(4,5),(5,5)) 0
((4,5),(4,4),(5,4)) 30% ((3,6),(4,5),(4,4)) 30%
((2,5),(3,5),(4,5)) 30% ((4,4),(5,4),(6,4)) 30%
表6
模式 支持度 模式 支持度
((2,3),(3,4),(4,5)) 30% ((2,5),(3,5),(4,5)) 30%
((3,4),(4,5),(5,6)) 30% ((3,5),(4,5),(5,5)) 40%
((4,5),(5,6),(6,7)) 30% ((3,6),(4,5),(4,4)) 30%
((4,5),(4,4),(5,4)) 30% ((4,4),(5,4),(6,4)) 30%
同理,K=4时,以内插网格序列模式中重合为限定条件,联合表6中长度为3的频繁序列模式,可以得到长度为4的频繁序列模式如表7所示。
表7
模式 支持度 模式 支持度
((2,3),(3,4),(4,5),(5,6)) 30% ((3,6),(4,5),(4,4),(5,4)) 30%
((3,4),(4,5),(5,6),(6,7)) 30% ((2,5),(3,5),(4,5),(5,5)) 30%
((4,5),(4,4),(5,4),(6,4)) 30%
最后,K=5时,以内插网格序列模式中重合为限定条件,联合表7中长度为4的频繁序列模式,得到长度为5的频繁序列模式如表8所示。
表8
模式 支持度
((3,6),(4,5),(4,4),(5,4),(6,4)) 30%
第三阶段:基于频繁序列模式生成内插网格序列规则
步骤7:根据长度大于1的频繁序列模式,生成候选的内插网格序列规则,并根据候选的内插网络序列规则及其前项,计算候选的内插网格序列规则的置信度。
首先从表4中长度为2的频繁序列模式生成候选内插网格序列规则,例如,对于频繁序列模式((2,3),(3,4)),其可生成候选的内插网格序列规则 ( ( 2 , 3 ) ⇒ ( 3 , 4 ) ) .
在本实施例中,候选的内插网格序列规则对应的内插网格序列模式为((2,3),(3,4)),支持度为30%。前项对应的内插网格序列模式为(2,3),支持度也为30%。因此,的置信度为100%。
同理,可以计算生成所有长度为2的频繁序列模式对应的候选内插网格序列规则,如表9所示。
表9
进一步,可以分别得到所有长度为3、4、5的频繁序列模式对应的候选内插网格序列规则,如表10、11、12所示。
表10
表11
表12
步骤8:选出所有置信度大于等于设定的置信度阈值的候选的内插网格序列规则作为内插网络序列规则。
在本实施例中,设定置信度阈值为40%,分别从表9~12中的候选内插网格序列规则得到内插网格序列规则,结果分别如表13~16所示。
表13
表14
表15
表16
第四阶段:根据移动对象当前所在的网格与所有内插网格序列规则的多项式匹配,预测移动对象的后续位置
步骤9:获取移动对象当前所在的网格,并将该网格与所有内插网格序列规则进行匹配,得到匹配集,并根据匹配集计算多项式匹配集,基于多项式匹配集对移动对象的后续位置进行预测。
在本实施例中,移动对象当前所在的网格为(4,5),将网格(4,5)分别与表13~表16进行匹配,得到的匹配集如表17所示。
表17
计算表17中匹配集合中每条内插网格序列规则的匹配值,其中,amax=3、dmax=3。因此,对于内插网格序列规则其匹配值为同理,可得其他规则的匹配值,如表18所示。有表18可知,网格(4,5)的多项式匹配集为规则因此,移动对象的后续位置为网格(4,4),预测过程的示意如图5所示。
表18
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (5)

1.基于内插网格序列规则的移动对象位置预测方法,其特征在于,包括以下步骤:
步骤1:采用空间等间隔的划分方法,将所有原始轨迹数据的空间分布范围划分为一系列的二维网格;
所述原始轨迹数据表示一个移动对象连续位置测量的有序列表,其定义为TID=(p1,p2,...,pn),其中,下标ID表示原始轨迹的序列号,pi=(x,y),1≤i≤n表示一个轨迹点,x,y表示轨迹点的横纵坐标值;
对于一个包含所有原始轨迹数据的离散二维空间R2={pi|1≤i≤n},其对应的二维网格为DR2={Cell|1≤Cell·col≤col_count,1≤Cell·row≤row_count},其中,Cell表示一个网格,Cell·col、Cell·row分别表示网格Cell在二维空间划分中所处的列号、行号,col_count、row_count分别是根据设定的空间分辨率而设定划分的列数、行数;
所述空间等间隔的划分方法满足如下条件:
(1)如果网格Cell满足条件:(Cell·row=1)∧(Cell·col=1),则Cell为起始网格,且Cell·LB·x=Min(pi·x),Cell·LB·y=Min(pi·y),Cell·LB·x表示网格Cell左下角的横坐标值,Cell·LB·y表示网格Cell左下角的纵坐标值,其中,“∧”表示“并且”关系;
(2)Cell·RT·x=Cell·LB·x+Δx,Cell·RT·y=Cell·LB·y+Δy分别表示网格Cell右上角的横、纵坐标值;其中,
Δ x = M a x ( p i · x ) - M i n ( p i · x ) c o l _ c o u n t , Δ y = M a x ( p i · y ) - M i n ( p i · y ) r o w _ c o u n t 分别表示网格在空间范围上的横、纵跨度;
(3)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·LB·y;
(4)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·LB·x,Cellj·LB·y=Cellk·RT·y;
(5)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·RT·y;
步骤2:根据原始轨迹数据与二维网格的匹配,对原始轨迹数据进行空间离散化,得到对应的网格序列;
所述网格序列是,对于任一网格Celli∈DR2,1≤i≤n,都满足条件即原始轨迹点pi包含于网格Celli
步骤3:对网格序列中空间不相邻的两个网格进行内插处理,得到对应的内插网格序列;
步骤4:根据设定的支持度阈值,从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式;
定义SePIntpC=(Cell1,Cell2,...,Celln)为一个内插网格序列模式,其中,
Celli∈C,1≤i≤n,n表示模式的长度,任意两个连续的网格
Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),必须满足空间邻近条件:(0≤|Celli·col-Cellj·col|≤1)∧(0≤|Celli·row-Cellj·row|≤1);
对于一个内插网格序列SeIntpC=(Cell1,Cell2,...,Cellm)和一个内插网格序列模式SePIntpC=(Cell1,Cell2,...,Celln),如果满足条件:(1)n≤m;(2)SeIntpC中存在连续的子序列(Cellk,Cellk+1,...,Cellk+n-1)与SePIntpC完全匹配,则称SeIntpC包含SePIntpC,记为
对于一个内插网格序列模式P和一个内插网格序列数据库D=(SeIntpC1,SeIntpC2,...,SeIntpCn),D对P的支持度定义为:
Supp D P = | { SeIntpC i | SeIntpC i ⊇ P , SeIntpC i ∈ D } | n × 100 %
其中,1≤i≤n,表示D中包含P的内插网格序列的数量,如果α是设定的支持度阈值,则称P为在D中频繁序列模式;
步骤5:对长度为K的任意两个频繁序列模式,进行中重合的关系判断,并基于判断结果生成长度为K+1的候选序列模式,其中,长度为K的频繁序列模式由长度为1的频繁序列模式组合生成,K=2,3,4…
对两个内插网格序列模式 A = ( Cell i 1 , Cell i 2 , ... , Cell i n ) , B = ( Cell j 1 , Cell j 2 , ... , Cell j n ) , 如果A的子序列 ( Cell i 2 , Cell i 3 , ... , Cell i n - 1 ) 与B的子序列 ( Cell j 1 , Cell j 2 , ... , Cell j n ) 完全匹配,则称A与B中重合;
步骤6:扫描所有内插网格序列数据,计算长度为K+1的所有候选序列模式的支持度,并与设定的支持度阈值比较,得到所有长度为K+1的频繁序列模式;
步骤7:根据长度大于1的频繁序列模式,生成候选的内插网格序列规则,并根据候选的内插网络序列规则及其前项,计算候选的内插网格序列规则的置信度;
对于一个网格空间DR2和一个内插网格序列数据库D, S e R I n t p C = ( Cell 1 → Cell 2 → , ... , → Cell m ⇒ Cell m + 1 → Cell m + 2 → , ... , → Cell m + n ) 称为一个内插网格序列规则,其中,Celli∈DR2,1≤i≤m+n,(Cell1,Cell2,...,Cellm+n)是D中是一个频繁序列模式,SeRIntpC的置信度 Conf D S e R I n t p C = Supp D ( Cell 1 , Cell 2 , ... , Cell m + n ) Supp D ( Cell 1 , Cell 2 , ... , Cell m ) × 100 % ; Cell1→Cell2→,...,→Cellm称为SeRIntpC的前项,记为SeRIntpC·antecedent,m表示SeRIntpC·antecedent中的网格数,称为SeRIntpC·antecedent的长度,记为SeRIntpC·antecedent·length;Cellm是SeRIntpC·antecedent中的最后一个网格,记为SeRIntpC·antecedent·lastCell;Cellm+1→Cellm+2→,...,→Cellm+n称为SeRIntpC的后项,记为SeRIntpC的后项,记为SeRIntpC·descendant,n表示SeRIntpC·descendant中的网格数,称为SeRIntpC·descendant的长度,记为SeRIntpC·descendant·length;
步骤8:选出所有置信度大于等于设定的置信度阈值β的候选的内插网格序列规则作为内插网络序列规则;
步骤9:获取移动对象当前所在的网格,并将该网格与所有内插网格序列规则进行匹配,得到匹配集,并根据匹配集计算多项式匹配集,基于多项式匹配集对移动对象的后续位置进行预测;
对于一个内插网格序列规则集合RuleSet={SeRIntpC1,SeRIntpC2,...,SeRIntpCn}和一个网格Cell,Cell与RuleSet的匹配集定义为 MatchSet R u l e S e t C e l l = { SeRIntpC i SeRIntpC i ∈ R u l e S e t , 1 ≤ i ≤ n , SeRIntpC i · a n t e c e d e n t · l a s t C e l l = C e l l } ,
其中,1≤i≤n,SeRIntpCi·antecedent·lastCell=Cell表示内插网格序列规则SeRIntpCi前项的最后一个网格与网格Cell相同;
定义多项式匹配集:
MMatchSet R u l e S e t C e l l = arg max S e R I n t p C ∈ MatchSet R u l e S e t C e l l | 1 2 S e R I n t p C · a n t e c e d e n t · l e n g t h a max + S e R I n t p C · d e s c e n d a n t · l e n g t h d max * Conf D S e R I n t p C
其中, a max = max { S e R I n t p C · a n t e c e d e n t · l e n g t h | S e R I n t p C ∈ MatchSet R u l e S e t C e l l } , 表示匹配内插网格序列规则中最长前项包含的网格数; d max = max { S e R I n t p C · d e s c e n d a n t · l e n g t h | S e R I n t p C ∈ MatchSet R u l e S e t C e l l } , 表示匹配内插网格序列规则中最长后项包含的网格数。
2.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法,其特征在于,步骤3的具体过程为:
对于一个网格序列SeCID=(Cell1,Cell2,...,Celln),其包含的任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),如果空间不邻近,则需要在网格Celli和Cellj之间进行内插,内插的具体公式如下:
Intp Cell i Cell j · c o l = r o u n d ( Cell i · c o l + k × Cell j · c o l - Cell i · c o l m ) ,
Intp Cell i Cell j · r o w = r o u n d ( Cell i · r o w + k × Cell j · r o w - Cell i · r o w m ) ,
其中, 分别表示内插网格的列号、行号,round()是四舍五入函数,是向下取整的函数,生成的内插网格序列为 SeIntpC I D = ( Cell 1 , Cell 2 , ... , Cell i , Intp Cell i Cell j , Cell j , Cell j + 1 , ... , Cell n ) .
3.根据权利要求2所述基于内插网格序列规则的移动对象位置预测方法,其特征在于:对于一个网格序列SeCID=(Cell1,Cell2,...,Celln),其包含的任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),如果空间不邻近,就是不满足条件:(0≤|Celli·col-Cellj·col|≤1)∧(0≤|Celli·row-Cellj·row|≤1)。
4.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法,其特征在于:步骤4中的支持度阈值α=30%。
5.根据权利要求1所述基于内插网格序列规则的移动对象位置预测方法,其特征在于:步骤8中的置信度阈值β=40%。
CN201510606759.9A 2015-09-22 2015-09-22 基于内插网格序列规则的移动对象位置预测方法 Active CN105184088B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510606759.9A CN105184088B (zh) 2015-09-22 2015-09-22 基于内插网格序列规则的移动对象位置预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510606759.9A CN105184088B (zh) 2015-09-22 2015-09-22 基于内插网格序列规则的移动对象位置预测方法

Publications (2)

Publication Number Publication Date
CN105184088A true CN105184088A (zh) 2015-12-23
CN105184088B CN105184088B (zh) 2017-11-07

Family

ID=54906165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510606759.9A Active CN105184088B (zh) 2015-09-22 2015-09-22 基于内插网格序列规则的移动对象位置预测方法

Country Status (1)

Country Link
CN (1) CN105184088B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120265391A1 (en) * 2009-06-18 2012-10-18 Michael Todd Letsky Method for establishing a desired area of confinement for an autonomous robot and autonomous robot implementing a control system for executing the same
US8467990B2 (en) * 2011-01-18 2013-06-18 Xerox Corporation Method for setting the geolocation of a non-GPS enabled device
WO2013020070A3 (en) * 2011-08-03 2013-07-11 Stc, Inc. Light rail vehicle monitoring and stop bar overrun system
CN103929804A (zh) * 2014-03-20 2014-07-16 南京邮电大学 一种基于用户移动规则的位置预测方法
CN104091349A (zh) * 2014-06-17 2014-10-08 南京邮电大学 基于支持向量机的鲁棒目标跟踪方法
CN104182638A (zh) * 2014-08-25 2014-12-03 南京邮电大学 一种基于模糊建模的目标定位方法
CN104299243A (zh) * 2014-09-28 2015-01-21 南京邮电大学 一种基于霍夫森林的目标跟踪方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120265391A1 (en) * 2009-06-18 2012-10-18 Michael Todd Letsky Method for establishing a desired area of confinement for an autonomous robot and autonomous robot implementing a control system for executing the same
US8467990B2 (en) * 2011-01-18 2013-06-18 Xerox Corporation Method for setting the geolocation of a non-GPS enabled device
WO2013020070A3 (en) * 2011-08-03 2013-07-11 Stc, Inc. Light rail vehicle monitoring and stop bar overrun system
CN103929804A (zh) * 2014-03-20 2014-07-16 南京邮电大学 一种基于用户移动规则的位置预测方法
CN104091349A (zh) * 2014-06-17 2014-10-08 南京邮电大学 基于支持向量机的鲁棒目标跟踪方法
CN104182638A (zh) * 2014-08-25 2014-12-03 南京邮电大学 一种基于模糊建模的目标定位方法
CN104299243A (zh) * 2014-09-28 2015-01-21 南京邮电大学 一种基于霍夫森林的目标跟踪方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RONG JIAN ET AL;: "《A hybrid neural network-based IE and IMM architecture for target tracking》", 《2008 WORKSHOP ON POWER ELECTRONICS AND INTELLIGENT TRANSPORTATION SYSTEM》 *
刘分 等;: "《基于移动网络位置信息的群体发现方法》", 《计算机应用研究》 *
张海涛 等;: "《匿名集序列规则与转移概率矩阵的空间预测和实验》", 《地球信息科学》 *

Also Published As

Publication number Publication date
CN105184088B (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
Zhao et al. Predictive task assignment in spatial crowdsourcing: a data-driven approach
Ch et al. Streamflow forecasting by SVM with quantum behaved particle swarm optimization
Brentan et al. Hybrid SOM+ k-Means clustering to improve planning, operation and management in water distribution systems
CN103903430B (zh) 一种采用多源同构数据的行程时间动态融合预测方法
Niedermayer et al. Probabilistic nearest neighbor queries on uncertain moving object trajectories
CN107610464A (zh) 一种基于高斯混合时间序列模型的轨迹预测方法
Wang et al. Chaotic time series method combined with particle swarm optimization and trend adjustment for electricity demand forecasting
CN106408124B (zh) 一种面向数据稀疏环境下的移动路径混合预测方法
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN104239556A (zh) 基于密度聚类的自适应轨迹预测方法
CN104156984A (zh) 一种不均匀杂波环境下多目标跟踪的概率假设密度方法
Sudo et al. Particle filter for real-time human mobility prediction following unprecedented disaster
CN112556686B (zh) 可预测动态时空环境的最短时间路径规划方法
Unterluggauer et al. Short‐term load forecasting at electric vehicle charging sites using a multivariate multi‐step long short‐term memory: A case study from Finland
CN103759732A (zh) 一种角度信息辅助的集中式多传感器多假设跟踪方法
CN109241227A (zh) 基于stacking集成学习算法的时空数据预测建模方法
Wang et al. GraphTTE: Travel time estimation based on attention-spatiotemporal graphs
KR101846294B1 (ko) 기상 레이더 기반 강우중심 추적방법
Fu et al. Traffic safety oriented multi-intersection flow prediction based on transformer and cnn
Parnianifard et al. Hybrid metamodeling/metaheuristic assisted multi-transmitters placement planning
CN105184088A (zh) 基于内插网格序列规则的移动对象位置预测方法
Jawed et al. Gqformer: A multi-quantile generative transformer for time series forecasting
Gong et al. Forecasting urban traffic flow by SVR
Senouci et al. WSNs deployment framework based on the theory of belief functions
Prabha et al. A comprehensive insight towards pre-processing methodologies applied on GPS data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant