CN104242949B - 一种轨迹压缩及解压缩方法 - Google Patents
一种轨迹压缩及解压缩方法 Download PDFInfo
- Publication number
- CN104242949B CN104242949B CN201410455230.7A CN201410455230A CN104242949B CN 104242949 B CN104242949 B CN 104242949B CN 201410455230 A CN201410455230 A CN 201410455230A CN 104242949 B CN104242949 B CN 104242949B
- Authority
- CN
- China
- Prior art keywords
- fixed point
- track
- follow
- frequent
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007906 compression Methods 0.000 title claims abstract description 130
- 230000006835 compression Effects 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000006837 decompression Effects 0.000 title claims abstract description 19
- 230000033001 locomotion Effects 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种轨迹压缩方法,包括:S1、对待压缩的轨迹进行扫描,获得待压缩的轨迹中的定点;轨迹为一个运动物体在空间中运动所产生的路径,定点为轨迹的起点、路段交叉点或者终点;S2、查询预先配置的频繁后继表,判断定点在待压缩的轨迹中的后继定点是否为定点的最频繁后继定点;后继定点为定点相邻的下一个定点;若是,则执行步骤S3;S3、将最频繁后继定点用负数进行表示,获得定点与负数的集合,定点与负数的集合即为压缩轨迹。相应的,本发明还提供一种应用上述的轨迹压缩方法得到的压缩轨迹的解压缩方法。采用本发明实施例,能够利用轨迹特性来对轨迹进行高压缩率、高效率的无损压缩。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种轨迹压缩及解压缩方法。
背景技术
近几年来,大数据及其相关研究已经成为计算机界最热问题,并逐渐成为主流研究方向。人们开始意识到潜藏在数据中的信息带来的价值,并开始越来越重视对于数据的研究。而随着技术的发展,各种能够收集有价值数据的技术与相关装置设备也在不断产生。其中,非常典型的一类设备就是能够进行轨迹数据探测与收集的设备,如GPS(GlobalPositioning System,全球定位系统)、智能手机、RFID(Radio FrequencyIdentification,无线射频识别)标签等等。这种轨迹数据一般具有三个维度,即表示物体位置的经度、纬度,以及表示某个位置的时间点的时间戳。由于这些轨迹数据具有时间和空间的双重特性,也被称为时空数据。这些时空轨迹数据往往体现着不同实体的运动规律甚至行为模式,从这些规律中又能衍生出许多相关的研究,其潜在价值极高。
然而,时空轨迹数据的规模是很大的。以GPS全球定位系统为例,在定位技术高度发达的今时今日,生活中各个方面都可能需要定位或者导航,如驾驶车辆,旅游,寻物,甚至是简单的在某个不熟悉的地方约见。每天有无数来自于全球各地的导航、定位等服务请求,而这些服务请求都将会产生相应的时空轨迹数据。可见,时空轨迹数据的规模是巨大的。
如此巨大的数据规模必然会带来一些问题。具体来说,大规模增长速度快的轨迹数据带来的问题有三点。第一,巨大的数据量会极大地压榨有限的存储空间,使得时空轨迹数据存储成为一个难题。由于其每个轨迹点间的时间间隔较小,时空轨迹数据会产生大量的冗余数据,这些冗余会浪费大量的存储空间,并且增加I/O(Input/Output,输入输出端口)时间。例如,我们以10秒的时间间隔检测4000个运动物体的运动情况,如果不加以压缩,每天就会产生1GB的数据增量。而GPS服务产生的数据往往是涵盖范围极广的,物体数量远远超过千甚至万数量级,其数据增加速度十分可观。因此,存储问题是显而易见的。第二,对如此巨大规模的数据进行传输、查询等处理是昂贵且耗时的。将大规模数据通过蜂窝网络或者卫星网络进行传输会花费大量经费。第三,当轨迹数据规模过于巨大,从中提取有用信息等会变得非常困难,如分析运动模式。数据压缩可以大大减少提取有用信息的时间。因此,对时空数据轨迹进行压缩是十分必要的。
时空轨迹数据压缩也是建立运动实体数据库数据管理的关键部分。然而,基于信息论的传统压缩方法虽然是无损压缩,但会将时空数据与其他数据同等对待,即使用同样的压缩方法。这种压缩方法未考虑时空轨迹数据的特殊性质,必然无法达到最好效果。并且,压缩后的数据不可使用,如需要对压缩后的数据进行进一步分析则必须解压整个文件,对于巨大的时空数据来说,解压整个文件需要消耗很多时间和计算资源。并且,许多的轨迹压缩算法都是基于轨迹点的删除,实际上是有损压缩,压缩后便无法还原成原始数据,从而导致算法的错误或压缩过程中的误删都会对之后的数据分析有很大影响。
发明内容
本发明实施例提出一种轨迹压缩及解压缩方法,能够利用轨迹特性来对轨迹进行高压缩率、高效率的无损压缩。
本发明实施例提供一种轨迹压缩方法,包括:
S1、对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一个运动物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终点;
S2、查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定点是否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若是,则执行步骤S3;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系;
S3、将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
进一步地,所述步骤S3具体包括:
S31、计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用负数进行表示;所述负数的绝对值为n;
S32、获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
相应地,本发明实施例还提供一种应用上述的轨迹压缩方法得到的压缩轨迹的解压缩方法,包括:
S01、对压缩轨迹进行扫描,获得所述压缩轨迹中的定点和负数;
S02、根据所述定点和频繁后继表,将所述负数还原为最频繁后继定点;
S03、获得所述定点和所述最频繁后继定点的集合,所述定点和所述最频繁后继定点的集合即为压缩前的轨迹。
进一步地,所述步骤S01具体包括:
根据所述定点和频繁后继表,将所述负数还原为连续出现的m个最频繁后继定点;m为所述负数的绝对值。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的轨迹压缩及解压缩方法能够利用轨迹的特性,将轨迹表示为独立定点的集合,通过对每个定点的最频繁后继定点进行压缩来完成轨迹的压缩,不会由于压缩对原数据产生损伤,最大程度地保持了数据的完整性、真实性;通过建立的频繁后继表,对轨迹中的定点进行快速压缩,具有高压缩率、高效率和高实用性;根据定点和定点的前定点来确定轨迹的运动方向,从而更加明确该定点的最频繁后继定点,使数据具有更好的压缩率和可用性;采用霍夫曼编码算法,对轨迹进行进一步地的压缩,同时达到无损压缩的目的;压缩后的轨迹仍为可读的文本文件,而并非二进制文件,从而可实现对压缩后的轨迹进行查询和分析;轨迹为定点集合,可根据定点的经纬度信息对轨迹的数据进行快速、准确的局部还原分析,无需解压整个压缩文件。
附图说明
图1是本发明提供的轨迹压缩方法的一个实施例的流程示意图;
图2是本发明提供的轨迹压缩方法中的路网轨迹的一个实施例的示意图;
图3是本发明提供的轨迹压缩方法中的路网轨迹的另一个实施例的示意图;
图4是本发明提供的解压缩方法的一个实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的轨迹压缩方法的一个实施例的流程示意图,包括步骤S1至步骤S3,具体如下:
S1、对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一个运动物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终点。
S2、查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定点是否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若是,则执行步骤S3;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系。
S3、将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
对待压缩轨迹中的定点逐一进行扫描,将每一个定点的后继定点与频繁后继表进行匹配,从而判断该定点的后继定点是否为该定点的最频繁后继定点,若是,则将最频繁后继定点用负数进行表示,若不是,则保留该后继定点。
进一步地,所述步骤S3具体包括:
S31、计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用负数进行表示;所述负数的绝对值为n;
S32、获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
在完成待压缩轨迹中的所有定点的扫描后,计算待压缩轨迹中的连续出现最频繁后继定点的个数n。若只出现一个最频繁后继定点,即n=1,则用-1来代替该最频繁后继定点;若连续出现多个最频繁后继定点,即n>1,则用n的相反数来代替连续出现的多个最频繁后继定点。
进一步地,在所述步骤S1之前还包括步骤S101至步骤S103,具体如下:
S101、将路网中的轨迹用定点的集合来表示。
需要说明的是,轨迹是用一系列的定点来进行表示的,且一系列的定点是按照轨迹运行的方向来排列的,即集合中的第一个定点为轨迹的起点,最后一个定点为轨迹的终点,中间部分的定点为轨迹依次经过的路段交叉点。
S102、对路网中所有轨迹进行扫描,获得所有轨迹中的定点。
S103、根据所有轨迹中的定点,建立频繁后继表。
在一个优选地实施方式中,所述根据所有轨迹中的定点,建立频繁后继表,具体包括:
统计每个定点的所有后继定点出现的频率,将每个定点和每个定点的最频繁后继定点的对应关系保存在频繁后继表中;所述最频繁后继定点为在定点的所有后继定点中出现频率最高的后继定点。
在某个路网中,一个定点必有若干相邻定点与它相连,在任意轨迹中,一个定点的后继定点为其相邻定点之一。而路网中轨迹具有周期性,如每天上下班车辆的轨迹,每天的轨迹是很相似的。因此,一些定点的使用必然比其他定点的使用频率高,如城市主干道中的定点。通过对路网中所有轨迹的定点进行扫描,统计出定点的最频繁后继定点。对于单向路段中的定点来说,一个定点具有唯一的最频繁后继定点。
下面基于图2所示的路网中的单向路段的轨迹,对本发明实施例提供的轨迹压缩方法进行详细描述。
如图2所示,当路网中具有3条轨迹T1、T2和T3时,对3条轨迹T1、T2和T3的压缩流程如下:
S201、根据定点的经纬度信息,对路网中的所有定点进行编号,如P1、P2……Pn。
S202、将轨迹T1、T2和T3用定点的集合进行表示,则T1=(P1,P2,P3,P6),T2=(P1,P2,P5),T3=(P4,P2,P5)。
S203、对轨迹T1、T2和T3进行扫描,获得轨迹T1、T2和T3中的所有定点P1、P2、P3、P4、P5和P6。
S204、统计每个定点的所有后继定点出现的频率,获得每个定点的最频繁后继定点。
在轨迹T1、T2和T3中,定点P2的后继定点P3出现次数为1,后继定点P5出现次数为2,则后继定点P5为定点P2的最频繁后继定点。同理,P1的最频繁后继定点为P2,P3的最频繁后继定点为P6,P4的最频繁后继定点为P2。将每个定点和每个定点的最频繁后继定点的对应关系保存在频繁后继表中,如表1:
定点 | 最频繁后继定点 |
P1 | P2 |
P2 | P5 |
P3 | P6 |
P4 | P2 |
表1
S205、对待压缩的轨迹T1、T2和T3分别进行扫描,获得待压缩轨迹中的定点。
S206、在表1中查询定点的最频繁后继定点,并与该定点在待压缩轨迹中的后继定点进行对照,判断该后继定点是否为最频繁后继定点。
通过查询可知,在轨迹T1中,P2为P1最频繁后继定点,P6为P3的最频繁后继定点。在轨迹T2中,P2为P1最频繁后继定点,P5为P2的最频繁后继定点。在轨迹T3中,P2为P4最频繁后继定点,P5为P2的最频繁后继定点。
S207、将最频繁后继定点用负数进行替换,即可获得压缩轨迹。
在轨迹中,若只连续出现一个最频繁后继定点,用负数-1代替该最频繁后继定点。如在轨迹T1中,P2为P1的最频繁后继定点,而P3不是P2的最频繁后继定点,则轨迹T1的压缩轨迹T’1=(P1,-1,P3,-1)。若连续出现n个最频繁后继定点,n>1,则用n的相反数来代替连续出现的最频繁后继定点。如在轨迹T2中,P2为P1的最频繁后继定点,P5为P2的最频繁后继定点,则轨迹T2的压缩轨迹T’2=(P1,-2)。同理,轨迹T3的压缩轨迹T’3=(P4,-2)。
在另一个优选地实施方式中,所述根据所有轨迹中的定点,建立频繁后继表,具体包括:
统计每个定点在具有相同前定点时的所有后继定点出现的频率,将每个定点和每个定点在具有相同前定点时的最频繁后继定点的对应关系保存在频繁后继表中;所述前定点为所述定点相邻的前一个定点。
现在路网中的许多路段具有双向性,即同一条路段具有两个相反的行驶方向,如双向分隔行驶的公路。而对于同一路段的双向轨迹具有相近的运动概率,因此,对于双向轨迹中的定点,需要先确定定点的前定点,获得轨迹的运动方向,即在所有轨迹中,具有相同定点及相同前定点的轨迹,其运动方向是相同的。对于双向路段中的定点来说,定点可能会出现两个最频繁后继定点。因此,需要确定轨迹的运动方向,先统计定点在相同轨迹方向的最频繁后继定点,再统计定点在不同轨迹方向的最频繁后继定点。
下面基于图3所示的路网中的双向路段的轨迹,对本发明实施例提供的轨迹压缩方法进行详细描述。
如图3所示,当路网中具有两条轨迹T4和T5时,对两条轨迹T4和T5的压缩流程如下:
S301、根据定点的经纬度信息,对路网中的所有定点进行编号,如P7、P8……Pn。
S202、将轨迹T4和T5用定点的集合进行表示,其中,T4和T5为路段相同方向相反的轨迹,则T4=(P7,P8,P9,P10)T5=(P10,P9,P8,P7)。
S203、对轨迹T4和T5进行扫描,获得轨迹T4和T5中的所有定点P7、P8、P9和P10。
S204、统计每个定点在具有相同前定点时的所有后继定点出现的频率,获得每个定点在具有相同前定点时的最频繁后继定点。
在轨迹T4和T5中,定点P8在前定点为P7时,最频繁后继定点为P9,定点P8在前定点为P9时,最频繁后继定点为P7。定点P9在前定点为P8时,最频繁后继定点为P10,定点P9在前定点为P10时,最频繁后继定点为P8。将每个定点,每个定点的前定点和每个定点的最频繁后继定点的对应关系保存在频繁后继表中,如表2:
(前定点,定点) | 最频繁后继定点 |
(P7,P8) | P9 |
(P8,P9) | P10 |
(P10,P9) | P8 |
(P9,P8) | P7 |
表2
S205、对待压缩的轨迹T4和T5分别进行扫描,获得待压缩轨迹中的定点。
S206、根据定点和定点的前定点,在表2中查询定点的最频繁后继定点,并与该定点在待压缩轨迹中的后继定点进行对照,判断该后继定点是否为最频繁后继定点。
通过查询可知,在轨迹T4中,当P8的前定点为P7时,P9为P8最频繁后继定点,当P9的前定点为P8时,P10为P9的最频繁后继定点。在轨迹T5中,当P9的前定点为P10时,P8为P9最频繁后继定点,当P8的前定点为P9时,P7为P8的最频繁后继定点。
具体地,所述定点的集合具体S207、将最频繁后继定点用负数进行替换,即可获得压缩轨迹。
其中,若只连续出现一个最频繁后继定点,用负数-1代替该最频繁后继定点。若连续出现n个最频繁后继定点,n>1,则用n的相反数来代替连续出现的最频繁后继定点。如在轨迹T4中,P9为P8的最频繁后继定点,P10为P9的最频繁后继定点,则轨迹T4的压缩轨迹T’4=(P7,P8,-2)。同理,轨迹T5的压缩轨迹T’5=(P10,P9,-2)。
为定点编号的集合,在所述步骤S1之前还包括:
根据定点的经纬度信息,对路网中的所有定点进行编号。
需要说明的是,每个定点对应一个经纬度信息,对每个定点进行编号,从而建立定点编号与定点经纬度信息的对应关系表。路网中的轨迹使用定点编号的集合来表示,而不使用定点经纬度信息的集合表示,大大减小了轨迹的信息量,便于轨迹的压缩,且便于压缩的并行操作。若需要查询轨迹的具体数据时,根据对应关系表,将轨迹中的编号还原为定点的经纬度信息,从而获得轨迹在路网中具体路段信息。
进一步地,在所述步骤S3之后还包括:
根据霍夫曼编码算法,对所述压缩轨迹进一步压缩,获得无损压缩轨迹。
采用霍夫曼编码算法,进一步压缩轨迹,同时达到无损压缩的目的。
在进行轨迹压缩后,将压缩轨迹的第一个定点和该压缩轨迹的第一个定点到最后一个定点的位移量保存在一个哈希表中,以方便进行查询。
相应地,参见图4,本发明实施例还提供一种应用上述轨迹压缩方法得到的压缩轨迹的解压缩方法,包括步骤S01至步骤S02,具体如下:
S01、对压缩轨迹进行扫描,获得所述压缩轨迹中的定点和负数;
S02、根据所述定点和频繁后继表,将所述负数还原为最频繁后继定点;
S03、获得所述定点和所述最频繁后继定点的集合,所述定点和所述最频繁后继定点的集合即为压缩前的轨迹。
压缩前的轨迹是由定点编号的集合组成,查询压缩过程中建立的定点编号与定点经纬度信息的对应关系表,即可将压缩前的轨迹还原为轨迹在路网中的具体数据信息。
进一步地,所述步骤S01具体包括:
根据所述定点和频繁后继表,将所述负数还原为连续出现的m个最频繁后继定点;m为所述负数的绝对值。
在一个优选地实施方式中,对于单向路段的压缩轨迹,先根据负数确定需要还原的最频繁后继定点的个数m,负数的绝对值即为m。然后,在频繁后继表中寻找与负数相邻的前一个定点的最频繁后继定点,再根据该最频繁后继定点在频繁后继表中寻找该最频繁后继定点的最频繁后继定点,直到找到m个最频繁后继定点,将负数还原为m个最频繁后继定点,即可获得压缩前的轨迹。
下面对路网中3条应用上述压缩轨迹方法得到的单向路段的压缩轨迹为例,详细说明本发明实施例提供的解压缩方法。
S401、对压缩轨迹T’1、T’2和T’3分别进行扫描,获得压缩轨迹中的定点和数字。其中,压缩轨迹T’1=(P1,-1,P3,-1),压缩轨迹T’2=(P1,-2),压缩轨迹T’3=(P4,-2)。
S402、根据压缩轨迹中的负数,确定该负数需还原的最频繁后继定点的个数m,m为负数的绝对值。根据负数的前定点和表1,对压缩轨迹T’1、T’2和T’3进行还原。
在压缩轨迹T’1中,第一个负数-1的前一个定点为P1,查询表1可知P1的最频繁后继定点为P2,因此,将第一个负数-1还原成定点P2。同理,将第二个负数-1还原成定点P6。因此,将压缩轨迹T’1还原成压缩前的轨迹T1=(P1,P2,P3,P6)。在压缩轨迹T’2中,负数-2表示该负数需还原成两(-2的绝对值)个最频繁后继定点。负数-2的前一个定点为P1,在表1中查找,P1的最频繁后继定点为P2,P2的最频繁后继定点为P5。因此,将负数-2还原成定点P2、P5。因此,将压缩轨迹T’2还原成压缩前的轨迹T2=(P1,P2,P5)。同理,将压缩轨迹T’3还原成压缩前的轨迹T3=(P4,P2,P5)。
S403、根据轨迹中定点的编号,将轨迹还原成定点的经纬度信息的集合。
在另一个实施方式中,对于双向路段的压缩轨迹,先根据负数确定需要还原的最频繁后继定点的个数m,负数的绝对值即为m。然后根据负数相邻的前两个定点在频繁后继表中寻找负数的前定点的最频繁后继定点,其中,负数的前定点为负数相邻的前一个定点。再根据负数的前定点和该最频繁后继定点在频繁后继表中寻找该最频繁后继定点的最频繁后继定点,直到找到m个最频繁后继定点为止,从而将负数还原为m个最频繁后继定点,获得压缩前的轨迹。
下面对路网中两条应用上述压缩轨迹方法得到的双向路段的压缩轨迹为例,详细说明本发明实施例提供的解压缩方法。
S501、对压缩轨迹T’4和T’5分别进行扫描,获得压缩轨迹中的定点和数字。其中,压缩轨迹T’4=(P7,P8,-2),压缩轨迹T’5(P10,P9,-2)。
S502、根据压缩轨迹中的负数,确定该负数需还原的最频繁后继定点的个数m,m为负数的绝对值。根据负数相邻的前两个定点和表1,对压缩轨迹T’4、和T’5进行还原。
在压缩轨迹T’4中,在压缩轨迹T’4中,负数-2表示该负数需还原成两个,即-2的绝对值,最频繁后继定点。负数-2的前两个定点为P7,P8,在表2中查找,当P8的前定点为P7时,P8的最频繁后继定点为P9,当P9的前定点为P8时,P9的最频繁后继定点为P10。因此,将负数-2还原成定点P9、P10。因此,将压缩轨迹T’4还原成压缩前的轨迹T4=(P7,P8,P9,P10)。同理,将压缩轨迹T’5还原成压缩前的轨迹T5=(P10,P9,P8,P7)。
S503、根据轨迹中定点的编号,将轨迹还原成定点的经纬度信息的集合。
进一步地,所述步骤S01之前还包括:
根据霍夫曼解码算法,对无损压缩轨迹进行解码,获得压缩轨迹;所述无损压缩轨迹是根据霍夫曼编码算法对压缩轨迹进行进一步压缩而得到的。
在轨迹压缩过程中,根据霍夫曼编码算法,对压缩轨迹进行实现进一步压缩,获得无损压缩轨迹。相应的,在解压过程中,需先根据霍夫曼解码算法,对无损压缩轨迹进行解码,获得压缩轨迹。
需要说明的是,本发明实施例提供的轨迹压缩及解压缩方法还可应用于时空轨迹数据的压缩及解压缩。将时空轨迹数据中的空间信息和时间信息分别进行独立的压缩及解压缩。其中,空间信息采用本发明实施例提供的轨迹压缩及解压缩方法,时间信息采用现有的时间序列压缩及解压缩方法,这里不再进行详细描述。
本发明实施例提供的轨迹压缩及解压缩方法能够利用轨迹的特性,将轨迹表示为独立定点的集合,通过对每个定点的最频繁后继定点进行压缩来完成轨迹的压缩,不会由于压缩对原数据产生损伤,最大程度地保持了数据的完整性、真实性;通过建立的频繁后继表,对轨迹中的定点进行快速压缩,具有高压缩率、高效率和高实用性;根据定点和定点的前定点来确定轨迹的运动方向,从而更加明确该定点的最频繁后继定点,使数据具有更好的压缩率和可用性;采用霍夫曼编码算法,对轨迹进行进一步地的压缩,同时达到无损压缩的目的;压缩后的轨迹仍为可读的文本文件,而并非二进制文件,从而可实现对压缩后的轨迹进行查询和分析;轨迹为定点集合,可根据定点的经纬度信息对轨迹的数据进行快速、准确局部还原分析,无需解压整个压缩文件。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种轨迹压缩方法,其特征在于,包括:
S1、对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一个运动物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终点;
S2、查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定点是否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若是,则执行步骤S3;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系;若否,则保留所述后继定点;
S3、将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
2.如权利要求1所述的轨迹压缩方法,其特征在于,所述步骤S3具体包括:
S31、计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用负数进行表示;所述负数的绝对值为n;
S32、获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
3.如权利要求1所述的轨迹压缩方法,其特征在于,在所述步骤S1之前还包括:
将路网中的轨迹用定点的集合来表示;
对路网中所有轨迹进行扫描,获得所有轨迹中的定点;
根据所有轨迹中的定点,建立频繁后继表。
4.如权利要求3所述的轨迹压缩方法,其特征在于,所述根据所有轨迹中的定点,建立频繁后继表,具体包括:
统计每个定点的所有后继定点出现的频率,将每个定点和每个定点的最频繁后继定点的对应关系保存在频繁后继表中;所述最频繁后继定点为在定点的所有后继定点中出现频率最高的后继定点。
5.如权利要求3所述的轨迹压缩方法,其特征在于,所述根据所有轨迹中的定点,建立频繁后继表,具体包括:
统计每个定点在具有相同前定点时的所有后继定点出现的频率,将每个定点和每个定点在具有相同前定点时的最频繁后继定点的对应关系保存在频繁后继表中;所述前定点为所述定点相邻的前一个定点。
6.如权利要求3至5任一项所述的轨迹压缩方法,其特征在于,所述定点的集合具体为定点编号的集合,在所述步骤S1之前还包括:
根据定点的经纬度信息,对路网中的所有定点进行编号。
7.如权利要求1所述的轨迹压缩方法,其特征在于,在所述步骤S3之后还包括:
根据霍夫曼编码算法,对所述压缩轨迹进一步压缩,获得无损压缩轨迹。
8.一种应用如权利要求1至6任一项所述的轨迹压缩方法得到的压缩轨迹的解压缩方法,其特征在于,包括:
S01、对压缩轨迹进行扫描,获得所述压缩轨迹中的定点和负数;
S02、根据所述定点和频繁后继表,将所述负数还原为最频繁后继定点;
S03、获得所述定点和所述最频繁后继定点的集合,所述定点和所述最频繁后继定点的集合即为压缩前的轨迹。
9.如权利要求8所述的解压缩方法,其特征在于,所述步骤S02具体包括:
根据所述定点和频繁后继表,将所述负数还原为连续出现的m个最频繁后继定点;m为所述负数的绝对值。
10.如权利要求8所述的解压缩方法,其特征在于,在所述步骤S01之前还包括:
根据霍夫曼解码算法,对无损压缩轨迹进行解码,获得压缩轨迹;所述无损压缩轨迹是根据霍夫曼编码算法对压缩轨迹进行进一步压缩而得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410455230.7A CN104242949B (zh) | 2014-09-09 | 2014-09-09 | 一种轨迹压缩及解压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410455230.7A CN104242949B (zh) | 2014-09-09 | 2014-09-09 | 一种轨迹压缩及解压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104242949A CN104242949A (zh) | 2014-12-24 |
CN104242949B true CN104242949B (zh) | 2017-11-14 |
Family
ID=52230409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410455230.7A Expired - Fee Related CN104242949B (zh) | 2014-09-09 | 2014-09-09 | 一种轨迹压缩及解压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104242949B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106253909B (zh) * | 2016-09-11 | 2020-07-03 | 复旦大学 | 一种路网轨迹的无损压缩方法 |
CN108259463B (zh) * | 2017-12-05 | 2020-08-14 | 北京掌行通信息技术有限公司 | 一种定位轨迹与行驶路径的融合压缩方法及系统 |
CN111046049B (zh) * | 2019-12-20 | 2021-10-26 | 西南交通大学 | 一种货车gps轨迹数据压缩方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102299718A (zh) * | 2010-06-25 | 2011-12-28 | 汉王科技股份有限公司 | 手写终端轨迹的压缩和解压方法 |
CN103795417A (zh) * | 2014-01-22 | 2014-05-14 | 复旦大学 | 一种最大误差可控的轨迹数据压缩方法 |
CN103795418A (zh) * | 2014-01-22 | 2014-05-14 | 复旦大学 | 一种路网轨迹的无损压缩方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10288433B2 (en) * | 2010-02-25 | 2019-05-14 | Microsoft Technology Licensing, Llc | Map-matching for low-sampling-rate GPS trajectories |
-
2014
- 2014-09-09 CN CN201410455230.7A patent/CN104242949B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102299718A (zh) * | 2010-06-25 | 2011-12-28 | 汉王科技股份有限公司 | 手写终端轨迹的压缩和解压方法 |
CN103795417A (zh) * | 2014-01-22 | 2014-05-14 | 复旦大学 | 一种最大误差可控的轨迹数据压缩方法 |
CN103795418A (zh) * | 2014-01-22 | 2014-05-14 | 复旦大学 | 一种路网轨迹的无损压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104242949A (zh) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Muckell et al. | SQUISH: an online approach for GPS trajectory compression | |
US8976266B2 (en) | Picture locating method and system based on navigation function of mobile terminal | |
Kellaris et al. | Map-matched trajectory compression | |
CN100461178C (zh) | 范围查询和数据流处理的方法和设备 | |
CN104965913A (zh) | 一种基于gps地理位置数据挖掘的用户分类方法 | |
KR101909365B1 (ko) | 내비게이션 시스템의 노선 플래닝 방법, 장치 및 저장 매체 | |
CN111209261B (zh) | 基于信令大数据的用户出行轨迹提取方法和系统 | |
CN104242949B (zh) | 一种轨迹压缩及解压缩方法 | |
Nurmi et al. | Identifying meaningful places: The non-parametric way | |
CN104182475B (zh) | 一种基于掩码技术和剖分编码的位置信息快速检索方法 | |
CN106454729A (zh) | 一种城市轨道交通站点选址规划方法和装置 | |
KR20110091763A (ko) | 특징 디스크립터를 표현하고 식별하는 방법, 장치 및 컴퓨터 판독가능 저장 매체 | |
CN109286399B (zh) | 基于lzw算法的gps轨迹数据的压缩方法 | |
CN109741209B (zh) | 台风灾害下配电网多源数据融合方法、系统及存储介质 | |
CN103729478A (zh) | 基于MapReduce的LBS兴趣点发现方法 | |
CN107133236A (zh) | 地理位置轨迹优化的方法和装置 | |
JP2014132711A (ja) | 複数の測位方式に基づく移動端末の位置情報から対象エリアを特定するエリア管理サーバ、プログラム及び方法 | |
Kellaris et al. | Trajectory compression under network constraints | |
CN111294742A (zh) | 基于信令cdr数据识别伴随手机号码的方法与系统 | |
CN104320848B (zh) | 基于云计算实现室内定位的系统及方法 | |
CN103795418A (zh) | 一种路网轨迹的无损压缩方法 | |
Zhang et al. | Transfer learning-based outdoor position recovery with cellular data | |
CN117216038A (zh) | 资产数据管理系统 | |
CN110933662B (zh) | 一种基于数据挖掘的时空伴随关系分析方法和系统 | |
CN103929804A (zh) | 一种基于用户移动规则的位置预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C53 | Correction of patent of invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Tan Haoyu Inventor after: Gao Min Inventor after: Ding Ye Inventor after: Ni Mingxuan Inventor before: Tan Haoyu Inventor before: Gao Min Inventor before: Ding Ye |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: TAN HAOYU GAO MIN DING YE TO: TAN HAOYU GAO MIN DING YE NI MINGXUAN |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20171114 |