CN108257379B - 一种车辆行驶路径的压缩存储方法及系统 - Google Patents

一种车辆行驶路径的压缩存储方法及系统 Download PDF

Info

Publication number
CN108257379B
CN108257379B CN201711268791.6A CN201711268791A CN108257379B CN 108257379 B CN108257379 B CN 108257379B CN 201711268791 A CN201711268791 A CN 201711268791A CN 108257379 B CN108257379 B CN 108257379B
Authority
CN
China
Prior art keywords
section
road section
downstream
compression
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711268791.6A
Other languages
English (en)
Other versions
CN108257379A (zh
Inventor
郭胜敏
韩兴广
马法进
夏曙东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING PALMGO INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING PALMGO INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING PALMGO INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING PALMGO INFORMATION TECHNOLOGY Co Ltd
Priority to CN201711268791.6A priority Critical patent/CN108257379B/zh
Publication of CN108257379A publication Critical patent/CN108257379A/zh
Application granted granted Critical
Publication of CN108257379B publication Critical patent/CN108257379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/50Conversion to or from non-linear codes, e.g. companding

Landscapes

  • Physics & Mathematics (AREA)
  • Nonlinear Science (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

本发明提供了一种车辆行驶路径的压缩存储方法及系统,基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的ID表达为全局ID和局部ID的组合;对所述组合进行压缩存储。所述每个下游路段的局部ID的计算方法为:计算每个下游路段相对于其上游路段的向量夹角;对所述向量夹角从小到大进行排序,所述局部ID的值为所述向量夹角在序列中的顺序值;或者从每个下游路段的所述ID的后段提取一定长度的子串作为所述每个下游路段的局部ID。本发明不需要对路网热度进行统计,也不需要对路网既有的ID体系进行霍夫曼编码改造,技术实现难度降低;采用全局+局部的LinkId表达体系,比全局唯一的霍夫曼编码体系,其压缩效率更高。

Description

一种车辆行驶路径的压缩存储方法及系统
技术领域
本发明涉及一种计算机技术和智能交通领域,尤其是涉及一种车辆行驶路径的压缩存储方法。
背景技术
随着智能手机等移动位置终端的普及,涌现出大量的基于位置的服务(Location-Based Service,LBS),例如手机地图、手机导航、共享出行等。上述服务基于用户上传的位置,提供针对性和个性化的服务,已经具备广泛的用户基础,并积累了大量的用户位置数据。基于海量的移动位置数据,可以从宏观、中观和微观不同维度,对大到国家、城市、小到行业、家庭、个人等方方面面进行精细化地描述和分析,对发现社会问题,提升社会运行的效能,等等,都具有重要的意义。
移动位置数据时时刻刻都在产生,其采集、存储、计算都面临极大的资源损耗,学术界和工业界也一直在探索对移动位置数据进行高效组织的方法。一般而言,作为移动位置生成的主体,车辆和人的运动要受到路网的约束,一个很直接的想法是将无限变化的、离散的位置点坐标映射到有限的路网拓扑序列上,从而提取出移动实体的行驶路径。
移动位置主体在某一时段内采集的位置数据定义为:
其中,唯一标识了一个移动位置实体,N是其在时段内采集的移动位置个数;移动位置数据由N个位置点构成,每个位置点采集的属性包括时刻和位置坐标其中1≤j≤N。
如图1所示,是两个移动位置实体,其采集的位置点序列分别为
移动位置采样存在位置漂移、采样间隔大等问题,例如,映射到路网上的位置比较近,但由于漂移,其采集的位置却相差较远;由于采样间隔大,虽然途经了e1→e7,但与e1和e7都有较大的差异。
基于地图匹配(map matching)操作,将移动位置数据映射到路网上后,可以提取出移动实体的行驶路径,如图1所示,的行驶路径为e1→e7→e8→e9的行驶路径为e4→e7→e8→e3,可以看到它们共同经过了e7→e8
可以看到,基于路网的规约,Map Matching操作将离散的位置信息映射到行驶路径中,得到的行驶路径可以进一步作为轨迹聚类、OD分析、流量分析等数据挖掘作业的基础。
目前,最新的移动位置数据压缩算法都应用了路网的辅助信息。例如,数据库领域顶级学术会议VLDB 2014年发表了一篇名为“PRESS:A Novel Framework of TrajectoryCompression in Road Networks”的论文,提出了一种基于路网辅助的移动位置数据进行压缩框架,其核心思想如下:
1)基于Map Matching操作,将移动位置点映射到路网上,获取移动实体的行驶路径;
2)位置点的信息用偏移量来表达,如图1中,已知的行驶路径是e1→e7→e8→e9,设在路网上的匹配点分别是则用在路径上的行驶偏移量来推算的位置;
3)对行驶路径进行压缩,其基本思路类似于信息压缩的霍夫曼编码,先统计热度比较高的路径,如图1中,e7→e8有2个移动实体经过,其热度高于e6→e3,则对e7和e8用短的ID表达,e6和e3用长的ID表达。
上述VLDB 2014论文借鉴霍夫曼编码的思想,对Link序的热度进行评估,将热度比较大的Link用字符长度短的Id来替换,从而整体减少行驶路径表达的存储容量。但是,这种方法在实现上存在一定的难度:1)需要大量的数据来提前训练路径的热度;2)即使采用霍夫曼编码思想,其LinkId体系依旧是全局唯一的,因此,压缩效率存在一定限制。
发明内容
为解决以上技术问题,鉴于移动实体的行驶路径在移动位置数据压缩和数据挖掘中的重要作用,本发明重点解决行驶路径的表达和压缩问题。本发明基于路网拓扑在上下游关系上的紧耦合特性,在路径表达上设计了一套全局+局部的LinkId表达体系,进而进行压缩编码,提高了压缩效率。
具体的,根据本发明的一个方面,提供了一种车辆行驶路径的压缩存储方法,包括:
基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
对所述组合进行压缩存储。
优选的,所述每个下游路段的局部ID的计算方法为:
计算每个下游路段相对于其上游路段的向量夹角;
对所述向量夹角从小到大进行排序,所述局部ID的值为所述向量夹角在序列中的顺序值。
更优选的,当两条下游路段的所述向量夹角的值相等时,计算每个下游路段相对于其上游路段的顺时针旋转角度,按照所述顺时针旋转角度的大小决定所述局部ID的值。
更优选的,当所述局部ID的值为N个连续的1序列时,用[N]来替代N个连续的1序列。
优选的,所述每个下游路段的局部ID的计算方法为:
从每个下游路段的路段ID的后段提取长度为m的子串,从1开始逐步扩大m的值,直到所述子串中没有重复元素,则取该子串作为所述每个下游路段的局部ID。
根据本发明的另一个方面,还提供了一种车辆行驶路径的压缩存储系统,包括顺序连接的如下模块:
ID表达模块,基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
压缩模块,用于对所述组合进行压缩存储。
本发明的优点在于:本发明不需要对路网热度进行统计,也不需要对路网既有的ID体系进行霍夫曼编码改造,技术实现难度降低;采用全局+局部的LinkId表达体系,比全局唯一的霍夫曼编码体系,其压缩效率更高。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是现有技术中移动位置数据、路网及移动位置数据映射道路网上形成行驶路径的示意图;
图2是本发明路段及后继路段的示意图。
图3为本发明的车辆行驶路径的压缩存储方法流程图;
图4为本发明的车辆行驶路径的压缩存储系统结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
行驶路径由一系列拓扑相连的路段(Link)组成,在路网中,路段由路段ID(本发明称LinkId)唯一进行标识。在全国路网有成百上千万的路段,为了对路段进行唯一表达,主流的图商一般LinkId的长度由13个字符表达,如果用完整的LinkId序来表达行驶路径,其存储容量必然难以承受。因此,基于路网的先验辅助知识,来减少LinkId的字符长度,则成为行驶路径表达和压缩的关键。
如图3所示,本发明的一种车辆行驶路径的压缩存储方法,包括如下步骤:
S1、基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的路段ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
S2、对所述组合进行压缩存储。
对应的,如图4所示,本发明的一种车辆行驶路径的压缩存储系统,包括顺序连接的如下模块:
ID表达模块101,基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的路段ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
压缩模块102,用于对所述组合进行压缩存储。
以下具体介绍本发明的压缩存储原理:
对于一幅给定的路网,其上下游之间的路段拓扑关系是一个受限的紧耦合关系。因此,本发明基于上下游之间的路段拓扑关系定义局部LinkId表达体系。
如图2所示,e1的后继路段有e2、e3和e43条,在已知e1的情况下,则可以通过e1+Δ(e1,e4)来表达e4;同理,e6可以用e4+Δ(e4,e6)来表达,进一步可以用e1+Δ(e1,e4)+Δ(e4,e6)来表达。其中,e1是全局的LinkId,Δ(e1,e4)和Δ(e4,e6)是一个局部的LinkId。
为不失一般性,设移动实体的行驶路径是e1→e4→e6,基于上述全局+局部的Link表达体系,则可以表达为:
e1→e1+Δ(e1,e4)→e1+Δ(e1,e4)+Δ(e4,e6);
去除重复项,可进一步压缩表达为:
e1→Δ(e1,e4)→Δ(e4,e6)。
在路网中,对于给定一条路段ei,其后继路段的数目为J,对于任意一条其后继路段1≤j≤J,由于后继路段的数目J有限,因此可以用非常短的字符表达。
本发明提供两类方法,但不限于这些方法来计算
1)基于角度的方法
定义路段的ei角度为θ(ei),其计算方法为ei的起点和终点的向量角,该向量角的表达方式为:以正北为0度,顺时针旋转0~360度;
计算每一条后继路段1≤j≤J与ei的顺时针旋转角度,计算方法为:
计算每一条后继路段1≤j≤J与ei的向量夹角,计算方法为:
1≤j≤J从小到大进行排序,的值为在序列中的顺序值。
对于出现值相等的情况,设则按照的大小顺序决定的值。如图2所示,θ(e1)=90,θ(e2)=0,θ(e3)=180,θ(e4)=90
有Γ(e1,e2)=90,Γ(e1,e3)=90,Γ(e1,e4)=0;
Θ(e1,e2)=270,Θ(e1,e3)=90,Θ(e1,e4)=0;
进而有Δ(e1,e2)=3,Δ(e1,e3)=2,Δ(e1,e4)=1;
同理有Δ(e4,e5)=2,Δ(e4,e6)=1
一般而言,一条路段的后继路段不会超过5条,所以用1个字符就可以表达;
例如,图2中,e1→e4→e6简化为e1→1→1,第2条路段往后每一条路段的存储量仅为原先的1/13。
从e1→1→1还原为e1→e4→e6仅执行简单的逆过程就可以了。
进一步地,考虑到车辆的行驶轨迹一般前行(即按照最小的方向行驶)的概率最大,因此在轨迹中→1出现的次数是最多的,可以进一步对其进行压缩。
具体方法为,对连续出现的“→1”进行计数,设其连续出现的次数为τ,则用“[τ]”来替代τ个“→1”序列。
例如,不妨设轨迹为e1→1→1→1→1→1→1→2→1→1→1→1,则可以进一步压缩为:
e1→[6]→2→[4]。
2)基于Id子串的方法
对于路段ei的后继路段1≤j≤J,定义其LinkId为后段提取长度为m的子串定义为
逐步扩大m的值,直到提取1≤j≤J中没有重复元素,即可以唯一标识ei的每一条后继路段,设此时m的取值为L,则
举例说明,设e2、e3和e4的LinkId分别为5955260000223,5955360000005和5955360000003;
Sub-Id(e2,1)=3,Sub-Id(e3,1)=5,Sub-Id(e4,1)=3;
由于Sub-Id(e2,1)=Sub-Id(e4,1),则增加l的值到2;
取Sub-Id(e2,2)=23,Sub-Id(e3,2)=05,Sub-Id(e4,2)=03,所有的子LinkId都不相同,可以唯一标识一条后继路段。
则有,Δ(e1,e2)=23,Δ(e1,e3)=05,Δ(e1,e4)=03;
同理,可以通过简单的逆操作实现数据还原。
本发明仅给出基本的技术思路,不排除可以通过二进制存储等方法进一步实现数据的压缩。
本发明不仅可以用于行驶路径的表达和压缩,对于非行驶路径类的数据,基于路网构建出路径,亦可以对数据实现压缩。例如,实时路况数据,常规技术中每一条Link是独立表达的;但从路网的角度来看,上下游的路况信息是相似和相关的,可以基于路网拓扑,对相似和相关的路况构建成路径关系,按照本发明的方法进行表达,可以进一步降低数据量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种车辆行驶路径的压缩存储方法,包括:
基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的路段ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
对所述组合进行压缩存储;
所述每个下游路段的局部ID的计算方法为:
计算每个下游路段相对于其上游路段的向量夹角;
对所述向量夹角从小到大进行排序,所述局部ID的值为所述向量夹角在序列中的顺序值;或者
从每个下游路段的路段ID的后段提取长度为m的子串,从1开始逐步扩大m的值,直到所述子串中没有重复元素,则取该子串作为所述每个下游路段的局部ID。
2.根据权利要求1所述的车辆行驶路径的压缩存储方法,其特征在于:
当两条下游路段的所述向量夹角的值相等时,计算每个下游路段相对于其上游路段的顺时针旋转角度,按照所述顺时针旋转角度的大小决定所述局部ID的值。
3.根据权利要求1或2所述的车辆行驶路径的压缩存储方法,其特征在于:
当所述局部ID的值为N个连续的1序列时,用[N]来替代N个连续的1序列。
4.一种车辆行驶路径的压缩存储系统,包括顺序连接的如下模块:
ID表达模块,基于上下游之间的路段拓扑关系,将所述行驶路径中的每个下游路段的路段ID表达为全局ID和局部ID的组合;所述全局ID为其上游路段的路段ID;
压缩模块,用于对所述组合进行压缩存储;
所述每个下游路段的局部ID的计算方法为:
计算每个下游路段相对于其上游路段的向量夹角;
对所述向量夹角从小到大进行排序,所述局部ID的值为所述向量夹角在序列中的顺序值;或者
从每个下游路段的所述路段ID的后段提取长度为m的子串,从1开始逐步扩大m的值,直到所述子串中没有重复元素,则取该子串作为所述每个下游路段的局部ID。
5.根据权利要求4所述的车辆行驶路径的压缩存储系统,其特征在于:
当两条下游路段的所述向量夹角的值相等时,计算每个下游路段相对于其上游路段的顺时针旋转角度,按照所述顺时针旋转角度的大小决定所述局部ID的值。
6.根据权利要求4或5所述的车辆行驶路径的压缩存储系统,其特征在于:
当所述局部ID的值为N个连续的1序列时,用[N]来替代N个连续的1序列。
CN201711268791.6A 2017-12-05 2017-12-05 一种车辆行驶路径的压缩存储方法及系统 Active CN108257379B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711268791.6A CN108257379B (zh) 2017-12-05 2017-12-05 一种车辆行驶路径的压缩存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711268791.6A CN108257379B (zh) 2017-12-05 2017-12-05 一种车辆行驶路径的压缩存储方法及系统

Publications (2)

Publication Number Publication Date
CN108257379A CN108257379A (zh) 2018-07-06
CN108257379B true CN108257379B (zh) 2019-11-26

Family

ID=62722348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711268791.6A Active CN108257379B (zh) 2017-12-05 2017-12-05 一种车辆行驶路径的压缩存储方法及系统

Country Status (1)

Country Link
CN (1) CN108257379B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110411450B (zh) * 2019-07-29 2021-04-16 北京航空航天大学 一种用于压缩轨迹的地图匹配方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3560663A (en) * 1969-01-30 1971-02-02 Automatic Elect Lab Traffic control for modifying the routing plan in a network of switching centers
CN1804932A (zh) * 2006-01-19 2006-07-19 吉林大学 车载实时动态交通诱导路径优化方法
CN101720059A (zh) * 2009-11-05 2010-06-02 浙江大学城市学院 一种车载移动自组织网络路由的实现方法
CN103235848A (zh) * 2013-04-15 2013-08-07 中国科学院软件研究所 一种基于简化路网模型的轻量级路网匹配方法
CN103795418A (zh) * 2014-01-22 2014-05-14 复旦大学 一种路网轨迹的无损压缩方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3560663A (en) * 1969-01-30 1971-02-02 Automatic Elect Lab Traffic control for modifying the routing plan in a network of switching centers
CN1804932A (zh) * 2006-01-19 2006-07-19 吉林大学 车载实时动态交通诱导路径优化方法
CN101720059A (zh) * 2009-11-05 2010-06-02 浙江大学城市学院 一种车载移动自组织网络路由的实现方法
CN103235848A (zh) * 2013-04-15 2013-08-07 中国科学院软件研究所 一种基于简化路网模型的轻量级路网匹配方法
CN103795418A (zh) * 2014-01-22 2014-05-14 复旦大学 一种路网轨迹的无损压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向车载导航地图的动态交通信息存储模型;李楷 等;《计算机工程》;20090430;第35卷(第7期);第245-246页 *

Also Published As

Publication number Publication date
CN108257379A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN109344263B (zh) 一种地址匹配方法
CN105243128A (zh) 一种基于签到数据的用户行为轨迹聚类方法
Yu et al. Scene learning: Deep convolutional networks for wind power prediction by embedding turbines into grid space
Kellaris et al. Map-matched trajectory compression
Roddick et al. Spatial, temporal and spatio-temporal databases-hot issues and directions for phd research
CN107133700A (zh) 基于R*‑tree索引的手机信令数据路网匹配方法
CN106649663A (zh) 一种基于紧凑视频表征的视频拷贝检测方法
CN107273470A (zh) 基于变粒度快速GeoHash编码的时空模式挖掘方法
CN104867402B (zh) 一种离线的逆地理编码的方法及其装置和终端设备
CN107256631A (zh) 一种车辆轨迹数据聚合运算方法
CN109284446A (zh) 一种poi信息融合方法
CN104598621A (zh) 一种基于滑动窗口的轨迹压缩方法
Rathore et al. Exploiting real-time big data to empower smart transportation using big graphs
CN102033947A (zh) 一种基于检索词的地域识别装置及方法
CN105389596A (zh) 卷积神经网络适用于识别多种尺寸图片的方法
Zhong et al. Analysis of co-occurrence toponyms in web pages based on complex networks
CN108257379B (zh) 一种车辆行驶路径的压缩存储方法及系统
CN111695019A (zh) 一种识别关联账号的方法及装置
Li et al. A personal location prediction method based on individual trajectory and group trajectory
CN104102191A (zh) 水环境信息集成与共享系统
CN107677277A (zh) 一种基于Dijkstra算法的路径确定方法
CN107194492A (zh) 一种基于位置社交网络的商家推荐的优化方法
CN114416892A (zh) 一种基于自训练地址切分模型的全国地址归一化方法
CN104408918B (zh) 基于MapReduce计算框架的浮动车数据与道路匹配的方法
CN112084418B (zh) 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant