CN108646261B - 一种车辆gps数据集的数据处理方法和装置 - Google Patents

一种车辆gps数据集的数据处理方法和装置 Download PDF

Info

Publication number
CN108646261B
CN108646261B CN201810151138.XA CN201810151138A CN108646261B CN 108646261 B CN108646261 B CN 108646261B CN 201810151138 A CN201810151138 A CN 201810151138A CN 108646261 B CN108646261 B CN 108646261B
Authority
CN
China
Prior art keywords
data set
data
gps data
point
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810151138.XA
Other languages
English (en)
Other versions
CN108646261A (zh
Inventor
陈鑫
洪学海
皮慧婷
李小畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Big Data Cloud Computing Center Of Chinese Academy Shangrao
Original Assignee
Institute Of Big Data Cloud Computing Center Of Chinese Academy Shangrao
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Big Data Cloud Computing Center Of Chinese Academy Shangrao filed Critical Institute Of Big Data Cloud Computing Center Of Chinese Academy Shangrao
Priority to CN201810151138.XA priority Critical patent/CN108646261B/zh
Publication of CN108646261A publication Critical patent/CN108646261A/zh
Application granted granted Critical
Publication of CN108646261B publication Critical patent/CN108646261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/01Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)

Abstract

本发明实施例公开了一种车辆GPS数据集的数据处理方法和装置,其中方法包括:获取车辆GPS数据集;对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型,所述车辆GPS数据集的数据错误类型包括但不局限于:采样点缺失、属性缺失、冗余数据、时间错误、数据跳变和预设空间范围随机移动;根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理。本发明实施例针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理,提高了GPS数据集的精确度,方便用于后续的分析,如推算路网运行状态等。

Description

一种车辆GPS数据集的数据处理方法和装置
技术领域
本发明涉及数据处理技术领域,尤其是一种车辆GPS数据集的数据处理方法和装置。
背景技术
道路信息采样数据是智能交通系统(Intelligent Transport System,ITS)的基础数据之一。而初始的基础数据往往具有很强的噪声,并不能直接使用,所以基础数据的预处理工作是十分基础且必要的。
车辆GPS采样设备得到的实时道路监控信息为城市路网交通状态计算提供数据支撑。通过分析交通数据从生成、采集、上传至信息中心的整个环节,发现影响数据质量的因素有很多,主要包含几个方面:(1)卫星定位精度原因,目前GPS(Global PositioningSystem,全球定位系统)定位设备的定位精度在 20~50m,这意味着GPS原始数据定位位置与实际位置相比必然存在一些误差,且误差在50m之内;(2)当外界对信号有较强干扰时(如高架桥或高楼遮挡等),信号传播路径发生变化,GPS设备难以将信号发送到数据中心,或发送数据的时间、瞬时速度、经纬度字段记录值与实际情况出现偏差;(3)GPS定位设备、数据中心接受系统等故障及相关人为因素也都容易使得获取的个别检测数据出现一些比如丢失、冗余、错误、不连贯等质量问题。原始的车辆GPS数据集由于噪声太大基本是无法使用的,必须对GPS数据集存在的问题进行详细定量分析,然后提出有针对性的处理方案。
发明内容
本发明实施例的主要目的在于提供一种车辆GPS数据集的数据处理方法和装置,针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述 GPS数据集进行数据处理,提高了GPS数据集的精确度。
为达以上目的,一方面提出一种车辆GPS数据集的数据处理方法,包括以下步骤:获取车辆GPS数据集;对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型,所述车辆GPS数据集的数据错误类型包括但不局限于:采样点缺失、属性缺失、冗余数据、时间错误、数据跳变和预设空间范围随机移动;根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为采样点缺失,则对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为属性缺失,则:若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或若车辆GPS数据集的终端号为0,则删除所述车辆GPS数据集。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为冗余数据,则判断该冗余数据为有益冗余还是有害冗余,若属于有益冗余,则不做任何处理;若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则计算与前后点的距离,保留与前后点预设距离内的数据。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为时间错误,则删除该GPS数据集。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为数据跳变,则:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则:读取所述GPS数据集所有的轨迹信息找到随机移动入点和出点;删除入点和出点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为入点和出点的平均值。
第二方面,本发明实施例提供了一种通信装置,包括:获取单元,用于获取车辆GPS数据集;分析单元,用于对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型;处理单元,用于根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为采样点缺失,则所述处理单元具体用于:对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为属性缺失,则所述处理单元具体用于:若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或若车辆 GPS数据集的终端号为0,则删除所述车辆GPS数据集。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为冗余数据,则所述处理单元具体用于:判断该冗余数据为有益冗余还是有害冗余;若属于有益冗余,则不做任何处理;若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则计算与前后点的距离,保留与前后点预设距离内的数据。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为时间错误,则所述处理单元删除该GPS数据集。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为数据跳变,则所述处理单元具体用于:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作。
一种实现方式中,若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则所述处理单元具体用于:读取所述GPS数据集所有的轨迹信息找到随机移动入点和出T点;删除入点和出点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为入点和出点的平均值。
第三方面,本发明实施例提供了一种通信装置,包括处理器、存储器、通信接口、系统总线,所述处理器、存储器和通信接口之间通过系统总线连接并完成相互间的通信,所述存储器中用于存储计算机执行指令,所述处理器执行所述存储器中的计算机执行指令以执行上述的方法。
本发明实施例所提供的一种车辆GPS数据集的数据处理方法和装置,针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理,提高了GPS数据集的精确度,方便用于后续的分析,如推算路网运行状态等。
附图说明
图1为本发明实施例提供的车辆GPS数据集中采样点缺失示例图;
图2为本发明实施例提供的车辆GPS数据集中数据跳变示例图;
图3为本发明实施例提供的车辆GPS数据预设空间范围随机移动示例图;
图4是本发明实施例提供的一种车辆GPS数据集的数据处理方法流程示意图;
图5是本发明实施例提供的一种通信装置示意图;
图6是本发明实施例提供的另一种通信装置示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参见表1所示,本发明实施例采用的车辆GPS数据的格式,共十个字段,分别为:1.调度中心ID;2.GPS设备终端号;3.车牌号;4.数据生成时间; 5.经度;6.纬度;7.速度;8.车辆状态;9.GPS定位状态;10.方向。基于车辆GPS采集到的交通信息中相当一部分存在质量问题,倘若直接利用这些不加处理的问题数据建立数学模型,推算路网运行状态,必然会加大计算工作量和难度,同时计算结果的准确性也会降低。
表1
Figure GDA0002918713740000051
在对从目前所获得的车辆GPS数据进行充分分析之后,总结归纳了如下六种主要数据错误:
一、采样点缺失。采样点的缺失主要体现在时间维度上,车辆的采样间隔是固定的,但是受到采样设备,以及采样时的网络环境影响,车辆的采样间隔是在具体某个范围内波动的。在某些特殊的条件下如采样设备损坏、无网络信号等条件下,回传数据会产生丢失的现象。这就造成了轨迹对象的不可信度上升,如果丢失的数据太多,就使这段轨迹与真实的行驶状态差距甚远,影响了后续分析结果。如图1所示,实线为道路信息,而虚线为采样点所连接的轨迹,这样的轨迹对象就是不可信的。
二、属性缺失。属性缺失和采样点缺失不同,采样点缺失是整条数据的丢失。而属性缺失,是采样数据中存在个别属性缺失的现象,表现为不可能为0 值的数据,出现0值情况。车辆的重要属性缺失造成了大量的无用数据,这些数据的信息,通过对数据的观察主要有一下几种缺失情况:
a.该条记录的所有重要属性的值均为0。
b.仅有车牌号、载客状态等次要的属性的值为0。
c.时间或经纬度值坐标的值为0。
d.终端号缺失。
三、冗余数据。冗余分为有益冗余和有害冗余,有益冗余是一种短时间回传的现象,主要原因是网络问题,基站没有收到设备发送的采样信息,这里说丢失数据包databag1,这种情况下基站要求设备再次出数据,于是设备发出数据包databag2,databag1与databag2采样间隔是小于10秒的。但是由于网络原因 databag1又回到了基站,这时基站也会存储databag1。对于这种短时回传数据,认为是使采样点密集的友好行为,不做出处理。有害冗余,是重复冗余。重复数据的产生原因是由于车辆上的设备的不稳定性造成的多次回传,重复数据会导致之后的速度计算过程中会造成道路估测值的精确度下降,所以首先应该剔除这类数据。
四、时间错误。比如时间的越界则是一种数据错误。由于设备原因,产生数据的日期是错误的,并不是当天,可能是不同的月份或者是不同的年份;
五、数据跳变。对于一些数据的坐标值是严重错误的,这样就产生跳变现象。数据跳变主要体现在空间维度上,由于设备原因,GPS采样点的坐标远远偏离真实值,甚至远远超出所在的城市或国家。如图2所示;
六、预设空间范围随机移动。这种数据是十分不可靠的。车辆无规则移动,可能由于卫星精度不够,也可能是车辆司机的一种驾驶行为。但是因为这种不到100米的小范围的移动对于交通状况的研究是没有意义的,所以应当进行去噪处理。如图3所示,车辆在预设空间范围内部随机移动,比如预设空间范围为54米之内。
如图4所示,针对以上描述的数据错误类型,本发明实施例提供了一种车辆GPS数据集的数据处理方法,包括:
步骤501:获取车辆GPS数据集;
步骤502:对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆 GPS数据集的数据错误类型,所述车辆GPS数据集的数据错误类型包括但不局限于:采样点缺失、属性缺失、冗余数据、时间错误、数据跳变和预设空间范围随机移动;
步骤503:根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理。
若所述车辆GPS数据集的数据错误类型为采样点缺失,则对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象。对于采样点的缺失,设置一个关于采样时间的阈值,比如设置最大的允许采样间隔为5分钟(min),如果超过5min,那么车辆可能已经行驶了多个路段。对于超过时间阈值的数据,将轨迹对象进行断开操作,操作后产生多条轨迹对象,针对每条轨迹对象分别进行后续处理。
若所述车辆GPS数据集的数据错误类型为属性缺失,则:若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或若车辆GPS数据集的终端号的值为0,则删除所述车辆GPS数据集。
若所述车辆GPS数据集的数据错误类型为冗余数据,则判断该冗余数据为有益冗余还是有害冗余,若属于有益冗余,则不做任何处理;若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则需进一步计算与前后点的距离,保留与前后点预设距离内的数据。
若所述车辆GPS数据集的数据错误类型为时间错误,则删除该GPS数据集。对于时间的越界,以2013年2月3日为例子,设置一个时间窗口'2013-02-03 08:00:00'到'2013-02-03 08:10:00'之间。如果超出这个范围直接删除掉。
若所述车辆GPS数据集的数据错误类型为数据跳变,则:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作。比如,设置空间阈值10km,即车辆以120km/h的速度行驶5min,超过阈值则将其切断。
若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则:读取所述GPS数据集所有的轨迹信息找到随机移动入(IN)点和出(OUT)点;删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为IN点和OUT点的平均值。比如,设置空间阈值为 50米,当检测到这样的轨迹段时,读取其所有的轨迹信息找到随机移动IN点和 OUT点。在这样的两个点之间去掉中间的所有采样点,然后将轨迹进行“删除- 重连”处理算法。删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度分别为IN点和OUT点的时间、空间、速度、角度的平均值。
本发明实施例所提供的一种车辆GPS数据集的数据处理方法和装置,针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理,提高了GPS数据集的精确度,方便用于后续的分析,如推算路网运行状态等。
如图5所示,本发明实施例还提供了一种通信装置600,该通信装置可以是安装在车辆上的行驶记录仪,包括:
获取单元601,用于获取车辆GPS数据集;
分析单元602,用于对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型;
处理单元603,用于根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理。
若所述车辆GPS数据集的数据错误类型为采样点缺失,则处理单元603对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象。对于采样点的缺失,设置一个关于采样时间的阈值,比如设置最大的允许采样间隔为5min,因为如果超过5min,那么车辆可能已经行驶了多个路段。对于超过时间阈值的数据,将轨迹对象进行断开操作,操作后产生多条轨迹对象,针对每条轨迹对象分别进行后续处理。
若所述车辆GPS数据集的数据错误类型为属性缺失,则处理单元603具体用于:若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或若车辆GPS数据集的终端号的值为0,则删除所述车辆GPS数据集。
若所述车辆GPS数据集的数据错误类型为冗余数据,则处理单元603具体用于判断该冗余数据为有益冗余还是有害冗余,若属于有益冗余,则不做任何处理;若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则需进一步计算与前后点的距离,保留与前后点预设距离内的数据。
若所述车辆GPS数据集的数据错误类型为时间错误,则处理单元603删除该GPS数据集。对于时间的越界,以2013年2月3日为例子,设置一个时间窗口'2013-02-03 08:00:00'到'2013-02-03 08:10:00'之间。如果超出这个范围直接删除掉。
若所述车辆GPS数据集的数据错误类型为数据跳变,则处理单元603具体用于:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作。比如,设置空间阈值10km,即车辆以120km/h的速度行驶 5min,超过阈值则将其切断。
若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则处理单元603具体用于:读取所述GPS数据集所有的轨迹信息找到随机移动IN点和 OUT点;删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为IN点和OUT点的平均值。比如,设置空间阈值为50米,当检测到这样的轨迹段时,读取其所有的轨迹信息找到随机移动IN点和OUT点。在这样的两个点之间去掉中间的所有采样点,然后将轨迹进行“删除-重连”处理算法。删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为IN点和OUT点的平均值。
本发明实施例所提供的一种车辆GPS数据集的数据处理方法和装置,针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理,提高了GPS数据集的精确度,方便用于后续的分析,如推算路网运行状态等。
如图6所示,本发明实施例提供了一种通信装置700,包括处理器701、存储器702、通信接口703、系统总线704,所述处理器701、存储器702和通信接口703之间通过系统总线704连接并完成相互间的通信,所述存储器702中用于存储计算机执行指令,通信装置正常运行时,所述处理器701执行所述存储器702中的计算机执行指令以执行图4所示的数据处理方法。
应理解,在本发明实施例中,该处理器701可以是CPU,该处理器701还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器702可以包括只读存储器和随机存取存储器,并向处理器701提供指令和数据。存储器702的一部分还可以包括非易失性随机存取存储器。例如,存储器702还可以存储设备类型的信息。
该系统总线704除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为系统总线 704。
通过上述的描述,通信装置700正常运行时可以针对所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理,提高了GPS数据集的准确度,方便用于后续的分析,如推算路网运行状态等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等) 执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U 盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (9)

1.一种车辆GPS数据集的数据处理方法,其特征在于,包括:
获取车辆GPS数据集;
对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型,所述车辆GPS数据集的数据错误类型包括但不局限于:采样点缺失、属性缺失、冗余数据、时间错误、数据跳变和预设空间范围随机移动;
根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理;
若所述车辆GPS数据集的数据错误类型为采样点缺失,则对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象;
若所述车辆GPS数据集的数据错误类型为数据跳变,则:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作;
若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则:读取所述GPS数据集所有的轨迹信息找到随机移动IN点和OUT点;删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为IN点和OUT点的平均值。
2.根据权利要求1所述的车辆GPS数据集的数据处理方法,其特征在于,若所述车辆GPS数据集的数据错误类型为属性缺失,则:
若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或
若车辆GPS数据集的终端号的值为0,则删除所述车辆GPS数据集。
3.根据权利要求1所述的车辆GPS数据集的数据处理方法,其特征在于,若所述车辆GPS数据集的数据错误类型为冗余数据,则判断该冗余数据为有益冗余还是有害冗余,若属于有益冗余,则不做任何处理;若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则计算与前后点的距离,保留与前后点预设距离内的数据。
4.根据权利要求1所述的车辆GPS数据集的数据处理方法,其特征在于,
若所述车辆GPS数据集的数据错误类型为时间错误,则删除该GPS数据集。
5.一种通信装置,其特征在于,包括:
获取单元,用于获取车辆GPS数据集;
分析单元,用于对所述车辆GPS数据集质量问题进行分类分析,确定所述车辆GPS数据集的数据错误类型;
处理单元,用于根据所述车辆GPS数据集的数据错误类型,采取相应的处理方法对所述GPS数据集进行数据处理;
若所述车辆GPS数据集的数据错误类型为采样点缺失,则所述处理单元具体用于:对采样超过时间阈值的数据,对轨迹对象断开操作,操作后产生多条轨迹对象;
若所述车辆GPS数据集的数据错误类型为数据跳变,则所述处理单元具体用于:监控车辆以预设时速行驶预定时间;判断车辆是否超过预设空间阈值,若超过预设空间阈值则将其切断,形成两个片段;判断哪些片段属于同一辆车,并将其重新连接;若重新连接之后的车辆轨迹对象为单个采样点,则将这一条数据进行删除操作;
若所述车辆GPS数据集的数据错误类型为预设空间范围随机移动,则所述处理单元具体用于:读取所述GPS数据集所有的轨迹信息找到随机移动IN点和OUT点;删除IN点和OUT点之间的所有采样点,插入新的采样点,新的采样点的时间、空间、速度、角度,设置为IN点和OUT点的平均值。
6.根据权利要求5所述的通信装置,其特征在于,若所述车辆GPS数据集的数据错误类型为属性缺失,则所述处理单元具体用于:
若车辆GPS数据集的所有重要属性的属性值均为0和时间或经纬度值坐标数值为0,则当作时间错误和空间跳变来处理;或
若车辆GPS数据集的终端号的值为0,则删除所述车辆GPS数据集。
7.根据权利要求5所述的通信装置,其特征在于,若所述车辆GPS数据集的数据错误类型为冗余数据,则所述处理单元具体用于:
判断该冗余数据为有益冗余还是有害冗余;
若属于有益冗余,则不做任何处理;
若属于有害冗余,则判断地理位置是否相同,若相同,则去掉多余数据只保留一条;若不同,则计算与前后点的距离,保留与前后点预设距离内的数据。
8.根据权利要求5所述的通信装置,其特征在于,
若所述车辆GPS数据集的数据错误类型为时间错误,则所述处理单元删除该GPS数据集。
9.一种通信装置,其特征在于,包括处理器、存储器、通信接口、系统总线,所述处理器、存储器和通信接口之间通过系统总线连接并完成相互间的通信,所述存储器中用于存储计算机执行指令,所述处理器执行所述存储器中的计算机执行指令以执行权利要求1-4任意一项所述的方法。
CN201810151138.XA 2018-02-14 2018-02-14 一种车辆gps数据集的数据处理方法和装置 Active CN108646261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810151138.XA CN108646261B (zh) 2018-02-14 2018-02-14 一种车辆gps数据集的数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810151138.XA CN108646261B (zh) 2018-02-14 2018-02-14 一种车辆gps数据集的数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN108646261A CN108646261A (zh) 2018-10-12
CN108646261B true CN108646261B (zh) 2021-03-26

Family

ID=63744216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810151138.XA Active CN108646261B (zh) 2018-02-14 2018-02-14 一种车辆gps数据集的数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN108646261B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886541A (zh) * 2019-01-14 2019-06-14 北京百度网讯科技有限公司 自动驾驶车辆数据质量评估方法、装置及存储介质
JP6995078B2 (ja) * 2019-03-29 2022-01-14 本田技研工業株式会社 道路管理装置
CN110489852A (zh) * 2019-08-14 2019-11-22 北京天泽智云科技有限公司 提高风电系统数据质量的方法及装置
CN112165421B (zh) * 2020-09-11 2022-04-01 上汽通用五菱汽车股份有限公司 车辆信息回传方法、车辆、服务器及存储介质
CN113268270B (zh) * 2021-06-07 2022-10-21 中科计算技术西部研究院 一种针对成对隐马尔可夫模型的加速方法、系统及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500500A (zh) * 2013-10-08 2014-01-08 同济大学 基于交通小区的出租车空车率信息处理方法
CN106781506B (zh) * 2017-02-21 2019-02-05 济南全通信息科技有限公司 基于公交车gps数据的大范围城市公交线网实时运行水平评价方法

Also Published As

Publication number Publication date
CN108646261A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108646261B (zh) 一种车辆gps数据集的数据处理方法和装置
CN113155139B (zh) 车辆轨迹纠偏方法、装置及电子设备
US9508201B2 (en) Identifying the origins of a vehicular impact and the selective exchange of data pertaining to the impact
US20090138188A1 (en) Method, device and system for modeling a road network graph
US9361739B2 (en) Odometer monitoring and redundant storage system
CN108320348A (zh) 交通事故动态图像的生成方法及计算机装置、计算机可读存储介质
JP2015014475A (ja) 車載器、及びスプーフィング検知方法
CN109407131B (zh) 车头朝向确定方法、装置及设备
Marais et al. GNSS accuracy enhancement based on pseudo range error estimation in an urban propagation environment
CN109435940B (zh) 一种公路车道的识别方法、装置及系统
CN104881907A (zh) 一种车辆事故信息获取方法和电子设备
WO2016003262A1 (en) A system and method for detecting global positioning system anomalies
US20220028186A1 (en) Vehicle identification number (vin)-based telematics device location tracking
CN111224710A (zh) 基于卫星空间分布检验的虚拟应答器捕获方法及捕获系统
CN111016974A (zh) 一种基于电子地图的列车完整性监控系统及方法
CN112885099A (zh) 用于确定车辆轨迹关键点的方法、装置及设备
JP2005156308A (ja) 移動体軌跡情報の異常判定方法及びプログラム
CN109525947B (zh) 一种无人机运动轨迹记录方法及装置
CN115129796A (zh) 定位数据分析方法、装置、设备和介质
CN112182132A (zh) 一种地铁用户的识别方法、系统、设备和存储介质
CN110109153B (zh) 导航处理方法、导航终端、设备及存储介质
JP2009104330A (ja) 死角車両検出システム、路側装置、車載装置および死角車両検出方法
Higuchi et al. Monitoring live parking availability by vision-based vehicular crowdsensing
CN114072864A (zh) 地图数据生成装置
Domínguez et al. Characterization of GNSS Integrity Threats in Terrestrial Applications Using Real Signal Captures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant