CN114565031A - 基于经纬度的车队识别方法、装置及计算机设备 - Google Patents

基于经纬度的车队识别方法、装置及计算机设备 Download PDF

Info

Publication number
CN114565031A
CN114565031A CN202210156109.9A CN202210156109A CN114565031A CN 114565031 A CN114565031 A CN 114565031A CN 202210156109 A CN202210156109 A CN 202210156109A CN 114565031 A CN114565031 A CN 114565031A
Authority
CN
China
Prior art keywords
vehicles
vehicle
divergence
track
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210156109.9A
Other languages
English (en)
Inventor
孙宁宁
马建辉
李振雷
王丙新
孙中辉
迟云雁
郝宝玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FAW Jiefang Automotive Co Ltd
Original Assignee
FAW Jiefang Automotive Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FAW Jiefang Automotive Co Ltd filed Critical FAW Jiefang Automotive Co Ltd
Priority to CN202210156109.9A priority Critical patent/CN114565031A/zh
Publication of CN114565031A publication Critical patent/CN114565031A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Abstract

本申请涉及一种基于经纬度的车队识别方法,包括:获取若干车辆的轨迹参数;所述轨迹参数包括若干组相邻时刻的位置数据,所述位置数据按照发生时间的先后顺序排列,所述位置数据包括经度及纬度;根据所述轨迹参数生成所述车辆的轨迹特征坐标;根据所述轨迹特征坐标采用密度聚类算法生成所述车辆的聚类簇;基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度,若所述车辆组合的位置数据的KL散度小于预设KL散度阈值,判定所述车辆组合中的车辆属于同一车队。上述实施例所述的基于经纬度的车队识别方法中,通过算法将大量的车辆轨迹数据纳入计算程序,数据处理方便快捷,且通过密度聚类和比较KL散度的方式进行双重聚类,聚类精度更高。

Description

基于经纬度的车队识别方法、装置及计算机设备
技术领域
本申请涉及数据挖掘技术领域,特别是涉及一种基于经纬度的车队识别方法、装置及计算机设备。
背景技术
同一车队的车辆类型、载货类型、动力系统、传动系统和行驶路线基本保持一致,通过对同一车队车辆信息的识别,厂家可以掌握更多客户信息,便于服务和维护客户;另一方面,车队识别的结果可以作为其它算法的输入,比如分析同一类型车辆在相同行驶路线时的不同表现等。
传统的车队识别大多依赖于汽车厂家对于大客户信息的掌握,通过咨询相关信息以得到属于同一车队的车辆信息,这种获取车队信息的方法效率低并且数据量少,无法满足日益庞大和复杂的车队系统。
发明内容
基于此,有必要针对上述技术问题,提供一种基于经纬度的车队识别方法、装置及计算机设备,以解决车队信息获取效率低下的问题。
本申请第一方面提供了一种基于经纬度的车队识别方法,包括:
获取若干车辆的轨迹参数;所述轨迹参数包括若干组相邻时刻的位置数据,所述位置数据按照发生时间的先后顺序排列,所述位置数据包括经度及纬度;
根据所述轨迹参数生成所述车辆的轨迹特征坐标;
根据所述轨迹特征坐标采用密度聚类算法生成所述车辆的聚类簇;
基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度,若所述车辆组合的位置数据的KL散度小于预设KL散度阈值,判定所述车辆组合中的车辆属于同一车队;所述车辆组合包括所述聚类簇中任意两辆不同的车辆。
于上述实施例所述的基于经纬度的车队识别方法中,通过收集大量车辆的行驶轨迹数据,包括各个相邻时刻的经度和纬度信息,进而获得不同车辆的基于经纬度的轨迹特征坐标,再采用密度聚类算法对所有车辆的轨迹特征坐标进行聚类,选取离簇中心距离在预设阈值范围内的车辆组成聚类簇,实现初步的车队筛选,之后在此基础上对聚类簇内任意两辆车辆组成车辆组合,逐一计算每个车辆组合中两辆车辆之间的经纬度的KL散度,当计算结果低于预设KL散度阈值时判定两辆车属于同一车队,直到所有的车辆组合均完成比较,最终获得轨迹特征最接近的车辆组成同一车队,上述方法通过算法将大量的车辆轨迹数据纳入计算程序,数据处理方便快捷,且通过密度聚类和比较KL散度的方式进行双重聚类,聚类精度更高。
在其中一个实施例中,所述轨迹参数包括N组相邻时刻的经度及纬度,N为正整数;所述根据所述轨迹参数生成所述若干车辆的轨迹特征坐标的步骤,包括:
计算任一车辆的轨迹参数的一阶导数,所述一阶导数μi按照以下公式计算:
Figure BDA0003512321890000021
其中,i∈[2,N],Ji为第i时刻的经度,Ji-1为第i-1时刻的经度,Wi为第i时刻的纬度,Wi-1为第i-1时刻的纬度。
于上述实施例所述的基于经纬度的车队识别方法中,一方面通过按照时间先后排列的离散的经纬度坐标进行初步定位,另一方面通过引入经度对纬度的一阶导数,使离散的各个时间点之间的轨迹更加接近于真实轨迹,有利于提高轨迹的精度。
在其中一个实施例中,若所述轨迹参数中第i时刻的纬度与第i-1时刻的纬度相同,则第i时刻的轨迹参数的一阶导数的取值范围为[-0.1,0.1]。
在其中一个实施例中,所述轨迹特征坐标包括所述轨迹参数的一阶导数的特征值、经度的特征值及纬度的特征值中至少一种;所述特征值包括平均值、和、方差、四分位数及数据数量中至少一种。
于上述实施例所述的基于经纬度的车队识别方法中,任一车辆的轨迹被转化为至少包括轨迹参数的一阶导数、经度和纬度这三个变量的平均值、和、方差、四分位数及数据数量的五维坐标系中的坐标点,使不同车辆之间的轨迹特征更便于比较,为对不同车辆的轨迹进行聚类计算提供了便利。
在其中一个实施例中,所述聚类簇中的任一车辆的轨迹特征坐标与簇中心坐标的距离小于预设距离值。
于上述实施例所述的基于经纬度的车队识别方法中,通过将车辆的轨迹具体化为坐标点,对不同的车辆,两者的坐标点距离越近,说明二者的轨迹越相似,两者属于同一车队的可能性更高,因此,通过密度聚类算法,将距离簇中心预设距离值以内的车辆归为同一聚类簇,能够实现初步的筛选。
在其中一个实施例中,还包括:
将所述聚类簇中任意两辆不同的车辆形成车辆组合;
计算所述车辆组合中两辆车辆之间的经度的KL散度、纬度的KL散度及经纬度联合分布的KL散度;
若所述经度的KL散度小于预设经度KL散度阈值、所述纬度的KL散度小于预设纬度KL散度阈值且所述经纬度联合分布的KL散度小于预设经纬度KL散度阈值,判定所述车辆组合中的车辆属于同一车队。
于上述实施例所述的基于经纬度的车队识别方法中,在前述实施例中聚类簇的基础上,对簇内车辆进行俩俩配对组合,分别计算每对车辆组合的经度的KL散度、纬度的KL散度及经纬度联合分布的KL散度,并将上述三个KL散度值与对应的KL散度阈值进行比较,当三者均在对应的阈值范围内,则判定该车辆组合中的车辆属于同一车队,这种方法能进一步提高车队的聚类精度,最终选出的车队组合的行驶轨迹具有高相似度。
在其中一个实施例中,还包括:
根据所述轨迹参数绘制同一车队中的车辆的轨迹散点图,输出所述轨迹散点图及对应车辆的车辆识别代码。
本申请第二方面提供了一种基于经纬度的车队识别装置,包括数据获取模块、计算模块、判断模块及显示模块,其中,所述数据获取模块用于获取若干车辆的轨迹参数;所述计算模块用于根据所述若干车辆的轨迹参数计算所述若干车辆的轨迹特征坐标,并根据所述轨迹特征坐标采用密度聚类算法计算获取所述车辆的聚类簇,基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度;所述判断模块用于根据车辆的轨迹特征坐标与所述聚类簇的簇中心坐标的距离判断所述车辆是否属于所述聚类簇,及/或根据所述车辆组合的位置数据的KL散度判断所述车辆组合中的车辆是否属于同一车队;所述显示模块用于输出显示同一车队中的车辆的轨迹散点图及对应车辆的车辆识别代码。
于上述实施例所述的基于经纬度的车队识别装置中,通过设置数据获取模块以大规模收集不同车辆在不同时期的轨迹参数,收集数据更加全面,在此基础上,收集到的数据经过计算模块进行数据处理,得到每辆车的轨迹特征坐标,再基于密度聚类算法计算所有车辆的聚类簇作为初步筛选的车队,然后在聚类簇中的车辆进行俩俩配对,计算相互位置数据的KL散度,通过判断模块判断配对的车辆组合是否符合同一车队的特征,以进一步精细化车队聚类结果。
在其中一个实施例中,还包括:
数据处理模块,用于根据预设规则对所述轨迹特征坐标进行数据归一化处理,使相同坐标下对应的不同车辆的数据采用统一的标准。
本申请第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前述任一项基于经纬度的车队识别方法的步骤。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一个实施例中基于经纬度的车队识别方法的流程示意图;
图2为本申请提供的一个实施例中在二维空间中具有噪声的基于密度的聚类方法的原理图;
图3为本申请提供的又一实施例中基于经纬度的车队识别方法的流程示意图;
图4为本申请提供的一个实施例中基于经纬度的车队识别装置的结构原理图。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
需要说明的是,当一个元件被认为是“连接”另一个元件时,它可以是直接连接到另一个元件,或者通过居中元件连接另一个元件。此外,以下实施例中的“连接”,如果被连接的对象之间具有电信号或数据的传递,则应理解为“电连接”、“通信连接”等。
在此使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应当理解的是,术语“包括/包含”或“具有”等指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。
随着汽车的普及,公路网车流量越来越大,为了便于车辆管理,需要对相同行驶路线的车辆进行组队管理,以方便客户调度和维护车辆,因此,如何对相同行驶路线的车辆进行组队识别,成为亟待解决的问题。传统的车队识别大多依赖于汽车厂家对于大客户信息的掌握,通过咨询相关信息以得到属于同一车队的车辆信息,这种获取车队信息的方法效率低并且数据量少,无法满足日益庞大和复杂的车队系统。
基于此,有必要针对上述技术问题,提供一种基于经纬度的车队识别方法、装置及计算机设备,以解决车队信息获取方法效率低下的问题。
以下将通过具体的实施例进行说明。
在本申请的一个实施例中,如图1所述,提供了一种基于经纬度的车队识别方法,包括:
步骤22,获取若干车辆的轨迹参数;
其中,所述轨迹参数包括若干组相邻时刻的位置数据,所述位置数据按照发生时间的先后顺序排列;所述位置数据包括经度及纬度。
具体地,通过GPS导航系统或北斗导航系统获取车辆按照时间先后顺序排列的经纬度坐标,通过一系列离散的经纬度坐标点能反映车辆的行驶轨迹,相邻采样点之间的时间间隔越短,精度越高,越能真实还原车辆的行驶轨迹,任一辆车的行驶轨迹数据必须完整无缺失且无明显异常。
步骤24,根据所述轨迹参数生成所述车辆的轨迹特征坐标;
步骤26,根据所述轨迹特征坐标采用密度聚类算法生成所述车辆的聚类簇;
具体地,基于密度的聚类算法假设聚类结构能够通过样本分布的紧密程度确定,以数据集在空间分布上的稠密程度为依据进行聚类,即只要一个区域中的样本密度大于某个阈值,就把它划入与之相近的簇中。其中,具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)是一种很典型的密度聚类算法,是基于一组邻域参数(ε,MinPts)来描述样本分布的紧密程度,相比于基于划分的聚类方法和层次聚类方法,DBSCAN算法将簇定义为密度相连的样本的最大集合,能够将密度足够高的区域划分为簇,不需要给定簇数量,并可在有噪声的空间数据集中发现任意形状的簇。DBSCAN算法先任选数据集中的一个核心对象作为种子,创建一个簇并找出它所有的核心对象,寻找合并核心对象密度可达的对象,直到所有核心对象均被访问过为止。DBSCAN的簇中至少包含一个核心对象:如果只有一个核心对象,则其他非核心对象都落在核心对象的ε-邻域内,如果有多个核心对象,则任意一个核心对象的ε-邻域内至少有一个其他核心对象,否则这两个核心对象无法密度可达,包含过少对象的簇可以被认为是噪音。
为了进一步说明密度聚类算法的原理,如图2所示,提供了一种在二维空间中具有噪声的基于密度的聚类方法的原理图,图中包含9个点,其中,在(a)图中,点1~8距离较近,局部密度较高,选定点5为核心对象,点1、点2、点3、点4、点6、点7及点8与点5的距离均在虚线圆的半径范围内,也即点1、点2、点3、点4、点6、点7及点8均在点5的ε-邻域以内,因此,可以将点1~8划定为一个聚类簇,簇中心为点5,而点9与簇中心点5的距离大于虚线圆的半径,且点9为一个孤立的点,可以认定点9为噪音,由此,点1~8构成了全体数据集合的聚类簇,簇中心为点5,而在(b)图中,此时,簇中心包括点5、点3和点7,其中,点1和点6在簇中心点5的ε-邻域范围以内,点4和点8在簇中心点3的ε-邻域范围以内,点2在簇中心点7的ε-邻域范围以内,同时,点3在点5的ε-邻域范围以内,点7在点3的ε-邻域范围以内,故而点5到点7可以通过密度相连,因此,点1~8构成了一个密度相连的聚类簇,簇中心包括点3、点5和点7,而点9与簇中心点3、簇中心点5及簇中心点7的距离均超过了虚线圆的半径,而且周围没有其它点形成聚类簇,因此,可以将点9归类为噪音进行排除。在此要说明的是,聚类簇的半径不是固定不变的,可以根据实际需要进行设定。在本实施例中,任一车辆通过轨迹特征坐标定位为坐标系下单个的点,因此,基于上述原理,通过密度聚类算法可以获取所有车辆集合的聚类簇,所述聚类簇中的任一车辆的轨迹特征坐标与簇中心坐标的距离均小于预设距离值,在该聚类簇中的车辆为初步筛选出的具备相似行驶轨迹的车辆。
步骤28,基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度,若所述车辆组合的位置数据的KL散度小于预设KL散度阈值,判定所述车辆组合中的车辆属于同一车队。
其中,所述车辆组合包括所述聚类簇中任意两辆不同的车辆。
具体地,信息熵可以表达数据信息量的大小,对于离散型随机变量xi,信息熵计算公式如下:
Figure BDA0003512321890000091
其中,p(xi)为离散型随机变量xi的概率分布函数。相对熵(relative entropy),又被称为KL散度(Kullback-Leibler divergence)或信息散度(information divergence),是两个概率分布间差异的非对称性度量。在信息理论中,相对熵等价于两个概率分布的信息熵的差值。若其中一个概率分布为真实分布,另一个为拟合分布,则此时相对熵等于交叉熵与真实分布的信息熵之差,表示使用理论分布拟合真实分布时产生的信息损失,相对熵计算公式如下:
Figure BDA0003512321890000092
Figure BDA0003512321890000093
其中,p(xi)为真实事件的概率分布,q(xi)为理论拟合出来的该事件的概率分布。相对熵恒为非负,如果相对熵为零,则两者的概率分布相同,说明真实分布与理论拟合出来的事件完全相同,如果相对熵大于零,说明两者存在差别,且相对熵越大,差别越明显,因此,相对熵可以用于衡量两个随机分布之间的距离。在本实施例中,在前述实施例所述聚类簇中将任意两辆汽车进行俩俩配对组合,对于任一车辆组合中的两辆汽车,假设分别为车辆A和车辆B,车辆A的行驶轨迹经度的信息熵为:
Figure BDA0003512321890000094
其中,p(JAi)为离散型随机变量车辆A行驶轨迹中经度JAi的概率分布函数,同理,车辆B的行驶轨迹经度的信息熵为:
Figure BDA0003512321890000101
其中,p(JBi)为离散型随机变量车辆B行驶轨迹中经度JBi的概率分布函数,由此可得,车辆A的行驶轨迹经度对车辆B的行驶轨迹经度的KL散度为:
Figure BDA0003512321890000102
Figure BDA0003512321890000103
若DKL(JA||JB)=0,说明车辆A的行驶轨迹的经度和车辆B的行驶轨迹的经度完全相同,若DKL(JA||JB)>0,说明车辆A的行驶轨迹的经度和车辆B的行驶轨迹的经度不同,且DKL(JA||JB)的数值越大,两者的行驶轨迹的经度差别越大,同理,可以通过上述方法求解车辆A的行驶轨迹的纬度对车辆B的行驶轨迹的经度的KL散度以及车辆A的行驶轨迹的经纬度联合分布对车辆B的行驶轨迹的经纬度联合分布的KL散度,若上述三项数据计算值均在各自对应的预设KL散度阈值范围内,则说明车辆A的行驶轨迹和车辆B的行驶轨迹相似度较高,两者可以归类于同一车队。
于上述实施例所述的基于经纬度的车队识别方法中,通过收集大量车辆的行驶轨迹数据,包括各个相邻时刻的经度和纬度信息,进而获得不同车辆的基于经纬度的轨迹特征坐标,再采用密度聚类算法对所有车辆的轨迹特征坐标进行聚类,选取离簇中心距离在预设阈值范围内的车辆组成聚类簇,实现初步的车队筛选,之后在此基础上对聚类簇内任意两辆车辆组成车辆组合,逐一计算每个车辆组合中两辆车辆之间的经纬度的KL散度,当计算结果低于预设KL散度阈值时判定两辆车属于同一车队,直到所有的车辆组合均完成比较,最终获得轨迹特征最接近的车辆组成同一车队,上述方法通过算法将大量的车辆轨迹数据纳入计算程序,数据处理方便快捷,且通过密度聚类和比较KL散度的方式进行双重聚类,聚类精度更高。
作为示例,所述轨迹参数包括N组相邻时刻的经度及纬度,N为正整数;步骤22,所述根据所述轨迹参数生成所述若干车辆的轨迹特征坐标,包括:
计算任一车辆的轨迹参数的一阶导数,所述一阶导数μi按照以下公式计算:
Figure BDA0003512321890000111
其中,i∈[2,N],Ji为第i时刻的经度,Ji-1为第i-1时刻的经度,Wi为第i时刻的纬度,Wi-1为第i-1时刻的纬度。
具体地,采用经纬度定位是汽车定位的主要方法,但是,经纬度数据是离散的,而车辆行驶轨迹是连续的,通过采样车辆行驶过程中不同时刻的经纬度数据并不能完全反映车辆的真实轨迹,相邻采样点之间的经纬度数据缺失,会直接导致轨迹数据与真实轨迹之间存在偏差,因此,本实施例通过引入相邻时刻之间经度对纬度的一阶导数的方法,使离散的各个时间点之间的轨迹更加接近于真实轨迹,有利于提高轨迹的精度。
作为示例,若所述轨迹参数中第i时刻的纬度与第i-1时刻的纬度相同,则第i时刻的轨迹参数的一阶导数的取值范围为[-0.1,0.1]。
具体地,从前述实施例中轨迹参数的一阶导数的计算公式可知,在两个相邻时刻,若车辆所处的纬度相同,则轨迹参数的一阶导数的计算值会趋于无穷大,使系统程序报错,出现这种情况时可以将该时刻的轨迹参数的一阶导数取值设定在[-0.1,0.1]范围内,比如为计算方便,可以取值为0。
作为示例,所述轨迹特征坐标包括所述轨迹参数的一阶导数的特征值、经度的特征值及纬度的特征值中至少一种;所述特征值包括平均值、和、方差、四分位数及数据数量中至少一种。
具体地,任一车辆的轨迹被转化为至少包括轨迹参数的一阶导数、经度和纬度这三个变量的平均值、和、方差、四分位数及数据数量的五维坐标系中的坐标点,使不同车辆之间的轨迹特征更便于比较,为对不同车辆的轨迹进行聚类计算提供了便利。
在本申请提供的一个实施例中,如图3所示,步骤28,基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度,若所述车辆组合的位置数据的KL散度小于预设KL散度阈值,判定所述车辆组合中的车辆属于同一车队,还包括:
步骤282,将所述聚类簇中任意两辆不同的车辆形成车辆组合;
具体地,通过前述实施例中密度聚类算法的阐述可知,通过密度聚类生成的聚类簇只有一个簇中心时,簇内车辆的轨迹特征坐标之间的距离较小,可以直接将簇内车辆组成同一车队,但是,当存在多个簇中心时,不同簇中心对应的ε-邻域内的车辆的轨迹特征坐标可能距离较远,请参考图2中(b)图所示,比如点6与点2,虽然属于同一聚类簇,但是两者的实际距离较远,对应的两辆车的行驶轨迹的差别也较大,因此,在这种情况下,同一聚类簇中的车辆并不能完全归类为同一车队,还需进一步提高精确度,在本实施例中,将形成的聚类簇中的车辆俩俩组成车辆组合,通过判断每个车辆组合中车辆行驶轨迹的相似度以进一步提升聚类精度。
步骤284,计算所述车辆组合中两辆车辆之间的经度的KL散度、纬度的KL散度及经纬度联合分布的KL散度;
步骤286,若所述经度的KL散度小于预设经度KL散度阈值、所述纬度的KL散度小于预设纬度KL散度阈值且所述经纬度联合分布的KL散度小于预设经纬度KL散度阈值,判定所述车辆组合中的车辆属于同一车队。
于上述实施例所述的基于经纬度的车队识别方法中,在前述实施例中聚类簇的基础上,对簇内车辆进行俩俩配对组合,分别计算每对车辆组合的经度的KL散度、纬度的KL散度及经纬度联合分布的KL散度,并将上述三个KL散度值与对应的KL散度阈值进行比较,当三者均在对应的阈值范围内,则判定该车辆组合中的车辆属于同一车队,这种方法能进一步提高车队的聚类精度,最终选出的车队组合的行驶轨迹具有高相似度。
作为示例,基于经纬度的车队识别方法还包括:
根据所述轨迹参数绘制同一车队中的车辆的轨迹散点图,输出所述轨迹散点图及对应车辆的车辆识别代码。
具体地,系统完成同一车队的判定工作之后,通过将同一车队的各车辆的轨迹参数绘制成轨迹散点图,并与各车辆的车辆识别代码一一对应进行可视化显示,使工作人员能直观看到同一车队的车辆成员及其对应的行驶轨迹,以便对结果进行人工修正和完善。
在本申请的一个实施例中,如图4所示,还提供了一种基于经纬度的车队识别装置,包括数据获取模块100、计算模块300、判断模块400及显示模块500,其中,数据获取模块100用于获取若干车辆的轨迹参数;计算模块300用于根据若干车辆的轨迹参数计算若干车辆的轨迹特征坐标,并根据轨迹特征坐标采用密度聚类算法计算获取车辆的聚类簇,基于聚类簇获取车辆组合,计算车辆组合的位置数据的KL散度;判断模块400用于根据车辆的轨迹特征坐标与聚类簇的簇中心坐标的距离判断车辆是否属于所述聚类簇,及/或根据车辆组合的位置数据的KL散度判断车辆组合中的车辆是否属于同一车队;显示模块500用于输出显示同一车队中的车辆的轨迹散点图及对应车辆的车辆识别代码。
作为示例,请继续参考图4,还包括数据处理模块200,用于根据预设规则对轨迹特征坐标进行数据归一化处理,使相同坐标下对应的不同车辆的数据采用统一的标准。
具体地,为减少计算量,可以将所有经纬度数据保留小数点后两位,同时使相同属性的变量单位统一,以使聚类结果更加精准。
在本申请的一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现前述任一项基于经纬度的车队识别方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
在本说明书的描述中,参考术语“有些实施例”、“其他实施例”、“理想实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特征包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性描述不一定指的是相同的实施例或示例。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于经纬度的车队识别方法,其特征在于,包括:
获取若干车辆的轨迹参数;所述轨迹参数包括若干组相邻时刻的位置数据,所述位置数据按照发生时间的先后顺序排列,所述位置数据包括经度及纬度;
根据所述轨迹参数生成所述车辆的轨迹特征坐标;
根据所述轨迹特征坐标采用密度聚类算法生成所述车辆的聚类簇;
基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度,若所述车辆组合的位置数据的KL散度小于预设KL散度阈值,判定所述车辆组合中的车辆属于同一车队;所述车辆组合包括所述聚类簇中任意两辆不同的车辆。
2.根据权利要求1所述的方法,其特征在于,所述轨迹参数包括N组相邻时刻的经度及纬度,N为正整数;所述根据所述轨迹参数生成所述若干车辆的轨迹特征坐标的步骤,包括:
计算任一车辆的轨迹参数的一阶导数,所述一阶导数μi按照以下公式计算:
Figure FDA0003512321880000011
其中,i∈[2,N],Ji为第i时刻的经度,Ji-1为第i-1时刻的经度,Wi为第i时刻的纬度,Wi-1为第i-1时刻的纬度。
3.根据权利要求2所述的方法,其特征在于,若所述轨迹参数中第i时刻的纬度与第i-1时刻的纬度相同,则第i时刻的轨迹参数的一阶导数的取值范围为[-0.1,0.1]。
4.根据权利要求2或3所述的方法,其特征在于,所述轨迹特征坐标包括所述轨迹参数的一阶导数的特征值、经度的特征值及纬度的特征值中至少一种;所述特征值包括平均值、和、方差、四分位数及数据数量中至少一种。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述聚类簇中的任一车辆的轨迹特征坐标与簇中心坐标的距离小于预设距离值。
6.根据权利要求5所述的方法,其特征在于,还包括:
将所述聚类簇中任意两辆不同的车辆形成车辆组合;
计算所述车辆组合中两辆车辆之间的经度的KL散度、纬度的KL散度及经纬度联合分布的KL散度;
若所述经度的KL散度小于预设经度KL散度阈值、所述纬度的KL散度小于预设纬度KL散度阈值且所述经纬度联合分布的KL散度小于预设经纬度KL散度阈值,判定所述车辆组合中的车辆属于同一车队。
7.根据权利要求6所述的方法,其特征在于,还包括:
根据所述轨迹参数绘制同一车队中的车辆的轨迹散点图,输出所述轨迹散点图及对应车辆的车辆识别代码。
8.一种基于经纬度的车队识别装置,其特征在于,包括:
数据获取模块,用于获取若干车辆的轨迹参数;
计算模块,用于根据所述若干车辆的轨迹参数计算所述若干车辆的轨迹特征坐标,并根据所述轨迹特征坐标采用密度聚类算法计算获取所述车辆的聚类簇,基于所述聚类簇获取车辆组合,计算所述车辆组合的位置数据的KL散度;
判断模块,用于根据车辆的轨迹特征坐标与所述聚类簇的簇中心坐标的距离判断所述车辆是否属于所述聚类簇,及/或根据所述车辆组合的位置数据的KL散度判断所述车辆组合中的车辆是否属于同一车队;
显示模块,用于输出显示同一车队中的车辆的轨迹散点图及对应车辆的车辆识别代码。
9.根据权利要求8所述的装置,其特征在于,还包括:
数据处理模块,用于根据预设规则对所述轨迹特征坐标进行数据归一化处理,使相同坐标下对应的不同车辆的数据采用统一的标准。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7所述的方法的步骤。
CN202210156109.9A 2022-02-21 2022-02-21 基于经纬度的车队识别方法、装置及计算机设备 Pending CN114565031A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210156109.9A CN114565031A (zh) 2022-02-21 2022-02-21 基于经纬度的车队识别方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210156109.9A CN114565031A (zh) 2022-02-21 2022-02-21 基于经纬度的车队识别方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN114565031A true CN114565031A (zh) 2022-05-31

Family

ID=81714087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210156109.9A Pending CN114565031A (zh) 2022-02-21 2022-02-21 基于经纬度的车队识别方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN114565031A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238024A (zh) * 2022-09-26 2022-10-25 交通运输部科学研究院 高速公路设施定位方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238024A (zh) * 2022-09-26 2022-10-25 交通运输部科学研究院 高速公路设施定位方法、装置、电子设备及存储介质
CN115238024B (zh) * 2022-09-26 2022-12-20 交通运输部科学研究院 高速公路设施定位方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109493119B (zh) 一种基于poi数据的城市商业中心识别方法及系统
WO2022227303A1 (zh) 信息处理方法、装置、计算机设备及存储介质
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN116797055A (zh) 一种基于物联网的城市道路规划方法及系统
CN110866775A (zh) 一种基于机器学习的用户空铁联程城际出行信息处理方法
CN111881243A (zh) 一种出租车轨迹热点区域分析方法及系统
CN113284369B (zh) 一种基于ads-b实测航路数据的预测方法
CN114386466B (zh) 一种用于脉冲星搜寻中候选体信号挖掘的并行的混合聚类方法
CN114565031A (zh) 基于经纬度的车队识别方法、装置及计算机设备
CN111341096B (zh) 一种基于gps数据的公交运行状态评估方法
CN116611678B (zh) 数据处理方法、装置、计算机设备和存储介质
CN113776610A (zh) 一种车辆油耗的确定方法及装置
CN110659774B (zh) 大数据方法驱动的停车需求预测方法
CN116664025A (zh) 装卸货位置点生成方法、装置及设备
CN116013084A (zh) 交通管控场景确定方法、装置、电子设备及存储介质
CN110610446A (zh) 一种基于两步聚类思路的县域城镇分类方法
CN116484244A (zh) 基于聚类模型的自动驾驶事故发生机制分析方法
CN114613124B (zh) 交通信息处理方法、装置、终端及计算机可读存储介质
CN114610825A (zh) 关联网格集的确认方法、装置、电子设备及存储介质
CN111798237B (zh) 基于应用日志的异常交易诊断方法及系统
CN114579748A (zh) 一种构建自主式交通系统功能架构的方法
Minea et al. Unconventional public transport anonymous data collection employing artificial intelligence
CN114419894A (zh) 一种路内停车泊位设置与使用监测的方法与系统
Xu et al. An assistant decision-supporting method for urban transportation planning over big traffic data
Nadinta et al. A clustering-based approach for reorganizing bus route on bus rapid transit system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination