CN114999151B - Gps轨迹中基于密度的城市交通流分层次分析方法及装置 - Google Patents
Gps轨迹中基于密度的城市交通流分层次分析方法及装置 Download PDFInfo
- Publication number
- CN114999151B CN114999151B CN202210577977.4A CN202210577977A CN114999151B CN 114999151 B CN114999151 B CN 114999151B CN 202210577977 A CN202210577977 A CN 202210577977A CN 114999151 B CN114999151 B CN 114999151B
- Authority
- CN
- China
- Prior art keywords
- track
- clustering
- clusters
- gps
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本发明涉及GPS数据处理领域,提供了一种GPS轨迹中基于密度的城市交通流分层次分析方法及装置。发明通过一种两阶段的聚类方法解决了传统聚类方法中参数固定导致的聚类结果精度低的问题。主要方案包括,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;根据GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;实施第一阶段聚类ST‑HDBC,在搭建的层次结构中实施第一阶段的聚类,将GPS轨迹片段进行聚类,得到一次聚类结果;根据轨迹地理特征进行建模,并以此为依据对一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
Description
技术领域
本发明涉及GPS数据处理领域,提供了一种GPS轨迹中基于密度的城市交通流分层次分析方法及装置。
背景技术
现有的交通流聚类分方法主要分为三类,基于划分的交通流聚类方法,基于层次的交通流聚类方法和基于密度的交通流聚类方法。基于划分的交通流聚类方法要首先确定希望得到的聚类个数,并且需要手动选择初次聚类中心,通过计和GPS轨迹间的距离来确定两条轨迹间的相似度。然而,由于GPS轨迹数据样本量通常较大,该方法的计算时间成本过高,不能满足当今智能交通系统对实时性的需求。基于层次的交通流聚类方法是一种自底向上的聚类,每一层通过合并最相似的两个或多个簇得到上一层的新簇,直到所有样本被合并在同一个簇中。这种方法的时间复杂度很高,并且虽然这种方法避免了预先设定希望得到的聚类个数,但由于每层合并中聚类的搜索半径是不变的,所以难以得到一个同时适用于不同城市的GPS数据中的聚类搜索半径,扩展性较差。基于密度的交通流聚类方法需要定义一个搜索半径,并且定义密度阈值,当搜索半径内的样本数据达到密度阈值时被认为是一个簇。但对于GPS轨迹数据来说,不同轨迹包含的轨迹点个数不统一,通过这类方法很难准确比较得到两条轨迹间的距离,这导致聚类结果精度大大下降。
发明内容
基于上述问题,本发明以提供一种克服上述问题或部分解决上述问题的。本发明通过一种两阶段的聚类方法解决了传统聚类方法中参数固定导致的聚类结果精度低的问题。将聚类阶段拆分为两个有针对性的阶段,第一个阶段针对不同参数进行聚类,而第二阶段对第一阶段的聚类结果进行更为精细的筛选。从而达到了提高聚类精确度的效果。
为了实现上述目的,本发明采用以下技术手段:
一种复杂GPS轨迹中基于密度的城市交通流分层次分析方法,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段。
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,步骤1包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST’
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
上述技术方案中,步骤3包括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
本发明还提供了一种复杂GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,GPS轨迹数据预处理模块实现包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST,
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差:
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
上述技术方案中,第一次聚类模块实现括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
因为本发明采用上述技术方案,因此具备以下有益效果:
交通流聚类是利用城市车辆GPS数据分析城市交通的一项常见任务。现有的基于密度的交通流聚类分析方法普遍存在两个重要问题,一是没有考虑城市道路的特点,二是没有很好地适应不同规模的城市区域。本提案中首先在轨迹分段的预处理阶段就考虑了轨迹的方向角偏移量,充分考虑到地理特征对交通流分析的影响。然后在聚类阶段,提出了两阶段的聚类分析方法。第一阶段将输入轨迹的时间和空间特征作为一个整体考虑,选择合适的相似函数;然后,利用HNSW结构在每一层设置不同的搜索半径,得到初步的聚类结果,并记录为子聚类;第二阶段,对分簇进行重新聚类,并根据道路特征使用相似度度量函数,得到最终的聚类结果。这样做有效避免了聚类结果的簇间耦合度低和聚类结果冗余的问题。
附图说明
图1在地图中选定聚类范围;
图2GPS轨迹数据的预处理结果展示;
图3聚类结果展示(含交通流密度高路段和其他路段);
图4聚类结果展示(仅交通流密度高路段),不同颜色深浅的为不同的类。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。
为了实现上述目的本发明采用以下技术手段:
一种复杂GPS轨迹中基于密度的城市交通流分层次分析方法,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段。
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,步骤1包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,…,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST,
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
上述技术方案中,步骤3包括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
本发明还提供了一种复杂GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,GPS轨迹数据预处理模块实现包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,Pk+2,…,pl}。
上述技术方案中,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST,
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
上述技术方案中,第一次聚类模块实现括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
实例:下面使用公开的出租车轨迹数据集San Francisco cab为例,验证本方法的有效性。
该数据集包含500个出租车共30天的行车轨迹,数据中包括GPS经纬度信息和时间戳,符合本方法对数据的基本要求。在该数据集中,随机框取某个范围较大的街区作为示例范围,框取结果如图1。
对框取范围内的轨迹数据做预处理,即步骤1,得到2088条子轨迹,如图 2所示。
对2088条轨迹进行两阶段的聚类,即步骤2,步骤3和步骤4。得到聚类结果,此时的聚类结果的呈现方式为数组,将其可视化展现在地图上,如下图 3所示。图4可以更直接的看到聚类的效果。
Claims (10)
1.一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
2.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤1包括以下步骤:
步骤 1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段与的方向角偏移量为,若小于中位数,则将这两个轨迹片段合并为一个;若大于中位数,则为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为 其中,i,m,k均属于l;
3.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
5.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
6.一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
7.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,GPS轨迹数据预处理模块实现包括以下步骤:
步骤 1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段与的方向角偏移量为,若小于中位数,则将这两个轨迹片段合并为一个;若大于中位数,则为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为 其中,i,m,k均属于l;
8.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
10.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210577977.4A CN114999151B (zh) | 2022-05-24 | 2022-05-24 | Gps轨迹中基于密度的城市交通流分层次分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210577977.4A CN114999151B (zh) | 2022-05-24 | 2022-05-24 | Gps轨迹中基于密度的城市交通流分层次分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114999151A CN114999151A (zh) | 2022-09-02 |
CN114999151B true CN114999151B (zh) | 2023-01-24 |
Family
ID=83028519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210577977.4A Active CN114999151B (zh) | 2022-05-24 | 2022-05-24 | Gps轨迹中基于密度的城市交通流分层次分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114999151B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427965A (zh) * | 2018-03-05 | 2018-08-21 | 重庆邮电大学 | 一种基于路网聚类的热点区域挖掘方法 |
CN111694032A (zh) * | 2020-05-09 | 2020-09-22 | 杭州电子科技大学 | 一种基于聚类的大规模轨迹数据的快速地图匹配方法 |
WO2021077761A1 (zh) * | 2019-10-23 | 2021-04-29 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN112765226A (zh) * | 2020-12-06 | 2021-05-07 | 复旦大学 | 基于轨迹数据挖掘的城市语义图谱构建方法 |
WO2021243516A1 (zh) * | 2020-06-01 | 2021-12-09 | 深圳先进技术研究院 | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 |
-
2022
- 2022-05-24 CN CN202210577977.4A patent/CN114999151B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427965A (zh) * | 2018-03-05 | 2018-08-21 | 重庆邮电大学 | 一种基于路网聚类的热点区域挖掘方法 |
WO2021077761A1 (zh) * | 2019-10-23 | 2021-04-29 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN111694032A (zh) * | 2020-05-09 | 2020-09-22 | 杭州电子科技大学 | 一种基于聚类的大规模轨迹数据的快速地图匹配方法 |
WO2021243516A1 (zh) * | 2020-06-01 | 2021-12-09 | 深圳先进技术研究院 | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 |
CN112765226A (zh) * | 2020-12-06 | 2021-05-07 | 复旦大学 | 基于轨迹数据挖掘的城市语义图谱构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114999151A (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241069B (zh) | 一种基于轨迹自适应聚类的路网快速更新的方法及系统 | |
CN109410586B (zh) | 一种基于多元数据融合的交通状态检测方法 | |
Schroedl et al. | Mining GPS traces for map refinement | |
Yang et al. | Generating lane-based intersection maps from crowdsourcing big trace data | |
CN108961758B (zh) | 一种基于梯度提升决策树的路口展宽车道探测方法 | |
CN104330089B (zh) | 一种利用历史gps数据进行地图匹配的方法 | |
US11699100B2 (en) | System for determining traffic metrics of a road network | |
CN103035123A (zh) | 一种交通轨迹数据中异常数据获取方法及系统 | |
CN110990661B (zh) | 一种基于路网约束和密度聚类的兴趣区域出入口提取方法 | |
CN116797055B (zh) | 一种基于物联网的城市道路规划方法及系统 | |
CN109147323A (zh) | 一种用于公路客货运输指标统计的车辆gps数据处理方法 | |
US20200355515A1 (en) | Method, apparatus, and computer program product for on-street parking localization | |
CN113932801A (zh) | 基于众包的辅助驾驶地图实时匹配更新方法 | |
WO2022077949A1 (zh) | 一种数据处理的方法和装置 | |
Arman et al. | Lane-level routable digital map reconstruction for motorway networks using low-precision GPS data | |
Huang et al. | Mining crowdsourced trajectory and geo‐tagged data for spatial‐semantic road map construction | |
Tang et al. | A novel method for road intersection construction from vehicle trajectory data | |
CN114999151B (zh) | Gps轨迹中基于密度的城市交通流分层次分析方法及装置 | |
CN110610446A (zh) | 一种基于两步聚类思路的县域城镇分类方法 | |
CN109859492A (zh) | 一种识别套牌车的系统和方法 | |
CN112559909B (zh) | 一种基于gcn嵌入空间聚类模型的商业区发现方法 | |
CN111710157B (zh) | 一种出租车热点区域的提取方法 | |
Liu et al. | Extracting campus’ road network from walking gps trajectories | |
TWI672642B (zh) | 人次統計系統及其方法 | |
Seo et al. | Strategy for introducing autonomous driving mobility service in transportation vulnerable areas: A case study of gyeonggi province in Republic of Korea |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |