CN114999151B - Gps轨迹中基于密度的城市交通流分层次分析方法及装置 - Google Patents

Gps轨迹中基于密度的城市交通流分层次分析方法及装置 Download PDF

Info

Publication number
CN114999151B
CN114999151B CN202210577977.4A CN202210577977A CN114999151B CN 114999151 B CN114999151 B CN 114999151B CN 202210577977 A CN202210577977 A CN 202210577977A CN 114999151 B CN114999151 B CN 114999151B
Authority
CN
China
Prior art keywords
track
clustering
clusters
gps
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210577977.4A
Other languages
English (en)
Other versions
CN114999151A (zh
Inventor
牛新征
刘鹏飞
张煦
吴鹏
荣先钊
黄成�
秦志旗
欧阳宇翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202210577977.4A priority Critical patent/CN114999151B/zh
Publication of CN114999151A publication Critical patent/CN114999151A/zh
Application granted granted Critical
Publication of CN114999151B publication Critical patent/CN114999151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及GPS数据处理领域,提供了一种GPS轨迹中基于密度的城市交通流分层次分析方法及装置。发明通过一种两阶段的聚类方法解决了传统聚类方法中参数固定导致的聚类结果精度低的问题。主要方案包括,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;根据GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;实施第一阶段聚类ST‑HDBC,在搭建的层次结构中实施第一阶段的聚类,将GPS轨迹片段进行聚类,得到一次聚类结果;根据轨迹地理特征进行建模,并以此为依据对一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;根据二次聚类结果在地图中显示并标注交通流密度较高的路段。

Description

GPS轨迹中基于密度的城市交通流分层次分析方法及装置
技术领域
本发明涉及GPS数据处理领域,提供了一种GPS轨迹中基于密度的城市交通流分层次分析方法及装置。
背景技术
现有的交通流聚类分方法主要分为三类,基于划分的交通流聚类方法,基于层次的交通流聚类方法和基于密度的交通流聚类方法。基于划分的交通流聚类方法要首先确定希望得到的聚类个数,并且需要手动选择初次聚类中心,通过计和GPS轨迹间的距离来确定两条轨迹间的相似度。然而,由于GPS轨迹数据样本量通常较大,该方法的计算时间成本过高,不能满足当今智能交通系统对实时性的需求。基于层次的交通流聚类方法是一种自底向上的聚类,每一层通过合并最相似的两个或多个簇得到上一层的新簇,直到所有样本被合并在同一个簇中。这种方法的时间复杂度很高,并且虽然这种方法避免了预先设定希望得到的聚类个数,但由于每层合并中聚类的搜索半径是不变的,所以难以得到一个同时适用于不同城市的GPS数据中的聚类搜索半径,扩展性较差。基于密度的交通流聚类方法需要定义一个搜索半径,并且定义密度阈值,当搜索半径内的样本数据达到密度阈值时被认为是一个簇。但对于GPS轨迹数据来说,不同轨迹包含的轨迹点个数不统一,通过这类方法很难准确比较得到两条轨迹间的距离,这导致聚类结果精度大大下降。
发明内容
基于上述问题,本发明以提供一种克服上述问题或部分解决上述问题的。本发明通过一种两阶段的聚类方法解决了传统聚类方法中参数固定导致的聚类结果精度低的问题。将聚类阶段拆分为两个有针对性的阶段,第一个阶段针对不同参数进行聚类,而第二阶段对第一阶段的聚类结果进行更为精细的筛选。从而达到了提高聚类精确度的效果。
为了实现上述目的,本发明采用以下技术手段:
一种复杂GPS轨迹中基于密度的城市交通流分层次分析方法,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段。
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,步骤1包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST’
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
相似度矩阵为S的中位数为sm,最大值和最小值分别为max(S)和min(S),建立3层的HNSW结构,那么第一层的搜索半径为
Figure BDA0003659578710000031
第二层的搜索半径为sm,第三层的搜索半径为
Figure BDA0003659578710000032
三层的密度阈值均为ef =50。
上述技术方案中,步骤3包括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure BDA0003659578710000033
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
本发明还提供了一种复杂GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,GPS轨迹数据预处理模块实现包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差:
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
相似度矩阵为S的中位数为sm,最大值和最小值分别为max(S)和min(S),建立3层的HNSW结构,那么第一层的搜索半径为
Figure BDA0003659578710000051
第二层的搜索半径为sm,第三层的搜索半径为
Figure BDA0003659578710000061
三层的密度阈值均为ef =50。
上述技术方案中,第一次聚类模块实现括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure BDA0003659578710000062
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
因为本发明采用上述技术方案,因此具备以下有益效果:
交通流聚类是利用城市车辆GPS数据分析城市交通的一项常见任务。现有的基于密度的交通流聚类分析方法普遍存在两个重要问题,一是没有考虑城市道路的特点,二是没有很好地适应不同规模的城市区域。本提案中首先在轨迹分段的预处理阶段就考虑了轨迹的方向角偏移量,充分考虑到地理特征对交通流分析的影响。然后在聚类阶段,提出了两阶段的聚类分析方法。第一阶段将输入轨迹的时间和空间特征作为一个整体考虑,选择合适的相似函数;然后,利用HNSW结构在每一层设置不同的搜索半径,得到初步的聚类结果,并记录为子聚类;第二阶段,对分簇进行重新聚类,并根据道路特征使用相似度度量函数,得到最终的聚类结果。这样做有效避免了聚类结果的簇间耦合度低和聚类结果冗余的问题。
附图说明
图1在地图中选定聚类范围;
图2GPS轨迹数据的预处理结果展示;
图3聚类结果展示(含交通流密度高路段和其他路段);
图4聚类结果展示(仅交通流密度高路段),不同颜色深浅的为不同的类。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。
为了实现上述目的本发明采用以下技术手段:
一种复杂GPS轨迹中基于密度的城市交通流分层次分析方法,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段。
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,步骤1包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,…,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,pk+2,…,pl}。
上述技术方案中,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
相似度矩阵为S的中位数为sm,最大值和最小值分别为max(S)和min(S),建立3层的HNSW结构,那么第一层的搜索半径为
Figure BDA0003659578710000091
第二层的搜索半径为sm,第三层的搜索半径为
Figure BDA0003659578710000092
三层的密度阈值均为ef =50。
上述技术方案中,步骤3包括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure BDA0003659578710000093
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
本发明还提供了一种复杂GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
上述技术方案中,GPS轨迹数据预处理模块实现包括以下步骤:
步骤1.1:定义轨迹为TR={p1,p2,…,pi,…,pl},其中pi是一个三元组pi=(longitude,latitude,timestamp),代表轨迹的一个GPS数据点;
步骤1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段segmenti与segmenti+1的方向角偏移量为α,若α小于中位数,则将这两个轨迹片段合并为一个;若α大于中位数,则 pi+1为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为{pi,pm,...,pk}其中,i,m,k均属于l;
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为{pi,pm,...,pk},将轨迹TR分割为轨迹片段:
TR1,TR2,TR3,......,TRS+1,其中,
轨迹片段TR1={p1,p2,…,pi};
轨迹片段TR2={pi+1,pi+2,…,pm};
轨迹片段TR3={pm+1,pm+2,…,pk};
轨迹片段TRS+1={pk+1,Pk+2,…,pl}。
上述技术方案中,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
S=SD+SA+ST
其中SD表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
SA表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
ST表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数sm确定每层的搜索半径,
相似度矩阵为S的中位数为sm,最大值和最小值分别为max(S)和min(S),建立3层的HNSW结构,那么第一层的搜索半径为
Figure BDA0003659578710000111
第二层的搜索半径为sm,第三层的搜索半径为
Figure BDA0003659578710000112
三层的密度阈值均为ef =50。
上述技术方案中,第一次聚类模块实现括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果C={c1,c2,…,cn},ci表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure BDA0003659578710000121
其中δ(ci)是第i个簇的簇内方差,δ(D)是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于Scat(D)的簇得到一次聚类结果。
上述技术方案中,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
实例:下面使用公开的出租车轨迹数据集San Francisco cab为例,验证本方法的有效性。
该数据集包含500个出租车共30天的行车轨迹,数据中包括GPS经纬度信息和时间戳,符合本方法对数据的基本要求。在该数据集中,随机框取某个范围较大的街区作为示例范围,框取结果如图1。
对框取范围内的轨迹数据做预处理,即步骤1,得到2088条子轨迹,如图 2所示。
对2088条轨迹进行两阶段的聚类,即步骤2,步骤3和步骤4。得到聚类结果,此时的聚类结果的呈现方式为数组,将其可视化展现在地图上,如下图 3所示。图4可以更直接的看到聚类的效果。

Claims (10)

1.一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,包括以下步骤:
步骤1、GPS轨迹数据预处理模型,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
步骤2、构建层次聚类结构,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
步骤3、实施第一阶段聚类ST-HDBC,在S2搭建的层次结构中实施第一阶段的聚类,将S1中得到的GPS轨迹片段进行聚类,得到一次聚类结果;
步骤4、实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对S3中得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
步骤5、根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
2.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤1包括以下步骤:
步骤1.1:定义轨迹为
Figure 805767DEST_PATH_IMAGE001
,其中
Figure DEST_PATH_IMAGE002
是一个三元组
Figure 129432DEST_PATH_IMAGE003
,代表轨迹的一个GPS数据点;
步骤 1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段
Figure DEST_PATH_IMAGE004
Figure 814229DEST_PATH_IMAGE005
的方向角偏移量为
Figure DEST_PATH_IMAGE006
,若
Figure 615963DEST_PATH_IMAGE006
小于中位数,则将这两个轨迹片段合并为一个;若
Figure 633598DEST_PATH_IMAGE006
大于中位数,则
Figure 659323DEST_PATH_IMAGE007
为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为
Figure DEST_PATH_IMAGE008
其中,imk均属于l
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为
Figure 117503DEST_PATH_IMAGE008
,将轨迹
Figure 519665DEST_PATH_IMAGE009
分割为轨迹片段:
Figure DEST_PATH_IMAGE010
,其中,
轨迹片段
Figure 595069DEST_PATH_IMAGE011
;
轨迹片段
Figure DEST_PATH_IMAGE012
;
轨迹片段
Figure 759071DEST_PATH_IMAGE013
;
轨迹片段
Figure DEST_PATH_IMAGE014
3.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤2包括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
Figure 919926DEST_PATH_IMAGE015
其中
Figure DEST_PATH_IMAGE016
表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
Figure 329041DEST_PATH_IMAGE017
表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
Figure DEST_PATH_IMAGE018
表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数
Figure 25995DEST_PATH_IMAGE019
确定每层的搜索半径,
相似度矩阵为
Figure DEST_PATH_IMAGE020
的中位数为
Figure 127943DEST_PATH_IMAGE019
,最大值和最小值分别为
Figure 572831DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
,建立3层的HNSW结构,那么第一层的搜索半径为
Figure 520059DEST_PATH_IMAGE023
,第二层的搜索半径为
Figure 130906DEST_PATH_IMAGE019
,第三层的搜索半径为
Figure DEST_PATH_IMAGE024
;三层的密度阈值均为
Figure 138177DEST_PATH_IMAGE025
4.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤3包括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果
Figure DEST_PATH_IMAGE026
Figure 539202DEST_PATH_IMAGE027
表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure DEST_PATH_IMAGE028
其中
Figure 785726DEST_PATH_IMAGE029
是第i个簇的簇内方差,
Figure DEST_PATH_IMAGE030
是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于
Figure 955807DEST_PATH_IMAGE031
的簇得到一次聚类结果。
5.根据权利要求1所述的一种GPS轨迹中基于密度的城市交通流分层次分析方法,其特征在于,步骤4包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
6.一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,包括:
GPS轨迹数据预处理模块,定义GPS轨迹的数据结构,并进行预处理和轨迹分段,得到轨迹片段;
构建层次聚类结构模块,根据S1得到的GPS轨迹片段构建HNSW结构,在每层中定义聚类搜索半径和密度阈值;
第一次聚类模块:实施第一阶段聚类ST-HDBC,在搭建的层次结构中实施第一阶段的聚类,将得到的GPS轨迹片段进行聚类,得到一次聚类结果;
第二次聚类模块:实施第二阶段聚类,根据轨迹地理特征进行建模,并以此为依据对得到的一次聚类结果的GPS轨迹簇进行二次合并,得到二次聚类结果;
展示模块:根据二次聚类结果在地图中显示并标注交通流密度较高的路段。
7.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,GPS轨迹数据预处理模块实现包括以下步骤:
步骤1.1:定义轨迹为
Figure DEST_PATH_IMAGE032
,其中
Figure 399558DEST_PATH_IMAGE002
是一个三元组
Figure DEST_PATH_IMAGE033
,代表轨迹的一个GPS数据点;
步骤 1.2:取分割点,设每两个GPS数据点间为一个轨迹片段,计算每两个轨迹片段间的方向角偏移量,并取一条GPS轨迹的所有方向角偏移量的中位数作为判断分割点依据,计算轨迹片段
Figure 287880DEST_PATH_IMAGE004
Figure 872182DEST_PATH_IMAGE005
的方向角偏移量为
Figure DEST_PATH_IMAGE034
,若
Figure 896770DEST_PATH_IMAGE034
小于中位数,则将这两个轨迹片段合并为一个;若
Figure 42581DEST_PATH_IMAGE034
大于中位数,则
Figure 949357DEST_PATH_IMAGE007
为一个分割点,对数据集中的每条轨迹,遍历所有GPS数据点,取得所有分割点,得到的包含S个元素的分割点集合为
Figure DEST_PATH_IMAGE035
其中,imk均属于l
步骤1.3:按分割点对轨迹进行分段,得到轨迹片段,由步骤1.2计算得到的分割点集合为
Figure 277963DEST_PATH_IMAGE008
,将轨迹
Figure 953795DEST_PATH_IMAGE009
分割为轨迹片段:
Figure DEST_PATH_IMAGE036
,其中,
轨迹片段
Figure 473770DEST_PATH_IMAGE011
;
轨迹片段
Figure 602263DEST_PATH_IMAGE012
;
轨迹片段
Figure 528368DEST_PATH_IMAGE013
;
轨迹片段
Figure 793127DEST_PATH_IMAGE014
8.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,构建层次聚类结构模块实现括以下步骤:
步骤2.1:计算轨迹片段相似度矩阵,利用轨迹片段地理位置、时间和方向角偏移量三个方面,得到相似度,其计算公式为:
Figure 280740DEST_PATH_IMAGE015
其中
Figure 896529DEST_PATH_IMAGE016
表示地理位置的相似度,其计算方法为两段轨迹片段间的欧氏距离;
Figure 127791DEST_PATH_IMAGE017
表示方向角的相似度,其计算方法为计算两段轨迹片段的平均方向角偏移量的差;
Figure 512636DEST_PATH_IMAGE018
表示时空的相似度,其计算方法是计算两段轨迹片段的持续时长的差;
步骤2.2:确定HNSW结构中,每层的聚类搜索半径和密度阈值;
由步骤2.1中的相似度矩阵中相似度的中位数
Figure 401176DEST_PATH_IMAGE019
确定每层的搜索半径,
相似度矩阵为
Figure 238682DEST_PATH_IMAGE020
的中位数为
Figure 742476DEST_PATH_IMAGE019
,最大值和最小值分别为
Figure DEST_PATH_IMAGE037
Figure DEST_PATH_IMAGE038
,建立3层的HNSW结构,那么第一层的搜索半径为
Figure DEST_PATH_IMAGE039
,第二层的搜索半径为
Figure 293412DEST_PATH_IMAGE019
,第三层的搜索半径为
Figure DEST_PATH_IMAGE040
;三层的密度阈值均为
Figure DEST_PATH_IMAGE041
9.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,第一次聚类模块实现括以下步骤:
步骤3.1:在层次结构中实施分层聚类,得到聚类结果
Figure DEST_PATH_IMAGE042
Figure 640604DEST_PATH_IMAGE027
表示聚类结果中的第i个簇,层次结构中,采用DBSCAN的聚类方法,每一层的搜索半径和密度阈值由步骤2.2确定;
步骤3.2:去除冗余簇,根据步骤3.1中得到的聚类结果进行筛选,具体为:
计算聚类结果的平均簇内方差,计算公式为:
Figure 230985DEST_PATH_IMAGE028
其中
Figure DEST_PATH_IMAGE043
是第i个簇的簇内方差,
Figure DEST_PATH_IMAGE044
是整个数据集的方差,删除聚类结果C中只包含单条轨迹或簇内方差小于
Figure DEST_PATH_IMAGE045
的簇得到一次聚类结果。
10.根据权利要求6所述的一种GPS轨迹中基于密度的城市交通流分层次分析装置,其特征在于,第二次聚类模块实现包括以下步骤:
步骤4.1:计算步骤3.3得到的一次聚类结果的簇之间的平均距离,在每个簇中随机选定一条轨迹作为中心轨迹,并将两个簇的中心轨迹间的距离,作为两簇之间的平均距离;
步骤4.2:计算簇间方向角偏移量差值,将簇内轨迹片段的方向角求平均作为该簇的平均方向角,并比较两个簇之间平均方向角偏移量差值,在偏移阈值内则判断两簇可以合并;
步骤4.3:计算簇间重合度,在每个簇中随机算定一个GPS样本点作为随机中心点,将待比较的两簇的随机中心点连线并求斜率,与由步骤S4.2得到的两簇的平均方向角作比较,在偏移阈值内则判断两簇可以合并;
步骤4.4:同时满足步骤S4.1,步骤S4.2和步骤S4.3的两个簇合并在一起,得到新的簇,最终得到二次聚类结果。
CN202210577977.4A 2022-05-24 2022-05-24 Gps轨迹中基于密度的城市交通流分层次分析方法及装置 Active CN114999151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210577977.4A CN114999151B (zh) 2022-05-24 2022-05-24 Gps轨迹中基于密度的城市交通流分层次分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210577977.4A CN114999151B (zh) 2022-05-24 2022-05-24 Gps轨迹中基于密度的城市交通流分层次分析方法及装置

Publications (2)

Publication Number Publication Date
CN114999151A CN114999151A (zh) 2022-09-02
CN114999151B true CN114999151B (zh) 2023-01-24

Family

ID=83028519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210577977.4A Active CN114999151B (zh) 2022-05-24 2022-05-24 Gps轨迹中基于密度的城市交通流分层次分析方法及装置

Country Status (1)

Country Link
CN (1) CN114999151B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
CN111694032A (zh) * 2020-05-09 2020-09-22 杭州电子科技大学 一种基于聚类的大规模轨迹数据的快速地图匹配方法
WO2021077761A1 (zh) * 2019-10-23 2021-04-29 江苏智通交通科技有限公司 基于层次聚类的路口异常车辆轨迹识别分析方法
CN112765226A (zh) * 2020-12-06 2021-05-07 复旦大学 基于轨迹数据挖掘的城市语义图谱构建方法
WO2021243516A1 (zh) * 2020-06-01 2021-12-09 深圳先进技术研究院 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
WO2021077761A1 (zh) * 2019-10-23 2021-04-29 江苏智通交通科技有限公司 基于层次聚类的路口异常车辆轨迹识别分析方法
CN111694032A (zh) * 2020-05-09 2020-09-22 杭州电子科技大学 一种基于聚类的大规模轨迹数据的快速地图匹配方法
WO2021243516A1 (zh) * 2020-06-01 2021-12-09 深圳先进技术研究院 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质
CN112765226A (zh) * 2020-12-06 2021-05-07 复旦大学 基于轨迹数据挖掘的城市语义图谱构建方法

Also Published As

Publication number Publication date
CN114999151A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN109241069B (zh) 一种基于轨迹自适应聚类的路网快速更新的方法及系统
CN109410586B (zh) 一种基于多元数据融合的交通状态检测方法
Schroedl et al. Mining GPS traces for map refinement
Yang et al. Generating lane-based intersection maps from crowdsourcing big trace data
CN108961758B (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN104330089B (zh) 一种利用历史gps数据进行地图匹配的方法
US11699100B2 (en) System for determining traffic metrics of a road network
CN103035123A (zh) 一种交通轨迹数据中异常数据获取方法及系统
CN110990661B (zh) 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN116797055B (zh) 一种基于物联网的城市道路规划方法及系统
CN109147323A (zh) 一种用于公路客货运输指标统计的车辆gps数据处理方法
US20200355515A1 (en) Method, apparatus, and computer program product for on-street parking localization
CN113932801A (zh) 基于众包的辅助驾驶地图实时匹配更新方法
WO2022077949A1 (zh) 一种数据处理的方法和装置
Arman et al. Lane-level routable digital map reconstruction for motorway networks using low-precision GPS data
Huang et al. Mining crowdsourced trajectory and geo‐tagged data for spatial‐semantic road map construction
Tang et al. A novel method for road intersection construction from vehicle trajectory data
CN114999151B (zh) Gps轨迹中基于密度的城市交通流分层次分析方法及装置
CN110610446A (zh) 一种基于两步聚类思路的县域城镇分类方法
CN109859492A (zh) 一种识别套牌车的系统和方法
CN112559909B (zh) 一种基于gcn嵌入空间聚类模型的商业区发现方法
CN111710157B (zh) 一种出租车热点区域的提取方法
Liu et al. Extracting campus’ road network from walking gps trajectories
TWI672642B (zh) 人次統計系統及其方法
Seo et al. Strategy for introducing autonomous driving mobility service in transportation vulnerable areas: A case study of gyeonggi province in Republic of Korea

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant