CN110188803A - 基于出租车轨迹数据的出行时空模式识别方法与系统 - Google Patents

基于出租车轨迹数据的出行时空模式识别方法与系统 Download PDF

Info

Publication number
CN110188803A
CN110188803A CN201910406202.9A CN201910406202A CN110188803A CN 110188803 A CN110188803 A CN 110188803A CN 201910406202 A CN201910406202 A CN 201910406202A CN 110188803 A CN110188803 A CN 110188803A
Authority
CN
China
Prior art keywords
trip
taxi
time series
recognition methods
track data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910406202.9A
Other languages
English (en)
Inventor
王磊
孙毅中
杨静
尚博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Tushentu Information Technology Co Ltd
Original Assignee
Nanjing Tushentu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Tushentu Information Technology Co Ltd filed Critical Nanjing Tushentu Information Technology Co Ltd
Priority to CN201910406202.9A priority Critical patent/CN110188803A/zh
Publication of CN110188803A publication Critical patent/CN110188803A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Remote Sensing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于出租车轨迹数据的出行时空模式识别方法与系统,所述方法包括:以道路交点为中心,设定长度为半径的圆形区域作为研究单元对出租车OD数据点进行集计处理;采用基于密度的聚类算法对出租车出行时间序列数据集进行聚类,并根据评价指标调整聚类参数以获得最优的聚类结果;其中通过对DTW加入时间窗口约束条件与经过调整函数对一阶时间相关系数自适应相异指数的度量值进行调整后的乘积作为最终的时间序列相似性度量函数;结合研究区域底图对聚类结果的空间分布进行叠加得到出行模式空间分布图。本发明采用的研究单元划分方法以及时间序列聚类方法结果更符合出租车模式的一般认知,针对出租车数据表现出更好的适用性。

Description

基于出租车轨迹数据的出行时空模式识别方法与系统
技术领域
本发明涉及城市地理学和时空数据挖掘领域,具体涉及一种通过城市出租车出行轨迹数据挖掘人群移动规律的基于时间序列聚类的出行时空模式识别方法与系统。
背景技术
城市是人群活动与城市空间结构长期相互作用的结果,人群出行需求与城市的空间结构特征密切相关。因此,了解城市人群出行时空模式与城市空间结构间的相关性对城市规划、交通管理、应急响应等具有重要且现实的意义。研究人员从不同方面研究了人群出行行为与城市形态的关联,例如分析用地类型和职住地的混合规模,并尝试通过居民的出行行为来进行城市规划实施评估。Jiang等利用瑞典出租车的GPS轨迹,挖掘其中隐含的群体性出行特征,进而分析城市空间结构对其产生的影响。龙瀛通过智能公交刷卡数据(SCD)分析持卡个人周期性、重复性访问的目的地以分析其职住地的空间分布和通勤行为,对北京典型的职住区域进行可视化。Pulselli、Marchettini通过手机通话数据反映城市人口的活动空间,进而监测城市居民活动。Sevtsuk等通过手机信令数据分析不同时间段人群在城市基站间的移动模式变化,结合人口、环境、用地、经济等指标对其进行解释。如根据轨迹数据所蕴含的人群出行时空模式,可以进一步识别居住、商业、休闲等城市功能结构。Liu等利用上海市出租车数据分析居民活动范围,识别上海市多中心城市结构,发现中心城区的活动空间与行政区关联很小,而郊区的居民活动范围则集中于行政区内部。通过结合浮动车数据、手机信令数据等人群活动轨迹数据,可以对城市交通状况进行分析与模拟。Tu等将轨迹点按时序连接形成运行路径,并按照固定时段切分形成交通快照,分析道路通行速度和出行热点分布,观察道路交通信息的时序变化。De等利用意大利60万辆私家车的GPS轨迹数据计算瞬时车速,结合道路网络数据对交通流速进行可视化分析。
但现有研究中注重分析时间切片下出行行为的空间分布特征以及频次、距离、方向等统计特征,反映了特定时间段的出行模式,即动态性,但与时间特征结合不足,很难直观反映出行行为随时间的周期性变化,需要探索能够统筹表达出行行为时空特征的分析模型。并且现有研究中缺少适用于出租车出行模式识别与提取的度量方法。部分已有研究引入时间序列聚类以分析人群出行模式,通过“研究单元—时间序列”集计模型统一表达出行行为的时空特征,在具有站点属性的数据(公交、地铁)有较好的应用,但并不能直接适用于出租车数据。现已有的研究单元划分方法(规则格网,交通小区等)不能兼顾出租车空间位置特征和路网形态特征,且时间序列邻近度量方法是基于值的接近程度,难以反映时间序列变化趋势的相似性。
发明内容
发明目的:针对现有技术存在的不足,本发明的目的是利用出租车轨迹数据研究人群出行时空特征,探讨顾及路网特征的研究单元划分方法,通过对研究单元出行时序的特征分析,提出一种基于出租车轨迹数据的出行时空模式识别方法与系统。
技术方案:为实现上述发明目的,本发明所述的基于出租车轨迹数据的出行时空模式识别方法,包括如下步骤:
(1)以道路交点为中心,设定长度为半径的圆形区域作为研究单元对出租车OD数据点进行集计处理,得到出租车出行时间序列数据集;其中一条时间序列包含24个时间节点,每个时间节点记录研究单元每小时时间间隔统计的OD点频次;
(2)采用基于密度的聚类算法对出租车出行时间序列数据集进行聚类,并根据聚类结果评价指标调整聚类参数以获得最优的聚类结果;其中通过对动态时间弯曲距离函数DTW加入时间窗口约束条件与经过调整函数对一阶时间相关系数自适应相异指数的度量值进行调整后的乘积作为最终的时间序列相似性度量函数;
(3)在研究区域底图上叠加聚类结果的空间分布从而得到出行模式空间分布图。
在优选的实施方案中,将出租车OD数据集划分为工作日O点,工作日D点,周末O点,周末D点4个研究数据集分别进行聚类分析,提取对应的出行模式。
在优选的实施方案中,出租车出行时间序列的相似性度量函数为:
其中,为时间序列自适应相异指数,F(x)为CORT系数的调整指数,为加入时间窗口和归一化约束的DTW距离函数。
具体地,
其中,分别表示时间节点Xi和Yj对应的出行频次。
具体地,
其中,分别表示归一化后的时间节点Xi和Yj对应的出行频次,
在优选的实施方案中,构建时间序列距离矩阵D:
在聚类过程中将时间序列距离矩阵作为距离参数对时间序列的相似性进行度量。
在优选的实施方案中,所述聚类结果评价指标采用轮廓系数。
本发明所述的一种基于出租车轨迹数据的出行时空模式识别系统,包括处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于出租车轨迹数据的出行时空模式识别方法。
有益效果:与现有技术相比,本发明具有如下优点:
1.从本发明实验最终结果可以看出,无论是聚类结果评价指标(即轮廓系数)还是聚类效果,本发明方法都优于传统DTW距离度量结合K-Means聚类方法;
2.与传统时间序列相似性度量方法相比,传统时间序列相似性度量函数时间复杂度高,且在聚类过程中时间序列间的距离不会发生改变,而本发明将时间序列距离矩阵作为距离参数对时间序列的相似性进行度量,有效地提高了迭代聚类计算的效率,从而降低了算法的时间复杂度;
3.由采用传统DTW聚类结合K-Means聚类方法得到的出行模式识别结果对比可知,本发明采用的时间序列聚类方法结果更符合出租车模式的一般认知,针对出租车数据表现出更好的适用性;
4.通过与传统时间序列聚类方法对比,能够验证本发明在出租车轨迹数据挖掘中的有效性,为出租车出行时空模式的识别进一步研究出行模式驱动机制提供了有效支撑。
附图说明
图1为顾及路网约束的研究单元划分示意图。
图2为基于DTW的距离函数的示意图。
图3为DTW距离与研究单元内出租车OD点频次相关性分析示意图。
图4为DBSCAN阈值判断示意图。
图5为出租车出行时空模式识别与提取方法流程图。
图6为出租车OD数据集聚类结果图。
图7为出租车出行模式聚类结果对比图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明实施例公开的一种基于出租车轨迹数据的出行时空模式识别方法,主要包括如下步骤:
S1:以道路交点为中心,设定长度为半径的圆形区域作为研究单元对出租车OD数据点进行集计处理,得到出租车出行时间序列数据集。本步骤的核心在于,顾及路网约束的研究单元划分。
在出行模式研究中,需要先将研究对象按照区域划分为研究单元或按照群体划分为特定集合,划分后的研究单元或集合作为最小研究单元进行分析,称之为集计处理,由集计数据建立的分析模型称为集计模型。对于出租车OD点数据(Origin to Destination,起点到终点),为了研究乘客上下车位置的时空分布特征,必须确定研究单元的空间划分方法,现有研究中通常采用规则格网和交通小区进行区域划分,而这两种方法都不能达到理想的集计处理效果,根据已有的出租车OD点空间分布与道路网络关联分析结果得知,出租车OD点数量与道路密度正相关,且大多聚集在道路交点周围200m范围内,因此如图1所示,本实施例引入了道路交点作为约束条件,选择道路交点为中心、宽度为200m的圆形缓冲区作为研究单元对出租车OD数据进行集计处理,从而进一步得到实施例需要的时间序列分析模型。
本实施例以出租车OD点频次作为统计指标,以1小时为时间间隔构建时间序列数据集,对于落在研究单元重叠处的OD点,规定同时属于该点所在的各研究单元,对于落在研究单元范围外的OD点视作噪声数据排除,数据结构如表1所示:
表1出租车时间序列数据结构
S2:采用基于密度的聚类算法对出租车出行时间序列数据集进行聚类,并根据聚类结果评价指标调整聚类参数以获得最优的聚类结果。
时间序列模式挖掘研究包括了时序相似性度量和模式聚类两个核心问题。相似性度量是计算时间序列相似程度的方法,是时间序列分析处理的基础算法。模式聚类就是将时间序列数据集按照形态特征或距离相似性分成不同子集的过程,每个子集内的时间序列包含相似的属性特征。
1)出租车出行时间序列相似性度量方法
本实施例提出了适用于出租车出行时间序列相似性的度量方法,该方法是对常见的时间序列相似性度量距离函数算法进行了改进,通过对动态时间弯曲距离函数(DynamicTime Warping,DTW)加入时间窗口约束条件与经过调整函数对一阶时间相关系数自适应相异指数的度量值进行调整后的乘积作为最终的时间序列相似性度量函数。
DTW距离是在时间序列之间寻找最佳对齐匹配距离作为时间序列距离的度量方法,其值越小表示相似度越高,如图2所示,对于两条时间序列X和Y,生成24个时间节点对{(X1,Y1),…,(X24,Y24)},然后计算时间节点对之间的距离,构建距离矩阵D24×24(如式1)。
其中 分别表示时间节点Xi和Yj对应的出行频次,是时间节点Xi和Yj出行频次的绝对差值,表示不同时间节点对之间的距离。
DTW距离允许时间节点复制后再进行对齐匹配,即支持时间轴伸缩和位移的时间序列的匹配,但在出租车时间序列度量中,由于时间节点对应的统计值表达该时间节点的出行频次,时间轴的过度拉伸或者位移可能导致匹配结果出现语义的错误,因此需要对时间轴的伸缩范围做出限制。通过加入时间窗口可以避免这类情况,并且能够有效降低算法的时间复杂度。本实施例中出租车时间序列数据集的时间间隔为1小时,为了在匹配过程中保留时间序列的形态特征,DTW时间窗口的值取1。基于递归关系,利用公式2,查找距离矩阵中累加距离(Cumulative Distances)的最小值即为DTW距离。
其中表示时间序列X在时间节点Xi前的波段和时间序列Y在时间节点Yj前的波段之间的DTW距离(相似度);|i-j|≤1表示对时间间隔限制为1。因此表示时间序列X和Y整体波形的相似度。
DTW距离是通过值的接近程度计算两条时间序列的相似性,然而时间序列中各时间节点的值之间存在关联,值的增长方向、增长速率同样表达了时间序列的相似程度。D.Chouakria和Nagabhushan引入了一种度量时间序列增长模式的方法,其目的是为了计算时间序列的增长趋势相关系数以修正常规度量方法得到的时间序列距离,该系数也被称自适应相异指数,如式3所示:
的值域属于区间[-1,1]。说明两条时间序列X、Y在各个时间节点增长方向和增长速率相同;
说明两条时间序列增长速率相同但方向相反;
表示时间序列X、Y的增长特征随机性独立。
的值越大,表示两条时间序列越相似。而在DTW距离函数中,两条时间序列越相似,DTW距离越小。因此,需要采用指数调整函数对自适应相异指数进行调整,如公式4所示:
调整后,两条时间序列越相似,自适应相异指数的调整指数越小,与DTW距离的变化趋势一致。
一般的,当一个研究单元内出行量越大,则该单元内整体出行行为的随机性越小,每日的出行模式越趋于稳定。表现在时间序列上,当研究单元内出行量越高,则该区域内多个工作日时间序列间的平均DTW距离越小,即时序越相似。利用式(2)计算各研究单元多个工作日时间序列间的平均DTW距离,例如某个研究单元中有5天也就是5条时间序列,就是计算5条时间序列所有两两组合之间的距离(1-2,1-3,1-4,1-5,2-3,2-4,2-5,3-4,3-5,4-5这些两两组合),然后相加求其平均值,就得到了研究单元多个工作日时间序列间的平均DTW距离。如图3中(a)所示,可见研究单元内OD点频次与平均DTW距离呈线性相关,与一般认知不符。这是由于DTW距离公式中时间节点对间的距离由欧式距离计算,时间序列数据集中OD频次可能相差多个数量级,随着OD频次增加,则两条时间序列的绝对距离增加。
为了消除样本绝对值的影响需要利用公式(5)对原数据进行归一化处理,其中表示时间节点Xi归一化后对应的出行频次。对归一化后的出租车时间序列数据集的DTW距离重新进行计算,结果如图3中(b)所示,随着OD频次增加,研究单元的自身DTW距离趋向稳定,此时时间序列距离度量结果更符合现实情况。
其中:与SX具体计算公式如下(式6-7):
类似的,对自适应相异指数进行验证。由于自适应相异指数是通过方差和、协方差和的比值计算得到,对输入时间序列的绝对值差异不敏感,因此不需要进行归一化处理。
综上所述,本发明实施例采用的时间序列相似性度量函数可写作式(8),其中D(X,Y)为最终评价序列相似性的指标,其值越小表示时间序列越相似。为时间序列自适应相异指数,F(x)为CORT系数的调整指数,为加入时间窗口和归一化约束的DTW距离函数
2)出租车出行时间序列聚类算法
本实施例通过基于密度的聚类算法(DBSCAN)对出租车时间序列高维数据进行聚类,该方法是通过一组邻域来描述样本集的紧密程度,邻域由两个参数搜索半径(Eps)和搜索半径内的最小样本数(MinPts)构成,这两个参数共同定义了邻域的最小密度阈值,将样本密度大于邻域密度阈值的位置识别为聚类。因此,确定邻域距离阈值和最小样本数阈值是聚类算法的关键。
搜索半径(Eps)和搜索半径内最小样本数(MinPts)指的是对每个样本对象确定半径为Eps范围为该样本的E邻域,当样本对象的E邻域内的样本数量大于等于MinPts时,此对象为核心对象,当E邻域内样本量小于MinPts时,此对象为边界对象,这两个参数一起定义了最小密度阈值,并且在点密度大于阈值的位置处识别聚类。在低Eps高MinPts的情况下,DBSCAN聚类将大部分对象识别为噪声,聚类簇的个数趋向于0,当选择高Eps低MinPts时,则会将所有对象聚类为同一簇,两种情况均会导致聚类结果质量降低。为了找到Eps和MinPts的正确值,本实施例根据已有研究结果确定了两种参数阈值的大致范围,进一步采用迭代方法实施例了Eps从1到7,步长0.1,MinPts从3到10,步长为1的所有参数组合,计算每次聚类结果的轮廓系数,并记录每次聚类的聚类簇个数,通过分析每组Eps和MinPts约束下聚类结果的轮廓系数和聚类簇数以得到合适的阈值。
对于聚类后的结果,需通过聚类指标对聚类结果进行评价,本实施例采用轮廓系数(Silhouette)作为时间序列聚类结果评价指标。轮廓系数是基于聚类结果中聚类簇内部的紧密度和聚类簇之间的分离度对聚类结果的优劣进行评价的方法,而不依赖于聚类结果的真实分类等先验知识。对于聚类中的第i个对象,计算其到所在簇内部其他对象的平均距离,记为a(i),计算其到不包含该对象的其他簇的距离,取其最小值记为b(i)。对于对象i,具体轮廓系数评价指标函数可由式(9)表示:
轮廓系数S(i)的取值范围为[-1,1],当S(i)趋近于1时,表示该对象被聚类到合适的簇,且距离其他簇距离较远,当S(i)趋近于-1时,表示该对象被分类到错误的簇。聚类簇的轮廓系数由该聚类簇内部各个对象的轮廓系数的均值表示,因此当聚类结果的轮廓系数接近于1时,表示聚类效果较好。
本实施例选取工作日中出行频次最高的前200个研究单元作为样例数据集,按上述方法进行聚类,首先对DBSCAN聚类阈值进行判断,如图4所示,横坐标为Eps取值,各颜色曲线表示不同MinPts取值对应的聚类结果,当Eps值取值在2.5至3.5之间,得到的聚类簇达到最多,当Eps值取值在3.4至4.6之间时,聚类结果的轮廓系数达到最高值。当Eps取值为3.7,MinPts为7时,该样例数据集的聚类结果轮廓系数取得最大值0.91(图4中(a)),则对于该时间序列数据集的最佳阈值为[Eps=3.7,MinPts=7],对应获得的聚类簇个数为3。
S3:出租车出行时空模式识别。
结合研究区域底图对聚类结果的空间分布进行叠加得到出行模式空间分布图,并进一步结合各区域内时序频次曲线,可分析具有相似时序特征的区域出行模式。
下面以收集的南京市的出租车轨迹数据为例,详细说明本发明方法的具体实施过程。针对出租车出行行为的时空分布特征,由于出租车出行在工作日与周末、上车点与下车点的空间分布特征各不相同,本实验中将原始出租车OD数据集划分为4个研究数据集,分别为工作日O点,工作日D点,周末O点,周末D点,按照本章所述方法分别进行聚类分析,结合聚类结果以提取出租车出行模式,主要分为以下步骤:
1)数据预处理。根据数据清洗规则对出租车轨迹数据进行清洗,剔除数据有缺失以及数据格式不正确等噪声数据,确保数据质量。
2)构建出租车出行时间序列数据集。将预处理后的数据导入数据库,确定数据类型、数据结构以及对象之间关系。
3)构建研究单元。结合城市道路网络数据,根据顾及路网约束的研究单元划分方法构建研究单元。
4)出租车出行时间序列数据集合的构建。根据研究单元对出租车OD数据库中的数据集合进行单元划分,按照出租车时间序列数据结构构建出租车出行序列数据集合。
5)计算时间序列距离矩阵。根据S2中公式(1)(序列中的频次为归一化处理后的频次)计算时间序列距离矩阵。
6)迭代DBCSAN聚类参数。由于DBCSAN聚类的结果主要受搜索半径与最小样本数两种参数的影响,通过迭代两种参数多次聚类以获得最优的聚类结果。
7)分析出租车出行模式聚类结果。根据多次迭代得到的最优聚类参数得到最优轮廓系数,计算此时聚类参数下的出租车出行模式聚类结果。
8)生成出租车出行模式空间分布图。结合研究区域底图对聚类结果的空间分布进行叠加分析,得到出行模式空间分布图。
9)出租车出行模式分析。将出租车出行模式空间分布结果结合各区域内时序频次曲线,分析具有相似时序特征的区域出行模式。
具体技术流程如图5所示。
根据S2部分中的公式以及S3模式识别技术流程进行迭代聚类计算,得到本次实验出租车OD数据集聚类结果(图6)。将聚类结果按照上车量平均频次由大到小排序,将其命名为Cluster1、Cluster2和Cluster3,其中Cluster1包含11个样本,Cluster2包含71个样本,Cluster3包含46个样本,共计样本128个,其余72个样本被判断为随机样本,视为噪声项排除。
结合OSM底图对聚类结果的空间分布进行初步判断,得到本实验的出行模式图(如图7中(a)所示),Cluster1是平均出行频次最高的研究单元,各时间节点的出行OD频次均高于其余类别,属于持续热点区域,分布在火车站,机场及长途汽车站附近,判断此类出行模式属于交通枢纽,因样例数据于2010年采集,此时南京南站尚未投入使用,因此该区域未被识别;Cluster2的时间序列呈现出工作时间出行峰值和晚间出行峰值,主要分布在城市中心以及几处商业中心,Cluster3则呈现强烈的晚间出行高峰,结合Peng对出行模式的描述,此类出行属于典型的娱乐出行,主要分布在夫子庙景区,1912酒吧街和湖南路商业街附近。
采用传统DTW距离度量方法和K-Means聚类方法得到对比实验结果(图7中(b)),可以看出,contrast 1的结果相对较好,成功将火车站、机场、长途车站附近研究单元聚集,但也包含了新街口中心区域等非交通枢纽的热点区域,contrast 2、contrast 3之间交错分布,未能做出区分,实验结果的空间聚集效果较差。综上所述,本实验采用的时间序列聚类方法结果符合对出租车出行模式一般认知,针对出租车数据体现出更好的适用性。
基于相同的发明构思,本发明实施例提供的一种基于出租车轨迹数据的出行时空模式识别系统,包括处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的一种基于出租车轨迹数据的出行时空模式识别方法。

Claims (9)

1.一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,包括如下步骤:
(1)以道路交点为中心,设定长度为半径的圆形区域作为研究单元对出租车OD数据点进行集计处理,得到出租车出行时间序列数据集;其中一条时间序列包含24个时间节点,每个时间节点记录研究单元每小时时间间隔统计的OD点频次;
(2)采用基于密度的聚类算法对出租车出行时间序列数据集进行聚类,并根据聚类结果评价指标调整聚类参数以获得最优的聚类结果;其中通过对动态时间弯曲距离函数DTW加入时间窗口约束条件与经过调整函数对一阶时间相关系数自适应相异指数的度量值进行调整后的乘积作为最终的时间序列相似性度量函数;
(3)在研究区域底图上叠加聚类结果的空间分布从而得到出行模式空间分布图。
2.根据权利要求1所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,将出租车OD数据集划分为工作日O点,工作日D点,周末O点,周末D点4个研究数据集分别进行聚类分析,提取对应的出行模式。
3.根据权利要求1所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,出租车出行时间序列的相似性度量函数为:
其中,为时间序列自适应相异指数,F(x)为CORT系数的调整指数,为加入时间窗口和归一化约束的DTW距离函数。
4.根据权利要求3所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,
其中,分别表示时间节点Xi和Yj对应的出行频次。
5.根据权利要求3所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,
6.根据权利要求3所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,
其中,分别表示归一化后的时间节点Xi和Yj对应的出行频次,
7.根据权利要求6所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,构建时间序列距离矩阵D:
在聚类过程中将时间序列距离矩阵作为距离参数对时间序列的相似性进行度量。
8.根据权利要求1所述的一种基于出租车轨迹数据的出行时空模式识别方法,其特征在于,所述聚类结果评价指标采用轮廓系数。
9.一种基于出租车轨迹数据的出行时空模式识别系统,包括处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现根据权利要求1-8任一项所述的一种基于出租车轨迹数据的出行时空模式识别方法。
CN201910406202.9A 2019-05-16 2019-05-16 基于出租车轨迹数据的出行时空模式识别方法与系统 Pending CN110188803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910406202.9A CN110188803A (zh) 2019-05-16 2019-05-16 基于出租车轨迹数据的出行时空模式识别方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910406202.9A CN110188803A (zh) 2019-05-16 2019-05-16 基于出租车轨迹数据的出行时空模式识别方法与系统

Publications (1)

Publication Number Publication Date
CN110188803A true CN110188803A (zh) 2019-08-30

Family

ID=67716413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910406202.9A Pending CN110188803A (zh) 2019-05-16 2019-05-16 基于出租车轨迹数据的出行时空模式识别方法与系统

Country Status (1)

Country Link
CN (1) CN110188803A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827540A (zh) * 2019-11-04 2020-02-21 黄传明 一种多模态数据融合的机动车移动模式识别方法及系统
CN112328728A (zh) * 2020-11-30 2021-02-05 浙江师范大学 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质
CN112784854A (zh) * 2020-12-30 2021-05-11 成都云盯科技有限公司 基于数理统计的服装颜色分割提取方法、装置和设备
CN113806544A (zh) * 2021-09-23 2021-12-17 湖北天天数链技术有限公司 简历信息处理方法、装置、电子设备及存储介质
CN114530038A (zh) * 2022-01-11 2022-05-24 江苏大学 一种基于时空数据聚类的出行兴趣区域提取方法及系统
CN114936959A (zh) * 2022-06-17 2022-08-23 上海市城乡建设和交通发展研究院 基于ic刷卡和公交轨迹数据实现车辆匹配和乘客上车点的识别方法
CN114997841A (zh) * 2022-07-18 2022-09-02 成都信通信息技术有限公司 一种基于区块链的低碳行为数据管理系统
CN116562598A (zh) * 2023-07-07 2023-08-08 成都花娃网络科技有限公司 一种分销调度方法、装置及存储介质
CN116592894A (zh) * 2023-07-11 2023-08-15 天津中远海运散运数字科技有限公司 一种航线规划方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268599A (zh) * 2014-09-29 2015-01-07 中国科学院软件研究所 一种基于车辆轨迹时空特征分析的黑车智能发现方法
CN105740904A (zh) * 2016-01-29 2016-07-06 东南大学 一种基于dbscan聚类算法的出行与活动模式识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268599A (zh) * 2014-09-29 2015-01-07 中国科学院软件研究所 一种基于车辆轨迹时空特征分析的黑车智能发现方法
CN105740904A (zh) * 2016-01-29 2016-07-06 东南大学 一种基于dbscan聚类算法的出行与活动模式识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周洋: "《基于出租车数据的城市居民活动空间与网络时空特性研究》", 《CNKI数据库》 *
程静: "《基于时间序列聚类方法分析北京出租车出行量的时空特征》", 《地球信息科学》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827540A (zh) * 2019-11-04 2020-02-21 黄传明 一种多模态数据融合的机动车移动模式识别方法及系统
CN110827540B (zh) * 2019-11-04 2021-03-12 黄传明 一种多模态数据融合的机动车移动模式识别方法及系统
CN112328728A (zh) * 2020-11-30 2021-02-05 浙江师范大学 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质
CN112784854A (zh) * 2020-12-30 2021-05-11 成都云盯科技有限公司 基于数理统计的服装颜色分割提取方法、装置和设备
CN113806544A (zh) * 2021-09-23 2021-12-17 湖北天天数链技术有限公司 简历信息处理方法、装置、电子设备及存储介质
CN114530038A (zh) * 2022-01-11 2022-05-24 江苏大学 一种基于时空数据聚类的出行兴趣区域提取方法及系统
CN114936959A (zh) * 2022-06-17 2022-08-23 上海市城乡建设和交通发展研究院 基于ic刷卡和公交轨迹数据实现车辆匹配和乘客上车点的识别方法
CN114936959B (zh) * 2022-06-17 2023-05-23 上海市城乡建设和交通发展研究院 实现车辆匹配和乘客上车点的识别方法
CN114997841A (zh) * 2022-07-18 2022-09-02 成都信通信息技术有限公司 一种基于区块链的低碳行为数据管理系统
CN114997841B (zh) * 2022-07-18 2022-10-21 成都信通信息技术有限公司 一种基于区块链的低碳行为数据管理系统
CN116562598A (zh) * 2023-07-07 2023-08-08 成都花娃网络科技有限公司 一种分销调度方法、装置及存储介质
CN116562598B (zh) * 2023-07-07 2023-09-19 成都花娃网络科技有限公司 一种分销调度方法、装置及存储介质
CN116592894A (zh) * 2023-07-11 2023-08-15 天津中远海运散运数字科技有限公司 一种航线规划方法、装置及存储介质
CN116592894B (zh) * 2023-07-11 2023-12-26 天津中远海运散运数字科技有限公司 一种航线规划方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN110188803A (zh) 基于出租车轨迹数据的出行时空模式识别方法与系统
CN105138779B (zh) 车载gps时空轨迹大数据优选方法及系统
Wang et al. Automatic intersection and traffic rule detection by mining motor-vehicle GPS trajectories
CN105206041B (zh) 一种考虑时序dbscan的智能手机轨迹链簇识别方法
CN105628033B (zh) 一种基于道路连通关系的地图匹配方法
CN108596202B (zh) 基于移动终端gps定位数据计算个人通勤时间的方法
CN102102992B (zh) 基于多级网络划分的匹配道路初筛方法及地图匹配系统
CN107766808A (zh) 道路网络空间中车辆对象移动轨迹聚类的方法及系统
CN107657637A (zh) 一种农机作业面积获取方法
CN110836675B (zh) 一种基于决策树的自动驾驶搜索决策方法
CN106600960A (zh) 基于时空聚类分析算法的交通出行起讫点识别方法
CN103593430A (zh) 一种基于移动对象时空信息轨迹分段聚类的方法
CN104680187B (zh) 基于缓冲区相似性度量的舰船轨迹层次聚类分析方法
CN107392245A (zh) 一种出租车载客轨迹聚类算法Tr‑OPTICS
CN105740904A (zh) 一种基于dbscan聚类算法的出行与活动模式识别方法
Tang et al. Exploring urban travel patterns using density-based clustering with multi-attributes from large-scaled vehicle trajectories
CN110781267A (zh) 一种基于地理国情的多尺度空间分析评价方法及系统
CN108961758A (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN113806419B (zh) 基于时空大数据的城市区域功能识别模型及识别方法
CN108171974A (zh) 一种基于手机三角定位数据的交通出行模式判别方法
CN110472999A (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN107944628A (zh) 一种路网环境下的聚集模式发现方法及系统
CN110110243A (zh) 一种基于回声状态网络的历史轨迹目的地预测方法
Qi et al. Vehicle trajectory reconstruction on urban traffic network using automatic license plate recognition data
CN108538054A (zh) 一种基于手机信令数据获取交通路况信息的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830