CN114120018B - 一种基于人群聚类轨迹熵的空间活力量化方法 - Google Patents

一种基于人群聚类轨迹熵的空间活力量化方法 Download PDF

Info

Publication number
CN114120018B
CN114120018B CN202010860956.4A CN202010860956A CN114120018B CN 114120018 B CN114120018 B CN 114120018B CN 202010860956 A CN202010860956 A CN 202010860956A CN 114120018 B CN114120018 B CN 114120018B
Authority
CN
China
Prior art keywords
track
space
clustering
entropy
vitality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010860956.4A
Other languages
English (en)
Other versions
CN114120018A (zh
Inventor
卿粼波
刘博�
王正勇
牛通
何小海
任超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202010860956.4A priority Critical patent/CN114120018B/zh
Publication of CN114120018A publication Critical patent/CN114120018A/zh
Application granted granted Critical
Publication of CN114120018B publication Critical patent/CN114120018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于人群聚类轨迹熵的空间活力量化方法,主要涉及利用空间轨迹熵的概念量化人群聚类轨迹数据并对公共空间活力分析。该方法包括:人群轨迹聚类方法采用匹配轨迹段间的余弦相关性和临近匹配点数改进相似性度量,并基于轮廓系数作为评价指标自动寻找聚类簇数。利用轨迹聚类结果计算空间轨迹熵,其描述空间中轨迹分布的不均匀性和不确定性,从而表征空间活力状态。本发明充分考虑了人群轨迹在空间中运动模式和类别特征分析空间活力状态。同时,采用信息熵值计算方法更好地处理了城市空间活力量化的问题,有效避免了传统方法主观因素多的问题,为城市规划领域研究空间活力量化提供了新思路。

Description

一种基于人群聚类轨迹熵的空间活力量化方法
技术领域
本发明涉及机器学习和城市规划交叉领域中的公共空间活力分析问题,尤其是涉及基于人群聚类轨迹熵的空间活力量化方法。
背景技术
随着城市社会的发展,公共空间生活受到人们的关注,城市公共空间活力是实现城市生活质量的最基本要素。城市公共空间中“人”的状态是衡量空间活力的重要因素,人群的活动可以真实体现人在空间中的感受,反映空间质量现状。人群活动作为体现空间活力的特征,已经成为城市空间活力研究的主要方向。
然而,传统行为活动数据获取和空间活力评估方法具有一定的局限性,比如现场观察法来获取活动类型数据,受到人力时间成本的限制。随着互联网、物联网等信息技术的发展,时空大数据等新技术逐渐被研究者所使用,城市公共空间下的摄像头视频可以提供公共空间人群运动轨迹状态信息,这些数据大量用于公共社会学的研究。人群轨迹数据由于覆盖面积广、运动自由等特点,包含了丰富的公共空间状态信息和市民活动信息。时空轨迹描述了运动人群在公共空间中的运动模式和行为特征,揭示了公共空间中人群流量和空间占用率,还可以通过分析解释公共空间的活力特性。本发明利用机器学习技术,采用人群轨迹聚类的方法提取人群的运动模式簇,并使用信息学和热力学熵的概念对运动轨迹模式簇量化分析并且感知人群在空间中的活力状态。该发明通过聚类轨迹熵描述空间中人群轨迹分布的均匀性和不确定性,给城市规划者调查领域研究公共空间活力提供了新思路。
发明内容
本发明的目的是提供一种基于人群聚类轨迹熵的空间活力量化方法,将轨迹熵的概念与公共空间活力分析结合。首先,根据人群轨迹的局部相关性利用匹配轨迹段间相关性和邻近匹配点数改进聚类相似性度量,然后采用轮廓系数作为评价指标对相似运动趋势轨迹自动寻找轨迹聚类簇数并得到轨迹聚类结果,最后以轨迹聚类结果计算空间轨迹熵,其描述空间中轨迹分布的不均匀性和不确定性,由空间轨迹熵定义特性,揭示了公共空间中人群运动模式和空间占有率,从而反映公共空间活力大小。
为了方便说明,首先引入如下概念:
相似性度量(Similarity Measurement):在分类聚类算法中,时常需要计算两个变量的距离,即综合评定两条轨迹之间相近程度的一种度量。
轮廓系数(Silhouette Coefficient):是聚类效果好坏的一种评价方式,它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。
本发明具体采用如下技术方案:
提出了一种基于人群聚类轨迹熵的空间活力量化方法,其特征在于:
a.采用匹配轨迹段间的余弦相关性和临近匹配点数的方法处理人群运动轨迹,得到任意两条轨迹间的相似性度量距离;
b.采用密度峰值聚类算法对空间轨迹聚类,利用轮廓系数增加筛选出最佳的聚类中心;
c.利用轨迹聚类结果计算空间轨迹熵,并使用空间轨迹熵量化分析空间活力;
该方法主要包括以下步骤:
(1)使用先进的多目标跟踪算法从公有的公共空间视频中提取轨迹数据,并对轨迹数据预处理,去除掉比较短的轨迹段;
(2)利用步骤(1)预处理后的轨迹数据,并基于两条轨迹结构相似性关系得到两条轨迹结构位置一致的匹配点;
(3)利用由匹配点组成的匹配线段,基于余弦相似性方法对匹配的轨迹段进行度量并得出余弦相关性增强系数α;
(4)设定轨迹匹配点间距离参数阈值β,轨迹中小于此阈值β的匹配点称其为临近匹配点,统计满足此条件的匹配点数。临近匹配点数与余弦相关性增强系数α共同作为相似性度量增强参数,最后计算出所有轨迹间相似性度量矩阵;
(5)以轮廓系数作为评价指标,利用轨迹相似度量矩阵作为密度峰值聚类算法的特征输入自适应得到聚类轨迹簇数;
(6)采用每条轨迹到所有轨迹聚类中心的距离计算不相似度概率,然后计算空间轨迹熵作为空间活力值。
本发明的有益效果是:
(1)结合人群运动轨迹的不确定性特点,利用匹配线段的余弦相似性度量和临近匹配点作为增强系数,提升轨迹聚类结果簇内相似度和簇间离散度。
(2)考虑到聚类参数选取困难问题,采用轮廓系数决定聚类簇数,有效减少参数对聚类结果的影响,提高了算法的自适应性。
(3)充分考虑到轨迹在空间分布量化表示问题,求解空间轨迹熵值可以有效的体现空间活力强度信息。
(4)将信息熵计算方法引入到城市空间活力研究中,避免了传统方法主观因素多的问题,提高研究价值。
附图说明
图1为基于聚类轨迹熵的空间活力分析框架图;
图2为四个公共空间A、B、C、D某时刻空间聚类轨迹图,Space A中有38条轨迹和17类簇,Space B中有21条轨迹9类簇,Space C中有11条轨迹4类簇,Space D中有19条轨迹2类簇;
图3为四个空间A、B、C、D空间轨迹聚类熵对比图。
具体实施方式
下面通过实例对本发明作进一步的详细说明,有必要指出的是,以下的实施例只用于对本发明做进一步的说明,不能理解为对本发明保护范围的限制,所属领域技术熟悉人员根据上述发明内容,对本发明做出一些非本质的改进和调整进行具体实施,应仍属于本发明的保护范围。
图1中,基于人群聚类轨迹熵的空间活力量化方法,具体包括以下步骤:
(1)使用先进的多目标跟踪算法从数据视频中提取轨迹数据,并对轨迹数据预处理,去除掉存在时间比较短的轨迹段。
(2)基于轨迹结构相似性对应关系,两条轨迹匹配点间一一对应,保证两条轨迹对应结构比例位置差最小得到对应匹配点,如公式1,TR_pos[i]表示轨迹点pi对应轨迹结构的比例位置,qj和pi是一对匹配点。
qj=map{min(abs(TR_pos[i]-TRq_pos[j]),pi=0,1,...,n)} (1)
(3)计算相关性增强系数:针对上述的匹配点以及匹配点组成的匹配线段,基于Cosine余弦相似性方法对匹配的轨迹段进行度量,如公式(2),pqθi的范围是[0,π],pqθi为0表示两条匹配段方向一致且相关性比较强,pqθi为π表示匹配段没有相关性。对于两条轨迹存在大量相关性强的匹配轨迹段,对应轨迹段的结构就趋近于相似,轨迹间距离可用轨迹点间距离衡量。对于结构差异比较大的轨迹,需要相关性增强系数,如式3,要在轨迹点距离基础上乘上增强系数,增大相似性度量距离。
Figure GDA0004255018610000041
Figure GDA0004255018610000042
(4)临近匹配点统计和计算轨迹相似性度量:针对两条轨迹不仅结构相似而且每个匹配点距离都比较近,那么这两条轨迹更可能是一个类群,因此定义匹配点距离阈值β,统计满足小于此阈值的匹配点数,如公式4,称其为临近匹配点,临近匹配点的数量决定了轨迹相似度距离能够缩小程度,相似度距离小的轨迹更容易聚成同一类。临近匹配点数与(3)中的相关性增强系数共同作为相似性度量的增强系数并计算出相似性度量矩阵,如公式5,||psi-qsi||代表匹配点间的欧式距离,增强系数作为缩放因子共同决定相似度度量距离的大小。
Figure GDA0004255018610000043
Figure GDA0004255018610000044
(5)依据轨迹相似性特征,基于密度峰值聚类算法将局部密度与高局部密度点间距离乘上排序后依次添加到聚类中心中,然后计算所有轨迹到中心轨迹点距离并计算轮廓系数,选取最大的轮廓系数对应的聚类中心和聚类个数作为所有轨迹的聚类中心和聚类簇数。
(6)计算空间轨迹熵:依据轨迹类别间的离群程度和轨迹在空间中混乱程度,综合考虑行为轨迹可以表达空间环境信息和空间中的轨迹分布状态,定义公式6、7,其中,p(Li,Lj)代表轨迹Li与各个聚类中心的不相似性概率,Lj表示聚类中心代表性轨迹,dist(Li,Lj)代表两个轨迹间的相似度距离,clus表示聚类中心的数量,
Figure GDA0004255018610000045
表示轨迹Li与各个聚类中心Lk距离之和。根据公式7计算空间轨迹熵作为空间活力值,表示轨迹在空间分布的情况,空间轨迹熵取值越大表示空间中非延时型活动越多,不同运动趋势或者运动方向的轨迹分布越均匀,对应空间活力越大。
Figure GDA0004255018610000051
Figure GDA0004255018610000052

Claims (4)

1.一种基于人群聚类轨迹熵的空间活力量化方法,其特征在于:
a.采用匹配轨迹段间的余弦相关性和临近匹配点数的方法处理人群运动轨迹,得到任意两条轨迹间的相似性度量距离;
b.采用轮廓系数和密度峰值聚类算法对空间轨迹聚类;
c.利用轨迹聚类结果计算空间轨迹熵,并用其量化空间活力;
该方法主要包括以下步骤:
(1)使用多目标跟踪算法从公共空间视频中提取轨迹数据,并通过预处理的方式过滤较短的轨迹段;
(2)以两条轨迹结构相似性关系得到两条轨迹结构位置一致的匹配点;以匹配点qj和pi为例,用TR_pos[i]表示轨迹点pi对应轨迹结构的比例位置,则qj可表示为
qj=map{min(abs(TR_pos[i]-TRq_pos[j]),pi=0,1,...,n)};
(3)由匹配点组成匹配线段,并利用余弦相似性公式计算得到余弦相关性增强系数α,计算公式如下,
Figure FDA0004257561310000011
Figure FDA0004257561310000012
其中,pqθi的范围是[0,π],0表示两条匹配段方向一致且相关性比较强,π表示匹配段没有相关性;
(4)先设定轨迹匹配点间的距离参数阈值β,然后统计轨迹中小于β的匹配点即临近匹配点,最后利用临近匹配点数与余弦相关性增强系数α计算任意两条轨迹间相似性度量矩阵,计算公式如下,
Figure FDA0004257561310000013
Figure FDA0004257561310000014
(5)以轮廓系数作为评价指标,将相似度量矩阵作为密度峰值聚类算法的特征输入,以自适应的方式进行轨迹聚类;
(6)根据每条轨迹到各轨迹聚类中心的距离,计算空间轨迹熵并作为空间活力值;以轨迹Li和Lj为例,计算公式如下,
Figure FDA0004257561310000021
Figure FDA0004257561310000022
其中,dist(Li,Lj)表示两者的相似度距离,clus表示聚类中心的数量,
Figure FDA0004257561310000023
表示轨迹Li与各聚类中心Lk距离之和。
2.如权利要求1所述的基于人群聚类轨迹熵的空间活力量化方法,其特征在于在步骤(3)和(4)中,首先针对匹配线段平行或者交叉的特性采用余弦相似性方法得到匹配线段的相关性系数,然后将该系数和临近匹配点数共同作为相关性度量的增强参数,最后结合两轨迹的匹配点距离和增强参数计算并优化轨迹度量距离矩阵。
3.如权利要求1所述的基于人群聚类轨迹熵的空间活力量化方法,其特征在于在步骤(5)中,针对轨迹聚类算法中确定聚类中心的问题,具体采用密度峰值聚类算法确定局部密度最大的对象作为可能的聚类中心并用轮廓系数筛选出最佳的聚类中心。
4.如权利要求1所述的基于人群聚类轨迹熵的空间活力量化方法,其特征在于在步骤(6)中,针对聚类轨迹在空间的分布情况和量化分析问题,首先计算各条轨迹的不相似概率,具体为用单条轨迹到某一聚类中心的距离除以该轨迹到所有聚类中心的距离和作为该轨迹到该聚类中心的不相似概率;然后重复上述计算方法,得到各轨迹的不相似概率;最后采用信息熵的计算方式计算每条轨迹对应熵值并求和得到空间轨迹熵,该熵值表明了轨迹在空间分布的均匀性和不确定性进而反映了空间活力状态。
CN202010860956.4A 2020-08-25 2020-08-25 一种基于人群聚类轨迹熵的空间活力量化方法 Active CN114120018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010860956.4A CN114120018B (zh) 2020-08-25 2020-08-25 一种基于人群聚类轨迹熵的空间活力量化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010860956.4A CN114120018B (zh) 2020-08-25 2020-08-25 一种基于人群聚类轨迹熵的空间活力量化方法

Publications (2)

Publication Number Publication Date
CN114120018A CN114120018A (zh) 2022-03-01
CN114120018B true CN114120018B (zh) 2023-07-11

Family

ID=80373680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010860956.4A Active CN114120018B (zh) 2020-08-25 2020-08-25 一种基于人群聚类轨迹熵的空间活力量化方法

Country Status (1)

Country Link
CN (1) CN114120018B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114626733A (zh) * 2022-03-21 2022-06-14 北京工业大学 公共空间活力评测方法、装置、电子设备及存储介质
CN116167692B (zh) * 2023-02-21 2023-09-01 上海朗晖慧科技术有限公司 一种结合货单信息的自动优化方法与系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593430A (zh) * 2013-11-11 2014-02-19 胡宝清 一种基于移动对象时空信息轨迹分段聚类的方法
CN105788273A (zh) * 2016-05-18 2016-07-20 武汉大学 基于低精度时空轨迹数据的城市交叉口自动识别的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765873B (zh) * 2015-04-24 2019-03-26 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN105243128B (zh) * 2015-09-29 2018-06-08 西华大学 一种基于签到数据的用户行为轨迹聚类方法
JP6886651B2 (ja) * 2016-12-08 2021-06-16 株式会社国際電気通信基礎技術研究所 行動コマンド生成システム、応答システムおよび行動コマンド生成方法
CN108427965B (zh) * 2018-03-05 2022-08-23 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
US10479356B1 (en) * 2018-08-17 2019-11-19 Lyft, Inc. Road segment similarity determination
CN110909592B (zh) * 2019-10-11 2020-12-18 重庆特斯联智慧科技股份有限公司 一种基于多尺度特征量的目标跟踪方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593430A (zh) * 2013-11-11 2014-02-19 胡宝清 一种基于移动对象时空信息轨迹分段聚类的方法
CN105788273A (zh) * 2016-05-18 2016-07-20 武汉大学 基于低精度时空轨迹数据的城市交叉口自动识别的方法

Also Published As

Publication number Publication date
CN114120018A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
Chen et al. Anomaly detection in surveillance video based on bidirectional prediction
Ge et al. Automatically detecting the small group structure of a crowd
Li et al. Trend modeling for traffic time series analysis: An integrated study
CN109657547B (zh) 一种基于伴随模型的异常轨迹分析方法
CN114120018B (zh) 一种基于人群聚类轨迹熵的空间活力量化方法
Jin et al. Comparison of clustering techniques for residential energy behavior using smart meter data
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN111340288A (zh) 一种顾及时空关联性的城市空气质量时序预测方法
CN113420414A (zh) 一种基于动态时空分析的短时交通流预测模型
CN114997534B (zh) 基于视觉特征的相似降雨预报方法和设备
CN112820415B (zh) 一种基于gis的慢性病时空演化特征分析及环境健康风险监测系统及方法
CN113780451A (zh) 时空大数据的时态数据内蕴模式聚类分析方法
CN108898244B (zh) 一种耦合多源要素的数字标牌位置推荐方法
Li et al. Traffic prediction, data compression, abnormal data detection and missing data imputation: An integrated study based on the decomposition of traffic time series
CN116434069A (zh) 一种基于局部-全局Transformer网络的遥感图像变化检测方法
Kang et al. Sensitivity of sequence methods in the study of neighborhood change in the United States
Zhang et al. Hybrid attention and motion constraint for anomaly detection in crowded scenes
CN115455079A (zh) 一种基于事故数据和特征因素的事故多发点推荐方法
Cerquitelli et al. Exploring energy performance certificates through visualization.
CN107045624B (zh) 一种基于最大加权团的脑电信号预处理与分类方法
CN116259172A (zh) 考虑交通网络时空特征的城市道路速度预测方法
Son et al. Partial convolutional LSTM for spatiotemporal prediction of incomplete data
Yi et al. Gas-theft suspect detection among boiler room users: A data-driven approach
CN110909037A (zh) 一种频繁轨迹模式的挖掘方法及装置
CN115034253A (zh) 基于拉普拉斯特征映射的高通量钙信号的降维和可视化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant