CN113553350A - 一种相似演化模式聚类及动态时区划分的交通流分区模型 - Google Patents

一种相似演化模式聚类及动态时区划分的交通流分区模型 Download PDF

Info

Publication number
CN113553350A
CN113553350A CN202110587211.XA CN202110587211A CN113553350A CN 113553350 A CN113553350 A CN 113553350A CN 202110587211 A CN202110587211 A CN 202110587211A CN 113553350 A CN113553350 A CN 113553350A
Authority
CN
China
Prior art keywords
traffic flow
time
data
road
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110587211.XA
Other languages
English (en)
Other versions
CN113553350B (zh
Inventor
王知远
陈良银
陈彦如
廖俊华
刘畅
刘诗佳
何皓宇
盘昊
吴迪智
袁道华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110587211.XA priority Critical patent/CN113553350B/zh
Publication of CN113553350A publication Critical patent/CN113553350A/zh
Application granted granted Critical
Publication of CN113553350B publication Critical patent/CN113553350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提出了基于相似演化模式聚类及动态时区划分的交通流时间序列分区模型,首次尝试挖掘交通流随时间变化的动态时空特征,解决交通流时间非平稳性在短时交通流预测中的挑战。具体的工作包括:首先使用亲和力传播聚类算法(APC),自动识别出路网内具有相似交通流演化模式的路段。其次针对交通流的日内演化差异,用曲度K‑Means算法,对相似演化模式中的交通流进行动态时区划分,更深层次地挖掘路网交通流的时空状态特征。然后在相似模式识别和自动时区划分后,对不同模式下的不同时区内的交通流分别建模,对交通流的状态信息进行量化,使模型的预测精度更加准确。最后使用真实数据集对所提模型的有效性进行验证。

Description

一种相似演化模式聚类及动态时区划分的交通流分区模型
一、技术领域
本发明涉及智能交通领域,尤其涉及短时交通流预测,具体是一种以相似演 化模式为标准,对路网各路段交通流数据进行聚类,进而对具有相似演化模式各 路段的单日内交通流数据进行动态时区划分的交通流分区模型。
二、背景技术
准确实时的短时交通流预测能够有效缓解城市交通拥堵、降低城市空气污 染,具有重要社会意义。交通流数据具有趋势性,周期性和动态随机性等特性。 其中趋势性和周期性属于交通流规律特性,主要表现为根据时间规律变化的趋势 或波动,是交通流可以被预测的前提。动态随机性由区域路网交通影响因素事件 (如信号灯、行人穿行、道路事故、交通管制等)产生的,会使交通流时间序列 数据产生波动的特征。动态随机性是导致交通流难以被准确预测的根本原因。
三、发明内容
本发明的目的是进一步挖掘区域路网交通流的时空信息,建立能更加适应路 网交通流动态随机性的自适应短时交通流预测模型,以进一步提升模型预测精 度。
在时间维度上,路段不同时段内交通流的时空分布具有明显的差异(如高峰 时段和非高峰时段),一个路段的交通流演化模式会随着时间的推移而发生改变, 即交通流在单日内会呈现出显著的时间非平稳性。因此,有必要对路段单日内不 同时段的交通流进行研究。
以往交通流预测模型往往采取全时间序列建模或对时间序列的静态时间分 区建模。其中,对时间序列的静态时间分区建模往往基于日常生活经验,手动地 对路段单日内的交通流量时间序列数据进行时区划分,例如将数据分为5段: 0:00-6:00、6:00-9:00、9:00-17:00、17:00-20:00、20:00-23:59,其中6:00-9:00 和17:00-20:00为当天的早高峰和晚高峰。但是,这种分区策略往往只根据日常 经验手动划分,没有适应交通流真实的数据特点。因此,需要一种动态时间分区 策略,以适应路网交通流的时间非平稳性,更细粒度地表征交通流的时空状态特 征,以提高短时交通流模型的预测精度。
基于以上分析,本发明提出了基于相似演化模式聚类及动态时区划分的交通 流时间序列分区模型(Similar Pattern Cluster and Dynamic Timeseries Partition,SPC-DTSP),首次尝试挖掘交通流随时间变化的动态时空特征,解决 交通流时间非平稳性在短时交通流预测中带来的挑战。具体地,本章所做工作的 贡献如下:
(1)使用亲和力传播聚类算法(Affinity Propagation Cluster,APC), 自动识别出路网内具有相似交通流演化模式的路段。
(2)针对交通流的日内演化差异,使用曲度K-Means算法(Warped K-Means,WKMS),对相似演化模式中的交通流进行动态时区划分,更深层次地挖掘路网交 通流的时空状态特征。
(3)在相似模式识别和自动时区划分后,对不同模式下的不同时区内的交 通流分别建模,更细粒度地对交通流的状态信息进行量化,使模型的预测精度更 加准确。
(4)使用真实数据集对所提模型的有效性进行验证,并与现有优秀预测模 型进行效果对比,展示所提模型的先进性。
本发明的目的是这样达到的:
针对现有研究没有充分利用路网各路段交通流单日内的动态随机性,并使用 静态全局固定的模型结构进行预测的问题,本发明建立了一个基于相似演化模式 聚类及动态时区划分的交通流时间序列分区模型。首先使用亲和力传播聚类,对 路网内各路段的交通流进行分类,将具有相似演化模式的路段交通流归为一类; 然后使用曲度K-Means算法,对具有相似交通流演化模式的路段进行单日时区划 分,在时间维度上进一步细粒度地标准路段的交通流状态。在此基础上再进行对 交通流的建模预测,预测精度会得到进一步提升。
具体做法是:
首先对采集到的美国加州公路管理系统PeMS的交通流数据进行预处理工作, 包括数据聚合、缺失数据填充、异常值处理、数据筛选。以提高数据可用性,提 升模型的预测精度。
(1)数据聚合:PeMS系统原始的数据采样间隔为30s,但过短的采样间隔会 导致收集到的数据呈现出较大程度的分散性和随机性,不利于对交通时间序列数 据的分析研究。PeMS自身提供了多种数据聚合的方法,将采样间隔30s的数据 重新聚合到一个更大的时间间隔内,包括5分钟、15分钟、60分钟,以满足研 究者不同的数据需求。本文聚焦于短时交通流预测,因此选用时间间隔为5分钟 的交通流时间序列数据。
(2)缺失数据填充:由于道路环形探测器长期暴露于室外环境,会受到天气、 地磁、物理撞击等各种因素的影响,从而导致传感器发生故障乃至损害,采集到 的交通流时间序列数据可能出现局部缺失和大片缺失的状况。针对局部缺失数 据,本文采用相邻时间的数据进行线性插值计算。针对大片缺失数据,本文采用 多个相同星期编号的平均时间序列数据进行填补。
(3)异常值处理:异常值体现在交通流时间序列数据中存在数据突变。比如 在早高峰时段中,某路段8:10、8:15、8:20三个采样时间点的车流量数据为520、 20、540,很明显8:15分的数据为异常数据。针对采样数据,本文使用异常点前 后相邻采样时间点的线性均值进行替换。
(4)数据筛选:路段工作日和周末的交通流时间序列数据呈现不同的演化趋 势,工作日的时间序列数据具有较为明显的早高峰和晚高峰,而周末的单高峰时 段也一般出现在中午,这是城市居民在不同时间不同的出行习惯导致的。为了实 验数据的一致性,只选用工作日的交通流时间序列数据作为研究对象。
在进行完对交通流数据的预处理后,得到可用性更高的数据。之后,需要首 先对各路段所有时间的交通流数据进行特征表示;其次,需要对各路段的交通流 特征数据进行相似演化模式聚类;最后,对具有相似交通流演化模式的数据进行 动态时区划分,得到最后对交通流数据的时间分区结果。
1.交通流时间序列数据特征表示
各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据 采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条 路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模 式。理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后 再使用某种算法将出现的重叠簇进行过滤和组合,但这种方法加大了预测模型的 复杂度,会带来巨大的计算负载,不利于对及交通流的实时预测。为了简化计算, 对各路段所有采集时间的交通流数据以天为单位进行均值计算,获取交通流平均 时间序列,表示该路段在统计时间内的日内平均演化交模式,作为亲和力传播聚 类算法的交通流数据特征。
现假设某个路网有M条路段,该路网所有路段的的交通流量数据表示为
Figure BDA0003088166560000041
Figure BDA0003088166560000042
其中路段p的所有交通数据定义为公式(4-1):
Figure BDA0003088166560000043
其中N表示单日以5分钟为采样频率的交通流量采集数,N=288;D表示采 集天数;xp,i表示路段p第i天的交通流量时间序列数据。
将路段p的交通流数据特征设定为
Figure BDA0003088166560000044
代表了所有采集时间内的交通流平 均变化趋势。由于工作日和非工作日的交通流数据存在明显差别,本文的研究对 象仅限于路网工作日的交通流数据。
Figure BDA0003088166560000045
的定义如公式(4-2)所示:
Figure BDA0003088166560000046
2.亲和力传播聚类算法APC算法对路网所有特征序列进行聚类
使用APC算法识别交通流相似演化模式包括如下5个步骤:
(1)将每个路段的交通流量时间序列数据进行特征表示。
(2)将路段交通特征映射为数据点(Data Point)。
(3)迭代计算责任性信息(Responsibility Message)ri,j和可用性信息(Availability Message)ai,j
(4)通过全局函数判断信息传递网络是否收敛。
(5)信息传递网络收敛,得到各聚类中心及各交通流演化模式序列。
APC聚类算法的第一步是将路段i的交通流平均时间序列数据映射为N维空 间的1个数据点,路网内所有路段的交通流平均时间序列数据的数据点表示为 {1,2,…,M},所有数据点组成了一个信息传递网络,每一个数据点都是这个信息 传递网络中的一个节点。APC聚类算法将这些数据点都视为潜在的聚类中心, 并沿着信息传递网络边缘,递归地计算并传递两种类型的实值消息:ri,j和ai,j, 直至信息传递网络收敛,全局函数取得最大值,得到最佳的聚类中心点集[67]。 网络全局函数定义为公式(4-3)和公式(4-4):
Figure BDA0003088166560000051
Figure BDA0003088166560000052
其中F是路网所有数据点的聚类中心集,ci∈F是数据点i的聚类中心,
Figure BDA0003088166560000055
是 数据点i和ci的相似度,相似度通过计算二者的欧氏距离得出。任意两点i和j的相 似度计算公式定义为公式(4-5):
Figure BDA0003088166560000053
相似度值越大,表明点j作为点i的能力越大。hj是点j作为潜在聚类中心点cj的惩罚函数。如果ci选择点j作为他的聚类中心点,则点j也必须作为自己的聚类 中心,否则点j不能称为一个聚类中心点,即公式(4-6):
ci=j,only if cj=j (4-6)
两种类型信息:责任性信息ru,l和可用性信息au,l在APC算法的迭代计算中 传递[68],ri,j包含点i到候选聚类中心点j的信息,表征了点j作为点i聚类中心的适 合程度(Suitability)。ai,j包含候选聚类中心点j到点i的信息,表明点f选择点j作 为聚类中心的合适程度。通过绘制与聚类准则函数相对应的因子图,利用置信传 播更新两种信息,使因子图的全局函数最大化,从而完成聚类[69]。使用如下公 式(4-7)至公式(4-9)进行消息更新:
ri,j←si,j-∑j′s.t.j′≠{i,j}(ai,j′+si,j′) (4-7)
ai,j←min{0,rj,j+∑i′s.t.i′≠{i,j}max(0,ri′,j)} (4-8)
rj,j←∑i′s.t.i′≠jmax(0,ri′,j) (4-9)
当信息传递网络收敛后,对于每个数据点i的聚类中心ci,ci满足公式(4-10):
Figure BDA0003088166560000054
当完成了对所有数据点的聚类后,便可以得出如公式(4-11)所示的聚类中 心点集:
C={ci,i∈[1,w],1<w<M} (4-11)
其中w是中心个数,M是路网路段总数。
对聚类中心点集进行去重后,便可以得到公式(4-12)所示的路网交通流演 化模式点集:
P=unique(C)={p1,p2,...,pr} (4-12)
其中r即为聚类得到的交通流演化模式数目,r=len(P)。
任意一种交通模式i所包含的路段点集为Si,则模式i所包含的路段个数为 Ni=|Si|,Si如公式(4-13)所示:
Si={j|pi=cj} (4-13)
假设所有交通流演化模式时间序列特征集为L,则L的表示如公式(4-14)所 示:
Figure BDA0003088166560000061
其中N为单日内的交通流数据采集数目。
在得到聚类结果后,为更直观地展示各路段特征时间序列与聚类中心时间序 列的数据分布情况,本节将所有路段的特征时间序列数据集Xp进行标准分数转 换。标准分数的定义如公式(4-15)所示:
Figure BDA0003088166560000062
其中,E[Xp]是Xp的期望,
Figure BDA0003088166560000066
是Xp的标准差。
3.曲度K-Means时区划分算法
曲度K-Means算法的输入是通过APC聚类算法得到的交通流演化模式时间 序列集合P,对P中每个交通流演化模式序列分别进行时区划分。通过迭代计算, WKMS算法得到离散分布的同质类。
在算法初始阶段,设置聚类边界点bi(黑色点)。由于引入了强制序列限制, 在每一个迭代计算过程,时间序列的前一半元素只能向左移动到边界前面数据点 (橘色点);时间序列的后一半元素只能向右移动到边界的后面。通过这种限制, 对整个交通流时间序列数据进行时区划分。
现假设经过APC聚类,任意第p种交通流演化模式的时间序列特征数据为
Figure BDA0003088166560000063
WKMS的目标在于将
Figure BDA0003088166560000064
划分为kp个不同的数据类
Figure BDA0003088166560000065
1<kp<<288,每一个数据类代表着一个时间分区的交通流数 据,kp是WKMS对第m种演化模式交通流的时间分区数目。在每一次迭代计算 中,每一种演化模式中的每一个聚类数目的轮廓系数都会被计算,当轮廓系数值 取得最大值时,该时刻的聚类数目即为最佳时区划分数目,即此时第m种交通流 演化模式的分区数目kp
至此,便完成了对相似交通流演化模式的动态时区划分。经过时区划分后, 假设第q个时区内的交通流数据总数为
Figure BDA0003088166560000071
则时区交通数据 和第p种演化模式的交通流时间序列数据的映射关系如公式(4-16)和公式(4-17) 所示:
{1,2,…,kp}→{1,2,…,288} (4-16)
Figure BDA0003088166560000072
其中kp是时间分区数目,
Figure BDA0003088166560000073
表示第p种交通流演化模式中第p个时间分区的 交通流数据。
四、附图说明
图1是相似演化模式聚类及动态时区划分的交通流时间序列分区模型结构图。
图2是亲和力传播聚类模型示意图。
图3是APC聚类算法流程。
图4是曲度K-Mens进行交通流动态时区划分示意图。
五、具体实施方式
本发明分3部分实施:
(1)交通流数据特征表示:为了简化计算,对各路段所有采集时间的交通流 数据以天为单位进行均值计算,获取交通流平均时间序列,表示该路段在统计时 间内的日内平均演化交模式,作为亲和力传播聚类算法的交通流数据特征。
(2)对交通流特征数据进行相似演化模式聚类:由于路网内各路段间存在物 理上直接或间接的连接,某个路段的交通状态在一定程度上会受其周围路段交通 状态的影响,这就形成了路段间的空间相关性和交通流协同演化模式。在进行完 交通流数据的特征表示后,本发明使用亲和力聚类传播算法对路网内具有相似演 化模式的路段交通流进行分类,使得预测模型的构建范围缩小在一个更加精确的 数据范围。
(3)动态时区划分:对聚类后的具有相似演化模式的交通流数据进行动态 时区划分。城市交通流在一天中不同时段呈现不同演化模式,各时段的交通流数 据分布呈现出明显差别。一天中非高峰时段的数据趋势平缓,高峰时段的数据呈 上升和下降趋势,且不同工作日之间、工作日和周末的单日内各时段的交通流数 据分布又各不相同。因此,准确识别出各时段交通流的数据分布特征,更加细粒 度地刻画单日交通流的演化模式对于预测模型的性能提高起着重要作用。因此使 用改进的K-Means算法曲度K-Means对聚类后的具有相似演化模式的交通流数据 进行动态时区划分。
本发明的用户使用场景举例:
一个有效的交通流预测模型对于路线规划、交通控制和智能驾驶等方面十分 重要。出行者可以利用流量预测信息判断道路未来拥堵情况,制定更加高效的出 行计划。实时的路况预测分析也有助于出行者及时调整前进路线,减少交通拥堵 的发生。交通管理者可以利用预测模型监控交通状态,提前对可能发生拥堵的区 域采取交通信号控制等措施。在车祸等紧急事件发生时,周边路段的未来交通流 变化趋势有助于交通管理者合理分配资源,从而提升疏散和救援的速度。对于智 能驾驶和车联网等应用而言,精准的速度预测信息是智能车辆协同系统的基础, 也是提升道路通行能力和安全性的重要保障。
综上所述,交通流预测研究对改善交通问题和提升出行效率等方面有着不可 替代的意义。

Claims (4)

1.一种相似演化模式聚类及动态时区划分的交通流时间序列分区模型,其特征在于:
通过对不同路段交通流数据的特征表示及聚类,提出了一种基于相似演化模式聚类及动态时区划分的交通流时间序列分区模型(Similar Pattern Cluster and DynamicTimeseries Partition,SPC-DTSP),首次尝试挖掘交通流随时间变化的动态时空特征,解决交通流时间非平稳性在短时交通流预测中带来的挑战;通过美国加州101公路真实交通数据集的实证研究表明,所提模型相对于传统时空K近邻模型和深度学习模型有更高的预测精度;
具体地,首先对路网个路段交通流数据进行特征表示;其次使用亲和力传播聚类算法对路网内具有相似演化模式的路段交通流进行分类;最后使用曲度K-Means算法对分类后的交通流数据进行动态时区划分,得到最终的对交通流数据的时间分区结果;
算法步骤:
(1)交通流时间序列数据特征表示:各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模式,理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后再使用某种算法将出现的重叠簇进行过滤和组合,但这种方法加大了预测模型的复杂度,会带来巨大的计算负载,不利于对及交通流的实时预测,为了简化计算,对各路段所有采集时间的交通流数据以天为单位进行均值计算,获取交通流平均时间序列,表示该路段在统计时间内的日内平均演化交模式,作为亲和力传播聚类算法的交通流数据特征;
(2)亲和力传播聚类算法APC算法对路网所有特征序列进行聚类:由于路网内各路段间存在物理上直接或间接的连接,某个路段的交通状态在一定程度上会受其周围路段交通状态的影响,这就形成了路段间的空间相关性和交通流协同演化模式,在进行完交通流数据的特征表示后,本发明使用亲和力聚类传播算法对路网内具有相似演化模式的路段交通流进行分类,使得预测模型的构建范围缩小在一个更加精确的数据范围;
(3)构建动态时空加权欧氏距离:曲度K-Means算法的输入是通过APC聚类算法得到的交通流演化模式时间序列集合P,对P中每个交通流演化模式序列分别进行时区划,通过迭代计算,WKMS算法得到离散分布的同质类。
2.如权利要求1所述的基于对交通流数据进行特征表示,其特征在于:各路段单日内的交通流时间序列数据呈现出一条时变曲线,以5分钟的数据采样频率为例,该交通流时变曲线以288个交通流数据为组成元素,构成了一条路段一天的交通流时间序列,曲线的走势反映出来路段单日内的交通流演化模式,理论上应当对所有采集时间(D天)的交通流时间序列数据进行聚类,然后再使用某种算法将出现的重叠簇进行过滤和组合,但这种方法加大了预测模型的复杂度,会带来巨大的计算负载,不利于对及交通流的实时预测,为了简化计算,对各路段所有采集时间的交通流数据以天为单位进行均值计算,获取交通流平均时间序列,表示该路段在统计时间内的日内平均演化交模式,作为亲和力传播聚类算法的交通流数据特征。
3.如权利要求2所述的使用亲和力传播聚类算法APC算法对路网所有特征序列进行聚类过程,其特征在于:对时空K近邻建模过程的4个关键步骤进行优化,具体的:
使用APC算法识别交通流相似演化模式包括如下5个步骤:1将每个路段的交通流量时间序列数据进行特征表示;2将路段交通特征映射为数据点(Data Point);3迭代计算责任性信息(Responsibility Message)ri,j和可用性信息(Availability Message)ai,j;4通过全局函数判断信息传递网络是否收敛;5信息传递网络收敛,得到各聚类中心及各交通流演化模式序列;
APC聚类算法的第一步是将路段i的交通流平均时间序列数据映射为N维空间的1个数据点,路网内所有路段的交通流平均时间序列数据的数据点表示为{1,2,…,M},所有数据点组成了一个信息传递网络,每一个数据点都是这个信息传递网络中的一个节点,APC聚类算法将这些数据点都视为潜在的聚类中心,并沿着信息传递网络边缘,递归地计算并传递两种类型的实值消息ri,j和ai,j,直至信息传递网络收敛,全局函数取得最大值,得到最佳的聚类中心点集。
4.如权利要求2所述的使用曲度K-Means时区划分算法,其特征在于:度K-Means算法的输入是通过APC聚类算法得到的交通流演化模式时间序列集合P,对P中每个交通流演化模式序列分别进行时区划分,通过迭代计算,WKMS 算法得到离散分布的同质类,在算法初始阶段,设置聚类边界点,由于引入了强制序列限制,在每一个迭代计算过程,时间序列的前一半元素只能向左移动到边界前面数据点;通过这种限制,对整个交通流时间序列数据进行时区划分;
现假设经过APC聚类,任意第p种交通流演化模式的时间序列特征数据为
Figure FDA0003088166550000031
WKMS的目标在于将
Figure FDA0003088166550000032
划分为kp个不同的数据类
Figure FDA0003088166550000033
每一个数据类代表着一个时间分区的交通流数据,kp是WKMS对第m种演化模式交通流的时间分区数目,在每一次迭代计算中,每一种演化模式中的每一个聚类数目的轮廓系数都会被计算,当轮廓系数值取得最大值时,该时刻的聚类数目即为最佳时区划分数目,即此时第m种交通流演化模式的分区数目kp,至此,便完成了对相似交通流演化模式的动态时区划分。
CN202110587211.XA 2021-05-27 2021-05-27 一种相似演化模式聚类及动态时区划分的交通流分区模型 Active CN113553350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110587211.XA CN113553350B (zh) 2021-05-27 2021-05-27 一种相似演化模式聚类及动态时区划分的交通流分区模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110587211.XA CN113553350B (zh) 2021-05-27 2021-05-27 一种相似演化模式聚类及动态时区划分的交通流分区模型

Publications (2)

Publication Number Publication Date
CN113553350A true CN113553350A (zh) 2021-10-26
CN113553350B CN113553350B (zh) 2023-07-18

Family

ID=78101897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110587211.XA Active CN113553350B (zh) 2021-05-27 2021-05-27 一种相似演化模式聚类及动态时区划分的交通流分区模型

Country Status (1)

Country Link
CN (1) CN113553350B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114627646A (zh) * 2022-03-06 2022-06-14 南京理工大学 一种基于车牌识别数据的路段交通流模式识别方法及系统
CN118015840A (zh) * 2024-04-08 2024-05-10 杭州海康威视数字技术股份有限公司 宏观子区的划分方法、装置、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103680158A (zh) * 2013-10-14 2014-03-26 长沙理工大学 基于c-均值模糊聚类分析的控制子区动态划分方法
CN105702029A (zh) * 2016-02-22 2016-06-22 北京航空航天大学 一种分时段考虑时空关联性的快速路交通状态预测方法
US20160359872A1 (en) * 2015-06-05 2016-12-08 Cisco Technology, Inc. System for monitoring and managing datacenters
CN107705556A (zh) * 2017-09-01 2018-02-16 南京邮电大学 一种基于支持向量机和bp神经网络结合的交通流预测方法
CN108898829A (zh) * 2018-06-07 2018-11-27 重庆邮电大学 针对无差异性划分和数据稀疏的动态短时交通流预测系统
CN109190797A (zh) * 2018-08-03 2019-01-11 北京航空航天大学 一种基于改进k最近邻的大规模路网状态短时预测方法
CN109598936A (zh) * 2018-12-18 2019-04-09 中国科学院地理科学与资源研究所 一种基于动态stknn模型的短时交通预测方法
CN109784354A (zh) * 2017-11-14 2019-05-21 中移(杭州)信息技术有限公司 基于改进分类效用的无参数聚类方法及电子设备
CN110111561A (zh) * 2019-03-27 2019-08-09 浙江工业大学 一种基于som-pam聚类算法的路网动态划分方法
CN111339978A (zh) * 2020-03-02 2020-06-26 北京建筑大学 利用卷积神经网络模型识别交通指数时间序列模式的方法
CN111523003A (zh) * 2020-04-27 2020-08-11 北京图特摩斯科技有限公司 一种以时序动态图谱为核心的数据应用方法及平台

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103680158A (zh) * 2013-10-14 2014-03-26 长沙理工大学 基于c-均值模糊聚类分析的控制子区动态划分方法
US20160359872A1 (en) * 2015-06-05 2016-12-08 Cisco Technology, Inc. System for monitoring and managing datacenters
CN105702029A (zh) * 2016-02-22 2016-06-22 北京航空航天大学 一种分时段考虑时空关联性的快速路交通状态预测方法
CN107705556A (zh) * 2017-09-01 2018-02-16 南京邮电大学 一种基于支持向量机和bp神经网络结合的交通流预测方法
CN109784354A (zh) * 2017-11-14 2019-05-21 中移(杭州)信息技术有限公司 基于改进分类效用的无参数聚类方法及电子设备
CN108898829A (zh) * 2018-06-07 2018-11-27 重庆邮电大学 针对无差异性划分和数据稀疏的动态短时交通流预测系统
CN109190797A (zh) * 2018-08-03 2019-01-11 北京航空航天大学 一种基于改进k最近邻的大规模路网状态短时预测方法
CN109598936A (zh) * 2018-12-18 2019-04-09 中国科学院地理科学与资源研究所 一种基于动态stknn模型的短时交通预测方法
CN110111561A (zh) * 2019-03-27 2019-08-09 浙江工业大学 一种基于som-pam聚类算法的路网动态划分方法
CN111339978A (zh) * 2020-03-02 2020-06-26 北京建筑大学 利用卷积神经网络模型识别交通指数时间序列模式的方法
CN111523003A (zh) * 2020-04-27 2020-08-11 北京图特摩斯科技有限公司 一种以时序动态图谱为核心的数据应用方法及平台

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TAO GUO等: "Adaptive Affinity Propagation Clustering", 《ARTIFIACAL INTELLIGENCE》 *
华明壮: "基于订单数据挖掘的共享单车调度需求分析方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114627646A (zh) * 2022-03-06 2022-06-14 南京理工大学 一种基于车牌识别数据的路段交通流模式识别方法及系统
CN118015840A (zh) * 2024-04-08 2024-05-10 杭州海康威视数字技术股份有限公司 宏观子区的划分方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113553350B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN110782070B (zh) 一种城市轨道交通突发事件客流时空分布预测方法
CN108417033B (zh) 基于多维因素的高速路交通事故分析预测方法
CN107610469A (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
GB2599765A (en) Vehicle traffic flow prediction method with missing data
CN113096388B (zh) 一种基于梯度提升决策树的短时交通流量预测方法
CN113159364A (zh) 一种大型交通场站的客流预测方法及系统
CN113553350A (zh) 一种相似演化模式聚类及动态时区划分的交通流分区模型
CN114495507B (zh) 融合时空注意力神经网络和交通模型的交通流预测方法
CN114463972B (zh) 一种基于etc门架通信数据的路段区间交通分析预测方法
CN113537626B (zh) 一种聚合信息差异的神经网络结合时间序列预测的方法
CN113420414A (zh) 一种基于动态时空分析的短时交通流预测模型
Tu et al. Research on intelligent calculation method of intelligent traffic flow index based on big data mining
CN117671992A (zh) 一种公交车智能调度方法及系统
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
CN110659774B (zh) 大数据方法驱动的停车需求预测方法
CN110490365B (zh) 一种基于多源数据融合预测网约车订单量的方法
Liu et al. An improved fuzzy trajectory clustering method for exploring urban travel patterns
CN114463978B (zh) 一种基于轨道交通信息处理终端的数据监测方法
CN116612633A (zh) 一种基于车路协同感知下的自适应动态路径规划方法
CN114005100B (zh) 一种基于聚类分析的路侧停车位分类方法
CN112508225A (zh) 基于谱聚类算法的多细节交通小区划分方法及系统
Niu et al. Highway Temporal‐Spatial Traffic Flow Performance Estimation by Using Gantry Toll Collection Samples: A Deep Learning Method
Wang et al. A hybrid deep learning approach for traffic flow prediction in highway domain
Zhu et al. Demand estimation and spatio-temporal clustering for urban road networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant