CN113420414B - 一种基于动态时空分析的短时交通流预测模型 - Google Patents

一种基于动态时空分析的短时交通流预测模型 Download PDF

Info

Publication number
CN113420414B
CN113420414B CN202110584457.1A CN202110584457A CN113420414B CN 113420414 B CN113420414 B CN 113420414B CN 202110584457 A CN202110584457 A CN 202110584457A CN 113420414 B CN113420414 B CN 113420414B
Authority
CN
China
Prior art keywords
time
space
prediction
traffic flow
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110584457.1A
Other languages
English (en)
Other versions
CN113420414A (zh
Inventor
文攀
陈良银
陈彦如
赵万槟
刘诗佳
廖俊华
牛毅
邹可欣
兰镇宇
袁道华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110584457.1A priority Critical patent/CN113420414B/zh
Publication of CN113420414A publication Critical patent/CN113420414A/zh
Application granted granted Critical
Publication of CN113420414B publication Critical patent/CN113420414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于动态时空分析的短时交通流预测方法,具体包括:系统建模:提出用于表征区域路网各路段交通状态的动态的交通流时空状态矩阵,精准化地定量表征了路段的交通状态;提出用于计算交通流时空状态矩阵之间相似度的交通流动态时空权重矩阵,动态地为时空状态矩阵的每个数据元素分配权值,以构建动态时空加权欧氏距离,优化K近邻模型的近邻搜索机制;提出基于相似度占比的加权预测法,使用美国加州公路管理系统PeMS的真实交通流量数据集进行实证研究。讨论了包含均值预测、反距离加权预测、等级加权预测三种预测函数的精度表现。与现有的统计理论和人工神经网络模型对比,验证了本发明所提模型在短时交通流预测中具有更好的预测精度。

Description

一种基于动态时空分析的短时交通流预测模型
一、技术领域
本发明涉及智能交通领域,尤其涉及短时交通流预测,具体是一种针对路网交通流动态时空分析的短时交通流预测模型。
二、背景技术
准确实时的短时交通流预测能够有效缓解城市交通拥堵、降低城市空气污染,具有重要社会意义。交通流数据具有趋势性,周期性和动态随机性等特性。其中趋势性和周期性属于交通流规律特性,主要表现为根据时间规律变化的趋势或波动,是交通流可以被预测的前提。动态随机性由区域路网交通影响因素事件(如信号灯、行人穿行、道路事故、交通管制等)产生的,会使交通流时间序列数据产生波动的特征。动态随机性是导致交通流难以被准确预测的根本原因。
非参数模型基于数据驱动,以其强大的数据信息提取能力在拟合交通流数据动态随机性上具有强大优势。而在众多的非参数模型之中,基于模式匹配原理的时空K近邻模型以其良好的预测准确性、良好的参数可解释型和强大的模型泛化能力被广泛地运用在各种交通流预测场景之中,因此本发明选择时空K近邻模型作为优化的对象。
时空K近邻模型有四个主要步骤,分别是构建交通向量、交通流状态向量相似度度量、选择K个相似向量以及构建预测函数进行结果预测。在时空K近邻模型优化的相关研究中,研究者分别对距离度量函数、K值选择和预测函数进行了优化。首先,这些研究直接使用预测目标路段历史交通流数据和其上下游路段的交通流数据进行建模,这种构建方式并没有充分地考虑路网交通流的动态随机特性;其次,传统相似度度量方法直接采用等权重的计算方法对两个交通流状态向量进行欧式距离计算,没有考虑不同时刻历史数据和上下游路段交通流对预测目标路段未来交通数据预测产生的不同影响;并且,现有研究大多采用等权重或较为复杂但精度并不高的高斯加权预测算法。通过以上分析,本发明基于对路网交通流的动态时空分析,构建了自适应时空加权增强K近邻模型预测模型(AdaptiveSpatio-Temporal Weighted Enhanced K-Nearest Neighbor,ASTWE-KNN),以更好地适应路网交通流的动态随机性,实现对各路段交通流的定制化建模预测。
三、发明内容
本发明的目的是进一步挖掘区域路网交通流的时空信息,建立能更加适应路网交通流动态随机性的自适应短时交通流预测模型,以进一步提升模型预测精度。
本发明的目的是这样达到的:
针对现有研究没有充分利用路网交通流的动态随机性,并使用静态全局固定的模型结构进行预测的问题,本发明建立了一个自适应动态时空K近邻模型,实现对各路段的定制化建模预测。根据相关计算模型,计算出各个路段最相关的路网交通流时空信息,以此构建交通流动态时空状态矩阵、动态时空加权欧氏距离,以优化K近邻模型的最佳近邻搜索机制。此外,本发明还提出了一种基于相似度占比的短时交通流预测算法,通过最大限度发挥最近邻在预测过程中的数据优势,进一步提升模型的预测精度。
具体做法是:
首先对采集到的美国加州公路管理系统PeMS的交通流数据进行预处理工作,包括数据聚合、缺失数据填充、异常值处理、数据筛选。以提高数据可用性,提升模型的预测精度。
(1)数据聚合:PeMS系统原始的数据采样间隔为30s,但过短的采样间隔会导致收集到的数据呈现出较大程度的分散性和随机性,不利于对交通时间序列数据的分析研究。PeMS自身提供了多种数据聚合的方法,将采样间隔30s的数据重新聚合到一个更大的时间间隔内,包括5分钟、15分钟、60分钟,以满足研究者不同的数据需求。本文聚焦于短时交通流预测,因此选用时间间隔为5分钟的交通流时间序列数据。
(2)缺失数据填充:由于道路环形探测器长期暴露于室外环境,会受到天气、地磁、物理撞击等各种因素的影响,从而导致传感器发生故障乃至损害,采集到的交通流时间序列数据可能出现局部缺失和大片缺失的状况。针对局部缺失数据,本文采用相邻时间的数据进行线性插值计算。针对大片缺失数据,本文采用多个相同星期编号的平均时间序列数据进行填补。
(3)异常值处理:异常值体现在交通流时间序列数据中存在数据突变。比如在早高峰时段中,某路段8:10、8:15、8:20三个采样时间点的车流量数据为520、20、540,很明显8:15分的数据为异常数据。针对采样数据,本文使用异常点前后相邻采样时间点的线性均值进行替换。
(4)数据筛选:路段工作日和周末的交通流时间序列数据呈现不同的演化趋势,工作日的时间序列数据具有较为明显的早高峰和晚高峰,而周末的单高峰时段也一般出现在中午,这是城市居民在不同时间不同的出行习惯导致的。为了实验数据的一致性,只选用工作日的交通流时间序列数据作为研究对象。
其次,数据预处理之后进行交通流的相关性计算,对各路段建立适应其交通流数据特征的时空状态矩阵和时空加权欧氏距离。
1.构建动态时空状态矩阵
传统K近邻模型使用单一时间序列的状态向量表征路段的交通状态,时空K近邻模型以时空状态矩阵表征路段的交通状态,通过纳入交通流空间信息,更加详细地描述了路段的交通状态。但由于城市交通流存在空间异质性,不同路段的交通流时空状态特征不尽相同,因此需要动态地为各路段确定与自身交通流相适应的时空状态矩阵,进一步地精准化表征路段的交通状态,即为本节所提出的动态时空状态矩阵(Dynamic Spatio-TemporalState Matrix,DSTSM)。
动态时空状态矩阵由动态空间邻居和动态预测时间窗确定。空间邻居是和预测目标路段交通流数据相关性较高的路段,描述了预测目标路段和路网内其他路段的空间相关性;预测时间窗由预测目标路段时间序列中与未来时刻交通数据相关的历史数据组成,对应于传统K近邻模型中的状态向量,描述了交通流时间序列数据的时间相关性。因此,DSTSM的构建包括两个关键步骤:动态空间邻居的确定和动态预测时间窗的确定。
(1)动态空间邻居的确定
一个路段的空间邻居被定义为会对该路段的交通流状态产生影响的周围路段。空间邻居可能是与该路段直接连接的路段,也可能是与该路段间接连接的路段。由于路段的交通状态同时受到交通路网的内部因素和外部因素影响(包括区域拥堵、行人穿行、红绿灯、道路施工等因素),各路段所受到的影响因素不同,导致了其交通流演化模式也不同。并且,由于路网内部各路段存在着直接或间接的物理连接关系,各路段之间的交通流也相互影响。因此,需要使用某种方法找出和预测目标路段交通状态密切相关的路段作为空间邻居,将空间邻居的交通流信息纳入到预测模型,有助于预测精度的提升。
确定预测目标路段空间邻居的方法实质是分析目标路段交通流时间序列数据与路网其他路段交通流时间序列数据的相关性。皮尔逊相关系数法是常用的分析路段见交通流数据相关性的方法,但由于路段间的交通流影响存在时滞,传统的皮尔逊相关系数法不能体现这种影响时滞,以此采用其延迟版本的互相关函数来计算两个交通流时间序列在特定时滞下的相关系数,以更加准确地计算路段间的空间相关性。
以某路段i和路段j为例,其交通流时间序列数据如公式(3-1)和公式(3-2)所示:
xi={voli(t),t0<<t<<tn},1<<i<<s (3-1)
xj={volj(t),t0<<t<<tn},1<<j<<s (3-2)
其中t0,tn表示数据采集起止时间,s表示路网路段数目,vol(t)表示路段t时刻的流量数据。
xi和xj在时滞τ下的互相关函数定义如公式(3-3)所示:
Figure BDA0003087642300000041
其中
Figure BDA0003087642300000042
Figure BDA0003087642300000043
表示xi和xj的序列标准差,
Figure BDA0003087642300000044
表示xi和xj在时滞τ下的相关系数。
Figure BDA0003087642300000045
Figure BDA0003087642300000046
如公式(3-4)和公式(3-5)所示:
Figure BDA0003087642300000047
Figure BDA0003087642300000048
其中E(xi)和E(xj)是xi和xj的序列均值,voli(t)和volj(t)是xi和xj序列中的数据元素,t∈[t0,tn]。
Figure BDA0003087642300000049
如公式(3-6)所示:
Figure BDA0003087642300000051
如公式3.3所示,互相关函数是关于时滞τ函数,互相关函数值随τ的变化而异。使互相关函数取得最大值的时延
Figure BDA0003087642300000052
是路段j对路段i交通状态影响的最大时滞范围。如公式(3-7)所示,
Figure BDA0003087642300000053
被定义为:
Figure BDA0003087642300000054
Figure BDA0003087642300000055
被视为判断路段j能否作为路段i空间邻居的标准。在特定交通状态下,周围路段对预测目标路段交通状态影响的传播距离在给定的预测时间范围内是大致固定的[49],因此如果
Figure BDA0003087642300000056
处于预测时间步长之内,则路段j被确定为路段i空间邻居。路段i的空间邻居确
定标准如公式(3-8)所示:
Figure BDA0003087642300000057
其中SNi是路段i的空间邻居集,Δt是预测时间步长,本文预测当前时刻未来5分钟的交通流量,所以Δt=1。
(2)动态预测时间窗的确定
预测时间窗包含了与未来交通数据密切相关的历史交通流数据,预测时间窗内的交通数据组成了传统K近邻模型中的状态向量。在动态时空状态矩阵DSTSM的构建过程中,空间邻居集SNi决定了矩阵的空间维数,预测时间窗决定了矩阵的时间维数。因此,预测时间窗的确定是构建DSTSM的另一个重要步骤。
在时间维度上,路段某一时刻的交通流会受到一个最大历史时间范围内交通流的影响。因此,当要预测(t+1)时刻的交通流数据时,需要确定(t+1)之前m个和(t+1)时刻的交通流数据有明显相关性的历史交通流数据,这m个历史数据便组成了预测时间窗。因此,预测时间窗的确定是选取预测目标路段时间序列中与未来时刻交通数据相关的历史交通流数据的过程。区别于以往研究者的对预测时间窗的静态设定方法[50][51],考虑到路网交通流的动态随机性,本节使用自相关函数,为路网各路段确定与自身交通流相适应的定制化预测时间窗。
自相关函数用于计算某个时间序列x和x在某个时滞τ后的时间序列y之间的数据相关性,自相关函数的计算公式如公式(3-9)和公式(3-10)所示:
Figure BDA0003087642300000058
Figure BDA0003087642300000059
其中n是时间序列数据采样个数,
Figure BDA00030876423000000510
是时间序列的均值,τ∈[0,h],且h<n。
使用自相关函数确定动态预测时间窗包括以下三个步骤:
第一,计算各路段时间序列的自相关函数。观察函数值的分布情况,取相关函数值为正的最大时延τmax作为预测时间窗最大的取值空间。
第二,在确定的预测时间窗最大的取值空间内,计算每一个时延的交通流预测精度。
第三,选择预测精度最高的时延作为模型的预测时间窗。
在确定了动态空间邻居和预测时间窗,动态时空状态矩阵就可以随之确定了。动态时空状态矩阵用于表征路段在某一时刻的交通状态。动态时空状态矩阵的构建,是根据已经确定的空间邻居数目m和预测时间窗长度n,从路网各路段的交通流时间序列数据中选取相关数据片段,组成一个m×n维矩阵的过程。
现假设有预测目标路段u,经过相关性计算,得到了u在当前时刻t的空间邻居数目为
Figure BDA0003087642300000061
预测时间窗长度为
Figure BDA0003087642300000062
则u在t时刻的动态时空状态矩阵的定义如公式(3-11)所示:
Figure BDA0003087642300000063
其中x表示所在区域路网内的路段总数,
Figure BDA0003087642300000064
表示u的第i个空间邻居,
Figure BDA0003087642300000065
Figure BDA0003087642300000066
Figure BDA0003087642300000067
表示u当前时刻t的流量数据。
2.动态时空加权欧氏距离DSTWED的构建
本发明提出了动态时空权重矩阵(Dynamic Spatio-Temporal WeightedEuclidean Distance,DSTWED)。针对路网不同路段的交通状态,动态地为时空状态矩阵中的各交通数据元素分配大小不等的权值,以适应路网交通流的时空相关性和动态随机性。然后将DSTWM引入到传统欧氏距离,形成动态时空加权欧氏距离DSTWED,更加准确地对交通流动态时空状态矩阵进行相似度度量。其构建包括计算动态空间权重和计算动态时间权重。
(1)动态空间权重的确定
动态空间权重依据各空间邻居与预测目标路段之间的互相关函数而定。现假设以计算路段u空间权重为例,其空间权重函数的定义如公式(3-12)所示:
Figure BDA0003087642300000068
其中
Figure BDA0003087642300000069
表示u的第i个空间邻居,
Figure BDA00030876423000000610
表示u的空间邻居总数,
Figure BDA00030876423000000611
表示u和
Figure BDA00030876423000000612
的互相关函数值,
Figure BDA00030876423000000613
的第i个空间邻居的空间权重。
考虑到将空间权重引入到传统欧氏距离后要和动态时空状态矩阵相乘,所以为了方便计算,本文同样以矩阵的形式展示权重,空间权重矩阵如公式(3-13)所示:
Figure BDA0003087642300000071
(2)动态时间权重的确定
在时间维度上,本节使用与预测目标时刻的时间接近度为预测时间窗内的历史交通流数据分配不同的时间权重,以体现各历史交通数据对预测未来交通数据的不同贡献程度。同样以计算路段u时间权重为例,其时间权重函数的定义如公式(3-14)所示:
Figure BDA0003087642300000072
其中ti表示预测时间窗中第i个历史交通数据的编号,
Figure BDA0003087642300000073
表示预测时间窗的长度,
Figure BDA0003087642300000074
表示第i个历史交通数据的时间权重。
同样考虑到将时间权重引入到传统欧氏距离后要和动态时空状态矩阵相乘,所以为了方便计算,本文同样以矩阵的形式展示时间权重,时间权重矩阵如公式(3-15)所示:
Figure BDA0003087642300000075
(3)构建动态时空加权欧氏距离DSTWED
以预测目标路段u为例,对时空权重的计算进行简单的举例说明。对于空间权重:经过互相关函数计算,从路网中选出了u的3个空间邻居路段,分别为路段d、路段p、路段q,三条路段和预测目标路段的互相关函数值分别为0.2、0.3、0.5。根据互相关函数值,d、p、q对u在空间维度上的交通流影响权值分别为0.2/(0.2+0.3+0.5)=0.2,0.3/(0.2+0.3+0.5)=0.3和0.5/(0.2+0.3+0.5)=0.5,构成的空间权重如公式(3-16)所示:
Figure BDA0003087642300000076
对于时间权重:经过对u交通流时间序列的自相关函数计算,得出预测时间窗长度为3,预测时间窗内包含的数据分别为volu(t-2),volu(t-1),volu(t),那么它们对u未来(t+1)时刻交通流数据的影响程度分别为
Figure BDA0003087642300000077
Figure BDA0003087642300000081
构成的时间权重如公式(3-17)所示:
Figure BDA0003087642300000082
当完成了对预测路段u的空间权重矩阵和时间权重矩阵的构建后,就可以将时空权重矩阵引入到欧氏距离,形成时空加权欧氏距离,计算当前时空状态矩阵
Figure BDA0003087642300000083
和历史库中所有时空状态矩阵
Figure BDA0003087642300000084
的相似度
Figure BDA0003087642300000085
时空加权欧氏距离的定义如公式(3-18)所示:
Figure BDA0003087642300000086
3.现有预测函数分析及基于相似度占比的加权预测函数PFSR的构造
在计算了预测目标路段当前时刻交通流时空状态矩阵和历史库中所有历史当前时刻的时空状态矩阵的相似度之后,通过确定的预测目标路段的最佳K值,便可以得到预测目标路段的最佳近邻。最后,将K个最佳近邻(t+1)时刻的交通流数据输入到预测函数,就得到了预测目标路段(t+1)时刻的交通流数据,即为最终的预测结果。因此,预测函数是构建自适应时空加权增强K近邻模型的最后一个重要步骤。
传统K近邻模型使用统计均值法生成预测结果。但由于各最佳近邻与当前时空状态矩阵的相似度不同,对预测目标路段未来交通状态的影响程度不同,统计均值预测方法并没有“扬长避短”,即没有发挥高相似度近邻在预测中应有的优势、规避低相似度近邻在预测中存在的劣势。所以,应使用权值分配法在预测过程中根据相似度为不同近邻分配不同权值,以提高模型预测精度。
现有研究分析讨论了一系列权值分配方法,包括等级加权法[52]、反距离加权法[53]和高斯加权法。其中,由于高斯加权法复杂的高斯计算因子α确定过程及有限的效果提升,因此本节不讨论高斯加权法在预测公式中的使用。均值法、等级加权法、反距离加权法的定义公式(3-19)至公式(3-21)所示:
Figure BDA0003087642300000087
Figure BDA0003087642300000088
ρRank(i)=(Ku-ri+1)2 (3-21)
其中u表示预测目标路段,i表示近邻编号,DIST表示u当前时刻交通流时空状态矩阵与第i个近邻的欧氏距离;Ku表示u的最佳近邻个数,ri表示根据相似度第i个近邻在所有近邻中的排名。
通过动态时空加权欧氏距离可以计算出预测目标路段当前时空状态矩阵和历史库中所有历史时空状态矩阵的相似度,将所有相似度数值降序排列,选排名前K个的历史时空状态矩阵作为预测目标路段当前时空状态矩阵的K个最佳近邻。
考虑到K个最佳近邻与当前时空状态矩阵之间相似度的差异,本文提出一种基于相似度占比的权重分配法:以每个最佳近邻和当前时空状态矩阵之间的相似度数值
Figure BDA0003087642300000091
与所有K个近邻和当前时空状态矩阵之间的相似度数值总和
Figure BDA0003087642300000092
的比值为权值,合理地将权重分配给每个最佳近邻。基于相似度占比的权重分配法的定义如公式(3-22)所示:
Figure BDA0003087642300000093
本发明的积极效果是:
1、针对现有时空K近邻模型无法适应路网交通流动态随机性的缺陷,本发明提出了动态时空状态矩阵和动态时空加权欧式距离,大大优化了模型最佳近邻的搜索机制,提升了模型的预测准确率。
2、对于最后的结果预测,本发明提出了基于相似度占比的短时交通流预测算法。该算法以每个最佳近邻和当前时空状态矩阵之间的相似度数值与所有所有近邻和当前时空状态矩阵之间的相似度数值总和的比值为权值,合理地将权重分配给每个最佳近邻,以最大程度发挥相似度最大的近邻在预测中的效用,以获取更加准确的预测结果。
四、附图说明
图1是ASTWE-KNN模型算法流程图。
五、具体实施方式
本发明分5部分实施:
(1)构建时空状态矩阵:首先使用互相关函数分析路网内各路段间的空间相关性,为每条路段确定最优的空间邻居;其次,使用自相关函数和交叉验证方法,分析单条路段交通流时间序列数据之间的时间相关性,为每条路段确定最优的预测时间窗。最后,根据确定的空间邻居和预测时间窗,从交通流数据中截取相关时空数据片段,组成时空状态模型。
(2)构建时空权重矩阵:首先依据互相关函数值,为时空状态矩阵空间维度的数据元素分配大小不等的权重,构成动态空间权重矩阵。然后根据时间接近度,为预测时间窗中不同的历史交通数据分配不同权重,构成动态时间权重矩阵。
(3)构建时空加权欧氏距离:将时空状态矩阵引入到传统欧氏距离,形成时空加权欧氏距离,更加准确地度量时空状态矩阵之间的相似度。
(4)确定最佳动态近邻:使用交叉验证方法,为每一条路段确定最佳近邻个数K,并依据计算出的当前时空状态矩阵和所有历史时空状态矩阵的相似度,选出K个历史状态矩阵作为最佳近邻。
(5)相似度占比加权预测:将最佳近邻未来时刻的交通流数据输入到本文提出的基于相似度占比的加权预测方法中,得出最终预测结果。
本发明的用户使用场景举例:
一个有效的交通流预测模型对于路线规划、交通控制和智能驾驶等方面十分重要。出行者可以利用流量预测信息判断道路未来拥堵情况,制定更加高效的出行计划。实时的路况预测分析也有助于出行者及时调整前进路线,减少交通拥堵的发生。交通管理者可以利用预测模型监控交通状态,提前对可能发生拥堵的区域采取交通信号控制等措施。在车祸等紧急事件发生时,周边路段的未来交通流变化趋势有助于交通管理者合理分配资源,从而提升疏散和救援的速度。对于智能驾驶和车联网等应用而言,精准的速度预测信息是智能车辆协同系统的基础,也是提升道路通行能力和安全性的重要保障。
综上所述,交通流预测研究对改善交通问题和提升出行效率等方面有着不可替代的意义。

Claims (1)

1.一种基于动态时空分析的交通流预测模型,该模型包含以下四个步骤:
步骤一、构建动态时空状态矩阵:首先使用互相关函数分析路网内各路段间的空间相关性,为每条路段确定最优的空间邻居;其次,使用自相关函数和交叉验证方法,分析单条路段交通流时间序列数据之间的时间相关性,为每条路段确定最优的预测时间窗;最后,根据确定的空间邻居和预测时间窗,从交通流数据中截取相关时空数据片段,组成时空状态矩阵;
路段xi和路段xj在时滞τ下的互相关函数定义如公式(1)所示,其中
Figure FDA0003646803960000019
Figure FDA00036468039600000110
表示xi和xj的序列标准差,
Figure FDA00036468039600000111
表示xi和xj在时滞τ下的相关系数:
Figure FDA0003646803960000011
用于计算某个时间序列x和x在某个时滞τ后的时间序列之间的数据相关性的自相关函数定义如公式(2)所示,其中n是时间序列数据采样个数,
Figure FDA0003646803960000018
是时间序列的均值,τ∈[0,h],且h<n,vol(t)表示路段t时刻的流量数据:
Figure FDA0003646803960000012
假设有预测目标路段u,经过相关性计算,得到了u在当前时刻t的空间邻居数目为
Figure FDA0003646803960000013
预测时间窗长度为
Figure FDA0003646803960000014
则u在时刻t的动态时空状态矩阵的定义如公式(3)所示,其中z表示所在区域路网内的路段总数,
Figure FDA0003646803960000015
表示第i个空间邻居,
Figure FDA0003646803960000016
表示u当前时刻t的流量数据:
Figure FDA0003646803960000017
步骤二、构建动态时空权重矩阵:首先依据互相关函数值,为时空状态矩阵空间维度的数据元素分配大小不等的权重,构成动态空间权重矩阵;然后根据时间接近度,为预测时间窗中不同的历史交通数据分配不同权重,构成动态时间权重矩阵;
空间权重函数的定义如公式(4)所示,其中
Figure FDA0003646803960000021
表示u的第i个空间邻居,
Figure FDA0003646803960000022
表示u的空间邻居总数,
Figure FDA0003646803960000023
表示u和
Figure FDA0003646803960000024
的互相关函数值,
Figure FDA0003646803960000025
表示u的第i个空间邻居的空间权重:
Figure FDA0003646803960000026
空间权重矩阵如公式(5)所示:
Figure FDA0003646803960000027
时间权重函数的定义如公式(6)所示,其中ti表示预测时间窗中第i个历史交通数据的编号,
Figure FDA0003646803960000028
表示预测时间窗的长度,
Figure FDA0003646803960000029
表示第i个历史交通数据的时间权重:
Figure FDA00036468039600000210
时间权重矩阵如公式(7)所示:
Figure FDA00036468039600000211
步骤三、构建动态时空加权欧氏距离:将时空状态矩阵引入到传统欧氏距离,形成时空加权欧氏距离,更加准确地度量时空状态矩阵之间的相似度,时空加权欧氏距离的定义如公式(8)所示,其中WSu表示空间权重,WTu表示时间权重,
Figure FDA00036468039600000212
表示当前时空状态矩阵,
Figure FDA00036468039600000213
表示历史库中所有时空状态矩阵,
Figure FDA00036468039600000214
表示两者的相似度:
Figure FDA0003646803960000031
步骤四、确定最佳动态近邻:使用交叉验证方法,为每一条路段确定最佳近邻个数K,并依据计算出的当前时空状态矩阵和所有历史时空状态矩阵的相似度,选出K个历史状态矩阵作为最佳近邻;
步骤五、相似度占比加权预测:将最佳近邻未来时刻的交通流数据输入到基于相似度占比的加权预测模型中,得出最终预测结果;基于相似度占比的权重分配法以每个最佳近邻和当前时空状态矩阵之间的相似度数值
Figure FDA0003646803960000032
与所有K个近邻(Ku表示u的近邻总数)和当前时空状态矩阵之间的相似度数值总和
Figure FDA0003646803960000033
的比值为权值,合理地将权重分配给每个最佳近邻,其定义如公式(9)所示:
Figure FDA0003646803960000034
CN202110584457.1A 2021-05-27 2021-05-27 一种基于动态时空分析的短时交通流预测模型 Active CN113420414B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110584457.1A CN113420414B (zh) 2021-05-27 2021-05-27 一种基于动态时空分析的短时交通流预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110584457.1A CN113420414B (zh) 2021-05-27 2021-05-27 一种基于动态时空分析的短时交通流预测模型

Publications (2)

Publication Number Publication Date
CN113420414A CN113420414A (zh) 2021-09-21
CN113420414B true CN113420414B (zh) 2022-08-30

Family

ID=77713166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110584457.1A Active CN113420414B (zh) 2021-05-27 2021-05-27 一种基于动态时空分析的短时交通流预测模型

Country Status (1)

Country Link
CN (1) CN113420414B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114120628B (zh) * 2021-10-12 2022-10-04 武汉理工大学 基于稀疏传感器布置的路态波纹预测校验方法及系统
CN113935253B (zh) * 2021-12-17 2022-02-22 西南石油大学 一种基于数据赋权的页岩气井经验产量递减模型拟合方法
CN114463972B (zh) * 2022-01-26 2024-02-27 成都和乐信软件有限公司 一种基于etc门架通信数据的路段区间交通分析预测方法
CN114354236B (zh) * 2022-03-15 2022-06-10 武汉顺源游乐设备制造有限公司 一种基于大数据分析的摇头飞椅运行状态监测方法及系统
CN114973699A (zh) * 2022-05-10 2022-08-30 阿波罗智联(北京)科技有限公司 交通控制信号的生成方法、边缘计算单元和路侧单元
CN115526382B (zh) * 2022-09-09 2023-05-23 扬州大学 一种路网级交通流预测模型可解释性分析方法
CN115658666B (zh) * 2022-10-12 2024-08-16 苏州大学 多源数据融合的稀疏交通流量补全方法及系统
CN116978222B (zh) * 2023-07-24 2024-04-16 重庆邮电大学 一种基于时空数据的短时交通流预测方法

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034350A (zh) * 2009-09-30 2011-04-27 北京四通智能交通系统集成有限公司 交通流数据短时预测方法及系统
CN102693633A (zh) * 2012-06-07 2012-09-26 浙江大学 一种短时交通流加权组合预测方法
KR20140102373A (ko) * 2013-02-13 2014-08-22 아주대학교산학협력단 도로 네트워크에서 움직이는 k-최근접 질의를 위한 안전한 모니터링 기법
CN104064023A (zh) * 2014-06-18 2014-09-24 银江股份有限公司 一种基于时空关联的动态交通流预测方法
CN105336163A (zh) * 2015-10-26 2016-02-17 山东易构软件技术股份有限公司 一种基于三层k近邻的短时交通流预测方法
US9424745B1 (en) * 2013-11-11 2016-08-23 Emc Corporation Predicting traffic patterns
CN106128100A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种基于Spark平台的短时交通流量预测方法
CN108564790A (zh) * 2018-06-12 2018-09-21 国交空间信息技术(北京)有限公司 一种基于交通流时空相似性的城市短时交通流预测方法
CN109190797A (zh) * 2018-08-03 2019-01-11 北京航空航天大学 一种基于改进k最近邻的大规模路网状态短时预测方法
CN109597866A (zh) * 2018-11-22 2019-04-09 成都理工大学 基于交通规则的道路网络中移动对象连续最近邻监视方法
CN109598936A (zh) * 2018-12-18 2019-04-09 中国科学院地理科学与资源研究所 一种基于动态stknn模型的短时交通预测方法
CN110070713A (zh) * 2019-04-15 2019-07-30 浙江工业大学 一种基于双向嵌套lstm神经网络的交通流预测方法
CN110211375A (zh) * 2019-05-23 2019-09-06 浙江大学 基于改进时空关联knn算法的交通流量预测方法
CN110223517A (zh) * 2019-06-20 2019-09-10 青岛科技大学 基于时空相关性的短时交通流量预测方法
CN110299009A (zh) * 2019-07-22 2019-10-01 上海工程技术大学 一种基于knn算法的预测短时交通流的方法和电子设备
CN110674987A (zh) * 2019-09-23 2020-01-10 北京顺智信科技有限公司 一种交通流量预测系统、方法及模型训练方法
CN111383452A (zh) * 2019-12-03 2020-07-07 东南大学 一种城市路网短期交通运行状态估计与预测方法
CN111667694A (zh) * 2020-06-22 2020-09-15 河北工业大学 一种基于改进dtw-knn的短时交通流预测方法
CN112183862A (zh) * 2020-09-29 2021-01-05 长春理工大学 一种城市路网的交通流量预测方法及系统
CN112216108A (zh) * 2020-10-12 2021-01-12 中南大学 一种基于属性增强的时空图卷积模型的交通预测方法
CN112669599A (zh) * 2020-12-14 2021-04-16 成都易书桥科技有限公司 一种基于时序分析和残差匹配的模型

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847682B2 (en) * 2002-02-01 2005-01-25 Hughes Electronics Corporation Method, system, device and computer program product for MPEG variable bit rate (VBR) video traffic classification using a nearest neighbor classifier
US9569785B2 (en) * 2012-11-21 2017-02-14 Marketo, Inc. Method for adjusting content of a webpage in real time based on users online behavior and profile
US20180189677A1 (en) * 2017-01-05 2018-07-05 Cisco Technology, Inc. Training a machine learning-based traffic analyzer using a prototype dataset

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034350A (zh) * 2009-09-30 2011-04-27 北京四通智能交通系统集成有限公司 交通流数据短时预测方法及系统
CN102693633A (zh) * 2012-06-07 2012-09-26 浙江大学 一种短时交通流加权组合预测方法
KR20140102373A (ko) * 2013-02-13 2014-08-22 아주대학교산학협력단 도로 네트워크에서 움직이는 k-최근접 질의를 위한 안전한 모니터링 기법
US9424745B1 (en) * 2013-11-11 2016-08-23 Emc Corporation Predicting traffic patterns
CN104064023A (zh) * 2014-06-18 2014-09-24 银江股份有限公司 一种基于时空关联的动态交通流预测方法
CN105336163A (zh) * 2015-10-26 2016-02-17 山东易构软件技术股份有限公司 一种基于三层k近邻的短时交通流预测方法
CN106128100A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种基于Spark平台的短时交通流量预测方法
CN108564790A (zh) * 2018-06-12 2018-09-21 国交空间信息技术(北京)有限公司 一种基于交通流时空相似性的城市短时交通流预测方法
CN109190797A (zh) * 2018-08-03 2019-01-11 北京航空航天大学 一种基于改进k最近邻的大规模路网状态短时预测方法
CN109597866A (zh) * 2018-11-22 2019-04-09 成都理工大学 基于交通规则的道路网络中移动对象连续最近邻监视方法
CN109598936A (zh) * 2018-12-18 2019-04-09 中国科学院地理科学与资源研究所 一种基于动态stknn模型的短时交通预测方法
CN110070713A (zh) * 2019-04-15 2019-07-30 浙江工业大学 一种基于双向嵌套lstm神经网络的交通流预测方法
CN110211375A (zh) * 2019-05-23 2019-09-06 浙江大学 基于改进时空关联knn算法的交通流量预测方法
CN110223517A (zh) * 2019-06-20 2019-09-10 青岛科技大学 基于时空相关性的短时交通流量预测方法
CN110299009A (zh) * 2019-07-22 2019-10-01 上海工程技术大学 一种基于knn算法的预测短时交通流的方法和电子设备
CN110674987A (zh) * 2019-09-23 2020-01-10 北京顺智信科技有限公司 一种交通流量预测系统、方法及模型训练方法
CN111383452A (zh) * 2019-12-03 2020-07-07 东南大学 一种城市路网短期交通运行状态估计与预测方法
CN111667694A (zh) * 2020-06-22 2020-09-15 河北工业大学 一种基于改进dtw-knn的短时交通流预测方法
CN112183862A (zh) * 2020-09-29 2021-01-05 长春理工大学 一种城市路网的交通流量预测方法及系统
CN112216108A (zh) * 2020-10-12 2021-01-12 中南大学 一种基于属性增强的时空图卷积模型的交通预测方法
CN112669599A (zh) * 2020-12-14 2021-04-16 成都易书桥科技有限公司 一种基于时序分析和残差匹配的模型

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KNN在短时交通流预测上的应用与研究;林罗杰 等;《现代计算机》;20200405(第4期);第39-41页 *
Short-Term Traffic Flow Forecasting Using a Distributed Spatial-Temporal k Nearest Neighbors Model;Anton Agafonov et al.;《 2018 IEEE International Conference on Computational Science and Engineering (CSE)》;20181227;第91-98页 *
短时交通流预测的改进K近邻算法;谢海红 等;《交通运输工程学报》;20140615;第14卷(第3期);第87-94页 *

Also Published As

Publication number Publication date
CN113420414A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN113420414B (zh) 一种基于动态时空分析的短时交通流预测模型
CN111612206B (zh) 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN108564790B (zh) 一种基于交通流时空相似性的城市短时交通流预测方法
CN107862864B (zh) 基于驾驶习惯和交通路况的行驶工况智能预测估计方法
Fang et al. FTPG: A fine-grained traffic prediction method with graph attention network using big trace data
CN107610464A (zh) 一种基于高斯混合时间序列模型的轨迹预测方法
CN112289034A (zh) 基于多模态时空数据的深度神经网络鲁棒交通预测方法
CN109376906B (zh) 基于多维度轨迹的出行时间预测方法、系统及电子设备
CN112801342A (zh) 一种基于降雨径流相似性的自适应径流预报方法
CN106980874B (zh) 一种面向配网大数据的多时态维度数据融合方法
CN115148019A (zh) 一种基于节假日拥堵预测算法的预警方法及系统
CN114495507B (zh) 融合时空注意力神经网络和交通模型的交通流预测方法
CN113051811B (zh) 一种基于gru网络的多模式短期交通拥堵预测方法
CN109598939A (zh) 一种基于多任务多视图学习模型的短时交通预测方法
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
CN112542049A (zh) 智慧交通综合管控平台
CN111209968A (zh) 基于深度学习的多气象因子模式预报温度订正方法及系统
CN111160650A (zh) 一种基于Adaboost算法的交通流特性分析与预测方法
CN117746626A (zh) 基于车流量的智慧交通管理方法及系统
CN115423146A (zh) 一种基于多因子最近邻抽样回归和支持向量机的自适应径流预报方法
CN118262516A (zh) 一种基于多种注意力神经网络的车辆交通预测方法及系统
CN111667694B (zh) 一种基于改进dtw-knn的短时交通流预测方法
CN113313317B (zh) 一种基于inla算法的共享单车使用需求预测方法及预测系统
CN112330003B (zh) 基于双向循环神经网络的周期型容量数据预测方法、系统及存储介质
Mei et al. Research on short-term urban traffic congestion based on fuzzy comprehensive evaluation and machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant