CN115034502A - 一种公路车辆旅行时间的预测方法 - Google Patents

一种公路车辆旅行时间的预测方法 Download PDF

Info

Publication number
CN115034502A
CN115034502A CN202210746241.5A CN202210746241A CN115034502A CN 115034502 A CN115034502 A CN 115034502A CN 202210746241 A CN202210746241 A CN 202210746241A CN 115034502 A CN115034502 A CN 115034502A
Authority
CN
China
Prior art keywords
road
travel time
vehicle travel
gru
road vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210746241.5A
Other languages
English (en)
Other versions
CN115034502B (zh
Inventor
陈志华
方昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202210746241.5A priority Critical patent/CN115034502B/zh
Publication of CN115034502A publication Critical patent/CN115034502A/zh
Application granted granted Critical
Publication of CN115034502B publication Critical patent/CN115034502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及车辆的时间预测技术领域,具体涉及一种公路车辆旅行时间的预测方法。包括以下步骤:获取公路车辆旅行时间数据集,并对其进行数据预处理;通过平均链接度量方法进行路段间相似度的度量;根据相似度对路段进行基于空间层次的聚类,并通过聚类算法获得k个路段群;根据多输入门控循环单元模型(M‑GRU)对k个路段群进行分别建模,且分别嵌入公路车辆旅行时间趋势变化信息;并将每个路段群的建模后的多输入门控循环单元模型(M‑GRU)的输出信息与嵌入的趋势变化信息进行拼接,得到深度多输入门控循环单元模型(DM‑GRU)输出所有路段的未来车辆旅行时间。本发明的目的是解决现有的公路交通车辆旅行时间的预测的精确度较低的问题。

Description

一种公路车辆旅行时间的预测方法
技术领域
本发明涉及车辆的时间预测技术领域,具体涉及一种公路车辆旅行时间的预测方法。
背景技术
车辆经过一个路段所花费的时间被定义为该路段的车辆旅行时间。公路交通车辆旅行时间的预测一直是智慧交通研究的热点问题。
近年来,由于机器学习算法的广泛流行,许多研究者将其应用到公路交通中车辆旅行时间的预测。机器学习算法和深度学习模型的发展帮助研究人员有效地利用交通数据的时间以及空间相关性来提高公路车辆旅行时间的预测准确率。根据各路段的传感器收集到的历史车辆旅行时间数据来训练机器学习算法模型,能够预测各路段的未来车辆旅行时间。
然而,随着人们的出行频率增加以及公路车辆数量的不断上升,基于现有的车辆旅行时间预测方法预测的精确度较低,不能规划更好的公路交通出行路线,通过对公路交通车辆旅行时间精确预测难以准确地预估在车辆在路程中所需花费的时间的情况。
发明内容
针对现有技术存在的不足,本发明提出一种公路车辆旅行时间的预测方法,以解决现有的公路交通车辆旅行时间的预测的精确度较低,导致人们的交通出行所花费时间较多的问题。
为达到上述目的,本发明采用如下技术方案:一种公路车辆旅行时间的预测方法,包括以下步骤:
获取预测区域内各路段各时刻的车辆旅行时间数据形成公路车辆旅行时间数据集,并对公路车辆旅行时间数据集进行数据预处理;
通过平均链接度量方法对数据预处理后的各路段车辆旅行时间进行路段间相似度的度量;
根据相似度对路段进行基于空间层次的聚类,并通过聚类算法获得k个路段群;
根据多输入门控循环单元模型(M-GRU)对k个路段群进行分别建模,且在建模时,对k个路段群分别嵌入公路车辆旅行时间趋势变化信息;
嵌入的趋势变化信息后,将每个路段群的建模后的多输入门控循环单元模型(M-GRU)的输出信息与嵌入的趋势变化信息进行拼接,得到深度多输入门控循环单元模型(DM-GRU);
深度多输入门控循环单元模型(DM-GRU)的深度神经网络输出所有路段的未来车辆旅行时间。
优选的,所述数据预处理采用指数移动平均法(EMA)和归一化函数将公路车辆旅行时间数据集中的数据转换成无量纲数据。
优选的,所述指数移动平均法(EMA)是在公路车辆旅行时间数据集上以一个时间间隔进行的平滑操作;
指数移动平均法(EMA)的计算公式为:
EMAt=α×Valuet+(1-α)×EMAt-1 (1);
其中,EMAt和EMAt-1分别代表当前时间点以及上一时间点被平滑后的值,Valuet代表当前时间点的数值;α是移动平滑系数,其计算公式如下:
Figure BDA0003716953130000021
其中,n为用于平滑数据的时期长度;
采用归一化函数将平滑操作后的公路车辆旅行时间数据转换成无量纲数据,压缩到0到1之间;
归一化函数的公式如下:
Figure BDA0003716953130000022
其中,x表示原始数据,xmax和xmin分别代表各路段的最大最小车辆旅行时间。
优选的,所述平均链接度量方法(Average-linkage)的具体计算公式如下:
Figure BDA0003716953130000031
其中,公式中的|A|和|B|分别代表路段群A和路段群B包含路段元素的数目,sim(Ai,Bj)代表群中的路段元素Ai,Bj的相似度度量;
计算元素之间相似度的方法包括基于排序的相关系数计算法、欧式距离计算法、皮尔逊相关系数法和Cosine相似度计算法中的一种或多种计算法方法。
优选的,所述基于排序的相关系数计算法,其具体计算公式如下:
Figure BDA0003716953130000032
其中,X,Y是两个等长的序列,Xsort_index和Ysort_index代表各X,Y中各元素进行排序后的索引号,mid代表元素排序后的索引的中位数;
所述欧式距离计算法的具体计算公式如下:
Figure BDA0003716953130000033
所述皮尔逊相关系数法的具体计算公式如下:
Figure BDA0003716953130000034
变量μXYXY分别代表X和Y的均值和标准差;
所述Cosine相似度计算法的具体计算公式如下:
Figure BDA0003716953130000035
优选的,所述聚类算法采用能够获得拥有相似车辆旅行时间变化趋势和紧密空间联系的路段群的空间特征层次聚类算法。
优选的,所述多输入门控循环单元模型(M-GRU)包括由门控循环单元(GRU)的输入向量[xt,1,xt,2,…,xt,n]对应n个路段在时间点t的旅行时间,输出向量[xt+m,1,xt+m,2,…,xt+m,n]则对应这些路段经过m个时间间隔后的车辆旅行时间组成;
其中,所述门控循环单元(GRU)的具体表达式如下:
rt=σ(Wr[ht-1,xt]T) (9);
zt=σ(Wz[ht-1,xt]T) (10);
ht′=tanh(Wh[ht-1⊙rt,xt]T) (11);
ht=zt⊙ht-1+(1-zt)⊙ht′ (12);
其中,rt为重置门,zt为更新门,ht-1为上一时间点的信息,xt为当前的输入信息,Wr,Wz和Wh代表神经网络的权重参数,σ代表sigmoid激活函数,⊙则是一种逐元素的矩阵乘法。
优选的,所述对k个路段群分别嵌入公路车辆旅行时间趋势变化信息的方式采用独热编码和嵌入技术。
优选的,所述嵌入技术的公式为:
Y=X·W (13);
对于拥有n种类别的变量x,X为x经过独热编码后产生的输入向量,其大小为1×n。
优选的,所述深度多输入门控循环单元模型(DM-GRU)中输出层的激活函数为线性函数,模型的隐藏层使用的激活函数为线性整流函数(ReLU);
ReLU激活函数的公式如下:
ReLU=max(0,x) (14)。
与现有技术相比,本方案产生的有益效果是:
通过在数据预处理阶段对公路车辆旅行时间数据集中的数据进行平滑处理,可以有效减少数据中的噪声或者异常值对于后续聚类分析的干扰。使用平均链接度量方法分析公路交通网络中各路段群的空间相关性。采用基于路段空间相关性的空间特征层次聚类算法对交通网络中的路段进行聚类并组成路段群。使用独热编码及嵌入技术嵌入时间戳作为车辆旅行时间变化趋势影响因子。采用深度多输入门控循环单元神经网络模型对聚类后的各路段群进行分别建模并预测各路段的车辆旅行时间。从而实现对公路交通车辆旅行时间精确预测,可以更准确地预估在车辆在路程中所需花费的时间,规划更好的公路交通出行路线,从而降低出行成本并节省行程时间。
附图说明
为了更清楚地说明本发明具体实施方式,下面将对具体实施方式中所需要使用的附图作简单地介绍。在所有附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明一种公路车辆旅行时间的预测方法的流程示意图;
图2为本发明一种公路车辆旅行时间的预测方法中测试阶段的流程示意图;
图3为本发明一种公路车辆旅行时间的预测方法中使用的GRU的流程示意图;
图4为本发明一种公路车辆旅行时间的预测方法中使用的M-GRU的流程示意图;
图5为本发明一种公路车辆旅行时间的预测方法中使用的DM-GRU结构示意图;
图6为本发明一种公路车辆旅行时间的预测方法中拼接流程示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
请参阅图1-图6,一种公路车辆旅行时间的预测方法,包括以下步骤:
S101、获取预测区域内各路段各时刻的车辆旅行时间数据形成公路车辆旅行时间数据集,并对公路车辆旅行时间数据集进行数据预处理。
本实施例中,选用的公路车辆旅行时间数据集为福建省漳州市市区部分路段的车辆旅行时间数据集,由根据各路段的传感器收集车辆旅行时间数据形成。车辆旅行时间数据集包含了漳州市区自2018年4月30日到2018年6月29日一共60天82个路段的车辆旅行时间数据。在数据预处理阶段对数据进行平滑处理,可以有效减少数据中的噪声或者异常值对于后续聚类分析的干扰。本实施例以5分钟为一个时间间隔的数据集上进行指数移动平均法(Exponential Moving Average,EMA)的平滑操作。EMA的计算公式如下:
EMAt=α×Valuet+(1-α)×EMAt-1 (1)。
其中,EMAt和EMAt-1分别代表当前时间点以及上一时间点被平滑后的值,Valuet代表当前时间点的数值。α是移动平滑系数,其计算公式如下:
Figure BDA0003716953130000061
其中,n为用于平滑数据的时期长度。在本实施例中,n设置为4,即以前20分钟的历史数据来平滑当下时间点的值。
本实施例中,采用归一化函数,将公路车辆旅行时间数据集中的数据转换成无量纲数据,压缩到0到1之间。归一化函数公式如下:
Figure BDA0003716953130000062
其中,x表示原始数据,xmax和xmin分别代表各路段的最大最小车辆旅行时间。
S102、通过平均链接度量方法对数据预处理后的各路段车辆旅行时间进行路段间相似度的度量。
本实施例中,平均链接度量方法(Average-linkage)的具体计算公式如下:
Figure BDA0003716953130000063
其中,公式中的|A|和|B|分别代表路段群A和路段群B包含路段元素的数目,sim(Ai,Bj)代表群中的路段元素Ai,Bj的相似度度量。
计算元素之间相似度的方法包括基于排序的相关系数计算法、欧式距离计算法、皮尔逊相关系数法和Cosine相似度计算法中的一种或多种计算法方法。
具体的,基于排序的相关系数计算法,其具体计算公式如下:
Figure BDA0003716953130000071
其中,X,Y是两个等长的序列,Xsort_index和Ysort_index代表各X,T中各元素进行排序后的索引号,mid代表元素排序后的索引的中位数。该相似度度量值将介于-1到1之间,该值接近1说明两个变量之间的具有较强的正相关性;当值的绝对值接近-1说明两个变量之间具有较强的负相关性。
欧式距离计算法的具体计算公式如下:
Figure BDA0003716953130000072
取值范围为0到正无穷。当欧式距离越小时,两个向量的相似度越高。
皮尔逊相关系数法的具体计算公式如下:
Figure BDA0003716953130000073
变量μXYXY分别代表X和Y的均值和标准差。当该值接近1说明两个变量之间的具有较强的正相关性;当值的绝对值接近-1说明两个变量之间具有较强的负相关性。
Cosine相似度计算法,其输出范围和皮尔逊相关系数相同,具体计算公式如下:
Figure BDA0003716953130000074
由于空间特征层次聚类关注的是相邻路段之间交通特征的相似程度,所以该算法不需要确定两个路段的交通状况变化趋势是呈现正相关还是负相关的关系。因此,本发明采用的相关系数值需要取绝对值来衡量路段之间的相关程度,当相关系数值越大则表明两个路段的相关性越强。
S103、根据相似度对路段进行基于空间层次的聚类。
S104、通过聚类算法获得k个路段群。
聚类算法采用能够获得拥有相似车辆旅行时间变化趋势和紧密空间联系的路段群的空间特征层次聚类算法(SFHC)。与传统层次法不同的是,SFHC的候选路段群只从相邻的路段中产生。在SFHC中,每两个相邻路段被选出并计算得到二者所属群的相似程度后,如果它们的相似度大于阈值就被合并。SFHC阈值优选为0.5知0.8之间。因此,当遍历整个交通网络之后,SFHC就可以得到具有相似交通模式并且在地理空间上紧密联系的路段以及这些路段组成的群。
SFHC算法的目标是生成一个群标记数组,其中,每个元素对应一个路段所属的群。而通过遍历群标记数组,并将具有相同标记的路段放在一个集合中,就可以获得拥有相似车辆旅行时间变化趋势和紧密空间联系的路段群。
S105、请一并参阅图3-图6,对k个路段群采用深度多输入门控循环单元模型(DM-GRU)进行分别建模。具体的,k个路段使用同一种建模方式,即提出的DM-GRU模型是基于多输入门控循环单元模型(M-GRU),并且使用嵌入层来获得外部信息构建的。从而通过建立一种深度多输入门控循环单元模型(DM-GRU)来实现对车辆旅行时间更加精准的预测。
本实施例中,多输入门控循环单元模型(M-GRU:Multi-input GRU)是基于门控循环单元(GRU)结构提出的。
其中,如图3所示,GRU的结构主要由重置门rt和更新门zt来决定上一时间点的信息ht-1是否被保留在新的隐藏状态ht′中。更新门zt被用于同时控制有多少ht-1和多少当前的输入信息xt可以被保存在最终的隐藏状态ht以及输出yt中。zt的信号越大,ht-1可以在ht和yt被保存得越多,而xt则被使用得越少。其中Wr,Wz,Wh代表神经网络的权重参数。σ代表sigmoid激活函数;⊙则是一种逐元素的矩阵乘法。具体的计算公式如下:
rt=σ(Wr[ht-1,xt]T) (9)。
zt=σ(Wz[ht-1,xt]T) (10)。
ht′=tanh(Wh[ht-1⊙rt,xt]T) (11)。
ht=zt⊙ht-1+(1-zt)⊙ht′ (12)。
由以上的描述可以看出,GRU中的门控机制使得历史时间点的信息被灵活保存下来。如果重置门越活跃,那么历史时间点的信息就被遗忘得更多,从而学习到序列的短期依赖;假设更新门越活跃,那么历史时间点的信息就被保留得更多,从而获得序列的长期依赖。在车辆旅行时间的预测中,未来时间点的信息往往与前几个时间点的信息有关,因此使用GRU可以选择性地保留车辆旅行时间序列的长期或短期时间依赖。
如图4所示,本发明提出的多输入GRU结构中,输入向量由多个路段在同一时刻的车辆旅行时间组成。GRU的输入向量[xt,1,xt,2,…,xt,n]对应n个路段在时间点t的旅行时间,而输出向量[xt+m,1,xt+m,2,…,xt+m,n]则对应这些路段经过m个时间间隔后的车辆旅行时间。因此,M-GRU可以学习多个路段之间的相互影响,从而有效利用了各路段之间的空间依赖。
S106、在建模时,对k个路段群分别嵌入公路车辆旅行时间趋势变化信息。
除了时间、空间维度上的特征,获取目标时刻是否处于周末、是否处于交通高峰期等外部信息也有利于预测公路车辆旅行时间的变化趋势。由于目标预测时刻所处的日期和时间段是离散型变量,所以需要先使用独热编码将它们转为类别型变量,然后把它们输入模型。比如,在一周的时间范围内,星期三的独热编码(One-hot Encoding)为[0,0,1,0,0,0,0]。本发明通过嵌入技术(Embedding Technique)获取这些外部信息。嵌入技术是一种在自然语言处理中被广泛用于将高维数据压缩成致密的低维向量的方法,公式如下:
Y=X·W (13)。
对于拥有n种类别的变量x,X为x经过独热编码后产生的输入向量,其大小为1×n。X经过大小为n×m的矩阵W的线性转换后,可得到1×m的输出向量Y。在实际运用中,n一般远大于m。
S107、嵌入趋势变化信息后,将每个路段群的建模后的多输入门控循环单元模型(M-GRU)的输出信息与嵌入的趋势变化信息进行拼接,得出深度多输入门控循环单元模型(DM-GRU)。
S108、深度多输入门控循环单元模型(DM-GRU)的深度神经网络输出所有路段的未来车辆旅行时间。
具体的,DM-GRU模型中的激活函数设计:神经网络通过前馈的方式,将前一层神经元的输出作为下一层神经元的输入,并将值传递。在没有加入激活函数的情况下,神经网络产生的函数映射关系都是线性的,是一个多元线性回归函数。线性函数在学习复杂的非线性关系时常常表现不佳,出现巨大的误差。通过引入激活函数,可以解决网络无法学习到非线性关系的问题,提高模型的逼近能力。在DM-GRU模型中输出层的激活函数为线性函数,模型的隐藏层使用的激活函数为线性整流函数(ReLU)。其中,线性激活函数即保持神经元值不变直接输出。ReLU激活函数的公式如下:
ReLU=max(0,x) (14)。
当x取值低于0的时候,函数值恒为0,神经元不会被激活;当x取值大于0的时候,函数则是一个一次函数。因此,在ReLU的作用下,只有部分神经元被激活,促使网络的稀疏性,便于网络的训练。简单的结构使得ReLU具有更快的收敛速度,具有更快的计算速度。
深度多输入门控循环单元模型的设置如下:
(1)对神经网络模型训练使用ADAM优化算法对网络权重参数进行优化。
(2)DM-GRU使用的损失函数为最小平方误差(MSE),公式如下所示:
Figure BDA0003716953130000101
其中,
Figure BDA0003716953130000102
代表预测的下一时刻路段车辆旅行时间的预测值,y代表真实值,N代表样本的数量。
(3)对神经网络模型训练时采用默认的学习率作为初始化学习率。
(4)数据被训练的次数为100。
在获取了模型的预测值之后还需要预测值进行数据反归一化处理。一方面为了让数据的各个属性之间具有可比性,另一方为了模型更好的学习各路段群中各个属性间的内在联系,在数据预处理阶段采用了归一化,将原始数据转换成0至1区间的无量纲数据。测试时,测试集输入至模型中进行预测,输入的同样是0至1区间的无量纲数据,因此,需要采用反归一化的方式,将数据还原成原本的量纲,以便于后续的准确度验证。计算公式如下:
Figure BDA0003716953130000111
其中
Figure BDA0003716953130000112
代表路段i在目标时间点t的真实车辆旅行时间,yt,i为模型预测的归一化后的车辆旅行时间,xmax和xmin分别代表各路段的最大最小车辆旅行时间。为了验证本发明的有效性,实验选取平均百分比误差(Mean Absolute Percentage Error,MAPE)作为模型的评价指标,MAPE值越小,说明算法的准确度越高,MAPE的计算公式如下:
Figure BDA0003716953130000113
其中,
Figure BDA0003716953130000114
代表预测的下一时刻路段车辆旅行时间的预测值,y代表真实值,N代表样本的数量。
本发明提出的DM-GRU模型是基于M-GRU结构构建的,并且使用嵌入层来获得外部信息。对于时刻t,输入的时间序列经过M-GRU的转化得到向量Mt;外部信息,经过独热编码变成高维向量然后通过嵌入层对数据降维,之后通过步骤S107的拼接操作合并为向量Et。最后,Mt和Et经过图6所示的混合过程得到模型的输出向量[yt,1,yt,2,…,yt,n],其中,yt,i代表路段i在目标时间点t的车辆旅行时间。从而能够更加精准的预测出所有路段的未来车辆旅行时间。
试验数据
在测试阶段,首先通过步骤S201,获取各路段群得测试数据。
然后,执行步骤S202,将测试数据分别输入到对应得DM-GRU模型中。
最终通过步骤S203,获得所有的路段的车辆旅行时间预测值。
最后与测试集的真实车辆旅行时间进行误差分析。通过对不同阈值设置情况下SFHC聚类效果的对比,当SFHC阈值设置为0.8时,即两个路段群的车辆旅行时间变化趋势的相似度达到80%,结合SFHC的DM-GRU模型在测试集上取得了最低的预测误差。使用不同阈值得到的误差如下表所示:
Figure BDA0003716953130000121
其中,本发明提出的基于聚类算法和长序列循环神经网络的公路车辆旅行时间预测方法在测试集上得到得测试结果的MAPE为10.71%至18.88%之间。从而通过对公路交通车辆旅行时间的精确预测,能够更准确地预估在车辆在路程中所需花费的时间,规划更好的公路交通出行路线,减少人们的交通出行拥堵,从而降低出行成本并节省行程时间。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种公路车辆旅行时间的预测方法,其特征在于,包括以下步骤:
获取预测区域内各路段各时刻的车辆旅行时间数据形成公路车辆旅行时间数据集,并对公路车辆旅行时间数据集进行数据预处理;
通过平均链接度量方法对数据预处理后的各路段车辆旅行时间进行路段间相似度的度量;
根据相似度对路段进行基于空间层次的聚类,并通过聚类算法获得k个路段群;
根据多输入门控循环单元模型(M-GRU)对k个路段群进行分别建模,且在建模时,对k个路段群分别嵌入公路车辆旅行时间趋势变化信息;
嵌入的趋势变化信息后,将每个路段群的建模后的多输入门控循环单元模型(M-GRU)的输出信息与嵌入的趋势变化信息进行拼接,得到深度多输入门控循环单元模型(DM-GRU);
深度多输入门控循环单元模型(DM-GRU)的深度神经网络输出所有路段的未来车辆旅行时间。
2.根据权利要求1所述的公路车辆旅行时间的预测方法,其特征在于,所述数据预处理采用指数移动平均法(EMA)和归一化函数将公路车辆旅行时间数据集中的数据转换成无量纲数据。
3.根据权利要求2所述的公路车辆旅行时间的预测方法,其特征在于,所述指数移动平均法(EMA)是在公路车辆旅行时间数据集上以一个时间间隔进行的平滑操作;
指数移动平均法(EMA)的计算公式为:
EMAt=α×Valuet+(1-α)×EMAt-1 (1);
其中,EMAt和EMAt-1分别代表当前时间点以及上一时间点被平滑后的值,Valuet代表当前时间点的数值;α是移动平滑系数,其计算公式如下:
Figure FDA0003716953120000011
其中,n为用于平滑数据的时期长度;
采用归一化函数将平滑操作后的公路车辆旅行时间数据转换成无量纲数据,压缩到0到1之间;
归一化函数的公式如下:
Figure FDA0003716953120000021
其中,x表示原始数据,xmax和xmin分别代表各路段的最大最小车辆旅行时间。
4.根据权利要求1所述的公路车辆旅行时间的预测方法,其特征在于,所述平均链接度量方法(Average-linkage)的具体计算公式如下:
Figure FDA0003716953120000022
其中,公式中的|A|和|B|分别代表路段群A和路段群B包含路段元素的数目,sim(Ai,Bj)代表群中的路段元素Ai,Bj的相似度度量;
计算元素之间相似度的方法包括基于排序的相关系数计算法、欧式距离计算法、皮尔逊相关系数法和Cosine相似度计算法中的一种或多种计算法方法。
5.根据权利要求4所述的公路车辆旅行时间的预测方法,其特征在于,所述基于排序的相关系数计算法,其具体计算公式如下:
Figure FDA0003716953120000023
其中,X,Y是两个等长的序列,Xsort_index和Ysort_index代表各X,Y中各元素进行排序后的索引号,mid代表元素排序后的索引的中位数;
所述欧式距离计算法的具体计算公式如下:
Figure FDA0003716953120000024
所述皮尔逊相关系数法的具体计算公式如下:
Figure FDA0003716953120000025
变量μXYXY分别代表X和Y的均值和标准差;
所述Cosine相似度计算法的具体计算公式如下:
Figure FDA0003716953120000031
6.根据权利要求1所述的公路车辆旅行时间的预测方法,其特征在于,所述聚类算法采用能够获得拥有相似车辆旅行时间变化趋势和紧密空间联系的路段群的空间特征层次聚类算法(SFHC)。
7.根据权利要求1所述的公路车辆旅行时间的预测方法,其特征在于,所述多输入门控循环单元模型(M-GRU)包括由门控循环单元(GRU)的输入向量[xt,1,xt,2,…,xt,n]对应n个路段在时间点t的旅行时间,输出向量[xt+m,1,xt+m,2,…,xt+m,n]则对应这些路段经过m个时间间隔后的车辆旅行时间组成;
其中,所述门控循环单元(GRU)的具体表达式如下:
rt=σ(Wr[ht-1,xt]T) (9);
zt=σ(Wz[ht-1,xt]T) (10);
ht′=tanh(Wh[ht-1⊙rt,xt]T) (11);
ht=zt⊙ht-1+(1-zt)⊙ht′ (12);
其中,rt为重置门,zt为更新门,ht-1为上一时间点的信息,xt为当前的输入信息,Wr,Wz和Wh代表神经网络的权重参数,σ代表sigmoid激活函数,⊙则是一种逐元素的矩阵乘法。
8.根据权利要求7所述的公路车辆旅行时间的预测方法,其特征在于,所述对k个路段群分别嵌入公路车辆旅行时间趋势变化信息的方式采用独热编码和嵌入技术。
9.根据权利要求8所述的公路车辆旅行时间的预测方法,其特征在于,所述嵌入技术的公式为:
Y=X·W (13);
对于拥有n种类别的变量x,X为x经过独热编码后产生的输入向量,其大小为1×n。
10.根据权利要求9所述的公路车辆旅行时间的预测方法,其特征在于,所述深度多输入门控循环单元模型(DM-GRU)中输出层的激活函数为线性函数,模型的隐藏层使用的激活函数为线性整流函数(ReLU);
ReLU激活函数的公式如下:
ReLU=max(0,x) (14)。
CN202210746241.5A 2022-06-28 2022-06-28 一种公路车辆旅行时间的预测方法 Active CN115034502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210746241.5A CN115034502B (zh) 2022-06-28 2022-06-28 一种公路车辆旅行时间的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210746241.5A CN115034502B (zh) 2022-06-28 2022-06-28 一种公路车辆旅行时间的预测方法

Publications (2)

Publication Number Publication Date
CN115034502A true CN115034502A (zh) 2022-09-09
CN115034502B CN115034502B (zh) 2024-07-02

Family

ID=83126819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210746241.5A Active CN115034502B (zh) 2022-06-28 2022-06-28 一种公路车辆旅行时间的预测方法

Country Status (1)

Country Link
CN (1) CN115034502B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898829A (zh) * 2018-06-07 2018-11-27 重庆邮电大学 针对无差异性划分和数据稀疏的动态短时交通流预测系统
CN111785018A (zh) * 2020-06-18 2020-10-16 重庆大学 一种基于门控循环单元的收费站下道流量预测方法
CN112382082A (zh) * 2020-09-30 2021-02-19 银江股份有限公司 一种拥堵区域交通运行状态预测方法及系统
CN112651422A (zh) * 2020-11-25 2021-04-13 中国科学院信息工程研究所 一种时空感知的网络流量异常行为检测方法及电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898829A (zh) * 2018-06-07 2018-11-27 重庆邮电大学 针对无差异性划分和数据稀疏的动态短时交通流预测系统
CN111785018A (zh) * 2020-06-18 2020-10-16 重庆大学 一种基于门控循环单元的收费站下道流量预测方法
CN112382082A (zh) * 2020-09-30 2021-02-19 银江股份有限公司 一种拥堵区域交通运行状态预测方法及系统
CN112651422A (zh) * 2020-11-25 2021-04-13 中国科学院信息工程研究所 一种时空感知的网络流量异常行为检测方法及电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
柯强等: "基于改进决策树的配电网多源数据快速检索", 计算机系统应用, vol. 30, no. 2, 27 January 2021 (2021-01-27), pages 97 - 102 *

Also Published As

Publication number Publication date
CN115034502B (zh) 2024-07-02

Similar Documents

Publication Publication Date Title
CN111899510B (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
CN112990556A (zh) 一种基于Prophet-LSTM模型的用户用电能耗预测方法
CN112949828B (zh) 一种基于图学习的图卷积神经网络交通预测方法及系统
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN112766078B (zh) 基于emd-svr-mlr与注意力机制的gru-nn的电力负荷层次预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN112396234A (zh) 一种基于时域卷积神经网络的用户侧负荷概率预测方法
CN111898825A (zh) 一种光伏发电功率短期预测方法及装置
CN114596726B (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN114218872A (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN114266301A (zh) 基于图卷积神经网络的电力设备故障智能预测方法
CN117277279A (zh) 一种基于粒子群优化的深度学习短期负荷预测方法
CN115759461A (zh) 一种面向物联网的多元时间序列预测方法及系统
CN114091752A (zh) 一种提升时间序列预测系统预测时间序列效果的方法
Yang et al. Remaining useful life prediction based on normalizing flow embedded sequence-to-sequence learning
CN116432697A (zh) 一种融合长短期记忆网络与注意力机制的时间序列预测方法
CN111310963A (zh) 电站的发电数据预测方法、装置、计算机设备和存储介质
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN115271186A (zh) 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN114117852A (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN114219126B (zh) 基于残差修正的小水电渗透地区网供负荷预测方法
CN115063972A (zh) 基于图卷积和门控循环单元的交通速度预测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant