CN112966853B - 基于时空残差混合模型的城市路网短时交通流预测方法 - Google Patents
基于时空残差混合模型的城市路网短时交通流预测方法 Download PDFInfo
- Publication number
- CN112966853B CN112966853B CN202110155146.3A CN202110155146A CN112966853B CN 112966853 B CN112966853 B CN 112966853B CN 202110155146 A CN202110155146 A CN 202110155146A CN 112966853 B CN112966853 B CN 112966853B
- Authority
- CN
- China
- Prior art keywords
- time
- traffic
- space
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000000737 periodic effect Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 230000007774 longterm Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000003213 activating effect Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 101100182247 Caenorhabditis elegans lat-1 gene Proteins 0.000 claims description 3
- 101100182248 Caenorhabditis elegans lat-2 gene Proteins 0.000 claims description 3
- 101150061388 LON1 gene Proteins 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 101150004293 lon2 gene Proteins 0.000 claims description 3
- 238000013507 mapping Methods 0.000 abstract 1
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于时空残差混合模型的城市路网短时交通流预测方法,包括:采集车辆当前经纬度数据并存放至大数据集群数据库中,对原始数据进行数据预处理;将城市路网按照经纬度划分成交通栅格网络,将车辆经纬度数据映射到交通栅格网络中,生成交通栅格数据;将交通栅格数据进行标准化处理,并构建训练集和测试集;构造基于时空残差混合模型的城市路网短时交通流预测模型;训练构建的基于时空残差混合模型的城市路网短时交通流预测模型预测下一时刻的交通栅格数据。本发明在对路网进行时空分析下,引入残差混合模型,提高对路网车流量时间和空间的捕获能力,从而降低了时空残差混合模型预测交通流时的相对误差,提高了预测精度。
Description
技术领域
本发明属于深度学习和智能交通车流量预测领域,具体为一种基于时空残差混合模型的城市路网短时交通流预测方法。
背景技术
随着交通传感器的普及和新型传感器的布设,交通数据呈现爆炸式的增长,交通流预测很大程度上依赖于从各个传感器收集的历史和实时的交通流数据,包括GPS、摄像头、线圈等。交通流预测的目的是提供交通流信息,准确的交通流预测对于提高智能交通系统可靠性、安全性至关重要,可以为交通出行者和交通管理部门提供准确可靠的交通信息。
交通流预测方法大体分为模型驱动和数据驱动两类方法。模型驱动方法一般是根据理论假设预先确定的,存在理论性强,但实用性低,实际情况一般比理论假设的情况复杂;数据驱动方法主要是得益于日益增长的交通数据,传统数据驱动方法缺乏对高维数据的处理能力,随着深度学习理论的兴起,结合深度学习模型的数据驱动方法可以有效的对高维数据进行建模,并且可以捕获数据中的特征信息。为了捕获城市路网的时空信息,已经提出时空残差模型,该方法在空间上利用2D卷积进行空间特征挖掘,在时间上使用残差网络进行捕获,但是缺乏对时间序列的筛选,容易捕获相关度低的时间序列,并且残差方法在捕获变化微小特征时,容易忽略长期时间特征,从而降低模型的预测精度。
发明内容
发明目的:针对上述问题,本发明引入一种基于时空残差混合模型的城市路网短时交通流预测方法。该方法在传统时空残差模型的基础上,对时间序列引入皮尔逊相关系数的分析,确定相关性高的周期序列和邻近序列;引入LSTM神经网络作为混合模型,对周期序列和邻近序列进行长期时间特征的捕获,从而降低训练的误差,提高了预测的精度。
技术方案:一种基于时空残差混合模型的城市路网短时交通流预测方法,包括如下步骤:
步骤1)由配备有GPS定位装置的车辆采集车辆当前经纬度数据并存放至后台服务器Hadoop大数据集群数据库中,并对车辆经纬度原始数据集P进行预处理;
步骤2)将城市路网根据预测需求按照经纬度划分成M*N的交通栅格网络,将预处理过的车辆经纬度原始数据按照经纬度划分到每一个交通栅格网络中,生成交通栅格数据;
步骤3)将交通栅格数据进行标准化处理,使用标准化后的数据集构建训练集和测试集;
步骤4)构造基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数;
步骤5)使用训练集训练基于时空残差混合模型的城市路网短时交通流预测模型,并用测试集对模型进行测试;
进一步地,所述步骤1)中,P={(Pid1,Plon1,Plat1,Ptime1)1,(Pid2,Plon2,Plat2,Ptime2)2,…,(Pidi,Ploni,Plati,Ptimei)n},其中n表示车辆经纬度原始数据集P的记录数量,Pidi,Ploni,Plati为第i个时间节点的车辆id,车辆经度,车辆纬度;使用大数据并行计算组件Spark对原始数据进行缺失值的剔除和修复,降低数据的冗余性和复杂性。
进一步地,所述步骤2)中,将城市路网按照经纬度划分成M*N的栅格网络,每一个栅格代表一个区域的交通状态,栅格网络记作S={sm,n};将处理后的车辆经纬度原始数据按照固定时间间隔统计到每个栅格中,对于每一个位置(m,n),表示在时间间隔t时位置(m,n)中的车流量,按照5分钟为间隔将原始数据转化为交通栅格数据,记作{Xt|t=0,…,H1},H1为交通栅格数据的样本总量。
进一步地,所述步骤3)中,对处理过后的交通栅格数据进行标准化处理,通过下式计算 其中/>表示标准化前t时刻的交通栅格数据;表示标准化后t时刻的交通栅格数据;μ为交通栅格总体数据的平均值;σ为交通栅格总体数据的标准差。
进一步地,所述步骤4)中,构建基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数,具体步骤如下:
步骤4-1:构造时空残差网络模型,分为周期模块和邻近模块,具体步骤如下:
步骤4-1-1:利用2D卷积实现对空间特征的捕获,2D卷积公式为:Xl=f(Wl*Xl-1+bl),其中*表示2D卷积的运算;Wl是第l层卷积层的卷积核参数;Xl是第l层卷积层的输出,bl是第l层卷积层的偏置项;Xl-1是第l-1层的输入;f是激活函数;bl是卷积中的偏置项。根据交通栅格数据尺寸,构建卷积核尺寸,移动步幅和补零圈数,实现2D卷积操作前后交通栅格数据尺寸的不变,并且捕获对应局部特征;
步骤4-1-2:利用皮尔逊相关系数确定交通栅格数据的周期序列和邻近序列长度,皮尔逊相关系数由待预测的交通栅格数据和t时刻前t-k时刻的交通栅格数据进行确定,公式为/>其中xi目标交通栅格数据;yi为待比较的交通栅格数据;σx为目标交通栅格数据的样本总体标准差;σy为待比较交通栅格数据的样本总体标准差;根据皮尔逊相关系数确定模型周期序列为邻近序列为/>
步骤4-1-3:设置时空残差网络模型的初始网络结构、确定卷积深度、残差单元个数和输出层数,输出矩阵维度;
步骤4-1-4:确定残差单元:其中/>表示邻近序列第l-1层的输入;/>表示邻近序列第l层的残差输出;/>表示残差单元中所有可学习参数的集合;
步骤4-2:构造混合模型用于捕获周期序列和邻近序列的长期时间特性,具体步骤如下:
步骤4-2-1:确定LSTM长短时神经网络作为混合模型捕捉长期时间特性;
步骤4-2-2:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长λ,确定输出层状态矩阵H=(h1,h2,…,hq);
步骤4-2-3:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V,U、W、V初始化时均为随机实数;
步骤4-2-4:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤4-3:构造基于时空残差混合模型的城市路网短时交通流预测模型,具体步骤如下:
步骤4-3-1:使用步骤4-1构造的时空残差网络模型,将交通栅格数据划分为周期序列和邻近序列,周期序列主要使用2D卷积实现空间特征的提取;邻近序列使用2D卷积结合残差单元实现局部微小变化特征的提取;分别得到周期序列和邻近序列/>
步骤4-3-2:将步骤4-3-1得到的周期序列和邻近序列分别输入步骤4-2构造的混合模型,提高两种序列的长期时间特性捕获能力;
步骤4-3-3:将步骤4-3-2输出得到的两种序列进行融合,具体公式为:Xf=Wc*Xc *+Ww*Xw *,其中Wc和Ww是可学习的参数;Xc *和Xw *是步骤4-3-2的输出;
步骤4-3-4:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差。
进一步地,所述步骤5)中,使用构造的训练集训练构建的基于时空残差混合模型的城市路网短时交通流预测模型预测下一时刻的交通栅格数据,并用测试集对模型进行测试,具体步骤如下:
步骤5-1:将训练集输入到基于时空残差混合模型的城市路网短时交通流预测模型,通过模型得到对应的实际输出;
步骤5-2:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差,利用反向传播算法将每次运算的误差传递给时空残差混合模型中每一个可更新的参数,随后利用梯度下降算法更新每一个连接权重;
步骤5-3:设置迭代次数,在迭代中不断更新时空残差混合模型的连接权重;
步骤5-4:利用测试集数据测试模型训练效果,输入到时空残差混合模型,得到预测的交通栅格数据。
有益效果:本发明的短时交通流预测方法,该方法在时空残差网络模型的基础上,对时间序列引入皮尔逊相关系数的分析,确定相关性高的周期序列和邻近序列;引入混合模型,对周期序列和邻近序列进行长期时间特征的捕获,提高了预测的精度。
本发明针对传统时空残差模型缺乏对交通流数据进行相关性分析、捕获微小变化容易忽略长期时间特征等问题,提出一种基于时空残差混合模型的城市路网短时交通流预测方法,对时间序列引入皮尔逊相关系数的分析,确定相关性高的周期序列和邻近序列;引入LSTM神经网络作为混合模型,实现对周期序列和邻近序列长期时间特征的捕获,从而降低训练的误差,提高了短时交通流的预测精度,使得城市路网交通流预测具有更高的准确性和实用性。
附图说明
图1为本发明的基于时空残差混合模型的城市路网短时交通流预测方法步骤示意图;
图2为本发明的基于时空残差混合模型的城市路网短时交通流预测方法流程图;
图3为本发明的基于时空残差混合模型图;
图4为本发明的基于时空残差混合模型训练集损失值曲线图;
图5为本发明的基于时空残差混合模型测试集真实数据和预测数据对比图;
图6为本发明的基于时空残差混合模型测试集某一路口真实数据和预测数据对比图。
具体实施方法
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1-2所示,一种基于时空残差混合模型的城市路网短时交通流预测方法,包括如下步骤:
步骤1)由出租车、公交车和其他配备有GPS定位装置的车辆采集车辆当前经纬度数据并存放至后台服务器Hadoop大数据集群数据库中,利用集群并行计算组件Spark对原始数据进行数据预处理;
所述步骤1中,采集出租车、公交车和其他配有GPS定位装置车辆的经纬度数据,获得按时间排序的车辆原始数据集P,P={(Pid1,Plon1,Plat1,Ptime1)1,(Pid2,Plon2,Plat2,Ptime2)2,…,(Pidi,Ploni,Plati,Ptimei)n},其中n表示车辆经纬度原始数据集P的记录数量,Pidi,Ploni,Plati为第i个时间节点的车辆id,车辆经度,车辆纬度;使用大数据并行计算组件Spark对原始数据进行缺失值的剔除和修复,降低数据的冗余性和复杂性。
步骤2)将城市路网根据预测需求按照经纬度划分成M*N的交通栅格网络,将处理过的车辆经纬度数据按照经纬度划分到每一个交通栅格网络中,按照5min时间间隔将原始数据转化为交通栅格数据;
所述步骤2)中,将城市路网按照经纬度划分成M*N的栅格网络,每一个栅格代表一个区域的交通状态,栅格网络记作S={sm,m};将处理后的车辆经纬度原始数据按照固定时间间隔统计到每个栅格中,对于每一个位置(m,n),表示在时间间隔t时位置(m,n)中的车流量,按照5分钟为间隔将原始数据转化为交通栅格数据,记作{Xt|t=0,…,H1},H1为交通栅格数据的样本总量。
步骤3)将处理过后的交通栅格数据进行标准化处理,使用标准化后的数据集构建训练集和测试集;
所述步骤3)中,对处理过后的交通栅格数据进行标准化处理,通过下式计算 其中/>表示标准化前t时刻的交通栅格数据;/>表示标准化后t时刻的交通栅格数据;μ为交通栅格总体数据的平均值;σ为交通栅格总体数据的标准差。
步骤4)构造基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数;
所述步骤4)中,构建基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数,具体步骤如下:
步骤4-1:构造时空残差网络模型,分为周期模块和邻近模块,具体步骤如下:
步骤4-1-1:利用2D卷积实现对空间特征的捕获,2D卷积公式为:Xl=f(W1*X1-1+bl),其中*表示2D卷积的运算;Wl是第l层卷积层的卷积核参数;Xl是第l层卷积层的输出,bl是第l层卷积层的偏置项,;Xl-1是第l-1层的输入;f是激活函数;bl是卷积中的偏置项。根据交通栅格数据尺寸,构建卷积核尺寸,移动步幅和补零圈数,实现2D卷积操作前后交通栅格数据尺寸的不变,并且捕获对应局部特征;
步骤4-1-2:利用皮尔逊相关系数确定交通栅格数据的周期序列和邻近序列长度,皮尔逊相关系数由待预测的交通栅格数据和t时刻前t-k时刻的交通栅格数据进行确定,公式为/>其中xi目标交通栅格数据;yi为待比较的交通栅格数据;σx为目标交通栅格数据的样本总体标准差;σy为待比较交通栅格数据的样本总体标准差;根据皮尔逊相关系数确定模型周期序列为邻近序列为/>
步骤4-1-3:设置时空残差网络模型的初始网络结构、确定卷积深度、残差单元个数和输出层数,输出矩阵维度;
步骤4-1-4:确定残差单元:其中/>表示邻近序列第l-1层的输入;/>表示邻近序列第l层的残差输出;/>表示残差单元中所有可学习参数的集合;
步骤4-2:构造混合模型用于捕获周期序列和邻近序列的长期时间特性,具体步骤如下:
步骤4-2-1:确定LSTM长短时神经网络作为混合模型捕捉长期时间特性;
步骤4-2-2:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长λ,确定输出层状态矩阵H=(h1,h2,…,hq);
步骤4-2-3:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V,U、W、V初始化时均为随机实数;
步骤4-2-4:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤4-3:构造基于时空残差混合模型的城市路网短时交通流预测模型,如图4所示,具体步骤如下:
步骤4-3-1:使用步骤4-1构造的时空残差网络模型,将交通栅格数据划分为周期序列和邻近序列,周期序列主要使用2D卷积实现空间特征的提取;邻近序列使用2D卷积结合残差单元实现局部微小变化特征的提取;分别得到周期序列和邻近序列/>
步骤4-3-2:将步骤4-3-1得到的周期序列和邻近序列输出分别输入步骤4-2构造的混合模型,提高两种序列的长期时间特性捕获能力;
步骤4-3-3:将步骤4-3-2输出得到的两种序列进行融合,具体公式为:Xf=Wc*Xc *+Ww*Xw *,其中Wc和Ww是可学习的参数;Xc *和Xw *是步骤4-3-2的输出;
步骤4-3-4:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差。
步骤5)使用构造的训练集训练构建的基于时空残差混合模型的城市路网短时交通流预测模型预测下一时刻的交通栅格数据,损失值情况如图4所示,并用测试集对模型进行测试,实验结果如图5、图6所示。
所述步骤5)中,使用构造的训练集训练构建的基于时空残差混合模型的城市路网短时交通流预测模型预测下一时刻的交通栅格数据,并用测试集对模型进行测试,具体步骤如下:
步骤5-1:将训练集输入到基于时空残差混合模型的城市路网短时交通流预测模型,通过模型得到对应的实际输出;
步骤5-2:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差,利用反向传播算法将每次运算的误差传递给时空残差混合模型中每一个可更新的参数,随后利用梯度下降算法更新每一个连接权重;
步骤5-3:设置迭代次数,在迭代中不断更新时空残差混合模型的连接权重;
步骤5-4:利用测试集数据测试模型训练效果,输入到时空残差混合模型,得到预测的交通栅格数据。
本发明针对传统时空残差模型缺乏对交通流数据进行相关性分析、捕获微小变化容易忽略长期时间特征等问题,提出一种基于改进时空残差卷积神经网络的城市路网短时交通流预测模型。该模型将原始交通流数据转化成交通栅格数据,利用皮尔逊相关系数对交通栅格数据进行相关性分析,确定相关性高的周期序列和邻近序列,同时建立周期序列模型和邻近序列模型,引入长短时记忆神经网络作为混合模型提取时间特征,捕获两种序列的长期时间特征,从而降低训练的误差,提高了短时交通流的预测精度,使城市路网交通流预测具有更高的准确性和实用性。
以上所述仅为本发明在真实交通数据集下较好的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和其他修饰变化,皆应纳入权利要求书记载的保护范围。
Claims (4)
1.一种基于时空残差混合模型的城市路网短时交通流预测方法,其特征在于:包括如下步骤:
步骤1)由配备有GPS定位装置的车辆采集车辆当前经纬度数据并存放至后台服务器Hadoop大数据集群数据库中,并对车辆经纬度原始数据集P进行预处理;
步骤2)将城市路网根据预测需求按照经纬度划分成M*N的交通栅格网络,将预处理过的车辆经纬度原始数据按照经纬度划分到每一个交通栅格网络中,生成交通栅格数据;
步骤3)将交通栅格数据进行标准化处理,使用标准化后的数据集构建训练集和测试集;
步骤4)构造基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数;
步骤5)使用训练集训练基于时空残差混合模型的城市路网短时交通流预测模型,并用测试集对模型进行测试;
所述步骤3)中,对处理过后的交通栅格数据进行标准化处理,通过下式计算 其中/>表示标准化前t时刻的交通栅格数据;/>表示标准化后t时刻的交通栅格数据;μ为交通栅格总体数据的平均值;σ为交通栅格总体数据的标准差;
所述步骤4)中,构建基于时空残差混合模型的城市路网短时交通流预测模型,确定时空残差网络结构和混合模型的基本结构参数,具体步骤如下:
步骤4-1:构造时空残差网络模型,分为周期模块和邻近模块,具体步骤如下:
步骤4-1-1:利用2D卷积实现对空间特征的捕获,2D卷积公式为:Xl=f(W1*X1-1+bl),其中*表示2D卷积的运算;Wl是第l层卷积层的卷积核参数;Xl是第l层卷积层的输出,bl是第l层卷积层的偏置项;Xl-1是第l-1层的输入;f是激活函数;bl是卷积中的偏置项;根据交通栅格数据尺寸,构建卷积核尺寸,移动步幅和补零圈数,实现2D卷积操作前后交通栅格数据尺寸的不变,并且捕获对应局部特征;
步骤4-1-2:利用皮尔逊相关系数确定交通栅格数据的周期序列和邻近序列长度,皮尔逊相关系数由待预测的交通栅格数据和t时刻前t-k时刻的交通栅格数据/>进行确定,公式为/>其中xi目标交通栅格数据;yi为待比较的交通栅格数据;σx为目标交通栅格数据的样本总体标准差;σy为待比较交通栅格数据的样本总体标准差;根据皮尔逊相关系数确定模型周期序列为/>邻近序列为/>
步骤4-1-3:设置时空残差网络模型的初始网络结构、确定卷积深度、残差单元个数和输出层数,输出矩阵维度;
步骤4-1-4:确定残差单元:其中/>表示邻近序列第l-1层的输入;/>表示邻近序列第l层的残差输出;/>表示残差单元中所有可学习参数的集合;
步骤4-2:构造混合模型用于捕获周期序列和邻近序列的长期时间特性,具体步骤如下:
步骤4-2-1:确定LSTM长短时神经网络作为混合模型捕捉长期时间特性;
步骤4-2-2:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长λ,确定输出层状态矩阵H=(h1,h2,…,hq);
步骤4-2-3:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V,U、W、V初始化时均为随机实数;
步骤4-2-4:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤4-3:构造基于时空残差混合模型的城市路网短时交通流预测模型,具体步骤如下:
步骤4-3-1:使用步骤4-1构造的时空残差网络模型,将交通栅格数据划分为周期序列和邻近序列,周期序列主要使用2D卷积实现空间特征的提取;邻近序列使用2D卷积结合残差单元实现局部微小变化特征的提取;分别得到周期序列和邻近序列/>
步骤4-3-2:将步骤4-3-1得到的周期序列和邻近序列分别输入步骤4-2构造的混合模型,提高两种序列的长期时间特性捕获能力;
步骤4-3-3:将步骤4-3-2输出得到的两种序列进行融合,具体公式为:Xf=Wc*Xc *+Ww*Xw *,其中Wc和Ww是可学习的参数;Xc *和Xw *是步骤4-3-2的输出;
步骤4-3-4:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差。
2.根据权利要求1所述的基于时空残差混合模型的城市路网短时交通流预测方法,其特征在于:所述步骤1)中,P={(Pid1,Plon1,Plat1,Ptime1)1,(Pid2,Plon2,Plat2,Ptime2)2,…,(Pidi,Ploni,Plati,Ptimei)n},其中n表示车辆经纬度原始数据集P的记录数量,Pidi,Ploni,Plati分别为第i个时间节点的车辆id,车辆经度,车辆纬度;使用大数据并行计算组件Spark对原始数据进行缺失值的剔除和修复,降低数据的冗余性和复杂性。
3.根据权利要求1所述的基于时空残差混合模型的城市路网短时交通流预测方法,其特征在于:所述步骤2)中,将城市路网按照经纬度划分成M*N的栅格网络,每一个栅格代表一个区域的交通状态,栅格网络记作S={sm,n};将处理后的车辆经纬度原始数据按照固定时间间隔统计到每个栅格中,对于每一个位置(m,n),表示在时间间隔t时位置(m,n)中的车流量,按照5min为间隔将原始数据转化为交通栅格数据,记作{Xt|t=0,…,H1},H1为交通栅格数据的样本总量。
4.根据权利要求1所述的基于时空残差混合模型的城市路网短时交通流预测方法,其特征在于:所述步骤5)中,训练基于时空残差混合模型的城市路网短时交通流预测模型,具体步骤如下:
步骤5-1:将训练集输入到基于时空残差混合模型的城市路网短时交通流预测模型,通过模型得到对应的实际输出;
步骤5-2:使用RMSE均方根误差作为损失函数来计算预测值和实际值之间的误差,利用反向传播算法将每次运算的误差传递给时空残差混合模型中每一个可更新的参数,随后利用梯度下降算法更新每一个连接权重;
步骤5-3:设置迭代次数,在迭代中不断更新时空残差混合模型的连接权重;
步骤5-4:利用测试集数据测试模型训练效果,输入到时空残差混合模型,得到预测的交通栅格数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110155146.3A CN112966853B (zh) | 2021-02-04 | 2021-02-04 | 基于时空残差混合模型的城市路网短时交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110155146.3A CN112966853B (zh) | 2021-02-04 | 2021-02-04 | 基于时空残差混合模型的城市路网短时交通流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966853A CN112966853A (zh) | 2021-06-15 |
CN112966853B true CN112966853B (zh) | 2023-12-22 |
Family
ID=76273724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110155146.3A Active CN112966853B (zh) | 2021-02-04 | 2021-02-04 | 基于时空残差混合模型的城市路网短时交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966853B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627089B (zh) * | 2021-08-27 | 2022-08-02 | 东南大学 | 一种基于混合密度神经网络的城市车流量仿真方法 |
CN114360242B (zh) * | 2021-12-10 | 2023-04-07 | 重庆邮电大学 | 一种基于混合卷积lstm的城市短时交通流预测方法及系统 |
CN114913689B (zh) * | 2022-06-01 | 2023-06-16 | 南通大学 | 一种基于先验知识时变图卷积网络的交通流预测方法 |
CN115994629B (zh) * | 2023-03-23 | 2023-06-20 | 南京信息工程大学 | 一种基于gn-rbf的空气湿度预测方法及系统 |
CN116631195B (zh) * | 2023-07-20 | 2023-10-13 | 江西师范大学 | 一种基于城市子区域热点路口挖掘的区域异常检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022517A (zh) * | 2016-10-31 | 2018-05-11 | 昆山国显光电有限公司 | 驱动电路载体、显示面板及平板显示器 |
CN109754126A (zh) * | 2019-01-30 | 2019-05-14 | 银江股份有限公司 | 基于时空相关性和卷积神经网络的短时交通流预测方法 |
CN111383452A (zh) * | 2019-12-03 | 2020-07-07 | 东南大学 | 一种城市路网短期交通运行状态估计与预测方法 |
AU2020101023A4 (en) * | 2020-06-16 | 2020-07-23 | Guizhou Minzu University | A Novel Deep Learning Approach for Distributed Traffic Flow Forecasting |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
-
2021
- 2021-02-04 CN CN202110155146.3A patent/CN112966853B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022517A (zh) * | 2016-10-31 | 2018-05-11 | 昆山国显光电有限公司 | 驱动电路载体、显示面板及平板显示器 |
CN109754126A (zh) * | 2019-01-30 | 2019-05-14 | 银江股份有限公司 | 基于时空相关性和卷积神经网络的短时交通流预测方法 |
CN111383452A (zh) * | 2019-12-03 | 2020-07-07 | 东南大学 | 一种城市路网短期交通运行状态估计与预测方法 |
AU2020101023A4 (en) * | 2020-06-16 | 2020-07-23 | Guizhou Minzu University | A Novel Deep Learning Approach for Distributed Traffic Flow Forecasting |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
Non-Patent Citations (1)
Title |
---|
基于深度时空网络的地铁站点客流短时预测;黎旭成;彭逸洲;吴宗翔;陈振武;;交通与运输(第S2期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112966853A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112966853B (zh) | 基于时空残差混合模型的城市路网短时交通流预测方法 | |
CN115240425B (zh) | 一种基于多尺度时空融合图网络的交通预测方法 | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN111275962B (zh) | 车辆轨迹数据聚集效应预测方法及装置 | |
CN113327417B (zh) | 基于3d动态时空残差卷积关联网络的交通流预测方法 | |
CN113591380A (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
CN112910711A (zh) | 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质 | |
CN115146842A (zh) | 基于深度学习的多元时间序列趋势预测方法和系统 | |
CN115564114A (zh) | 一种基于图神经网络的空域碳排放短期预测方法及系统 | |
CN115828121A (zh) | 基于邻接dbscan融合时变多图卷积网络的交通流预测方法 | |
CN114913689B (zh) | 一种基于先验知识时变图卷积网络的交通流预测方法 | |
CN114511154A (zh) | 一种基于时空复杂图卷积网络的交通流预测方法 | |
CN110795522B (zh) | 一种移动用户轨迹位置的预测方法及装置 | |
CN110223342B (zh) | 一种基于深度神经网络的空间目标尺寸估计方法 | |
CN115099328A (zh) | 基于对抗网络的交通流量预测方法、系统、设备及存储介质 | |
CN114004152B (zh) | 基于图卷积和循环神经网络的多风场风速时空预测方法 | |
CN112907971B (zh) | 基于遗传算法优化时空残差模型的城市路网短时交通流预测方法 | |
CN113793227B (zh) | 一种用于社交网络事件的类人智能感知与预测方法 | |
CN113515798B (zh) | 一种城市三维空间扩张模拟方法及装置 | |
CN116699731A (zh) | 一种热带气旋路径短期预报方法、系统及存储介质 | |
CN111488974A (zh) | 基于深度学习神经网络的海洋风能降尺度方法 | |
CN115293639A (zh) | 一种基于隐马尔可夫模型的战场态势研判方法 | |
CN115169544A (zh) | 一种短期光伏发电功率预测方法及系统 | |
CN114912674A (zh) | 基于全日面光球磁图的太阳射电爆发预报方法及系统 | |
CN114566048A (zh) | 一种基于多视角自适应时空图网络的交通控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |