CN116913098A - 一种融合空气质量与车流量数据的短时交通流预测方法 - Google Patents
一种融合空气质量与车流量数据的短时交通流预测方法 Download PDFInfo
- Publication number
- CN116913098A CN116913098A CN202311184559.XA CN202311184559A CN116913098A CN 116913098 A CN116913098 A CN 116913098A CN 202311184559 A CN202311184559 A CN 202311184559A CN 116913098 A CN116913098 A CN 116913098A
- Authority
- CN
- China
- Prior art keywords
- air quality
- matrix
- traffic flow
- representing
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims abstract description 83
- 238000003062 neural network model Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 10
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 4
- 238000013135 deep learning Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 46
- 239000010410 layer Substances 0.000 claims description 44
- 238000005070 sampling Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 5
- 230000001413 cellular effect Effects 0.000 claims description 3
- 238000002203 pretreatment Methods 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 235000010269 sulphur dioxide Nutrition 0.000 description 1
- 239000004291 sulphur dioxide Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/048—Detecting movement of traffic to be counted or controlled with provision for compensation of environmental or other condition, e.g. snow, vehicle stopped at detector
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种融合空气质量与车流量数据的短时交通流预测方法,根据获取的车流量和空气质量数据集构建特征矩阵,再根据街道节点绘制空气质量关联拓扑图,用于获取空间特征,并创建对应的空气质量关联矩阵;然后根据空气质量关联拓扑图和特征矩阵,构造映射函数,使用深度学习方法搭建神经网络模型,对映射函数进行建模;对神经网络模型进行训练,并计算预测值与实际值之间的损失函数,通过反向传播算法对神经网络模型的参数进行优化,使用ADAM不断自适应学习率,优化神经网络模型的参数以使模型更加准确;使用训练好的神经网络模型对实时数据进行预测,输出预测结果。本发明结合车流量和空气质量数据,提高了交通流预测的准确性和可靠性。
Description
技术领域
本发明属于5G车联网技术领域,主要涉及了一种融合空气质量与车流量数据的短时交通流预测方法。
背景技术
交通流预测是交通控制和管理领域的一个重要问题,旨在减少拥堵、提高交通效率、优化城市交通管理,同时减少交通事故率、能源浪费和碳排放等社会问题。随着城市化进程的加深和交通需求的不断增长,交通流预测的研究和应用也越来越受到关注。随着传感器和数据采集技术的不断进步,交通数据的获取和处理变得更加容易。例如,车载传感器、路侧传感器和交通摄像头等技术可以实时采集交通流数据,这些数据可以用于交通流预测和交通控制。
传统的交通流预测方法包括统计模型、时间序列模型、回归模型等,这些模型在过去几十年中已经得到了广泛应用。然而,这些模型在处理非线性、复杂的交通流数据时存在局限性,因此需要更加先进的方法来提高预测准确性。
近年来,随这人工智能技术的飞速发展,如深度学习、强化学习等。这些技术可以对大规模、非线性、动态的交通数据进行处理和预测,同时可以通过学习自适应地提高预测准确性。但现有方法并未同时充分考虑内外部因素的影响。如何结合多源数据实现流量预测任务,是亟待解决的问题。
发明内容
本发明的目的在于提供一种融合空气质量与车流量数据的短时交通流预测方法,该方法利用城市道路交通流时空关联信息进行预测,可克服现有方法不能充分利用交通流数据的时空特征和周期性特征的缺点,同时进一步将交通流数据不同特征进行融合,从而提高短时交通流预测的准确性。
为实现上述目的,本发明采用的技术方案如下。
一种融合空气质量与车流量数据的短时交通流预测方法,包括以下步骤:
步骤S1数据采集:收集历史车流量数据和历史空气质量数据,获得历史车流量数据集和历史空气质量数据集;
步骤S2信息预处理:使用MinMax缩放器对历史车流量数据集和历史空气质量数据集进行归一化预处理,保证数据的准确性和完整性,并采用平均值法处理数据集中的缺失值;然后根据处理后的数据集构建特征矩阵X,将历史车流量数据和空气质量数据结合起来,,其中,x是历史车流量序列,Q是历史空气质量序列;并将处理后的历史车流量数据集和历史空气质量数据集分别划分为训练集和测试集;
步骤S3获取空间特征:根据街道节点绘制空气质量关联拓扑图G,用于获取空间特征,并创建对应的空气质量关联矩阵A;
步骤S4构造映射函数:根据空气质量关联拓扑图G和特征矩阵X,构造映射函数,然后计算下一个T时段的交通信息,计算公式为:
,
其中,m为历史时间序列的长度,T为需要预测的时间序列的长度,t为当前采样时刻;
步骤S5搭建模型:使用深度学习方法搭建神经网络模型,对映射函数进行建模;神经网络模型包含输入层、两层GCN模型、一层LSTM模型、一个注意力机制Attention和一层全连接层;其中,输入层用于输入包含实时获取的车流量数据与空气质量数据信息的特征矩阵X,GCN模型用于捕获街道节点之间车流量数据与空气质量数据的空间特征,LSTM模型用于捕获时间特征,注意力机制Attention用于对LSTM模型的输出进行加权求和,帮助LSTM模型更加聚焦于关键的输入信息,全连接层用于输出预测结果;
步骤S6模型训练:使用训练集数据对步骤S5搭建的神经网络模型进行训练,并使用测试集数据进行准确度测试,计算预测值与实际值之间的损失函数,通过反向传播算法对神经网络模型的参数进行优化,使用ADAM不断自适应学习率,优化神经网络模型的参数以使模型更加准确;
步骤S7数据预测:使用训练好的神经网络模型对实时获取的车流量数据与空气质量数据信息进行预测,输出预测结果。
进一步地,步骤S3中,根据街道节点绘制空气质量关联拓扑图G,用于获取空间特征,并创建对应的空气质量关联矩阵A的具体步骤为:
步骤S31,将街道标记为街道节点,若两街道间直接连通,视为两街道间的空气质量相互关联,则将空气质量相互关联的两街道间的连接关系标记为一条无向边;若两街道间不直接连通,视为两街道间的空气质量不相互关联,则将空气质量不相互关联的两街道间的连接关系标记为没有边相连;将各街道间的连接关系绘制成一张无向点线图;
步骤S32,创建一个空气质量关联矩阵,所述空气质量关联矩阵是一个n × n的邻接矩阵,其中n是街道节点的数量,将邻接矩阵的每个元素初始化为0,邻接矩阵中元素为0表示两个街道节点之间没有边相连;
步骤S33,遍历步骤S31中获取的无向点线图中的所有边,对于每条边连接的两个街道节点,如街道节点i和街道节点j,将邻接矩阵中对应的第i行第j列和第j行第i列的元素设置为1,表示街道节点i和街道节点j之间存在一条无向边;遍历完成后即可获得街道节点对应的空气质量关联矩阵A。
进一步地,步骤S5中,单层GCN模型表示为:
,
其中,是添加自连接的矩阵,A表示空气质量关联矩阵,/>是单位矩阵,/>是度矩阵,/>,/>表示层的输出,/>包含层的参数,/>表示sigmoid函数;
两层GCN模型表示为:
,
其中,表示对空气质量关联矩阵A的预处理步骤,/>表示从输入到隐藏层的权重矩阵,R表示实数集,P为特征矩阵X的长度,H为隐藏单元数,表示从隐藏层到输出层的权重矩阵;/>表示需要预测的时间序列的长度T的输出,N×T表示矩阵的维度,/>表示为N行T列的实数矩阵,矩阵行数N等于街道节点的个数,矩阵列数T即为预测的时间序列的长度;/>代表重构线性单元。
进一步地,步骤S5中,两层GCN模型中都包含多个GCN处理单元,两层GCN模型的GCN处理单元一一对应,其中,每一个采样时刻的特征矩阵对应两个GCN处理单元,GCN处理单元的输出表示为/>,即/>;将GCN模型第二层的输出/>作为输入,输入至LSTM模型中,LSTM模型捕获时间特征后输出新的节点表示/>,即LSTM模型的输出为/>,使用/>表示LSTM模型的整体输出,则GCN+LSTM的节点更新公式为:/>;同理,LSTM模型中包含多个LSTM处理单元,每两个GCN处理单元对应一个LSTM处理单元,将LSTM处理单元的输出表示为/>,则LSTM模型的整体输出表示为:/>。
进一步地,步骤S5中,LSTM模型的计算方式为:
,
,
,
,
,
其中,为输入门,/>为遗忘门,/>为细胞状态,/>为输出门,/>为当前采样时刻t对应的LSTM处理单元的输出,/>为当前采样时刻t对应的LSTM处理单元的输入;/>表示sigmoid函数,/>表示输入门的权重矩阵,/>表示遗忘门的权重矩阵,/>表示输出门的权重矩阵;/>表示输入门的偏置参数,/>表示遗忘门的偏置参数,/>表示输出门的偏置参数,/>表示候选细胞状态。
进一步地,步骤S5中,通过注意力机制Attention对LSTM模型的输出进行加权求和的计算方法为,若LSTM处理单元的输出为,则加权求和后的表示为/>,其中/>表示当前采样时刻t的权重;
使用Bahdanau Attention的方法来计算当前采样时刻t的权重,给定LSTM处理单元的输出/>和一个查询向量q,则当前采样时刻t的权重/>的计算公式为:
,
其中,,/>、/>、/>、/>都是需要学习的参数;/>、/>是为了计算注意力权重分母部分而存在的临时值,/>的计算公式与/>的一样,即/>,/>,/>为k时刻LSTM处理单元的输出;将加权求和后的表示C作为注意力机制Attention的输出,输入到接下来的全连接层中进行预测,输出预测结果。
进一步地,步骤S6中,计算预测值与实际值之间的损失函数时,采用均方误差作为损失函数,损失函数的计算公式表示为:
,
其中,s是样本数,是第/>个样本的实际值,/>是模型对第/>个样本的预测值。
相较于现有技术,本发明方法具有以下有益效果:
本发明提出了一种融合空气质量与车流量数据的短时交通流预测方法,利用城市道路交通流时空关联信息及周期性信息进行预测,并结合了空气质量数据,从而提高了交通流预测的准确性和可靠性。相对于现有方法,本发明充分利用了时空特征和空气质量数据,解决了现有方法不能充分利用时空特征和空气质量数据的问题。
附图说明
图1是本发明融合空气质量与车流量数据的短时交通流预测方法的流程图。
图2是本发明实施例中的街道示意图。
图3是本发明实施例中的空气质量关联拓扑图。
图4是本发明实施例中的模型整体结构示意图。
图5本发明实施例中LSTM模型的结构示意图。
图6是本发明实施例中采用融合空气质量与车流量数据的短时交通流预测方法进行预测的结果对比图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
如图1~图5所示的一种融合空气质量与车流量数据的短时交通流预测方法,具体步骤为:
步骤S1数据采集:本方法采集了两个数据源的数据,包括历史车流量数据集、历史空气质量数据集。数据是通过在城市部署多个传感器采集获得。这些传感器提供关于每5min通过的车辆数量的信息。而在历史空气质量数据集中,有由机动车辆排放的污染物参数,即包含一氧化碳、二氧化氮、二氧化硫、颗粒物和臭氧参数的数据。
步骤S2为了保证数据的准确性和完整性,需要对数据进行预处理。本实施例中使用sklearn库中的MinMaxScaler缩放器(最小最大值归一化)对历史车流量数据集、历史空气质量数据集进行归一化预处理,并采用平均值法处理数据集中的缺失值。缺失值的处理方法具体为:先确定数据集中存在缺失值的列的索引;然后计算这些列的平均值,并将对应列中的缺失值替换为该列的平均值。
构建特征矩阵X,将历史车流量数据和历史空气质量数据结合起来,,其中,x是历史车流量序列,Q是历史空气质量序列;并将处理后的历史车流量数据集和历史空气质量数据集分别划分为训练集和测试集。
步骤S3获取空间特征,包括以下步骤:
步骤S31绘制空气质量关联拓扑图G:如图2、图3所示,图2中含有8条街道,将图2中各街道标记为街道节点,即图2中对应含有街道节点1~街道节点8;若两街道间直接连通,视为两街道间的空气质量相互关联,则将空气质量相互关联的两街道间的连接关系标记为一条无向边;若两街道间不直接连通,视为两街道间的空气质量不相互关联,则将空气质量不相互关联的两街道间的连接关系标记为没有边相连;将各街道间的连接关系绘制成一张无向点线图,即可获得图3中(a)所示的点线图。
步骤S32创建一个空气质量关联矩阵,所述空气质量关联矩阵是一个n × n的邻接矩阵,其中n是街道节点的数量(即街道的数量)。将邻接矩阵的每个元素初始化为0,邻接矩阵中元素为0表示两个街道节点之间没有边相连。
步骤S33如图3中(b)所示,遍历图3中(a)中的所有边,对于每条边连接的两个街道节点(例如街道节点i和街道节点j),将邻接矩阵中对应的第i行第j列和第j行第i列的元素设置为1,表示街道节点i和街道节点j之间存在一条无向边。因为街道节点不应与自身邻接,所以邻接矩阵的主对角线上的元素均为0。遍历完成后获得街道节点对应的空气质量关联矩阵A。
步骤S4构建映射函数。本方法将交通流预测问题可以看作是在空气质量关联拓扑图G和特征矩阵X的前提下学习映射函数,然后计算下一个T时段的交通信息,计算公式为:
,
其中,m为历史时间序列的长度,T为需要预测的时间序列的长度,t为当前采样时刻,用来指示这是一个实时到达的交通流数据。
步骤S5搭建模型,包括以下步骤:
步骤S51搭建GCN模型:给定空气质量关联矩阵A和特征矩阵X,GCN模型在傅里叶域构造一个滤波器。该滤波器作用于图3中的街道节点,通过滤波器的一阶邻域捕获街道节点之间的空间特征,然后通过叠加多个卷积层来建立GCN模型,单层GCN模型表示为:
,
其中,是添加自连接的矩阵,A表示空气质量关联矩阵,/>是单位矩阵,/>是度矩阵,/>,即/>是将空气质量关联矩阵A按列求和,/>表示第/>层的输出,/>包含第/>层的参数,/>表示sigmoid函数。
本发明方法选择采用两层GCN模型来获得空间依赖性,双层GCN模型表示为:
,
其中,表示对空气质量关联矩阵A的预处理步骤,/>表示从输入到隐藏层的权重矩阵,R表示实数集,P为特征矩阵X的长度,H为隐藏单元数,表示从隐藏层到输出层的权重矩阵;/>表示需要预测的时间序列的长度T的输出,N×T表示矩阵的维度,/>表示为N行T列的实数矩阵,矩阵行数N等于街道节点的个数,矩阵列数T即为预测的时间序列的长度;/>代表重构线性单元,本实施例中,采用现代深度神经网络中常用的激活层作为重构线性单元。总之,本方法使用两层GCN模型从车流量数据与空气质量数据中学习空间特征。如图4所示,两层GCN模型中都包含多个GCN处理单元,两层GCN模型的GCN处理单元一一对应,其中,每一个采样时刻的特征矩阵/>对应两个GCN处理单元,GCN处理单元的输出表示为/>,即。
步骤S52搭建LSTM模型:将步骤S51中GCN模型第二层的输出作为输入,输入至LSTM模型中,LSTM模型捕获时间特征,然后输出新的节点表示/>,即LSTM模型的输出为/>,这里使用/>表示LSTM模型的整体输出。则GCN+LSTM的节点更新公式为:/>。同理,如图4所示,LSTM模型中包含多个LSTM处理单元,每两个GCN处理单元对应一个LSTM处理单元,将LSTM处理单元的输出表示为/>,则LSTM模型的整体输出表示为:
。
本实施例中,LSTM处理单元之间相互关联,每一个LSTM处理单元会受到前一个LSTM处理单元的影响。LSTM模型的结构如图5所示,LSTM模型的计算方式为:
,
,
,
,
,
其中,为输入门,/>为遗忘门,/>为细胞状态,/>为输出门,/>为当前采样时刻t对应的LSTM处理单元的输出,/>为当前采样时刻t对应的LSTM处理单元的输入;/>表示sigmoid函数,/>表示输入门的权重矩阵,/>表示遗忘门的权重矩阵,/>表示输出门的权重矩阵;/>表示输入门的偏置参数,/>表示遗忘门的偏置参数,/>表示输出门的偏置参数,/>表示候选细胞状态。在实际实现中,还需要为LSTM模型添加dropout和批标准化等技术来提高模型的鲁棒性和泛化能力。
步骤S53在LSTM模型中加入注意力机制Attention,用于帮助模型更加聚焦于关键的输入信息,提高模型的预测性能。下面是本实施例采用的方法:
对各个LSTM处理单元的输出进行加权求和,权重由注意力机制计算得出。若LSTM处理单元的输出为,则加权求和后的表示为/>,其中,/>表示当前采样时刻t的权重。
本实施例中使用Bahdanau Attention的方法来计算当前采样时刻t的权重。给定LSTM处理单元的输出和一个查询向量q,则当前采样时刻t的权重的计算公式为:
,
其中,,/>、/>、/>、/>都是需要学习的参数。/>、/>是为了计算注意力权重分母部分而存在的临时值,/>的计算公式与/>的一样,即/>,/>,/>为k时刻LSTM处理单元的输出。
然后将加权求和后的表示C作为注意力机制Attention的输出,输入到接下来的全连接层Predication中进行预测,输出预测结果。
步骤S6模型训练:使用训练集数据对步骤S5搭建的神经网络模型进行训练,并使用测试集数据进行准确度测试,计算预测值与实际值之间的损失函数,采用均方误差作为损失函数,通过反向传播算法对神经网络模型的参数进行优化,使用ADAM不断自适应学习率,优化模型参数以使其更加准确。其中均方误差(Mean Square Error, MSE)是常用的一种衡量模型预测结果与真实结果之间差异的评价指标。它是对预测值与实际值之间误差的平方求和的平均值,可以用以下公式表示:
,
其中,s是样本数,是第/>个样本的实际值,/>是模型对第/>个样本的预测值。均方误差的值越小,说明模型的预测结果与实际值越接近,模型的预测性能越好。在训练过程中,优化模型的目标通常是最小化均方误差,使得模型的预测结果尽可能地接近真实结果。
步骤S7数据预测:智能网联汽车和路测传感器作为收集空气质量与车流量数据的入口,通过路测基站将数据上传到数据处理后台,获取实时车流量数据与空气质量数据,使用训练好的神经网络模型对实时获取的车流量数据与空气质量数据信息进行预测,输出预测结果。
本实施例中的预测结果如图6所示,图6为每5分钟对街道车流量进行一次预测的结果对比图,图6中(a)为预测结果图,图6中(b)为真实结果图,可以看出,预测结果与真实结果之间的误差非常小,说明采用本发明短时交通流预测方法进行交通流预测的准确率高。
Claims (7)
1.一种融合空气质量与车流量数据的短时交通流预测方法,其特征在于,包括以下步骤:
步骤S1,收集历史车流量数据和历史空气质量数据,获得历史车流量数据集和历史空气质量数据集;
步骤S2,使用MinMax缩放器对历史车流量数据集和历史空气质量数据集进行归一化预处理,保证数据的准确性和完整性,并采用平均值法处理数据集中的缺失值;然后根据处理后的数据集构建特征矩阵X,将历史车流量数据和空气质量数据结合起来,,其中,x是历史车流量序列,Q是历史空气质量序列;并将处理后的历史车流量数据集和历史空气质量数据集分别划分为训练集和测试集;
步骤S3,根据街道节点绘制空气质量关联拓扑图G,用于获取空间特征,并创建对应的空气质量关联矩阵A;
步骤S4,根据空气质量关联拓扑图G和特征矩阵X,构造映射函数,然后计算下一个T时段的交通信息,计算公式为:
,
其中,m为历史时间序列的长度,T为需要预测的时间序列的长度,t为当前采样时刻;
步骤S5,使用深度学习方法搭建神经网络模型,对映射函数进行建模;神经网络模型包含输入层、两层GCN模型、一层LSTM模型、一个注意力机制Attention和一层全连接层;其中,输入层用于输入包含实时获取的车流量数据与空气质量数据信息的特征矩阵X,GCN模型用于捕获街道节点之间车流量数据与空气质量数据的空间特征,LSTM模型用于捕获时间特征,注意力机制Attention用于对LSTM模型的输出进行加权求和,帮助LSTM模型更加聚焦于关键的输入信息,全连接层用于输出预测结果;
步骤S6,使用训练集数据对步骤S5搭建的神经网络模型进行训练,并使用测试集数据进行准确度测试,计算预测值与实际值之间的损失函数,通过反向传播算法对神经网络模型的参数进行优化,使用ADAM不断自适应学习率,优化神经网络模型的参数以使模型更加准确;
步骤S7,使用训练好的神经网络模型对实时获取的车流量数据与空气质量数据信息进行预测,输出预测结果。
2.根据权利要求1所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,步骤S3中,根据街道节点绘制空气质量关联拓扑图G,用于获取空间特征,并创建对应的空气质量关联矩阵A的具体步骤为:
步骤S31,将街道标记为街道节点,若两街道间直接连通,视为两街道间的空气质量相互关联,则将空气质量相互关联的两街道间的连接关系标记为一条无向边;若两街道间不直接连通,视为两街道间的空气质量不相互关联,则将空气质量不相互关联的两街道间的连接关系标记为没有边相连;将各街道间的连接关系绘制成一张无向点线图;
步骤S32,创建一个空气质量关联矩阵,所述空气质量关联矩阵是一个n × n的邻接矩阵,其中n是街道节点的数量,将邻接矩阵的每个元素初始化为0,邻接矩阵中元素为0表示两个街道节点之间没有边相连;
步骤S33,遍历步骤S31中获取的无向点线图中的所有边,对于每条边连接的两个街道节点,如街道节点i和街道节点j,将邻接矩阵中对应的第i行第j列和第j行第i列的元素设置为1,表示街道节点i和街道节点j之间存在一条无向边;遍历完成后即可获得街道节点对应的空气质量关联矩阵A。
3.根据权利要求1所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,单层GCN模型表示为:
,
其中,是添加自连接的矩阵,A表示空气质量关联矩阵,/>是单位矩阵,是度矩阵,/>,/>表示层的输出,/>包含层的参数,/>表示sigmoid函数;
两层GCN模型表示为:
,
其中,表示对空气质量关联矩阵A的预处理步骤,/>表示从输入到隐藏层的权重矩阵,R表示实数集,P为特征矩阵X的长度,H为隐藏单元数,表示从隐藏层到输出层的权重矩阵;/>表示需要预测的时间序列的长度T的输出,N×T表示矩阵的维度,/>表示为N行T列的实数矩阵,矩阵行数N等于街道节点的个数,矩阵列数T即为预测的时间序列的长度;/>代表重构线性单元。
4.根据权利要求3所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,两层GCN模型中都包含多个GCN处理单元,两层GCN模型的GCN处理单元一一对应,其中,每一个采样时刻的特征矩阵对应两个GCN处理单元,GCN处理单元的输出表示为/>,即/>;将GCN模型第二层的输出/>作为输入,输入至LSTM模型中,LSTM模型捕获时间特征后输出新的节点表示/>,即LSTM模型的输出为/>,使用表示LSTM模型的整体输出,则GCN+LSTM的节点更新公式为:;同理,LSTM模型中包含多个LSTM处理单元,每两个GCN处理单元对应一个LSTM处理单元,将LSTM处理单元的输出表示为/>,则LSTM模型的整体输出表示为:。
5.根据权利要求4所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,LSTM模型的计算方式为:
,
,
,
,
,
其中,为输入门,/>为遗忘门,/>为细胞状态,/>为输出门,/>为当前采样时刻t对应的LSTM处理单元的输出,/>为当前采样时刻t对应的LSTM处理单元的输入;表示sigmoid函数,/>表示输入门的权重矩阵,/>表示遗忘门的权重矩阵,/>表示输出门的权重矩阵;/>表示输入门的偏置参数,/>表示遗忘门的偏置参数,/>表示输出门的偏置参数,/>表示候选细胞状态。
6.根据权利要求5所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,步骤S5中,通过注意力机制Attention对LSTM模型的输出进行加权求和的计算方法为,若LSTM处理单元的输出为,则加权求和后的表示为/>,其中/>表示当前采样时刻t的权重;
使用Bahdanau Attention的方法来计算当前采样时刻t的权重,给定LSTM处理单元的输出/>和一个查询向量q,则当前采样时刻t的权重/>的计算公式为:
,
其中,,/>、/>、/>、/>都是需要学习的参数;/>、/>是为了计算注意力权重分母部分而存在的临时值,/>的计算公式与/>的一样,即/>,/>,/>为k时刻LSTM处理单元的输出;将加权求和后的表示C作为注意力机制Attention的输出,输入到接下来的全连接层中进行预测,输出预测结果。
7.根据权利要求1所述的融合空气质量与车流量数据的短时交通流预测方法,其特征在于,步骤S6中,计算预测值与实际值之间的损失函数时,采用均方误差作为损失函数,损失函数的计算公式表示为:
,
其中,s是样本数,是第/>个样本的实际值,/>是模型对第/>个样本的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311184559.XA CN116913098B (zh) | 2023-09-14 | 2023-09-14 | 一种融合空气质量与车流量数据的短时交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311184559.XA CN116913098B (zh) | 2023-09-14 | 2023-09-14 | 一种融合空气质量与车流量数据的短时交通流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116913098A true CN116913098A (zh) | 2023-10-20 |
CN116913098B CN116913098B (zh) | 2023-12-22 |
Family
ID=88363380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311184559.XA Active CN116913098B (zh) | 2023-09-14 | 2023-09-14 | 一种融合空气质量与车流量数据的短时交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116913098B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118116207A (zh) * | 2024-04-28 | 2024-05-31 | 松立控股集团股份有限公司 | 一种时空交通流量缺失数据填充方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426636A (zh) * | 2015-12-23 | 2016-03-23 | 北京工业大学 | 城市峡谷街道机动车污染物排放与扩散的实时估计方法 |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN110070713A (zh) * | 2019-04-15 | 2019-07-30 | 浙江工业大学 | 一种基于双向嵌套lstm神经网络的交通流预测方法 |
WO2019145018A1 (en) * | 2018-01-23 | 2019-08-01 | Siemens Aktiengesellschaft | System, device and method for detecting abnormal traffic events in a geographical location |
WO2021109318A1 (zh) * | 2019-12-03 | 2021-06-10 | 东南大学 | 一种城市路网短期交通运行状态估计与预测方法 |
CN114519932A (zh) * | 2022-01-10 | 2022-05-20 | 中国科学院深圳先进技术研究院 | 一种基于时空关系抽取的区域交通状况集成预测方法 |
EP4016412A1 (en) * | 2020-12-18 | 2022-06-22 | Imec VZW | Traffic prediction |
CN114662791A (zh) * | 2022-04-22 | 2022-06-24 | 重庆邮电大学 | 一种基于时空注意力的长时序pm2.5预测方法及系统 |
-
2023
- 2023-09-14 CN CN202311184559.XA patent/CN116913098B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426636A (zh) * | 2015-12-23 | 2016-03-23 | 北京工业大学 | 城市峡谷街道机动车污染物排放与扩散的实时估计方法 |
WO2019145018A1 (en) * | 2018-01-23 | 2019-08-01 | Siemens Aktiengesellschaft | System, device and method for detecting abnormal traffic events in a geographical location |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN110070713A (zh) * | 2019-04-15 | 2019-07-30 | 浙江工业大学 | 一种基于双向嵌套lstm神经网络的交通流预测方法 |
WO2021109318A1 (zh) * | 2019-12-03 | 2021-06-10 | 东南大学 | 一种城市路网短期交通运行状态估计与预测方法 |
EP4016412A1 (en) * | 2020-12-18 | 2022-06-22 | Imec VZW | Traffic prediction |
CN114519932A (zh) * | 2022-01-10 | 2022-05-20 | 中国科学院深圳先进技术研究院 | 一种基于时空关系抽取的区域交通状况集成预测方法 |
CN114662791A (zh) * | 2022-04-22 | 2022-06-24 | 重庆邮电大学 | 一种基于时空注意力的长时序pm2.5预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
闫旭;范晓亮;郑传潘;臧?;王程;程明;陈龙彪;: "基于图卷积神经网络的城市交通态势预测算法", 浙江大学学报(工学版), no. 06 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118116207A (zh) * | 2024-04-28 | 2024-05-31 | 松立控股集团股份有限公司 | 一种时空交通流量缺失数据填充方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116913098B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN109285346B (zh) | 一种基于关键路段的城市路网交通状态预测方法 | |
CN111563611B (zh) | 面向图卷积网络的云数据中心可再生能源时空预测方法 | |
CN111798051A (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN116721537A (zh) | 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法 | |
CN115578852B (zh) | 一种基于dstgcn的交通预测方法 | |
CN101982843B (zh) | 一种非参数回归短时交通流预测中状态向量的选取方法 | |
CN116913098B (zh) | 一种融合空气质量与车流量数据的短时交通流预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN109583588B (zh) | 一种短期风速预测方法及系统 | |
CN116842459B (zh) | 一种基于小样本学习的电能计量故障诊断方法及诊断终端 | |
CN113516304B (zh) | 基于时空图网络的区域污染物时空联合预测方法及装置 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
Dhamge et al. | Genetic algorithm driven ANN model for runoff estimation | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
CN115051925B (zh) | 一种基于迁移学习的时空序列预测方法 | |
CN115629160A (zh) | 一种基于时空图的空气污染物浓度预测方法及系统 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN112766240B (zh) | 基于时空关系的残差多图卷积人群分布预测方法及系统 | |
He et al. | Neural computing for grey Richards differential equation to forecast traffic parameters with various time granularity | |
Ghose et al. | A Deep Learning based Air Quality Prediction Technique Using Influencing Pollutants of Neighboring Locations in Smart City | |
CN113469331B (zh) | 基于全局和局部时空图卷积的车辆尾气预测方法及系统 | |
CN116434569A (zh) | 基于stnr模型的交通流量预测方法及系统 | |
Jin et al. | Research on multi-sensor information fusion algorithm of fan detection robot based on improved BP neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |