CN108133295B - 一种针对目标路段的机动车尾气浓度连续时间预测方法 - Google Patents

一种针对目标路段的机动车尾气浓度连续时间预测方法 Download PDF

Info

Publication number
CN108133295B
CN108133295B CN201810027931.9A CN201810027931A CN108133295B CN 108133295 B CN108133295 B CN 108133295B CN 201810027931 A CN201810027931 A CN 201810027931A CN 108133295 B CN108133295 B CN 108133295B
Authority
CN
China
Prior art keywords
data
concentration
road section
layer
motor vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810027931.9A
Other languages
English (en)
Other versions
CN108133295A (zh
Inventor
杨钰潇
李泽瑞
杜晓冬
吕文君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Yousi Tiancheng Intelligent Technology Co ltd
Original Assignee
Anhui Yousi Tiancheng Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Yousi Tiancheng Intelligent Technology Co ltd filed Critical Anhui Yousi Tiancheng Intelligent Technology Co ltd
Priority to CN201810027931.9A priority Critical patent/CN108133295B/zh
Publication of CN108133295A publication Critical patent/CN108133295A/zh
Application granted granted Critical
Publication of CN108133295B publication Critical patent/CN108133295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Feedback Control In General (AREA)
  • Traffic Control Systems (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

本发明公开了一种针对目标路段的机动车尾气浓度连续时间预测方法,通过构造eRCNN神经网络模型,以包含连续路段时空尾气浓度数据的矩阵作为网络的输入,用卷积层自然地捕获附近路段之间的尾气浓度的复杂交互性,而无需详细的表征,同时引入误差反馈循环层来感知污染物浓度突然变动引起的预测误差,此外还极大程度上利用、整合了历史观测数据之间的关系,提高了预测精度与效率,同时具有较强的泛化能力,具有一定的社会价值和现实意义。

Description

一种针对目标路段的机动车尾气浓度连续时间预测方法
技术领域
本发明属于环境监测技术领域,涉及一种机动车尾气浓度预测方法,具体是一种针对目标路段的机动车尾气浓度连续时间预测方法。
背景技术
随着社会发展和城市进步,近年来,城市区域中机动车数量持续增加,诸多社会问题随之产生,如城市交通拥堵现象严重、交通事故增多、机动车尾气污染、酒驾等。在北京、上海、广州等大城市,机动车已成为排放一氧化碳、氮氧化物、碳氢化合物等污染物的第一大污染源。由于汽车废气的排放主要在0.3米至2米之间,正好是人体的呼吸范围,对人体的健康损害非常严重——刺激呼吸道,使呼吸系统的免疫力下降,导致暴露人群慢性气管炎、支气管炎及呼吸困难的发病率升高、肺功能下降等一系列症状。尾气中所含的强致癌物质——苯类物质,会引发肺癌、甲状腺癌等。
为了改善这些机动车尾气产生的社会问题,及时准确地了解城市道路中机动车尾气的排放情况,建立适用于城市区域机动车尾气浓度预测模型,可以实现对城市路网各路段尾气排放的实时预测和趋势估计,为制定城市移动源大气污染物排放的监管提供决策依据。当某区域的有害气体成分浓度达到一定污染值时,平台可以向政府决策部门发出限号、分流、限行等建议,从而可减少由于在路机动车引起的空气污染。
而现有的污染物浓度预测方法,只是从污染物本身的角度出发,主观选择可能的影响因素进行物理建模,预测效果不理想。
发明内容
本发明针对现有技术的不足,提供了一种针对目标路段的机动车尾气浓度连续时间预测方法,构建eRCNN神经网络模型,利用城市中各路段的位置关系及其尾气污染物的各时刻历史浓度值,预测出目标路段下一时刻的尾气污染物浓度,提高了预测精度与效率。
本发明的目的可以通过以下技术方案实现:
一种针对目标路段的机动车尾气浓度连续时间预测方法,具体包括以下步骤:
步骤S1,采集城市目标路段附近指定周期内的机动车尾气浓度数据;
步骤S2,对步骤S1所采集的机动车尾气浓度数据进行数据预处理。
步骤S3,构造eRCNN神经网络模型;
步骤S4,根据步骤S2预处理后的机动车尾气浓度数据,构造eRCNN神经网络的训练数据集和测试数据集;
步骤S5,将步骤S4中的训练数据集送入步骤S3中构造的eRCNN神经网络模型中,进行参数训练、预训练以及微调,逐步提高预测精度。
步骤S6,将经过步骤S5中训练、测试后的eRCNN神经网络作为针对目标路段的机动车尾气浓度连续时间预测模型,经过模型对输入数据的自主学习,预测出目标路段的机动车尾气浓度的发展趋势以及未来某时刻的尾气浓度值。
进一步地,所述步骤S1中机动车尾气浓度数据的采集方法具体包括:
步骤S11,首先确定需要采集机动车尾气浓度数据的路段,包括预测的目标路段S以及其上下游的2m个路段。
步骤S12,收集一个月中25个工作日每5分钟的上述路段的城市机动车尾气浓度数据,构造时空输入矩阵X
Figure GDA0002415134540000031
其中,xs,t表示目标路段S在t时刻的机动车尾气浓度,是需要预测目标,列向量x:t包含了在同一时刻t,目标路段S及其上下游各m个路段的机动车尾气浓度;行向量包含了对同一目标路段S,从t时刻到t之前n个时刻的机动车尾气浓度。按这种方式,输入矩阵X包含空间和时间上与预测目标xs,t相邻的所有机动车尾气浓度信息。
进一步地,所述步骤S2中的数据预处理具体包括两个方面:
A、缺失值填补:对于部分缺失的数据,采用缺失数据栅格区域的前d个与后d个尾气排放数据取平均值的方法进行填补,从而保证数据的完备性和充足性,保证预测结果的准确性和可信度,本发明实施例d取值30。
B、归一化处理:所谓归一化处理,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,保证不同数据范围的输入数据发挥相同的作用。本发明中以路段为单位,对该路段所有时刻的数据按下式进行归一化处理:
Figure GDA0002415134540000032
其中x′i,j是第i个路段在j时刻归一化后的数据,xi,j是第i个路段在j时刻的原始数据,xi,max和xi,min分别是第i个路段所有时刻的数据中的最大值和最小值。
进一步地,所述eRCNN神经网络包括卷积层、池化层、误差反馈循环层和输出层四层结构。
进一步地,所述卷积层连接时空输入矩阵和若干可训练的滤波器,每个滤波器都是i*i的权重矩阵,第k个滤波器为
Figure GDA0002415134540000041
卷积层用第k个滤波器锯齿扫描时空输入矩阵,计算卷积神经元矩阵,第k个滤波器得到的卷积神经元矩阵的元素(p,q)的计算公式为:
Figure GDA0002415134540000042
式中,bk是第k个过滤器的偏置量。
进一步地,所述池化层采用均值下降采样法对卷积神经元矩阵降维,将卷积神经元矩阵分为j*j个不相交的区域,用各区域的均值代表其中卷积神经元的特征,池化后的时空矩阵维度维数降为原来的1/(j*j),通过向量化池化后的卷积神经元矩阵,输出一个特征向量。
进一步地,所述误差反馈循环层包括常规循环层神经元和误差反馈神经元,其中常规循环层神经元的输入是池化层输出的特征向量p、以及前一时间步的误差反馈循环层的向量值,
Figure GDA0002415134540000043
式中
Figure GDA0002415134540000044
是第k个常规循环层神经元的连接权重向量,
r(t-1)是t-1步的误差反馈循环层神经元向量,
Figure GDA0002415134540000045
r(t-1)对应的权重向量,
Figure GDA0002415134540000051
是第k个常规循环层神经元的偏置量;
第k个误差反馈循环神经元在t预测步的值定义为:
Figure GDA0002415134540000052
式中
Figure GDA0002415134540000053
是第k个误差反馈循环神经元要训练的权重,向量
e(t-1)是预测误差向量,
Figure GDA0002415134540000054
是第k个误差反馈循环层神经元的偏置量;
其中,e(t)=[y(t-1)-o(t-1),...,y(t-l)-o(t-l)]
式中y(t-1)是第t-l步的实际尾气污染物浓度,o(t-l)是第t-l步的预测值;
误差反馈循环层的输出是常规循环层神经元和误差反馈循环层神经元的组合:
r=[r(R);r(E)]。
进一步地,所述误差反馈层的输出神经元r作为一个输出层的输入,输出层产生最终的预测值为:
o=σ(w(OR)r(R)+w(OE)r(E)+b(O))
Figure GDA0002415134540000055
所述输出层采用改进的ReLU函数作为激活函数:
进一步地,所述步骤S5中的参数训练通过小批量随机梯度下降法实现,对于一个路段,参数训练的目标是使所有训练样本的平方误差最小,即Loss函数为:
Figure GDA0002415134540000061
在小批量随机梯度下降法中,将训练样本分为几个小批量,对于一个小批量,计算相对于所有参数的L的偏导数,然后使用以下等式更新参数:
Figure GDA0002415134540000062
其中α是一可调整的学习速率,L到参数的偏导数通过误差反向传播算法来计算;
对eRCNN模型进行预训练,首先用基于Pearson相关系数的聚类算法,皮尔森相关系数公式如下:
Figure GDA0002415134540000063
式中,ρ(si,sj)表示路段si和路段sj的Pearson相关系数,
Si表示路段si的各属性值组成的向量,Sj同理,Cov(Si,Sj)表示Si和Sj的协方差,Var(Si)表示向量Si的方差,Var(Sj)同理;
设定Pearson相关系数的阈值为0.6,然后将位置上相邻且Pearson相关系数大于阈值的路段聚在一起,同一集合中各路段的机动车尾气浓度数据共享,共同训练出一个eRCNN模型;
使用预训练模型的参数作为参数的初始值,在预训练的模型基础上,用某路段给定时间段的尾气浓度数据微调参数。
本发明的有益效果:本发明提出针对目标路段的机动车尾气浓度连续时间预测方法,通过构造eRCNN神经网络模型,以包含连续路段时空尾气浓度数据的矩阵作为网络的输入,用卷积层自然地捕获附近路段之间的尾气浓度的复杂交互性,而无需详细的表征,同时引入误差反馈循环层来感知污染物浓度突然变动引起的预测误差,此外还极大程度上利用、整合了历史观测数据之间的关系,提高了预测精度与效率,同时具有较强的泛化能力,具有一定的社会价值和现实意义。
附图说明
图1为本发明的方法流程图。
图2为本发明eRCNN神经网络的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种针对目标路段的机动车尾气浓度连续时间预测方法,具体包括以下步骤:
步骤S1,采集城市目标路段附近指定周期内的机动车尾气浓度数据。
其中,步骤S1中机动车尾气浓度数据的采集方法具体包括:
步骤S11,首先确定需要采集机动车尾气浓度数据的路段,包括预测的目标路段S以及其上下游的2m个路段。
步骤S12,收集一个月中25个工作日每5分钟的上述路段的城市机动车尾气浓度数据,构造时空输入矩阵X,上述数据收集的时间和频率为优选值,可根据实际情况调整。
Figure GDA0002415134540000081
其中,xs,t表示目标路段S在t时刻的机动车尾气浓度,是需要预测目标,列向量x:t包含了在同一时刻t,目标路段S及其上下游各m个路段的机动车尾气浓度;行向量包含了对同一目标路段S,从t时刻到t之前n个时刻的机动车尾气浓度。按这种方式,输入矩阵X包含空间和时间上与预测目标xs,t相邻的所有机动车尾气浓度信息。
步骤S2,对步骤S1所采集的机动车尾气浓度数据进行数据预处理。
其中,步骤S2中的数据预处理具体包括两个方面:
A、缺失值填补:对于部分缺失的数据,采用缺失数据栅格区域的前d个与后d个尾气排放数据取平均值的方法进行填补,从而保证数据的完备性和充足性,保证预测结果的准确性和可信度,本发明实施例d取值30。
B、归一化处理:所谓归一化处理,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,保证不同数据范围的输入数据发挥相同的作用。本发明中以路段为单位,对该路段所有时刻的数据按下式进行归一化处理:
Figure GDA0002415134540000091
其中xi,j是第i个路段在j时刻归一化后的数据,xi,j是第i个路段在j时刻的原始数据,xi,max和xi,min分别是第i个路段所有时刻的数据中的最大值和最小值。
步骤S3,构造eRCNN神经网络模型。
其中,如图2所示,eRCNN神经网络包括卷积层、池化层、误差反馈循环层和输出层四层结构。
其中,卷积层连接时空输入矩阵和若干可训练的滤波器,每个滤波器都是i*i的权重矩阵,第k个滤波器为Wk (c),卷积层用第k个滤波器锯齿扫描时空输入矩阵,计算卷积神经元矩阵。本发明中采用6个3*3的滤波器,第k个滤波器得到的卷积神经元矩阵的元素(p,q)的计算公式为:
Figure GDA0002415134540000092
式中,bk是第k个过滤器的偏置量。
池化层采用均值下降采样法对卷积神经元矩阵降维。在本发明提出的eRCNN模型中,池化层将卷积神经元矩阵分为j*j个不相交的区域,用各区域的均值代表其中卷积神经元的特征,池化后的时空矩阵维度维数降为原来的1/(j*j),通过向量化池化后的卷积神经元矩阵,输出一个特征向量。
误差反馈循环层:机动车尾气浓度数据的一个重要特征是在短时间内的突然变化,例如,早晚高峰发生交通拥堵时,而当追尾事故发生后,造成的交通拥堵会使尾气浓度增加;夜间渣土运输车等大型柴油车辆连续行驶过某路段时,也会造成短时机动车尾气浓度大幅上升。一般来说,使用传统的神经网络结构,很难预测这些突然状况下尾气浓度的变化。于是,本发明引入了一个误差反馈循环层来改善上述情况下模型的预测性能。
在误差反馈循环层,包括常规循环层神经元和误差反馈循环神经元,其中常规循环层神经元的输入是池化层输出的特征向量p、以及前一时间步的误差反馈循环层的向量值,
Figure GDA0002415134540000101
式中
Figure GDA0002415134540000102
是第k个常规循环层神经元的连接权重向量,
r(t-1)是t-1步的误差反馈循环层神经元向量,
Figure GDA0002415134540000103
r(t-1)对应的权重向量,
Figure GDA0002415134540000104
是第k个常规循环层神经元的偏置量;
第k个误差反馈循环神经元在t预测步的值定义为:
Figure GDA0002415134540000105
式中
Figure GDA0002415134540000106
是第k个误差反馈循环神经元要训练的权重,向量
e(t-1)是预测误差向量,
Figure GDA0002415134540000107
是第k个误差反馈循环层神经元的偏置量;
其中,e(t)=[y(t-1)-o(t-1),...,y(t-l)-o(t-l)]
式中y(t-l)是第t-l步的实际尾气污染物浓度,o(t-l)是第t-l步的预测值;
误差反馈循环层的输出是常规循环层神经元和误差反馈循环层神经元的组合:
r=[r(R);r(E)]。
输出层:考虑到误差反馈层的输出神经元r作为一个输出层的输入,输出层产生最终的预测值为:
o=σ(w(OR)r(R)+w(OE)r(E)+b(O))
在输出层,我们采用一种改进的ReLU(整流线性单元)函数作为激活函数:
Figure GDA0002415134540000111
步骤S4,根据步骤S2预处理后的机动车尾气浓度数据,构造eRCNN神经网络的训练数据集和测试数据集。
将数据预处理后的机动车尾气浓度数据分为训练数据集和测试数据集两个数据集,分别用于之后eRCNN神经网络模型的训练和测试。本发明将收集的前20个工作日的数据用作训练数据集,剩余的5个工作日的数据作为测试数据集。
步骤S5,将步骤S4中的训练数据集送入步骤S3中构造的eRCNN神经网络模型中,进行参数训练、预训练以及微调,逐步提高预测精度。
其中,参数训练通过小批量随机梯度下降法(SGD)实现,对于一个路段,参数训练的目标是使所有训练样本的平方误差最小,即Loss函数为:
Figure GDA0002415134540000112
在小批量SGD中,将训练数据集分为几个小批量(mini-batches),对于一个小批量,我们计算相对于所有参数的L的偏导数,然后使用以下等式更新参数:
Figure GDA0002415134540000121
其中α是一可调整的学习速率,L到参数的偏导数通过误差反向传播(BP)算法来计算。本发明中学习速率α取0.001,权重衰减取0.0005,mini-batches大小为32,反向传播的时间步长为20时间步,即每20K次迭代后学习速率除以10。
预训练:由于不同的路段可能具有不同的尾气浓度的变化模式(车辆、天气、建筑等原因),因此,我们需要为每个路段训练特殊的模型参数。然而在实际情况下,特定段的训练数据是有限的。如果训练数据不足,则eRCNN模型可能会遇到过拟合问题。为避免这一问题,本发明对eRCNN模型进行预训练,首先用基于Pearson相关系数的聚类算法,皮尔森相关系数公式如下:
Figure GDA0002415134540000122
式中,ρ(si,sj)表示路段si和路段Sj的Pearson相关系数,Si表示路段si的各属性值组成的向量,Sj同理,Cov(Si,Sj)表示Si和Sj的协方差,Var(Si)表示向量Si的方差,Var(Sj)同理。
根据统计学相关原理,设定Pearson相关系数的阈值为0.6,然后将位置上相邻且Pearson相关系数大于阈值的路段聚在一起,同一集合中各路段的机动车尾气浓度数据共享,共同训练出一个eRCNN模型。
微调:使用预训练模型的参数作为参数的初始值,利用局部时空数据进一步微调每个段的eRCNN模型。具体来说,将一天的24小时分为七个时间范围:[0:00,6:00],[6:00,9:00],[9:00,12:00],[12:00,15:00],[15:00,18:00],[18:00,21:00],[21:00,0:00]。在预训练的模型基础上,我们用某路段给定时间段的尾气浓度数据微调参数,提高预测精度。
步骤S6,将经过步骤S5中训练、测试后的eRCNN神经网络作为针对目标路段的机动车尾气浓度连续时间预测模型,经过模型对输入数据的自主学习,可预测出目标路段的机动车尾气浓度的发展趋势以及未来某时刻的尾气浓度值。
本发明提出针对目标路段的机动车尾气浓度连续时间预测方法,通过构造eRCNN神经网络模型,以包含连续路段时空尾气浓度数据的矩阵作为网络的输入,用卷积层自然地捕获附近路段之间的尾气浓度的复杂交互性,而无需详细的表征,同时引入误差反馈循环层来感知污染物浓度突然变动引起的预测误差,此外还极大程度上利用、整合了历史观测数据之间的关系,提高了预测精度与效率,同时具有较强的泛化能力,具有一定的社会价值和现实意义。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.一种针对目标路段的机动车尾气浓度连续时间预测方法,其特征在于,具体包括以下步骤:
步骤S1,采集城市目标路段附近指定周期内的机动车尾气浓度数据;
所述步骤S1中机动车尾气浓度数据的采集方法具体包括:
步骤S11,首先确定需要采集机动车尾气浓度数据的路段,包括预测的目标路段S以及其上下游的2m个路段;
步骤S12,收集一个月中若干个工作日每指定时间段的上述路段的城市机动车尾气浓度数据,构造时空输入矩阵X;
Figure FDA0002415134530000011
其中,xs,t表示目标路段S在t时刻的机动车尾气浓度,是需要预测目标,列向量x:t包含了在同一时刻t,目标路段S及其上下游各m个路段的机动车尾气浓度;行向量包含了对同一目标路段S,从t时刻到t之前n个时刻的机动车尾气浓度;按这种方式,输入矩阵X包含空间和时间上与预测目标xs,t相邻的所有机动车尾气浓度信息;
步骤S2,对步骤S1所采集的机动车尾气浓度数据进行数据预处理;
所述步骤S2中的数据预处理具体包括两个方面:
A、缺失值填补:对于部分缺失的数据,采用缺失数据栅格区域时间上的前d个与后d个尾气排放数据取平均值的方法进行填补;
B、归一化处理:所谓归一化处理,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,以路段为单位,对该路段所有时刻的数据按下式进行归一化处理:
Figure FDA0002415134530000021
其中x′i,j是第i个路段在j时刻归一化后的数据,xi,j是第i个路段在j时刻的原始数据,xi,max和xi,min分别是第i个路段所有时刻的数据中的最大值和最小值;
步骤S3,构造eRCNN神经网络模型;
步骤S4,根据步骤S2预处理后的机动车尾气浓度数据,构造eRCNN神经网络的训练数据集和测试数据集;
步骤S5,将步骤S4中的训练数据集送入步骤S3中构造的eRCNN神经网络模型中,进行参数训练、预训练以及微调,逐步提高预测精度;
所述步骤S5中的参数训练通过小批量随机梯度下降法实现,Loss函数为:
Figure FDA0002415134530000022
将训练数据集分为若干个小批量,对于一个小批量,计算相对于所有参数的L的偏导数,然后使用以下等式更新参数:
Figure FDA0002415134530000023
其中α是一可调整的学习速率,L到参数的偏导数通过误差反向传播算法来计算;
所述步骤S5中的预训练,首先用基于Pearson相关系数的聚类算法,皮尔森相关系数公式如下:
Figure FDA0002415134530000031
式中,ρ(si,sj)表示路段si和路段sj的Pearson相关系数,Si表示路段si的各属性值组成的向量,Sj同理,Cov(Si,Sj)表示Si和Sj的协方差,Var(Si)表示向量Si的方差,Var(Sj)同理;
设定Pearson相关系数的阈值为0.6,然后将位置上相邻且Pearson相关系数大于阈值的路段聚在一起,同一集合中各路段的机动车尾气浓度数据共享,共同训练出一个eRCNN模型;
使用预训练模型的参数作为参数的初始值,在预训练的模型基础上,用某路段给定时间段的尾气浓度数据微调参数;
步骤S6,将经过步骤S5中训练、测试后的eRCNN神经网络作为针对目标路段的机动车尾气浓度连续时间预测模型,经过模型对输入数据的自主学习,预测出目标路段的机动车尾气浓度的发展趋势以及未来某时刻的尾气浓度值;
所述eRCNN神经网络包括卷积层、池化层、误差反馈循环层和输出层四层结构;
所述卷积层连接时空输入矩阵和若干可训练的滤波器,每个滤波器都是i*i的权重矩阵,第k个滤波器为Wk (c),卷积层用第k个滤波器锯齿扫描时空输入矩阵,计算卷积神经元矩阵,第k个滤波器得到的卷积神经元矩阵的元素(p,q)的计算公式为:
Figure FDA0002415134530000041
式中,bk是第k个过滤器的偏置量;
所述池化层采用均值下降采样法对卷积神经元矩阵降维,将卷积神经元矩阵分为j*j个不相交的区域,用各区域的均值代表其中卷积神经元的特征,池化后的时空矩阵维度维数降为原来的1/(j*j),通过向量化池化后的卷积神经元矩阵,输出一个特征向量;
所述误差反馈循环层包括常规循环层神经元和误差反馈神经元,其中常规循环层神经元的输入是池化层输出的特征向量p、以及前一时间步的误差反馈循环层的向量值,
Figure FDA0002415134530000042
式中
Figure FDA0002415134530000043
是第k个常规循环层神经元的连接权重向量,r(t-1)是t-1步的误差反馈循环层神经元向量,
Figure FDA0002415134530000044
是r(t-1)对应的权重向量,
Figure FDA0002415134530000045
是第k个常规循环层神经元的偏置量;
第k个误差反馈循环神经元在t预测步的值定义为:
Figure FDA0002415134530000046
式中
Figure FDA0002415134530000047
是第k个误差反馈循环神经元要训练的权重,向量e(t-1)是预测误差向量,
Figure FDA0002415134530000048
是第k个误差反馈循环层神经元的偏置量;
其中,e(t)=[y(t-1)-o(t-1),…,y(t-l)-o(t-l)];
式中y(t-1)是第t-l步的实际尾气污染物浓度,o(t-l)是第t-l步的预测值;
误差反馈循环层的输出是常规循环层神经元和误差反馈循环层神经元的组合:
r=[r(R);r(E)];
所述误差反馈层的输出神经元r作为一个输出层的输入,输出层产生最终的预测值为:
o=σ(w(OR)r(R)+w(OE)r(E)+b(O));
所述输出层采用改进的ReLU函数作为激活函数,
Figure FDA0002415134530000051
CN201810027931.9A 2018-01-11 2018-01-11 一种针对目标路段的机动车尾气浓度连续时间预测方法 Active CN108133295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810027931.9A CN108133295B (zh) 2018-01-11 2018-01-11 一种针对目标路段的机动车尾气浓度连续时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810027931.9A CN108133295B (zh) 2018-01-11 2018-01-11 一种针对目标路段的机动车尾气浓度连续时间预测方法

Publications (2)

Publication Number Publication Date
CN108133295A CN108133295A (zh) 2018-06-08
CN108133295B true CN108133295B (zh) 2020-07-07

Family

ID=62400428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810027931.9A Active CN108133295B (zh) 2018-01-11 2018-01-11 一种针对目标路段的机动车尾气浓度连续时间预测方法

Country Status (1)

Country Link
CN (1) CN108133295B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165690A (zh) * 2018-09-03 2019-01-08 安徽优思天成智能科技有限公司 一种城市路网尾气污染分布预测的方法及系统
CN109214570A (zh) * 2018-09-03 2019-01-15 安徽优思天成智能科技有限公司 一种基于深度时空修正模型的城市区域尾气污染预测方法
CN109685249A (zh) * 2018-11-24 2019-04-26 上海师范大学 基于AutoEncoder和BiLSTM融合神经网络的空气PM2.5浓度预测方法
CN109781809B (zh) * 2019-02-23 2020-11-20 苏州市智汇易联科技有限公司 一种甲醛浓度人工智能测算方法
CN110766219A (zh) * 2019-10-21 2020-02-07 成都理工大学工程技术学院 基于bp神经网络的雾霾预测方法
CN113128013B (zh) 2019-12-30 2024-09-20 富联精密电子(天津)有限公司 环境状态分析方法、装置、计算机装置及存储介质
TWI743640B (zh) * 2019-12-30 2021-10-21 新加坡商鴻運科股份有限公司 環境狀態分析方法、裝置、電腦裝置及存儲介質
CN111477012B (zh) * 2020-06-24 2020-10-27 平安国际智慧城市科技股份有限公司 基于路况状态预测模型的溯源方法、装置和计算机设备
CN111915082B (zh) * 2020-08-03 2024-03-29 深圳集智数字科技有限公司 一种预测方法、装置、存储介质及设备
CN114202816B (zh) * 2020-10-12 2024-08-20 西南交通大学 一种考虑出行时间与污染暴露量的道路定价方法
CN113222217B (zh) * 2021-04-15 2022-02-25 中国科学技术大学先进技术研究院 基于离散排放标签的柴油车排放连续值预测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105424598A (zh) * 2014-11-29 2016-03-23 巫立斌 一种基于图像识别的机动车尾气检测方法
CN105654729A (zh) * 2016-03-28 2016-06-08 南京邮电大学 一种基于卷积神经网络的短时交通流量预测方法
CN106295874A (zh) * 2016-08-08 2017-01-04 上海交通大学 基于深信度网络的交通流参数预测方法
CN106611090A (zh) * 2016-12-31 2017-05-03 中国科学技术大学 一种基于重构深度学习的道边空气污染物浓度预测方法
CN106781489A (zh) * 2016-12-29 2017-05-31 北京航空航天大学 一种基于递归神经网络的路网状态预测方法
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105424598A (zh) * 2014-11-29 2016-03-23 巫立斌 一种基于图像识别的机动车尾气检测方法
CN105654729A (zh) * 2016-03-28 2016-06-08 南京邮电大学 一种基于卷积神经网络的短时交通流量预测方法
CN106295874A (zh) * 2016-08-08 2017-01-04 上海交通大学 基于深信度网络的交通流参数预测方法
CN106781489A (zh) * 2016-12-29 2017-05-31 北京航空航天大学 一种基于递归神经网络的路网状态预测方法
CN106611090A (zh) * 2016-12-31 2017-05-03 中国科学技术大学 一种基于重构深度学习的道边空气污染物浓度预测方法
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统

Also Published As

Publication number Publication date
CN108133295A (zh) 2018-06-08

Similar Documents

Publication Publication Date Title
CN108133295B (zh) 一种针对目标路段的机动车尾气浓度连续时间预测方法
CN111832814B (zh) 一种基于图注意力机制的空气污染物浓度预测方法
WO2021012982A1 (zh) 一种车外大气污染环境下列车乘员健康预警系统及其方法
Yi et al. A neural network model forecasting for prediction of daily maximum ozone concentration in an industrialized urban area
CN111882869B (zh) 一种考虑不良天气的深度学习交通流预测方法
US20210291614A1 (en) Health protection system for passengers on a train in a polluted indoor environment and method thereof
CN108022012A (zh) 基于深度学习的车辆位置预测方法
CN111275962B (zh) 车辆轨迹数据聚集效应预测方法及装置
CN108197731B (zh) 一种基于共同训练的机动车尾气遥测与车检结果一致性方法
CN108364087A (zh) 一种城市机动车尾气浓度的时空预测方法
CN102722989A (zh) 基于模糊神经网络的高速公路微气象交通预警方法
CN112613225B (zh) 一种基于神经网络元胞传输模型的交叉口交通状态预测方法
CN116631186B (zh) 基于危险驾驶事件数据的高速公路交通事故风险评估方法、系统
CN112542049A (zh) 智慧交通综合管控平台
CN112863182A (zh) 基于迁移学习的跨模态数据预测方法
CN109376331A (zh) 一种基于梯度提升回归树的城市公交车排放率估计方法
CN115410372B (zh) 基于贝叶斯lstm的高速公路交通流量可靠预测方法
CN116070676B (zh) 基于注意力机制和自编码器的高速公路路面温度预报方法
CN116052435B (zh) 一种城市道路拥堵影响范围界定与道路影响力计算方法
CN112614346A (zh) 基于奇异谱分析和回声状态网络的短时交通流预测方法
Chowdhury et al. Application of data mining techniques on air pollution of Dhaka city
CN117310101A (zh) 一种大气污染物浓度监测系统
CN116597642A (zh) 一种交通拥堵状况的预测方法及系统
CN117558124A (zh) 一种基于多源信息深度融合的通道运行状态推演预测方法
CN117238126A (zh) 一种连续流道路场景下的交通事故风险评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant