CN107330300B - 一种基于支持向量回归的车辆尾气浓度反演方法 - Google Patents

一种基于支持向量回归的车辆尾气浓度反演方法 Download PDF

Info

Publication number
CN107330300B
CN107330300B CN201710732914.0A CN201710732914A CN107330300B CN 107330300 B CN107330300 B CN 107330300B CN 201710732914 A CN201710732914 A CN 201710732914A CN 107330300 B CN107330300 B CN 107330300B
Authority
CN
China
Prior art keywords
tail gas
vehicle
data
exhaust
concentration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710732914.0A
Other languages
English (en)
Other versions
CN107330300A (zh
Inventor
凌强
张强
李峰
康宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201710732914.0A priority Critical patent/CN107330300B/zh
Publication of CN107330300A publication Critical patent/CN107330300A/zh
Application granted granted Critical
Publication of CN107330300B publication Critical patent/CN107330300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2219/00Indexing scheme relating to application aspects of data processing equipment or methods
    • G06F2219/10Environmental application, e.g. waste reduction, pollution control, compliance with environmental legislation

Landscapes

  • Exhaust Gas After Treatment (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)
  • Testing Of Engines (AREA)

Abstract

本发明涉及一种基于支持向量回归的车辆尾气浓度反演方法,分为两个阶段。第一个阶段是车辆尾气遥感监测数据与车辆环检数据进行数据融合及预处理阶段。第二个阶段是建立基于支持向量回归(SVR)的车辆尾气浓度反演模型,并对不同环境下车辆尾气排放浓度进行预测与估计。

Description

一种基于支持向量回归的车辆尾气浓度反演方法
技术领域
本发明涉及一种基于支持向量回归的车辆尾气浓度反演方法,属于车辆尾气浓度检测与估计和模式识别领域。
背景技术
在2016年底,我国机动车保有量达2.9亿辆,其中有1.94亿辆汽车。而且机动车保有量还在持续快速地增长。城市中,大量的机动车辆排放的尾气污染物会形成光学烟雾,加剧温室效应,造成污染空气,诱发多种呼吸道疾病。为了控制机动车辆的污染物排放,不仅要改进汽车制造工艺,还要提高城市尾气监控技术。而机动车尾气排放造成的空气污染与气象条件(如风速,风向,温度等)及车辆自身信息密切相关。所以研究不同驾驶模式下车辆CO、CO2等尾气排放浓度的反演预测是很有理论意义与实用价值的。
目前,在车辆尾气浓度反演与检测方面,国内外研究者做了很多工作,提出很多方法。文献[1]-[3]([1]Merkisz J,Pielecha J,Fuc P,et al.The analysis of the PEMSmeasurements of the exhaust emissions from city buses using differentresearch procedures[C]//Vehicle Power and Propulsion Conference(VPPC),2012IEEE.IEEE,2012:903-907.,[2]Kousoulidou M,Fontaras G,Ntziachristos L,etal.Use of portable emissions measurement system(PEMS)for the development andvalidation of passenger car emission factors[J].Atmospheric Environment,2013,64:329-338.,[3]Rubino L,Bonnel P,Hummel R,et al.On-road emissions and fueleconomy of light duty vehicles using PEMS:chase-testing experiment[J].SAEinternational Journal of Fuels and Lubricants,2008,1(2008-01-1824):1454-1468.)提出在待检测车辆上安装车载尾气检测设备(PEMS),与车辆尾气排放管道相连,使用探针采集尾气污染物,针对不同污染物使用不同的基于物理模型的反演算法进行估计预测,但这种方法不具有普适性,不可能让所有的机动车辆都安装PEMS设备。文献[4](ShanH,Liu H,Zhang L,et al.The control method of Acceleration Simulation Modeemissions detection systems based on Fuzzy proportional-integral-derivativecontrol[C]//Fuzzy Systems and Knowledge Discovery(FSKD),2015 12thInternational Conference on.IEEE,2015:580-584.)提到使用AMS工况法检测尾气排放状况,但AMS工况法只能检测特定车速(25km/h和40km/h)车辆的尾气排放状况,而且不能判断比较加速或减速过程的车辆尾气排放状况。文献[5]([5]Fastaia A J,Cross TA.Vehicle exhaust gas analysis system with gas blockage interlock:U.S.Patent4,160,373[P].1979-7-10.)提出使用NDIR不分光红外分析法检测碳氧化物尾气浓度,这种方法测量范围较大,响应速度较快,但受气象条件影响较大,不稳定。文献[6]([6]FrancoGarcía V.Evaluation and improvement of road vehicle pollutant emissionfactors based on instantaneous emissions data processing[J].2014.)使用发动机测功机测量尾气浓度,准确度较高,但仅限于实验室模拟条件。文献[7]([7]Zhang Y,Stedman D H,Bishop G A,et al.Worldwide on-road vehicle exhaust emissionsstudy by remote sensing[J].Environmental science&technology,1995,29(9):2286-2294.)提出单纯使用遥感监测的方法来检测尾气排放浓度,但结果受环境因素影响较大,尤其是对低污染车辆检测结果不准确。文献[8]([8]国家环境保护总局.GB18285-2005点燃式发动机汽车排气污染物排放限值及测量方法(双怠速法及简易工况法)[S].北京:中国环境科学出版社,2005.)提到使用怠速法和双怠速法检测尾气浓度,但怠速法与双怠速法属于无负荷尾气检测方法,与车辆真实运行状况有较大差距,检测结果不准确,对高污染车辆尾气浓度的检测尤为不准确。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种基于支持向量回归的车辆尾气浓度反演方法,是基于数据驱动的,不需要接触式设备,本发明训练模型时使用大量的多特征尾气数据,抗噪能力强,适用于多种环境模式,且模型训练速度快,预测精度高。
本发明技术解决方案:一种基于支持向量回归的车辆尾气浓度反演方法,分为两个阶段。第一个阶段是车辆尾气遥感监测数据与车辆环检数据进行数据融合及预处理阶段。第二个阶段是建立基于支持向量回归(SVR)的车辆尾气浓度反演模型,并对不同环境下车辆尾气排放浓度进行预测与估计。
(1)车辆尾气遥感监测数据与车辆环检数据的数据融合及预处理
将车辆遥感监测数据与环检数据分别从相应数据库中导出,基于车牌号码将其进行数据映射融合。
对融合后尾气数据进行数据筛选与清洗,进行异常值检测与插值,字符串OneHot向量化处理及数值标准化处理。
(2)基于支持向量回归(SVR)的车辆尾气浓度反演模型的建立
将经过处理的尾气数据映射到无穷维特征空间,构造出相应的高维线性优化超平面,建立回归模型,转化为凸优化问题,通过拉格朗日方法求解凸优化问题,再求解对偶问题,有对偶问题求解出SVR尾气浓度反演模型的数学形式。
利用已建立的SVR尾气浓度反演模型,对车辆尾气CO、CO2浓度进行快速反演预测与估计。
具体实现步骤如下:
Step1:将车辆尾气遥感监测数据与车辆环检数据分别从相应数据库导入csv文件,再导入高级数据结构DataFrame;
Step2:基于车牌号码对车辆尾气遥感监测数据与车辆环检数据进行映射融合,形成初始尾气分析数据;
Step3:对初始尾气分析数据进行特定字段的筛选,保留车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式等4个字符串属性字段,并保留车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度等12个数值型属性字段,清洗其他无关属性字段;清洗缺省尾气记录;
Step4:对Step3处理后的尾气数据记录中的字符串属性字段,使用OneHot方法进行向量化处理,对数值型属性字段的异常值进行边界插值或过滤,将处理后的数值属性字段范围缩放至(-1,1);
Step5:将经过上述处理的尾气数据,按照9:1的比例分为尾气训练数据集与尾气测试数据集;
Step6:使用尾气训练数据集来训练SVR尾气浓度反演模型,为了防止所建立的模型过于复杂而引起过拟合现象,使用5折交叉验证方法建立SVR尾气浓度反演模型,即将占整体数据集90%的尾气训练数据集再随机划分为5等份,分别将每一等份数据作为验证集,其余作为训练集,交叉验证重复5次,并将5个子模型输出的平均值作为SVR尾气浓度反演模型的输出结果,即相应的CO或CO2尾气浓度反演结果。向训练好的SVR尾气浓度反演模型输入待检测车辆尾气数据信息,即可在1秒内精确快速地反演预测出待检测车辆CO、CO2尾气浓度。交叉验证时的各个子模型数学形式皆可表示为:其中x为所述模型输入,即经过Step4处理后的车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式、车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度等尾气数据特征,f(x)为所述子模型输出的CO或CO2尾气反演浓度,l是训练所述子模型所使用的尾气训练集样本点的数量,xi是训练所述子模型所使用的第i个尾气样本点数据,i=1,2,...,l,且αi,
Figure BDA0001387483740000041
是拉格朗日因子,K(xi,x)是高斯核函数,K(xi,x)=exp(-γ||xi-x||2),γ>0,γ为常数,b为偏置向量。
所述Step6中,SVR尾气浓度反演子模型的数学表达形式为
Figure BDA0001387483740000042
在尾气训练数据集上构造及求解这个表达式过程如下:
(61)首先将Step6所述模型输入x通过高斯映射映射到无穷维特征空间,在此空间中构造最优化线性超平面,期望输出为由燃烧方程反解得到的CO、CO2尾气浓度,再求解回归数学模型:
f(x)=WTΦ(x)+b
其中x为Step6所述模型输入的尾气数据特征,W是权重向量,Φ(x)是将输入变量x映射到高维空间的高斯映射函数,
Figure BDA0001387483740000043
γ>0,γ为常数,b是偏置向量,训练模型时f(x)为所述模型的期望输出,即由燃烧方程反解的CO或CO2尾气浓度;
(62)由线性代数中的点到超平面距离关系将回归模型转化为求解带约束的凸优化问题:
Figure BDA0001387483740000044
subject to((WT·Φ(xi))+b)-yi≤ε+ξi
Figure BDA0001387483740000045
Figure BDA0001387483740000046
其中,C为正则化参数,ε为回归残差,v为不敏感损失系数影响因子,且0≤v≤1,l是尾气训练集样本点的数量,ξi,
Figure BDA0001387483740000047
是松弛变量,yi是第i个尾气样本点CO或CO2浓度值;
(63)引入拉格朗日因子αi,
Figure BDA0001387483740000051
ηi,
Figure BDA0001387483740000052
β≥0,将带约束的凸优化问题转化为无约束的拉格朗日函数优化问题:
Figure BDA0001387483740000053
(64)求解KKT条件,即令拉格朗日函数对各参数的偏导为0,即由此确定原带约束凸优化问题的对偶问题:
Figure BDA0001387483740000057
从而求解出Step6所述的SVR尾气浓度反演子模型的数学表达形式:
Figure BDA0001387483740000059
其中K(xi,x)为高斯核函数,
K(xi,x)=Φ(xi)Φ(x)=exp(-γ||xi-x||2),γ>0。
所述Step2中,基于车牌号码对车辆尾气遥感监测数据与车辆环检数据进行映射融合,具体过程如下:
(1)利用正则化匹配方法提取尾气遥感监测数据记录与车辆环检数据记录中的车牌号码关键字;
(2)将所有拥有共同车牌号码的尾气遥感监测数据记录与车辆环检数据记录的属性字段映射合并,形成初始尾气分析数据。
所述Step4中,使用OneHot方法向量化处理尾气数据中的字符串属性字段,标准化处理尾气数据中的数值型属性字段的具体过程如下:
(1)对尾气分析数据中的字符串属性字段,包括车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式,将其中每一字段的不同特征值分别编码为{1,2,3,…};
(2)对尾气分析数据中的数值型属性字段,包括车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度,按照这些数值型属性字段的范围进行边界过滤或插值,并将处理后的最大值与最小值分别缩放至1,-1,其他值缩放至(-1,1),减小不同量纲对尾气浓度分析的干扰。
所述(62)中引入的最优的正则化参数C和不敏感损失系数影响因子v,需要提前人为设定,使用网格寻参方法来确定最优参数C和v,具体过程如下:
(1)先分别大范围内大间隔地离散设定参数C和v的可能取值,遍历这些取值组合,依据尾气训练数据集上的模型输出结果与期望输出结果的均方误差找到初步粗略的最优参数设定C1和v1
(2)再分别在C1和v1附近小范围内小间隔地离散设定参数C和v的可能取值,遍历这些取值组合,依据尾气训练数据集上的模型输出结果与期望输出结果的均方误差确定最优参数C和v。
本发明与现有技术相比的优点在于:
(1)本发明在对车辆尾气浓度进行反演估计时,不需要在每辆车上安装接触式尾气浓度检测硬件设备(如PEMS设备)。
(2)本发明通过将大量的车辆尾气遥感监测数据与车辆环检数据依据车牌号码进行数据融合,然后对融合尾气数据进行相关预处理,依据融合数据建立支持向量回归(SVR)尾气浓度反演模型,输入相关尾气特征信息,即可快速预测与估计车辆CO、CO2尾气排放浓度。
(3)一般的尾气浓度反演算法,多基于物理模型反演,使用数据量较少,受噪声干扰较大,对于不同环境测得数据,反演结果差异较大,而且在建立反演模型时,多没有考虑车辆自身信息,如车辆基准质量,发动机排量等。而基于支持向量回归(SVR)的车辆尾气浓度反演回归算法在模型训练时,使用了大量的尾气数据,受噪点数据影响小,另外模型输入考虑了车辆自身信息,行驶运动状态及气象环境条件,能够适用于多种不同环境模式。
(4)使用SVR模型反演预测车辆尾气浓度的精度远高于一般的多元线性回归(MLR)模型的结果精度。另外相较于一般基于神经网络反演模型,SVR模型训练速度更快。
附图说明
图1为本发明的SVR车辆尾气浓度反演方法流程图;
图2为本发明的SVR模型反演随机样本车辆的CO、CO2尾气浓度结果对比图,其中a为100辆随机测试车辆的CO尾气浓度反演结果图,b为100辆随机测试车辆的CO2尾气浓度反演结果图。
具体实施方式
本发明是基于环保部门采样得到的大量车辆环检数据及尾气遥感监测数据进行车辆尾气浓度反演与估计的,本发明不需要将价格昂贵、不便携的接触式尾气检测设备(如PEMS设备)安装于每一辆检测车辆,只需采样待检测车辆的遥感监测结果,根据其车牌号码匹其车辆环检结果,将二者进行数据融合及预处理,再输入到提前使用大量尾气数据训练过的基于支持向量回归(Support Vector Regression,SVR)的车辆尾气浓度反演模型,即可反演估计出待检测车辆的CO、CO2尾气浓度。提前训练SVR尾气浓度反演模型时使用了包含多种驾驶模式、环境模式的尾气数据,所以相比较与AMS工况法,本发明可适用于多种速度及加速度驾驶条件下的车辆CO、CO2尾气的反演与估计。另外,训练模型时使用的尾气数据中包含车辆通过时的环境温度、风向和风速等环境信息,考虑了环境信息后,本发明反演的车辆尾气浓度结果更为准确。
下面结合附图进行详细说明。
如图1所示,本发明具体实现如下:
1.车辆尾气遥感监测数据与车辆环检数据的映射融合及数据预处理
1.1车辆遥感监测数据与车辆环检数据的映射融合
分别从车辆尾气遥感监测数据库和车辆环检数据库将与尾气浓度分析相关的表导入csv文件,再分别导入高级数据结构DataFrame中,按照车牌号码对这两种数据进行正则化匹配,映射融合,将具有相同车牌号码的不同属性字段进行合并,形成信息更加全面的尾气数据记录。
1.2尾气数据预处理
对尾气数据进行数据清洗,删除无用属性字段,删除含缺省值记录,对部分异常值进行过滤或边界插值。筛选范围是(-1.5IQR+mid,+10IQR+mid),mid是对应样本变量中值,IRQ是四分位距,使用中值mid而不是平均值的原因是为了减小噪点数据的影响。对特定字符串变量,用OneHot方法{1,2,3,…}来简单编码,将数值型变量缩放至(-1,1),消除量纲噪声干扰。
2.基于支持向量回归(SVR)的车辆尾气浓度反演模型的建立
将经过上述处理的尾气数据分为训练集与测试集,分别用来训练SVR模型与测试模型性能。将尾气数据中车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式、车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度等属性字段作为模型输入特征,将由燃烧方程反解得到的CO、CO2浓度作为标准输出来训练支持向量回归(SVR)模型。
2.1构造高维线性最优化超平面
首先将样本空间通过高斯映射映射到无穷维特征空间,然后在高维特征空间中构造线性超平面:
f(x)=WTΦ(x)+b
其中x为车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式、车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度等经过处理的尾气数据特征,W权重向量,Φ(x)是将输入变量x到高维空间的高斯映射函数,b是偏置向量,f(x)为由燃烧方程反解的CO(CO2)尾气浓度。
用到的高斯映射函数:
Figure BDA0001387483740000081
γ>0,本发明实施例取0.5。
对应的高斯核函数:
K(x,x')=Φ(x)Φ(x')=exp(-γ||x-x'||2)
2.2转化凸优化问题
通过构造高维超平面,将原问题转化为一个数学问题,并且期望经过映射后的实际输出与期望输出(在超平面上)一致,由线性代数知识易知,样本点距离超平面最大间隔δ正比于其中W*=(1-WT)T,所以为了最大化δ,就是最小化||W*||,即最小化||W*||2,又||W*||2=||W||2+1。
所以得出凸优化问题:
subject to((WT·Φ(xi))+b)-yi≤ε+ξi
Figure BDA0001387483740000092
Figure BDA0001387483740000093
其中,C为正则化参数,ε为回归残差,v为ε的影响因子,且0≤v≤1,l是尾气训练集数据样本点的数量,
Figure BDA0001387483740000094
是松弛变量,yi是第i个尾气样本点CO(CO2)浓度值。
2.3求解凸优化问题
引入拉格朗日因子
Figure BDA0001387483740000095
β≥0,可将原约束问题转化为无约束问题:
Figure BDA0001387483740000096
Figure BDA0001387483740000097
可以得到对偶问题:
Figure BDA0001387483740000098
Figure BDA00013874837400000911
从而得到回归估计函数为:
Figure BDA00013874837400000912
得到的f(x)即为相应的尾气浓度反演值。
2.4网格寻参寻找最优参数
正则化参数C和ε的影响因子v需要提前人为设定,C可以控制反演回归模型的拟合误差,C越大,整体误差越小,但如果C过大则会发生过拟合,模型的泛化能力会很差,v可以控制误差超出ε的样本点数和支持向量个数。参数C和v会对模型的精确度和泛化能力产生很大的影响。
使用网格寻参方法来自适应确定最优参数C和v,具体方法是全局寻粗略解,局部寻最优解。令C和v的初步范围为{C:300,500,800,1000,1500},{v:0.1,0.3,0,5,0.7,0.9},遍历所有参数可能组合,根据训练样本的平均绝对误差MAE确定初步最优参数C1和v1,如在对CO尾气浓度进行反演回归时,C1=1000,v1=0.3,再在C1和v1附近进行精细寻参,如{C1:900,950,1000,1050,1100},{v1:0.15,0.2,0.25,0.3,0,35,0.4,0.45},遍历局部参数所以可能组合找到较为可靠的最优参数C*=1050和v*=0.3。
2.5交叉验证确定尾气浓度反演回归模型
采用5折交叉验证来训练SVR尾气浓度反演模型,将训练集随机平均分为5份,将每一份数据分别作为验证集数据,其他作为训练集数据,训练模型,最后取5个模型输出的平均值作为整个模型的输出。
3.基于支持向量回归(SVR)的车辆尾气浓度反演预测
按照5-折交叉验证的方法使用训练集数据分别训练CO和CO2的尾气浓度反演回归模型,模型训练时间比一般的神经网络模型速度要快很多,且模型训练完成后,对于输入样本,可实现快速精确反演预测。选取均方根误差RMSE,相关系数R,平均绝对误差MAE和拟合优度Rnew作为SVR尾气浓度反演模型的统计分析性能指标。其中:
Figure BDA0001387483740000101
Figure BDA0001387483740000102
Figure BDA0001387483740000103
Figure BDA0001387483740000104
上式中,N为测试车辆样本个数,yi,
Figure BDA0001387483740000105
分别为样本相应的CO(CO2)尾气浓度,样本平均CO(CO2)尾气浓度,样本CO(CO2)尾气反演预测浓度,样本平均CO(CO2)尾气反演预测浓度。
随机选取100个测试样本,分别使用上述的支持向量回归(SVR)方法以及广义多元线性回归MLR方法对CO、CO2尾气浓度进行反演预测,SVR方法得到的观测值与预测值结果对比图如图2所示,相关统计性能对比如表1所示。
表1SVR与MLR模型反演100个随机测试车辆样本的CO、CO2尾气浓度统计性能对比表
Figure BDA0001387483740000111
在图2中,a与b的横坐标为车辆尾气随机测试样本(”Random Test Data”),a与b的纵坐标分别为CO和CO2尾气体积浓度百分比(”Concentration”),单位是百分比(%)。由图2可以看出,使用SVR模型对车辆CO和CO2尾气浓度进行反演预测效果非常好,尤其是对CO尾气浓度进行反演时,可以清晰地看出预测值折线(虚线)与观测值(实线)折线高度重合,在对CO2尾气浓度进行反演时,二者基本重合,即SVR模型可以准确的拟合刻画车辆自身信息、环境因素等信息与车辆尾气CO、CO2浓度之间的关系模式。由表1可以看出,与多元线性回归MLR方法相比,基于SVR模型的CO,CO2尾气浓度反演方法,得到的相关系数R和拟合优度Rnew更大,均方根误差RMSE和平均绝对误差MAE更小,也就是说基于SVR的CO、CO2尾气浓度反演预测方法要远优于一般基于MLR的尾气反演结果。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (4)

1.一种基于支持向量回归的车辆尾气浓度反演方法,其特征在于步骤如下:
Step1:将车辆尾气遥感监测数据与车辆环检数据分别从相应数据库导入csv文件,再导入高级数据结构DataFrame;
Step2:基于车牌号码对车辆尾气遥感监测数据与车辆环检数据进行映射融合,形成初始尾气分析数据;
Step3:对初始尾气分析数据进行特定字段的筛选,保留车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式4个字符串属性字段,并保留车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度12个数值型属性字段,清洗其他无关属性字段;清洗缺省尾气记录;
Step4:对Step3处理后的尾气数据记录中的字符串属性字段,使用OneHot方法进行向量化处理,对数值属性字段的异常值进行边界插值或过滤,将处理后的数值属性字段范围缩放至(-1,1);
Step5:将经过上述处理的尾气数据,按照9:1的比例分为尾气训练数据集与尾气测试数据集;
Step6:使用尾气训练数据集来训练SVR尾气浓度反演模型,为了防止所建立的模型过于复杂而引起过拟合现象,使用5折交叉验证方法建立SVR尾气浓度反演模型,即将占整体数据集90%的尾气训练数据集再随机划分为5等份,分别将每一等份数据作为验证集,其余作为训练集,交叉验证重复5次,并将5个子模型输出的平均值作为SVR尾气浓度反演模型的输出结果,即相应的CO或CO2尾气浓度反演结果,再向训练好的SVR尾气浓度反演模型输入待检测车辆尾气数据信息,即可精确快速地反演预测出待检测车辆CO、CO2尾气浓度;交叉验证时的各个子模型数学形式皆可表示为:
Figure FDA0002193271340000011
其中x为所述模型输入,即经过Step4处理后的车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式、车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度尾气数据特征,f(x)为所述子模型输出的CO或CO2尾气反演浓度,l是训练所述子模型所使用的尾气训练集样本点的数量,xi是训练所述子模型所使用的第i个尾气样本点数据,i=1,2,...,l,αi,
Figure FDA0002193271340000021
是拉格朗日因子,K(xi,x)是高斯核函数,K(xi,x)=exp(-γ||xi-x||2),γ>0,γ为常数,b为偏置向量;
所述Step6中,SVR尾气浓度反演子模型的数学表达形式为
Figure FDA0002193271340000022
在尾气训练集数据上构造及求解这个表达式过程如下:
(61)首先将Step6所述模型输入x通过高斯映射映射到无穷维特征空间,在此空间中构造最优化线性超平面,期望输出为由燃烧方程反解得到的CO、CO2尾气浓度,再求解回归数学模型:
f(x)=WTΦ(x)+b
其中x为Step6所述模型输入的尾气数据特征,W是权重向量,Φ(x)是将输入变量x映射到高维空间的高斯映射函数,
Figure FDA0002193271340000023
γ>0,γ为常数,b是偏置向量,训练模型时f(x)为所述模型的期望输出,即由燃烧方程反解的得到CO或CO2尾气浓度;
(62)由线性代数中的点到超平面距离关系将回归模型转化为求解带约束的凸优化问题:
Figure FDA0002193271340000024
subject to((WT·Φ(xi))+b)-yi≤ε+ξi
Figure FDA0002193271340000025
Figure FDA0002193271340000026
ε≥0.
其中,C为正则化参数,ε为回归残差,v为不敏感损失系数影响因子,且0≤v≤1,l是尾气训练集样本点的数量,ξi,
Figure FDA0002193271340000027
是松弛变量,yi是第i个尾气样本点CO或CO2浓度值;
(63)引入拉格朗日因子αi,
Figure FDA0002193271340000028
ηi,
Figure FDA0002193271340000029
β≥0,将带约束的凸优化问题转化为无约束的拉格朗日函数优化问题:
Figure FDA00021932713400000210
(64)求解KKT条件,即令拉格朗日函数对各参数的偏导为0,即由此确定原带约束凸优化问题的对偶问题:
Figure FDA0002193271340000033
Figure FDA0002193271340000034
从而求解出Step6所述的SVR尾气浓度反演子模型的数学表达形式:
Figure FDA0002193271340000037
其中K(xi,x)为高斯核函数,
K(xi,x)=Φ(xi)Φ(x)=exp(-γ||xi-x||2),γ>0。
2.根据权利要求1所述的一种基于支持向量回归的车辆尾气浓度反演方法,其特征在于:所述Step2中,基于车牌号码对车辆尾气遥感监测数据与车辆环检数据进行映射融合,具体过程如下:
(1)利用正则化匹配方法提取尾气遥感监测数据记录与车辆环检数据记录中的车牌号码关键字;
(2)将所有拥有共同车牌号码的尾气遥感监测数据记录与车辆环检数据记录的属性字段映射合并,形成初始尾气分析数据。
3.根据权利要求1所述的一种基于支持向量回归的车辆尾气浓度反演方法,其特征在于:所述Step4中,使用OneHot方法向量化处理尾气数据中字符串属性字段,标准化处理尾气数据中数值型属性字段的具体过程如下:
(1)对尾气分析数据中的字符串属性字段,包括车辆燃油规格、是否有催化转化器、排气后处理装置、驱动方式,将其中每一字段的不同特征值分别编码为{1,2,3,…};
(2)对尾气分析数据中的数值型属性字段,包括车辆速度、加速度、比功率、不透光烟度、温度、湿度、风速、风向角度、车辆基准质量、发动机排量、激光吸收光谱反演初始CO尾气浓度、激光吸收光谱反演初始CO2尾气浓度,按照这些数值型属性字段的范围进行边界过滤或插值,并将处理后的最大值与最小值分别缩放至1,-1,其他值缩放至(-1,1),减小不同量纲对尾气浓度分析的干扰。
4.根据权利要求1所述的一种基于支持向量回归的车辆尾气浓度反演方法,其特征在于:所述(62)中引入的最优的正则化参数C和不敏感损失系数影响因子v,需要提前人为设定,使用网格寻参方法来确定最优参数C和v,具体过程如下:
(1)先分别大范围内大间隔地离散设定参数C和v的可能取值,遍历这些取值组合,依据尾气训练数据集上的模型输出结果与期望输出结果的均方误差找到初步粗略的最优参数设定C1和v1
(2)再分别在C1和v1附近小范围内小间隔地离散设定参数C和v的可能取值,遍历这些取值组合,依据尾气训练数据集上的模型输出结果与期望输出结果的均方误差确定最优参数C和v。
CN201710732914.0A 2017-08-24 2017-08-24 一种基于支持向量回归的车辆尾气浓度反演方法 Active CN107330300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710732914.0A CN107330300B (zh) 2017-08-24 2017-08-24 一种基于支持向量回归的车辆尾气浓度反演方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710732914.0A CN107330300B (zh) 2017-08-24 2017-08-24 一种基于支持向量回归的车辆尾气浓度反演方法

Publications (2)

Publication Number Publication Date
CN107330300A CN107330300A (zh) 2017-11-07
CN107330300B true CN107330300B (zh) 2020-01-03

Family

ID=60224563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710732914.0A Active CN107330300B (zh) 2017-08-24 2017-08-24 一种基于支持向量回归的车辆尾气浓度反演方法

Country Status (1)

Country Link
CN (1) CN107330300B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197731B (zh) * 2017-12-26 2022-01-11 中国科学技术大学 一种基于共同训练的机动车尾气遥测与车检结果一致性方法
CN108226046B (zh) * 2017-12-26 2019-10-25 中国科学技术大学 一种机动车尾气遥测结果修正方法
CN108629450A (zh) * 2018-04-26 2018-10-09 东南大学 一种液化天然气公交车尾气排放预测方法
CN109187877A (zh) * 2018-09-28 2019-01-11 广东泓胜科技股份有限公司 一种机动车尾气监测方法、装置、介质及设备
CN111024898B (zh) * 2019-12-30 2021-07-06 中国科学技术大学 一种基于CatBoost模型的车辆尾气浓度超标判别方法
CN113269348B (zh) * 2021-04-09 2023-05-30 中国科学院合肥物质科学研究院 一种基于机器学习的机动车尾气浓度预测方法及系统
CN113537515A (zh) * 2021-07-27 2021-10-22 江苏蓝创智能科技股份有限公司 Pm2.5预测方法、系统、装置及存储介质
CN113674814B (zh) * 2021-08-24 2023-06-23 佛山市海天(高明)调味食品有限公司 一种光谱定量分析模型的构建方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1648638A (zh) * 2005-02-05 2005-08-03 西安交通大学 基于支持向量机的多组分气体浓度定量分析仪
DE102010016682A1 (de) * 2009-04-29 2010-11-04 Avl List Gmbh Verfahren zur dynamischen Totzeitkompensation der Abgaskonzentration
CN106650287A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种基于mlp神经网络的机动车尾气排放因子估计方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8103458B2 (en) * 2008-12-18 2012-01-24 Delphi Technologies, Inc. Exhaust gas sensing system and method for determining concentrations of exhaust gas constituents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1648638A (zh) * 2005-02-05 2005-08-03 西安交通大学 基于支持向量机的多组分气体浓度定量分析仪
DE102010016682A1 (de) * 2009-04-29 2010-11-04 Avl List Gmbh Verfahren zur dynamischen Totzeitkompensation der Abgaskonzentration
CN106650287A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种基于mlp神经网络的机动车尾气排放因子估计方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Study on the evaluation method of vehicle exhaust pollutant concentration level》;Shousheng Chen,et al;《2017 32nd Youth Academic Annual Conference of Chinese Association of Automation》;20170531;全文 *
《北京市交通微环境汽车尾气污染的浓度特征》;杜譞,等;《中国环境科学》;20091231;第29卷(第1期);第26-30页 *
《城市街道峡谷机动车尾气浓度的计算方法研究》;张仁才,等;《大气与环境光学学报》;20161130;第11卷(第6期);第448-452页 *

Also Published As

Publication number Publication date
CN107330300A (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
CN107330300B (zh) 一种基于支持向量回归的车辆尾气浓度反演方法
CN107577910B (zh) 一种基于深层次神经网络的车辆尾气浓度反演方法
CN111460382B (zh) 基于高斯过程回归的燃油车有害气体排放预测方法及系统
CN109489978B (zh) 一种基于V-a工况的柴油机车多种排放检测方法的多源数据关联分析方法
CN112964476B (zh) 一种重型柴油车实际道路颗粒物排放在线预测方法
CN110135466B (zh) 一种污染物排放超标车辆判断方法及系统
CN108763643B (zh) 一种地区机动车排放因子计算方法
CN111024898A (zh) 一种基于CatBoost模型的车辆尾气浓度超标判别方法
CN112486962A (zh) 一种提取组合短片段计算重型柴油车NOx排放的方法
CN112819217A (zh) 移动源污染排放主要影响因素预测方法、系统及存储介质
Panneer Selvam et al. Prediction of NO x emissions from compression ignition engines using ensemble learning-based models with physical interpretability
CN112733419A (zh) 一种突发大气污染事故源反演准确性提升方法
CN110988263B (zh) 一种基于改进的Stacking模型的车辆尾气浓度估计方法
CN116558834A (zh) Pems排放分析方法、装置、计算机设备和存储介质
CN111145556A (zh) 黑烟车车牌识别方法、系统、设备和可读存储介质
CN110927099A (zh) 柴油发动机氮氧化物还原剂的快速检测方法
CN116992240B (zh) 一种车辆排放远程评估方法、设备和存储介质
Donateo et al. Real time estimation of emissions in a diesel vehicle with neural networks
Fei et al. Discrimination of excessive exhaust emissions of vehicles based on Catboost algorithm
CN116773485A (zh) 一种基于多模态数据的城市区域碳排放检测系统
CN114060132B (zh) 一种基于排放远程监控的NOx传感器作弊甄别方法
Kioutsioukis et al. Uncertainty and sensitivity analysis of national road transport inventories compiled with COPERT 4
Joumard et al. Accuracy of exhaust emission factor measurements on chassis dynamometer
CN114548557A (zh) NOx排放预测方法、装置、电子设备及计算机存储介质
Zhang et al. A vehicle emission factors concentration inversion method based on deep neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: No.443 Huangshan Road, Shushan District, Hefei City, Anhui Province 230022

Patentee after: University of Science and Technology of China

Address before: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96

Patentee before: University of Science and Technology of China

CP02 Change in the address of a patent holder