CN108197731B - 一种基于共同训练的机动车尾气遥测与车检结果一致性方法 - Google Patents

一种基于共同训练的机动车尾气遥测与车检结果一致性方法 Download PDF

Info

Publication number
CN108197731B
CN108197731B CN201711429055.4A CN201711429055A CN108197731B CN 108197731 B CN108197731 B CN 108197731B CN 201711429055 A CN201711429055 A CN 201711429055A CN 108197731 B CN108197731 B CN 108197731B
Authority
CN
China
Prior art keywords
data
motor vehicle
training
inspection
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711429055.4A
Other languages
English (en)
Other versions
CN108197731A (zh
Inventor
康宇
赵振怡
李泽瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201711429055.4A priority Critical patent/CN108197731B/zh
Publication of CN108197731A publication Critical patent/CN108197731A/zh
Application granted granted Critical
Publication of CN108197731B publication Critical patent/CN108197731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)
  • Testing Of Engines (AREA)
  • Exhaust Gas After Treatment (AREA)

Abstract

本发明公开了一种基于共同训练的机动车尾气遥测与车检结果一致性方法,包括以下步骤:利用BP神经网络模型训练出环境相关变量对机动车尾气遥测数据和车检结果差异的影响;同时利用支持向量机算法利用机动车信息相关变量对机动车尾气遥测数据和车检结果差异做分析;将两种方法分别训练出的预测概率矩阵进行线性拟合,最终实现机动车尾气遥测结果与车检结果一致。

Description

一种基于共同训练的机动车尾气遥测与车检结果一致性方法
技术领域
本发明属于环境检测技术处理领域,特别涉及一种基于共同训练的机动车尾气遥测与车检结果一致性方法。
背景技术
随着国民经济的快速发展和人民经济水平的提高,机动车保有量逐年增加,我国的空气污染问题日趋严重,严重灰霾现象时有出现,特别是京津冀地区更加常见。机动车尾气排放作为城市空气污染的主要污染源之一,其负面效应主要包括:引发人类呼吸系统疾病、地表臭氧含量过高、城市热岛效应加重,以及产生光化学烟雾等。因此,我国亟需机动车尾气遥感检测设备及制定相应环保政策,以减少和控制机动车尾气排放。
遥感技术是一种非接触式的光学测量手段,可直接测量行驶中机动车的尾气排放,已在欧美等国家得到了普遍应用。遥测设备的优点是自动化程度高,一天可以测试上万辆机动车,已成为机动车尾气检测/维修(I/M)项目及筛查高排放车的主要手段。在如今的信息化时代,机动车尾气的检测更倾向于智能化、网络化和模块化。其中一种常见的方法就是利用机动车尾气立式遥感检测设备进行机动车尾气遥测。该方法主要利用多波长激光技术检测出机动车尾气中CO、NO、HC的体积浓度以及不透光烟度值;利用红外线发射接收装置得到机动车速度和加速度;利用图像识别技术识别机动车牌照号码。每个机动车尾气检测单元由多个安装在横跨车道的龙门架上垂直于路面的激光发射器构成,每个激光发射器以一定距离间隔安置,每个激光发射器均垂直向地面发射激光束,由于每个车道的激光接收器会受到不同车道激光的影响,他们接收到的是混叠信号,通过对激光接收器混叠信号的分析,得到机动车尾气污染物成分与体积浓度的混叠数据,每个接收器的数据会被发送到弱信号处理单元进行弱信号提取与分离。机动车尾气立式遥测设备可以实现对设备部署点的每一条机动车道上行驶的所有机动车尾气排放进行实时监控,可以在短时间内积累大量机动车尾气排放数据,大大降低了机动车尾气排放的检测成本,在筛选高污染排放车辆,豁免清洁车辆,识别限行车辆、对行驶中的机动车进行实时在线检测方面发挥重大作用,极大地解决了机动车进行车辆年检时采取简易工况法中存在的偶然性以及机动车尾气检测抽样间隔过长的问题,使得机动车监管更加高效。机动车尾气立式遥感检测设备的问世,积极响应了当前环境治理和大气污染防治的迫切需要,是对现有国内外机动车尾气遥测设备的一次技术大提升,加强对机动车尾气排放的有效监控,加速推动我国环境保护检测技术的发展,该设备将极大提升环保部门的工作效能和执法监管力度,帮助政府随时掌握机动车尾气排放情况,从而为有效控制和减少大气污染提供可靠的科学依据和强力的决策支持。在实验室条件下,遥测设备的准确率非常高,但是在室外条件下,汽车尾气颗粒的扩散受到环境条件(温度,湿度、风速、大气压)的影响较大,遥测设备测得的机动车尾气体积浓度与真实排放有差异。我们设定机动车年检结果为该机动车的真实尾气排放的结果,因此,应当克服环境因素与车载变量,使得遥测数据结果与车检结果一致,使得遥测设备的结果可靠性增加。
申请号201510745166.0的申请文件公布了一种基于机动车比功率的速度对车辆排放因子修正方法。该发明专利根据机动车行驶速度计算机动车比功率,得到不同速度区间的比功率分布情况,并利用平均速度计算的修正系数对其进行修正。
发明内容
本发明的目的在于:为解决机动车尾气遥感监测设备在进行机动车尾气遥测时,受到遥感监测设备安装点环境多样,气象条件变化复杂的影响,而导致数据与车检结果不一致的问题,提供一种基于共同训练的机动车尾气遥测数据与车检结果一致性方法,将两种影响因素分别进行讨论,有效的减少了不同类变量间的相关性,使得在训练后能够更精确的找到上述数据集的一致性。
为了实现上述目的,本发明提供了一种基于共同训练的机动车尾气遥测与车检结果一致性方法,包括以下步骤:
步骤1:将机动车尾气遥测数据与机动车车辆年检数据两个数据集合并成一个数据集,所述数据集包括:机动车尾气遥测数据中的环境相关变量、机动车信息相关变量、遥测尾气成分浓度,机动车车辆年检数据中的环境相关变量和机动车车检结果;最终合并的机动车尾气排放数据集中变量分为四类:环境相关变量、机动车信息相关变量、遥测尾气浓度变量以及机动车车检结果,对数据集中的数据做清洗处理;
步骤2:提取步骤1数据集中环境相关变量与遥测尾气浓度变量,以机动车车检结果作为标签,采用BP网络模型,训练环境相关变量对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得到分类的预测概率矩阵;
步骤3:提取步骤1数据集中机动车信息相关变量与遥测尾气浓度变量,使用支持向量机算法,将机动车车检结果作为标签,训练出机动车信息相关变量对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得出分类的预测概率矩阵;
步骤4:将步骤2和步骤3分别训练出的所述预测概率矩阵,进行线性拟合,以达到使机动车尾气遥测结果与车检结果一致的目的。
可选地,上述步骤1中环境相关变量包括:机动车尾气遥测数据中的温度、湿度、大气压和机动车车辆年检数据中的温度,湿度、大气压之间的差值;机动车信息相关变量包括:机动车使用性质、使用年限、机动车长度、发动机排量、基准质量、催化转化器、比功率;行驶信息:速度、加速度;遥测尾气浓度变量包括:机动车尾气排放的CO、HC、NO的体积浓度、不透光烟度值。
具体数据集格式如下:
1)机动车尾气排放数据集中的每条样本数据应包括每辆机动车尾气遥测数据集部分、车辆年检数据集部分以及机动车年检判定结果。因此,每条样本数据属性组成如下:
Figure BDA0001524526560000031
其中,D(i)表示机动车尾气排放数据集的第i条样本数据,
Figure BDA0001524526560000032
表示第i条样本数据中的尾气遥测数据集部分,
Figure BDA0001524526560000033
表示第i条样本数据中的车辆年检数据集部分;
2)尾气遥测数据集中属性组成如下:
Figure BDA0001524526560000034
其中,尾气遥测数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、风速、使用年限、机动车长度、使用性质、催化转化器、温度、大气压强、相对湿度;
3)车辆年检数据集的属性组成如下:
Figure BDA0001524526560000035
其中,车检数据集的数据属性依次分别表示机动车年检时的温度、大气压强、相对湿度,S(i)表示第i条样本数据的机动车年检判定结果;
4)将机动车年检判定结果进行二值化分类,定义如下:
S(i)={0,1}
其中,将0定义为机动车年检判定结果超标,将1定义为机动车年检判定结果合格。车辆年检判定结果为第i条样本数据的标签。
可选地,上述步骤2中采用BP神经网络模型,训练环境变量对遥测数据与车检数据差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:
根据步骤1中所建立的机动车尾气排放数据集,将数据集中环境相关变量与遥测尾气浓度变量提取出作为特征。即数据格式为:
DBP={CO,HC,NO,Opacity,WindSpeed,TTel-TIns,PTel-PIns,HTel-HIns,S}
其中车检结果S(i)={0,1}作为标签。
将数据集DBP按0.3:0.21:0.49的比例分为训练集、验证集和测试集。首先,搭建BP神经网络模型,其中包括一层输入层,两层隐藏层、一层原始输出层、一层Softmax层和一层最终输出层。将训练集作为输入,以100个数据为一个数据块依次循环2000次对网络进行训练。由于这是个二分类问题,其损失函数设为交叉熵:
Figure BDA0001524526560000041
其中p(x)是标签的分类概率,q(x)是经过Softmax回归后的预测类别概率。同时,为了防止过拟合问题,本模型中加入了L1正则化操作,即在损失函数中加入每层的各个节点的权重的绝对值的总和,这相当于在损失函数中加入刻画模型复杂程度的指标,通过限制权重的大小,使得模型不能任意拟合训练数据中的随机噪声。
在每次循环后计算损失函数的大小以及训练后的模型对验证集预测的准确率,二者稳定后即模型训练成功。通过调整每层节点个数以降低损失率,最终隐藏层节点个数分别为100个,200个,得到的测试集的概率矩阵形式为n×2,n是测试集的样本数量。
可选地,上述步骤3中采用支持向量机算法,训练机动车信息相关变量对遥测数据与车检结果差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:
根据步骤1中所建立的机动车尾气遥测数据集,将数据集中遥测数据的机动车速度、加速度、基准质量、发动机排量、比功率、使用年限、车长、使用性质和催化转化器作为特征提取出来作为输入变量的一部分。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:
DSVM={CO,HC,NO,Opacity,Speed,Acc,JZZL,FDJPL,VSP,Useryears,Length,SYXZ,CHZHQ,S}其中车检结果S(i)={0,1}作为标签。
将数据集DSVM按0.3:0.21:0.49的比例分为训练集、验证集和测试集。将训练集作为输入数据,标签作为输出数据,建立支持向量机模型,选择多项式核函数来转换特征空间,训练一个超曲面将正负实例正确分开。因此,测试集在训练好的超曲面上的概率矩阵是n×2的,其中n是测试集的样本数量。
可选地,上述步骤4中对步骤2和步骤3训练出的概率矩阵进行线性拟合,使得机动车尾气遥测数据的结果与车检结果一致的方法如下:
将两个概率矩阵以加权方式相加,得到的概率矩阵包括每条机动车遥测数据类别属0的概率与类别属1的概率,取概率大于0.5的类别为上述共同训练的预测标签。
与现有技术相比,本发明的优点在于:
(1)本发明所解决的一致性问题中,车检结果与遥测数据之间的差异主要由两类影响因子导致。通过理论分析,环境因素通过影响污染物质的扩散,从而影响遥测设备对污染物质检测的误差;而机动车本身的行驶状态不同,其排放的污染物含量也不同,例如机动车在行驶中有各种状态,但在车辆年检中排放物质检测是在固定的行驶状态下。因此,从理论上说两个数据集的差异是由两类独立的因子所影响,其加权值也不应当相关性过大。本发明所采用的BP神经网络与支持向量机共同训练的算法,用两个模型分别对两种影响因素进行训练修正,得到相应的概率矩阵,充分保证了模型的独立性,同时也没有舍弃其最终结果的综合影响。因此,该算法更能准确的反映出二者数据的差异性。
(2)环境影响因子在对污染物质扩散的影响中,根据参考的物理扩散模型,各种因素互相叠加,呈非线性相关,并且非常复杂。BP神经网络中可调控的参数很多,非线性激活函数保证了其非线性。只要隐藏层节点足够,便能拟合复杂的相关模型。因此BP神经网络对环境因素的拟合有很大的优势。
(3)车辆行驶状态对尾气的排放影响是分段线性或者非线性。支持向量机的核函数可将数据映射到低维空间进行有效分类,由于其核函数可调,适用于不算复杂的非线性,因此对于此因子的建模有很高的效率与准确定。因此,本发明提出的算法将两种因素分别训练,排除了环境因素和机动车行驶状态因素间的相互干扰,可以在单个模型上的训练达到最优。因此,最终也能达到更好的效果。
附图说明
图1为一种基于共同训练的机动车尾气遥测与车检结果一致性方法流程图;
图2为BP神经网络模型的网络结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清晰明确,以下对本发明进行进一步详细说明。
如图1所示,本发明具体实施过程如下:
步骤1:将机动车尾气遥测数据与机动车车辆年检数据两个数据集合并成一个数据集,所述数据集包括:机动车尾气遥测数据中的环境相关变量、机动车信息相关变量、遥测尾气成分浓度,机动车车辆年检数据中的环境相关变量和机动车车检结果;最终合并的机动车尾气排放数据集中变量分为四类:环境相关变量、机动车信息相关变量、遥测尾气浓度变量以及机动车车检结果,对数据集中的数据做清洗处理。具体过程如下:
机动车尾气遥测数据包括环境变量:温度、湿度、风速、大气压;基本信息:机动车使用性质、使用年限、机动车长度、发动机排量、基准质量、催化转化器、比功率;行驶信息:速度、加速度;以及机动车尾气排放的CO、HC、NO的体积浓度、不透光烟度值。车检数据包括:温度,湿度、大气压以及车检结果。
具体数据集格式如下:
1)机动车尾气排放数据集中的每条样本数据应包括每辆机动车尾气遥测数据集部分、车辆年检数据集部分以及机动车年检判定结果。因此,每条样本数据属性组成如下:
Figure BDA0001524526560000061
其中,D(i)表示机动车尾气排放数据集的第i条样本数据,
Figure BDA0001524526560000062
表示第i条样本数据中的尾气遥测数据集部分,
Figure BDA0001524526560000063
表示第i条样本数据中的车辆年检数据集部分;
2)尾气遥测数据集中属性组成如下:
Figure BDA0001524526560000064
其中,遥测数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、风速、使用年限、机动车长度、使用性质、催化转化器、温度、大气压强、相对湿度;
3)车辆年检数据集的属性组成如下:
Figure BDA0001524526560000065
其中,车检数据集的数据属性依次分别表示机动车年检时的温度、大气压强、相对湿度,S(i)表示第i条样本数据的机动车年检判定结果;
4)将机动车年检判定结果进行二值化分类,定义如下:
S(i)={0,1}
其中,将0定义为机动车年检判定结果超标,将1定义为机动车年检判定结果合格。年检判定结果为该条数据的标签。
对采集到的数据进行数据清洗的步骤包括:
1)将机动车使用性质、催化转化器和机动车年检判定结果进行二值化处理,其方法如下表所示:
1 0
机动车使用性质 营运 非营运
催化转化器 安装 未安装
机动车年检判定结果 合格 超标
2)对于数据中的缺失值,采用同类均值插补的方法,即根据数据标签分为车检合格与超标两类,分别以该类中样本的均值来插补同类别的缺失值。
3)将发动机排量、基准质量、使用年限、机动车长度、比功率、速度、加速度、温度、相对湿度、大气压强、风速、不透光烟度值、CO、HC、NO的体积浓度,进行归一化处理,计算的公式如下:
Figure BDA0001524526560000071
其中,x表示某项数据属性中某条样本值,xmax表示某项数据属性中的最大值,xmin表示某项数据属性中的最小值,x′表示归一化处理后的数值。
步骤2:根据步骤1中所建立的机动车尾气遥测数据集,考虑机动车尾气遥测设备检测的结果与车辆年检结果的差异主要受到环境差异和机动车行驶状态条件差异的影响。因此,将数据集中遥测数据的环境变量:温度、湿度、大气压和风速,车检数据中的环境变量:温度、湿度、大气压作为特征提取出来,并取二者差值作为输入变量的一部分,其中考虑到车检环境可以认为风速为0。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:
DBP={CO,HC,NO,Opacity,WindSpeed,TTel-TIns,PTel-PIns,HTel-HIns,S}
数据集DBP的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、风速、机动车尾气遥测数据与机动车车辆年检数据中温度、大气压、湿度的差值,其中车检结果S(i)={0,1}作为标签。
将数据集DBP按0.3:0.21:0.49的比例分为训练集、验证集和测试集。首先,搭建BP神经网络模型,具体网络模型如图2,其中包括一层输入层,两层隐藏层、一层原始输出层、一层Softmax层和一层最终输出层。由于数据集共有8个特征,输出标签是2分类,因此网络结构中输入层节点为8,输出层节点为2个。将训练集作为输入,以100个数据为一个数据块依次循环2000次对网络进行训练。由于这是个二分类问题,其损失函数设为交叉熵:
Figure BDA0001524526560000081
其中p(x)是标签的分类概率,q(x)是经过Softmax回归后的预测概率矩阵。同时,为了防止过拟合问题,本模型中加入了L1正则化操作,即在损失函数中加入每层的各个节点的权重的绝对值的总和,这相当于在损失函数中加入刻画模型复杂程度的指标,通过限制权重的大小,使得模型不能任意拟合训练数据中的随机噪声。
在每次循环后计算损失函数的大小以及训练后的模型对验证集预测的准确率,二者稳定后即模型训练成功。通过调整每层节点个数以降低损失率,最终隐藏层节点个数分别为100个,200个,得到的测试集的概率矩阵PBP=[p(S=0),p(S=1)]形式为n×2,n是测试集的样本数量,p(S=0)是预测结果等于0的概率,p(S=1)是预测结果等于1的概率。
步骤3:根据步骤1中所建立的机动车尾气遥测数据集,将数据集中遥测数据的机动车速度、加速度、基准质量、发动机排量、比功率、使用年限、车长、使用性质和催化转化器作为特征提取出来作为输入变量的一部分。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:
DSVM={CO,HC,NO,Opacity,Speed,Acc,JZZL,FDJPL,VSP,Useryears,Length,SYXZ,CHZHQ,S}数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、使用年限、机动车长度、使用性质、催化转化器,其中车检结果S(i)={0,1}作为标签。
将数据集DSVM按0.3:0.21:0.49的比例分为训练集、验证集和测试集。将训练集作为输入数据,标签作为输出数据,建立支持向量机模型。通过选择不同的核函数以及各参数,最终发现选择多项式核函数来转换特征空间可以达到更好地效果,不会出现过拟合或欠拟合的现象,因此能够训练一个超曲面将正负实例正确分开。因此,测试集在训练好的超曲面上的概率矩阵PSVM=[p(S=0),p(S=1)]是n×2的,其中n是测试集的样本数量,p(S=0)是预测结果等于0的概率,p(S=1)是预测结果等于1的概率。
步骤4:将步骤2和步骤3分别训练出的概率矩阵,进行线性拟合,以达到使机动车尾气遥测数据的结果与车检结果一致的目的。其方法如下:
将两个概率矩阵以加权方式相加,得到的最终预测概率矩阵P=a*PBP+b*PSVM+c,其中a,b,c为加权系数,可通过线性拟合的方式获得取值,即a=0.4284,b=0.3756,c=0.098。
该方法得到的概率矩阵包括每条机动车遥测数据类别属0的概率与类别属1的概率,取概率较大的类别为上述共同训练的预测标签:
Pend=argmax[p(S=0),p(S=1)]
其中Pend是概率矩阵中较大值的下标的集合。
总之,本发明利用BP神经网络模型训练出环境变量对机动车尾气遥测结果和车检结果差异的影响;同时利用支持向量机算法利用机动车行驶状态的信息对机动车尾气遥测和车检结果差异做分析;将两种方法分别训练出的预测概率矩阵进行线性拟合,最终实现机动车尾气遥测结果与车检结果一致。
提供以上实例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (6)

1.一种基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于:包括以下步骤:
步骤1:将机动车尾气遥测数据与机动车车辆年检数据两个数据集合并成一个数据集,所述数据集包括:机动车尾气遥测数据中的环境相关变量、机动车信息相关变量、遥测尾气成分浓度,机动车车辆年检数据中的环境相关变量和机动车车检结果;最终合并的机动车尾气排放数据集中变量分为四类:环境相关变量对比差值、机动车信息相关变量、遥测尾气成分浓度变量以及机动车车检结果,对数据集中的数据做清洗处理;
步骤2:提取步骤1数据集中环境相关变量对比差值与遥测尾气成分浓度变量,以机动车车检结果作为标签,采用BP网络模型,训练环境相关变量对比差值对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得到分类的预测概率矩阵;
步骤3:提取步骤1数据集中机动车信息相关变量与遥测尾气成分浓度变量,使用支持向量机算法,将机动车车检结果作为标签,训练出机动车信息相关变量对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得出分类的预测概率矩阵;
步骤4:将步骤2和步骤3分别训练出的所述预测概率矩阵以加权方式相加,得到的概率矩阵包括每条机动车遥测数据类别属0的概率与类别属1的概率,取概率大于0.5的类别为上述共同训练的预测标签。
2.根据权利要求1所述的基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于:步骤1中环境相关变量对比差值包括:机动车尾气遥测数据中的温度、相对湿度、大气压和机动车车辆年检数据中的温度,相对湿度、大气压之间的差值;机动车信息相关变量包括:机动车使用性质、使用年限、机动车长度、发动机排量、基准质量、催化转化器、比功率;行驶信息:速度、加速度;遥测尾气成分浓度变量包括:机动车尾气排放的CO、HC、NO的体积浓度、不透光烟度值。
3.根据权利要求1所述的基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于:步骤1中数据集格式如下:
(1)机动车尾气排放数据集中的每条样本数据应包括每辆机动车尾气遥测数据集部分、车辆年检数据集部分以及机动车年检判定结果,每条样本数据属性组成如下:
Figure FDA0003344413970000011
其中,D(i)表示机动车尾气排放数据集的第i条样本数据,
Figure FDA0003344413970000021
表示第i条样本数据中的尾气遥测数据集部分,
Figure FDA0003344413970000022
表示第i条样本数据中的车辆年检数据集部分;
(2)尾气遥测数据集中属性组成如下:
Figure FDA0003344413970000023
其中,尾气遥测数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、风速、使用年限、机动车长度、使用性质、催化转化器、温度、大气压强、相对湿度;
(3)车辆年检数据集的属性组成如下:
Figure FDA0003344413970000024
其中,车检年检数据集的数据属性依次分别表示机动车年检时的温度、大气压强、相对湿度,S(i)表示第i条样本数据的机动车年检判定结果;
(4)将机动车年检判定结果进行二值化分类,定义如下:
S(i)={0,1}
其中,将0定义为机动车年检判定结果超标,将1定义为机动车年检判定结果合格,车辆年检判定结果为第i条样本数据的标签。
4.根据权利要求1所述的基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于:所述步骤1中对采集到的数据进行数据清洗的步骤包括:
(1)对于数据中的缺失值,采用同类均值插补的方法,即根据数据标签分为车检合格与超标两类,分别以该类中样本的均值来插补同类别的缺失值;
(2)将发动机排量、基准质量、使用年限、机动车长度、比功率、速度、加速度、温度、相对湿度、大气压强、风速、不透光烟度值、CO、HC、NO的体积浓度,进行归一化处理,计算的公式如下:
Figure FDA0003344413970000025
其中,x表示某项数据属性中某条样本值,xmax表示某项数据属性中的最大值,xmin表示某项数据属性中的最小值,x′表示归一化处理后的数值。
5.根据权利要求3所述的基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于,所述步骤2中采用BP神经网络模型,训练环境相关变量对比差值对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:
(1)提取特征:将数据集中环境相关变量对比差值与遥测尾气成分浓度变量提取出作为特征,即数据格式为:
DBP={CO,HC,NO,Opacity,WindSpeed,TTel-TIns,PTel-PIns,HTel-HIns,S(i)}
其中数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、风速,遥测数据集中的温度、大气压强、相对湿度与年检数据集中的温度、大气压强、相对湿度的对应差值,以及车检结果;对于第i条样本数据的车检结果S(i)={0,1},作为BP神经网络模型训练过程中的标签数据;
(2)分割数据集:将数据集DBP按一定比例分为训练集、验证集和测试集;
(3)训练网络:首先,搭建BP神经网络模型,其中包括一层输入层,两层隐藏层、一层原始输出层、一层Softmax层和一层最终输出层,将训练集作为输入,以数据块为单位,依次送入网络进行训练:
损失函数设为交叉熵H(p,q):
Figure FDA0003344413970000031
其中p(x)是标签的分类概率,q(x)是每一次循环中经过Softmax回归后的预测概率矩阵;在每次循环后计算损失函数的大小以及训练后的模型对验证集预测的准确率,二者稳定后即模型训练成功,通过调整每层节点个数以降低损失率,得到的测试集的概率矩阵形式为n×2,n是测试集的样本数量,模型训练成功后所得的q(x),即所求分类的预测概率矩阵。
6.根据权利要求3所述的基于共同训练的机动车尾气遥测与车检结果一致性方法,其特征在于:所述步骤3中,采用支持向量机算法,训练机动车信息相关变量对遥测数据与车检结果差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:
(1)提取特征:将数据集中机动车信息相关变量与遥测尾气成分浓度变量提取出作为特征,特征的数据格式为:
DSVM={CO,HC,NO,Opacity,Speed,Acc,JZZL,FDJPL,VSP,Useryears,Length,SYXZ,CHZHQ,S}
其中数据集的数据属性依次分别表示CO、HC和NO的体积浓度,不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、使用年限、机动车长度、使用性质、催化转化器和车检结果;对于第i条样本数据的车检结果S(i)={0,1},作为支持向量机算法训练过程中的标签数据;
(2)建立模型:将数据集DSVM按一定比例分为训练集、验证集和测试集,将训练集作为输入数据,标签作为输出数据,建立支持向量机模型,选择多项式核函数来转换特征空间,训练一个超曲面将正负实例正确分开,并给出分类的预测概率矩阵;测试集在训练好的超曲面上的预测概率矩阵是n×2的,其中n是测试集的样本数量。
CN201711429055.4A 2017-12-26 2017-12-26 一种基于共同训练的机动车尾气遥测与车检结果一致性方法 Active CN108197731B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711429055.4A CN108197731B (zh) 2017-12-26 2017-12-26 一种基于共同训练的机动车尾气遥测与车检结果一致性方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711429055.4A CN108197731B (zh) 2017-12-26 2017-12-26 一种基于共同训练的机动车尾气遥测与车检结果一致性方法

Publications (2)

Publication Number Publication Date
CN108197731A CN108197731A (zh) 2018-06-22
CN108197731B true CN108197731B (zh) 2022-01-11

Family

ID=62584117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711429055.4A Active CN108197731B (zh) 2017-12-26 2017-12-26 一种基于共同训练的机动车尾气遥测与车检结果一致性方法

Country Status (1)

Country Link
CN (1) CN108197731B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284406B (zh) * 2018-09-03 2021-12-03 四川长虹电器股份有限公司 基于差异循环神经网络的意图识别方法
CN109238987B (zh) * 2018-10-11 2021-07-09 成都中安瑞晨科技有限责任公司 一种多光谱汽车尾气监测装置
CN110135466B (zh) * 2019-04-23 2022-07-15 中国科学技术大学 一种污染物排放超标车辆判断方法及系统
CN110866562A (zh) * 2019-11-20 2020-03-06 江苏中路信息科技有限公司 一种基于dsvm的大数据分类预测方法
CN112213244B (zh) * 2020-10-27 2023-10-10 中国科学院合肥物质科学研究院 基于机器学习的机动车尾气林格曼黑度测量装置及方法
CN114662060B (zh) * 2022-05-26 2022-08-16 中汽研汽车检验中心(天津)有限公司 基于机器学习的车载氮氧化物传感器浓度测量值修正方法
CN115081526A (zh) * 2022-06-16 2022-09-20 中国汽车工程研究院股份有限公司 一种机动车排放危害识别和判定的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105424598A (zh) * 2014-11-29 2016-03-23 巫立斌 一种基于图像识别的机动车尾气检测方法
CN106599941A (zh) * 2016-12-12 2017-04-26 西安电子科技大学 基于卷积神经网络与支持向量机的手写数字识别方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN106644951A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气遥测设备校正方法
CN106680281A (zh) * 2016-12-31 2017-05-17 中国科学技术大学 一种基于深度残差学习网络的柴油车尾气烟度检测方法
CN107330300A (zh) * 2017-08-24 2017-11-07 中国科学技术大学 一种基于支持向量回归的车辆尾气浓度反演方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688309B2 (en) * 2011-12-12 2014-04-01 International Business Machines Corporation Active and stateful hyperspectral vehicle evaluation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105424598A (zh) * 2014-11-29 2016-03-23 巫立斌 一种基于图像识别的机动车尾气检测方法
CN106599941A (zh) * 2016-12-12 2017-04-26 西安电子科技大学 基于卷积神经网络与支持向量机的手写数字识别方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN106644951A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气遥测设备校正方法
CN106680281A (zh) * 2016-12-31 2017-05-17 中国科学技术大学 一种基于深度残差学习网络的柴油车尾气烟度检测方法
CN107330300A (zh) * 2017-08-24 2017-11-07 中国科学技术大学 一种基于支持向量回归的车辆尾气浓度反演方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Analysis and prediction of vehicle exhaust emission using ANN;Zhenyi Xu等;《2017 36th Chinese Control Conference》;20170728;第4029-4033页 *
机动车尾气遥感监测数据中心平台的设计与开发;吴迪 等;《大气与环境光学学报》;20161115;第11卷(第6期);第453-459页 *

Also Published As

Publication number Publication date
CN108197731A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN108197731B (zh) 一种基于共同训练的机动车尾气遥测与车检结果一致性方法
CN106650825B (zh) 一种机动车尾气排放数据融合系统
CN107577910B (zh) 一种基于深层次神经网络的车辆尾气浓度反演方法
CN112113912B (zh) 一种柴油车排放遥感大数据监测系统及监测方法
CN108268935B (zh) 一种基于时序循环神经网络的pm2.5浓度值预测方法及系统
CN110243762A (zh) 机动车尾气遥测和监管系统及自学习高排污车辆判定算法
CN110346517B (zh) 一种智慧城市工业大气污染可视化预警方法及其系统
CN111310786B (zh) 基于随机森林分类器的交通检测器异常诊断方法及装置
CN210221806U (zh) 污染判定标定车辆及其车载尾气检测设备
CN111024898B (zh) 一种基于CatBoost模型的车辆尾气浓度超标判别方法
CN108226046A (zh) 一种机动车尾气遥测结果修正方法
CN114157513B (zh) 基于改进卷积神经网络的车联网入侵检测方法及设备
CN208422108U (zh) 基于毫米波雷达与激光雷达的交通情况调查装置
CN110346518B (zh) 一种交通排放污染可视化预警方法及其系统
CN110135466B (zh) 一种污染物排放超标车辆判断方法及系统
CN107895482A (zh) 基于毫米波雷达与激光雷达的交通情况调查装置及方法
CN115081508B (zh) 一种基于交通数字孪生的交通运行风险平行仿真系统
Cacciola et al. Aspects about air pollution prediction on urban environment
CN116070676B (zh) 基于注意力机制和自编码器的高速公路路面温度预报方法
CN116631186B (zh) 基于危险驾驶事件数据的高速公路交通事故风险评估方法、系统
CN111077048A (zh) 基于移动设备的机会式群体智能空气质量监测及评估方法
CN110988263B (zh) 一种基于改进的Stacking模型的车辆尾气浓度估计方法
CN112985830A (zh) 一种abs结果自动判定算法
CN112819217A (zh) 移动源污染排放主要影响因素预测方法、系统及存储介质
CN114291081B (zh) 一种基于人工智能算法的车辆碰撞检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant