CN113222217A - 基于离散排放标签的柴油车排放连续值预测方法及系统 - Google Patents

基于离散排放标签的柴油车排放连续值预测方法及系统 Download PDF

Info

Publication number
CN113222217A
CN113222217A CN202110406754.7A CN202110406754A CN113222217A CN 113222217 A CN113222217 A CN 113222217A CN 202110406754 A CN202110406754 A CN 202110406754A CN 113222217 A CN113222217 A CN 113222217A
Authority
CN
China
Prior art keywords
emission
label
sample
diesel vehicle
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110406754.7A
Other languages
English (en)
Other versions
CN113222217B (zh
Inventor
康宇
李婧
曹洋
许镇义
夏秀山
李兵兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Institute of Advanced Technology University of Science and Technology of China
Original Assignee
Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Institute of Advanced Technology University of Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center, Institute of Advanced Technology University of Science and Technology of China filed Critical Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Priority to CN202110406754.7A priority Critical patent/CN113222217B/zh
Publication of CN113222217A publication Critical patent/CN113222217A/zh
Application granted granted Critical
Publication of CN113222217B publication Critical patent/CN113222217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的一种基于离散排放标签的柴油车排放连续值预测方法及系统包括以下步骤,生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。本发明是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。

Description

基于离散排放标签的柴油车排放连续值预测方法及系统
技术领域
本发明涉及交通物流网络中尾气排放监测技术领域,具体涉及一种基于离散排放标签的柴油车排放连续值预测方法及系统。
背景技术
随着我国经济的飞速发展,人们的生活水平显著提高,机动车辆的普及和保有量持续增加,使得机动车排放污染成为大气污染的主要来源之一。其中,以柴油车为代表的移动污染源严重影响着空气质量,引起社会的广泛关注。针对这一情况,开展柴油车排放的监督检测以及排放等级评估具有十分重要的意义。
柴油车排放检测主要依据道路遥感监测设备的检测结果,当一辆柴油车通过遥感监测设备时,可以得到包含一氧化碳(CO),碳氢化物(HC),一氧化氮(NO)的浓度值等遥感检测数据。然而,遥感监测设备位置固定,难以获取柴油车在不同运行工况下的排放情况,且覆盖区域较小。除此之外,传统的柴油车排放标准则大都依据车辆检测机构的检测结果(即离线车检)判定是否为正常排放,消耗大量的人力和时间,且车辆接受离线车检的频率极低,难以获得所有在路柴油车辆近期在检测机构中的检测结果,多数在路柴油车为正常排放的可信度较低。
发明内容
本发明提出的一种基于离散排放标签的柴油车排放连续值预测方法及系统,能够有效的预测柴油车污染物排放情况,并判定其排放等级。
为实现上述目的,本发明采用了以下技术方案:
一种基于离散排放标签的柴油车排放连续值预测方法,包括以下步骤
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
进一步的,所述生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据具体包括,
根据便携式排放测量系统的获取到的信息,构建系统输入样本,包括:
柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length);车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP);
环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为
Figure BDA0003022588410000021
样本标签y∈{1,...,c}为离线车检的柴油车排放级别;
假设共有总的样本Ψ条,遵循7:3的准则分开训练集和测试集,记训练集样本数据有n条,测试集样本有Ω条,且有标签的数据全部归于训练集,记训练集中有标签的样本集为
Figure BDA0003022588410000022
其中,
Figure BDA0003022588410000023
yi∈{1,...,c}为xi对应的标签;无标签的样本集记作
Figure BDA0003022588410000024
其中,
Figure BDA0003022588410000025
训练集总的样本数量为n=l+u,l为有标签样本的数量,u为无标签样本的数量。
进一步的,根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签,具体包括,
通过标签获取方法,训练集中的无标签样本被赋予计算得到的标签,定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算;
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
Figure BDA0003022588410000031
其中,xa,xb∈Xn
Figure BDA0003022588410000032
表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束
Figure BDA0003022588410000033
wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当
Figure BDA0003022588410000034
时,wad=1,wab=0,b≠d,
Figure BDA0003022588410000035
为最优解;
所以,wab用于测定顶点xb与顶点xa的相似程度,且wab≠wba,进而,推断出:
Figure BDA0003022588410000036
其中,
Figure BDA0003022588410000037
表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值通过以下n个标准二次规划问题来求解:
Figure BDA0003022588410000038
Figure BDA0003022588410000039
计算完所有权值后,将得到一个稀疏矩阵(W)ab=wab,这个
Figure BDA00030225884100000310
即被视为G的权重矩阵;
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取;
已知y∈{1,...,c},定义
Figure BDA00030225884100000311
是非负实数n×c阶矩阵的集合,
Figure BDA00030225884100000312
是Yn进行“one-hot”编码后得到的n×c阶矩阵,如果xa的标签为j(1≤j≤c),则
Figure BDA00030225884100000313
否则
Figure BDA00030225884100000314
对于无标签样本预设
Figure BDA00030225884100000315
定义任意矩阵
Figure BDA00030225884100000316
对应于样本集Xn的标签,则样本点xa的设定标签为ya=argmaxj≤cHaj,因此,H也可以看作为获取样本点设定标签的函数,即Ha对应于xa的标签获取结果;
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
Figure BDA00030225884100000317
其中,0<α<1是xa从它从邻域样本点“吸收”到的标签信息部分,
Figure BDA0003022588410000041
为t次迭代中的标签向量,
Figure BDA0003022588410000042
由此,上述迭代公式更新为:
Figure BDA0003022588410000043
进而,
Figure BDA0003022588410000044
由于
Figure BDA0003022588410000045
wab≥0,根据定理Perron-Frobenius,知道W的谱半径,ρ(W)≤1,且0<α<1,则,
Figure BDA0003022588410000046
Figure BDA0003022588410000047
其中I为n阶单位矩阵,显然,{Ht}收敛于H*
Figure BDA0003022588410000048
无标签数据的标签即可根据
Figure BDA0003022588410000049
得到;
此时无标签的样本集更新为有标签样本集
Figure BDA00030225884100000410
yj∈{1,...,c}为利用上述方法获取的设定标签,则训练集所有的样本构成有标签样本集Xn=Xl∪Xu,Yn=Yl∪Yu
进一步的,所述根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级,具体包括,
首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
Figure BDA00030225884100000411
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量
Figure BDA00030225884100000412
包含便携式排放测量系统测得的第k个样本的信息,
Figure BDA00030225884100000413
为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1,yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级;
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
Figure BDA0003022588410000051
其中,
Figure BDA0003022588410000052
为模型参数在第r次迭代中的估计值,F(·)和f(·)分别为正态分布的分布函数和概率密度函数,O(·)为指示函数,当满足条件时,结果为1,否则为0;根据得到的模型参数估计值
Figure BDA0003022588410000053
即可计算测试集柴油车的排放值。
进一步的,还包括
Figure BDA0003022588410000054
在预测柴油车排放值的问题中,由于缺乏先验信息,阈值θ是未知的,因此,选择同时估计未知模型参数
Figure BDA0003022588410000055
和阈值θ,即实现
Figure BDA0003022588410000056
将阈值θ设置为模型参数的一个元素,
Figure BDA0003022588410000057
预测模型更新为:
Figure BDA0003022588410000058
参数估计算法更新为:
Figure BDA0003022588410000059
其中,
Figure BDA00030225884100000510
为增加阈值θ后模型参数在第r次迭代中的估计值,根据最终得到的参数估计值
Figure BDA00030225884100000511
确定模型参数
Figure BDA00030225884100000512
和阈值
Figure BDA00030225884100000513
即可根据
Figure BDA00030225884100000514
k=1,2,...,Ω计算测试集柴油车样本数据对应的排放值。
另一方面,本发明的一种基于离散排放标签的柴油车排放连续值预测系统,还包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
第三方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
由上述技术方案可知,本发明的基于离散排放标签的柴油车排放连续值预测方法及系统,是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。
附图说明
图1为本发明构建方法的流程示意图;
图2为本发明系统框架图;
图3为本发明标签获取的流程图;
图4为本发明连续值预测的模型结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例所述的基于离散排放标签的柴油车排放连续值预测方法,包括:
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
具体如下:
1、样本构建:
根据便携式排放测量系统的信息,构建系统输入样本,由柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length),车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP)与环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为
Figure BDA0003022588410000071
样本标签y∈{1,...,c}为离线车检的柴油车排放级别,由于离线车检的频率较低,且距车检时间越远,检测结果越不可信,因此只有部分柴油车辆样本有对应的离散标签即近期离线车检结果。假设共有总的样本Ψ条,遵循7:3的准则分开训练集和测试集,记训练集样本数据有n条,测试集样本有Ω条,且有标签的数据全部归于训练集,记训练集中有标签的样本集为
Figure BDA0003022588410000072
其中,
Figure BDA0003022588410000073
yi∈{1,...,c}为xi对应的标签;无标签的样本集记作
Figure BDA0003022588410000074
其中,
Figure BDA0003022588410000075
训练集总的样本数量为n=l+u,l为有标签样本的数量,u为无标签样本的数量。
2、基于图的标签获取:
通过标签获取方法,训练集中的无标签样本可以被赋予计算得到的标签,此处定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算。
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
Figure BDA0003022588410000076
其中,xa,xb∈Xn
Figure BDA0003022588410000077
表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束
Figure BDA0003022588410000078
wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当
Figure BDA0003022588410000079
时,wad=1,wab=0,b≠d,
Figure BDA00030225884100000710
为最优解。所以,wab可以测定顶点xb与顶点xa的相似程度,另外需要注意的一点是wab≠wba。进而,可以推断出:
Figure BDA0003022588410000081
其中,
Figure BDA0003022588410000082
表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值可以通过以下n个标准二次规划问题来求解:
Figure BDA0003022588410000083
Figure BDA0003022588410000084
计算完所有权值后,将得到一个稀疏矩阵(W)ab=wab,这个
Figure BDA0003022588410000085
即被视为G的权重矩阵。
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取。已知y∈{1,...,c},定义
Figure BDA0003022588410000086
是非负实数n×c阶矩阵的集合,
Figure BDA0003022588410000087
是Yn进行“one-hot”编码后得到的n×c阶矩阵,如果xa的标签为j(1≤j≤c),则
Figure BDA0003022588410000088
否则
Figure BDA0003022588410000089
对于无标签样本预设
Figure BDA00030225884100000810
(1≤j≤c)。定义任意矩阵
Figure BDA00030225884100000811
对应于样本集Xn的标签,则样本点xa的设定标签为ya=argmaxj≤cHaj,因此,H也可以看作为获取样本点设定标签的函数,即Ha对应于xa的标签获取结果。
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
Figure BDA00030225884100000812
其中,0<α<1是xa从它从邻域样本点“吸收”到的标签信息部分,
Figure BDA00030225884100000813
为t次迭代中的标签向量,
Figure BDA00030225884100000814
由此,上述迭代公式更新为:
Figure BDA00030225884100000815
进而,
Figure BDA00030225884100000816
由于
Figure BDA00030225884100000817
wab≥0,根据定理Perron-Frobenius,可以知道W的谱半径,ρ(W)≤1,且0<α<1,则,
Figure BDA0003022588410000091
Figure BDA0003022588410000092
其中I为n阶单位矩阵,显然,{Ht}收敛于H*
Figure BDA0003022588410000093
无标签数据的标签即可根据
Figure BDA0003022588410000094
得到。
此时无标签的样本集更新为有标签样本集
Figure BDA0003022588410000095
yj∈{1,...,c}为利用上述方法获取的设定标签,则训练集所有的样本构成有标签样本集Xn=Xl∪Xu,Yn=Yl∪Yu
3、连续值预测方法:
在训练样本集有标签的基础上,设计算法对测试集柴油车排放值进行预测,即预测CO、HC或NO等污染物排放值。在数据采集和处理过程中不可避免会出现一些误差,因此随机噪声的加入是必要的,根据中心极限定理,假设噪声服从正态分布,均值为0,方差为σ2。因此,首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
Figure BDA0003022588410000096
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量
Figure BDA0003022588410000097
包含便携式排放测量系统测得的第k个样本的信息,
Figure BDA0003022588410000098
为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1。yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级。
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
Figure BDA0003022588410000099
其中,
Figure BDA00030225884100000910
为模型参数在第r次迭代中的估计值,F(·)和f(·)分别为正态分布的分布函数和概率密度函数,O(·)为指示函数,当满足条件时,结果为1,否则为0。根据得到的模型参数估计值
Figure BDA00030225884100000911
即可计算测试集柴油车的排放值:
Figure BDA00030225884100000912
在预测柴油车排放值的问题中,由于缺乏先验信息,阈值θ是未知的。因此,选择同时估计未知模型参数
Figure BDA0003022588410000101
和阈值θ,即实现
Figure BDA0003022588410000102
将阈值θ设置为模型参数的一个元素,
Figure BDA0003022588410000103
预测模型更新为:
Figure BDA0003022588410000104
参数估计算法更新为:
Figure BDA0003022588410000105
其中,
Figure BDA0003022588410000106
为增加阈值θ后模型参数在第r次迭代中的估计值。根据最终得到的参数估计值
Figure BDA0003022588410000107
可以确定模型参数
Figure BDA0003022588410000108
和阈值
Figure BDA0003022588410000109
即可根据
Figure BDA00030225884100001010
k=1,2,...,Ω计算测试集柴油车样本数据对应的排放值。
以下,举例说明:
1、数据准备:
使用柴油车95辆,其中30辆有近期车辆检测机构的检测结果,包含高排放车12辆,正常排放车18辆,利用便携式排放测量系统对所有的柴油车进行排放检测,设置每辆车取用样本数据100条左右。由于在不同的运行工况下柴油车的排放情况具有明显差异,因此,为了保证样本数据的多样性,所选取50条数据应尽量代表不同运行状态下的排放检测结果。最终,共获得10823条样本,包括有车检结果(即有标签)的样本数据3179条,没有标签的样本数据7644条。将10823条样本按照7:3的规则分为训练集和测试集,并保证有标签数据全部属于训练集,此时训练集包含有标签数据3179条,无标签数据4397条。
2、数据预处理:
样本的每一个特征都具有特定的物理意义,且有着不同的数量级,为了避免数据形式对系统模型建立的影响,将所有样本的同一种特征进行归一化处理,将值归一化到[0,1]之间,完成所有10维特征值的归一化处理。除此之外,根据离线车检结果设置有标签数据的离散标签,其中高排放柴油车设置为2,正常排放柴油车设置为1。
3、标签获取:
利用标签获取方法,获取训练集中无标签样本的“设定标签”,根据每个顶点的邻域信息构建无向图G=(V,E),利用其邻近顶点的线性组合实现最优构建,最终得到边权重的稀疏矩阵W。
预设置训练集中无标签样本的标签为0,有标签样本的标签保持原值,在此基础上对训练集的标签向量进行“one-hot”编码,得到一个n×c阶的标签矩阵
Figure BDA0003022588410000111
定义矩阵
Figure BDA0003022588410000112
对应于训练样本集的标签,根据已得到的G和W,完成迭代过程来实现无标签样本设定标签的获取,在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息。最终得到无标签样本数据所对应的设定标签
Figure BDA0003022588410000113
进而,
Figure BDA0003022588410000114
此时训练集中所有的样本均被设为有标签的样本数据Xn=Xl∪Xu,Yn=Yl∪Yu
4、连续值预测:
按照阈值θ未知的预测模型构建方法,在特征向量的第11维增加全1列数据,此时样本特征更新为xk=[xk1,xk2,...,xkd,-1]T。首先在训练集中执行参数估计迭代算法,计算模型参数和阈值的估计值
Figure BDA0003022588410000115
Figure BDA0003022588410000116
之后根据参数估计结果计算柴油车对应测试集样本数据的运行工况下CO、HC或NO的排放值
Figure BDA0003022588410000117
k=1,2,...,Ω。与此同时,根据CO、HC或NO的排放值和估计得到的阈值θ,最终得到柴油车的排放等级,即为高排放车辆还是正常排放情况。
由上可知,本发明的基于离散排放标签的柴油车排放连续值预测方法,能够有效的预测柴油车污染物排放情况,并判定其排放等级;本发明是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。
另一方面,本发明的一种基于离散排放标签的柴油车排放连续值预测系统,还包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
第三方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种基于离散排放标签的柴油车排放连续值预测方法,其特征在于,包括以下步骤,
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
2.根据权利要求1所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:所述生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据具体包括,
根据便携式排放测量系统的获取到的信息,构建系统输入样本,包括:
柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length);车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP);环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为
Figure FDA0003022588400000011
样本标签y∈{1,...,c}为离线车检的柴油车排放级别;
假设共有总的样本Ψ条,遵循7:3的准则分开训练集和测试集,记训练集样本数据有n条,测试集样本有Ω条,且有标签的数据全部归于训练集,记训练集中有标签的样本集为
Figure FDA0003022588400000012
其中,
Figure FDA0003022588400000013
yi∈{1,...,c}为xi对应的标签;无标签的样本集记作
Figure FDA0003022588400000014
其中,
Figure FDA0003022588400000015
训练集总的样本数量为n=l+u,l为有标签样本的数量,u为无标签样本的数量。
3.根据权利要求2所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签,具体包括,
通过标签获取方法,训练集中的无标签样本被赋予计算得到的标签,定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算;
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
Figure FDA0003022588400000021
其中,xa,xb∈Xn
Figure FDA0003022588400000022
表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束
Figure FDA0003022588400000023
wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当
Figure FDA0003022588400000024
时,wad=1,wab=0,b≠d,
Figure FDA0003022588400000025
为最优解;
所以,wab用于测定顶点xb与顶点xa的相似程度,且wab≠wba,进而,推断出:
Figure FDA0003022588400000026
其中,
Figure FDA0003022588400000027
表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值通过以下n个标准二次规划问题来求解:
Figure FDA0003022588400000028
Figure FDA0003022588400000029
计算完所有权值后,将得到一个稀疏矩阵(W)ab=wab,这个
Figure FDA00030225884000000210
即被视为G的权重矩阵;
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取;
已知y∈{1,...,c},定义
Figure FDA00030225884000000211
是非负实数n×c阶矩阵的集合,
Figure FDA00030225884000000212
是Yn进行“one-hot”编码后得到的n×c阶矩阵,如果xa的标签为j(1≤j≤c),则
Figure FDA00030225884000000213
否则
Figure FDA00030225884000000214
对于无标签样本预设
Figure FDA00030225884000000215
定义任意矩阵
Figure FDA00030225884000000216
对应于样本集Xn的标签,则样本点xa的设定标签为ya=argmaxj≤cHaj,因此,H也可以看作为获取样本点设定标签的函数,即Ha对应于xa的标签获取结果;
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
Figure FDA00030225884000000217
其中,0<α<1是xa从它从邻域样本点“吸收”到的标签信息部分,
Figure FDA00030225884000000218
为t次迭代中的标签向量,
Figure FDA00030225884000000219
由此,上述迭代公式更新为:
Figure FDA0003022588400000031
进而,
Figure FDA0003022588400000032
由于
Figure FDA0003022588400000033
wab≥0,根据定理Perron-Frobenius,知道W的谱半径,ρ(W)≤1,且0<α<1,则,
Figure FDA0003022588400000034
Figure FDA0003022588400000035
其中I为n阶单位矩阵,显然,{Ht}收敛于H*
Figure FDA0003022588400000036
无标签数据的标签即可根据
Figure FDA0003022588400000037
得到;
此时无标签的样本集更新为有标签样本集
Figure FDA0003022588400000038
yj∈{1,...,c}为利用上述方法获取的设定标签,则训练集所有的样本构成有标签样本集Xn=Xl∪Xu,Yn=Yl∪Yu
4.根据权利要求3所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:所述根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级,具体包括,
首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
Figure FDA0003022588400000039
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量
Figure FDA00030225884000000310
包含便携式排放测量系统测得的第k个样本的信息,
Figure FDA00030225884000000311
为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1,yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级;
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
Figure FDA00030225884000000312
其中,
Figure FDA00030225884000000313
为模型参数在第r次迭代中的估计值,F(·)和f(·)分别为正态分布的分布函数和概率密度函数,O(·)为指示函数,当满足条件时,结果为1,否则为0;根据得到的模型参数估计值
Figure FDA00030225884000000314
即可计算测试集柴油车的排放值。
5.根据权利要求4所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:
Figure FDA0003022588400000041
在预测柴油车排放值的问题中,由于缺乏先验信息,阈值θ是未知的,因此,选择同时估计未知模型参数
Figure FDA0003022588400000042
和阈值θ,即实现
Figure FDA0003022588400000043
将阈值θ设置为模型参数的一个元素,
Figure FDA0003022588400000044
预测模型更新为:
Figure FDA0003022588400000045
参数估计算法更新为:
Figure FDA0003022588400000046
其中,
Figure FDA0003022588400000047
为增加阈值θ后模型参数在第r次迭代中的估计值,根据最终得到的参数估计值
Figure FDA0003022588400000048
确定模型参数
Figure FDA0003022588400000049
和阈值
Figure FDA00030225884000000410
即可根据
Figure FDA00030225884000000411
计算测试集柴油车样本数据对应的排放值。
6.一种基于离散排放标签的柴油车排放连续值预测系统,其特征在于,包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
CN202110406754.7A 2021-04-15 2021-04-15 基于离散排放标签的柴油车排放连续值预测方法及系统 Active CN113222217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110406754.7A CN113222217B (zh) 2021-04-15 2021-04-15 基于离散排放标签的柴油车排放连续值预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110406754.7A CN113222217B (zh) 2021-04-15 2021-04-15 基于离散排放标签的柴油车排放连续值预测方法及系统

Publications (2)

Publication Number Publication Date
CN113222217A true CN113222217A (zh) 2021-08-06
CN113222217B CN113222217B (zh) 2022-02-25

Family

ID=77087407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110406754.7A Active CN113222217B (zh) 2021-04-15 2021-04-15 基于离散排放标签的柴油车排放连续值预测方法及系统

Country Status (1)

Country Link
CN (1) CN113222217B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120278270A1 (en) * 2011-04-28 2012-11-01 International Business Machines Corporation Selecting solution for carbon emission prediction
EP2797041A1 (en) * 2013-04-26 2014-10-29 Università Del Salento - Dipartimento Di Ingegneria Dell'Innovazione Method for estimating pollutant concentration of urban environments using fluid-dynamics clustering
CN106650826A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种多车道水平式尾气遥测设备数据处理方法
CN106683024A (zh) * 2016-12-31 2017-05-17 中国科学技术大学 一种基于排放源强相似性的机动车尾气遥测设备布点方法
CN108133295A (zh) * 2018-01-11 2018-06-08 安徽优思天成智能科技有限公司 一种针对目标路段的机动车尾气浓度连续时间预测方法
CN110135466A (zh) * 2019-04-23 2019-08-16 中国科学技术大学 一种污染物排放超标车辆判断方法及系统
CN110175719A (zh) * 2019-05-30 2019-08-27 中国科学技术大学 通过尾气数据空间插值实现尾气排放估计及预警的方法
CN110503139A (zh) * 2019-08-07 2019-11-26 中国科学技术大学 一种城市区域尾气污染预测方法
CN111142501A (zh) * 2019-12-27 2020-05-12 浙江科技学院 基于半监督自回归动态隐变量模型的故障检测方法
CN112613652A (zh) * 2020-12-17 2021-04-06 东南大学 一种服务于低碳道路交通规划的道路网碳排放估算方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120278270A1 (en) * 2011-04-28 2012-11-01 International Business Machines Corporation Selecting solution for carbon emission prediction
EP2797041A1 (en) * 2013-04-26 2014-10-29 Università Del Salento - Dipartimento Di Ingegneria Dell'Innovazione Method for estimating pollutant concentration of urban environments using fluid-dynamics clustering
CN106650826A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种多车道水平式尾气遥测设备数据处理方法
CN106683024A (zh) * 2016-12-31 2017-05-17 中国科学技术大学 一种基于排放源强相似性的机动车尾气遥测设备布点方法
CN108133295A (zh) * 2018-01-11 2018-06-08 安徽优思天成智能科技有限公司 一种针对目标路段的机动车尾气浓度连续时间预测方法
CN110135466A (zh) * 2019-04-23 2019-08-16 中国科学技术大学 一种污染物排放超标车辆判断方法及系统
CN110175719A (zh) * 2019-05-30 2019-08-27 中国科学技术大学 通过尾气数据空间插值实现尾气排放估计及预警的方法
CN110503139A (zh) * 2019-08-07 2019-11-26 中国科学技术大学 一种城市区域尾气污染预测方法
CN111142501A (zh) * 2019-12-27 2020-05-12 浙江科技学院 基于半监督自回归动态隐变量模型的故障检测方法
CN112613652A (zh) * 2020-12-17 2021-04-06 东南大学 一种服务于低碳道路交通规划的道路网碳排放估算方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴鹏等: "车辆排放对大气污染的模糊监测及神经预测模型", 《交通科技与经济》 *
康宇 等: "A Novel Location Strategy for Minimizing Monitors", 《TRANSACTIONS ON SYSTEMS》 *
李兵兵: "城市道路机动车低空污染排放影响研究", 《安徽科技》 *

Also Published As

Publication number Publication date
CN113222217B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN110633353B (zh) 一种基于集成学习的船舶类型仿冒监测方法
CN111539454B (zh) 一种基于元学习的车辆轨迹聚类方法及系统
CN111832225A (zh) 一种构建汽车行驶工况的方法
CN111024898B (zh) 一种基于CatBoost模型的车辆尾气浓度超标判别方法
CN110796270A (zh) 一种机器学习模型选择方法
CN113139594B (zh) 一种机载图像无人机目标自适应检测方法
CN113435471A (zh) 深度特征聚类的高排放移动源污染识别方法及系统
CN113591948B (zh) 一种缺陷模式识别方法、装置、电子设备和存储介质
CN115544919B (zh) 一种气流体污染物排放源的溯源方法及装置
CN114677362A (zh) 基于改进YOLOv5的表面缺陷检测方法
CN116608861A (zh) 一种船舶航迹行为异常检测方法、系统、装置及存储介质
Yu et al. Foreign objects identification of transmission line based on improved YOLOv7
CN112949735A (zh) 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法
CN113781483B (zh) 工业产品外观缺陷检测方法和装置
US20130268242A1 (en) Sparse Representation for Dynamic Sensor Networks
CN113222217B (zh) 基于离散排放标签的柴油车排放连续值预测方法及系统
CN116805045B (zh) 气象预测模型修正方法、装置、设备及可读存储介质
CN115907079B (zh) 一种基于注意力时空图卷积网络的空域交通流量预测方法
CN110222793A (zh) 基于多视角主动学习的在线半监督分类方法及系统
CN118378972B (zh) 网络货运油品抵扣信息监管方法及系统
CN116246128B (zh) 跨数据集的检测模型的训练方法、装置及电子设备
Rawat et al. Car Detection and Recognition using Deep Learning Techniques
Zhang et al. Atedlw: Intelligent detection of abnormal trajectory in ship data service system
CN115082404A (zh) 一种针对超声b显数据的钢轨伤损识别方法
Chang et al. UAV Vehicle Detection System Based on YOLOv8

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant