CN113222217A - 基于离散排放标签的柴油车排放连续值预测方法及系统 - Google Patents
基于离散排放标签的柴油车排放连续值预测方法及系统 Download PDFInfo
- Publication number
- CN113222217A CN113222217A CN202110406754.7A CN202110406754A CN113222217A CN 113222217 A CN113222217 A CN 113222217A CN 202110406754 A CN202110406754 A CN 202110406754A CN 113222217 A CN113222217 A CN 113222217A
- Authority
- CN
- China
- Prior art keywords
- emission
- label
- sample
- diesel vehicle
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 58
- 239000011159 matrix material Substances 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 15
- 238000007689 inspection Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 3
- 239000000463 material Substances 0.000 abstract description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 20
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000004215 Carbon black (E152) Substances 0.000 description 10
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 10
- 229910002091 carbon monoxide Inorganic materials 0.000 description 10
- 229930195733 hydrocarbon Natural products 0.000 description 10
- 150000002430 hydrocarbons Chemical class 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 6
- 239000003344 environmental pollutant Substances 0.000 description 5
- 231100000719 pollutant Toxicity 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000003915 air pollution Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的一种基于离散排放标签的柴油车排放连续值预测方法及系统包括以下步骤,生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。本发明是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。
Description
技术领域
本发明涉及交通物流网络中尾气排放监测技术领域,具体涉及一种基于离散排放标签的柴油车排放连续值预测方法及系统。
背景技术
随着我国经济的飞速发展,人们的生活水平显著提高,机动车辆的普及和保有量持续增加,使得机动车排放污染成为大气污染的主要来源之一。其中,以柴油车为代表的移动污染源严重影响着空气质量,引起社会的广泛关注。针对这一情况,开展柴油车排放的监督检测以及排放等级评估具有十分重要的意义。
柴油车排放检测主要依据道路遥感监测设备的检测结果,当一辆柴油车通过遥感监测设备时,可以得到包含一氧化碳(CO),碳氢化物(HC),一氧化氮(NO)的浓度值等遥感检测数据。然而,遥感监测设备位置固定,难以获取柴油车在不同运行工况下的排放情况,且覆盖区域较小。除此之外,传统的柴油车排放标准则大都依据车辆检测机构的检测结果(即离线车检)判定是否为正常排放,消耗大量的人力和时间,且车辆接受离线车检的频率极低,难以获得所有在路柴油车辆近期在检测机构中的检测结果,多数在路柴油车为正常排放的可信度较低。
发明内容
本发明提出的一种基于离散排放标签的柴油车排放连续值预测方法及系统,能够有效的预测柴油车污染物排放情况,并判定其排放等级。
为实现上述目的,本发明采用了以下技术方案:
一种基于离散排放标签的柴油车排放连续值预测方法,包括以下步骤
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
进一步的,所述生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据具体包括,
根据便携式排放测量系统的获取到的信息,构建系统输入样本,包括:
柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length);车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP);
环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为样本标签y∈{1,...,c}为离线车检的柴油车排放级别;
假设共有总的样本Ψ条,遵循7:3的准则分开训练集和测试集,记训练集样本数据有n条,测试集样本有Ω条,且有标签的数据全部归于训练集,记训练集中有标签的样本集为其中,yi∈{1,...,c}为xi对应的标签;无标签的样本集记作其中,训练集总的样本数量为n=l+u,l为有标签样本的数量,u为无标签样本的数量。
进一步的,根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签,具体包括,
通过标签获取方法,训练集中的无标签样本被赋予计算得到的标签,定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算;
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
其中,xa,xb∈Xn,表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当时,wad=1,wab=0,b≠d,为最优解;
所以,wab用于测定顶点xb与顶点xa的相似程度,且wab≠wba,进而,推断出:
其中,表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值通过以下n个标准二次规划问题来求解:
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取;
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
进而,
其中I为n阶单位矩阵,显然,{Ht}收敛于H*,
进一步的,所述根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级,具体包括,
首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量包含便携式排放测量系统测得的第k个样本的信息,为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1,yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级;
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
其中,为模型参数在第r次迭代中的估计值,F(·)和f(·)分别为正态分布的分布函数和概率密度函数,O(·)为指示函数,当满足条件时,结果为1,否则为0;根据得到的模型参数估计值即可计算测试集柴油车的排放值。
预测模型更新为:
参数估计算法更新为:
另一方面,本发明的一种基于离散排放标签的柴油车排放连续值预测系统,还包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
第三方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
由上述技术方案可知,本发明的基于离散排放标签的柴油车排放连续值预测方法及系统,是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。
附图说明
图1为本发明构建方法的流程示意图;
图2为本发明系统框架图;
图3为本发明标签获取的流程图;
图4为本发明连续值预测的模型结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例所述的基于离散排放标签的柴油车排放连续值预测方法,包括:
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
具体如下:
1、样本构建:
根据便携式排放测量系统的信息,构建系统输入样本,由柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length),车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP)与环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为样本标签y∈{1,...,c}为离线车检的柴油车排放级别,由于离线车检的频率较低,且距车检时间越远,检测结果越不可信,因此只有部分柴油车辆样本有对应的离散标签即近期离线车检结果。假设共有总的样本Ψ条,遵循7:3的准则分开训练集和测试集,记训练集样本数据有n条,测试集样本有Ω条,且有标签的数据全部归于训练集,记训练集中有标签的样本集为其中,yi∈{1,...,c}为xi对应的标签;无标签的样本集记作其中,训练集总的样本数量为n=l+u,l为有标签样本的数量,u为无标签样本的数量。
2、基于图的标签获取:
通过标签获取方法,训练集中的无标签样本可以被赋予计算得到的标签,此处定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算。
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
其中,xa,xb∈Xn,表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当时,wad=1,wab=0,b≠d,为最优解。所以,wab可以测定顶点xb与顶点xa的相似程度,另外需要注意的一点是wab≠wba。进而,可以推断出:
其中,表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值可以通过以下n个标准二次规划问题来求解:
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取。已知y∈{1,...,c},定义是非负实数n×c阶矩阵的集合,是Yn进行“one-hot”编码后得到的n×c阶矩阵,如果xa的标签为j(1≤j≤c),则否则对于无标签样本预设(1≤j≤c)。定义任意矩阵对应于样本集Xn的标签,则样本点xa的设定标签为ya=argmaxj≤cHaj,因此,H也可以看作为获取样本点设定标签的函数,即Ha对应于xa的标签获取结果。
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
进而,
其中I为n阶单位矩阵,显然,{Ht}收敛于H*,
3、连续值预测方法:
在训练样本集有标签的基础上,设计算法对测试集柴油车排放值进行预测,即预测CO、HC或NO等污染物排放值。在数据采集和处理过程中不可避免会出现一些误差,因此随机噪声的加入是必要的,根据中心极限定理,假设噪声服从正态分布,均值为0,方差为σ2。因此,首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量包含便携式排放测量系统测得的第k个样本的信息,为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1。yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级。
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
其中,为模型参数在第r次迭代中的估计值,F(·)和f(·)分别为正态分布的分布函数和概率密度函数,O(·)为指示函数,当满足条件时,结果为1,否则为0。根据得到的模型参数估计值即可计算测试集柴油车的排放值:
预测模型更新为:
参数估计算法更新为:
以下,举例说明:
1、数据准备:
使用柴油车95辆,其中30辆有近期车辆检测机构的检测结果,包含高排放车12辆,正常排放车18辆,利用便携式排放测量系统对所有的柴油车进行排放检测,设置每辆车取用样本数据100条左右。由于在不同的运行工况下柴油车的排放情况具有明显差异,因此,为了保证样本数据的多样性,所选取50条数据应尽量代表不同运行状态下的排放检测结果。最终,共获得10823条样本,包括有车检结果(即有标签)的样本数据3179条,没有标签的样本数据7644条。将10823条样本按照7:3的规则分为训练集和测试集,并保证有标签数据全部属于训练集,此时训练集包含有标签数据3179条,无标签数据4397条。
2、数据预处理:
样本的每一个特征都具有特定的物理意义,且有着不同的数量级,为了避免数据形式对系统模型建立的影响,将所有样本的同一种特征进行归一化处理,将值归一化到[0,1]之间,完成所有10维特征值的归一化处理。除此之外,根据离线车检结果设置有标签数据的离散标签,其中高排放柴油车设置为2,正常排放柴油车设置为1。
3、标签获取:
利用标签获取方法,获取训练集中无标签样本的“设定标签”,根据每个顶点的邻域信息构建无向图G=(V,E),利用其邻近顶点的线性组合实现最优构建,最终得到边权重的稀疏矩阵W。
预设置训练集中无标签样本的标签为0,有标签样本的标签保持原值,在此基础上对训练集的标签向量进行“one-hot”编码,得到一个n×c阶的标签矩阵定义矩阵对应于训练样本集的标签,根据已得到的G和W,完成迭代过程来实现无标签样本设定标签的获取,在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息。最终得到无标签样本数据所对应的设定标签进而,此时训练集中所有的样本均被设为有标签的样本数据Xn=Xl∪Xu,Yn=Yl∪Yu。
4、连续值预测:
按照阈值θ未知的预测模型构建方法,在特征向量的第11维增加全1列数据,此时样本特征更新为xk=[xk1,xk2,...,xkd,-1]T。首先在训练集中执行参数估计迭代算法,计算模型参数和阈值的估计值和之后根据参数估计结果计算柴油车对应测试集样本数据的运行工况下CO、HC或NO的排放值k=1,2,...,Ω。与此同时,根据CO、HC或NO的排放值和估计得到的阈值θ,最终得到柴油车的排放等级,即为高排放车辆还是正常排放情况。
由上可知,本发明的基于离散排放标签的柴油车排放连续值预测方法,能够有效的预测柴油车污染物排放情况,并判定其排放等级;本发明是首次基于离散排放标签实现柴油车排放连续值预测的问题,并且能够同时实现对柴油车排放等级的评估,解决了标签不足的问题,大大节省了车辆检测机构的人力物力。
另一方面,本发明的一种基于离散排放标签的柴油车排放连续值预测系统,还包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
第三方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种基于离散排放标签的柴油车排放连续值预测方法,其特征在于,包括以下步骤,
生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
2.根据权利要求1所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:所述生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据具体包括,
根据便携式排放测量系统的获取到的信息,构建系统输入样本,包括:
柴油车自身特性:使用时间(UseYear)、车辆基重(BaseWeight)、车身长度(Length);车辆运行情况:速度(Speed)、加速度(Acc)、比功率(VSP);环境因素:风速(WindSpeed)、温度(Temperature)、湿度(Humidity)、气压(Pressure)组成10维样本特征向量,记为样本标签y∈{1,...,c}为离线车检的柴油车排放级别;
3.根据权利要求2所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签,具体包括,
通过标签获取方法,训练集中的无标签样本被赋予计算得到的标签,定义为“设定标签”,获取标签后的无标签样本均可作为有标签样本参与后续计算;
对于给定的训练样本集Xn=Xl∪Xu,利用每个顶点的邻域信息构建G=(V,E),样本点表示为无向图中的顶点,假设所有的邻域信息都是线性的,即每个顶点都能够利用其邻近顶点的线性组合实现最优构建,进而,无向图构建的目标更新为最小化如下公式:
其中,xa,xb∈Xn,表示xa的邻域顶点集合,wab表示顶点xb对顶点xa的影响,进一步有约束wab≥0,很明显,顶点xb和顶点xa越相似,wab越大,当时,wad=1,wab=0,b≠d,为最优解;
所以,wab用于测定顶点xb与顶点xa的相似程度,且wab≠wba,进而,推断出:
其中,表示局部格拉姆矩阵(Ga)bd=(xa-xb)T(xa-xb)为关于顶点xa的第(b,d)项,通常(·)bd即表示一个矩阵的第(b,d)项,因此,对应于每个样本的权值通过以下n个标准二次规划问题来求解:
根据上述构建的无向图G及W,将使用一个迭代过程来实现无标签样本设定标签的获取;
在迭代中,每个样本点从其邻域“吸收”一部分标签信息,并保留其初始状态的一些标签信息,在t+1次迭代中xa的标签为:
进而,
其中I为n阶单位矩阵,显然,{Ht}收敛于H*,
4.根据权利要求3所述的基于离散排放标签的柴油车排放连续值预测方法,其特征在于:所述根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级,具体包括,
首先利用训练集数据建立预测模型,假设柴油车排放是样本输入数据即样本特征与随机噪声的线性组合:
其中,d,n为特征维度和样本个数,qk为第k个样本的噪声,特征向量包含便携式排放测量系统测得的第k个样本的信息,为需要估计的模型参数,sk为柴油车排放连续值结果,即反映第k个样本的排放值,θ为阈值,Z(·)为指示函数,当sk≥θ时,值为2;当sk<θ时,值为1,yk为模型输出,表示第k个要预测的样本的排放等级,yk=2表示该柴油车为高排放等级,yk=1表示为正常排放等级;
在已知训练集特征向量{xk,k=1,2,...,n}和柴油车排放等级{yk,k=1,2,...,n}的情况下,设计基于极大似然估计的参数估计迭代算法:
6.一种基于离散排放标签的柴油车排放连续值预测系统,其特征在于,包括以下单元,
数据预处理单元,用于生成柴油车排放检测系统的样本数据,对样本数据进行预处理,并生成预处理数据;
设定标签生成单元,用于根据训练集样本数据构建无向图并得到边权重稀疏矩阵,利用标签获取算法,生成训练集中无标签样本的设定标签;
预测单元,用于根据连续值预测方法估计系统参数及相关阈值,基于结果计算柴油车CO、HC或NO的排放值及判定柴油车排放等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406754.7A CN113222217B (zh) | 2021-04-15 | 2021-04-15 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406754.7A CN113222217B (zh) | 2021-04-15 | 2021-04-15 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113222217A true CN113222217A (zh) | 2021-08-06 |
CN113222217B CN113222217B (zh) | 2022-02-25 |
Family
ID=77087407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110406754.7A Active CN113222217B (zh) | 2021-04-15 | 2021-04-15 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222217B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120278270A1 (en) * | 2011-04-28 | 2012-11-01 | International Business Machines Corporation | Selecting solution for carbon emission prediction |
EP2797041A1 (en) * | 2013-04-26 | 2014-10-29 | Università Del Salento - Dipartimento Di Ingegneria Dell'Innovazione | Method for estimating pollutant concentration of urban environments using fluid-dynamics clustering |
CN106650826A (zh) * | 2016-12-31 | 2017-05-10 | 中国科学技术大学 | 一种多车道水平式尾气遥测设备数据处理方法 |
CN106683024A (zh) * | 2016-12-31 | 2017-05-17 | 中国科学技术大学 | 一种基于排放源强相似性的机动车尾气遥测设备布点方法 |
CN108133295A (zh) * | 2018-01-11 | 2018-06-08 | 安徽优思天成智能科技有限公司 | 一种针对目标路段的机动车尾气浓度连续时间预测方法 |
CN110135466A (zh) * | 2019-04-23 | 2019-08-16 | 中国科学技术大学 | 一种污染物排放超标车辆判断方法及系统 |
CN110175719A (zh) * | 2019-05-30 | 2019-08-27 | 中国科学技术大学 | 通过尾气数据空间插值实现尾气排放估计及预警的方法 |
CN110503139A (zh) * | 2019-08-07 | 2019-11-26 | 中国科学技术大学 | 一种城市区域尾气污染预测方法 |
CN111142501A (zh) * | 2019-12-27 | 2020-05-12 | 浙江科技学院 | 基于半监督自回归动态隐变量模型的故障检测方法 |
CN112613652A (zh) * | 2020-12-17 | 2021-04-06 | 东南大学 | 一种服务于低碳道路交通规划的道路网碳排放估算方法 |
-
2021
- 2021-04-15 CN CN202110406754.7A patent/CN113222217B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120278270A1 (en) * | 2011-04-28 | 2012-11-01 | International Business Machines Corporation | Selecting solution for carbon emission prediction |
EP2797041A1 (en) * | 2013-04-26 | 2014-10-29 | Università Del Salento - Dipartimento Di Ingegneria Dell'Innovazione | Method for estimating pollutant concentration of urban environments using fluid-dynamics clustering |
CN106650826A (zh) * | 2016-12-31 | 2017-05-10 | 中国科学技术大学 | 一种多车道水平式尾气遥测设备数据处理方法 |
CN106683024A (zh) * | 2016-12-31 | 2017-05-17 | 中国科学技术大学 | 一种基于排放源强相似性的机动车尾气遥测设备布点方法 |
CN108133295A (zh) * | 2018-01-11 | 2018-06-08 | 安徽优思天成智能科技有限公司 | 一种针对目标路段的机动车尾气浓度连续时间预测方法 |
CN110135466A (zh) * | 2019-04-23 | 2019-08-16 | 中国科学技术大学 | 一种污染物排放超标车辆判断方法及系统 |
CN110175719A (zh) * | 2019-05-30 | 2019-08-27 | 中国科学技术大学 | 通过尾气数据空间插值实现尾气排放估计及预警的方法 |
CN110503139A (zh) * | 2019-08-07 | 2019-11-26 | 中国科学技术大学 | 一种城市区域尾气污染预测方法 |
CN111142501A (zh) * | 2019-12-27 | 2020-05-12 | 浙江科技学院 | 基于半监督自回归动态隐变量模型的故障检测方法 |
CN112613652A (zh) * | 2020-12-17 | 2021-04-06 | 东南大学 | 一种服务于低碳道路交通规划的道路网碳排放估算方法 |
Non-Patent Citations (3)
Title |
---|
吴鹏等: "车辆排放对大气污染的模糊监测及神经预测模型", 《交通科技与经济》 * |
康宇 等: "A Novel Location Strategy for Minimizing Monitors", 《TRANSACTIONS ON SYSTEMS》 * |
李兵兵: "城市道路机动车低空污染排放影响研究", 《安徽科技》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113222217B (zh) | 2022-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633353B (zh) | 一种基于集成学习的船舶类型仿冒监测方法 | |
CN111539454B (zh) | 一种基于元学习的车辆轨迹聚类方法及系统 | |
CN111832225A (zh) | 一种构建汽车行驶工况的方法 | |
CN111024898B (zh) | 一种基于CatBoost模型的车辆尾气浓度超标判别方法 | |
CN110796270A (zh) | 一种机器学习模型选择方法 | |
CN113139594B (zh) | 一种机载图像无人机目标自适应检测方法 | |
CN113435471A (zh) | 深度特征聚类的高排放移动源污染识别方法及系统 | |
CN113591948B (zh) | 一种缺陷模式识别方法、装置、电子设备和存储介质 | |
CN115544919B (zh) | 一种气流体污染物排放源的溯源方法及装置 | |
CN114677362A (zh) | 基于改进YOLOv5的表面缺陷检测方法 | |
CN116608861A (zh) | 一种船舶航迹行为异常检测方法、系统、装置及存储介质 | |
Yu et al. | Foreign objects identification of transmission line based on improved YOLOv7 | |
CN112949735A (zh) | 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法 | |
CN113781483B (zh) | 工业产品外观缺陷检测方法和装置 | |
US20130268242A1 (en) | Sparse Representation for Dynamic Sensor Networks | |
CN113222217B (zh) | 基于离散排放标签的柴油车排放连续值预测方法及系统 | |
CN116805045B (zh) | 气象预测模型修正方法、装置、设备及可读存储介质 | |
CN115907079B (zh) | 一种基于注意力时空图卷积网络的空域交通流量预测方法 | |
CN110222793A (zh) | 基于多视角主动学习的在线半监督分类方法及系统 | |
CN118378972B (zh) | 网络货运油品抵扣信息监管方法及系统 | |
CN116246128B (zh) | 跨数据集的检测模型的训练方法、装置及电子设备 | |
Rawat et al. | Car Detection and Recognition using Deep Learning Techniques | |
Zhang et al. | Atedlw: Intelligent detection of abnormal trajectory in ship data service system | |
CN115082404A (zh) | 一种针对超声b显数据的钢轨伤损识别方法 | |
Chang et al. | UAV Vehicle Detection System Based on YOLOv8 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |