CN107992454B - 一种基于在线顺序回归的空气质量等级预测方法 - Google Patents

一种基于在线顺序回归的空气质量等级预测方法 Download PDF

Info

Publication number
CN107992454B
CN107992454B CN201711419856.2A CN201711419856A CN107992454B CN 107992454 B CN107992454 B CN 107992454B CN 201711419856 A CN201711419856 A CN 201711419856A CN 107992454 B CN107992454 B CN 107992454B
Authority
CN
China
Prior art keywords
air quality
formula
sample
nth iteration
grade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711419856.2A
Other languages
English (en)
Other versions
CN107992454A (zh
Inventor
程凡
章霞
张闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN201711419856.2A priority Critical patent/CN107992454B/zh
Publication of CN107992454A publication Critical patent/CN107992454A/zh
Application granted granted Critical
Publication of CN107992454B publication Critical patent/CN107992454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于在线顺序回归的空气质量等级预测方法,包括:步骤1、输入空气监测历史数据;步骤2、对所述的空气质量样本数据进行预处理;步骤3:训练在线顺序回归空气质量等级预测模型;步骤4:输入待预测空气质量样本数据;步骤5:对所述待预测空气质量样本数据进行预处理;步骤6:通过在线顺序回归模型预测空气质量等级。本发明适用环境检测技术领域,能够高效、准确的从空气质量历史数据训练出预测模型进行空气质量等级预测,有效改善空气质量、合理的进行空气环境质量预测、预警。

Description

一种基于在线顺序回归的空气质量等级预测方法
技术领域
本发明涉及环境预测技术领域,尤其涉及一种基于在线顺序回归的空气质量等级预测方法。
背景技术
空气是人类赖以生存的不可或缺的物质,环境空气质量和人们的日常生活息息相关,同时也在居民居住环境综合评价占有重要地位,但随着工业化和城镇化的推进以及私人车辆的持续增加,空气质量持续恶化,大气污染日益严重,雾霾天气严重影响了人们的工作和生活。如何改善空气质量、合理的进行空气环境质量预测预警变得越来越重要。
传统的基于分类的空气质量预测方法在实际实现中需要将所有训练数据调入内存处理,庞大的数据量和有限的应用环境成为传统分类学习方法的主要制约因素。时至今日,历史空气质量数据的数据量已经积累庞大到不可忽视的地步,传统的基于分类的空气质量预测方法已经不能满足庞大的历史空气质量数据的处理需求。
同时传统的基于分类的空气质量预测方法对于空气质量仅仅回答了‘好’或者‘不好’,不能满足进一步对空气质量分类的需求;其次,空气质量等级数据在时间和空间上分布不平衡,如何有效识别其中较少的空气质量等级数据显得极为重要,传统的基于分类的方法没有考虑到该分布不平衡问题,其性能具有较大的局限性。
发明内容
本发明为克服现有技术的不足之处,提出一种基于在线顺序回归的空气质量预测方法,以期能高效、准确的从空气质量历史数据训练出预测模型进行空气质量等级预测,有效改善空气质量、合理的进行空气环境质量预测、预警。
为了达到上述目的,本发明采用的技术方案为:
本发明一种基于在线顺序回归的空气质量等级预测方法的特点是按如下步骤进行:
步骤一:在线顺序回归的空气质量等级预测模型训练
步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,记为
Figure GDA0002671734800000011
Figure GDA0002671734800000012
表示第t个空气质量样本中第i个空气质量指标,t=1,2,…,T;令所述第t个空气质量样本的等级记为yt,且yt∈{1,2,…,h},yt=1时,表示最高等级,当yt=h时,表示最低等级;
步骤1.2:对所述第t个空气质量样本的质量指标xt进行标准化处理,得到第t个空气质量样本的特征向量
Figure GDA0002671734800000021
并与所述第t个空气质量样本的等级yt构成第t个样本空间(x′t,yt),从而得到T个空气质量样本的样本空间,记为
Figure GDA0002671734800000022
步骤1.3:定义当前迭代次数为n,最大迭代次数为N;并初始化n=1;
步骤1.4:输入空气质量训练样本(x′n,yn);x′n为第n次迭代时输入的第n个空气质量样本的特征向量;yn表示第n次迭代时输入的第n个空气质量样本的等级;
利用式(1)更新第n次迭代时等级为yn的空气质量样本的一阶统计信息
Figure GDA0002671734800000023
Figure GDA0002671734800000024
式(1)中,当n=1时,
Figure GDA0002671734800000025
为d维零向量;
利用式(2)更新第n次迭代时等级为yn的空气质量样本的二阶统计信息
Figure GDA0002671734800000026
Figure GDA0002671734800000027
式(2)中,当n=1时,
Figure GDA0002671734800000028
为d×d维零向量;(x′n)T表示x′n的转置;
步骤1.5:判断yn=1是否成立,若成立,则执行步骤1.6-步骤1.7;否则,判断yn=h是否成立,若成立,则执行步骤1.10-步骤1.15,否则执行步骤1.8-步骤1.9;
步骤1.6:利用式(3)定义空气质量等级预测模型第n次迭代的经验损失函数L(wn):
Figure GDA0002671734800000029
式(3)中,λ为常量;wn为空气质量等级预测模型权值向量,
Figure GDA00026717348000000210
为wn的转置,当n=1时,wn为d维零向量;
Figure GDA00026717348000000211
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为2;
Figure GDA00026717348000000212
表示第n次迭代时空气质量等级为2的空气质量样本统计个数;
步骤1.7:利用式(4)更新第n次迭代的梯度gn后,执行步骤1.12-步骤1.15:
Figure GDA00026717348000000213
式(4)中,
Figure GDA0002671734800000031
表示第n次迭代时等级为2的空气质量样本的一阶统计信息;
Figure GDA0002671734800000032
表示第n次迭代时等级为2的空气质量样本的二阶统计信息;
步骤1.8:利用式(5)定义空气质量等级预测模型第n次迭代的损失函数L(wn):
Figure GDA0002671734800000033
式(5)中,
Figure GDA0002671734800000034
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn-1;
Figure GDA0002671734800000035
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn+1;
Figure GDA0002671734800000036
分别表示第n次迭代时空气质量等级为yn-1,yn+1的空气质量样本的统计个数;
步骤1.9:利用式(6)更新第n次迭代的梯度gn后,执行步骤1.12-步骤1.15:
Figure GDA0002671734800000037
式(6)中,
Figure GDA0002671734800000038
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的一阶统计信息;
Figure GDA0002671734800000039
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的二阶统计信息;
步骤1.10:利用式(7)定义空气质量等级预测模型第n次迭代的损失函数L′(wn):
Figure GDA00026717348000000310
式(7)中,
Figure GDA00026717348000000311
表示第n次迭代的前n-1个空气质量样本中第i个空气质量样本的等级为n-1;
Figure GDA00026717348000000312
表示第n次迭代时空气质量等级为h-1的空气质量样本统计个数。
步骤1.11:利用式(8)更新第n次迭代的梯度gn
Figure GDA00026717348000000313
式(8)中,
Figure GDA00026717348000000314
表示第n次迭代时等级为h-1的空气质量样本的一阶统计信息;
Figure GDA00026717348000000315
表示第n次迭代时等级为h-1的空气质量样本的二阶统计信息;
步骤1.12:利用式(9)得到第n次迭代时梯度一阶动量无偏估计
Figure GDA0002671734800000041
Figure GDA0002671734800000042
式(9)中,
Figure GDA0002671734800000043
为常量β1的n次方,mn为第n次迭代时有偏梯度一阶动量估计,并由式(10)中获得:
mn=β1mn-1+(1-β1)·gn (10)
式(10)中,当n=1时,mn-1为d维零向量;
步骤1.13:利用式(11)得到梯度二阶动量无偏估计
Figure GDA0002671734800000044
Figure GDA0002671734800000045
式(11)中,
Figure GDA0002671734800000046
为常量β2的n次方,vn为第n次迭代时有偏梯度二阶动量估计,并由式(12)中获得:
Figure GDA0002671734800000047
式(12)中,当n=1时,vn-1为d维零向量;
步骤1.14:利用式(13)更新第n次迭代的权值向量wn+1
Figure GDA0002671734800000048
式(13)中,α,γ为常量;
步骤1.15、令n+1赋值给n,并判断n>N是否成立,若成立,则表示获得最优权值向量wN+1作为预测模型,并执行步骤二,否则,返回步骤1.4执行;
步骤二:空气质量等级预测:
步骤2.1:获取待预测的空气质量数据的d个空气质量指标并进行标准化处理后得到待测样本x,
步骤2.2:利用式(14)得到所述待测样本x的决策函数值f(x):
f(x)=x(wN+1)T (14)
步骤2.3:根据等级集合{1,2,…,h},得到所述决策函数值f(x)所属的等级即为所述待测样本x的空气质量等级。
与已有技术相比,本发明的有益效果体现在:
1、本发明不同于传统基于分类的空气质量等级预测方法,提出一种基于在线顺序回归的空气质量等级预测方法,通过d个空气质量预测指标,利用收敛更快速的方法在线处理分布不平衡的空气质量数据,训练空气质量等级预测模型,实现了高效、准确的空气质量等级预测。
2、本发明在训练样本数据过程中,采用在线训练的方式,每次训练只采用样本集中的一个空气质量样本数据,通过保存空气质量样本数据特征向量的一阶统计信息和二阶统计信息来计算单个样本梯度信息,有效避免了传统学习面临的数据量和应用环境限制的问题。
3、本发明在训练在线顺序回归空气质量等级预测模型过程中,采取直接优化AUC(Area Under Curve)指标来定义损失函数,能够很好的度量不平衡数据处理的整体性能,从而克服了传统分类算法不能有效解决空气质量等级数据在时间和空间上分布不平衡的问题,使训练出的分类模型优于传统分类模型,从而提高了异常空气质量等级预测性能和准确率。
4、本发明基于在线顺序回归进行空气质量等级预测,将目标问题分解为更细致的多等级排序问题。本发明将空气质量等级预测为优、良、轻度污染、中度污染、重度污染和严重污染6个等级,进一步满足对空气质量分类的需求。
5、本发明在梯度更新的过程中使用了自适应梯度更新,该梯度尽可能提取出历史梯度信息以及历史梯度二阶信息,分析历史梯度间的关联,保证了构建出的梯度方向更加科学合理。使模型参数训练过程更加迅速,提高了模型训练收敛速度。
附图说明
图1为空气质量等级分布示意图;
图2为本发明实施例提供的预测空气质量方法的流程示意图;
图3为本发明实施例提供的基于在线顺序回归模型训练算法流程示意图。
具体实施方式
本实施例中,一种基于在线顺序回归的空气质量等级预测方法包括在线顺序回归的空气质量等级预测模型训练步骤和空气质量等级预测步骤,具体的说,如图2所示,是按如下步骤进行:
步骤一:如图3所示,在线顺序回归的空气质量等级预测模型训练
步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,本发明中利用的指标主要有记录时间、单位一氧化碳浓度、单位一氧化氮浓度、单位二氧化氮浓度、PT08.S2、PT08.S3、PT08.S3、温度、相对湿度、绝对湿度等,记为
Figure GDA0002671734800000061
Figure GDA0002671734800000062
表示第t个空气质量样本中第i个空气质量指标,t=1,2,…,T;令所述第t个空气质量样本的等级记为yt,且yt∈{1,2,…,h},yt=1时,表示最高等级,当yt=h时,表示最低等级,本发明将空气质量等级预测问题转化为多等级顺序回归问题,本发明利用6分类顺序回归模型,如图1所示;
步骤1.2:对所述第t个空气质量样本的质量指标xt进行标准化处理,将属性特征转换为分类器处理的数据格式,并对数据做适当的归一化,减小模型训练的计算复杂度,得到第t个空气质量样本的特征向量
Figure GDA0002671734800000063
并与所述第t个空气质量样本的等级yt构成第t个样本空间(xt′,yt),从而得到T个空气质量样本的样本空间,记为
Figure GDA0002671734800000064
步骤1.3:定义当前迭代次数为n,最大迭代次数为N;并初始化n=1;通过N次迭代,每次迭代从样本空间取一个空气质量样本进行模型训练,使高等级空气质量样本决策函数值高于低等级空气质量样本决策函数值,得到最优模型权值向量wN+1
步骤1.4:输入空气质量训练样本(x′n,yn);x′n为第n次迭代时输入的第n个空气质量样本的特征向量;yn表示第n次迭代时输入的第n个空气质量样本的等级;
利用式(1)更新第n次迭代时等级为yn的空气质量样本的一阶统计信息
Figure GDA0002671734800000065
Figure GDA0002671734800000066
式(1)中,当n=1时,
Figure GDA0002671734800000067
为d维零向量;
利用式(2)更新第n次迭代时等级为yn的空气质量样本的二阶统计信息
Figure GDA0002671734800000068
Figure GDA0002671734800000069
式(2)中,当n=1时,
Figure GDA00026717348000000610
为d×d维零向量;(x′n)T表示x′n的转置;
步骤1.5:判断yn=1是否成立,若成立,则执行步骤1.6-步骤1.7;否则,判断yn=h是否成立,若成立,则执行步骤1.10-步骤1.15,否则执行步骤1.8-步骤1.9;
步骤1.6:利用式(3)定义空气质量等级预测模型第n次迭代的经验损失函数L(wn),目标损失函数以AUC为直接优化目标,通过梯度方法得到最优模型wN,以解决空气质量数据在时间空间分布不平衡的问题:
Figure GDA0002671734800000071
式(3)中,λ为常量;wn为空气质量等级预测模型权值向量,
Figure GDA0002671734800000072
为wn的转置,当n=1时,wn为d维零向量;
Figure GDA0002671734800000073
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为2;
Figure GDA0002671734800000074
表示第n次迭代时空气质量等级为2的空气质量样本统计个数。
步骤1.7:利用式(4)更新第n次迭代的梯度gn,对式(3)求导得到梯度gn,以梯度下降方法迭代寻找最优预测模型,同时通过保存空气质量样本的一阶统计信息和二阶统计信息达到在线训练的目的。再执行步骤1.12-步骤1.15:
Figure GDA0002671734800000075
式(4)中,
Figure GDA0002671734800000076
表示第n次迭代时等级为2的空气质量样本的一阶统计信息;
Figure GDA0002671734800000077
表示第n次迭代时等级为2的空气质量样本的二阶统计信息;
步骤1.8:利用式(5)定义空气质量等级预测模型第n次迭代的损失函数L(wn):
Figure GDA0002671734800000078
式(5)中,
Figure GDA0002671734800000079
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn-1;
Figure GDA00026717348000000710
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn+1;
Figure GDA00026717348000000711
分别表示第n次迭代时空气质量等级为yn-1,yn+1的空气质量样本的统计个数;
步骤1.9:利用式(6)更新第n次迭代的梯度gn后,执行步骤1.12-步骤1.15:
Figure GDA00026717348000000712
式(6)中,
Figure GDA0002671734800000081
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的一阶统计信息;
Figure GDA0002671734800000082
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的二阶统计信息;
步骤1.10:利用式(7)定义空气质量等级预测模型第n次迭代的损失函数L′(wn):
Figure GDA0002671734800000083
式(7)中,
Figure GDA0002671734800000084
表示第n次迭代的前n-1个空气质量样本中第i个空气质量样本的等级为n-1;
Figure GDA0002671734800000085
表示第n次迭代时空气质量等级为h-1的空气质量样本统计个数。
步骤1.11:利用式(8)更新第n次迭代的梯度gn
Figure GDA0002671734800000086
式(8)中,
Figure GDA0002671734800000087
表示第n次迭代时等级为h-1的空气质量样本的一阶统计信息;
Figure GDA0002671734800000088
表示第n次迭代时等级为h-1的空气质量样本的二阶统计信息;
步骤1.12:利用式(9)得到第n次迭代时梯度一阶动量无偏估计
Figure GDA0002671734800000089
通过自适应动量法保存当前梯度平方信息vn和历史梯度信息mn,尽可能提取出历史梯度的相关信息,分析历史梯度间的关联,保证构建出的梯度更加科学合理。使用Adam方法得到的梯度在更新预测模型wN的性能更加突出,能够有效提高收敛速度、有效跳出局部最优。同时在自适应梯度方法上,也可以使用AdaGrad方法也能达到类似的效果,但在本发明中经比较Adam方法更优:
Figure GDA00026717348000000810
式(9)中,
Figure GDA00026717348000000811
为常量β1的n次方,mn为第n次迭代时有偏梯度一阶动量估计,并由式(10)中获得:
mn=β1mn-1+(1-β1)·gn (10)
式(10)中,当n=1时,mn-1为d维零向量;
步骤1.13:利用式(11)得到梯度二阶动量无偏估计
Figure GDA00026717348000000812
Figure GDA0002671734800000091
式(11)中,
Figure GDA0002671734800000092
为常量β2的n次方,vn为第n次迭代时有偏梯度二阶动量估计,并由式(12)中获得:
Figure GDA0002671734800000093
式(12)中,当n=1时,vn-1为d维零向量;
步骤1.14:利用式(13)更新第n次迭代的权值向量wn+1
Figure GDA0002671734800000094
式(13)中,α,γ为常量;
步骤1.15、令n+1赋值给n,并判断n>N是否成立,若成立,则表示获得最优权值向量wN+1作为预测模型,并执行步骤二,否则,返回步骤1.4执行;
步骤二:空气质量等级预测,利用步骤一得到的最优空气质量等级预测模型以及相应的待测空气质量样本进行空气质量等级预测:
步骤2.1:获取待预测的空气质量数据的d个空气质量指标并进行标准化处理后得到待测样本x,
步骤2.2:利用式(14)得到所述待测样本x的决策函数值f(x):
f(x)=x(wN+1)T (14)
步骤2.3:根据等级集合{1,2,…,h},得到所述决策函数值f(x)所属的等级即为所述待测样本x的空气质量等级。
通过仿真数据集的例子来说明本发明的具体实施方法和验证本发明方法的效果:
1)、准备标准数据集
本发明使用空气质量数据集Airquality作为真实数据集验证空气质量等级预测方法的有效性,同时使用标准数据集wine,auto,abalone验证其性能。在Airquality数据集中,包含29358条真实空气质量数据,每条数据包含15个空气质量指标。我们使用全部样本来验证本发明对于空气质量等级预测的性能。训练样本被划分为训练样本和测试样本数据,通过五折交叉验证选取出最佳的模型参数;
2)、评价指标
采用AUC作为本实例的评价指标,用来评测在标准数据集上本发明对于空气质量等级预测的性能。AUC值越高,表示等级预测效果越好。
3)、在标准数据集上进行实验
为了验证本发明所提方法的有效性,本发明在数据集wine,auto,abalone上进行建模预测,并记录其AUC值与耗用时间;
表1实验结果
Figure GDA0002671734800000101
从表1可以看出,在不同的数据集中,本发明提出的空气质量等级预测方法均能获得很好的精度和较低的时间,继而体现出本发明的有效性。

Claims (1)

1.一种基于在线顺序回归的空气质量等级预测方法,其特征是按如下步骤进行:
步骤一:在线顺序回归的空气质量等级预测模型训练
步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,记为
Figure FDA0002671734790000011
Figure FDA0002671734790000012
表示第t个空气质量样本中第i个空气质量指标,t=1,2,…,T;令所述第t个空气质量样本的等级记为yt,且yt∈{1,2,…,h},yt=1时,表示最高等级,当yt=h时,表示最低等级;
步骤1.2:对所述第t个空气质量样本的质量指标xt进行标准化处理,得到第t个空气质量样本的特征向量
Figure FDA0002671734790000013
并与所述第t个空气质量样本的等级yt构成第t个样本空间(
Figure DEST_PATH_IMAGE002
,yt),从而得到T个空气质量样本的样本空间,记为
Figure FDA0002671734790000014
步骤1.3:定义当前迭代次数为n,最大迭代次数为N;并初始化n=1;
步骤1.4:输入空气质量训练样本(
Figure DEST_PATH_IMAGE004
,yn);
Figure DEST_PATH_IMAGE004
为第n次迭代时输入的第n个空气质量样本的特征向量;yn表示第n次迭代时输入的第n个空气质量样本的等级;
利用式(1)更新第n次迭代时等级为yn的空气质量样本的一阶统计信息
Figure FDA0002671734790000015
Figure FDA0002671734790000016
式(1)中,当n=1时,
Figure FDA0002671734790000017
为d维零向量;
利用式(2)更新第n次迭代时等级为yn的空气质量样本的二阶统计信息
Figure FDA0002671734790000018
Figure FDA0002671734790000019
式(2)中,当n=1时,
Figure FDA00026717347900000110
为d×d维零向量;(
Figure 130215DEST_PATH_IMAGE004
)T表示
Figure 781776DEST_PATH_IMAGE004
的转置;
步骤1.5:判断yn=1是否成立,若成立,则执行步骤1.6-步骤1.7;否则,判断yn=h是否成立,若成立,则执行步骤1.10-步骤1.15,否则执行步骤1.8-步骤1.9;
步骤1.6:利用式(3)定义空气质量等级预测模型第n次迭代的经验损失函数L(wn):
Figure FDA00026717347900000111
式(3)中,λ为常量;wn为空气质量等级预测模型权值向量,
Figure FDA0002671734790000021
为wn的转置,当n=1时,wn为d维零向量;
Figure FDA0002671734790000022
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为2;
Figure FDA0002671734790000023
表示第n次迭代时空气质量等级为2的空气质量样本统计个数;
步骤1.7:利用式(4)更新第n次迭代的梯度gn后,执行步骤1.12-步骤1.15:
Figure FDA0002671734790000024
式(4)中,
Figure FDA0002671734790000025
表示第n次迭代时等级为2的空气质量样本的一阶统计信息;
Figure FDA0002671734790000026
表示第n次迭代时等级为2的空气质量样本的二阶统计信息;
步骤1.8:利用式(5)定义空气质量等级预测模型第n次迭代的损失函数L(wn):
Figure FDA0002671734790000027
式(5)中,
Figure FDA0002671734790000028
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn-1;
Figure FDA0002671734790000029
表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本的等级为yn+1;
Figure FDA00026717347900000210
分别表示第n次迭代时空气质量等级为yn-1,yn+1的空气质量样本的统计个数;
步骤1.9:利用式(6)更新第n次迭代的梯度gn后,执行步骤1.12-步骤1.15:
Figure FDA00026717347900000211
式(6)中,
Figure FDA00026717347900000212
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的一阶统计信息;
Figure FDA00026717347900000213
分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的二阶统计信息;
步骤1.10:利用式(7)定义空气质量等级预测模型第n次迭代的损失函数
Figure 768643DEST_PATH_IMAGE002
Figure FDA00026717347900000214
式(7)中,
Figure FDA00026717347900000215
表示第n次迭代的前n-1个空气质量样本中第i个空气质量样本的等级为n-1;
Figure FDA00026717347900000216
表示第n次迭代时空气质量等级为h-1的空气质量样本统计个数;
步骤1.11:利用式(8)更新第n次迭代的梯度gn
Figure FDA0002671734790000031
式(8)中,
Figure FDA0002671734790000032
表示第n次迭代时等级为h-1的空气质量样本的一阶统计信息;
Figure FDA0002671734790000033
表示第n次迭代时等级为h-1的空气质量样本的二阶统计信息;
步骤1.12:利用式(9)得到第n次迭代时梯度一阶动量无偏估计
Figure FDA0002671734790000034
Figure FDA0002671734790000035
式(9)中,
Figure FDA0002671734790000036
为常量
Figure 889045DEST_PATH_IMAGE004
的n次方,mn为第n次迭代时有偏梯度一阶动量估计,并由式(10)中获得:
Figure DEST_PATH_IMAGE006
(10)
式(10)中,当n=1时,mn-1为d维零向量;
步骤1.13:利用式(11)得到梯度二阶动量无偏估计
Figure FDA0002671734790000037
Figure FDA0002671734790000038
式(11)中,
Figure FDA0002671734790000039
为常量
Figure DEST_PATH_IMAGE008
的n次方,vn为第n次迭代时有偏梯度二阶动量估计,并由式(12)中获得:
Figure FDA00026717347900000310
式(12)中,当n=1时,vn-1为d维零向量;
步骤1.14:利用式(13)更新第n次迭代的权值向量wn+1
Figure FDA00026717347900000311
式(13)中,α,γ为常量;
步骤1.15、令n+1赋值给n,并判断n>N是否成立,若成立,则表示获得最优权值向量wN+1作为预测模型,并执行步骤二,否则,返回步骤1.4执行;
步骤二:空气质量等级预测:
步骤2.1:获取待预测的空气质量数据的d个空气质量指标并进行标准化处理后得到待测样本x,
步骤2.2:利用式(14)得到所述待测样本x的决策函数值f(x):
f(x)=x(wN+1)T (14)
步骤2.3:根据等级集合{1,2,…,h},得到所述决策函数值f(x)所属的等级即为所述待测样本x的空气质量等级。
CN201711419856.2A 2017-12-25 2017-12-25 一种基于在线顺序回归的空气质量等级预测方法 Active CN107992454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711419856.2A CN107992454B (zh) 2017-12-25 2017-12-25 一种基于在线顺序回归的空气质量等级预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711419856.2A CN107992454B (zh) 2017-12-25 2017-12-25 一种基于在线顺序回归的空气质量等级预测方法

Publications (2)

Publication Number Publication Date
CN107992454A CN107992454A (zh) 2018-05-04
CN107992454B true CN107992454B (zh) 2020-11-17

Family

ID=62042435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711419856.2A Active CN107992454B (zh) 2017-12-25 2017-12-25 一种基于在线顺序回归的空气质量等级预测方法

Country Status (1)

Country Link
CN (1) CN107992454B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271374B (zh) * 2018-10-19 2021-01-26 国网江苏省电力有限公司信息通信分公司 一种基于机器学习的数据库健康度打分方法和打分系统
CN109377440B (zh) * 2018-12-06 2022-04-12 北京工业大学 一种基于多任务集成学习器的pm2.5和o3浓度协同预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002063539A1 (en) * 2001-02-08 2002-08-15 Aeroqual Limited Air quality monitoring system
CN104850734A (zh) * 2015-04-21 2015-08-19 武大吉奥信息技术有限公司 一种基于时空分布特征的空气质量指数预测方法
CN105488316A (zh) * 2014-09-17 2016-04-13 日本电气株式会社 用于预测空气质量的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002063539A1 (en) * 2001-02-08 2002-08-15 Aeroqual Limited Air quality monitoring system
CN105488316A (zh) * 2014-09-17 2016-04-13 日本电气株式会社 用于预测空气质量的系统和方法
CN104850734A (zh) * 2015-04-21 2015-08-19 武大吉奥信息技术有限公司 一种基于时空分布特征的空气质量指数预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Regression analysis and urban air quality forecasting for the city of Athens;Th.Slini et al.;《GlobalNEST International Journal》;20020228;第153-162页 *
一种新型直接优化NDCG的排序模型构造算法;程凡 等;《中国科学技术大学学报》;20130131;第43卷(第1期);第65-72页 *
哈夫曼树SVM在空气质量等级分类中的应用;王琛 等;《智能计算机与应用》;20160228;第6卷(第1期);第64-67页 *
有序多分类回归模型及其在判断空气质量等级方面的应用;李壁涛 等;《中国优秀硕士学位论文全文数据库基础科学辑》;20150815(第08期);第A002-174页 *

Also Published As

Publication number Publication date
CN107992454A (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN109389238B (zh) 一种基于岭回归的短期负荷预测方法及装置
CN107992454B (zh) 一种基于在线顺序回归的空气质量等级预测方法
CN108334943A (zh) 基于主动学习神经网络模型的工业过程半监督软测量建模方法
CN106156805A (zh) 一种样本标签缺失数据的分类器训练方法
CN113326960A (zh) 基于粒子群算法优化lstm的地铁牵引能耗预测方法
CN105787259A (zh) 一种多元气象因素对负荷变化影响相关性的分析方法
CN115511100A (zh) 一种基于环境温度相关数据学习的空调负荷回归预测方法
CN114692677A (zh) 一种基于多目标特征选择的焊接缺陷识别方法
CN113281229A (zh) 一种基于小样本下多模型自适应大气pm2.5浓度预测方法
CN117933497B (zh) 一种基于tsa-arima-cnn的企业碳排放预测方法
CN115096357A (zh) 一种基于ceemdan-pca-lstm的室内环境质量预测方法
CN114970675A (zh) 基于特征选择的人工鼻冰箱食物新鲜度检测系统和方法
CN107451684A (zh) 基于核随机逼近的股市概率预测方法
CN113223634B (zh) 基于二维自注意力增强gru模型高炉铁水硅含量预测方法
CN110163437B (zh) 基于DPK-means的日前光伏发电功率预测方法
CN109697630B (zh) 一种基于稀疏回归的商家客流量多因素分析与预测方法
CN111178383A (zh) 一种基于多核支持向量机的电池单体品质分类方法
CN113035363A (zh) 一种概率密度加权的遗传代谢病筛查数据混合采样方法
CN105956688A (zh) 大气中碳浓度和温度的变化趋势预测方法及装置
Torres et al. Efficiency and Reliability Enhancement of High Pressure Die Casting Process Through a Digital Twin.
CN117113291B (zh) 一种半导体制造中生产参数重要性的分析方法
CN116451582B (zh) 基于机器学习融合模型的火灾热释放速率测量系统和方法
CN112257015B (zh) 一种火电机组数据获取方法、系统及数据处理方法
CN111079973A (zh) 一种基于改进粒子群优化svm的空气质量预测算法
CN109934503A (zh) 一种互联网环境下的金融市场风险预警方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant