CN114638358A - 消光系数转颗粒物浓度方法、设备以及计算机存储介质 - Google Patents

消光系数转颗粒物浓度方法、设备以及计算机存储介质 Download PDF

Info

Publication number
CN114638358A
CN114638358A CN202210302505.8A CN202210302505A CN114638358A CN 114638358 A CN114638358 A CN 114638358A CN 202210302505 A CN202210302505 A CN 202210302505A CN 114638358 A CN114638358 A CN 114638358A
Authority
CN
China
Prior art keywords
data
neural network
concentration
value
particulate matter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210302505.8A
Other languages
English (en)
Inventor
刘诚
雒晋谊
李启华
张治国
邢成志
谈伟
刘浩然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202210302505.8A priority Critical patent/CN114638358A/zh
Publication of CN114638358A publication Critical patent/CN114638358A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了消光系数转颗粒物浓度方法、设备以及计算机存储介质,该方法包括:利用超光谱大气遥感技术获取区域站点消光系数,NO2,SO2和H2O的廓线数据;利用大气化学和气象耦合模型模拟获得温度,气压和风速,通过国家环境空气监测获得PM10质量浓度;将温度,气压与H2O数据结合,计算得到相对湿度的垂直分布;对获取得到的大气数据的缺失值和特殊值进行处理,并进行最大值‑最小值归一化,得到反向传播神经网络输入数据;将输入数据输入至已训练好的反向传播神经网络中,得到PM2.5质量浓度结果,其中,反向传播神经网络包含输入层,一个隐含层和输出层。通过把输入数据输入到已训练好的反向传播神经网络中计算得到PM2.5质量浓度,实现更精准的转换。

Description

消光系数转颗粒物浓度方法、设备以及计算机存储介质
技术领域
本发明涉及空气质量检测领域,尤其涉及消光系数转颗粒物浓度方法、设备以及计算机存储介质。
背景技术
随着人们生活水平日益提高以及全民健康意识的不断提高,空气的质量检测被逐渐重视起来,尤其是对PM2.5浓度的检测,PM2.5是指直径小于2.5μm的气溶胶粒子,又称细颗粒物,是雾霾的重要组成部分,由于其粒径与质量都很小,在空气中停留时间较长,对能见度和人体健康方面有着严重的影响。
目前也有使用转换技术来获得站点的PM2.5浓度,主要是需要长时间对站点进行观测,从而通过人为去寻找到与PM2.5的对应关系,进行反演之后得到PM2.5的浓度,一旦站点进行变化,就需要重新花费时间进行观测,同时在寻找对应关系的时候会存在对应关系误差,导致转换出来的PM2.5浓度不准确。
需要说明的是,上述内容仅用于辅助理解本发明所解决的技术问题,并不代表承认上述内容是相关技术。
发明内容
本申请实施例通过提供一种消光系数转颗粒物浓度方法,解决了在相关PM2.5转换技术中,当站点变换的时候,需要重新寻找与PM2.5的对应关系才能检测出PM2.5的浓度,检测出来的PM2.5浓度不准确的问题,使用神经网络设计出当站点变换也能检测出PM2.5浓度的通用模型,提高了检测PM2.5浓度的准确性。
为实现上述目的,本发明提出的消光系数转颗粒物浓度方法,所述消光系数转颗粒物浓度方法的步骤包括:
获取站点大气数据值作为待输入数据;
将所述待输入数据进行数据预处理,得到预处理数据;
将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。
可选地,对检测颗粒物浓度有影响的大气数据值包括:消光系数、二氧化氮、二氧化硫、相对湿度、温度、气压、风速和可吸入颗粒物浓度。
可选地,所述将所述待输入数据输入至已训练好的反向传播神经网络中,得到所述待检测站点的颗粒物浓度结果的步骤之前,还包括:
获取所述待测站点以往的历史大气数据值;
将所述历史大气数据值按照时间点分组,建立训练样本数据集;
对所述训练样本数据集进行归一化处理,得到预处理样本数据集;
将所述预处理样本集输入到反向传播神经网络中进行训练。
可选地,所述将所述预处理样本集输入到反向传播神经网络中进行训练的步骤包括:
获取所述待测站点的期望颗粒物浓度值;
根据所述预处理样本集和期望颗粒物浓度值,确定所述反向传播神经网络中的隐含层神经元个数;
根据所述隐含层神经元个数和预处理样本集对反向传播神经网络进行训练。
可选地,所述根据所述隐含层神经元个数和预处理样本集对反向传播神经网络进行训练的步骤包括:
获取反向传播神经网络中各层神经元之间的连接权重值;
由所述连接权重值和神经元激活函数计算出输出层的输出量,其中所述输出量是颗粒物浓度;
计算出所述输出量和期望颗粒物浓度值之间的误差;
判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练。
可选地,所述判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练的步骤包括:
若所述误差达到预设训练目标且当前训练样本是最后一组样本数据,则训练完成反向传播神经网络;
若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值,循环执行由所述连接权重值和神经元激活函数计算出输出层的输出量,其中所述输出量是颗粒物浓度的步骤,到判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练的步骤,直到训练次数等于预设训练次数且误差达到预设训练目标。
可选地,所述若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值的步骤包括:
获取总样本数据数量;
根据所述颗粒物浓度值、历史颗粒物浓度值和总样本数据数量,使用列文伯格-马夸尔特算法计算得到所述误差梯度;
根据所述误差梯度来修正神经元之间的连接权值和阈值。
可选地,所述将所述待输入数据进行归一化处理,得到预处理数据的步骤包括:
将所述待输入数据按照时间点进行分组,得到多个样本数据;
遍历所述多个样本数据中的每个待输入数据,获取所述多个样本数据中每个待输入数据;
获取所述多个样本数据中每个待输入数据的最大值和最小值;
采用最大值-最小值归一算法计算所述待输入数据、最大值和最小值,得所述待输入数据对应的归一预处理数据。
此外,为实现上述目的,本发明还提供了一种消光系数转颗粒物浓度设备,所述消光系数转颗粒物浓度设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的消光系数转颗粒物浓度程序,所述消光系数转颗粒物浓度程序被所述处理器执行时实现如上所述的消光系数转颗粒物浓度方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有消光系数转颗粒物浓度程序,所述消光系数转颗粒物浓度程序被处理器执行时实现如上所述的消光系数转颗粒物浓度方法的步骤。
本发明公开了消光系数转颗粒物浓度方法、设备以及计算机存储介质,该方法包括:获取站点大气数据值作为待输入数据;将所述待输入数据进行数据预处理,得到预处理数据;将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。本发明是通过获取到站点的大气数据值作为待输入数据,对获取到的待输入数据进行归一化处理,把数据放缩,得到一个较小的数据,之后再把这个数据输入到之前已训练好的反向传播神经网络模型中,根据之前训练反向神经网络模型中确定好的各层神经元之间的权值和输入进来的数据加权求和得到反向传播神经网络模型中隐含层的输出量,同样的,根据隐含层的输出量和隐含层与输出层之间神经元的权值加权求和计算得到输出层的输出量,把得到的输出量经过输出层的激活函数和反归一化运算之后得到站点的PM2.5浓度,进行反归一化处理是因为数据在输入到反向神经网络模型中之前,进行过归一化处理,对数据进行放缩,所以计算出来的数据是一个比较小的数据,与实际的PM2.5浓度值有所出入,需要进行反归一化处理,得到的数据值才是实际中的PM2.5浓度,即使变换站点,只要获取该站点的大气数据值输入到反向传播神经网络模型中,反向传播神经网络模型就会经过加权求和激活函数以及反归一化处理计算得出该站点的PM2.5浓度,提高了检测PM2.5浓度的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明消光系数转颗粒物浓度方法第一实施例的流程示意图;
图3为本发明消光系数转颗粒物浓度方法第一实施例中步骤S200的细化流程示意图;
图4为本发明消光系数转颗粒物浓度方法第二实施例中步骤S300之前的细化流程示意图;
图5为本发明消光系数转颗粒物浓度方法第二实施例中步骤S700的细化流程示意图;
图6为本发明消光系数转颗粒物浓度方法第三实施例中步骤S720的细化流程示意图;
图7是BP神经网络结构图;
图8是BP神经网络模型的训练流程图;
图9是北京市通过神经网络模型转换得到的PM2.5与消光系数,实际观测值的时序图;
图10是合肥市通过神经网络模型转换得到的PM2.5与消光系数,实际观测值的时序图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本申请要解决的技术问题是在相关转换PM2.5浓度技术中,需要长时间观测寻找与PM2.5的对应关系,从而反演出PM2.5质量浓度,一旦站点发现变换,之前的对应关系就不能使用,需要重新观测寻找对应关系,才能得到PM2.5的浓度,寻找对应关系中会存在误差现象,得到的PM2.5浓度不准确的问题,本发明针对这一技术问题所采用的技术手段是使用反向传播神经网络模型把获取到的大气数据值经过反向传播神经网络模型的计算之后得到与实际的PM2.5浓度很接近的数值,是通过获取到站点的大气数据值作为待输入数据,对获取到的待输入数据进行归一化处理,把数据放缩,得到一个较小的数据,之后再把这个数据输入到之前已训练好的反向传播神经网络模型中,根据之前训练反向神经网络模型中确定好的各层神经元之间的权值和输入进来的数据加权求和得到反向传播神经网络模型中隐含层的输出量,同样的,根据隐含层的输出量和隐含层与输出层之间神经元的权值加权求和计算得到输出层的输出量,把得到的输出量经过输出层的激活函数和反归一化运算之后得到站点的PM2.5浓度,进行反归一化处理是因为数据在输入到反向神经网络模型中之前,进行过归一化处理,对数据进行放缩,所以计算出来的数据是一个比较小的数据,与实际的PM2.5浓度值有所出入,需要进行反归一化处理,得到的数据值才是实际中的PM2.5浓度,即使变换站点,只要获取该站点的大气数据值输入到反向传播神经网络模型中,反向传播神经网络模型就会经过加权求和激活函数以及反归一化处理计算得出该站点的PM2.5浓度,提高了检测PM2.5浓度的准确性。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
如图1所示,图1为本申请实施例方案涉及的硬件运行环境的终端设备结构示意图。
如图1所示,该终端设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括消光系数转颗粒物浓度程序。
在图1所示的终端设备中,网络接口1004主要用于与后台服务器进行数据通信;用户接口1003主要用于与客户端(用户端)进行数据通信;处理器1001可以用于调用存储器1005中消光系数转颗粒物浓度程序,并执行以下操作:
获取站点大气数据值作为待输入数据;
将所述待输入数据进行数据预处理,得到预处理数据;
将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。
本申请提供了一种颗粒物浓度检测方法,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。为便于理解本发明的整体控制逻辑顺序,请参考图8,图8为本发明的反向传播神经网络模型的训练流程图。
参照图2,图2为本申请消光系数转颗粒物浓度方法第一实施例的流程示意图。
本实施例消光系数转颗粒物浓度方法,包括以下步骤:
步骤S100,获取站点大气数据值作为待输入数据;
步骤S200,将所述待输入数据进行数据预处理,得到预处理数据;
步骤S300,将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。
在本实施例中,消光系数转颗粒物浓度方法主要是用在BP神经网络中,用于检测各个站点PM2.5的质量浓度,当要检测某个站点的PM2.5质量浓度时,就可以直接使用已经训练好的神经网络模型去转换,这里的执行主体是这个转换系统。在这一整个过程中,获取大气数据值是基础值,只有获取到能够影响PM2.5质量浓度的大气数据值,才能够进一步通过神经网络模型得到站点PM2.5质量浓度,训练模型是核心,只有把模型训练出来,输入大气数据值之后才能够得到PM2.5质量浓度,可以参考图9和图10,分别代表的是不同地区通过神经网络模型转换得到的PM2.5浓度与实际观测数值的图。
以下是对颗粒物浓度,也就是PM2.5浓度的具体实现过程:
在本实施例中,当要检测某个站点的PM2.5质量浓度时,需要先获取该站点的大气数据值,大气数据值是影响PM2.5浓度的重要因素,不同的大气数据值得到的PM2.5浓度是不一样的,并且在获取大气数据值时,要获取不同时间段的大气数据值,大气数据值不是保持不变的,是随时波动着的,可能不同时刻得到的大气数据值不一样,这样得到的PM2.5浓度就不一样,获取不同时间段的大气数据值,得到的PM2.5浓度也是对应时间段内的PM2.5浓度。在这里获取大气数据值,也就是获取PM10来计算PM2.5浓度的。但是不能把获取到的数据直接输入到BP神经网络模型中,因为数据比较大,所以需要对数据进行预处理,才能输入到模型中。
在获取到大气数据值之后,需要对大气数据值进行预处理,在数据的采集和上传的过程中可能会受到设备故障以及外在环境等因素的影响,造成数据的确实、错误以及不一致等情况出现,会使数据整体的可用性大大降低,从而导致最终得到PM2.5浓度不准确,所以需要对数据进行预处理。在所数据进行预处理的过程中,先采用期望值最大法对无效数据、缺失数据和异常数据进行处理之后,因为获取大气数据值的单位以及量级是不一样的,还需要对大气数据值进行标准化操作,把数据同一到较小的区间内,从而提高模型的运算效率和加快模型的收敛速率。
在更进一步的实施例中,参照图3,S200步骤包括:
步骤S210,将所述待输入数据按照时间点进行分组,得到多个样本数据;
步骤S220,遍历所述多个样本数据中的每个待输入数据,获取所述多个样本数据中每个待输入数据;
步骤S230,获取所述多个样本数据中每个待输入数据的最大值和最小值;
步骤S240,采用最大值-最小值归一算法计算所述待输入数据、最大值和最小值,得所述待输入数据对应的归一预处理数据。
获取到的大气数据值是包含不同时间点的数据值,所以按照时间点来对这些大气数据值进行分组,得到多个数据集,每个数据集中都有八个数据,遍历所有数据集中的每个数据,若是要输入某个数据集,就需要对这个数据集中的每个数据进行预处理,获取这个数据集中每个数据的数值,然后在获取这个数据在所有数据集中的最大值和最小值,采用最大值-最小值归一化算法对这个数据进行标准化处理,把数据映射到[0,1]的范围内。最大值-最小值归一化算法顾名思义就是使用该数据的最大值和最小值对该数据进行放缩,归一到某个较小区间内。把数据归一到[0,1]的范围内之后,即可以报数据输入到BP神经模型中计算PM2.5浓度了。
把处理好的数据输入到反向传播神经网络模型中,这个反向传播神经网络是之前就训练好的,可以直接把站点进行归一化处理之后的数据输入,反向神经网络模型在接收到该数据时,会自动根据之前就已确定下来各层神经元之间的连接权值和输入的数据进行计算,首先是根据输入层与隐含层之间的连接权值和输入层的各神经元数值通过加权求和计算得到隐含层的输出量,再根据隐含层的输出量与隐含层和输出层的连接权值通过加权求和得到输出层的输出量,输出量是一个在[0,1]区间内的数据,不符合实际的PM2.5浓度,所以需要对输出量进行反归一化处理,得到的最终数据才是实际的PM2.5浓度。若是站点发生变换,只需要重新获取站点的大气数据值,把数据输入值已经训练好的反向传播神经网络模型中,反向传播神经网络模型会自动根据输入的数据,经过运算得到对应站点的PM2.5浓度。反向传播(Back Propagation)神经网络是一种按误差反向传播训练的多层前馈网络,它里面的算法成为BP算法,算法的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。
本实施例公开了消光系数转颗粒物浓度方法,该方法包括:获取站点大气数据值作为待输入数据;将所述待输入数据进行数据预处理,得到预处理数据;将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。本发明是通过获取到站点的大气数据值作为待输入数据,对获取到的待输入数据进行归一化处理,把数据放缩,得到一个较小的数据,之后再把这个数据输入到之前已训练好的反向传播神经网络模型中,根据之前训练反向神经网络模型中确定好的各层神经元之间的权值和输入进来的数据加权求和得到反向传播神经网络模型中隐含层的输出量,同样的,根据隐含层的输出量和隐含层与输出层之间神经元的权值加权求和计算得到输出层的输出量,把得到的输出量经过输出层的激活函数和反归一化运算之后得到站点的PM2.5浓度,进行反归一化处理是因为数据在输入到反向神经网络模型中之前,进行过归一化处理,对数据进行放缩,所以计算出来的数据是一个比较小的数据,与实际的PM2.5浓度值有所出入,需要进行反归一化处理,得到的数据值才是实际中的PM2.5浓度,即使变换站点,只要获取该站点的大气数据值输入到反向传播神经网络模型中,反向传播神经网络模型就会经过加权求和激活函数以及反归一化处理计算得出该站点的PM2.5浓度,提高了检测PM2.5浓度的准确性。
进一步地,参考图4,基于上述第一实施例,提出本申请消光系数转颗粒物浓度方法第二实例。
步骤S300之前,还包括:
步骤S400,获取所述站点以往的历史大气数据值和历史期望颗粒物浓度值;
步骤S500,将所述历史大气数据值按照时间点分组,建立训练样本数据集;
步骤S600,采用最大值-最小值归一化算法对所述训练样本数据集进行预处理,得到处理训练样本数据集;
步骤S700,根据所述处理训练样本数据集和历史期望颗粒物浓度值,训练反向传播神经网络。
在使用BP神经网络模型对站点进行PM2.5浓度之前,需要对BP神经网络进行训练,以确保检测出来的PM2.5浓度贴近实际的PM2.5浓度,能够精准的得到PM2.5浓度。需要获取该站点以往的历史大气数据集和历史期望颗粒物浓度值,历史期望颗粒物浓度值可以通过国家环境空气监测网中获得,历史大气数据值首先是通过超光谱大气遥感仪器获取消光系数廓线、二氧化氮廓线、二氧化硫廓线和水的浓度,再利用大气化学和气象耦合模拟出BP神经网络模型所需要的温度、气压、风速和可吸入颗粒物质量浓度廓线,通过获取到的温度和气压廓线与水的浓度结合,计算得到相对湿度的垂直分布,获取到这些数据,需要把获取到的这些数据进行分类。
获取到数据是非常多的,并且考虑到数据是分不同时间段的,有时间序列信息的,所以将得到的数据按照小时均值分为多个训练样本数据集,分组完成之后,还需要对训练样本数据中的每个数据进行预处理,直接获取得到的数据值是非常大的,需要把这些样本数据进行放缩到[0,1]的区间范围内,放缩对这些样本数据进行放缩是为了减少BP神经网络训练的时长,同时也是为了提高BP神经网络模型的运算效率。同样也是采用最大值-最小值归一化方法将样本数据中的每个数据进行归一化处理,同一映射到[0,1]到范围内,使用到的转换函数是x*=(x-min)/(max-min),其中x*为归一化后的结果,x为归一化之前的数据,是样本数据中某个数据的数据值,max是样本数据最大值,也就是某个数据在所有训练样本数据中这个数据的最大值,min是样本数据最小值,也就是某个数据在所有训练样本数据中这个数据的最小值。
把所有样本数据中每个数据都进行归一化操作完,根据所归一化之后的样本数据和历史期望颗粒物浓度值开始构造BP神经网络模型,构建完成之后就开始训练BP神经网络模型。BP神经网络模型的结构包括:输入层、多个隐含层和输出层,但是这里的BP神经网络模型的网络结构包括:输入层、一个隐含层和输出层,参考图7,图7是BP神经网络结构图。开始训练BP神经网络网络模型还需要知道各层的神经元个数,才能根据神经元之间的来训练BP神经网络模型。
在更进一步的实施例中,参照图5,步骤S700包括:
步骤S710,根据所述处理训练样本数据集和历史期望颗粒物浓度值,确定所述BP神经网络中的隐含层神经元个数;
步骤S720,根据所述隐含层神经元个数、处理训练样本数据集和历史期望颗粒物浓度值,训练反向传播神经网络。
本实施例是基于上述实施例,即将要训练的BP神经网路模型的网络结构是包括:输入层、一个隐含层和输出层,每个样本数据集中都包括八个数据值,这八个数据值就是输入量,是输入到输入层中的,所以也就是输入层的神经元,输入多少个数据,输入层就有多少个神经元,输出层是为了得到PM2.5浓度的,最终输出层就只有一个神经元,其中就只有隐含层是不知道神经元个数,可以通过输入层神经元个数和输出层的神经元个数来计算出隐含层的神经元个数,根据公式
Figure BDA0003566054410000111
其中n、a、b分别代表隐含层、输入层和输出层神经元个数,c是0到10之间的任意数值,利用上述公式得到隐含层的神经元个数在[3,13]之间,要确定最终的隐含层神经元个数,可以采用平均绝对误差和均方误差来评估最优的隐含层神经元个数,从而确定最终的隐含层神经元个数。按照0到10依次给c赋值,给c赋的值不一样,每次都会得到不一样隐含层神经元个数,从而计算出来的PM2.5浓度也就不一样,采用平均绝对误差或者是均方误差来计算这个误差在不在0.1范围内,如果在,隐含层当前的神经元个数是最优个数。平均绝对误差和均方根误差的具体公式:
平均绝对误差:
Figure BDA0003566054410000112
其中xi为PM2.5质量浓度真实值yi为PM2.5质量浓度预测值,n为样本数据个数。
均方根误差:
Figure BDA0003566054410000113
其中xi为PM2.5质量浓度真实值,yi为PM2.5质量浓度预测值,n为样本数据个数。
计算出隐含层神经元个数之后,BP神经网络模型就已经构建好,可以把样本数据输入到已经构建好的BP神经网络模型中,开始对BP神经网络模型的训练,但是在训练之前需要确定好训练次数、训练完成之后需要达到训练目标、以及学习率,这些数据是判断训练模型有没有达标,若是达标就证明这次训练是成功的,可以用这个训练好的模型去检测PM2.5浓度,若是没有达标需要重新训练。
在本实施例中,使用BP神经网络模型对站点PM2.5的质量浓度进行检测时,需要对BP神经网络模型进行训练,以保证计算出来得到的PM2.5质量浓度是准确的,同时也可以保证站点发生切换的时候,同样可以使用该训练好的模型进行PM2.5的质量浓度的检测,实现BP神经网络模型的通用性。
进一步地,参照图6,基于上述第一实施例和第二实施例中的任一实施例,提出本申请消光系数转颗粒物浓度方法的第三实施例。
步骤S720包括:
步骤S721,获取反向传播神经网络中各层神经元之间的连接权值;
步骤S722,由所述连接权重值和神经元激活函数计算出输出层的输出量,其中所述输出量是颗粒物浓度;
步骤S723,计算出所述输出量和历史期望颗粒物浓度值之间的误差;
步骤S724,判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练。
在本实施例中,先获取BP神经网络模型中各层神经元之间连接权值,刚开始的连接权值是初始化的,可以在[0,1]之间随意取值,没有要求,但是一轮训练完之后,若是输出得到PM2.5质量浓度没有满足预设训练目标,就需要根据误差来修正各层神经元之间的连接权值,不断修正以得到最优连接权值,得到PM2.5质量浓度。
获取到最初设置的连接权值,先计算输入层到隐含层的输出量,也就是输入层到隐含层节点进行加权求和,比如:输入层的第一个神经元为0.3,第二个神经元为0.8,输入层第一个神经元到隐含层第一个神经元的权值为0.2,第二神经元到隐含层第一个神经元的权值为0.5,加权求和就是:0.3*0.2+0.8*0.5+b,其中b是阈值,可以任意取值,没有要求,把得到的结果放入到激活函数中计算得到隐含层第一神经元的数值,隐含层到输出层也是同样的算法,最终得到PM2.5的质量浓度。
根据计算出来的PM2.5浓度和在国家空气质量监测网上获取到的PM2.5浓度进行误差计算,判断这个误差有没有达到预设的训练目标,若是计算出来的误差值没有达到训练目标,需要对神经元之间的连接权值进行修正,若是误差值达到或者接近于预设训练目标,就完成BP神经网络模型的训练。
在进一步的实施例中,步骤S724包括:
若所述误差达到预设训练目标且当前训练样本是最后一组样本数据,则训练完成BP神经网络;
若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值,循环执行由所述连接权重值和神经元激活函数计算出输出层的输出量,其中所述输出量是颗粒物浓度的步骤,到判断所述误差是否达到预设训练目标,完成BP神经网络的训练的步骤,直到训练次数等于预设训练次数且误差达到预设训练目标。
本实施例基于上述实施例,若是计算出来的误差值达到或者接近于预设训练目标,并且是最后一组样本数据了,就可以完成BP神经网络模型的训练了,若是误差值达到预设训练目标,但是当前的样本数据不是最后一组样本数据,就需要继续执行下一组样本数据,知道样本数据全部并执行完毕,得到每组样本数据对应的PM2.5的浓度。若是误差值没有达到预设训练目标,就在原训练次数上加一,并判断训练的次数有没有等于或者大于预设训练次数,若是没有就继续执行,计算误差梯度来修正各层神经元之间的连接权值,重复执行根据新修正的权值来重新计算各层的输出量,再根据新得到的PM2.5浓度与期望地PM2.5浓度来计算误差值,只进行判断是否达到训练目标。预设训练目标这里设置为0.01,训练次数为2000。
这里需要说明的是,根据BP神经网络模型计算出PM2.5浓度,需要把PM2.5浓度进行反归一化才能与期望的PM2.5浓度进行误差计算,因为计算出来的PM2.5浓度的数值比较小,在输入到BP神经网络模型中之前,对数据进行归一化处理,将数据映射到[0,1]的区间范围内,所以在于期望PM2.5浓度进行误差计算是,必须再进行反归一化算法,得到现实中的PM2.5浓度大小,反归一化算法公式为:Outputj=xj(maxj-minj)+minj,其中,xj表示网络实际输出中第j维的数据值,minj表示网络训练时期望输出第j维数据的最小值,maxj表示网络训练时期望输出第j维数据的最大值,Outputj表示经过反归一化处理后的网络输出值。
在更进一步的实施例中,若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值的步骤包括:
获取总样本数据数量;
根据所述颗粒物浓度值、历史颗粒物浓度值和总样本数据数量,使用列文伯格-马夸尔特算法计算得到所述误差梯度;
根据所述误差梯度来修正神经元之间的连接权值和阈值。
本实施例是基于上述实施例,先获取总的样本个数,之前获取样本数据按照时间点分成多组样本数据,直接获取样本个数就行,再使用列文伯格-马夸尔特算法误差的公式来计算使用当前权值计算出来的PM2.5浓度与期望的PM2.5浓度进行比较误差梯度的计算,来修正连接权值和阈值,列文伯格-马夸尔特算法误差公式:
Figure BDA0003566054410000141
其中,yi为PM2.5质量浓度真实值,xi为PM2.5质量浓度预测值,也就是PM2.5期望浓度值,n为样本数据个数,w为权值和阈值组成的向量。若是这个列文伯格-马夸尔特算法误差不在预设值中,就需要反向传播,进一步修正连接权值和阈值。
列文伯格-马夸尔特算法是最优化算法中的一种,是使用最广泛的非线性最小二乘法算法,简称LM算法。LM算法时用模型函数对待估参数向量在其领域内做线性近似,从而转换为最小二乘问题。在本申请中,使用LM算法计算连接权值的误差梯度,从而来修正各层神经元之间的连接权值和阈值,以实现最终计算出来的PM2.5浓度值是正确的。
在本实施例中,先是获取初始化的权值,来计算PM2.5浓度,在通过计算出来的PM2.5浓度和期望的PM2.5浓度计算出两者之间的误差有没有达到本次训练的目标,若是达到就判定此次训练成功,可以使用这个模型去检测PM2.5浓度,若是没有达到训练目标,就说明模型还不行,需要继续训练,直到达到训练目标,同时在这个过程还需要不断修正各层神经元之间的连接权值,连接权值是计算PM2.5浓度的关键,连接权值时是最优时,计算出来的PM2.5浓度也是最优的。
此外,本发明实施例还提出一种计算机可读存储介质。所述计算机可读存储介质上存储有颗粒物浓度检测程序,所述颗粒物浓度检测程序被处理器执行时实现如上述任一项实施例中的颗粒物浓度检测方法的步骤。
本发明计算机可读存储介质具体实施方式与上述颗粒物浓度检测方法各实施例基本相同,在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种消光系数转颗粒物浓度方法,其特征在于,所述消光系数转颗粒物浓度方法的步骤包括:
获取站点大气数据值作为待输入数据;
将所述待输入数据进行数据预处理,得到预处理数据;
将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果,其中,根据所述预处理数据和已确定好的权值加权求和得到隐含层的输出量,通过隐含层的激活函数计算输出量得到隐含层的结果,根据隐含层的结果和隐含层到输出层的权值加权求和得到输出值,采用激活函数对输出值计算并进行反归一化处理,得到所述站点的颗粒物浓度。
2.如权利要求1所述的消光系数转颗粒物浓度方法,其特征在于,对检测颗粒物浓度有影响的大气数据值包括:消光系数、二氧化氮、二氧化硫、相对湿度、温度、气压、风速和可吸入颗粒物浓度。
3.如权利要求1所述的消光系数转颗粒物浓度方法,其特征在于,所述将所述预处理数据输入至已训练好的反向传播神经网络中,得到所述站点的颗粒物浓度结果的步骤之前,还包括:
获取所述站点以往的历史大气数据值;
将所述历史大气数据值按照时间点分组,建立训练样本数据集;
对所述训练样本数据集进行归一化处理,得到预处理样本数据集;
将所述预处理样本集输入到反向传播神经网络中进行训练。
4.如权利要求3所述的消光系数转颗粒物浓度方法,其特征在于,所述将所述待输入预处理样本集输入到反向传播神经网络中进行训练的步骤包括:
获取所述站点的期望颗粒物浓度值;
根据所述预处理样本集和期望颗粒物浓度值,确定所述反向传播神经网络中的隐含层神经元个数;
根据所述隐含层神经元个数和预处理样本集对反向传播神经网络进行训练。
5.如权利要求4所述的消光系数转颗粒物浓度方法,其特征在于,所述根据所述隐含层神经元个数和预处理样本集对反向传播神经网络进行训练的步骤包括:
获取反向传播神经网络中各层神经元之间的连接权重值;
由所述连接权重值和神经元激活函数计算出输出层的输出量,其中输出量是颗粒物浓度;
计算出所述输出量和期望颗粒物浓度值之间的误差;
判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练。
6.如权利要求5所述的消光系数转颗粒物浓度方法,其特征在于,所述判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练的步骤包括:
若所述误差达到预设训练目标且当前训练样本是最后一组样本数据,则训练完成反向传播神经网络;
若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值,循环执行由所述连接权重值和神经元激活函数计算出输出层的输出量,其中所述输出量是颗粒物浓度的步骤,到判断所述误差是否达到预设训练目标,完成反向传播神经网络的训练的步骤,直到训练次数等于预设训练次数且误差达到预设训练目标。
7.如权利要求5所述的消光系数转颗粒物浓度方法,其特征在于,所述若所述误差没有达到预设训练目标,则计算误差梯度,修正神经元之间的连接权值和阈值的步骤包括:
获取总样本数据数量;
根据所述颗粒物浓度值、历史颗粒物浓度值和总样本数据数量,使用列文伯格-马夸尔特算法计算得到所述误差梯度;
根据所述误差梯度来修正神经元之间的连接权值和阈值。
8.如权利要求1所述的消光系数转颗粒物浓度方法,其特征在于,所述将所述待输入数据进行归一化处理,得到预处理数据的步骤包括:
将所述待输入数据按照时间点进行分组,得到多个样本数据;
遍历所述多个样本数据中的每个待输入数据,获取所述多个样本数据中每个待输入数据;
获取所述多个样本数据中每个待输入数据的最大值和最小值;
采用最大值-最小值归一算法计算所述待输入数据、最大值和最小值,得所述待输入数据对应的归一预处理数据。
9.一种消光系数转颗粒物浓度设备,其特征在于,所述消光系数转颗粒物浓度设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的颗粒物浓度检测程序,所述消光系数转颗粒物浓度程序被所述处理器执行时实现如权利要求1至8中任一项所述的消光系数转颗粒物浓度方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有消光系数转颗粒物浓度程序,所述消光系数转颗粒物浓度程序被处理器执行时实现如权利要求1至8中任一项所述的消光系数转颗粒物浓度方法的步骤。
CN202210302505.8A 2022-03-25 2022-03-25 消光系数转颗粒物浓度方法、设备以及计算机存储介质 Pending CN114638358A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210302505.8A CN114638358A (zh) 2022-03-25 2022-03-25 消光系数转颗粒物浓度方法、设备以及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210302505.8A CN114638358A (zh) 2022-03-25 2022-03-25 消光系数转颗粒物浓度方法、设备以及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114638358A true CN114638358A (zh) 2022-06-17

Family

ID=81950634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210302505.8A Pending CN114638358A (zh) 2022-03-25 2022-03-25 消光系数转颗粒物浓度方法、设备以及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114638358A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115436239A (zh) * 2022-11-07 2022-12-06 四川亿欣新材料有限公司 一种碳酸钙颗粒度检测方法
CN117309195A (zh) * 2023-11-30 2023-12-29 中控技术股份有限公司 测温仪表的检测方法、装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115436239A (zh) * 2022-11-07 2022-12-06 四川亿欣新材料有限公司 一种碳酸钙颗粒度检测方法
CN117309195A (zh) * 2023-11-30 2023-12-29 中控技术股份有限公司 测温仪表的检测方法、装置及电子设备
CN117309195B (zh) * 2023-11-30 2024-04-12 中控技术股份有限公司 测温仪表的检测方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN109978228B (zh) 一种pm2.5浓度预测方法、装置及介质
Lu et al. Generalized radial basis function neural network based on an improved dynamic particle swarm optimization and AdaBoost algorithm
CN114638358A (zh) 消光系数转颗粒物浓度方法、设备以及计算机存储介质
CN111814956B (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
CN115018021A (zh) 基于图结构与异常注意力机制的机房异常检测方法及装置
CN110309537B (zh) 一种飞行器的智能健康预测方法及系统
CN110595960B (zh) 一种基于机器学习的pm2.5浓度遥感估算方法
CN116028822B (zh) 一种电能表误差状态评估方法、系统、设备及存储介质
CN111428419A (zh) 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质
CN108846200B (zh) 一种基于迭代法的准静态桥梁影响线识别方法
CN114490065A (zh) 一种负载预测方法、装置及设备
CN115841004A (zh) 基于多维数据的带钢热轧过程力学性能软测量方法及装置
CN115545334A (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN112215412A (zh) 溶解氧预测方法及装置
CN110289987B (zh) 基于表征学习的多智能体系统网络抗攻击能力评估方法
CN109187898B (zh) 水产养殖环境中水质氨氮含量的软测量方法及装置
CN116960962A (zh) 一种跨区域数据融合的中长期区域负荷预测方法
CN113761806B (zh) 一种基于神经网络的大气能见度预测方法
CN116050475A (zh) 关键污染物浓度预测模型的训练方法、装置和计算机设备
CN115510763A (zh) 一种基于数据驱动探索的空气污染物浓度预测方法及系统
CN115359248A (zh) 基于元学习的机器人导航避障方法与系统
CN114117787A (zh) 基于ssa优化bp神经网络的短期风功率预测方法
CN114818945A (zh) 融入类别自适应度量学习的小样本图像分类方法及装置
CN114492199A (zh) 一种电压互感器性能的分析方法、系统、电子设备及介质
Jimsan et al. Monitoring of pond water quality using fog network with fuzzy rule based algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination