CN113380340A - 飞灰浓度预测模型的训练方法、装置、计算机设备 - Google Patents

飞灰浓度预测模型的训练方法、装置、计算机设备 Download PDF

Info

Publication number
CN113380340A
CN113380340A CN202110685255.6A CN202110685255A CN113380340A CN 113380340 A CN113380340 A CN 113380340A CN 202110685255 A CN202110685255 A CN 202110685255A CN 113380340 A CN113380340 A CN 113380340A
Authority
CN
China
Prior art keywords
fly ash
ash concentration
data
layer
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110685255.6A
Other languages
English (en)
Other versions
CN113380340B (zh
Inventor
王彬
王川
王凯
何英杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kaiyun Intelligent Co ltd
Original Assignee
Shenzhen Kaiyun Intelligent Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kaiyun Intelligent Co ltd filed Critical Shenzhen Kaiyun Intelligent Co ltd
Priority to CN202110685255.6A priority Critical patent/CN113380340B/zh
Publication of CN113380340A publication Critical patent/CN113380340A/zh
Application granted granted Critical
Publication of CN113380340B publication Critical patent/CN113380340B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本申请涉及飞灰浓度预测模型的训练方法、装置、计算机设备。所述方法包括:获取训练样本数据;将历史飞灰浓度时间序列输入时间序列处理层,得到飞灰浓度处理结果,以及,将关键特征数据输入特征数据处理层,得到关键特征处理结果:将飞灰浓度处理结果和关键特征处理结果输入融合层,得到数据融合结果;将数据融合结果输入输出层,得到预测飞灰浓度时间序列;输出层包括根据飞灰浓度预测模型的输出目标所配置的预测头;基于预测飞灰浓度时间序列和标签飞灰浓度时间序列,对时间序列处理层、特征数据处理层、融合层、输出层进行训练,得到训练后飞灰浓度预测模型。采用本方法能够有效预测飞灰浓度,优化了飞灰浓度预测模型,提升了预测的准确度。

Description

飞灰浓度预测模型的训练方法、装置、计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种飞灰浓度预测模型的训练方法、装置、计算机设备。
背景技术
目前,燃煤电厂通过采用除尘设备,并使用除尘设备的最大功率来吸附电厂排放气体中的飞灰。但实际应用中大部分时间飞灰的排放量并不是很高,不需要使用到除尘设备的最大功率。
为了削减除尘设备能耗,通常是采用传统的基于领域知识搭建的物理模型作为预测模型,以对飞灰进行相应的处理和控制。但建立传统的基于领域知识的物理模型时,需要对不同电站的运行模式进行详细调研,还需分析大量的相关输入物理数据的关系,建立模型的周期长、成本高,难以满足实际应用的需求。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决上述问题的一种飞灰浓度预测模型的训练方法、装置、计算机设备。
一种飞灰浓度预测模型的训练方法,所述飞灰浓度预测模型包括时间序列处理层、特征数据处理层、融合层、输出层,所述方法包括:
获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果:
将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
在一个实施例中,所述将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,包括:
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到历史飞灰浓度数据;
对所述历史飞灰浓度数据进行外置权重放大处理,得到所述飞灰浓度处理结果;所述飞灰浓度处理结果在模型网络中传递的影响力大于所述历史飞灰浓度数据在模型网络中传递的影响力。
在一个实施例中,在所述获取训练样本数据的步骤之前,还包括:
获取电厂采样数据;所述电厂采样数据为针对多个时间点的采样数据,每一时间点对应一飞灰浓度值和多个特征数据;
对所述电厂采样数据进行归一化处理,根据归一化处理后的电厂采样数据,得到模型训练数据和模型测试数据。
在一个实施例中,所述获取训练样本数据,包括:
根据预设的时间选取信息,建立所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系;
基于所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系,从所述模型训练数据中,确定所述标签飞灰浓度时间序列和所述历史飞灰浓度时间序列。
在一个实施例中,所述获取训练样本数据,包括:
基于预设的数据筛选规则,对所述模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,得到筛选处理结果;
对所述筛选处理结果进行降维处理,得到与飞灰浓度相关的关键特征数据。
在一个实施例中,还包括:
基于进化算法,对初始飞灰浓度预测模型的初始模型结构参数进行优化,得到优化后模型结构参数;所述初始模型结构参数包括所述初始飞灰浓度预测模型中的多个初始超参数;
基于所述优化后模型结构参数,构建所述飞灰浓度预测模型。
在一个实施例中,所述基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型,包括:
基于反向传播算法,根据所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层的模型内部参数进行调整,直至得到优化后模型内部参数;所述模型内部参数包括权重和偏差;
基于所述优化后模型内部参数,得到训练后飞灰浓度预测模型。
在一个实施例中,在所述得到训练后飞灰浓度预测模型的步骤之前,还包括:
在所述飞灰浓度预测模型的损失函数中加入预设的惩罚项;所述惩罚项用于抑制模型输出负值。
一种飞灰浓度预测模型的训练装置,所述飞灰浓度预测模型包括时间序列处理层、特征数据处理层、融合层、输出层,所述装置包括:
训练样本数据获取模块,用于获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
网络层处理模块,用于将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果;
融合层处理模块,用于将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
预测飞灰浓度时间序列输出模块,用于将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
模型训练模块,用于基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的飞灰浓度预测模型的训练方法的步骤。
上述一种飞灰浓度预测模型的训练方法、装置、计算机设备,通过获取训练样本数据,训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据,将历史飞灰浓度时间序列输入时间序列处理层,得到飞灰浓度处理结果,以及,将关键特征数据输入特征数据处理层,得到关键特征处理结果,然后将飞灰浓度处理结果和关键特征处理结果输入融合层,得到数据融合结果,将数据融合结果输入输出层,得到预测飞灰浓度时间序列,输出层包括根据飞灰浓度预测模型的输出目标所配置的预测头,进而基于预测飞灰浓度时间序列和标签飞灰浓度时间序列,对时间序列处理层、特征数据处理层、融合层、输出层进行训练,得到训练后飞灰浓度预测模型,实现了基于飞灰浓度预测模型对飞灰浓度的有效预测,通过采用标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据进行模型训练,优化了飞灰浓度预测模型,提升了预测的准确度。
附图说明
图1为一个实施例中一种飞灰浓度预测模型的训练方法的流程示意图;
图2为一个实施例中一种外置权重放大处理步骤的流程示意图;
图3为一个实施例中一种关键特征数据确定步骤的流程示意图;
图4为一个实施例中一种模型训练过程的示意图;
图5为一个实施例中一种模型测试效果的示意图;
图6为一个实施例中一种飞灰浓度预测模型的训练装置的结构框图;
图7为一个实施例中一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种飞灰浓度预测模型的训练方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,飞灰浓度预测模型可以包括时间序列处理层、特征数据处理层、融合层、输出层,该方法包括以下步骤:
步骤101,获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
作为一示例,飞灰浓度时间序列可以为指定时间段内按时间序列排列的飞灰浓度测量值,历史飞灰浓度时间序列可以包括针对当前时间点的前k分钟时间段对应的多个飞灰浓度测量值,标签飞灰浓度时间序列可以包括针对当前时间点的未来时刻时间段对应的多个飞灰浓度测量值。
例如,对于当前时间点t,可以将当前时间点t的前k分钟内各时间点各自对应的飞灰浓度测量值,作为历史飞灰浓度时间序列;还可以将当前时间点t的未来时刻时间段内各时间点各自对应的飞灰浓度测量值,作为标签飞灰浓度时间序列。
在对飞灰浓度预测模型进行训练的过程中,可以基于中控采集数据获取训练样本数据,该训练样本数据可以包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据,以采用训练样本数据进一步对飞灰浓度预测模型进行训练。
在一示例中,与飞灰浓度相关的关键特征数据可以通过对中控采集数据中多个预测潜在相关的特征数据进行筛选得到,例如,由于中控采集数据中包含大量与飞灰浓度关联的特征数据,若全部使用冗余高,容易导致过拟合,则可以通过数据筛选处理得到一定数量的特征数据,作为与飞灰浓度相关的关键特征数据。
步骤102,将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果:
在获取训练样本数据后,可以将历史飞灰浓度时间序列输入飞灰浓度预测模型中的时间序列处理层,得到飞灰浓度处理结果,并可以将关键特征数据输入飞灰浓度预测模型中的特征数据处理层,得到关键特征处理结果。
在一个可选实施例中,飞灰浓度预测模型可以为深度学习神经网络模型,如基于深度学习的数据驱动型短期预测模型,基于飞灰浓度预测模型,可以将历史飞灰浓度时间序列作为强化输入数据,通过专用于分析时间序列的RNN网络层(Recurrent NeuralNetwork,循环神经网络)进行处理(也可以采用LSTM或GRU),并可以将关键特征数据输入MLP网络层(Multi-layer neural network,多层神经网络)进行处理。
步骤103,将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
在具体实现中,可以将根据历史飞灰浓度时间序列得到的飞灰浓度处理结果和根据关键特征数据得到的关键特征处理结果,输入飞灰浓度预测模型中的融合层,进而可以得到数据融合结果,从而通过历史飞灰浓度走势和关键特征数据的融合,能够有效预测未来时刻的飞灰浓度走势。
步骤104,将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
在得到数据融合结果后,可以将该数据融合结果输入飞灰浓度预测模型中的输出层,该输出层可以包括根据飞灰浓度预测模型的输出目标所配置的预测头,进而可以得到预测飞灰浓度时间序列,如预测未来时刻的飞灰浓度走势。
具体地,在飞灰浓度预测模型中的输出层,若待预测的输出目标为未来时刻时间序列,则可以加上一个RNN的预测头(prediction head);若待预测的输出目标为未来某一时间点,即单一数值,则可以采用常规神经元。
步骤105,基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
在实际应用中,可以根据预测飞灰浓度时间序列和标签飞灰浓度时间序列,对待训练的飞灰浓度预测模型进行训练,即可以对模型中的时间序列处理层、特征数据处理层、融合层、输出层进行优化,进而可以得到训练后飞灰浓度预测模型,该训练后的飞灰浓度预测模型可以用于对燃煤电厂出气口的飞灰浓度进行预测。
在一示例中,可以采用监督学习(Supervised learning)方法,通过基于未来时刻的标签飞灰浓度时间序列和模型输出的预测飞灰浓度时间序列,采用反向传播算法对待训练的飞灰浓度预测模型进行训练,即基于训练样本数据可以得到训练后的飞灰浓度预测模型,进而在实际场景中,可以采用训练后的飞灰浓度预测模型,根据输入数据有效预测出燃煤电厂出气口的飞灰浓度。
在本申请实施例中,通过获取训练样本数据,训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据,将历史飞灰浓度时间序列输入时间序列处理层,得到飞灰浓度处理结果,以及,将关键特征数据输入特征数据处理层,得到关键特征处理结果,然后将飞灰浓度处理结果和关键特征处理结果输入融合层,得到数据融合结果,将数据融合结果输入输出层,得到预测飞灰浓度时间序列,输出层包括根据飞灰浓度预测模型的输出目标所配置的预测头;进而基于预测飞灰浓度时间序列和标签飞灰浓度时间序列,对时间序列处理层、特征数据处理层、融合层、输出层进行训练,得到训练后飞灰浓度预测模型,实现了基于飞灰浓度预测模型对飞灰浓度的有效预测,通过采用标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据进行模型训练,优化了飞灰浓度预测模型,提升了预测的准确度。
在一个实施例中,如图2所示,所述将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,可以包括如下步骤:
步骤201,将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到历史飞灰浓度数据;
其中,历史飞灰浓度数据可以为时间序列处理层的输出结果,即将历史飞灰浓度时间序列输入时间序列处理层后得到的输出结果。
在实际应用中,可以将历史飞灰浓度时间序列作为强化输入数据,输入至时间序列处理层进行处理,如采用专用于分析时间序列的RNN网络层,进而可以得到时间序列处理层输出的历史飞灰浓度数据。
在一示例中,RNN网络层可以为RNN隐藏层,其可以具有10个神经元。
步骤202,对所述历史飞灰浓度数据进行外置权重放大处理,得到所述飞灰浓度处理结果;所述飞灰浓度处理结果在模型网络中传递的影响力大于所述历史飞灰浓度数据在模型网络中传递的影响力。
在得到时间序列处理层输出的历史飞灰浓度数据后,可以对该历史飞灰浓度数据进行外置权重放大处理,以放大其在模型网络中传递的影响力,进而可以得到飞灰浓度处理结果。
具体地,由于将历史飞灰浓度时间序列作为强化输入数据,对预测结果的正向作用较大,则可以基于反k型网络结构,通过100-1000倍的外置权重放大其在模型网络中传递的影响力。
通过上述实施例将历史飞灰浓度时间序列输入时间序列处理层,得到历史飞灰浓度数据,进而对历史飞灰浓度数据进行外置权重放大处理,得到飞灰浓度处理结果,飞灰浓度处理结果在模型网络中传递的影响力大于历史飞灰浓度数据在模型网络中传递的影响力,可以放大历史飞灰浓度时间序列对预测结果的正向作用,提升了预测的准确度。
在一个实施例中,在所述获取训练样本数据的步骤之前,可以包括如下步骤:
获取电厂采样数据;所述电厂采样数据为针对多个时间点的采样数据,每一时间点对应一飞灰浓度值和多个特征数据;
在实际应用中,通过针对多个时间点进行数据采集,每一时间点可以对应有一飞灰浓度值和多个特征数据,可以获取电厂采样数据。
具体地,在数据的采集与准备阶段,可以通过间隔1秒的时间点计数方式,采集燃煤电厂出气口在多个时间点的数据,例如,针对每个时间点,可以采集燃煤电厂出气口的飞灰浓度测量值,并可以基于电子数字化管理系统提供该时间点对应的主蒸汽温度、冷风开度、反应器喷氨流量等多个预测潜在相关的特征数据。
本申请中可以基于深度学习的数据驱动算法优势,无序的详细分析单个输入对于预测目标的飞灰浓度的函数映射关系,通过自动数据学习可以赋予每个输入对应的权重,对于部分缺失数据可以采用临近值均值填充的方法进行补全。
对所述电厂采样数据进行归一化处理,根据归一化处理后的电厂采样数据,得到模型训练数据和模型测试数据。
在获取电厂采样数据后,为了使原始的电厂采样数据中不同量纲的特征数据处于同一数值量级,可以对电厂采样数据进行归一化处理,并可以将归一化处理后的电厂采样数据分为模型训练数据和模型测试数据。
在一示例中,可以采用如下方式对电厂采样数据进行归一化处理:
Figure BDA0003124356720000091
其中,x为原始的电厂采样数据,xmin为该数据在全部时间点对应的数据中最小值,xmax为该数据在全部时间点对应的数据中最大值,x’为归一化处理后范围在0至1之间的数值。
通过归一化处理,可以使得原始的电厂采样数据中不同量纲的特征数据处于同一数值量级,降低了因方差大的特征数据造成的过度影响,能够使模型更准确,且有助于最大限度地从原始的电厂采样数据中提取有效特征数据,用于模型训练,提升了模型的灵活度。
由于训练后的飞灰浓度预测模型输出的预测结果也为归一化处理结果,则可以预先记录xmin和xmax,进而通过逆向操作还原出实际数值量级的飞灰浓度预测结果
Figure BDA0003124356720000093
可以采用如下方式计算得到:
Figure BDA0003124356720000092
在又一示例中,对于归一化处理后的电厂采样数据,可以将其分为模型训练数据和模型测试数据,如训练集和测试集。模型测试数据不参与模型训练过程,通过采用预留的模型测试数据对训练后的飞灰浓度预测模型进行验证,能够最大程度仿真模型在实际应用中的表现。
通过上述实施例获取电厂采样数据,电厂采样数据为针对多个时间点的采样数据,每一时间点对应一飞灰浓度值和多个特征数据,进而对电厂采样数据进行归一化处理,根据归一化处理后的电厂采样数据,得到模型训练数据和模型测试数据,可以使得电厂采样数据中不同量纲的特征数据处于同一数值量级,提升了模型准确性。
在一个实施例中,所述获取训练样本数据,可以包括如下步骤:
根据预设的时间选取信息,建立所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系;
作为一示例,时间选取信息可以表征出当前时间点与标签飞灰浓度时间序列、当前时间点与历史飞灰浓度时间序列之间的关系,例如,选取当前时间点的前k分钟对应的多个时间点组成历史飞灰浓度时间序列,选取当前时间点的后n分钟对应的多个时间点组成标签飞灰浓度时间序列。
在具体实现中,由于预设的时间选取信息可以表征出当前时间点与标签飞灰浓度时间序列、当前时间点与历史飞灰浓度时间序列之间的关系,则可以根据该时间选取信息,建立标签飞灰浓度时间序列与历史飞灰浓度时间序列之间的关系。
在一示例中,可以根据燃煤电厂的出气口管道长度,选取当前时间点t之前5分钟的飞灰浓度测量值组成历史飞灰浓度时间序列,以作为强化输入数据,从而可以有效提高算法准确度10-15%,也可以选取当前时间点t之前15分钟,但大于15分钟效果不佳且算力复杂度增加。
基于所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系,从所述模型训练数据中,确定所述标签飞灰浓度时间序列和所述历史飞灰浓度时间序列。
在实际应用中,可以基于标签飞灰浓度时间序列与历史飞灰浓度时间序列之间的关系,从模型训练数据中选取合适的时间点数据,进而可以得到标签飞灰浓度时间序列和历史飞灰浓度时间序列。
通过上述实施例根据预设的时间选取信息,建立标签飞灰浓度时间序列与历史飞灰浓度时间序列之间的关系,进而基于标签飞灰浓度时间序列与历史飞灰浓度时间序列之间的关系,从模型训练数据中,确定标签飞灰浓度时间序列和历史飞灰浓度时间序列,可以根据时间选取信息确定历史飞灰浓度时间序列以作为强化输入数据,有效提高了模型中算法准确度。
在一个实施例中,如图3所示,所述获取训练样本数据,可以包括如下步骤:
步骤301,基于预设的数据筛选规则,对所述模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,得到筛选处理结果;
在具体实现中,由于中控采集数据中包含大量与飞灰浓度关联的特征数据,若全部使用冗余高,容易导致过拟合,则可以基于预设的数据筛选规则,对模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,进而通过数据预处理可以得到筛选处理结果。
例如,针对每一特征数据x,可以采用如下自定义数据分析公式计算得到θ:
Figure BDA0003124356720000111
通过将模型训练数据中的多个特征数据各自对应的θ进行排序,由于处于排序结果末尾的数据为波动较小,且因分布不均缺少信息量、因均值与中值差异较大的数据,则可以去掉排序结果末尾20%的数据,从而能够有效提高算法表现。
步骤302,对所述筛选处理结果进行降维处理,得到与飞灰浓度相关的关键特征数据。
在筛选处理结果后,可以对该筛选处理结果进行降维处理,进而可以进一步筛选出一定数量的特征数据,作为与飞灰浓度相关的关键特征数据。
具体地,可以基于PCA算法进行降维处理,例如,针对中控采集数据中包含的大量与飞灰浓度关联的特征数据,基于PCA算法可以降维至20,即筛选出20种类型的特征数据,作为与飞灰浓度相关的关键特征数据。若大于20,由于输入数据量大,过拟合仍然明显;若小于20,会造成有效特征因过分压缩而失去,因此降维至20为优化解。
通过上述实施例基于预设的数据筛选规则,对模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,得到筛选处理结果,进而对筛选处理结果进行降维处理,得到与飞灰浓度相关的关键特征数据,避免了使用全部特征数据冗余高,容易导致过拟合的问题。
在一个实施例中,所述方法还可以包括如下步骤:
基于进化算法,对初始飞灰浓度预测模型的初始模型结构参数进行优化,得到优化后模型结构参数;所初始模型结构参数包括所述初始飞灰浓度预测模型中的多个初始超参数;基于所述优化后模型结构参数,构建所述飞灰浓度预测模型。
作为一示例,初始超参数可以为初始飞灰浓度预测模型的隐藏层数、每层神经元数量、学习速率等。
神经网络模型中神经网络可以由大量的神经元联结进行计算,神经网络可以具有三个关键部分:
1、结构(Architecture),其可以表示神经网络中的变量和变量之间的拓扑关系,例如,神经网络中隐藏层的数量和每层神经元的数量。
2、激活函数(Activation function),其可以定义神经元如何根据其它神经元的活动来改变自身的激励值。
3、学习速率(Learning Rate),其可以为长时间尺度的动力学规则,用于表示出神经网络中的权重如何随着时间推进而调整
由于深度学习神经网络模型中包含大量需要优化的超参数,如学习速率的选取,网络结构中隐藏层和每层神经元的数量等,相较于传统方法对超参数的优化主要依赖经验和随机调参测试,本申请中通过进化算法可以对初始飞灰浓度预测模型中的初始超参数进行优化。
例如,通过采用训练优化器(如Adam优化算法),可以获取初始飞灰浓度预测模型中的多个初始超参数,并对该多个初始超参数进行优化,进而可以基于优化后多个超参数,构建飞灰浓度预测模型。
进化算法可以模拟自然选择的演化过程对模型进行优化,其可以通过多轮的迭代过程在搜索空间内寻找较优解,进化算法的流程可以为:
1、在初始轮中通过进化算法随机生成一批个体;
2、根据个体拥有的待优化参数,可以从状态空间中均匀的选取个体;
3、基于进化算法可以评估每个个体的适应度,在本申请中,适应度可以为预测误差,较高适应度对应较低的预测误差;
4、当全部个体的适应度计算完成后,优胜的个体可以通过交叉和变异的方式生成下一代个体;
5、针对下一代个体,可以采用同样定义的适应度来评估表现;
6、通过多轮的迭代过程,直到整体的平均适应度收敛为止。
在一示例中,基于进化算法,本申请中可以得到最后优化结果(即优化后模型结构参数)为双隐藏层,每层为10个神经元,学习速率为0.02。
通过上述实施例基于进化算法,对初始飞灰浓度预测模型的初始模型结构参数进行优化,得到优化后模型结构参数,初始模型结构参数包括初始飞灰浓度预测模型中的多个初始超参数,进而基于优化后模型结构参数,构建飞灰浓度预测模型,可以基于进化算法得到优化后模型结构参数,避免了依赖经验和随机调参测试得到超参数,提高了飞灰浓度预测模型的预测准确度。
在一个实施例中,所述基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型,可以包括如下步骤:
基于反向传播算法,根据所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层的模型内部参数进行调整,直至得到优化后模型内部参数;所述模型内部参数包括权重和偏差;基于所述优化后模型内部参数,得到训练后飞灰浓度预测模型。
神经网络的基本搭建单元为神经元,每个神经元可以基于激活函数f,根据输入数据x得到输出数据y,可以采用如下方式表示:
y=f(∑wx+b)
其中,w为权重,b为偏差值;将输入数据x乘上权重w并进行求和,然后加上偏差值b,通过激活函数f可以获得最终输出数据y。
在一示例中,待训练的飞灰浓度预测模型中隐藏层的激活函数可以采用tanh双曲正切:
Figure BDA0003124356720000141
由于用于模型训练的训练样本数据为经过归一化处理后的数据,其数值的波动范围为0-1之间,则可以根据该特点选用sigmoid函数作为输出层的激活函数:
Figure BDA0003124356720000142
在实际应用中,基于反向传播算法,可以根据预测飞灰浓度时间序列和标签飞灰浓度时间序列,对待训练的飞灰浓度预测模型中时间序列处理层、特征数据处理层、融合层、输出层的模型内部参数进行调整,直至得到优化后模型内部参数,进而可以基于优化后模型内部参数,得到训练后飞灰浓度预测模型。
例如,待训练的飞灰浓度预测模型可以根据预测飞灰浓度时间序列和标签飞灰浓度时间序列,通过反向传播算法学习获取优化后模型内部参数,即得到优化后权重w和优化后偏差b。
通过上述实施例基于反向传播算法,根据预测飞灰浓度时间序列和标签飞灰浓度时间序列,对时间序列处理层、特征数据处理层、融合层、输出层的模型内部参数进行调整,直至得到优化后模型内部参数,模型内部参数包括权重和偏差,进而基于优化后模型内部参数,得到训练后飞灰浓度预测模型,可以基于反向传播算法得到优化后模型内部参数,为得到训练后飞灰浓度预测模型提供了数据支持。
在一个实施例中,在所述得到训练后飞灰浓度预测模型的步骤之前,可以包括如下步骤:
在所述飞灰浓度预测模型的损失函数中加入预设的惩罚项;所述惩罚项用于抑制模型输出负值。
由于数据驱动算法的随机性,可能会出现不符合实际物理规律的负值情况,则可以在训练飞灰浓度预测模型时,在飞灰浓度预测模型的损失函数中加入惩罚项:
Figure BDA0003124356720000151
其中,
Figure BDA0003124356720000152
为惩罚项,a为权重系数,k为出现负值的预测样本数,w、b为模型自优化参数。
在一示例中,在推断阶段,若仍然发生极端情况出现负值,可以对训练后飞灰浓度预测模型进行负值裁剪,如采用外部模型max(0,f(xk,w,b)进行裁剪。
通过上述实施例在飞灰浓度预测模型的损失函数中加入预设的惩罚项,惩罚项用于抑制模型输出负值,避免了因数据驱动算法的随机性导致的输出负值情况。
为了使本领域技术人员能够更好地理解上述步骤,以下结合图4通过一个例子对本申请实施例加以示例性说明,但应当理解的是,本申请实施例并不限于此。
飞灰浓度预测模型可以采用如图4的反K型结构进行构建,模型训练过程可以为:
1、将历史飞灰浓度时间序列作为强化输入数据,输入RNN网络层(即时间序列处理层,如图4中1)进行处理,该RNN网络层可以为RNN隐藏层,包含10个神经元,历史飞灰浓度时间序列可以表示为时间节点1-时间节点k;
2、对RNN网络层的输出结果可以进行外置权重放大处理,得到飞灰浓度处理结果,如通过100-1000倍的外置权重放大,可以增强飞灰浓度处理结果在模型网络中传递的影响力;
3、获取中控平台输入数据,通过PCA算法降维处理可以得到与飞灰浓度相关的关键特征数据,进而可以将关键特征数据输入第一个MLP网络层(即特征数据处理层,如图4中2)进行处理,该MLP网络层可以为MLP第一个隐藏层,包含10个神经元;
4、将飞灰浓度处理结果和关键特征处理结果输入第二个MLP网络层(即融合层,如图4中3)进行处理,可以得到数据融合结果,该MLP网络层可以为MLP第二个隐藏层,包含10个神经元;
5、将数据融合结果输入RNN网络层(即输出层,如图4中4)进行处理,并通过负值裁剪,可以得到输出的飞灰浓度预测结果(即预测飞灰浓度时间序列),该RNN网络层可以为RNN输出层,包含1-10个神经元,预测飞灰浓度时间序列可以表示为时间节点t+1-时间节点t+n;
6、飞灰浓度预测模型还可以用于预测除飞灰以外的其它相关控制指标,通过共享同样的输入数据,可以有效减少模型复杂度和推断的计算量。由于输出层可以包括根据飞灰浓度预测模型的输出目标所配置的预测头,则可以通过在MLP第二个隐藏层上加上另一个预测头(prediction head),将数据融合结果输入RNN网络层(如图4中5)进行处理,并通过负值裁剪,可以得到输出的其它相关控制指标预测结果,如不同尺寸颗粒物、氮氧化合物,一氧化碳等,该RNN网络层可以为RNN输出层,包含1-10个神经元。
在一个可选实施例中,可以采用预留的模型测试数据对得到的训练后飞灰浓度预测模型进行验证,例如,通过将训练后飞灰浓度预测模型作为实验模型,将持续性模型作为对照组模型进行验证,两者的统计表现展示在如下表1中:
Figure BDA0003124356720000161
从表1中统计结果可以看出,实验模型在各时间点对应的飞灰浓度未来预测值上均显著优于对照组模型,实验模型的预报技巧评分为14%-16%。由于1-3分钟的预测属于超短期预测范围,在短期时长下持续性模型的表现较优,数据驱动型模型容易出现过拟合的情况。本申请中通过进化算法得到优化后模型结构参数,使得训练后飞灰浓度预测模型在短期时长的预测范围内也得到了较好的预测结果。
实验模型和对照组模型的绝对值误差分布柱状图如图5所示,从图中可以看出,在不同预测时长下,实验模型的误差分布相对于对照组模型的误差分布呈现向左偏移,即训练后飞灰浓度预测模型的较大绝对值误差发生概率小于持续性模型的较大绝对值误差发生概率。
随着预测时长增加,预测难度也随之上升。通过分析较大误差发生时的情况,在1分钟预测场景中,实验模型误差>2出现15次,占比为0.13%,对照组模型误差>2出现48次,占比为0.42%;在2分钟预测场景中,实验模型误差>2出现18次,占比为0.16%,对照组模型误差>2出现49次,占比为0.43%;在3分钟预测场景中,实验模型误差>2出现20次,占比为0.17%,对照组模型误差>2出现51次,占比为0.44%。从而在不同时长的预测场景中,训练后飞灰浓度预测模型的表现都显著优于持续性模型。
应该理解的是,虽然图1-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种飞灰浓度预测模型的训练装置,所述飞灰浓度预测模型包括时间序列处理层、特征数据处理层、融合层、输出层,包括:
训练样本数据获取模块601,用于获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
网络层处理模块602,用于将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果;
融合层处理模块603,用于将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
预测飞灰浓度时间序列输出模块604,用于将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
模型训练模块605,用于基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
在一个实施例中,所述网络层处理模块602包括:
时间序列处理层输入子模块,用于将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到历史飞灰浓度数据;
外置权重放大处理子模块,用于对所述历史飞灰浓度数据进行外置权重放大处理,得到所述飞灰浓度处理结果;所述飞灰浓度处理结果在模型网络中传递的影响力大于所述历史飞灰浓度数据在模型网络中传递的影响力。
在一个实施例中,所述装置还包括:
电厂采样数据获取模块,用于获取电厂采样数据;所述电厂采样数据为针对多个时间点的采样数据,每一时间点对应一飞灰浓度值和多个特征数据;
归一化处理模块,用于对所述电厂采样数据进行归一化处理,根据归一化处理后的电厂采样数据,得到模型训练数据和模型测试数据。
在一个实施例中,所述训练样本数据获取模块601包括:
时间选取信息获取子模块,用于根据预设的时间选取信息,建立所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系;
飞灰浓度时间序列确定子模块,用于基于所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系,从所述模型训练数据中,确定所述标签飞灰浓度时间序列和所述历史飞灰浓度时间序列。
在一个实施例中,所述训练样本数据获取模块601包括:
数据筛选子模块,用于基于预设的数据筛选规则,对所述模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,得到筛选处理结果;
降维处理子模块,用于对所述筛选处理结果进行降维处理,得到与飞灰浓度相关的关键特征数据。
在一个实施例中,所述装置还包括:
进化算法处理模块,用于基于进化算法,对初始飞灰浓度预测模型的初始模型结构参数进行优化,得到优化后模型结构参数;所述初始模型结构参数包括所述初始飞灰浓度预测模型中的多个初始超参数;
模型构建模块,用于基于所述优化后模型结构参数,构建所述飞灰浓度预测模型。
在一个实施例中,所述模型训练模块605包括:
反向传播算法处理子模块,用于基于反向传播算法,根据所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层的模型内部参数进行调整,直至得到优化后模型内部参数;所述模型内部参数包括权重和偏差;
模型训练子模块,用于基于所述优化后模型内部参数,得到训练后飞灰浓度预测模型。
在一个实施例中,所述装置还包括:
负值抑制模块,用于在所述飞灰浓度预测模型的损失函数中加入预设的惩罚项;所述惩罚项用于抑制模型输出负值。
在本申请实施例中,通过获取训练样本数据,训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据,将历史飞灰浓度时间序列输入时间序列处理层,得到飞灰浓度处理结果,以及,将关键特征数据输入特征数据处理层,得到关键特征处理结果,然后将飞灰浓度处理结果和关键特征处理结果输入融合层,得到数据融合结果,将数据融合结果输入输出层,得到预测飞灰浓度时间序列,输出层包括根据飞灰浓度预测模型的输出目标所配置的预测头,进而基于预测飞灰浓度时间序列和标签飞灰浓度时间序列,对时间序列处理层、特征数据处理层、融合层、输出层进行训练,得到训练后飞灰浓度预测模型,实现了基于飞灰浓度预测模型对飞灰浓度的有效预测,通过采用标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据进行模型训练,优化了飞灰浓度预测模型,提升了预测的准确度。
关于一种飞灰浓度预测模型的训练装置的具体限定可以参见上文中对于一种飞灰浓度预测模型的训练方法的限定,在此不再赘述。上述一种飞灰浓度预测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储飞灰浓度预测模型的训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现飞灰浓度预测模型的训练方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果:
将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
在一个实施例中,处理器执行计算机程序时还实现上述其他实施例中的飞灰浓度预测模型的训练方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果:
将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的飞灰浓度预测模型的训练方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种飞灰浓度预测模型的训练方法,其特征在于,所述飞灰浓度预测模型包括时间序列处理层、特征数据处理层、融合层、输出层,所述方法包括:
获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果:
将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,包括:
将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到历史飞灰浓度数据;
对所述历史飞灰浓度数据进行外置权重放大处理,得到所述飞灰浓度处理结果;所述飞灰浓度处理结果在模型网络中传递的影响力大于所述历史飞灰浓度数据在模型网络中传递的影响力。
3.根据权利要求1所述的方法,其特征在于,在所述获取训练样本数据的步骤之前,还包括:
获取电厂采样数据;所述电厂采样数据为针对多个时间点的采样数据,每一时间点对应一飞灰浓度值和多个特征数据;
对所述电厂采样数据进行归一化处理,根据归一化处理后的电厂采样数据,得到模型训练数据和模型测试数据。
4.根据权利要求3所述的方法,其特征在于,所述获取训练样本数据,包括:
根据预设的时间选取信息,建立所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系;
基于所述标签飞灰浓度时间序列与所述历史飞灰浓度时间序列之间的关系,从所述模型训练数据中,确定所述标签飞灰浓度时间序列和所述历史飞灰浓度时间序列。
5.根据权利要求3所述的方法,其特征在于,所述获取训练样本数据,包括:
基于预设的数据筛选规则,对所述模型训练数据中的多个时间点各自对应的多个特征数据进行筛选处理,得到筛选处理结果;
对所述筛选处理结果进行降维处理,得到与飞灰浓度相关的关键特征数据。
6.根据权利要求1所述的方法,其特征在于,还包括:
基于进化算法,对初始飞灰浓度预测模型的初始模型结构参数进行优化,得到优化后模型结构参数;所述初始模型结构参数包括所述初始飞灰浓度预测模型中的多个初始超参数;
基于所述优化后模型结构参数,构建所述飞灰浓度预测模型。
7.根据权利要求1所述的方法,其特征在于,所述基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型,包括:
基于反向传播算法,根据所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层的模型内部参数进行调整,直至得到优化后模型内部参数;所述模型内部参数包括权重和偏差;
基于所述优化后模型内部参数,得到训练后飞灰浓度预测模型。
8.根据权利要求1至7任意一项所述的方法,其特征在于,在所述得到训练后飞灰浓度预测模型的步骤之前,还包括:
在所述飞灰浓度预测模型的损失函数中加入预设的惩罚项;所述惩罚项用于抑制模型输出负值。
9.一种飞灰浓度预测模型的训练装置,其特征在于,所述飞灰浓度预测模型包括时间序列处理层、特征数据处理层、融合层、输出层,所述装置包括:
训练样本数据获取模块,用于获取训练样本数据;其中,所述训练样本数据包括标签飞灰浓度时间序列、历史飞灰浓度时间序列、与飞灰浓度相关的关键特征数据;
网络层处理模块,用于将所述历史飞灰浓度时间序列输入所述时间序列处理层,得到飞灰浓度处理结果,以及,将所述关键特征数据输入所述特征数据处理层,得到关键特征处理结果;
融合层处理模块,用于将所述飞灰浓度处理结果和所述关键特征处理结果输入所述融合层,得到数据融合结果;
预测飞灰浓度时间序列输出模块,用于将所述数据融合结果输入所述输出层,得到预测飞灰浓度时间序列;所述输出层包括根据所述飞灰浓度预测模型的输出目标所配置的预测头;
模型训练模块,用于基于所述预测飞灰浓度时间序列和所述标签飞灰浓度时间序列,对所述时间序列处理层、所述特征数据处理层、所述融合层、所述输出层进行训练,得到训练后飞灰浓度预测模型。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的飞灰浓度预测模型的训练方法的步骤。
CN202110685255.6A 2021-06-21 2021-06-21 飞灰浓度预测模型的训练方法、装置、计算机设备 Active CN113380340B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110685255.6A CN113380340B (zh) 2021-06-21 2021-06-21 飞灰浓度预测模型的训练方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110685255.6A CN113380340B (zh) 2021-06-21 2021-06-21 飞灰浓度预测模型的训练方法、装置、计算机设备

Publications (2)

Publication Number Publication Date
CN113380340A true CN113380340A (zh) 2021-09-10
CN113380340B CN113380340B (zh) 2023-05-16

Family

ID=77578087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110685255.6A Active CN113380340B (zh) 2021-06-21 2021-06-21 飞灰浓度预测模型的训练方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN113380340B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429589A (zh) * 2022-04-07 2022-05-03 北京理工大学 一种氢气泄漏浓度分布预测方法及系统
CN114965164A (zh) * 2022-06-02 2022-08-30 连云港同顺电力节能设备有限公司 一种电力生产飞灰监测系统、方法及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1134290A2 (en) * 2000-03-14 2001-09-19 Pfizer Products Inc. Pharmacophore models for the identification of the CYP2D6 inhibitory potency of selective serotonin reuptake inhibitors
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法
US20170316328A1 (en) * 2016-04-27 2017-11-02 International Business Machines Corporation Pollution prediction
CN108268935A (zh) * 2018-01-11 2018-07-10 浙江工业大学 一种基于时序循环神经网络的pm2.5浓度值预测方法及系统
CN109142171A (zh) * 2018-06-15 2019-01-04 上海师范大学 基于特征扩张的融合神经网络的城市pm10浓度预测方法
CN111754042A (zh) * 2020-06-28 2020-10-09 成都佳华物链云科技有限公司 基于高斯回归的大气污染物浓度的预测方法及装置
EP3751466A1 (de) * 2019-06-13 2020-12-16 Siemens Aktiengesellschaft Verfahren zur vorhersage eines schadstoffwertes in der luft
WO2021032332A1 (de) * 2019-08-16 2021-02-25 Siemens Aktiengesellschaft Computergestütztes verfahren zum erzeugen von trainingsdaten für ein neuronales netz für eine vorhersage einer schadstoffkonzentration
CN112651166A (zh) * 2020-11-24 2021-04-13 呼和浩特科林热电有限责任公司 脱硝系统入口氮氧化物浓度预测方法、装置及脱硝系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1134290A2 (en) * 2000-03-14 2001-09-19 Pfizer Products Inc. Pharmacophore models for the identification of the CYP2D6 inhibitory potency of selective serotonin reuptake inhibitors
US20170316328A1 (en) * 2016-04-27 2017-11-02 International Business Machines Corporation Pollution prediction
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法
CN108268935A (zh) * 2018-01-11 2018-07-10 浙江工业大学 一种基于时序循环神经网络的pm2.5浓度值预测方法及系统
CN109142171A (zh) * 2018-06-15 2019-01-04 上海师范大学 基于特征扩张的融合神经网络的城市pm10浓度预测方法
EP3751466A1 (de) * 2019-06-13 2020-12-16 Siemens Aktiengesellschaft Verfahren zur vorhersage eines schadstoffwertes in der luft
WO2021032332A1 (de) * 2019-08-16 2021-02-25 Siemens Aktiengesellschaft Computergestütztes verfahren zum erzeugen von trainingsdaten für ein neuronales netz für eine vorhersage einer schadstoffkonzentration
CN111754042A (zh) * 2020-06-28 2020-10-09 成都佳华物链云科技有限公司 基于高斯回归的大气污染物浓度的预测方法及装置
CN112651166A (zh) * 2020-11-24 2021-04-13 呼和浩特科林热电有限责任公司 脱硝系统入口氮氧化物浓度预测方法、装置及脱硝系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭思雯;陶玉帆;李超;: "基于时间序列的瓦斯浓度动态预测", no. 09, pages 24 - 29 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429589A (zh) * 2022-04-07 2022-05-03 北京理工大学 一种氢气泄漏浓度分布预测方法及系统
CN114965164A (zh) * 2022-06-02 2022-08-30 连云港同顺电力节能设备有限公司 一种电力生产飞灰监测系统、方法及存储介质

Also Published As

Publication number Publication date
CN113380340B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
Sangiorgio et al. Robustness of LSTM neural networks for multi-step forecasting of chaotic time series
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN114399032B (zh) 一种电能表计量误差预测方法及系统
CN112686464A (zh) 短期风电功率预测方法及装置
CN111382906B (zh) 一种电力负荷预测方法、系统、设备和计算机可读存储介质
CN113380340A (zh) 飞灰浓度预测模型的训练方法、装置、计算机设备
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN111461463A (zh) 一种基于tcn-bp的短期负荷预测方法、系统及设备
Zhao et al. Probabilistic remaining useful life prediction based on deep convolutional neural network
US20220367057A1 (en) Missing medical diagnosis data imputation method and apparatus, electronic device and medium
Dave et al. Comparison of regression model, feed-forward neural network and radial basis neural network for software development effort estimation
Kayim et al. Time series forecasting with volatility activation function
CN113128666A (zh) 基于Mo-S-LSTMs模型的时间序列多步预测方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN116665798A (zh) 一种空气污染趋势预警方法及相关装置
CN112561180B (zh) 基于元学习的短期风速预测方法、装置、计算机设备及存储介质
CN115389743A (zh) 一种变压器油中溶解气体含量区间预测方法、介质及系统
Kumari et al. Remaining useful life prediction using hybrid neural network and genetic algorithm approaches
CN112183814A (zh) 一种短期风速预测方法
CN110796243A (zh) 一种连续型运行监测数据模拟发生方法及装置
CN117473275B (zh) 一种数据中心的能耗检测方法
Mylonas et al. Remaining useful life estimation under uncertainty with causal GraphNets
CN116029466B (zh) 一种碳排放量预测方法、装置、存储介质及设备
Milivojević et al. Long short-term memory prediction for COVID19 time series
Kleijkers Forecasting greenhouse cucumber production using a combined LSTM-TCN deep neural network.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: He Yingjie

Inventor after: Wang Chuan

Inventor after: Wang Kai

Inventor after: Wang Bin

Inventor before: Wang Bin

Inventor before: Wang Chuan

Inventor before: Wang Kai

Inventor before: He Yingjie

GR01 Patent grant
GR01 Patent grant