CN113902166A

CN113902166A - 大数据融合碳排放治理、预测分析模型方法

Info

Publication number: CN113902166A
Application number: CN202111042848.7A
Authority: CN
Inventors: 张志亮; 赵永国; 杨荣霞; 曹熙; 张仙梅; 郭鑫
Original assignee: China Southern Power Grid Big Data Service Co ltd
Current assignee: China Southern Power Grid Big Data Service Co ltd
Priority date: 2021-09-07
Filing date: 2021-09-07
Publication date: 2022-01-07

Abstract

本发明涉及一种大数据融合碳排放治理、预测分析模型方法，是针对现有同类方法对新区域的碳排放较难精准预测，较少采用模型对碳排放治理预测分析的技术问题。其要点是该方法利用大数据深度网络对数据进行预训练，采用深度学习的方法学习大量数据的通用特征；然后，采用批量标准化的机制对源域核目标域的数据分布进行一致性处理后，新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征；最后，通过多核学习的方法将通用特征和差异特征进行融合，基于循环神经网络设计一个数据预测模型。上述差异特征学习先将新区域的数据放进已经训练好的深度学习神经网络中添加两层批量标准化层，最后由监督学习进行神经网络最后一层参数的微调。

Description

大数据融合碳排放治理、预测分析模型方法

技术领域

本发明涉及碳排放指数的模型，是一种大数据融合碳排放治理、预测分析模型方法。

背景技术

碳排放是指人类活动或者自然形成的温室气体排放，温室气体一旦超出大气标准，便会造成温室效应，使全球气温上升，威胁人类生存。全球气候变暖的主要原因是由于人类在自身发展过程中对能源的过度使用和自然资源的过度开发，造成大气中温室气体的浓度以极快的速度增长所致。目前，由于电力行业碳排放指数是结合电力碳排放总量指标、电力排放强度指标和零碳电能占比三个指标构成的，三个指标具有相互侧重又相互支撑。因此电力碳排放充电行业碳排放指数涉及时域、地域和成分(即电力碳排放总量指标、电力排放强度指标和零碳电能占比)三个维度来刻画。从一个地区对碳排放指数构建碳排放的预测模型，直接使用很难适用于其他区域，对于一个新的区域来说，采集大量的样本，采用专业的方法并对样本的碳排放指数进行估计，这将是一项耗时耗力的事情。现有一些碳排放控制采用大数据分析，如中国专利文献中披露的申请号201910732016.4，申请公布日2019.12.06，发明名称“一种基于大数据分析的企业碳数据或碳资产智能管控平台”；但目前用于电动汽车充电的碳排放治理和预警分析较少，其采用的主要方法，如中国专利文献中披露的申请号201910401157.8，申请公布日2019.08.23，发明名称“一种电动车二氧化碳减排量估算方法”；及如中国专利文献中披露的申请号201910416264.8，申请公布日2019.09.10，发明名称“一种电动汽车绿色发展体系指数计算方法”。但上述方法较少采用新区域的数据设计碳排放治理、预测分析模型，精准预测碳排放。

发明内容

为克服上述不足，本发明的目的是向本领域提供一种大数据融合碳排放治理、预测分析模型方法，使其主要解决现有同类方法对新区域的碳排放较难精准预测，较少采用模型对碳排放治理预测分析的技术问题。其目的是通过如下技术方案实现的。

一种大数据融合碳排放治理、预测分析模型方法，其特征在于该方法利用大数据深度网络对数据进行预训练，采用深度学习的方法学习大量数据的通用特征；然后，采用批量标准化的机制对源域核目标域的数据分布进行一致性处理后，采用新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征；最后，通过多核学习的方法将通用特征和差异特征进行融合，基于循环神经网络设计一个数据预测模型。从而通过数据预测模型有效提升数据预测得精度，在数据精准预测基础上，采用合适的碳排放工具进行碳排放综合治理，提升治理的有效性。

该方法的具体步骤如下：步骤一，采用深度学习的方法，学习大量数据的通用特征，即将大量的训练数据放进去深度卷积神经网络中，通过大规模数据进行训练，深度神经网络的卷积核能够获取通用的特征信息；步骤二，采用新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征，由于不同区域的数据分布是具有差异性的，采用批量标准化的机制实现新区域的自适应，提高预测模型的泛化能力；步骤三，采用多核学习方法将通用特征和差异特征进行融合，即采用多个核函数进行组合，每个核函数对应数据的不同特征空间，以便实现特征融合；同时利用各个基本和的特征映射能力，解决特征融合的问题；步骤四，采用循环神经网络实现碳排放数据的预测，从时间序列数据中截取四个时间序列数据，然后结合编码器对数据编码后，并获得语义编码。

所述步骤二的新区域在线数据的差异特征学习步骤如下：

1)首先，将新区域的数据放进去步骤一中已经训练好的深度学习神经网络中；

2)然后，深度学习神经网络中添加两层批量标准化层，分别在第t层隐含层前面和第t+1层隐含层后面；

3)接着，基于新区域在线少量数据，利用有监督学习进行神经网络最后一层参数的微调；

假设U是t-1层某个神经元的输出，那么经过批量标准化操作之后，批量标准化操作后某个神经元的计算值为：x＝WU+b；其中W和b是批量标准化操作层设置好的两个参数；由于前一层的神经元都经过线性变换值，需要对线性变换的数据进行标准化处理，那么需要对每一个神经元的线性变换值进行标准化激活处理后，才能成为批量标准化神经元的输入值；假设x^(k)为第k个神经元在某一个批量标准化操作所获得的线性变换值；E(x^(k))为各个隐含层神经元经过同一个批量标准化线性变换处理后的均值，

为各个隐含层神经元经过同一个批量标准化线性变换处理后的标准差；

该批量标准化神经元的输出值为：

4)最后，基于上述的深度学习网络将新区域的差异化特征进行提取。

所述步骤三的多核学习方法公式表示为：

本发明的自适应性和自学习性更高，数据训练时间较短，数据可信度较高，提高了数据的预测精度；其适合用于电力行业碳排放指数通过模型进行治理预测分析，及其同类方法的技术改进。

附图说明

图1是本发明的深度学习的工作原理方框图。

图2是本发明的深度学习神经网络中添加两层批量标准化层的工作原理图。

图3是图2的参数微调的工作原理图。

图4是本发明的采用循环神经网络实现碳排放数据预测的工作原理方框图。

具体实施方式

现结合附图，对本发明的具体实施步骤进行进一步的具体描述。

步骤一，采用深度学习的方法，学习大量数据的通用特征。为了实现碳排放指数的预测，将大量的训练数据放进去深度卷积神经网络中，通过大规模数据进行训练，深度神经网络的卷积核能够获取通用的特征信息，如图1所示。

步骤二，采用新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征。虽然微调节省新区域数据训练的时间，能提高学习精度，但是它是建立在源域核目标域数据分布的基础上，由于区域不一样，影响不同地区的碳排放指数计算的指标存在误差、扭曲、噪音和异常值的影响，上述指标包括电力碳排放总量指标、电力排放强度指标和零碳电能占比，因此不同区域的数据分布是具有差异性的。该方法采用批量标准化的机制实现新区域的自适应，提高预测模型的泛化能力。

所述新区域在线数据的差异特征学习步骤如下：

1)首先，将新区域的数据放进去步骤一中已经训练好的深度学习神经网络中。

2)然后，深度学习神经网络中添加两层批量标准化层，分别在第t层隐含层前面和第t+1层隐含层后面，具体如图2所示。

假设U是t-1层某个神经元的输出，那么经过批量标准化操作之后，批量标准化操作后某个神经元的计算值为：x＝WU+b；其中W和b是批量标准化操作层设置好的两个参数。由于前一层的神经元都经过线性变换值，需要对线性变换的数据进行标准化处理，那么需要对每一个神经元的线性变换值进行标准化激活处理后，才能成为批量标准化神经元的输入值。

假设x^(k)为第k个神经元在某一个批量标准化操作所获得的线性变换值；E(x^(k))为各个隐含层神经元经过同一个批量标准化线性变换处理后的均值，

为各个隐含层神经元经过同一个批量标准化线性变换处理后的标准差。那么最后，该批量标准化神经元的输出值为：

3)接着，基于新区域在线少量数据，利用有监督学习进行神经网络最后一层参数的微调。这一步基于获取在线数据的周期，对模型进行不断迭代和网络参数更新，这样的网络模型更加容易满足动态数据的要求，如图3所示。

步骤三，采用多核学习方法将通用特征和差异特征进行融合，即采用多个核函数进行组合，每个核函数对应数据的不同特征空间，以便实现特征融合；同时利用各个基本和的特征映射能力，解决特征融合的问题。所述步骤三的多核学习方法公式表示为：

步骤四，采用循环神经网络实现碳排放数据的预测，从时间序列数据中截取四个时间序列数据，然后结合编码器对数据编码后，并获得语义编码。这里需要强调的是，语义编码不是固定的，它是随着数据的不同而时刻改变。然后结合语义编码进行解码后，实现碳排放指数数据的预测，如图4所示。

该方法的创新点具体如下：1、利用大规模数据预训练模型进行通用特征提取，很大程度上利用了大规模数据的优势，学习到数据的通用特征快速锁定可信深度神经网络参数的变化范围，也能避免由于数据量过少所产生的网络过拟合的现象。2、采用批量标准化实现不同源域数据和目标域数据的处理，实现新区域自适应方法消除数据集的分布差异，应对传统数据无法被使用的问题。3、通过在线少量数据，利用有监督学习进行神经网络最后一层参数的微调，从而应对新的区域样本数据太少导致的数据建模精度不可信，数据训练时间过长的问题。4、采用多核学习的方法，将通用的特征和差异化特征进行学习，使得融合后的特征得到更好的表达，显著提高数据预测精度。

Claims

1.一种大数据融合碳排放治理、预测分析模型方法，其特征在于该方法利用大数据深度网络对数据进行预训练，采用深度学习的方法学习大量数据的通用特征；然后，采用批量标准化的机制对源域核目标域的数据分布进行一致性处理后，采用新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征；最后，通过多核学习的方法将通用特征和差异特征进行融合，基于循环神经网络设计一个数据预测模型。

2.根据权利要求1所述的大数据融合碳排放治理、预测分析模型方法，其特征在于该方法的具体步骤如下：步骤一，采用深度学习的方法，学习大量数据的通用特征，即将大量的训练数据放进去深度卷积神经网络中，通过大规模数据进行训练，深度神经网络的卷积核能够获取通用的特征信息；步骤二，采用新区域的数据对网络参数进行微调，进而学习新区域在线数据的差异特征，由于不同区域的数据分布是具有差异性的，采用批量标准化的机制实现新区域的自适应，提高预测模型的泛化能力；步骤三，采用多核学习方法将通用特征和差异特征进行融合，即采用多个核函数进行组合，每个核函数对应数据的不同特征空间，以便实现特征融合；同时利用各个基本和的特征映射能力，解决特征融合的问题；步骤四，采用循环神经网络实现碳排放数据的预测，从时间序列数据中截取四个时间序列数据，然后结合编码器对数据编码后，并获得语义编码。

3.根据权利要求2所述的大数据融合碳排放治理、预测分析模型方法，其特征在于所述步骤二的新区域在线数据的差异特征学习步骤如下：

该批量标准化神经元的输出值为：

4.根据权利要求2所述的大数据融合碳排放治理、预测分析模型方法，其特征在于所述步骤三的多核学习方法公式表示为：