CN116757369A

CN116757369A - 一种基于注意力机制的碳排放分析方法及系统

Info

Publication number: CN116757369A
Application number: CN202311055416.9A
Authority: CN
Inventors: 王平欣; 荆臻; 张志�; 王清; 李琮琮; 朱红霞; 陈祉如; 赵曦; 马俊; 杜艳; 曹彤; 董贤光; 孙凯; 李骁; 刘丽君; 王兆军
Original assignee: Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Current assignee: Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority date: 2023-08-22
Filing date: 2023-08-22
Publication date: 2023-09-15
Anticipated expiration: 2043-08-22
Also published as: CN116757369B

Abstract

本发明属于碳排放计算技术领域，具体公开了一种基于注意力机制的碳排放分析方法及系统，方法包括：基于各类能源发电数据，分别得到每一类能源发电的局部时序特征向量和全局时序特征向量；通过特征融合得到对应能源发电的时序特征；基于各类能源的上下文特征进行自监督学习，得到预训练的基础模型；基于不同的训练数据集对基础模型进行训练，得到对应的训练好的下游任务模型；获取不同能源发电的电力数据，利用训练好的下游任务模型，完成下游任务预测；本发明基于同一个基础模型，通过不同训练数据集的训练，能够实现碳排放预测、能源消耗预测和各类能源占比预测，从而实现发电模式自感知。

Description

一种基于注意力机制的碳排放分析方法及系统

技术领域

本发明涉及碳排放计算技术领域，尤其涉及一种基于注意力机制的碳排放分析方法及系统。

背景技术

近年来，电力系统逐渐成为碳排放的主要来源，目前对电力系统的碳排放计算主要包括宏观统计法和碳流分析法。

宏观统计法从宏观数据出发，统计一段时间内的能源消耗总量，由于计算简单、使用方便等优点，因此被广泛应用于较长时间跨度的碳排放计算。但其提供的计算结果不能及时反馈且宏观计算较为粗略，无法细致描述指标的变化过程，导致无法精确地追踪碳排放的流向。碳流分析法是一种基于功率分布的碳流追踪方法，确定电网中的功率分布，与碳排放强度相结合，然后将碳排放平摊到各个节点、支路和损耗上，从而实现碳排放流向的追踪溯源。虽然碳流分析法经过了多年的发展和完善，但仍有一定的改进空间。

首先，一部分碳流方法在面对有损网络时会产生较大的计算误差，现有的碳流计算方法容易出现分摊不均的情况；其次，大部分碳流分析法本质上属于静态，未能考虑负荷、新能源波动以及不定因素产生的额外碳排放计算。

发明内容

为了解决上述问题，本发明提出了一种基于注意力机制的碳排放分析方法及系统，基于各类能源发电数据，通过自监督学习方式实现对基础模型的预训练，然后通过不同的训练数据集训练得到不同的下游任务模型，实现对下游任务的预测。

在一些实施方式中，采用如下技术方案：

一种基于注意力机制的碳排放分析方法，包括：

基于各类能源发电数据，分别得到每一类能源发电的局部时序特征向量和全局时序特征向量；

对每一类能源发电的局部时序特征向量和全局时序特征向量进行融合，得到对应能源发电的时序特征；

利用得到的时序特征经过自注意力机制获得各类能源的权重分数，然后与各类能源发电的时序特征相乘，输出各类能源的上下文特征；基于上下文特征进行自监督学习，得到预训练的基础模型；

基于不同的训练数据集对基础模型进行训练，得到对应的训练好的下游任务模型；获取不同能源发电的电力数据，利用训练好的下游任务模型，完成下游任务预测；所述下游任务预测至少包括碳排放预测。

所述下游任务预测还包括：能源消耗预测或各类能源占比预测。

作为进一步的方案，所述各类能源发电数据，具体包括：

基于碳能源发电数据、基于水力发电数据、基于风力发电数据、基于光伏发电数据和基于生物质能发电数据。

作为进一步的方案，得到各类能源发电的时序特征，具体过程为：

利用卷积神经网络和注意力机制分别进行特征表示学习，得到每一类能源发电数据基于局部窗口视角下的时序特征表示和基于全局窗口视角下的时序特征表示；

通过窗口注意力机制分别得到每一类能源发电数据的局部时序特征向量和全局时序特征向量；

将每一类能源发电数据的局部时序特征向量和全局时序特征向量进行融合，经过门控机制和归一化，得到每一类能源发电数据的时序特征。

作为进一步的方案，基于不同的训练数据集对基础模型进行训练，得到训练好的下游任务模型，所述下游任务模型为碳排放预测模型、能源消耗预测模型或者能源占比预测模型；

对于碳排放预测模型，训练数据集为用户实际的碳排放量；对于能源消耗预测模型，训练数据集为用户用电的能源消耗；对于能源占比预测模型，训练数据集为各类能源的占比。

作为进一步的方案，利用得到的时序特征经过自注意力机制获得各类能源的权重分数，具体过程为：

对于时序特征向量，分别乘系数矩阵得到查询向量和查询关键字，计算输入向量之间的相关性，然后通过softmax操作得到各类能源的权重分数。

在另一些实施方式中，采用如下技术方案：

一种基于注意力机制的碳排放分析系统，包括：

时序特征提取模块，用于基于各类能源发电数据，分别得到每一类能源发电的局部时序特征向量和全局时序特征向量；

时序特征融合模块，用于对每一类能源发电的局部时序特征向量和全局时序特征向量进行融合，得到对应能源发电的时序特征；

基础模型训练模块，用于利用得到的时序特征经过自注意力机制获得各类能源的权重分数，然后与各类能源发电的时序特征相乘，输出各类能源的上下文特征；基于上下文特征进行自监督学习，得到预训练的基础模型；

下游任务预测模块，用于基于不同的训练数据集对基础模型进行训练，得到对应的训练好的下游任务模型；获取不同能源发电的电力数据，利用训练好的下游任务模型，完成下游任务预测；所述下游任务预测至少包括碳排放预测。

基于不同的训练数据集对基础模型进行训练，得到训练好的下游任务模型，所述下游任务模型为碳排放预测模型、能源消耗预测模型或者能源占比预测模型；

与现有技术相比，本发明的有益效果是：

（1）本发明以各类能源发电数据为基础，为了能够更好地捕获各类能源的时序特征，采用卷积神经网络和Transformer相结合，然后通过窗口注意力机制，得到局部和全局上的时序特征，然后经过特征融合和门控机制获得各类能源发电的时序特征。

（2）本发明利用时序特征和自注意力机制生成各类能源发电权重分数；然后将权重和时序特征相乘，得到各类能源发电的上下文特征，然后进行自监督学习；得到预训练的基础模型；在基础模型的计算上，基于不同的下游任务，选择不同的训练数据集对基础模型进行训练，得到相应下游任务预测模型。采用这种方法不需要对下游任务重新训练模型，减少了训练时间和计算资源的消耗。

（3）本发明基于同一个基础模型，通过不同训练数据集的训练，能够实现碳排放预测、能源消耗预测和各类能源占比预测，从而实现发电模式自感知。

本发明的其他特征和附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本方面的实践了解到。

附图说明

图1为本发明实施例中基于注意力机制的碳排放分析方法过程示意图；

图2为本发明实施例中基础模型的预训练过程示意图；

图3为本发明实施例中基础模型的自监督训练过程示意图；

图4为本发明实施例中基础模型的下游任务预测示意图。

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一

在一个或多个实施方式中，公开了一种基于注意力机制的碳排放分析方法, 结合图1，具体过程包括：

步骤（1）：基于各类能源发电数据，分别得到不同能源发电的局部时序特征向量和全局时序特征向量；

步骤（2）：对局部时序特征向量和全局时序特征向量进行融合，得到各类能源发电的时序特征。

对于上述步骤（1）和步骤（2），具体说明如下：

本实施例中，基于各类能源发电数据，同时采用卷积神经网络（ConvolutionalNeural Network，CNN）和Transformer相结合的方法，进行局部/全局特征学习，得到局部和全局的特征，然后采用窗口注意力机制（Window Attention）来挖掘特征之间更深层次的联系，得到局部和全局上的时序特征。

具体地，结合图2，各类能源发电数据，主要包括基于碳能源发电数据、基于水力发电数据、基于风力发电数据、基于光伏发电数据和基于生物质能发电数据，分别表示为。其中L表示数据长度，d表示维度。

本实施例中，五类能源发电数据，分别经过编码器#1、编码器#2、编码器#3、编码器#4和编码器#5；在每一个编码器中，分别利用一维卷积网络和注意力机制进行特征表示学习，得到基于局部窗口视角下的时序特征表示和全局窗口下的时序特征表示。然后采用局部-全局窗口注意力机制得到全局时序特征和局部时序特征，两种时序特征拼接后经过特征融合和门控机制去除冗余部分，最后经过归一化得到各类能源的发电数据的时序特征。

以基于碳能源发电数据的时序特征为例，基于碳能源发电数据经过编码器#1处理，需要经过如下过程：

①对基于碳能源发电数据，采用一维卷积神经网络提取局部时序特征表示，一维卷积网络模块由个卷积块层堆叠而成，单个卷积块层包括依次连接的一维卷积层、全连接层和层归一化；单个卷积块层的表示如下：

其中，表示一维卷积操作，∥表示拼接操作，卷积核/>，偏置/>；全连接层权重系数/>，偏置/>，表示单个全连接神经网络层，/>表示层归一化操作，/>、/>表示经过一维卷积层和全连接层后的中间量。

为了缓解梯度爆炸或消失，使用层归一化操作，层归一化定义为：

其中，假设x表示层归一化的输入，和/>是其均值和方差，/>是一个很小的数，防止除零。/>和/>分别代表缩放和平移的参数向量，和x维数相同。

②采用注意力机制获取基于碳能源发电数据的全局时序特征表示；

注意力模型（Transformer blocks）是一个基于多头自注意力的序列到序列模型，采用注意力模型提取不同能源发电的特征：

其中，表示权重参数矩阵，/>表示提取煤炭发电电力数据的查询向量，/>表示其关键字，/>表示对应值，/>表示向量维度。表示多头注意力机制的公式。

基于上述得到的局部时序特征表示和全局时序特征表示/>，采用局部-全局窗口注意力机制，充分学习得到局部时序特征和全局时序特征，然后经过特征融合和门控机制，去除冗余部分，经过归一化得到基于碳能源发电数据的时序特征。

具体地，首先将局部时序特征表示作为查询向量，通过注意力机制得到局部时序特征表示/>，并将所有行向量进行求和得到局部时序特征向量/>。

其中，表示权重参数向量，/>表示以局部时序特征表示/>作为查询向量，/>表示其关键字，/>表示对应值，/>表示向量维度，/>表示时序特征长度。

然后将全局时序特征表示作为查询向量，通过注意力机制得到全局时序特征矩阵/>，在矩阵第0维求和得到全局时序特征向量/>。

其中，表示权重参数矩阵，/>表示以全局时序特征表示作为查询向量，/>表示其关键字，/>表示对应值。

将局部时序特征向量和全局时序特征向量/>进行融合，得到基于碳能源发电数据的时序特征。具体融合过程如下：

其中，，*表示矩阵对应位置相乘，/>和/>分别表示煤炭发电类电力数据的局部时序特征向量和全局时序特征向量，输出/>为煤炭发电类电力数据的时序特征。

其余四类能源发电数据，分别经过编码器#2-编码器#5，按照与上述同样的方式，分别得到的水力发电电力数据的时序特征、风力发电电力数据的时序特征/>、光伏发电电力数据的时序特征/>和生物质电电力数据的时序特征/>；，为五种能源电力数据时序特征拼接后总数据的时序特征。

编码器#2-编码器#5的数据处理过程与编码器#1相同，不再赘述。

步骤（3）：本实施例中，基于图2中得到的各类能源发电的时序特征，采用类别感知模块中的能源类别感知自注意力机制（Self-Attention）获得各类能源的权重分配（注意力分数），然后与各类能源发电的时序特征相乘，输出各类能源的上下文特征，具体为：

。

其中，代表权重参数矩阵,TF表示五种电力数据时序特征拼接，/>表示以TF作为查询向量，/>表示查询关键字，/>表示向量维度，/>为不同发电模式下的电力数据分配权重，/>为权重中间量，/>为中间量的第/>列。

步骤（4）：基于上下文特征和原各类能源发电数据，利用自监督学习模块进行自监督学习，得到预训练的基础模型。

本实施例中，自监督学习模块的数据处理过程如图3所示，基于步骤（3）中得到的上下文特征，使用一个随机掩码矩阵（Labeling），将其与原矩阵(原能源发电数据)相乘进行标签化。

每一类能源发电数据对应一个自监督任务，以煤炭发电类电力数据为例，其自监督任务过程如下：

基于原碳能源发电数据和随机掩码矩阵/>，经过标签化得到/>。

将带权重的碳能源上下文特征与原矩阵数据（基于碳能源发电数据）进行拼接，为了使拼接后的维度与保持一致，让拼接后的数据经过FCLayer（全连接层），得到预测值:

其中，表示煤炭发电类电力数据的上下文特征，/>表示单个全连接神经网络层。

使用均方误差损失函数作为煤炭发电类电力数据的自监督损失；其他四类能源数据的自监督任务过程与上述过程相同，得到自监督损失分别为/>。

最终的自监督损失为不同发电模式下的均方差损失函数之和。

其中，表示标签实际值，/>表示标签预测值，L表示标签长度，d表示标签维度。

利用最终的自监督损失，即不同发电模式下的均方差损失函数之和，通过反向传播算法训练基础模型的参数，训练完成后，对预训练参数冻结，得到训练好的基础模型。

（5）基于不同的训练数据集对基础模型进行训练，得到训练好的下游任务模型；

具体地，对于碳排放预测模型，训练数据集为用户实际的碳排放量；对于能源消耗预测模型，训练数据集为用户用电的能源消耗；对于能源占比预测模型，训练数据集为各类能源的占比。

（6）获取不同能源发电的电力数据，利用训练好的下游任务模型，完成下游任务预测；所述下游任务预测至少包括碳排放预测、能源消耗预测和各类能源占比预测。

本实施例中，如图4所示，在进行任务预测过程中，不同发电模式下的电力数据（即不同能源发电的电力数据）经过预训练的编码器#1—编码器#5（Pre-trained Encoder）和预训练的类别感知模块（Category-aware block）得到不同发电模式下的电力数据的上下文信息/>。将五种上下文特征进行聚合后与原有的电力数据拼接，经过全连接层得到矩阵/>，为学习数据得到的中间表示向量。

然后分别对下一阶段的碳排放、电力消耗和各类能源发电量占比进行预测。

碳排放、电力消耗和各类能源发电量占比预测任务的输出分别为、和/>。

在模型训练过程中的损失仍然采用均方误差损失，然后对损失进行微调。

其中，和/>表示碳排放预测模型中实际标签值和预测标签值；/>和/>表示电力消耗预测模型中实际标签值和预测标签值；/>和/>表示能源占比预测模型中实际标签值和预测标签值。

为了验证本实施例基于基础模型训练得到的下游任务预测模型的性能，将本实例提出的方法与9个基线方法进行对比，实验结果如表1所示。实验结果表明，本实例提出的方法优于其他基线的方法。因为使用了预训练充分学习不同发电模式下电力数据的局部和全局时序特征，通过自监督学习挖掘不同发电模式下的潜在知识，从而提升了模型的性能。

表1 不同预测方法结果的比较

实施例二

在一个或多个实施方式中，公开了一种基于注意力机制的碳排放分析系统，包括：

时序特征提取模块，用于基于各类能源发电数据，分别得到不同能源发电的局部时序特征向量和全局时序特征向量；

时序特征融合模块，用于对局部时序特征向量和全局时序特征向量进行融合，得到各类能源发电的时序特征；

下游任务预测模块，用于基于不同的训练数据集对基础模型进行训练，得到训练好的下游任务模型；获取不同能源发电的电力数据，利用训练好的下游任务模型，完成下游任务预测；所述下游任务预测至少包括碳排放预测、能源消耗预测和各类能源占比预测。

需要说明的是，上述各模块的具体实现方式与实施例一中相同，不再详述。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于注意力机制的碳排放分析方法，其特征在于，包括：

2.如权利要求1所述的一种基于注意力机制的碳排放分析方法，其特征在于，所述下游任务预测还包括：能源消耗预测或各类能源占比预测。

3.如权利要求1所述的一种基于注意力机制的碳排放分析方法，其特征在于，所述各类能源发电数据，具体包括：

煤炭发电类电力数据、水力发电类电力数据、风力发电类电力数据、光伏发电类电力数据和生物质发电类电力数据。

4.如权利要求1所述的一种基于注意力机制的碳排放分析方法，其特征在于，所述得到对应能源发电的时序特征，具体过程为：

5.如权利要求1所述的一种基于注意力机制的碳排放分析方法，其特征在于，基于不同的训练数据集对基础模型进行训练，得到训练好的下游任务模型，所述下游任务模型为碳排放预测模型、能源消耗预测模型或者能源占比预测模型；

6.如权利要求1所述的一种基于注意力机制的碳排放分析方法，其特征在于，利用得到的时序特征经过自注意力机制获得各类能源的权重分数，具体过程为：

7.一种基于注意力机制的碳排放分析系统，其特征在于，包括：

8.如权利要求7所述的一种基于注意力机制的碳排放分析系统，其特征在于，所述下游任务预测还包括：能源消耗预测或各类能源占比预测。