CN115860281A

CN115860281A - 基于跨实体注意力的能源系统多实体负载预测方法和装置

Info

Publication number: CN115860281A
Application number: CN202310170296.0A
Authority: CN
Inventors: 王之宇; 张音捷; 白冰; 张兴明; 邹涛; 朱桢; 孙才俊; 黎海燕; 陈岱渊; 张奕鹏; 孙天宁; 徐昊天
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2023-02-27
Filing date: 2023-02-27
Publication date: 2023-03-28
Anticipated expiration: 2043-02-27
Also published as: CN115860281B

Abstract

本发明公开了一种基于跨实体注意力的能源系统多实体负载预测方法和装置，该方法包括以下步骤：首先对数据预处理，采用特征变量选择网络预测各个实体对特征的依赖性，并通过长短期记忆网络提取时间依赖信息；然后对实体编码；其次使用通过键值查询不同实体间的注意力，以对实体间的相互作用进行编码计算跨实体注意力；再将特征编码输出为负载预测值；通过以上步骤对负载预测网络模型进行训练学习，以获取最终的负载预测网络模型；最后将新的输入特征变量输入负载预测网络模型，即可获取负载预测值。本发明能够高效地对实体的时间特征进行建模并模拟实体间的相关性，量化一个时间窗口内多个实体之间的相关性，大幅提高各个实体负载预测的准确度。

Description

基于跨实体注意力的能源系统多实体负载预测方法和装置

技术领域

本发明涉及能源系统领域，尤其涉及一种基于跨实体注意力的能源系统多实体负载预测方法和装置。

背景技术

能源负载预测是能源系统调度和优化的一个重要组成部分。这种技术被归类为时间序列预测问题，使用以前的特征作为输入来估计未来的能源负载。现有用于负载预测方法有很多，常见的有：线性回归、指数平滑、支持向量机、决策树、进化算法等，上述方法过程复杂，要求建模人员具有很强的专业领域知识，并且传统模型非线性拟合能力和高维数据处理能力较差。近年来基于深度学习的神经网络逐渐成为研究主流。一般的神经网络网络模型可以拟合电力负载与相关变量间的复杂非线性关系，但是无法学习并利用负载时间序列数据中的时间依赖；循环神经网络可以利用时间依赖信息，提高负载预测结果的精度，但其对长期依赖学习时容易出现梯度爆炸或者梯度消失问题。现有研究对电力负载与其相关影响因素间的关系缺乏深入研究，亟待探究电力负载及其影响因素间的关系，同时对多实体的综合能源系统以及跨实体之间的负载联系研究较少。

注意力机制在自然语言处理、计算机视觉等领域取得广泛的应用，其全局自注意力机制帮助模型获得输入数据间的相关程度，同时支持大规模并行计算，大幅提高了计算效率。本发明提出了一个名为跨实体时间融合Transformer（Cross-entity TemporalFusion Transformer，CETFT）的神经网络模型，它利用跨实体的注意力机制来模拟实体间的相关性。这个增强的注意力模块可以描述一个时间窗口内多个实体之间的关系，并告知解码器应该集中在编码器的哪个实体上。为了降低计算的复杂性，不同实体中通过同一个共享变量选择网络提取特征。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于跨实体注意力的能源系统多实体负载预测方法和装置。本发明能够提高预测的准确率，同时有助于降低计算复杂度。

本发明的目的是通过以下技术方案来实现的：本发明实施例第一方面提供了一种基于跨实体注意力的能源系统多实体负载预测方法，包括以下步骤：

（1）对输入数据进行预处理：根据输入数据的特征类别对各个实体的输入数据进行不同的处理，根据可用性将输入的特征变量分为已知特征和未知特征，所述特征类别包括连续特征和离散特征，将连续特征进行归一化处理，使用实体嵌入层将离散特征映射为连续向量；

（2）实体编码：将所述步骤（1）预处理后的输入数据依次通过特征变量选择网络和长短期记忆网络，以将每个实体生成一个表示其所有时刻状态的编码向量；

（3）跨实体注意力计算：根据键矩阵、查询矩阵和价值矩阵以及所述步骤（2）获取的每个实体的编码向量计算单个实体的自注意力值，并对其进行扩展，以获取不同实体间的跨实体注意力值；

（4）将跨实体注意力值通过门控残差网络提取特征，并通过全连接层输出预测周期内的各个实体的能源负载值；

（5）采集能源系统的输入特征变量和能源负载值对负载预测网络模型进行训练，以获取最终的负载预测网络模型；其中，所述负载预测网络模型包括所述步骤（2）中的实体编码网络、所述步骤（3）中的跨实体注意力网络、所述步骤（4）中的门控残差网络和全连接层；

（6）将新采集的输入特征变量输入到最终的负载预测网络模型中，以获取能源负载预测值。

可选地，所述已知特征为在预测时间之前能提前确定的特征，所述未知特征为在预测时间之前无法提前确定的特征。

可选地，所述步骤（2）具体为：采用特征变量选择网络预测各个实体对特征变量的依赖性并据此进行特征选择，以获取特征选择后的特征向量；将过去时刻的全部特征输入长短期记忆网络的编码器，将未来时刻的已知特征输入长短期记忆网络的解码器，为每个实体生成表示其所有时刻状态的编码向量。

可选地，所述步骤（2）包括以下子步骤：

（2.1）在经过对输入数据预处理的基础上，令E为综合能源系统中的实体数量，将第i个实体在t时刻的特征变量以向量形式表示，表示为

或/>

，其中，/>

表示已知特征向量部分，/>

表示未知特征向量部分，/>

表示当前时间；并将第i个实体在t时刻的特征变量的集合表示为/>

，且经过预处理后/>

所含元素数量为/>

，其中，/>

和/>

分别表示第i个实体未知特征变量的数量和已知特征变量的数量；

（2.2）利用特征变量的特征选择权重对向量形式表示的特征变量

进行特征选择，以获取特征选择后的特征向量/>

；

（2.3）将满足

的特征向量/>

输入长短期记忆网络的编码器，将满足

的特征向量/>

输入长短期记忆网络的解码器，将属于第i个实体的特征向量

按照时间顺序串联连接为长向量，以获取实体对时间序列特征的编码向量/>

。

可选地，所述步骤（3）包括以下子步骤：

（3.1）根据键矩阵K、查询矩阵Q和价值矩阵V以及所述步骤（2）获取的每个实体的编码向量

计算单个实体的自注意力值；/>

（3.2）根据自注意力值将单个实体的自注意力模块扩展为跨实体注意力模块，计算不同实体间的跨实体注意力值。

可选地，所述步骤（4）包括以下子步骤：

（4.1）将跨实体注意力值输入到门控残差网络中，以提取特征，对特征向量进一步加工；

（4.2）将所述步骤（4.1）获取到的特征向量通过全连接层，以输出预测周期内的各个实体的能源负载值。

可选地，所述步骤（5）包括以下子步骤：

（5.1）采集综合能源系统一段时间内各个实体的输入特征变量和能源负载值；

（5.2）对负载预测网络模型的参数进行随机初始化，以获取负载预测网络模型；

（5.3）将所述步骤（5.1）采集到的输入特征变量输入到负载预测网络模型中，以获取第i个实体在时刻t的能源负载预测值；

（5.4）根据能源负载预测值和所述步骤（5.1）采集到的能源负载值计算对称平均绝对百分比误差；根据对称平均绝对百分比误差对负载预测网络模型的参数进行调整，以减小对称平均绝对百分比误差；将负载预测网络模型的参数返回负载预测网络模型，以更新负载预测网络模型；

（5.5）重复所述步骤（5.3）-所述步骤（5.4），直至对称平均绝对百分比误差不再降低，以获取最终的负载预测网络模型。

可选地，所述负载预测网络模型的参数包括实体编码网络、跨实体注意力网络、门控残差网络和全连接层的权重、偏置。

本发明实施例第二方面提供了一种基于跨实体注意力的能源系统多实体负载预测装置，包括一个或多个处理器，用于实现上述的基于跨实体注意力的能源系统多实体负载预测方法。

本发明实施例第三方面提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，用于实现上述的基于跨实体注意力的能源系统多实体负载预测方法。

本发明的有益效果是，本发明综合考虑能源系统中多个实体间的相关性，提出了跨实体注意力机制，有效提高了负载预测精度；针对各个实体在同一时刻共享大量特征的特点，提出了共享特征变量选择网络，有效降低了计算复杂度。

附图说明

图1为跨实体时间融合Transformer网络结构图；

图2为能源系统多实体负载预测过程示意图；

图3为跨实体注意力掩码图；

图4为门控线性单元计算过程示意图；

图5为本发明中的基于跨实体注意力的能源系统多实体负载预测装置的一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的基于跨实体注意力的能源系统多实体负载预测方法的最终目标是通过跨实体注意力机制将各个实体间的电力能量负载进行关联，提高对于综合能源系统中各个实体的电量负载预测的精度。实体由于存在用电量为0或者负数（即光伏发电量大于用电量），平均绝对百分误差无法用于衡量模型预测精度，因此本发明采用对称平均绝对百分比误差（Symmetric Mean Absolute Percentage Error，SMAPE）衡量模型预测精度，上述问题可由下式表示：

其中，

表示第i个实体在t时刻的电力能量负载实际值，/>

表示第i个实体在t时刻的模型对于电力能量负载预测值，n表示预测的时刻的数量，E表示综合能源系统中的实体数量。本发明的目的即为通过模型产生对电力能量负载/>

的估计值/>

，使得SMAPE最小。

该基于跨实体注意力的能源系统多实体负载预测方法，如图1所示，包括以下步骤：

（1）对输入数据进行预处理：根据输入数据的特征类别对各个实体的输入数据进行不同的处理，根据可用性进一步将输入的特征变量分为已知特征和未知特征。其中，特征类别包括连续特征和离散特征，将连续特征进行归一化处理，使用实体嵌入层将离散特征映射为连续向量。

实体嵌入层通过查表得到离散特征的每一个可能取值所对应的特征向量，称之为嵌入向量。离散变量经过嵌入处理得到的嵌入向量可以看作由多个连续变量组成的向量，因此使用与连续变量相同的方式进行后续处理。

应当理解的是，实体嵌入为一种可学习的映射，输入为离散特征值，输出为所对应的向量。

本实施例中，已知特征为在预测时间之前能提前确定的特征，未知特征为在预测时间之前无法提前确定的特征。如表1所示，显示为电力能量负载预测所使用的时间与天气特征的分类。

表1：实体特征变量信息

特征变量	特征类型	特征可知性
			是否为假期	离散特征	已知特征
日期	离散特征	已知特征
			小时	离散特征	已知特征
星期	离散特征	已知特征
			月份	离散特征	已知特征
云型	离散特征	未知特征
			水平漫反射辐照度	连续特征	未知特征
法向直接辐照度	连续特征	未知特征
			水平总辐照度	连续特征	未知特征
晴朗天气时漫反射辐照度	连续特征	未知特征
			晴朗天气时法向直接辐照度	连续特征	未知特征
晴朗天气时水平总辐照度	连续特征	未知特征
			露点温度	连续特征	未知特征
气温	连续特征	未知特征
			压强	连续特征	未知特征
相对湿度	连续特征	未知特征
			太阳天顶角	连续特征	未知特征
可降水	连续特征	未知特征
			风向	连续特征	未知特征
风速	连续特征	未知特征
			负荷	连续特征	未知特征/预测目标

（2）实体编码：将步骤（1）预处理后的输入数据依次通过特征变量选择网络和长短期记忆网络，以将每个实体生成一个表示其所有时刻状态的编码向量。具体地，采用特征变量选择网络预测各个实体对特征变量的依赖性并据此进行特征选择，以获取特征选择后的特征向量；将过去时刻的全部特征输入长短期记忆网络的编码器，将未来时刻的已知特征输入长短期记忆网络的解码器，为每个实体生成表示其所有时刻状态的编码向量。

本实施例中，特征变量选择网络为一组对应于输入特征的神经网络，数量等于特征总数，输入为经过预处理的特征向量，特征变量选择网络根据特征重要性对其进行加权求和后输出，可以获取特征选择后的特征向量。其中，综合能源系统中多实体预测过程如图2所示。

或/>

，其中，/>

表示已知特征向量部分，/>

表示未知特征向量部分，/>

表示当前时间，/>

表示特征变量组成的向量；并将第i个实体在t时刻的特征变量的集合表示为/>

，且经过预处理后/>

所含元素数量为/>

，其中，/>

和/>

分别表示第i个实体未知特征变量的数量和已知特征变量的数量。

进行特征选择，以获取特征选择后的特征向量/>

。

输入的多个特征变量可能存在对性能产生负面影响的不必要的噪声输入，利用对特征变量的权重的估计对向量形式表示的特征变量进行变量选择，通过在有效突出特征上学习来提升模型的性能。特征选择后的特征向量的表达式为：

其中，

为特征选择后的特征向量，j表示输入元素变量/>

在特征向量

中的位置，且j是集合/>

的一个元素，/>

是特征选择权重，且特征选择权重

对应于输入元素变量/>

。

综合能源系统中在同一时间段下实体之间存在共享相同特征，如时间特征、天气特征、地理信息特征。将对应于同一个特征变量

的特征选择权重/>

在实体之间共享，以减少网络的复杂性。

特征选择权重

的计算方式为：

其中，exp为以e为底的指数函数，

表示第j个输入元素变量，/>

为对应于输入元素变量/>

的门控残差网络，Softmax表示归一化指数函数。

如图4所示，表示为门控残差网络的计算过程。为了表达方便，将对应于

的门控残差网络简记为/>

，将其输入的元素变量值/>

简记为z，则

的表达式为：

其中，GLU为门控线性单元，LayerNorm为归一化层，z表示模型输入，

为门控残差网络所对应的特征变量。

进一步地，GLU的计算方式为：

z为函数的输入，

、/>

、/>

、/>

为可学习的参数，G、R代表两个不同的网络层，/>

为特征选择网络对应的特征变量，/>

为G网络的权重，/>

为G网络的偏置，/>

为R网络的权重，/>

为R网络的偏置，/>

为向量点积（

，其中，/>

、/>

分别为/>

、/>

中的i维向量），/>

为乙状激活函数，该函数对输入向量的每个元素作如下运算：

其中，

。

将输入特征变量

按照特征选择网络输出的对应于每个特征变量的特征选择权重/>

加权求和，得到实体筛选后的特征向量/>

，表示为：

由此为每个不同时刻t不同实体i生成了长度相同的特征向量

，作为长短期记忆网络的编码器以及解码器的输入。

（2.3）将满足的特征向量作为长短期记忆网络的编码器的输入，将满足的特征向量作为长短期记忆网络的解码器的输入，然后将属于第i个实体的特征向量串联连接为长向量，作为长短期记忆网络对实体时间序列特征的编码向量。其中，特征向量的连接方式为：

按照时间顺序将每个时刻的向量依次连接并合并成一个一维向量，其中

为所有向量时刻的最小值，/>

为所有向量时刻的最大值。

（3）跨实体注意力计算：根据键矩阵、查询矩阵和价值矩阵以及步骤（2）获取的每个实体的编码向量计算单个实体的自注意力值，并对其进行扩展，以获取不同实体间的跨实体注意力值。

（3.1）对于单个实体，使用自注意力计算来实现时间特征的进一步提取。由固定的一组键矩阵K、查询矩阵Q、以及价值矩阵V完成，得到实体不同时刻间特征的相关程度，即自注意力值，上述过程可由下式进行表示：

其中，

表示单个实体的自注意力值，/>

结果为相似度，/>

是K的维度，M为掩码矩阵，softmax为归一化指数函数，/>

为矩阵点乘，/>

、

为输入的两个向量矩阵，分别为长短期记忆网络的解码器对实体/>

和实体/>

时间序列特征的编码向量，/>

、/>

、/>

分别为键矩阵K、查询矩阵Q、价值矩阵V的权值。应当理解的是，/>

、/>

、/>

为三个矩阵，可以通过学习获得。

对于时间序列的预测，编码部分模型可以观察到所有的信息，而为了防止信息泄露，解码部分模型只能观察到当前时刻之前采集到的信息。因此使用一个单实体注意力掩码矩阵来控制变量的时间可知性，其形状为直角梯形，上底和下底的长度分别等于编码向量的大小和所有向量的大小，表示为：

其中，M表示掩码矩阵，掩码矩阵中的元素

表示第i个实体与第j个实体之间的掩码，L表示编码长度，H表示解码长度。

（3.2）如图3所示，为了对实体间的相关关系进行建模，将原本单一的自注意力模块扩展为跨实体注意力模块。实体不再只对自身进行注意力计算，其也会与同一时刻下的其他实体进行注意力计算，将原本的局部自注意力扩大为全局注意力，获得更多的实体间信息与相关程度。注意力公式扩展为：

其中，

表示扩大的全局注意力值，/>

表示随着注意力扩大的查询矩阵，/>

表示随着注意力扩大的键矩阵，/>

表示随着注意力扩大的价值矩阵，/>

表示

矩阵的转置，/>

是/>

的维度，/>

为随着注意力扩大的掩码矩阵，可由下式表示：

其中，掩码矩阵

中的元素/>

表示表示第i个实体与第j个实体之间的掩码，mod为取模操作。

通过自注意力计算对每个实体i的特征编码向量

进行了进一步处理，得到注意力输出值/>

，总而得到表示实体i特征的矩阵，其每一行表示不同时刻t的特征向量。

（4）输出：将跨实体注意力值通过门控残差网络进一步提取特征，并通过全连接层输出预测周期内的各个实体的能源负载值。

（4.1）将跨实体注意力值输入到门控残差网络中，使用门控残差网络对特征向量进行进一步加工：

其中，z为函数输入，即为步骤（3）得到的注意力输出值

；/>

、/>

、

、/>

为可学习的参数，下标A表示该门控残差网络用于加工注意力输出值，

为G网络的权重，/>

为G网络的偏置，/>

为R网络的权重，/>

为R网络的偏置，/>

为向量点积（/>

，其中，/>

、/>

分别为/>

、/>

中的i维向量），/>

其中，

。/>

门控残差网络的输出为加工后的矩阵

，其每一行表示不同时刻t的特征向量。

（4.2）将步骤（4.1）获取到的特征向量通过全连接层，以输出网络预测周期内的各个实体的能源负载值。

本实施例中，使用全连接层将每一实体每一时刻的特征向量转换为对应的输出负载预测值。全连接层为一种神经网络层，其输入的每个元素和输出的每个元素间均有连接，其中输入为门控残差网络的输出，即通过门控残差网络加工后的矩阵

，输出为不同时刻t不同实体i的能源负载值。

（5）采集能源系统的输入特征变量和能源负载值对负载预测网络模型进行训练，以获取最终的负载预测网络模型。

本实施例中，该能源系统多实体负载预测方法所对应的负载预测网络模型包含有实体编码网络、跨实体注意力网络、门控残差网络和全连接层，均为神经网络模块，其权重W和偏置b均为可学习的参数。

（5.1）为了对参数进行学习，首先采集综合能源系统一段时间内各个实体的数据，包括输入特征变量和能源负载值，并按照输入特征变量的定义将其按照时刻和实体整理为结构化数据。

（5.2）对负载预测网络模型的可学习的参数进行随机初始化，即：对实体编码网络、跨实体注意力网络、门控残差网络和全连接层的权重、偏置进行随机初始化，以获取负载预测网络模型。

本实施例中，负载预测网络模型包括实体编码网络、跨实体注意力网络、门控残差网络和全连接层。负载预测网络模型的参数包括实体编码网络、跨实体注意力网络、门控残差网络和全连接层的权重、偏置。

（5.3）将步骤（5.1）采集到的输入特征变量输入负载预测网络模型中可以得到负载预测网络模型对第i个实体在时刻t的能源负载预测值，即电力能量负载预测值

。

（5.4）根据能源负载预测值和步骤（5.1）采集到的能源负载值计算对称平均绝对百分比误差，即计算电力能量负载预测值与真实值的对称平均绝对百分比误差（SymmetricMean Absolute Percentage Error，SMAPE），其表达式为：

其中，

表示第i个实体在时刻t的电力能量负载实际值，/>

表示第i个实体在时刻t的模型对于电力能量负载预测值，n表示预测的时刻的数量，E表示综合能源系统中的实体数量。

学习过程为迭代过程，每一轮迭代中根据SMAPE的值对实体编码网络、跨实体注意力网络、门控残差网络、全连接层的权重W和偏置b进行调节，使得SMAPE降低。同时将实体编码网络、跨实体注意力网络、门控残差网络、全连接层的权重W和偏置b返回负载预测网络模型，以更新负载预测网络模型。

（5.5）重复步骤（5.3）-步骤（5.4），迭代足够多的次数，直到SMAPE不再降低，保存以上可学习的参数，得到学习完成的模型，即最终的负载预测网络模型。

（6）将新采集的输入特征变量输入到最终的负载预测网络模型中，即可输出对于未来时刻电力能量负载的预测值，即对应的能源负载预测值。

与前述基于跨实体注意力的能源系统多实体负载预测方法的实施例相对应，本发明还提供了基于跨实体注意力的能源系统多实体负载预测装置的实施例。

参见图5，本发明实施例提供的一种基于跨实体注意力的能源系统多实体负载预测装置，包括一个或多个处理器，用于实现上述实施例中的基于跨实体注意力的能源系统多实体负载预测方法。

本发明基于跨实体注意力的能源系统多实体负载预测装置的实施例可以应用在任意具备数据处理能力的设备上，该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图5所示，为本发明基于跨实体注意力的能源系统多实体负载预测装置所在任意具备数据处理能力的设备的一种硬件结构图，除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能，还可以包括其他硬件，对此不再赘述。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明实施例还提供一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现上述实施例中的基于跨实体注意力的能源系统多实体负载预测方法。

所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元，例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备，例如所述设备上配备的插接式硬盘、智能存储卡（Smart Media Card，SMC）、SD卡、闪存卡（Flash Card）等。进一步的，所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据，还可以用于暂时地存储已经输出或者将要输出的数据。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于跨实体注意力的能源系统多实体负载预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于跨实体注意力的能源系统多实体负载预测方法，其特征在于，所述已知特征为在预测时间之前能提前确定的特征，所述未知特征为在预测时间之前无法提前确定的特征。

3.根据权利要求1所述的基于跨实体注意力的能源系统多实体负载预测方法，其特征在于，所述步骤（2）具体为：采用特征变量选择网络预测各个实体对特征变量的依赖性并据此进行特征选择，以获取特征选择后的特征向量；将过去时刻的全部特征输入长短期记忆网络的编码器，将未来时刻的已知特征输入长短期记忆网络的解码器，为每个实体生成表示其所有时刻状态的编码向量。

4.根据权利要求3所述的基于跨实体注意力的能源系统多实体负载预测方法，其特征在于，所述步骤（2）包括以下子步骤：