CN117575672A

CN117575672A - 一种基于时空特征迁移学习的行业电量预测方法、装置

Info

Publication number: CN117575672A
Application number: CN202311518645.XA
Authority: CN
Inventors: 鞠默欣; 唐伟宁; 孔凡强; 刘宝铭; 刘俐君; 刘璐; 曲丽; 刘钊瑞; 闫楠楠; 丁强; 宋昊燃; 周雨馨
Original assignee: Marketing Service Center Of State Grid Jilin Electric Power Co ltd
Current assignee: Marketing Service Center Of State Grid Jilin Electric Power Co ltd
Priority date: 2023-11-15
Filing date: 2023-11-15
Publication date: 2024-02-20

Abstract

本发明公开了一种基于时空特征迁移学习的行业电量预测方法、装置，包括：利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据；根据采集到的目标行业用电数据，利用余弦相似度算法从带行业类别标签的源域数据提取目标行业的近邻集；根据目标行业用电数据和目标行业的近邻集，利用行业时空用电特征迁移提取器提取目标行业时空用电特征；根据目标行业用电数据和目标行业时空用电特征，利用多核支持向量回归模型进行电量预测，得到目标行业的电量预测结果。本发明能够实现新型电力系统分行业电量预测拟合。

Description

一种基于时空特征迁移学习的行业电量预测方法、装置

技术领域

本发明涉及一种基于时空特征迁移学习的行业电量预测方法、装置，属于电力系统电量预测技术领域。

背景技术

电力系统的发电、输电、变电、配电以及用电五个基本环节间高度耦合，相互间处于动态平衡的关系，大规模的电力能源的生产传输无法实现长时间的存储，电力能源生产过剩或不足的情况时有发生。因此，根据电量预测的变化实时调整电力系统，保证电力系统各环节间的动态平衡，是保证电力系统高效运转的重要前提。电量预测不仅关系到电力系统对其电力调度的日程安排，还将作为电力市场交易计量及电力网络区域建设等的重要考量因素，为电力系统的日常运行、规划管理等多项工作提供参考依据。因此精确的电量预测结果不仅为电力系统规划调度的合理性、准确性提供保障，还能进一步促进网络的安全稳定运行，并为配电系统中的分布式电源布点规划及其网架构造和规模大小的确定提供指导。因此，电量预测已经成为现代化新型电力系统运行和管理中的一个重要研究领域。

不同用电行业(如大工业、商业、居民等)具有不同的用电特性，且各行业处于不同经济社会发展阶段时其用电发展特性会出现波动变化。伴随我国经济发展进入新常态，产业结构转型不断加速，用电特性波动将进一步加剧。将所有用电行业视为一个整体的传统预测模型忽略了不同用电行业的内在特性，其电量预测结果容易出现较大误差，现有粗放型预测算法已无法满足新型电力系统的精细化预测要求。

发明内容

为了解决现有技术中存在的问题，本发明提出了一种基于时空特征迁移学习的行业电量预测方法、装置，采用基于密度的无监督聚类算法赋予源域数据行业类别标签，利用目标行业的近邻数据辅助模型训练，迁移学习得到目标行业时空用电特征，从而基于目标行业时空用电特征实现新型电力系统的分行业精细化电量预测，提高电量预测的准确率。

为解决上述技术问题，本发明采用了如下技术手段：

第一方面，本发明提出了一种基于时空特征迁移学习的行业电量预测方法，包括如下步骤：

利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据；

根据采集到的目标行业用电数据，利用余弦相似度算法从所述带行业类别标签的源域数据提取目标行业的近邻集；

根据所述目标行业用电数据和所述目标行业的近邻集，利用行业时空用电特征迁移提取器提取目标行业时空用电特征；

根据所述目标行业用电数据和所述目标行业时空用电特征，利用多核支持向量回归模型进行电量预测，得到目标行业的电量预测结果。

结合第一方面，进一步的，所述利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据，包括：

(1)设电力系统的源域数据为对象集合D，对象集合D中每个对象表示源域数据中一条用电数据；将对象集合D中所有对象p_i标记为未访问状态，并初始化核心对象集合

(2)从对象集合D中随机选择一个处于未访问状态且不属于任何一个簇的对象p_i，将对象p_i标记为已访问状态；

(3)计算对象p_i的邻域内对象的数量N_Eps(p_i)：

N_Eps(p_i)＝{p_j|p_j∈D,j≠i,distance(p_i,p_j)≤Eps}

其中，distance(p_i,p_j)表示对象集合D中对象p_i与对象p_j之间的距离，Eps为预设的邻域半径；

(4)若N_Eps(p_i)小于预设的对象个数MinPts，则返回步骤(2)；若N_Eps(p_i)不小于MinPts，则对象p_i为核心对象，新建簇H_pi，令将对象p_i及其邻域中所有不属于任何一个簇的对象加入簇H_pi；

(5)从簇中任意选取一个对象q，计算对象q的邻域内对象的数量N_Eps(q)；若N_Eps(q)小于MinPts，则检测簇/>中下一个对象；若N_Eps(q)不小于MinPts，则对象q为核心对象，令/>进入步骤(6)；

(6)遍历对象q邻域内的所有对象Λ，若对象Λ处于未访问状态，则将对象Λ标记为已访问状态，并将对象Λ添加到簇中，返回步骤(5)；若对象Λ处于已访问状态但不属于任何一个簇，将对象Λ添加到簇/>中，返回步骤(5)；

(7)重复步骤(2)～步骤(6)，直到对象集合D中不存在处于未访问状态且不属于任何一个簇的对象，输出所有聚类后的簇；

(8)根据核心对象集合计算每个簇中核心对象的特征向量，将每个簇中核心对象的特征向量作为该簇的行业类别标签，得到带行业类别标签的源域数据。

结合第一方面，进一步的，所述利用余弦相似度算法从所述带行业类别标签的源域数据提取目标行业的近邻集，包括：

根据所述带行业类别标签的源域数据，获取每个行业类别的源域数据的属性向量；

根据目标行业的用电数据，获取目标行业的属性向量，所述属性向量包括温度、湿度、风速、扩散通量和用电量；

利用余弦相似度算法计算每个行业类别的属性向量与目标行业的属性向量之间的相似度；

将相似度大于阈值的带行业类别标签的源域数据作为目标行业的近邻数据，得到目标行业的近邻集。

结合第一方面，进一步的，利用目标行业的近邻集对行业时空用电特征迁移提取器进行训练，得到针对目标行业的行业时空用电特征迁移提取器；利用针对目标行业的行业时空用电特征迁移提取器处理目标行业的用电数据，进行特征迁移学习，得到目标行业时空用电特征。

结合第一方面，进一步的，所述行业时空用电特征迁移提取器包括空间特征提取模型和时间特征提取模型，其中，所述空间特征提取模型采用卷积神经网络，所述时间特征提取模型采用双向门控循环单元和多头自注意力机制；

通过所述空间特征提取模型提取目标行业的空间特征，通过所述时间特征提取模型提取目标行业的时间特征，将目标行业的空间特征和时间特征合并得到目标行业时空用电特征。

结合第一方面，进一步的，所述时间特征提取模型包括三个门控循环单元层和一个多头自注意力机制；所述时间特征提取模型的第一层设置为双向门控循环单元层，用于提取用电数据沿正向和反向维度的位置特征；所述时间特征提取模型的第二层设置为多头自注意力机制层，用于对双向门控循环单元层的输出特征的维度权重进行汇总；在所述时间特征提取模型的第三层和第四层均设置为单向门控循环单元层，用于提取多头自注意力机制层输出矩阵的特征。

结合第一方面，进一步的，所述多核支持向量回归模型的表达式为：

其中，s为目标行业用电数据的总数，K(x_m,x_j)表示多核支持向量回归模型的核函数，x_m为第m个输入的目标行业用电数据及目标行业时空用电特征，y_m为第m个输出的目标行业电量预测值，α_m和分别为第m个输入对应的拉格朗日系数，ε为样本惩罚参数，C为惩罚因子。

结合第一方面，进一步的，利用粒子群优化算法对多核支持向量回归模型的参数进行优化，包括：

(1)将多核支持向量回归模型的参数向量(γ,C,ε)作为粒子，参数向量(γ,C,ε)的取值范围作为粒子的搜索空间Φ，设置群体大小λ，惯性因子δ，认知因素社会因素最大迭代次数T，其中，γ为多核支持向量回归模型的核函数的超参数，C为惩罚因子，ε为样本惩罚参数；

(2)初始化每个粒子的位置速度/>粒子历史最优位置/>和粒子历史最优适应度值fitness，其中，l＝1,2,…,λ；

(3)在第t次迭代，根据当前所有粒子的历史最优位置更新历史全局最优位置

(4)随机生成第t次迭代的对角矩阵和/>更新第t次迭代中λ个粒子的速度，第t次迭代第l个粒子的速度的更新公式为：

其中，δ为惯性因子，表示模拟粒子返回到历史最佳位置趋势的认知因素，/>表示量化后粒子相对于全局最优粒子性能的社会因素；

基于第t次迭代中λ个粒子的速度，更新第t次迭代中λ个粒子的位置，第t次迭代第l个粒子的位置的更新公式为：

(5)基于第t次迭代中λ个粒子的位置，通过适应度函数计算各粒子的适应度值若/>更新/>更新/>令t＝t+1；若/>令t＝t+1；

(6)重复步骤(3)～步骤(5)，直至达到最大迭代次数T或fitness小于预设值，终止迭代，输出当前历史全局最优位置得到γ、C、ε的最优值，将最优值带入多核支持向量回归模型，得到粒子群优化后的多核支持向量回归模型。

结合第一方面，进一步的，将正交多项式的非线性逼近能力引入神经网络，构建电量数据拟合模型，根据目标行业用电数据和目标行业时空用电特征，利用电量数据拟合模型进行电量预测拟合。

第二方面，本发明提出了一种基于时空特征迁移学习的行业电量预测装置，包括：

聚类模块，用于利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据；

相似度度量模块，用于根据采集到的目标行业用电数据，利用余弦相似度算法从所述带行业类别标签的源域数据提取目标行业的近邻集；

特征提取模块，用于根据所述目标行业用电数据和所述目标行业的近邻集，利用行业时空用电特征迁移提取器提取目标行业时空用电特征；

电量预测模块，用于根据所述目标行业用电数据和所述目标行业时空用电特征，利用多核支持向量回归模型进行电量预测，得到目标行业的电量预测结果。

采用以上技术手段后可以获得以下优势：

本发明提出了一种基于时空特征迁移学习的行业电量预测方法、装置，对电力系统的源域数据进行聚类，划分不同行业的源域数据，进而提取不同行业的时空用电特征，作为电量预测的输入，通过分行业电量预测，实现更精细化、更准确的电量预测效果。本发明通过对电量数据进行数据分析和处理，自下而上开展分行业电量预测，为电力系统规划调度的合理性、准确性提供保障，还能够进一步促进网络的安全稳定运行，并为配电系统中的分布式电源布点规划及其网架构造和规模大小的确定提供指导。

附图说明

图1为本发明一种基于时空特征迁移学习的行业电量预测方法的步骤示意图；

图2为本发明实施例中1D-CNN的结构示意图；

图3为本发明实施例中门控循环单元的结构示意图；

图4为本发明实施例中双向门控循环单元的结构示意图；

图5为本发明实施例中多头注意力机制的结构示意图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明：

实施例1

本发明提出了一种基于时空特征迁移学习的行业电量预测方法，如图1所示，具体包括如下步骤：

步骤A、利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据。

步骤B、根据采集到的目标行业用电数据，利用余弦相似度算法从带行业类别标签的源域数据提取目标行业的近邻集。

步骤C、根据目标行业用电数据和目标行业的近邻集，利用行业时空用电特征迁移提取器提取目标行业时空用电特征。

步骤D、根据目标行业用电数据和目标行业时空用电特征，利用多核支持向量回归模型进行电量预测，得到目标行业的电量预测结果。

在步骤A中，为了刻画行业聚簇特征，本发明采用聚类算法按照行业类别将源域数据分割成不同簇，使得相同簇内数据的行业用电特性的相似性尽可能大，不同簇间数据的行业用电特性的差异性尽可能大，并给每个簇内的数据赋予行业类别标签。

数据聚类通常将庞杂数据集中具有相似特征的数据自动归类到同一个簇。为了表征源域用电数据的行业聚簇特征，本发明采用了基于密度的无监督聚类算法(DBSCAN聚类算法)赋予源域数据对应的行业类别标签。DBSCAN聚类算法是一种基于密度的空间聚类算法，能够将具有足够密度的区域划分为簇，并在具有噪声的空间数据库中发现任意形状的簇。

在DBSCAN聚类算法中，源域数据中特定点的密度可以通过该特定点半径之内的点计数(包括本身)来估计。在DBSCAN聚类算法中将点分为3类：稠密区域内部的点(核心点)、稠密区与边缘上的点(边界点)和稀疏区域中的点(噪声或背景点)。在本发明实施例中，核心点(Core Point)代表在半径Eps内含有超过MinPts数目的点，则该点为核心点，这些点都是在簇内的；在半径Eps内含有不超过MinPts数目的点，统称为非核心点；边界点(BorderPoint)代表处于任意核心点半径Eps范围内的非核心点；噪声点(Noise Point)表示不处于任意核心点半径Eps范围内的非核心点。Eps是一个全局的给定半径，MinPts决定了成为核心点至少需要的数据点个数。

在本发明实施例中，设电力系统的源域数据(包含电力系统中不同行业、不同时刻的用电数据)为对象集合D，对象集合D中每个对象表示源域数据中一条用电数据；给定对象半径大小为Eps区域内的状态空间称为该对象的Eps邻域，用N_Eps(p)表示以对象p为圆心、半径Eps范围内的对象的集合，有：

N_Eps(p)＝{q|q∈D,distance(p,q)≤Eps} (1)

其中，distance(p,q)表示对象集合D中对象p与对象q之间的距离。

如果对象的Eps邻域至少包含最小数目MinPts个对象，则称该对象为核心对象。给定一个对象集合D，如果p在q的Eps邻域内，同时q为核心对象，则称对象p从对象q出发时是直接密度可达的。如果存在一个对象链p₁,p₂,…,p_n,p₁＝q,p_n＝p，对于p_i∈D(1≤i≤n)，p_i+1是从p_i关于Eps和MinPts直接密度可达的，则对象p是从对象q关于Eps和MinPts密度可达的。如果存在对象o∈D，使对象p和q都是从o关于Eps和MinPts密度可达的，那么对象p到q是关于Eps和MinPts密度相连的。

在本发明实施例中，步骤A的具体操作如下：

步骤A01、设电力系统的源域数据为对象集合D，对象集合D中每个对象表示源域数据中一条用电数据；将对象集合D中所有对象p_i标记为未访问状态，并初始化核心对象集合

步骤A02、从对象集合D中随机选择一个处于未访问状态且不属于任何一个簇的对象p_i，将对象p_i标记为已访问状态。

步骤A03、根据公式(1)计算对象p_i的邻域内对象的数量N_Eps(p_i)。

比较N_Eps(p_i)与MinPts：若N_Eps(p_i)小于预设的对象个数MinPts，则返回步骤A02，选取下一个对象；若N_Eps(p_i)不小于MinPts，则对象p_i为核心对象，新建簇令/>将对象p_i及其邻域中所有不属于任何一个簇的对象加入簇/>

步骤A04、从簇中任意选取一个对象q，计算对象q的邻域内对象的数量N_Eps(q)。

比较N_Eps(q)与MinPts：若N_Eps(q)小于MinPts，则检测簇中下一个对象；若N_Eps(q)不小于MinPts，则对象q为核心对象，令/>进入下一步。

步骤A05、遍历对象q邻域内的所有对象Λ，若对象Λ处于未访问状态，则将对象Λ标记为已访问状态，并将对象Λ添加到簇中，并返回步骤A04；若对象Λ处于已访问状态但不属于任何一个簇，将对象Λ添加到簇/>中，并返回步骤A04。

重复步骤A04～步骤A05，直至簇为空，完成簇/>中所有对象的处理。

步骤A06、重复步骤A02～步骤A05，直到对象集合D中不存在处于未访问状态且不属于任何一个簇的对象，完成电力系统的源域数据的聚类，将源域数据按照行业用电特性划分到多个簇中，输出所有聚类后的簇。

步骤A07、至此，本发明得到多个簇，每个簇中至少包括一个核心对象，根据核心对象集合计算每个簇中核心对象的特征向量，将每个簇中核心对象的特征向量作为该簇的行业类别标签，得到带行业类别标签的源域数据。

在本发明实施例中，当一个簇只包含一个核心对象时，利用该核心对象的温度、湿度、风速、扩散通量组成特征向量，作为该簇的行业类别标签；当一个簇包含多个核心对象时，将所有核心对象的温度、湿度、风速、扩散通量求均值后组成特征向量，作为该簇的行业类别标签。

在步骤B中，通过余弦相似度算法计算不同簇内带行业类别标签的源域数据和目标行业用电数据之间的相似度，进而通过相似度从源域数据中选取出与目标行业用电数据具有高相关性的子数据集，以构建目标行业近邻集，用于后续目标行业的用电特性迁移学习。

余弦相似度采用向量空间中两向量夹角的余弦值作为衡量两个体间差异的标准。余弦相似度的取值范围为[-1,1]，其取值越接近1，表明两个向量的夹角越接近0度，则两个向量越相似；取值越接近0，表明两个向量的夹角越接近180度，则两个向量越不相似。给定两个向量a和b，两个向量间的余弦值可以通过欧几里得点积公式求出：

a·b＝‖a‖||b‖cosq (2)

其中，q为向量a和b的夹角。

基于公式(2)，给定两个属性向量A(x₁,y₁,z₁…)和B(x₂,y₂,z₂…)，则两个属性向量之间的余弦相似度similarity可表示为：

其中，x₁,y₁,z₁表示不同的属性，ξ为属性向量中属性的总数，A_t和B_t分别表示属性向量A和B中第t个属性。

在本发明实施例中，步骤B的具体操作如下：

步骤B01、获取带行业类别标签的源域数据和目标行业的用电数据，以温度、湿度、风速、扩散通量和用电量作为属性，根据带行业类别标签的源域数据获取每个行业类别的源域数据的属性向量，根据目标行业的用电数据获取目标行业的属性向量。

步骤B02、利用余弦相似度算法(公式(3))计算每个行业类别的属性向量与目标行业的属性向量之间的相似度，得到相似度集合。

步骤B03、将相似度集合中每个相似度与人为设置的阈值比较，得到大于阈值/>的相似度对应的带行业类别标签的源域数据，作为目标行业的近邻数据，构建目标行业的近邻集。

在步骤C中，首先，利用目标行业的近邻集对行业时空用电特征迁移提取器进行训练，以行业用电特性相关影响因素为输入，行业类别标签为输出，得到针对目标行业的行业时空用电特征迁移提取器；然后，利用训练好的，针对目标行业的行业时空用电特征迁移提取器处理目标行业的用电数据，进行特征迁移学习，得到目标行业时空用电特征。当存在多组目标行业用电数据时，可以根据每组输入的目标行业用电数据分别得到对应的目标行业时空用电特征。

在本发明实施例中，行业时空用电特征迁移提取器包括空间特征提取模型和时间特征提取模型，其中，空间特征提取模型采用卷积神经网络(CNN)，时间特征提取模型采用双向门控循环单元和多头自注意力机制。通过卷积神经网络提取目标行业的空间特征，通过双向门控循环单元和多头自注意力机制提取目标行业的时间特征，将空间特征和时间特征合并得到目标行业时空用电特征。

目前，深度学习已被证明其在特征提取和时间序列预测等方面具有强大的能力。考虑到卷积神经网络针对时序数据具有令人信服的特征提取能力，本发明采用CNN对目标行业近邻集进行空间特征提取，以追踪由过程参数差异引起的空间模式变化。将相似度度量得到的目标行业近邻集中的数据直接输入CNN模型，通过多组卷积池化组合提取出温度、湿度、风速、扩散通量等属性中所隐藏的深层非线性特征，最终输出近邻集的电量预测值，结合损失函数对CNN模型进行训练，优化CNN模型的网络参数，提高CNN模型对空间特征的提取能力。在本发明实施例中，采用Smooth L1Loss作为损失函数。将采集到的目标行业用电数据输入训练好的CNN模型中，实现目标行业空间用电特征的迁移提取，并将输出层的前一个全连接层加入目标行业空间的特征向量中，进行空间特征增强。

CNN网络结构可按照输入分为1D-CNN、2D-CNN和3D-CNN，其中1D-CNN非常适用于对电力时序数据进行时间序列分析或特征提取，其具体结构如图2所示。

CNN架构通常由卷积层和池化层组成，以从输入数据中过滤和提取有用特征。图2的输入为多维时间序列数据，每个卷积层都有对应的卷积核(过滤器)，输入数据上的每种彩色方框代表一个过滤器。过滤器在整个输入矩阵上自上向下滑动，通过所包含的系数矩阵产生输入数据的卷积特征。过滤器所提取的卷积特征维数为N*1，其中N与输入维度、过滤器尺寸及卷积步长相关。假设在输入数据上应用的卷积核数量为M，则所提取的卷积特征维度为N*M。卷积层后面通常跟着一个非线性激活函数，然后紧跟一个池化层。池化层是一种子采样技术，能够基于特定规则将各卷积特征矩阵转化为低维特征矩阵并聚合。例如，在max-pooling规则下将输出当前滑动窗口中的最大值，即窗口中的最关键特征。池化操作能够增强系统的健壮性，降低池化输出对输入变化的敏感性。CNN架构适用于提取时间序列数据的稳健特征，避免了矩阵维度的迭代扩展。

为了增强时序用电数据各维度间的相关性，本发明时间特征提取模型由三个门控循环单元(GRU)层和一个多头自注意力机制组成，考虑到模型参数规模及模型训练时间的合理性，首先将第一个GRU层设置为双向GRU层，用于提取用电数据沿正向和反向维度的位置特征；将多头自注意力机制设置在双向GRU层之后，以进行权重设定，多头自注意力机制能够对双向GRU层中所提取输出特征的维度权重进行汇总以增强数据间的关联性；在多头自注意力机制之后设置剩下两层GRU层，剩下两层GRU层均设置为正常的单向GRU层，用于提取多头自注意力机制输出矩阵的特征。

门控循环单元使用更新门和重置门选择性地过滤和记忆历史信息，能够从原始数据集中学习顺序和时变模式，解决了传统RNN存在的梯度消失、梯度爆炸及长期记忆力差等问题。在本发明实施例中，GRU模型的内部结构如图3所示，其中h_t-1和h_t分别代表前一个单元和当前单元的隐藏状态；代表当前单元的候选状态；x_t代表当前单元的输入张量，可以通过h_t-1和x_t求解h_t和/>具体计算公式如下：

r_t＝σ(W_r·[h_t-1；x_t]) (4)

z_t＝σ(W_z·[h_t-1；x_t]) (5)

其中，r_t和z_t分别代表门控循环单元的重置门和更新门，W_r、W_z和W_h为权重矩阵，h_t由历史及当前的状态信息组成，h_t-1⊙(1-z_t)代表选择性遗忘历史信息，代表选择性记忆当前信息。

在本发明实施例中，双向GRU层的结构如图4所示，将时序用电数据(目标行业用电数据和/或目标行业的近邻集)分别从正向和反向输入双向GRU，在两个方向上分别通过GRU模型对电力系统使用周期中电量的变化进行动态跟踪，获取正向及反向输出特征，然后将正向及反向输出特征合并为输出特征图，双向GRU能够增强时序用电数据各维度间的相关性。

在本发明实施例中，多头自注意力机制的头数设置为8，其具体结构如图5所示。

将双向GRU层输出的输出特征图映射作为多头自注意力机制的输入张量X，通过多头自注意力机制进一步增强序列数据各维度间的相关性。在多头自注意力机制中，分别用W^K、W^Q和W^V计算出Query、Key、Value三个特征矩阵，通过Query矩阵和Key矩阵的点积运算来表征两者间的相关性，将上述运算结果与Query矩阵的列维度进行除法运算，以防止运算结果过大，然后通过softmax运算将上述结果转换为权重矩阵，并将权重矩阵与Value矩阵相乘得到Z矩阵，该计算过程可表示为：

其中，Q、K、V分别表示Query矩阵、Key矩阵、Value矩阵，d_k为比例因子，即Query矩阵的列维数。

通过公式(8)计算出多个Z矩阵，对多个Z矩阵执行并联操作，并将其变换为目标输出张量X^*。在多头自注意力机制中，输入张量X和输出张量X^*具有相同的数据结构，输出张量X^*的所有维度均将其余维度的相关性纳入考虑范围。因此，多头自注意力机制能够充分提取用电数据维度间的相关性，增强用电数据各维的关联性。

在步骤D中，为了对电量数据进行分行业预测，通过步骤C提取出的目标行业时空用电特征以及目标行业用电数据对多核支持向量回归模型进行训练，以实现分行业电量预测。

支持向量机(SVM)是一种基于统计学习理论和VC维理论的机器学习算法。该算法在特征空间搜寻不同种类样本的最优分类超平面，适用于多因素回归拟合问题。SVM通过核函数将输入空间中的非线性分类问题转化为高维空间中的线性分类问题，克服了维数灾难和非线性可分问题。支持向量机最终的决策函数仅由少数支持向量所确定，因此算法的计算复杂度取决于支持向量的数目而非样本空间维数，具有较强的鲁棒性。SVM在分类和预测场景中分别对应于支持向量分类和支持向量回归(SVR)。

本发明针对电力数据预测场景，采用多核支持向量回归模型(MSVR)进行分行业电量预测，首先定义输入的样本数据如下：

G＝{(x₁,y₁),...,(x_m,y_m)},m＝1,2,...,s (9)

其中，x_m为第m个输入的目标行业用电数据及其目标行业时空用电特征，x_m∈X＝R^s，R^s代表输入向量，包含多个目标行业用电数据及其目标行业时空用电特征；y_m为第m个输出的目标行业电量预测值，y_m∈Y＝R，R代表输出向量，包含多个目标行业的电量预测值，s为输入样本总数。

预测回归问题通常聚焦于寻找关于R^s的函数f(x)，使得通过f(x)能够预测任意输入值x_m所对应的输出值y_m。假设在高维特征空间中建立的参数为w和e的线性回归函数f(x)形式如下：

f(x)＝w*Φ(x)+e (10)

其中，Φ(x)表示非线性映射函数。

定义ε线性不敏感损失函数，表达式如下：

其中，y为目标行业时空用电特征对应的电量真实值，ε为样本惩罚参数。

在公式(9)～公式(11)的基础上，引入松弛变量ξ_m和求解线性回归函数f(x)中w和e的数学表达如下：

在多核支持向量回归模型，惩罚因子较大表明训练误差较大，较小则说明回归函数的误差较小。本发明通过引入拉格朗日函数将上公式(12)转化为对偶形式的数学表达：

其中，K(x_m,x_j)＝Φ(x_m)Φ(x_j)表示多核支持向量回归模型的核函数，α_m和分别为第m个输入对应的拉格朗日系数，C为惩罚因子。

核函数本质上是一种能够将原始非线性输入数据投影到高维特征中以使其能够线性表示的投影函数。核函数必须满足Mercer定理。在Mercer定理的基础上，核函数可细分为全局核函数和局部核函数。全局核函数允许间隔较远的数据点影响内核值，而局部核函数只允许彼此接近的数据点影响内核值，多项式核函数和径向基核函数分别是全局核函数和局部核函数的典型例子。对于多项式核函数，次数越高，其插值能力越好；对于径向基核函数，γ值越小，其插值能力越差。假设和/>均为符合Mercer定理规则的支持向量核函数，且有C₁,C₂≥0，则不同核函数的线性组合也是一个合法的核函数。混合核函数/>结合了/>和/>的优良特性，能够有效提升模型的拟合及泛化能力，因此，本发明选用混合核函数作为多核支持向量回归模型的核函数，混合核函数的数学表达如下所示：

在本发明实施例中，为了提高电量预测精度，获得多核支持向量回归模型的最优超参数组合，本发明采用粒子群优化算法对MSVR的参数选择过程进行优化，提出了基于粒子群优化的多核支持向量回归电量预测模型(PSO-MSVR)。

多核支持向量回归模型中待优化的超参数为γ、C、ε，其中，γ为核函数中的参数。在粒子群优化算法中，每个粒子都有自己的位置和速度/>其中，/>对应于向量(γ,C,ε)的取值。假定Φ是粒子的搜索空间，即向量(γ,C,ε)的取值范围，λ是群大小；(γ,C,ε)的范围分别设置为[0,1000]、[1,10000]和[0,50]。粒子是否优秀取决于其适应度函数，即使用该粒子参数组合训练MSVR所得到电量预测结果的RMSE值。粒子每次迭代都会根据自身的历史最优位置/>与历史全局最优位置/>分别更新其位置和速度，迭代在达到最大迭代次数或RMSE小于预设值时终止，迭代终止对应的全局最优位置/>表示多核支持向量回归模型的最优超参数组合。

在本发明实施例中，粒子位置和速度的更新公式如下：

其中，表示第t+1次迭代第l个粒子的速度；δ为惯性因子，δ≥0，表示粒子对于先前飞行方向的记忆，可防止飞行方向的剧烈变化，能够平衡粒子群算法的全局和局部寻优；/>表示模拟粒子返回到历史最佳位置趋势的认知因素；/>表示量化后粒子相对于全局最优粒子性能的社会因素；/>和/>均为λ×λ对角矩阵，其中主对角线是均匀分布在区间[0,1]中的随机数；/>表示第t+1次迭代第l个粒子的位置。

在本发明实施例中，利用粒子群优化算法优化多核支持向量回归模型参数的具体流程如下：

(1)获取训练集，训练集中包括多组目标行业时空用电特征和目标行业用电数据，设置群体大小λ，惯性因子δ，认知因素社会因素/>最大迭代次数T，粒子的搜索空间Φ。

(2)在初始阶段(t＝0)，分别对迭代计数器t、粒子位置粒子速度/>和粒子历史最优位置/>进行初始化。将粒子位置/>初始化为搜索空间Φ范围内的随机值，将粒子速度初始化为0或者非常小的随机浮点数；通过适应度函数计算各粒子的适应度值，即在位置/>下通过多核支持向量回归模型得到初始的电量预测结果的RMSE值；使用当前粒子位置初始化粒子历史最优位置/>使用当前粒子适应度值/>初始化粒子历史最优适应度值fitness。

(3)在第t次迭代，根据当前所有粒子的历史最优位置更新历史全局最优位置随机生成第t次迭代的对角矩阵/>和/>基于公式(15)和公式(16)，更新第t次迭代中λ个粒子的位置/>更新第t次迭代中λ个粒子的速度基于第t次迭代中λ个粒子的位置，通过适应度函数计算各粒子的适应度值/>若/>更新/>更新/>进入下一次迭代；否则，直接进入下一次迭代。

(4)重复步骤(3)，直至达到最大迭代次数T或fitness小于预设值，终止迭代，输出历史全局最优位置此时历史全局最优位置/>中γ、C、ε的值即为最优值，将最优值带入多核支持向量回归模型，即可得到粒子群优化后的多核支持向量回归模型。

在本发明实施例中，由于用户用电行为的随机性及用电特征的差异性较为显著，本发明还能够将正交多项式的非线性逼近能力引入神经网络，构建电量数据拟合模型，实现电量预测拟合。

假设训练样本集{(x_m,y_m),m＝0,1,...,s}，将该样本集中目标行业用电数据及目标行业时空用电特征{x_m,m＝0,1,...,s}和目标行业的电量预测值{y_m,m＝0,1,…,s}分别作为神经网络的输入与期望输出，通过梯度下降算法对神经网络中所有参数进行训练加以调整，从而学习到训练样本集中存在的模式。由正交多项式前向神经网络结果可实现对输入{x_m,m＝0,1,…,s}的激励输出，x_m的拟合值为：

其中，I表示正交多项式的次数，W表示神经网络输入层到隐藏层的权值向量，W＝[ω₀,ω₁…ω_I]^T∈R^I+1，ω_μ表示第μ次的权值，μ＝0,1,2,…,I，P(x_m)表示神经网络输入层到隐藏层的激励向量，P(x_m)＝[P₀(x_m),P₁(x_m)...P_I(x_m)]^T∈R^I+1，P_μ表示第μ次的激励，上标T表示转置运算。

假设期望输出向量Q＝[Q(x₀),Q(x₁)...Q(x_s)]^T，则多项式的结构矩阵为：

拟合模型可转换为Q(x_m)＝P(m,:)W，其中P表示(s+1)×(I+1)的范德蒙德矩阵，s≥I。在获取权值向量W的情况下，可根据转换后的拟合模型得出任意x_m对应的电量拟合值。

由所有输入{x_m,m＝0,1,...,s}经激励后的拟合输出Q(x_m)与期望输出{y_m,m＝0,1,...,s}，可定义正交多项式前向神经网络的目标函数：

本发明通过优化求解权值向量，使目标函数E最小化，可以实现x_m在任意范围内都能使输出Q(x_m)充分逼近ym，进而实现基于正交多项式的电量数据拟合，得到拟合表达式，可应用于预测以外的更多数据分析场景。

实施例2

与实施例1基于相同的发明构思，本实施例介绍一种基于时空特征迁移学习的行业电量预测拟合装置，包括聚类模块、相似度度量模块、特征提取模块和电量预测模块。

聚类模块用于利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据。

相似度度量模块用于根据采集到的目标行业用电数据，利用余弦相似度算法从所述带行业类别标签的源域数据提取目标行业的近邻集。

特征提取模块用于根据所述目标行业用电数据和所述目标行业的近邻集，利用行业时空用电特征迁移提取器提取目标行业时空用电特征。

电量预测模块用于根据所述目标行业用电数据和所述目标行业时空用电特征，利用多核支持向量回归模型进行电量预测，得到目标行业的电量预测结果。

上述各模块的具体功能实现参考实施例1方法中的相关内容，不予赘述。

本发明针对不同用电行业具有不同的用电特性，不同行业的内在用电特性会影响该行业电量预测的情况，对电力系统的源域数据进行聚类，划分不同行业的源域数据，进而提取不同行业的时空用电特征，作为电量预测的输入，通过分行业电量预测，实现更精细化、更准确的电量预测效果。本发明通过对电量数据进行数据分析和处理，自下而上开展分行业电量预测，为电力系统规划调度的合理性、准确性提供保障，还能够进一步促进网络的安全稳定运行，并为配电系统中的分布式电源布点规划及其网架构造和规模大小的确定提供指导。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于时空特征迁移学习的行业电量预测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，所述利用基于密度的无监督聚类算法对电力系统的源域数据进行聚类，得到带行业类别标签的源域数据，包括：

(3)计算对象p_i的邻域内对象的数量N_Eps(p_i)：

N_Eps(p_i)＝{p_j|p_j∈D,j1i,distance(p_i,p_j)≤Eps}

(4)若N_Eps(p_i)小于预设的对象个数MinPts，则返回步骤(2)；若N_Eps(p_i)不小于MinPts，则对象p_i为核心对象，新建簇H_pi，令θ＝θ∪p_i，将对象p_i及其邻域中所有不属于任何一个簇的对象加入簇H_pi；

(5)从簇H_pi中任意选取一个对象q，计算对象q的邻域内对象的数量N_Eps(q)；若N_Eps(q)小于MinPts，则检测簇H_pi中下一个对象；若N_Eps(q)不小于MinPts，则对象q为核心对象，令θ＝θ∪q，进入步骤(6)；

(6)遍历对象q邻域内的所有对象Λ，若对象Λ处于未访问状态，则将对象Λ标记为已访问状态，并将对象Λ添加到簇H_pi中，返回步骤(5)；若对象Λ处于已访问状态但不属于任何一个簇，将对象Λ添加到簇H_pi中，返回步骤(5)；

(8)根据核心对象集合θ计算每个簇中核心对象的特征向量，将每个簇中核心对象的特征向量作为该簇的行业类别标签，得到带行业类别标签的源域数据。

3.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，所述利用余弦相似度算法从所述带行业类别标签的源域数据提取目标行业的近邻集，包括：

将相似度大于阈值θ的带行业类别标签的源域数据作为目标行业的近邻数据，得到目标行业的近邻集。

4.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，利用目标行业的近邻集对行业时空用电特征迁移提取器进行训练，得到针对目标行业的行业时空用电特征迁移提取器；利用针对目标行业的行业时空用电特征迁移提取器处理目标行业的用电数据，进行特征迁移学习，得到目标行业时空用电特征。

5.根据权利要求4所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，所述行业时空用电特征迁移提取器包括空间特征提取模型和时间特征提取模型，其中，所述空间特征提取模型采用卷积神经网络，所述时间特征提取模型采用双向门控循环单元和多头自注意力机制；

6.根据权利要求5所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，所述时间特征提取模型包括三个门控循环单元层和一个多头自注意力机制；所述时间特征提取模型的第一层设置为双向门控循环单元层，用于提取用电数据沿正向和反向维度的位置特征；所述时间特征提取模型的第二层设置为多头自注意力机制层，用于对双向门控循环单元层的输出特征的维度权重进行汇总；在所述时间特征提取模型的第三层和第四层均设置为单向门控循环单元层，用于提取多头自注意力机制层输出矩阵的特征。

7.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，所述多核支持向量回归模型的表达式为：

8.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，利用粒子群优化算法对多核支持向量回归模型的参数进行优化，包括：

(1)将多核支持向量回归模型的参数向量(γ,C,ε)作为粒子，参数向量(γ,C,ε)的取值范围作为粒子的搜索空间Φ，设置群体大小λ，惯性因子δ，认知因素社会因素/>最大迭代次数T，其中，γ为多核支持向量回归模型的核函数的超参数，C为惩罚因子，ε为样本惩罚参数；

(3)在第t次迭代，根据当前所有粒子的历史最优位置更新历史全局最优位置/>

9.根据权利要求1所述的基于时空特征迁移学习的行业电量预测方法，其特征在于，将正交多项式的非线性逼近能力引入神经网络，构建电量数据拟合模型，根据目标行业用电数据和目标行业时空用电特征，利用电量数据拟合模型进行电量预测拟合。

10.一种基于时空特征迁移学习的行业电量预测装置，其特征在于，包括：