CN117592595A

CN117592595A - 一种配电网负荷预测模型建立、预测方法及装置

Info

Publication number: CN117592595A
Application number: CN202311418658.XA
Authority: CN
Inventors: 赵轩; 董少峤; 周毅; 聂文海; 李顺昕; 杨金刚; 岳云力; 赵一男; 杨敏; 赵敏; 全璐瑶
Original assignee: State Grid Corp of China SGCC; State Grid Jibei Electric Power Co Ltd; Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Jibei Electric Power Co Ltd; Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority date: 2023-10-30
Filing date: 2023-10-30
Publication date: 2024-02-23

Abstract

本说明书涉及电力系统技术领域，尤其是涉及一种配电网负荷预测模型建立、预测方法及装置。该方法包括：获取用电负荷数据集和影响因素数据集；从所述用电负荷数据集中提取用电特征集；对所述用电特征集进行多级层次聚类，得到用电聚类信息；根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集；构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值；利用所述训练样本集训练神经网络模型，将训练完成的神经网络模型作为配电网负荷预测模型。通过本说明书实施例，可提高随着新兴产业发展而不断变化的配电网的用电负荷预测准确度。

Description

一种配电网负荷预测模型建立、预测方法及装置

技术领域

本说明书涉及电力系统技术领域，尤其是涉及一种配电网负荷预测模型建立、预测方法及装置。

背景技术

配电网负荷预测是电网安全运行、调度控制中重要的环节，对电网规划具有重要意义，准确的配电网负荷预测有利于决策者合理调度电网的资源，并在维持电网的稳定和经济运行中发挥重要作用。随着大量的数据中心、医药技术、电动物流以及电采暖等新型负荷接入配电网，配电网的负荷类型在逐步地发生着变化，原有的配电网负荷特性也发生较大的转变。不同类型的新型产业用户的负荷接入配电网，对配电网经济性、安全性、电能质量和环保效益均造成较大影响，并且在未完全掌握其运作规律及用电负荷特性的情况下，会对电网负荷预测的准确性、电网规划方案的适应性带来诸多困难和影响。

发明内容

鉴于目前，提出了本方案以便克服上述问题或者至少部分地解决上述问题。

一方面，本说明书的一些实施例的目的在于提供一种配电网负荷预测模型建立方法，所述方法包括：

获取用电负荷数据集和影响因素数据集；

从所述用电负荷数据集中提取用电特征集；

对所述用电特征集进行多级层次聚类，得到用电聚类信息；

根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集；

构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值；

利用所述训练样本集训练神经网络模型，将训练完成的神经网络模型作为配电网负荷预测模型。

进一步地，获取用电负荷数据集后，进一步包括：

清洗所述用电负荷数据集中的脏数据和残缺数据；

对清洗后的用电负荷数据集进行归一化处理。

进一步地，从所述用电负荷数据集中提取用电特征集，包括：

对所述用电负荷数据集进行离散小波变换，得到小波系数矩阵；

对所述小波系数矩阵进行降噪处理；

构建降噪后的小波系数矩阵对应的用电特征集。

进一步地，对所述用电特征集进行多级层次聚类，得到用电聚类信息，包括：

利用混沌映射，从所述用电特征集中选择预设归类数量的用电特征，作为第一归类中心；

计算每个用电特征与每个第一归类中心的余弦加权相似度；

根据所述余弦加权相似度划分所述用电特征，得到第一归类结果；

根据每个第一归类结果中各用电特征之间的余弦加权相似度确定第一归类结果的类中心；

确定每个第一归类结果的类中心与第一归类中心之间的局部加权相似度；

若存在任一局部加权相似度中小于预设阈值，则利用所述类中心更新第一归类中心，并重新计算局部加权相似度，直至所述局部加权相似度均不小于预设阈值；

根据所述局部加权相似度均不小于第一阈值时的归类结果，确定所述用电聚类信息。

进一步地，确定每个第一归类结果的类中心与第一归类中心之间的局部加权相似度，包括：

分别对每个第一归类结果的类中心与第一归类中心进行哈希处理；

确定哈希处理结果对应的哈希相似度；

确定每个第一归类结果的类中心与第一归类中心之间的余弦加权相似度；

将每个第一归类结果的类中心与第一归类中心之间的余弦加权相似度与所述哈希相似度进行加权求和，得到局部加权相似度。

进一步地，所述影响因素数据集包括历史气象数据、新型产业发展指数数据。

进一步地，根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集，包括：

根据所述用电聚类信息对所述用电负荷数据集进行分类；

将所述影响因素数据集和分类后的用电负荷数据集作为训练样本集。

进一步地，构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值，包括：

利用混沌映射初始化得到种群；

确定种群中所有个体的适应度；

根据个体的属性信息，更新种群中所有个体的位置；

判断更新后每个个体的位置是否超出预设边界；

若超出预设边界，则利用所述属性信息对应的位置优化算法更新个体位置；

若未超出预设边界，则利用自适应t分布突变策略对种群中个体的位置进行扰动；

利用贪婪规则，根据扰动前后个体的适应度，判断是否利用所述属性信息对应的位置优化算法更新个体位置；

重复如上更新个体位置的步骤，直至迭代次数达到第二阈值。

进一步地，利用所述训练样本集训练神经网络模型，进一步包括：

将所述训练样本集划分为训练集及验证集；

利用所述训练集训练神经网络模型；

将所述验证集中的历史气象数据输入至训练得到的神经网络模型中；

根据模型输出结果及所述验证集中的真实标签计算准确率；

若所述准确率小于第三阈值，则重新训练所述神经网络模型；

若所述准确率不小于第三阈值，则完成所述神经网络模型的训练。

另一方面，本说明书的一些实施例还提供一种配电网负荷预测模型建立装置，所述装置包括：

接收模块，用于获取用电负荷数据集和影响因素数据集；

提取模块，用于从所述用电负荷数据集中提取用电特征集；

聚类模块，用于对所述用电特征集进行多级层次聚类，得到用电聚类信息；

建立模块，用于根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集；

优化模块，用于构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值；

训练模块，用于利用所述训练样本集训练神经网络模型，将训练完成的神经网络模型作为配电网负荷预测模型。

基于同一发明构思，本说明书的一些实施例还提供了一种配电网负荷预测方法，所述方法包括：

接收待分析的影响因素数据；

将所述待分析的影响因素数据输入至利用前述任一实施例所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

另一方面，基于同一发明构思，本说明书的一些实施例还提供了一种配电网负荷预测装置，所述装置包括：

获取模块，用于接收待分析的影响因素数据；

预测模块，用于将所述待分析的影响因素数据输入至利用前述任一实施例所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

另一方面，本说明书的一些实施例还提供了一种计算机设备，包括存储器、处理器、以及存储在所述存储器上的计算机程序，所述计算机程序被所述处理器运行时，执行上述方法的指令。

另一方面，本说明书的一些实施例还提供了一种计算机存储介质，其上存储有计算机程序，所述计算机程序被计算机设备的处理器运行时，执行上述方法的指令。

另一方面，本说明书的一些实施例还提供了一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被计算机设备的处理器运行时，执行上述方法的指令。

本说明书的一些实施例提供的一个或者多个技术方案，至少具有如下的技术效果：

本说明书的实施例自动接收用电负荷数据集和影响因素数据集，从用电负荷数据集中提取用电特征集，对用电特征集进行多级层次聚类得到用电聚类信息，以减小直接对用电负荷数据集进行聚类所需的计算成本，并且能够根据用电负荷数据集的内部深度联系进行分类，之后基于用电聚类信息对用电负荷数据集进行分类，将影响因素数据集作为输入，将分类后的用电负荷数据集作为目标输出，训练单输入多输出的神经网络模型，由于目标标签数量为多个，因此再利用群智能优化算法优化神经网络模型的权重和阈值，以避免神经网络模型陷入局部最优，保证模型训练的输出尽可能逼近目标输出，提高配电网负荷预测模型的预测精度。

上述说明仅是本说明书的一些实施例技术方案的概述，为了能够更清楚了解本说明书的一些实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本说明书的一些实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本说明书的一些实施例的具体实施方式。

附图说明

为了更清楚地说明本说明书的一些实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了本说明书一些实施例中一种配电网负荷预测模型建立方法的实施系统示意图；

图2示出了本说明书一些实施例中一种配电网负荷预测模型建立方法的流程图；

图3为本说明书一些实施例中数据预处理的步骤示意图；

图4为本说明书一些实施例中提取用电特征集的步骤示意图；

图5为本说明书一些实施例中确定用电聚类信息的步骤示意图；

图6为本说明书一些实施例中确定局部加权相似度的步骤示意图；

图7为本说明书一些实施例中建立训练样本集的步骤示意图；

图8为本说明书一些实施例中优化神经网络模型的步骤示意图；

图9为本说明书一些实施例中训练神经网络模型的步骤示意图；

图10示出了本说明书一些实施例中一种配电网负荷预测方法的流程图；

图11为本说明书一些实施例中一种配电网负荷预测模型建立装置的结构示意图；

图12为本说明书一些实施例中一种配电网负荷预测装置的结构示意图；

图13为本说明书一些实施例中提供的计算机设备结构示意图。

【附图标记说明】

101、终端；

102、服务器；

1101、模块；

1102、模块；

1103、模块；

1104、模块；

1105、模块；

1106、模块；

1201、模块；

1202、模块；

1302、计算机设备；

1304、处理器；

1306、存储器；

1308、驱动机构；

1310、输入/输出接口；

1312、输入设备；

1314、输出设备；

1316、呈现设备；

1318、图形用户接口；

1320、网络接口；

1322、通信链路；

1324、通信总线。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书的一些实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的一些实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

需要说明的是，本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是，本申请技术方案中对数据的获取、存储、使用、处理等均符合相关法律法规的相关规定。

如图1所示为本发明实施例一种配电网负荷预测模型建立方法的实施系统示意图，可以包括：终端101以及服务器102，终端101和服务器102之间通过网络进行通信，网络可以包括局域网(Local Area Network，简称为LAN)、广域网(Wide Area Network，简称为WAN)、因特网或其组合，并连接至网站、用户设备(例如计算设备)和后端系统。工作人员可以通过终端101向服务器102发送配电网负荷预测模型建立请求，服务器102接收到配电网负荷预测模型建立请求后，调用数据库中的每一个审计员的用电负荷数据集和影响因素数据集进行计算处理，得到建模结果，并将建模结果发送给终端101，以使工作人员根据建模结果处理业务，得到预测负荷结果。

在本说明书实施例中，所述服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在一个可选的实施例中，终端101可以包括但不限于自助终端设备、台式计算机、平板电脑、笔记本电脑、智能可穿戴设备等类型的电子设备。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、Linux、Windows等。当然，所述终端101并不限于上述具有一定实体的电子设备，其还可以为运行于上述电子设备中的软件。

此外，需要说明的是，图1所示的仅仅是本公开提供的一种应用环境，在实际应用中，还可以包括多个终端101，本说明书不做限制。

图2是本发明实施例提供的一种配电网负荷预测模型建立方法的流程图，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或装置产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体的如图2所示，应用与上述的服务器侧，所述方法可以包括：

S201：获取用电负荷数据集和影响因素数据集；

S202：从所述用电负荷数据集中提取用电特征集；

S203：对所述用电特征集进行多级层次聚类，得到用电聚类信息；

S204：根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集；

S205：构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值；

S206：利用所述训练样本集训练神经网络模型，将训练完成的神经网络模型作为配电网负荷预测模型。

可以理解为，一些实施例中，配电网中不同类型用电用户的负荷数据具有不同的特点，在不区分用电用户类型情况下利用神经网络进行有监督模型训练存在难以深度挖掘用电负荷数据集和影响因素数据集之间的内在联系的问题，导致用电负荷预测精度降低，相比于直接对用户用电的负荷数据进行聚类分析，从用电负荷数据集中提取用电特征集，利用用电特征集进行聚类分析，能够进一步地发掘用电负荷数据集的各类特征之间的相似度，从而更精准地衡量用电负荷数据之间的相似程度，以更准确区分具有不同特性的用电负荷数据，提高后续模型训练精确度，进一步地，一些实施例中，影响因素数据集包括历史气象数据、新型产业发展指数数据，对于新型产业集中对应的配电网区域，气象数据是影响用电负荷的关键因素，新型产业发展指数也是影响不同用户用电负荷的重要影响因素，新型产业发展指数是指以新产业、新业态、新运行模式为主要内容的统计指标体系，利用调查基础数据，采用线性加权的综合评价方法构建而成的复合指数，具体而言，气象数据、新型产业发展指数数据与配电网用电负荷之间的关联度可以利用相关性分析方法得到，例如Copula算法等，本文对相关性分析方法不做限定。

参照附图3，在一些实施例中，获取用电负荷数据集后，可以包括：

S301：清洗所述用电负荷数据集中的脏数据和残缺数据；

S302：对清洗后的用电负荷数据集进行归一化处理。

可以理解为，一些实施例中，数据的异常值可以包括脏数据和缺损数据，脏数据是指数据不在给定的范围内或对于实际业务毫无意义，或是数据格式非法，以及存在不规范的编码和含糊的业务逻辑，缺损数据是指由于主客观条件的影响导致数据漏失或不能使用的数据，剔除异常值能够提高训练样本集的准确性，从而提高后续训练得到的模型的精确度，对于影响因素数据集这样可以具有多种子数据类型的数据而言，归一化处理是指把数据映射到指定的范围内进行处理，通过把有量纲表达式变成无量纲表达式，便于不同单位或量级的指标能够进行比较和加权，以使后续构建训练样本集和模型训练的过程更加便捷快速，并且经过归一化后，还能将有量纲的数据集变成纯量，达到简化计算的作用。

参照附图4，在一些实施例中，从所述用电负荷数据集中提取用电特征集，可以包括：

S401：对所述用电负荷数据集进行离散小波变换，得到小波系数矩阵；

S402：对所述小波系数矩阵进行降噪处理；

S403：构建降噪后的小波系数矩阵对应的用电特征集。

可以理解为，一些实施例中，用电负荷数据集可以为具有离散的、具有时序性的、与时间相关的用电负荷点集，也可以为具有时序性的、与时间相关的用电负荷曲线集，离散小波变换在多尺度分析、噪声去除、特征提取、时频局部化能力和数据压缩等方面具有优势，能够提取用电负荷曲线的重要特征并提高分类效果，具体而言，用电特征可以包括平均小波系数、标准差、均方根误差、峰度、偏度、时域特征、频域特征、零交叉率、自相关系数、分形维数、非线性动力学参数中的一种或多种，进一步地，一些实施例中，在得到小波系数矩阵后还会对其进行平滑处理，以去除噪声或不重要的细节，避免对分类造成不必要的干扰，从而提取出信号中的主要特征，之后基于平滑处理后的小波系数矩阵构建对应的特征数据集，能够保证特征数据集充分、精确地反映用电负荷数据集的特征。需要说明的是，本说明书中除了利用离散小波变换，还可以利用其他离散数据处理方法如离散傅里叶变换等得到对应的特征数据集，本文对此不做限定。

参照附图5，在一些实施例中，对所述用电特征集进行多级层次聚类，得到用电聚类信息，可以包括：

S501：利用混沌映射，从所述用电特征集中选择预设归类数量的用电特征，作为第一归类中心；

S502：计算每个用电特征与每个第一归类中心的余弦加权相似度；

S503：根据所述余弦加权相似度划分所述用电特征，得到第一归类结果；

S504：根据每个第一归类结果中各用电特征之间的余弦加权相似度确定第一归类结果的类中心；

S505：确定每个第一归类结果的类中心与第一归类中心之间的局部加权相似度；

S506：若存在任一局部加权相似度中小于预设阈值，则利用所述类中心更新第一归类中心，并重新计算局部加权相似度，直至所述局部加权相似度均不小于预设阈值；

S507：根据所述局部加权相似度均不小于第一阈值时的归类结果，确定所述用电聚类信息。

可以理解为，一些实施例中，混沌映射被用于生成混沌序列，混沌序列是一种由简单的确定性系统产生的随机性序列，利用混沌映射生成随机数可以提升第一归类中心的多样性和全局遍历性，混沌映射可以利用如下公式构建：

其中，z₁为第1次映射数据，r为映射参数，z₀为初始映射数据，z_h为第h次映射数据，z_h+1为第h+1次映射数据。

进一步地，一些实施例中，余弦加权相似度是加权后的余弦相似度，用于衡量向量与向量、序列与序列等之间的距离，从而判断向量与向量、序列与序列等之间的相似程度的大小，每个用电特征与每个第一归类中心均可以理解为高维空间下的特征向量，具体而言，余弦相似度可以利用如下公式构建：

其中，Similarity(A,B)为特征向量A与特征向量B之间的余弦相似度，A_i为特征向量A的第i个元素，B_i为特征向量B的第i个元素，n为特征向量A和特征向量B的维度，i为维度序数。

进一步地，一些实施例中，余弦加权相似度中的加权是在计算余弦相似度的基础上得到的，可以理解为，余弦加权相似度可以利用如下公式构建：

其中，Similarity(A,B)为特征向量A与特征向量B之间的余弦相似度，A_i为特征向量A的第i个元素，B_i为特征向量B的第i个元素,ω_i为第i个元素的权重参数，n为特征向量A和特征向量B的维度，i为维度序数。

进一步地，一些实施例中，权重参数ω_i可以为预设的固定值，也可以利用群智能优化算法确定权重参数，具体而言，可以通过以下方式得到权重参数：

(1)利用混沌映射初始化得到种群；

(2)确定种群中所有个体的适应度；

(3)根据个体的属性信息，更新种群中所有个体的位置；

(4)判断更新后每个个体的位置是否超出预设边界；

(5)若超出预设边界，则利用所述属性信息对应的位置优化算法更新个体位置；

(6)若未超出预设边界，则利用自适应t分布突变策略对种群中个体的位置进行扰动；

(7)利用贪婪规则，根据扰动前后个体的适应度，判断是否利用所述属性信息对应的位置优化算法更新个体位置；

(8)重复如上更新个体位置的步骤，直至迭代次数达到第二阈值。

需要说明的是，上述步骤(1)-(8)中个体位置向量对应于权重参数组成的向量。

进一步地，一些实施例中，根据每个用电特征与每个第一归类中心的余弦加权相似度可以对各用电特征进行初步聚类，初步聚类结果即为第一归类结果(包括与第一归类中心数量相同的多个簇)，之后再在每个簇中选取簇中心(类中心)，比较类中心与第一归类中心之间的距离，根据该距离判断是否需要更新第一归类中心，具体而言，若类中心与第一归类中心之间的距离中存在任一距离大于预设限定值即类中心与第一归类中心之间的相似度存在任一相似度小于预设阈值)，则说明当前第一归类中心不准确，对应的第一归类结果也同样不准确，因此需要将当前类中心替换当前第一归类中心，这是因为类中心是基于第一归类中心进一步归类得到的，其分类准确率更高，若类中心与第一归类中心之间的距离均小于预设限定值(即类中心与第一归类中心之间的相似度均大于预设阈值)，则说明当前第一归类中心准确，可以根据其对应的第一归类结果确定用电聚类信息，以利用用电聚类信息区分不同用户使用负载时产生的用电负荷的曲线。

参照附图6，在一些实施例中，确定每个第一归类结果的类中心与第一归类中心之间的局部加权相似度，可以包括：

S601：分别对每个第一归类结果的类中心与第一归类中心进行哈希处理；

S602：确定哈希处理结果对应的哈希相似度；

S603：确定每个第一归类结果的类中心与第一归类中心之间的余弦加权相似度；

S604：将每个第一归类结果的类中心与第一归类中心之间的余弦加权相似度与所述哈希相似度进行加权求和，得到局部加权相似度。

可以理解为，一些实施例中，每个第一归类结果的类中心与每个第一归类结果的第一归类中心之间的相似度即所述局部加权相似度，为了使局部加权相似度能够深度挖掘数据之间的内在联系，提高相似度度量的全局性，避免仅利用余弦加权相似度进行相似度度量可能导致的归类陷入局部最优的问题，首先对每个第一归类结果的类中心与第一归类中心进行哈希处理得到哈希码，以通过适当的哈希函数将高维数据转换为汉明空间中的压缩二进制哈希码，提高数据存储和检索的效率，之后再计算每个第一归类结果的类中心与第一归类中心之间的余弦加权相似度，利用余弦加权相似度与所述哈希相似度进行加权求和的结果得到局部加权相似度，需要说明的是，加权求和可以为线性加权求和，也可以为非线性加权求和，本文对此不做限定。

参照附图7，在一些实施例中，根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集，可以包括：

S701：根据所述用电聚类信息对所述用电负荷数据集进行分类；

S702：将所述影响因素数据集和分类后的用电负荷数据集作为训练样本集。

可以理解为，一些实施例中，用电聚类信息中包括用电负荷数据所在簇信息，根据用电聚类信息可以将用电负荷数据集进行分类为多簇用电负荷子数据集，之后将影响因素数据集整体作为输入，将各簇用电负荷子数据集作为目标输出，训练神经网络，以使神经网络能够根据影响因素数据集准确预测用电负荷，需要说明的是，本说明书实施例并不限定神经网络模型的具体结构，具体而言，影响因素数据集与各簇用电负荷子数据集均可以建立并训练对应的一个子神经网络模型，即此时子神经网络模型为单输入单输出(这里将影响因素数据集整体视为单输入，不代表影响因素数据集仅有一类数据)，多簇用电负荷子数据集则对应有多个子神经网络模型，多个子神经网络模型共同构成配电网负荷预测模型，另一方面，也可以根据影响因素数据集与各簇用电负荷子数据集建立并训练单输入多输出的神经网络模型(这里将影响因素数据集整体视为单输入，不代表影响因素数据集仅有一类数据)，从而得到配电网负荷预测模型。

参照附图8，在一些实施例中，构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值，可以包括：

S801：利用混沌映射初始化得到种群；

S802：确定种群中所有个体的适应度；

S803：根据个体的属性信息，更新种群中所有个体的位置；

S804：判断更新后每个个体的位置是否超出预设边界；

S805：若超出预设边界，则利用所述属性信息对应的位置优化算法更新个体位置；

S806：若未超出预设边界，则利用自适应t分布突变策略对种群中个体的位置进行扰动；

S807：利用贪婪规则，根据扰动前后个体的适应度，判断是否利用所述属性信息对应的位置优化算法更新个体位置；

S808：重复如上更新个体位置的步骤，直至迭代次数达到第二阈值。

可以理解为，一些实施例中，个体的适应度用于衡量将由向量表示的个体当前所在位置作为神经网络模型的权重和阈值时，神经网络模型预测结果与真实结果的误差，在每次迭代过程中更佳的个体适应度意味着模型的误差更低，个体的属性信息是指在初始化种群时，每个个体初始化对应的个体属性，不同属性信息的个体更新位置的方式不同，预设边界是指相比于搜索边界范围更小、更适合个体生存的区域的边界，若个体在更新位置后超出预设边界，则需要利用该个体的属性信息对应的位置优化算法更新个体位置，若未超出预设边界，则说明当前个体位于适宜生存的预设边界内，但可能不是出于最佳生存点，因此再利用自适应t分布突变策略对种群中个体的位置进行扰动，以有效增强算法的优化性能，有利于提高算法逃避局部最优的能力，但是没法确定扰动之后得到的新位置一定比原位置的适应度要好，因此在进行变异扰动更新后，利用贪婪规则，通过比较新旧两个位置的适应度，以确定是否要更新位置，重复多次更新个体位置，直到迭代次数达到第二阈值，输出全局最佳适应度及其对应的个体位置最优解，以根据个体位置最优解得到优化后的权重和阈值。

进一步地，一些实施例中，适应度可以为个体位置之间的欧式距离，适应度目标函数可以利用如下公式计算：

其中，f(x)为第k个个体的适应度，K为个体总数，k为个体序数，x_jk为第k个个体的预测值，x′_jk为第k个个体的实际值。

进一步地，一些实施例中，个体的属性可以包括五类：stroll、dance、comida、propagate、steal中的一种或多种；

对于stroll属性，位置优化算法可以利用如下公式构建：

x_i(t+1)＝x_i(t)+a×b×x_i(t-1)+c×Δx

Δx＝|x_i(t)-X^w|

其中，x_i(t+1)为第i+1个个体在第t次迭代时的位置，x_i(t)为第i个个体在第t次迭代时的位置，x_i(t-1)为第i个个体在第t-1次迭代时的位置，b∈(0,0.2)，b为偏转系数，c∈(0，1)，c为自然系数，Δx为光强度的变化程度，其中X^w为当前种群内适应度最差的位置；

对于dance属性，位置优化算法可以利用如下公式构建：

x_i(t+1)＝x_i(t)+tan(α)×|x_i(t)-x_i(t-1)|

其中，x_i(t+1)为第i+1个个体在第t次迭代时的位置，x_i(t)为第i个个体在第t次迭代时的位置，x_i(t-1)为第i个个体在第t-1次迭代时的位置，α∈[0，π]，α为偏转角；

对于propagate属性，位置优化算法可以利用如下公式构建：

Lb′＝max(X′×(1-R),Lb)

Ub′＝min(X′×(1+R),Ub)

y_i(t+1)＝X′+y₁×(y_i(t)-Lb′)+y₂×(y_i(t)-Ub′)

其中，Lb′，Ub′分别为个体繁殖区域的下限和上限，Lb、Ub分别为搜索空间的下限和上限，X′为当前种群内的最优位置，R为惯性权重，并且T_max为算法迭代时不断变化的最大迭代次数，y_i(t)为第t次迭代时第i个繁殖产物的位置，y₁和y₂为一维独立随机向量，其维数与位置向量匹配；

对于comida属性，位置优化算法可以利用如下公式构建：

Lb″＝max(X″×(1-R),Lb)

Ub″＝min(X″×(1+R),Ub)

x_i(t+1)＝x_i(t)+d×(x_i(t)-Lb″)+f×(x_i(t)-Ub″)

其中，X″为全局最优位置，Lb″和Ub″分别为最佳觅食区域的下限和上限，x_i(t+1)为第i+1个个体在第t次迭代时的位置，x_i(t)为第i个个体在第t次迭代时的位置，x_i(t-1)为第i个个体在第t-1次迭代时的位置，d为正态分布的随机数，f为属于(0，1)的随机向量；

对于steal属性，位置优化算法可以利用如下公式构建：

x_i(t+1)＝X″+ε×g×(|x_i(t)-Lb′|+|x_i(t)-Lb″|)

其中，x_i(t+1)为第i+1个偷窃个体在第t次迭代时的位置，x_i(t)为第i个偷窃个体在第t次迭代时的位置，X″为全局最优位置，X′为当前种群内的最优位置，ε为常量，常用值为0.5，g为一维随机向量，服从正态分布，其维数与位置向量匹配，Lb″分别为最佳觅食区域的下限，Lb′为个体繁殖区域的下限；

自适应t分布突变策略，可以利用如下公式构建：

其中，为干扰后的个体位置，x_l为第l个个体的位置，t(iter)为以迭代次数iter为自由度的t分布。

参照附图9，在一些实施例中，可以包括：

S901：将所述训练样本集划分为训练集及验证集；

S902：利用所述训练集训练神经网络模型；

S903：将所述验证集中的历史气象数据输入至训练得到的神经网络模型中；

S904：根据模型输出结果及所述验证集中的真实标签计算准确率；

S905：若所述准确率小于第三阈值，则重新训练所述神经网络模型；

S906：若所述准确率不小于第三阈值，则完成所述神经网络模型的训练。

可以理解为，一些实施例中，将所述训练样本集划分为训练集及验证集，作用是用来拟合模型，通过设置分类器的参数，训练分类模型。后续结合验证集作用时，会选出同一参数的不同取值，拟合出多个分类器，验证集的作用是当通过训练集训练出多个模型后，为了能找出效果最佳的模型，使用各个模型对验证集数据进行预测，并记录模型准确率。选出效果最佳的模型所对应的参数，即用来调整模型参数，在训练集和验证集的共同作用下，能够进一步增强模型训练效果，一些实施例中，还将训练样本集划分为训练集、验证集和测试集，通过测试集进行模型预测，衡量该最优模型的性能和分类能力，即可以把测试集理解为不参与模型训练的数据集，当已经确定模型参数后，使用测试集进行模型性能评价。

需要说明的是，尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

基于同一发明构思，本说明书的一些实施例还提供了一种配电网负荷预测方法，参考图10所示，在一些实施例中，所述方法可以包括：

S1001：接收待分析的影响因素数据；

S1002：将所述待分析的影响因素数据输入至利用前述任一实施例所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

与上述的配电网负荷预测模型建立方法对应，本说明书的一些实施例还提供了一种配电网负荷预测模型建立装置，参考图11所示，在一些实施例中，所述装置可以包括：

接收模块1101，用于获取用电负荷数据集和影响因素数据集；

提取模块1102，用于从所述用电负荷数据集中提取用电特征集；

聚类模块1103，用于对所述用电特征集进行多级层次聚类，得到用电聚类信息；

建立模块1104，用于根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集；

优化模块1105，用于构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值；

训练模块1106，用于利用所述训练样本集训练神经网络模型，将训练完成的神经网络模型作为配电网负荷预测模型。

基于同一发明构思，与上述的配电网负荷预测方法对应，本说明书的一些实施例还提供了一种配电网负荷预测装置，参考图12所示，在一些实施例中，所述装置可以包括：

获取模块1201，用于接收待分析的影响因素数据；

预测模块1202，用于将所述待分析的影响因素数据输入至利用前述任一实施例所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

需要说明的是，本说明书的实施例中，所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权同意且经过各方充分授权的信息和数据。

本说明书的实施例还提供一种计算机设备。如图13所示，在本说明书一些实施例中，所述计算机设备1302可以包括一个或多个处理器1304，诸如一个或多个中央处理单元(CPU)或图形处理器(GPU)，每个处理单元可以实现一个或多个硬件线程。计算机设备1302还可以包括任何存储器1306，其用于存储诸如代码、设置、数据等之类的任何种类的信息，一具体实施例中，存储器1306上并可在处理器1304上运行的计算机程序，所述计算机程序被所述处理器1304运行时，可以执行上述任一实施例所述的方法的指令。非限制性的，比如，存储器1306可以包括以下任一项或多种组合：任何类型的RAM，任何类型的ROM，闪存设备，硬盘，光盘等。更一般地，任何存储器都可以使用任何技术来存储信息。进一步地，任何存储器可以提供信息的易失性或非易失性保留。进一步地，任何存储器可以表示计算机设备1302的固定或可移除部件。在一种情况下，当处理器1304执行被存储在任何存储器或存储器的组合中的相关联的指令时，计算机设备1302可以执行相关联指令的任一操作。计算机设备1302还包括用于与任何存储器交互的一个或多个驱动机构1308，诸如硬盘驱动机构、光盘驱动机构等。

计算机设备1302还可以包括输入/输出接口1310(I/O)，其用于接收各种输入(经由输入设备1312)和用于提供各种输出(经由输出设备1314)。一个具体输出机构可以包括呈现设备1316和相关联的图形用户接口1318(GUI)。在其他实施例中，还可以不包括输入/输出接口1310(I/O)、输入设备1312以及输出设备1314，仅作为网络中的一台计算机设备。计算机设备1302还可以包括一个或多个网络接口1320，其用于经由一个或多个通信链路1322与其他设备交换数据。一个或多个通信总线1324将上文所描述的部件耦合在一起。

通信链路1322可以以任何方式实现，例如，通过局域网、广域网(例如，因特网)、点对点连接等、或其任何组合。通信链路1322可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。

本申请是参照本说明书一些实施例的方法、设备(系统)、计算机可读存储介质和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理器的处理器以产生一个机器，使得通过计算机或其他可编程数据处理器的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理器以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理器上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算机设备访问的信息。按照本说明书中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理器来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

还应理解，在本说明书实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种配电网负荷预测模型建立方法，其特征在于，所述方法包括：

获取用电负荷数据集和影响因素数据集；

从所述用电负荷数据集中提取用电特征集；

对所述用电特征集进行多级层次聚类，得到用电聚类信息；

2.根据权利要求1所述的方法，其特征在于，获取用电负荷数据集后，进一步包括：

清洗所述用电负荷数据集中的脏数据和残缺数据；

对清洗后的用电负荷数据集进行归一化处理。

3.根据权利要求1所述的方法，其特征在于，从所述用电负荷数据集中提取用电特征集，包括：

对所述小波系数矩阵进行降噪处理；

构建降噪后的小波系数矩阵对应的用电特征集。

4.根据权利要求1所述的方法，其特征在于，对所述用电特征集进行多级层次聚类，得到用电聚类信息，包括：

计算每个用电特征与每个第一归类中心的余弦加权相似度；

5.根据权利要求4所述的方法，其特征在于，确定每个第一归类结果的类中心与第一归类中心之间的局部加权相似度，包括：

确定哈希处理结果对应的哈希相似度；

6.根据权利要求1所述的方法，其特征在于，所述影响因素数据集包括历史气象数据、新型产业发展指数数据。

7.根据权利要求6所述的方法，其特征在于，根据所述用电聚类信息、用电负荷数据集和影响因素数据集建立训练样本集，包括：

根据所述用电聚类信息对所述用电负荷数据集进行分类；

8.根据权利要求1所述的方法，其特征在于，构建与群智能优化算法级联的神经网络模型，以优化所述神经网络模型的权重和阈值，包括：

利用混沌映射初始化得到种群；

确定种群中所有个体的适应度；

根据个体的属性信息，更新种群中所有个体的位置；

判断更新后每个个体的位置是否超出预设边界；

9.根据权利要求1所述的方法，其特征在于，利用所述训练样本集训练神经网络模型，进一步包括：

将所述训练样本集划分为训练集及验证集；

利用所述训练集训练神经网络模型；

根据模型输出结果及所述验证集中的真实标签计算准确率；

10.一种配电网负荷预测方法，其特征在于，所述方法包括：

接收待分析的影响因素数据；

将所述待分析的影响因素数据输入至利用权利要求1-9任一项所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

11.一种配电网负荷预测模型建立装置，其特征在于，所述装置包括：

接收模块，用于获取用电负荷数据集和影响因素数据集；

提取模块，用于从所述用电负荷数据集中提取用电特征集；

12.一种配电网负荷预测装置，其特征在于，所述装置包括：

获取模块，用于接收待分析的影响因素数据；

预测模块，用于将所述待分析的影响因素数据输入至利用权利要求1-10任一项所述方法训练得到的配电网负荷预测模型中，得到所述待分析的影响因素数据对应的配电网负荷预测结果。

13.一种计算机设备，包括存储器、处理器、以及存储在所述存储器上的计算机程序，其特征在于，所述计算机程序被所述处理器运行时，执行根据权利要求1-10任意一项所述方法的指令。

14.一种计算机存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被计算机设备的处理器运行时，执行根据权利要求1-10任意一项所述方法的指令。

15.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序，所述计算机程序被处理器运行时，执行根据权利要求1-10任意一项所述方法的指令。