CN118626883A

CN118626883A - 负荷数据的特性分析分析方法、装置、计算机设备、可读存储介质和程序产品

Info

Publication number: CN118626883A
Application number: CN202410615844.0A
Authority: CN
Inventors: 孙立明; 余涛
Original assignee: Guangzhou Shuimu Qinghua Technology Co ltd
Current assignee: Guangzhou Shuimu Qinghua Technology Co ltd
Priority date: 2024-05-17
Filing date: 2024-05-17
Publication date: 2024-09-10

Abstract

本申请涉及一种负荷数据的特性分析方法、装置、计算机设备、存储介质和计算机程序产品，涉及电力系统技术领域。本申请能够达到大幅节约训练成本、有效样本数量要求较少以及在多种应用场景上仍具有良好性能的技术效果。该方法包括：对目标地区的历史有功功率数据进行预处理，得到目标负荷数据；对分类后的工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正；利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正；将修正后的最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。

Description

负荷数据的特性分析分析方法、装置、计算机设备、可读存储介质和程序产品

技术领域

本申请涉及电力系统技术领域，特别是涉及一种负荷数据的特性分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

背景技术

在电力系统中，对负荷数据的特性分析是确保电网稳定运行和高效调度的关键技术。准确的负荷特性分析有助于电力公司优化资源分配、减少运营成本，并提高对突发事件的响应能力。传统的机器学习模型虽然提升了算法精度，但在极端天气、节假日等小样本场景下，表现并不理想，主要因为这些场景缺乏足够的数据样本，且机器学习模型的黑盒特性限制了其在实际业务决策中的应用。

当前常见的方法是利用参数量较大的深度学习模型来进行负荷数据的特性分析，但这需要消耗庞大的计算资源和存储资源，存在算法复杂度高、样本数据量要求大以及模型更新效率低等问题，导致该方案无法在新场景上快速更新部署。

发明内容

基于此，有必要针对上述技术问题，提供一种负荷数据的特性分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种负荷数据的特性分析方法，包括：

获取目标地区的历史有功功率数据，对所述历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；

将所述目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；

根据每日更新后的当前负荷数据集，对所述工作日最优聚类中心曲线进行实时修正；

利用预设的多元影响因素修正方法，对所述节假日最优聚类中心曲线进行实时修正；

将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到所述目标地区的典型最优负荷特性曲线。

在其中一个实施例中，所述对所述有功功率数据进行数据清洗和归一化处理，得到目标负荷数据，包括：

检测出所述历史有功功率数据中的异常值和缺失值，对所述异常值进行剔除并对所述缺失值进行补全，得到数据清洗后的历史有功功率数据；根据所述目标地区的日最大有功功率值，对所述数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为所述目标负荷数据。

在其中一个实施例中，所述对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线，包括：

在所述工作日负荷数据和所述节假日负荷数据中，分别确定预设数量的初始聚类质心；根据所述初始聚类质心，确定所述工作日负荷数据和所述节假日负荷数据中的剩余样本，并分别计算所述剩余样本到所述初始聚类质心的动态时间规整距离；基于所述动态时间规整距离，对所述工作日负荷数据和所述节假日负荷数据分别进行序列聚类，得到所述工作日最优聚类中心曲线和所述节假日最优聚类中心曲线。

在其中一个实施例中，所述利用预设的多元影响因素修正方法，对所述节假日最优聚类中心曲线进行实时修正，包括：

根据预设的特征种类和时间范围，确定待输入特征；将所述待输入特征输入预先构建的预测结果贡献度计算模型，得到各所述待输入特征对负荷预测结果的目标贡献度；基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正。

在其中一个实施例中，在基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正之前，还包括：

根据所述待输入特征，构建负荷预测模型；所述基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正，包括：基于所述目标贡献度，对待训练的事后解释模型进行训练，直至经训练的所述事后解释模型的输出结果与所述负荷预测模型的输出结果一致；利用经训练的所述事后解释模型，对所述节假日最优聚类中心曲线进行实时修正。

在其中一个实施例中，在获取目标地区的历史有功功率数据之后，还包括：

根据所述历史有功功率数据的采集日期和预设采样点，生成所述历史有功功率数据对应的有功功率序列；基于所述有功功率序列，构建负荷数据库；根据所述每日更新后的当前负荷数据集，对所述负荷数据库进行滚动更新。

第二方面，本申请还提供了一种负荷数据的特性分析装置，包括：

数据处理模块，用于获取目标地区的历史有功功率数据，对所述历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；

序列聚类模块，用于将所述目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；

第一修正模块，用于根据每日更新后的当前负荷数据集，对所述工作日最优聚类中心曲线进行实时修正；

第二修正模块，用于利用预设的多元影响因素修正方法，对所述节假日最优聚类中心曲线进行实时修正；

数据汇总模块，用于将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到所述目标地区的典型最优负荷特性曲线。

第三方面，本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取目标地区的历史有功功率数据，对所述历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；将所述目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；根据每日更新后的当前负荷数据集，对所述工作日最优聚类中心曲线进行实时修正；利用预设的多元影响因素修正方法，对所述节假日最优聚类中心曲线进行实时修正；将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到所述目标地区的典型最优负荷特性曲线。

第四方面，本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

第五方面，本申请还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

上述负荷数据的特性分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品，通过对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；再根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正；然后利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正；最后将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。本方案中利用多元影响因素对节假日最优聚类中心曲线进行实时修正，还充分考虑了负荷特性分析中有效样本数量不足的问题，构建了考虑多元影响因素校正的负荷特性分析流程，从而达到大幅节约训练成本、有效样本数量要求较少以及在多种应用场景上仍具有良好性能的技术效果，使得该方案能够在新场景上快速更新部署。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案，下面将对本申请实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为一个实施例中负荷数据的特性分析方法的应用环境图；

图2为一个实施例中负荷数据的特性分析方法的流程示意图；

图3为一个实施例中序列聚类步骤的流程示意图；

图4为一个具体实施例中负荷数据的特性分析方法的流程示意图；

图5为一个应用实施例中负荷数据的特性分析方法的流程示意图；

图6为一个实施例中负荷数据的特性分析装置的结构框图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的负荷数据的特性分析方法，可以应用于如图1所示的应用环境中。其中，终端通过网络与服务器进行通信。数据存储系统可以存储服务器需要处理的数据。数据存储系统可以集成在服务器上，也可以放在云上或其他网络服务器上。

具体地，本申请实施例提供的负荷数据的特性分析方法，可以由服务器执行。

示例性的，服务器获取目标地区的历史有功功率数据，对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；服务器将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；服务器根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正；服务器利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正；服务器将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。

在如图1所示的应用环境中，终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或分布式系统，还可以是提供云计算服务的云服务器。

在一个示例性的实施例中，如图2所示，提供了一种负荷数据的特性分析方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤S201至步骤S205。其中：

步骤S201，获取目标地区的历史有功功率数据，对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据。

其中，历史有功功率数据可以是给定每日采样点m后，第k天获得的有功功率序列，经过N天负荷数据收集后，形成负荷数据集。

具体地，服务器响应于负荷数据的特性分析指令，获取目标地区的历史有功功率数据，对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据。

步骤S202，将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

其中，序列聚类是一种针对时间序列数据的聚类方法，其目标是将具有相似模式或趋势的时间序列样本归为同一类别，通过对时间序列数据进行聚类，可以帮助发现数据中的规律和趋势，从而为决策和预测提供支持。

具体地，服务器将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行基于DTW距离（Dynamic Time Warping，动态时间规整距离）的序列K-means聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

步骤S203，根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正。

其中，工作日最优聚类中心曲线可以是通过评估工作日负荷数据中不同簇数目（k）的聚类结果，来选择最佳的簇数目，从而帮助确定最合适的聚类结果。

其中，每日更新后的当前负荷数据集可以通过在新增每日实际负荷数据的负荷数据库进行滚动更新而得到。

具体地，服务器在负荷数据库中获取每日更新后的当前负荷数据集，并根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正。

步骤S204，利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正。

其中，节假日最优聚类中心曲线可以是通过评估节假日负荷数据中不同簇数目（k）的聚类结果，来选择最佳的簇数目，从而帮助确定最合适的聚类结果。

具体地，服务器利用基于SHAP值（SHapley Additive exPlanations，沙普利值）分析的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正。

步骤S205，将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。

其中，典型最优负荷特性曲线可以是在电力系统中用于描述负荷对电压的响应的一种曲线，这种曲线通常是非线性的，其形状取决于负荷的性质以及系统的运行状态。

具体地，服务器将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总融合，得到目标地区的典型最优负荷特性曲线。

上述负荷数据的特性分析方法中，通过对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；再根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正；然后利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正；最后将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。本方案中利用多元影响因素对节假日最优聚类中心曲线进行实时修正，还充分考虑了负荷特性分析中有效样本数量不足的问题，构建了考虑多元影响因素校正的负荷特性分析流程，从而达到大幅节约训练成本、有效样本数量要求较少以及在多种应用场景上仍具有良好性能的技术效果，使得该方案能够在新场景上快速更新部署。

在其中一个实施例中，对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据，具体包括如下步骤：

检测出历史有功功率数据中的异常值和缺失值，对异常值进行剔除并对缺失值进行补全，得到数据清洗后的历史有功功率数据；根据目标地区的日最大有功功率值，对数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为目标负荷数据。

其中，标幺化处理可以是一种数据预处理技术，常用于将数据进行无量纲化，使不同特征之间具有可比性，同时消除由于量纲不同而引起的计算误差；标幺化处理的核心思想是将原始数据按照某种方式进行转换，使得其取值范围都在0到1之间。

具体地，服务器检测出历史有功功率数据中的异常值和缺失值，对异常值进行剔除并对缺失值进行补全，得到数据清洗后的历史有功功率数据；根据目标地区的日最大有功功率值，对数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为目标负荷数据。

举例说明，异常值剔除可以通过使用Z-Score方法进行异常值检测，通过计算数据点与平均值之差与标准差的比值，来判断数据点是否为异常值：

其中，是指第i天第j个数据点的采样值，是指负荷数据库的均值，是指负荷数据库的标准差；当大于3或者小于-3时，该数据点被认定为异常值，并使用临近两点进行插值处理；对于第N天的负荷数据，若异常值数量超过20%，则直接删除处理。

缺失值补全可以是对负荷数据库中出现的缺失值或不连续性的数据进行插值：

其中，是待插值的采样时刻，和是已知的采样时刻，和是已知的数据点，是待插值的数据点。

归一化处理可以以目标地区的日最大有功功率值作为基准值，对原始数据点进行标幺化处理，将数据放缩至区间：

其中，是目标地区的日最大有功功率值。

本实施例中，通过对所述历史有功功率数据进行异常值剔除、缺失值补全以及标幺化处理，从而准确得到符合特性分析需求的目标负荷数据。

在其中一个实施例中，如图3所示，对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线，具体包括如下步骤：

步骤S301，在工作日负荷数据和节假日负荷数据中，分别确定预设数量的初始聚类质心。

步骤S302，根据初始聚类质心，确定工作日负荷数据和节假日负荷数据中的剩余样本，并分别计算剩余样本到初始聚类质心的动态时间规整距离。

步骤S303，基于动态时间规整距离，对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

其中，动态时间规整距离（Dynamic Time Warping，DTW）是一种用于度量两个时间序列之间相似度的参数。

具体地，服务器在工作日负荷数据和节假日负荷数据中，随机选取预设数量的初始聚类质心；根据初始聚类质心，确定工作日负荷数据和节假日负荷数据中的剩余样本，并分别计算剩余样本到初始聚类质心的动态时间规整距离；基于动态时间规整距离，对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

举例说明，基于DTW距离的序列K-means聚类方法可基于序列之间的DTW距离进行聚类，两个序列之间的DTW距离计算方法可通过构建一个代价矩阵C，找到一条路径使从起点(1, 1)到终点(m, n)的距离最短，代价矩阵中元素的计算公式为：

其中，m和n分别为两序列的长度；表示i和j的欧式距离。

上述的序列K-means聚类方法，具体包括以下步骤：

1）在负荷数据库中随机选取k个序列作为初始聚类质心；

2）计算剩余样本到聚类中心的DTW距离，并将其分配至距离最近的簇内；

3）所有样本分配完成后，更新簇内质心；

4）重复步骤2）和步骤3），当样本所属簇未改变时，则结束。

本实施例中，通过对工作日负荷数据和节假日负荷数据分别进行序列K-means聚类，可以有效地处理时间序列数据，并且能够更好地保留序列中的时间信息，从而得到更具有实际意义的工作日最优聚类中心曲线和节假日最优聚类中心曲线。

在其中一个实施例中，对利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正，具体包括如下步骤：

根据预设的特征种类和时间范围，确定待输入特征；将待输入特征输入预先构建的预测结果贡献度计算模型，得到各待输入特征对负荷预测结果的目标贡献度；基于目标贡献度，对节假日最优聚类中心曲线进行实时修正。

其中，待输入特征可以是节假日类型、气温、区域和历史负荷值因素等。

其中，预测结果贡献度计算模型可以是：

上式中，Q是I中包含特征i的所有子集形成的集合；是为集合Q元素个数，为特征i加入联盟的概率；它的分母表示n个特征的排列种数，分子表示联盟中，前个特征进入联盟的排列种数，然后特征i进入，然后再乘上后面个特征进入联盟的排列种数，特征i加入联盟后，其对联盟对贡献值是。

具体地，服务器根据预设的特征种类和时间范围，确定待输入特征；将待输入特征输入预先构建的预测结果贡献度计算模型，得到各待输入特征对负荷预测结果的目标贡献度；基于目标贡献度，对节假日最优聚类中心曲线进行实时修正。

举例说明，基于SHAP值分析的多元影响因素修正方法，可以包括以下步骤：

1）考虑节假日类型、气温、区域和历史负荷值因素作为特征值，构建负荷预测模型；设预测日为D，则以D-30天至D-1天的特征值预测第D天的负荷数据；

2）计算各输入特征对负荷预测结果的Shapley贡献值，计算方法为：

3）基于Shapley贡献值构建事后解释模型，通过Shapley贡献值量化特征在原模型决策的影响，并满足事后解释模型的结果与原模型的结果一致：

其中，是负荷预测模型预测的平均值，C是特征总数。

4）利用事后解释模型对节假日最优聚类中心曲线进行修正，即以节假日最优聚类中心曲线的值作为，利用各特征的Shapley贡献值进行修正。

本实施例中，通过利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正，从而准确得到修正后的考虑时效性的节假日最优聚类中心曲线。

在其中一个实施例中，在基于目标贡献度，对节假日最优聚类中心曲线进行实时修正之前，本申请的方法还包括如下步骤：

根据待输入特征，构建负荷预测模型；

基于目标贡献度，对节假日最优聚类中心曲线进行实时修正，具体包括如下步骤：

基于目标贡献度，对待训练的事后解释模型进行训练，直至经训练的事后解释模型的输出结果与负荷预测模型的输出结果一致；利用经训练的事后解释模型，对节假日最优聚类中心曲线进行实时修正。

具体地，服务器根据待输入特征，构建负荷预测模型；基于目标贡献度，对待训练的事后解释模型进行训练，直至经训练的事后解释模型的输出结果与负荷预测模型的输出结果一致；利用经训练的事后解释模型，对节假日最优聚类中心曲线进行实时修正。

本实施例中，通过利用经训练的事后解释模型，对节假日最优聚类中心曲线进行实时修正，从而准确得到修正后的考虑时效性的节假日最优聚类中心曲线，同时有利于促进业务人员与模型之间的互动，使得新获得的负荷数据能够反馈到模型中。

在其中一个实施例中，在获取目标地区的历史有功功率数据之后，本申请的方法还包括如下步骤：

根据历史有功功率数据的采集日期和预设采样点，生成历史有功功率数据对应的有功功率序列；基于有功功率序列，构建负荷数据库；根据每日更新后的当前负荷数据集，对负荷数据库进行滚动更新。

具体地，服务器根据历史有功功率数据的采集日期和预设采样点，生成历史有功功率数据对应的有功功率序列；基于有功功率序列，构建负荷数据库；根据每日更新后的当前负荷数据集，对负荷数据库进行滚动更新。

举例说明，目标地区的有功功率数据可以是在给定每日采样点m的情况下，第k天获得的有功功率序列，经过N天负荷数据收集后，形成负荷数据库。

本实施例中，基于有功功率序列，构建负荷数据库，并根据每日更新后的当前负荷数据集，对负荷数据库进行滚动更新，实现了负荷数据的高效存储和利用。

在一个实施例中，如图4所示，提供了一个具体实施例中负荷数据的特性分析，具体包括以下步骤：

步骤S401，获取目标地区的历史有功功率数据，检测出历史有功功率数据中的异常值和缺失值，对异常值进行剔除并对缺失值进行补全，得到数据清洗后的历史有功功率数据。

步骤S402，根据目标地区的日最大有功功率值，对数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为目标负荷数据。

步骤S403，将目标负荷数据按工作日和节假日进行分类，在工作日负荷数据和节假日负荷数据中，分别确定预设数量的初始聚类质心；根据初始聚类质心，确定工作日负荷数据和节假日负荷数据中的剩余样本，并分别计算剩余样本到初始聚类质心的动态时间规整距离。

步骤S404，基于动态时间规整距离，对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

步骤S405，根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正。

步骤S406，根据预设的特征种类和时间范围，确定待输入特征；将所述待输入特征输入预先构建的预测结果贡献度计算模型，得到各所述待输入特征对负荷预测结果的目标贡献度。

步骤S407，根据待输入特征，构建负荷预测模型；基于目标贡献度，对待训练的事后解释模型进行训练，直至经训练的事后解释模型的输出结果与负荷预测模型的输出结果一致；利用经训练的事后解释模型，对节假日最优聚类中心曲线进行实时修正。

步骤S408，将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。

上述负荷数据的特性分析方法中，充分考虑了负荷特性分析中有效样本数量不足的问题，构建了考虑多元影响因素校正的负荷特性分析流程，并通过特征解释性分析提高模型的透明度，促进业务人员与模型之间的互动，使得新获得的负荷数据能够反馈到模型中，实现模型的持续改进。

在一个实施例中，如图5所示，提供了一个应用实施例中负荷数据的特性分析，具体包括以下步骤：

步骤1：获取目标地区的有功功率数据，构建负荷数据库。

步骤2：对原始数据样本进行预处理，包括对原始数据样本中的异常值剔除、缺失值补全以及归一化处理，获得预处理后的负荷数据。

步骤3：将预处理后的负荷数据按工作日和节假日进行分类，利用基于DTW距离的序列K-means聚类方法对工作日负荷数据和节假日负荷数据分别进行聚类，分别获得工作日和节假日的最优聚类中心曲线。

步骤4：通过步骤3获得的最优聚类中心曲线，按工作日和节假日的不同分别进行实时修正：对于工作日，使用步骤3方法在新增每日实际负荷数据的负荷数据库进行滚动更新，获得工作日修正最优聚类中心曲线；对于节假日，使用基于SHAP值分析的多元影响因素修正方法获得节假日修正最优聚类中心曲线；实时修正后的结果，即为考虑多元影响因素校正后的目标地区的典型最优负荷特性曲线。

上述实施例带来的有益效果如下：

本方案充分考虑了负荷特性分析中有效样本数量不足的问题，构建了考虑多元影响因素校正的负荷特性分析流程，并通过特征解释性分析提高模型的透明度，促进业务人员与模型之间的互动，使得新获得的负荷数据能够反馈到模型中，实现模型的持续改进。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的负荷数据的特性分析方法的负荷数据的特性分析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个负荷数据的特性分析装置实施例中的具体限定可以参见上文中对于负荷数据的特性分析方法的限定，在此不再赘述。

在一个示例性的实施例中，如图6所示，提供了一种负荷数据的特性分析装置，包括：

数据处理模块601，用于获取目标地区的历史有功功率数据，对历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据；

序列聚类模块602，用于将目标负荷数据按工作日和节假日进行分类，并对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线；

第一修正模块603，用于根据每日更新后的当前负荷数据集，对工作日最优聚类中心曲线进行实时修正；

第二修正模块604，用于利用预设的多元影响因素修正方法，对节假日最优聚类中心曲线进行实时修正；

数据汇总模块605，用于将修正后的工作日最优聚类中心曲线和修正后的节假日最优聚类中心曲线进行汇总，得到目标地区的典型最优负荷特性曲线。

在一个实施例中，数据处理模块601，还用于检测出历史有功功率数据中的异常值和缺失值，对异常值进行剔除并对缺失值进行补全，得到数据清洗后的历史有功功率数据；根据目标地区的日最大有功功率值，对数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为目标负荷数据。

在一个实施例中，序列聚类模块602，还用于在工作日负荷数据和节假日负荷数据中，分别确定预设数量的初始聚类质心；根据初始聚类质心，确定工作日负荷数据和节假日负荷数据中的剩余样本，并分别计算剩余样本到初始聚类质心的动态时间规整距离；基于动态时间规整距离，对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线。

在一个实施例中，第二修正模块604，还用于根据预设的特征种类和时间范围，确定待输入特征；将待输入特征输入预先构建的预测结果贡献度计算模型，得到各待输入特征对负荷预测结果的目标贡献度；基于目标贡献度，对节假日最优聚类中心曲线进行实时修正。

在一个实施例中，负荷数据的特性分析装置还包括模型构建模块，用于根据待输入特征，构建负荷预测模型；第二修正模块604，还用于基于目标贡献度，对待训练的事后解释模型进行训练，直至经训练的事后解释模型的输出结果与负荷预测模型的输出结果一致；利用经训练的事后解释模型，对节假日最优聚类中心曲线进行实时修正。

在一个实施例中，负荷数据的特性分析装置还包括数据更新模块，用于根据历史有功功率数据的采集日期和预设采样点，生成历史有功功率数据对应的有功功率序列；基于有功功率序列，构建负荷数据库；根据每日更新后的当前负荷数据集，对负荷数据库进行滚动更新。

上述负荷数据的特性分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个示例性的实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O）和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储有功功率序列数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种负荷数据的特性分析方法。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要符合相关规定。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性存储器和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-Only Memory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（Resistive Random Access Memory，ReRAM）、磁变存储器（Magnetoresistive RandomAccess Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random Access Memory，SRAM）或动态随机存取存储器（Dynamic Random Access Memory，DRAM）等。本申请提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器、人工智能（Artificial Intelligence，AI）处理器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本申请记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种负荷数据的特性分析方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述历史有功功率数据进行数据清洗和归一化处理，得到目标负荷数据，包括：

检测出所述历史有功功率数据中的异常值和缺失值，对所述异常值进行剔除并对所述缺失值进行补全，得到数据清洗后的历史有功功率数据；

根据所述目标地区的日最大有功功率值，对所述数据清洗后的有功功率数据进行标幺化处理，得到取值范围在预设区间内的历史有功功率数据，作为所述目标负荷数据。

3.根据权利要求2所述的方法，其特征在于，所述对工作日负荷数据和节假日负荷数据分别进行序列聚类，得到工作日最优聚类中心曲线和节假日最优聚类中心曲线，包括：

在所述工作日负荷数据和所述节假日负荷数据中，分别确定预设数量的初始聚类质心；

根据所述初始聚类质心，确定所述工作日负荷数据和所述节假日负荷数据中的剩余样本，并分别计算所述剩余样本到所述初始聚类质心的动态时间规整距离；

基于所述动态时间规整距离，对所述工作日负荷数据和所述节假日负荷数据分别进行序列聚类，得到所述工作日最优聚类中心曲线和所述节假日最优聚类中心曲线。

4.根据权利要求1所述的方法，其特征在于，所述利用预设的多元影响因素修正方法，对所述节假日最优聚类中心曲线进行实时修正，包括：

根据预设的特征种类和时间范围，确定待输入特征；

将所述待输入特征输入预先构建的预测结果贡献度计算模型，得到各所述待输入特征对负荷预测结果的目标贡献度；

基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正。

5.根据权利要求4所述的方法，其特征在于，在基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正之前，还包括：

根据所述待输入特征，构建负荷预测模型；

所述基于所述目标贡献度，对所述节假日最优聚类中心曲线进行实时修正，包括：

基于所述目标贡献度，对待训练的事后解释模型进行训练，直至经训练的所述事后解释模型的输出结果与所述负荷预测模型的输出结果一致；

利用经训练的所述事后解释模型，对所述节假日最优聚类中心曲线进行实时修正。

6.根据权利要求1至5任一项所述的方法，其特征在于，在获取目标地区的历史有功功率数据之后，还包括：

根据所述历史有功功率数据的采集日期和预设采样点，生成所述历史有功功率数据对应的有功功率序列；

基于所述有功功率序列，构建负荷数据库；

根据所述每日更新后的当前负荷数据集，对所述负荷数据库进行滚动更新。

7.一种负荷数据的特性分析装置，其特征在于，所述装置包括：

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。