CN115630979A

CN115630979A - 日前电价的预测方法、装置、存储介质及计算机设备

Info

Publication number: CN115630979A
Application number: CN202211114971.XA
Authority: CN
Inventors: 张荣权; 李刚强; 郑裕霞; 万宇菲; 王莉; 谢正侠; 熊婕; 罗玲玲
Original assignee: Nanchang Jiaotong University
Current assignee: Nanchang Jiaotong University
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2023-01-20

Abstract

本申请实施例公开了一种日前电价的预测方法、装置、存储介质及计算机设备，涉及电价预测领域。本申请基于皮尔逊系数选择特征，然后使用DBSCAN算法对电价数据集进行异常值检测，然后训练不带池化层的NPCNN以保证最小化网络结构，再应用小波变换分解的子频率序列训练决策树，利用训练好的NPCNN预测日前电价和训练好的决策树预测误差，将预测的日前电价和误差进行叠加得到最终的日前预测电价，可与提高模型训练过程中的收敛速度，以及提高训练效果，以及提高预测过程的预测精度。

Description

日前电价的预测方法、装置、存储介质及计算机设备

技术领域

本申请涉及电价预测领域，尤其涉及一种日前电价的预测方法、装置、存储介质及计算机设备。

背景技术

为了充分发挥市场在电力资源配置中的决定性作用以及助力碳中和的目标实现，近年来各省密集发布了电力市场化改革政策。目前，广东、蒙西、浙江、山西、山东、福建、四川、甘肃8个地区(国家第一批试点)全部开展了整月试运行和不间断电力现货结算试运行。在电力现货市场政策背景下，发电企业通常按照报量报价曲线获取现货市场的发电利润，售电企业按照报量不报价曲线支出现货市场的购电费用。基于此，发电/售电企业为了能够在电力现货市场实现利润最大化/成本最小化，高精度和高稳定的电力现货市场价格预测方法是迫切需要的。然而由于电力现货价格存在强波动性和非线性，已成为学术界和工程界面临的重大挑战。至今为止，有关电价预测方法可以大致分为：第一类为基于物理预测模型的电力现货市场价格预测；第二类基于统计方法的电力现货市场价格预测；第三类基于机器学习的电力现货价格预测；第四类，基于混合模型的电力现货价格预测。第一类是根据安全约束机组组合模型和安全约束经济调度模型提前模拟电力市场出清流程，由于预测逻辑是真实反应电力现货价格实现流程，这种方法在电力现货市场前期受电力交易人员青睐。但这种方法存在以下弊端：1)物理模型预测无法实时获取电网运行的全部边际条件；2)物理模型预测存在建模复杂，实际应用缺乏技术支撑；3)倘若预测过程存在不期望输入，物理模型的预测性能将变差。第二类是通过使用线性拟合(例如自回归移动平均)来建立历史和电力现货价格时间序列数据之间的映射关系。相较于物理模型，该方法的高运行速度、模型简单、方便等。然而，统计模型往往依赖于历史数据，需要强相关的特征，难以拟合电力现货价格数据的强波动性和高维性。第三类方法可以具体分为浅层学习和深度学习方法。浅层学习方法主要是设计成更小的网络结构，利用误差最小化原理和一定的优化算法来提取非线性特征。由于其在学习非线性特征方面的显着能力，与物理方法和统计方法相比，浅层学习方法已用于电力现货市场价格预测。常用的浅层学习方法包括决策树、k-最近邻、多层感知器、反向传播神经网络、径向基函数神经网络、支持向量回归、提升方法和极限学习机。但随着近年来大数据技术和智能优化理论的发展，浅层学习模型的弊端将容易出现维数灾变和欠拟合，导致大数据时代电力现货价格难以预测。

发明内容

本申请实施例提供了日前电价的预测方法、装置、存储介质及计算机设备，可以解决模型训练效率不高和预测精度较差的问题。所述技术方案如下：

第一方面，本申请实施例提供了一种日前电价的预测方法，所述方法包括：

获取历史电价数据集；其中，所述历史电价数据集包括多个电价数据，所述电价数据包括：时间点、该时间点的真实电价、该时间点的预测电价和该时间点上采集的多个潜在影响因子；

根据所述历史电价数据集，计算各个潜在影响因子和电价之间的皮尔逊系数；

根据计算的皮尔逊系数在所述多个潜在影响因子中筛选出目标影响因子；

根据具有噪声的基于密度的聚类DBSCAN算法，在筛选后的历史电价数据集中剔除异常电价数据，以及对剔除的异常电价数据进行填充处理；

根据预设比例对填充后的历史电价数据集进行划分得到训练集、验证集和测试集；

利用所述训练集对非池化卷积神经网络NPCNN进行训练；

计算所述验证集中真实电价和日前预测电价的差值得到预测误差序列；

利用小波变换对所述预测误差序列进行分解得到子频率序列；

利用所述子频率序列对决策树进行训练；

利用训练好的NPCNN在当前时刻进行电价预测得到日前预测电价；

利用训练好的决策树在当前时刻进行误差预测得到日前电价预测误差；

将所述日前预测电价和所述日前电价预测误差进行叠加得到最终日前预测电价。

第二方面，本申请实施例提供了一种日前电价的预测装置，所述装置包括：

获取单元，用于获取历史电价数据集；其中，所述历史电价数据集包括多个电价数据，所述电价数据包括：时间点、该时间点的真实电价、该时间点的预测电价和该时间点上采集的多个潜在影响因子；

计算单元，用于根据所述历史电价数据集，计算各个潜在影响因子和电价之间的皮尔逊系数；

筛选单元，用于根据计算的皮尔逊系数在所述多个潜在影响因子中筛选出目标影响因子；

剔除单元，用于根据具有噪声的基于密度的聚类DBSCAN算法，在筛选后的历史电价数据集中剔除异常电价数据，以及对剔除的异常电价数据进行填充处理；

划分单元，用于根据预设比例对填充后的历史电价数据集进行划分得到训练集、验证集和测试集；

训练单元，用于利用所述训练集对非池化卷积神经网络NPCNN进行训练；

所述计算单元，还用于计算所述验证集中真实电价和日前预测电价的差值得到预测误差序列；

分解单元，用于利用小波变换对所述预测误差序列进行分解得到子频率序列；

所述训练单元，还用于利用所述子频率序列对决策树进行训练；

预测单元，用于利用训练好的NPCNN在当前时刻进行电价预测得到日前预测电价；

所述预测单元，还用于利用训练好的决策树在当前时刻进行误差预测得到日前电价预测误差；

叠加单元，用于将所述日前预测电价和所述日前电价预测误差进行叠加得到最终日前预测电价。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

第四方面，本申请实施例提供一种计算机设备，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

本申请一些实施例提供的技术方案带来的有益效果至少包括：

基于皮尔逊系数选择特征，然后使用DBSCAN算法对电价数据集进行异常值检测，然后训练不带池化层的NPCNN以保证最小化网络结构，再应用小波变换分解的子频率序列训练决策树，利用训练好的NPCNN预测日前电价和训练好的决策树预测误差，将预测的日前电价和误差进行叠加得到最终的日前预测电价，可与提高模型训练过程中的收敛速度，以及提高训练效果，以及提高预测过程的预测精度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本申请实施例提供的网络架构示意图；

图2是本申请实施例提供的日前电价的预测方法的流程示意图；

图3是本申请提供的一种日前电价的预测装置的结构示意图；

图4是本申请提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施例方式作进一步地详细描述。

需要说明的是，本申请提供的日前电价的预测方法一般由计算机设备执行，相应的，日前电价的预测装置一般设置于计算机设备中。

图1示出了可以应用于本申请的日前电价的预测方法或日前电价的预测装置的示例性系统架构。

如图1所示，系统架构可以包括：计算机设备101和服务器102。计算机设备101和服务器102之间可以通过网络进行通信，网络用于上述各个单元之间提供通信链路的介质。网络可以包括各种类型的有线通信链路或无线通信链路，例如：有线通信链路包括光纤、双绞线或同轴电缆等，无线通信链路包括蓝牙通信链路、无线保真(WIreless-FIdelity，Wi-Fi)通信链路或微波通信链路等。

其中，服务器102为电力交易现货市场的交易服务器，服务器102中存储有历史交易记录，计算机设备102采集历史交易记录生成历史电价数据集，然后利用本申请的模型训练方法训练NPCNN和决策树，最后利用训练好的NPCNN和决策树实现日前电价的预测。

需要说明的是，计算机设备101和服务器102可以是硬件，也可以是软件。当计算机设备101和服务器102为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当计算机设备101和服务器102为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不做具体限定。

本申请的计算机设备上可以安装有各种通信客户端应用，例如：视频录制应用、视频播放应用、语音交互应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

计算机设备可以是硬件，也可以是软件。当计算机设备为硬件时，可以是具有显示屏的各种计算机设备，包括但不限于智能手机、平板电脑、膝上型便携式计算机和台式计算机等等。当计算机设备为软件时，可以是安装上述所列举的计算机设备中。其可以实现呈多个软件或软件模块(例如：用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不作具体限定。

当计算机设备为硬件时，其上还可以安装有显示设备，显示设备显示可以是各种能实现显示功能的设备，例如：显示设备可以是阴极射线管显示器(cathode ray tubedisplay，简称CR)、发光二极管显示器(light-emitting diode display，简称LED)、电子墨水屏、液晶显示屏(liquid crystal display，简称LCD)、等离子显示面板(plasmadisplaypanel，简称PDP)等。用户可以利用计算机设备上的显示设备，来查看显示的文字、图片、视频等信息。

应理解，图1中的计算机设备、网络和服务器的数目仅是示意性的。根据实现需要，可以是任意数量的计算机设备、网络和服务器。

下面将结合附图2，对本申请实施例提供的日前电价的预测方法进行详细介绍。其中，本申请实施例中的日前电价的预测装置可以是图1所示的计算机设备。

请参见图2，为本申请实施例提供了一种日前电价的预测方法的流程示意图。如图2所示，本申请实施例的所述方法可以包括以下步骤：

S201、获取历史电价数据集。

在本申请实施例中，计算机设备根据电力交易现货市场的历史交易记录获取历史电价数据集，历史电价数据集为时间序列数据，即不同时间点上采集的可能与电价相关的参数值，历史电价数据集包括多个电价数据，即历史电价数据集合对应多个时间点，电价数据包括：时间点、该时间点的真实电价、该时间点的预测电价和该时间点上采集的多个潜在影响因子，该时间点的预测电价是根据本申请中训练好的NPCNN(no poolingconvolutional neural networks，非池化卷积神经网络)预测出来的电价，即计算机设备会每隔一段时间利用本申请的方法对NPCNN网络重新进行训练，以提高预测的准确性。潜在影响因子表示可能对电价造成影响的因子，包括但不限于：历史电价、天气参数(温度、湿度、气压等)、节假日、发电机组运行参数等，历史电价表示相对该时间点的历史真实电价，历史电价的数量一般为多个。例如：时间点为2022年8月8日12时，该时间点的历史电价为2022年7月31日12时至2022年8月7日12时之间每隔1小时采集的历史真实电价。

S202、根据历史电价数据集，计算各个潜在影响因子和电价之间的皮尔逊系数。

在本申请实施例中，利用皮尔逊系数计算潜在影响因子和电价之间相关程度，以便筛选出与电价相关程度高的影响因子，删除与电价相关程度低的影响因子，以便降低训练人工神经网络的数据量和利用人工神经网络进行预测的数据量。

在本申请实施例中，利用如下公式计算潜在影响因子和电价之间的皮尔逊系数：

其中，x_h表示第h个时间点上的真实电价，y_h表示第h个时间点上的潜在影响因子，

表示历史数据集包括的真实电价的标准差，

表示历史数据集中该潜在影响因子的标准差和Cov(x_h,y_h)表示真实电价和该潜在影响因子的协方差，

表示计算得到的皮尔逊次数。

S203、根据计算的皮尔逊系数在多个潜在影响因子中筛选出目标影响因子。

在本申请实施例中，根据S202的计算方法计算得到各个潜在影响因子的皮尔逊系数，从中筛选出相关程度高的目标影响因子。当皮尔逊系数为0时，表示电价和潜在影响因子不相关；当电价和潜在影响因子同增或同减，表示电价和该潜在影响因子呈正相关；反之，若电价和潜在影响因子反增或反减，表示电价和该潜在潜在影响因子呈负相关；综上，若皮尔逊系数越接近于1或-1，则电价和潜在影响因子的相关度越高；若皮尔逊系数越接近于0，则日电价和潜在影响因子的相关度越低。本申请通过设置一个系数阈值，系数阈值的大小在0～1之间，系数阈值的大小可根据实际需求而定，将计算得到的皮尔逊系数的绝对值和该系数系数进行比较，若潜在影响因子的皮尔逊系数大于系数阈值，则该潜在影响因子为目标影响因子，保留该潜在影响因子；若潜在影响因子的皮尔逊系数不大于系数阈值，则该潜在影响因子不为目标影响因子，删除该潜在影响因子。由此可见，根据S203中进行筛选处理后的历史电价数据集中的电价数据包括：时间点、该时间点的真实电价、该时间点的预测电价和该时间点上的至少一个目标影响因子，至少一个目标影响因子的数量少于先前的影响因子的数量，从而减少历史电价数据集的数据量。

S204、根据具有噪声的基于密度的聚类DBSCAN算法，在筛选后的历史电价数据集中剔除异常电价数据，以及对剔除的异常电价数据进行填充处理。

在本申请实施例中，历史电价数据集中的电价数据在采集过程中可能发生错误，后续在使用错误的电价数据进行模型训练会产生无法收敛的问题，为了提高模型训练的收敛速度，利用DBSCAN(density-based spatial clustering of applications withnoise，具有噪声的基于密度的聚类)算法识别S203处理后的历史电价数据集中的异常电价数据。本申请的DBSCAN算法可识别异常的真实电价、异常的预测电价和异常的目标影响因子，因此可以处理高维度的电价数据，提高异常电价数据识别的效率。

其中，对异常电价数据进行剔除后，该异常电价数据在历史电价数据集中形成空缺值，本申请需要对空缺值进行填充，例如：采用线性插值法对空缺值进行填充。

举例来说，2022年8月8日12时的真实电价为空缺值，那么选择2022年8月7日和2022年8月6日12时的真实电价进行加权平均得到填充的数值。

S205、根据预设比例对填充后的历史电价数据集进行划分得到训练集、验证集和测试集。

在本申请实施例中，对S204填充处理后的历史电价数据集，根据预设比例划分为三种类型的数据集：训练集、验证集和测试集，预设比例可以根据实际需求而定，例如：按照70％：20％：10％的比例划分为训练集、验证集和测试集，训练集用于训练NPCNN，验证集用于评估NPCNN的误差，测试集用于测试NPCNN的预测能力。

S206、利用训练集对非池化卷积神经网络NPCNN进行训练。

在本申请实施例中，由于训练集中的电价数据经过S201～S203的特征选择过程，训练集包括的多个电价数据也称为样本数据，样本数据的特征数量已经大大减少，因此本申请使用不带池化操作的卷积神经网络提取特征，可以提高模型的训练效率。

其中，NPCNN由一个输入层、一个卷积层、一个全连接层和一个输出层，相比传统的CNN减少了池化层。

输入层输入训练集中的电价数据，将一维的电价数据转换为二维的电价相关特征矩阵，卷积层用于提取电价相关特征矩阵中的输出特征图，将提取的输入特征图传输至全连接层，采用如下公式提取输出特征图：

g_j＝f(∑_i∈Iw_ij*x_i+b_ij)；式(2)。

其中，*表示卷积操作，f()表示激活函数，例如：激活函数为sigmoid，g_j表示输出的第j个输出特征图，x_i表示电价相关矩阵中的第i个输入特征图，w_ij和b_ij分别为卷积层的第i输入特征图和第j输出特征图的权重和偏置。

全连接层将根据卷积层的输出特征图学习到复杂特征，将复杂特征映射到输出层形成输出层，形成第m个样本数据的第d个输出向量的日期电价预测值

本申请实施例提供一种自定义的自适应函数，以解决NPCNN的稳定性和过拟合问题，自适应函数表示如下：

其中，M表示将训练集划分的样本批次数量，D表示输出向量大小，

和

分别表示在样本批次中第m个样本数据的第d个输出向量的日前电价实际值和日前预测电价。ψ表示NPCNN的网络参数(即卷积层、全连接层和输出层中各个层的权重和偏置)，ζ表示正则化系数，通过正则化系数可以调整NPCNN中网络参数的数量，减小NPCNN网络的复杂度。

进一步，在本申请实施例使用强化萤火虫算法来估计NPCNN的最优网络参数(各个层的权重和偏置)，相比于现有的萤火虫算法，引入动量参数来减少振荡，以及使用二阶矩的估计值的自适应矩，使收敛更快、更优和更稳定。

其中，估计最优网络参数的步骤包括：

采用均匀分布生成初始种群，初始种群中包括多个萤火虫，每个萤火虫对应一个网络参数，各个萤火虫的网络参数呈均匀分布，这样有利于强化早期的探索性能，加快收敛速度。

将初始种群中的各个网络参数代入到NPCNN后，NPCNN使用样本数据进行预测得到日前预测电价，然后将日前预测电价代入到上述的自定义的自适应函数得到各个萤火虫的适应度，最小适应度的萤火虫对应的网络参数为当前最优解。

对网络参数进行更新迭代和重置适应度，采用如下公式对初始种群中萤火虫的网络参数进行更新迭代：

其中，

和

分别表示第z只萤火虫在第k+1次迭代的动量一次矩和二次矩，r_zv分别表示第z只萤火虫与第v只萤火虫之间的欧式距离，θ和l分别表示动量一次矩和二次矩的权重。η、γ、μ和a分别表示r_zv＝0处的吸引力、光吸引系数、正态分布的随机数以及学习步长。δ和∈分别表示初始学习率和调参值。

表示自适应学习率(自适应矩估计)，其学习率与二次矩有关。

在本申请实施例中，倘若变化方向与式(4)的第二项变化方向(移动萤火虫速度方向)相同，且移动萤火虫速度变大，则相应也增大；反之，倘若变化方向与式(4)的第二项变化方向(移动萤火虫速度方向)相反，且移动萤火虫速度变大，则相应也减小；以上过程意味着一次动量有助于在相关方向上加速强化萤火虫算法并抑制振荡。从(5)和(6)可以看出：如果急剧下降(萤火虫接近全局解)，学习率会增加动量变化从而跳出局部最优解。这意味着自适应矩估计方法有助于加速强化萤火虫算法提高迭代后期的收敛精度。其中，NPCNN的网络参数每次迭代之后，将网络参数代入NPCNN的自适应函数计算适应度，并重新更新当前最优解。

每次迭代后，判断是否满足预设的迭代终止条件，迭代终止条件可以是：迭代前后网络参数的误差小于自定义阈值或迭代次数达到次数阈值，自定义阈值和次数阈值可以根据实际需求而定，例如：自定义阈值为10^-6，次数阈值为100次。若为是，退出迭代过程，将当前的网络参数作为NPCNN的最优网络参数

将最优网络参数代入到NPCNN中得到训练好的NPCNN。

其中，在完成NPCNN的训练后，利用验证集对训练后的NPCNN进行验证，以及利用测试集对训练后的NPCNN进行测试，以修正NPCNN的网络参数。其中，根据如下公式计算验证集中的样本数据对应的日前预测电价，以及测试集中的样本数据对应的日前预测电价：

其中，

和

分别为验证集和测试集的日前预测电价，

和NP分别表示强化萤火虫算法的最优网络参数和NPCNN网络数学模型。Γ_vali和Γ_test分别表示训练集和测试集中样本数据的输入特征。

S207、计算验证集中真实电价和日前预测电价的差值得到预测误差序列。

在本申请实施例中，将验证集中的各个样本数据的输入特征输入到S205中训练后的NPCNN网络中得到日前预测电价，各个样本数据对应一个真实电价，将各个样本数据得到的日前预测电价和真实电价求差得到预测误差序列，预测误差序列包括高频信号和低频信号。高频信号表示NPCNN和强化萤火虫算法的输入特征的不确定变化，低频信号表示过拟合。

S208、利用小波变换对预测误差序列进行分解得到子频率序列。

在本申请实施例中，利用小波变换对预测误差序列进行分解实现提取其中的高频信号和低频信号，例如：采用如下公式对预测误差序列进行小波变换：

其中，W_p,q表示子频率序列，

表示验证集对应的日前预测电价，r_vail表示验证集对应的真实电价，φ(·)为母小波函数，例如：母小波函数为Daubechies函数，p和q分别表示缩放变量和平移变量。

S209、利用子频率序列对决策树进行训练。

其中，由于决策树具有强可解释性、泛化能力和运行快，通过决策树在子频率序列中快速提取不同频率的预测误差特征。决策树通过依次计算各个预测误差特征的误差平方和，每轮的误差平方和将得到决策树的最优特征(树的节点)和最优切分点(树的节点分叉大小)，直到把所有预测误差特征搜索完毕(完成决策树的从根至叶生成)。

S210、利用训练好的NPCNN在当前时刻进行电价预测得到日前预测电价。

在本申请实施例中，利用当前时刻采集的电价数据对预测时刻的电价进行预测得到日前预测电价，当前时刻采集的电价数据表示一个时间区间内采集的电价数据，时间区间的长度可以根据实际需求而定，当前时刻位于预测时间之前，且当前时刻和预测时刻相邻，当前时刻采集的电价数据中包括S201中确定的目标影响因子。

例如：当前时刻为2022年8月30日8：00，计算机设备采集2022年8月1日8：00～8月30日8:00的历史电价、温度、发电机组运行参数等目标影响因子，根据采集的电价数据生成输入特征数据，将输入特征数据输入到训练好的NPCNN后预测2022年8月31日8：

00的日前预测电价。

S211、利用训练好的决策树在当前时刻进行误差预测得到日前电价预测误差。

其中，基于当前时刻获取历史预测误差序列，然后使用S207的方法对历史误差序列进行小波变换得到历史子频率序列，将历史子频率序列输入到训练好的决策树中得到预测时刻的日前电价预测误差。

例如：当前时刻为2022年8月30日8:00，采集2022年8月1日8：00～2022年8月30日8:00的预测误差，得到历史预测误差序列，预测时刻为2022年8月31日8:00，决策树输出的是2022年8月31日8:00的日前电价预测误差。

S212、将日前预测电价和日前电价预测误差进行叠加得到最终日前预测电价。

例如：将S209预测的日前预测电价和电价预测误差进行叠加得到2022年8月31日8:00的最终日前预测电价。

本申请实施例的日前电价预测方法相比于现有的方法具有如下技术效果：

特征预处理：与均方差、箱型图、K均值聚类等传统异常检测方法相比，基于DBSCAN聚类的异常检测方法可以有效地解决任意形状的日前电价数据集，不存在指定归类的簇，而是通过DBSCAN聚类算法自动寻优。

特征训练：传统日前电价预测方法一般采用K邻近、支持向量回归、决策树、极端梯度增强算法、深度神经网络、长短期记忆网络、卷积神经网络等。由K邻近、支持向量回归、决策树、极端梯度增强算法等浅层机器学习模型对日前电价预测时容易出现欠拟合。由深度神经网络、长短期记忆网络、卷积神经网络等深度学习方法的参数过多而无法有效性能优化。鉴于此，基于NPCNN+强化萤火虫算法可以在保证卷积神经网络的特征提取能力时，对日前电价数据进行有效特征提取，同时强化萤火虫算法对NPCNN网络的参数进一步有效优化，可解决深度学习方法的参数过多而无法有效性能优化。

误差校正：传统日前电价预测方法主要关注于基于浅层学习/深度学习的日前电价特征训练过程，而基于深度学习模型的电力现货价格预测并不总是完美的，因为它极度依赖于超参数和网络结构的选择，导致显着的模型方差。基于小波变换+决策树的误差校正模块可以有效地减少日前电价的预测误差，同时也可以减少预测模型的方差。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参见图3，其示出了本申请一个示例性实施例提供的日前电价的预测装置的结构示意图，以下简称装置3。该装置3可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分。装置3包括：获取单元301、计算单元302、筛选单元303、剔除单元304、划分单元305、训练单元306、分解单元307、预测单元308、叠加单元309。

获取单元301，用于获取历史电价数据集；其中，所述历史电价数据集包括多个电价数据，所述电价数据包括：时间点、该时间点的真实电价、该时间点的预测电价和该时间点上采集的多个潜在影响因子；

计算单元302，用于根据所述历史电价数据集，计算各个潜在影响因子和电价之间的皮尔逊系数；

筛选单元303，用于根据计算的皮尔逊系数在所述多个潜在影响因子中筛选出目标影响因子；

剔除单元304，用于根据具有噪声的基于密度的聚类DBSCAN算法，在筛选后的历史电价数据集中剔除异常电价数据，以及对剔除的异常电价数据进行填充处理；

划分单元305，用于根据预设比例对填充后的历史电价数据集进行划分得到训练集、验证集和测试集；

训练单元306，用于利用所述训练集对非池化卷积神经网络NPCNN进行训练；

所述计算单元302，还用于计算所述验证集中真实电价和日前预测电价的差值得到预测误差序列；

分解单元307，用于利用小波变换对所述预测误差序列进行分解得到子频率序列；

所述训练单元306，还用于利用所述子频率序列对决策树进行训练；

预测单元308，用于利用训练好的NPCNN在当前时刻进行电价预测得到日前预测电价；

所述预测单元308，还用于利用训练好的决策树在当前时刻进行误差预测得到日前电价预测误差；

叠加单元309，用于将所述日前预测电价和所述日前电价预测误差进行叠加得到最终日前预测电价。

在一个或多个可能的实施例中，在训练NPCNN的过程中，使用强化萤火虫算法估计NPCNN的最优网络参数；

所述强化萤火虫算法中使用如下公式进行更新迭代和重置适应度：

其中，

和

在一个或多个可能的实施例中，迭代终止条件为：迭代次数等于次数阈值或迭代前后误差小于自定义阈值。

在一个或多个可能的实施例中，训练NPCNN过程中使用的自适应函数为：

和

分别表示在样本批次中第m个样本数据的第d个输出向量的日前电价实际值和日前预测电价。ψ表示NPCNN的网络参数(即卷积层、全连接层和输出层中各个层的权重和偏置)，ζ表示正则化系数。

在一个或多个可能的实施例中，所述利用小波变换对所述预测误差序列进行分解得到子频率序列，包括：

采用如下公式对预测误差序列进行小波变换：

其中，W_p,q表示子频率序列，

在一个或多个可能的实施例中，目标影响因子包括：历史电价、温度、节假日、竞价空间。

在一个或多个可能的实施例中，利用线性插值对剔除的异常电价数据进行填充处理。

需要说明的是，上述实施例提供的装置4在执行日前电价的预测方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成上述的全部或者部分功能。另外，上述实施例提供的日前电价的预测装置与日前电价的预测方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图2所示实施例的方法步骤，具体执行过程可以参见图2所示实施例的具体说明，在此不进行赘述。

本申请还提供了一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的日前电价的预测方法。

请参见图4，为本申请实施例提供了一种计算机设备的结构示意图。如图4所示，所述计算机设备400可以包括：至少一个处理器401，至少一个网络接口404，用户接口403，存储器405，至少一个通信总线402。

其中，通信总线402用于实现这些组件之间的连接通信。

其中，用户接口403可以包括显示屏(Display)、摄像头(Camera)，可选用户接口403还可以包括标准的有线接口、无线接口。

其中，网络接口404可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

其中，处理器401可以包括一个或者多个处理核心。处理器401利用各种接口和线路连接整个计算机设备400内的各个部分，通过运行或执行存储在存储器405内的指令、程序、代码集或指令集，以及调用存储在存储器405内的数据，执行计算机设备400的各种功能和处理数据。可选的，处理器401可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器401可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器401中，单独通过一块芯片进行实现。

其中，存储器405可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。可选的，该存储器405包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器405可用于存储指令、程序、代码、代码集或指令集。存储器405可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器405可选的还可以是至少一个位于远离前述处理器401的存储装置。如图4所示，作为一种计算机存储介质的存储器405中可以包括操作系统、网络通信模块、用户接口模块以及应用程序。

在图4所示的计算机设备400中，用户接口403主要用于为用户提供输入的接口，获取用户输入的数据；而处理器401可以用于调用存储器405中存储的应用程序，并具体执行如图2所示的方法，具体过程可参照图2所示，此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。