CN111967675A

CN111967675A - 光伏发电量的预测方法以及预测装置

Info

Publication number: CN111967675A
Application number: CN202010838375.0A
Authority: CN
Inventors: 郝吉芳; 杨培环
Original assignee: BOE Technology Group Co Ltd
Current assignee: BOE Technology Group Co Ltd
Priority date: 2020-08-19
Filing date: 2020-08-19
Publication date: 2020-11-20

Abstract

本申请实施例提供一种光伏发电量的预测方法以及预测装置，该预测方法包括：获取光伏发电站的历史数据集，所述历史数据集包括类别特征和连续特征；将所述类别特征通过embedding转换为连续稠密向量；利用预测模型根据所述连续稠密向量和所述连续特征进行光伏发电量预测。如此设计，通过将历史数据集中的类别特征通过embedding转换为连续稠密向量，利用连续稠密向量联合历史数据集中的连续特性作为预测模型的输入特征，然后运用预测模型根据输入特征进行光伏发电量预测，能够实现对历史数据集中的类别特征表达能力的增强，从而提高预测模型的预测结果的预测精度；另外embedding可以实现对历史数据集的降维，在类别特征类别数量较多时可以提高处理效率。

Description

光伏发电量的预测方法以及预测装置

技术领域

本申请实施例涉及光伏发电技术领域，尤其涉及一种光伏发电量的预测方法以及预测装置。

背景技术

光伏发电是一种利用太阳能的有效方式，但是光伏系统的发电量受太阳辐射、温度、天气类型和季节变化等因素的影响，具有间歇性、随机性和波动性的特点，在实际应用中发电量的上述特点可能给电力系统的生产和运行带来极大的挑战，因此迫切需要一种光伏发电量的预测方法。

鉴于此，相关技术中出现了基于机器学习实现光伏发电量预测的方法，具体地，将从光伏发电站采集的历史数据导入预测模型，通过对预测模型的训练实现对发电量的预测。

然而，从光伏发电站采集的历史数据类型众多，表达能力较弱，进而造成预测模型的表达能力弱，导致预测结果准确性较差，而且在历史数据类型较多的情况下，会加重预测模型的参数复杂度。

发明内容

本申请实施例的目的在于提出一种光伏发电量的预测方法以及预测装置，用于提高历史数据的表达能力，从而提高预测结果的准确性。

基于上述目的，第一方面，本申请实施例提供一种光伏发电量的预测方法，包括：

获取光伏发电站的历史数据集，所述历史数据集包括类别特征和连续特征；

将所述类别特征通过embedding转换为连续稠密向量；

利用预测模型根据所述连续稠密向量和所述连续特征进行光伏发电量预测。

在本实施例提供的一种光伏发电量的预测方法方法中，通过将历史数据集中的类别特征通过embedding转换为连续稠密向量，利用连续稠密向量联合历史数据集中的连续特性作为预测模型的输入特征，然后运用预测模型根据输入特征进行光伏发电量预测，如此设计，能够实现对历史数据集中的类别特征表达能力的增强，从而提高预测模型的预测结果的预测精度；另外embedding可以实现对历史数据集的降维，在类别特征类别数量较多时提高处理效率。

在一种可能的实施方式中，所述预测模型为采用stacking模型融合方法融合LightGBM、XGBoost以及LSTM的融合模型。通过采用stacking方法融合不同的预测模型，能够提升预测结果的预测精度。

在一种可能的实施方式中，所述预测方法还包括：将所述连续稠密向量和所述连续特征连接后形成N个输入特征；

所述利用预测模型根据所述连续稠密向量和所述连续特征进行光伏发电量预测步骤包括：

采用所述XGBoost对N个所述输入特征进行学习并得到第一结果；

采用所述LightGBM对N个所述输入特征和所述第一结果进行学习得到第二结果；

采用所述XGBoost对N个所述输入特征和所述第二结果进行学习得到第三结果；

采用所述LSTM对N个所述输入特征和所述第二结果进行学习得到第四结果；

对所述第二结果、所述第三结果和所述第四结果进行加权组合，以得到所述预测模型的预测结果；

其中，N为正整数。

在一种可能的实施方式中，所述第二结果、所述第三结果和所述第四结果的权重分别为0.3、0.3和0.4。

在一种可能的实施方式中，所述预测模型为采用stacking模型融合方法融合DecisionTree、RandomForest和Xgboost的融合模型。

采用所述RandomForest对N个所述输入特征进行学习并得到第五结果；

采用所述DecisionTree对N个所述输入特征和所述第五结果进行学习得到第六结果；

采用所述RandomForest对N个所述输入特征和所述第六结果进行学习得到第七结果；

采用所述Xgboost对N个所述输入特征和所述第六结果进行学习得到第八结果；

对所述第六结果、所述第七结果和所述第八结果进行加权组合，以得到所述预测模型的预测结果；

其中，N为正整数，所述第六结果、所述第七结果和所述第八结果的权重分别为0.25、0.4和0.35。

在一种可能的实施方式中，所述预测模型为LightGBM、XGBoost、LSTM、DecisionTreeRegression、RandomForest或XGBoost。

在一种可能的实施方式中，所述利用预测模型根据所述连续稠密向量和所述连续特征进行发电量预测步骤还包括：

将所述历史数据集分成k份，取k-1份用作训练集，剩余1份用作测试集；

采用所述训练集训练所述预测模型；

利用训练后的所述预测模型对所述测试集进行预测；

对比所述预测模型的预测结果和所述测试集得到单次误差率；

选取不同的所述训练集和所述测试集循环上述步骤以得到k个所述单次误差率；

根据K个所述单次误差率计算平均误差率判断所述预测模型是否可用；

其中，k为大于1的正整数。

在一种可能的实施方式中，所述将所述类别特征通过embedding转换为连续稠密向量步骤包括：

构建神经网络；

利用所述神经网络中的one-hot层对所述类别特征进行one-hot向量编码；

利用所述神经网络中的embedding层将向量编码后的所述类别特征转换为连续稠密向量。

在一种可能的实施方式中，所述神经网络包括连接于所述embedding层输出端的全连接层；所述全连接层根据所述embedding层的输出结果预测光伏发电量，所述全连接层为所述预测模型。

在一种可能的实施方式中，所述历史数据集中包括多个用于表征环境状况的环境特征，所述将所述连续稠密向量和所述连续特征连接后形成N个输入特征包括：

将多个所述环境特征两两交互形成高阶特征；

连接所述连续稠密向量、所述连续特征以及所述高阶特征形成输入特征。

在一种可能的实施方式中，所述环境特征包括风力、风向、温度、湿度和光照强度，所述将多个所述环境特征两两交互形成高阶特征包括：

温度和光照强度相乘，温度和风力相乘，温度和风向相乘，光照强度和风力相乘，光照强度和风向相乘，温度和光照强度相除，温度和风力相除，温度和风向相除，光照强度和风力相除，和/或，光照强度和风向相除。

在一种可能的实施方式中，在所述获取光伏发电站的历史数据集步骤之后包括：

对所述历史数据集进行数据预处理，所述数据预处理包括缺失值补充、剔除异常值，归一化和标准化。

在一种可能的实施方式中，所述连续特征包括辐射度和日照小时数；所述类别特征包括天气类型、地理数据和日期。

第二方面，本申请实施例提供了一种光伏发电量的预测装置，包括：

获取模块，被配置为获取光伏发电站的历史数据集，所述历史数据集包括类别特征和连续特征；

转换模块，被配置为将所述类别特征通过嵌入层转换为连续稠密向量；

预测模块，被配置为利用预测模型根据所述连续稠密向量和所述连续特征进行发电量预测。

本实施例的装置可以用于执行第一方面实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种光伏发电量的预测方法流程图一；

图2为本申请实施例提供的一种神经网络的网络结构图；

图3为本申请实施例提供的一种预测模型的连接示意图；

图4为本申请实施例提供的一种光伏发电量的预测方法流程图二；

图5为本申请实施例提供的另一种预测模型的连接示意图；

图6为本申请实施例提供的一种光伏发电量的预测方法流程图三；

图7为本申请实施例提供的一种光伏发电量的预测装置的结构示意图。

具体实施方式

相关技术中出现了基于机器学习实现光伏发电量预测的方法，具体地，将从光伏发电站采集的历史数据导入预测模型，通过对预测模型的训练实现对发电量的预测。然而，从光伏发电站采集的历史数据类型众多，表达能力较弱，进而造成预测模型的表达能力弱，导致预测结果准确性较差，而且在历史数据类型较多的情况下，会加重预测模型的参数复杂度。

鉴于此，本申请实施例提供了一种光伏发电量的预测方法，对历史数据集中的类别特征通过嵌入层转换为连续稠密向量，利用连续稠密向量联合历史数据集中的连续特性，然后运用预测模型进行光伏发电量预测。在该预测方法中通过将类别特征转换为连续稠密向量，使得历史数据集的表达能力增强，进而使预测模型的预测结果更为准确，另外嵌入层可以实现数据的降维，对于较多的类别特征，处理效果更好。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例提供了一种光伏发电量的预测方法，如图1所示，该光伏发电量的预测方法包括如下步骤：

步骤S10：获取光伏发电站的历史数据集，所述历史数据集包括类别特征和连续特征；

历史数据集可以包括多个不同光伏发电站、不同时间的历史数据，历史数据可以包括日期、历史发电量、辐射度、日照小时数、地理数据、天气类型、光照强度、风力、风向、温度和湿度等。其中，天气类型包括晴、多云转晴、阴、小雨以及晴转多云等，地理数据是指光伏发电站所处的位置信息，例如城市A和城市B。

历史数据集包括类别特征和连续特征，类别特征中数据为离散变量，即数据为离散地表达一种类别或标签，例如天气类型、地理数据、日期、风力和风向等。而辐射度、日照小时数、光照强度、温度和湿度等数据则属于连续特征。

步骤S20：将所述类别特征通过embedding转换为连续稠密向量；

embedding(嵌入)是一种将离散变量转变为连续向量的方法，Embedding能够捕捉原来特征的内在属性，使得一些原来意义上离得“近”的东西，在转换后的连续向量中确实离得近。

类别特征属于离散变量，空间维数较多且过于稀疏，表达能力较弱。在该步骤中将类别特征embedding转换为连续稠密向量，从而实现对数据的降维，使其更为稠密，使类别特征的表达更加细致和丰富，增强了类别特征的表达能力。在一种可能的实施方式中，embedding可以通过word2vec或Bert实现。

步骤S30：利用预测模型根据所述连续稠密向量和所述连续特征进行光伏发电量预测。

预测模型可以为神经网络模型，也可以为基于机器学习的预测算法。采用连续稠密向量代替类别特征，并与连续特征连接作为预测模型的输入特征，预测模型根据该输入特征可以输出预测结果。

在上述光伏发电量的预测方法中，通过将历史数据集中的类别特征通过embedding转换为连续稠密向量，利用连续稠密向量联合历史数据集中的连续特性作为预测模型的输入特征，然后运用预测模型根据输入特征进行光伏发电量预测，如此设计，能够实现对历史数据集中的类别特征表达能力的增强，从而提高预测模型的预测结果的预测精度；另外embedding可以实现对历史数据集的降维，在类别特征类别数量较多时提高处理效率。

原始的历史数据集可能具有数据缺失、存在异常值以及表述不规范或错误等问题，为了便于对历史数据集的处理以及保证历史数据集的准确性，在步骤S10之后还包括对历史数据集的数据预处理，数据预处理包括对历史数据集进行缺失值补充、剔除异常值和标准化等操作。

其中，缺失值补充可以通过查询和检索相关数据库的方式对历史数据集中缺失的数值进行补充，例如对于辐射度、日照小时数、天气类型、风力、风向、光照强度、温度和湿度等天气数据，在部分天气数据发生缺失时，通过网络爬虫爬取了对应城市、日期的天气数据，对缺失值进行补充。另外，还可以补充其他天气数据，如日最高温度、日平均温度、风力和空气质量指数等，对历史数据的特征维度进行了扩充，使得历史数据集中特征更为丰富，以提供预测模型预测结果的准确性。

异常值剔除用于剔除明显不符合逻辑的异常值，例如剔除历史发电量中高于对应发电站容量的数据，剔除天气类型为数字的数据。在一种可能的实施方式中，异常值剔除可以通过DBSCAN聚类方法或孤立森林方法等实现。

标准化则是用于修正表述不规范或错误的数据，以天气数据为例，将多云晴修正为多云转晴，将晴2修正为晴，将晴转朵云修正为晴转多云等。又例如，将历史发电量标准化为单位容量下的发电量。

通过对历史数据集的数据预处理，使历史数据集更适合预测模型的输入。

在一种可能的实施方式中，步骤S20包括：

构建神经网络；

在本实施例中构建神经网络对类别特征进行处理，图2为本申请实施例提供的一种神经网络的网络结构图，如图2所示，该神经网络的网络结构分为四层，分别为one-hot层(one-hot layer A，one-hot layer B和one-hot layer C)，embedding层(embeddinglayer A，embedding layer B和embedding layer C)和2个全连接层(dense layer 0和dense layer 1)。历史数据集中的类别特征输入one-hot层以实现向量编码，编码完毕后输入embedding层进行转换，embedding将类别特征转换为相应维数的连续稠密向量，此处连续稠密向量的维度跟类别特征中类别数量成正比，通常为1-30，或者确定搜索空间，在搜索空间内寻找最佳维度。embedding层输出连续稠密向量。在本实施例中利用神经网络中embedding层得到的连续稠密向量作为原始类别特征的替换，然后用于输入预测模型。

在一种可能的实施方式中，还可通过全连接层实现对embedding层得到结果的进一步优化，然后输入预测模型；也可以在两个全连接层后直接输出预测结果，即使用神经网络实现对光伏发电量的预测，此处神经网络的全连接层可以理解为预测模型。

通过上述描述可知，类别特征可以包括天气类型、地理数据、日期、风力和风向等，日期又包括年、月和日。

以天气类型为例，如下表所示，天气类型共有100种，相应的索引编码为0，1，…99。

天气	晴	多云	……	小雨
					ID	0	1	……	99

天气类型通过one-hot向量编码后如下表所示，每一种天气类型采用一个包含100个整数的向量来表示，其中99个数字是0。

天气	晴	多云	……	小雨
					One-hot	[1,0,0,0,…0]	[0,1,0,0,…,0]	……	[0,0,0,0,…,1]

设定embedding后的向量的维度为10，embedding后的向量如下表所示，则每种天气会被一个包含10个0-1之间的实数来表示。

天气	Embedded连续稠密向量
		晴	[0.212,0.0023,0.369,…]
多云	[0.457,0.239,0.00892,…]
		…	…
小雨	[0.652,0.147,0.369,…]

通过上述转换过程可以看出，类别特征经过one-hot编码和embedding转换为10维的连续稠密向量，相较于100维的one-hot向量更为稠密，连接更为紧密，表达能力更强。

历史数据集中包括温度、光照强度、风力和风向等环境特征，不同环境特征之间相互影响，同时共同影响光伏发电量，例如光照强度会影响光伏发电量，温度会影响光伏发电量，而光照强度又影响温度。鉴于此，不同环境特征之间两两交互可以形成影响光伏发电量的高阶特征，高阶特征、连续特征和连续向量联合形成预测模型的输入特征，如此有助于提高预测模型预测精度的提升。

环境特征两两之间的交互可以为相乘或相除。多个环境特征之间的两两交互可以为：温度和光照强度相乘，温度和风力相乘，温度和风向相乘，光照强度和风力相乘，光照强度和风向相乘，温度和光照强度相除，温度和风力相除，温度和风向相除，光照强度和风力相除，以及，光照强度和风向相除等。

在一种可能的实施方式中，预测模型为采用stacking模型融合方法融合LightGBM、XGBoost以及LSTM的融合模型。

其中，LightGBM(简称LGBM)是一种实现GBDT算法的框架，GBDT(GradientBoosting Decision Tree，简称GBDT)是用梯度提升(Gradient Boosting)策略训练出来的决策树(Decision Tree)模型，GBDT利用决策树迭代训练以得到最优模型，具有训练效果好、不易过拟合等优点，在工业界应用广泛。

LightGBM支持高效率的并行训练，具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。另外，LightGBM优化了对类别特征的支持，可以直接输入类别特征，不需要额外的0/1展开，并在决策树算法上增加了类别特征的决策规则。

XGBoost(简称XGB)是一种基于决策树的集成机器学习算法，使用梯度上升框架，适用于分类和回归问题。XGBoost与GBDT比较大的不同就是目标函数的定义。XGBoost将每个树的结果进行求和，作为最终的预测值。

长短期记忆(Long short-term memory，简称LSTM)是一种特殊的循环神经网络(Recurrent Neural Network，简称RNN)，主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。相比普通的RNN，LSTM能够在更长的序列中有更好的表现。

Stacking(堆叠)是一种模型融合技术，用于组合来自多个预测模型的信息以生成新模型。多个预测模型形成多层结构，下一层利用上一层模型的结果进行学习。Stacking模型能够弱化性能较差的基本模型表现，而突出强调性能最佳的模型。

本实施例中，预测模型共包含4层，图3为本申请实施例提供的一种预测模型的连接示意图，如图3所示，第一层为XGBoost，第二层为LightGBM，第三层为XGBoost和LSTM。连续稠密向量、连续特征和高阶特征连接后形成N个输入特征，分别为输入特征1、输入特征2、…、输入特征N，其中N为正整数。

与之对应的，如图4所示，步骤S30包括：

步骤S31：采用所述XGBoost对N个所述输入特征进行学习并得到第一结果；

步骤S32：采用所述LightGBM对N个所述输入特征和所述第一结果进行学习得到第二结果；

步骤S33：采用所述XGBoost对N个所述输入特征和所述第二结果进行学习得到第三结果；

步骤S34：采用所述LSTM对N个所述输入特征和所述第二结果进行学习得到第四结果；

步骤S35：对所述第二结果、所述第三结果和所述第四结果进行加权组合，以得到所述预测模型的预测结果。

可选的，第二结果、第三结果和第四结果的权重分别为0.3、0.3和0.4。

本实施例中，预测模型通过stacking模型融合方法融合LightGBM、XGBoost以及LSTM三个模型，使融合后的预测模型的预测精度得到进一步提升，达到了高精度预测光伏发电量的技术效果。

在另一种可能的实施方式，预测模型采用stacking模型融合方法融合DecisionTree、RandomForest和XGBoost。

在机器学习中，决策树(DecisionTree，简称DT)是一种预测模型，表示对象属性与对象值之间的一种映射关系，树中每个节点表示某个对象，而每个分叉路径则代表某个可能的属性值，而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树是数据挖掘中一种常用技术，可以用于分析数据，同样也可以用来作预测。

随机森林(RandomForest，简称RF)是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。

本实施例中，该预测模型包含4层，图5为本申请实施例提供的另一种预测模型的连接示意图，如图5所示，第一层为RandomForest，第二层为DecisionTree，第三层为XGBoost和RandomForest。

连续稠密向量、连续特征和高阶特征连接后形成N个输入特征，分别为输入特征1、输入特征2、…、输入特征N，其中N为正整数。

与之对应的，步骤S30包括：

对所述第六结果、所述第七结果和所述第八结果进行加权组合，以得到所述预测模型的预测结果。

可选的，第六结果、第七结果和第八结果的权重分别为0.25、0.4和0.35。

在一种可能的实施方式，如图6所示，步骤S30包括：

步骤S301：将所述历史数据集分成k份，取k-1份用作训练集，剩余1份用作测试集，

步骤S302：采用所述训练集训练所述预测模型；

步骤S303：利用训练后的所述预测模型对所述测试集进行预测；

步骤S304：对比所述预测模型的预测结果和所述测试集得到单次误差率；

步骤S305：选取不同的所述训练集和所述测试集循环上述步骤以得到k个所述单次误差率；

步骤S306：根据K个所述单次误差率计算平均误差率判断所述预测模型是否可用；

其中，k为大于1的正整数，在步骤中采用k折交叉验证的方式训练预测模型并评估预测模型的预测结果，每次随机取k-1份训练集训练上述预测模型，另1份用作测试集以得到单次误差率。k次评估完成后对k个单次误差率取平均得到平均误差率，根据平均误差率判断预测模型是否可用，通常平均误差率在5％以内即表示预测模型可用。

上述实施例中描述了采用Stacking模型融合技术融合三个预测模型的方式，但是本申请并不局域于此，在一种可能的实施方式中，预测模型可以为单个的预测模型，例如，LightGBM、XGBoost、LSTM、DecisionTreeRegression、RandomForest或XGBoost。

需要说明的是，本申请实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

另外，上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

图7为本申请实施例提供的一种光伏发电量的预测装置结构示意图，如图7所示，本实施例的装置可以包括：

获取模块10，被配置为获取光伏发电站的历史数据集，所述历史数据集包括类别特征和连续特征；

转换模块20，被配置为将所述类别特征通过嵌入层转换为连续稠密向量；

预测模块30，被配置为利用预测模型根据所述连续稠密向量和所述连续特征进行发电量预测。

本实施例的装置可以用于执行图1所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

为了描述的方便，描述以上装置是以功能分为各种模块分别描述。当然，在实施本申请实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种光伏发电量的预测方法，其特征在于，包括：

将所述类别特征通过embedding转换为连续稠密向量；

2.根据权利要求1所述的预测方法，其特征在于：所述预测模型为采用stacking模型融合方法融合LightGBM、XGBoost以及LSTM的融合模型。

3.根据权利要求2所述的预测方法，其特征在于，所述预测方法还包括：将所述连续稠密向量和所述连续特征连接后形成N个输入特征；

其中，N为正整数。

4.根据权利要求3所述的预测方法，其特征在于：所述第二结果、所述第三结果和所述第四结果的权重分别为0.3、0.3和0.4。

5.根据权利要求1所述的预测方法，其特征在于：所述预测模型为采用stacking模型融合方法融合DecisionTree、RandomForest和Xgboost的融合模型。

6.根据权利要求5所述的预测方法，其特征在于，所述预测方法还包括：将所述连续稠密向量和所述连续特征连接后形成N个输入特征；

7.根据权利要求1所述的预测方法，其特征在于：所述预测模型选自以下模型至少其一：LightGBM、XGBoost、LSTM、DecisionTreeRegression、RandomForest和XGBoost。

8.根据权利要求1-7中任一项所述的预测方法，其特征在于，所述利用预测模型根据所述连续稠密向量和所述连续特征进行发电量预测步骤还包括：

采用所述训练集训练所述预测模型；

利用训练后的所述预测模型对所述测试集进行预测；

其中，k为大于1的正整数。

9.根据权利要求1所述的预测方法，其特征在于，所述将所述类别特征通过embedding转换为连续稠密向量步骤包括：

构建神经网络；

10.根据权利要求9所述的预测方法，其特征在于，所述神经网络包括连接于所述embedding层输出端的全连接层，所述全连接层根据所述embedding层的输出结果预测光伏发电量，所述全连接层为所述预测模型。

11.根据权利要求3或6所述的预测方法，其特征在于，所述历史数据集中包括多个用于表征环境状况的环境特征，所述将所述连续稠密向量和所述连续特征连接后形成N个输入特征包括：

将多个所述环境特征两两交互形成高阶特征；

12.根据权利要求11所述的预测方法，其特征在于，所述环境特征包括风力、风向、温度、湿度和光照强度，所述将多个所述环境特征两两交互形成高阶特征包括：

13.根据权利要求1所述的预测方法，其特征在于，在所述获取光伏发电站的历史数据集步骤之后包括：

对所述历史数据集进行数据预处理，所述数据预处理包括缺失值补充、剔除异常值、归一化和标准化。

14.根据权利要求1所述的预测方法，其特征在于，所述连续特征包括辐射度和日照小时数；所述类别特征包括天气类型、地理数据和日期。

15.一种光伏发电量的预测装置，其特征在于，包括：