CN115601197B - 光伏电站的异常状态检测方法、装置 - Google Patents
光伏电站的异常状态检测方法、装置 Download PDFInfo
- Publication number
- CN115601197B CN115601197B CN202211496688.8A CN202211496688A CN115601197B CN 115601197 B CN115601197 B CN 115601197B CN 202211496688 A CN202211496688 A CN 202211496688A CN 115601197 B CN115601197 B CN 115601197B
- Authority
- CN
- China
- Prior art keywords
- photovoltaic power
- data set
- power station
- state
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Photovoltaic Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供的一种光伏电站的异常状态检测方法、装置。该方法包括:在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征;其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态;根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果;根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。该方法结合了深度学习和无监督学习,对于从未出现过的新异常状态也可在聚类的过程中被发现,提高了判断准确性。
Description
技术领域
本申请涉及新能源技术领域,尤其涉及一种光伏电站的异常状态检测方法、装置、计算机设备、存储介质。
背景技术
由于工业扩张的加快和能源消费的持续增长,全球人均能源需求呈上升趋势,各个国家对太阳能、风能、水力、潮汐能、生物质能和地热能等新的、安全和可持续的绿色电力的需求有了大幅的增长。在所有可再生能源中,太阳能发电被认为是从环境中提取能源的最佳方式。然而,由于光伏组件安装在室外环境中,持续暴露在恶劣的环境条件下(阳光、降雨等)可能会降低系统的最佳性能,从而导致设备故障。而传统技术中对光伏电站进行异常状态检测的方法存在效率低、成本高且准确性不足的问题。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中对光伏电站进行异常状态检测时效率低、成本高且准确性不足等技术缺陷。
第一方面,本申请提供了一种光伏电站的异常状态检测方法,包括:
在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;
将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征;其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态;
根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果;
根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
在其中一个实施例中,根据多个聚类结果,输出光伏电站在预设周期内的异常状态检测结果,包括:
以多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类;
对于任意一个潜在异常状态聚类,在该异常状态聚类的中心与正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为正常状态聚类,否则将该异常状态聚类归类为异常状态聚类;
对于光伏电站在预设周期内的任意一个采集时刻,若该采集时刻对应的工作数据属于正常状态聚类,则判定光伏电站在该采集时刻处于正常状态,若该采集时刻对应的工作数据属于异常状态聚类,则判定光伏电站在该采集时刻处于异常状态。
在其中一个实施例中,状态检测模型的训练过程包括:
获取光伏电站的历史工作数据集和对应的历史状态数据集;历史工作数据集包括多个历史采集的工作数据,历史状态数据集包括各历史采集时刻光伏电站的状态;
对历史工作数据集进行标准化处理;
根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集;
利用训练数据集对状态检测模型进行训练,得到训练完成的状态检测模型。
在其中一个实施例中,根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集,包括:
从历史工作数据集中随机抽取预设比例的工作数据;
以被抽取到的工作数据和对应的历史状态数据集作为训练数据集,未被抽取到的工作数据和对应的历史状态数据集作为测试数据集。
在其中一个实施例中,获取光伏电站的历史工作数据集和对应的历史状态数据集,还包括:
在历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对缺失数据进行插值补全。
在其中一个实施例中,在预设周期内,实时采集光伏电站的工作数据,得到样本数据集,还包括:
在样本数据集中的样本量不足的情况下,将多个历史采集的工作数据补充到样本数据集中。
在其中一个实施例中,在得到多个聚类结果后,还包括:
将多个聚类结果中的样本分布进行可视化展示。
第二方面,本申请实施例提供了一种光伏电站的异常状态检测装置,包括:
实时数据采集模块,用于在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;
数据处理模块,用于将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征;其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态;
聚类模块,用于根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果;
分析模块,用于根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
第三方面,本申请实施例提供了一种计算机设备,包括一个或多个处理器,以及存储器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的异常状态检测方法的步骤。
第四方面,本申请实施例提供了一种存储介质,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的异常状态检测方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
基于上述任一实施例,采用深度学习和无监督学习相结合的方法,在利用监督学习的方式训练出状态检测模型后,将其输出层剥离,得到信息提取模型,将信息提取模型输出的状态信息特征加载到无监督模型结构中,对状态信息特征进行聚类,最后根据多个聚类结果,可得到光伏电站在预设周期内的异常状态检测结果。该方法降低了数据收集难度,在使用过程中,无监督学习无需对数据进行标注,既增加了数据量也降低了使用门槛。同时,该方法不受偏见信息的影响,即使是之前从未出现过的新异常状态也可在聚类的过程中被发现,大大提高了异常状态的判断准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的光伏电站的异常状态检测方法的流程示意图;
图2为本申请一个实施例中对多个分类结果进行分析的流程示意图;
图3为本申请一个实施例中训练状态检测模型的流程示意图;
图4为本申请另一个实施例提供的光伏电站的异常状态检测方法的流程示意图;
图5为本申请实施例提供的光伏电站的异常状态检测装置的模块结构图;
图6为本申请实施例提供的计算机设备的内部结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
传统技术中,为了检测光伏电站的状态,可以通过对整个光伏阵列进行拍照并将图像送入计算机,计算机对收集到的数据进行预处理(比如平滑滤波、图像分割等),然后计算每块电池板的平均灰度值和方差,该数值反映了每块电池板的工作状态,再利用自适应数据融合的方法求出电池板的参考平均值和方差,综合各块电池数据与平均数据对光伏电站的状态做出判断。但该方法一方面是数据采集相对困难,集中式电站规模占地面积较大,分布式电站单体规模小但数量多,无法在每块组件上方安装相机采集图像数据,因此需要安排工作人员操作无人机搭载红外摄像机进行定期巡检。另一个原因,则是检测方法分析的指标过于单一,影响检测的准确率。目前还有通过根据光伏电站的工作数据,依赖深度学习模型对异常状态进行判断的方案,但是该方案受数据驱动,无法发现原来不存在的异常状态,仍存在准确性不高的问题。
本申请提供了一种光伏电站的异常状态检测方法,请参阅图1,包括步骤S102至步骤S108。
S102,在预设周期内,实时采集光伏电站的工作数据,得到样本数据集。
可以理解,预设周期是需要对光伏电站进行异常状态统计的周期,在预设周期内会每间隔一段时间就实时采集一次光伏电站的工作数据,每个实时采集工作数据的时刻即为采集时刻。预设周期的大小可以根据对于实时性的要求进行设置,例如,以日作为预设周期,每天反馈此该光伏电站当天在每个工作数据的采集时刻的状态情况。工作数据指的是和光伏电站的状态有关的数据,可以由多种属性的数据组成。而样本数据集中即包括预设周期内在所有采集时刻的采集到的工作数据。
工作数据中所说的多种属性的数据可以至少分为两类。一类为光伏电站运行数据,该类中包括的不同属性的数据可以为逆变器工作状态、直流侧电压、功率、交流侧电压、有功功率、无功功率、功率因数、频率、日发电量等。而光伏电站的状态又常常受天气影响,因此,另一类为站内气象监测数据,该类中包括的不同属性的数据可以为水平总辐射、组件温度、环境温度、相对湿度、气压、风速及风向等。上述列举的各种属性的数据,在针对不同电站进行落地部署的过程中,根据现场情况的不同,可以在上述数据中进行合理的选用,关键原则是尽可能采集会影响电站运行效率以及反映真实工作状态的数据。
S104,将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征。
可以理解,利用深度学习模型学习根据对数据的标注,学习如何对数据的状态进行判断,是深度学习模型常使用的场景之一。对于光伏电站而言,也可以训练得到用于根据光伏电站的工作数据判断光伏电站是否处于异常状态的状态检测模型。状态检测模型可以为多层感知机模型,包括输入层、隐藏层和输出层。其中,输入层用于接收光伏电站的工作数据并将接收到的工作数据传递到隐藏层中,隐藏层用于对工作数据进行特征提取,得到和异常状态有关的状态信息特征,最终,输出层根据状态信息特征进行分类,判断光伏电站是否异常。但是,该种模型受限于监督学习模型的结构,该模型只能识别已经发生过相似问题的异常状态。在真实运行场景中,设备工作异常状态往往是不可穷尽的,直接使用状态检测模型存在状态识别准确度不足的问题。因此,考虑到隐藏层在训练的过程中特征提取的能力不断提高,隐藏层学习到了如何提取到对判断异常状态有价值的特征提取方式,本实施例将训练完成的状态检测模型中的输出层剥离,得到信息提取模型,仅利用信息提取模型进行特征提取,然后将提取的特征输出到异常状态的状态检测模型。
S106,根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果。
在剥离了状态检测模型的输出层后,本实施例考虑将深度学习和无监督学习进行集合,即将剥离了状态检测模型的输出层所得到的信息提取模型嵌入可进行聚类(cluster)的无监督学习结构中,该结构可以基于每个工作数据对应的状态信息特征之间的共同点进行聚类。基于此,在提取出样本数据集中每个工作数据对应的状态信息特征后,根据各状态信息特征对样本数据集中的各工作数据进行聚类,将具有类似的状态信息特征的多个工作数据聚集成为一个聚类结果。采用此方式,即使是训练状态检测模型时所使用的数据中未包含的新的异常状态,也会由于具有类似的状态信息特征而被聚集在一起,可以发现新的异常状态,提高判断准确性。
S108,根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
聚类结果与光伏电站的工作状态之间存在对应关系,在确定聚类结果属于哪一种工作状态后,对于光伏电站在预设周期内的任意一个采集时刻,根据该采集时刻对应的工作数据所属聚类结果对应的工作状态,即可得到光伏电站在该采集时刻的工作状态。基于此,可得到光伏电站在整个预设周期内的异常状态检测结果。
基于本实施例中的光伏电站的异常状态检测方法,采用深度学习和无监督学习相结合的方法,在利用监督学习的方式训练出状态检测模型后,将其输出层剥离,得到信息提取模型,将信息提取模型输出的状态信息特征加载到无监督模型结构中,对状态信息特征进行聚类,最后根据多个聚类结果,可得到光伏电站在预设周期内的异常状态检测结果。该方法降低了数据收集难度,在使用过程中,无监督学习无需对数据进行标注,既增加了数据量也降低了使用门槛。同时,该方法不受偏见信息的影响,即使是之前从未出现过的新异常状态也可在聚类的过程中被发现,大大提高了异常状态的判断准确性。
目前的许多聚类算法中,例如K-means算法,需要先预设聚类结果的数量,既假设预设聚类结果的数量为5,则样本数据集中的工作数据将被聚集为5类,在有些实施例中在确定出正常状态对应的聚类结果后,就直接将其他聚类结果视为异常状态对应的聚类结果。但该划分方式过于粗暴,可能存在其他聚类结果虽然属于正常状态,但由于未达到预设的数量而被单独聚类,从而导致将处于正常状态的采集时刻误判为异常状态。为了解决该问题,请参阅图2,根据多个聚类结果,输出光伏电站在预设周期内的异常状态检测结果,包括步骤S202至步骤S206。
S202,以多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类。
考虑到光伏电站正常工作是常态,而出现异常属于例外,预设周期内光伏电站处于正常状态的时间比例最大。因此,多个聚类结果中样本量最大的即为与正常状态对应的聚类结果,将其称为正常状态聚类。但多个聚类结果中其余的聚类结果并不能直接判定为与异常状态对应的聚类,而只能认为存在是异常状态聚类的可能性。因此,将其余的聚类结果视为潜在异常状态聚类,由接下来的步骤做进一步判断。
S204,对于任意一个潜在异常状态聚类,在该异常状态聚类的中心与正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为正常状态聚类,否则将该异常状态聚类归类为异常状态聚类。
具体而言,不同聚类结果的中心在样本空间中的距离可反映这聚类结果之间的相似程度,距离越远则意味着这两个聚类结果越不相似。而本实施例中,潜在异常状态聚类的中心与正常状态聚类的中心之间的距离越大,则该潜在异常状态聚类被进一步确定为异常状态聚类的可能性也就越大,反之,该潜在异常状态聚类被进一步确定为正常状态聚类的可能性越大。基于此,为了对潜在异常状态聚类做划分,可以设置预设阈值,将中心之间的距离小于预设阈值的潜在异常状态聚类视为与正常状态聚类足够相似,将其确定为正常状态聚类,否则,则与正常状态聚类的差异足够大,将其确定为异常状态聚类。
S206,对于光伏电站在预设周期内的任意一个采集时刻,若该采集时刻对应的工作数据属于正常状态聚类,则判定光伏电站在该采集时刻处于正常状态,若该采集时刻对应的工作数据属于异常状态聚类,则判定光伏电站在该采集时刻处于异常状态。
可以理解,在将每个聚类结果都分为正常状态聚类或异常状态聚类后,即可根据每个采集时刻对应的工作数据所属聚类结果的属性,判定光伏电站在该采集时刻处于正常状态或异常状态。
在其中一个实施例中,工作数据包括与光伏电站运行状态有关的多种属性的数据。请参阅图3,状态检测模型的训练过程包括步骤S302至步骤S308。
S302,获取光伏电站的历史工作数据集和对应的历史状态数据集。
可以理解,历史工作数据集包括多个历史采集的工作数据,即光伏电站在运行过程中也会采集工作数据,形成历史记录,可以基于该光伏电站的实际数据进行模型训练。历史工作数据集中每个工作数据的采集时刻称为历史采集时刻,历史状态数据集包括各历史采集时刻光伏电站的状态,可作为监督信息,判断模型输出的预测结果是否准确,以指示模型的训练。从模型精确度的角度考虑,历史工作数据集可以包括光伏电站所有历史采集的工作数据。但从训练速度的角度考虑,历史工作数据集也可以只包括光伏电站所有历史采集的工作数据中的部分。
S304,对历史工作数据集进行标准化处理。
考虑到工作数据包括多种属性的数据,每种属性的数据存在量纲的差异,例如某一时刻的光伏电站的直流电压为530V、直流电流为0.8A、空气温度为31.6℃、风速为1.8m/s,这几个数据从数值上看不具有可比性,如果直接利用历史工作数据集进行训练容易导致状态检测模型过度关注非关键信息。因此,可以先对数据进行标准化处理,将原始数据转化为无量纲、无数量级差异的标准化数值。经标准化处理后每个属性的数据均值为0,标准差为1,每个属性的数据都被压缩在0附近波动。其处理方式可以为:z=(x-u)/s,其中,x为原始数据,u为原始数据对应属性的所有数据的均值,s为原始数据对应属性的所有数据的标准差。
S306,根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集。
利用标准化处理后的历史工作数据集作为输入,对应的历史状态数据集作为标准即可开始对状态检测模型进行训练。而在模型训练中,在获得相关数据后,常常需要划分出训练使用的数据集和测试使用的数据集,从而避免模型陷入过拟合场景。在一个具体实施例中,先从历史工作数据集中随机抽取预设比例的工作数据,并以被抽取到的工作数据和历史状态数据集中与被抽取到的工作数据对应的部分作为训练数据集,未被抽取到的工作数据和历史状态数据集中与未被抽取到的工作数据对应的部分作为测试数据集。
S308,利用训练数据集对状态检测模型进行训练,得到训练完成的状态检测模型。
具体而言,将训练数据集中的工作数据输入状态检测模型,得到预测状态,根据预测检测结果与训练数据集中对应的实际状态之间的差异构建损失函数,以缩小该差异为目标调整状态检测模型中的参数,直到满足训练结束条件,如循环次数达到预设次数或损失函数的值小于预设值,则得到训练完成的状态检测模型。对调整状态检测模型中的参数所使用的求解器和损失函数本实施例中不做限定,可根据实际情况进行选用,如求解器可使用SGD(Stochastic Gradient Descent,随机梯度下降)求解器、adam求解器等,损失函数可使用交叉熵。另外,在使用本申请中的异常状态检测方法时,随着时间的推进,步骤S102中实时采集的工作数据也成为了历史采集的工作数据,此时,可以对信息提取模型进行在线更新。具体而言,利用包含了新的工作数据的历史工作数据集,利用本实施例中的方法对状态检测模型进行更新,将更新后的状态检测模型的输出层剥离,也就得到了更新的信息提取模型。进行更新的时机可以为,响应于用户发出的更新指令,也可以为在当前的信息提取模型的上线时间达到预设时间时自动进行更新。
在其中一个实施例中,若使用图3中的方法构建训练集,请参阅图4,则图1中的方法应包括步骤S402至步骤S410。
S402在预设周期内,实时采集光伏电站的工作数据,得到样本数据集。
S404,对样本数据集进行标准化处理。
S406,将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征。其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态。
S408,根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果。
S410,根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
图4中的方法与图1中的差别在于,若在训练集中做了标准化处理,则在使用训练好的模型进行推理时也应对样本数据集做相同的标准化处理。
在其中一个实施例中,获取光伏电站的历史工作数据集和对应的历史状态数据集,还包括:在历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对缺失数据进行插值补全。
可以理解,在采集光伏电站的工作数据时,可能会出现某个属性的数据没有采集到或在传输过程中丢失,这些历史工作数据集中所缺失的数据称为缺失数据。因此,最后形成的历史工作数据集可能并不完整,例如工作数据包括直流电压、直流电流、直流功率、空气温度、空气湿度、辐照强度等,但是某一历史采集时刻的空气湿度和辐照强度未采集到,则该历史采集时刻的空气湿度和辐照强度即属于缺失数据。本实施例考虑到历史工作数据集中的数据是在一定时间内以较短的时间间隔连续采集的,所以同种属性的数据之间有较好关联性。因此,对于缺失数据,可以使用同种属性的其他有记录的数据进行插值补全。插值补全的具体方式有很多,例如,从效率的角度出发,可以直接使用前一有记录的历史采集时刻的工作数据来补全缺失数据。例如,每1分钟采集一次工作数据,7:42的风速为缺失数据,7:41的风速为1.4m/s,则直接将7:42的风速补全为1.4m/s。但从准确性的角度考虑,也可采用如线性插值法、抛物插值法、拉格朗日插值法等根据数据变化趋势进行插值的插值方式。
在其中一个实施例中,在预设周期内,实时采集光伏电站的工作数据,得到样本数据集,还包括:在样本数据集中的样本量不足的情况下,将多个历史采集的工作数据补充到样本数据集中。
可以理解,聚类的精度对参与聚类的样本数量有一定要求,若预设周期较短,导致实时采集的工作数据不足,则得到的聚类结果不具有参考性。因此,可以从工作数据的历史记录中补充一部分历史采集的工作数据进入到样本数据集中,实时采集的工作数据和历史采集的工作数据一同参与聚类,保证有足够数量的工作数据参与聚类。关于如判断样本数据集中的样本量是否足够,可以根据实际情况设置样本数量阈值,当预设周期内实时采集的工作数据的数量小于样本阈值,则利用历史采集的工作数据将样本数据集中的样本量补充到大于样本阈值。
在其中一个实施例中,在得到多个聚类结果后,还包括:将多个聚类结果中的样本分布进行可视化展示。可以理解,聚类结果中的每个样本都代表了多个属性的数据,相当于对工作数据实现了降维,再提供样本分布的可视化分析,可以让用户能够更直观的了解异常数据的分布情况。
应该理解的是,虽然图1-图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-图4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
本申请实施例提供了一种光伏电站的异常状态检测装置,请参阅图5,包括实时数据采集模块210、数据处理模块220、聚类模块230和分析模块240。实时数据采集模块210用于在预设周期内,实时采集光伏电站的工作数据,得到样本数据集。数据处理模块220用于将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征。其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态。聚类模块230用于根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果。分析模块240用于根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
在其中一个实施例中,聚类模块230用于以多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类;对于任意一个潜在异常状态聚类,在该异常状态聚类的中心与正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为正常状态聚类,否则将该异常状态聚类归类为异常状态聚类;对于光伏电站在预设周期内的任意一个采集时刻,若该采集时刻对应的工作数据属于正常状态聚类,则判定光伏电站在该采集时刻处于正常状态,若该采集时刻对应的工作数据属于异常状态聚类,则判定光伏电站在该采集时刻处于异常状态。
在其中一个实施例中,异常状态检测装置还包括训练模块。训练模块包括历史数据获取单元、预处理单元、训练数据集构建单元和训练单元。历史数据获取单元用于获取光伏电站的历史工作数据集和对应的历史状态数据集。历史工作数据集包括多个历史采集的工作数据,历史状态数据集包括各历史采集时刻光伏电站的状态。预处理单元用于对历史工作数据集进行标准化处理。训练数据集构建单元根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集。训练单元用于利用训练数据集对状态检测模型进行训练,得到训练完成的状态检测模型。
在其中一个实施例中,预处理单元还用于在历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对缺失数据进行插值补全。
在其中一个实施例中,训练数据集构建单元用于从历史工作数据集中随机抽取预设比例的工作数据;以被抽取到的工作数据和对应的历史状态数据集作为训练数据集,未被抽取到的工作数据和对应的历史状态数据集作为测试数据集。
在其中一个实施例中,实时数据采集模块210还用于在样本数据集中的样本量不足的情况下,将多个历史采集的工作数据补充到样本数据集中。
关于异常状态检测装置的具体限定可以参见上文中对于异常状态检测方法的限定,在此不再赘述。上述异常状态检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
本申请实施例提供了一种计算机设备,包括一个或多个处理器,以及存储器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征;其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态;根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果;根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行:以多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类;对于任意一个潜在异常状态聚类,在该异常状态聚类的中心与正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为正常状态聚类,否则将该异常状态聚类归类为异常状态聚类;对于光伏电站在预设周期内的任意一个采集时刻,若该采集时刻对应的工作数据属于正常状态聚类,则判定光伏电站在该采集时刻处于正常状态,若该采集时刻对应的工作数据属于异常状态聚类,则判定光伏电站在该采集时刻处于异常状态。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行:获取光伏电站的历史工作数据集和对应的历史状态数据集;历史工作数据集包括多个历史采集的工作数据,历史状态数据集包括各历史采集时刻光伏电站的状态;对历史工作数据集进行标准化处理;根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集;利用训练数据集对状态检测模型进行训练,得到训练完成的状态检测模型。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行:从历史工作数据集中随机抽取预设比例的工作数据;以被抽取到的工作数据和对应的历史状态数据集作为训练数据集,未被抽取到的工作数据和对应的历史状态数据集作为测试数据集。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行:在历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对缺失数据进行插值补全。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行:在样本数据集中的样本量不足的情况下,将多个历史采集的工作数据补充到样本数据集中。
在其中一个实施例中,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的异常状态检测方法的步骤。
示意性地,如图6所示,图6为本申请实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图6,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的异常状态检测方法。
计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(I/O)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如WindowsServer TM、Mac OS XTM、Unix TM、Linux TM、Free BSDTM或类似。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请实施例提供了一种存储介质,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;将样本数据集输入信息提取模型,得到各工作数据对应的状态信息特征;其中,信息提取模型为训练完成且剥离了输出层的状态检测模型,状态检测模型包括输入层、隐藏层和输出层,状态检测模型用于根据光伏电站的工作数据判断光伏电站是否处于异常状态;根据各状态信息特征对样本数据集进行聚类,得到多个聚类结果;根据多个聚类结果,得到光伏电站在预设周期内的异常状态检测结果。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:以多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类;对于任意一个潜在异常状态聚类,在该异常状态聚类的中心与正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为正常状态聚类,否则将该异常状态聚类归类为异常状态聚类;对于光伏电站在预设周期内的任意一个采集时刻,若该采集时刻对应的工作数据属于正常状态聚类,则判定光伏电站在该采集时刻处于正常状态,若该采集时刻对应的工作数据属于异常状态聚类,则判定光伏电站在该采集时刻处于异常状态。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:获取光伏电站的历史工作数据集和对应的历史状态数据集;历史工作数据集包括多个历史采集的工作数据,历史状态数据集包括各历史采集时刻光伏电站的状态;对历史工作数据集进行标准化处理;根据标准化处理后的历史工作数据集和对应的历史状态数据集,构建训练数据集;利用训练数据集对状态检测模型进行训练,得到训练完成的状态检测模型。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:从历史工作数据集中随机抽取预设比例的工作数据;以被抽取到的工作数据和对应的历史状态数据集作为训练数据集,未被抽取到的工作数据和对应的历史状态数据集作为测试数据集。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:在历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对缺失数据进行插值补全。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行:在样本数据集中的样本量不足的情况下,将多个历史采集的工作数据补充到样本数据集中。
在其中一个实施例中,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的异常状态检测方法的步骤。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种光伏电站的异常状态检测方法,其特征在于,包括:
在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;所述工作数据包括与所述光伏电站运行状态有关的多种属性的数据,所述多种属性的数据至少包括光伏电站运行数据和站内气象监测数据;
将所述样本数据集输入信息提取模型,得到各所述工作数据对应的状态信息特征;其中,所述信息提取模型为采用监督学习的方式训练完成且剥离了输出层的状态检测模型,所述状态检测模型用于根据所述光伏电站的所述工作数据判断所述光伏电站是否处于异常状态,所述状态检测模型包括输入层、隐藏层和所述输出层,所述输入层用于接收所述光伏电站的所述工作数据并将接收到的所述工作数据传递到所述隐藏层中,所述隐藏层用于对所述工作数据进行特征提取,得到和异常状态有关的所述状态信息特征,所述输出层用于根据所述状态信息特征进行分类,判断光伏电站是否异常;
根据各所述状态信息特征对所述样本数据集进行聚类,得到多个聚类结果;
根据所述多个聚类结果,得到所述光伏电站在所述预设周期内的异常状态检测结果;所述异常状态检测结果包括所述光伏电站在所述预设周期任意一个采集时刻的工作状态,所述采集时刻为所述预设周期内实时采集所述工作数据的时刻。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个聚类结果,输出所述光伏电站在所述预设周期内的异常状态检测结果,包括:
以所述多个聚类结果中样本量最大的聚类结果为正常状态聚类,其余的聚类结果为潜在异常状态聚类;
对于任意一个所述潜在异常状态聚类,在该异常状态聚类的中心与所述正常状态聚类的中心的距离小于预设阈值的情况下,将该异常状态聚类归类为所述正常状态聚类,否则将该异常状态聚类归类为异常状态聚类;
对于所述光伏电站在所述预设周期内的任意一个采集时刻,若该所述采集时刻对应的所述工作数据属于所述正常状态聚类,则判定所述光伏电站在该所述采集时刻处于正常状态,若该所述采集时刻对应的所述工作数据属于所述异常状态聚类,则判定所述光伏电站在该所述采集时刻处于异常状态。
3.根据权利要求1所述的方法,其特征在于,所述状态检测模型的训练过程包括:
获取所述光伏电站的历史工作数据集和对应的历史状态数据集;所述历史工作数据集包括多个历史采集的所述工作数据,所述历史状态数据集包括各历史采集时刻所述光伏电站的状态;
对所述历史工作数据集进行标准化处理;
根据所述标准化处理后的所述历史工作数据集和对应的所述历史状态数据集,构建训练数据集;
利用所述训练数据集对所述状态检测模型进行训练,得到训练完成的所述状态检测模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述标准化处理后的所述历史工作数据集和对应的所述历史状态数据集,构建训练数据集,包括:
从所述历史工作数据集中随机抽取预设比例的所述工作数据;
以被抽取到的所述工作数据和对应的所述历史状态数据集作为所述训练数据集,未被抽取到的所述工作数据和对应的所述历史状态数据集作为测试数据集。
5.根据权利要求3所述的方法,其特征在于,所述获取所述光伏电站的历史工作数据集和对应的历史状态数据集,还包括:
在所述历史工作数据集存在缺失的情况下,根据与缺失数据同种属性的其他数据,对所述缺失数据进行插值补全。
6.根据权利要求1所述的方法,其特征在于,所述在预设周期内,实时采集光伏电站的工作数据,得到样本数据集,还包括:
在所述样本数据集中的样本量不足的情况下,将多个历史采集的所述工作数据补充到所述样本数据集中。
7.根据权利要求1所述的方法,其特征在于,在得到所述多个聚类结果后,还包括:
将所述多个聚类结果中的样本分布进行可视化展示。
8.一种光伏电站的异常状态检测装置,其特征在于,包括:
实时数据采集模块,用于在预设周期内,实时采集光伏电站的工作数据,得到样本数据集;
数据处理模块,用于将所述样本数据集输入信息提取模型,得到各所述工作数据对应的状态信息特征;其中,所述信息提取模型为采用监督学习的方式训练完成且剥离了输出层的状态检测模型,所述状态检测模型用于根据所述光伏电站的所述工作数据判断所述光伏电站是否处于异常状态,所述状态检测模型包括输入层、隐藏层和所述输出层,所述输入层用于接收所述光伏电站的所述工作数据并将接收到的所述工作数据传递到所述隐藏层中,所述隐藏层用于对所述工作数据进行特征提取,得到和异常状态有关的所述状态信息特征,所述输出层用于根据所述状态信息特征进行分类,判断光伏电站是否异常;
聚类模块,用于根据各所述状态信息特征对所述样本数据集进行聚类,得到多个聚类结果;
分析模块,用于根据所述多个聚类结果,得到所述光伏电站在所述预设周期内的异常状态检测结果;所述异常状态检测结果包括所述光伏电站在所述预设周期任意一个采集时刻的工作状态,所述采集时刻为所述预设周期内实时采集所述工作数据的时刻。
9.一种计算机设备,其特征在于,包括一个或多个处理器,以及存储器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如权利要求1至7任一项所述的异常状态检测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7任一项所述的异常状态检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211496688.8A CN115601197B (zh) | 2022-11-28 | 2022-11-28 | 光伏电站的异常状态检测方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211496688.8A CN115601197B (zh) | 2022-11-28 | 2022-11-28 | 光伏电站的异常状态检测方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115601197A CN115601197A (zh) | 2023-01-13 |
CN115601197B true CN115601197B (zh) | 2023-03-10 |
Family
ID=84852375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211496688.8A Active CN115601197B (zh) | 2022-11-28 | 2022-11-28 | 光伏电站的异常状态检测方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115601197B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726319A (zh) * | 2023-12-15 | 2024-03-19 | 郭健 | 基于大数据分析的电力系统异常检测方法以及装置 |
CN117932486B (zh) * | 2023-12-22 | 2024-09-24 | 北京中科科仪股份有限公司 | 检漏设备工作状态的预测方法、装置、设备及存储介质 |
CN118071178B (zh) * | 2024-04-18 | 2024-08-06 | 浙江正泰智维能源服务有限公司 | 一种用于评估电站异常状态的方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110995153A (zh) * | 2019-12-18 | 2020-04-10 | 国网电子商务有限公司 | 一种光伏电站的异常数据检测方法、装置及电子设备 |
CN112085108A (zh) * | 2020-09-11 | 2020-12-15 | 杭州华电下沙热电有限公司 | 基于自动编码器及k均值聚类的光伏电站故障诊断算法 |
CN112085621A (zh) * | 2020-09-11 | 2020-12-15 | 杭州华电下沙热电有限公司 | 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法 |
CN114123971A (zh) * | 2021-10-25 | 2022-03-01 | 中国华能集团清洁能源技术研究院有限公司 | 一种基于VaDE的光伏组串异常检测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110705789A (zh) * | 2019-09-30 | 2020-01-17 | 国网青海省电力公司经济技术研究院 | 一种光伏电站短期功率预测方法 |
-
2022
- 2022-11-28 CN CN202211496688.8A patent/CN115601197B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110995153A (zh) * | 2019-12-18 | 2020-04-10 | 国网电子商务有限公司 | 一种光伏电站的异常数据检测方法、装置及电子设备 |
CN112085108A (zh) * | 2020-09-11 | 2020-12-15 | 杭州华电下沙热电有限公司 | 基于自动编码器及k均值聚类的光伏电站故障诊断算法 |
CN112085621A (zh) * | 2020-09-11 | 2020-12-15 | 杭州华电下沙热电有限公司 | 一种基于K-Means-HMM模型的分布式光伏电站故障预警算法 |
CN114123971A (zh) * | 2021-10-25 | 2022-03-01 | 中国华能集团清洁能源技术研究院有限公司 | 一种基于VaDE的光伏组串异常检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115601197A (zh) | 2023-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115601197B (zh) | 光伏电站的异常状态检测方法、装置 | |
CN117411189B (zh) | 一种微电网协调控制器的监测数据增强方法 | |
Li et al. | Classification of energy consumption in buildings with outlier detection | |
CN109359697A (zh) | 一种电力设备巡检中使用的图形图像识别方法及巡查系统 | |
KR102215690B1 (ko) | 시계열의 데이터를 모니터링 하는 방법 및 그 장치 | |
CN115036922B (zh) | 一种分布式光伏发电电量预测方法及系统 | |
CN114417971A (zh) | 一种基于k近邻密度峰值聚类的电力数据异常值检测算法 | |
Zhao et al. | Collaborative fault detection for large-scale photovoltaic systems | |
CN115936180A (zh) | 光伏发电功率预测方法、装置和计算机设备 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 | |
CN116308883A (zh) | 一种基于大数据的区域电网数据统筹管理系统 | |
He et al. | A non-intrusive approach for fault detection and diagnosis of water distribution systems based on image sensors, audio sensors and an inspection robot | |
CN117277566B (zh) | 基于大数据的电网数据分析电力调度系统及方法 | |
CN112508278A (zh) | 一种基于证据回归多模型的多联供系统负荷预测方法 | |
CN117033923A (zh) | 一种基于可解释性机器学习的犯罪数量预测方法及系统 | |
CN114326391B (zh) | 一种建筑能耗预测方法 | |
CN115168437A (zh) | 一种基于数据分析实现用电用户画像的方法及系统 | |
CN113435494A (zh) | 低压居民用户异常用电识别方法及仿真模拟系统 | |
CN113033326A (zh) | 一种光伏电站施工踩踏组件监测方法 | |
Zhang et al. | Load prediction based on depthwise separable convolution model | |
CN117892212B (zh) | 一种分布式异构能源站点态势感知监测方法 | |
CN118277747B (zh) | 一种基于人工智能的用电行为分析方法及系统 | |
Zhang et al. | A multivariate time series anomaly detection model based on graph attention mechanism in energy consumption of intelligent buildings | |
CN113935549B (zh) | 一种综合智慧能源优化调度系统 | |
CN114624613A (zh) | 基于系统集群分析的状态监测异常识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |