CN117370790A - 一种光伏发电组件故障自动报警方法及系统 - Google Patents
一种光伏发电组件故障自动报警方法及系统 Download PDFInfo
- Publication number
- CN117370790A CN117370790A CN202311327308.2A CN202311327308A CN117370790A CN 117370790 A CN117370790 A CN 117370790A CN 202311327308 A CN202311327308 A CN 202311327308A CN 117370790 A CN117370790 A CN 117370790A
- Authority
- CN
- China
- Prior art keywords
- principal component
- fault
- data
- power generation
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000007621 cluster analysis Methods 0.000 claims abstract description 26
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 10
- 101150011264 setB gene Proteins 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 15
- 238000013145 classification model Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000012806 monitoring device Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 238000012706 support-vector machine Methods 0.000 description 15
- 238000012544 monitoring process Methods 0.000 description 5
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/182—Level alarms, e.g. alarms responsive to variables exceeding a threshold
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/50—Photovoltaic [PV] energy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Emergency Management (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明公开了一种光伏发电组件故障自动报警方法及系统,方法包括:对光伏发电系统中运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;提取每个样本特征值,统计所采集运行样本数据的样本总数和提取的样本特征数,将叠加组合后的数据输入第一故障预测模型得到第一故障预测结果;将第一主成分特征和第二主成分特征输入卷积神经网络以提取出空间信息,输入GRU网络以提取出时间序列信息,之后计算出总相似度输入预先建立的知识图谱模型,得到第二故障预测结果;综合两个结果进行故障分级报警。通过建立精确分析模型算法,大大提高了故障分析的准确度和效率。
Description
技术领域
本发明涉及数据分析领域,具体涉及一种光伏发电组件故障自动报警方法及系统。
背景技术
光伏发电技术作为当前可再生能源中的研究重点对象,对于社会的发展进步和大规模节能减排,发挥了其重要价值作用。针对光伏发电系统的数据监测和实时报警领域,现有技术中大多都是通过设定阈值或结合该领域标准来分析光伏发电系统的各类数据,发现问题则进行报警。例如CN116111951A(公开日20230512)中公开了调取单元通过数据检测单元获取光伏发电单元中各部件的运行参数以实时对光伏发电系统进行检测,并及时发现光伏发电系统处于故障状态的原因,第一解析单元根据用电端的电压频率初步判定光伏发电单元的运行状态,第二解析单元根据各光伏板平均温度值、蓄电池电量值以及蓄电池的消耗速率以对光伏发电单元出现故障的原因进行进一步判定,警报单元根据第二解析单元输出的故障原因发出对应的警报信息。但是该类方法中存在一些缺陷,譬如没有充分考虑故障数据之间的相关性、未建立模型算法进行精确分析、未将光伏发电系统中的时空数据纳入故障分析数据等等,这些都会使得针对光伏发电系统的数据故障监测效率相对较低,无法保障数据分析、故障监测的准确度。
发明内容
针对现有技术中的以上缺陷,本发明的目的在于提供一种光伏发电组件故障自动报警方法及系统。该方法充分考虑了数据之间的相关性,通过建立精确分析模型算法,并将光伏发电系统中的时空数据纳入故障分析考虑因素,由此大大提高了故障分析的准确度和效率。
为实现上述发明目的,本发明采用如下技术方案:
第一方面,本发明提供一种光伏发电组件故障自动报警方法,该方法包括:
步骤1,采集光伏发电系统中的各类运行样本数据;
步骤2,对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和该步骤3中提取的样本特征数;
步骤4,将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
步骤5,将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
步骤6,计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
步骤7,计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
步骤8,计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
步骤9,将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
进一步地,还包括:所述步骤1,采集光伏发电系统中的各类运行样本数据,具体包括:
通过监测装置对光伏发电系统的现场信息进行实时采集,其中包括光伏方阵运行时的电压值、电流值、功率、蓄电池的蓄电量、光伏设备的环境温度及表面温度。
进一步地,还包括:所述步骤2还包括:
对所采集的运行样本数据进行K-means聚类分析,以提取出第一主成分特征和第二主成分特征;K-means聚类分析采用平方误差准则,具体为:
,
其中,E为数据集中所有样本数据的平方误差,q表示给定的样本,表示聚类Di的平均值,k为聚类类别数,i=1,2,...,k。
进一步地,还包括:所述PCA聚类分析或所述K-means聚类分析在进行信息提取处理时,具体是将光伏发电系统中与温度相关的数据作为提取的第一主成分特征,其余特征作为提取的第二主成分特征。
进一步地,还包括:所述步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和所述步骤3中提取的样本特征数,具体包括:
将MapReduce并行计算模型对数据的处理抽象为Map函数和Reduce函数;通过Map函数读取所述第一主成分特征和所述第二主成分特征的样本特征值,并将读取的数据传输给Reduce函数进行整合统计。
进一步地,还包括:所述将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,具体是进行数据拼接,包括:
将所述每个样本特征值按照顺序进行排列,将所述样本总数插入排列后数据的前面,将所述样本特征数插入排列后数据的后面,以完成数据拼接。
进一步地,还包括:构建SVM故障分类模型,具体包括:
抽取部分叠加组合后的数据作为SVM模型的训练数据,
设计损失函数计算SVM模型的输出值pj与训练集中实际的故障类别数值qj的误差,当误差小于设定阈值时则训练结束,得到故障分类模型SVM;
其中,损失函数为:
其中,J为训练集数目,j=1,2,...,J,wj为可调节参数。
进一步地,还包括:
将所述总相似度作为知识图谱分析模型的输入,将故障分类标签作为所述知识图谱分析模型的输出,对知识图谱分析模型进行训练得到反映总相似度和故障分类标签映射关系的故障型知识图谱分析模型。
进一步地,还包括:所述步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警,具体包括:
将所述第一故障预测结果与第一阈值进行比较,将所述第二故障预测结果与第二阈值进行比较;
若所述第一故障预测结果大于等于第一阈值,且所述第二故障预测结果大于等于第二阈值,则进行一级报警;
若所述第一故障预测结果小于第一阈值,且所述第二故障预测结果小于第二阈值,则无故障,不自动报警;
若所述第一故障预测结果大于等于第一阈值,所述第二故障预测结果小于第二阈值,则进行二级报警;
若所述第一故障预测结果小于第一阈值,所述第二故障预测结果大于等于第二阈值,则进行三级报警。
第二方面,本发明还提供一种光伏发电组件故障自动报警系统,该系统包括:
采集模块,用于采集光伏发电系统中的各类运行样本数据;
聚类模块,用于对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
MapReduce单元模块,用于基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所采集运行样本数据的样本总数和提取的样本特征数;
第一预测模块,用于将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
转换模块,用于将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
第一计算模块,用于计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
第二计算模块,用于计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
第三计算模块,用于计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
第二预测模块,用于将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
分级报警模块,用于综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
有益效果:
1.本发明通过步骤1,采集光伏发电系统中的各类运行样本数据;步骤2,对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和所述步骤3中提取的样本特征数;步骤4,将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;步骤5,将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;步骤6,计算所述空间特征向量h与向量集setA的相似度L(h,setA),步骤7,计算所述时间序列向量p与向量集setB的相似度L(p,setB),步骤8,结合相似度L(h,setA)和相似度L(p,setB)计算总相似度sim(h,p),步骤9,将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。本发明通过在MapReduce并行运算模式下实现PCA-SVM数据聚类、故障分析算法,得到第一故障预测结果;通过提取第一主成分特征和第二主成分特征的空间特征向量和时间特征向量,结合与之对应的向量集合分别计算出相似度,并将两个相似度进行加权求和后的总相似度输入知识图谱模型,得到第二故障预测结果;最后将两个故障预测结果进行综合分析,以实现光伏发电组件的故障分级报警;该方法充分考虑了数据之间的相关性,通过建立精确分析模型算法,并将光伏发电系统中的时空数据纳入故障分析考虑因素,由此大大提高了故障分析的准确度和效率。
附图说明
图1为光伏发电组件故障自动报警方法的流程示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
如图1所示,本实施例提供一种光伏发电组件故障自动报警方法,该方法包括:
步骤1,采集光伏发电系统中的各类运行样本数据;
具体地,通过监测装置对光伏发电系统的现场信息进行实时采集,其中包括光伏方阵运行时的电压值、电流值、功率、蓄电池的蓄电量、光伏设备的环境温度及表面温度。
检测装置具体包括与光伏发电系统相连接的传感器和变换器、信号调节单元、数据采集单元接口、通讯接口、数据库、上位机。具体地,温度传感器使用精密度很高的铂电阻温度传感器。信号调节单元通过RS485总线与数据采集单元接口进行连接,数据采集单元接口通过通讯接口与数据库/上位机连接,并将采集的光伏方阵运行时的电压值、电流值、功率、蓄电池的蓄电量、光伏设备的环境温度及表面温度等数据存储到数据库中。
步骤2,对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
具体地,还可以对所采集的运行样本数据进行K-means聚类分析,以提取出第一主成分特征和第二主成分特征;K-means聚类分析采用平方误差准则,具体为:
,
其中,E为数据集中所有样本数据的平方误差,q表示给定的样本,表示聚类Di的平均值,k为聚类类别数,i=1,2,...,k。
具体地,PCA聚类分析和K-means聚类分析所实现的功能相同,都是针对海量的运行基本数据进行聚类分析处理。
步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和该步骤3中提取的样本特征数;
具体地,通过采用 PCA-SVM聚类分类算法或K-means-SVM聚类分类算法来实故障类型识别、故障分析,并将其在MapReduce 框架上实现并行计算,提高了计算速率。
步骤4,将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
数据叠加组合具体是进行数据拼接,包括:
将所述每个样本特征值按照顺序进行排列,将所述样本总数插入排列后数据的前面,将所述样本特征数插入排列后数据的后面,以完成数据拼接,将数据拼接后的数据集输入SVM中进行故障预测。
通过数据拼接的方式,将特征数据进行有效结合,挖掘出了数据之间的相关性,由此提高了故障预测的准确度。
步骤5,将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
具体地,卷积神经网络包括若干卷积层和池化层;利用卷积神经网络对于空间特征的敏感性以及GRU网络对于时间特征的敏感性,挖掘出了与光伏发电系统故障相关的时间数据特性和空间数据特性。
步骤6,计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
步骤7,计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
具体地,向量集setA和向量集setB均是预先统计并存储在数据库中的特征集合;通过上述步骤6和步骤7,本发明创新性的将光伏发电系统中相关的空间特征向量和时间序列向量分别与其对应的向量集进行相似度计算,之后再将两个相似度进行加权求和,以达到充分利用时空特征信息进行故障预测的效果,大大提高了针对光伏发电系统的故障预测准确度。
步骤8,计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
步骤9,将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
具体地,通过预先构建反映总相似度和故障分类标签映射关系的故障型知识图谱分析模型,并将计算出的总相似度sim(h,p)作为知识图谱模型的具体输入特征以输出对应的故障分类标签,实现准确的故障监测。
步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
在可选的实施方式中,还包括:所述PCA聚类分析或所述K-means聚类分析在进行信息提取处理时,具体是将光伏发电系统中与温度相关的数据作为提取的第一主成分特征,其余特征作为提取的第二主成分特征。
温度作为光伏发电系统中故障的主要监测数据,在一定程度上,温度对于故障的预测起到了至关重要的作用。因此,为了提高温度的重要性,本发明特别的将与温度相关的数据作为提取的第一主成分特征,其余特征作为提取的第二主成分特征。
在可选的实施方式中,还包括:所述步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce阶段统计所述步骤1中所采集运行样本数据的样本总数和所述步骤3中提取的样本特征数,具体包括:
将MapReduce并行计算模型对数据的处理抽象为Map函数和Reduce函数;通过Map函数读取所述第一主成分特征和所述第二主成分特征的样本特征值,并将读取的数据传输给Reduce函数进行整合统计。
具体地,MapReduce具有自动实现分布式并行计算、容错性高等优点。同时,可以为所述第一主成分特征和所述第二主成分特征的样本特征值提供相应的权重,由于所述第一主成分特征是与温度相关的数据,因此可以为第一主成分特征的样本特征值设定更高的权重值,以及时准确的预测故障。
在可选的实施方式中,还包括:构建SVM故障分类模型,具体包括:
抽取部分叠加组合后的数据作为SVM模型的训练数据,
设计损失函数计算SVM模型的输出值pj与训练集中实际的故障类别数值qj的误差,当误差小于设定阈值时则训练结束,得到故障分类模型SVM;
其中,损失函数为:
其中,J为训练集数目,j=1,2,...,J,wj为可调节参数。
在可选的实施方式中,还包括:
将所述总相似度作为知识图谱分析模型的输入,将故障分类标签作为所述知识图谱分析模型的输出,对知识图谱分析模型进行训练得到反映总相似度和故障分类标签映射关系的故障型知识图谱分析模型。
具体地,以知识图谱技术为基础,通过构建反映总相似度和故障分类标签映射关系的故障型知识图谱分析模型,首次提出将知识谱图模型应用到光伏发电系统的故障预测中,并且取得了很好的预测效果。
在可选的实施方式中,还包括:所述步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警,具体包括:
将所述第一故障预测结果与第一阈值进行比较,将所述第二故障预测结果与第二阈值进行比较;
若所述第一故障预测结果大于等于第一阈值,且所述第二故障预测结果大于等于第二阈值,则进行一级报警;
若所述第一故障预测结果小于第一阈值,且所述第二故障预测结果小于第二阈值,则无故障,不自动报警;
若所述第一故障预测结果大于等于第一阈值,所述第二故障预测结果小于第二阈值,则进行二级报警;
若所述第一故障预测结果小于第一阈值,所述第二故障预测结果大于等于第二阈值,则进行三级报警。
具体地,通过等级划分的机制进行报警,可以细化针对光伏发电机组各类故障的处理措施,能够提高故障处理的效率和及时性。
基于相同的发明构思,本实施例提供一种光伏发电组件故障自动报警系统,该系统包括:
采集模块,用于采集光伏发电系统中的各类运行样本数据;
聚类模块,用于对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
MapReduce单元模块,用于基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所采集运行样本数据的样本总数和提取的样本特征数;
第一预测模块,用于将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
转换模块,用于将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
第一计算模块,用于计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
第二计算模块,用于计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
第三计算模块,用于计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
第二预测模块,用于将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
分级报警模块,用于综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
Claims (10)
1.一种光伏发电组件故障自动报警方法,其特征在于,该方法包括:
步骤1,采集光伏发电系统中的各类运行样本数据;
步骤2,对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和该步骤3中提取的样本特征数;
步骤4,将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
步骤5,将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
步骤6,计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
步骤7,计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
步骤8,计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
步骤9,将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
2.根据权利要求1所述的方法,其特征在于,所述步骤1,采集光伏发电系统中的各类运行样本数据,具体包括:
通过监测装置对光伏发电系统的现场信息进行实时采集,其中包括光伏方阵运行时的电压值、电流值、功率、蓄电池的蓄电量、光伏设备的环境温度及表面温度。
3.根据权利要求1所述的方法,其特征在于,所述步骤2还包括:
对所采集的运行样本数据进行K-means聚类分析,以提取出第一主成分特征和第二主成分特征;K-means聚类分析采用平方误差准则,具体为:
,
其中,E为数据集中所有样本数据的平方误差,q表示给定的样本,表示聚类Di的平均值,k为聚类类别数,i=1,2,...,k。
4.根据权利要求1或3所述的方法,其特征在于,还包括:所述PCA聚类分析或所述K-means聚类分析在进行信息提取处理时,具体是将光伏发电系统中与温度相关的数据作为提取的第一主成分特征,其余特征作为提取的第二主成分特征。
5. 根据权利要求1所述的方法,其特征在于,还包括:所述步骤3,基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所述步骤1中所采集运行样本数据的样本总数和所述步骤3中提取的样本特征数,具体包括:
将MapReduce并行计算模型对数据的处理抽象为Map函数和Reduce函数;通过Map函数读取所述第一主成分特征和所述第二主成分特征的样本特征值,并将读取的数据传输给Reduce函数进行整合统计。
6.根据权利要求1所述的方法,其特征在于,所述将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,具体是进行数据拼接,包括:
将所述每个样本特征值按照顺序进行排列,将所述样本总数插入排列后数据的前面,将所述样本特征数插入排列后数据的后面,以完成数据拼接。
7.根据权利要求6所述的方法,其特征在于,构建SVM故障分类模型,具体包括:
抽取部分叠加组合后的数据作为SVM模型的训练数据,
设计损失函数计算SVM模型的输出值pj与训练集中实际的故障类别数值qj的误差,当误差小于设定阈值时则训练结束,得到故障分类模型SVM;
其中,损失函数为:
其中,J为训练集数目,j=1,2,...,J,wj为可调节参数。
8.根据权利要求1所述的方法,其特征在于,还包括:
将所述总相似度作为知识图谱分析模型的输入,将故障分类标签作为所述知识图谱分析模型的输出,对知识图谱分析模型进行训练得到反映总相似度和故障分类标签映射关系的故障型知识图谱分析模型。
9.根据权利要求1所述的方法,其特征在于,所述步骤10,综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警,具体包括:
将所述第一故障预测结果与第一阈值进行比较,将所述第二故障预测结果与第二阈值进行比较;
若所述第一故障预测结果大于等于第一阈值,且所述第二故障预测结果大于等于第二阈值,则进行一级报警;
若所述第一故障预测结果小于第一阈值,且所述第二故障预测结果小于第二阈值,则无故障,不自动报警;
若所述第一故障预测结果大于等于第一阈值,所述第二故障预测结果小于第二阈值,则进行二级报警;
若所述第一故障预测结果小于第一阈值,所述第二故障预测结果大于等于第二阈值,则进行三级报警。
10.一种光伏发电组件故障自动报警系统,其特征在于,该系统包括:
采集模块,用于采集光伏发电系统中的各类运行样本数据;
聚类模块,用于对所采集的运行样本数据进行PCA聚类分析,提取出第一主成分特征和第二主成分特征;其中,第一主成分特征和第二主成分特征表示PCA聚类分析后两种不同的类型数据;
MapReduce单元模块,用于基于MapReduce 并行运算模式下,在Map阶段提取所述第一主成分特征和所述第二主成分特征中的每个样本特征值,在Reduce 阶段统计所采集运行样本数据的样本总数和提取的样本特征数;
第一预测模块,用于将所述每个样本特征值、所述样本总数和所述样本特征数进行叠加组合,并将叠加后的数据输入第一故障预测模型,得到第一故障预测结果;所述第一故障预测模型为SVM故障分类模型;
转换模块,用于将所述步骤2中的所述第一主成分特征和所述第二主成分特征输入卷积神经网络以提取出空间信息,并将所述空间信息转换成空间特征向量h;将所述第一主成分特征和所述第二主成分特征输入GRU网络以提取出时间序列信息,并将所述时间序列信息转换成时间序列向量p;
第一计算模块,用于计算所述空间特征向量h与向量集setA的相似度L(h,setA),公式为:
其中,向量集setA表示光伏发电系统正常运行情况下的空间特征集合,a为向量集setA中的一个向量;
第二计算模块,用于计算所述时间序列向量p与向量集setB的相似度L(p,setB),公式为:
其中,向量集setB表示光伏发电系统正常运行情况下的时间特征集合,b为向量集setB中的一个向量;
第三计算模块,用于计算总相似度sim(h,p),公式为:
其中,、/>表示权重值;
第二预测模块,用于将所述总相似度sim(h,p)输入预先建立的知识图谱模型,得到第二故障预测结果;
分级报警模块,用于综合所述第一故障预测结果和所述第二故障预测结果,进行光伏发电组件的故障分级报警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311327308.2A CN117370790A (zh) | 2023-10-13 | 2023-10-13 | 一种光伏发电组件故障自动报警方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311327308.2A CN117370790A (zh) | 2023-10-13 | 2023-10-13 | 一种光伏发电组件故障自动报警方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117370790A true CN117370790A (zh) | 2024-01-09 |
Family
ID=89405300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311327308.2A Pending CN117370790A (zh) | 2023-10-13 | 2023-10-13 | 一种光伏发电组件故障自动报警方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117370790A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096873A1 (en) * | 2002-12-30 | 2005-05-05 | Renata Klein | Method and system for diagnostics and prognostics of a mechanical system |
CN103646079A (zh) * | 2013-12-13 | 2014-03-19 | 武汉大学 | 一种用于图数据库搜索的分布式索引及其并行生成方法 |
CN105574165A (zh) * | 2015-12-17 | 2016-05-11 | 国家电网公司 | 一种基于聚类的电网运行监控信息辨识分类方法 |
US20170286525A1 (en) * | 2016-03-31 | 2017-10-05 | Splunk Inc. | Field Extraction Rules from Clustered Data Samples |
CN110363354A (zh) * | 2019-07-16 | 2019-10-22 | 上海交通大学 | 风场风功率预测方法、电子装置及存储介质 |
CN112084237A (zh) * | 2020-09-09 | 2020-12-15 | 广东电网有限责任公司中山供电局 | 一种基于机器学习和大数据分析的电力系统异常预测方法 |
CN112834224A (zh) * | 2021-01-05 | 2021-05-25 | 广东核电合营有限公司 | 一种核电汽轮发电机健康状态评估方法及系统 |
US20210173462A1 (en) * | 2019-12-09 | 2021-06-10 | General Electric Company | Systems and methods for enhanced power system event detection and identification |
CN114528755A (zh) * | 2022-01-25 | 2022-05-24 | 国网冀北电力有限公司 | 一种基于注意力机制结合gru的电力设备故障检测模型 |
CN114778112A (zh) * | 2021-04-16 | 2022-07-22 | 大唐(赤峰)新能源有限公司 | 风电发电机组机械故障音频识别和故障诊断方法 |
US20220373984A1 (en) * | 2021-05-19 | 2022-11-24 | Shandong University | Hybrid photovoltaic power prediction method and system based on multi-source data fusion |
CN115982602A (zh) * | 2023-03-20 | 2023-04-18 | 济宁众达利电气设备有限公司 | 一种光伏变压器电故障检测方法 |
-
2023
- 2023-10-13 CN CN202311327308.2A patent/CN117370790A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096873A1 (en) * | 2002-12-30 | 2005-05-05 | Renata Klein | Method and system for diagnostics and prognostics of a mechanical system |
CN103646079A (zh) * | 2013-12-13 | 2014-03-19 | 武汉大学 | 一种用于图数据库搜索的分布式索引及其并行生成方法 |
CN105574165A (zh) * | 2015-12-17 | 2016-05-11 | 国家电网公司 | 一种基于聚类的电网运行监控信息辨识分类方法 |
US20170286525A1 (en) * | 2016-03-31 | 2017-10-05 | Splunk Inc. | Field Extraction Rules from Clustered Data Samples |
CN110363354A (zh) * | 2019-07-16 | 2019-10-22 | 上海交通大学 | 风场风功率预测方法、电子装置及存储介质 |
US20210173462A1 (en) * | 2019-12-09 | 2021-06-10 | General Electric Company | Systems and methods for enhanced power system event detection and identification |
CN112084237A (zh) * | 2020-09-09 | 2020-12-15 | 广东电网有限责任公司中山供电局 | 一种基于机器学习和大数据分析的电力系统异常预测方法 |
CN112834224A (zh) * | 2021-01-05 | 2021-05-25 | 广东核电合营有限公司 | 一种核电汽轮发电机健康状态评估方法及系统 |
CN114778112A (zh) * | 2021-04-16 | 2022-07-22 | 大唐(赤峰)新能源有限公司 | 风电发电机组机械故障音频识别和故障诊断方法 |
US20220373984A1 (en) * | 2021-05-19 | 2022-11-24 | Shandong University | Hybrid photovoltaic power prediction method and system based on multi-source data fusion |
CN114528755A (zh) * | 2022-01-25 | 2022-05-24 | 国网冀北电力有限公司 | 一种基于注意力机制结合gru的电力设备故障检测模型 |
CN115982602A (zh) * | 2023-03-20 | 2023-04-18 | 济宁众达利电气设备有限公司 | 一种光伏变压器电故障检测方法 |
Non-Patent Citations (2)
Title |
---|
M. MALVONI,ET AL: "Photovoltaic forecast based on hybrid PCA–LSSVM using dimensionality reducted data", NEUROCOMPUTING, vol. 211, 26 October 2016 (2016-10-26), pages 72 - 83, XP029737128, DOI: 10.1016/j.neucom.2016.01.104 * |
姚宏民等: "基于密度峰值聚类及GRNN神经网络的光伏发电功率预测方法", 太阳能学报, no. 09, 28 September 2020 (2020-09-28), pages 190 - 196 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492667A (zh) | 一种用于非侵入式电力负荷监测的特征选择辨识方法 | |
CN110458230A (zh) | 一种基于多判据融合的配变用采数据异常甄别方法 | |
CN114676742A (zh) | 一种基于注意力机制和残差网络的电网异常用电检测方法 | |
CN116842459B (zh) | 一种基于小样本学习的电能计量故障诊断方法及诊断终端 | |
CN115036922B (zh) | 一种分布式光伏发电电量预测方法及系统 | |
CN111273125A (zh) | 基于rst-cnn的电力电缆沟道故障诊断方法 | |
CN110569888A (zh) | 基于有向无环图支持向量机的变压器故障诊断方法及装置 | |
CN113887912A (zh) | 一种深度学习下面向嵌入式设备的非侵入式负荷识别方法 | |
Yoon et al. | Deep learning-based method for the robust and efficient fault diagnosis in the electric power system | |
Zu et al. | A simple gated recurrent network for detection of power quality disturbances | |
He et al. | Compound fault diagnosis for photovoltaic arrays based on multi-label learning considering multiple faults coupling | |
CN116467648A (zh) | 一种基于物联表的非线性台区电力故障的早期监测方法 | |
CN117411436B (zh) | 光伏组件状态检测方法、系统及存储介质 | |
Ding et al. | A health status-based performance evaluation method of photovoltaic system | |
CN117725491A (zh) | 一种基于SCINet的电力系统故障状态检测分类方法 | |
CN117277566B (zh) | 基于大数据的电网数据分析电力调度系统及方法 | |
CN117033923A (zh) | 一种基于可解释性机器学习的犯罪数量预测方法及系统 | |
CN116720095A (zh) | 一种基于遗传算法优化模糊c均值的电特性信号聚类方法 | |
CN117370790A (zh) | 一种光伏发电组件故障自动报警方法及系统 | |
CN117764547A (zh) | 一种光伏组串故障诊断方法及系统 | |
CN115456013A (zh) | 基于运行数据的风电机组变流器功率模块故障诊断方法 | |
Ma et al. | Anomaly Detection of Mountain Photovoltaic Power Plant Based on Spectral Clustering | |
CN115598459A (zh) | 一种配电网10kV馈线故障停电预测方法 | |
CN110837932A (zh) | 基于dbn-ga模型的太阳能集热系统热功率预测方法 | |
CN113435494A (zh) | 低压居民用户异常用电识别方法及仿真模拟系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |