CN115146881A - 一种低压分布式光伏系统不良数据检测方法和系统 - Google Patents
一种低压分布式光伏系统不良数据检测方法和系统 Download PDFInfo
- Publication number
- CN115146881A CN115146881A CN202211081062.0A CN202211081062A CN115146881A CN 115146881 A CN115146881 A CN 115146881A CN 202211081062 A CN202211081062 A CN 202211081062A CN 115146881 A CN115146881 A CN 115146881A
- Authority
- CN
- China
- Prior art keywords
- data
- cluster
- clustering
- meteorological
- photovoltaic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 39
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 238000007621 cluster analysis Methods 0.000 claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 7
- 238000005286 illumination Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 abstract description 6
- 238000012544 monitoring process Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000013082 photovoltaic technology Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Power Engineering (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明提供了一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法和系统,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最外围数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏系统的特性分析以及出力预测的影响。
Description
技术领域
本发明属于光伏出力预测技术领域,具体涉及一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法和系统。
背景技术
近年来随着国家政策的大力支持,光伏技术的日益成熟,光伏组件的安装成本也呈指数级下降。因此,在我国各个地区出现了集中式或分布式光伏系统。然而,光伏电站的大规模建设也给此类可再生能源的准确监控带来技术难题。目前,用以监控光伏系统数据的设备主要包括:SCADA系统监控下光伏接入点可获取的有功功率以及无功功率;PMU系统监控下光伏接入点可检测的高频相量数据。随着光伏容量的快速增加,各式数据采集设备也相应投入使用,导致系统中的监控数据爆炸式增长。由于数据采集装置的量测误差,以及数据传输过程中的通信故障,通常容易导致传输到数据存储端的数据存在部分不良数据。这些不良数据的存在对后续光伏系统的特性分析以及出力预测都带来间接影响。
发明内容
有鉴于此,本发明提供一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法和系统,旨在准确检测传输到数据存储端的部分不良数据,降低其对光伏系统的特性分析以及出力预测的影响。
为了解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供了一种低压分布式光伏系统不良数据检测方法,包括:
获取光伏阵列的历史出力数据以及对应的气象数据;
根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;
依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel;
根据光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV,MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;
分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;
循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
进一步的,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
进一步的,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
进一步的,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm;
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE;
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
进一步的,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
第二方面,本发明提供了一种低压分布式光伏系统不良数据检测系统,包括:
数据获取单元,用于获取光伏阵列的历史出力数据以及对应的气象数据;
第一聚类分析单元,用于根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel;
第二聚类分析单元,用于根据光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
进一步的,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
进一步的,在第一聚类分析单元中,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
进一步的,在第二聚类分析单元中,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm;
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE;
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
进一步的,在第二聚类分析单元中,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
综上,本发明提供了一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法和系统,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,将气象环境的划分结果构建气象环境标签,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最外围数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏系统的特性分析以及出力预测的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法的流程图;
图2为本发明实施例提供的一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法的流程框图。
具体实施方式
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
近年来随着国家政策的大力支持,光伏技术的日益成熟,光伏组件的安装成本也呈指数级下降。因此,在我国各个地区出现了集中式或分布式光伏系统。然而,光伏电站的大规模建设也给此类可再生能源的准确监控带来技术难题。目前,用以监控光伏系统数据的设备主要包括:SCADA系统监控下光伏接入点可获取的有功功率以及无功功率;PMU系统监控下光伏接入点可检测的高频相量数据。随着光伏容量的快速增加,各式数据采集设备也相应投入使用,导致系统中的监控数据爆炸式增长。由于数据采集装置的量测误差,以及数据传输过程中的通信故障,通常容易导致传输到数据存储端的数据存在部分不良数据。这些不良数据的存在对后续光伏系统的特性分析以及出力预测都带来间接影响。
基于此,本发明提供一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法和系统。
以下对本发明的一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法的实施例进行详细的介绍。
请参阅图1,本实施例提供了一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法,包括:
S100:获取光伏阵列的历史出力数据以及对应的气象数据。
需要说明的是,光伏出力有功出力记为PPV,气象数据具体包括气温Temp、光照强度Lux、空气湿度RH、云量TCC。
S200:根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*。
可以理解的是,每一个簇类物理意义即为光伏电站工作的一个气象环境。
S300:依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel。
需要说明的是,步骤S200-S300为一阶段聚类分析过程。具体的,本阶段的聚类分析过程如下:
令初始聚类数c = 2,采用模糊C算法对气象数据集Met = [Temp, Lux, RH, TCC]做聚类分析。修正聚类数c的值,并计算XB聚类有效性指标,循环采用模糊C算法划分得出c个簇类,直到XB指标达到谷值时,确定最佳聚类数c*个气象环境。其中,XB聚类有效性指标的计算方法表示如下:
c表示聚类数,N表示所有待聚类数据样本数目,μij为样本xi隶属于i类隶属度值,vj是第j个簇类的聚类中心。XB聚类有效性指标越小,说明聚类结果中类内各点距离越小,类间各点之间距离越大,聚类划分越明显。
根据一阶段的气象数据集聚类结果,构建气象环境指标MetLabel=1, 2,…, c*。并按照各个采样时刻光伏出力PPV对应气象数据所属簇类,对光伏出力数据PPV标记气象环境指标MetLabel。气象环境标签MetLabel,可以有效依据气象环境数据,划分光伏阵列在各个时刻所属的工作气象环境。
S400:根据光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力。
S500:分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm。
S600:循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
需要说明的是,步骤S400-S600为二阶段聚类分析过程。具体的,本阶段的聚类分析过程如下:
令初始聚类数k = 2,采用模糊C算法对N条由光伏出力和对应气象环境指标构建的数据集P = [PPV, MetLabel]做聚类分析。修正聚类数k的值,根据偏离指标(Dev)最小选择最佳聚类数k*。其中,偏离指标(Dev)计算方法如下:
k表示聚类数,nj表示第j个簇类中的数据数目,表示第j个簇类所有数据的MetLabel构成数据集的众数。因此,偏离指标(Dev)主要用以衡量两阶段聚类划分的差异性。循环采用模糊C聚类算法划分得出k个簇类,直到Dev指标达到谷值时,取偏离指标(Dev)最小时的k值为最佳二阶段聚类数k*。
得出最佳二阶段聚类结果后,分别计算各个簇类的数据到聚类中心的距离dm。其中,dm计算方法如下ym,j表示第j个簇类的第m个样本,ej表示二阶段聚类中心:
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE如下:
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE。以此方法,依次再次去掉各簇类剩余数据中dm最大的一个,并计算平均距离指标DAVE。观察平均距离指标DAVE曲线下降趋势,当DAVE曲线一直保持平稳下降,说明无不良数据;当DAVE曲线先急速下降,后转为平稳下降,依据肘部法原则,认为使得DAVE曲线急速下降的数据点为不良数据,做剔除处理。
另外,本实施例提供的不良数据检测方法的检测对象是低压分布式光伏阵列。
图2是根据上述步骤确定的不良数据检测方法的流程框图。
本实施例提供一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法,通过采集光伏出力数据对应的气象数据,构建气象数据向量集,并通过一阶段模糊C聚类分析,将气象环境的划分结果构建气象环境标签,按照各时刻光伏出力的气象数据所属簇类,标记气象环境标签。在二阶段模糊C聚类过程中,将光伏出力数据与气象环境标签组合构建数据集合,依据偏离指标选择最佳聚类数,让二阶段聚类划分与一阶段的聚类划分尽可能贴合。根据最终光伏有功出力的划分簇类,依次剔除最外围数据,并绘制平均距离指标DAVE的下降曲线,依据肘部法原则检测不良数据。本发明可以准确检测出传输到数据存储端的部分不良数据,降低其对光伏系统的特性分析以及出力预测的影响。
以上是对本发明的一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测方法的实施例进行的详细介绍,以下将对本发明的一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测系统的实施例进行详细的介绍。
本实施例提供一种基于二阶段模糊C算法的低压分布式光伏系统不良数据检测系统,包括:数据获取单元、第一聚类分析单元和第二聚类分析单元。
在本实施例中,数据获取单元用于获取光伏阵列的历史出力数据以及对应的气象数据。
需要说明的是,气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
在本实施例中,第一聚类分析单元用于根据气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel。
在第一聚类分析单元中,一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
在本实施例中,第二聚类分析单元用于根据光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
在第二聚类分析单元中,二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm;
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE;
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
另外,依据肘部法原则确定不良数据具体为:
确定平均距离指标DAVE曲线中的拐点,将拐点对应的数据点记为不良数据点,做剔除处理。
需要说明的是,本实施例提供的不良数据检测系统用于实现前述实施例提供的不良数据检测方法,各单元的具体设置均以完整实现该方法为准,在此不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种低压分布式光伏系统不良数据检测方法,其特征在于,包括:
获取光伏阵列的历史出力数据以及对应的气象数据;
根据所述气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;
依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel;
根据所述光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV,MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;
分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;
循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
2.根据权利要求1所述的低压分布式光伏系统不良数据检测方法,其特征在于,所述气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
3.根据权利要求2所述的低压分布式光伏系统不良数据检测方法,其特征在于,所述一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对所述气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
4.根据权利要求1所述的低压分布式光伏系统不良数据检测方法,其特征在于,所述二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据所述最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm;
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE;
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
5.根据权利要求1或4所述的低压分布式光伏系统不良数据检测方法,其特征在于,依据肘部法原则确定不良数据具体为:
确定所述平均距离指标DAVE曲线中的拐点,将所述拐点对应的数据点记为不良数据点,做剔除处理。
6.一种低压分布式光伏系统不良数据检测系统,其特征在于,包括:
数据获取单元,用于获取光伏阵列的历史出力数据以及对应的气象数据;
第一聚类分析单元,用于根据所述气象数据构建气象数据向量集Met 进行一阶段聚类分析,即采用模糊C聚类分析算法,将N条气象数据划分为c个不同的簇类,并确定最佳聚类数c*;还用于依据各个光伏阵列在各个出力时刻的气象数据所属簇类,增加光伏系统的气象环境标签MetLabel;
第二聚类分析单元,用于根据所述光伏系统的气象环境标签,继续采用模糊C聚类分析算法对数据集P=[PPV, MetLabel]数据做二阶段聚类分析,确定最佳聚类数k*,其中PPV为光伏有功出力;还用于分别计算按照最佳聚类数划分得到的k*个簇类中各条数据到聚类中心的距离dm;还用于循环计算平均距离指标DAVE,并在每次计算后去掉各簇类中dm最大的一条数据,根据每次计算得到的平均距离指标结果生成平均距离指标DAVE曲线,依据肘部法原则确定不良数据。
7.根据权利要求6所述的低压分布式光伏系统不良数据检测系统,其特征在于,所述气象数据具体包括:气温Temp、光照强度Lux、空气湿度RH、云量TCC。
8.根据权利要求7所述的低压分布式光伏系统不良数据检测系统,其特征在于,在所述第一聚类分析单元中,所述一阶段聚类分析具体包括:
令初始聚类数c=2,采用模糊C聚类算法对所述气象数据向量集Met = [Temp, Lux,RH, TCC]做聚类分析;
根据XB聚类有效性指标确定最佳聚类数c*,构建气象环境指标1, 2,…, c*;
依据各个采样时刻光伏出力对应的气象数据所属簇类,对光伏处理数据标记气象环境标签MetLabel。
9.根据权利要求6所述的低压分布式光伏系统不良数据检测系统,其特征在于,在所述第二聚类分析单元中,所述二阶段聚类分析具体包括:
令初始聚类数k = 2,采用模糊C算法对N条数据集P = [PPV, MetLabel]做聚类分析,根据偏离指标最小选择最佳聚类数k*;
根据所述最佳聚类数结果,分别计算各个簇类的数据到聚类中心的距离dm;
根据计算所得的各个簇类数据的距离值,计算平均距离指标DAVE;
去掉各簇类中dm最大的一条数据,更新数据集并重新计算平均距离指标DAVE,按照每计算一次DAVE的同时去掉一条dm最大的数据的规则,生成平均距离指标DAVE曲线,依据肘部法原则筛除不良数据。
10.根据权利要求6或9所述的低压分布式光伏系统不良数据检测系统,其特征在于,在所述第二聚类分析单元中,依据肘部法原则确定不良数据具体为:
确定所述平均距离指标DAVE曲线中的拐点,将所述拐点对应的数据点记为不良数据点,做剔除处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081062.0A CN115146881B (zh) | 2022-09-05 | 2022-09-05 | 一种低压分布式光伏系统不良数据检测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081062.0A CN115146881B (zh) | 2022-09-05 | 2022-09-05 | 一种低压分布式光伏系统不良数据检测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115146881A true CN115146881A (zh) | 2022-10-04 |
CN115146881B CN115146881B (zh) | 2023-01-13 |
Family
ID=83416577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211081062.0A Active CN115146881B (zh) | 2022-09-05 | 2022-09-05 | 一种低压分布式光伏系统不良数据检测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146881B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123682A (zh) * | 2014-07-28 | 2014-10-29 | 国家电网公司 | 一种基于气象影响因素的配网故障风险评估方法 |
CN106022528A (zh) * | 2016-05-26 | 2016-10-12 | 上海电力学院 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
US20170018038A1 (en) * | 2014-03-07 | 2017-01-19 | Hitachi, Ltd. | Data analyzing system and method |
CN108053149A (zh) * | 2018-01-05 | 2018-05-18 | 东南大学 | 一种考虑气象因素的光伏电站并网风险评估方法 |
CN108846527A (zh) * | 2018-08-27 | 2018-11-20 | 云南电网有限责任公司电力科学研究院 | 一种光伏发电功率预测方法 |
EP3640869A1 (en) * | 2018-10-17 | 2020-04-22 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Method for predicting an energy demand, data processing system and renewable power plant with a storage |
-
2022
- 2022-09-05 CN CN202211081062.0A patent/CN115146881B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170018038A1 (en) * | 2014-03-07 | 2017-01-19 | Hitachi, Ltd. | Data analyzing system and method |
CN104123682A (zh) * | 2014-07-28 | 2014-10-29 | 国家电网公司 | 一种基于气象影响因素的配网故障风险评估方法 |
CN106022528A (zh) * | 2016-05-26 | 2016-10-12 | 上海电力学院 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
CN108053149A (zh) * | 2018-01-05 | 2018-05-18 | 东南大学 | 一种考虑气象因素的光伏电站并网风险评估方法 |
CN108846527A (zh) * | 2018-08-27 | 2018-11-20 | 云南电网有限责任公司电力科学研究院 | 一种光伏发电功率预测方法 |
EP3640869A1 (en) * | 2018-10-17 | 2020-04-22 | Deutsches Zentrum für Luft- und Raumfahrt e.V. | Method for predicting an energy demand, data processing system and renewable power plant with a storage |
Non-Patent Citations (1)
Title |
---|
郭辉: "基于电站群聚类和相似气象日的光伏电站不良数据修复", 《优秀硕士学位论文工程科技Ⅱ辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115146881B (zh) | 2023-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN110008982B (zh) | 一种基于光伏发电出力聚类的气象监测点选择方法 | |
CN111488896B (zh) | 一种基于多源数据挖掘的配电线路时变故障概率计算方法 | |
CN114006369B (zh) | 区域风光场站功率联合预测方法、装置、电子设备和存储介质 | |
CN110766200A (zh) | 一种基于K-means均值聚类的风电机组发电功率预测方法 | |
CN111428942B (zh) | 基于变网格技术提取微地形因子的线路覆冰厚度预测方法 | |
CN116227637A (zh) | 一种面向有源配电网的精细化负荷预测方法和系统 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN116050666B (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN115796434A (zh) | 一种用于配电网的管控方法、装置、电子设备及存储介质 | |
CN113052386A (zh) | 基于随机森林算法的分布式光伏日发电量预测方法和装置 | |
CN113139880A (zh) | 风电机组实际功率曲线拟合方法、装置、设备及存储介质 | |
CN114399081A (zh) | 一种基于天气分类的光伏发电功率预测方法 | |
Chen et al. | Research on wind power prediction method based on convolutional neural network and genetic algorithm | |
CN116125204A (zh) | 一种基于电网数字化的故障预测系统 | |
CN116317937A (zh) | 一种分布式光伏电站运行故障诊断方法 | |
CN117540327B (zh) | 一种企业环境自主管理数据采集处理系统 | |
CN114611842A (zh) | 一种整县屋顶分布式光伏功率预测方法 | |
CN105939014A (zh) | 一种风电场站相关性指标获取方法 | |
CN115146881B (zh) | 一种低压分布式光伏系统不良数据检测方法和系统 | |
CN109948738A (zh) | 涂装烘干室的能耗异常检测方法、装置及系统 | |
CN117200223A (zh) | 日前电力负荷预测方法和装置 | |
CN117787698A (zh) | 基于供电范围最大化的微网风险评估方法及系统 | |
CN116664098A (zh) | 一种光伏电站的异常检测方法及系统 | |
CN111965442A (zh) | 一种数字孪生环境下的能源互联网故障诊断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |