CN116664098A - 一种光伏电站的异常检测方法及系统 - Google Patents
一种光伏电站的异常检测方法及系统 Download PDFInfo
- Publication number
- CN116664098A CN116664098A CN202310424266.8A CN202310424266A CN116664098A CN 116664098 A CN116664098 A CN 116664098A CN 202310424266 A CN202310424266 A CN 202310424266A CN 116664098 A CN116664098 A CN 116664098A
- Authority
- CN
- China
- Prior art keywords
- power generation
- photovoltaic power
- power station
- data
- state data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 83
- 230000005856 abnormality Effects 0.000 title claims description 31
- 238000010248 power generation Methods 0.000 claims abstract description 150
- 230000002159 abnormal effect Effects 0.000 claims abstract description 58
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 238000007418 data mining Methods 0.000 claims abstract description 8
- 230000007613 environmental effect Effects 0.000 claims description 18
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000005286 illumination Methods 0.000 claims description 8
- 238000013079 data visualisation Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 18
- 238000012423 maintenance Methods 0.000 abstract description 17
- 238000012549 training Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 7
- 230000002411 adverse Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000001744 unit root test Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/50—Photovoltaic [PV] energy
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Marketing (AREA)
- Computational Mathematics (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Photovoltaic Devices (AREA)
- Remote Monitoring And Control Of Power-Distribution Networks (AREA)
Abstract
本发明公开了一种光伏电站的异常检测方法及系统,包括:(1)获取光伏电站本身的状态数据及所处外界环境的状态数据;(2)对光伏电站本身的状态数据及所处外界环境的状态数据进行判断,结合序关系分析法确定的权重确定环境变化等级,在环境变化等级达到要求或工作人员主动触发时,进入步骤(3);(3)通过基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型得到新的健康临界值、检测出现异常的发电单元并报警,随后使用向量自回归模型得到异常发电单元对周围发电单元的影响系数。本发明提供的方法及系统降低了光伏电站的维护成本,提高了异常检测的准确率,使运维人员可以及时发现潜在问题。
Description
技术领域
本发明涉及太阳能光伏电站领域,尤其涉及一种光伏电站的异常检测方法及系统。
背景技术
随着光伏装机容量的快速增长和光伏发电系统的智能化运行,光伏电站运行数据的研究已成为该领域研究的热门课题。其中,准确、可信的光伏功率数据是光伏发电性能评估、光伏功率预测及光伏并网等研究的基础。然而,由于设备故障、消纳能力有限等原因,许多光伏电站现场采集的数据中含有大量的异常数据,这不仅影响了光伏功率数据本身的数据质量,而且大大降低了相关实验和测试结果的准确性。因此,越来越多的学者开始研究光伏发电中的异常数据问题。
近些年来,人工智能技术进入高速发展阶段。光伏电站设备运行数据样本较大,当前的异常检测方法数据处理能力较差。与此同时,由于实际设备检测工作的实操性较差,所以一些学者开始使用人工智能技术完成光伏电站设备的远程检测操作,并使用可视化技术以及数据融合技术对当前电气设备运行检测方法展开优化,以此来降低设备运行故障难度,提升设备维护效率。
然而,现有的光伏电站异常检测方法对各种状态数据权重的确定大多采用客观赋权法,需要大量的样本数据,计算复杂且通用性较差,不能体现出实际场景中对不同状态数据的重视程度,对光伏电站环境变化等级的确定造成了不利影响。此外,现有光伏电站异常检测方法没有计算异常发电单元对周围发电单元造成的不利影响,在这种情况下就会导致运维人员无法及时发现周围发电单元的潜在问题,对光伏电站的正常运行造成不利影响。
发明内容
针对现有方法存在的问题,本发明提供了一种光伏电站的异常检测方法及系统。
本发明提供一种光伏电站的异常检测方法,包括以下步骤:
步骤101,获取光伏电站本身的状态数据及所处外界环境的状态数据;
步骤102,对光伏电站本身的状态数据及所处外界环境的状态数据进行判断,使用序关系分析法确定的权重确定环境变化等级,在环境变化等级达到要求或工作人员主动触发时,进入步骤103;
步骤103,通过基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型得到新的健康临界值、检测出现异常的发电单元并报警,随后使用向量自回归模型得到异常发电单元对周围发电单元的影响系数;
其中,所述权重采用序关系分析法计算得到,将温度、湿度、气压等数据类型根据历史记录确定不同的权重,便于确定环境变化等级,防止环境的轻微变化就导致重新计算健康临界值的情况发生;动态健康临界值生成、检测和报警模型采用CART算法,用于检测发电单元、发电模组及整个电站的异常情况;所述向量自回归模型通过异常发电单元和周围发电单元的数据序列得到异常发电单元对周围发电单元的影响系数,便于及时发现潜在问题。
进一步地,步骤102中,将光伏电站本身的状态数据及所处外界环境的状态数据与数据对应的权重进行计算,得到环境变化的等级,根据环境变化等级判断是否达到需要重新计算光伏电站健康临界值的要求。
进一步地,步骤103中,包括以下步骤:
步骤S31,将光伏电站各发电单元的当前状态数据和外界环境的状态数据输入到动态健康临界值生成模型中,得到当前状态下光伏电站各个发电单元的健康临界值;
步骤S32,将发电单元自身状态及相邻单元的状态数据输入到动态健康临界值检测模型中,判断光伏电站各发电单元、发电模组及整个电站的状态是否超出当前健康临界值,得到出现异常的发电单元;
步骤S33,将异常发电单元和周围发电单元的数据序列输入到向量自回归模型中,得到异常发电单元对周围发电单元的影响系数。
进一步地,所述动态健康临界值生成、检测和报警模型通过以下步骤训练得到:
步骤T1,数据清洗、选择和转换;
步骤T2,根据CART算法,得到动态健康临界值生成、检测和报警模型;
步骤T3,对动态健康临界值生成、检测和报警模型进行迭代验证,直至整个模型的预测准确率达到预设条件,得到最终的模型。
进一步地,所述向量自回归模型的数据序列包括发电单元的温度、发电速率和累计工作时长等。
进一步地,所述外界环境的状态数据包括温度、湿度、气压、风速、光照强度、光照时长等。
本发明还提供一种光伏电站的异常检测系统,包括:
光伏电站数据采集模块,用于获取光伏电站本身的状态数据及所处外界环境的状态数据,并使用序关系分析法确定的权重确定环境变化等级;
动态健康临界值检测模块,用于将所述光伏电站本身及所处外界环境的状态数据输入到基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型中,更新光伏电站的健康临界值并检测出出现异常的发电单元并报警,并通过向量自回归模型得到异常发电单元对周围发电单元的影响系数;
数据可视化模块,用于展示状态数据和健康临界值的变化,其中,发生异常和存在潜在风险的发电单元将被特别注明;
其中,所述权重采用序关系分析法计算得到,将温度、湿度、气压等数据类型根据历史记录确定不同的权重,便于确定环境变化等级,防止环境的轻微变化就导致重新计算健康临界值的情况发生;动态健康临界值生成、检测和报警模型采用CART算法,用于检测发电单元、发电模组及整个电站的异常情况;所述向量自回归模型通过异常发电单元和周围发电单元的数据序列得到异常发电单元对周围发电单元的影响系数,便于及时发现潜在问题。
本发明的有益效果是:
本发明提供的一种光伏电站的异常检测方法及系统,通过使用序关系分析法,更加准确的确定外界状态数据的权重并定期对权重进行更新,从而确定光伏电站环境变化等级,以此避免环境的轻微变化就导致重新计算健康临界值的情况发生。CART算法构建动态健康临界值生成、检测和报警模型,可以根据外界环境以及发电单元累计工作的时长的变化动态获取光伏电站的健康临界值。随后根据更新后的健康临界值以及光伏电站健康检测及报警系统判断光伏电站中各个发电单元的健康状态,在发生异常时及时提醒运维人员,并提供可视化页面帮助运维人员更好的了解光伏电站的总体情况。最后通过向量自回归模型对异常发电单元对周围发电单元产生的影响系数进行计算,对影响系数较大的发电单元进行检查,以此排除潜在的安全隐患。本发明提供的方法及系统降低了光伏电站的维护成本,提高了异常检测的准确率,使运维人员可以及时发现潜在问题。
附图说明
此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:
图1为本发明提供的光伏电站的异常检测方法的流程示意图;
图2为本发明提供的光伏电站异常检测方法的数据处理流程示意图;
图3为本发明提供的向量自回归模型的流程示意图;
图4为本发明提供的CART算法的流程示意图;
图5为本发明提供的光伏电站的异常检测系统的结构示意图。
具体实施方式
为使本发明的技术方案和特点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。其中的示意性实施例以及说明仅用来解释本发明,但并不作为本发明的限定。
现有的光伏电站异常检测方法对光伏电站所处外界环境的状态数据进行权重确定时,大多使用客观赋权法,且不会对权重进行更新。光伏电站的现实运行场景是多种多样且极其复杂的,状态数据在不同的光伏电站造成的影响也是不一样的,同时由于客观赋权法极度依赖样本数据,造成计算出的权重与其实际重要程度相差较大。因此,在对状态数据的权重进行赋值时应根据历史记录采用序关系分析法进行主观赋值并定期更新,从而得到更适合本光伏电站的状态数据权重,在进行环境变化等级计算时更加准确,同时避免环境的轻微变化就导致重新计算健康临界值的情况发生。光伏电站的异常检测不应仅检测出异常发电单元,同时也应计算出现异常的发电单元对周围发电单元是否是造成不利影响,以此使运维人员可以及时发现周围发电单元的潜在安全风险。
因此,本发明使用序关系分析法对光伏电站的状态数据权重进行主观赋值,得到更真实的权重值,以此计算环境变化的等级,减少环境的轻微变化导致重新计算健康临界值的情况发生,提高整个光伏电站运行平稳程度;随后通过向量自回归模型对异常发电单元对周围发电单元产生的影响系数进行计算,使运维人员可以及时发现潜在问题。
实施例1
图1为本发明提供的光伏电站的异常检测方法的流程示意图,如图1所示,本发明提供了一种光伏电站的异常检测方法,包括:
步骤101,获取光伏电站本身的状态数据及所处外界环境的状态数据。
在本发明中,光伏电站的状态数据不仅仅包含外界环境的状态数据,如温度、湿度、气压、风速、光照强度、光照时长等;还包含光伏电站本身状态数据,如发电单元的温度、发电速率和累计工作时长等。在准确的收集了各种数据前提下,才能对光伏电站当前的健康临界值进行动态调整,更好的发现异常发电单元。
步骤102,对光伏电站本身的状态数据及所处外界环境的状态数据进行判断,结合序关系分析法计算的权重确定环境变化的等级。
其中,在环境变化等级达到要求或工作人员主动触发时,进入步骤103,重新计算光伏电站健康临界值并检测出出现异常的发电单元。此步骤主要目的是判断环境变化的等级是否达到需要重新计算光伏电站健康临界值的要求,降低不必要的资源浪费。
步骤103,通过基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型得到新的健康临界值、检测出现异常的发电单元并报警,随后使用向量自回归模型得到异常发电单元对周围发电单元的影响系数。
其中,所述权重采用序关系分析法计算得到,将温度、湿度、气压等数据类型根据历史记录确定不同的权重,便于确定环境变化等级,防止环境的轻微变化就导致重新计算健康临界值的情况发生;动态健康临界值生成、检测和报警模型采用CART算法,用于检测发电单元、发电模组及整个电站的异常情况;所述向量自回归模型通过异常发电单元和周围发电单元的数据序列得到异常发电单元对周围发电单元的影响系数,便于及时发现潜在问题。
在进行光伏电站异常检测时,采用客观赋权法对外界环境的状态数据进行权重计算通用性和稳定性较差,造成权重与其实际重要程度不匹配的现象。此外,常见的光伏电站异常检测系统仅仅检测出了异常发电单元,没有对异常发电单元可能造成的影响进行计算,无法让运维人员及时发现周围发电单元可能的潜在问题。
实施例2
基于上述现有的光伏电站异常检测系统在实际应用过程中可能会遇到的问题,本发明提出了一种全新的光伏电站异常检测方法,该方法中包括序关系分析法确定的状态数据权重、数据挖掘领域内的重要算法CART算法模型、3-Sigma算法和局部异常因子算法、向量自回归模型。首先通过对光伏电站本身及所处外界环境的状态数据进行收集,并通过序关系分析法确定的状态数据权重计算环境变化等级,环境变化等级达到要求后,将光伏电站各发电单元的当前状态数据和外界环境的状态数据输入到基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型中。其中,在收集到状态数据后,通过数据清洗、选择和转换对数据进行处理,以供模型更好的获取到有效的数据。随后将处理好的状态数据输入到动态健康临界值生成、检测和报警模型中,对光伏电站的健康临界值进行动态更新,对光伏电站各发电单元、发电模组及整个电站的状态进行判断,预测可能发生异常的发电单元和异常类型,由系统提醒运维人员及时调整。最后将异常发电单元和周围发电单元的数据序列输入到向量自回归模型中,得到异常发电单元对周围发电单元的影响系数,从而使运维人员及时发现潜在问题。
本发明提供的一种光伏电站的异常检测方法,通过使用序关系分析法得到状态数据的权重,并使用CART算法构建健康临界值生成、检测和报警模型,获取了光伏电站本身的状态数据及所处外界环境的状态数据,得到了光伏电站中的异常发电单元,降低了异常检测系统的误报率,最后通过向量自回归模型中计算出异常发电单元对周围发电单元的影响系数,使运维人员发现光伏电站中的潜在问题。所述光伏电站异常检测方法的数据处理流程图如图2所示。
在上述实施例的基础上,将所述状态数据输入到动态健康临界值生成、检测和报警模型得到新的健康临界值、检测出现异常的发电单元并报警,随后使用向量自回归模型得到异常发电单元对周围发电单元的影响系数,包括:
首先,将光伏电站的外界环境的状态和光伏电站本身的状态数据与光伏电站稳定运行时的状态数据进行对比,并通过序关系分析法确定的状态数据权重计算环境变化的等级,判断环境变化等级是否达到需要重新计算光伏电站健康临界值的要求。
在本发明中,通过对光伏电站的外界环境的状态和光伏电站本身的状态数据的收集,并使用状态数据的权重计算环境变化的等级。若外界环境的变化等级达到预设要求,则将获取到的状态数据交给动态健康临界值生成模型进行处理。
具体的,对光伏电站外界环境的状态数据,如温度、湿度、气压、风速、光照强度、光照时长等;光伏电站本身状态数据,如发电单元的温度、发电速率和累计工作时长等进行收集后,将每一种数据的变化值与状态数据的权重进行计算,判断环境变化的等级。
其中,状态数据的权重计算通过序关系分析法计算得到,该方法不需要构建判断矩阵和一致性检查,可操作性和稳定性强,具体公式为:
wk-1=rkwkk=n,n-1,…,2
其中,wn代表第n项状态数据的权重,n代表状态数据的总数,ri代表第i项状态数据在相邻状态数据之间的相对重要程度。
步骤S31,将光伏电站各发电单元的当前状态数据和外界环境的状态数据输入到动态健康临界值生成模型中,得到当前状态下光伏电站各个发电单元的健康临界值。
具体的,将光伏电站各发电单元的当前状态数据和外界环境的状态数据进行清洗、选择和转换等处理,剔除掉异常数据和无用数据。随后将可用数据输入到动态健康临界值生成模型中,得到当前状态下光伏电站各个发电单元的健康临界值。
步骤S2,将发电单元自身状态及相邻单元的状态数据输入到动态健康临界值检测模型中,判断光伏电站各发电单元、发电模组及整个电站的状态是否超出当前健康临界值,得到可能出现异常的发电单元;
具体的,在健康临界值动态更新后,动态健康临界值检测模型中将会自动运行。其中,将其与发电单元自身状态及相邻单元的状态数据一起输入到动态健康临界值检测模型中,得到发电单元发生异常的概率。随后,对发电单元发生异常的概率求加权平均值,得到发电模组及整个电站的状态。若发生异常的概率超过预设阈值,则将发电单元编号输出给报警系统。
步骤S33,将异常发电单元和周围发电单元的数据序列输入到向量自回归模型中,得到异常发电单元对周围发电单元的影响系数,由系统提醒运维人员及时发现潜在问题。
具体的,在接收到可能发生异常的发电单元编号后,将其编号及数据序列和周围发电单元的数据序列共同输入到向量自回归模型中,得到异常发电单元对周围发电单元的影响系数,若出现数值较大的影响系数,则提醒运维人员对该发电单元进行检查,及时发现其潜在的安全隐患,保证光伏电站的平稳运行。随后,将预测出的数据使用3-Sigma算法和局部异常因子算法进行检测,对预测结果进行进一步的可靠性检测。向量自回归模型的流程图如图3所示。
具体的,第一步,平稳性检验。使用ADF单位根检验方法对所述数据序列进行计算,若不存在单位根,则认为该数据序列是平稳的;若存在单位根,对其进行差分变换,并再次查看差分变换后的数据序列是否平稳。第二步,协整关系检验。协整关系检验的目的是检验各个自变量之间是否存在稳定的因果关系,通过特征根迹检验法计算出所述数据序列的检验表,并判断自变量之间的协整关系。第三步,确定滞后阶数。使用AIC信息准则进行综合判断,取AIC值最小时的p值作为滞后阶数,此时信息保留值最大。第四步,参数估计。使用最小二乘法对确定了滞后阶数的向量自回归模型的参数进行估计,得到向量自回归模型的数学模型。第五步,模型检验。对所述数学模型进行稳定性检验,判断模型是否稳定,随后预测出异常发电单元对周围发电单元的影响系数。
实施例3
在上述实施例的基础上,动态健康临界值生成、检测和报警模型通过以下步骤训练得到:
步骤T1,数据清洗、选择和转换。
具体的,首先通过数据清洗、选择和转换获取光伏电站中可用的高质量状态数据;随后根据CART算法,使用所述状态数据进行训练得到动态健康临界值生成模型;最后,将光伏电站各发电单元的当前状态数据和外界环境的状态数据输入到所述模型中,得到当前状态下光伏电站各个发电单元的健康临界值。
数据清洗即按照预先设定的规则从原始数据中剔除不满足实际需要的业务数据并补充缺失的数据,提高数据的质量,降低模型的训练难度,原始数据主要包含三个部分的内容:测试数据、错误数据和缺失的数据。其中,错误数据主要针对的是重复数据、格式错误的数据和描述错误的数据。
具体的,第一步,去除或补充有缺失的数据。对每个字段进行计算,明确其缺失值的比例,按照缺失的比例和字段的重要性,以业务知识或经验推测进行去除或填充。第二步,将数据的类型与格式和内容进行匹配,以业务知识或经验推测进行去除或修改。第三步,对数据的值和逻辑进行判断,以业务知识或经验推测进行去除或修改。第四步,去除训练模型中不需要的数据类型,保留所需要的状态数据,如温度、湿度、发电单元的温度和发电速率等。第五步,使用工具对数据进行关联性验证,确保数据的完整性。
数据转化即按照预先设定的规则将原始数据转换为不同格式或不同颗粒度的数据。如时间格式,在光伏电站不同的业务系统中可能包含有不同的时间格式,为了方便模型的训练,必须将其转换为统一格式。随后,使用z-score标准化方法将不同量级的数据进行规范化,为模型的训练提供真实可靠的数据。
步骤T2,根据CART算法,得到动态健康临界值生成、检测和报警模型。
具体的,首先将经过数据清洗、选择和转换后的可用数据进行分组,将数据划分为动态健康临界值生成模型数据集、动态健康临界值检测模型数据集和动态健康临界值报警模型数据集。随后,使用CART算法分别构建动态健康临界值生成、检测和报警模型,并使用对应的数据集对构建的模型进行训练。
分类与回归树(Classification And Regression Trees,CART)是一种产生二叉决策树的技术,CART算法流程图如图4所示。其中,信息增益也被用来作为选择最佳分裂属性和标准的度量,在每个子类产生子节点的地方,只产生两个子节点。
CART生成树时使用的属性度量标准是Gini指标(Gini index)。Gini指标用于度量数据划分或训练元组集的不纯度,Gini指标定义为:
其中,pi是D中元组属于Ci类的概率。
当考虑二元分裂时,计算每个结果划分的不纯度的加权和。例如,如果A的二元分裂将D划分成D1和D2,则给定划分的Gini指标为:
Gini(D1)和Gini(D2)分别由Gini指标定义公式得到。对于每个属性,考虑每种可能的二元划分。对于离散值属性,选择该属性生成的最小Gini指标作为分裂子集。对于连续值属性,考虑每个可能的分裂点。
步骤T3,对动态健康临界值生成、检测和报警模型进行迭代验证,直至整个模型的预测准确率达到预设条件,得到最终的模型。
具体的,将数据集中的测试集分别输入训练好的动态健康临界值生成、检测和报警模型中,验证模型的准确率,动态修改测试集和验证集,重复步骤T2,直到整个模型满足预设条件,得到最终的动态健康临界值生成、检测和报警模型。
实施例4
本实施例对本发明提供的光伏电站的异常检测系统进行描述,本实施例描述的光伏电站的异常检测系统与上述实施例描述的光伏电站的异常检测方法可相互对照。
图5为本发明提供的光伏电站的异常检测系统的结构示意图,本发明提供了一种光伏电站的异常检测系统,包括光伏电站数据采集模块、动态健康临界值检测模块和数据可视化模块。其中,光伏电站数据采集模块用于获取光伏电站本身和外界环境的状态数据;动态健康临界值检测模块用于动态更新光伏电站的健康临界值,并通过向量自回归模型得到异常发电单元对周围发电单元的影响系数,随后对出现异常的发电单元和可能存在潜在风险的发电单元进行报警;数据可视化模块用于将所述状态数据和健康临界值的变化展示出来。
在本发明中,光伏电站运行时的温度、湿度、发电单元的温度和发电速率等,通过光伏电站数据采集模块,获取到相应的状态数据,并将所述状态数据作为更新健康临界值的依据输入到动态健康临界值检测模块,以供动态健康临界值检测模块对光伏电站的健康临界值进行动态更新,随后将状态数据和健康临界值输入到数据可视化模块,以供数据可视化模块将所述状态数据和更新后的健康临界值展示给运维人员,其中,可能发生异常和存在潜在风险的发电单元将被特别注明。
本发明提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
需要说明的是,以上实施例仅用于说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了相关描述,但本领域的普通技术人员应当可以理解,并可以在形式上和细节上对其做出各种改变,而不偏离所附权利要求书所限定的本发明的精神和范围。同时,实施例中公知的具体结构及特性等常识在此未作过多描述。最后,本发明要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
Claims (7)
1.一种光伏电站的异常检测方法,其特征在于,包括以下步骤:
步骤101,获取光伏电站本身的状态数据及所处外界环境的状态数据;
步骤102,对光伏电站本身的状态数据及所处外界环境的状态数据进行判断,结合序关系分析法计算的权重确定环境变化等级,在环境变化等级达到要求或工作人员主动触发时,进入步骤103;
步骤103,通过基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型得到新的健康临界值、检测出现异常的发电单元并报警,随后使用向量自回归模型得到异常发电单元对周围发电单元的影响系数;
其中,动态健康临界值生成、检测和报警模型采用CART算法,用于检测发电单元、发电模组及整个电站的异常情况;所述向量自回归模型通过异常发电单元和周围发电单元的数据序列得到异常发电单元对周围发电单元的影响系数。
2.根据权利要求1所述的一种光伏电站的异常检测方法,其特征在于,步骤102中,将光伏电站本身的状态数据及所处外界环境的状态数据与数据对应的权重进行计算,得到环境变化的等级,根据环境变化等级判断是否达到需要重新计算光伏电站健康临界值的要求。
3.根据权利要求1所述的一种光伏电站的异常检测方法,其特征在于,步骤103中,包括以下步骤:
步骤S31,将光伏电站各发电单元的当前状态数据和外界环境的状态数据输入到动态健康临界值生成模型中,得到当前状态下光伏电站各个发电单元的健康临界值;
步骤S32,将发电单元自身状态及相邻单元的状态数据输入到动态健康临界值检测模型中,判断光伏电站各发电单元、发电模组及整个电站的状态是否超出当前健康临界值,得到出现异常的发电单元;
步骤S33,将异常发电单元和周围发电单元的数据序列输入到向量自回归模型中,得到异常发电单元对周围发电单元的影响系数。
4.根据权利要求1所述的一种光伏电站的异常检测方法,其特征在于,所述动态健康临界值生成、检测和报警模型通过以下步骤训练得到:
步骤T1,数据清洗、选择和转换;
步骤T2,根据CART算法,得到动态健康临界值生成、检测和报警模型;
步骤T3,对动态健康临界值生成、检测和报警模型进行迭代验证,直至整个模型的预测准确率达到预设条件,得到最终的模型。
5.根据权利要求1所述的一种光伏电站的异常检测方法,其特征在于,所述向量自回归模型的数据序列包括发电单元的温度、发电速率和累计工作时长。
6.根据权利要求1所述的一种光伏电站的异常检测方法,其特征在于,所述外界环境的状态数据包括温度、湿度、气压、风速、光照强度、光照时长。
7.一种光伏电站的异常检测系统,所述检测系统用于实现权利要求1-6任一项所述的一种光伏电站的异常检测方法,其特征在于,包括:
光伏电站数据采集模块,用于获取光伏电站本身的状态数据及所处外界环境的状态数据,并使用序关系分析法确定的权重确定环境变化等级;
动态健康临界值检测模块,用于将所述光伏电站本身的状态数据及所处外界环境的状态数据输入到基于数据挖掘的光伏电站的动态健康临界值生成、检测和报警模型中,更新光伏电站的健康临界值并检测出出现异常的发电单元并报警,并通过向量自回归模型得到异常发电单元对周围发电单元的影响系数;
数据可视化模块,用于展示状态数据和健康临界值的变化,其中,发生异常和存在潜在风险的发电单元将被特别注明;
其中,动态健康临界值生成、检测和报警模型采用CART算法,用于检测发电单元、发电模组及整个电站的异常情况;所述向量自回归模型通过异常发电单元和周围发电单元的数据序列得到异常发电单元对周围发电单元的影响系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310424266.8A CN116664098A (zh) | 2023-04-19 | 2023-04-19 | 一种光伏电站的异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310424266.8A CN116664098A (zh) | 2023-04-19 | 2023-04-19 | 一种光伏电站的异常检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116664098A true CN116664098A (zh) | 2023-08-29 |
Family
ID=87719644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310424266.8A Pending CN116664098A (zh) | 2023-04-19 | 2023-04-19 | 一种光伏电站的异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116664098A (zh) |
-
2023
- 2023-04-19 CN CN202310424266.8A patent/CN116664098A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN111275288B (zh) | 基于XGBoost的多维数据异常检测方法与装置 | |
CN113156917B (zh) | 基于人工智能的电网设备故障诊断方法及系统 | |
CN111680820B (zh) | 分布式光伏电站故障诊断方法和装置 | |
CN114723285B (zh) | 一种电网设备安全性评估预测方法 | |
CN110362045B (zh) | 一种考虑海洋气象因素的海上双馈风电机组故障判别方法 | |
CN109583520B (zh) | 一种云模型与遗传算法优化支持向量机的状态评估方法 | |
CN111950585A (zh) | 一种基于XGBoost的地下综合管廊安全状况评估方法 | |
CN107807860B (zh) | 一种基于矩阵分解的电力故障分析方法及系统 | |
CN112434390B (zh) | 基于多层网格搜索的pca-lstm轴承剩余寿命预测方法 | |
CN113570138A (zh) | 一种时间卷积网络的设备剩余使用寿命预测方法及装置 | |
KR20190082715A (ko) | 상관도를 고려한 데이터 분류 방법 및 이 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독가능한 저장매체 | |
CN116186624A (zh) | 一种基于人工智能的锅炉评估方法及系统 | |
CN116308304A (zh) | 基于元学习概念漂移检测的新能源智慧运维方法及系统 | |
CN115481726A (zh) | 一种工业机器人整机健康评估方法及系统 | |
CN117394529A (zh) | 基于scada的主配网合环倒供电控制条件辅助决策方法及系统 | |
CN112001511A (zh) | 基于数据挖掘的设备可靠性及动态风险评价方法、系统和设备 | |
CN114091600B (zh) | 一种数据驱动的卫星关联故障传播路径辨识方法及系统 | |
CN114595883A (zh) | 基于元学习的油浸式变压器剩余寿命个性化动态预测方法 | |
CN108446202B (zh) | 一种机房设备的安全状况的判断方法 | |
CN105741184B (zh) | 一种变压器状态评估方法及装置 | |
KR101997580B1 (ko) | 상관도를 고려한 데이터 분류 방법 및 이 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독가능한 저장매체 | |
CN117060353A (zh) | 基于前馈神经网络高压直流输电系统故障诊断方法及系统 | |
CN111612149A (zh) | 一种基于决策树的主网线路状态检测方法、系统及介质 | |
CN116151799A (zh) | 一种基于bp神经网络的配电线路多工况故障率快速评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |