CN114565004A - 一种风电机组功率曲线异常散点剔除方法及装置 - Google Patents

一种风电机组功率曲线异常散点剔除方法及装置 Download PDF

Info

Publication number
CN114565004A
CN114565004A CN202111405970.6A CN202111405970A CN114565004A CN 114565004 A CN114565004 A CN 114565004A CN 202111405970 A CN202111405970 A CN 202111405970A CN 114565004 A CN114565004 A CN 114565004A
Authority
CN
China
Prior art keywords
power
wind speed
data
power curve
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111405970.6A
Other languages
English (en)
Inventor
黄鑫
王琳
刘伟江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Windey Co Ltd
Original Assignee
Zhejiang Windey Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Windey Co Ltd filed Critical Zhejiang Windey Co Ltd
Priority to CN202111405970.6A priority Critical patent/CN114565004A/zh
Publication of CN114565004A publication Critical patent/CN114565004A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Algebra (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了一种风电机组功率曲线异常散点剔除方法,包括以下步骤:步骤S1)获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;步骤S2)按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;步骤S3)基于DBSCAN聚类算法,获得风速‑功率散点的主簇;步骤S4)将满足条件的数据归入主簇,确定主簇为正常数据,剔除其他簇数据;步骤S5)基于RANSAC回归模型,拟合功率曲线;步骤S6)设置功率曲线的散点边界,剔除异常散点。本方案可准确地将异常散点剔除,有利于功率曲线的准确计算及可靠应用。

Description

一种风电机组功率曲线异常散点剔除方法及装置
技术领域
本发明涉及风力发电技术领域,具体涉及一种风电机组功率曲线异常散点剔除方法及装置。
背景技术
风电机组的功率曲线,表征着机组发电性能运行优劣,是机组后续优化、控制、评估工作的关键输入数据。由于结冰、限电、状态码混乱、程序升级等原因,风电机组功率曲线可能存在异常散点,仅通过状态码规则无法完全剔除异常散点,当上述异常散点数据应用在机组性能优化、故障预警与诊断、考核评估时,会给模型带来一定误差。因此,在应用风电机组功率曲线数据时,需要考虑剔除异常散点数据,确保应用结果精确可靠。
目前,被广泛使用的风电机组功率曲线异常散点剔除方法主要是基于表征机组状态的状态码完成。具体的,通过状态码规则筛选得到机组正常发电状态下的风速、功率等数据。然而,机组实际运行时的风速、功率数据,受多种因素影响,状态码规则筛选后仍有离群的分布的散点。时下热门的异常散点剔除方法有基于密度的聚类算法,认为分布于功率曲线上的散点较密集,通过功率曲线散点的分布差异剔除异常散点。由于运行工况的影响,机组功率曲线散点分布并不均匀,当离群散点密集分布,和功率曲线上的散点难以分隔开时,使用聚类算法剔除异常散点的效果将大大下降。
综上所述,如何准确地完全剔除功率曲线异常散点,是目前风电领域技术人员需要解决的技术研究问题。
发明内容
针对现有技术存在的上述不足,本发明的目的在于提供一种风电机组功率曲线异常散点剔除方法及装置,可准确地将异常散点剔除,有利于功率曲线的准确计算及可靠应用。
为了实现上述目的,本发明采用以下技术方案:
一种风电机组功率曲线异常散点剔除方法,包括以下步骤:步骤S1)获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;步骤S2)按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;步骤S3)基于DBSCAN聚类算法,获得风速-功率散点的主簇;步骤S4)将满足条件的数据归入主簇,确定主簇为正常数据,剔除其他簇数据;步骤S5)基于RANSAC回归模型,拟合功率曲线;步骤S6)设置功率曲线的散点边界,剔除异常散点。本发明提供一种风电机组功率曲线异常散点剔除方法,具体过程为:获取目标机组的状态码数据,利用状态码规则初步剔除机组功率曲线异常数据;根据DBSCAN聚类模型,筛选出功率曲线主簇;根据额定风速和额定功率,将额定风速以上达到一定功率的数据归到主簇,剔除其他簇数据,形成新的正常数据集;根据训练好的RANSAC回归模型,拟合功率曲线,设置功率曲线散点边界,剔除异常散点,得到机组功率曲线的正常散点数据。其中,训练RANSAC回归模型的过程,包括获取学习样本,学习样本基于功率分层法提取;设置功率曲线散点边界的过程,包括获取各功率段的风速宽度,根据平均风速宽度设置边界阈值。
由于结冰、限电、状态码混乱、程序升级等原因,风电机组功率曲线存在异常散点,仅通过状态码规则无法完全剔除异常散点。利用基于密度的DBSCAN聚类算法,可以剔除分布较散的功率曲线异常散点,但对于分布较密集的功率曲线异常散点,仍然难以剔除,聚类算法存在一定不足。利用RANSAC回归模型对额定功率前的功率曲线散点拟合成曲线,结合各功率段的风速宽度,设置功率曲线散点边界阈值,可以剔除分布较密集的功率曲线异常散点。在现有技术的基础上,本发明先利用状态码规则进行初步筛选,然后基于DBSCAN聚类算法剔除分布较散的异常散点,再利用RANSAC回归模型拟合功率曲线,剔除分布较密集的异常散点,本方法可以使拟合的功率曲线更精准,使功率曲线具备合理、光滑的形态,有利于后续功率曲线的准确计算及可靠应用。
作为优选,步骤S3的具体过程,包括以下步骤:
步骤S301:设风速-功率散点集合为{(v1,p1),(v2,p2),…,(vn,pn)};
步骤S302:对风速-功率散点集合{(v1,p1),(v2,p2),…,(vn,pn)}进行归一化处理,得到归一化后的风速-功率散点集合
Figure BDA0003372832620000021
步骤S303:将归一化后的风速-功率散点集合
Figure BDA0003372832620000022
输入至DBSCAN聚类模型,获得风速-功率散点的主簇。
作为优选,步骤S4中所述条件为:风速-功率散点(vi,pi)中vi≥v额定且pi≥p额定*0.95。
作为优选,步骤S5的具体过程,包括以下步骤:
步骤S501:采用功率分层法获取风速-功率学习样本,所述学习样本的风速-功率散点中功率低于额定功率;
步骤S502:基于学习样本,训练RANSAC回归模型,以实际功率pi为输入,预测对应的风速v_pri
作为优选,步骤S501的具体过程,包括以下步骤:
步骤S5011:基于T个功率区间{(0,δ),(δ,2δ),…,((T-1)*δ,p额定)},δ表示设置的单位功率长度,将风速-功率散点划分到T个数据集{dataset 1,dataset 2,…,dataset T}中,统计全部数据集的功率四分位点的样本数numf
步骤S5012:计算各数据集的风速宽度di,根据设置的风速宽度阈值∈,获取初始学习样本,具体为:当vi≤∈+vmin时,获取风速-功率散点(vi,pi)为初始学习样本,其中,vmin表示对应数据集内的最小风速;
步骤S5013:基于各数据集总样本数{num 1,num 2,…,num T}与功率四分位点样本数numf,获得最终学习样本,具体为:当num i≤numf时,最终学习样本与初始学习样本保持一致;当num i>numf时,最终学习样本基于初始学习样本等间隔抽样获取。
作为优选,步骤S6中,设置功率曲线散点边界的具体过程为:剔除各数据集内风速宽度di大于风速宽度阈值∈的风速宽度值,计算其余风速宽度的平均值
Figure BDA0003372832620000031
功率曲线散点边界阈值σ设置为:
Figure BDA0003372832620000032
其中,k、h为实际经验参数。
作为优选,步骤S6中,当-σ≤v_pri-vi≤σ,则风速-功率散点(vi,pi)为功率曲线正常散点;当v_pri-vi>σ或v_pri-vi<σ,则风速-功率散点(vi,pi)为功率曲线异常散点。
一种风电机组功率曲线异常散点剔除装置,采用上述的一种风电机组功率曲线异常散点剔除方法,包括:
SCADA数据获取模块,用于获取目标机组的SCADA数据,包括状态码、风速、功率数据;状态码规则筛选模块,用于将所述SCADA数据按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;
DBSCAN聚类模型筛选模块,用于将所述正常发电状态的风速、功率数据输入DBSCAN聚类模型,结合目标机组的额定功率,获得风速-功率散点的主簇;
RANSAC回归模型模块,用于利用所述风速-功率散点的主簇拟合功率曲线;
拟合功率曲线筛选模块,用于利用拟合功率曲线和各功率段的风速宽度,设置目标机组的功率曲线散点边界,剔除边界外的异常散点,获得目标机组的功率曲线正常散点;
所述RANSAC回归模型模块,包括:
学习样本获取单元,用于利用所述风速-功率散点的主簇,基于功率段选取数据作为学习样本;
模型训练单元,用于利用所述学习样本,训练RANSAC回归模型。
一种风电机组功率曲线异常散点剔除方法设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器上计算机程序时,实现上述的一种风电机组功率曲线异常散点剔除方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时,实现上述的一种风电机组功率曲线异常散点剔除方法的步骤。
因此,本发明的优点是:先利用状态码规则进行初步筛选,然后基于DBSCAN聚类算法剔除分布较散的异常散点,再利用RANSAC回归模型拟合功率曲线,剔除分布较密集的异常散点,实现将功率曲线异常散点准确剔除,有利于后续功率曲线的准确计算及可靠应用。
附图说明
图1为本发明实施例中一种风电机组功率曲线异常散点剔除方法的流程图。
图2为本发明实施例中一种风电机组功率曲线异常散点剔除装置的结构示意图。
图3为本发明实施例中一种风电机组功率曲线异常散点剔除设备的结构示意图。
图4为本发明实施例中一种风电机组功率曲线异常散点剔除设备的具体结构示意图。
1、SCADA数据获取模块2、状态码规则筛选模块3、DBSCAN聚类模型筛选模块4、RANSAC回归模型模块41、学习样本获取单元42、模型训练单元5、拟合功率曲线筛选模块6、存储器7、处理器8、系统总线9、电源设备10、计算机程序11、数据12、网络接口13、显示装置14、输入装置15、存储介质16、操作系统。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明做进一步的详细说明。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
如图1所示,一种风电机组功率曲线异常散点剔除方法,包括以下步骤:
步骤1:获取目标机组对应的SCADA数据,其中,SCADA数据包括表征机组状态的状态码、风速和功率;
步骤2:按照状态码规则进行初步筛选,获得机组正常发电状态的风速、功率数据;
步骤3:基于DBSCAN聚类算法,获得风速-功率散点的主簇;
步骤4:将满足vi≥v额定,且pi≥p额定*0.95条件的数据归到主簇,剔除其他簇数据,确定主簇为正常数据;
步骤5:基于RANSAC回归模型,拟合功率曲线,设置功率曲线的散点边界,剔除异常散点,获得机组功率曲线正常散点。
步骤3中利用DBSCAN聚类算法,确定风速-功率散点主簇,包括:
设风速-功率散点集合为{(v1,p1),(v2,p2),…,(vn,pn)},对数据进行归一化处理,得到归一化后的风速-功率散点集合
Figure BDA0003372832620000051
输入DBSCAN聚类模型,得到风速-功率散点的主簇。
DBSCAN聚类算法的具体步骤如下:
步骤3.1:确定半径参数r、最少点参数MinPts,其中,半径参数r为风速-功率散点周围邻近区域的半径,散点半径r内的区域称为r邻域;最少点参数MinPts为r邻域内包含的散点数目最小值;
步骤3.2:随机选择一个风速-功率散点作为起始点,计算其r邻域内的散点数目;
步骤3.3:该散点的r邻域内,当风速-功率散点数目大于等于最少点参数MinPts,则该对象为核心点,分配一个簇标签
Figure BDA0003372832620000052
当风速-功率散点数目小于最少点参数MinPts,则该对象为噪声点;
步骤3.4:访问该散点r邻域内的所有邻居散点,当被访问散点没有簇标签,则分配簇标签
Figure BDA0003372832620000053
当被访问散点为核心点,则依次访问被访问核心点的邻居散点,直至被访问散点的r邻域内无核心点;
步骤3.5:选择未被访问的风速-功率散点作为新起始点,重复步骤3.2至步骤3.4,直至所有风速-功率散点都被分配簇标签,选择包含风速-功率散点最多的簇作为主簇。
步骤5中利用RANSAC回归模型拟合功率曲线,包括:
基于获取的学习样本数据,训练RANSAC回归模型,以实际功率pi为输入,预测对应的风速v_pri
RANSAC模型拟合功率曲线的具体步骤如下:
步骤5.1:从学习样本中随机选取x个数据,拟合出可能符合要求的模型H(p);
步骤5.2:基于模型H(p)拟合的曲线,统计与曲线的欧式距离在误差[-τ,τ]范围内的数据集合M;
步骤5.3:设x个数据、数据集合M共包含m个数据,设模型至少需要数据n个,当m>n时,则基于随机选取的x个数据、数据集合M,重新拟合符合要求的模型H′(p);当m<n时,则返回步骤5.1;
步骤5.4:基于模型H′(p)拟合的曲线,计算选择的x个数据、数据集合M与曲线的容错误差μ,设历史最优容错误差为μopt,历史最优模型为Hopt(p),当μ<μopt,则μopt=μ,Hopt(p)=H′(p);当μ>μopt,则返回步骤5.1,直至达到给定迭代次数S。
步骤5中利用RANSAC回归模型拟合功率曲线,还包括:
利用功率分层法获取风速、功率学习样本,且学习样本仅考虑低于额定功率的风速-功率散点。
利用功率分层法获取学习样本的具体步骤如下:
1)基于T个相等的功率区间{[0,δ],(δ,2δ],…,((T-1)*δ,p额定)},δ是设置的单位功率长度,将风速-功率散点划分到T个数据集{dataset 1,dataset 2,…,dataset T}中,统计全部数据集的功率四分位点的样本数numf
2)计算各数据集的风速宽度di,根据设置的风速宽度阈值∈,获取初始学习样本,具体的:当vi≤∈+vmin,获取风速-功率散点(vi,pi)为初始学习样本,其中,vmin为该数据集内的最小风速;
3)基于各数据集总样本数{num 1,num 2,…,num T}与功率四分位点样本数numf,获得最终学习样本,具体的:当num i≤numf,最终学习样本与初始学习样本保持一致;当num i>numf,最终学习样本基于初始学习样本等间隔抽样获取。
步骤5中RANSAC回归模型拟合的功率曲线散点边界,计算过程如下:
剔除各数据集内的风速宽度di大于风速宽度阈值∈的风速宽度值,计算其余风速宽度的平均值
Figure BDA0003372832620000061
功率曲线散点边界阈值σ设置为:
Figure BDA0003372832620000062
其中,k、h为实际经验参数。
步骤5中目标机组功率曲线正常散点数据获取过程如下:
当-σ≤v_pri-vi≤σ,则风速-功率散点(vi,pi)为功率曲线正常散点数据;当v_pri-vi>σ或v_pri-vi<σ,则风速-功率散点(vi,pi)为功率曲线异常散点数据。
实施例二:
如图2所示,一种风电机组功率曲线异常散点剔除装置,包括:
SCADA数据获取模块1,用于获取目标机组的SCADA数据,包括状态码、风速、功率数据;状态码规则筛选模块2,用于将SCADA数据根据状态码规则筛选,获得目标机组正常发电状态的风速、功率数据;
DBSCAN聚类模型筛选模块3,用于将正常发电状态的风速、功率数据输入DBSCAN聚类模型,结合目标机组的额定功率,获得风速-功率散点的主簇;
RANSAC回归模型模块4,用于利用风速-功率散点的主簇拟合功率曲线,包括:
学习样本获取单元41,用于利用风速-功率散点的主簇,基于功率段选取适量数据作为学习样本;
模型训练单元42,用于利用学习样本,训练RANSAC回归模型;
拟合功率曲线筛选模块5,用于利用RANSAC回归模型拟合功率曲线和各功率段的风速宽度,设置目标机组的功率曲线散点边界,剔除边界外的异常散点数据,获得目标机组的功率曲线正常散点数据。
本实施例提供的风电机组功率曲线异常散点剔除装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
实施例三:
如图3所示,一种风电机组功率曲线异常散点剔除设备,包括:
存储器6,用于存储计算机程序;
处理器7,用于执行存储器6上计算机程序时,实现上述风电机组功率曲线异常散点剔除方法的步骤。
具体的,如图4所示,一种风电机组功率曲线异常散点剔除设备,包括通过系统总线8连接的电源设备9、处理器7、存储器6、网络接口12、显示装置13、输入装置14和存储介质15。其中,处理器7用于提供计算和控制能力。存储介质15存有操作系统16、计算机程序10和数据11。存储器6为存储介质15中的操作系统16、计算机程序10提供运行环境。网络接口12可以是无线或有线网络接口,用于网络连接通信。显示装置13可以是各类显示器,包括LCD显示器、CRT显示器、LED显示器等。输入装置14可以是键盘、鼠标、显示屏的触摸层等。
上文所描述的风电机组功率曲线异常散点剔除方法中的步骤可以由风电机组功率曲线异常散点剔除设备的结构实现。
实施例四:
一种可读存储介质,可读存储介质上存储有计算机程序指令,计算机程序被处理器7执行时,实现上述风电机组功率曲线异常散点剔除方法的步骤。该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种程序代码的可读存储介质。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (10)

1.一种风电机组功率曲线异常散点剔除方法,其特征在于,包括以下步骤:
步骤S1:获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;
步骤S2:按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;
步骤S3:基于DBSCAN聚类算法,获得风速-功率散点的主簇;
步骤S4:将满足条件的数据归入主簇,确定主簇为正常数据,剔除其他簇数据;
步骤S5:基于RANSAC回归模型,拟合功率曲线;
步骤S6:设置功率曲线的散点边界,剔除异常散点。
2.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S3的具体过程,包括以下步骤:
步骤S301:设风速-功率散点集合为{(v1,p1),(v2,p2),…,(vn,pn)};
步骤S302:对风速-功率散点集合{(v1,p1),(v2,p2),…,(vn,pn)}进行归一化处理,得到归一化后的风速-功率散点集合
Figure FDA0003372832610000011
步骤S303:将归一化后的风速-功率散点集合
Figure FDA0003372832610000012
输入至DBSCAN聚类模型,获得风速-功率散点的主簇。
3.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S4中所述条件为:风速-功率散点(vi,pi)中vi≥v额定且pi≥p额定*0.95。
4.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S5的具体过程,包括以下步骤:
步骤S501:采用功率分层法获取风速-功率学习样本,所述学习样本的风速-功率散点中功率低于额定功率;
步骤S502:基于学习样本,训练RANSAC回归模型,以实际功率pi为输入,预测对应的风速v_pri
5.根据权利要求4所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S501的具体过程,包括以下步骤:
步骤S5011:基于T个功率区间{(0,δ),(δ,2δ),…,((T-1)*δ,p额定)},δ表示设置的单位功率长度,将风速-功率散点划分到T个数据集{dataset 1,dataset 2,…,dataset T}中,统计全部数据集的功率四分位点的样本数numf
步骤S5012:计算各数据集的风速宽度di,根据设置的风速宽度阈值∈,获取初始学习样本,具体为:当vi≤∈+vmin时,获取风速-功率散点(vi,pi)为初始学习样本,其中,vmin表示对应数据集内的最小风速;
步骤S5013:基于各数据集总样本数{num 1,num 2,…,num T}与功率四分位点样本数numf,获得最终学习样本,具体为:当num i≤numf时,最终学习样本与初始学习样本保持一致;当num i>numf时,最终学习样本基于初始学习样本等间隔抽样获取。
6.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S6中,设置功率曲线散点边界的具体过程为:剔除各数据集内风速宽度di大于风速宽度阈值∈的风速宽度值,计算其余风速宽度的平均值
Figure FDA0003372832610000021
功率曲线散点边界阈值σ设置为:
Figure FDA0003372832610000022
其中,k、h为实际经验参数。
7.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S6中,当-σ≤v_pri-vi≤σ,则风速-功率散点(vi,pi)为功率曲线正常散点;当v_pri-vi>σ或v_pri-vi<σ,则风速-功率散点(vi,pi)为功率曲线异常散点。
8.一种风电机组功率曲线异常散点剔除装置,采用如权利要求1-7任一项所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,包括:
SCADA数据获取模块,用于获取目标机组的SCADA数据,包括状态码、风速、功率数据;
状态码规则筛选模块,用于将所述SCADA数据按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;
DBSCAN聚类模型筛选模块,用于将所述正常发电状态的风速、功率数据输入DBSCAN聚类模型,结合目标机组的额定功率,获得风速-功率散点的主簇;
RANSAC回归模型模块,用于利用所述风速-功率散点的主簇拟合功率曲线;
拟合功率曲线筛选模块,用于利用拟合功率曲线和各功率段的风速宽度,设置目标机组的功率曲线散点边界,剔除边界外的异常散点,获得目标机组的功率曲线正常散点;
所述RANSAC回归模型模块,包括:
学习样本获取单元,用于利用所述风速-功率散点的主簇,基于功率段选取数据作为学习样本;
模型训练单元,用于利用所述学习样本,训练RANSAC回归模型。
9.一种风电机组功率曲线异常散点剔除方法设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器上计算机程序时,实现如权利要求1-7任一项所述的一种风电机组功率曲线异常散点剔除方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时,实现如权利要求1-7任一项所述的一种风电机组功率曲线异常散点剔除方法的步骤。
CN202111405970.6A 2021-11-24 2021-11-24 一种风电机组功率曲线异常散点剔除方法及装置 Pending CN114565004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111405970.6A CN114565004A (zh) 2021-11-24 2021-11-24 一种风电机组功率曲线异常散点剔除方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111405970.6A CN114565004A (zh) 2021-11-24 2021-11-24 一种风电机组功率曲线异常散点剔除方法及装置

Publications (1)

Publication Number Publication Date
CN114565004A true CN114565004A (zh) 2022-05-31

Family

ID=81711893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111405970.6A Pending CN114565004A (zh) 2021-11-24 2021-11-24 一种风电机组功率曲线异常散点剔除方法及装置

Country Status (1)

Country Link
CN (1) CN114565004A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115478991A (zh) * 2022-09-21 2022-12-16 中节能风力发电股份有限公司 风电机组功率曲线形态异常的检测方法、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115478991A (zh) * 2022-09-21 2022-12-16 中节能风力发电股份有限公司 风电机组功率曲线形态异常的检测方法、设备及介质

Similar Documents

Publication Publication Date Title
CN110188397B (zh) 一种架空输电线路覆冰预测模型和方法
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN112449696B (zh) 时序数据诊断装置、追加学习方法及程序
CN112308281A (zh) 一种温度信息预测方法及装置
JP6172317B2 (ja) 混合モデル選択の方法及び装置
CN114298175A (zh) 基于边缘计算的电力设备状态监测与故障预警方法及系统
US20200285807A1 (en) Complex system anomaly detection based on discrete event sequences
CN112560997A (zh) 故障识别模型训练方法、故障识别方法及相关装置
CN114399321A (zh) 一种业务系统稳定性分析方法、装置和设备
CN111638988A (zh) 一种基于深度学习的云主机故障智能预测方法
CN114565004A (zh) 一种风电机组功率曲线异常散点剔除方法及装置
CN105183659A (zh) 基于多级模式预测的软件系统行为异常检测方法
CN113987027A (zh) 一种基于故障预测的设备状态确定方法、装置及介质
CN113092083A (zh) 一种基于分形维数和神经网络的机泵故障诊断方法和装置
Kai et al. Notice of Retraction: A Novel Forecasting Model of Fuzzy Time Series Based on K-means Clustering
CN116957361A (zh) 一种基于虚实结合的船舶任务系统健康状态检测方法
CN113408816B (zh) 一种基于深度神经网络的电网灾情评估方法
CN115841580A (zh) 一种基于标记分布的轴承剩余使用寿命预测方法
CN115018359A (zh) 一种防雷策略确定方法、装置、设备以及存储介质
CN114363004A (zh) 风险评估方法、装置、计算机设备和存储介质
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
CN110555543B (zh) 一种风电场预测的不确定度分析方法及系统
CN117131947B (zh) 架空输电线路故障预测方法、装置、设备及存储介质
CN116109211B (zh) 基于设备数字化的设备运行水平分析方法及装置
US20240201680A1 (en) Systems and methods for displaying renewable energy asset health risk information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination