CN110083804A - 基于条件分布回归的风电场scada数据缺失的智能修复方法 - Google Patents
基于条件分布回归的风电场scada数据缺失的智能修复方法 Download PDFInfo
- Publication number
- CN110083804A CN110083804A CN201910333754.1A CN201910333754A CN110083804A CN 110083804 A CN110083804 A CN 110083804A CN 201910333754 A CN201910333754 A CN 201910333754A CN 110083804 A CN110083804 A CN 110083804A
- Authority
- CN
- China
- Prior art keywords
- data
- condition
- point
- repaired
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括以下步骤:选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;建立散点图;去除散点图中采样点的异常点;计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;对于所有选出的代表点,将相邻的代表点进行线性插补;然后根据线性插补后X‑Y的函数关系进行映射。本发明解决了现有方法修复精度低,计算量较大的问题。
Description
技术领域
本发明涉及大数据处理领域,尤其是一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法。
背景技术
风电场在复杂且恶劣的工作环境下,保持风电机组高性能运行是一项相对困难的工作。风电机组SCADA(远程数据监控系统)数据被广泛应用于机组运行状态分析研究中,其包含了风电机组组件运行状态的综合信息,SCADA能够远程获取风机运行状态数据,是风电场健康运行的保障。但是SCADA系统运行过程中,经常会遇到由于计算机硬件故障、软件错误、病毒、人为误操作等原因造成SCADA数据缺失或损坏。因此,为挽回由于数据缺失带来的损失,寻求一种通过大数据分析,利用已知数据对缺失部分数据进行估计的方法,是风电场运行维护人员需要解决的一个问题。
在已发表的风电场实测数据缺失相关的文献中,修复缺失数据常采用预测和插补的方法。对于风速和风电功率的预测,传统方法主要包括基于自回归滑动平均模型的时间序列预测、多层前馈神经网络预测和组合预测等。WSWP概率预测方法的局限性在于函数关系式与实际结合不紧密,理论的公式应用到实际需要在初始模型的基础上添加适量的修正因子。虽然使用神经网络可以自动找出修正参数,但是神经网络会存在过拟合的问题,会对于异常数据分布进行误判,从而无法确保结果的准确性。除此之外,这些修正因子的权重根据历史统计结果获得,但是由于风速本身具有强烈的间歇性与波动性,此种预测方式误差较大的问题始终难以克服。
发明内容
本发明的目的在于克服现有技术中存在的不足,提供一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,能够对SCADA缺失数据进行修复,解决了现有方法修复精度低,计算量较大的问题。本发明采用的技术方案是:
一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括以下步骤:
步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;条件数据X是完整的数据;
然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,散点图中,每一对条件数据和待修复数据确定一个采样点;
步骤S2,去除散点图中采样点的异常点;
步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;
步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;
步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;
然后根据线性插补后X-Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。
进一步地,步骤S2中,使用3σ法则去除异常点;包括:
a)计算条件数据X的标准差σ;
b)每一个采样点横坐标xi与均值的差的绝对值与3倍标准差σ比较,若大于3倍标准差则剔除;
c)重复步骤b)直到此次循环无任何剔除。
进一步地,步骤S4具体包括:
对于各段数据,进行如下处理:
将一段数据中的待修复数据Y从小到大排列,选取该段中待修复数据Y的两个十分位点,若两个十分位点之差与该段数据中Y中位数的比值大于设定阈值,则认为分散,否则为集中;
若为集中,则将该段数据中Y中位数对应的采样点作为该段的代表点;若为分散,则舍弃该段数据。
本发明的优点在于:本发明通过修复缺失数据,能够更准确的对风机异常情况进行预警,对系统运行稳定和设备备用安排具有实际价值,同时也有助于更准确的估计发电量,辅助决策者制定发展战略,提高企业经济效益。
附图说明
图1为本发明的方法流程图。
图2为本发明的散点图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
本发明提出一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括如下步骤:
步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;X与Y需要是相关的,例如,速度与加速度;待修复数据Y是可能存在缺失情况的数据;条件数据X是完整的数据;
然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,如图2所示,散点图中,每一对条件数据和待修复数据确定一个采样点;图2中的小圆点表示各采样点;
步骤S2,去除散点图中采样点的异常点;
例如,使用3σ法则去除异常点;
a)计算条件数据X的标准差σ;
b)每一个采样点横坐标xi与均值的差的绝对值与3倍标准差σ比较,若大于3倍标准差则剔除;
c)重复步骤b)直到此次循环无任何剔除;
步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;此处数据应理解为X与Y,因为将X等分成80段,同时Y也相应等分为80段;
步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;
对于各段数据,进行如下处理:
将一段数据中的待修复数据Y从小到大排列,选取该段中待修复数据Y的两个十分位点,若两个十分位点之差与该段数据中Y中位数的比值大于设定阈值,则认为分散,否则为集中;
若为集中,则将该段数据中Y中位数对应的采样点作为该段的代表点;若为分散,则舍弃该段数据;
图2中的小三角表示选出的代表点;
步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;
进行线性插补时,相邻的代表点用直线段连接,各条直线段所连成的整条线段就反应了X-Y的函数关系;
然后根据线性插补后X-Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。
本发明提出的方法与传统的确定性预测方法相比,克服了因风速的间歇性与波动性而导致的误差大的缺点,与神经网络预测法相比,具有更高的计算效率。通过修复缺失数据,能够更准确的对风机异常情况进行预警,对系统的稳定运行和设备的备用安排都有实际价值,同时也有助于更准确的估计发电量,辅助决策者制定发展战略,提高企业经济效益。
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,其特征在于,包括以下步骤:
步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;条件数据X是完整的数据;
然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,散点图中,每一对条件数据和待修复数据确定一个采样点;
步骤S2,去除散点图中采样点的异常点;
步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;
步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;
步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;
然后根据线性插补后X-Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。
2.如权利要求1所述的基于条件分布回归的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S2中,使用3σ法则去除异常点;包括:
a)计算条件数据X的标准差σ;
b)每一个采样点横坐标xi与均值的差的绝对值与3倍标准差σ比较,若大于3倍标准差则剔除;
c)重复步骤b)直到此次循环无任何剔除。
3.如权利要求1所述的基于条件分布回归的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S4具体包括:
对于各段数据,进行如下处理:
将一段数据中的待修复数据Y从小到大排列,选取该段中待修复数据Y的两个十分位点,若两个十分位点之差与该段数据中Y中位数的比值大于设定阈值,则认为分散,否则为集中;
若为集中,则将该段数据中Y中位数对应的采样点作为该段的代表点;若为分散,则舍弃该段数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910333754.1A CN110083804B (zh) | 2019-04-24 | 2019-04-24 | 基于条件分布回归的风电场scada数据缺失的智能修复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910333754.1A CN110083804B (zh) | 2019-04-24 | 2019-04-24 | 基于条件分布回归的风电场scada数据缺失的智能修复方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110083804A true CN110083804A (zh) | 2019-08-02 |
CN110083804B CN110083804B (zh) | 2022-10-28 |
Family
ID=67416506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910333754.1A Active CN110083804B (zh) | 2019-04-24 | 2019-04-24 | 基于条件分布回归的风电场scada数据缺失的智能修复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110083804B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784373A (zh) * | 2021-01-19 | 2021-05-11 | 河北大学 | 一种风电机组齿轮箱的故障预警方法 |
CN118445556A (zh) * | 2024-07-08 | 2024-08-06 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014201849A1 (zh) * | 2013-06-18 | 2014-12-24 | 国网辽宁省电力有限公司电力科学研究院 | 配有储能电站的分散式风电场有功优化调控方法 |
CN106570790A (zh) * | 2016-11-10 | 2017-04-19 | 甘肃省电力公司风电技术中心 | 一种计及风速数据分段特性的风电场出力数据修复方法 |
-
2019
- 2019-04-24 CN CN201910333754.1A patent/CN110083804B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014201849A1 (zh) * | 2013-06-18 | 2014-12-24 | 国网辽宁省电力有限公司电力科学研究院 | 配有储能电站的分散式风电场有功优化调控方法 |
CN106570790A (zh) * | 2016-11-10 | 2017-04-19 | 甘肃省电力公司风电技术中心 | 一种计及风速数据分段特性的风电场出力数据修复方法 |
Non-Patent Citations (1)
Title |
---|
陈伟等: "风电机组异常数据预处理的分类多模型算法", 《电力系统及其自动化学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784373A (zh) * | 2021-01-19 | 2021-05-11 | 河北大学 | 一种风电机组齿轮箱的故障预警方法 |
CN112784373B (zh) * | 2021-01-19 | 2022-03-01 | 河北大学 | 一种风电机组齿轮箱的故障预警方法 |
CN118445556A (zh) * | 2024-07-08 | 2024-08-06 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
CN118445556B (zh) * | 2024-07-08 | 2024-09-13 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110083804B (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Estimation methods review and analysis of offshore extreme wind speeds and wind energy resources | |
CN109145957B (zh) | 基于大数据的配电网异常指标的识别与处理方法及装置 | |
CN110569867A (zh) | 基于决策树算法的输电线路故障原因判别方法、介质及设备 | |
CN103401236B (zh) | 一种基于风电场流动相关性的风电场机组分组方法 | |
CN109190283A (zh) | 一种考虑高湍流自由来流效应的风力机翼型气动优化方法 | |
CN107341349A (zh) | 风机健康评估的方法、系统、存储器及控制器 | |
CN109492777A (zh) | 一种基于机器学习算法平台的风电机组健康管理方法 | |
CN106777984A (zh) | 一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法 | |
CN105894177A (zh) | 一种基于决策树算法的电力设备运行风险分析评估方法 | |
CN105005878B (zh) | 一种坚强智能电网的综合评估方法 | |
CN107844917A (zh) | 一种基于大数据的企业生命周期分析方法和系统 | |
CN107453354B (zh) | 一种配电网的薄弱环节识别方法 | |
CN108011367A (zh) | 一种基于深度决策树算法的电力负荷特性挖掘方法 | |
CN110083804A (zh) | 基于条件分布回归的风电场scada数据缺失的智能修复方法 | |
CN110412966A (zh) | 监测变桨电机温度异常的方法和装置 | |
CN114997745B (zh) | 一种基于深度特征提取的光伏故障诊断溯源方法 | |
CN115293383A (zh) | 融合博弈论的变压器风险致因分析方法 | |
CN109236589B (zh) | 一种用于评估风机叶片除冰投资方案的方法及装置 | |
CN110489852A (zh) | 提高风电系统数据质量的方法及装置 | |
CN114781662A (zh) | 一种基于深度学习的故障线路复电知识推理方法 | |
CN109802634A (zh) | 一种基于大数据的光伏电站的智能运维方法及运维系统 | |
CN111814394B (zh) | 一种基于相关性和冗余性检测的电力系统安全评估方法 | |
CN110273818B (zh) | 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法 | |
CN116301652A (zh) | 一种风电机组在线监测历史数据冷热分离系统 | |
Bao et al. | Iterative modeling of wind turbine power curve based on least‐square B‐spline approximation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |