CN110058971A - 风电场scada数据缺失的智能修复方法 - Google Patents
风电场scada数据缺失的智能修复方法 Download PDFInfo
- Publication number
- CN110058971A CN110058971A CN201910333761.1A CN201910333761A CN110058971A CN 110058971 A CN110058971 A CN 110058971A CN 201910333761 A CN201910333761 A CN 201910333761A CN 110058971 A CN110058971 A CN 110058971A
- Authority
- CN
- China
- Prior art keywords
- data
- unit data
- auxiliary
- missing
- repaired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000008439 repair process Effects 0.000 claims abstract description 59
- 238000001914 filtration Methods 0.000 claims abstract description 4
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种风电场SCADA数据缺失的智能修复方法,包括以下步骤:对于待修复机组数据a,选出相应的多列辅助修复机组数据B;选择辅助修复机组数据B中与a相关性最大的多列辅助修复机组数据C;判断待修复机组数据a和所述多列辅助修复机组数据C的方差差异,若超过设定阈值则对a和C进行标准化;对C进行基线补偿;对于以上步骤得到的辅助修复机组数据C,选择C中与待修复机组数据a平均绝对误差最小的多列机组数据D;对上述多列机组数据D进行组编筛选,得到最接近均值的多列机组数据D′;对多列机组数据D′进行中值滤波;对多列机组数据D′求每个时刻的均值。本发明能高效准确地对缺失数据进行智能修复,且效率高,鲁棒性强。
Description
技术领域
本发明涉及工业大数据领域,尤其是一种风电场SCADA数据缺失的智能修复方法。
背景技术
风能作为一种清洁的可再生能源,已经日益引起世界各国的注意,风力发电技术已趋于成熟。在大型的风电场中有几十台甚至上百台风力发电机组。由于风电场(尤其海上风电场)地处偏远,人工维护困难,风电场SCADA数据库系统运行过程中,SCADA能够远程获取风机运行状态数据,是风电场健康运行的保障。但是SCADA系统往往受到传感器失效、网络阻塞等各种因素的影响,导致数据的缺失。因此,为挽回由于数据缺失带来的损失,一种通过大数据分析,利用已知数据对缺失部分数据进行估计的方法显得尤为重要。
在已发表的风电场实测数据缺失相关的文献中,修复缺失数据主要方法有两种:一是采用时间序列法对风场风速数据进行预测和插补的方法,二是被广泛应用的机器学习KNN算法。前者是一种基于时间序列模型,充分利用缺失段前、后的有效实测数据,综合采用顺插和逆插方式插补出数据缺失段的方法。然而,基于时间序列的数据插补法,没有过多地考虑外界因素影响,当外界发生较大变化时,比如季节更替、天气变化,修复的数据往往会有较大偏差。而KNN方法最吸引人的特点之一在于,它易于理解也易于实现。其非参数的特性在遇到某些“不寻常”数据的情况下非常有优势。但KNN算法的一个明显缺点是,在分析大型数据集时会变得非常耗时,因为它会在整个数据集中搜索距离最小点。此外,在高维数据集中,最近与最远点之间的差别非常小,因此KNN的准确性会降低。
发明内容
本发明的目的在于克服现有技术中存在的不足,提供一种风电场SCADA数据缺失的智能修复方法,能够对风机SCADA缺失数据进行修复,解决了现有方法修复精度低,计算量较大的问题。通过修复缺失数据,能够更准确的对风机异常情况进行预警,同时也有助于更准确的估计发电量。本发明采用的技术方案是:
一种风电场SCADA数据缺失的智能修复方法,包括以下步骤:
步骤S1,数据预处理:对于待修复机组数据a,选出相应的多列辅助修复机组数据B;
步骤S2,计算辅助修复机组数据B与待修复机组数据a的互相关系数,选择辅助修复机组数据B中与a相关性最大的多列辅助修复机组数据C;
步骤S3,判断待修复机组数据a和所述多列辅助修复机组数据C的方差差异,若超过设定阈值则需要对待修复机组数据a和所有辅助修复机组数据C进行标准化,否则不需要进行标准化;
步骤S4,根据待修复机组数据a和辅助修复机组数据C的补偿基准,对C进行基线补偿;
步骤S5,若步骤S3中进行过标准化,则对待修复机组数据a和基线补偿后的辅助修复机组数据C反标准化还原;否则不需要反标准化还原;
步骤S6,对于以上步骤得到的辅助修复机组数据C,选择C中与待修复机组数据a平均绝对误差最小的多列机组数据D;
步骤S7,对上述多列机组数据D进行组编筛选,得到最接近均值的多列机组数据D′;
步骤S8,对多列机组数据D′进行中值滤波;
步骤S9,对多列机组数据D′求每个时刻的均值,然后得到一列用于对待修复机组数据a进行修复的机组数据。
进一步地,步骤S1中,对采集的机组数据需要进行数据结构转换,数据结构转换方法为:将不同机组采集的同类传感器数据进行整合,相近的多个时刻融合成一个时刻。
进一步地,步骤S2中,选择与a相关性最大的多列辅助修复机组数据C的具体方法为:
对传感器采集的机组数据进行不同步数的移位从而抵消相位差,之后选择互相关系数最大的多列辅助修复机组数据C;
互相关系数计算公式如下:
其中,Rτ为互相关系数,τ为移位步数,X,Y分别为两列机组数据,μX,μY分别为两列机组数据的均值,σX,σY分别为两列机组数据的标准差。
进一步地,步骤S4中,将待修复机组数据a缺失段的两端作为a的补偿基准;将各辅助修复机组数据C中与a缺失段所对应数据段的两端,作为C的补偿基准;
对于机组数据缓慢变化的情况,计算待修复机组数据a缺失段的两端邻近点与辅助修复机组数据C与a缺失段对应段两端邻近点之差,对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿;
邻近点选取方法:对于a缺失段即需要修复的数据段呈上升趋势,则选取a缺失段前端若干数据点中的最大值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最大值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点中的最小值作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最小值,作为C与a缺失段对应段后端的邻近点;
对于a缺失段即需要修复的数据段呈下降趋势,则选取a缺失段前端若干数据点中的最小值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最小值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点中的最大值,作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最大值作为C与a缺失段对应段后端的邻近点;
对于机组数据非缓慢变化的情况,分别对a缺失段两端各取若干数据点、C与a缺失段对应段两端各取若干数据点求均值,计算两者均值差,对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿。
进一步地,步骤S6中,具体包括:求出待修复机组数据a缺失段前后各若干数据点与辅助修复机组数据C中相应数据点的平均绝对误差,选取误差最小的多列机组数据D。
进一步地,步骤S7具体为:对各列机组数据D每个时刻的数据进行排序,然后对排序后的数据按列重新组编成机组数据,对重新组编后的机组数据,去除其中的最小值列和最大值列,得到最接近均值的多列机组数据D′。
本发明的优点:本发明提供的方法与定量预测和插补方法相比,有更高的准确度;与时间序列分析方法相比,不易受外界因素影响;与KNN算法相比,具有更高的计算效率。本发明能高效准确地对缺失数据进行智能修复,且效率高,鲁棒性强;通过修复缺失数据,能够对风机机组异常情况进行预警,同时有助于更准确的估计发电量,辅助决策者制定发展战略,提高经济效益。
附图说明
图1为本发明的流程图。
图2为本发明的待修复机组数据a和与a相关性最大的多列辅助修复机组数据C的图形示意图。
图3为本发明的机组数据D进行组编筛选示意图。
图4为本发明的数据修复后的效果图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
一种风电场SCADA数据缺失的智能修复方法,包括以下步骤:
步骤S1,数据预处理:对于待修复机组数据a,选出相应的多列辅助修复机组数据B;
一个风电场包含多个风机机组,每个机组包含多个传感器信号,由于同一风场的多个机组地理位置相近,因此机组间同类传感器采集的多个信号存在关联,称为横向相关,为了利用横向相关性对数据进行修复,需要先将数据转换成恰当的结构;
不同机组采集信号的时间不同步,影响机组间相关性挖掘;为解决这一问题,需进行数据结构转换,将多个相近的时刻融合成一个时刻,从而将多机组的同类传感器数据合并成一张表,行标题为机组序号,列标题为时间;从而解决了由于采集时刻的不同,无法将多机组数据整合成一张表的问题。表1中第一列机组数据示意性的表示为待修复机组数据,实际缺失的数据可能有数百个,示意性地显示10个缺失数据;表1中其余列均为辅助修复机组数据,已经剔除了其它大量连续缺失数据的机组,即不适合辅助修复的机组的数据;
time | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
0 | 405.37 | 405.02 | 403.99 | 404.33 | 403.99 | 404.16 | 403.64 | 404.68 |
1 | 405.02 | 405.02 | 403.99 | 403.64 | 403.82 | 403.99 | 403.64 | 404.68 |
2 | 404.51 | 404.85 | 403.99 | 403.3 | 403.64 | 403.99 | 403.64 | 404.51 |
3 | 405.2 | 404.51 | 403.99 | 403.82 | 403.99 | 404.16 | 403.64 | 404.51 |
4 | 405.2 | 404.51 | 404.51 | 403.82 | 404.33 | 404.51 | 403.64 | 404.85 |
5 | 404.68 | 404.51 | 404.16 | 403.64 | 403.64 | 404.16 | 404.16 | 404.85 |
6 | 404.68 | 404.51 | 404.16 | 403.82 | 404.16 | 403.99 | 403.3 | 404.16 |
7 | 404.33 | 404.68 | 404.16 | 403.82 | 403.99 | 403.64 | 403.3 | 404.51 |
8 | 404.16 | 403.99 | 403.64 | 404.16 | 403.99 | 404.33 | 403.64 | 404.85 |
9 | 404.68 | 404.16 | 404.16 | 403.99 | 404.51 | 404.33 | 403.64 | 404.16 |
10 | 404.68 | 404.16 | 403.64 | 404.33 | 404.16 | 403.99 | 404.16 | |
11 | 403.82 | 403.64 | 403.82 | 403.99 | 403.64 | 404.16 | 403.99 | |
12 | 403.99 | 404.51 | 404.16 | 404.16 | 403.99 | 403.64 | 404.16 | |
13 | 403.64 | 404.33 | 403.3 | 404.16 | 403.64 | 403.64 | 404.33 | |
14 | 404.33 | 403.64 | 403.64 | 403.64 | 403.3 | 403.64 | 404.51 | |
15 | 404.51 | 404.33 | 404.16 | 403.99 | 403.82 | 404.33 | 404.16 | |
16 | 403.99 | 403.82 | 403.64 | 404.16 | 404.33 | 403.82 | 404.33 | |
17 | 403.64 | 403.3 | 403.64 | 403.99 | 403.99 | 403.47 | 403.64 | |
18 | 403.64 | 407.1 | 407.1 | 407.1 | 407.1 | 407.44 | 407.27 | |
19 | 407.61 | 407.44 | 407.61 | 407.61 | 407.44 | 407.1 | 407.27 | |
20 | 407.79 | 407.44 | 407.27 | 407.1 | 407.44 | 407.44 | 407.1 | 407.61 |
21 | 408.3 | 407.61 | 406.41 | 407.27 | 407.61 | 407.79 | 407.1 | 407.27 |
22 | 407.27 | 407.1 | 407.1 | 407.61 | 407.1 | 407.96 | 407.27 | 407.44 |
23 | 407.61 | 407.1 | 406.41 | 407.1 | 406.92 | 407.44 | 406.58 | 407.1 |
表1
步骤S2,计算辅助修复机组数据B与待修复机组数据a的互相关系数,选择辅助修复机组数据B中与a相关性最大的多列辅助修复机组数据C;
此处计算互相关系数时,对传感器采集的机组数据进行不同步数的移位从而抵消相位差,之后选择互相关系数最大的多列辅助修复机组数据C;
互相关系数计算公式如下:
其中,Rτ为互相关系数,τ为移位步数,X,Y分别为两列机组数据,μX,μY分别为两列机组数据的均值,σX,σY分别为两列机组数据的标准差;
图2中,横坐标为机组数据的时间,纵坐标为机组数据的值;为了显示图2和待修复机组数据a原来的图形和图4中修复后的图形的对比,图2中未在待修复机组数据a中挖去缺失段,特此说明;
步骤S3,判断待修复机组数据a和所述多列辅助修复机组数据C的方差差异,若超过设定阈值则需要对待修复机组数据a和所有辅助修复机组数据C进行标准化,否则不需要进行标准化;
步骤S4,根据待修复机组数据a和辅助修复机组数据C的补偿基准,对C进行基线补偿;
由于不同机组传感器采集数据的基线可能不同,存在基线差,因此需要对辅助修复机组数据C进行基线补偿;
将待修复机组数据a缺失段的两端作为a的补偿基准;将各辅助修复机组数据C中与a缺失段所对应数据段的两端,作为C的补偿基准;
对于机组数据缓慢变化的情况,计算待修复机组数据a缺失段的两端邻近点与辅助修复机组数据C与a缺失段对应段两端邻近点之差,对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿;
邻近点选取方法:对于a缺失段即需要修复的数据段呈上升趋势,则选取a缺失段前端若干数据点(例如100个数据点)中的最大值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最大值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点(例如100个数据点)中的最小值,作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最小值作为C与a缺失段对应段后端的邻近点;
对于a缺失段即需要修复的数据段呈下降趋势,则选取a缺失段前端若干数据点(例如100个数据点)中的最小值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最小值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点(例如100个数据点)中的最大值,作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最大值作为C与a缺失段对应段后端的邻近点;
求出a缺失段、C与a缺失段对应段的前端两个临近点的差值,同样,求出后端两个临近点的差值;
对于机组数据非缓慢变化的情况(变化较剧烈),
将待修复机组数据a缺失段的两端作为a的补偿基准;将各辅助修复机组数据C中与a缺失段所对应数据段的两端,作为C的补偿基准;
对于a缺失段两端各取若干数据点(例如100个数据点)求均值,对于C与a缺失段对应段两端各取若干数据点(例如100个数据点)求均值,计算两者均值差(即一端的均值差,另一端的均值差),对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿。
步骤S5,若步骤S3中进行过标准化,则对待修复机组数据a和基线补偿后的辅助修复机组数据C反标准化还原;否则不需要反标准化还原;
步骤S6,对于以上步骤得到的辅助修复机组数据C,选择C中与待修复机组数据a平均绝对误差最小的多列机组数据D;
具体为,求出待修复机组数据a缺失段前后各若干数据点(例如各100个数据点)与辅助修复机组数据C中相应数据点(指对应时刻的数据点)的平均绝对误差,选取误差最小的多列机组数据D;
步骤S7,对上述多列机组数据D进行组编筛选,得到最接近均值的多列机组数据D′;具体为:
对各列机组数据D每个时刻的数据进行排序,然后对排序后的数据按列重新组编成机组数据,对重新组编后的机组数据,去除其中的最小值列和最大值列,得到最接近均值的多列机组数据D′;如图3所示;
步骤S8,对多列机组数据D′进行中值滤波,以降低噪声干扰;
步骤S9,对多列机组数据D′求每个时刻的均值,然后得到一列用于对待修复机组数据a进行修复的机组数据。
根据待修复机组数据a缺失段中的每个时刻,对应到步骤S9中最后得到的机组数据,从中找到对应的数值即可修复缺失段。
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种风电场SCADA数据缺失的智能修复方法,其特征在于,包括以下步骤:
步骤S1,数据预处理:对于待修复机组数据a,选出相应的多列辅助修复机组数据B;
步骤S2,计算辅助修复机组数据B与待修复机组数据a的互相关系数,选择辅助修复机组数据B中与a相关性最大的多列辅助修复机组数据C;
步骤S3,判断待修复机组数据a和所述多列辅助修复机组数据C的方差差异,若超过设定阈值则需要对待修复机组数据a和所有辅助修复机组数据C进行标准化,否则不需要进行标准化;
步骤S4,根据待修复机组数据a和辅助修复机组数据C的补偿基准,对C进行基线补偿;
步骤S5,若步骤S3中进行过标准化,则对待修复机组数据a和基线补偿后的辅助修复机组数据C反标准化还原;否则不需要反标准化还原;
步骤S6,对于以上步骤得到的辅助修复机组数据C,选择C中与待修复机组数据a平均绝对误差最小的多列机组数据D;
步骤S7,对上述多列机组数据D进行组编筛选,得到最接近均值的多列机组数据D′;
步骤S8,对多列机组数据D′进行中值滤波;
步骤S9,对多列机组数据D′求每个时刻的均值,然后得到一列用于对待修复机组数据a进行修复的机组数据。
2.如权利要求1所述的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S1中,对采集的机组数据需要进行数据结构转换,数据结构转换方法为:将不同机组采集的同类传感器数据进行整合,相近的多个时刻融合成一个时刻。
3.如权利要求1所述的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S2中,选择与a相关性最大的多列辅助修复机组数据C的具体方法为:
对传感器采集的机组数据进行不同步数的移位从而抵消相位差,之后选择互相关系数最大的多列辅助修复机组数据C;
互相关系数计算公式如下:
其中,Rτ为互相关系数,τ为移位步数,X,Y分别为两列机组数据,μX,μY分别为两列机组数据的均值,σX,σY分别为两列机组数据的标准差。
4.如权利要求1所述的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S4中,将待修复机组数据a缺失段的两端作为a的补偿基准;将各辅助修复机组数据C中与a缺失段所对应数据段的两端,作为C的补偿基准;
对于机组数据缓慢变化的情况,计算待修复机组数据a缺失段的两端邻近点与辅助修复机组数据C与a缺失段对应段两端邻近点之差,对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿;
邻近点选取方法:对于a缺失段即需要修复的数据段呈上升趋势,则选取a缺失段前端若干数据点中的最大值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最大值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点中的最小值作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最小值,作为C与a缺失段对应段后端的邻近点;
对于a缺失段即需要修复的数据段呈下降趋势,则选取a缺失段前端若干数据点中的最小值作为a缺失段前端的邻近点,辅助修复机组数据C与a缺失段对应段的前端若干数据点中的最小值,作为C与a缺失段对应段前端的邻近点;选取a缺失段后端若干数据点中的最大值,作为a缺失段后端的邻近点,辅助修复机组数据C与a缺失段对应段的后端若干数据点中的最大值作为C与a缺失段对应段后端的邻近点;
对于机组数据非缓慢变化的情况,分别对a缺失段两端各取若干数据点、C与a缺失段对应段两端各取若干数据点求均值,计算两者均值差,对待修复机组数据a缺失段中间时刻进行线性插补,所得到的序列与相应的辅助修复机组数据C相加,实现补偿。
5.如权利要求1所述的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S6中,具体包括:求出待修复机组数据a缺失段前后各若干数据点与辅助修复机组数据C中相应数据点的平均绝对误差,选取误差最小的多列机组数据D。
6.如权利要求1所述的风电场SCADA数据缺失的智能修复方法,其特征在于,
步骤S7具体为:对各列机组数据D每个时刻的数据进行排序,然后对排序后的数据按列重新组编成机组数据,对重新组编后的机组数据,去除其中的最小值列和最大值列,得到最接近均值的多列机组数据D′。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910333761.1A CN110058971B (zh) | 2019-04-24 | 2019-04-24 | 风电场scada数据缺失的智能修复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910333761.1A CN110058971B (zh) | 2019-04-24 | 2019-04-24 | 风电场scada数据缺失的智能修复方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110058971A true CN110058971A (zh) | 2019-07-26 |
CN110058971B CN110058971B (zh) | 2023-04-18 |
Family
ID=67320477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910333761.1A Active CN110058971B (zh) | 2019-04-24 | 2019-04-24 | 风电场scada数据缺失的智能修复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110058971B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113806351A (zh) * | 2021-11-19 | 2021-12-17 | 国能信控互联技术有限公司 | 一种火电机组发电数据异常值处理方法及装置 |
CN118445556A (zh) * | 2024-07-08 | 2024-08-06 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050193244A1 (en) * | 2004-02-04 | 2005-09-01 | Alacritus, Inc. | Method and system for restoring a volume in a continuous data protection system |
CN107577649A (zh) * | 2017-09-26 | 2018-01-12 | 广州供电局有限公司 | 缺失数据的插补处理方法及装置 |
US20180068033A1 (en) * | 2016-09-08 | 2018-03-08 | Indian Institute Of Technology Bombay | Method for imputing missed data in sensor data sequence with missing data |
CN108629119A (zh) * | 2018-05-08 | 2018-10-09 | 安徽大学 | 一种时序modis定量遥感产品时空修复及批处理实现方法 |
-
2019
- 2019-04-24 CN CN201910333761.1A patent/CN110058971B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050193244A1 (en) * | 2004-02-04 | 2005-09-01 | Alacritus, Inc. | Method and system for restoring a volume in a continuous data protection system |
US20180068033A1 (en) * | 2016-09-08 | 2018-03-08 | Indian Institute Of Technology Bombay | Method for imputing missed data in sensor data sequence with missing data |
CN107577649A (zh) * | 2017-09-26 | 2018-01-12 | 广州供电局有限公司 | 缺失数据的插补处理方法及装置 |
CN108629119A (zh) * | 2018-05-08 | 2018-10-09 | 安徽大学 | 一种时序modis定量遥感产品时空修复及批处理实现方法 |
Non-Patent Citations (2)
Title |
---|
YINGYING ZHAO等: ""Fault prognosis of wind turbine generator using SCADA data"", 《2016 NORTH AMERICAN POWER SYMPOSIUM (NAPS)》 * |
牛瑞等: ""SCADA系统异常数据分析及治理建议"", 《电网与清洁能源》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113806351A (zh) * | 2021-11-19 | 2021-12-17 | 国能信控互联技术有限公司 | 一种火电机组发电数据异常值处理方法及装置 |
CN113806351B (zh) * | 2021-11-19 | 2022-04-19 | 国能信控互联技术有限公司 | 一种火电机组发电数据异常值处理方法及装置 |
CN118445556A (zh) * | 2024-07-08 | 2024-08-06 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
CN118445556B (zh) * | 2024-07-08 | 2024-09-13 | 湖南大学 | 一种基于多重相关性学习的风电场scada数据修复方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110058971B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105719259A (zh) | 路面裂缝图像检测方法 | |
CN111275288A (zh) | 基于XGBoost的多维数据异常检测方法与装置 | |
CN110659693B (zh) | 基于k近邻分类的配电网快速拓扑识别方法、系统及介质 | |
CN100367620C (zh) | 基于混成状态估计的电力网络拓扑错误辨识方法 | |
CN110058971A (zh) | 风电场scada数据缺失的智能修复方法 | |
CN108074015B (zh) | 一种风电功率超短期预测方法及系统 | |
CN111709454B (zh) | 一种基于最优copula模型的多风电场出力聚类评估方法 | |
CN106155985B (zh) | 一种基于相邻数据特征的数据缺失填充方法 | |
CN106203741B (zh) | 用于电网负荷预测的多元异质数据清洗方法 | |
CN112686971A (zh) | 建筑系统关系拓扑无向图有向化方法和系统 | |
CN118114083B (zh) | 基于大数据的学生学业表现预测方法 | |
CN114153888A (zh) | 一种时间序列数据的异常值检测方法和装置 | |
CN115327425B (zh) | 基于统计的锂电池储能电站的多级异常检测方法及系统 | |
CN113095367A (zh) | 一种基于深度强化学习的压缩机故障诊断方法 | |
CN113887119B (zh) | 一种基于sarima-lstm的河流水质预测方法 | |
CN117092980B (zh) | 一种基于大数据的电气故障检测控制系统 | |
CN111625992B (zh) | 一种基于自调优深度学习的机械故障预测方法 | |
CN112461340A (zh) | 水位仪的故障纠正、检测方法及装置 | |
CN113554079B (zh) | 一种基于二次检测法的电力负荷异常数据检测方法及系统 | |
KR20210097613A (ko) | 수요관리 자원 최적화를 위한 전력사용량 예측 시스템 | |
CN110070132A (zh) | 风电场scada系统缺失数据修复结果的修正补偿方法 | |
CN116304949A (zh) | 一种能耗历史数据的校准方法 | |
CN115564139A (zh) | 基于能值评估的能源系统运行状态优化方法及装置 | |
CN109388845A (zh) | 基于反向学习与增强复杂进化的光伏阵列参数提取方法 | |
CN115481115A (zh) | 一种冗余数据清洗方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |