CN109409740B - 一种基于皮尔森相关系数校核风力发电数据质量的方法 - Google Patents
一种基于皮尔森相关系数校核风力发电数据质量的方法 Download PDFInfo
- Publication number
- CN109409740B CN109409740B CN201811255097.5A CN201811255097A CN109409740B CN 109409740 B CN109409740 B CN 109409740B CN 201811255097 A CN201811255097 A CN 201811255097A CN 109409740 B CN109409740 B CN 109409740B
- Authority
- CN
- China
- Prior art keywords
- data
- correlation coefficient
- pearson correlation
- wind power
- power generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000002547 anomalous effect Effects 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000002354 daily effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明公开了一种基于皮尔森相关系数校核风力发电数据质量的方法,包括选取标准样本数据计算皮尔森相关系数;利用皮尔森相关系数修正每日数据;对比两组替换数据的皮尔森相关系数,得出结论。本发明通过风力发电功率与风速的皮尔森相关系数来校核修正风力发电数据,可以更加科学、合理提升风力发电数据质量,对新能源数据中心风力发电数据的收集和分析起到有效的支撑作用,节约了风力发电站的日常运行和维护的成本。
Description
技术领域
本发明属于风力发电数据质量评估技术领域,具体涉及一种基于皮尔森相关系数校核风力发电数据质量的方法。
背景技术
风电是一类清洁、绿色的可再生能源,也是可再生能源领域中技术最成熟、最具规模开发条件和商业化发展前景的发电方式之一。加快发展风电已成为包括中国、欧盟在内多国推动能源结构转型、应对气候和环境问题的重要途径。
新能源数据中心每日采集风力发电实时数据,用以日常运营维护和数据分析,实时发电数据通过计量设备采集,除去设备异常,在采集传输过程中也有可能发生问题,新能源数据中心每日需处理的数据量极大,日数据量已经达到4GB,传统的人工方式校核数据已经无法满足现状。因为风速与发电量成正比,因此本专利通过风力发电功率与风速的皮尔森相关系数来校核修正风力发电数据,提高风力发电数据质量。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于皮尔森相关系数校核风力发电数据质量的方法。
为实现上述技术目的,本发明采取的技术方案为:
一种基于皮尔森相关系数校核风力发电数据质量的方法,包括以下步骤:
步骤1:选取标准样本数据计算皮尔森相关系数;
步骤2:利用皮尔森相关系数修正每日数据;
步骤3:对比两组替换数据的皮尔森相关系数,得出结论。
为优化上述技术方案,采取的具体措施还包括:
步骤1所述标准样本数据为风力电站风速相对平稳的24小时内整点风力发电功率和风速数据。
步骤1所述皮尔森相关系数计算公式如下:
式中,COR(X,Y)为皮尔森相关系数,变量X为功率样本数据,变量Y为风速样本数据。
步骤2所述利用皮尔森相关系数修正每日数据通过以下步骤实现:
步骤2-1:以相同时间点数据替换异常数据计算皮尔森相关系数;
步骤2-2:以相同风速下数据替换异常数据计算皮尔森相关系数。
本发明具有以下有益效果:
本发明通过风力发电功率与风速的皮尔森相关系数来校核修正风力发电数据,可以更加科学、合理提升风力发电数据质量,对新能源数据中心风力发电数据的收集和分析起到有效的支撑作用,节约了风力发电站的日常运行和维护的成本。
附图说明
图1是本发明的流程框图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述。
如图1所示,一种基于皮尔森相关系数校核风力发电数据质量的方法,包括以下步骤:
步骤1:选取标准样本数据计算皮尔森相关系数;
步骤1-1:标准样本数据整理。
选取某风力电站一天(风速相对平稳)内整点风力发电功率和风速数据作为标准样本,具体标准样本数据见表1:
表1
步骤1-2:计算皮尔森相关系数。
皮尔森相关系数是两个变量的协方差除以这两个变量的标准差得到的,公式如下:
变量X为功率样本数据,变量Y为风速样本数据。
根据皮尔森相关系数的特性可知,当两个变量的方差都不为零时,皮尔森相关系数才有意义,皮尔森相关系数的取值范围为[-1,1]。皮尔森相关系数描述的是两个变量间线性相关强弱的程度。若皮尔森相关系数大于零,表示两个变量正相关,即一个变量的值越大,另一个变量的值也越大;若皮尔森相关系数小于零,表示两个变量负相关,即一个变量值越大另一个变量值反而越小,皮尔森相关系数的绝对值越大表示相关性越强,不存在因果关系,若皮尔森相关系数为零,表示两个变量间不是线性关系,但有可能是其他方式相关。
将表1数据带入皮尔森相关系数计算公式得出COR(X,Y)=0.889,以此作为修正异常数据的标准。
步骤2:利用皮尔森相关系数修正每日数据。
还是以某风力电站一天内整点发电功率和风速数据为例,假设风力电站运行情况良好,并无异常告警,新能源数据中心采集数据见表2,其中发现异常数据 (表2中时间16所对应的给功率值为0),此种情况一般是由于网络波动造成的数据丢失,我们判断此类数据为需要校核的数据。
表2
在这种情况下,我们采用皮尔森相关系数对异常数据进行修正,步骤如下:
步骤2-1:
选取一组相同时间点的风力发电功率数据,见表3。
表3
时间 | 功率 |
16 | 1.62 |
16 | 1.13 |
16 | 0.89 |
16 | 0.47 |
16 | 0.79 |
16 | 1.16 |
16 | 0.96 |
16 | 0.95 |
16 | 0.88 |
16 | 0.79 |
将一组10个数据分别替换异常数据计算皮尔森相关系数,见表4。
表4
时间 | 功率 | 相关系数 |
16 | 1.62 | 0.652 |
16 | 1.13 | 0.803 |
16 | 0.89 | 0.856 |
16 | 0.47 | 0.984 |
16 | 0.79 | 0.871 |
16 | 1.16 | 0.795 |
16 | 0.96 | 0.842 |
16 | 0.95 | 0.844 |
16 | 0.88 | 0.858 |
16 | 0.79 | 0.871 |
根据相关系数对比,功率为0.79时相关系数为0.871,最为接近0.889。
步骤2-2:
选取一组相同风速情况下的风力发电功率数据,见表5。
表5
风速 | 功率 |
6.3 | 0.71 |
6.3 | 0.52 |
6.3 | 0.64 |
6.3 | 0.63 |
6.3 | 0.66 |
6.3 | 0.87 |
6.3 | 0.74 |
6.3 | 0.72 |
6.3 | 0.59 |
6.3 | 0.64 |
将一组10个数据分别替换异常数据计算皮尔森相关系数,见表6。
表6
风速 | 功率 | 相关系数 |
6.3 | 0.71 | 0.881 |
6.3 | 0.52 | 0.893 |
6.3 | 0.64 | 0.887 |
6.3 | 0.63 | 0.885 |
6.3 | 0.66 | 0.888 |
6.3 | 0.87 | 0.859 |
6.3 | 0.74 | 0.878 |
6.3 | 0.72 | 0.88 |
6.3 | 0.59 | 0.89 |
6.3 | 0.64 | 0.887 |
根据皮尔森相关系数的对比,功率为0.66时相关系数为0.888,最为接近标准样本数据的相关系数0.889。
步骤3对比两组替换数据的皮尔森相关系数,得出结论。
根据步骤2-1和步骤2-2的计算结果,在相同风速条件下的风力功率数据, 10个抽样数据的相关系数都非常接近0.889,并且替换的风力发电功率数据0.66 与实际风力发电功率数据0.68非常接近,与在相同时间点的风力发电功率数据0.79对比,更为接近实际值,因此,在选择校正数据时,我们选择用相同风速条件下的数据进行替换,替换异常数据。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (1)
1.一种基于皮尔森相关系数校核风力发电数据质量的方法,其特征在于:包括以下步骤:
步骤1:选取标准样本数据并计算皮尔森相关系数,包括:
步骤1-1:选取标准样本数据,包括风力电站风速相对平稳的24小时内整点风力发电功率和风速数据;
步骤1-2:根据标准样本数据计算皮尔森相关系数,计算公式如下:
式中,COR(X,Y)为皮尔森相关系数,变量X为功率样本数据,变量Y为风速样本数据;
步骤2:替换每日数据中的异常数据,并计算皮尔森相关系数,包括:
步骤2-1:以相同时间点数据替换异常数据,并计算皮尔森相关系数;
步骤2-2:以相同风速下数据替换异常数据,并计算皮尔森相关系数;
步骤3:将步骤2得到的皮尔森相关系数与步骤1的皮尔森相关系数对比,同时将替换数据与实际值比较,以皮尔森相关系数最接近步骤1皮尔森相关系数,且异常数据与实际值最接近实际值为目标,选取最优的异常数据替换方式作为风力发电数据质量校核方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811255097.5A CN109409740B (zh) | 2018-10-25 | 2018-10-25 | 一种基于皮尔森相关系数校核风力发电数据质量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811255097.5A CN109409740B (zh) | 2018-10-25 | 2018-10-25 | 一种基于皮尔森相关系数校核风力发电数据质量的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109409740A CN109409740A (zh) | 2019-03-01 |
CN109409740B true CN109409740B (zh) | 2021-08-10 |
Family
ID=65470098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811255097.5A Active CN109409740B (zh) | 2018-10-25 | 2018-10-25 | 一种基于皮尔森相关系数校核风力发电数据质量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409740B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288592B (zh) * | 2019-07-02 | 2021-03-02 | 中南大学 | 一种基于概率语义分析模型的锌浮选加药状态评价的方法 |
CN112731022B (zh) * | 2020-12-18 | 2023-06-23 | 阳光智维科技股份有限公司 | 光伏逆变器故障检测方法、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102884698A (zh) * | 2010-02-10 | 2013-01-16 | 未来燃料电池解决方案有限公司 | 有可再生电源的能量供应系统和操作能量供应系统的方法 |
CN108549962A (zh) * | 2018-06-04 | 2018-09-18 | 中国农业大学 | 基于历史分段序列搜索和时序稀疏化的风电功率预测方法 |
CN109086793A (zh) * | 2018-06-27 | 2018-12-25 | 东北大学 | 一种风力发电机的异常识别方法 |
-
2018
- 2018-10-25 CN CN201811255097.5A patent/CN109409740B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102884698A (zh) * | 2010-02-10 | 2013-01-16 | 未来燃料电池解决方案有限公司 | 有可再生电源的能量供应系统和操作能量供应系统的方法 |
CN108549962A (zh) * | 2018-06-04 | 2018-09-18 | 中国农业大学 | 基于历史分段序列搜索和时序稀疏化的风电功率预测方法 |
CN109086793A (zh) * | 2018-06-27 | 2018-12-25 | 东北大学 | 一种风力发电机的异常识别方法 |
Non-Patent Citations (1)
Title |
---|
Wind power prediction with missing data using Gaussian process;Tianhong Liu et al;《Applied Soft Computing》;20180720;第71卷;905-916 * |
Also Published As
Publication number | Publication date |
---|---|
CN109409740A (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021806B (zh) | 一种基于核函数极限学习机的光伏组串故障诊断方法 | |
CN108448625B (zh) | 一种基于数据驱动的风机切入风速计算方法 | |
CN109409740B (zh) | 一种基于皮尔森相关系数校核风力发电数据质量的方法 | |
CN105627504B (zh) | 基于支持向量机的变风量中央空调系统冷水机组能耗估计方法 | |
CN106570790B (zh) | 一种计及风速数据分段特性的风电场出力数据修复方法 | |
CN107591811B (zh) | 配电网无功优化方法及装置 | |
CN109634944B (zh) | 一种基于多维度时空分析的网损数据清洗方法 | |
CN112948757A (zh) | 一种基于改进皮尔逊相关系数的低压台区拓扑校验方法 | |
CN115293372A (zh) | 基于多维度、多参量数值分析的光伏组串故障诊断方法 | |
CN116028887A (zh) | 一种连续性工业生产数据的分析方法 | |
CN111817299A (zh) | 基于模糊推理的配电台区线损率异常成因智能辨识方法 | |
CN117056848B (zh) | 一种用于提升电力系统决策的监测数据质量分析方法 | |
CN109034538B (zh) | 一种面向变电站自动化设备运行质量的评价分析方法 | |
CN113344293B (zh) | 一种基于nca-融合回归树模型的光伏功率预测方法 | |
CN110633844B (zh) | 基于emd和ann的建筑能源系统模拟预测方法及应用 | |
CN110729763B (zh) | 一种大规模风电汇集对直流功率影响的量化评估方法 | |
CN109193645B (zh) | 一种数据驱动的环形电网电抗参数评估方法及评估系统 | |
CN108414851B (zh) | 基于ems理论电量数据与采集电量数据的智能校核方法 | |
CN105184681B (zh) | 基于最近距离分群的大型光伏发电集群弃光电量评估法 | |
CN107506867B (zh) | 一种基于动态建模的光伏出力预测方法 | |
CN110942093A (zh) | 一种配电自动化终端状态评价方法 | |
CN114297186A (zh) | 一种基于偏离系数的用电数据预处理方法及系统 | |
CN117709642A (zh) | 一种基于聚类分析的长时间尺度无功补偿优化配置方法 | |
CN114969017B (zh) | 风功率数据清洗方法、清洗装置及预测方法 | |
CN103279119B (zh) | 网格频率设定双椭圆拟合方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |