CN111027768A - 数据处理方法、装置和应用平台 - Google Patents
数据处理方法、装置和应用平台 Download PDFInfo
- Publication number
- CN111027768A CN111027768A CN201911255735.8A CN201911255735A CN111027768A CN 111027768 A CN111027768 A CN 111027768A CN 201911255735 A CN201911255735 A CN 201911255735A CN 111027768 A CN111027768 A CN 111027768A
- Authority
- CN
- China
- Prior art keywords
- data
- prediction model
- power
- power prediction
- photovoltaic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000007781 pre-processing Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000015654 memory Effects 0.000 claims description 67
- 238000012706 support-vector machine Methods 0.000 claims description 63
- 238000004140 cleaning Methods 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 12
- 238000007405 data analysis Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000007787 long-term memory Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 22
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000010248 power generation Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 17
- 238000012360 testing method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000013135 deep learning Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 7
- 230000004927 fusion Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012797 qualification Methods 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013082 photovoltaic technology Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据处理方法、装置和应用平台。其中,该方法包括:获取光伏原始数据;对光伏原始数据进行数据预处理,得到待分析光伏数据;将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。本发明解决了由于相关技术在进行光伏功率预测的过程中传统方法复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足的技术问题。
Description
技术领域
本发明涉及计算机技术应用领域,具体而言,涉及一种数据处理方法、装置和应用平台。
背景技术
近年来,能源与环境一直是人类关注的重点。随着煤炭、石油和天然气等化石燃料的大规模减少,这些不可再生能源在未来会变得更加紧张,同时气候变化和全球变暖问题也日益严重。为了避免资源短缺和环境恶化的危机,发展可再生的绿色能源已经成为全世界共同的主旨。目前主要的绿色能源有光能、风能、水能、潮汐能、地热能等,它们在产能过程中并不会产生二氧化碳。太阳能作为其中的一员,因为其取之不尽的特点,会代替化石能源成为主要发展对象。随着我国快速增长的分布式光伏技术,太阳能发电被大量应用在建筑、工业、交通运输业、农业等领域的各种建设与非建设用地上,中国光伏发电总装机容量已连续几年位居世界首位。根据国家发改委能源所的研究,到2050年太阳能和风能将成为我国主要的电力支柱,占全部发电量的64%。光伏(Photo-voltaic,PV)发电将成为装机规模最大的发电形态,装机容量可达到27亿千瓦,以清洁绿色的方式向城市和乡村提供电力。
然而,光伏发电在带来便利的同时却增加了并网的复杂性。太阳能发电的最大特点是不确定性较强,不能与火力、水力发电一样提供稳定电能。光伏功率的输出受内部与外部两个方面因素的影响。其中内因是指硬件方面的影响因素,包括面板的仰角与方向、电路器件的损耗等;外因是指地理环境的影响因素,包括辐照量、温度、湿度等。两种因素相比之下,内因较为稳定,而外因无时无刻不在变化,这一点是光伏功率波动的根本原因。除此之外,光伏发电还具有周期性与间歇性,这更加大了对电网的干扰。在电力系统中,为了给用户提供安全可靠、稳定输出的电能,电网的实时调度尤为重要。由于电能具有瞬时性,必须提前对功率进行准确预测,将不确定因素对电网的危害降到最低,以保证电网安全稳定的运行。
其中,在现有技术中光伏功率预测方法可以大致分成物理建模、统计分析和学习方法。其中物理方法是根据光伏发电原理建立系统方程,利用物理学、电气学知识对功率进行计算,但过程较为复杂,灵活性和准确性都比较差。统计分析和学习方法都是通过纯数据进行建模,它们都有一个共同点,即都需要预先知道相关的历史数据,对数据进行分析,提炼信息,对系统的运行机制进行研究,从而对系统可能的响应和演变作出预测。
但是随着分布式光伏发电技术的快速发展,光伏产业在电力系统中的比重持续增加。由于光伏发电的不确定性因素较多,变化性强并且有间歇,这给光伏的并网过程与电网的调度工作带来了较大困难。传统的预测方法模型复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足。
针对上述由于相关技术在进行光伏功率预测的过程中传统方法复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据处理方法、装置和应用平台,以至少解决由于相关技术在进行光伏功率预测的过程中传统方法复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足的技术问题。
根据本发明实施例的一个方面,提供了一种数据处理方法,包括:获取光伏原始数据;对光伏原始数据进行数据预处理,得到待分析光伏数据;将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
可选的,对光伏原始数据进行数据预处理,得到待分析光伏数据包括:在光伏原始数据包括天气数据和功率数据的情况下,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据。
进一步地,可选的,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据包括:对天气数据和功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;将筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;对天气数据的无量纲值和功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;合并清洗后的天气数据的无量纲值和功率数据的无量纲值,得到待分析光伏数据。
可选的,将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果包括:在预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值;将深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值分别赋于深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型,得到融合后的模型组合;将待分析光伏数据输入融合后的模型组合进行数据预测,得到光伏功率预测结果。
进一步地,可选的,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值包括:分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的预测相对误差比重;根据预存相对误差比重分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的熵值;根据相对误差的熵值分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的变异程度系数;根据相对误差的变异程度系数分别计算深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值。
根据本发明实施例的一个方面,提供了一种数据处理装置,包括:获取模块,用于获取光伏原始数据;预处理模块,用于对光伏原始数据进行数据预处理,得到待分析光伏数据;预测模块,用于将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
可选的,预处理模块包括:预处理单元,用于在光伏原始数据包括天气数据和功率数据的情况下,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据。
进一步地,可选的,预处理单元包括:筛选子单元,用于对天气数据和功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;转换子单元,用于将筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;数据清洗子单元,用于对天气数据的无量纲值和功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;合并子单元,用于合并清洗后的天气数据的无量纲值和功率数据的无量纲值,得到待分析光伏数据。
可选的,预测模块包括:计算单元,用于在预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值;赋值单元,用于将深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值分别赋于深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型,得到融合后的模型组合;预测单元,用于将待分析光伏数据输入融合后的模型组合进行数据预测,得到光伏功率预测结果。
进一步地,可选的,计算单元包括:第一计算子单元,用于分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的预测相对误差比重;第二计算子单元,用于根据预存相对误差比重分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的熵值;第三计算子单元,用于根据相对误差的熵值分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的变异程度系数;第四计算子单元,用于根据相对误差的变异程度系数分别计算深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值。
根据本发明实施例的一个方面,提供了一种数据处理方法的应用平台,应用于上述方法,包括:实时监控模块、预测曲线模块、数据分析模块和数据报表模块,其中,实时监控模块,用于显示气象数值实时曲线与功率数据实时曲线;预测曲线模块,用于显示气象数值预测曲线与功率数据预测曲线;数据分析模块,用于对历史数据库里的信息进行总结计算并展示;数据报表模块,用于将数据分析中的信息库以文件形式输出。
在本发明实施例中,通过获取光伏原始数据;对光伏原始数据进行数据预处理,得到待分析光伏数据;将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果,达到了将深度学习的感知能力与机器学习的决策能力、长短时记忆网络的累计信息功能结合起来,形成深度强化学习,优势互补,提升预测精度的目的,从而实现了提升光伏功率预测精度的技术效果,进而解决了由于相关技术在进行光伏功率预测的过程中传统方法复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据处理方法的流程示意图;
图2是根据本发明实施例的数据处理方法中执行过程的流程示意图;
图3是根据本发明实施例的数据处理方法中光伏电池板的工作原理图;
图4是根据本发明实施例的数据处理方法中计算单个模型权重流程图;
图5是根据本发明实施例的数据处理方法中融合模型预测结果的示意图;
图6是根据本发明实施例的数据处理方法中四种方法预测结果的示意图;
图7是根据本发明实施例的数据处理装置的示意图;
图8是根据本发明实施例的数据处理方法的应用平台的示意图;
图9是根据本发明实施例的数据处理方法的应用平台的系统组成示意图;
图10是根据本发明实施例的数据处理方法的应用平台的系统工作流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
根据本发明实施例,提供了一种数据处理方法的方法实施例,图1是根据本发明实施例的数据处理方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S102,获取光伏原始数据;
步骤S104,对光伏原始数据进行数据预处理,得到待分析光伏数据;
步骤S106,将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
具体的,结合步骤S102至步骤S106,本申请实施例提供的数据处理方法针对传统预测方法的不足,采用一种基于深度学习理论的光伏功率预测方法,引入其它模型并进行了融合,以提高系统的综合能力,在太阳能发电原理的基础上研究影响光伏发电的主要因素与次要因素,基于此对电厂的报表数据进行筛选并分析,通过清洗处理提高数据的实用性,以满足训练模型的需求。引入深层网络结构框架,采用基于受限玻尔兹曼机的深度置信网络进行建模,进一步提取数据深层特征,对比浅层网络体现半监督学习的可行性。采用一种新的组合预测模型,继续引入机器学习中的支持向量机与深度学习中的长短时记忆网络,通过信息熵原理对三种算法进行融合,使模型的感知能力更加全面。
其中,本申请实施例提供的数据处理方法的整体框图如图2所示。图2是根据本发明实施例的数据处理方法中执行过程的流程示意图,以深层次表达的堆叠算法为核心,研究深度学习在光伏功率预测上的应用。在不同的场景下,各种预测模型的效果有所不同。单一地使用一种模型会使得预测结果受异常点影响严重,从而降低整体预测质量。基于此,本申请实施例提供的数据处理方法结合信息熵理论,将深度信念网络与机器学习中的支持向量机算法、深度学习中的长短时记忆网络进行融合从而提高算法的灵活性与适应性。本申请实施例提供的数据处理方法的主要目标是在对目前光伏功率预测方法的理论和研究的基础上,采用一种以深度学习网络为主,机器学习算法为辅的融合算法预测光伏功率。
在本发明实施例中,通过获取光伏原始数据;对光伏原始数据进行数据预处理,得到待分析光伏数据;将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果,达到了将深度学习的感知能力与机器学习的决策能力、长短时记忆网络的累计信息功能结合起来,形成深度强化学习,优势互补,提升预测精度的目的,从而实现了提升光伏功率预测精度的技术效果,进而解决了由于相关技术在进行光伏功率预测的过程中传统方法复杂度较低,表达能力有限且形式单一,在实用性、灵活性和准确性上都有所不足的技术问题。
可选的,步骤S104中对光伏原始数据进行数据预处理,得到待分析光伏数据包括:在光伏原始数据包括天气数据和功率数据的情况下,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据。
进一步地,可选的,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据包括:对天气数据和功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;将筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;对天气数据的无量纲值和功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;合并清洗后的天气数据的无量纲值和功率数据的无量纲值,得到待分析光伏数据。
具体的,这里需要说明的是本申请实施例提供的数据处理方法在数据预处理过程中的天气影响因素,其中,光伏发电的原理是通过半导体界面的光生伏特效应将太阳能直接转化为电能。光伏板主要由整流器、逆变器、直流控制器和储能系统四个部分组成。目前,在不同的地区,光伏发电站的种类也不一样,主要有离网光伏发电(独立光伏发电)、并网光伏、分散式发电(分布式发电)三种。
图3是为光伏电池板的工作原理图,在图3中可以看出,光伏电池板中的关键部分是PN结。光伏电池板工作原理为:当阳光照射在PN结上时,形成了光电变化的界面,导致负电子跑向N区,正电子跑向P区。因此在N区出现了很多负电荷,P区出现了很多正电荷,这种现象被称为“光伏效应”,是电势差产生的根本原因。在实际应用中,为了获得不同的电压和电流。可以将大量的光伏电池组件以串联和并联的方式连接。
由此可以看出,太阳光照与光伏阵列的输出有很大的联系,温度和风速等一些天气因素对光伏输出功率也有一定影响。因此,需要定量分析不同气象因素与光伏输出功率之间的相关性。
固定安装角度的光伏阵列系统单位面积输出功率常用公式可表示为:
PPV(t)=I(t)Aηpc[1-β(tc-Tcref)],(2-1)
在(2-1)式中,I(t)表示t时刻的辐射度;A为光伏组件的面积;tc、Tcref分别表示环境温度和参考温度;ηpc表示直流变换环节最大功率点跟踪效率;β为温度系数。由公式(2-1)可以得出直接影响因素是辐射度与环境温度。
本申请实施例提供的数据处理方法以内蒙古乌兰察布市凉城县某电站的数据为例,取2017年一年的日发电量数据,按公式(2-2)计算各属性值之间的相关系数,结果如表2-1所示。
表2-1各变量之间相关性分析
可以看出各个天气属性之间各有关联。其中,辐照度和功率之间的相关性最为显著。此外,环境因素如湿度、风速、风向、气压等也在间接影响光伏发电。
在数据预处理过程中,光伏原始数据可能在测量、传输过程中会产生一些异常数据,为了检测出这些异常数据,在使用前应对数据进行合并、筛选、转化和清洗。
一方面,完整准确的数据对于光伏输出预测是必不可少的,但是在实际应用中,得到的数据中有一部分受到一些因素的干扰导致不完整甚至不准确。因此,需要对这些数据进行预处理,即删除掉一些不良数据,通过技术手段将缺失的数据补充上。通过对数据进行预处理,解决了在训练模型时得到的结果不可靠的问题,确保PV功率的预测符合准确度要求。
另一方面,训练模型时,在发电量、温度、湿度等这些变量输入到模型之前,考虑到这些变量单位不统一、存在数量级的差异等问题,而且输出结果在数值范围上也有相应的限制。因此,必须对数据进行处理。
数据清洗主要有四个工作:
(1)完整性检验
通过采样时间、传输延迟等因素来检查数据的完整性。主要检查数据量和计划量的规格是否一致,实际采集数据的时间点和计划采集的是否有差别。
(2)变化率检验
主要检验各物理量的变化幅度是否在合理范围。
(3)合理性检验
检测历史数据是否有异常。比如光伏发电电压和实际功率值,这两个值应该大于零且分别小于额定电压与装机容量。如果这两个值不在这个范围内,说明测量的值有问题。
(4)数据单位的转换
数据采集过程中,不同系统采集的数据在数量级上都有所不同。为了方便数据的传输与计算,每个系统中的数据并不是真实的单位,只是暂时约定的无量纲值。每个工厂都有一整套内部设定的单位系数调整制度,因此在使用之前必须转换数据单位,使数据更加标准化,便于进一步研究。
本申请实施例提供的数据处理方法中的数据集来自内蒙古乌兰察布市凉城县某装机容量为20MW的光电站2017年11月至2018年9份的近300天的报表,分别为“数值天气预报(Numerical Weather Prediction,简称NWP)”和“功率”两个报表,分别记录当天24小时的天气情况以及实际功率值。
首先将按日独立编排的工作簿整合在一起,本申请实施例提供的数据处理方法通过“西格马”等大数据处理与决策平台工具辅助完成。其次处理数据中的无效行、无效列与错误值。其中无效行指空值比例较高的某些数据行;无效列指空值比例较高的数据列或某列数据全部为单一数据;错误值指与同列数据类型明显不同的数据值。
表2-2是功率值的原始数据,在工厂报表中,功率数据是以5分钟为间隔进行采样的。由于字符转换与解码等错误影响,数据中有许多不合理值,功率出现负值,甚至个别时刻功率值超过了装机容量大小。
表2-2部分功率数据处理前示例
日期 | 时间 | 实际功率 |
2017-11-20 | 07:45:00 | 0.119109 |
2017-11-20 | 07:46:00 | 0.1191 |
2017-11-20 | …… | …… |
2017-11-20 | 08:00:00 | 0.1331 |
2017-11-20 | …… | …… |
2017-11-20 | 08:09:00 | 0.3527 |
2017-11-20 | 08:10:00 | 0.3643 |
2017-11-20 | …… | …… |
2017-11-20 | 10:00:00 | 10.075 |
表2-3为气象原始数据,采样周期为5分钟,报表中的数字均为无符形,同样存在较多的异常值与非标准量纲。温度在零度以下的数值不能正常显示。湿度、压强需要通过设定的系数才能还原标准单位下的真实值。
表2-3部分气象数据处理前示例
将功率数据与气象数据进行合并,时间间隔统一为5分钟。按照设定系数与国家预测标准对量纲的规定,将数值标准化处理,处理后的数据如表2-4所示。各变量的单位为:功率——MW;辐照度——W/m2;风向——度;风速——m/s;环境温度——℃;环境湿度——%RH;气压——hpa(百帕)。
表2-4部分合并数据处理后示例
对于数据的平滑性,不同属性的数值处理方式也不同。对于温度、风速、湿度、气压等物理量均有渐变性,即不可能在短时间内发生巨变,很容易识别噪点。而辐照度的强波动性导致其数值可能在短时间内飘忽不定,从而影响功率值的稳定性,信号噪点也较难识别。因此重点对渐变量的噪点进行处理。对于异常的突变数据的修复,先计算在d天内所有数据的均值和方差
t表示采样时间,用θ(d,t)表示第d天t时刻数值的偏离率
ρ表示所有偏离率的最大值,当θ(d,t)<ρ时,说明数据正常;反之就属于畸变数据,为了使偏离率的波动幅度不会有太大起伏,因此利用式(2-6)通过之前的数据加以计算与替换。
通过对各变量的处理以及工作簿的合并,对最终数据进行统计性描述如表2-5所示(保留两位小数),最终各变量的集中趋势与离中趋势都与实际相符,这84960个数据将作为后期建模与仿真的样本数据集。
表2-5处理后数据的
本申请实施例提供的数据处理方法的所有样本集总样本天数为295天,训练集243天,测试集52天。52天的测试集是从4个季节中分别挑选天气情况较为复杂的日期,平均每个月13天,再从这52天中按月份挑选4天作为测试集二,其余48天为测试集一。测试集一用于测试单个预测模型的效果,测试集二用于测试最终信息熵组合模型的效果。其中测试集二中的4天从始至终未参与过任何训练,因此能检验单一模型与融合模型整体的泛化能力。每一次实验前都重新对数据进行分组,最终的结果是多组数据的平均值。
为了直观地评估预测模型的结果以比较光伏功率预测模型的质量,误差函数的大小通常被用作评估和分析预测模型的指标。本申请实施例提供的数据处理方法用到的性能指标有:决定系数、均偏差、均方差、相对误差、准确率、合格率。用f表示预测功率值,y表示真实功率值,C表示装机容量,n表示参与计算的样本数量,对于这几种指标的解释如下所示:
(1)决定系数(Coefficient of Determination,R2):是指模型捕获的响应方差的分数,取值范围为[0,1],值越大说明模型越能清晰表达模型的性能,表达式
(2)均偏差(Mean Absolute Error,MAE):
(3)均方差(Mean Square Error,MSE),其意义为误差平方和(Sum of SquaredError,SSE)的平均值,用于评估系统预测离散度。另外,大多优化过程在交叉验证中均通过比较MSE判定最优,其表达式为:
(4)相对误差(Mean Absolute Percentage Error,MAPE),也称为平均绝对百分比误差:
(5)准确率(Mean Accuracy,MA):
(6)合格率(Q),国家能源局针对光伏发电站专设的一项评估准则,规定某时刻预测偏差占装机容量的百分比在25%以内视为合格,合格率的表达式为:
上述示例以实际现场数值为例,在发电原理的基础上,针对电站数据因测量传输等问题所导致的异常值进行清洗,对报表数据进行筛选、合并、清洗。通过讨论各种天气属性与PV功率之间的相关程度,风速等变量对光伏阵列的输出影响较小,而光强和温度对光伏输出功率的影响比较大。因此,在构建日特征向量时,主要以光强和温度为主,将风速等变量作为辅助变量。
可选的,步骤S106中将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果包括:在预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值;将深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值分别赋于深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型,得到融合后的模型组合;将待分析光伏数据输入融合后的模型组合进行数据预测,得到光伏功率预测结果。
进一步地,可选的,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值包括:分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的预测相对误差比重;根据预存相对误差比重分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的熵值;根据相对误差的熵值分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的变异程度系数;根据相对误差的变异程度系数分别计算深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值。
具体的,在本申请实施例中深度信念网络为Deep Belif Networks,简称DBN;支持向量机为Support Vector Regression,简称SVR;长短时记忆神经网络为Long Short TermMemory Network,简称LSTM;
为了使预测模型能在各种情况发挥它的作用,单个预测模型已经不再适用,必须提出一种新的方法,因为每个模型发挥的作用不相同,在对其进行组合之前,先给每个模型赋予一个合适的权值。权值的大小体现了相应模型对预测结果贡献的大小。为了能使组合的模型的预测效果达到最优,对单个模型权重的取值相当重要。一般对模型权重的选择有两种方法,分别是最优和非最优组合方法。最优组合方法是通过一些约束条件来建立一个目标函数,对该目标函数进行求解得出最优的权重系数。而非最优组合是通过计算单个模型的误差值来确定权值大小,如果单个模型的误差小,则相应的预测模型的权值就大,反之,模型的权值就小。
组合预测通过利用各种预测方法提供的信息组合模型,信息熵是一种有效的方法。因此,本申请实施例提供的数据处理方法利用信息熵的原理,求不同情况下单个模型的预测误差,通过预测误差信息确定各个模型的权值大小,具体如下:
信息熵是随机变量不确定性的度量,是一种评估信息离散程度的准则,本申请实施例提供的数据处理方法的参数定义为表2-6,计算公式如(2-13)所示:
表2-6
式(2-13)中,假设某一概率系统有n个事件;H∈[0,1],H表示信息熵值,单位为bit;p表示第i种状态可能出现的概率。
将熵值思想用来确定组合模型中各单项模型的权值。如果单个模型的预测的误差越小,该模型的熵值越大,说明该模型比较稳定,则在组合模型中,该模型占的权值就大。反之,如果一个模型的信息熵比较小,表明该模型不稳定,则权值就越小。根据信息熵的理论知识,求在组合预测中单个模型的权值,计算步骤如图4计算单个模型权重流程图所示。通过逐一计算样本的误差比重的熵值,得出变异程度系数,进而转化为权值。
在本申请实施例提供的数据处理方法中,使用了三个预测模型,将这三个预测模型组合,再将不同的权值赋予三个预测模型。组合后的模型综合了这三个模型各自的优点,使模型更具有实用性。
在同一外界条件下,模型预测的效果越好,该模型的权重系数也越大。因此,针对不同的天气,组合模型的预测结果在整体上很接近单一模型,甚至超过单一模型的预测结果。
按照熵权对测试集二中存在天气突变情况的四个季节代表日进行预测,截取每日8:00-17:00时段画出真实功率曲线与融合模型的组合预测曲线如图5是融合模型预测结果的示意图,组合后的预测曲线能够很好地跟踪真实值。为了进一步对比,将四种方法的模型评估结果列入表2-7,可以看出组合后的各评估结果都比其它三种单一模型好。
如图5所示,融合后的模型在综合了3种单一模型后在准确性方面有显著提高。以6月23日为例,画出4个预测曲线如图6所示,图6是四种方法预测结果。根据当日天气,正午12:00后受云层影响光照强度下降,在12:00前,SVR与LSTM最能接近真实值;但在接近12:00时,SVR出现大幅度误差;12:00后,DBN开始发挥优势,SVR仍有波动。组合后的曲线在每个时段内综合吸取各个单一模型结果,使最终结果趋向于最佳模型。由此可以看出组合预测模型具有较好预测性能,在天气突变的情况下也能较好地预测功率值。其中,图6分别描绘了12:00-12:30时段的预测结果和12:00-12:30时段预测误差。
表2-7
网络 | 决定系数 | 均偏差 | 均方差 | 相对误差 | 准确率 | 合格率 |
SVR | 0.8152 | 2.4373 | 11.6752 | 11.2784 | 87.7809 | 89.9290 |
LSTM | 0.9025 | 1.1556 | 2.5314 | 5.8220 | 94.3459 | 94.3758 |
DBN | 0.8113 | 1.5006 | 4.8769 | 7.5720 | 93.2264 | 93.6847 |
组合 | 0.9881 | 04058 | 0.3954 | 2.0397 | 97.0465 | 98.0645 |
由表2-7可知,组合后的结果各项指标平均值都有所改善,这是因为三种单一模型的结果对异常点很敏感,个别值的跳跃式误差导致整体平均值大幅度降低,而组合模型可以有效地降低异常点造成的影响,三种模型互相取长补短,保证最终的精度。
预测结果表明基于信息熵理论的组合预测模型能够很好地综合利用各个单一模型的优点。虽然组合模型不能保证每次的预测结果都比其他所有模型优良,使得其结果尽量靠近精度最好的模型。因此,组合预测模型具有较好地稳定性,且避免了因单一模型造成的灵活性低的缺陷。
本申请实施例提供的数据处理方法将深度学习的感知能力与机器学习的决策能力、长短时记忆网络的累计信息功能结合起来,形成深度强化学习,优势互补,提升预测精度;通过测试可看出组合预测模型具有较好的稳定性,即使在突变天气下也能有较高的预测精度,具有一定的实用价值。
实施例二
根据本发明实施例的一个方面,提供了一种数据处理装置,图7是根据本发明实施例的数据处理装置的示意图,如图7所示,包括:
获取模块72,用于获取光伏原始数据;预处理模块74,用于对光伏原始数据进行数据预处理,得到待分析光伏数据;预测模块76,用于将待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
可选的,预处理模块74包括:预处理单元,用于在光伏原始数据包括天气数据和功率数据的情况下,对天气数据和功率数据进行合并、筛选、转化和清洗,得到待分析光伏数据。
进一步地,可选的,预处理单元包括:筛选子单元,用于对天气数据和功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;转换子单元,用于将筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;数据清洗子单元,用于对天气数据的无量纲值和功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;合并子单元,用于合并清洗后的天气数据的无量纲值和功率数据的无量纲值,得到待分析光伏数据。
可选的,预测模块76包括:计算单元,用于在预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的误差值,确定深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值;赋值单元,用于将深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值分别赋于深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型,得到融合后的模型组合;预测单元,用于将待分析光伏数据输入融合后的模型组合进行数据预测,得到光伏功率预测结果。
进一步地,可选的,计算单元包括:第一计算子单元,用于分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的预测相对误差比重;第二计算子单元,用于根据预存相对误差比重分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的熵值;第三计算子单元,用于根据相对误差的熵值分别计算深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的相对误差的变异程度系数;第四计算子单元,用于根据相对误差的变异程度系数分别计算深度信念网络的功率预测模型的权值、支持向量机的功率预测模型的权值和长短时记忆网络的功率预测模型的权值。
实施例三
根据本发明实施例的一个方面,提供了一种数据处理方法的应用平台,应用于上述方法,包括:实时监控模块、预测曲线模块、数据分析模块和数据报表模块,其中,实时监控模块,用于显示气象数值实时曲线与功率数据实时曲线;预测曲线模块,用于显示气象数值预测曲线与功率数据预测曲线;数据分析模块,用于对历史数据库里的信息进行总结计算并展示;数据报表模块,用于将数据分析中的信息库以文件形式输出。
具体的,本申请实施例提供的数据处理方法的应用平台可以应用于对光伏电站输出功率进行预测,方便安排调度计划,也利于光电厂的运行和维护。
其中,本申请实施例提供的数据处理方法的应用平台将实施例一中三种单一模型和组合模型嵌入到系统中,通过系统界面的功能按键可以实现对气象数据及光伏功率的预测与实时监测。系统的开发为深度学习算法的实际应用提供了一种简便的可视化的实验测试平台。
本申请实施例提供的数据处理方法的应用平台的主要功能由四部分组成:监控部分、预测部分、总结部分、报表部分,具体分布如图8所示,图8是根据本发明实施例的数据处理方法的应用平台的示意图。
此外,本申请实施例提供的数据处理方法的应用平台设计与实现可以分三步:设计系统界面、嵌入软件算法和调试软件系统。将三种预测功率方法和组合模型方法集成到功率预测系统中。
首先对软件的界面进行设计,确定界面的尺寸大小,对界面的布局进行合理设计;其次将模型嵌入到相应的功能模块中;最后调试系统,确保系统中的各项功能可以实现。出自于人性化的考虑,系统应额外具备以下属性:(1)实用性:为了方便用户的使用,利用PyQt5工具包将本系统设置为一个exe的可执行文件,用户可以在其他计算机上使用。(2)注意事项:为了让用户进行正确操作,列出使用时需要注意的事项。
其中,本申请实施例提供的数据处理方法的应用平台的结构如下:
完整的预测系统的外部数据接口分为两个部分:NWP数据、气象网站数据。其中NWP系统以一定的周期不间断传输信息,数据被保存在临时数据库中。通过基Python开发的OpenStack云计算平台,进行主线程与次线程的调度和管理,以及数据的虚拟化存储。主线程采用RabbitMQ消息总线服务器,实现数据的快速收发和任务信号的调度、分派,通过分布式的任务队列模式实现并行的任务,即远程管理、任务监视、Numpy数值计算、Matplotlab流式绘图。
(1)实时监控模块包括气象数值实时曲线与功率数据实时曲线两部分,气象数据信息与NWP数据相符,包括辐照度、温度、湿度、风速等变量。曲线实时更新,展示前4个小时的变化情况,其中功率的实时曲线与先前的预测值同步显示,以表现功率预测的准确性。
(2)预测曲线
包括气象数值预测曲线与功率数据预测曲线两部分,气象数据信息来源于NWP的预测数据,包括辐照度、温度、湿度、风速等变量。曲线实时更新,展示从当前起4个小时内的预测值,功率曲线由后台计算得出。
(3)数据分析模块
对历史数据库里的信息进行总结计算并展示,计算内容包括:NWP数据各项平均值、装机容量、当日当前累计发电量、总负荷率、总用电率、光伏故障时间等。进入模型管理设置,可查看模型,如果有充分的数据也可以重新训练从而对模型参数进行更新。
(4)数据报表模块
将数据分析中的信息库以文件形式输出。
系统组成如图9所示。其中核心数据库负责数据的存储和与导出。图10为系统工作流程,多线程交互式的处理方式可以在运算的过程中不会造成界面的卡顿。
本申请实施例提供的数据处理方法的应用平台的系统界面中,在预测界面的运行前增设登录与注册前提,让用户实现注册功能,已注册的用户可用账号密码登录。此功能通过tkinter实现,tkinter是Python官方自带插件,编程过程简单,布局和摆放通过像素坐标定位。
点击注册按钮进入注册页面。注册成功后通过账号密码进行登录,之前的训练好的模型以“.pkl”格式保存在代码文件夹中,除了三种单一模型的参数外,还有统一的归一化(反归一化)处理模型。界面登录成功后会显示缓冲图标。在此过程中,代码文件夹中的临时表格开利用保存的模型进行运算,将结果写入临时文件,界面缓冲的过程即为计算的过程,这是为了进入界面后监测画面的卡顿影响实时性能。
按照以上步骤,最后设计的光伏功率预测系统界面。窗口大小为1580×910像素,配以下鼠标悬浮文本功能:任意空白区域有“欢迎您的使用”字样;所有按钮都有鼠标悬浮提示框功能;右上角“?”框显示该系统的详细介绍。
界面分为3个区,其中预测区可选择查看气象曲线与功率曲线,其中气象包括辐照度(全辐射度与散辐射度)、温度湿度、风向风速、气压;基于matplotlib的animation实现流式数据监控,其动画展示核心主要有两个:动画的骨架、更新的过程(即传入实时数据时图形的变化方法)。
这里由于Python拥有解释性语言的通病,容易暴露源程序;脱离解释器后,不能运行,不便于推广等缺点。将Python代码进行打包,打包后的文件可以隐藏源码,保护核心技术和知识产权;便于发布程序;可脱离Python环境在任意电脑上执行。本申请实施例使用的是pyinstaller工具,pyinstaller依赖pywin32扩展包。最后将代码文件打包成exe文件,降低脚本对环境的依赖性,同时使运行更加迅速。
鉴于光电厂运行与维护的实际需求,本申请实施例基于上述实施例1中的预测算法模型及组合预测模型,根据所要实现的相关功能,通过Python语言建立了图形用户界面,利用PyCharm、PyQt、tkinter和OpenStack等平台与工具进行了基于深度学习网络的光电输出功率预测系统平台的搭建。完成实时监控、预测曲线、数据分析、报表管理等功能。在实现数据监测的同时,为深度学习算法的实际应用提供了一种可视化的实验测试平台。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种数据处理方法,其特征在于,包括:
获取光伏原始数据;
对所述光伏原始数据进行数据预处理,得到待分析光伏数据;
将所述待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
2.根据权利要求1所述的方法,其特征在于,对所述光伏原始数据进行数据预处理,得到待分析光伏数据包括:
在所述光伏原始数据包括天气数据和功率数据的情况下,对所述天气数据和所述功率数据进行合并、筛选、转化和清洗,得到所述待分析光伏数据。
3.根据权利要求2所述的方法,其特征在于,对所述天气数据和所述功率数据进行合并、筛选、转化和清洗,得到所述待分析光伏数据包括:
对所述天气数据和所述功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;
将所述筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;
对所述天气数据的无量纲值和所述功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;
合并所述清洗后的天气数据的无量纲值和功率数据的无量纲值,得到所述待分析光伏数据。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,将所述待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果包括:
在所述预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的误差值,确定所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值;
将所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值分别赋于所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型,得到融合后的模型组合;
将所述待分析光伏数据输入所述融合后的模型组合进行数据预测,得到光伏功率预测结果。
5.根据权利要求4所述的方法,其特征在于,所述分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的误差值,确定所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值包括:
分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的预测相对误差比重;
根据所述预存相对误差比重分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的相对误差的熵值;
根据所述相对误差的熵值分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的相对误差的变异程度系数;
根据所述相对误差的变异程度系数分别计算所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值。
6.一种数据处理装置,其特征在于,包括:
获取模块,用于获取光伏原始数据;
预处理模块,用于对所述光伏原始数据进行数据预处理,得到待分析光伏数据;
预测模块,用于将所述待分析光伏数据输入预设模型组合进行数据预测,得到光伏功率预测结果。
7.根据权利要求6所述的装置,其特征在于,所述预处理模块包括:
预处理单元,用于在所述光伏原始数据包括天气数据和功率数据的情况下,对所述天气数据和所述功率数据进行合并、筛选、转化和清洗,得到所述待分析光伏数据。
8.根据权利要求7所述的装置,其特征在于,所述预处理单元包括:
筛选子单元,用于对所述天气数据和所述功率数据进行完整性检验、变化率检验和合理性检验,得到筛选后的天气数据和功率数据;
转换子单元,用于将所述筛选后的天气数据和功率数据进行数据单位的转换,得到天气数据的无量纲值和功率数据的无量纲值;
数据清洗子单元,用于对所述天气数据的无量纲值和所述功率数据的无量纲值中不满足预设条件的数据进行清洗,得到清洗后的天气数据的无量纲值和功率数据的无量纲值;
合并子单元,用于合并所述清洗后的天气数据的无量纲值和功率数据的无量纲值,得到所述待分析光伏数据。
9.根据权利要求6至8中任意一项所述的装置,其特征在于,所述预测模块包括:
计算单元,用于在所述预设模型组合包括深度信念网络的功率预测模型、支持向量机的功率预测模型和长短时记忆网络的功率预测模型的情况下,分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的误差值,确定所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值;
赋值单元,用于将所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值分别赋于所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型,得到融合后的模型组合;
预测单元,用于将所述待分析光伏数据输入所述融合后的模型组合进行数据预测,得到光伏功率预测结果。
10.根据权利要求9所述的装置,其特征在于,所述计算单元包括:
第一计算子单元,用于分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的预测相对误差比重;
第二计算子单元,用于根据所述预存相对误差比重分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的相对误差的熵值;
第三计算子单元,用于根据所述相对误差的熵值分别计算所述深度信念网络的功率预测模型、所述支持向量机的功率预测模型和所述长短时记忆网络的功率预测模型的相对误差的变异程度系数;
第四计算子单元,用于根据所述相对误差的变异程度系数分别计算所述深度信念网络的功率预测模型的权值、所述支持向量机的功率预测模型的权值和所述长短时记忆网络的功率预测模型的权值。
11.一种数据处理方法的应用平台,其特征在于,应用于权利要求1至5中任一项所述的方法,包括:实时监控模块、预测曲线模块、数据分析模块和数据报表模块,其中,
所述实时监控模块,用于显示气象数值实时曲线与功率数据实时曲线;
所述预测曲线模块,用于显示气象数值预测曲线与功率数据预测曲线;
所述数据分析模块,用于对历史数据库里的信息进行总结计算并展示;
所述数据报表模块,用于将数据分析中的信息库以文件形式输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911255735.8A CN111027768A (zh) | 2019-12-10 | 2019-12-10 | 数据处理方法、装置和应用平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911255735.8A CN111027768A (zh) | 2019-12-10 | 2019-12-10 | 数据处理方法、装置和应用平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111027768A true CN111027768A (zh) | 2020-04-17 |
Family
ID=70208352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911255735.8A Pending CN111027768A (zh) | 2019-12-10 | 2019-12-10 | 数据处理方法、装置和应用平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027768A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036634A (zh) * | 2020-08-26 | 2020-12-04 | 阳光电源股份有限公司 | 光伏发电功率的确定方法、预测系统及可读存储介质 |
CN112101651A (zh) * | 2020-09-08 | 2020-12-18 | 中国电子科技集团公司第十八研究所 | 电能源网络协调控制方法、系统及信息数据处理终端 |
CN113298297A (zh) * | 2021-05-10 | 2021-08-24 | 内蒙古工业大学 | 一种基于孤立森林与wgan网络的风电输出功率预测方法 |
CN115031363A (zh) * | 2022-05-27 | 2022-09-09 | 约克广州空调冷冻设备有限公司 | 预测空调性能的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809532A (zh) * | 2015-05-25 | 2015-07-29 | 海南汉能薄膜太阳能有限公司 | 一种光伏系统发电量的预测方法 |
CN108921339A (zh) * | 2018-06-22 | 2018-11-30 | 南京工程学院 | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 |
CN110474339A (zh) * | 2019-08-07 | 2019-11-19 | 国网福建省电力有限公司 | 一种基于深度发电负荷预测的电网无功控制方法 |
-
2019
- 2019-12-10 CN CN201911255735.8A patent/CN111027768A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809532A (zh) * | 2015-05-25 | 2015-07-29 | 海南汉能薄膜太阳能有限公司 | 一种光伏系统发电量的预测方法 |
CN108921339A (zh) * | 2018-06-22 | 2018-11-30 | 南京工程学院 | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 |
CN110474339A (zh) * | 2019-08-07 | 2019-11-19 | 国网福建省电力有限公司 | 一种基于深度发电负荷预测的电网无功控制方法 |
Non-Patent Citations (1)
Title |
---|
赵亮 等: "基于深度信念网络的光伏电站短期发电量预测", 《电力系统保护与控制》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036634A (zh) * | 2020-08-26 | 2020-12-04 | 阳光电源股份有限公司 | 光伏发电功率的确定方法、预测系统及可读存储介质 |
CN112101651A (zh) * | 2020-09-08 | 2020-12-18 | 中国电子科技集团公司第十八研究所 | 电能源网络协调控制方法、系统及信息数据处理终端 |
CN112101651B (zh) * | 2020-09-08 | 2023-11-14 | 中电科蓝天科技股份有限公司 | 电能源网络协调控制方法、系统及信息数据处理终端 |
CN113298297A (zh) * | 2021-05-10 | 2021-08-24 | 内蒙古工业大学 | 一种基于孤立森林与wgan网络的风电输出功率预测方法 |
CN115031363A (zh) * | 2022-05-27 | 2022-09-09 | 约克广州空调冷冻设备有限公司 | 预测空调性能的方法和装置 |
CN115031363B (zh) * | 2022-05-27 | 2023-11-28 | 约克广州空调冷冻设备有限公司 | 预测空调性能的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bosman et al. | PV system predictive maintenance: Challenges, current approaches, and opportunities | |
CN111027768A (zh) | 数据处理方法、装置和应用平台 | |
Paulescu et al. | Structured, physically inspired (gray box) models versus black box modeling for forecasting the output power of photovoltaic plants | |
Zheng et al. | Projection of future global offshore wind energy resources using CMIP data | |
Trigo-González et al. | Hourly PV production estimation by means of an exportable multiple linear regression model | |
CN113496311A (zh) | 光伏电站发电功率预测方法及系统 | |
Babatunde et al. | Predictive analysis of photovoltaic plants specific yield with the implementation of multiple linear regression tool | |
Santiago et al. | Graphical diagnosis of performances in photovoltaic systems: A case study in southern Spain | |
Shi et al. | First estimation of high-resolution solar photovoltaic resource maps over China with Fengyun-4A satellite and machine learning | |
Wimalaratne et al. | Unisolar: An open dataset of photovoltaic solar energy generation in a large multi-campus university setting | |
Tsafarakis et al. | A time-series data analysis methodology for effective monitoring of partially shaded photovoltaic systems | |
Khan et al. | Optimal photovoltaic panel direction and tilt angle prediction using stacking ensemble learning | |
CN115545333A (zh) | 一种多负荷日类型配电网负荷曲线预测方法 | |
Rao Kasagani et al. | Modeling of solar photovoltaic power using a two-stage forecasting system with operation and weather parameters | |
Chen et al. | Toward future information market: An information valuation paradigm | |
CN117236720A (zh) | 利用多气象因子特征的光伏电站发电功率预测方法 | |
CN110717623B (zh) | 融合多种天气状况的光伏发电功率预测方法及装置、设备 | |
Morcillo-Herrera et al. | Method to calculate the electricity generated by a photovoltaic cell, based on its mathematical model simulations in MATLAB | |
Wang et al. | Economics of physics-based solar forecasting in power system day-ahead scheduling | |
CN115640916A (zh) | 分布式电源出力和多能负荷态势感知方法及系统 | |
Peruchena et al. | A clustering approach for the analysis of solar energy yields: A case study for concentrating solar thermal power plants | |
Kastner et al. | Towards auto-calibrated UBEM using readily available, underutilized urban data: A case study for Ithaca, NY | |
Roumpakias et al. | Comparative Performance Analysis of a Grid-Connected Photovoltaic Plant in Central Greece after Several Years of Operation Using Neural Networks | |
Chakar et al. | A Bayesian inference approach to extract circuit model parameters and analyze photovoltaic degradation from power production data | |
Zhou et al. | Assessing distributed solar power generation potential under multi-gcms: A factorial-analysis-based random forest method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |