CN117013527A - 一种分布式光伏发电功率预测方法 - Google Patents

一种分布式光伏发电功率预测方法 Download PDF

Info

Publication number
CN117013527A
CN117013527A CN202310992238.6A CN202310992238A CN117013527A CN 117013527 A CN117013527 A CN 117013527A CN 202310992238 A CN202310992238 A CN 202310992238A CN 117013527 A CN117013527 A CN 117013527A
Authority
CN
China
Prior art keywords
data
model
power generation
training
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202310992238.6A
Other languages
English (en)
Inventor
张新朝
魏云龙
孙磊
管立君
李一鹏
周达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Hanyao Carbon New Energy Technology Co ltd
Original Assignee
Hebei Hanyao Carbon New Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Hanyao Carbon New Energy Technology Co ltd filed Critical Hebei Hanyao Carbon New Energy Technology Co ltd
Priority to CN202310992238.6A priority Critical patent/CN117013527A/zh
Publication of CN117013527A publication Critical patent/CN117013527A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Power Engineering (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种分布式光伏发电功率预测方法,属于清洁能源领域。一种分布式光伏发电功率预测方法,先收集数据,从中提取有用的特征,对特征进行数据清洗和预处理,选择适合的机器学习及统计模型来进行功率预测;将一部分数据作为训练集用于模型训练,剩余部分用于模型评估和验证;使用训练集对选定的模型进行训练;使用测试集对训练好的模型进行验证;使用经过验证的模型对未来的功率进行预测;根据预测结果和实际发电数据的对比,对模型进行优化和改进;定期收集新的发电数据和气象数据,进行模型的更新和监测。本发明有效的解决了光伏发电系统的波动性和不稳定性问题,提高发电功率预测的精准性和实时性,优化能源调度和降低成本。

Description

一种分布式光伏发电功率预测方法
技术领域
本发明涉及清洁能源领域,更具体地说,涉及一种分布式光伏发电功率预测方法。
背景技术
1883年,美国发明家查尔斯·福兰特制造了第一块光伏电池,标志着光伏技术的起步。1954年,贝尔实验室的物理学家丹尼尔·查普、卡尔文·福勒和杰拉德·皮尔斯发明了第一块高效率的硅光伏电池,标志着光伏技术迈向实际应用的关键里程碑。此后,光伏技术开始在太空探索和通信领域得到广泛应用,并在地面应用中得到推广。
光伏发电是可持续发展的重要组成部分,是一种可再生能源形式,不像化石燃料一样会耗尽。通过光伏发电,可以减少对传统化石能源的依赖,降低温室气体排放,有助于应对气候变化和环境问题。光伏发电将太阳能直接转化为电能,广泛应用于供应家庭、工业、商业和公共机构的电力需求,包括偏远地区和农村地区的电气化、太空航天器和卫星、充电移动设备、电动汽车等。光伏发电在实现清洁能源、减少碳排放、提高能源安全、促进可持续发展等方面发挥着重要的作用。随着技术的不断进步和成本的降低,光伏发电将在未来继续发挥更大的潜力和作用。
但是光伏发电系统的发电功率受多种因素影响,包括太阳辐射、天气状况、时间变化等,这些因素使得光伏发电系统的功率表现出较大的不稳定性和波动性。
发明内容
本发明的目的在于提供一种分布式光伏发电功率预测方法,以解决上述背景技术中提出的问题:
但是光伏发电系统的发电功率受多种因素影响,包括太阳辐射、天气状况、时间变化等,这些因素使得光伏发电系统的功率表现出较大的不稳定性和波动性。
一种分布式光伏发电功率预测方法,包括以下步骤:
步骤1:数据收集,收集光伏系统的历史发电功率数据和相关的气象数据(包括太阳辐射、温度、湿度);
步骤2:特征提取,从收集到的数据中提取有用的特征,包括时间、天气条件、光伏组件参数;
步骤3:数据预处理,对提取到的特征进行数据清洗和预处理,包括处理缺失数据、异常值和噪声;
步骤4:模型选择,选择适合的机器学习及统计模型来进行功率预测;
步骤5:数据划分,将一部分数据作为训练集用于模型训练,剩余部分用于模型评估和验证;
步骤6:模型训练,使用训练集对选定的模型进行训练;
步骤7:模型验证,使用测试集对训练好的模型进行验证;
步骤8:预测应用,使用经过验证的模型对未来的功率进行预测;
步骤9:模型优化,根据预测结果和实际发电数据的对比,对模型进行优化和改进;
步骤10:持续监测和更新,定期收集新的发电数据和气象数据,进行模型的更新和监测。
优选的,所述数据收集是进行分布式光伏发电功率预测的第一步,包括明确预测目标和需求、确定数据类型和来源、获取实时数据、获取历史数据、数据清洗和预处理、数据整合、数据标记和标签、数据分割、数据存储和管理、数据更新和维护。
优选的,数据收集来源,包括现场传感器和监测系统、气象台站和气象数据服务、历史数据记录、第三方数据提供商、公共数据集和数据库、合作伙伴和数据共享、人工采集。
优选的,所述特征提取是从历史发电功率数据、气象数据中提取与功率变化相关的特征,包括:数据理解和探索、特征选择、时间特征、数值特征、类别特征、派生特征、统计特征、时序特征、特征缩放、特征重要性评估。
优选的,所述数据预处理,对收集到的原始数据进行清洗、转换和归一化,以下是数据预处理的步骤:
步骤3.1:数据清洗,检查数据中是否存在缺失值、重复值和错误值,选择使用均值、中位数和使用插值方法进行填充缺失值,及时剔除或修正重复值和错误值;
步骤3.2:异常值处理,检测和处理异常值,确保异常值不会对模型的训练和预测产生不良影响;
步骤3.3:特征选择,根据预测目标和实际需求,选择与预测有关的特征,剔除不相关和冗余的特征;
步骤3.4:数据变换,数据不满足模型的假设和要求时,进行数据变换,包括对数转换、指数转换、幂次转换;
步骤3.5:数据归一化、标准化,进行归一化和标准化处理数值型特征,使不同特征具有相似的尺度范围;
步骤3.6:特征工程,在数据预处理的过程中,进行特征工程,包括特征提取、派生和转换;
步骤3.7:数据分割,将预处理后的数据划分为训练集、验证集和测试集;
步骤3.8:处理类别特征,对于分类变量,需要进行编码处理,转换为数值特征;
步骤3.9:处理时间序列数据,对于时间序列数据,需要提取时间特征和生成滞后特征,捕捉时间序列中的模式和趋势;
步骤3.10:数据探索和可视化,在数据预处理的过程中,通过数据探索和可视化分析,了解数据的分布、关系和特点。
优选的,数据清洗是对收集到的原始数据进行处理,消除数据中缺失值、重复值和错误值,以保证数据的质量和准确性,包括观察和了解数据、处理缺失值、处理重复值、处理错误值、记录数据处理过程、数据验证和检查。
优选的,特征工程是在数据预处理的基础上,通过提取、转换和组合特征,以生成更有意义、更能表达数据特征的表示形式,包括特征选择、特征提取、特征转换、特征组合、数据降维、特征重要性评估、数据验证和检查。
优选的,数据分割是将整个数据集划分为训练集、验证集和测试集,用于模型的训练、参数调优和最终模型的评估,包括确定划分比例、随机化数据集、数据划分、保持类别平衡、数据标签和标识、数据验证、数据存储。
优选的,所述模型选择,根据问题类型和数据特征,选择候选模型,机器学习模型包括线性回归、决策树、支持向量机、神经网络,统计模型包括ARIMA、指数平滑法;使用训练集对每个候选模型进行训练,并使用验证集对模型进行评估和调参,选择最优的超参数和模型结构;使用验证集上的评估指标对所有候选模型进行比较,选择性能最佳的模型作为最终模型。
优选的,所述数据划分,将整个数据集划分为训练集和测试集,根据数据集的大小和问题的需求,确定划分比例是70%~80%的训练集和20%~30%的测试集。
优选的,所述模型训练,准备好训练集中的特征和对应的标签,根据选定的模型类型,选择合适的优化算法来训练模型,在开始训练之前,对模型的参数进行初始化,使用训练集中的特征和标签来训练模型,在模型训练过程中,进行多次迭代和调参,找到最优的模型参数,定期保存模型的中间结果;在训练完成后,使用验证集对训练得到的模型进行评估,进一步优化和改进模型的训练结果。
优选的,所述模型验证,将测试集的特征输入到训练好的模型中,得到模型的预测结果,将模型的预测结果与测试集的真实标签进行比较,计算模型在测试集上的性能指标,分析模型在测试集上的表现,理解模型的优势和局限性;记录和报告模型在测试集上的性能指标。
优选的,所述预测应用,将经过验证的模型加载到预测环境中,根据模型的输入要求,从采集到的数据中提取出需要用于预测的特征;将提取到的特征输入到模型中,进行未来功率的预测,模型根据学到的规律和参数,给出未来功率的预测结果,将模型预测的结果应用到实际情况中。
优选的,所述模型优化、持续监测和更新,确定数据采集的频率和时间,定期收集新的发电数据和气象数据,将新采集的数据存储在可靠的数据库中,根据新的数据,定期对模型进行更新和优化,在模型更新后,使用验证集和交叉验证方法对模型进行验证,评估模型的新性能和泛化能力;建立模型监测系统,定期监测模型的性能和预测结果,对于关键性的预测应用,建立报警机制;根据监测结果和实际应用反馈,持续改进模型的性能和表现;不断地优化模型,使其持续有效和适应新数据。
相比于现有技术,本发明的优点在于:
(1)精准性提高:分布式光伏发电功率预测利用先进的数据处理和机器学习技术,可以更准确地预测光伏发电系统的功率输出。通过考虑更多的影响因素和实时数据,预测模型可以得出更精准的预测结果。
(2)实时性:分布式光伏发电功率预测可以基于实时的气象数据、太阳辐射和其他相关信息进行预测。这使得预测模型能够及时地对光伏系统输出进行调整和优化,适应变化的天气条件。
(3)降低不确定性:光伏发电系统受天气等因素影响,输出功率具有一定的不确定性。分布式光伏发电功率预测通过综合考虑多个因素,可以降低不确定性,提高对发电量的预测准确性。
(4)能源调度优化:准确的功率预测有助于电网运营商和发电厂家进行能源调度和优化。根据预测结果,合理安排电网的供电和消耗,以确保电网的稳定性和可靠性。
(5)成本节约:通过精准的功率预测,可以有效地规划光伏发电站的运行,减少能源浪费,优化发电计划,从而降低发电成本。
(6)增加可靠性:分布式光伏发电功率预测有助于提高光伏发电系统的可靠性。在天气突变或其他异常情况下,预测模型可以帮助调整发电站的运行策略,保障电网稳定供电。
(7)智能化管理:预测模型的使用使光伏发电系统能够实现智能化管理和运维。预测结果为决策提供数据支持,优化运营策略,降低人工干预成本。
附图说明
图1为本发明的整体系统示意图。
具体实施方式
实施例:
分布式光伏发电功率预测是通过分析光照、天气条件、光伏电池组件参数等因素,预测未来一段时间内分布式光伏系统的发电功率。下面是一种分布式光伏发电功率预测方法的步骤:
步骤1:数据收集,收集光伏系统的历史发电功率数据和相关的气象数据(包括太阳辐射、温度、湿度)。这些数据可以从现场传感器、气象台站或者第三方数据提供商获取。
步骤2:特征提取,从收集到的数据中提取有用的特征,包括:时间(年、月、日、小时)、天气条件(光照强度、温度)、光伏组件参数(组件类型、功率)。
步骤3:数据预处理,对提取到的特征进行数据清洗和预处理,包括处理缺失数据、异常值和噪声,以及进行特征归一化或标准化操作,确保数据的质量和一致性。
步骤4:模型选择,选择适合的机器学习及统计模型来进行功率预测。常用的方法包括线性回归、支持向量机(SVM)、决策树、随机森林、神经网络。根据实际情况和数据特点选择最适合的模型。
步骤5:数据划分,将历史数据集划分为训练集和测试集。将一部分数据作为训练集用于模型训练,剩余部分用于模型评估和验证。
步骤6:模型训练,使用训练集对选定的模型进行训练。根据选择的模型算法和优化目标,调整模型参数以最小化预测误差。
步骤7:模型验证,使用测试集对训练好的模型进行验证。通过比较预测结果与实际观测值,评估模型的准确性和性能。
步骤8:预测应用,使用经过验证的模型对未来的功率进行预测。根据实际需求,可以进行不同时间尺度(小时、天、月)的功率预测,并结合实时的气象数据进行实时调整和优化。
步骤9:模型优化,根据预测结果和实际发电数据的对比,对模型进行优化和改进。可以调整特征选择、模型参数、模型结构来提高预测的准确性和稳定性。
步骤10:持续监测和更新,定期收集新的发电数据和气象数据,进行模型的更新和监测,以不断提升预测的准确性和适应性。
进一步,所述数据收集是进行分布式光伏发电功率预测的第一步,包括明确预测目标和需求、确定数据类型和来源、获取实时数据、获取历史数据、数据清洗和预处理、数据整合、数据标记和标签、数据分割、数据存储和管理、数据更新和维护。
进一步,数据收集来源,包括现场传感器和监测系统、气象台站和气象数据服务、历史数据记录、第三方数据提供商、公共数据集和数据库、合作伙伴和数据共享、人工采集。
进一步,所述特征提取是从历史发电功率数据、气象数据中提取与功率变化相关的特征,包括:数据理解和探索、特征选择、时间特征、数值特征、类别特征、派生特征、统计特征、时序特征、特征缩放、特征重要性评估。
进一步,所述数据预处理,在进行特征工程和建模之前,对收集到的原始数据进行清洗、转换和归一化,以下是数据预处理的步骤:
步骤3.1:数据清洗,检查数据中是否存在缺失值、重复值和错误值,选择使用均值、中位数和使用插值方法进行填充缺失值,及时剔除或修正重复值和错误值;
步骤3.2:异常值处理,检测和处理异常值,确保异常值不会对模型的训练和预测产生不良影响;
步骤3.3:特征选择,根据预测目标和实际需求,选择与预测有关的特征,剔除不相关和冗余的特征;
步骤3.4:数据变换,数据不满足模型的假设和要求时,进行数据变换,包括对数转换、指数转换、幂次转换;
步骤3.5:数据归一化、标准化,进行归一化和标准化处理数值型特征,使不同特征具有相似的尺度范围;
步骤3.6:特征工程,在数据预处理的过程中,进行特征工程,包括特征提取、派生和转换;
步骤3.7:数据分割,将预处理后的数据划分为训练集、验证集和测试集;
步骤3.8:处理类别特征,对于分类变量,需要进行编码处理,转换为数值特征;
步骤3.9:处理时间序列数据,对于时间序列数据,需要提取时间特征和生成滞后特征,捕捉时间序列中的模式和趋势;
步骤3.10:数据探索和可视化,在数据预处理的过程中,通过数据探索和可视化分析,了解数据的分布、关系和特点。
进一步,数据清洗是对收集到的原始数据进行处理,消除数据中缺失值、重复值和错误值,以保证数据的质量和准确性,包括观察和了解数据、处理缺失值、处理重复值、处理错误值、记录数据处理过程、数据验证和检查。
进一步,特征工程是在数据预处理的基础上,通过提取、转换和组合特征,以生成更有意义、更能表达数据特征的表示形式,包括特征选择、特征提取、特征转换、特征组合、数据降维、特征重要性评估、数据验证和检查。
进一步,数据分割是将整个数据集划分为训练集、验证集和测试集,用于模型的训练、参数调优和最终模型的评估,包括确定划分比例、随机化数据集、数据划分、保持类别平衡、数据标签和标识、数据验证、数据存储。
进一步,所述模型选择,根据问题类型和数据特征,选择候选模型,机器学习模型包括线性回归、决策树、支持向量机、神经网络,统计模型包括ARIMA、指数平滑法;使用训练集对每个候选模型进行训练,并使用验证集对模型进行评估和调参,选择最优的超参数和模型结构;使用验证集上的评估指标对所有候选模型进行比较,选择性能最佳的模型作为最终模型。
进一步,所述数据划分,将整个数据集划分为训练集和测试集,根据数据集的大小和问题的需求,确定划分比例是70%~80%的训练集和20%~30%的测试集。
进一步,所述模型训练,准备好训练集中的特征和对应的标签,根据选定的模型类型,选择合适的优化算法来训练模型,在开始训练之前,对模型的参数进行初始化,使用训练集中的特征和标签来训练模型,在模型训练过程中,进行多次迭代和调参,找到最优的模型参数,定期保存模型的中间结果;在训练完成后,使用验证集对训练得到的模型进行评估,进一步优化和改进模型的训练结果。
进一步,所述模型验证,将测试集的特征输入到训练好的模型中,得到模型的预测结果,将模型的预测结果与测试集的真实标签进行比较,计算模型在测试集上的性能指标,分析模型在测试集上的表现,理解模型的优势和局限性;记录和报告模型在测试集上的性能指标。
进一步,所述预测应用,将经过验证的模型加载到预测环境中,根据模型的输入要求,从采集到的数据中提取出需要用于预测的特征;将提取到的特征输入到模型中,进行未来功率的预测,模型根据学到的规律和参数,给出未来功率的预测结果,将模型预测的结果应用到实际情况中。
进一步,所述模型优化,将预测结果和实际发电数据进行可视化,计算预测值与实际值之间的误差,根据对比和误差分析的结果,调整模型的超参数,根据数据分析和领域知识,增加更多的特征来提高模型的预测能力,剔除异常值;在进行模型改进后,重新评估模型的性能,不断地进行优化和改进,达到满意的预测效果。
进一步,所述持续监测和更新,确定数据采集的频率和时间,定期收集新的发电数据和气象数据,将新采集的数据存储在可靠的数据库中,根据新的数据,定期对模型进行更新和优化,在模型更新后,使用验证集和交叉验证方法对模型进行验证,评估模型的新性能和泛化能力;建立模型监测系统,定期监测模型的性能和预测结果,对于关键性的预测应用,建立报警机制;根据监测结果和实际应用反馈,持续改进模型的性能和表现;不断地优化模型,使其持续有效和适应新数据。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种分布式光伏发电功率预测方法,其特征在于,包括以下步骤:
步骤1:数据收集,收集光伏系统的历史发电功率数据和相关的气象数据,所述气象数据,是对天气条件进行观测和记录的数据,包括太阳辐射、温度和湿度;
步骤2:特征提取,从收集到的数据中提取有用的特征,包括时间、天气条件、光伏组件参数;
步骤3:数据预处理,对提取到的特征进行数据清洗和预处理,包括处理缺失数据、异常值和噪声;
步骤4:模型选择,选择适合的机器学习及统计模型来进行功率预测;
步骤5:数据划分,将一部分数据作为训练集用于模型训练,剩余部分用于模型评估和验证;
步骤6:模型训练与验证,使用训练集对选定的模型进行训练,使用测试集对训练好的模型进行验证;
步骤7:预测应用,使用经过验证的模型对未来的功率进行预测;
步骤8:优化模型,持续监测和更新,根据预测结果和实际发电数据的对比,对模型进行优化和改进,定期收集新的发电数据和气象数据,进行模型的更新和监测。
2.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述数据收集是进行分布式光伏发电功率预测的第一步,包括明确预测目标和需求、确定数据类型和来源、获取实时数据、获取历史数据、数据清洗和预处理、数据整合、数据标记和标签、数据分割、数据存储和管理、数据更新和维护。
3.根据权利要求2所述的一种分布式光伏发电功率预测方法,其特征在于:数据收集来源,包括现场传感器和监测系统、气象台站和气象数据服务、历史数据记录、第三方数据提供商、公共数据集和数据库、合作伙伴和数据共享、人工采集。
4.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述特征提取是从历史发电功率数据、气象数据中提取与功率变化相关的特征,包括:数据理解和探索、特征选择、时间特征、数值特征、类别特征、派生特征、统计特征、时序特征、特征缩放、特征重要性评估。
5.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述数据预处理,对收集到的原始数据进行清洗、转换和归一化,以下是数据预处理的步骤:
步骤3.1:数据清洗,检查数据中是否存在缺失值、重复值和错误值,选择使用均值、中位数和使用插值方法进行填充缺失值,及时剔除或修正重复值和错误值;
步骤3.2:异常值处理,检测和处理异常值,确保异常值不会对模型的训练和预测产生不良影响;
步骤3.3:特征选择,根据预测目标和实际需求,选择与预测有关的特征,剔除不相关和冗余的特征;
步骤3.4:数据变换,数据不满足模型的假设和要求时,进行数据变换,包括对数转换、指数转换或幂次转换;
步骤3.5:数据归一化、标准化,进行归一化和标准化处理数值型特征,使不同特征具有相似的尺度范围;
步骤3.6:特征工程,在数据预处理的过程中,进行特征工程,包括特征提取、派生和转换;
步骤3.7:数据分割,将预处理后的数据划分为训练集、验证集和测试集;
步骤3.8:处理类别特征,对于分类变量,需要进行编码处理,转换为数值特征;
步骤3.9:处理时间序列数据,对于时间序列数据,需要提取时间特征和生成滞后特征,捕捉时间序列中的模式和趋势;
步骤3.10:数据探索和可视化,在数据预处理的过程中,通过数据探索和可视化分析,了解数据的分布、关系和特点。
6.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述模型选择,根据问题类型和数据特征,选择候选模型,机器学习模型包括线性回归、决策树、支持向量机、神经网络,统计模型包括ARIMA、指数平滑法;使用训练集对每个候选模型进行训练,并使用验证集对模型进行评估和调参,选择最优的超参数和模型结构;使用验证集上的评估指标对所有候选模型进行比较,选择性能最佳的模型作为最终模型。
7.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述数据划分,将整个数据集划分为训练集和测试集,根据数据集的大小和问题的需求,确定划分比例是70%~80%的训练集和20%~30%的测试集。
8.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述模型训练与验证,准备好训练集中的特征和对应的标签,根据选定的模型类型,选择合适的优化算法来训练模型,在开始训练之前,对模型的参数进行初始化,使用训练集中的特征和标签来训练模型,在模型训练过程中,进行多次迭代和调参,找到最优的模型参数,定期保存模型的中间结果;在训练完成后,使用验证集对训练得到的模型进行评估,进一步优化和改进模型的训练结果,将测试集的特征输入到训练好的模型中,得到模型的预测结果,将模型的预测结果与测试集的真实标签进行比较,计算模型在测试集上的性能指标,分析模型在测试集上的表现,理解模型的优势和局限性;记录和报告模型在测试集上的性能指标。
9.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述预测应用,将经过验证的模型加载到预测环境中,根据模型的输入要求,从采集到的数据中提取出需要用于预测的特征;将提取到的特征输入到模型中,进行未来功率的预测,模型根据学到的规律和参数,给出未来功率的预测结果,将模型预测的结果应用到实际情况中。
10.根据权利要求1所述的一种分布式光伏发电功率预测方法,其特征在于:所述模型优化、持续监测和更新,确定数据采集的频率和时间,定期收集新的发电数据和气象数据,将新采集的数据存储在可靠的数据库中,根据新的数据,定期对模型进行更新和优化,在模型更新后,使用验证集和交叉验证方法对模型进行验证,评估模型的新性能和泛化能力;建立模型监测系统,定期监测模型的性能和预测结果,对于关键性的预测应用,建立报警机制;根据监测结果和实际应用反馈,持续改进模型的性能和表现;不断地优化模型,使其持续有效和适应新数据。
CN202310992238.6A 2023-08-08 2023-08-08 一种分布式光伏发电功率预测方法 Withdrawn CN117013527A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310992238.6A CN117013527A (zh) 2023-08-08 2023-08-08 一种分布式光伏发电功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310992238.6A CN117013527A (zh) 2023-08-08 2023-08-08 一种分布式光伏发电功率预测方法

Publications (1)

Publication Number Publication Date
CN117013527A true CN117013527A (zh) 2023-11-07

Family

ID=88568807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310992238.6A Withdrawn CN117013527A (zh) 2023-08-08 2023-08-08 一种分布式光伏发电功率预测方法

Country Status (1)

Country Link
CN (1) CN117013527A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117394439A (zh) * 2023-12-01 2024-01-12 广州疆海科技有限公司 一种提高储能系统发电自用率的方法
CN117742135A (zh) * 2024-02-09 2024-03-22 石家庄学院 一种用于通信机房的光伏节能控制方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117394439A (zh) * 2023-12-01 2024-01-12 广州疆海科技有限公司 一种提高储能系统发电自用率的方法
CN117742135A (zh) * 2024-02-09 2024-03-22 石家庄学院 一种用于通信机房的光伏节能控制方法及系统

Similar Documents

Publication Publication Date Title
CN117013527A (zh) 一种分布式光伏发电功率预测方法
CN115796393B (zh) 基于多能互动的能源网管理优化方法、系统及存储介质
CN113496311A (zh) 光伏电站发电功率预测方法及系统
CN116914747B (zh) 电力用户侧负荷预测方法及系统
CN116128167B (zh) 一种基于云计算实时监测的分布式光伏发电分析方法
CN115081597A (zh) 一种基于机器学习的以电核碳方法、系统、设备和介质
CN117669960A (zh) 一种基于多变量气象因子的新能源功率预测方法
CN117634678A (zh) 基于实际运行场景的低碳园区碳排放预测方法
CN117251672A (zh) 基于电力数据的区域行业多维能源碳排放计算方法和装置
CN111967660A (zh) 一种基于svr的超短期光伏预测残差修正方法
CN116128211A (zh) 基于风光不确定性预报场景的风光水联合短期优化调度方法
Mantri et al. Solar Power Generation Prediction for Better Energy Efficiency using Machine Learning
CN117578534B (zh) 光伏储能系统的调度方法、装置、设备及存储介质
CN117175695B (zh) 一种基于柴油发电机组的光伏微网发电方法及系统
TWI783605B (zh) 太陽能系統發電量預測方法
Kaushik et al. Performance Analysis of Regression Models in Solar PV Forecasting
Sasaki et al. Daily Peak Load Demand Forecast Considering Weather Conditions
CN112348070A (zh) 一种智能电网中短期负荷预测方法及系统
CN117833361A (zh) 基于时间序列分析的燃煤电厂深度调峰预测方法及装置
CN117217417A (zh) 居民用电调节潜力评估方法
Liang et al. Predictive Modeling and Management of Solar Power Generation in a Factory: A Case Study in the Indian Region
CN118114809A (zh) 一种风力发电功率预测方法及装置
CN118095704A (zh) 基于大数据的乡村典型能源供需平衡方法及系统
CN118017498A (zh) 一种基于时间卷积网络与Informer组合模型的中长期电力负荷预测方法
Luo et al. A Short-Term Prediction Method for Photovoltaic Power Based on Similar Daily Set Training of Meteorological Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20231107