CN117458480A - 基于改进lof的光伏发电功率短期预测方法及系统 - Google Patents

基于改进lof的光伏发电功率短期预测方法及系统 Download PDF

Info

Publication number
CN117458480A
CN117458480A CN202311521025.1A CN202311521025A CN117458480A CN 117458480 A CN117458480 A CN 117458480A CN 202311521025 A CN202311521025 A CN 202311521025A CN 117458480 A CN117458480 A CN 117458480A
Authority
CN
China
Prior art keywords
data
photovoltaic output
time series
layer
photovoltaic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311521025.1A
Other languages
English (en)
Inventor
叶建东
冯开达
余玉晗
卓华硕
黄秀秀
林建熙
易杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Yangjiang Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Yangjiang Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Yangjiang Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202311521025.1A priority Critical patent/CN117458480A/zh
Publication of CN117458480A publication Critical patent/CN117458480A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/04Circuit arrangements for ac mains or ac distribution networks for connecting networks of the same frequency but supplied from different sources
    • H02J3/06Controlling transfer of power between connected networks; Controlling sharing of load between connected networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • H02J2300/24The renewable source being solar energy of photovoltaic origin

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Power Engineering (AREA)
  • Photovoltaic Devices (AREA)

Abstract

本发明涉及光伏发电技术领域,公开了一种基于改进LOF的光伏发电功率短期预测方法及系统,本方法通过基于K‑mediods聚类改进的LOF异常检测算法对历史光伏出力时间序列数据进行数据异常检测,提高数据异常检测准确性,同时,基于DBN神经网络的扩张因果卷积层对历史光伏出力时间序列纯净数据进行特征提取,并基于多头自注意力机制对特征向量进行加权处理,从而提高特征权重,充分挖掘数据信息,提高光伏功率数据特征提取的准确性,还基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,通过训练好的光伏出力短时预测模型对未来预设时刻的光伏出力进行预测,从而提高光伏出力预测的精度。

Description

基于改进LOF的光伏发电功率短期预测方法及系统
技术领域
本发明涉及光伏发电技术领域,尤其涉及一种基于改进LOF的光伏发电功率短期预测方法及系统。
背景技术
作为新能源发电的重要组成部分,光伏在配电网的渗透率不断提高。但受制于地理环境、气象要素和设备性能的影响,光伏发电量呈现出一定的随机性和波动性。而大规模分布式光伏的接入,一方面会加剧配电网负荷短时波动,影响电力实时平衡;另一方面,光伏发电功率与负荷特性不匹配造成消纳难题,为有源配电网运行带来严峻挑战。因此,高精度的光伏发电功率预测可为电网制定和调整调度计划提供技术支持,提高光伏电站经济效益。
目前国内外针对分布式光伏功率预测开展了许多研究,主要集中在确定性预测。预测方法可分为基于历史数据的统计模型和机器学习模型等。常用的统计方法包括支持向量机、极限学习机、回声状态网络等。但上述统计方法处理复杂非线性问题的能力有限,难以全面捕捉光伏功率数据的波动特征。随着人工智能技术的不断提升,深度学习因其强大的非线性拟合能力和泛化能力也被广泛用于新能源预测领域。然而,现有的研究大多只关注于预测方法的优化,而忽视了数据处理步骤对于提高样本质量的重要性。并且在处理长时间序列时,使用传统的循环神经网络(Recurrent Neural Network,RNN)和长短期记忆网络(Long Short-term Memory,LSTM)等会产生数据遗忘问题而导致预测效果不佳。单一的预测模型也难以充分挖掘数据信息,对于光伏功率数据特征的提取不够准确。
发明内容
本发明提供了一种基于改进LOF的光伏发电功率短期预测方法及系统,解决了单一的预测模型也难以充分挖掘数据信息,对于光伏功率数据特征的提取不够准确的技术问题。
有鉴于此,本发明第一方面提供了一种基于改进LOF的光伏发电功率短期预测方法,包括以下步骤:
获取历史光伏出力时间序列数据,对所述历史光伏出力时间序列数据进行归一化处理;
基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测;
根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据;
基于DBN神经网络的扩张因果卷积层对所述历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据;
基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据;
基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型;
通过所述光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
优选地,基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测的步骤具体包括:
通过下式计算历史光伏出力时间序列数据的局部异常因子为:
式中,i、j均表示数据样本点索引,LOFk(i)表示数据样本点i的第k局部异常因子,Nk(i)表示数据样本点i的第k距离邻域,lrd(i)、lrd(j)分别表示数据样本点i、j的局部可达密度;
其中,
式中,rk(i,j)表示数据样本点i到j的第k可达距离,rk(i,j)=max{kdt(j),d(i,j)}
其中,kdt(j)表示数据样本点j的第k距离,d(i,j)表示点i与点j之间距离,M表示历史光伏出力时间序列数据的数据样本点数;
将所述历史光伏出力时间序列数据按照局部异常因子进行排序,排序后的数据集记为P=(p1,p2,…,pM),PM表示第M个数据样本;
随机在数据集P中选择两个数据样本作为聚类中心;
计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中;
任意在数据集P中选择非聚类中心的数据样本PM代替聚类中心,通过下式的绝对误差函数作为准则函数为:
式中,R表示数据集P中所有数据样本的绝对误差之和,G表示聚类中心个数,G=2,g表示聚类中心索引,Cd表示第d个簇,xg表示簇Cd的簇中心点;
计算替换聚类中心前后的R的差值,将R的差值与零进行对比,若R<0,则将所述数据样本PM替代为新的聚类中心,并转至计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中的步骤,循环迭代更新直至迭代更新后的聚类中心不再发生更改,得到聚类结果,所述聚类结果包括数据正常样本和数据异常样本;
根据所述聚类结果确定数据异常阈值,将所述历史光伏出力时间序列数据与所述数据异常阈值进行比较,将大于所述数据异常阈值的历史光伏出力时间序列数据确定为数据异常值。
优选地,计算数据集P中其他的数据样本与每个聚类中心之间的相似度的步骤具体包括:
计算数据集P中其他的数据样本与每个聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离;
将数据样本与聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离进行距离平均融合,得到距离平均融合结果作为相似度。
优选地,根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据的步骤具体包括:
对数据异常值进行剔除,利用移动平均插值法对剔除的数据异常值进行插值处理,得到历史光伏出力时间序列纯净数据。
优选地,所述DBN神经网络的DBN的能量函数为:
式中,E(v,h|δ)为DBN的能量函数,δ为受限玻尔兹曼机中参数,δ={m,n,x},m和n分别为可视层和隐含层的偏置向量,x为可视层和隐含层间的权重矩阵,v,h分别为可视层与隐含层的状态,为可视层第ni个神经元的偏置,/>为可视层第ni个神经元,/>为隐含层第mj个神经元的偏置,/>为可视层第ni个神经元与隐含层第mj个神经元的连接权重,/>为隐含层第mj个神经元;
由DBN神经网络的DBN的能量函数得到联合概率密度分布为:
式中,Z(δ)为归一化因子,δ*为参数估计结果,L(δ)表示估计函数,N′表示偏置向量总数,p(vn|δ)为可视层状态下隐含层的神经元被激活概率,p(v,h|δ)为状态(v,h)的联合概率分布,为可视层状态下隐含层第mj个神经元被激活概率,/>为隐含层状态h下可见层第ni个神经元被激活概率。
优选地,基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据的步骤具体包括:
利用Sim函数计算特征向量与注意力层的注意力向量之间的特征相似度;
基于Softmax函数,利用特征相似度计算特征向量的注意力分布值为:
式中,pi为注意力分布值,Sim(ri,q)表示通过Sim函数计算得到的特征向量ri与注意力层的注意力向量q之间的特征相似度,T为多头自注意力机制的头数,z为输入的向量维度;
将特征向量与相应的注意力分布值进行加权求和,得到单头自注意力机制输出向量;
将所有次的单头自注意力机制输出向量进行拼接,得到光伏出力特征向量时间序列数据的输出结果为:
式中,S表示光伏出力特征向量时间序列数据的输出结果,表示向量拼接操作,HeadT表示第T头自注意力机制输出向量。
优选地,基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型的步骤具体包括:
构建单层GRU模型并接收加权后的光伏出力特征向量时间序列数据作为输入,通过下式的参数计算公式对所述输入进行操作,其中,参数计算公式为:
式中,ct为GRU重置门,Yt为单层GRU模型t时刻的输入,β和tanh分别为sigmoid激活函数和双曲正切激活函数,Wc、Wg和W分别为重置门、更新门和候选隐藏状态的权重矩阵,ht-1表示t-1时刻的隐藏层输出,为候选隐藏状态,gt为GRU更新门,ht为隐藏层输出;
根据单层GRU模型的输出设置正负序BiGRU模型,正负序BiGRU模型的计算过程为:
式中,分别为t时刻、t-1时刻的正序GRU模型输出,/>分别为t时刻、t-1时刻的负序GRU模型输出,Wcl和Wc2分别为正序输入权重矩阵和t-1时刻输出权重矩阵;Wvl与Wv2分别为负序GRU模型输入权重矩阵和t+1时刻输出权重矩阵;Wl与W2分别为正序GRU模型和负序GRU模型输出权重矩阵。
第二方面,本发明还提供了一种基于改进LOF的光伏发电功率短期预测系统,包括:
数据获取模块,用于获取历史光伏出力时间序列数据,对所述历史光伏出力时间序列数据进行归一化处理;
异常检测模块,用于基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测;
异常处理模块,用于根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据;
特征提取模块,用于基于DBN神经网络的扩张因果卷积层对所述历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据;
注意力加权模块,用于基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据;
模型训练模块,用于基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型;
预测模块,用于通过所述光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
第三方面,本发明还提供了一种电子设备,所述电子设备包括存储器和处理器;
所述存储器用于存储程序;
所述处理器执行所述程序实现上述的方法。
第四方面,本发明还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过基于K-mediods聚类改进的LOF异常检测算法对历史光伏出力时间序列数据进行数据异常检测,提高数据异常检测准确性,同时,基于DBN神经网络的扩张因果卷积层对历史光伏出力时间序列纯净数据进行特征提取,并基于多头自注意力机制对特征向量进行加权处理,从而提高特征权重,充分挖掘数据信息,提高光伏功率数据特征提取的准确性,还基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,通过训练好的光伏出力短时预测模型对未来预设时刻的光伏出力进行预测,从而提高光伏出力预测的精度。
附图说明
图1为本发明实施例提供的一种基于改进LOF的光伏发电功率短期预测方法的流程图;
图2为本发明实施例提供的一种基于改进LOF的光伏发电功率短期预测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1,本发明提供的一种基于改进LOF的光伏发电功率短期预测方法,包括以下步骤:
S1、获取历史光伏出力时间序列数据,对历史光伏出力时间序列数据进行归一化处理。
其中,可以对历史光伏出力时间序列数据进行统一量纲处理,将数据映射在[0,1]之间。
S2、基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测。
S3、根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据。
S4、基于DBN神经网络的扩张因果卷积层对历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据。
其中,DBN具有多个隐藏层的前馈神经网络,由多个受限玻尔兹曼机堆叠而成,低层表示原始数据信号,高层表示数据的特征。
DBN神经网络的DBN的能量函数为:
式中,E(v,h|δ)为DBN的能量函数,δ为受限玻尔兹曼机中参数,δ={m,n,x},m和n分别为可视层和隐含层的偏置向量,x为可视层和隐含层间的权重矩阵,v,h分别为可视层与隐含层的状态,为可视层第ni个神经元的偏置,/>为可视层第ni个神经元,/>为隐含层第mj个神经元的偏置,/>为可视层第ni个神经元与隐含层第mj个神经元的连接权重,为隐含层第mj个神经元;
由DBN神经网络的DBN的能量函数得到联合概率密度分布为:
式中,Z(δ)为归一化因子,δ*为参数估计结果,L(δ)表示估计函数,N′表示偏置向量总数,p(vn|δ)为可视层状态下隐含层的神经元被激活概率,p(v,h|δ)为状态(v,h)的联合概率分布,为可视层状态下隐含层第mj个神经元被激活概率,/>为隐含层状态h下可见层第ni个神经元被激活概率。
其中,扩张因果膨胀卷积层是可以用于提取特征中的隐藏信息和长期时间关系,能够有效的提取输入数据的特征,其不仅可以提取特征中的隐藏信息和长期时间关系,而且还能减少输入数据的特征维度,使得运算效率提高。
S5、基于多头自注意力机制对特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据。
其中,使用多头自注意力机制可以对特征向量动态生成注意力权值,并利用注意力权值对特征向量进行加权处理并输出。
S6、基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型。
其中,BIGRU层,使用前向和反向的两个GRU网络结构对因果膨胀卷积层的输出向量进行学习,得到双向的时序特征,并与非时序特征合并,输入到输出层。
在BiGRU神经网络运行数据处理时,当前时刻的输出不仅和之前的状态有关系,也和之后的状态相关。双向GRU是由两个GRU上下叠加在一起组成的,输出由这两个GRU的状态共同决定,可以更好地挖掘设备运行的时间序列在退化过程中的建模能力。同时,输出层采用全连接层,可以根据时序特征与非时序特征的合并结果进行输出。
S7、通过光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
需要说明的是,本方法通过基于K-mediods聚类改进的LOF异常检测算法对历史光伏出力时间序列数据进行数据异常检测,提高数据异常检测准确性,同时,基于DBN神经网络的扩张因果卷积层对历史光伏出力时间序列纯净数据进行特征提取,并基于多头自注意力机制对特征向量进行加权处理,从而提高特征权重,充分挖掘数据信息,提高光伏功率数据特征提取的准确性,还基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,通过训练好的光伏出力短时预测模型对未来预设时刻的光伏出力进行预测,从而提高光伏出力预测的精度。
在一个具体实施例中,步骤S2具体包括:
201、通过下式计算历史光伏出力时间序列数据的局部异常因子为:
式中,i、j均表示数据样本点索引,LOFk(i)表示数据样本点i的第k局部异常因子,Nk(i)表示数据样本点i的第k距离邻域,lrd(i)、lrd(j)分别表示数据样本点i、j的局部可达密度;
其中,
式中,rk(i,j)表示数据样本点i到j的第k可达距离,rk(i,j)=max{kdt(j),d(i,j)}
其中,kdt(j)表示数据样本点j的第k距离,d(i,j)表示点i与点j之间距离,M表示历史光伏出力时间序列数据的数据样本点数;
202、将历史光伏出力时间序列数据按照局部异常因子进行排序,排序后的数据集记为P=(p1,p2,…,pM),PM表示第M个数据样本;
203、随机在数据集P中选择两个数据样本作为聚类中心;
204、计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中;
在一个示例中,计算数据集P中其他的数据样本与每个聚类中心之间的相似度的步骤具体包括:
2041、计算数据集P中其他的数据样本与每个聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离;
2042、将数据样本与聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离进行距离平均融合,得到距离平均融合结果作为相似度。
其中,欧式距离计算为:
切比雪夫距离计算为:
dtch(x,y)=maxi(∣xi-yi∣)
曼哈顿距离计算为:
式中,n代表数据的维度,对于光伏发电功率时序数据n为2。
205、任意在数据集P中选择非聚类中心的数据样本PM代替聚类中心,通过下式的绝对误差函数作为准则函数为:
式中,R表示数据集P中所有数据样本的绝对误差之和,G表示聚类中心个数,G=2,g表示聚类中心索引,Cd表示第d个簇,xg表示簇Cd的簇中心点;
206、计算替换聚类中心前后的R的差值,将R的差值与零进行对比,若R<0,则将数据样本PM替代为新的聚类中心,并转至计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中的步骤,循环迭代更新直至迭代更新后的聚类中心不再发生更改,得到聚类结果,聚类结果包括数据正常样本和数据异常样本;
207、根据聚类结果确定数据异常阈值,将历史光伏出力时间序列数据与数据异常阈值进行比较,将大于数据异常阈值的历史光伏出力时间序列数据确定为数据异常值。
可以理解的是,采用K-mediods聚类算法获得数据异常阈值,避免人工选取导致的分界判断不精细问题,从而提高LOF异常检测精度。
由于由于目标是将数据分为正常和异常两类,故聚类中心个数为两个,通过聚类形成两类数据,即为正常和异常两类,将排序后的数据通过K-mediods聚类后即可根据分类界限得到LOF异常值检测的数据异常阈值。
在一个具体实施例中,步骤S3具体包括:
对数据异常值进行剔除,利用移动平均插值法对剔除的数据异常值进行插值处理,得到历史光伏出力时间序列纯净数据。
在一个具体实施例中,步骤S5具体包括:
501、利用Sim函数计算特征向量与注意力层的注意力向量之间的特征相似度;
502、基于Softmax函数,利用特征相似度计算特征向量的注意力分布值为:
pi=Softmax(Sim(ri,q))
式中,pi为注意力分布值,Sim(ri,q)表示通过Sim函数计算得到的特征向量ri与注意力层的注意力向量q之间的特征相似度,T为多头自注意力机制的头数,z为输入的向量维度;
503、将特征向量与相应的注意力分布值进行加权求和,得到单头自注意力机制输出向量;
504、将所有次的单头自注意力机制输出向量进行拼接,得到光伏出力特征向量时间序列数据的输出结果为:
式中,S表示光伏出力特征向量时间序列数据的输出结果,表示向量拼接操作,HeadT表示第T头自注意力机制输出向量。
在一个具体实施例中,步骤S6具体包括:
601、构建单层GRU模型并接收加权后的光伏出力特征向量时间序列数据作为输入,通过下式的参数计算公式对输入进行操作,其中,参数计算公式为:
式中,ct为GRU重置门,Yt为单层GRU模型t时刻的输入,β和tanh分别为sigmoid激活函数和双曲正切激活函数,Wc、Wg和W分别为重置门、更新门和候选隐藏状态的权重矩阵,ht-1表示t-1时刻的隐藏层输出,为候选隐藏状态,gt为GRU更新门,ht为隐藏层输出;
602、根据单层GRU模型的输出设置正负序BiGRU模型,正负序BiGRU模型的计算过程为:
式中,分别为t时刻、t-1时刻的正序GRU模型输出,/>分别为t时刻、t-1时刻的负序GRU模型输出,Wcl和Wc2分别为正序输入权重矩阵和t-1时刻输出权重矩阵;Wvl与Wv2分别为负序GRU模型输入权重矩阵和t+1时刻输出权重矩阵;Wl与W2分别为正序GRU模型和负序GRU模型输出权重矩阵。
以上为本发明提供的一种基于改进LOF的光伏发电功率短期预测方法的实施例的详细描述,以下为本发明提供的一种基于改进LOF的光伏发电功率短期预测系统的实施例的详细描述。
为了便于理解,请参阅图2,本发明还提供了一种基于改进LOF的光伏发电功率短期预测系统,包括:
数据获取模块100,用于获取历史光伏出力时间序列数据,对历史光伏出力时间序列数据进行归一化处理;
异常检测模块200,用于基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测;
异常处理模块300,用于根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据;
特征提取模块400,用于基于DBN神经网络的扩张因果卷积层对历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据;
注意力加权模块500,用于基于多头自注意力机制对特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据;
模型训练模块600,用于基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型;
预测模块700,用于通过光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
本发明还提供了一种电子设备,电子设备包括存储器和处理器;
存储器用于存储程序;
处理器执行程序实现上述的方法。
本发明还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,电子设备和计算机可读存储介质的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,电子设备,计算机可读存储介质和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.基于改进LOF的光伏发电功率短期预测方法,其特征在于,包括以下步骤:
获取历史光伏出力时间序列数据,对所述历史光伏出力时间序列数据进行归一化处理;
基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测;
根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据;
基于DBN神经网络的扩张因果卷积层对所述历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据;
基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据;
基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型;
通过所述光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
2.根据权利要求1所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测的步骤具体包括:
通过下式计算历史光伏出力时间序列数据的局部异常因子为:
式中,i、j均表示数据样本点索引,表示数据样本点i的第k局部异常因子,/>表示数据样本点i的第k距离邻域,/>、/>分别表示数据样本点i、j的局部可达密度;
其中,
式中,表示数据样本点i到j的第k可达距离,/>
其中,表示数据样本点j的第k距离,/>表示点i与点j之间距离,M表示历史光伏出力时间序列数据的数据样本点数;
将所述历史光伏出力时间序列数据按照局部异常因子进行排序,排序后的数据集记为,PM表示第M个数据样本;
随机在数据集P中选择两个数据样本作为聚类中心;
计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中;
任意在数据集P中选择非聚类中心的数据样本PM代替聚类中心,通过下式的绝对误差函数作为准则函数为:
式中,R表示数据集P中所有数据样本的绝对误差之和,G表示聚类中心个数,G=2,g表示聚类中心索引,表示第d个簇,/>表示簇/>的簇中心点;
计算替换聚类中心前后的R的差值,将R的差值与零进行对比,若R<0,则将所述数据样本PM替代为新的聚类中心,并转至计算数据集P中其他的数据样本与每个聚类中心之间的相似度,并将相应的数据样本划分至相似度最高的聚类中心所在的类簇中的步骤,循环迭代更新直至迭代更新后的聚类中心不再发生更改,得到聚类结果,所述聚类结果包括数据正常样本和数据异常样本;
根据所述聚类结果确定数据异常阈值,将所述历史光伏出力时间序列数据与所述数据异常阈值进行比较,将大于所述数据异常阈值的历史光伏出力时间序列数据确定为数据异常值。
3.根据权利要求2所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,计算数据集P中其他的数据样本与每个聚类中心之间的相似度的步骤具体包括:
计算数据集P中其他的数据样本与每个聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离;
将数据样本与聚类中心之间的欧式距离、切比雪夫距离和曼哈顿距离进行距离平均融合,得到距离平均融合结果作为相似度。
4.根据权利要求1所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据的步骤具体包括:
对数据异常值进行剔除,利用移动平均插值法对剔除的数据异常值进行插值处理,得到历史光伏出力时间序列纯净数据。
5.根据权利要求1所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,所述DBN神经网络的DBN的能量函数为:
式中,为DBN的能量函数,/>为受限玻尔兹曼机中参数,/>,m和n分别为可视层和隐含层的偏置向量,x为可视层和隐含层间的权重矩阵,/>分别为可视层与隐含层的状态,/>为可视层第ni个神经元的偏置,/>为可视层第ni个神经元,/>为隐含层第/>个神经元的偏置,/>为可视层第ni个神经元与隐含层第/>个神经元的连接权重,/>为隐含层第/>个神经元;
由DBN神经网络的DBN的能量函数得到联合概率密度分布为:
式中,为归一化因子,/>为参数估计结果,/>表示估计函数,/>表示偏置向量总数,为可视层状态下隐含层的神经元被激活概率,/>为状态/>的联合概率分布,为可视层状态下隐含层第/>个神经元被激活概率,/>为隐含层状态h下可见层第ni个神经元被激活概率。
6.根据权利要求1所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据的步骤具体包括:
利用Sim函数计算特征向量与注意力层的注意力向量之间的特征相似度;
基于Softmax函数,利用特征相似度计算特征向量的注意力分布值为:
式中,为注意力分布值,/>表示通过Sim函数计算得到的特征向量/>与注意力层的注意力向量/>之间的特征相似度,T为多头自注意力机制的头数,z为输入的向量维度;
将特征向量与相应的注意力分布值进行加权求和,得到单头自注意力机制输出向量;
将所有次的单头自注意力机制输出向量进行拼接,得到光伏出力特征向量时间序列数据的输出结果为:
式中,S表示光伏出力特征向量时间序列数据的输出结果,表示向量拼接操作,/>表示第T头自注意力机制输出向量。
7.根据权利要求1所述的基于改进LOF的光伏发电功率短期预测方法,其特征在于,基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型的步骤具体包括:
构建单层GRU模型并接收加权后的光伏出力特征向量时间序列数据作为输入,通过下式的参数计算公式对所述输入进行操作,其中,参数计算公式为:
式中,为GRU重置门,/>为单层GRU模型t时刻的输入,/>和tanh分别为sigmoid激活函数和双曲正切激活函数,/>、/>和/>分别为重置门、更新门和候选隐藏状态的权重矩阵,/>表示t-1时刻的隐藏层输出,/>为候选隐藏状态,/>为GRU更新门,/>为隐藏层输出;
根据单层GRU模型的输出设置正负序BiGRU模型,正负序BiGRU模型的计算过程为:
式中,、/>分别为t时刻、t-1时刻的正序GRU模型输出,/>、/>分别为t时刻、t-1时刻的负序GRU模型输出,/>和/>分别为正序输入权重矩阵和t-1时刻输出权重矩阵;/>与/>分别为负序GRU模型输入权重矩阵和t+1时刻输出权重矩阵;/>与/>分别为正序GRU模型和负序GRU模型输出权重矩阵。
8.基于改进LOF的光伏发电功率短期预测系统,其特征在于,包括:
数据获取模块,用于获取历史光伏出力时间序列数据,对所述历史光伏出力时间序列数据进行归一化处理;
异常检测模块,用于基于K-mediods聚类改进的LOF异常检测算法对经归一化处理后的历史光伏出力时间序列数据进行数据异常检测;
异常处理模块,用于根据数据异常检测结果对数据异常值进行预处理,得到历史光伏出力时间序列纯净数据;
特征提取模块,用于基于DBN神经网络的扩张因果卷积层对所述历史光伏出力时间序列纯净数据进行特征提取,得到光伏出力特征向量时间序列数据;
注意力加权模块,用于基于多头自注意力机制对所述特征向量进行加权处理,得到加权后的光伏出力特征向量时间序列数据;
模型训练模块,用于基于加权后的光伏出力特征向量时间序列数据对BiGRU神经网络进行训练,构建光伏出力短时预测模型;
预测模块,用于通过所述光伏出力短时预测模型对未来预设时刻的光伏出力进行预测。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器;
所述存储器用于存储程序;
所述处理器执行所述程序实现权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
CN202311521025.1A 2023-11-15 2023-11-15 基于改进lof的光伏发电功率短期预测方法及系统 Pending CN117458480A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311521025.1A CN117458480A (zh) 2023-11-15 2023-11-15 基于改进lof的光伏发电功率短期预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311521025.1A CN117458480A (zh) 2023-11-15 2023-11-15 基于改进lof的光伏发电功率短期预测方法及系统

Publications (1)

Publication Number Publication Date
CN117458480A true CN117458480A (zh) 2024-01-26

Family

ID=89596565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311521025.1A Pending CN117458480A (zh) 2023-11-15 2023-11-15 基于改进lof的光伏发电功率短期预测方法及系统

Country Status (1)

Country Link
CN (1) CN117458480A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117938555A (zh) * 2024-03-25 2024-04-26 衢州海易科技有限公司 车联网云平台日志序列和参数异常检测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117938555A (zh) * 2024-03-25 2024-04-26 衢州海易科技有限公司 车联网云平台日志序列和参数异常检测方法及系统

Similar Documents

Publication Publication Date Title
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN107992976B (zh) 热点话题早期发展趋势预测系统及预测方法
Yang et al. Combined wireless network intrusion detection model based on deep learning
CN112733447B (zh) 一种基于域自适应网络的水下声源定位方法及系统
CN117458480A (zh) 基于改进lof的光伏发电功率短期预测方法及系统
CN117117859B (zh) 基于神经网络的光伏发电功率预测方法及系统
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN112363896A (zh) 日志异常检测系统
CN111985719A (zh) 一种基于改进的长短期记忆网络的电力负荷预测方法
CN115659254A (zh) 一种双模态特征融合的配电网电能质量扰动分析方法
CN115115125A (zh) 基于深度学习融合模型的光伏功率区间概率预测方法
CN112906935A (zh) 一种风电场超短期功率预测方法
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
CN117688362A (zh) 基于多元数据特征增强的光伏功率区间预测方法及装置
CN117574776A (zh) 一种面向任务规划的模型自学习优化方法
CN116245259B (zh) 基于深度特征选择的光伏发电预测方法、装置和电子设备
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN115794805A (zh) 一种中低压配网量测数据补齐方法
CN115619028A (zh) 一种基于聚类算法融合的电力负荷精准预测方法
CN115496153A (zh) 多头自注意力的深度卷积嵌入聚类风光荷联合场景方法
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN115081551A (zh) 基于K-Means聚类和优化RVM线损模型建立方法及系统
CN114298413A (zh) 一种水电机组振摆趋势预测方法
CN117829822B (zh) 一种电力变压器故障预警方法及系统
CN116742613A (zh) 基于多相关日数值天气预报关联特性的风电功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination