CN111027229A - 基于稀疏异方差多样条回归的风功率曲线拟合的方法 - Google Patents

基于稀疏异方差多样条回归的风功率曲线拟合的方法 Download PDF

Info

Publication number
CN111027229A
CN111027229A CN201911367126.1A CN201911367126A CN111027229A CN 111027229 A CN111027229 A CN 111027229A CN 201911367126 A CN201911367126 A CN 201911367126A CN 111027229 A CN111027229 A CN 111027229A
Authority
CN
China
Prior art keywords
sparse
regression
heteroscedastic
spline
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911367126.1A
Other languages
English (en)
Other versions
CN111027229B (zh
Inventor
汪运
邹润民
李意芬
杨佳欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201911367126.1A priority Critical patent/CN111027229B/zh
Publication of CN111027229A publication Critical patent/CN111027229A/zh
Application granted granted Critical
Publication of CN111027229B publication Critical patent/CN111027229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Wind Motors (AREA)

Abstract

本发明提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;根据获取到的数据构建稀疏异方差多样条回归模型;采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。本发明所提供的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,避免了冗余信息对最终回归结果的影响。

Description

基于稀疏异方差多样条回归的风功率曲线拟合的方法
技术领域
本发明涉及新能源领域和统计领域,特别涉及一种基于稀疏异方差多样条回归的风功率曲线拟合的方法。
背景技术
新能源的开发和利用成为解决世界性能源短缺和环境污染问题的重要途径。风能作为一种清洁、对环境友好且取之不尽用之不竭的可再生能源受到了越来越多的关注。一个准确的风功率曲线在风能的广泛应用中起到重要的作用。
通常,风机的生产厂商给自己生产的风机提供相应的理论功率曲线。这些理论的功率曲线一般是在固定的空气密度下得到的。然而,气候环境会随着时间和地理位置的不同而发生变化。因此,同一台风机在不同的季节和不同的风场中的性能都是有差异的。所以有必要从实际的数据中挖掘出反映风机实际性能的真实的功率曲线。根据建模理论,功率曲线的建模方法可以分成两大类,即曲线拟合方法和基于人工智能的方法。
曲线拟合模型通常的形状是S型,通常也可以分成两类:截断的曲线拟合模型和完整的曲线拟合模型。分段的曲线拟合模型包括线性分段模型、多项式模型、基于Sigmoid函数和高斯累计分布函数的风功率曲线模型。而完整的曲线拟合模型主要包括三参数逻辑函数(3-PLF)、四参数逻辑函数(4-PLF)、五参数逻辑函数(5-PLF)、六参数逻辑函数(6-PLF)以及修正的双曲正切模型(MHTan)。对于基于人工智能的方法来说,它们可以自动地学习处风速与功率之间的复杂非线性关系。比较流行的方法包括支持向量机(SVM)、高斯过程(GP)、极限学习机(ELM)、基于样条回归的模型、自适应神经模糊推理系统(ANFIS)、单调回归模型以及copula模型等。
当前,很多学者提出一些其他策略来增加功率曲线拟合精度。首先,提高数据质量。在开放环境下,收集到的数据中包含很多不确定性,如异常点和缺失数据。这些不确定性都会影响到功率曲线模型的训练。为了处理风电数据中的异常点,常用的方法有基于聚类的方法(如模糊C均值聚类和K均值聚类)和基于统计的方法(如3sigma原则等)。其次,开发新的考虑风功率了曲线拟合任务的相关特性的功率曲线拟合新方法。目前,已有一些文献发现功率曲线拟合任务的一些特性,如拟合误差的异方差特性以及复杂的非高斯特性,但并没有讨论考虑不同特性模型之间的差异性。根据发现的任务特性,学者们提出了异方差样条回归(HSRM)、鲁棒样条回归(RSRM)、基于混合非对称高斯分布的非对称样条回归(MoAG-ASR)以及基于混合非对称指数幂分布的非对称样条回归(MoAEP-ASR)。
在实际中,由于气候环境的复杂性,真实的功率曲线也将会很复杂。在此种情况下,真实的功率曲线很难用单一模型充分地描述。因此,开发具有超强非线性拟合能力的模型有助于得到更加精确的风功率曲线。另外,也需要考虑在模型中嵌入功率曲线任务的特性。这样才能构建解决特定问题的人工智能方法,并且需要对比考虑不同功率曲线拟合任务下模型的性能差异性,分析出哪种任务特性更适合于所研究的任务。
发明内容
本发明提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,其目的是为了解决现有功率曲线拟合的两大缺陷,导致功率曲线拟合精度较低误差较大的问题。
为了达到上述目的,本发明的实施例提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
其中,所述步骤1具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第t类的第i个样本可表示为
Figure BDA0002338702590000031
Nt表示第t类中所有样本的个数,且
Figure BDA0002338702590000032
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第t个样本中,均值和协方差分别表示为μt,∑t
步骤13,在第t个样本中,计算均值μt和样本
Figure BDA0002338702590000033
之间的马氏距离
Figure BDA0002338702590000034
Figure BDA0002338702590000035
步骤14,如果
Figure BDA0002338702590000036
的值大于给定的阈值,样本
Figure BDA0002338702590000037
将被视为异常点,否则将被视为正常样本。
其中,所述步骤2具体包括:
给定N个输入数据{xi}i=1,…,N,根据不同的样条基函数以及不同的节点数,可计算K个样条基函数矩阵H1,H2,…,HK;在上述矩阵中,得到的映射特征的维度分别为M1,…,MK
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure BDA0002338702590000038
其中,
Figure BDA0002338702590000039
表示的是一个
Figure BDA00023387025900000310
的0矩阵,
Figure BDA00023387025900000311
所述稀疏异方差多样条回归模型为:
Figure BDA00023387025900000312
其中,yi表示与输入xi相对应的真实输出,εi表示回归误差,ω=[ω1,…,ωK]T表示的是所有样条基函数矩阵的权重向量,
Figure BDA00023387025900000313
表示的是回归系数,
Figure BDA00023387025900000314
表示的是矩阵
Figure BDA00023387025900000315
的第i行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure BDA00023387025900000316
其中
Figure BDA00023387025900000317
表示的是一个
Figure BDA00023387025900000318
的矩阵,Y=[y1,…,yN]T表示的是输出向量,ε=[ε1,…,εN]T表示的是回归误差向量。
其中,所述步骤2还包括:
给定样条基函数矩阵的权重向量ω和回归系数β稀疏贝叶斯先验,对有效映射特征和样条基函数或矩阵的自动选择;
Figure BDA0002338702590000041
Figure BDA00023387025900000414
Figure BDA0002338702590000042
ηk~G(ηk|d0,e0)
其中,N(·)和G(·)分别表示的是高斯分布和Gamma分布的概率密度函数,
Figure BDA0002338702590000043
Figure BDA0002338702590000044
表示的是高斯分布的方差,b0,c0,d0,e0表示的是Gamma分布的参数;
回归误差εi满足如下先验分布:
Figure BDA0002338702590000045
γi~G(γi|f0,g0)
其中
Figure BDA0002338702590000046
表示的是高斯分布的方差,f0,g0表示的是Gamma分布的参数。
其中,所述步骤3具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数β的后验分布q(β)为多维高斯分布,
q(β)=N(β|μβ,∑β)
其中,μβ,∑β分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure BDA0002338702590000047
Figure BDA0002338702590000048
其中,<·>表示的是求期望运算,
Figure BDA0002338702590000049
是一个
Figure BDA00023387025900000415
的矩阵,
Figure BDA00023387025900000410
diag(·)用来产生对角矩阵的函数;
参数
Figure BDA00023387025900000416
的后验分布
Figure BDA00023387025900000417
是一个Gamma分布
Figure BDA00023387025900000411
其中Gamma分布参数
Figure BDA00023387025900000412
的迭代公式为
Figure BDA00023387025900000413
Figure BDA0002338702590000051
参数ω的后验分布q(ω)也是一个多维高斯分布,
q(ω)=N(ω|μω,∑ω)
其中μω,∑ω分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure BDA0002338702590000052
Figure BDA0002338702590000053
其中,B=diag(<η1>,…,<ηK>)。对于参数ηk和γi,它们的后验分布都是Gamma分布,
Figure BDA0002338702590000054
Figure BDA0002338702590000055
其中,参数
Figure BDA0002338702590000056
的迭代公式分别为
Figure BDA0002338702590000057
Figure BDA0002338702590000058
Figure BDA0002338702590000059
Figure BDA00023387025900000510
本发明的上述方案有如下的有益效果:
本发明的上述实施例所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,通过给定样条基函数权重系数和回归系数的稀疏先验,可以实现对样条基函数和映射特征的自适应选择,避免了冗余信息对最终回归结果的影响,在多样条回归模型的基础上嵌入了风功率曲线拟合的异方差特性,从而构建适用于风功率曲线拟合的特性机器学习方法。
附图说明
图1为本发明的步骤1的数据处理结果;
图2为本发明的模型SHMSRM-G拟合的功率曲线;
图3为本发明的模型SHMSRM-G中回归系数和样条基函数权重值;
图4为本发明的基于稀疏异方差多样条回归的风功率曲线拟合的方法的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的功率曲线拟合的两大缺陷,导致功率曲线拟合精度较低误差较大的问题,提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法。
如图4所示,本发明的实施例提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
其中,所述步骤1为数据预处理,具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第t类的第i个样本可表示为
Figure BDA0002338702590000061
Nt表示第t类中所有样本的个数,且
Figure BDA0002338702590000062
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第t个样本中,均值和协方差分别表示为μt,∑t
步骤13,在第t个样本中,计算均值μt和样本
Figure BDA0002338702590000071
之间的马氏距离
Figure BDA0002338702590000072
Figure BDA0002338702590000073
步骤14,如果
Figure BDA0002338702590000074
的值大于给定的阈值,样本
Figure BDA0002338702590000075
将被视为异常点,否则将被视为正常样本;最后,针对原始风电数据我们获得了去除异常点以后的处理后的数据。
其中,所述步骤2为构建稀疏异方差多样条回归模型,具体包括:
给定N个输入数据{xi}i=1,…,N,根据不同的样条基函数以及不同的节点数,可计算K个样条基函数矩阵H1,H2,…,HK;在上述矩阵中,得到的映射特征的维度分别为M1,…,MK
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure BDA0002338702590000076
其中,
Figure BDA0002338702590000077
表示的是一个
Figure BDA0002338702590000078
的0矩阵,
Figure BDA0002338702590000079
所述稀疏异方差多样条回归模型为:
Figure BDA00023387025900000710
其中,yi表示与输入xi相对应的真实输出,εi表示回归误差,ω=[ω1,…,ωK]T表示的是所有样条基函数矩阵的权重向量,
Figure BDA00023387025900000711
表示的是回归系数,
Figure BDA00023387025900000712
表示的是矩阵
Figure BDA00023387025900000713
的第i行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure BDA00023387025900000714
其中,
Figure BDA00023387025900000715
表示的是一个
Figure BDA00023387025900000716
的矩阵,Y=[y1,…,yN]T表示的是输出向量,ε=[ε1,…,εN]T表示的是回归误差向量。
尽管上述模型中考虑了多个样条回归模型,模型在理论上具有很强的非线性拟合能力。然而,冗余的映射特征和样条基函数或矩阵会对最终的模型性能产生影响。其中,所述步骤2还包括:给定样条基函数矩阵的权重向量ω和回归系数β稀疏贝叶斯先验,从而可以自动地实现对有效映射特征和样条基函数或矩阵的自动选择;给定参数ω和β如下贝叶斯先验:
Figure BDA0002338702590000081
Figure BDA00023387025900000814
Figure BDA0002338702590000082
ηk~G(ηk|d0,e0)
其中,N(·)和G(·)分别表示的是高斯分布和Gamma分布的概率密度函数,
Figure BDA0002338702590000083
Figure BDA0002338702590000084
表示的是高斯分布的方差,b0,c0,d0,e0表示的是Gamma分布的参数;
其中,考虑使用高斯分布假设来将风功率曲线拟合任务的异方差特性嵌入到回归模型当中,回归误差εi满足如下先验分布:
Figure BDA0002338702590000085
γi~G(γi|f0,g0)
其中
Figure BDA0002338702590000086
表示的是高斯分布的方差,f0,g0表示的是Gamma分布的参数。从上述公式可以看出,对于不同的样本,其误差满足参数不同的高斯分布。这也就意味着回归误差是异方差的。基于上述模型参数的先验分布,本发明构建了稀疏异方差多样条回归模型。
其中,所述步骤3为利用变分贝叶斯方法优化模型参数,具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数β的后验分布q(β)为多维高斯分布,
q(β)=N(β|μβ,∑β)
其中,μβ,∑β分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure BDA0002338702590000087
Figure BDA0002338702590000088
其中,<·>表示的是求期望运算,
Figure BDA0002338702590000089
是一个
Figure BDA00023387025900000810
的矩阵,
Figure BDA00023387025900000811
diag(·)用来产生对角矩阵的函数;
参数
Figure BDA00023387025900000815
的后验分布
Figure BDA00023387025900000816
是一个Gamma分布
Figure BDA00023387025900000812
其中Gamma分布参数
Figure BDA00023387025900000813
的迭代公式为
Figure BDA0002338702590000091
Figure BDA0002338702590000092
参数ω的后验分布q(ω)也是一个多维高斯分布,
q(ω)=N(ω|μω,∑ω)
其中μω,∑ω分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure BDA0002338702590000093
Figure BDA0002338702590000094
其中,B=diag(<η1>,…,<ηK>)。对于参数ηk和γi,它们的后验分布都是Gamma分布,
Figure BDA0002338702590000095
Figure BDA0002338702590000096
其中,参数
Figure BDA0002338702590000097
的迭代公式分别为
Figure BDA0002338702590000098
Figure BDA0002338702590000099
Figure BDA00023387025900000910
Figure BDA00023387025900000911
其中,所述步骤4为迭代优化参数,初始化模型参数,根据步骤三中得出的后验分布及参数公式,利用迭代的方法,求出参数ω和β的估计值μω和μβ
本发明的上述实施例所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,通过给定样条基函数权重系数和回归系数的稀疏先验,可以实现对样条基函数和映射特征的自适应选择,避免了冗余信息对最终回归结果的影响,在多样条回归模型的基础上嵌入了风功率曲线拟合的异方差特性,从而构建适用于风功率曲线拟合的特性机器学习方法。
本发明利用两个风电场的数据(数据集A和数据集B)对上述方法进行验证。每个数据集中只包含两个变量,风速和风功率。在数据集A中,5000个样本作为训练集,1000个样本作为测试集。数据集B中,训练集和测试集的样本个数分别为4500和1000。为了说明模型性能的有效性,本发明中采用的14个对比模型,包括3-PLF,4-PLF、5-PLF、6-PLF、MHTan、GP、SVM、ELM、ANFIS、SRM、HSRM、RSRM、MoAG-ASR和MoAEP-ASR。所采用的误差指标为平均绝对误差(MAE)、均方根误差(RMSE)和标准化的平均绝对百分比误差(NMAPE)。
对于本发明所提出的稀疏异方差多样条回归模型,主要考虑两种样条基函数,即B样条基和截断幂基。考虑的节点个数为{2,4,…,20}。从而产生了20个样条基函数矩阵。另外,参数b0,c0,do,e0,fo,g0,h0,i0,r0,s0的初始化参数值都为0.001。模型的最大迭代次数设置为50。
首先,利用基于模糊C均值的方法对原始数据进行处理。在这里,设定聚类的个数为5,阈值为15。根据数据预处理的相关描述,处理后的数据如图1所示。从图中可以看出,比较明显的异常点都被去除了。
利用上述处理后的数据训练所有功率曲线模型,所有模型在测试集上的结果如表1所示。
表1不同功率曲线模型在不同数据集上的拟合结果
Figure BDA0002338702590000101
Figure BDA0002338702590000111
从表1的结果可以看出,通常情况下基于人工智能技术的功率曲线拟合方法比完整的曲线拟合方法的效果要好。在数据集A中,最优的曲线拟合方法为5-PLF。在数据集B中,最优的曲线拟合方法为6-PLF。在数据集A和数据集B中,最优的人工智能方法为本发明所提出的模型SHMSRM-G。在所有的模型当中,本发明所提出的模型的拟合效果都是最好的。
在所有基于人工智能的方法中,SVM、GP、ELM和ANFIS并没有考虑风功率曲线拟合任务的特性,HSRM、RSRM、MoAG-ASR、MoAEP-ASR和SHMSRM-G都考虑了风功率曲线拟合任务的特性。从表1中的实验结果可以看出,一般情况下考虑了任务特性的方法的拟合效果要优于没有考虑任务特性的方法。
模型SHMSRM-G与HSRM的区别主要在于SHMSRM-G考虑了多个样条回归模型的拟合性能,而HSRM模型只考虑了单个样条回归模型。SHMSRM-G的功率曲线拟合效果优于HSRM的主要是因为多个样条回归模型的非线性拟合能力要强于单个样条回归模型。模型SHMSRM-G与RSRM、MoAG-ASR和MoAEP-ASR的区别体现在两方面:(1)前者考虑了多个样条回归模型,提升了非线性拟合能力,而后者只用了单个样条回归模型;(2)前者从个体的拟合误差的差异性出发,考虑了功率曲线拟合误差的异方差特性,后者从拟合误差的整体视角出发,考虑了拟合误差的非高斯特性。从表1也可以看出,由于上述两个原因,本发明提出的SHMSRM-G也优于RSRM、MoAG-ASR和MoAEP-ASR。
如图2所示,从效果来看,该模型可以很好地拟合风电数据,从而可以准确地描述风机发电特性。
如图3所示,很多值接近于0,意味着该项映射特征或者样条基函数对最终的回归结果影响较小。这也从侧面证明了稀疏贝叶斯先验确实能使得参数值稀疏;综上所述,本发明所提出的模型SHMSRM-G在功率曲线拟合任务中取得了良好的拟合效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
2.根据权利要求1所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤1具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第t类的第i个样本可表示为
Figure FDA0002338702580000011
Nt表示第t类中所有样本的个数,且
Figure FDA0002338702580000012
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第t个样本中,均值和协方差分别表示为μt,∑t
步骤13,在第t个样本中,计算均值μt和样本
Figure FDA0002338702580000013
之间的马氏距离
Figure FDA0002338702580000014
Figure FDA0002338702580000015
步骤14,如果
Figure FDA0002338702580000016
的值大于给定的阈值,样本
Figure FDA0002338702580000017
将被视为异常点,否则将被视为正常样本。
3.根据权利要求1所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤2具体包括:
给定N个输入数据{xi}i=1.…,N,根据不同的样条基函数以及不同的节点数,可计算K个样条基函数矩阵H1,H2,…,HK;在上述矩阵中,得到的映射特征的维度分别为M1,…,MK
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure FDA0002338702580000018
其中,
Figure FDA0002338702580000021
表示的是一个
Figure FDA0002338702580000022
的0矩阵,
Figure FDA0002338702580000023
所述稀疏异方差多样条回归模型为:
Figure FDA0002338702580000024
其中,yi表示与输入xi相对应的真实输出,εi表示回归误差,ω=[ω1,…,ωK]T表示的是所有样条基函数矩阵的权重向量,
Figure FDA00023387025800000217
表示的是回归系数,
Figure FDA0002338702580000025
表示的是矩阵
Figure FDA0002338702580000026
的第i行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure FDA0002338702580000027
其中
Figure FDA0002338702580000028
表示的是一个
Figure FDA0002338702580000029
的矩阵,Y=[y1,…,yN]T表示的是输出向量,ε=[ε1,…,εN]T表示的是回归误差向量。
4.根据权利要求3所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤2还包括:
给定样条基函数矩阵的权重向量ω和回归系数β稀疏贝叶斯先验,对有效映射特征和样条基函数或矩阵的自动选择;
Figure FDA00023387025800000210
Figure FDA00023387025800000211
Figure FDA00023387025800000212
ηk~G(ηk|d0,e0)
其中,N(·)和G(·)分别表示的是高斯分布和Gamma分布的概率密度函数,
Figure FDA00023387025800000213
Figure FDA00023387025800000214
表示的是高斯分布的方差,b0,c0,d0,e0表示的是Gamma分布的参数;
回归误差εi满足如下先验分布:
Figure FDA00023387025800000215
γi~G(γi|f0,g0)
其中
Figure FDA00023387025800000216
表示的是高斯分布的方差,f0,g0表示的是Gamma分布的参数。
5.根据权利要求4所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤3具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数β的后验分布q(β)为多维高斯分布,
q(β)=N(β|μβ,∑β)
其中,μβ,∑β分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure FDA0002338702580000031
Figure FDA0002338702580000032
其中,<·>表示的是求期望运算,
Figure FDA0002338702580000033
是一个
Figure FDA0002338702580000034
的矩阵,
Figure FDA0002338702580000035
diag(·)用来产生对角矩阵的函数;
参数
Figure FDA0002338702580000036
的后验分布
Figure FDA0002338702580000037
是一个Gamma分布
Figure FDA0002338702580000038
其中Gamma分布参数
Figure FDA0002338702580000039
的迭代公式为
Figure FDA00023387025800000310
Figure FDA00023387025800000311
参数ω的后验分布q(ω)也是一个多维高斯分布,
q(ω)=N(ω|μω,∑ω)
其中μω,∑ω分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure FDA00023387025800000312
Figure FDA00023387025800000313
其中B=diag(<η1>,…,<ηK>),对于参数ηk和γi,它们的后验分布都是Gamma分布,
Figure FDA00023387025800000314
Figure FDA00023387025800000315
其中参数
Figure FDA0002338702580000041
的迭代公式分别为
Figure FDA0002338702580000042
Figure FDA0002338702580000043
Figure FDA0002338702580000044
Figure FDA0002338702580000045
CN201911367126.1A 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法 Active CN111027229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911367126.1A CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911367126.1A CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Publications (2)

Publication Number Publication Date
CN111027229A true CN111027229A (zh) 2020-04-17
CN111027229B CN111027229B (zh) 2021-12-07

Family

ID=70213807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911367126.1A Active CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Country Status (1)

Country Link
CN (1) CN111027229B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612995A (zh) * 2021-03-08 2021-04-06 武汉理工大学 一种基于贝叶斯回归的多来源降雨数据融合算法及装置
CN113051769A (zh) * 2021-04-09 2021-06-29 中南大学 一种基于非对称损失与混合智能优化算法的功率曲线建模方法
CN117235449A (zh) * 2023-11-14 2023-12-15 湖北省气象服务中心(湖北省专业气象服务台) 基于sigmoid曲线及双包络算法的风电功率异常数据处理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105939026A (zh) * 2016-05-27 2016-09-14 电子科技大学 基于混合Laplace分布的风电功率波动量概率分布模型建立方法
CN106351793A (zh) * 2015-07-17 2017-01-25 通用电气公司 用于改进风力发电的系统和方法
CN106611243A (zh) * 2016-12-02 2017-05-03 华北电力大学(保定) 一种基于garch模型的风速预测残差修正方法
CN107657116A (zh) * 2017-09-26 2018-02-02 福州大学 一种风电场功率曲线仿射建模的方法
CN108090323A (zh) * 2018-01-10 2018-05-29 天津大学 基于无限混合高斯和样条回归的风电功率曲线拟合方法
CN108345961A (zh) * 2018-01-30 2018-07-31 上海电力学院 风电场群出力预测与分析方法
CN109002650A (zh) * 2018-08-21 2018-12-14 同济大学 一种风电机组功率曲线建模方法
CN109902340A (zh) * 2019-01-20 2019-06-18 东北电力大学 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN110265996A (zh) * 2019-02-26 2019-09-20 国网吉林省电力有限公司 一种适于光伏/风电功率预测的时间特征尺度建模方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106351793A (zh) * 2015-07-17 2017-01-25 通用电气公司 用于改进风力发电的系统和方法
CN105939026A (zh) * 2016-05-27 2016-09-14 电子科技大学 基于混合Laplace分布的风电功率波动量概率分布模型建立方法
CN106611243A (zh) * 2016-12-02 2017-05-03 华北电力大学(保定) 一种基于garch模型的风速预测残差修正方法
CN107657116A (zh) * 2017-09-26 2018-02-02 福州大学 一种风电场功率曲线仿射建模的方法
CN108090323A (zh) * 2018-01-10 2018-05-29 天津大学 基于无限混合高斯和样条回归的风电功率曲线拟合方法
CN108345961A (zh) * 2018-01-30 2018-07-31 上海电力学院 风电场群出力预测与分析方法
CN109002650A (zh) * 2018-08-21 2018-12-14 同济大学 一种风电机组功率曲线建模方法
CN109902340A (zh) * 2019-01-20 2019-06-18 东北电力大学 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN110265996A (zh) * 2019-02-26 2019-09-20 国网吉林省电力有限公司 一种适于光伏/风电功率预测的时间特征尺度建模方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SHENGLEI PEI,YIFEN LI: "Wind Turbine Power Curve Modeling with a Hybrid Machine Learning Technique", 《APPLIED SCIENCES》 *
YUN WANG,ETC: "Wind Power Curve Modeling and Wind Power Forecasting With Inconsistent Data", 《IEEE TRANSACTIONS ON SUSTAINABLE ENERGY》 *
张弛: "风电场短期风速预测若干问题研究", 《中国博士学位论文全文数据库 信息科技辑》 *
杨茂,等: "基于风速升降特性及支持向量机理论的异常数据重构算法", 《电力系统保护与控制》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612995A (zh) * 2021-03-08 2021-04-06 武汉理工大学 一种基于贝叶斯回归的多来源降雨数据融合算法及装置
CN113051769A (zh) * 2021-04-09 2021-06-29 中南大学 一种基于非对称损失与混合智能优化算法的功率曲线建模方法
CN117235449A (zh) * 2023-11-14 2023-12-15 湖北省气象服务中心(湖北省专业气象服务台) 基于sigmoid曲线及双包络算法的风电功率异常数据处理方法

Also Published As

Publication number Publication date
CN111027229B (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN111027229B (zh) 基于稀疏异方差多样条回归的风功率曲线拟合的方法
CN106529719B (zh) 基于粒子群优化算法风速融合的风电功率预测的方法
CN112699247A (zh) 一种基于多类交叉熵对比补全编码的知识表示学习框架
CN112288164B (zh) 一种计及空间相关性和修正数值天气预报的风功率组合预测方法
Wang et al. Sparse heteroscedastic multiple spline regression models for wind turbine power curve modeling
Liu et al. A two-stage deep autoencoder-based missing data imputation method for wind farm SCADA data
CN111079343B (zh) 一种基于宽度学习的风电机组有效风速估计方法
Wang et al. Wind power curve modeling with asymmetric error distribution
CN116503676B (zh) 一种基于知识蒸馏小样本增量学习的图片分类方法及系统
CN113313139A (zh) 基于机组动态特性的风电功率预测不确定性量化方法
CN112733273A (zh) 一种基于遗传算法和最大似然估计确定贝叶斯网络参数的方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN111814342A (zh) 一种复杂设备可靠性混合模型及其构建方法
CN115115090A (zh) 一种基于改进lstm-cnn的风功率短期预测方法
CN110991701A (zh) 一种基于数据融合的风电场风机风速预测方法及系统
CN111507365A (zh) 一种基于模糊聚类的置信规则自动生成方法
CN116345469A (zh) 一种基于图神经网络的电网潮流调整方法
CN111159900A (zh) 风机风速的预测方法及装置
CN108563829B (zh) 一种基于贝叶斯鲁棒函数回归的多步风速预报方法
CN116629137B (zh) 风电机组能效管理方法、装置及变桨通讯控制系统
CN110765420A (zh) 一种基于pso-fi的地面自动气象站气温观测资料质量控制方法
CN116341720A (zh) 基于动态图卷积和transformer的多风机风速风向预测方法
Yu et al. Knn, an underestimated model for regional rainfall forecasting
CN113048012B (zh) 基于混合高斯模型的风电机组偏航角度识别方法和装置
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant