CN114578087B - 基于非支配排序和随机模拟算法的风速不确定性度量方法 - Google Patents
基于非支配排序和随机模拟算法的风速不确定性度量方法 Download PDFInfo
- Publication number
- CN114578087B CN114578087B CN202210080454.9A CN202210080454A CN114578087B CN 114578087 B CN114578087 B CN 114578087B CN 202210080454 A CN202210080454 A CN 202210080454A CN 114578087 B CN114578087 B CN 114578087B
- Authority
- CN
- China
- Prior art keywords
- population
- random
- individuals
- dominant
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01P—MEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
- G01P5/00—Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft
- G01P5/001—Full-field flow measurement, e.g. determining flow velocity and direction in a whole region at the same time, flow visualisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Physiology (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及风速不确定性度量技术领域,且公开了基于非支配排序和随机模拟算法的风速不确定性度量方法,包括以下步骤:S1、利用非支配排序遗传算法和包络熵原理确定变分模态分解的模态数,实现参数的自适应选取;S2、选择麻雀搜索算法进行参数寻优,消除随机输入权重与偏置对深度极限学习机的影响,对各分量序列进行预测;S3、在点预测的基础上,使用马尔科夫链构造随机矩阵,对误差序列进行随机模拟,并根据蒙特卡洛思想得到若干独立的随机抽样结果,将模拟的误差分位数序列与点预测结果相结合,得到区间预测结果。S4、对本文所提方法进行实例评估和验证,证明方法的可行性和优越性,建立完整的风速不确定性度量方案。
Description
技术领域
本发明涉及风速不确定性度量技术领域,尤其涉及基于非支配排序和随机模拟算法的风速不确定性度量方法。
背景技术
随着传统能源日渐枯竭,全球环境压力较大,对可再生能源的需求逐步增加。风能作为一种清洁且永不枯竭的资源,受到广泛关注。大力发展风电产业,对调整能源结构、推进能源生产和消费革命具有重要意义。但风能本身具有强波动性和受制于地理位置等特点,其规律性差,难以准确预测,因此量化风速波动风险是当前研究重点。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了基于非支配排序和随机模拟算法的风速不确定性度量方法,提出带精英策略的非支配排序遗传算法(NSGA-II),结合包络熵原理,以确定变分模态分解(即VMD)模态分解数;利用麻雀搜索算法消除深度极限学习机中,各极限学习机-自动编码器的随机输入权重与随机偏置的影响;基于马尔科夫链和蒙特卡洛思想,利用随机模拟算法构造预测区间,从而建立完整的风速不确定性度量方案。
(二)技术方案
本发明提供如下技术方案:基于非支配排序和随机模拟算法的风速不确定性度量方法,包括以下步骤:
S1、数据集划分,按照一定比例划分训练集和测试集,训练集用于网络的学习与建立,测试集用来检验预测方法的可行性;
S2、风速序列分解,为充分挖掘数据信息,便于后期建立预测模型,对风速序列进行分解,利用非支配排序遗传算法和包络熵原理确定变分模态分解(即VMD)的模态数个数和惩罚因子,实现参数的自适应选取;
S3、建立点预测模型,利用深度极限学习机对各分量序列进行预测,由于最终模型效果受各极限学习机-自动编码器(即ELM-AE)的随机输入权重与随机偏置的影响,选择麻雀搜索算法进行参数寻优,以提高预测精度,将各分量预测值相加,得到最终点预测序列;
S4、构建区间预测方案,对训练误差使用马尔科夫链构造随机矩阵,再根据蒙特卡洛思想进行反复抽样,按所提出的分位数抽样方法,得到若干独立且符合实际分布的随机抽样结果,将模拟的误差分位数序列与点预测结果相结合,从而得到不确定性预测区间;
S5、不确定性度量评估,使用平均绝对误差(MAE)、绝对平均百分比误差(MAPE)和均方根误差(RMSE)评估点预测结果:
其中,n为序列个数,yt为原始测试集,/>为对应预测序列。计算平均宽度Widavg和覆盖率Ratcor,衡量不确定性度量效果,指标公式如下:
其中Ut和Lt分别为分位数统计量中的上下分位数,为真实值在预测区间内的个数。
在一种可能的实施方式中,所述S2中快速非支配排序算法为:假设种群为N,种群中支配个体n的个体数为xn,被个体n支配的个体集合为Sn,算法步骤为:
1)找到种群中所有xn=0的个体,并保存到当前集合G1中;
2)对于当前集合G1中的每一个个体k,考察其所支配的个体集合Sk,将集合Sk中每个个体m的xm减1,即xm=xm-1,若xm=0则将个体m存入另一个集合中U;
3)将G1中的个体作为第一级非支配层的最优个体,赋予该集合内个体相同的非支配序nrank,并以U作为当前集合继续分级操作,直到整个种群均被分级。
在一种可能的实施方式中,所述S2中结合包络熵原理构造非支配排序遗传算法的目标函数:
1)对原时序信号s进行希尔伯特变换,得到输出序列S,即:S=Hilbert(s);
2)获取输出信号的极值,完成包络线ei的提取,并对包络信号进行傅里叶变换,取绝对值得到时序信号的包络谱即:/>其中si和Si分别为希尔伯特变换中第i个输入和输出信号;
3)对包络谱进行标准化并计算包络熵Ei,即:其中φi为标准化包络谱,N为信号个数,K为φi长度;
4)适应度函数由以下公式得到:其中size为种群大小。
在一种可能的实施方式中,所述S2中还包括基于非支配排序的粒子群优化算法:用一种粒子来模拟鸟类个体,每个粒子可视为搜索空间中的一个搜索个体,粒子的当前位置即为对应优化问题的一个候选解,粒子的飞行过程即为该个体的搜索过程,粒子的飞行速度可根据粒子历史最优位置和种群历史最优位置进行动态调整,粒子仅具有两个属性:速度和位置,其中速度代表移动的快慢,位置代表移动的方向,每个粒子单独搜寻的最优解叫做个体极值,粒子群中最优的个体极值作为当前全局最优解,通过不断迭代,更新速度和位置信息,最终得到满足终止条件的最优解,本文选用粒子群优化算法作为非支配排序遗传算法中的基础遗传算法,从而实现准确快速寻优。
在一种可能的实施方式中,所述S3中基于麻雀搜索算法优化深度极限学习机:制定了如下规则:
1)具有较好适应度值的发现者在搜索过程中优先获取食物,并为所有搜索者提供觅食的方向,且发现者可以获得比搜索者更大的搜索范围;
2)每个麻雀都有成为发现者的可能,只要其寻找到更优解,但种群中发现者所占比例保持不变;
3)一些搜索者可能会监视发现者,甚至与发现者争夺食物,以获得更好的食物来源;
4)由于发现者带头领导觅食,为获得能量,一些饥饿个体可能去其他区域搜寻食物;
5)当种群受到捕食者威胁时,会进行反捕食行为:处在种群外围的麻雀极易受到捕食者的攻击,需要不断地调整位置以保护种群,与此同时,位于种群中心的麻雀会去接近它们相邻的同伴,尽量减少处于危险区域。
在一种可能的实施方式中,基于上述规则,麻雀搜索算法优化深度极限学习机的算法步骤如下:
1)模型初始化,参数包括深度极限学习机(即DELM)中各极限学习机-自动编码器(即ELM-AE)输入权重与偏置、种群数量n、发现者数量、最大迭代数rmax等,以矩阵X表示种群位置,矩阵Fit中每行的值为个体适应值,发现者具有较好适应值,
其中d为维数;
2)发现者位置更新,根据上述规则,发现者位置按下式迭代更新:
其中r为当前迭代;j=1,2,..,d;/>表示第i个麻雀的第j维度迭代r次的值;α是(0,1]范围内的随机数;alarm表示报警值范围为[0,1];safety为安全阈值范围为[0.5,1];U是服从正态分布的随机数;I表示元素都为1的1*d维矩阵,当alarm<safety时,周围没有捕食者,发现者可以进行广泛食物搜索;如果alarm>safety表示部分个体发现了捕食者,整个种群需要迅速飞到其他安全区域;
3)一些饥饿的个体监视着发现者,当发现他们找到优秀的食物时,会去争夺食物,这些个体的位置更新公式为:
其中Xworst为种群最糟糕的位置;Pbest为当前最优发现者的位置;C表示元素随机为1或-1的1*d维矩阵,且有C+=CT(CCT)-1,当i>n/2时,表示饥饿者xi没有得到食物,需要到其他地方捕食;如果i≤n/2,饥饿者xi将在Pbest周围觅食;
4)设置10%到20%的个体为侦察者,可以发现威胁种群的因素,这些个体的位置为:
其中Xbest为当前最优位置;λ是标准正态分布随机数,ω是范围在[-1,1]的随机数,用来控制步长和方向;ε是一个很小的常数,以避免零除法误差,当/>时,个体处于种群边缘,易遭遇危险;如果个体位于种群中心,需要接近其他个体以便于发现危险;
5)依照当前位置更新最优适应度,重复上述步骤,直到满足收敛准则或达到最大迭代次数;
6)输出经麻雀搜索算法优化后各极限学习机-自动编码器(即ELM-AE)输入权重与偏置。
在一种可能的实施方式中,所述S4中基于随机模拟算法构造预测区间:
1)计算转移矩阵,对于给定的状态数m,将数据集Y=(y1,y2,...,yn)划分到状态集(Q1,Q2,...,Qm)中,计算各个状态之间的转换次数,将从状态i到状态j的转换次数记为kij,由kij构成的矩阵即为状态转移矩阵;
2)生成概率矩阵,将状态转移矩阵中的各个元素除以本行元素之和,即得到概率转移矩阵H,其中元素hij为:当训练集足够大时,hij可近似看作当前状态为i时下一状态变为j的概率P(yk+1=j|yk=i),且满足:/>
3)生成随机样本,对于序列末尾样本yn,找到其对应的某个状态a,在转移概率矩阵H的该行中,按照概率(ha1,ha2,...,ham)进行随机抽样,选取状态b作为下一个状态,在状态b下,通过分位数抽样获得随机样本,即从0到1的均匀分布中选择一个随机数u,在状态Qb中,选取u分位数作为本次抽样的具体取值,此次抽样所得l个序列记为均匀抽样有时不能全面显示信息,因此在这一步中,用分位数抽样代替均匀抽样,可以更有效地保留不同状态下分布差异的信息;
4)蒙特卡洛抽样,基于上述抽样的可重复性和随机性,可生成任意v组随机样本Y(1),Y(2),Y(3),...,Y(v),结合蒙特卡洛思想,不同组之间的抽样独立同分布,即每列从概率角度上来自相同的随机序列,但取值各不相同;
5)生成预测区间,对于v组随机序列Y(1),Y(2),Y(3),...,Y(v)上的任一时刻t(1≤t≤l),可以计算该时刻v个不同预测值的分位数统计量,例如上下5%分位数、中位数等,对于任一给定的置信度1-α,只需要计算时刻t中v个抽样样本值的上α/2分位数Ut(α/2)和下α/2分位数Lt(α/2)组成的闭区间,就可以构成时刻t在1-α置信度下的预测区间,将时刻t从1到l遍历,就可以得到所考察时间内的区间预测结果。
与现有技术相比,本发明提供了基于非支配排序和随机模拟算法的风速不确定性度量方法,具备以下有益效果:
1、本发明基于非支配排序遗传算法、包络熵原理和麻雀搜索算法,结合马尔可夫过程和蒙特卡洛思想的随机模拟算法,建立一套完整的风速不确定性度量方法。2、采用带有精英策略的非支配排序遗传算法对变分模态分解(即VMD)的参数进行寻优,引入包络熵作为适应度函数,建立模态分解数和惩罚因子的自适应选取方法。3、利用麻雀搜索算法消除深度极限学习机中随机输入权重和偏置的影响,从而提高预测准确性,得到点预测结果。4、对误差序列构建马尔科夫链,结合分位数抽样和蒙特卡洛思想构建随机模拟算法,综合点预测结果得到任意置信度下的预测区间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
图1为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的流程图;
图2为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的西班牙Sotavento风电场1月数据样本(间隔10分钟);
图3为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的西班牙Sotavento风电场8月数据样本(间隔5分钟);
图4为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的风速数据的基本统计特征;
图5为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的模型预测1月份点预测结果;
图6为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的模型预测8月份点预测结果;
图7为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的1月各模型的点预测误差评价指标值;
图8为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的8月各模型的点预测误差评价指标值;
图9为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的1月份测试集的不确定性预测结果;
图10为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的8月份测试集的不确定性预测结果;
图11为本发明所提供的基于非支配排序和随机模拟算法的风速不确定性度量方法的区间预测的评价指标。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
如图1-11所示,本发明提供了基于非支配排序和随机模拟算法的风速不确定性度量方法,包括以下步骤:
S1、数据集划分,按照一定比例划分训练集和测试集,训练集用于网络的学习与建立,测试集用来检验预测方法的可行性;
S2、风速序列分解,为充分挖掘数据信息,便于后期建立预测模型,对风速序列进行分解,利用非支配排序遗传算法和包络熵原理确定变分模态分解(即VMD)的模态数个数和惩罚因子,实现参数的自适应选取;
S3、建立点预测模型,利用深度极限学习机对各分量序列进行预测,由于最终模型效果受各极限学习机-自动编码器(即ELM-AE)的随机输入权重与随机偏置的影响,选择麻雀搜索算法进行参数寻优,以提高预测精度,将各分量预测值相加,得到最终点预测序列;
S4、构建区间预测方案,对训练误差使用马尔科夫链构造随机矩阵,再根据蒙特卡洛思想进行反复抽样,按所提出的分位数抽样方法,得到若干独立且符合实际分布的随机抽样结果,将模拟的误差分位数序列与点预测结果相结合,从而得到不确定性预测区间;
S5、不确定性度量评估,使用平均绝对误差(MAE)、绝对平均百分比误差(MAPE)和均方根误差(RMSE)评估点预测结果:
其中,n为序列个数,yt为原始测试集,/>为对应预测序列。计算平均宽度Widavg和覆盖率Ratcor,衡量不确定性度量效果,指标公式如下:
其中Ut和Lt分别为分位数统计量中的上下分位数,为真实值在预测区间内的个数。
为量化风速不确定信息,建立高精度、高覆盖率的区间预测体系,综合分解降噪手段、深度学习网络和参数优化算法,建立性能优良的点预测模型,在此基础上结合统计学知识,基于马尔科夫链方法和蒙特卡洛思想,利用随机模拟算法构造预测区间,从而建立完整的风速不确定性度量方案。首先,考虑到风速序列的非平稳、非线性特征,利用变分模态分解算法进行信号分解与重构,以消除噪声的干扰;考虑到模态数个数和惩罚因子需人为设定的缺陷,利用带有精英策略的非支配排序粒子群算法结合包络熵原理,建立自适应参数选择方法,避免模态混叠。其次,使用带有多个极限学习机-自动编码器的深度极限学习机对分解后的序列进行预测,此网络模型精度高、运行速度快,风速预测能力较强;并利用寻优能力强、收敛速度快的群体优化算法消除随机输入权重与随机偏置的影响,进一步提高预测准确性,得到确定性预测值。最后,引入马尔可夫链描述风速特征,与蒙特卡洛抽样相结合,模拟风速随机波动特征;提出分位数抽样方法,最大限度贴合原始数据并充分保留原始信息,利用统计学原理得到任意置信度下的风速预测区间。
在一种可能的实施方式中,所述S2中快速非支配排序算法为:假设种群为N,种群中支配个体n的个体数为xn,被个体n支配的个体集合为Sn,算法步骤为:
1)找到种群中所有xn=0的个体,并保存到当前集合G1中;
2)对于当前集合G1中的每一个个体k,考察其所支配的个体集合Sk,将集合Sk中每个个体m的xm减1,即xm=xm-1,若xm=0则将个体m存入另一个集合中U;
3)将G1中的个体作为第一级非支配层的最优个体,赋予该集合内个体相同的非支配序nrank,并以U作为当前集合继续分级操作,直到整个种群均被分级,与NSGA中采用的非支配排序方法相比,NSGA-II中采用快速非支配排序算法,有效降低计算复杂度,解决了运行效率问题。
拥挤度估计和拥挤度比较算子:为克服NSGA中共享参数需人工设定的问题,NSGA-II中加入拥挤度计算步骤,以保证种群的多样性,拥挤度表示种群中给定点周围个体的密度,特定解周围的拥挤度用个体周围包含该个体但不包含其余个体的最大长方形的长来表示,最终得到各个个体的拥挤度nc。
经上述过程后,种群中的个体都用非支配序nrank和拥挤度nc这两个属性,接下来定义拥挤度比较算子:在比较个体p和个体q时,若满足prank<qrank,或prank=qrank且pc>qc,则个体p获胜。即如果两个个体的非支配排序不同,取等级较优的个体;如果两个个体在同一级,取处于较不拥挤位置的个体。
精英策略:NSGA-II中将同一代的父代种群Fl与子代种群Ol融合生成新的临时种群Tl,种群大小为2N,并对该种群排序分层,生成一系列非支配集Wi并计算拥挤度。由于Tl中既包含父代个体也包含子代个体,故经过非支配排序后的集合W1最优,将W1加入新的父代种群Fl+1中,若种群个数小于N则继续添加下一级非支配集W2,直到种群数量超过N。
精英策略的提出将父代种群与所产生的子代种群相融合,共同竞争产生下一代种群,扩大了采样空间,保持了父代中的优良个体遗传下一代;通过对所有个体分层存放的方式,保证了满意解不被丢弃,提高了种群水平。
在一种可能的实施方式中,所述S2中结合包络熵原理构造非支配排序遗传算法的目标函数:
1)对原时序信号s进行希尔伯特变换,得到输出序列S,即:S=Hilbert(s);
2)获取输出信号的极值,完成包络线ei的提取,并对包络信号进行傅里叶变换,取绝对值得到时序信号的包络谱即:/>其中si和Si分别为希尔伯特变换中第i个输入和输出信号;
3)对包络谱进行标准化并计算包络熵Ei,即:其中φi为标准化包络谱,N为信号个数,K为φi长度;
4)适应度函数由以下公式得到:其中size为种群大小。
在一种可能的实施方式中,所述S1中还包括基于非支配排序的粒子群优化算法:用一种粒子来模拟鸟类个体,每个粒子可视为搜索空间中的一个搜索个体,粒子的当前位置即为对应优化问题的一个候选解,粒子的飞行过程即为该个体的搜索过程,粒子的飞行速度可根据粒子历史最优位置和种群历史最优位置进行动态调整,粒子仅具有两个属性:速度和位置,其中速度代表移动的快慢,位置代表移动的方向,每个粒子单独搜寻的最优解叫做个体极值,粒子群中最优的个体极值作为当前全局最优解,通过不断迭代,更新速度和位置信息,最终得到满足终止条件的最优解,本文选用粒子群优化算法作为非支配排序遗传算法中的基础遗传算法,从而实现准确快速寻优。
在一种可能的实施方式中,所述S3中基于麻雀搜索算法优化深度极限学习机:制定了如下规则:
1)具有较好适应度值的发现者在搜索过程中优先获取食物,并为所有搜索者提供觅食的方向,且发现者可以获得比搜索者更大的搜索范围;
2)每个麻雀都有成为发现者的可能,只要其寻找到更优解,但种群中发现者所占比例保持不变;
3)一些搜索者可能会监视发现者,甚至与发现者争夺食物,以获得更好的食物来源;
4)由于发现者带头领导觅食,为获得能量,一些饥饿个体可能去其他区域搜寻食物;
5)当种群受到捕食者威胁时,会进行反捕食行为:处在种群外围的麻雀极易受到捕食者的攻击,需要不断地调整位置以保护种群,与此同时,位于种群中心的麻雀会去接近它们相邻的同伴,尽量减少处于危险区域。
在一种可能的实施方式中,基于上述规则,麻雀搜索算法优化深度极限学习机的算法步骤如下:
1)模型初始化,参数包括深度极限学习机(即DELM)中各极限学习机-自动编码器(即ELM-AE)输入权重与偏置、种群数量n、发现者数量、最大迭代数rmax等,以矩阵X表示种群位置,矩阵Fit中每行的值为个体适应值,发现者具有较好适应值,
其中d为维数;
2)发现者位置更新,根据上述规则,发现者位置按下式迭代更新:
其中r为当前迭代;j=1,2,..,d;/>表示第i个麻雀的第j维度迭代r次的值;α是(0,1]范围内的随机数;alarm表示报警值范围为[0,1];safety为安全阈值范围为[0.5,1];U是服从正态分布的随机数;I表示元素都为1的1*d维矩阵,当alarm<safety时,周围没有捕食者,发现者可以进行广泛食物搜索;如果alarm>safety表示部分个体发现了捕食者,整个种群需要迅速飞到其他安全区域;
3)一些饥饿的个体监视着发现者,当发现他们找到优秀的食物时,会去争夺食物,这些个体的位置更新公式为:
其中Xworst为种群最糟糕的位置;Pbest为当前最优发现者的位置;C表示元素随机为1或-1的1*d维矩阵,且有C+=CT(CCT)-1,当i>n/2时,表示饥饿者xi没有得到食物,需要到其他地方捕食;如果i≤n/2,饥饿者xi将在Pbest周围觅食;
4)设置10%到20%的个体为侦察者,可以发现威胁种群的因素,这些个体的位置为:
其中Xbest为当前最优位置;λ是标准正态分布随机数,ω是范围在[-1,1]的随机数,用来控制步长和方向;ε是一个很小的常数,以避免零除法误差,当/>时,个体处于种群边缘,易遭遇危险;如果/>个体位于种群中心,需要接近其他个体以便于发现危险;
5)依照当前位置更新最优适应度,重复上述步骤,直到满足收敛准则或达到最大迭代次数;
6)输出经麻雀搜索算法优化后各极限学习机-自动编码器(即ELM-AE)输入权重与偏置。
在一种可能的实施方式中,所述S4中基于随机模拟算法构造预测区间:
1)计算转移矩阵,对于给定的状态数m,将数据集Y=(y1,y2,...,yn)划分到状态集(Q1,Q2,...,Qm)中,计算各个状态之间的转换次数,将从状态i到状态j的转换次数记为kij,由kij构成的矩阵即为状态转移矩阵;
2)生成概率矩阵,将状态转移矩阵中的各个元素除以本行元素之和,即得到概率转移矩阵H,其中元素hij为:当训练集足够大时,hij可近似看作当前状态为i时下一状态变为j的概率P(yk+1=j|yk=i),且满足:/>
3)生成随机样本,对于序列末尾样本yn,找到其对应的某个状态a,在转移概率矩阵H的该行中,按照概率(ha1,ha2,...,ham)进行随机抽样,选取状态b作为下一个状态,在状态b下,通过分位数抽样获得随机样本,即从0到1的均匀分布中选择一个随机数u,在状态Qb中,选取u分位数作为本次抽样的具体取值,此次抽样所得l个序列记为均匀抽样有时不能全面显示信息,因此在这一步中,用分位数抽样代替均匀抽样,可以更有效地保留不同状态下分布差异的信息;
4)蒙特卡洛抽样,基于上述抽样的可重复性和随机性,可生成任意v组随机样本Y(1),Y(2),Y(3),...,Y(v),结合蒙特卡洛思想,不同组之间的抽样独立同分布,即每列从概率角度上来自相同的随机序列,但取值各不相同;
5)生成预测区间,对于v组随机序列Y(1),Y(2),Y(3),...,Y(v)上的任一时刻t(1≤t≤l),可以计算该时刻v个不同预测值的分位数统计量,例如上下5%分位数、中位数等,对于任一给定的置信度1-α,只需要计算时刻t中v个抽样样本值的上α/2分位数Ut(α/2)和下α/2分位数Lt(α/2)组成的闭区间,就可以构成时刻t在1-α置信度下的预测区间,将时刻t从1到l遍历,就可以得到所考察时间内的区间预测结果,为量化风速序列的不确定性,分别利用马尔科夫链和蒙特卡洛模拟算法,构造风速序列的预测区间,充分发挥数据的信息优势,模拟风速随机波动特征,利用统计方法可以得到任意置信度下的风速预测区间,为风电场的稳定运行和大规模风电并网提供保障。
尽管已经示出和描述了本发明实施的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Claims (5)
1.基于非支配排序和随机模拟算法的风速不确定性度量方法,其特征在于,包括以下步骤:
S1、数据集划分,按照一定比例划分训练集和测试集,训练集用于网络的学习与建立,测试集用来检验预测方法的可行性;
S2、风速序列分解,为充分挖掘数据信息,便于后期建立预测模型,对风速序列进行分解,利用非支配排序遗传算法和包络熵原理确定变分模态分解(即VMD)的模态数个数和惩罚因子,实现参数的自适应选取;
S3、建立点预测模型,利用深度极限学习机对各分量序列进行预测,由于最终模型效果受各极限学习机-自动编码器(即ELM-AE)的随机输入权重与随机偏置的影响,选择麻雀搜索算法进行参数寻优,以提高预测精度,将各分量预测值相加,得到最终点预测序列;
S4、构建区间预测方案,对训练误差使用马尔科夫链构造随机矩阵,再根据蒙特卡洛思想进行反复抽样,按所提出的分位数抽样方法,得到若干独立且符合实际分布的随机抽样结果,将模拟的误差分位数序列与点预测结果相结合,从而得到不确定性预测区间;
S5、不确定性度量评估,使用平均绝对误差(MAE)、绝对平均百分比误差(MAPE)和均方根误差(RMSE)评估点预测结果: 其中,n为序列个数,yt为原始测试集,/>为对应预测序列,计算平均宽度Widavg和覆盖率Ratcor,衡量不确定性度量效果,指标公式如下:
其中Ut和Lt分别为分位数统计量中的上下分位数,为真实值在预测区间内的个数;
所述S2中结合包络熵原理构造非支配排序遗传算法的目标函数:
1)对原时序信号s进行希尔伯特变换,得到输出序列S,即:S=Hilbert(s);
2)获取输出信号的极值,完成包络线ei的提取,并对包络信号进行傅里叶变换,取绝对值得到时序信号的包络谱即:/>其中si和Si分别为希尔伯特变换中第i个输入和输出信号;
3)对包络谱进行标准化并计算包络熵Ei,即:其中φi为标准化包络谱,N为信号个数,K为φi长度;
4)适应度函数由以下公式得到:其中size为种群大小;
所述S4中基于随机模拟算法构造预测区间:
1)计算转移矩阵,对于给定的状态数m,将数据集划分到状态集中,计算各个状态之间的转换次数,将从状态i到状态j的转换次数记为kij,由kij构成的矩阵即为状态转移矩阵;
2)生成概率矩阵,将状态转移矩阵中的各个元素除以本行元素之和,即得到概率转移矩阵H,其中元素hij为:当训练集足够大时,hij可近似看作当前状态为i时下一状态变为j的概率P(yk+1=j|yk=i),且满足:/>
3)生成随机样本,对于序列末尾样本yn,找到其对应的某个状态a,在转移概率矩阵H的该行中,按照概率进行随机抽样,选取状态b作为下一个状态,在状态b下,通过分位数抽样获得随机样本,即从0到1的均匀分布中选择一个随机数u,在状态Qb中,选取u分位数作为本次抽样的具体取值,此次抽样所得l个序列记为均匀抽样有时不能全面显示信息,因此在这一步中,用分位数抽样代替均匀抽样,可以更有效地保留不同状态下分布差异的信息;
4)蒙特卡洛抽样,基于上述抽样的可重复性和随机性,可生成任意v组随机样本Y(1),Y(2),Y(3),...,Y(v),结合蒙特卡洛思想,不同组之间的抽样独立同分布,即每列从概率角度上来自相同的随机序列,但取值各不相同;
5)生成预测区间,对于v组随机样本Y(1),Y(2),Y(3),...,Y(v)上的任一时刻,可以计算该时刻v个不同预测值的分位数统计量,上下5%分位数、中位数,对于任一给定的置信度1-a,只需要计算时刻t中v个抽样样本值的上a/2分位数Ut(a/2)和下a/2分位数Lt(a/2)组成的闭区间,就可以构成时刻t在1-a置信度下的预测区间,将时刻t从1到l遍历,就可以得到所考察时间内的区间预测结果。
2.根据权利要求1所述的基于非支配排序和随机模拟算法的风速不确定性度量方法,其特征在于,所述S2中非支配排序遗传算法为:假设种群为N,种群中支配个体n的个体数为xn,被个体n支配的个体集合为Sn,算法步骤为:
1)找到种群中所有xn=0的个体,并保存到当前集合G1中;
2)对于当前集合G1中的每一个个体k,考察其所支配的个体集合Sk,将集合Sk中每个个体m的xm减1,即xm=xm-1,若xm=0则将个体m存入另一个集合中U;
3)将G1中的个体作为第一级非支配层的最优个体,赋予该集合内个体相同的非支配序nrank,并以U作为当前集合继续分级操作,直到整个种群均被分级。
3.根据权利要求1所述的基于非支配排序和随机模拟算法的风速不确定性度量方法,其特征在于,所述S2中还包括基于非支配排序的粒子群优化算法:用一种粒子来模拟鸟类个体,每个粒子可视为搜索空间中的一个搜索个体,粒子的当前位置即为对应优化问题的一个候选解,粒子的飞行过程即为该个体的搜索过程,粒子的飞行速度可根据粒子历史最优位置和种群历史最优位置进行动态调整,粒子仅具有两个属性:速度和位置,其中速度代表移动的快慢,位置代表移动的方向,每个粒子单独搜寻的最优解叫做个体极值,粒子群中最优的个体极值作为当前全局最优解,通过不断迭代,更新速度和位置信息,最终得到满足终止条件的最优解,本文选用粒子群优化算法作为非支配排序遗传算法中的基础遗传算法,从而实现准确快速寻优。
4.根据权利要求3所述的基于非支配排序和随机模拟算法的风速不确定性度量方法,其特征在于,所述S3中基于麻雀搜索算法优化深度极限学习机:制定了如下规则:
1)具有较好适应度值的发现者在搜索过程中优先获取食物,并为所有搜索者提供觅食的方向,且发现者可以获得比搜索者更大的搜索范围;
2)每个麻雀都有成为发现者的可能,只要其寻找到更优解,但种群中发现者所占比例保持不变;
3)一些搜索者可能会监视发现者,甚至与发现者争夺食物,以获得更好的食物来源;
4)由于发现者带头领导觅食,为获得能量,一些饥饿个体可能去其他区域搜寻食物;
5)当种群受到捕食者威胁时,会进行反捕食行为:处在种群外围的麻雀极易受到捕食者的攻击,需要不断地调整位置以保护种群,与此同时,位于种群中心的麻雀会去接近它们相邻的同伴,尽量减少处于危险区域。
5.根据权利要求1所述的基于非支配排序和随机模拟算法的风速不确定性度量方法,其特征在于,基于上述规则,麻雀搜索算法优化深度极限学习机的算法步骤如下:
1)模型初始化,参数包括深度极限学习机(即DELM)中各极限学习机-自动编码器(即ELM-AE)输入权重与偏置、种群数量n、发现者数量、最大迭代数rmax,以矩阵X表示种群位置,矩阵Fit中每行的值为个体适应值,发现者具有较好适应值,
其中d为维数;
2)发现者位置更新,根据上述规则,发现者位置按下式迭代更新:
其中r为当前迭代;j=1,2,..,d;/>表示第i个麻雀的第j维度迭代r次的值;a是(0,1]范围内的随机数;alarm表示报警值范围为[0,1];safety为安全阈值范围为[0.5,1];U是服从正态分布的随机数;I表示元素都为1的1*d维矩阵,当alarm<safety时,周围没有捕食者,发现者可以进行广泛食物搜索;如果alarm>safety表示部分个体发现了捕食者,整个种群需要迅速飞到其他安全区域;
3)一些饥饿的个体监视着发现者,当发现他们找到优秀的食物时,会去争夺食物,这些个体的位置更新公式为:
其中Xworst为种群最糟糕的位置;Pbest为当前最优发现者的位置;C表示元素随机为1或-1的1*d维矩阵,且有C+=CT(CCT)-1,当i>n/2时,表示饥饿者xi没有得到食物,需要到其他地方捕食;如果i≤n/2,饥饿者xi将在Pbest周围觅食;
4)设置10%到20%的个体为侦察者,可以发现威胁种群的因素,这些个体的位置为:
其中Xbest为当前最优位置;λ是标准正态分布随机数,ω是范围在[-1,1]的随机数,用来控制步长和方向;
ε是一个很小的常数,以避免零除法误差,当时,个体处于种群边缘,易遭遇危险;如果/>个体位于种群中心,需要接近其他个体以便于发现危险;
5)依照当前位置更新最优适应度,重复上述步骤,直到满足收敛准则或达到最大迭代次数;
6)输出经麻雀搜索算法优化后各极限学习机-自动编码器(即ELM-AE)输入权重与偏置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210080454.9A CN114578087B (zh) | 2022-01-24 | 2022-01-24 | 基于非支配排序和随机模拟算法的风速不确定性度量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210080454.9A CN114578087B (zh) | 2022-01-24 | 2022-01-24 | 基于非支配排序和随机模拟算法的风速不确定性度量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114578087A CN114578087A (zh) | 2022-06-03 |
CN114578087B true CN114578087B (zh) | 2023-10-13 |
Family
ID=81769459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210080454.9A Active CN114578087B (zh) | 2022-01-24 | 2022-01-24 | 基于非支配排序和随机模拟算法的风速不确定性度量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114578087B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117787109B (zh) * | 2024-02-23 | 2024-05-03 | 天津东方泰瑞科技有限公司 | 一种风速转换可靠性评估方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3223100A1 (en) * | 2016-03-23 | 2017-09-27 | Airbus Operations GmbH | Method and system for gust speed estimation |
CN107274015A (zh) * | 2017-06-12 | 2017-10-20 | 华北电力大学(保定) | 一种预测风速的方法及系统 |
CN107370188A (zh) * | 2017-09-11 | 2017-11-21 | 国网山东省电力公司莱芜供电公司 | 一种计及风电出力的电力系统多目标调度方法 |
CN107958424A (zh) * | 2016-10-14 | 2018-04-24 | 华北电力大学(保定) | 一种基于改进引力搜索算法的电力系统经济调度策略 |
CN109681299A (zh) * | 2019-01-23 | 2019-04-26 | 黄冈师范学院 | 柴油机Urea-SCR系统氨喷射量和氨覆盖率同步优化方法 |
CN112329339A (zh) * | 2020-10-27 | 2021-02-05 | 河北工业大学 | 一种风电场短期风速预测方法 |
CN112345249A (zh) * | 2020-07-28 | 2021-02-09 | 江苏理工学院 | 基于优化变分模态分解的滚动轴承故障诊断方法 |
CN113157381A (zh) * | 2020-05-14 | 2021-07-23 | 北京理工大学 | 基于非支配排序和猫头鹰搜索的多工作流调度方法 |
CN113468790A (zh) * | 2021-07-12 | 2021-10-01 | 湖北工业大学 | 一种基于改进粒子群算法的风速特征模拟方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019232667A1 (zh) * | 2018-06-04 | 2019-12-12 | 大连理工大学 | 用于减小结构模态识别不确定性的传感器布置方法 |
-
2022
- 2022-01-24 CN CN202210080454.9A patent/CN114578087B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3223100A1 (en) * | 2016-03-23 | 2017-09-27 | Airbus Operations GmbH | Method and system for gust speed estimation |
CN107958424A (zh) * | 2016-10-14 | 2018-04-24 | 华北电力大学(保定) | 一种基于改进引力搜索算法的电力系统经济调度策略 |
CN107274015A (zh) * | 2017-06-12 | 2017-10-20 | 华北电力大学(保定) | 一种预测风速的方法及系统 |
CN107370188A (zh) * | 2017-09-11 | 2017-11-21 | 国网山东省电力公司莱芜供电公司 | 一种计及风电出力的电力系统多目标调度方法 |
CN109681299A (zh) * | 2019-01-23 | 2019-04-26 | 黄冈师范学院 | 柴油机Urea-SCR系统氨喷射量和氨覆盖率同步优化方法 |
CN113157381A (zh) * | 2020-05-14 | 2021-07-23 | 北京理工大学 | 基于非支配排序和猫头鹰搜索的多工作流调度方法 |
CN112345249A (zh) * | 2020-07-28 | 2021-02-09 | 江苏理工学院 | 基于优化变分模态分解的滚动轴承故障诊断方法 |
CN112329339A (zh) * | 2020-10-27 | 2021-02-05 | 河北工业大学 | 一种风电场短期风速预测方法 |
CN113468790A (zh) * | 2021-07-12 | 2021-10-01 | 湖北工业大学 | 一种基于改进粒子群算法的风速特征模拟方法及系统 |
Non-Patent Citations (1)
Title |
---|
多源不确定耦合下离心压气机叶轮气动稳健性;唐新姿 等;《航空动力学报》;第35卷(第01期);第196-204页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114578087A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113469426A (zh) | 基于改进bp神经网络的光伏输出功率预测方法及系统 | |
CN116028822B (zh) | 一种电能表误差状态评估方法、系统、设备及存储介质 | |
CN107169871B (zh) | 一种基于关系组合优化和种子扩张的多关系社区发现方法 | |
CN111931983A (zh) | 一种降水量预测方法及系统 | |
CN112989529B (zh) | 一种基于遗传算法的鸡舍温度传感器布置优化方法 | |
CN112884238A (zh) | 光伏发电功率预测方法及装置 | |
CN114578087B (zh) | 基于非支配排序和随机模拟算法的风速不确定性度量方法 | |
CN110321493A (zh) | 一种社交网络的异常检测与优化方法、系统及计算机设备 | |
CN110633859A (zh) | 一种两阶段分解集成的水文序列预测方法 | |
CN110264006B (zh) | 基于混沌萤火虫算法和贝叶斯网络的风电功率概率性预测方法 | |
Fayaz et al. | An adaptive gradient boosting model for the prediction of rainfall using ID3 as a base estimator | |
AU2021106200A4 (en) | Wind power probability prediction method based on quantile regression | |
CN112149870B (zh) | 一种基于ISODATA聚类与Elman神经网络的猪舍氨气浓度组合预测方法 | |
CN117252288A (zh) | 一种区域资源有功支撑能力预测方法及系统 | |
CN112307672A (zh) | 基于布谷鸟算法优化的bp神经网络短期风功率预测方法 | |
CN114897204A (zh) | 一种海上风电场短期风速预测方法和装置 | |
CN116522594A (zh) | 基于卷积神经网络的时间自适应暂态稳定预测方法及装置 | |
CN112581311B (zh) | 一种多风电场聚合后出力长期波动特性预测方法及系统 | |
US11829883B2 (en) | Executing a genetic algorithm on a low-power controller | |
CN115310355A (zh) | 考虑多能耦合的综合能源系统多元负荷预测方法及系统 | |
CN113177675A (zh) | 一种基于天牛群算法优化神经网络的空调冷负荷预测方法 | |
CN114021476A (zh) | 基于麻雀搜索和改进灰色模型的继电器贮存寿命预测方法 | |
CN114048819A (zh) | 基于注意力机制和卷积神经网络的配电网拓扑辨识方法 | |
CN114139783A (zh) | 基于非线性加权组合的风电短期功率预测方法及装置 | |
CN115166811A (zh) | 一种模拟工作现场中子谱快速构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |