发明内容
发明目的:针对现有技术的不足,本发明提供一种基于深度学习的抽蓄机组调节系统辨识方法,实现对抽水蓄能调节系统的精确辨识,有效提升机组建模精度,进而保障机组控制品质。
技术方案:本发明提出一种基于深度学习的抽蓄机组调节系统辨识方法,具体包括以下步骤:
(1)对抽水蓄能机组调节系统进行机理建模,利用机理模型产生仿真数据,并划分为训练集和测试集,确定深度学习模型的输入变量;其中训练集和测试集的比为7:3;
(2)建立深度学习模型GRU对训练集的机理模型深层次特征进行挖掘;
(3)改进哈里斯鹰优化算法,在逃逸能量中引入一种非线性能量指数递减策略;
(4)将改进的哈里斯鹰优化算法实现GRU模型的参数寻优,包括学习率和隐含层节点数;
(5)利用训练好的GRU模型和测试集得到预测值。
进一步地,所述步骤(2)包括以下步骤:
(21)计算更新门vt,计算公式如下:
vt=σ(Wv*[Yt-1,Zt]+bv) (1)
式中,σ表示激活函数sigmod,Yt-1为上一个时刻的输出,Zt为当前时刻的输入;Wv为更新门的权重矩阵,bv为偏差向量;
(22)计算重置门rt,计算公式如下:
rt=σ(Wr*[Yt-1,Zt]+br) (2)
式中,σ表示激活函数sigmod,Yt-1为上一个时刻的输出,Zt为当前时刻的输入;Wr为重置门的权重矩阵,br为偏差向量;
(23)计算出更新门和重置门后,GRU会将会计算候选隐藏状态ht,候选隐藏状态ht计算公式如下:
ht=tanh(Wh*[rt*Yt-1,Zt]+bh) (3)
式中,tanh(x)表示Tanh激活函数,Wh为对应的权重参数,bh为对应的偏差参数;
(24)在最后的t时刻,GRU的输出计算公式如下:
yt=(1-vt)*Yt-1+vt*ht。 (4)
进一步地,所述步骤(3)包括以下步骤:
(31)确定个体的适应值数学模型,公式如下:
式中,n表示样本总数;pi表示系统在时刻i的实际输出;表示辨识模型在时刻i的模拟输出;
(32)参数初始化:将HHO的种群规模初始化为N,群体中个体的维数为d,最大迭代次数为Tmax,随机生成初始种群;
(33)根据式(5)计算初始适应度值,将适应度值最优的个体位置设置为当前猎物位置;
(34)位置更新,先通过更新猎物逃逸能量,然后根据逃逸能量和生成的随机数执行搜索或者开发行为中对应的位置策略;
(35)计算适应度:计算位置更新后的个体适应度,并与猎物适应度值进行比较,若位置更新后的个体适应度值优于猎物,则以适应度值更优的个体位置作为新的猎物位置:;
(36)如果迭代次数t<Tmax,则转到步骤(33);否则,转到(37);
(37)返回最佳个体,输出GRU模型的最优参数。
进一步地,所述步骤(34)包括以下步骤:
(341)搜索阶段,哈里斯鹰通过两种策略寻找到猎物,找到猎物的的公式计算如下:
式中,x(t)和x(t+1)分别为当前和下一迭代的个体位置,t为迭代次数,xrand为随机选出的个体位置,xrabbit(t)为猎物位置,即拥有最优适应度的个体位置,r1,r2,r3和r4为[0,1]之间的随机数;q是用来随机选择要采用的策略,xm(t)为个体平均位置,其表达式如下:
式中,xi(t)为种群第i个个体的位置,M为种群规模;
(342)搜索与开发的转换阶段:哈里斯鹰优化算法根据猎物的逃逸能量在探索和不同的开发行为之间转换,逃逸能量定义为:
式中,E0是猎物的初始能量,为[-1,1]之间的随机数,每次迭代时自动更新;t是迭代次数,Tmax为最大迭代次数,当|E|≥1时进入搜索阶段,|E|<1时,进入开发阶段;引入一种非线性能量指数递减策略,改进后的逃逸能量计算公式如下:
式中,t是迭代次数,Tmax为最大迭代次数;
(343)开发阶段:假设r定义为[0,1]之间的随机数,用于选择不同的开发策略;当0.5≤|E|<1且r≥0.5时,采用软围攻策略进行位置更新,计算公式如下:
x(t+1)=Δx(t)-E|Jxrabbit(t)-x(t)| (10)
式中,Δx(t)=xrabbit(t)-x(t),表示猎物位置与个体当前位置的差值,J为[0,2]之间的随机数;
当|E|<0.5且r≥0.5时采取硬围攻策略进行位置更新,计算公式如下:
x(t+1)=xrabbit(t)-E|Δx(t)| (11)
当0.5≤|E|<1且r<0.5时,采取渐近式快速俯冲的软包围策略进行位置更新,计算公式如下:
Y=xrabbit(t)-E|Jxrabbit(t)-x(t)| (13)
Z=Y+S*LF(2) (14)
式中,S为2维随机向量,LF()为莱维飞行的数学表达式;
当|E|<0.5且r<0.5时,采取渐近式快速俯冲的硬包围策略进行位置更新,计算公式如下:
Y=xrabbit(t)-E|Jxrabbit(t)-xm(t)| (16)
Z=Y+S*LF(2)。
有益效果:与现有技术相比,本发明的有益效果:本发明针对GRU模型超参数难以确定的特点,采用改进哈里斯鹰优化算法实现GRU模型超参数的动态调整,将GRU辨识模型的隐含层节点个数和学习率大小等参数作为决策变量,以辨识误差作为目标函数,借助改进哈里斯鹰优化算法的全局寻优能力,获取最优模型结构与参数,以提高GRU模型的泛化性,实现对抽水蓄能调节系统的精确辨识,有效提升机组建模精度,进而保障机组控制品质。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明提出一种基于深度学习的抽蓄机组调节系统辨识方法,如图1所示,具体包括以下步骤:
步骤1:对抽水蓄能机组调节系统进行了机理建模,利用机理模型产生仿真数据,将原始数据归一至[0,1]区间并划分为训练集和测试集,确定深度学习模型的输入变量。
通过随机产生抽水蓄能调节系统的频率扰动信号,随机设置调节系统PID控制器参数,充分激发抽水蓄能机组调节系统的非线性,提高用于建模的运行数据的多样性。模型仿真时间设定为50s,采样周期设定为0.1s,每次实验结束时,抽水蓄能调节系统的控制器输出和单位频率输出数据都被保存下来。将原始数据规范至[0,1]区间,独立进行30次实验,其中20次实验的动态过程运行数据作为训练样本,其余10次实验数据作为测试样本,采用{u(t-1),u(t-2),u(t-3),y(t-1),y(t-2),y(t-3)}作为模型的输入变量,其中,u(t-1),u(t-2),u(t-3)分别表示前1,2,3时刻的控制器输出,y(t-1),y(t-2),y(t-3)分别表示前1,2,3时刻的单位频率输出。训练集和测试集的比为7:3。
步骤2:建立深度GRU模型对训练数据集机理模型深层次特征进行挖掘。
门控循环单元(GRU)是长短期记忆网络(LSTM)的一种变体,LSTM网络由多个循环单元组成,通过更新神经元状态信息,使用输入门、输出门和遗忘门来控制历史信息的权重来存储过去的信息。与LSTM网络相比,GRU的结构更为简单,它将遗忘门和输入门合并为一个“更新门”,这使得矩阵乘法变小,当训练数据量很大时,GRU可以节省大量计算时间,同时输出门变为重置门。更新门用于选择在前一时刻保留状态信息,重置门主要决定需要忘记多少过去的信息。更新门决定了有多少历史信息可以传递给未来,重置门的主要功能是确定有多少个历史信息能不能传递到下一个状态。深度学习模型GRU模型的建立步骤如下:
步骤2.1:计算更新门vt,计算公式如下:
vt=σ(Wv*[Yt-1,Zt]+bv) (1)
式中,σ表示激活函数sigmod,Yt-1为上一个时刻的输出,Zt为当前时刻的输入;Wv为更新门的权重矩阵,bv为偏差向量。
步骤2.2:计算重置门rt,计算公式如下:
rt=σ(Wr*[Yt-1,Zt]+br) (2)
式中,σ表示激活函数sigmod,Yt-1为上一个时刻的输出,Zt为当前时刻的输入;Wr为重置门的权重矩阵,br为偏差向量。
步骤2.3:计算出更新门和重置门后,GRU会将会计算候选隐藏状态ht,候选隐藏状态ht计算公式如下:
ht=tanh(Wh*[rt*Yt-1,Zt]+bh) (3)
式中,tanh(x)表示Tanh激活函数,Wh为对应的权重参数,bh为对应的偏差参数。
步骤2.4:在最后的t时刻,GRU的输出计算公式如下:
yt=(1-vt)*Yt-1+vt*ht (4)
步骤3:改进哈里斯鹰优化算法,在逃逸能量中引入一种非线性能量指数递减策略。
哈里斯鹰优化算法(HHO)是一种模拟哈里斯鹰捕食行为的智能优化算法,算法步骤主要包括三个阶段,即搜索阶段、搜索与开发的转换和开发阶段。哈里斯鹰优化算法具体步骤如下:
步骤3.1:确定个体的适应值数学模型,公式如下:
式中,n表示样本总数;pi表示系统在时刻i的实际输出;表示辨识模型在时刻i的模拟输出。
步骤3.2:参数初始化。将HHO的种群规模初始化为N,群体中个体的维数为d,最大迭代次数为Tmax,随机生成初始种群;
步骤3.3:根据式(5)计算初始适应度值,将适应度值最优的个体位置设置为当前猎物位置。
步骤3.4:位置更新,先通过更新猎物逃逸能量,然后根据逃逸能量和生成的随机数执行搜索或者开发行为中对应的位置策略。
步骤3.4.1:搜索阶段,哈里斯鹰通过两种策略寻找到猎物,找到猎物的的公式计算如下:
式中,x(t)和x(t+1)分别为当前和下一迭代的个体位置,t为迭代次数,xrand为随机选出的个体位置,xrabbit(t)为猎物位置,即拥有最优适应度的个体位置,r1,r2,r3和r4为[0,1]之间的随机数;q是用来随机选择要采用的策略,xm(t)为个体平均位置,其表达式如下:
式中,xi(t)为种群第i个个体的位置,M为种群规模。
步骤3.4.2:搜索与开发的转换阶段。哈里斯鹰优化算法根据猎物的逃逸能量在探索和不同的开发行为之间转换。逃逸能量定义为:
式中,E0是猎物的初始能量,为[-1,1]之间的随机数,每次迭代时自动更新;t是迭代次数,Tmax为最大迭代次数,当|E|≥1时进入搜索阶段,|E|<1时,进入开发阶段。
由于使用哈里斯鹰优化算法在求解复杂优化问题时存在易陷入局部最优和收敛速度慢的缺点,为克服上述缺点,引入一种非线性能量指数递减策略。改进后的逃逸能量计算公式如下:
式中,t是迭代次数,Tmax为最大迭代次数。
步骤3.4.3:开发阶段。假设r定义为[0,1]之间的随机数,用于选择不同的开发策略。当0.5≤|E|<1且r≥0.5时,采用软围攻策略进行位置更新,计算公式如下:
x(t+1)=Δx(t)-E|Jxrabbit(t)-x(t)| (10)
式中,Δx(t)=xrabbit(t)-x(t),表示猎物位置与个体当前位置的差值,J为[0,2]之间的随机数。
当|E|<0.5且r≥0.5时采取硬围攻策略进行位置更新,计算公式如下:
x(t+1)=xrabbit(t)-E|Δx(t)| (11)
当0.5≤|E|<1且r<0.5时,采取渐近式快速俯冲的软包围策略进行位置更新,计算公式如下:
Y=xrabbit(t)-E|Jxrabbit(t)-x(t)| (13)
Z=Y+S*LF(2) (14)
式中,S为2维随机向量,LF()为莱维飞行的数学表达式。
当|E|<0.5且r<0.5时,采取渐近式快速俯冲的硬包围策略进行位置更新,计算公式如下:
Y=xrabbit(t)-E|Jxrabbit(t)-xm(t)| (16)
Z=Y+S*LF(2) (17)
步骤3.5:计算适应度。计算位置更新后的个体适应度,并与猎物适应度值进行比较,若位置更新后的个体适应度值优于猎物,则以适应度值更优的个体位置作为新的猎物位置。
步骤3.6:如果迭代次数t<Tmax,则转到步骤3.3;否则,转到步骤3.7.
步骤3.7:返回最佳个体,输出GRU模型的最优参数。
步骤4:将改进的哈里斯鹰优化算法实现GRU模型的参数寻优,包括学习率和隐含层节点数。
步骤5:利用训练好的GRU模型和测试集数据得到预测值,反归一化后即可得到最终输出。
选取抽水蓄能机组调节系统辨识中常用的三种评价指标:均方根误差RMSE,平均绝对误差MAE和相关系数R,对辨识模型的精度进行评价。RMSE、MAE和R的计算公式如下:
式中,yi和代表了第i个时间段的实际值和预测值;/>和/>代表着实测值和预测值的平均值;N表示样本数据集的大小。
表1不同模型抽水蓄能机组调节系统智能辨识方法的误差结果对比
表1为不同模型抽水蓄能机组调节系统智能辨识方法的误差结果对比,从表1可以看出本发明所提出的IHHO-GRU在抽水蓄能机组调节系统智能辨识精度有着优异的表现。图2为抽水蓄能机组调节系统智能辨识模型观测值与预测值对比图,从图2可以看出,所提出的IHHO-GRU模型有着准确的辨识精度。