CN111796518B - 磁控形状记忆合金执行器位移控制方法 - Google Patents
磁控形状记忆合金执行器位移控制方法 Download PDFInfo
- Publication number
- CN111796518B CN111796518B CN202010519724.2A CN202010519724A CN111796518B CN 111796518 B CN111796518 B CN 111796518B CN 202010519724 A CN202010519724 A CN 202010519724A CN 111796518 B CN111796518 B CN 111796518B
- Authority
- CN
- China
- Prior art keywords
- neural network
- shape memory
- memory alloy
- function
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
一种磁控形状记忆合金执行器位移控制方法,属于智能材料及其机构建模与控制领域。本发明的目的是将神经网络与迭代学习控制相结合,设计了基于神经网络的迭代学习控制器,并给出系统初始状态在有界范围内变化时系统收敛条件的磁控形状记忆合金执行器位移控制方法。本发明步骤是:建立可以描述磁控形状记忆合金执行器率相关迟滞非线性的Volterra级数模型,并利用神经网络构建Volterra级数的核函数;采用神经网络拟合迭代学习控制器,并给出系统初始状态在有界范围内变化时系统的收敛条件。本发明不但放宽了迭代学习控制的适用条件,更符合实际应用环境,还提高了迭代学习控制的鲁棒性,提升控制品质。
Description
技术领域
本发明属于智能材料及其机构建模与控制领域。
背景技术
进入二十世纪九十年代以来,随着精密制造业的蓬勃发展,传统的机械加工制造方式已经不能满足现代工业飞速发展的需要,人们对高精度、高分辨率定位技术提出了新的要求。以压电陶瓷、形状记忆合金和超磁致伸缩材料等新兴智能材料为核心器件的执行器因其具备微-纳米级的精密定位能力,近些年来成为了各个国家在高精尖制造领域研究的热点。
磁控形状记忆合金执行器是利用磁控形状记忆合金材料的磁性形状记忆效应,在磁场的作用下产生形变,能保证微纳米级分辨率机械运动的高精度微定位机构,有着传统电机驱动不可比拟的优势。由于其具有体积小、响应快、功耗低、位移分辨率高等优点,在智能结构、精密加工、纳米技术、微电子工程、精密光学、生物工程等领域有广泛的应用前景,如磁控形状记忆合金执行器驱动无阀泵、天文望远镜定位系统等。然而磁控形状记忆合金材料内部具有的迟滞非线性严重制约了其在各个领域的应用。为解决磁控形状记忆合金执行器位移复杂迟滞非线性的问题,实现磁控形状记忆合金执行器微纳米级精度定位控制,需要提出更有效的控制策略,设计性能优异的控制器。
磁控形状记忆合金执行器具有迟滞动态特性复杂、系统参数未知等特点,所以传统的控制方法难以达到满意的控制效果。迭代学习控制在不需要辨识系统参数及需求很少先验知识的情况之下即可取得理想的控制效果,在很多传统控制方法难以解决的复杂被控对象控制过程中发挥了重要的作用。
发明内容
本发明的目的是将神经网络与迭代学习控制相结合,设计了基于神经网络的迭代学习控制器,并给出系统初始状态在有界范围内变化时系统收敛条件的磁控形状记忆合金执行器位移控制方法。
本发明步骤是:
步骤1:建立可以描述磁控形状记忆合金执行器率相关迟滞非线性的Volterra级数模型,并利用神经网络构建Volterra级数的核函数;
Volterra级数模型的表达式为:
其中,u(k)和ym(k)为系统的输入输出,hn和K为Volterra级数的核函数和记忆长度;
综合考虑模型的精度以及计算复杂度,当K选取为2时Volterra级数模型的表达式为:
为了避免Volterra级数的维数灾难并获得较高建模精度,采用神经网络构建Volterra级数模型的核函数,神经网络的表达式为:
Xj(k)=f(Sj(k)) (4)
当采用神经网络构建volterra级数模型时,以系统当前时刻和历史时刻的输入值作为神经网络的输入向量,即Ii(k)=[u(k),u(k-1),u(k-2)],神经网络的优化算法采用梯度下降法,综合考虑计算复杂度和建模精度隐含层的神经元个数选为7,输出层的神经元个数为1,网络初始权值设定为0到1的随机值;
步骤2:采用神经网络拟合迭代学习控制器,并给出系统初始状态在有界范围内变化时系统的收敛条件;
第一步:在利用迭代学习算法设计控制器时,为了保证算法的收敛性,以下假设是必需的:对于以磁控形状记忆合金执行器为被控对象的非线性系统,系统的离散时间状态空间表达式如下:
其中,k=0,1,...,N-1为系统的离散时间,up(k)为系统输入,xp(k)为系统状态,C为具有适当维数的系数矩阵,N为期望时间长度且为正整数,p为迭代次数,g(·)为非线性函数;
假设1:所有信号都定义在有限时间区间内且对于一个有限的参考轨迹,系统应存在唯一的控制律和理想的系统状态;即:对于k∈[0,N-1],系统表示如下:
其中,ur(k)为理想控制输入,xr(k)为理想系统状态,yr(k)为理想系统输出;
假设2:非线性函数g(·)沿着迭代轴方向满足广义Lipschitz条件,即:
||g(x1(k),u1(k))-g(x2(k),u2(k))||≤L(||x1(k)-x2(k)||+|u1(k)-u2(k)|)(8)
其中,L>0表示Lipschitz常数;
假设3:初始状态误差有界,即:
||xr(0)-xp(0)||≤∈ (9)
其中,∈为大于零的常数;
第二步:对于受控系统(6),设计如下形式的迭代学习控制器,控制律为:
该控制律的近似公式为:
up(k)=f(up-1(k),ep-1(k),(ep-1(k+1)-ep-1(k))) (11)
则控制律可以写为:
up(k)=f(up-1(k),ep-1(k),ep-1(k+1)) (12)
其中,f为未知函数;
综合考虑神经网络的精度和计算复杂度,采用结构为3-7-1的多输入单输出三层神经网络对未知函数f进行拟合,选取sigmoid函数为中间隐含层的激活函数,神经网络的输入向量为神经网络初始权值为0至1之间的随机值;
第三步:采用梯度下降法优化网络的参数使损失函数最小化时,损失函数的计算需要用到模型信息,为使神经网络参数能够在线更新,用步骤1中所建立的模型计算步骤2中神经网络的损失函数;
其中,θ表示神经网络参数,η表示学习率,ep代表磁控形状记忆合金执行器实际输出和期望位移之间的误差;
采用步骤1中建立的磁控形状记忆合金执行器迟滞模型的输出ym代替(13)中的yp计算损失函数,即:
由式(13)计算神经网络参数的更新值,并重复以上步骤以获得理想的神经网络参数直至系统跟踪误差达到设定要求。
本发明利用神经网络出色的泛化性能弥补了传统迭代学习控制在非线性系统控制问题中的不足。相比于传统的非线性控制方法,基于神经网络的迭代学习控制对磁控形状记忆合金执行器具有更好的控制效果,且提升了迭代学习控制器的鲁棒性和对非线性系统的控制性能。本发明不但放宽了迭代学习控制的适用条件,更符合实际应用环境,还提高了迭代学习控制的鲁棒性,提升控制品质。
附图说明
图1是基于神经网络的Volterra级数模型结构框图;
图2是基于神经网络迭代学习控制的磁控形状记忆合金执行器位移控制结构框图。
具体实施方式
本发明提供的一种基于神经网络迭代学习控制的磁控形状记忆合金执行器位移控制方法,其特征在于,包括以下步骤:
步骤1:建立可以描述磁控形状记忆合金执行器率相关迟滞非线性的Volterra级数模型,并利用神经网络构建Volterra级数的核函数;
Volterra级数模型的表达式为:
其中,k=0,1,...,N-1为离散时刻,N为期望时间长度且为正整数,n为模型阶数,p为迭代次数,up(k)和为第p次迭代时模型的输入和输出值,hn(κ1,...,κn)和K为模型的n阶核函数和记忆长度,κn为第n项对应的记忆延时。
综合考虑模型的精度以及计算复杂度,当n选取为2时Volterra级数模型的表达式为:
为了避免Volterra级数的维数灾难并获得高建模精度,采用神经网络构建Volterra级数模型的核函数,图1为基于神经网络的Volterra级数模型的结构图。
神经网络的表达式为:
Xj(k)=f(Sj(k)) (4)
其中,ωij为输入层第i个神经元与隐含层第j个神经元的连接权值,ωj为隐含层第j个神经元与输出层神经元连接的权值,Sj(k)和Xj(k)分别表示隐含层第j个神经元的输入和输出值。
O(k)表示神经网络的输出值,Ii(k)表示神经网络输入层第i个神经元的输入值。
隐含层激活函数f(·)选取为双极性sigmoid函数,表达式如下:
其中,x表示双极性sigmoid函数的输入值,e为常数。
当采用神经网络构建Volterra级数模型时,以执行器当前时刻和历史时刻的输入值作为神经网络的输入向量,即I(k)=[up(k),up(k-1),up(k-2)]。综合考虑计算复杂度和建模精度,隐含层的神经元个数选为7,输出层的神经元个数为1。
神经网络初始权值设定为0到1的随机值,优化算法采用梯度下降法,根据梯度下降法求得神经网络参数的更新法则公式为:
ωj(k)=ωj(k-1)+η*Δωj(k)+α(ωj(k-1)-ωj(k-2)) (8)
ωij(k)=ωij(k-1)+η*Δωij(k)+α(ωij(k-1)-ωij(k-2)) (10)
其中,α=0.5是学习速率调整系数,η*=0.2为学习率,为第p次迭代时的建模误差,yp(k)为在第p次迭代时执行器实际输出值,Ep(k)为误差函数,Δωj(k)和Δωij(k)分别表示ωj和ωij的变化量。
步骤2:采用神经网络拟合迭代学习控制器,并给出系统初始状态在有界范围内变化时系统的收敛条件。
第一步:在利用迭代学习算法设计控制器时,为了保证算法的收敛性,以下假设是必需的:
对于以磁控形状记忆合金执行器为被控对象的非线性系统,系统的离散时间状态空间表达式可写为如下形式:
其中,xp(k)为系统在第p次迭代时的系统状态量,C为具有适当维数的系数矩阵,g(·)为非线性函数。
假设2:非线性函数g(·)沿着迭代轴方向满足广义Lipschitz条件。即
||g(x1(k),u1(k))-g(x2(k),u2(k))||≤L(||x1(k)-x2(k)||+|u1(k)-u2(k)|)(15)
其中,L>0表示Lipschitz常数。
假设3:初始状态误差有界,即:
其中,∈为大于零的常数。
第二步:对于受控系统(13),设计如下形式的迭代学习控制器,控制律为:
该控制律的近似公式为:
up(k)=f(up-1(k),ep-1(k),(ep-1(k+1)-ep-1(k))) (18)
则控制律可以写为:
up(k)=f(up-1(k),ep-1(k),ep-1(k+1)) (19)
其中,f为未知函数,ep-1(k)为第p-1次迭代时系统误差值。
图2是基于神经网络迭代学习控制的磁控形状记忆合金执行器位移控制结构框图。综合考虑神经网络的精度和计算复杂度,采用结构为3-7-1的多输入单输出三层神经网络对未知函数f进行拟合,选取sigmoid函数为中间隐含层的激活函数。神经网络的输入向量为网络初始权值为0至1之间的随机值。对于实际控制过程而言,系统初始状态误差是难以避免的,控制算法的收敛条件关系到整个控制系统的稳定性,因此需要从理论角度获得系统初始状态误差不为零时控制器的收敛条件以确保控制系统的可靠运行。
为获得系统的收敛条件,令:
其中,fu和fe分别为未知非线性函数f对控制量u和系统误差ep的偏导数。
对式(19)应用泰勒公式展开并保留一阶项可得:
Δup+1(k)=fu(k)Δup(k)-fe(k)Δep(k)-fe(k+1)Δep(k+1) (23)
||Δup+1(k)||≤||fu(k)Δup(k)||+||fe(k)CΔxp(k)||+||fe(k+1)CΔxp(k+1)||(25)
根据步骤2的假设2,式(24)可表示为:
||Δxp(k+1)||≤L||Δxp(k)||+L|Δup(k)| (26)
由数学归纳法可得:
根据假设3可得:
将式(29)、(30)带入式(25)可得:
令α=L,则:
同理可得:
式(31)可表示为:
所以可知当δ+βρ1+γρ2<1时,随着系统迭代次数的增加,跟踪误差会收敛到和∈成比例的区域内。即:对于非线性系统(6),在满足假设条件(13)、(14)、(15)时,应用控制律(19),如果有δ+βρ1+γρ2<1成立,则系统的跟踪误差会有界收敛于和初态误差∈呈比例关系大小的范围内。
第三步:采用梯度下降法优化网络的参数使损失函数最小化时,损失函数的计算需要用到模型信息,为使神经网络参数能够在线更新,用步骤1中所建立的模型计算步骤2中神经网络的损失函数。
其中,Δθp表示第p次迭代时神经网络参数的变化量,η=0.4表示学习率。
式(37)计算的是神经网络参数的更新值,则第p+1次迭代时神经网络参数θp+1可表示为:
θp+1=θp+Δθp(39)
重复以上神经网络参数更新过程以获得理想的神经网络参数直至系统跟踪误差达到设定要求。
Claims (1)
1.一种磁控形状记忆合金执行器位移控制方法,其特征在于:其步骤是:
步骤1:建立可以描述磁控形状记忆合金执行器率相关迟滞非线性的Volterra级数模型,并利用神经网络构建Volterra级数的核函数;
Volterra级数模型的表达式为:
其中,u(k)和ym(k)为系统的输入输出,hn和K为Volterra级数的核函数和记忆长度;
综合考虑模型的精度以及计算复杂度,当K选取为2时Volterra级数模型的表达式为:
为了避免Volterra级数的维数灾难并获得较高建模精度,采用神经网络构建Volterra级数模型的核函数,神经网络的表达式为:
Xj(k)=f(Sj(k)) (4)
当采用神经网络构建volterra级数模型时,以系统当前时刻和历史时刻的输入值作为神经网络的输入向量,即Ii(k)=[u(k),u(k-1),u(k-2)],神经网络的优化算法采用梯度下降法,综合考虑计算复杂度和建模精度隐含层的神经元个数选为7,输出层的神经元个数为1,网络初始权值设定为0到1的随机值;
步骤2:采用神经网络拟合迭代学习控制器,并给出系统初始状态在有界范围内变化时系统的收敛条件;
第一步:在利用迭代学习算法设计控制器时,为了保证算法的收敛性,以下假设是必需的:对于以磁控形状记忆合金执行器为被控对象的非线性系统,系统的离散时间状态空间表达式如下:
其中,k=0,1,...,N-1为系统的离散时间,up(k)为系统输入,xp(k)为系统状态,C为具有适当维数的系数矩阵,N为期望时间长度且为正整数,p为迭代次数,g(·)为非线性函数;
假设1:所有信号都定义在有限时间区间内且对于一个有限的参考轨迹,系统应存在唯一的控制律和理想的系统状态;即:对于k∈[0,N-1],系统表示如下:
其中,ur(k)为理想控制输入,xr(k)为理想系统状态,yr(k)为理想系统输出;
假设2:非线性函数g(·)沿着迭代轴方向满足广义Lipschitz条件,即:
||g(x1(k),u1(k))-g(x2(k),u2(k))||≤L(||x1(k)-x2(k)||+|u1(k)-u2(k)|) (8)
其中,L>0表示Lipschitz常数;
假设3:初始状态误差有界,即:
||xr(0)-xp(0)||≤∈ (9)
其中,∈为大于零的常数;
第二步:对于受控系统(6),设计如下形式的迭代学习控制器,控制律为:
该控制律的近似公式为:
up(k)=f(up-1(k),ep-1(k),(ep-1(k+1)-ep-1(k))) (11)
则控制律可以写为:
up(k)=f(up-1(k),ep-1(k),ep-1(k+1)) (12)
其中,f为未知函数;
综合考虑神经网络的精度和计算复杂度,采用结构为3-7-1的多输入单输出三层神经网络对未知函数f进行拟合,选取sigmoid函数为中间隐含层的激活函数,神经网络的输入向量为神经网络初始权值为0至1之间的随机值;
第三步:采用梯度下降法优化网络的参数使损失函数最小化时,损失函数的计算需要用到模型信息,为使神经网络参数能够在线更新,用步骤1中所建立的模型计算步骤2中神经网络的损失函数;
其中,θ表示神经网络参数,η表示学习率,ep代表磁控形状记忆合金执行器实际输出和期望位移之间的误差;
采用步骤1中建立的磁控形状记忆合金执行器迟滞模型的输出ym代替(13)中的yp计算损失函数,即:
由式(13)计算神经网络参数的更新值,并重复以上步骤以获得理想的神经网络参数直至系统跟踪误差达到设定要求。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010519724.2A CN111796518B (zh) | 2020-06-09 | 2020-06-09 | 磁控形状记忆合金执行器位移控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010519724.2A CN111796518B (zh) | 2020-06-09 | 2020-06-09 | 磁控形状记忆合金执行器位移控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111796518A CN111796518A (zh) | 2020-10-20 |
CN111796518B true CN111796518B (zh) | 2021-08-20 |
Family
ID=72804022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010519724.2A Active CN111796518B (zh) | 2020-06-09 | 2020-06-09 | 磁控形状记忆合金执行器位移控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111796518B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115208721B (zh) * | 2022-06-23 | 2024-01-23 | 上海交通大学 | 类Volterra的神经网络均衡器构建方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5517667A (en) * | 1993-06-14 | 1996-05-14 | Motorola, Inc. | Neural network that does not require repetitive training |
CN1794116A (zh) * | 2005-12-22 | 2006-06-28 | 桂林电子工业学院 | 基于神经网络的迟滞特性建模方法 |
CN100592226C (zh) * | 2008-08-13 | 2010-02-24 | 南京航空航天大学 | 迟滞系统的逆系统控制方法 |
CN107180259B (zh) * | 2017-05-15 | 2021-03-30 | 电子科技大学 | 一种基于系统辨识的stap训练样本选择方法 |
CN109807887B (zh) * | 2019-01-18 | 2020-09-15 | 上海交通大学 | 基于深度神经网络的柔性臂智能感知与控制方法和系统 |
-
2020
- 2020-06-09 CN CN202010519724.2A patent/CN111796518B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111796518A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102621889B (zh) | 一种压电陶瓷定位的复合控制方法 | |
Fallah Ghavidel et al. | Observer-based hybrid adaptive fuzzy control for affine and nonaffine uncertain nonlinear systems | |
Shao et al. | Stroke maximizing and high efficient hysteresis hybrid modeling for a rhombic piezoelectric actuator | |
CN110815225A (zh) | 电机驱动单机械臂系统的点对点迭代学习优化控制方法 | |
Zakerzadeh et al. | Hysteresis nonlinearity identification using new Preisach model-based artificial neural network approach | |
CN111930008B (zh) | 基于数据驱动控制的压电微定位平台轨迹跟踪控制方法 | |
CN112171677B (zh) | 基于lstm迟滞模型的机器人柔性关节补偿控制方法 | |
CN108710301B (zh) | 压电陶瓷作动器迟滞非线性在线辨识和补偿的方法及系统 | |
Zhou et al. | Hysteresis inverse compensation-based model reference adaptive control for a piezoelectric micro-positioning platform | |
Li et al. | Deep reinforcement learning in soft viscoelastic actuator of dielectric elastomer | |
Ma et al. | Hybrid model based on Preisach and support vector machine for novel dual-stack piezoelectric actuator | |
CN105159069A (zh) | 一种压电陶瓷作动器的位移控制方法 | |
Lin et al. | Intelligent integral backstepping sliding‐mode control using recurrent neural network for piezo‐flexural nanopositioning stage | |
CN111796518B (zh) | 磁控形状记忆合金执行器位移控制方法 | |
Son et al. | Adaptive displacement online control of shape memory alloys actuator based on neural networks and hybrid differential evolution algorithm | |
Li et al. | Closed-LSTM neural network based reference modification for trajectory tracking of piezoelectric actuator | |
Qin et al. | Dual-loop robust attitude control for an aerodynamic system with unknown dynamic model: Algorithm and experimental validation | |
CN112947083B (zh) | 一种基于磁悬浮控制系统的非线性模型预测控制优化方法 | |
Xie et al. | A deep residual recurrent neural network model-augmented attention with physical characteristics: Application to turntable servo system | |
Chen et al. | Controllable micrometer positioning design of piezoelectric actuators using a robust fuzzy eliminator | |
CN106019933B (zh) | 一种“粘滞-滑动”微动平台的预测控制方法 | |
Kilicarslan et al. | Modeling and hysteresis compensation in a thin SMA wire using ANFIS methods | |
Wu et al. | Positioning control of liquid crystal elastomer actuator based on double closed-loop system structure | |
CN113114128A (zh) | 基于广义Bouc-Wen逆模型的压电前馈补偿方法 | |
Sun et al. | Variable gain switching exact differential observer‐based compensation control for servo system with backlash |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |