CN108448978B - 一种有刷直流电机强化学习自适应控制方法 - Google Patents

一种有刷直流电机强化学习自适应控制方法 Download PDF

Info

Publication number
CN108448978B
CN108448978B CN201810253881.6A CN201810253881A CN108448978B CN 108448978 B CN108448978 B CN 108448978B CN 201810253881 A CN201810253881 A CN 201810253881A CN 108448978 B CN108448978 B CN 108448978B
Authority
CN
China
Prior art keywords
motor
speed
direct current
loop
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810253881.6A
Other languages
English (en)
Other versions
CN108448978A (zh
Inventor
胡云峰
李娜
张森
陈虹
史少云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201810253881.6A priority Critical patent/CN108448978B/zh
Publication of CN108448978A publication Critical patent/CN108448978A/zh
Application granted granted Critical
Publication of CN108448978B publication Critical patent/CN108448978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/0003Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control
    • H02P21/0017Model reference adaptation, e.g. MRAS or MRAC, useful for control or parameter estimation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/14Estimation or adaptation of machine parameters, e.g. flux, current or voltage
    • H02P21/18Estimation of position or speed

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Control Of Electric Motors In General (AREA)
  • Control Of Direct Current Motors (AREA)

Abstract

一种有刷直流电机强化学习自适应控制方法,属于电机技术领域。本发明的目的是通过参数鲁棒自适应律在线辨识齿槽转矩、非线性摩擦力模型参数以及基于强化学习的未知扰动估计补偿策略,解决了有刷直流电机转速控制过程中死区、爬行及低速不平稳问题的有刷直流电机转速非线性控制方法。本发明步骤是:建立有刷直流电机的数学模型;有刷直流电机鲁棒自适应控制方法。本发明基于微分平坦设计前馈加反馈的二自由度控制结构。相对于传统的双环PI控制方法,该方法引入的前馈控制能够在参考输入作用瞬间而不是出现偏差后作用于被控对象,且在前馈中引入了非线性补偿信号,能够抑制扰动对电机低速控制的影响,提升转速跟踪精度。

Description

一种有刷直流电机强化学习自适应控制方法
技术领域
本发明属于电机技术领域。
背景技术
有刷直流电机是一种重要的工业基础零部件,具有力矩系数大、过载能力强、可靠性高等优点,在汽车、机器人、航空航天等领域有着广泛的应用。随着现代科学技术的飞速发展,特别是电力电子、数字控制技术和现代控制理论的巨大进步,为有刷直流电机的高精度转速控制发展创造了有利条件,有刷直流电机高精度转速控制受到了越来越多的关注。众多领域对有刷直流电机控制性能的要求在不断地提升,高精度电机转速控制方法的开发难度也因此变高。
摩擦力矩和齿槽转矩是影响电机转速跟踪精度提升的两个关键因素。电机摩擦力矩是由电枢与电刷以及壳体等部件相互接触产生的,因此摩擦力矩是无法避免的。摩擦力矩的存在使电机转速跟踪过程中产生了低速爬行现象。电机永磁体与电枢齿槽之间相互作用产生了周期性扰动力矩,即齿槽转矩,这种力矩也是无法避免的。齿槽转矩的存在影响了电机的转速跟踪平稳度。
在传统的有刷直流电机转速控制领域,主要存在以下的问题:
(1)在有刷直流电机的控制系统中,控制器设计往往需要精确的电机参数值。但是随着温度等外界环境的变化,有刷直流电机的摩擦力模型参数和齿槽转矩参数都会随之而变化。当常温下设定的控制器参数值相对于电机当前运行实际参数值发生较大变化时,转速控制系统的控制性能会降低,甚至无法正常工作。
(2)电机负载变化、模型不确定性等未知扰动的存在对电机转速控制系统性能有较大的影响。这种影响主要表现在电机跟踪期望转速或者精确定位时产生的波动现象,它影响了运动控制系统的控制性能。
目前为了解决有刷直流电机转速跟踪控制器开发过程中所遇到的问题,许多专家学者在算法方面进行了努力,针对有刷直流电机转速控制问题已经提出了许多成型的方法:中国专利公开号106647254A,公开日2017年5月10日,专利申请号为201610867744.2,专利申请名称为“一种基于膜算法的永磁直流电动机转速在线控制方法”。专利申请中描述了一种基于膜算法的永磁直流电动机转速控制方法,能够在参数灵敏性低,涉及参数较少的情况下实现转速控制。该方法首先收集不同工况下转速与控制电压的数据,分别构造高斯过程模型和二阶多项式模型。然后,根据所构造的多项式响应模型和高斯过程预测模型构造三层膜的膜算法框架。最后根据膜算法框架中输入下一周期期望转速,得到预测控制电压,将输出层预测控制电压输出并作用到电机。该方法在一定程度上实现了有刷直流电机的转速控制,但是算法需要在线求解优化问题,算法过于复杂并且计算周期长,不易于工业实现。
中国专利公开号106602945A,公开日2017年4月26日,专利申请号为20161169775.7,专利申请名称为“一种直流有刷电机转速离散控制和显式预测控制方法”。专利申请中描述了一种基于显示预测控制有刷直流电机转速控制方法,该方法简历有刷直流电机调速系统子采样周期离散状态空间模型,能够反映直流电机调速系统本质的混杂特性,克服了传统方案开关周期内系统动态行为无法描述的缺点。但是该方法基于线性模型,没有考虑电机在低速运行过程中扰动对转速跟踪效果的影响,使该方法在低速情况下无法以较高精度控制电机转速。
工业中常用的直流电机调速方法主要是单环或双环的PID控制方法。该方法虽然具有调试简单、工程易实现的优点,但是在电机运行过程中对扰动的抑制能力不够,导致转速跟踪误差变大,在低转速工况下这种现象尤为明显。
发明内容
本发明的目的是通过参数鲁棒自适应律在线辨识齿槽转矩、非线性摩擦力模型参数以及基于强化学习的未知扰动估计补偿策略,解决了有刷直流电机转速控制过程中死区、爬行及低速不平稳问题的有刷直流电机转速非线性控制方法
本发明步骤是:
(1)建立有刷直流电机的数学模型
有刷直流电机的等效电路为电感、电阻及电动势的串联,U表示有刷直流电机电刷两端的电压,电机电枢回路平衡方程:
Figure BDA0001608504230000021
式中ε为电机电枢反电动势;i为电机电枢回路电流;R为电机电枢回路电阻;L为电机电枢回路电感;
推导出直流电机的感应电动势方程:
ε=keω (2)
式中,ε是有刷直流电机的感应电动势(V);ke是反电势常数(V·s/rad);
建立电机电枢力矩平衡方程:
Figure BDA0001608504230000022
式中,J是电机转子的转动惯量(N·m2);T是电枢的电磁转矩(N·m);ω是电机转速(rad/s);Tf是电机电枢摩擦力矩(N·m);f
Figure BDA0001608504230000023
是电机电枢与永磁体产生的齿槽转矩(N·m);d是电机的未知扰动(N·m),t是时间(s);
其中电磁转矩T由下式计算:
T=kti (4)
其中kt是转矩灵敏度系数(N·m/A);
摩擦力矩Tf采用LuGre动态摩擦力模型,由下式计算:
Figure BDA0001608504230000024
Figure BDA0001608504230000025
Figure BDA0001608504230000026
其中,σ0是鬃毛的刚度,σ1是阻尼系数,σ2是粘滞系数,z代表鬃毛的平均形变量,ωs为stribeck速率,ω为电机转速;
齿槽转矩由下式计算:
Figure BDA0001608504230000031
其中,Ti
Figure BDA0001608504230000032
分别为第i阶谐波的基频和相位,λi=iλ1,对于
Figure BDA0001608504230000033
有λi≠λj,θ为电机的机械角位移;基频λi是换相片的个数;
(2)有刷直流电机鲁棒自适应控制方法
①模型参数鲁棒自适应律设计
有刷直流电机中的LuGre动态摩擦力模型如式(5)(6)(7)所示,考虑到LuGre模型内部状态z在电机高速状态下容易产生不稳定现象,同时在高速时起到主导作用的摩擦力为静摩擦力,因此改进LuGre模型为如下形式:
Figure BDA0001608504230000034
其中:
Figure BDA0001608504230000035
在低速时LuGre模型不变,在高速时LuGre模型变换为静摩擦力模型:
Tf=Fcsgn(ω)+Fvω (11)
齿槽转矩模型为如下形式:
Figure BDA0001608504230000036
将上式展开:
Figure BDA0001608504230000037
定义
Figure BDA0001608504230000038
齿槽转矩模型变换为如下形式:
Tcog=Tcsin(λ1θ)+Tscos(λ1θ) (15)
定义齿槽转矩和摩擦力模型参数
θ=[θ1,θ2,θ3,θ4,θ5,θ6]T=[σ0,σ1,Fc,α2,Tc,Ts],令
Figure BDA0001608504230000041
为真值θ的估计值;
定义
Figure BDA0001608504230000042
·i表示向量θ中第i个元素,θi max
Figure BDA0001608504230000043
的上限,θi mim
Figure BDA0001608504230000044
的下限。
设计如下自适应律:
Figure BDA0001608504230000045
其中Γ>0为对角矩阵,值与自适应收敛速度有关;
式中的自适应函数定义为如下形式:
Figure BDA0001608504230000046
ωe=ω*-ω为速度跟踪误差,ω*为期望转速,
Figure BDA0001608504230000047
定义为如下形式:
Figure BDA0001608504230000048
齿槽转矩和摩擦力矩为
Figure BDA0001608504230000049
②基于强化学习的未知扰动估计补偿策略
下式为转速环方程:
Figure BDA00016085042300000410
未知扰动d基本结构由两部分组成,一部分为评价器神经网络,一部分为执行器神经网络;
I、执行器ActorRBF神经网络设计
设d的最优估计为:
Figure BDA00016085042300000411
ω1为神经网络的逼近误差,ξa为基向量,
Figure BDA00016085042300000412
为神经网络的最优参数权值;
为了获得接近最优的权值向量,通过强化学习自适应方法更新,执行器网络权值更新律为:
Figure BDA00016085042300000413
执行器网络输出为
Figure BDA00016085042300000414
II、评价器CriticRBF神经网络设计
评价器网络输出强化学习信号r
Figure BDA0001608504230000051
评价器网络权重更新律:
Figure BDA0001608504230000052
(23)(24)(25)式中Γa=diag(va,va),Γc=diag(vc,vc);va,vc,ηa,ηc为正的常数;ξa=[ca1,...,cal]T,ξc=[cc1,...,ccl]T为径向基向量,采用高斯函数,表达式为:
Figure BDA0001608504230000053
μi为第i个节点的中心点,ηi为高斯函数的基带宽度,ψ=[ωr,ω,eω]T为神经网络输入;
③基于微分平坦的控制器设计
I、电流环控制器设计:
定义平坦输出y1,控制量u1,状态量x1
y1=i,u1=U,x1=i (27)
状态量x被写为:
Figure BDA0001608504230000054
前馈控制量uf1被平坦输出y及其微分
Figure BDA0001608504230000055
表示为如下形式:
Figure BDA0001608504230000056
因此电流环系统是微分平坦的;
设计反馈控制器为PI形式:
Kp1(y1REF-y1)+KI1∫(y1REF-y1)dt=λ1 (30)
电流环总的控制律为:
u1=uf11 (31)
其中y1REF为转速环输出的期望电流值,Kp1,KI1为电流环反馈控制器可调参数;
II、转速环控制器设计:
定义平坦输出y2,控制量u2,状态量x2
y2=ω,u2=i,x2=ω (32)
转速环控制器输出为期望电流值:
i=iacom (33)
转速环前馈控制量可以表示为:
Figure BDA0001608504230000061
上式重写为:
Figure BDA0001608504230000062
反馈控制器设计为PI形式:
Kp2(y2REF-y2)+KI2∫(y2REF-y2)dt=λ2 (36)
转速环总的控制律为:
Figure BDA0001608504230000063
式中y2REF为期望转速,Kp2,KI2为转速环反馈控制器可调参数。
本发明的有益效果是:
1、本发明中,考虑参数的未知性和时变性,设计有刷直流电机齿槽转矩和摩擦力矩参数鲁棒自适应律,在线辨识模型参数,实现齿槽转矩和非线性摩擦力矩的精确补偿。
2、本发明中,将负载力矩和建模误差考虑为系统扰动,设计了基于强化学习的未知扰动在线估计补偿策略,能够进一步提升控制系统的扰动抑制效果。
3、本发明基于微分平坦设计前馈加反馈的二自由度控制结构。相对于传统的双环PI控制方法,该方法引入的前馈控制能够在参考输入作用瞬间而不是出现偏差后作用于被控对象,且在前馈中引入了非线性补偿信号,能够抑制扰动对电机低速控制的影响,提升转速跟踪精度。
附图说明
图1为本发明所述的有刷直流电机电枢回路等效电路图;
图2为本发明所述有刷直流电机转速控制系统控制框图;
图3为空载下,采用传统双闭环PI控制方法的正弦信号期望转速跟踪实验曲线,红线为期望转速,蓝线为实测转速,其中纵坐标为转速,单位为rad/s,横坐标为时间,单位为s;
图4为空载下,采用传统双闭环PI控制方法的正弦信号期望转速跟踪误差曲线,其中纵坐标为转速跟踪误差,单位为rad/s,横坐标为时间,单位为s;
图5为空载下,采用本发明所述控制方法的正弦信号期望转速转速跟踪误差曲线,红线为期望转速,蓝线为实测转速,其中纵坐标为转速,单位为rad/s,横坐标为时间,单位为s;
图6为空载下,采用本发明所述控制方法的正弦信号期望转速跟踪误差曲线,其中纵坐标为转速跟踪误差,单位为rad/s,横坐标为时间,单位为s;
图7为空载下,采用传统双闭环PI控制方法的跟踪1rad/s稳态低转速的跟踪曲线,其中纵坐标为实测转速,单位为rad/s,横坐标为时间,单位为s;
图8为空载下,采用本发明所述控制方法的跟踪1rad/s稳态低转速的跟踪曲线,其中纵坐标为实测转速,单位为rad/s,横坐标为时间,单位为s。
具体实施方式
通过不断地研究和实践,本发明的发明人发现合适的自适应率可以在线估计摩擦力矩和齿槽转矩参数,达到精确补偿电机摩擦力矩和齿槽转矩的目的;同时设计基于强化学习的未知扰动估计补偿策略,能够抑制未知扰动对电机稳态运行平稳度造成的影响,这样的方法能够给电机带来更好的转速跟踪性能。本发明以有刷直流电机数学模型为基础,设计了基于强化学习的有刷直流电机自适应控制方法。
本发明步骤是:
(1)建立有刷直流电机的数学模型
图1为有刷直流电机电路原理图,可以看出有刷直流电机的等效电路为电感、电阻及电动势的串联,U表示有刷直流电机电刷两端的电压,根据基尔霍夫电压定律,可以得到电机电枢回路平衡方程:
Figure BDA0001608504230000071
式中ε为电机电枢反电动势;i为电机电枢回路电流;R为电机电枢回路电阻;L为电机电枢回路电感。
根据电磁感应定律可以推导出直流电机的感应电动势方程:
ε=keω (2)
式中,ε是有刷直流电机的感应电动势(V);ke是反电势常数(V·s/rad)。
根据牛顿第二定律建立电机电枢力矩平衡方程:
Figure BDA0001608504230000072
式中,J是电机转子的转动惯量(N·m2);T是电枢的电磁转矩(N·m);ω是电机转速(rad/s);Tf是电机电枢摩擦力矩(N·m);f
Figure BDA0001608504230000073
是电机电枢与永磁体产生的齿槽转矩(N·m);d是电机的未知扰动(N·m),t是时间(s);
其中电磁转矩T由下式计算:
T=kti (4)
其中kt是转矩灵敏度系数(N·m/A);
摩擦力矩Tf采用LuGre动态摩擦力模型,由下式计算:
Figure BDA0001608504230000074
Figure BDA0001608504230000075
Figure BDA0001608504230000076
其中,σ0是鬃毛的刚度,σ1是阻尼系数,σ2是粘滞系数,z代表鬃毛的平均形变量,ωs为stribeck速率,ω为电机转速。
齿槽转矩由下式计算:
Figure BDA0001608504230000081
其中,Ti
Figure BDA0001608504230000082
分别为第i阶谐波的基频和相位,λi=iλ1,对于
Figure BDA0001608504230000083
有λi≠λj,θ为电机的机械角位移;基频λi是换相片的个数,是由电机本体的结构决定的,可以通过离线辨识的方法获取。载波的幅值和相位是预先不知道的。
(2)基于强化学习的有刷直流电机鲁棒自适应控制方法
本实施方式所述控制方法首先针对电机中存在的齿槽转矩和非线性摩擦力,考虑到齿槽转矩参数和LuGre摩擦力模型参数存在不确定性和时变性,设计鲁棒自适应律在线估计模型参数。其次,考虑到电机未知扰动,采用强化学习方法,设计了基于Actor-Critic机制的模型不确定性估计补偿算法。最后,证明了系统是微分平坦的,设计基于微分平坦的有刷直流电机非线性转速控制器。控制系统框图如图2所示。
①模型参数鲁棒自适应律设计
有刷直流电机中的LuGre动态摩擦力模型如式(5)(6)(7)所示,考虑到LuGre模型内部状态z在电机高速状态下容易产生不稳定现象,同时在高速时起到主导作用的摩擦力为静摩擦力,因此改进LuGre模型为如下形式:
Figure BDA0001608504230000084
其中:
Figure BDA0001608504230000085
这样在低速时LuGre模型不变,在高速时LuGre模型变换为静摩擦力模型:
Tf=Fcsgn(ω)+Fvω (11)。
本发明采用占据主导作用的一阶谐波的基频,因此齿槽转矩模型为如下形式:
Figure BDA0001608504230000086
为了计算齿槽转矩,将上式展开:
Figure BDA0001608504230000087
定义
Figure BDA0001608504230000088
齿槽转矩模型变换为如下形式:
Tcog=Tcsin(λ1θ)+Tscos(λ1θ) (15)
由于在每次运行时齿槽转矩的相位都不相同,因此Ts,Tc为未知参数。
自适应方法可以在线的辨识齿槽转矩和摩擦力矩模型的参数。定义齿槽转矩和摩擦力模型参数
θ=[θ1,θ2,θ3,θ4,θ5,θ6]T=[σ0,σ1,Fc,α2,Tc,Ts],令
Figure BDA0001608504230000091
为真值θ的估计值;
定义
Figure BDA0001608504230000092
·i表示向量θ中第i个元素,θi max
Figure BDA0001608504230000093
的上限,θi min
Figure BDA0001608504230000094
的下限。
设计如下自适应律:
Figure BDA0001608504230000095
其中Γ>0为对角矩阵,值与自适应收敛速度有关;
式中的自适应函数定义为如下形式:
Figure BDA0001608504230000096
这里的ωe=ω*-ω为速度跟踪误差,ω*为期望转速,
Figure BDA0001608504230000097
定义为如下形式:
Figure BDA0001608504230000098
因此估计出的齿槽转矩和摩擦力矩为
Figure BDA0001608504230000099
②基于强化学习的未知扰动估计补偿策略
针对转速环存在的未知扰动,采用强化学习中的Actor-Critic机制在线估计未知扰动d。
下式为转速环方程:
Figure BDA00016085042300000910
基于Actor-Critic机制估计系统未知扰动d基本结构由两部分组成,一部分为评价器神经网络,用于评价系统的运行状况,产生对评价信号的预报。一部分为执行器神经网络,,执行器神经网络根据评价器神经网络输出的评价信号产生动作,作用到系统中。这里执行器神经网络的输出为未知扰动d。
I、执行器ActorRBF神经网络设计
设d的最优估计为:
Figure BDA0001608504230000101
ω1为神经网络的逼近误差,ξa为基向量,
Figure BDA0001608504230000102
为神经网络的最优参数权值。
为了获得接近最优的权值向量,通过强化学习自适应方法更新,执行器网络权值更新律为:
Figure BDA0001608504230000103
执行器网络输出为
Figure BDA0001608504230000104
II、评价器CriticRBF神经网络设计
评价器网络输出强化学习信号r
Figure BDA0001608504230000105
评价器网络权重更新律:
Figure BDA0001608504230000106
(23)(24)(25)式中Γa=diag(va,va),Γc=diag(vc,vc);va,vc,ηa,ηc为正的常数;ξa=[ca1,...,cal]T,ξc=[cc1,...,ccl]T为径向基向量,采用高斯函数,表达式为:
Figure BDA0001608504230000107
μi为第i个节点的中心点,ηi为高斯函数的基带宽度,ψ=[ωr,ω,eω]T为神经网络输入;
③基于微分平坦的控制器设计
I、电流环控制器设计:
在设计微分平坦前馈控制器之前,首先证明系统是微分平坦的。定义平坦输出y1,控制量u1,状态量x1
y1=i,u1=U,x1=i (27)
状态量x被写为:
Figure BDA0001608504230000108
根据电机模型,前馈控制量uf1被平坦输出y及其微分
Figure BDA00016085042300001010
表示为如下形式:
Figure BDA0001608504230000109
因此电流环系统是微分平坦的。
设计反馈控制器为PI形式:
Kp1(y1REF-y1)+KI1∫(y1REF-y1)dt=λ1 (30)
电流环总的控制律为:
u1=uf11 (31)
其中y1REF为转速环输出的期望电流值,Kp1,KI1为电流环反馈控制器可调参数。
II、转速环控制器设计:
首先证明转速环系统是微分平坦的,定义平坦输出y2,控制量u2,状态量x2
y2=ω,u2=i,x2=ω (32)
转速环控制器输出为期望电流值:
i=iacom (33)
转速环前馈控制量可以表示为:
Figure BDA0001608504230000111
因此系统是微分平坦的。由于摩擦力矩和齿槽转矩模型参数采用自适应律在线估计出,未知扰动采用强化学习方法估计,因此上式重写为:
Figure BDA0001608504230000112
反馈控制器设计为PI形式:
Kp2(y2REF-y2)+KI2∫(y2REF-y2)dt=λ2 (36)
转速环总的控制律为:
Figure BDA0001608504230000113
式中y2REF为期望转速,Kp2,KI2为转速环反馈控制器可调参数。
实验分析
为了验证本发明提出控制方法的有效性吗,建立了基于dSPACE的有刷直流电机转速控制快速原型实验平台。实验电机的参数如下:
额定电压 12V
额定电流 12A
峰值堵转转矩 1.5N·m
电枢电阻
反电势常数 0.016V·s/rad
转矩灵敏度系数 0.125N·m/A
额定转速 753r/min
图3为在空载条件下,给定转速为ω=4sin(t)的正弦信号,控制算法为双环PI的转速跟踪曲线,其中红线代表期望转速,蓝线代表实测转速,从图3中可以看出,在电机换向的过程中出现了死区现象,这是由于摩擦力的存在而造成的,图4为转速跟踪误差曲线,误差峰值约1.7rad/s,跟踪误差较大,说明双环PI控制不能很好的抑制电机扰动。图5为空载条件下,给定转速为ω=4sin(t)的正弦信号,控制算法为基于强化学习的自适应鲁棒自适应控制方法的转速跟踪曲线,其中红线代表期望转速,蓝线代表实测转速,从图5中可以看出,实测转速能够紧贴期望转速,跟踪效果较好。图6为转速跟踪误差曲线,误差峰值约0.5rad/s,与双环PI控制的方法相比跟踪误差较小,低速区的死区现象得到了很好的抑制,说明本发明的方法具有较好的扰动抑制效果。
图7为空载条件下,给定转速为1rad/s时,双环PI控制的转速跟踪曲线。从图7中可以看出在电机运行过程中,电机出现了抖动现象,转速跟踪误差峰值约为1rad/s,几乎为期望转速的100%,说明在低转速工况下,传统的双环PI控制算法扰动抑制能力较弱,电机不能很好的跟踪期望转速。图8为给定转速为1rad/s时基于强化学习的自适应鲁棒自适应控制方法的转速跟踪曲线,从图8中可以看出在电机运行过程中,电机运行较为平稳,转速跟踪误差峰值约0.4rad/s,为期望转速的40%,与传统双环PI方法相比,在低转速工况下本发明方法有着较好的扰动抑制能力。
由上述实验结果可以看出,有刷直流电机的转速控制中,本发明提出的基于强化学习的自适应鲁棒自适应控制方法控制性能均优于传统的双环PI控制,本发明方法有较好的扰动抑制能力。

Claims (1)

1.一种有刷直流电机强化学习自适应控制方法,其特征在于:其步骤是:
(1)建立有刷直流电机的数学模型
有刷直流电机的等效电路为电感、电阻及电动势的串联,U表示有刷直流电机电刷两端的电压,电机电枢回路平衡方程:
Figure FDA0001608504220000011
式中ε为电机电枢反电动势;i为电机电枢回路电流;R为电机电枢回路电阻;L为电机电枢回路电感;
推导出直流电机的感应电动势方程:
ε=keω (2)
式中,ε是有刷直流电机的感应电动势(V);ke是反电势常数(V·s/rad);
建立电机电枢力矩平衡方程:
Figure FDA0001608504220000012
式中,J是电机转子的转动惯量(N·m2);T是电枢的电磁转矩(N·m);ω是电机转速(rad/s);Tf是电机电枢摩擦力矩(N·m);
Figure FDA0001608504220000018
是电机电枢与永磁体产生的齿槽转矩(N·m);d是电机的未知扰动(N·m),t是时间(s);
其中电磁转矩T由下式计算:
T=kti (4)
其中kt是转矩灵敏度系数(N·m/A);
摩擦力矩Tf采用LuGre动态摩擦力模型,由下式计算:
Figure FDA0001608504220000013
Figure FDA0001608504220000014
Figure FDA0001608504220000015
其中,σ0是鬃毛的刚度,σ1是阻尼系数,σ2是粘滞系数,z代表鬃毛的平均形变量,ωs为stribeck速率,ω为电机转速;
齿槽转矩由下式计算:
Figure FDA0001608504220000016
其中,Ti
Figure FDA0001608504220000017
分别为第i阶谐波的基频和相位,λi=iλ1,对于
Figure FDA0001608504220000019
有λi≠λj,θ为电机的机械角位移;基频λi是换相片的个数;
(2)有刷直流电机鲁棒自适应控制方法
①模型参数鲁棒自适应律设计
有刷直流电机中的LuGre动态摩擦力模型如式(5)(6)(7)所示,考虑到LuGre模型内部状态z在电机高速状态下容易产生不稳定现象,同时在高速时起到主导作用的摩擦力为静摩擦力,因此改进LuGre模型为如下形式:
Figure FDA0001608504220000021
Figure FDA0001608504220000022
Figure FDA0001608504220000023
其中:
Figure FDA0001608504220000024
在低速时LuGre模型不变,在高速时LuGre模型变换为静摩擦力模型:
Tf=Fcsgn(ω)+Fvω (11)
齿槽转矩模型为如下形式:
Figure FDA0001608504220000025
将上式展开:
Figure FDA0001608504220000026
定义
Figure FDA0001608504220000027
齿槽转矩模型变换为如下形式:
Tcog=Tcsin(λ1θ)+Tscos(λ1θ) (15)
定义齿槽转矩和摩擦力模型参数
θ=[θ1,θ2,θ3,θ4,θ5,θ6]T=[σ0,σ1,Fc,α2,Tc,Ts],令
Figure FDA0001608504220000028
为真值θ的估计值;
定义
Figure FDA0001608504220000029
·i表示向量θ中第i个元素,θi max
Figure FDA00016085042200000210
的上限,θi min
Figure FDA00016085042200000211
的下限;
设计如下自适应律:
Figure FDA0001608504220000031
其中Γ>0为对角矩阵,值与自适应收敛速度有关;
式中的自适应函数定义为如下形式:
Figure FDA0001608504220000032
ωe=ω*-ω为速度跟踪误差,ω*为期望转速,
Figure FDA0001608504220000033
定义为如下形式:
Figure FDA0001608504220000034
齿槽转矩和摩擦力矩为
Figure FDA0001608504220000035
②基于强化学习的未知扰动估计补偿策略
下式为转速环方程:
Figure FDA0001608504220000036
未知扰动d基本结构由两部分组成,一部分为评价器神经网络,一部分为执行器神经网络;
I、执行器ActorRBF神经网络设计
设d的最优估计为:
Figure FDA0001608504220000037
ω1为神经网络的逼近误差,ξa为基向量,
Figure FDA0001608504220000038
为神经网络的最优参数权值;
为了获得接近最优的权值向量,通过强化学习自适应方法更新,执行器网络权值更新律为:
Figure FDA0001608504220000039
执行器网络输出为
Figure FDA00016085042200000310
II、评价器CriticRBF神经网络设计
评价器网络输出强化学习信号r
Figure FDA00016085042200000311
评价器网络权重更新律:
Figure FDA00016085042200000312
(23)(24)(25)式中Γa=diag(va,va),Γc=diag(vc,vc);va,vc,ηa,ηc为正的常数;ξa=[ca1,...,cal]T,ξc=[cc1,...,ccl]T为径向基向量,采用高斯函数,表达式为:
Figure FDA0001608504220000041
μi为第i个节点的中心点,ηi为高斯函数的基带宽度,ψ=[ωr,ω,eω]T为神经网络输入;
③基于微分平坦的控制器设计
I、电流环控制器设计:
定义平坦输出y1,控制量u1,状态量x1
y1=i,u1=U,x1=i (27)
状态量x被写为:
Figure FDA0001608504220000042
前馈控制量uf1被平坦输出y及其微分
Figure FDA0001608504220000046
表示为如下形式:
Figure FDA0001608504220000043
因此电流环系统是微分平坦的;
设计反馈控制器为PI形式:
Kp1(y1REF-y1)+KI1∫(y1REF-y1)dt=λ1 (30)
电流环总的控制律为:
u1=uf11 (31)
其中y1REF为转速环输出的期望电流值,Kp1,KI1为电流环反馈控制器可调参数;
II、转速环控制器设计:
定义平坦输出y2,控制量u2,状态量x2
y2=ω,u2=i,x2=ω (32)
转速环控制器输出为期望电流值:
i=iacom (33)
转速环前馈控制量可以表示为:
Figure FDA0001608504220000044
上式重写为:
Figure FDA0001608504220000045
反馈控制器设计为PI形式:
Kp2(y2REF-y2)+KI2∫(y2REF-y2)dt=λ2 (36)
转速环总的控制律为:
Figure FDA0001608504220000051
式中y2REF为期望转速,Kp2,KI2为转速环反馈控制器可调参数。
CN201810253881.6A 2018-03-26 2018-03-26 一种有刷直流电机强化学习自适应控制方法 Active CN108448978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810253881.6A CN108448978B (zh) 2018-03-26 2018-03-26 一种有刷直流电机强化学习自适应控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810253881.6A CN108448978B (zh) 2018-03-26 2018-03-26 一种有刷直流电机强化学习自适应控制方法

Publications (2)

Publication Number Publication Date
CN108448978A CN108448978A (zh) 2018-08-24
CN108448978B true CN108448978B (zh) 2021-04-30

Family

ID=63197167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810253881.6A Active CN108448978B (zh) 2018-03-26 2018-03-26 一种有刷直流电机强化学习自适应控制方法

Country Status (1)

Country Link
CN (1) CN108448978B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110504877B (zh) * 2019-08-30 2022-03-25 广东工业大学 电机转速pi调节方法、系统、装置及存储介质
CN111665718B (zh) * 2020-06-05 2022-05-10 长春工业大学 一种基于q学习算法的对角递归神经网络控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6598008B2 (en) * 2001-07-06 2003-07-22 Samsung Electronics Co., Ltd. Method of estimating speed of induction motor and magnetic flux of rotor
CN101846975A (zh) * 2010-05-28 2010-09-29 北京理工大学 带有动态摩擦补偿的伺服系统自适应鲁棒控制器
CN103780188A (zh) * 2014-01-23 2014-05-07 安徽大学 基于动态摩擦补偿的永磁球形电机转子自适应控制系统
CN105071723A (zh) * 2015-06-16 2015-11-18 吉林大学 三步法设计的有刷直流电机复合控制方法
CN105490461A (zh) * 2015-12-24 2016-04-13 合肥工业大学 电机转角检测装置与检测方法
CN106208824A (zh) * 2016-07-22 2016-12-07 浙江工业大学 一种基于自抗扰迭代学习的多电机同步控制方法
CN107395074A (zh) * 2017-07-24 2017-11-24 吉林大学 基于fpga实现的永磁直流电机多分辨率控制器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6598008B2 (en) * 2001-07-06 2003-07-22 Samsung Electronics Co., Ltd. Method of estimating speed of induction motor and magnetic flux of rotor
CN101846975A (zh) * 2010-05-28 2010-09-29 北京理工大学 带有动态摩擦补偿的伺服系统自适应鲁棒控制器
CN103780188A (zh) * 2014-01-23 2014-05-07 安徽大学 基于动态摩擦补偿的永磁球形电机转子自适应控制系统
CN105071723A (zh) * 2015-06-16 2015-11-18 吉林大学 三步法设计的有刷直流电机复合控制方法
CN105490461A (zh) * 2015-12-24 2016-04-13 合肥工业大学 电机转角检测装置与检测方法
CN106208824A (zh) * 2016-07-22 2016-12-07 浙江工业大学 一种基于自抗扰迭代学习的多电机同步控制方法
CN107395074A (zh) * 2017-07-24 2017-11-24 吉林大学 基于fpga实现的永磁直流电机多分辨率控制器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"有刷直流电机自适应滑模控制器设计与实验";顾万里; 胡云峰; 张森; 陈虹;《西安交通大学学报》;20170628;全文 *
"有刷直流电机非线性控制系统设计";顾万里; 张森; 胡云峰; 陈虹;《吉林大学学报(工学版)》;20160922;全文 *

Also Published As

Publication number Publication date
CN108448978A (zh) 2018-08-24

Similar Documents

Publication Publication Date Title
CN108233781B (zh) 基于干扰观测器的直流电机自适应反演滑模控制方法
WO2018120323A1 (zh) 同时消除反电势、负载转矩扰动的伺服控制策略及其系统
Hu et al. Performance-oriented adaptive robust control of a class of nonlinear systems preceded by unknown dead zone with comparative experimental results
Ro et al. Robust friction compensation for submicrometer positioning and tracking for a ball-screw-driven slide system
CN107121932B (zh) 电机伺服系统误差符号积分鲁棒自适应控制方法
CN108322120B (zh) 适用于永磁同步电机的鲁棒非线性预测转矩控制方法
CN108448978B (zh) 一种有刷直流电机强化学习自适应控制方法
CN110649845B (zh) 基于鲁棒广义预测控制的光电转台位置跟踪控制方法
CN113206623B (zh) 基于快速积分终端滑模及干扰估计的永磁同步电机有限时间调速控制方法
Zhou et al. Nonlinearity compensation and high-frequency flexibility suppression based RIC method for precision motion control systems
CN111585475A (zh) 一种无刷直流电机伺服系统扰动抑制与高精度跟踪控制方法
Zhang et al. High precision tracking control of a servo gantry with dynamic friction compensation
JPWO2014091840A1 (ja) サーボ制御装置
Liu et al. Cascade tracking control of servo motor with robust adaptive fuzzy compensation
CN112701975A (zh) 一种双惯量伺服系统的自适应齿隙振荡抑制方法
CN108566137B (zh) 一种电机位置伺服控制器的离散时域参数化设计方法
Wang et al. Hybrid active–passive robust control framework of a flexure-joint dual-drive gantry robot for high-precision contouring tasks
Xun et al. An exoskeleton joint output force control technology based on improved ADRC
Zheng et al. Adaptive control of robotic servo system with friction compensation
CN109324503A (zh) 基于鲁棒积分的多层神经网络电机系统控制方法
CN110995098B (zh) 一种永磁同步电机的反演控制方法
Li et al. Adaptive backstepping sliding mode control for the oscillation displacement system of continuous casting mold with mismatched disturbances
Aghaee et al. BLDC motor speed control based on MPC sliding mode multi-loop control strategy–implementation on Matlab and Arduino software
Hu et al. Suppression of limit cycle oscillation for two-mass system with backlash nonlinearity based on dual Luenberger observer
Satoh et al. Performance improvement of predictive functional control: a disturbance observer approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant