CN108155836B - 基于全局在线启发式动态规划永磁同步电机矢量控制方法 - Google Patents
基于全局在线启发式动态规划永磁同步电机矢量控制方法 Download PDFInfo
- Publication number
- CN108155836B CN108155836B CN201810071519.7A CN201810071519A CN108155836B CN 108155836 B CN108155836 B CN 108155836B CN 201810071519 A CN201810071519 A CN 201810071519A CN 108155836 B CN108155836 B CN 108155836B
- Authority
- CN
- China
- Prior art keywords
- current time
- target network
- network
- hidden layer
- permanent magnet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001360 synchronised effect Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 230000002787 reinforcement Effects 0.000 claims abstract description 34
- 238000013459 approach Methods 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims description 70
- 239000011159 matrix material Substances 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 39
- 210000002569 neuron Anatomy 0.000 claims description 32
- 230000004913 activation Effects 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 10
- 230000010349 pulsation Effects 0.000 abstract description 6
- 238000005457 optimization Methods 0.000 abstract 1
- 238000005070 sampling Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P21/00—Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
- H02P21/0003—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control
- H02P21/0007—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control using sliding mode control
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P21/00—Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
- H02P21/0003—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control
- H02P21/0014—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control using neural networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P21/00—Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
- H02P21/0003—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control
- H02P21/0025—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control implementing a off line learning phase to determine and store useful data for on-line control
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P21/00—Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
- H02P21/14—Estimation or adaptation of machine parameters, e.g. flux, current or voltage
- H02P21/18—Estimation of position or speed
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P21/00—Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
- H02P21/22—Current control, e.g. using a current control loop
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P6/00—Arrangements for controlling synchronous motors or other dynamo-electric motors using electronic commutation dependent on the rotor position; Electronic commutators therefor
- H02P6/10—Arrangements for controlling torque ripple, e.g. providing reduced torque ripple
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Control Of Ac Motors In General (AREA)
Abstract
本发明公开了一种基于全局在线启发式动态规划永磁同步电机矢量控制方法,电流环采用改进趋近率的滑模变结构控制器,减小了电流抖振现象,抑制了永磁同步电机转矩脉动,速度环采用了一种单神经元全局在线启发式动态规划算法来评价永磁同步电机的参数变化,自适应的调整折扣因子K,该算法通过对电机编码器的采样,以目标转速和实际转速的差为零作为优化目标,从而设计强化学习信号,并通过目标网络产生一个内部的强化学习信号来提高系统的学习能力,通过不断地在线学习来调节q轴电流的参考量,补偿永磁同步电机参数的变化,从而增强永磁同步电机的速度抗干扰能力。本发明提出的方法对于永磁同步电机矢量控制系统具有很强的针对性和实用性。
Description
技术领域
本发明涉及到永磁同步电机智能控制技术领域,具体涉及到一种基于全局在线启发式动态规划永磁同步电机矢量控制方法。
背景技术
永磁同步电机(PMSM)具有功率密度高、结构简单、体积小、可靠性强等优点,被广泛的应用于数控机床、航空航天和机器人的机械手控制等领域。永磁同步电机自身也是一个强耦合、非线性的控制系统,存在参数变化和外部扰动的问题。因此,针对永磁同步电机的可靠控制方法一直是国内外研究重点。近几年出现了很多针对永磁同步电机的非线性控制方法,国外的S.Barkat学者(S.Barkat,A.and H.Nouri,“NoninteractingAdaptive Control of PMSM Using Interval Type-2 Fuzzy Logic Systems,”IEEETrans.Fuzzy Syst.,vol.19,no.5,pp.925-936,Oct.2011.)将模糊控制方法应用于永磁同步电机的控制。但是模糊控制方法的隶属函数需要人为的经验设置,在实际应用中使用较为困难。在PMSM高速长时间运行时,电机参数(如:交直轴电感,电阻,永磁体磁链等参数)变化很大,传统的PI、模糊、滑模等控制方法对电机参数的依赖性较强,当参数变化时,会影响其控制效果。
单神经元PI控制方法,相对于传统的控制方法可以在线的整定比例、积分参数,近几年受到国外学者的广泛关注,加拿大的C.B.Butt博士(C.B.Butt and M.A.Rahman,“Intelligent Speed Control of Interior Permanent Magnet Motor Drives Using aSingle Untrained Artificial Neuron,”IEEE Trans.Ind.Appl.,vol.49,no.4,pp.1836-1843,Jul.2013.)将单神经元PI用于内嵌式永磁同步电机(IPMSM)的速度控制,并取得了较好的控制效果。但是,单神经元PI算法虽然可以在线的实时整定比例、积分参数,其折扣因子K,需要经验来设置,设置过大,会引起系统震荡,设置过小,又会导致系统响应过慢。
传统滑模变结构控制(SMC)方法,其滑动模态可以进行设计且与对象参数及扰动无关,这就使得SMC控制具有快速响应、对应参数变化及扰动不灵敏、无需系统在线辨识、物理实现简单等优点。但是传统SMC控制在进入滑模面后,会存在“抖振”现象,将其用于永磁同步电机矢量控制系统电流内环,容易引起永磁同步电机转矩脉动。
发明内容
技术问题:本发明提供一种基于全局在线启发式动态规划永磁同步电机矢量控制方法,实现了永磁同步电机矢量控制系统的智能在线控制,减小了永磁同步电机高速运行中的速度波动,同时减小了电流的抖振,抑制了系统运行的转矩脉动,增强控制系统的鲁棒性和稳定性。
技术方案:本发明的基于全局在线启发式动态规划永磁同步电机矢量控制方法,包括以下步骤:
步骤1:初始化单神经元全局在线启发式动态规划算法的目标网络学习率、评价网络学习率、单神经元PI算法参数,根据系统的跟踪误差,设计外部强化学习信号;
步骤2:通过神经网络正向传输,计算评价网络的输出和目标网络的输出,所述评价网络的输出为性能指标函数J(t),所述目标网络的输出为内部强化学习信号S(t),其中t表示当前时刻;
步骤3:计算目标网络误差和评价网络误差,通过计算出的误差分别对目标网络和评价网络的权值进行在线调整;
步骤4:通过求解最优性能指标函数,得到单神经元PI算法K值,通过得到的K值调节单神经元PI控制算法的输出,即永磁同步电机系统q轴电流的参考值iq *;
步骤5:矢量控制系统中的d轴电流内环采用改变趋近率的滑模变结构控制器,通过d轴给定参考值id *=0和实际电流id的差,来调节d轴电压ud;
矢量控制系统中的q轴电流内环采用改变趋近率的滑模变结构控制器,通过步骤4得到的q轴电流的参考值iq *和实际电流iq的差,来调节q轴电压uq。
进一步的,本发明方法中,所述步骤1中按照下式设计外部强化学习信号r(t):
r(t)=0.98*e(t)+0.02*e(t-1),e(t)=ω*(t)-ω(t)
其中,t表示当前时刻,t-1表示上一时刻,ω*(t)为目标转速,ω(t)为实际转速,e(t)为当前时刻转速差,e(t-1)为上一时刻转速差。
进一步的,本发明方法中,所述步骤2中的性能指标函数为:
其中,为评价网络激活函数,为当前时刻评价网络输入向量,ck(t)为当前时刻t的评价网络输入向量中的第k个元素,k的取值范围为1到5,t-1为上一时刻,l为评价网络隐层节点序号,l取值范围为1到Nc,Nc为评价网络隐层节点数,Nf为目标网络隐层节点数,u(t)为当前时刻t的控制量,u(t-1)为上一时刻控制量,e(t)为当前时刻t的系统误差,e(t-1)为上一时刻系统误差,S(t)为当前时刻t的内部强化学习信号,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第k列元素,zl(t)为当前时刻t的评价网络隐层输出向量的第l个元素,为当前时刻t的评价网络隐层到输出层的权值矩阵第l个元素,J(t)为当前时刻t的性能指标函数。
进一步的,本发明方法中,所述步骤2中的内部强化学习信号S(t)为:
其中,为目标网络的激活函数,aj(t)为当前时刻t的目标网络输入向量中的第j个元素,j的取值范围为1到4,t表示当前时刻,t-1表示上一时刻,i的取值范围为1到Nf,Nf为目标网络隐层节点数,i为目标网络隐层节点序号,u(t)为当前时刻t的控制量,u(t-1)为上一时刻控制量,e(t)为当前时刻t的系统误差,e(t-1)为上一时刻系统误差,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,S(t)为当前时刻t的内部强化学习信号。
进一步的,本发明方法中,所述步骤3中根据下式计算目标网络误差:
ef(t)=αS(t)-[S(t-1)-r(t-1)]
其中,α为目标网络折扣因子,其取值范围为0<α<1,S(t)为t时刻的内部强化学习信号,S(t-1)为上一时刻的内部强化学习信号,r(t-1)为上一时刻的外部强化学习信号,ef(t)为当前时刻t的目标网络误差。
进一步的,本发明方法中,所述步骤3中根据下式计算评价网络误差:
ec(t)=γJ(t)-[J(t-1)-S(t)]
其中,γ为评价网络折扣因子,其取值范围为0<γ<1,J(t)为当前时刻t的性能指标,J(t-1)为上一时刻性能指标,S(t)为当前时刻t的内部强化学习信号,ec(t)为当前时刻t的评价网络误差。
进一步的,本发明方法中,所述步骤3中根据以下调整规则对目标网络的权值进行在线调整:
其中,aj(t)为当前时刻t的目标网络输入向量中的第j个元素,lf(t)是当前时刻t的目标网络学习率,ef(t)为当前时刻t的目标网络误差,Ef(t)是当前时刻t的目标网络误差的平方,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素的增量,为当前时刻t的目标网络输入层到隐层权值矩阵第i行,第j列元素的增量,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,S(t)为当前时刻t的内部强化学习信号,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,α为目标网络折扣因子。
进一步的,本发明方法中,所述步骤3中根据以下调整规则对评价网络的权值进行在线调整:
其中,ck(t)为当前时刻t的评价网络输入向量中的第k个元素,lc(t)为当前时刻t的评价网络学习率,ec(t)为当前时刻t的评价网络误差,Ec(t)为当前时刻t的评价网络误差的平方,为当前时刻t的评价网络隐层到输出层权值矩阵第l个元素的增量,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第k列元素的增量,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为评价网络的激活函数,zl(t)为当前时刻t的目标网络隐层输出向量的第l个元素,J(t)为当前时刻t的性能指标,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,γ为评价网络折扣因子。
进一步的,本发明方法中,所述步骤4中按照如下方法求解最优性能指标函数:
K(t)=K(t-1)+ΔK(t)
其中,la(t)为当前时刻t的单神经元PI折扣因子学习率,ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差,Ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差的平方,ΔK(t)为当前时刻t的K值增量,Δu(t)为当前时刻t的控制信号的增量,u(t)为当前时刻t的控制信号,为当前时刻t的目标网络输入层到隐层权值矩阵第i行,第3列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第4列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第1列元素,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为评价网络的激活函数,zl(t)为当前时刻t的目标网络隐层输出向量的第l个元素,J(t)为当前时刻t的性能指标,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,为当前时刻t的评价网络隐层到输出层的权值矩阵第l个元素,S(t)为当前时刻t的内部强化学习信号,K(t-1)为上一时刻单神经元PI算法K值,K(t)为当前时刻t的K值。
本发明方法通过构建永磁同步电机id=0矢量控制系统,基于全局在线启发式动态规划算法设计近似最优性能指标函数,求解最优控制率,单神经元PI控制器的折扣因子K值,调节控制器输出永磁同步电机系统的q轴参考电流维持永磁同步电机矢量控制系统速度稳定。当电机参数改变时,全局在线启发式动态规划算法可以在线学习电机参数的变化,求解当前的最优K值,实现永磁同步电机矢量控制系统的智能在线控制,减小了永磁同步电机高速运行中的速度波动,同时联合改进趋近率的SMC电流内环控制器,减小了电流的抖振,抑制了系统运行的转矩脉动,增强控制系统的鲁棒性和稳定性。
有益效果:本发明与现有技术相比,具有以下优点:
传统的永磁同步电机矢量控制系统的电流环大多采用PI控制算法,PI控制算法实现现简单,运用广泛,但是PI控制算法存在经典控制理论的固有缺陷,对系统参数变化和外界扰动过于敏感,很难满足永磁同步电机的控制需求。滑模变结构控制(SMC)是一种特殊的非线性控制方法,具有较强的抗外界扰动能力,但是传统的滑模变结构控制存在固有的抖振问题,在提高了永磁同步电机的电流环的抗扰动能力的同时,又产生了电流抖振现象,导致了永磁同步电机的转矩脉动问题,本发明提出的永磁同步电机矢量控制系统的电流内环采用新型趋近律的SMC控制器,相对于现有的SMC控制器,该控制器可以有效地减弱永磁同步电机电流抖振现象,减弱了永磁同步电机实际运行中的转矩脉动。
传统的永磁同步电机矢量控制系统的速度环大多也采用PI控制算法,如上所述,PI控制算法对系统参数变化和外界扰动过于敏感,很难满足永磁同步电机的速度控制需求。单神经元PI控制算法可以自适应的调整比例、积分参数,将其用于永磁同步电机的速度控制,可以显著的提高永磁同步电机的速度稳定性,但是,单神经元PI算法虽然可以在线的实时整定比例、积分参数,其折扣因子K,需要经验来设置,设置过大,会引起系统震荡,设置过小,又会导致系统响应过慢。本发明将全局在线启发式动态规划算法和单神经元PI算法重新整合,提出了单神经元全局在线启发式动态规划永磁同步电机速度控制器,引入了机器学习的思想,可以使永磁同步电机速度控制器根据环境特征不断地自学习,增强永磁同步电机运行的速度稳定性和鲁棒性。
本发明提出的永磁同步电机矢量控制方法,联合改进趋近率滑模变结构电流控制器、单神经全局在线启发式动态规划算法速度控制器,显著了提高了永磁同步电机的电流响应速度、减小了永磁同步电机转矩脉动、增强了电流环抗扰动能力,增强了速度环稳定性和鲁棒性。该方法具有实现成本低、扩展性强的优点,既可以用于小功率永磁同步电机系统,例如:伺服系统、小功率医疗器械等领域,也可以用于大功率的永磁同步电机系统,例如:电动汽车电机控制、大型机械加工等领域。
附图说明
图1为永磁同步电机矢量控制系统结构示意图。
图2为单神经元全局在线启发式动态规划算法结构示意图。
图3为目标网络结构示意图。
图4为评价网络结构示意图。
图5为单神经元PI结构示意图。
图6为硬件实施结构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
基于全局在线启发式动态规划永磁同步电机矢量控制方法,其实施具体包括以下步骤:
步骤1:初始化单神经元全局在线启发式动态规划算法的目标网络学习率、评价网络学习率、单神经元PI算法参数,根据系统的跟踪误差,设计外部强化学习信号;
构建永磁同步电机矢量控制系统。图1为永磁同步电机矢量控制系统结构示意图,包括三相全桥电压源型逆变器、编码器采集模块、SVPWM算法模块、Park变换模块、Clark变换模块和逆Park变换模块、两个电流内环SMC控制器、和一个速度外环SAN-GRHDP控制器。首先建立系统的整体硬件平台,具体实施如图6所示,永磁同步电机、三相全桥电压源型逆变器、编码器及其采集电路、整流电路、PC电脑、DSP28335等都为外部硬件结构,SVPWM算法模块、Park变换模块、Clark变换模块和逆Park变换模块、两个电流内环SMC控制器、和一个速度外环SAN-GRHDP控制器这些属于软件部分,均采用TI公司的DSP28335进行实现。初始化SAN-GRHDP算法的目标网络学习率、评价网络学习率、单神经元PI算法等参数如表1所示,表1为单神经元全局在线启发式动态规划算法参数设置表。
表1
SAN-GRHDP方法的参数设置
外部强化学习信号的定义如下所示:
r(t)=0.98*e(t)+0.02*e(t-1),e(t)=ω*(t)-ω(t)
其中,t表示当前时刻,t-1表示上一时刻,ω*(t)为目标转速,ω(t)为实际转速,e(t)为当前时刻转速差,e(t-1)为上一时刻转速差。
步骤2:通过神经网络正向传输,计算评价网络的输出和目标网络的输出,所述评价网络的输出为性能指标函数J(t),所述目标网络的输出为内部强化学习信号S(t);
目标网络正向计算过程具体实施如图3所示:其中a(t)=[e(t),e(t-1),u(t),u(t-1)]T为输入向量。
aj(t)为当前时刻t的目标网络输入向量中的第j个元素,当前时刻t的目标网络输入向量为a(t)=[e(t),e(t-1),u(t),u(t-1)]T,j的取值范围为1到4,t表示当前时刻,t-1表示上一时刻,i的取值范围为1到Nf,Nf为目标网络隐层节点数,i为目标网络隐层节点序号,u(t)为当前时刻t的控制量,u(t-1)为上一时刻控制量,e(t)为当前时刻t的系统误差,e(t-1)为上一时刻系统误差,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,S(t)为当前时刻t的内部强化学习信号。
评价网络正向计算过程具体实施如图4所示:其中
c(t)=[S(t),e(t),e(t-1),u(t),u(t-1)]T为输入向量。
ck(t)为当前时刻t的评价网络输入向量中的第k个元素,当前时刻t的目标网络输入向量为c(t)=[S(t),e(t),e(t-1),u(t),u(t-1)]T,k的取值范围为1到5,t-1为上一时刻,l为评价网络隐层节点序号,l取值范围为1到Nc,Nc为评价网络隐层节点数,Nf为目标网络隐层节点数,u(t)为当前时刻t的控制量,u(t-1)为上一时刻控制量,e(t)为当前时刻t的系统误差,e(t-1)为上一时刻系统误差,S(t)为当前时刻t的内部强化学习信号,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第k列元素,zl(t)为当前时刻t的评价网络隐层输出向量的第l个元素,为当前时刻t的评价网络隐层到输出层的权值矩阵第l个元素,J(t)为当前时刻t的性能指标函数。
步骤3:计算目标网络误差和评价网络的误差,通过计算出的误差分别对目标网络和评价网络的权值进行在线调整;
权值调整规则为:
权值调整规则为:
其中,α为目标网络折扣因子,其取值范围为0<α<1,S(t)为t时刻的内部强化学习信号,S(t-1)为上一时刻的内部强化学习信号,r(t-1)为上一时刻的外部强化学习信号,ef(t)为当前时刻t的目标网络误差。
其中,γ为评价网络折扣因子,其取值范围为0<γ<1,J(t)为当前时刻t的性能指标,J(t-1)为上一时刻性能指标,S(t)为当前时刻t的内部强化学习信号,ec(t)为当前时刻t的评价网络误差。
其中,aj(t)为当前时刻t的目标网络输入向量中的第j个元素,lf(t)是当前时刻t的目标网络学习率,ef(t)为当前时刻t的目标网络误差,Ef(t)是当前时刻t的目标网络误差的平方,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素的增量,为当前时刻t的目标网络输入层到隐层权值矩阵第i行,第j列元素的增量,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素。
其中,ck(t)为当前时刻t的评价网络输入向量中的第k个元素,lc(t)为当前时刻t的评价网络学习率,ec(t)为当前时刻t的评价网络误差,Ec(t)为当前时刻t的评价网络误差的平方,为当前时刻t的评价网络隐层到输出层权值矩阵第l个元素的增量,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第k列元素的增量,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为评价网络的激活函数,zl(t)为当前时刻t的目标网络隐层输出向量的第l个元素,为当前时刻t的目标网络输入层到隐层的权值矩阵第i行,第j列元素,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素。
步骤4:通过求解最优性能指标函数,得到单神经元PI算法K值,通过得到的K值调节单神经元PI控制算法的输出,即永磁同步电机系统q轴电流的参考值iq *;
K(t+1)=K(t)+ΔK(t)
单神经元PI控制算法的输出为如图5,其中, 其中,w1(t)为当前时刻比例权值,w2(t)为当前时刻积分权值,w1(t-1)为上一时刻比例权值,w2(t-1)为上一时刻积分权值。为当前时刻q轴电流参考量,为当前时刻q轴电流增量,上一时刻为q轴电流参考量,x2(t)=e(t)=ω*(t)-ω(t)为转速差,其中,ω*(t)为电机目标转速,ω(t)为电机实际转速。x1(t)为当前转速差和上一时刻转速差的差值。ηP为比例权值调整学习率,ηI为积分权值调整学习率。
其中,la(t)为当前时刻t的单神经元PI折扣因子学习率,ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差,Ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差的平方,ΔK(t)为当前时刻t的K值增量,Δu(t)为当前时刻t的控制信号的增量,u(t)为当前时刻t的控制信号,为当前时刻t的目标网络输入层到隐层权值矩阵第i行,第3列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第4列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第1列元素,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为评价网络的激活函数,zl(t)为当前时刻t的目标网络隐层输出向量的第l个元素,J(t)为当前时刻t的性能指标,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,为当前时刻t的评价网络隐层到输出层的权值矩阵第l个元素,S(t)为当前时刻t的内部强化学习信号,K(t-1)为上一时刻单神经元PI算法K值,K(t)为当前时刻t的K值。
步骤5:矢量控制系统中的d轴电流内环采用改变趋近率的滑模变结构控制器,通过d轴给定参考值id *和实际电流id的差,来调节d轴电压ud;
矢量控制系统中的q轴电流内环采用改变趋近率的滑模变结构控制器,通过q轴给定参考值iq *和实际电流iq的差,来调节q轴电压uq。
基于新型趋近律的滑模变结构控制器,其新型趋近率主要为下式所示:
其中,s为滑模面,为s的导数,sgn(·)为符号函数,k,δ,ε为调整参数,调节规律为:当控制系统离趋紧面较远时,s很大,e-δ|s|很小,分母近似等于ε,趋近律公式近似等价于此时调节k远大于ε,就能使得运动点快速的趋近于切换面。δ一般取δ>0,k取值远大于ε,k>0,ε>0。
根据实际控制对象,现场调整这三个参数,k>0,δ>0,0<ε<1。x1为状态变量。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
Claims (8)
1.一种基于全局在线启发式动态规划永磁同步电机矢量控制方法,其特征在于,该方法包括以下步骤:
步骤1:初始化单神经元全局在线启发式动态规划算法的目标网络学习率、评价网络学习率、单神经元PI算法参数,根据系统的跟踪误差,按照下式设计外部强化学习信号r(t):
r(t)=0.98*e(t)+0.02*e(t-1),e(t)=ω*(t)-ω(t)
其中,t表示当前时刻,t-1表示上一时刻,ω*(t)为目标转速,ω(t)为实际转速,e(t)为当前时刻转速差,e(t-1)为上一时刻转速差;
步骤2:通过神经网络正向传输,计算评价网络的输出和目标网络的输出,所述评价网络的输出为性能指标函数J(t),所述目标网络的输出为内部强化学习信号S(t),其中t表示当前时刻;
步骤3:计算目标网络误差和评价网络误差,通过计算出的误差分别对目标网络和评价网络的权值进行在线调整;
步骤4:通过求解最优性能指标函数,得到单神经元PI算法K值,通过得到的K值调节单神经元PI控制算法的输出,即永磁同步电机系统q轴电流的参考值iq *;求解最优性能指标函数的方法如下:
K(t)=K(t-1)+ΔK(t)
其中,la(t)为当前时刻t的单神经元PI折扣因子学习率,ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差,Ea(t)为当前时刻t的单神经元PI折扣因子学习反传误差的平方,ΔK(t)为当前时刻t的K值增量,Δu(t)为当前时刻t的控制信号的增量,u(t)为当前时刻t的控制信号,为当前时刻t的目标网络输入层到隐层权值矩阵第i行,第3列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第4列元素,为当前时刻t的评价网络输入层到隐层权值矩阵第l行,第1列元素,为目标网络的激活函数,qi(t)为当前时刻t的目标网络隐层输出向量的第i个元素,为评价网络的激活函数,zl(t)为当前时刻t的目标网络隐层输出向量的第l个元素,J(t)为当前时刻t的性能指标,为当前时刻t的目标网络隐层到输出层权值矩阵第i个元素,为当前时刻t的评价网络隐层到输出层的权值矩阵第l个元素,S(t)为当前时刻t的内部强化学习信号,K(t-1)为上一时刻单神经元PI算法K值,K(t)为当前时刻t的K值;
步骤5:矢量控制系统中的d轴电流内环采用改变趋近率的滑模变结构控制器,通过d轴给定参考值id *=0和实际电流id的差,来调节d轴电压ud;
矢量控制系统中的q轴电流内环采用改变趋近率的滑模变结构控制器,通过步骤4得到的q轴电流的参考值iq *和实际电流iq的差,来调节q轴电压uq。
4.根据权利要求2或3所述的基于全局在线启发式动态规划永磁同步电机矢量控制方法,其特征在于,所述步骤3中根据下式计算目标网络误差:
ef(t)=αS(t)-[S(t-1)-r(t-1)]
其中,α为目标网络折扣因子,其取值范围为0<α<1,S(t)为t时刻的内部强化学习信号,S(t-1)为上一时刻的内部强化学习信号,r(t-1)为上一时刻的外部强化学习信号,ef(t)为当前时刻t的目标网络误差。
5.根据权利要求2或3所述的基于全局在线启发式动态规划永磁同步电机矢量控制方法,其特征在于,所述步骤3中根据下式计算评价网络误差:
ec(t)=γJ(t)-[J(t-1)-S(t)]
其中,γ为评价网络折扣因子,其取值范围为0<γ<1,J(t)为当前时刻t的性能指标,J(t-1)为上一时刻性能指标,S(t)为当前时刻t的内部强化学习信号,ec(t)为当前时刻t的评价网络误差。
6.根据权利要求2或3所述的基于全局在线启发式动态规划永磁同步电机矢量控制方法,其特征在于,所述步骤3中根据以下调整规则对目标网络的权值进行在线调整:
7.根据权利要求2或3所述的基于全局在线启发式动态规划永磁同步电机矢量控制方法,其特征在于,所述步骤3中根据以下调整规则对评价网络的权值进行在线调整:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810071519.7A CN108155836B (zh) | 2018-01-24 | 2018-01-24 | 基于全局在线启发式动态规划永磁同步电机矢量控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810071519.7A CN108155836B (zh) | 2018-01-24 | 2018-01-24 | 基于全局在线启发式动态规划永磁同步电机矢量控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108155836A CN108155836A (zh) | 2018-06-12 |
CN108155836B true CN108155836B (zh) | 2021-01-26 |
Family
ID=62459088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810071519.7A Active CN108155836B (zh) | 2018-01-24 | 2018-01-24 | 基于全局在线启发式动态规划永磁同步电机矢量控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108155836B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113241982A (zh) * | 2021-05-08 | 2021-08-10 | 江苏理工学院 | 基于模糊单神经元控制的永磁同步电主轴矢量调速方法 |
CN113343592B (zh) * | 2021-07-28 | 2023-11-17 | 辽宁锐翔通用飞机制造有限公司 | 一种新能源飞机的永磁同步电机dqn智能控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150039545A1 (en) * | 2013-08-05 | 2015-02-05 | City University of London | Systems, methods and devices for vector control of permanent magnet synchronous machines using artificial neural networks |
CN105552895A (zh) * | 2015-12-30 | 2016-05-04 | 国家电网公司 | 一种基于多层次启发式动态规划的电力系统动态等值法 |
-
2018
- 2018-01-24 CN CN201810071519.7A patent/CN108155836B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150039545A1 (en) * | 2013-08-05 | 2015-02-05 | City University of London | Systems, methods and devices for vector control of permanent magnet synchronous machines using artificial neural networks |
CN105552895A (zh) * | 2015-12-30 | 2016-05-04 | 国家电网公司 | 一种基于多层次启发式动态规划的电力系统动态等值法 |
Non-Patent Citations (3)
Title |
---|
GrHDP 算法的研究及其在虚拟交互中的应用;方啸;《中国博士学位论文全文数据库》;20150515;第12-32页 * |
永磁同步电机调速系统滑模变结构控制;张晓光;《中国博士学位论文全文数据库》;20150115;第22-28、52页 * |
神经网络PID近似动态规划永磁同步电机控制策略研究;尹康;《中国优秀硕士学位论文全文数据库》;20160115;第3、18-30页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108155836A (zh) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110739893B (zh) | 一种改进自适应无轨迹卡尔曼滤波转动惯量辨识方法 | |
CN106849793B (zh) | 一种电动汽车用永磁同步电机模糊神经网络控制系统 | |
CN103401501B (zh) | 一种基于模糊自抗扰的pmsm伺服系统控制方法 | |
CN101917150B (zh) | 永磁同步电机模糊神经网络广义逆鲁棒控制器及构造方法 | |
CN101938246B (zh) | 无速度传感器电机转速的模糊融合辨识方法 | |
CN108418487B (zh) | 一种用于电动汽车的速度脉动抑制方法 | |
CN106788028B (zh) | 无轴承永磁同步电机强化学习控制器及其构造方法 | |
Khuntia et al. | A comparative study of PI, IP, fuzzy and neuro-fuzzy controllers for speed control of DC motor drive | |
CN109507876B (zh) | 一种基于信度推理的电推船舶电机pid参数整定方法 | |
Yu et al. | Adaptive fuzzy backstepping position tracking control for a permanent magnet synchronous motor | |
CN108155836B (zh) | 基于全局在线启发式动态规划永磁同步电机矢量控制方法 | |
CN106597840A (zh) | 一种基于产生式规则推理的pid参数整定方法 | |
Lu et al. | Speed tracking of Brushless DC motor based on deep reinforcement learning and PID | |
CN107294448B (zh) | 一种基于命令滤波的异步电机模糊离散控制方法 | |
CN115890668A (zh) | 一种机器人关节模组分散式优化学习控制方法及系统 | |
CN113037161A (zh) | 一种基于超扭曲滑模算法的模型参考自适应永磁同步电机无位置传感器矢量控制方法 | |
Sridhar et al. | Speed control of BLDC motor using soft computing technique | |
CN116614030A (zh) | 基于gpc和fcs-mpc的永磁伺服电机复合模型预测控制方法 | |
CN104270046A (zh) | 一种基于转速-电流二维模糊模型自学习的电机控制方法 | |
Lu et al. | PID Adaptive Feedback Motor System Based on Neural Network | |
CN116638544A (zh) | 一种基于超局部模型的关节模组协同控制方法 | |
CN114094896A (zh) | 一种永磁同步电机的自构式t-s型模糊神经网络控制方法 | |
CN105871277A (zh) | 一种基于最小方差的永磁伺服系统非线性模型预测控制器设计方法 | |
CN113037174B (zh) | 一种基于模糊切换策略的永磁同步电机复合变结构控制方法 | |
CN110829921B (zh) | 一种永磁同步电机迭代反馈整定控制及其优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |