CN108356816B - 基于输出位置的单臂机械手事件触发adp控制器结构 - Google Patents

基于输出位置的单臂机械手事件触发adp控制器结构 Download PDF

Info

Publication number
CN108356816B
CN108356816B CN201810028833.7A CN201810028833A CN108356816B CN 108356816 B CN108356816 B CN 108356816B CN 201810028833 A CN201810028833 A CN 201810028833A CN 108356816 B CN108356816 B CN 108356816B
Authority
CN
China
Prior art keywords
output
unit
observer
approximator
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810028833.7A
Other languages
English (en)
Other versions
CN108356816A (zh
Inventor
杨杨
徐闯
岳东
谈杰
缪松涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201810028833.7A priority Critical patent/CN108356816B/zh
Publication of CN108356816A publication Critical patent/CN108356816A/zh
Application granted granted Critical
Publication of CN108356816B publication Critical patent/CN108356816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明属于工业过程控制技术领域,具体涉及基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成。其在保证控制器的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。

Description

基于输出位置的单臂机械手事件触发ADP控制器结构
技术领域
本发明属于工业过程控制技术领域,具体涉及基于输出位置的单臂机械手事件触发ADP(Adaptive Dynamic Programming,自适应动态规划)控制器结构。
背景技术
在单臂机械手中,机械手的关节角位移是其自身一个重要的输出量,是实际系统中经常需要的控制量。在现实生活中,节省控制燃料、减少控制器的计算负荷和降低控制器的成本都是当前单臂机械手设计的设计目标,为了达到这些目标,本发明在控制器的设计中,引入了事件触发机制,并且基于输出位置设计出了一种自适应动态规划控制方法,该控制器凭借其现实意义十分实用,对未来单臂机械手的研究发展具有十分重要的现实意义。
机械臂系统是一个十分复杂的非线性系统,针对机械臂的不确定性问题的解决方案为自适应控制策略,自适应控制是通过辨识、学习和调整控制规律使得单臂机械手的控制性能指标达到最优,其中最优控制问题是在本世纪50~60年代在空间技术发展和数字计算机实用化的推动下形成的并且的得到了迅速的发展;近些年来,自适应动态规划(Adaptive Dynamic Programming,ADP)作为最优控制领域中一种新兴的近似最优方法,也被称为近似动态规划,并且获得了广泛的关注;自适应动态规划方法的框架是由PaulJ.Werbos提出来的,其主要思想是通过利用函数近似结构,例如用神经网络来近似经典动态规划中的性能指标函数,从而来获得最优性能指标函数和最优控制以满足最优性原理;为了保证性能指标达到最优,在2008年,Silvia Ferrari等人利用含约束的近似动态规划方法设计出一种基于神经网络的状态反馈ADP控制器;姜钟平等人针对非线性系统,提出了一种具有鲁棒性的状态反馈ADP控制器;以及,黄玉柱等人针对n阶仿射非线性系统,提出了一种基于状态反馈的鲁棒ADP控制器;由于在实际系统中观测系统状态需要大量的传感器,设计合适的观测器能够减少传感器的数量,从而降低控制器的成本;所以大量学者针对输出反馈的ADP控制器进行了研究;张化光等人研究了仿射非线性系统的基于输出反馈的ADP控制方法;在2013年,刘德荣等人在神经网络的基础上讨论了非仿射非线性系统的输出反馈ADP控制问题,刘德荣等人还借助自适应动态规划算法研究了一类仿射非线性系统的容错控制问题;然而,基于输出反馈的ADP控制方法存在着传输负载和计算负荷的问题;针对这一问题,何海波等人利用神经网络技术设计和事件触发机制解决了一类仿射非线性系统的状态反馈ADP控制问题;在2017年,何海波等人还通过基于事件触发的状态反馈ADP控制器实现了具有控制约束的仿射非线性系统的最优控制;此外,他们在上述研究的基础上,分别研究了仿射非线性系统和具有控制约束的仿射非线性系统输出反馈的事件触发ADP控制问题。
发明内容
在实际的应用中,基于单臂机械手的控制能量、控制器的计算负荷以及观测器的数量等问题,本发明设计了基于输出位置的单臂机械手事件触发ADP控制器结构,其在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
为实现上述技术目的,本发明采取的技术方案为,基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
比较器单元的输入端分别为系统的输出y和观测器单元的输出
Figure BDA0001545770590000021
系统的输出y即为单臂机械手输出的位置信号y;
数据采样系统单元的输入端分别为比较器单元的输出
Figure BDA0001545770590000022
观测器单元的输出
Figure BDA0001545770590000023
观测器单元的输出
Figure BDA0001545770590000024
和事件触发模块的输出b;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出
Figure BDA0001545770590000025
比较单元的输入端分别为系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000026
指令单元的输入端为比较单元的输出
Figure BDA0001545770590000027
和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
观测器单元的输入端分别为第一逼近单元的输出
Figure BDA0001545770590000028
系统的输出y、观测器单元的输出
Figure BDA0001545770590000029
和观测器单元的输出
Figure BDA00015457705900000210
第一逼近器单元的输入信号分别为零阶保持器单元的输出
Figure BDA0001545770590000031
观测器单元的输出
Figure BDA0001545770590000032
观测器单元的输出
Figure BDA0001545770590000033
和数据采样系统的输出
Figure BDA0001545770590000034
误差函数单元的输入端分别为观测器单元的输出
Figure BDA0001545770590000035
观测器单元的输出
Figure BDA0001545770590000036
第一非线性运算单元的输出
Figure BDA0001545770590000037
和零阶保持器单元的输出
Figure BDA0001545770590000038
第二逼近器单元的输入端分别为观测器单元的输出
Figure BDA0001545770590000039
观测器单元的输出
Figure BDA00015457705900000310
零阶保持器单元的输出
Figure BDA00015457705900000311
和误差函数单元的输出ec
第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure BDA00015457705900000312
数据采样系统单元的输出
Figure BDA00015457705900000313
零阶保持器单元的输出
Figure BDA00015457705900000314
第一逼近器单元的输出
Figure BDA00015457705900000315
和第二逼近器单元的输出
Figure BDA00015457705900000316
第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure BDA00015457705900000317
和第一非线性运算单元的输出
Figure BDA00015457705900000318
零阶保持器的输入端为第二非线性运算单元的输出
Figure BDA00015457705900000319
控制律计算单元的输入端为零阶保持器的输出
Figure BDA00015457705900000320
指令单元的输出b和第二非线性运算单元的输出
Figure BDA00015457705900000321
单臂机械手的输入端为控制律计算单元的输出u。
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构的系统模型为:
Figure BDA00015457705900000322
其中,θ为单臂机械手的角度位置;
Figure BDA00015457705900000323
是单臂机械手的角速度;G为转动惯量;D为单臂机械手关节转动的粘性摩擦系数;u为单臂机械手的控制力矩;MgHsin(θ)为重力项;M是单臂机械手的质量;g是重力加速度;H是单臂机械手的高度。
作为本发明改进的技术方案,单臂机械手的状态模型为:
Figure BDA0001545770590000041
其中:x1=θ;
Figure BDA0001545770590000042
y为单臂机械手输出的位置信号;u是控制律计算单元的输出,即控制输入;
Figure BDA0001545770590000043
f1(x1,x2)=x2
Figure BDA0001545770590000044
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出
Figure BDA0001545770590000045
观测器单元的输出
Figure BDA0001545770590000046
和第一逼近器单元的输出
Figure BDA0001545770590000047
所述的系统的输出y、观测器单元的输出
Figure BDA0001545770590000048
观测器单元的输出
Figure BDA0001545770590000049
和第一逼近器单元的输出
Figure BDA00015457705900000410
经过以下公式计算:
Figure BDA00015457705900000411
得到本次运行时观测器单元的输出
Figure BDA00015457705900000412
Figure BDA00015457705900000413
本次运行时观测器单元的输出
Figure BDA00015457705900000414
Figure BDA00015457705900000415
其中,2×2阶矩阵
Figure BDA00015457705900000416
为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,
Figure BDA00015457705900000417
均为常数;在之后的运行中,
Figure BDA00015457705900000418
分别为上一次运行时第一逼近器单元的输出
Figure BDA00015457705900000419
中的元素;
Figure BDA00015457705900000420
Figure BDA00015457705900000421
中出现的
Figure BDA00015457705900000422
Figure BDA00015457705900000423
分别为观测器单元的输入端所接入的观测器单元的输出
Figure BDA00015457705900000424
观测器单元的输出
Figure BDA00015457705900000425
且观测器单元的输入端所接入的观测器单元的输出
Figure BDA00015457705900000426
观测器单元的输出
Figure BDA00015457705900000427
在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出
Figure BDA00015457705900000428
观测器单元的输出
Figure BDA00015457705900000429
均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出
Figure BDA0001545770590000051
观测器单元的输出
Figure BDA0001545770590000052
均为上一次运行时,观测器单元的输出值;
步骤二、比较器单元:比较器单元的两个输入端分别为系统的输出y和观测器单元的输出
Figure BDA0001545770590000053
所述的系统的输出y经过以下的计算:
Figure BDA0001545770590000054
得到比较器单元的输出
Figure BDA0001545770590000055
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出
Figure BDA0001545770590000056
观测器单元的输出
Figure BDA0001545770590000057
观测器单元的输出
Figure BDA0001545770590000058
和数据采样系统单元的输出
Figure BDA0001545770590000059
所述的零阶保持器单元的输出
Figure BDA00015457705900000510
观测器单元输出的信号
Figure BDA00015457705900000511
观测器单元输出的信号
Figure BDA00015457705900000512
和数据采样系统单元输出
Figure BDA00015457705900000513
经过以下公式计算:
Figure BDA00015457705900000514
得到第一逼近器单元的输出
Figure BDA00015457705900000515
其中,
Figure BDA00015457705900000516
Figure BDA00015457705900000517
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
Figure BDA00015457705900000518
是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0],
Figure BDA00015457705900000519
Figure BDA00015457705900000520
为双曲正切函数,
Figure BDA00015457705900000521
Figure BDA00015457705900000522
Figure BDA00015457705900000523
为双曲正切函数
Figure BDA00015457705900000524
的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900000525
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA00015457705900000526
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure BDA00015457705900000527
的值为0,在之后的运行时,
Figure BDA0001545770590000061
选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出
Figure BDA0001545770590000062
观测器单元的输出
Figure BDA0001545770590000063
零阶保持器单元的输出
Figure BDA0001545770590000064
和第一非线性运算单元的输出
Figure BDA0001545770590000065
所述的观测器单元的输出
Figure BDA0001545770590000066
观测器单元的输出
Figure BDA0001545770590000067
零阶保持器单元的输出
Figure BDA0001545770590000068
和第一非线性运算单元的输出
Figure BDA0001545770590000069
经过以下公式计算:
Figure BDA00015457705900000610
可得误差函数单元的输出ec
其中,
Figure BDA00015457705900000611
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900000612
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA00015457705900000613
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出
Figure BDA00015457705900000614
为常数;在之后的运行中,第一非线性运算单元的输出
Figure BDA00015457705900000615
选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出
Figure BDA00015457705900000616
观测器单元的输出
Figure BDA00015457705900000617
零阶保持器单元的输出
Figure BDA00015457705900000618
和误差函数单元的输出ec,所述的观测器单元的输出
Figure BDA00015457705900000619
观测器单元输出
Figure BDA00015457705900000620
和零阶保持器单元输出
Figure BDA00015457705900000621
以及误差函数单元输出ec经过以下公式计算:
Figure BDA00015457705900000622
可得第二逼近器单元的输出
Figure BDA00015457705900000623
Figure BDA00015457705900000624
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;
Figure BDA00015457705900000625
关于时间t的导数满足公式
Figure BDA00015457705900000626
βc为第二逼近器单元中神经网络的学习率,为大于0的常数;
Figure BDA0001545770590000071
κ是ln2行1列的矩阵;
Figure BDA0001545770590000072
为双曲正切函数,
Figure BDA0001545770590000073
是双曲正切函数对
Figure BDA0001545770590000074
的偏导数,
Figure BDA0001545770590000075
Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
步骤六、比较单元:计算单元的输入端为系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000076
所述的系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000077
经过以下公式计算:
Figure BDA0001545770590000078
得到比较单元的输出
Figure BDA0001545770590000079
在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure BDA00015457705900000710
为常数;在后续运行中,数据采样系统单元的输出
Figure BDA00015457705900000711
为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
步骤七、计算单元:计算单元的输入端为系统的输出y和零阶保持器单元的输出
Figure BDA00015457705900000712
所述的系统输出y和零阶保持器单元的输出
Figure BDA00015457705900000713
经过以下公式计算:
Figure BDA00015457705900000714
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2、g和
Figure BDA00015457705900000715
为大于0的常数,且
Figure BDA00015457705900000716
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900000717
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA00015457705900000718
选用上一次运行时的零阶保持器单元的输出;
步骤八、指令单元:指令单元的输入端为比较单元的输出,所述的比较单元输出
Figure BDA0001545770590000081
经过以下公式计算:
Figure BDA0001545770590000082
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出
Figure BDA0001545770590000083
和观测器单元的输出
Figure BDA0001545770590000084
观测器单元的输出
Figure BDA0001545770590000085
以及指令单元的输出b,所述的比较器单元的输出
Figure BDA0001545770590000086
和观测器单元的输出
Figure BDA0001545770590000087
观测器单元的输出
Figure BDA0001545770590000088
以及指令单元的输出b经过以下公式计算:
Figure BDA0001545770590000089
得到数据采样系统单元的输出
Figure BDA00015457705900000810
Figure BDA00015457705900000811
其中,
Figure BDA00015457705900000812
Figure BDA00015457705900000813
分别为数据采样系统单元前一次输出值;
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure BDA00015457705900000814
数据采样系统单元的输出
Figure BDA00015457705900000815
零阶保持器单元的输出
Figure BDA00015457705900000816
第一逼近器单元的输出
Figure BDA00015457705900000817
和第二逼近器单元的输出
Figure BDA00015457705900000818
所述的数据采样系统单元的输出
Figure BDA00015457705900000819
数据采样系统单元的输出
Figure BDA00015457705900000820
零阶保持器单元的输出
Figure BDA00015457705900000821
第一逼近器单元的输出
Figure BDA00015457705900000822
和第二逼近器单元的输出
Figure BDA00015457705900000823
经过以下公式计算:
Figure BDA00015457705900000824
Figure BDA00015457705900000825
得第一非线性运算单元的输出
Figure BDA0001545770590000091
其中,
Figure BDA0001545770590000092
Figure BDA0001545770590000093
均为双曲正切函数,
Figure BDA0001545770590000094
Figure BDA0001545770590000095
Figure BDA0001545770590000096
Figure BDA0001545770590000097
双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA0001545770590000098
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA0001545770590000099
选用上一次运行时的零阶保持器单元的输出;
步骤十一、第二非线性运算单元:第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure BDA00015457705900000910
第一非线性运算单元的输出
Figure BDA00015457705900000911
所述的非线性运算单元的输出
Figure BDA00015457705900000912
和非线性运算单元的输出经过以下公式计算:
Figure BDA00015457705900000913
得到第二非线性单元的输出
Figure BDA00015457705900000914
步骤十二、零阶保持器单元:零阶保持器单元的输入端为第二非线性运算单元的输出
Figure BDA00015457705900000915
经过以下公式计算:
Figure BDA00015457705900000916
得到零阶保持器单元的输出
Figure BDA00015457705900000917
其中:
Figure BDA00015457705900000918
为采样时刻,δj-1为上一次采样时刻;
Figure BDA00015457705900000919
为第二非线性运算单元在上一次采样时刻的输出;
步骤十三、控制律计算单元:控制律计算单元的输入端为零阶保持器单元的输出
Figure BDA00015457705900000920
指令单元输出b和第二非线性单元的输出
Figure BDA00015457705900000921
所述的零阶保持器单元的输出
Figure BDA00015457705900000922
指令单元输出b和第二非线性单元的输出
Figure BDA00015457705900000923
经过以下公式计算:
Figure BDA00015457705900000924
得到控制律计算单元的输出u作为单臂机械手系统的输入。
本发明的技术方案与现有技术相比,其有益效果在于:
1)本发明基于输出位置的单臂机械手事件触发ADP控制器,针对实际应用中状态不可观测的情况,设计神经网络观测器,实现对系统状态重构,能减少系统状态检测装置的数量,降低了硬件成本;
2)本发明基于输出位置的单臂机械手事件触发ADP控制器,引入了神经网络技术,利用神经网络逼近效果来估计出系统中的未知函数和性能指标,解决单臂机械手系统的近似优化控制问题;
3)本发明基于输出位置的单臂机械手事件触发ADP控制器,在控制器的设计中引入了事件触发机制,利用事件触发条件非周期地更新控制律,能有效降低控制器的计算负荷。
综上,在系统中采用事件触发机制设计事件触发控制技术,利用事件触发神经网络状态观测器和事件触发控制器不用实时地更新观测器神经网络权值和事件触发控制律,从而在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
附图说明
图1本专利的基于输出位置的单臂机械手事件触发ADP控制器的结构示意图;
图2本专利的基于输出位置的单臂机械手事件触发ADP控制器的角位置观测效果图;
图3本专利的基于输出位置的单臂机械手事件触发ADP控制器的角速度观测效果图;
图4本专利的基于输出位置的单臂机械手事件触发ADP控制器的角位置误差效果图,其中
Figure BDA0001545770590000101
e1为角位置误差;
图5本专利的基于输出位置的单臂机械手事件触发ADP控制器的角速度误差效果图,其中
Figure BDA0001545770590000102
e2为角速度误差;
图6本专利提出的观测器单元中神经网络权值范数效果图,其中
Figure BDA0001545770590000103
为第一逼近单元估计的权值矩阵
Figure BDA0001545770590000104
的范数;
图7本专利提出的事件触发ADP控制器的控制律;
图8本专利提出的事件触发ADP控制器中误差范数的平方与阈值对比图,其中误差范数的平方
Figure BDA0001545770590000111
为比较单元输出
Figure BDA0001545770590000112
的平方,阈值td为计算单元的输出;
图9本专利提出的事件触发ADP控制器中事件触发时刻图;
图10本专利提出的事件触发ADP控制器的控制方法与传统的ADP控制方法关于采样次数的对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以及结合附图及仿真,对本发明进行进一步详细描述。
基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
比较器单元的输入端分别为系统的输出y和观测器单元的输出
Figure BDA0001545770590000113
系统的输出y即为单臂机械手输出的位置信号y;
数据采样系统单元的输入端分别为比较器单元的输出
Figure BDA0001545770590000114
观测器单元的输出
Figure BDA0001545770590000115
观测器单元的输出
Figure BDA0001545770590000116
和事件触发模块的输出b;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出
Figure BDA0001545770590000117
比较单元的输入端分别为系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000118
指令单元的输入端为比较单元的输出
Figure BDA0001545770590000119
和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
观测器单元的输入端分别为第一逼近单元的输出
Figure BDA00015457705900001110
系统的输出y、观测器单元的输出
Figure BDA00015457705900001111
和观测器单元的输出
Figure BDA00015457705900001112
第一逼近器单元的输入信号分别为零阶保持器单元的输出
Figure BDA00015457705900001113
观测器单元的输出
Figure BDA00015457705900001114
观测器单元的输出
Figure BDA00015457705900001115
和数据采样系统的输出
Figure BDA00015457705900001116
误差函数单元的输入端分别为观测器单元的输出
Figure BDA00015457705900001117
观测器单元的输出
Figure BDA00015457705900001118
第一非线性运算单元的输出
Figure BDA00015457705900001119
和零阶保持器单元的输出
Figure BDA00015457705900001120
第二逼近器单元的输入端分别为观测器单元的输出
Figure BDA0001545770590000121
观测器单元的输出
Figure BDA0001545770590000122
零阶保持器单元的输出
Figure BDA0001545770590000123
和误差函数单元的输出ec
第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure BDA0001545770590000124
数据采样系统单元的输出
Figure BDA0001545770590000125
零阶保持器单元的输出
Figure BDA0001545770590000126
第一逼近器单元的输出
Figure BDA0001545770590000127
和第二逼近器单元的输出
Figure BDA0001545770590000128
第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure BDA0001545770590000129
和第一非线性运算单元的输出
Figure BDA00015457705900001210
零阶保持器的输入端为第二非线性运算单元的输出
Figure BDA00015457705900001211
控制律计算单元的输入端为零阶保持器的输出
Figure BDA00015457705900001212
指令单元的输出b和第二非线性运算单元的输出
Figure BDA00015457705900001213
单臂机械手的输入端为控制律计算单元的输出u。
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构的系统模型为:
Figure BDA00015457705900001214
其中,θ为单臂机械手的角度位置;
Figure BDA00015457705900001215
是单臂机械手的角速度;G为转动惯量;D为单臂机械手关节转动的粘性摩擦系数;u为单臂机械手的控制力矩;MgHsin(θ)为重力项;M是单臂机械手的质量;g是重力加速度;H是单臂机械手的高度。
作为本发明改进的技术方案,单臂机械手的状态模型为:
Figure BDA00015457705900001216
其中:x1=θ;
Figure BDA00015457705900001217
y为单臂机械手输出的位置信号;u是控制律计算单元的输出,即控制输入;
Figure BDA00015457705900001218
f1(x1,x2)=x2
Figure BDA0001545770590000131
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出
Figure BDA0001545770590000132
观测器单元的输出
Figure BDA0001545770590000133
和第一逼近器单元的输出
Figure BDA0001545770590000134
所述的系统的输出y、观测器单元的输出
Figure BDA0001545770590000135
观测器单元的输出
Figure BDA0001545770590000136
和第一逼近器单元的输出
Figure BDA0001545770590000137
经过以下公式计算:
Figure BDA0001545770590000138
得到本次运行时观测器单元的输出
Figure BDA0001545770590000139
Figure BDA00015457705900001310
本次运行时观测器单元的输出
Figure BDA00015457705900001311
Figure BDA00015457705900001312
其中,2×2阶矩阵
Figure BDA00015457705900001313
为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,
Figure BDA00015457705900001314
均为常数;在之后的运行中,
Figure BDA00015457705900001315
分别为上一次运行时第一逼近器单元的输出
Figure BDA00015457705900001316
中的元素;
Figure BDA00015457705900001317
Figure BDA00015457705900001318
中出现的
Figure BDA00015457705900001319
Figure BDA00015457705900001320
分别为观测器单元的输入端所接入的观测器单元的输出
Figure BDA00015457705900001321
观测器单元的输出
Figure BDA00015457705900001322
且观测器单元的输入端所接入的观测器单元的输出
Figure BDA00015457705900001323
观测器单元的输出
Figure BDA00015457705900001324
在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出
Figure BDA00015457705900001325
观测器单元的输出
Figure BDA00015457705900001326
均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出
Figure BDA00015457705900001327
观测器单元的输出
Figure BDA00015457705900001328
均为上一次运行时,观测器单元的输出值;
步骤二、比较器单元:比较器单元的两个输入端分别为系统的输出y和观测器单元的输出
Figure BDA00015457705900001329
所述的系统的输出y经过以下的计算:
Figure BDA0001545770590000141
得到比较器单元的输出
Figure BDA0001545770590000142
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出
Figure BDA0001545770590000143
观测器单元的输出
Figure BDA0001545770590000144
观测器单元的输出
Figure BDA0001545770590000145
和数据采样系统单元的输出
Figure BDA0001545770590000146
所述的零阶保持器单元的输出
Figure BDA0001545770590000147
观测器单元输出的信号
Figure BDA0001545770590000148
观测器单元输出的信号
Figure BDA0001545770590000149
和数据采样系统单元输出
Figure BDA00015457705900001410
经过以下公式计算:
Figure BDA00015457705900001411
得到第一逼近器单元的输出
Figure BDA00015457705900001412
其中,
Figure BDA00015457705900001413
Figure BDA00015457705900001414
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
Figure BDA00015457705900001415
是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0],
Figure BDA00015457705900001416
Figure BDA00015457705900001417
为双曲正切函数,
Figure BDA00015457705900001418
Figure BDA00015457705900001419
Figure BDA00015457705900001420
为双曲正切函数
Figure BDA00015457705900001421
的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900001422
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA00015457705900001423
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure BDA00015457705900001424
的值为0,在之后的运行时,
Figure BDA00015457705900001425
选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出
Figure BDA00015457705900001426
观测器单元的输出
Figure BDA00015457705900001427
零阶保持器单元的输出
Figure BDA00015457705900001428
和第一非线性运算单元的输出
Figure BDA0001545770590000151
所述的观测器单元的输出
Figure BDA0001545770590000152
观测器单元的输出
Figure BDA0001545770590000153
零阶保持器单元的输出
Figure BDA0001545770590000154
和第一非线性运算单元的输出
Figure BDA0001545770590000155
经过以下公式计算:
Figure BDA0001545770590000156
可得误差函数单元的输出ec
其中,
Figure BDA0001545770590000157
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA0001545770590000158
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA0001545770590000159
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出
Figure BDA00015457705900001510
为常数;在之后的运行中,第一非线性运算单元的输出
Figure BDA00015457705900001511
选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出
Figure BDA00015457705900001512
观测器单元的输出
Figure BDA00015457705900001513
零阶保持器单元的输出
Figure BDA00015457705900001514
和误差函数单元的输出ec,所述的观测器单元的输出
Figure BDA00015457705900001515
观测器单元输出
Figure BDA00015457705900001516
和零阶保持器单元输出
Figure BDA00015457705900001517
以及误差函数单元输出ec经过以下公式计算:
Figure BDA00015457705900001518
可得第二逼近器单元的输出
Figure BDA00015457705900001519
其中:
Figure BDA00015457705900001520
通过神经网络技术得出单臂机械手的性能指标V;
Figure BDA00015457705900001521
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;
Figure BDA00015457705900001522
关于时间t的导数满足公式
Figure BDA00015457705900001523
βc为第二逼近器单元中神经网络的学习率,为大于0的常数;
Figure BDA00015457705900001524
κ是ln2行1列的矩阵;
Figure BDA00015457705900001525
为双曲正切函数,
Figure BDA00015457705900001526
是双曲正切函数对
Figure BDA00015457705900001527
的偏导数,
Figure BDA00015457705900001528
Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
步骤六、比较单元:计算单元的输入端为系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000161
所述的系统的输出y和数据采样系统单元的输出
Figure BDA0001545770590000162
经过以下公式计算:
Figure BDA0001545770590000163
得到比较单元的输出
Figure BDA0001545770590000164
在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure BDA0001545770590000165
为常数;在后续运行中,数据采样系统单元的输出
Figure BDA0001545770590000166
为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
步骤七、计算单元:计算单元的输入端为系统的输出y和零阶保持器单元的输出
Figure BDA0001545770590000167
所述的系统输出y和零阶保持器单元的输出
Figure BDA0001545770590000168
经过以下公式计算:
Figure BDA0001545770590000169
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2、g和
Figure BDA00015457705900001610
为大于0的常数,且
Figure BDA00015457705900001611
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900001612
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA00015457705900001613
选用上一次运行时的零阶保持器单元的输出;
步骤八、指令单元:指令单元的输入端为比较单元的输出,所述的比较单元输出
Figure BDA00015457705900001614
经过以下公式计算:
Figure BDA00015457705900001615
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出
Figure BDA0001545770590000171
和观测器单元的输出
Figure BDA0001545770590000172
观测器单元的输出
Figure BDA0001545770590000173
以及指令单元的输出b,所述的比较器单元的输出
Figure BDA0001545770590000174
和观测器单元的输出
Figure BDA0001545770590000175
观测器单元的输出
Figure BDA0001545770590000176
以及指令单元的输出b经过以下公式计算:
Figure BDA0001545770590000177
得到数据采样系统单元的输出
Figure BDA0001545770590000178
Figure BDA0001545770590000179
其中,
Figure BDA00015457705900001710
Figure BDA00015457705900001711
分别为数据采样系统单元前一次输出值;
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure BDA00015457705900001712
数据采样系统单元的输出
Figure BDA00015457705900001713
零阶保持器单元的输出
Figure BDA00015457705900001714
第一逼近器单元的输出
Figure BDA00015457705900001715
和第二逼近器单元的输出
Figure BDA00015457705900001716
所述的数据采样系统单元的输出
Figure BDA00015457705900001717
数据采样系统单元的输出
Figure BDA00015457705900001718
零阶保持器单元的输出
Figure BDA00015457705900001719
第一逼近器单元的输出
Figure BDA00015457705900001720
和第二逼近器单元的输出
Figure BDA00015457705900001721
经过以下公式计算:
Figure BDA00015457705900001722
Figure BDA00015457705900001723
得第一非线性运算单元的输出
Figure BDA00015457705900001724
其中,
Figure BDA00015457705900001725
Figure BDA00015457705900001726
均为双曲正切函数,
Figure BDA00015457705900001727
Figure BDA00015457705900001728
Figure BDA00015457705900001729
Figure BDA00015457705900001730
双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure BDA00015457705900001731
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure BDA0001545770590000181
选用上一次运行时的零阶保持器单元的输出;
步骤十一、第二非线性运算单元:第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure BDA0001545770590000182
第一非线性运算单元的输出
Figure BDA0001545770590000183
所述的非线性运算单元的输出
Figure BDA0001545770590000184
和非线性运算单元的输出经过以下公式计算:
Figure BDA0001545770590000185
得到第二非线性单元的输出
Figure BDA0001545770590000186
步骤十二、零阶保持器单元:零阶保持器单元的输入端为第二非线性运算单元的输出
Figure BDA0001545770590000187
经过以下公式计算:
Figure BDA0001545770590000188
得到零阶保持器单元的输出
Figure BDA0001545770590000189
其中:
Figure BDA00015457705900001810
为采样时刻,δj-1为上一次采样时刻;
Figure BDA00015457705900001811
为第二非线性运算单元在上一次采样时刻的输出;
步骤十三、控制律计算单元:控制律计算单元的输入端为零阶保持器单元的输出
Figure BDA00015457705900001812
指令单元输出b和第二非线性单元的输出
Figure BDA00015457705900001813
所述的零阶保持器单元的输出
Figure BDA00015457705900001814
指令单元输出b和第二非线性单元的输出
Figure BDA00015457705900001815
经过以下公式计算:
Figure BDA00015457705900001816
得到控制律计算单元的输出u作为单臂机械手系统的输入。
基于事件触发和ADP对单臂机械手位置实现控制,在系统中采用事件触发机制设计事件触发控制技术,利用事件触发神经网络状态观测器单元和事件触发控制器在不影响观测精度和控制效果的情况下,不用实时地更新观测器单元神经网络权值和事件触发控制律,从而在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
针对该系统,根据图1可以设计如下控制器:
Figure BDA0001545770590000191
采用“模块化”的思想对参数进行整定,通过各模块中参数之间存在的相互联系,依靠反复的仿真实验来确定相对适应的值是:单臂机械手的状态x1x2的初始值分别为0.5和‐0.5,M=10,g=9.81,H=0.5,G=10,D=2;观测器单元的输入
Figure BDA0001545770590000192
Figure BDA0001545770590000193
的初始值都为0,A1=0,A2=1,A3=-4,A4=-0.4,T1=10,T2=-1;比较单元中y的值为0.5;计算单元中α=0.95,L1=3,L2=2,g=0.04,
Figure BDA0001545770590000201
第一逼近器单元中βo=0.1,ρ=50,ln1=6,其中权值矩阵
Figure BDA0001545770590000202
和Vob中各个元素的初始值可在‐1到1中选取,第二逼近器单元中βc=0.01,ln2=8,其中权值矩阵
Figure BDA0001545770590000203
和Vc中各个元素的初始值可在‐1到1中选取;数据采样系统单元的输出
Figure BDA0001545770590000204
的初始值都为0,零阶保持器单元的输出
Figure BDA0001545770590000205
的初始值为0。仿真结果如图2‐图10所示,根据图2‐图5所知,
Figure BDA0001545770590000206
与x1
Figure BDA0001545770590000207
与x2在短时间内能够近似重合,以及e1和e2在短时间内能够收敛到0,则事件触发的神经网络观测器单元能够有效的估计系统中的未知状态。本专利提出的事件触发控制器产生的控制律如图7所示。图8‐图10通过分析事件触发的时刻,对比分析事件触发ADP控制与传统的ADP控制,事件触发ADP控制方法所需计算的次数远远小于传统的ADP控制方法所需计算的次数,更加表现出本专利在减少计算负荷上的优势。

Claims (4)

1.基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
比较器单元的输入端分别为系统的输出y和观测器单元的输出
Figure FDA0002732805730000011
系统的输出y即为单臂机械手输出的位置信号y;
数据采样系统单元的输入端分别为比较器单元的输出
Figure FDA0002732805730000012
观测器单元的输出
Figure FDA0002732805730000013
观测器单元的输出
Figure FDA0002732805730000014
和事件触发模块的输出b;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出
Figure FDA0002732805730000015
比较单元的输入端分别为系统的输出y和数据采样系统单元的输出
Figure FDA0002732805730000016
指令单元的输入端为比较单元的输出
Figure FDA0002732805730000017
和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
观测器单元的输入端分别为第一逼近单元的输出
Figure FDA0002732805730000018
系统的输出y、观测器单元的输出
Figure FDA0002732805730000019
和观测器单元的输出
Figure FDA00027328057300000110
第一逼近器单元的输入信号分别为零阶保持器单元的输出
Figure FDA00027328057300000111
观测器单元的输出
Figure FDA00027328057300000112
观测器单元的输出
Figure FDA00027328057300000113
和数据采样系统的输出
Figure FDA00027328057300000114
误差函数单元的输入端分别为观测器单元的输出
Figure FDA00027328057300000115
观测器单元的输出
Figure FDA00027328057300000116
第一非线性运算单元的输出
Figure FDA00027328057300000117
和零阶保持器单元的输出
Figure FDA00027328057300000118
第二逼近器单元的输入端分别为观测器单元的输出
Figure FDA00027328057300000119
观测器单元的输出
Figure FDA00027328057300000120
零阶保持器单元的输出
Figure FDA00027328057300000121
和误差函数单元的输出ec
第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure FDA00027328057300000122
数据采样系统单元的输出
Figure FDA00027328057300000123
零阶保持器单元的输出
Figure FDA00027328057300000124
第一逼近器单元的输出
Figure FDA00027328057300000125
和第二逼近器单元的输出
Figure FDA00027328057300000126
第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure FDA00027328057300000127
和第一非线性运算单元的输出
Figure FDA0002732805730000021
零阶保持器的输入端为第二非线性运算单元的输出
Figure FDA0002732805730000022
控制律计算单元的输入端为零阶保持器的输出
Figure FDA0002732805730000023
指令单元的输出b和第二非线性运算单元的输出
Figure FDA0002732805730000024
Figure FDA0002732805730000025
单臂机械手的输入端为控制律计算单元的输出u,u为单臂机械手的控制力矩。
2.根据权利要求1所述的基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,单臂机械手事件触发ADP控制器结构的系统模型为:
Figure FDA0002732805730000026
其中,θ为单臂机械手的角度位置;
Figure FDA0002732805730000027
是单臂机械手的角速度;G为转动惯量;D为单臂机械手关节转动的粘性摩擦系数;u为单臂机械手的控制力矩;MgHsin(θ)为重力项;M是单臂机械手的质量;g是重力加速度;H是单臂机械手的高度。
3.根据权利要求2所述的基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,单臂机械手的状态模型为:
Figure FDA0002732805730000028
其中:x1=θ;
Figure FDA0002732805730000029
y为单臂机械手输出的位置信号;u是控制律计算单元的输出,即控制输入;
Figure FDA00027328057300000210
f1(x1,x2)=x2
Figure FDA00027328057300000211
4.根据权利要求1所述的基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出
Figure FDA0002732805730000031
观测器单元的输出
Figure FDA0002732805730000032
和第一逼近器单元的输出
Figure FDA0002732805730000033
所述的系统的输出y、观测器单元的输出
Figure FDA0002732805730000034
观测器单元的输出
Figure FDA0002732805730000035
和第一逼近器单元的输出
Figure FDA0002732805730000036
经过以下公式计算:
Figure FDA0002732805730000037
得到本次运行时观测器单元的输出
Figure FDA0002732805730000038
Figure FDA0002732805730000039
本次运行时观测器单元的输出
Figure FDA00027328057300000310
Figure FDA00027328057300000311
其中,2×2阶矩阵
Figure FDA00027328057300000312
为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,
Figure FDA00027328057300000313
均为常数;在之后的运行中,
Figure FDA00027328057300000314
分别为上一次运行时第一逼近器单元的输出
Figure FDA00027328057300000315
中的元素;
Figure FDA00027328057300000316
Figure FDA00027328057300000317
中出现的
Figure FDA00027328057300000318
Figure FDA00027328057300000319
分别为观测器单元的输入端所接入的观测器单元的输出
Figure FDA00027328057300000320
观测器单元的输出
Figure FDA00027328057300000321
且观测器单元的输入端所接入的观测器单元的输出
Figure FDA00027328057300000322
观测器单元的输出
Figure FDA00027328057300000323
在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出
Figure FDA00027328057300000324
观测器单元的输出
Figure FDA00027328057300000325
均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出
Figure FDA00027328057300000326
观测器单元的输出
Figure FDA00027328057300000327
均为上一次运行时,观测器单元的输出值;
步骤二、比较器单元:比较器单元的两个输入端分别为系统的输出y和观测器单元的输出
Figure FDA00027328057300000328
所述的系统的输出y经过以下的计算:
Figure FDA00027328057300000329
得到比较器单元的输出
Figure FDA00027328057300000330
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出
Figure FDA0002732805730000041
观测器单元的输出
Figure FDA0002732805730000042
观测器单元的输出
Figure FDA0002732805730000043
和数据采样系统单元的输出
Figure FDA0002732805730000044
所述的零阶保持器单元的输出
Figure FDA0002732805730000045
观测器单元输出的信号
Figure FDA0002732805730000046
观测器单元输出的信号
Figure FDA0002732805730000047
和数据采样系统单元输出
Figure FDA0002732805730000048
经过以下公式计算:
Figure FDA0002732805730000049
得到第一逼近器单元的输出
Figure FDA00027328057300000410
其中,
Figure FDA00027328057300000411
Figure FDA00027328057300000412
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
Figure FDA00027328057300000413
是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0],
Figure FDA00027328057300000414
Figure FDA00027328057300000415
为双曲正切函数,
Figure FDA00027328057300000416
Figure FDA00027328057300000417
Figure FDA00027328057300000418
为双曲正切函数
Figure FDA00027328057300000419
的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure FDA00027328057300000420
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure FDA00027328057300000421
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure FDA00027328057300000422
的值为0,在之后的运行时,
Figure FDA00027328057300000423
选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出
Figure FDA00027328057300000424
观测器单元的输出
Figure FDA00027328057300000425
零阶保持器单元的输出
Figure FDA00027328057300000426
和第一非线性运算单元的输出
Figure FDA00027328057300000427
所述的观测器单元的输出
Figure FDA00027328057300000428
观测器单元的输出
Figure FDA00027328057300000429
零阶保持器单元的输出
Figure FDA00027328057300000430
和第一非线性运算单元的输出
Figure FDA00027328057300000431
经过以下公式计算:
Figure FDA00027328057300000432
可得误差函数单元的输出ec
其中,
Figure FDA0002732805730000051
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure FDA0002732805730000052
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure FDA0002732805730000053
选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出
Figure FDA0002732805730000054
为常数;在之后的运行中,第一非线性运算单元的输出
Figure FDA0002732805730000055
选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出
Figure FDA0002732805730000056
观测器单元的输出
Figure FDA0002732805730000057
零阶保持器单元的输出
Figure FDA0002732805730000058
和误差函数单元的输出ec,所述的观测器单元的输出
Figure FDA0002732805730000059
观测器单元输出
Figure FDA00027328057300000510
和零阶保持器单元输出
Figure FDA00027328057300000511
以及误差函数单元输出ec经过以下公式计算:
Figure FDA00027328057300000512
可得第二逼近器单元的输出
Figure FDA00027328057300000513
Figure FDA00027328057300000514
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;
Figure FDA00027328057300000515
关于时间t的导数满足公式
Figure FDA00027328057300000516
βc为第二逼近器单元中神经网络的学习率,为大于0的常数;
Figure FDA00027328057300000517
κ是ln2行1列的矩阵;
Figure FDA00027328057300000518
为双曲正切函数,
Figure FDA00027328057300000519
是双曲正切函数对
Figure FDA00027328057300000520
的偏导数,
Figure FDA00027328057300000521
Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
步骤六、比较单元:计算单元的输入端为系统的输出y和数据采样系统单元的输出
Figure FDA00027328057300000522
所述的系统的输出y和数据采样系统单元的输出
Figure FDA00027328057300000523
经过以下公式计算:
Figure FDA0002732805730000061
得到比较单元的输出
Figure FDA0002732805730000062
在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出
Figure FDA0002732805730000063
为常数;在后续运行中,数据采样系统单元的输出
Figure FDA0002732805730000064
为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
步骤七、计算单元:计算单元的输入端为系统的输出y和零阶保持器单元的输出
Figure FDA0002732805730000065
所述的系统输出y和零阶保持器单元的输出
Figure FDA0002732805730000066
经过以下公式计算:
Figure FDA0002732805730000067
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2g
Figure FDA0002732805730000068
为大于0的常数,且
Figure FDA0002732805730000069
在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure FDA00027328057300000610
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure FDA00027328057300000611
选用上一次运行时的零阶保持器单元的输出;
步骤八、指令单元:指令单元的输入端为比较单元的输出,所述的比较单元输出
Figure FDA00027328057300000612
经过以下公式计算:
Figure FDA00027328057300000613
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出
Figure FDA00027328057300000614
和观测器单元的输出
Figure FDA00027328057300000615
观测器单元的输出
Figure FDA00027328057300000616
以及指令单元的输出b,所述的比较器单元的输出
Figure FDA00027328057300000617
和观测器单元的输出
Figure FDA00027328057300000618
观测器单元的输出
Figure FDA00027328057300000619
以及指令单元的输出b经过以下公式计算:
Figure FDA0002732805730000071
得到数据采样系统单元的输出
Figure FDA0002732805730000072
Figure FDA0002732805730000073
其中,
Figure FDA0002732805730000074
Figure FDA0002732805730000075
分别为数据采样系统单元前一次输出值;
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出
Figure FDA0002732805730000076
数据采样系统单元的输出
Figure FDA0002732805730000077
零阶保持器单元的输出
Figure FDA0002732805730000078
第一逼近器单元的输出
Figure FDA0002732805730000079
和第二逼近器单元的输出
Figure FDA00027328057300000710
所述的数据采样系统单元的输出
Figure FDA00027328057300000711
数据采样系统单元的输出
Figure FDA00027328057300000712
零阶保持器单元的输出
Figure FDA00027328057300000713
第一逼近器单元的输出
Figure FDA00027328057300000714
和第二逼近器单元的输出
Figure FDA00027328057300000715
经过以下公式计算:
Figure FDA00027328057300000716
Figure FDA00027328057300000717
得第一非线性运算单元的输出
Figure FDA00027328057300000718
其中,
Figure FDA00027328057300000719
Figure FDA00027328057300000720
均为双曲正切函数,
Figure FDA00027328057300000721
Figure FDA00027328057300000722
Figure FDA00027328057300000723
Figure FDA00027328057300000724
双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出
Figure FDA00027328057300000725
的值为常数,在之后的运行时,零阶保持器单元的输出
Figure FDA00027328057300000726
选用上一次运行时的零阶保持器单元的输出;
步骤十一、第二非线性运算单元:第二非线性运算单元的输入端分别为第一非线性运算单元的输出
Figure FDA00027328057300000727
第一非线性运算单元的输出
Figure FDA00027328057300000728
所述的非线性运算单元的输出
Figure FDA00027328057300000729
和非线性运算单元的输出经过以下公式计算:
Figure FDA0002732805730000081
得到第二非线性单元的输出
Figure FDA0002732805730000082
步骤十二、零阶保持器单元:零阶保持器单元的输入端为第二非线性运算单元的输出
Figure FDA0002732805730000083
经过以下公式计算:
Figure FDA0002732805730000084
得到零阶保持器单元的输出
Figure FDA0002732805730000085
其中:
Figure FDA0002732805730000086
为采样时刻,δj-1为上一次采样时刻;
Figure FDA0002732805730000087
为第二非线性运算单元在上一次采样时刻的输出;
步骤十三、控制律计算单元:控制律计算单元的输入端为零阶保持器单元的输出
Figure FDA0002732805730000088
指令单元输出b和第二非线性单元的输出
Figure FDA0002732805730000089
所述的零阶保持器单元的输出
Figure FDA00027328057300000810
指令单元输出b和第二非线性单元的输出
Figure FDA00027328057300000811
经过以下公式计算:
Figure FDA00027328057300000812
得到控制律计算单元的输出u作为单臂机械手系统的输入。
CN201810028833.7A 2018-01-12 2018-01-12 基于输出位置的单臂机械手事件触发adp控制器结构 Active CN108356816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810028833.7A CN108356816B (zh) 2018-01-12 2018-01-12 基于输出位置的单臂机械手事件触发adp控制器结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810028833.7A CN108356816B (zh) 2018-01-12 2018-01-12 基于输出位置的单臂机械手事件触发adp控制器结构

Publications (2)

Publication Number Publication Date
CN108356816A CN108356816A (zh) 2018-08-03
CN108356816B true CN108356816B (zh) 2021-03-30

Family

ID=63011081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810028833.7A Active CN108356816B (zh) 2018-01-12 2018-01-12 基于输出位置的单臂机械手事件触发adp控制器结构

Country Status (1)

Country Link
CN (1) CN108356816B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109333529B (zh) * 2018-09-20 2022-08-23 南京邮电大学 含预定义性能的多单臂机械手输出一致控制器及设计方法
CN109932900A (zh) * 2019-04-28 2019-06-25 东华大学 一种非线性连续系统的权重更新方法
CN110524540A (zh) * 2019-08-28 2019-12-03 南京师范大学 一种机械臂系统的自适应容错抗干扰的控制方法
CN110658724B (zh) * 2019-11-20 2021-12-10 电子科技大学 一类非线性系统自适应模糊容错控制方法
CN111273671B (zh) * 2020-03-03 2022-05-31 大连海事大学 一种智能船舶的非周期通讯远程观测器
CN113219826B (zh) * 2021-04-09 2022-03-15 杭州电子科技大学 基于事件触发机制的非线性振荡器的自适应跟踪控制方法
CN114851193B (zh) * 2022-04-26 2023-12-22 北京航空航天大学 一种空间机械臂与未知环境接触过程的智能柔顺操控方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
WO2005072461A2 (en) * 2004-01-27 2005-08-11 New School Technologies, Llc Synthetic nervous system for robotics
CN104133375A (zh) * 2014-08-14 2014-11-05 大连海事大学 一种多auv同步控制器结构及设计方法
CN104749952A (zh) * 2015-04-16 2015-07-01 大连海事大学 一种自适应动态面控制器结构及设计方法
CN104834218A (zh) * 2015-04-29 2015-08-12 南京邮电大学 一种平行单级双倒立摆的动态面控制器结构及设计方法
CN104881044A (zh) * 2015-06-11 2015-09-02 北京理工大学 一种姿态未知的多移动机器人系统的自适应跟踪控制方法
CN104942809A (zh) * 2015-06-23 2015-09-30 广东工业大学 基于视觉伺服系统的机械臂动态模糊逼近器
CN107193211A (zh) * 2017-05-11 2017-09-22 南京邮电大学 基于自抗扰和反演技术的单臂机械手控制器及其设计方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
WO2005072461A2 (en) * 2004-01-27 2005-08-11 New School Technologies, Llc Synthetic nervous system for robotics
CN104133375A (zh) * 2014-08-14 2014-11-05 大连海事大学 一种多auv同步控制器结构及设计方法
CN104749952A (zh) * 2015-04-16 2015-07-01 大连海事大学 一种自适应动态面控制器结构及设计方法
CN104834218A (zh) * 2015-04-29 2015-08-12 南京邮电大学 一种平行单级双倒立摆的动态面控制器结构及设计方法
CN104881044A (zh) * 2015-06-11 2015-09-02 北京理工大学 一种姿态未知的多移动机器人系统的自适应跟踪控制方法
CN104942809A (zh) * 2015-06-23 2015-09-30 广东工业大学 基于视觉伺服系统的机械臂动态模糊逼近器
CN107193211A (zh) * 2017-05-11 2017-09-22 南京邮电大学 基于自抗扰和反演技术的单臂机械手控制器及其设计方法

Also Published As

Publication number Publication date
CN108356816A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108356816B (zh) 基于输出位置的单臂机械手事件触发adp控制器结构
Sun et al. Neural network-based adaptive controller design of robotic manipulators with an observer
CN108448610B (zh) 一种基于深度学习的短期风功率预测方法
CN108646758B (zh) 一种多移动机器人预设性能编队控制器结构及设计方法
Zhou et al. Adaptive NN control for nonlinear systems with uncertainty based on dynamic surface control
CN111190429B (zh) 一种基于强化学习的无人机主动容错控制方法
CN109986562A (zh) 一种平面机械臂系统及其分散式容错控制方法
Zhou et al. A novel compound fault-tolerant method based on online sequential extreme learning machine with cycle reservoir for turbofan engine direct thrust control
CN114548368A (zh) 一种基于多层核超限学习机的锂电池温度场预测模型的建模方法、预测模型以及预测方法
Liu et al. Decentralized event-triggered output feedback control for a class of interconnected large-scale systems
Xu et al. Fuzzy adaptive finite time fault-tolerant control for multi-input and multi-output nonlinear systems with actuator faults
Gao et al. Adaptive model-based dynamic event-triggered output feedback control of a robotic manipulator with disturbance
CN115857353A (zh) 一种事件触发机制的模块化机器人分散力/位置最优控制方法
Gao et al. Fault tolerant control scheme for a class of interconnected nonlinear time delay systems using event-triggered approach
CN114063457A (zh) 一种机械臂系统的事件触发容错控制方法
Ming et al. DRNAS: Differentiable RBF neural architecture search method considering computation load in adaptive control
Renotte et al. Neural modeling and control of a heat exchanger based on SPSA techniques
Fravolini et al. Minimal resource allocating networks for aircraft SFDIA
Tian et al. Nonlinear approximate optimal control based on integral reinforcement learning
CN118404592B (zh) 一种机器人控制方法、装置和机器人
Zhou et al. Identification Modeling Based on RBFNN for an Aerial Inertially Stabilized Platform
Liao et al. Rocket sensor data prediction based on LSTM with attention mechanism
Ren et al. Discrete-time parallel robot motion control using adaptive neuro-fuzzy inference system based on improved subtractive clustering
CN118438438B (zh) 基于模糊滑模的变负载机械臂自适应有限时间容错控制方法及系统
Nie et al. Nonsingular fast terminal sliding mode control of manipulator trajectory tracking based on adaptive finite-time disturbance observer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant