CN108356816B - 基于输出位置的单臂机械手事件触发adp控制器结构 - Google Patents
基于输出位置的单臂机械手事件触发adp控制器结构 Download PDFInfo
- Publication number
- CN108356816B CN108356816B CN201810028833.7A CN201810028833A CN108356816B CN 108356816 B CN108356816 B CN 108356816B CN 201810028833 A CN201810028833 A CN 201810028833A CN 108356816 B CN108356816 B CN 108356816B
- Authority
- CN
- China
- Prior art keywords
- output
- unit
- observer
- approximator
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001960 triggered effect Effects 0.000 title claims abstract description 58
- 238000005070 sampling Methods 0.000 claims abstract description 78
- 238000004364 calculation method Methods 0.000 claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims description 45
- 230000006870 function Effects 0.000 claims description 42
- 238000013528 artificial neural network Methods 0.000 claims description 41
- 210000004027 cell Anatomy 0.000 claims description 30
- 230000005484 gravity Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 11
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- WKBPZYKAUNRMKP-UHFFFAOYSA-N 1-[2-(2,4-dichlorophenyl)pentyl]1,2,4-triazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1C(CCC)CN1C=NC=N1 WKBPZYKAUNRMKP-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011031 topaz Substances 0.000 description 1
- 229910052853 topaz Inorganic materials 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Feedback Control In General (AREA)
Abstract
本发明属于工业过程控制技术领域,具体涉及基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成。其在保证控制器的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
Description
技术领域
本发明属于工业过程控制技术领域,具体涉及基于输出位置的单臂机械手事件触发ADP(Adaptive Dynamic Programming,自适应动态规划)控制器结构。
背景技术
在单臂机械手中,机械手的关节角位移是其自身一个重要的输出量,是实际系统中经常需要的控制量。在现实生活中,节省控制燃料、减少控制器的计算负荷和降低控制器的成本都是当前单臂机械手设计的设计目标,为了达到这些目标,本发明在控制器的设计中,引入了事件触发机制,并且基于输出位置设计出了一种自适应动态规划控制方法,该控制器凭借其现实意义十分实用,对未来单臂机械手的研究发展具有十分重要的现实意义。
机械臂系统是一个十分复杂的非线性系统,针对机械臂的不确定性问题的解决方案为自适应控制策略,自适应控制是通过辨识、学习和调整控制规律使得单臂机械手的控制性能指标达到最优,其中最优控制问题是在本世纪50~60年代在空间技术发展和数字计算机实用化的推动下形成的并且的得到了迅速的发展;近些年来,自适应动态规划(Adaptive Dynamic Programming,ADP)作为最优控制领域中一种新兴的近似最优方法,也被称为近似动态规划,并且获得了广泛的关注;自适应动态规划方法的框架是由PaulJ.Werbos提出来的,其主要思想是通过利用函数近似结构,例如用神经网络来近似经典动态规划中的性能指标函数,从而来获得最优性能指标函数和最优控制以满足最优性原理;为了保证性能指标达到最优,在2008年,Silvia Ferrari等人利用含约束的近似动态规划方法设计出一种基于神经网络的状态反馈ADP控制器;姜钟平等人针对非线性系统,提出了一种具有鲁棒性的状态反馈ADP控制器;以及,黄玉柱等人针对n阶仿射非线性系统,提出了一种基于状态反馈的鲁棒ADP控制器;由于在实际系统中观测系统状态需要大量的传感器,设计合适的观测器能够减少传感器的数量,从而降低控制器的成本;所以大量学者针对输出反馈的ADP控制器进行了研究;张化光等人研究了仿射非线性系统的基于输出反馈的ADP控制方法;在2013年,刘德荣等人在神经网络的基础上讨论了非仿射非线性系统的输出反馈ADP控制问题,刘德荣等人还借助自适应动态规划算法研究了一类仿射非线性系统的容错控制问题;然而,基于输出反馈的ADP控制方法存在着传输负载和计算负荷的问题;针对这一问题,何海波等人利用神经网络技术设计和事件触发机制解决了一类仿射非线性系统的状态反馈ADP控制问题;在2017年,何海波等人还通过基于事件触发的状态反馈ADP控制器实现了具有控制约束的仿射非线性系统的最优控制;此外,他们在上述研究的基础上,分别研究了仿射非线性系统和具有控制约束的仿射非线性系统输出反馈的事件触发ADP控制问题。
发明内容
在实际的应用中,基于单臂机械手的控制能量、控制器的计算负荷以及观测器的数量等问题,本发明设计了基于输出位置的单臂机械手事件触发ADP控制器结构,其在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
为实现上述技术目的,本发明采取的技术方案为,基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出比较单元的输入端分别为系统的输出y和数据采样系统单元的输出指令单元的输入端为比较单元的输出和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
单臂机械手的输入端为控制律计算单元的输出u。
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构的系统模型为:
其中,θ为单臂机械手的角度位置;是单臂机械手的角速度;G为转动惯量;D为单臂机械手关节转动的粘性摩擦系数;u为单臂机械手的控制力矩;MgHsin(θ)为重力项;M是单臂机械手的质量;g是重力加速度;H是单臂机械手的高度。
作为本发明改进的技术方案,单臂机械手的状态模型为:
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出所述的系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出经过以下公式计算:
得到本次运行时观测器单元的输出的本次运行时观测器单元的输出的其中,2×2阶矩阵为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,均为常数;在之后的运行中,分别为上一次运行时第一逼近器单元的输出中的元素; 中出现的与分别为观测器单元的输入端所接入的观测器单元的输出观测器单元的输出且观测器单元的输入端所接入的观测器单元的输出观测器单元的输出在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出观测器单元的输出均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出观测器单元的输出均为上一次运行时,观测器单元的输出值;
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出观测器单元的输出观测器单元的输出和数据采样系统单元的输出所述的零阶保持器单元的输出观测器单元输出的信号观测器单元输出的信号和数据采样系统单元输出经过以下公式计算:
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0], 为双曲正切函数, 为双曲正切函数的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出的值为0,在之后的运行时,选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出所述的观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出经过以下公式计算:
可得误差函数单元的输出ec,
其中,在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出为常数;在之后的运行中,第一非线性运算单元的输出选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和误差函数单元的输出ec,所述的观测器单元的输出观测器单元输出和零阶保持器单元输出以及误差函数单元输出ec经过以下公式计算:
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;关于时间t的导数满足公式βc为第二逼近器单元中神经网络的学习率,为大于0的常数;κ是ln2行1列的矩阵;为双曲正切函数,是双曲正切函数对的偏导数,Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
得到比较单元的输出在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出为常数;在后续运行中,数据采样系统单元的输出为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2、g和为大于0的常数,且在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b,所述的比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b经过以下公式计算:
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出所述的数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出经过以下公式计算:
得第一非线性运算单元的输出其中,和均为双曲正切函数, 为和双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到控制律计算单元的输出u作为单臂机械手系统的输入。
本发明的技术方案与现有技术相比,其有益效果在于:
1)本发明基于输出位置的单臂机械手事件触发ADP控制器,针对实际应用中状态不可观测的情况,设计神经网络观测器,实现对系统状态重构,能减少系统状态检测装置的数量,降低了硬件成本;
2)本发明基于输出位置的单臂机械手事件触发ADP控制器,引入了神经网络技术,利用神经网络逼近效果来估计出系统中的未知函数和性能指标,解决单臂机械手系统的近似优化控制问题;
3)本发明基于输出位置的单臂机械手事件触发ADP控制器,在控制器的设计中引入了事件触发机制,利用事件触发条件非周期地更新控制律,能有效降低控制器的计算负荷。
综上,在系统中采用事件触发机制设计事件触发控制技术,利用事件触发神经网络状态观测器和事件触发控制器不用实时地更新观测器神经网络权值和事件触发控制律,从而在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
附图说明
图1本专利的基于输出位置的单臂机械手事件触发ADP控制器的结构示意图;
图2本专利的基于输出位置的单臂机械手事件触发ADP控制器的角位置观测效果图;
图3本专利的基于输出位置的单臂机械手事件触发ADP控制器的角速度观测效果图;
图7本专利提出的事件触发ADP控制器的控制律;
图9本专利提出的事件触发ADP控制器中事件触发时刻图;
图10本专利提出的事件触发ADP控制器的控制方法与传统的ADP控制方法关于采样次数的对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以及结合附图及仿真,对本发明进行进一步详细描述。
基于输出位置的单臂机械手事件触发ADP控制器结构,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出比较单元的输入端分别为系统的输出y和数据采样系统单元的输出指令单元的输入端为比较单元的输出和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
单臂机械手的输入端为控制律计算单元的输出u。
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构的系统模型为:
其中,θ为单臂机械手的角度位置;是单臂机械手的角速度;G为转动惯量;D为单臂机械手关节转动的粘性摩擦系数;u为单臂机械手的控制力矩;MgHsin(θ)为重力项;M是单臂机械手的质量;g是重力加速度;H是单臂机械手的高度。
作为本发明改进的技术方案,单臂机械手的状态模型为:
作为本发明改进的技术方案,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出所述的系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出经过以下公式计算:
得到本次运行时观测器单元的输出的本次运行时观测器单元的输出的其中,2×2阶矩阵为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,均为常数;在之后的运行中,分别为上一次运行时第一逼近器单元的输出中的元素; 中出现的与分别为观测器单元的输入端所接入的观测器单元的输出观测器单元的输出且观测器单元的输入端所接入的观测器单元的输出观测器单元的输出在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出观测器单元的输出均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出观测器单元的输出均为上一次运行时,观测器单元的输出值;
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出观测器单元的输出观测器单元的输出和数据采样系统单元的输出所述的零阶保持器单元的输出观测器单元输出的信号观测器单元输出的信号和数据采样系统单元输出经过以下公式计算:
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0], 为双曲正切函数, 为双曲正切函数的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出的值为0,在之后的运行时,选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出所述的观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出经过以下公式计算:
可得误差函数单元的输出ec,
其中,在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出为常数;在之后的运行中,第一非线性运算单元的输出选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和误差函数单元的输出ec,所述的观测器单元的输出观测器单元输出和零阶保持器单元输出以及误差函数单元输出ec经过以下公式计算:
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;关于时间t的导数满足公式βc为第二逼近器单元中神经网络的学习率,为大于0的常数;κ是ln2行1列的矩阵;为双曲正切函数,是双曲正切函数对的偏导数,Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
得到比较单元的输出在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出为常数;在后续运行中,数据采样系统单元的输出为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2、g和为大于0的常数,且在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b,所述的比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b经过以下公式计算:
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出所述的数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出经过以下公式计算:
得第一非线性运算单元的输出其中,和均为双曲正切函数, 为和双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到控制律计算单元的输出u作为单臂机械手系统的输入。
基于事件触发和ADP对单臂机械手位置实现控制,在系统中采用事件触发机制设计事件触发控制技术,利用事件触发神经网络状态观测器单元和事件触发控制器在不影响观测精度和控制效果的情况下,不用实时地更新观测器单元神经网络权值和事件触发控制律,从而在保证系统的稳定的基础上,使得系统的传输负荷和计算负荷大大减少,节约成本。
针对该系统,根据图1可以设计如下控制器:
采用“模块化”的思想对参数进行整定,通过各模块中参数之间存在的相互联系,依靠反复的仿真实验来确定相对适应的值是:单臂机械手的状态x1x2的初始值分别为0.5和‐0.5,M=10,g=9.81,H=0.5,G=10,D=2;观测器单元的输入和的初始值都为0,A1=0,A2=1,A3=-4,A4=-0.4,T1=10,T2=-1;比较单元中y的值为0.5;计算单元中α=0.95,L1=3,L2=2,g=0.04,第一逼近器单元中βo=0.1,ρ=50,ln1=6,其中权值矩阵和Vob中各个元素的初始值可在‐1到1中选取,第二逼近器单元中βc=0.01,ln2=8,其中权值矩阵和Vc中各个元素的初始值可在‐1到1中选取;数据采样系统单元的输出的初始值都为0,零阶保持器单元的输出的初始值为0。仿真结果如图2‐图10所示,根据图2‐图5所知,与x1,与x2在短时间内能够近似重合,以及e1和e2在短时间内能够收敛到0,则事件触发的神经网络观测器单元能够有效的估计系统中的未知状态。本专利提出的事件触发控制器产生的控制律如图7所示。图8‐图10通过分析事件触发的时刻,对比分析事件触发ADP控制与传统的ADP控制,事件触发ADP控制方法所需计算的次数远远小于传统的ADP控制方法所需计算的次数,更加表现出本专利在减少计算负荷上的优势。
Claims (4)
1.基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,包括比较器单元、事件触发模块、数据采样系统单元、观测器单元、第一逼近器单元、误差函数单元、第二逼近器单元、第一非线性运算单元、第二非线性运算单元、零阶保持器单元和控制律计算单元构成;
事件触发模块包括计算单元、比较单元和指令单元;计算单元的输入端分别为系统的输出y和零阶保持器的输出比较单元的输入端分别为系统的输出y和数据采样系统单元的输出指令单元的输入端为比较单元的输出和计算单元的输出td,指令单元的输出b作为事件触发模块的输出b;
单臂机械手的输入端为控制律计算单元的输出u,u为单臂机械手的控制力矩。
4.根据权利要求1所述的基于输出位置的单臂机械手事件触发ADP控制器结构,其特征在于,单臂机械手事件触发ADP控制器结构采用如下步骤运行:
步骤一、观测器单元:观测器单元的输入端分别为系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出所述的系统的输出y、观测器单元的输出观测器单元的输出和第一逼近器单元的输出经过以下公式计算:
得到本次运行时观测器单元的输出的本次运行时观测器单元的输出的其中,2×2阶矩阵为赫尔维兹矩阵,A1、A2、A3、A4分别为常数;T1、T2分别为大于0的常数,在单臂机械手事件触发ADP控制器结构第一次运行时,均为常数;在之后的运行中,分别为上一次运行时第一逼近器单元的输出中的元素; 中出现的与分别为观测器单元的输入端所接入的观测器单元的输出观测器单元的输出且观测器单元的输入端所接入的观测器单元的输出观测器单元的输出在事件触发ADP控制器第一次运行时,所接入的观测器单元的输出观测器单元的输出均为常数值;在事件触发ADP控制器之后的运行,所接入的观测器单元的输出观测器单元的输出均为上一次运行时,观测器单元的输出值;
步骤三、第一逼近器单元:第一逼近器单元的输入端分别为零阶保持器单元的输出观测器单元的输出观测器单元的输出和数据采样系统单元的输出所述的零阶保持器单元的输出观测器单元输出的信号观测器单元输出的信号和数据采样系统单元输出经过以下公式计算:
为第一逼近器单元中神经网络隐藏层到输出层的事件触发的权值矩阵,是2行ln1列的矩阵;ln1为第一逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;是第一逼近器单元中神经网络隐藏层到输出层估计的权值矩阵;β0为神经网络的学习率,为大于0的常数;C=[1 0], 为双曲正切函数, 为双曲正切函数的输入矩阵;Vob为第一逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln1行3列的矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出的值为0,在之后的运行时,选用上一次运行时的数据采样系统单元的输出;ρ为一个大于0的常数;
步骤四、误差函数单元:误差函数单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出所述的观测器单元的输出观测器单元的输出零阶保持器单元的输出和第一非线性运算单元的输出经过以下公式计算:
可得误差函数单元的输出ec,
其中,在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;在事件触发ADP控制器结构第一次运行时,第一非线性运算单元的输出为常数;在之后的运行中,第一非线性运算单元的输出选用上一次运行时的第一非线性运算单元的输出;
步骤五、第二逼近器单元:第二逼近器单元的输入端分别为观测器单元的输出观测器单元的输出零阶保持器单元的输出和误差函数单元的输出ec,所述的观测器单元的输出观测器单元输出和零阶保持器单元输出以及误差函数单元输出ec经过以下公式计算:
为第二逼近器单元中神经网络隐藏层到输出层的估计权值矩阵,是ln2行1列矩阵;关于时间t的导数满足公式βc为第二逼近器单元中神经网络的学习率,为大于0的常数;κ是ln2行1列的矩阵;为双曲正切函数,是双曲正切函数对的偏导数,Vc是为第二逼近器单元中神经网络输入层到隐藏层的权值矩阵,为ln2行3列矩阵;ln2为第二逼近器单元中神经网络隐藏层神经元的个数,为大于0的常数;
得到比较单元的输出在单臂机械手事件触发ADP控制器结构第一次运行时,数据采样系统单元的输出为常数;在后续运行中,数据采样系统单元的输出为上一次单臂机械手事件触发ADP控制器结构运行时数据采样系统单元的输出;
得到计算单元的输出td,其中,α为一个常数,并且α∈(0,1);L1、L2、g和为大于0的常数,且在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到指令单元输出b为事件触发模块的输出b;
步骤九、数据采样系统单元:数据采样系统单元的输入端分别为比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b,所述的比较器单元的输出和观测器单元的输出观测器单元的输出以及指令单元的输出b经过以下公式计算:
步骤十、第一非线性运算单元:第一非线性运算单元的输入端分别为数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出所述的数据采样系统单元的输出数据采样系统单元的输出零阶保持器单元的输出第一逼近器单元的输出和第二逼近器单元的输出经过以下公式计算:
得第一非线性运算单元的输出其中,和均为双曲正切函数, 为和双曲正切函数的输入矩阵;在事件触发ADP控制器结构第一次运行时,零阶保持器单元的输出的值为常数,在之后的运行时,零阶保持器单元的输出选用上一次运行时的零阶保持器单元的输出;
得到控制律计算单元的输出u作为单臂机械手系统的输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810028833.7A CN108356816B (zh) | 2018-01-12 | 2018-01-12 | 基于输出位置的单臂机械手事件触发adp控制器结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810028833.7A CN108356816B (zh) | 2018-01-12 | 2018-01-12 | 基于输出位置的单臂机械手事件触发adp控制器结构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108356816A CN108356816A (zh) | 2018-08-03 |
CN108356816B true CN108356816B (zh) | 2021-03-30 |
Family
ID=63011081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810028833.7A Active CN108356816B (zh) | 2018-01-12 | 2018-01-12 | 基于输出位置的单臂机械手事件触发adp控制器结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108356816B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109333529B (zh) * | 2018-09-20 | 2022-08-23 | 南京邮电大学 | 含预定义性能的多单臂机械手输出一致控制器及设计方法 |
CN109932900A (zh) * | 2019-04-28 | 2019-06-25 | 东华大学 | 一种非线性连续系统的权重更新方法 |
CN110524540A (zh) * | 2019-08-28 | 2019-12-03 | 南京师范大学 | 一种机械臂系统的自适应容错抗干扰的控制方法 |
CN110658724B (zh) * | 2019-11-20 | 2021-12-10 | 电子科技大学 | 一类非线性系统自适应模糊容错控制方法 |
CN111273671B (zh) * | 2020-03-03 | 2022-05-31 | 大连海事大学 | 一种智能船舶的非周期通讯远程观测器 |
CN113219826B (zh) * | 2021-04-09 | 2022-03-15 | 杭州电子科技大学 | 基于事件触发机制的非线性振荡器的自适应跟踪控制方法 |
CN114851193B (zh) * | 2022-04-26 | 2023-12-22 | 北京航空航天大学 | 一种空间机械臂与未知环境接触过程的智能柔顺操控方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
WO2005072461A2 (en) * | 2004-01-27 | 2005-08-11 | New School Technologies, Llc | Synthetic nervous system for robotics |
CN104133375A (zh) * | 2014-08-14 | 2014-11-05 | 大连海事大学 | 一种多auv同步控制器结构及设计方法 |
CN104749952A (zh) * | 2015-04-16 | 2015-07-01 | 大连海事大学 | 一种自适应动态面控制器结构及设计方法 |
CN104834218A (zh) * | 2015-04-29 | 2015-08-12 | 南京邮电大学 | 一种平行单级双倒立摆的动态面控制器结构及设计方法 |
CN104881044A (zh) * | 2015-06-11 | 2015-09-02 | 北京理工大学 | 一种姿态未知的多移动机器人系统的自适应跟踪控制方法 |
CN104942809A (zh) * | 2015-06-23 | 2015-09-30 | 广东工业大学 | 基于视觉伺服系统的机械臂动态模糊逼近器 |
CN107193211A (zh) * | 2017-05-11 | 2017-09-22 | 南京邮电大学 | 基于自抗扰和反演技术的单臂机械手控制器及其设计方法 |
-
2018
- 2018-01-12 CN CN201810028833.7A patent/CN108356816B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
WO2005072461A2 (en) * | 2004-01-27 | 2005-08-11 | New School Technologies, Llc | Synthetic nervous system for robotics |
CN104133375A (zh) * | 2014-08-14 | 2014-11-05 | 大连海事大学 | 一种多auv同步控制器结构及设计方法 |
CN104749952A (zh) * | 2015-04-16 | 2015-07-01 | 大连海事大学 | 一种自适应动态面控制器结构及设计方法 |
CN104834218A (zh) * | 2015-04-29 | 2015-08-12 | 南京邮电大学 | 一种平行单级双倒立摆的动态面控制器结构及设计方法 |
CN104881044A (zh) * | 2015-06-11 | 2015-09-02 | 北京理工大学 | 一种姿态未知的多移动机器人系统的自适应跟踪控制方法 |
CN104942809A (zh) * | 2015-06-23 | 2015-09-30 | 广东工业大学 | 基于视觉伺服系统的机械臂动态模糊逼近器 |
CN107193211A (zh) * | 2017-05-11 | 2017-09-22 | 南京邮电大学 | 基于自抗扰和反演技术的单臂机械手控制器及其设计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108356816A (zh) | 2018-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108356816B (zh) | 基于输出位置的单臂机械手事件触发adp控制器结构 | |
Sun et al. | Neural network-based adaptive controller design of robotic manipulators with an observer | |
CN108448610B (zh) | 一种基于深度学习的短期风功率预测方法 | |
CN108646758B (zh) | 一种多移动机器人预设性能编队控制器结构及设计方法 | |
Zhou et al. | Adaptive NN control for nonlinear systems with uncertainty based on dynamic surface control | |
CN111190429B (zh) | 一种基于强化学习的无人机主动容错控制方法 | |
CN109986562A (zh) | 一种平面机械臂系统及其分散式容错控制方法 | |
Zhou et al. | A novel compound fault-tolerant method based on online sequential extreme learning machine with cycle reservoir for turbofan engine direct thrust control | |
CN114548368A (zh) | 一种基于多层核超限学习机的锂电池温度场预测模型的建模方法、预测模型以及预测方法 | |
Liu et al. | Decentralized event-triggered output feedback control for a class of interconnected large-scale systems | |
Xu et al. | Fuzzy adaptive finite time fault-tolerant control for multi-input and multi-output nonlinear systems with actuator faults | |
Gao et al. | Adaptive model-based dynamic event-triggered output feedback control of a robotic manipulator with disturbance | |
CN115857353A (zh) | 一种事件触发机制的模块化机器人分散力/位置最优控制方法 | |
Gao et al. | Fault tolerant control scheme for a class of interconnected nonlinear time delay systems using event-triggered approach | |
CN114063457A (zh) | 一种机械臂系统的事件触发容错控制方法 | |
Ming et al. | DRNAS: Differentiable RBF neural architecture search method considering computation load in adaptive control | |
Renotte et al. | Neural modeling and control of a heat exchanger based on SPSA techniques | |
Fravolini et al. | Minimal resource allocating networks for aircraft SFDIA | |
Tian et al. | Nonlinear approximate optimal control based on integral reinforcement learning | |
CN118404592B (zh) | 一种机器人控制方法、装置和机器人 | |
Zhou et al. | Identification Modeling Based on RBFNN for an Aerial Inertially Stabilized Platform | |
Liao et al. | Rocket sensor data prediction based on LSTM with attention mechanism | |
Ren et al. | Discrete-time parallel robot motion control using adaptive neuro-fuzzy inference system based on improved subtractive clustering | |
CN118438438B (zh) | 基于模糊滑模的变负载机械臂自适应有限时间容错控制方法及系统 | |
Nie et al. | Nonsingular fast terminal sliding mode control of manipulator trajectory tracking based on adaptive finite-time disturbance observer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |