CN113103237B - 一种面向未知环境约束的可重构机械臂控制方法及系统 - Google Patents

一种面向未知环境约束的可重构机械臂控制方法及系统 Download PDF

Info

Publication number
CN113103237B
CN113103237B CN202110447459.6A CN202110447459A CN113103237B CN 113103237 B CN113103237 B CN 113103237B CN 202110447459 A CN202110447459 A CN 202110447459A CN 113103237 B CN113103237 B CN 113103237B
Authority
CN
China
Prior art keywords
function
mechanical arm
force
reconfigurable
reconfigurable mechanical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202110447459.6A
Other languages
English (en)
Other versions
CN113103237A (zh
Inventor
马冰
董博
张振国
安天骄
卢曾鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun University of Technology
Original Assignee
Changchun University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun University of Technology filed Critical Changchun University of Technology
Priority to CN202110447459.6A priority Critical patent/CN113103237B/zh
Publication of CN113103237A publication Critical patent/CN113103237A/zh
Application granted granted Critical
Publication of CN113103237B publication Critical patent/CN113103237B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1633Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种面向未知环境约束的可重构机械臂控制方法及系统。所述包括:构建约束空间下多自由度的可重构机械臂的动力学模型;基于动力学模型,采用自适应估计参数法建立可重构机械臂的状态空间方程;基于状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿‑雅可比‑贝尔曼函数;采用自适应动态规划算法,通过神经网络评价模型对性能指标函数进行估计,并基于性能指标估计函数,采用策略迭代算法对哈密尔顿‑雅可比‑贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略。本发明能实现未知环境约束下可重构机械臂的精确控制。

Description

一种面向未知环境约束的可重构机械臂控制方法及系统
技术领域
本发明涉及机器人控制领域,特别是涉及一种面向未知环境约束的可重构机械臂控制方法及系统。
背景技术
可重构机械臂是一类具有标准模块与接口,可以根据不同的任务需求对自身构形进行重新组合与配置的机械臂。根据模块化的概念,可重构机械臂的关节模块包含了通讯、驱动、控制、传感等单元,可以使机械臂在不同的外界环境与约束下根据任务需要改变自身构形,使重构后的机械臂能够对新的工作环境有更好的适应性。正是由于这样的结构特点,可重构机械臂具有融合最新的机械、传感器以及计算机控制技术的能力,以及具有良好的重塑、自适应的能力,能够根据环境和任务改变以及优化自身的结构,快速、有效地完成任务,因此,可重构机械臂在军事、航天、救援和核工业等领域具有重大意义。
对于许多情况,机械臂的力控制任务与位置控制具有同样重要的意义。当机械臂的末端或其末端工具与周围环境产生接触时,只利用位置控制往往不能满足要求。例如钻孔、磨削、剥刮等任务中,不仅要控制机械臂末端的位置,而且要更多地关注到末端与环境之间的接触力控制任务。对于一些更复杂的作业,如工作环境不确定或变化的装配和高精度装配作业,对其跟踪误差的要求甚至超过机械臂本身所能达到的精度。如果仍然通过位置控制来实现控制精度的提高是十分困难的,不仅代价昂贵可能还会徒劳无益,因此研究人员采用力控制方案来解决这一问题。对机械臂末端进行力控制,就是对机械臂与环境之间的相互作用力进行控制。机械臂的力控制方法很多,但都是依赖于机械臂的位置和力的混合控制,以便适应因作业结构而产生的位置约束。对于一个受环境约束的可重构机械臂,由于环境约束使得机械臂末端不能实现空间上的任意运动,并且由于任务要求需要对位置和末端接触力同时进行控制。传统的力/位置控制方法,主要的思想是将力的控制以质量-弹簧-阻尼模型转换成相应末端的位置控制,由于模型的不精准性导致了控制精度的有限性。并且大多数的力/位置控制都过多的依赖于环境约束和机器人之间的动力学信息,然而这一要求对于可变构形的可重构机械臂来说是十分困难的。因此,在面向未知环境约束的情况下,如何提高可重构机械臂的控制精度成为目前亟待解决的问题。
发明内容
基于此,有必要提供一种面向未知环境约束的可重构机械臂控制方法及系统,以提高在未知环境约束下可重构机械臂的控制精度。
为实现上述目的,本发明提供了如下方案:
一种面向未知环境约束的可重构机械臂控制方法,包括:
构建约束空间下多自由度的可重构机械臂的动力学模型;
基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程;
基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略。
可选的,所述构建约束空间下多自由度的可重构机械臂的动力学模型,具体包括:
获取所述可重构机械臂的关节位置和关节速度;
确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩;
基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。
可选的,所述接触力矩为:
Figure BDA0003037404850000021
其中,τc为接触力矩,fc为可重构机械臂的末端与约束环境接触的外部力向量,
Figure BDA0003037404850000031
为约束环境空间反映到关节空间的雅可比矩阵的转置,q为关节位置向量,
Figure BDA00030374048500000310
为未知约束参数向量。
可选的,所述动力学模型为
Figure BDA0003037404850000032
其中,q为关节位置向量,
Figure BDA0003037404850000033
为关节速度向量,
Figure BDA0003037404850000034
为关节加速度向量,M(q)为惯性矩阵,
Figure BDA0003037404850000035
为离心力-哥氏力项,G(q)为重力项,u为控制输入力矩,τc为接触力矩。
可选的,所述基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程,具体包括:
将受未知环境约束的可重构机械臂的未知约束方程线性参数化,得到线性表示形式;
由所述线性表示形式确定反映约束环境空间与任务工作空间关系的雅可比矩阵;
对所述反映约束环境空间与任务工作空间关系的雅可比矩阵进行估计,得到估计矩阵;
基于所述估计矩阵确定可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值;
由所述动力学模型和所述接触力矩估计值构建所述可重构机械臂的状态空间方程。
可选的,所述基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数,具体包括:
基于所述状态空间方程,构建包含末端效应器的跟踪误差和接触力偏差的多信息融合函数;所述多信息融合函数为
Figure BDA0003037404850000036
其中,m(t)为t时刻的多信息融合函数,eq为关节位置跟踪误差,
Figure BDA0003037404850000037
为关节速度跟踪误差,eτ为末端效应器约束力矩跟踪误差,kdeq
Figure BDA0003037404850000038
的系数,keq
Figure BDA0003037404850000039
的系数,kτ为eτ的系数;
由所述多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
所述性能指标函数为
Figure BDA0003037404850000041
其中,P(m(t))为t时刻的性能指标函数,Ψ(Ω)为由一系列可行的控制策略组成的集合,u为控制输入力矩,N(m(t),u(m(t)))为t时刻的效用函数,u(m(t))为t时刻的多信息融合函数对应的力和位置跟踪控制策略;
所述哈密尔顿-雅可比-贝尔曼函数为
Figure BDA0003037404850000042
其中,
Figure BDA0003037404850000043
为哈密尔顿-雅可比-贝尔曼函数,m为多信息融合函数,u(m)为多信息融合函数对应的力和位置跟踪控制策略,
Figure BDA0003037404850000044
为性能指标函数P(m)对m的偏微分函数,N(m,u(m))为效用函数,
Figure BDA0003037404850000045
为多信息融合函数的一阶导数,
Figure BDA0003037404850000046
为t时刻的性能指标函数P(m(t))对m(t)的偏微分函数,
Figure BDA0003037404850000047
为估计接触力矩,vc为与力和位置跟踪误差相关的函数,
Figure BDA0003037404850000048
Qc为多信息融合函数对应的给定的正定矩阵,
Figure BDA0003037404850000049
Figure BDA00030374048500000415
为n×n维的空间,Rc为力和位置跟踪控制策略对应的给定的正定矩阵,n为可重构机械臂的自由度,
Figure BDA00030374048500000410
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,q为关节位置向量,
Figure BDA00030374048500000411
为关节速度向量。
可选的,所述近似的最优力和位置跟踪控制策略为
Figure BDA00030374048500000412
其中,
Figure BDA00030374048500000413
为近似的最优力和位置跟踪控制策略,
Figure BDA00030374048500000414
为力和位置跟踪控制策略对应的给定的正定矩阵,gT(q)为与惯性矩阵相关的模型函数,
Figure BDA00030374048500000510
为神经网络评价模型中激活函数的偏导数,
Figure BDA00030374048500000511
为神经网络评价模型中权值的估计值。
可选的,所述状态空间方程为:
Figure BDA0003037404850000051
其中,I为状态空间,
Figure BDA0003037404850000052
是受环境约束的可重构机械臂的状态向量,q为关节位置向量,
Figure BDA0003037404850000053
为关节速度向量,x1表示反映可重构机械臂系统运动位置的状态向量,x2表示反映可重构机械臂系统运动速度的状态向量,
Figure BDA0003037404850000054
为x1的一阶导数,
Figure BDA0003037404850000055
为x2的一阶导数,y是该非线性系统的输出状态,
Figure BDA0003037404850000056
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,
Figure BDA0003037404850000057
g(q)=M-1(q),M-1(q)为惯性矩阵的逆矩阵,
Figure BDA0003037404850000058
为离心力-哥氏力项,G(q)为重力项,
Figure BDA0003037404850000059
为估计接触力矩,u为控制输入力矩。
本发明还提供了一种面向未知环境约束的可重构机械臂控制系统,包括:
动力学模型构建模块,用于构建约束空间下多自由度的可重构机械臂的动力学模型;
状态方程构建模块,用于基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程;
函数构建模块,用于基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
求解模块,用于采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略。
可选的,所述动力学模型构建模块,具体包括:
数据获取单元,用于获取所述可重构机械臂的关节位置和关节速度;
力矩确定单元,用于确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩;
模型构建单元,用于基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。
与现有技术相比,本发明的有益效果是:
本发明提出了一种面向未知环境约束的可重构机械臂控制方法及系统,采用自适应估计参数法建立可重构机械臂的状态空间方程,实现了未知约束参量的估计,保证了机械臂系统在与外界环境接触时安全稳定地运行;采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数,采用自适应动态规划算法,通过神经网络评价模型对性能指标函数进行估计,并基于性能指标估计函数,采用策略迭代算法对哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略,将力和位置控制任务转化为相应的最优控制问题来解决,实现了在未知环境约束下可重构机械臂的精确控制。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的面向未知环境约束的可重构机械臂控制方法的流程图;
图2为本发明具体实施例提供的最优力和位置控制原理图;
图3为本发明具体实施例提供的最优力/位置控制方法流程图;
图4为本发明实施例提供的面向未知环境约束的可重构机械臂控制系统的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
在面向未知环境约束的情况下,仅采用已知参数信息对约束环境不确定性进行估计,是实现复杂任务下可重构机械臂力/位置精确控制的重要前提。
本实施例为了保证能源有限的可重构机械臂在极端环境下具有良好的稳定性与精确性,将传统的力/位置控制通过跟踪误差融合函数转化为相应的最优控制问题来解决,利用自适应动态规划方法和神经网络的近似能力,求解融合力和位置跟踪目标的哈密尔顿-雅可比-贝尔曼方程。从而实现,在未知环境约束下可重构机械臂的力/位置跟踪作业稳定安全运行的同时,优化系统跟踪控制精度,降低能源损耗。
本实施例提供的面向未知环境约束的可重构机械臂控制方法的构思如下:构建受约束可重构机械臂的动力学模型,对未知环境约束空间进行分析,并设计自适应估计算法近似未知约束参数向量。而后,设计了一种包含末端效应器的跟踪误差和接触力矩偏差的多信息融合函数,并构建相对应的性能指标函数和哈密顿-雅可比-贝尔曼方程。利用自适应动态规划和策略迭代算法,通过构造评价神经网络,求解哈密尔顿方程,进而得到近似的最优力/位置控制策略。
图1为本发明实施例提供的面向未知环境约束的可重构机械臂控制方法的流程图。参见图1,本实施例的面向未知环境约束的可重构机械臂控制方法,具体包括:
步骤101:构建约束空间下多自由度的可重构机械臂的动力学模型。
所述步骤101,具体包括:
获取所述可重构机械臂的关节位置和关节速度。
确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩。所述接触力矩为:
Figure BDA0003037404850000081
其中,τc为接触力矩,fc为可重构机械臂的末端与约束环境接触的外部力向量,
Figure BDA0003037404850000082
为约束环境空间反映到关节空间的雅可比矩阵的转置,q为关节位置向量,
Figure BDA0003037404850000083
为未知约束参数向量,
Figure BDA0003037404850000084
其中,
Figure BDA00030374048500000816
为环境约束方程,
Figure BDA0003037404850000085
表示为在工作空间下机械臂运动而产生的位移与其作用在关节空间坐标系下的关节位置相互转换关系,l为环境约束维数。
基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。所述动力学模型为
Figure BDA0003037404850000086
其中,q为关节位置向量,
Figure BDA0003037404850000087
为关节速度向量,
Figure BDA0003037404850000088
为关节加速度向量,M(q)为惯性矩阵,
Figure BDA0003037404850000089
为离心力-哥氏力项,G(q)为重力项,u为控制输入力矩,τc为可重构机械臂的末端效应器与约束环境接触所产生的接触力矩。
步骤102:基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程。
所述步骤102,具体包括:
将受未知环境约束的可重构机械臂的未知约束方程线性参数化,得到线性表示形式
Figure BDA00030374048500000817
其中
Figure BDA00030374048500000810
为约束环境空间的回归方程,z1,z2,…,zl为相对应的约束环境子空间的回归方程。
由所述线性表示形式确定反映约束环境空间与任务工作空间关系的雅可比矩阵
Figure BDA00030374048500000811
其中,
Figure BDA00030374048500000812
为约束空间回归方程的偏微分函数,
Figure BDA00030374048500000813
为与约束参数向量线性相关函数的标量值。
对所述反映约束环境空间与任务工作空间关系的雅可比矩阵进行估计,得到估计矩阵
Figure BDA00030374048500000814
其中,
Figure BDA00030374048500000815
为与约束参数向量线性相关函数标量值的近似值。通过上述的可重构机械臂不确定环境约束的分析和推导。
基于所述估计矩阵确定可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值。具体的,首先通过上述的可重构机械臂不确定环境约束的分析和推导,可以得到近似的反映约束环境空间与关节工作空间的雅可比矩阵
Figure BDA0003037404850000091
表示为:
Figure BDA0003037404850000092
因此,可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值
Figure BDA0003037404850000093
由所述动力学模型和所述接触力矩估计值构建所述可重构机械臂的状态空间方程。所述状态空间方程为:
Figure BDA0003037404850000094
其中,I为状态空间,
Figure BDA00030374048500000912
是受环境约束的可重构机械臂的状态向量,x为对应的非线性系统,q为关节位置向量,
Figure BDA0003037404850000095
为关节速度向量,x1表示反映可重构机械臂系统运动位置的状态向量,x2表示反映可重构机械臂系统运动速度的状态向量,
Figure BDA0003037404850000096
为x1的一阶导数,
Figure BDA0003037404850000097
为x2的一阶导数,y是该非线性系统的输出状态,
Figure BDA0003037404850000098
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,
Figure BDA0003037404850000099
g(q)=M-1(q),M-1(q)为惯性矩阵的逆矩阵,
Figure BDA00030374048500000913
为离心力-哥氏力项,G(q)为重力项,
Figure BDA00030374048500000910
为估计接触力矩,u为控制输入力矩。
步骤103:基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数。
所述步骤103,具体包括:
基于所述状态空间方程,构建包含末端效应器的跟踪误差和接触力偏差的多信息融合函数;所述多信息融合函数为
Figure BDA00030374048500000911
其中,m(t)为t时刻的多信息融合函数,eq为关节位置跟踪误差,
Figure BDA0003037404850000101
为关节速度跟踪误差,eτ为末端效应器约束力矩跟踪误差,kdeq
Figure BDA0003037404850000102
的系数,keq
Figure BDA0003037404850000103
的系数,kτ为eτ的系数。
由所述多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数。
所述性能指标函数为
Figure BDA0003037404850000104
其中,P(m(t))为t时刻的性能指标函数,Ψ(Ω)为由一系列可行的控制策略组成的集合,u为控制输入力矩,N(m(t),u(m(t)))为t时刻的效用函数,u(m(t))为t时刻的多信息融合函数对应的力和位置跟踪控制策略。
所述哈密尔顿-雅可比-贝尔曼函数为
Figure BDA00030374048500001012
其中,
Figure BDA00030374048500001013
为哈密尔顿-雅可比-贝尔曼函数,m为多信息融合函数,u(m)为多信息融合函数对应的力和位置跟踪控制策略,
Figure BDA0003037404850000105
为性能指标函数P(m)对m的偏微分函数,N(m,u(m))为效用函数,
Figure BDA0003037404850000106
为多信息融合函数的一阶导数,
Figure BDA0003037404850000107
为t时刻的性能指标函数P(m(t))对m(t)的偏微分函数,
Figure BDA0003037404850000108
为估计接触力矩,vc为与力和位置跟踪误差相关的函数,
Figure BDA0003037404850000109
Qc为多信息融合函数对应的给定的正定矩阵,
Figure BDA00030374048500001010
Rc为力和位置跟踪控制策略对应的给定的正定矩阵,n为可重构机械臂的自由度,
Figure BDA00030374048500001011
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数。
步骤104:采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略。
所述步骤104,具体包括:
(1)利用策略迭代算法求解哈密尔顿方程得到最优性能指标函数,然后将解结合策略迭代算法得到最优控制策略。步骤如下:
步骤1:参数初始化,选择i为迭代次数,当i=0,给定一个初始的容许控制μ(0)(m),并选取一个正常数δ。
步骤2:当i>0时,结合控制策略μ(i)(m),通过以下的等式来更新性能指标函数P(i)(m),
Figure BDA0003037404850000111
这里性能指标函数P(i+1)(m)=0。
步骤3:通过以下等式来更新控制策略μ(i)(m),
Figure BDA0003037404850000112
步骤4:如果||P(i+1)(m)-P(i)(m)||≤δ,停止计算,得到最优控制策略;否则,令i=i+1,转到步骤2;
步骤5:停止。
通过该算法的迭代计算,当i→∞时可以近似计算出最优性能指标函数P(i)(m)→P*(m)和近似计算出最优控制策略μ(i)(m)→u*(m)。
由步骤(1)可知,上述策略迭代算法是可以得到最优控制策略的,但是,上述策略迭代算法中步骤2的等式即哈密尔顿函数无法求解,因此,需要采用评价神经网络来近似得到性能指标函数,即得到步骤2需要更新的P(m)。
(2)建立评价神经网络结构估计相对应的最优性能指标函数:
Figure BDA0003037404850000113
其中,
Figure BDA0003037404850000114
是理想权值,N为隐含层神经元的个数,
Figure BDA0003037404850000115
是激活函数,
Figure BDA0003037404850000116
为评价神经网络近似残差,
Figure BDA0003037404850000117
为N×1维的空间,
Figure BDA0003037404850000118
为N×n维的空间。将性能指标函数P(m)的偏导数表示为:
Figure BDA0003037404850000121
其中,
Figure BDA0003037404850000122
Figure BDA0003037404850000123
分别为激活函数和评价神经网络近似残差的偏导数。
将哈密尔顿方程改写为下面的式子:
Figure BDA0003037404850000124
其中,ech为由理想的评价神经网络近似哈密尔顿函数得到的残差。由于评价神经网络的理想权值Wc无法直接得知,所以将评价神经网络近似为:
Figure BDA0003037404850000125
其中,
Figure BDA0003037404850000126
为神经网络权值的近似值,从而,得到近似的哈密尔顿函数为:
Figure BDA0003037404850000127
其中,ec是估计的哈密尔顿函数的近似误差,通过建立最小化目标函数
Figure BDA0003037404850000128
利用梯度下降算法调整神经网络权值向量
Figure BDA0003037404850000129
设计其更新策略为:
Figure BDA00030374048500001210
其中,αc为评价神经网络权值的更新策略。
因此,针对受不确定环境约束的可重构机械臂系统,结合最优控制策略和评价神经网络近似能力,并利用策略迭代算法,最终得到近似的最优力/位置控制策略。所述近似的最优力/位置控制策略为
Figure BDA00030374048500001211
其中,
Figure BDA00030374048500001212
为近似的最优力和位置跟踪控制策略,
Figure BDA00030374048500001213
为力和位置跟踪控制策略对应的给定的正定矩阵,gT(q)为与惯性矩阵相关的模型函数,
Figure BDA00030374048500001214
为神经网络评价模型中激活函数的偏导数,
Figure BDA00030374048500001313
为神经网络评价模型中权值的估计值。
下面提供了一个更为具体的实施例。
如图2所示,根据受约束的可重构机械臂实际位置和接触力变量,通过自适应算法在线估计未知环境参数,并与期望位置和接触力矩变量作比较。设定神经网络初值,通过建立力/位置跟踪误差融合函数,得到神经网络权值更新策略并且得到近似性能指标函数。从而建立近似哈密尔顿-雅可比-贝尔曼方程,进一步更新评价神经网络权值。最后,利用近似的性能指标函数,得到面向未知环境约束的近似最优力/位置控制策略。
如图3所示,面向未知环境约束的可重构机械臂最优力/位置控制方法,该方法首先建立受约束的可重构机械臂系统动力学模型,利用自适应在线估计位置的环境参数,从而建立力/位置跟踪误差融合函数,并构建相对应的性能指标函数和哈密尔顿方程。通过策略迭代的学习算法和评价神经网络结构,近似性能指标函数来求解哈密尔顿方程,得到近似的最优力/位置控制策略。最后通过仿真验证所提出控制方法的有效性。
1、动力学模型的建立
考虑在约束任务空间下的n自由度可重构机械臂系统动力学模型表示为:
Figure BDA0003037404850000131
其中,
Figure BDA0003037404850000132
为关节位置向量,
Figure BDA0003037404850000133
为关节速度向量,
Figure BDA0003037404850000134
为关节加速度向量,
Figure BDA0003037404850000135
为惯性矩阵,
Figure BDA0003037404850000136
为离心力-哥氏力项,
Figure BDA0003037404850000137
为重力项,
Figure BDA0003037404850000138
为控制输入力矩,
Figure BDA0003037404850000139
是由于可重构机械臂末端效应器与约束环境接触所产生的接触力矩,
Figure BDA00030374048500001310
为n×1维的空间。
对于与未知环境接触的可重构机械臂,其与刚性连杆机械臂相互作用的不确定约束曲面描述为
Figure BDA00030374048500001314
其中,
Figure BDA00030374048500001311
表示为在工作空间下机械臂运动而产生的位移与其作用在关节空间坐标系下的关节位置相互转换关系,l为环境约束维数,
Figure BDA00030374048500001312
是一个不确定参数向量,
Figure BDA00030374048500001412
为l×1维的空间,
Figure BDA0003037404850000141
为工作空间下与关节运动角度相关的约束方程,
Figure BDA0003037404850000142
为与笛卡尔坐标系下机械臂运动角度相关的约束方程。因此,可将约束力矩τc表示为:
Figure BDA0003037404850000143
其中,fc为可测的可重构机械臂末端与环境接触的外部力向量,
Figure BDA0003037404850000144
为约束环境空间反映到关节工作空间的雅可比矩阵,将其展开讨论为:
Figure BDA0003037404850000145
其中,J(q)为可重构机械臂的雅可比矩阵,
Figure BDA0003037404850000146
为约束环境与机械臂工作空间之间的雅可比矩阵。
本实施例所考虑的约束环境几何结构已知且曲面维度为1,而参数向量
Figure BDA00030374048500001413
是不确定的甚至未知的,如其梯度范围、弧度参数等。并且考虑可重构机械臂实际应用中,接触外力在任务过程中可测量力的大小,因此存在|fc|≤fL其中fL为正常数上界。
2、未知环境约束的不确定性分析与自适应估计参数法
分析受外界不确定环境约束的可重构机械臂的未知约束方程
Figure BDA0003037404850000147
并将其线性参数化,表示为:
Figure BDA0003037404850000148
其中,
Figure BDA0003037404850000149
为约束环境空间的回归方程,
Figure BDA00030374048500001410
为1×l维的空间,z=z(q)表示为在工作空间下机械臂运动而产生的位移与其作用在关节空间坐标系下的关节位置相互转换关系,z1,z2,…,zl为相对应的约束环境子空间的回归方程。并且利用以下泰勒函数展开结构来表述一系列的约束函数:
Figure BDA00030374048500001411
其中,
Figure BDA00030374048500001414
a0,…,ai,…,…,bi,j,…,…,ci,…为以泰勒展开结构的约束方程系数。需要注意的是,约束曲面函数的某些坐标项可以由其他坐标项的可微函数表示。
在传统的力/位置控制方法中,控制问题直接在任务空间中求解,需要完整的运动学信息才能得到关节空间到任务空间的雅可比矩阵。然而,考虑到不确定的环境约束,通过具有未知运动学参数的雅可比矩阵自适应估计算法,以保证受约束机器人的稳定性。因此,根据约束函数的性质可以将反映不确定环境与任务工作空间关系的雅可比矩阵
Figure BDA0003037404850000151
表示为与约束参数向量线性相关的形式:
Figure BDA0003037404850000152
其中,
Figure BDA0003037404850000153
为约束空间回归方程的偏微分函数,
Figure BDA0003037404850000154
为与约束参数向量线性相关函数的标量值。由于约束环境的不确定参数
Figure BDA00030374048500001514
未知,所以可以将近似的
Figure BDA0003037404850000155
表示为:
Figure BDA0003037404850000156
其中,
Figure BDA0003037404850000157
为与约束参数向量线性相关函数标量值的近似值,
Figure BDA0003037404850000158
为环境不确定参数
Figure BDA0003037404850000159
的估计值。
根据机械臂的性质和实际应用要求可知,雅可比矩阵
Figure BDA00030374048500001510
和不确定环境参数
Figure BDA00030374048500001515
是有界的,另外由于重构机械臂在力/位置跟踪过程中处处非奇异,也就是说雅可比矩阵
Figure BDA00030374048500001511
是满秩的,不存在奇异点的情况。因此,所考虑和分析的可以反映不确定环境与任务工作空间关系的雅可比矩阵
Figure BDA00030374048500001516
同样是有界的,并且可以由自适应估计算法近似。所以,这里定义雅可比矩阵估计误差为:
Figure BDA00030374048500001512
可得到近似的约束力矩误差eτp为:
Figure BDA00030374048500001513
其中,J+T(q)=J(q)(JT(q)J(q))-1为与雅可比矩阵相关的转换矩阵。通过估计算法
Figure BDA0003037404850000161
和传感器测量的τc,可以得到由于估计算法而产生的约束力矩误差eτp,并且利用梯度下降法对所设计的估计误差目标函数
Figure BDA0003037404850000162
进行更新,进而实现对不确定约束参数
Figure BDA0003037404850000163
的估计,其更新策略为:
Figure BDA0003037404850000164
通过上述的可重构机械臂不确定环境约束的分析和推导,可以得到近似的反映约束环境空间与关节工作空间的雅可比矩阵
Figure BDA0003037404850000165
表示为:
Figure BDA0003037404850000166
因此,将可重构机械臂与环境接触力矩τc估计近似为:
Figure BDA0003037404850000167
针对受不确定环境约束的可重构机械臂动力学模型(1)和自适应估计未知约束参数方(11),建立受未知环境约束的可重构机械臂系统状态空间方程:
Figure BDA0003037404850000168
3、针对受未知环境约束的可重构机械臂系统,定义关节位置跟踪误差eq,关节速度跟踪误差
Figure BDA00030374048500001612
和末端效应器约束力矩跟踪误差eτ分别为
eq=q-qd (15)
Figure BDA0003037404850000169
Figure BDA00030374048500001610
其中,qd
Figure BDA00030374048500001611
τd分别是期望轨迹,期望速度和期望接触力矩。
为了使得可重构机械臂的实际位置和速度跟踪的上期望轨迹的同时,实现末端效应器与外界环境之间相互作用力的控制,利用混合力/位置控制的思想,将机械臂末端效应器的运动目标和接触力目标的实现分成两个解耦的单独子问题去解决。通过这样的思想,设计了融合力/位置跟踪目标的混合力/位置误差方程m(t):
Figure BDA0003037404850000171
其中,kdeq,keq,kτ为方程的系数也是控制参数,并且该函数初始状态为m0(t)=m(0)。
结合优化思想和自适应动态规划的算法,将力/位置控制问题转化为相应的最优控制来解决,设计融合力/位置跟踪误差和控制输出力矩的综合性能指标函数:
Figure BDA0003037404850000172
其中,效应函数N(m(t),u(m(t)))=m(t)TQcm(t)+u(t)TRcu(t),对于所有m(t)和u(t)有不等式N(m(t),u(m(t)))≥0成立,并且初始状态N(0,0)=0,
Figure BDA0003037404850000173
Qc为多信息融合函数对应的给定的正定矩阵,
Figure BDA0003037404850000174
Rc为力和位置跟踪控制策略对应的给定的正定矩阵。Ψ(Ω)是由一系列可行的控制策略组成的集合。
针对于受未知环境约束的可重构机械臂系统,对于
Figure BDA0003037404850000175
如果存在一组容许控制策略μ(m(t))∈Ψ(Ω)并且满足μ(0)=0,如果μ(m(t))在Ω上是连续的,则μ(m(t))=u(m(t))能确保可重构机械臂系统在紧集
Figure BDA0003037404850000178
上收敛,并且保证性能指标函数P(m(t))是有界的且初始状态P(0)=0。也就是说,将受未知环境约束的可重构机械臂系统的力/位置跟踪问题转化为相应的最优控制问题来解决,需要求解最优性能指标函数得到一组最优控制策略u*(m(t))∈μ(m(t)),使得所设计的混合跟踪误差函数m(t)最小,实现对可重构机械臂系统的力/位置跟踪控制。为求解可重构机械臂最优力/位置跟踪控制问题,将相对应的哈密尔顿-雅可比-贝尔曼函数和最优性能指标函数定义如下:
Figure BDA0003037404850000176
Figure BDA0003037404850000177
其中,
Figure BDA0003037404850000181
为性能指标函数P(m)对m(t)的偏微分函数
Figure BDA0003037404850000182
Figure BDA0003037404850000183
与力/位置跟踪误差相关的函数。利用上述哈密尔顿方程和最优性能指标函数,结合优化思想,最优性能指标函数P*(m)满足于哈密尔顿方程:
Figure BDA0003037404850000184
如果P*(m)存在且连续可微,可以得到受未知环境约束的可重构机械臂系统最优力/位置跟踪控制策略为:
Figure BDA0003037404850000185
并通过整理和推导可以得到等式:
Figure BDA0003037404850000186
4、策略迭代的学习算法
接下来,利用策略迭代算法来寻找最优控制策略,它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优控制策略。策略迭代算法由策略评估和策略改进两部分组成。具体步骤如下:
步骤1:参数初始化,选择i为迭代次数,当i=0,给定一个初始的容许控制策略μ(0)(m),并选取一个正常数δ。
步骤2:当i>0时,结合控制策略μ(i)(m),通过以下的等式来更新性能指标函数P(i)(m),
Figure BDA0003037404850000187
这里性能指标函数P(i+1)(m)=0。
步骤3:通过以下等式来更新控制策略μ(i)(m),
Figure BDA0003037404850000188
步骤4:如果||P(i+1)(m)-P(i)(m)||≤δ,停止计算,得到最优控制策略;否则,令i=i+1,转到步骤2;
步骤5:停止。
通过该算法的迭代计算,当i→∞时可以近似计算出最优性能指标函数P(i)(m)→P*(m)和最优控制策略μ(i)(m)→u*(m)。
5、评价神经网络的构建
为了找到最优控制策略,需要求解哈密尔顿方程得到最优性能指标函数,然后将解结合策略迭代算法得到最优控制策略。对于如可重构机械臂系统这样的高度非线性系统,哈密尔顿方程是一个计算量大且求解困难的非线性偏微分方程。因此,需要利用策略迭代算法和神经网络的逼近能力来寻找最优控制策略和最优性能指标函数。
建立评价神经网络结构近似相对应的最优性能指标函数:
Figure BDA0003037404850000191
其中,
Figure BDA0003037404850000192
是理想权值,N为隐含层神经元的个数,
Figure BDA0003037404850000193
是激活函数,
Figure BDA0003037404850000194
为评价神经网络近似残差。将性能指标函数P(m)的偏导数表示为:
Figure BDA0003037404850000195
其中,
Figure BDA0003037404850000196
Figure BDA0003037404850000197
分别为激活函数和评价神经网络近似残差的偏导数。根据上式,将哈密尔顿方程改写为:
Figure BDA0003037404850000198
其中,ech为由理想的评价神经网络近似哈密尔顿函数得到的残差。由于理想的评价神经网络权值Wc无法直接得知,所以将评价神经网络近似为:
Figure BDA0003037404850000199
其中,
Figure BDA00030374048500001910
为神经网络权值的近似值,从而,通过得到近似的哈密尔顿函数为:
Figure BDA0003037404850000201
其中,ec是估计的哈密尔顿函数的近似误差,通过采用梯度下降算法最小化目标函数
Figure BDA0003037404850000202
以调整神经网络权值向量
Figure BDA0003037404850000203
设计其更新策略为:
Figure BDA0003037404850000204
其中,αc为评价神经网络权值的更新策略,设计
Figure BDA0003037404850000205
并根据自适应控制中持续激励条件,假设υc有界并存在一个正常数υcL,使得||υc||≤υcL
因此,针对受未知环境约束的可重构机械臂系统,结合最优控制策略和评价神经网络近似能力,利用策略迭代算法,最终得到近似的最优力/位置控制策略为:
Figure BDA0003037404850000206
6、仿真验证
选取两种不同构形的二自由度可重构机械臂模型,在两种不同空间约束下进行仿真实验来验证所提出的最优力/位置控制方法的有效性。
构形1的动力学模型参数为
Figure BDA0003037404850000207
Figure BDA0003037404850000208
Figure BDA0003037404850000209
构形1在已知约束下与环境接触并完成既定作业,给定其环境约束方程为:
ΦA(q)=l1+l2cos(q2)-1.5=0
其中,l1=1和l2=1为该可重构机械臂两个连杆的长度。并给出构形1的期望位置跟踪目标轨迹和末端期望接触力分别为:
q1d=sin(t)+0.3cos(2t)
Figure BDA0003037404850000211
fd=10N
定义可重构机械臂的初始位置为q0=[-1 -0.5]T,选择力/位置误差融合函数的参数kdeq=6.4,keq=8.1,kτ=4.4。设定评价神经网络的权值为
Figure BDA0003037404850000212
并且初始值设定为
Figure BDA0003037404850000213
激活函数选取有滑模函数组成的
Figure BDA0003037404850000214
其中m1,m2分别是关节1和2的力/位置误差融合函数,神经网络权值更新策略设定为αc=0.3。
构形2的动力学模型参数为
Figure BDA0003037404850000215
Figure BDA0003037404850000216
Figure BDA0003037404850000217
构形2在未知环境下进行力/位置任务,主要是完成如打磨,抛光等与未知环境接触的力/位置作业,其约束环境具有一定的不确定性,设定具有不确定因素的约束方程表达为:
ΦB(z(q))=yz-tan(θz)xz-b=0
=l1cosq1-l2cos(q1+q2)-tan(θz)(l1sinq1-l2sin(q1+q2))-b
其中,l1=1和l2=1为该可重构机械臂两个连杆的长度,θz为未知约束面坡度角。未知约束面方程中的目标参数为b=1,θzd=π/6。并给出构形2的期望位置跟踪目标轨迹和末端期望接触力分别为:
q1d=sin(2t)+0.2cos(t)
Figure BDA0003037404850000218
fd=5N
为了得到一个更平滑稳定的跟踪性能并尽量减少接触力偏差,所提出的面向未知环境的最优力/位置控制器能够保证约束方程的近似误差ez趋于零,也就是说,使得
Figure BDA0003037404850000221
首先给出
Figure BDA0003037404850000222
其中
Figure BDA0003037404850000223
并且估计的坡度角可计算为
Figure BDA0003037404850000224
从关节空间到笛卡尔空间的雅可比矩阵J(q)定义为:
Figure BDA0003037404850000225
通过Matlab仿真结果表明,所提出的面向未知环境约束的最优力/位置控制方法能为可重构机械臂提供稳定性和精确性,以满足各种复杂极端任务的要求。
本实施例提供的面向未知环境约束的可重构机械臂控制方法,具有如下优点:
在机械臂力/位置跟踪方面,本实施例解决了面向约束工作空间存在不确定性因素情况下的力/位置跟踪任务目标,采用自适应估计算法在线近似未知约束参数向量,保证机械臂系统在与外界环境接触时安全稳定地运行。
在控制精度方面,本实施例将力/位置控制任务转化为相应的最优控制问题来解决,引入自适应动态规划方法,使得末端效应器的接触力和位置跟踪性能更加连续和平滑,并在保持系统渐进稳定的同时,降低执行器的输出消耗。
因此,本实施例解决了现有技术中面向未知环境不确定性因素影响的力/位置控制响应速度慢以及跟踪精度低的问题,为可重构机械臂提供稳定性和精确性,并且可以满足与各种复杂环境接触任务的需求。
本发明还提供了一种面向未知环境约束的可重构机械臂控制系统,参见图4,所述系统包括:
动力学模型构建模块201,用于构建约束空间下多自由度的可重构机械臂的动力学模型。
状态方程构建模块202,用于基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程。
函数构建模块203,用于基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数。
求解模块204,用于采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略。
作为一种可选的实施方式,所述动力学模型构建模块,具体包括:
数据获取单元,用于获取所述可重构机械臂的关节位置和关节速度。
力矩确定单元,用于确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩。
模型构建单元,用于基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种面向未知环境约束的可重构机械臂控制方法,其特征在于,包括:
构建约束空间下多自由度的可重构机械臂的动力学模型;
基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程;
基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略;
所述基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程,具体包括:
将受未知环境约束的可重构机械臂的未知约束方程线性参数化,得到线性表示形式;
由所述线性表示形式确定反映约束环境空间与任务工作空间关系的雅可比矩阵;
对所述反映约束环境空间与任务工作空间关系的雅可比矩阵进行估计,得到估计矩阵;
基于所述估计矩阵确定可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值;
由所述动力学模型和所述接触力矩估计值构建所述可重构机械臂的状态空间方程;
所述基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数,具体包括:
基于所述状态空间方程,构建包含末端效应器的跟踪误差和接触力偏差的多信息融合函数;所述多信息融合函数为
Figure FDA0003790691990000021
其中,m(t)为t时刻的多信息融合函数,eq为关节位置跟踪误差,
Figure FDA0003790691990000022
为关节速度跟踪误差,eτ为末端效应器约束力矩跟踪误差,kdeq
Figure FDA0003790691990000023
的系数,keq
Figure FDA0003790691990000024
的系数,kτ为eτ的系数;
由所述多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
所述性能指标函数为
Figure FDA0003790691990000025
其中,P(m(t))为t时刻的性能指标函数,Ψ(Ω)为由一系列可行的控制策略组成的集合,u为控制输入力矩,N(m(t),u(m(t)))为t时刻的效用函数,u(m(t))为t时刻的多信息融合函数对应的力和位置跟踪控制策略;
所述哈密尔顿-雅可比-贝尔曼函数为
Figure FDA0003790691990000026
其中,
Figure FDA0003790691990000027
为哈密尔顿-雅可比-贝尔曼函数,m为多信息融合函数,u(m)为多信息融合函数对应的力和位置跟踪控制策略,
Figure FDA0003790691990000031
为性能指标函数P(m)对m的偏微分函数,N(m,u(m))为效用函数,
Figure FDA0003790691990000032
为多信息融合函数的一阶导数,
Figure FDA0003790691990000033
为t时刻的性能指标函数P(m(t))对m(t)的偏微分函数,
Figure FDA0003790691990000034
为估计接触力矩,vc为与力和位置跟踪误差相关的函数,
Figure FDA0003790691990000035
Qc为多信息融合函数对应的给定的正定矩阵,
Figure FDA0003790691990000036
Rc为力和位置跟踪控制策略对应的给定的正定矩阵,n为可重构机械臂的自由度,
Figure FDA0003790691990000037
为n×n维的空间,
Figure FDA0003790691990000038
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,q为关节位置向量,
Figure FDA0003790691990000039
为关节速度向量;
采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略,具体包括:
(1)利用策略迭代算法求解哈密尔顿方程得到最优性能指标函数,然后将解结合策略迭代算法得到最优控制策略,步骤如下:
步骤1:参数初始化,选择i为迭代次数,当i=0时,给定一个初始的容许控制μ(0)(m),并选取一个正常数δ;
步骤2:当i>0时,结合控制策略μ(i)(m),通过以下的等式来更新性能指标函数P(i)(m),
Figure FDA00037906919900000310
这里性能指标函数P(i+1)(m)=0,
Figure FDA00037906919900000311
为P(i+1)(m)对m的偏微分函数;
步骤3:通过以下等式来更新控制策略μ(i)(m),
Figure FDA0003790691990000041
步骤4:如果||P(i+1)(m)-P(i)(m)||≤δ,停止计算,得到最优控制策略;否则,令i=i+1,转到步骤2;
步骤5:停止;
所述近似的最优力和位置跟踪控制策略为
Figure FDA0003790691990000042
其中,
Figure FDA0003790691990000043
为近似的最优力和位置跟踪控制策略,
Figure FDA0003790691990000044
为力和位置跟踪控制策略对应的给定的正定矩阵,gT(q)为与惯性矩阵相关的模型函数,
Figure FDA0003790691990000045
为神经网络评价模型中激活函数的偏导数,
Figure FDA0003790691990000046
为神经网络评价模型中权值的估计值。
2.根据权利要求1所述的一种面向未知环境约束的可重构机械臂控制方法,其特征在于,所述构建约束空间下多自由度的可重构机械臂的动力学模型,具体包括:
获取所述可重构机械臂的关节位置和关节速度;
确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩;
基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。
3.根据权利要求2所述的一种面向未知环境约束的可重构机械臂控制方法,其特征在于,所述接触力矩为:
Figure FDA0003790691990000047
其中,τc为接触力矩,fc为可重构机械臂的末端与约束环境接触的外部力向量,
Figure FDA0003790691990000048
为约束环境空间反映到关节空间的雅可比矩阵的转置,q为关节位置向量,θ为未知约束参数向量。
4.根据权利要求2所述的一种面向未知环境约束的可重构机械臂控制方法,其特征在于,所述动力学模型为
Figure FDA0003790691990000051
其中,q为关节位置向量,
Figure FDA0003790691990000052
为关节速度向量,
Figure FDA0003790691990000053
为关节加速度向量,M(q)为惯性矩阵,
Figure FDA0003790691990000054
为离心力-哥氏力项,G(q)为重力项,u为控制输入力矩,τc为接触力矩。
5.根据权利要求1所述的一种面向未知环境约束的可重构机械臂控制方法,其特征在于,所述状态空间方程为:
Figure FDA0003790691990000055
其中,I为状态空间,
Figure FDA0003790691990000056
是受环境约束的可重构机械臂的状态向量,q为关节位置向量,
Figure FDA0003790691990000057
为关节速度向量,x1表示反映可重构机械臂系统运动位置的状态向量,x2表示反映可重构机械臂系统运动速度的状态向量,
Figure FDA0003790691990000058
为x1的一阶导数,
Figure FDA0003790691990000059
为x2的一阶导数,y是该非线性系统的输出状态,
Figure FDA00037906919900000510
表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,
Figure FDA00037906919900000511
g(q)=M-1(q),M-1(q)为惯性矩阵的逆矩阵,
Figure FDA00037906919900000512
为离心力-哥氏力项,G(q)为重力项,
Figure FDA00037906919900000513
为估计接触力矩,u为控制输入力矩。
6.一种用于实现权利要求1-5中任意一项所述方法的面向未知环境约束的可重构机械臂控制系统,其特征在于,包括:
动力学模型构建模块,用于构建约束空间下多自由度的可重构机械臂的动力学模型;
状态方程构建模块,用于基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程;
函数构建模块,用于基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
求解模块,用于采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略;
所述基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程,具体包括:
将受未知环境约束的可重构机械臂的未知约束方程线性参数化,得到线性表示形式;
由所述线性表示形式确定反映约束环境空间与任务工作空间关系的雅可比矩阵;
对所述反映约束环境空间与任务工作空间关系的雅可比矩阵进行估计,得到估计矩阵;
基于所述估计矩阵确定可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值;
由所述动力学模型和所述接触力矩估计值构建所述可重构机械臂的状态空间方程。
7.根据权利要求6所述的一种面向未知环境约束的可重构机械臂控制系统,其特征在于,所述动力学模型构建模块,具体包括:
数据获取单元,用于获取所述可重构机械臂的关节位置和关节速度;
力矩确定单元,用于确定所述可重构机械臂的末端效应器与约束环境接触所产生的接触力矩;
模型构建单元,用于基于所述关节位置、所述关节速度和所述接触力矩构建所述动力学模型。
CN202110447459.6A 2021-04-25 2021-04-25 一种面向未知环境约束的可重构机械臂控制方法及系统 Expired - Fee Related CN113103237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110447459.6A CN113103237B (zh) 2021-04-25 2021-04-25 一种面向未知环境约束的可重构机械臂控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110447459.6A CN113103237B (zh) 2021-04-25 2021-04-25 一种面向未知环境约束的可重构机械臂控制方法及系统

Publications (2)

Publication Number Publication Date
CN113103237A CN113103237A (zh) 2021-07-13
CN113103237B true CN113103237B (zh) 2022-10-04

Family

ID=76720083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110447459.6A Expired - Fee Related CN113103237B (zh) 2021-04-25 2021-04-25 一种面向未知环境约束的可重构机械臂控制方法及系统

Country Status (1)

Country Link
CN (1) CN113103237B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113954079B (zh) * 2021-11-23 2023-03-24 北京邮电大学 一种同质模块化机器人通用数学表征方法
CN114406996B (zh) * 2021-12-30 2023-05-26 长春工业大学 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统
CN114211478B (zh) * 2022-01-05 2022-09-30 长春工业大学 一种模块化机械臂协调操作最优控制方法及系统
CN114407022B (zh) * 2022-03-07 2022-09-09 哈尔滨工业大学 一种基于模型参数误差观测器的机械臂碰撞检测方法
CN114851193B (zh) * 2022-04-26 2023-12-22 北京航空航天大学 一种空间机械臂与未知环境接触过程的智能柔顺操控方法
CN116149262B (zh) * 2023-04-23 2023-07-04 山东科技大学 一种伺服系统的跟踪控制方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108555913A (zh) * 2018-06-15 2018-09-21 天津大学 基于无源性的移动机械臂位置/力的自抗扰控制方法
CN109483542A (zh) * 2018-11-23 2019-03-19 上海电气集团股份有限公司 一种基于非线性运动学模型的机器人控制方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415272B1 (en) * 1998-10-22 2002-07-02 Yamaha Hatsudoki Kabushiki Kaisha System for intelligent control based on soft computing
US7437201B2 (en) * 2003-01-14 2008-10-14 Cullen Christopher P Electric motor controller
NZ551335A (en) * 2004-06-18 2010-03-26 Ambrx Inc Antibodies and fragments thereof comprising an non naturally encoded amino acid coupled to a linker
US9566710B2 (en) * 2011-06-02 2017-02-14 Brain Corporation Apparatus and methods for operating robotic devices using selective state space training
KR102487493B1 (ko) * 2016-03-03 2023-01-11 구글 엘엘씨 로봇 파지용 심층 기계 학습 방법 및 장치
CN105798930B (zh) * 2016-04-01 2017-09-05 浙江工业大学 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法
CN107045557B (zh) * 2016-11-01 2020-05-12 长春工业大学 面向约束的可重构机械臂非奇异终端滑模力位置控制方法
CN106945020B (zh) * 2017-05-18 2019-10-22 哈尔滨工业大学 一种空间双机械臂系统运动协调控制方法
CN107544261B (zh) * 2017-10-26 2020-07-24 长春工业大学 不确定环境接触下的可重构机器人分散学习最优控制方法
CN107972031B (zh) * 2017-11-10 2020-07-07 浙江科技学院 一种冗余机械臂可重复运动的初始位置定位方法
CN109581868B (zh) * 2018-09-21 2021-11-30 长春工业大学 基于评判辨识结构的可重构机器人分散神经最优控制方法
CN110170992B (zh) * 2019-04-02 2022-11-04 长春工业大学 一种基于动态规划的模块化机械臂多故障容错控制方法
CN111618864B (zh) * 2020-07-20 2021-04-23 中国科学院自动化研究所 基于自适应神经网络的机器人模型预测控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108555913A (zh) * 2018-06-15 2018-09-21 天津大学 基于无源性的移动机械臂位置/力的自抗扰控制方法
CN109483542A (zh) * 2018-11-23 2019-03-19 上海电气集团股份有限公司 一种基于非线性运动学模型的机器人控制方法

Also Published As

Publication number Publication date
CN113103237A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN113103237B (zh) 一种面向未知环境约束的可重构机械臂控制方法及系统
Moberg Modeling and control of flexible manipulators
Sutanto et al. Encoding physical constraints in differentiable newton-euler algorithm
Chen et al. Zeroing neural-dynamics approach and its robust and rapid solution for parallel robot manipulators against superposition of multiple disturbances
Xu et al. Two optimization algorithms for solving robotics inverse kinematics with redundancy
Taghbalout et al. Experimental dynamic identification of a YuMi collaborative robot
Yildirim et al. Noise analysis of robot manipulator using neural networks
Zhoga et al. Algorithm to synthesize control force for tripod manipulator drives
Zhang et al. Time delay compensation of a robotic arm based on multiple sensors for indirect teaching
Maithani et al. Predicting human intent for cooperative physical human-robot interaction tasks
Mekhnacha et al. The design and implementation of a bayesian CAD modeler for robotic applications
Salmasi et al. A manoeuvre control strategy for flexible-joint manipulators with joint dry friction
Ding et al. Dynamic modelling and PFL-based trajectory tracking control for underactuated cable-driven truss-like manipulator
Patel et al. An Analysis of Unified Manipulation with Robot Arms and Dexterous Hands via Optimization-based Motion Synthesis
Cruz et al. Application of robust discontinuous control algorithm for a 5-DOF industrial robotic manipulator in real-time
Chávez-Olivares et al. On explicit force regulation with active velocity damping for robot manipulators
KR102410838B1 (ko) 와이어 구동 방식 로봇의 모델링 및 제어 방법
Ferguene et al. Dynamic external force feedback loop control of a robot manipulator using a neural compensator—Application to the trajectory following in an unknown environment
Adel et al. End-effector position estimation and control of a flexible interconnected industrial manipulator using machine learning
Wu et al. Model free adaptive predictive tracking control for robot manipulators with uncertain parameters
Antonelli et al. Explicit force control for underwater vehicle-manipulator systems
Kim et al. Description of instantaneous restriction space for multi-DOFs bilateral teleoperation systems using position sensors in unstructured environments
CN113290554B (zh) 一种基于值迭代的Baxter机械臂智能优化控制方法
Litim et al. Trajectory planning and motion control schemes for 2DoF planar parallel manipulator Biglide type with elastic joints: A comparative study
Marufkhani et al. Adaptive Robust Task-Space Control of Bilateral Teleoperation Systems with Time Delays

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20221004

CF01 Termination of patent right due to non-payment of annual fee