CN113370208A - 一种可重构机械臂子系统的控制方法及系统 - Google Patents

一种可重构机械臂子系统的控制方法及系统 Download PDF

Info

Publication number
CN113370208A
CN113370208A CN202110654378.3A CN202110654378A CN113370208A CN 113370208 A CN113370208 A CN 113370208A CN 202110654378 A CN202110654378 A CN 202110654378A CN 113370208 A CN113370208 A CN 113370208A
Authority
CN
China
Prior art keywords
expression
reconfigurable
control moment
representing
arm subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110654378.3A
Other languages
English (en)
Inventor
董博
朱新野
安天骄
张振国
刘克平
李元春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun University of Technology
Original Assignee
Changchun University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun University of Technology filed Critical Changchun University of Technology
Priority to CN202110654378.3A priority Critical patent/CN113370208A/zh
Publication of CN113370208A publication Critical patent/CN113370208A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种可重构机械臂子系统的控制方法及系统。所述方法包括:基于可重构机械臂子系统的基础参数构建动力学模型;根据动力学模型确定动力学模型的状态空间表达式;基于可重构机械臂子系统的效用函数和控制策略确定动力学模型的代价函数;采用扩张状态观测器对状态空间表达式进行观测得到动力学模型补偿控制力矩表达式;采用神经网络对交联耦合项进行补偿得到交联项辨识控制力矩表达式;对代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式;并根据三个表达式确定最终控制力矩表达式。本发明可以得到最优控制力矩,保证在未知环境约束的情况下机械臂有较高的跟踪精度,可以实现轨迹以及力的精确控制。

Description

一种可重构机械臂子系统的控制方法及系统
技术领域
本发明涉及可重构机械臂领域,特别是涉及一种可重构机械臂子系统的控制方法及系统。
背景技术
可重构机械臂能够按照任务需求的不同将本身的构形进行二次组合或配置,呈现出大多数机械臂缺少的性质。“模块化”和“可重构”是对于可重构机械臂设计的两大基本要求,其主要思想是将一个复杂的机械臂系统划分成若干个可维护性和便捷性较高的子系统,进而使机械臂系统的开发和设计时间有效缩短。可重构机械臂系统在执行力/位置作业的场合下无法避免的要在未知环境约束条件下进行工作,同时要对系统的节能性、精准性、鲁棒性及稳定性等进行综合考量,所以,如果环境信息无法确定,那么选取的控制策略是否合适是非常重要的。
在现代控制理论中,最主要的就是最优控制,其主要核心思想就是:要选取最优控制策略让系统中的性能指标达到理想化状态。就可重构机械臂子系统而言,现有方法采用无模型自适应控制方法求取控制策略,确保了可重构机械臂子系统的稳定性,但是因为可重构机械臂子系统过于复杂,且其内在规律难以了解,导致通过无模型自适应控制方法得到的控制策略并不是最优的。
发明内容
本发明的目的是提供一种可重构机械臂子系统的控制方法及系统,可以得到最优控制力矩,保证在未知环境约束的情况下机械臂有较高的跟踪精度,可以实现轨迹以及力的精确控制。
为实现上述目的,本发明提供了如下方案:
一种可重构机械臂子系统的控制方法,包括:
基于可重构机械臂子系统的基础参数构建动力学模型;所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩;
根据所述动力学模型确定所述动力学模型的状态空间表达式;
基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数;所述效用函数为根据所述位置和所述控制力矩建立的;
采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式;
采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式;
对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式;
根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
可选的,所述采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式,具体包括:
基于扩张状态观测器的构建方法,对所述状态空间表达式进行处理得到处理后的状态空间表达式;
根据所述处理后的状态空间表达式构造第一扩张状态观测模型;
根据所述处理后的状态空间表达式和所述第一扩张状态观测模型确定观测误差的动力学方程;
根据所述观测误差的动力学方程和位置观测误差函数确定第二扩张状态观测模型;所述位置观测误差函数为根据观测参数的真实值与观测值确定的;所述观测参数包括所述可重构机械臂子系统的位置、速度和加速度;
基于所述处理后的状态空间表达式和所述第二扩张状态观测模型,采用比例-积分-微分控制策略确定动力学模型补偿控制力矩表达式。
可选的,所述采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式,具体包括:
将所述交联耦合项构建成径向基神经网络形式得到交联耦合项动力学辨识表达式;
根据所述交联耦合项动力学辨识表达式得到所述交联耦合项动力学辨识估计值表达式;
将所述交联耦合项动力学辨识估计值表达式和所述交联耦合项动力学辨识表达式的差确定为辨识误差表达式;
基于径向基神经网络算法根据所述辨识误差表达式得到所述交联项辨识控制力矩表达式。
可选的,所述对代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式,具体包括:
采用神经网络对所述代价函数进行逼近得到近似代价函数;
采用所述神经网络对所述近似代价函数进行逼近得到估计代价函数;
对所述估计代价函数进行求偏导得到估计偏导函数;
根据所述估计偏导函数和所述代价函数得到最优补偿控制力矩表达式。
可选的,所述根据所述估计偏导函数和所述代价函数得到最优补偿控制力矩表达式,具体包括:
对所述代价函数取无穷小得到哈密顿函数;
对所述哈密顿函数取最小控制力矩得到哈密顿-雅克比-贝克曼方程;
根据所述哈密顿-雅克比-贝克曼方程和所述估计偏导函数得到最优补偿控制力矩表达式。
可选的,所述最终控制力矩表达式,具体为:
Figure BDA0003113218180000031
其中,ui *表示第i个可重构机械臂子系统的最终控制力矩,kip表示比例增益,xid表示第i个可重构机械臂子系统的期望位置,
Figure BDA0003113218180000032
表示第i个可重构机械臂子系统的位置的观测值,kid表示微分增益,
Figure BDA0003113218180000033
表示第i个可重构机械臂子系统的速度的观测值,
Figure BDA0003113218180000034
表示第i个可重构机械臂子系统的加速度的观测值,λi表示第一系数,
Figure BDA0003113218180000035
表示第i个可重构机械臂子系统的速度误差,
Figure BDA0003113218180000036
表示交联耦合项动力学辨识的估计值,
Figure BDA0003113218180000041
表示第i个可重构机械臂子系统的期望加速度,ηi表示第二系数,sgn(ei)表示第i个可重构机械臂子系统的位置误差的符号,kqwei表示第三系数,Ri表示第四系数,gi T表示控制输入矩阵的梯度,
Figure BDA0003113218180000042
表示激活函数的梯度的转置矩阵,
Figure BDA0003113218180000043
表示权值。
可选的,所述动力学模型,具体为:
Figure BDA0003113218180000044
其中,Mi(qi)表示惯性矩阵,
Figure BDA0003113218180000045
表示第i个可重构机械臂子系统的加速度,
Figure BDA0003113218180000046
表示哥氏力和离心力项,
Figure BDA0003113218180000047
表示第i个可重构机械臂子系统的速度,Gi(qi)表示重力项,
Figure BDA0003113218180000048
表示交联耦合项,Di表示模型工作环境,ui表示控制力矩,τci表示接触力矩。
可选的,所述动力学模型的状态空间表达式,具体为:
Figure BDA0003113218180000049
其中,
Figure BDA00031132181800000410
表示第i个可重构机械臂子系统的位置的导数,xi2表示xi的速度,
Figure BDA00031132181800000411
表示第i个可重构机械臂子系统的速度的导数,fi(xi1,xi2)表示可重构机械臂子系统的飘移动力学,gi(xi1)表示可重构机械臂子系统的控制输入矩阵,ui表示控制力矩,τci表示接触力矩,hi(x)表示交联耦合函数,di表示状态空间工作环境,yi表示第i个可重构机械臂子系统的输出,xi表示第i个可重构机械臂子系统的状态,xi1表示第i个可重构机械臂子系统的位置。
可选的,所述动力学模型的代价函数,具体为:
Figure BDA00031132181800000412
其中,Ji(ei)表示动力学模型的代价函数,βi,表示第一代价函数系数,TdM表示模型工作环境的上界,Ni(ei,ui)表示效用函数,Υi表示第二代价函数系数,
Figure BDA00031132181800000413
表示最优代价函数的梯度,ui表示控制力矩,Ψ(Ω)表示控制策略集合。
一种可重构机械臂子系统的控制系统,包括:
动力学模型构建模块,用于基于可重构机械臂子系统的基础参数构建动力学模型;所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩;
状态空间表达式确定模块,用于根据所述动力学模型确定所述动力学模型的状态空间表达式;
代价函数确定模块,用于基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数;所述效用函数为根据所述位置和所述控制力矩建立的;
动力学模型补偿控制力矩表达式确定模块,用于采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式;
交联项辨识控制力矩表达式确定模块,用于采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式;
最优补偿控制力矩表达式确定模块,用于对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式;
最终控制力矩表达式确定模块,用于根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明采用扩张状态观测器对状态空间表达式进行观测,采用神经网络对交联耦合项进行补偿,基于观测-评判结构的控制方法,使得最终得到的控制力矩最优,从而保证在未知环境约束的情况下机械臂有较高的跟踪精度,以实现对轨迹以及力的精确控制。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的可重构机械臂子系统的控制方法的流程图;
图2为本发明实施例提供的可重构机械臂子系统的控制方法的原理图;
图3为本发明实施例提供的可重构机械臂子系统的控制系统的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
就可重构机械臂系统而言,要想使控制策略最优,就要对哈密顿-雅克比-贝克曼方程进行求解,而此方程属于非线性偏微分的方程,无法通过解析的手段将最优解得出。自适应动态规划法对于解决此问题而言,是一种十分有效的工具,对于自适应动态规划系统而言,性能指标函数通常是用神经网络进行近似描述的,同时对哈密顿-雅克比-贝克曼方程的解进行逼近,鉴于此,本实施例提供了一种可重构机械臂子系统的控制方法,如图1和图2所示,所述方法包括:
步骤101:基于可重构机械臂子系统的基础参数构建动力学模型。所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩。所述交联耦合项为根据可重构机械臂子系统的位置、速度和加速度建立的。
在实际应用中,步骤101具体为:获取可重构机械臂的位置、速度和加速度,根据可重构机械臂的位置、速度和加速度构建交联耦合项。
获取接触力矩(机械臂末端和外接约束接触形成的接触力矩)、可重构机械臂子系统的加速度、速度和模型工作环境。
根据可重构机械臂子系统的交联耦合项、接触力矩、加速度、速度、模型工作环境和控制力矩构建动力学模型。
在实际应用中,所述动力学模型,具体为:
Figure BDA0003113218180000071
其中,qi表示第i个可重构机械臂子系统的位置,Mi(qi)表示惯性矩阵,
Figure BDA0003113218180000072
表示第i个可重构机械臂子系统的加速度,
Figure BDA0003113218180000073
表示哥氏力和离心力项,
Figure BDA0003113218180000074
表示第i个可重构机械臂子系统的速度,Gi(qi)表示重力项,q,
Figure BDA0003113218180000075
是机械臂整体的位置、速度、加速度向量,
Figure BDA0003113218180000076
表示交联耦合项,Di表示模型工作环境,ui表示控制力矩,τci表示接触力矩。每一个自由度都可以视为一个子系统,每一个子系统存在对应的关节以及模块。
步骤102:根据所述动力学模型确定所述动力学模型的状态空间表达式。
在实际应用中,令
Figure BDA0003113218180000077
则所述动力学模型的状态空间表达式,具体为:
Figure BDA0003113218180000078
其中,
Figure BDA0003113218180000079
表示第i个可重构机械臂子系统的位置的导数,xi2表示xi的速度,即第i个可重构机械臂子系统的速度,
Figure BDA00031132181800000710
表示第i个可重构机械臂子系统的速度的导数,fi(xi1,xi2)表示可重构机械臂子系统的飘移动力学,gi(xi1)表示可重构机械臂子系统的控制输入矩阵,ui表示控制力矩,τci表示接触力矩,hi(x)表示交联耦合函数,di表示状态空间工作环境,yi表示第i个可重构机械臂子系统的输出,xi表示第i个可重构机械臂子系统的状态,xi1表示xi的位置,即第i个可重构机械臂子系统的位置。
步骤103:基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数。所述效用函数为根据所述位置和所述控制力矩建立的。
在实际应用中,所述动力学模型的代价函数,具体为:
Figure BDA0003113218180000081
其中,Ji(ei)表示动力学模型的代价函数,βi,表示第一代价函数系数,TdM表示模型工作环境的上界,Ni(ei,ui)表示效用函数,Υi表示第二代价函数系数,
Figure BDA0003113218180000082
表示最优代价函数的梯度,ui表示控制力矩,Ψ(Ω)表示控制策略集合。Ni(ei,ui)=ei TQiei+ui TRiui,其中
Figure BDA0003113218180000083
Figure BDA0003113218180000084
是确定的正常数矩阵,ei为可重构机械臂子系统的位置误差,ei T是ei的转置矩阵,ui T是ui的转置矩阵。
在实际应用中,对代价函数取最小控制力矩得到最优代价函数:
Figure BDA0003113218180000085
基于非线性系统最优控制设计理论下,可知最优代价函数中
Figure BDA0003113218180000086
满足哈密顿-雅克比-贝克曼方程,在Ji *(ei)连续可微的情况下,将Ji *(ei)带入哈密顿-雅克比-贝克曼方程并对哈密顿-雅克比-贝克曼方程求偏导,得到最优力/位置控制力矩
Figure BDA0003113218180000087
其中,kqwei为一给定正常数,gi T为控制输入矩阵的梯度。
把最优控制力矩分为三部分ui1,ui2,ui3 *,即
Figure BDA0003113218180000088
其中ui1为动力学模型补偿控制力矩,ui2是交联项辨识控制力矩,ui3 *为最优补偿控制力矩。
步骤104:采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式。
在实际应用中,因为可重构机械臂的构形是无法直接获得的,因此采用扩张状态观测器来观测系统动力学模型fi(xi1,xi2),gi(xi1)从而得到动力学模型补偿控制力矩ui1表达式,步骤104具体包括:
步骤1040:基于扩张状态观测器的构建方法,对所述状态空间表达式进行处理得到处理后的状态空间表达式。
在实际应用中,步骤1040具体为:
考虑状态空间表达式中没有交联耦合项函数以及未知环境(工作环境)约束的可重构机械臂子系统,基于扩张状态观测器的思想,可以得到处理后的状态空间表达式
Figure BDA0003113218180000091
其中
Figure BDA0003113218180000092
为扩张的动力学,xi3为扩张状态,
Figure BDA0003113218180000093
为第i个可重构机械臂系统扩张状态的导数。
步骤1041:根据所述处理后的状态空间表达式构造第一扩张状态观测模型。
在实际应用中,步骤1041具体为:
定义观测误差为
Figure BDA0003113218180000094
为xi1,xi2,xi3的观测值,eio1,eio2,eio3为xi1,xi2,xi3的观测误差,
根据处理后的状态空间表达式构造扩张状态观测器(第一扩张状态观测模型)如下形式:
Figure BDA0003113218180000095
其中,
Figure BDA0003113218180000096
Figure BDA0003113218180000097
对时间的导数,
Figure BDA0003113218180000098
是与观测误差相关的函数,βi0j(j=1,2,3)代表第j个可调观测器增益,
Figure BDA0003113218180000099
为控制输入矩阵的观测值。
步骤1042:根据所述处理后的状态空间表达式和所述第一扩张状态观测模型确定观测误差的动力学方程。
在实际应用中,观测误差的动力学方程为:
Figure BDA00031132181800000910
其中,
Figure BDA00031132181800000911
为ei01,ei02,ei03对时间的导数,
Figure BDA0003113218180000101
为位置观测误差函数,
Figure BDA0003113218180000102
为扩张动力学的观测值。
步骤1043:根据所述观测误差的动力学方程和位置观测误差函数确定第二扩张状态观测模型;所述位置观测误差函数为根据观测参数的真实值与观测值确定的;所述观测参数包括所述可重构机械臂子系统的位置、速度和加速度。
在实际应用中,所述观测误差函数为
Figure BDA0003113218180000103
其中,κi是一常数。将观测误差函数带入观测误差的动力学方程得到第二扩张状态观测模型。
第二扩张状态观测模型具体为:
Figure BDA0003113218180000104
其中,sgn(eio1)为求eio1的符号。
步骤1044:基于所述处理后的状态空间表达式和所述第二扩张状态观测模型,采用比例-积分-微分控制策略确定动力学模型补偿控制力矩ui1表达式。
在实际应用中ui1的表达式为:
Figure BDA0003113218180000105
其中,kip为比例增益,xid为期望的位置轨迹,kid是微分增益。
步骤105:采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式。
步骤105具体包括:
步骤1051:将所述交联耦合项构建成径向基神经网络形式得到交联耦合项动力学辨识表达式。
在实际应用中,交联耦合项动力学辨识表达式为:
Figure BDA0003113218180000106
其中,hi为交联耦合项动力学辨识,ωi T为ωi的转置矩阵,
Figure BDA0003113218180000107
代表高斯基函数,εi是神经网络的逼近误差,cij,bij分别代表神经网络的中心以及带宽,ωi为理想神经网络的权值,exp为指数项。
步骤1052:根据所述交联耦合项动力学辨识表达式得到所述交联耦合项动力学辨识估计值表达式。
在实际应用中,步骤1052具体为:定义
Figure BDA0003113218180000111
为ωi的估计值,
Figure BDA0003113218180000112
为hi的估计值,根据交联耦合项动力学辨识表达式得到交联耦合项动力学辨识估计值表达式:
Figure BDA0003113218180000113
其中,
Figure BDA0003113218180000114
Figure BDA0003113218180000115
的转置矩阵。
步骤1053:将所述交联耦合项动力学辨识估计值表达式和所述交联耦合项动力学辨识表达式的差确定为辨识误差表达式。
在实际应用中,定义权值逼近误差为
Figure BDA0003113218180000116
所以辨识误差表达式为:
Figure BDA0003113218180000117
步骤1054:基于径向基神经网络算法根据所述辨识误差表达式得到所述交联项辨识控制力矩ui2表达式。
在实际应用中,ui2的表达式为:
Figure BDA0003113218180000118
其中sgn(ei)是求ei的符号,
Figure BDA0003113218180000119
为子系统的速度误差,ηi,λi为一常数,
Figure BDA00031132181800001110
为期望的加速度。
步骤106:对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式。
步骤106具体包括:
步骤1061:采用神经网络对所述代价函数进行逼近得到近似代价函数。
在实际应用中,步骤1061具体为利用单层神经网络来表示近似代价函数Ji(ei),用神经网络对代价函数逼近处理得到近似代价函数:
Figure BDA00031132181800001111
其中,
Figure BDA00031132181800001112
为神经网络理想的权重,
Figure BDA00031132181800001113
为wiF的转置矩阵,Ni是隐含层神经元的个数,σiF(ei)表示激活函数,εiF表示评判神经网络对应的逼近误差。
步骤1062:采用所述神经网络对所述近似代价函数进行逼近得到估计代价函数。
由于理想的权值向量wiF未知,所以在实际应用中,步骤1062具体为由评判神经网络对Ji(ei)可以逼近得到估计代价函数:
Figure BDA0003113218180000121
其中,
Figure BDA0003113218180000122
表示为Ji(ei)的估计值,
Figure BDA0003113218180000123
Figure BDA0003113218180000124
的转置矩阵,
Figure BDA0003113218180000125
为wiF的逼近值在自适应动态规划中对性能指标函数逼近的神经网络叫评判网络
步骤1063:对所述估计代价函数进行求偏导得到估计偏导函数。
对估计代价函数
Figure BDA0003113218180000126
求偏导数可以得到估计偏导函数:
Figure BDA0003113218180000127
步骤1064:根据所述估计偏导函数和所述代价函数得到最优补偿控制力矩表达式。
在实际应用中,所述步骤1064具体包括:
步骤10641:对所述代价函数取无穷小得到哈密顿函数;在实际应用中,哈密顿函数为:
Figure BDA0003113218180000128
其中,
Figure BDA0003113218180000129
为代价函数Ji(ei)的梯度,
Figure BDA00031132181800001210
为子系统的速度误差,vi为哈密顿方程的辅助向量,
Figure BDA00031132181800001211
为代价函数
Figure BDA00031132181800001212
的梯度
在实际应用中,对Ji(ei)求偏导数得到:
Figure BDA00031132181800001213
其中,
Figure BDA00031132181800001214
Figure BDA00031132181800001215
分别代表激活函数的梯度和逼近误差。根据哈密顿函数和代价函数以及估计偏导函数,哈密顿方程可以改写为:
Figure BDA0003113218180000131
其中,eiJh是由评判网络逼近误差而得到的残差,
Figure BDA0003113218180000132
为神经网络逼近误差的梯度。
步骤10642:对所述哈密顿函数取最小控制力矩得到哈密顿-雅克比-贝克曼方程。
在实际应用中,哈密顿-雅克比-贝克曼方程具体为:
Figure BDA0003113218180000133
步骤10643:根据所述哈密顿-雅克比-贝克曼方程和所述估计偏导函数得到最优补偿控制力矩表达式。
在实际应用中,步骤10643具体为将估计偏导函数和哈密顿-雅克比-贝克曼方程结合,得到最优补偿控制力矩
Figure BDA0003113218180000134
表达式:
Figure BDA0003113218180000135
其中训练和调整评判网络的权值信息
Figure BDA0003113218180000136
采用目标函数
Figure BDA0003113218180000137
Figure BDA0003113218180000138
训练来得到最小值,且神经网络的权值通过梯度下降法
Figure BDA0003113218180000139
来进行更新,其中,
Figure BDA00031132181800001310
为权值更新律是对
Figure BDA00031132181800001311
求导得到的,αiF表示评价神经网络的学习速率。
步骤107:根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
在实际应用中,所述最终控制力矩表达式,具体为:
Figure BDA00031132181800001312
其中,ui *表示第i个可重构机械臂子系统的最终控制力矩,kip表示比例增益,xid表示第i个可重构机械臂子系统的期望位置,
Figure BDA00031132181800001313
表示第i个可重构机械臂子系统的位置的观测值,kid表示微分增益,
Figure BDA0003113218180000141
表示第i个可重构机械臂子系统的速度的观测值,
Figure BDA0003113218180000142
表示第i个可重构机械臂子系统的加速度的观测值,λi表示第一系数,
Figure BDA0003113218180000143
表示第i个可重构机械臂子系统的速度误差,
Figure BDA0003113218180000144
表示交联耦合项动力学辨识的估计值,
Figure BDA0003113218180000145
表示第i个可重构机械臂子系统的期望加速度,ηi表示第二系数,sgn(ei)表示第i个可重构机械臂子系统的位置误差的符号,kqwei表示第三系数,Ri表示第四系数,gi T表示控制输入矩阵的梯度,
Figure BDA0003113218180000146
表示激活函数的梯度的转置矩阵,
Figure BDA0003113218180000147
表示权值。
如图3所示,本实施例还提供了一种与上述方法对应的可重构机械臂子系统的控制系统,所述系统包括:
动力学模型构建模块A1,用于基于可重构机械臂子系统的基础参数构建动力学模型;所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩。
状态空间表达式确定模块A2,用于根据所述动力学模型确定所述动力学模型的状态空间表达式。
代价函数确定模块A3,用于基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数;所述效用函数为根据所述位置和所述控制力矩建立的。
动力学模型补偿控制力矩表达式确定模块A4,用于采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式。
交联项辨识控制力矩表达式确定模块A5,用于采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式。
最优补偿控制力矩表达式确定模块A6,用于对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式。
最终控制力矩表达式确定模块A7,用于根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
本发明有以下技术效果:
1、本发明对自适应动态规划法进行改进通过可重构机械臂动力学模型,提出了评判-观测结构的最优力/位置控制方法,针对可重构机械臂的力/位置最优控制问题进行求解,具体表现为采用了扩张状态观测器以及径向基神经网络对未知系统的动力学模型进行观测以及交联耦合项进行补偿,将现有控制方法机器人位置、速度以及力的跟踪精度低的问题得到解决,保证了系统在未知环境约束的情况下有较高的跟踪精度,达到了轨迹以及力的精确控制,在位置与力的跟踪方面,加快了机械臂系统的跟踪速度。
2、在神经网络训练方面,本发明通过在线策略迭代的方法可以加快神经网络的收敛速度。
3、在控制力矩方面由于自适应规划的缘故,本发明的控制力矩更加柔顺并且适中,不仅可以保持系统大范围渐进稳定,而且降低了每个可重构机械臂子系统的能量消耗。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种可重构机械臂子系统的控制方法,其特征在于,包括:
基于可重构机械臂子系统的基础参数构建动力学模型;所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩;
根据所述动力学模型确定所述动力学模型的状态空间表达式;
基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数;所述效用函数为根据所述位置和所述控制力矩建立的;
采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式;
采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式;
对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式;
根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
2.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式,具体包括:
基于扩张状态观测器的构建方法,对所述状态空间表达式进行处理得到处理后的状态空间表达式;
根据所述处理后的状态空间表达式构造第一扩张状态观测模型;
根据所述处理后的状态空间表达式和所述第一扩张状态观测模型确定观测误差的动力学方程;
根据所述观测误差的动力学方程和位置观测误差函数确定第二扩张状态观测模型;所述位置观测误差函数为根据观测参数的真实值与观测值确定的;所述观测参数包括所述可重构机械臂子系统的位置、速度和加速度;
基于所述处理后的状态空间表达式和所述第二扩张状态观测模型,采用比例-积分-微分控制策略确定动力学模型补偿控制力矩表达式。
3.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式,具体包括:
将所述交联耦合项构建成径向基神经网络形式得到交联耦合项动力学辨识表达式;
根据所述交联耦合项动力学辨识表达式得到所述交联耦合项动力学辨识估计值表达式;
将所述交联耦合项动力学辨识估计值表达式和所述交联耦合项动力学辨识表达式的差确定为辨识误差表达式;
基于径向基神经网络算法根据所述辨识误差表达式得到所述交联项辨识控制力矩表达式。
4.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述对代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式,具体包括:
采用神经网络对所述代价函数进行逼近得到近似代价函数;
采用所述神经网络对所述近似代价函数进行逼近得到估计代价函数;
对所述估计代价函数进行求偏导得到估计偏导函数;
根据所述估计偏导函数和所述代价函数得到最优补偿控制力矩表达式。
5.根据权利要求4所述的一种可重构机械臂子系统的控制方法,其特征在于,所述根据所述估计偏导函数和所述代价函数得到最优补偿控制力矩表达式,具体包括:
对所述代价函数取无穷小得到哈密顿函数;
对所述哈密顿函数取最小控制力矩得到哈密顿-雅克比-贝克曼方程;
根据所述哈密顿-雅克比-贝克曼方程和所述估计偏导函数得到最优补偿控制力矩表达式。
6.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述最终控制力矩表达式,具体为:
Figure FDA0003113218170000031
其中,ui *表示第i个可重构机械臂子系统的最终控制力矩,kip表示比例增益,xid表示第i个可重构机械臂子系统的期望位置,
Figure FDA0003113218170000032
表示第i个可重构机械臂子系统的位置的观测值,kid表示微分增益,
Figure FDA0003113218170000033
表示第i个可重构机械臂子系统的速度的观测值,
Figure FDA0003113218170000034
表示第i个可重构机械臂子系统的加速度的观测值,λi表示第一系数,
Figure FDA0003113218170000035
表示第i个可重构机械臂子系统的速度误差,
Figure FDA0003113218170000036
表示交联耦合项动力学辨识的估计值,
Figure FDA0003113218170000037
表示第i个可重构机械臂子系统的期望加速度,ηi表示第二系数,sgn(ei)表示第i个可重构机械臂子系统的位置误差的符号,kqwei表示第三系数,Ri表示第四系数,gi T表示控制输入矩阵的梯度,
Figure FDA0003113218170000038
表示激活函数的梯度的转置矩阵,
Figure FDA0003113218170000039
表示权值。
7.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述动力学模型,具体为:
Figure FDA00031132181700000310
其中,Mi(qi)表示惯性矩阵,
Figure FDA00031132181700000311
表示第i个可重构机械臂子系统的加速度,
Figure FDA00031132181700000312
表示哥氏力和离心力项,
Figure FDA00031132181700000313
表示第i个可重构机械臂子系统的速度,Gi(qi)表示重力项,
Figure FDA00031132181700000314
表示交联耦合项,Di表示模型工作环境,ui表示控制力矩,τci表示接触力矩。
8.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述动力学模型的状态空间表达式,具体为:
Figure FDA00031132181700000315
其中,
Figure FDA00031132181700000316
表示第i个可重构机械臂子系统的位置的导数,xi2表示xi的速度,
Figure FDA00031132181700000317
表示第i个可重构机械臂子系统的速度的导数,fi(xi1,xi2)表示可重构机械臂子系统的飘移动力学,gi(xi1)表示可重构机械臂子系统的控制输入矩阵,ui表示控制力矩,τci表示接触力矩,hi(x)表示交联耦合函数,di表示状态空间工作环境,yi表示第i个可重构机械臂子系统的输出,xi表示第i个可重构机械臂子系统的状态,xi1表示第i个可重构机械臂子系统的位置。
9.根据权利要求1所述的一种可重构机械臂子系统的控制方法,其特征在于,所述动力学模型的代价函数,具体为:
Figure FDA0003113218170000041
其中,Ji(ei)表示动力学模型的代价函数,βi,表示第一代价函数系数,TdM表示模型工作环境的上界,Ni(ei,ui)表示效用函数,Υi表示第二代价函数系数,
Figure FDA0003113218170000042
表示最优代价函数的梯度,ui表示控制力矩,Ψ(Ω)表示控制策略集合。
10.一种可重构机械臂子系统的控制系统,其特征在于,包括:
动力学模型构建模块,用于基于可重构机械臂子系统的基础参数构建动力学模型;所述基础参数包括加速度、速度、交联耦合项、模型工作环境、控制力矩和接触力矩;
状态空间表达式确定模块,用于根据所述动力学模型确定所述动力学模型的状态空间表达式;
代价函数确定模块,用于基于所述可重构机械臂子系统的效用函数和控制策略确定所述动力学模型的代价函数;所述效用函数为根据所述位置和所述控制力矩建立的;
动力学模型补偿控制力矩表达式确定模块,用于采用扩张状态观测器对所述状态空间表达式进行观测得到动力学模型补偿控制力矩表达式;
交联项辨识控制力矩表达式确定模块,用于采用神经网络对所述交联耦合项进行补偿得到交联项辨识控制力矩表达式;
最优补偿控制力矩表达式确定模块,用于对所述代价函数依次采用逼近和求偏导的处理方法得到最优补偿控制力矩表达式;
最终控制力矩表达式确定模块,用于根据所述动力学模型补偿控制力矩表达式、所述交联项辨识控制力矩表达式和所述最优补偿控制力矩表达式确定最终控制力矩表达式,并根据所述最终控制表达式对所述可重构机械臂子系统进行控制。
CN202110654378.3A 2021-06-11 2021-06-11 一种可重构机械臂子系统的控制方法及系统 Withdrawn CN113370208A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110654378.3A CN113370208A (zh) 2021-06-11 2021-06-11 一种可重构机械臂子系统的控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110654378.3A CN113370208A (zh) 2021-06-11 2021-06-11 一种可重构机械臂子系统的控制方法及系统

Publications (1)

Publication Number Publication Date
CN113370208A true CN113370208A (zh) 2021-09-10

Family

ID=77574033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110654378.3A Withdrawn CN113370208A (zh) 2021-06-11 2021-06-11 一种可重构机械臂子系统的控制方法及系统

Country Status (1)

Country Link
CN (1) CN113370208A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114093433A (zh) * 2021-11-29 2022-02-25 江南大学 基于观测器的精馏过程单吨能耗预报精度评价方法及系统
CN114310914A (zh) * 2022-02-15 2022-04-12 南开大学 多自由度机械臂模糊自适应迭代轨迹跟踪控制方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114093433A (zh) * 2021-11-29 2022-02-25 江南大学 基于观测器的精馏过程单吨能耗预报精度评价方法及系统
CN114093433B (zh) * 2021-11-29 2022-05-13 江南大学 基于观测器的精馏过程单吨能耗预报精度评价方法及系统
CN114310914A (zh) * 2022-02-15 2022-04-12 南开大学 多自由度机械臂模糊自适应迭代轨迹跟踪控制方法及系统
CN114310914B (zh) * 2022-02-15 2024-05-07 南开大学 多自由度机械臂模糊自适应迭代轨迹跟踪控制方法及系统

Similar Documents

Publication Publication Date Title
CN109940622B (zh) 一种基于电机电流的机器人机械臂无传感碰撞检测方法
Wu et al. Adaptive fractional-order non-singular terminal sliding mode control based on fuzzy wavelet neural networks for omnidirectional mobile robot manipulator
Rigatos Model-based and model-free control of flexible-link robots: A comparison between representative methods
Singh et al. Stability analysis of robust adaptive hybrid position/force controller for robot manipulators using neural network with uncertainties
CN110647042A (zh) 一种基于数据驱动的机器人鲁棒学习预测控制方法
CN112904728A (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
CN111880412B (zh) 基于单评判网络的可重构机器人零和神经最优控制方法
CN113370208A (zh) 一种可重构机械臂子系统的控制方法及系统
CN111872937B (zh) 一种任务空间中不确定机械臂的控制方法
CN116460860B (zh) 一种基于模型的机器人离线强化学习控制方法
Sun Kinematics model identification and motion control of robot based on fast learning neural network
Zhao et al. Model accelerated reinforcement learning for high precision robotic assembly
CN113359444B (zh) 基于神经网络的挠性航天器刚柔耦合特性智能辨识方法
Dong et al. Terminal sliding mode attitude tracking control for unmanned vehicle with predefined-time stability
CN115933647B (zh) 基于复合控制算法的omr轨迹跟踪控制方法及存储介质
Luo et al. End‐Effector Pose Estimation in Complex Environments Using Complementary Enhancement and Adaptive Fusion of Multisensor
CN114211478B (zh) 一种模块化机械臂协调操作最优控制方法及系统
Nawrocka et al. Neural network control for robot manipulator
CN110515299B (zh) 一种星-臂耦合系统的主星姿态解耦预报方法及系统
Lu et al. Active task design in adaptive control of redundant robotic systems
Fei et al. Adaptive global fast terminal sliding mode control of MEMS gyroscope using fuzzy-neural-network
CN114186477A (zh) 一种基于Elman神经网络的轨道预测算法
CN114406996A (zh) 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统
CN112380655A (zh) 一种基于rs-cmsa算法的机器人逆运动学求解方法
Wang et al. Neural networks‐based adaptive robust control of crawler‐type mobile manipulators using sliding mode approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210910

WW01 Invention patent application withdrawn after publication