CN106406098A - 一种机器人系统在未知环境下的人机交互控制方法 - Google Patents
一种机器人系统在未知环境下的人机交互控制方法 Download PDFInfo
- Publication number
- CN106406098A CN106406098A CN201611026105.XA CN201611026105A CN106406098A CN 106406098 A CN106406098 A CN 106406098A CN 201611026105 A CN201611026105 A CN 201611026105A CN 106406098 A CN106406098 A CN 106406098A
- Authority
- CN
- China
- Prior art keywords
- formula
- man
- robot
- adaptive
- machine interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Abstract
本发明涉及一种机器人系统在未知环境下的人机交互控制方法,在人机交互中用机器人机械臂的参考自适应来改善其参考轨迹,使其可以在未知环境下也可以满足我们所需要的人机交互性能,通过提出基于轨迹参数和反复学习的参考自适应来使其最小化,由最小化的代价函数描述轨迹追踪和力最小化,其中代价函数已被参数化,轨迹参数也被最小化,对由目标阻抗模型建立的机器人进行控制。本发明方法是一种反复学习的方法,可适用于未知环境下的机器人的遥操作,具有良好的人机交互性、实时性和准确性等优点。
Description
技术领域
本发明属于机器人遥操作领域,涉及一种机器人系统在未知环境下的人机交互控制方法。
背景技术
在遥操作系统中,人类通过人机交互界面、通信网络和远程机器人实现和远程环境的交互,实现对远端机器人的操控。该系统一方面通过操作者的介入,解决了机器人在人工智能和传感技术限制的条件下,对任务目标的确定能力和决策能力不足,无法完全自主地在复杂和未知环境下完成需要高级决策的作业任务的不足;另一方面利用机器人在操作精度、复杂任务分配和路径规划等计算方面的优势,将人的智能与机器人的精确性有机的结合起来,保证远程机器人自主地进行高精度作业的同时,减轻操作者的任务负担。
前期的研究工作表明,机器人操作的对象和环境都是已知的,操作对象都以确定的合作目标为主。但是对于抓捕、捕获,甚至对敌方航天器的破坏等攻击活动,因为操作对象和环境都是未知的,所以以往的控制系统都不能很好地进行控制。因此,设计基于参考自适应的控制系统,结合机器人和环境之间的轨迹误差和相互作用力,使用代价函数构建交互性能。设计基于参考自适应的在未知环境下的人机交互控制方法十分必要。
已有的方法包括混合力/位置控制系统和阻抗控制系统,根据混合力/位置的系统结构进行控制较为简单,不能解决较为复杂的未知环境下的任务。采用阻抗控制系统结构,机器人的运动通过来自环境的力进行控制,但是如何获取一个阻抗模型和一个最优参考轨迹从而达到人们对人机交互的性能要求,并不容易。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种机器人系统在未知环境下的人机交互控制方法,针对在未知环境中的机器人的人机交互控制方法的问题,可用于对目标的抓取等操作中。
技术方案
一种机器人系统在未知环境下的人机交互控制方法,其特征在于步骤如下:
步骤1:结合轨迹追踪误差和人机之间的相互作用力,用代价函数V定义将要评价的期望的交互性能:
式中,t0和tf分别表示起始和终止时间,X(t)是给定的任务轨迹,Q表示半正定矩阵,R表示正定矩阵;
步骤2:设计一个自适应规律来更新机器人的参考轨迹,在一个反复迭代规则下使代价函数最小化:
自适应规律:θj+1=θj+γj(V*-V(θj))
式中,θ是轨迹参数,γ是j次迭代的自适应率;
所述反复迭代规则:
步骤3:建立基于笛卡尔空间下的自适应阻抗控制律:
以自适应阻抗控制律进行交互控制。
所述步骤1中,所要研究的系统描述和控制目标如下:
1-1):机器人机械臂的运动学方程:
X(t)=φ(q(t)) (1)
式中,是笛卡尔空间下的机械臂位置,是相对应的关节空间下的机械臂位置,nC是笛卡尔空间的大小,n是机器人的自由度。对时间t求导,得到
式中,是雅克比矩阵,再对时间t求导,得到
因此,得到机械臂关节空间的动力学表达式
式中,是惯性矩阵,表示哥式力和离心力,表示重力,表示控制输入,表示与环境的相互作用力。将式(1)、(2)和(3)带入式(4),得到在笛卡尔坐标系下的机械臂动力学方程
其中,
MR(q(t))=J-T(q(t))M(q(t))J-T(q(t))
GR(q(t))=J-T(q(t))G(q(t))
u(t)=J-T(q(t))τ(t)
1-2):式(5)的机械臂动力学方程采用一个目标阻抗模型,可表示为:
式中,MD、CD和GD分别是期望的惯性矩阵、阻尼矩阵和刚体矩阵,Xr(t)是参考轨迹。
系统的另一部分是机器人与环境之间的相互作用关系,不失一般性的,所采用的环境模型可以是
式中,ME、CE和GE分别是未知环境的惯性矩阵、阻尼矩阵和刚体矩阵。
1-3):所采用的代价函数为
式中,t0和tf分别表示起始和终止时间,X(t)是给定的任务轨迹,Q表示半正定矩阵,R表示正定矩阵。通过求V的最小值,轨迹追踪和最小相互作用力之间的平衡可以得到,期望的相互作用性能可以满足要求。
所述步骤2中,具体的自适应控制率的构造方法如下:
2-1)将代价函数参数化,根据式(6)和(7),可以得到
机械臂的实际轨迹X(t)可以基于Xr(t)获得,也可用X(θ)表示,其中θ是轨迹参数,从环境模型(7)可以看出,相互作用力F(t)也可以基于X(θ)获得,因此也可以用F(θ)表示。显然,式(8)中的代价函数V也可以由轨迹参数θ决定。所以,现在目标变为,寻求使代价函数V(θ)最小的最优的θ集,即
2-2)为了获得θ*,设计了一个自适应率,构造一个变换
V*-V(θj+1)=λ(V*-V(θj)) (11)
式中,V*=V(θ*)表示V(θ)的最小值,j为迭代指数,λ是收敛率。为了得到式(11)的变换,一个简单的自适应率被设计如下
θj+1=θj+γj(V*-V(θj)) (12)
式中,和是j次迭代的自适应率,定义梯度
因此,可以得到
式中,只要最小代价函数的收敛性将可以实现。
然而,自适应率中的V*是未知的,为了避免这个局限性,对自适应率进行了修改
θj+1=θj-σjV(θj) (15)
式中,是新的自适应率,则构造的变换变为
将式(15)带入(16)得
其中,新的自适应率σj需要满足
2-3)σj的选择依赖于当完全已知的时候,σj可按以下方程选取
可加速收敛过程。
为了加速自适应过程,梯度部分可以使用之前的代价函数和参数进行估计,如下
以上过程,通过学习得到梯度g(θ),受未知环境限制的期望的交互性能可以得到满足。
所述步骤3中,设计自适应阻抗控制在笛卡尔坐标系下的具体方法如下:
定义阻抗误差:
式中,和选择两个满足Λ+Γ=KC和ΛΓ=KG的正定矩阵,定义滤波辅助变量Xl(t),则
式(20)可重新写为
通过定义另一个阻抗误差
可得到以下方程式
根据式(24),如果且存在,因为Λ是正定的,则有因此,自适应阻抗控制的目标为
考虑式(23),式(5)可重写写为
其中,Xv(t)=-ΓX(t)+Xl(t)
除此之外,还可以得到
在笛卡尔坐标下,提出一个自适应阻抗控制,如下
其中,K是正定矩阵,采用以下方程进行校正
式中,是Ψ的估计值。
综合以上步骤,首先,基于相互作用性能V(θ)在笛卡尔坐标下生成参考轨迹Xr(t);其次,采用目标阻抗模型,自适应阻抗控制被应用于机器人动力学模型。
有益效果
本发明提出的一种机器人系统在未知环境下的人机交互控制方法,在人机交互中用机器人机械臂的参考自适应来改善其参考轨迹,使其可以在未知环境下也可以满足我们所需要的人机交互性能,通过提出基于轨迹参数和反复学习的参考自适应来使其最小化,由最小化的代价函数描述轨迹追踪和力最小化,其中代价函数已被参数化,轨迹参数也被最小化,对由目标阻抗模型建立的机器人进行控制。
本发明方法是一种反复学习的方法,可适用于未知环境下的机器人的遥操作,具有良好的人机交互性、实时性和准确性等优点。与现有技术相比,本发明具有如下有益效果:
1.远程操作更精准,执行任务更容易
本发明基于参考自适应技术,使用参数化的代价函数对参数进行最小化,解决了以往控制方法精度不高的问题。
2.可以在未知环境中进行操控,满足人机交互性能
3.计算量小,计算速度快,能够满足实时性要求
附图说明
图1为本发明的控制流程意图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
步骤一:建立机器人机械臂的运动学方程:
X(t)=φ(q(t)) (30)
式中,是笛卡尔空间下的机械臂的位置,是相对应的关节空间下的机械臂的位置,nC是笛卡尔空间的大小,n是机器人的自由度。对时间t微分,得到
式中,是雅克比矩阵,再对时间t求导,得到
因此,机械臂关节空间的动力学表达式为
式中,是惯性矩阵,表示哥式力和离心力,表示重力,表示控制输入,表示与环境的相互作用力。将式(30)、式(31)和式(32)带入式(33),得到在笛卡尔坐标系下的机械臂动力学方程
其中,
MR(q(t))=J-T(q(t))M(q(t))J-T(q(t))
GR(q(t))=J-T(q(t))G(q(t))
u(t)=J-T(q(t))τ(t)
式(34)的机械臂动力学方程采用一个目标阻抗模型,可表示为:
式中,MD、CD和GD分别是期望的惯性矩阵、阻尼矩阵和刚体矩阵,Xr(t)是参考轨迹。
步骤二:系统的另一部分是机器人与环境之间的相互作用关系,不失一般性的,所采用的环境模型可以是
式中,ME、CE和GE分别是未知环境的惯性矩阵、阻尼矩阵和刚体矩阵。
步骤三:设计一个代价函数
式中,t0和tf分别表示起始和终止时间,X(t)是给定的任务轨迹,Q表示半正定矩阵,R表示正定矩阵。通过求V的最小值,轨迹追踪和最小相互作用力之间的平衡可以得到,期望的相互作用性能可以满足要求。
步骤四:将代价函数参数化,根据式(35)和式(36),可以得到
机械臂的实际轨迹X(t)可以基于Xr(t)获得,也可用X(θ)表示,其中θ是轨迹参数,从环境模型式(36)可以看出,相互作用力F(t)也可以基于X(θ)获得,因此也可以用F(θ)表示。显然,式(37)中的代价函数V也可以由轨迹参数θ决定。所以,现在目标变为,寻求使代价函数V(θ)最小的最优的θ集,即
步骤五设计了一个自适应率,构造一个变换
V*-V(θj+1)=λ(V*-V(θj)) (40)
式中,V*=V(θ*)表示V(θ)的最小值,j为迭代指数,λ是收敛率。为了得到式(40)的变换,一个简单的自适应率被设计如下
θj+1=θj+γj(V*-V(θj)) (41)
式中,和是j次迭代的自适应率,定义梯度
因此,可以得到
式中,只要最小代价函数的收敛性将可以实现。
步骤六:然而,自适应率中的V*是未知的,为了避免这个局限性,对自适应率进行了修改
θj+1=θj-σjV(θj) (44)
式中,是新的自适应率,则构造的变换变为
将式(44)带入式(45)得
其中,新的自适应率σj需要满足
σj的选择依赖于当完全已知的时候,σj可按以下方程选取
可加速收敛过程。
为了加速自适应过程,梯度部分可以使用之前的代价函数和参数进行估计,如下
以上过程,通过学习得到梯度g(θ),受未知环境限制的期望的交互性能可以得到满足。
步骤七:定义阻抗误差:
式中,和选择两个满足Λ+Γ=KC和ΛΓ=KG的正定矩阵,定义滤波辅助变量Xl(t),则
式(49)可重新写为
通过定义另一个阻抗误差
可得到以下方程式
根据式(53),如果且存在,因为Λ是正定的,则有因此,自适应阻抗控制的目标为
考虑式(52),式(34)可重写写为
其中,Xv(t)=-ΓX(t)+Xl(t)
除此之外,还可以得到
步骤八:在笛卡尔坐标下,提出一个自适应阻抗控制,如下
其中,K是正定矩阵,采用以下方程进行校正
式中,是Ψ的估计值。
Claims (1)
1.一种机器人系统在未知环境下的人机交互控制方法,其特征在于步骤如下:
步骤1:结合轨迹追踪误差和人机之间的相互作用力,用代价函数V定义将要评价的期望的交互性能:
式中,t0和tf分别表示起始和终止时间,X(t)是给定的任务轨迹,Q表示半正定矩阵,R表示正定矩阵;
步骤2:设计一个自适应规律来更新机器人的参考轨迹,在一个反复迭代规则下使代价函数最小化:
自适应规律:θj+1=θj+γj(V*-V(θj))
式中,θ是轨迹参数,γ是j次迭代的自适应率;
所述反复迭代规则:
步骤3:建立基于笛卡尔空间下的自适应阻抗控制律:
以自适应阻抗控制律进行交互控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611026105.XA CN106406098B (zh) | 2016-11-22 | 2016-11-22 | 一种机器人系统在未知环境下的人机交互控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611026105.XA CN106406098B (zh) | 2016-11-22 | 2016-11-22 | 一种机器人系统在未知环境下的人机交互控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106406098A true CN106406098A (zh) | 2017-02-15 |
CN106406098B CN106406098B (zh) | 2019-04-19 |
Family
ID=58069128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611026105.XA Active CN106406098B (zh) | 2016-11-22 | 2016-11-22 | 一种机器人系统在未知环境下的人机交互控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106406098B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107179683A (zh) * | 2017-04-01 | 2017-09-19 | 浙江工业大学 | 一种基于神经网络的交互机器人智能运动检测与控制方法 |
CN107553485A (zh) * | 2017-07-13 | 2018-01-09 | 西北工业大学 | 一种人机交互过程中动态虚拟夹具的生成方法 |
CN107748496A (zh) * | 2017-09-25 | 2018-03-02 | 北京邮电大学 | 基于参数自适应调节的阻抗控制器算法 |
CN108153153A (zh) * | 2017-12-19 | 2018-06-12 | 哈尔滨工程大学 | 一种学习变阻抗控制系统及控制方法 |
CN109062032A (zh) * | 2018-10-19 | 2018-12-21 | 江苏省(扬州)数控机床研究院 | 一种基于近似动态逆的机器人pid变阻抗控制方法 |
CN110103225A (zh) * | 2019-06-04 | 2019-08-09 | 兰州大学 | 一种数据驱动的机械臂重复运动控制方法与装置 |
CN112428278A (zh) * | 2020-10-26 | 2021-03-02 | 北京理工大学 | 机械臂的控制方法、装置及人机协同模型的训练方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306029A (zh) * | 2011-08-08 | 2012-01-04 | 东南大学 | 一种基于康复训练机器人的阻抗自适应的运动控制方法 |
US8406989B1 (en) * | 2009-02-13 | 2013-03-26 | Hrl Laboratories, Llc | Method for adaptive obstacle avoidance for articulated redundant robot arm |
CN105242533A (zh) * | 2015-09-01 | 2016-01-13 | 西北工业大学 | 一种融合多信息的变导纳遥操作控制方法 |
-
2016
- 2016-11-22 CN CN201611026105.XA patent/CN106406098B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8406989B1 (en) * | 2009-02-13 | 2013-03-26 | Hrl Laboratories, Llc | Method for adaptive obstacle avoidance for articulated redundant robot arm |
CN102306029A (zh) * | 2011-08-08 | 2012-01-04 | 东南大学 | 一种基于康复训练机器人的阻抗自适应的运动控制方法 |
CN105242533A (zh) * | 2015-09-01 | 2016-01-13 | 西北工业大学 | 一种融合多信息的变导纳遥操作控制方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107179683A (zh) * | 2017-04-01 | 2017-09-19 | 浙江工业大学 | 一种基于神经网络的交互机器人智能运动检测与控制方法 |
CN107179683B (zh) * | 2017-04-01 | 2020-04-24 | 浙江工业大学 | 一种基于神经网络的交互机器人智能运动检测与控制方法 |
CN107553485A (zh) * | 2017-07-13 | 2018-01-09 | 西北工业大学 | 一种人机交互过程中动态虚拟夹具的生成方法 |
CN107748496A (zh) * | 2017-09-25 | 2018-03-02 | 北京邮电大学 | 基于参数自适应调节的阻抗控制器算法 |
CN108153153A (zh) * | 2017-12-19 | 2018-06-12 | 哈尔滨工程大学 | 一种学习变阻抗控制系统及控制方法 |
CN109062032A (zh) * | 2018-10-19 | 2018-12-21 | 江苏省(扬州)数控机床研究院 | 一种基于近似动态逆的机器人pid变阻抗控制方法 |
CN109062032B (zh) * | 2018-10-19 | 2021-08-31 | 江苏省(扬州)数控机床研究院 | 一种基于近似动态逆的机器人pid变阻抗控制方法 |
CN110103225A (zh) * | 2019-06-04 | 2019-08-09 | 兰州大学 | 一种数据驱动的机械臂重复运动控制方法与装置 |
CN110103225B (zh) * | 2019-06-04 | 2023-04-11 | 兰州大学 | 一种数据驱动的机械臂重复运动控制方法与装置 |
CN112428278A (zh) * | 2020-10-26 | 2021-03-02 | 北京理工大学 | 机械臂的控制方法、装置及人机协同模型的训练方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106406098B (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106406098A (zh) | 一种机器人系统在未知环境下的人机交互控制方法 | |
CN108621158B (zh) | 一种关于机械臂的时间最优轨迹规划控制方法及装置 | |
Yuguang et al. | Dynamic modeling and adaptive fuzzy sliding mode control for multi-link underwater manipulators | |
CN102207988B (zh) | 一种多自由度机械臂高效动力学建模方法 | |
CN102795544B (zh) | 基于轨迹在线规划的桥式吊车高效消摆控制方法 | |
CN105773623A (zh) | 基于预测型间接迭代学习的scara机器人轨迹跟踪控制方法 | |
CN105772917B (zh) | 一种三关节点焊机器人轨迹跟踪控制方法 | |
CN107662211A (zh) | 一种基于量子粒子群算法的空间机器人预测控制方法 | |
CN103433924A (zh) | 串联机器人高精度位置控制方法 | |
CN107160398B (zh) | 基于确定学习的全状态受限刚性机械臂安全可靠控制方法 | |
CN103538068A (zh) | Scara机器人模糊滑模轨迹跟踪控制方法 | |
CN110376882A (zh) | 基于有限时间扩张状态观测器的预定性能控制方法 | |
CN105159306A (zh) | 一种基于全局稳定的四旋翼飞行器滑模控制方法 | |
CN110421564A (zh) | 一种基于关节能耗评估的机器人工作单元布局优化方法 | |
CN103331756A (zh) | 一种机械臂运动控制方法 | |
CN109857100B (zh) | 一种基于反演法和快速终端滑模的复合轨迹跟踪控制算法 | |
CN108527372A (zh) | 一种变刚度串联弹性驱动器的机器人关节自适应控制方法 | |
CN110673544B (zh) | 基于自适应在线学习的上肢康复机器人控制方法 | |
CN109213175A (zh) | 一种基于原对偶神经网络的移动机器人视觉伺服轨迹跟踪预测控制方法 | |
CN103399986A (zh) | 基于微分几何的空间机械臂建模方法 | |
CN108453732A (zh) | 控制体系封闭机器人自适应动态力/位置混合控制方法 | |
CN107263466A (zh) | 空间机器人基于二次规划问题的基座无扰控制方法 | |
CN103728988A (zh) | 基于内模的scara机器人轨迹跟踪控制方法 | |
Hu et al. | Adaptive variable impedance control of dual-arm robots for slabstone installation | |
CN103389650A (zh) | 四通道遥操作系统的双边未知死区自适应控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |