CN113043251B - 一种机器人示教再现轨迹学习方法 - Google Patents

一种机器人示教再现轨迹学习方法 Download PDF

Info

Publication number
CN113043251B
CN113043251B CN202110441900.XA CN202110441900A CN113043251B CN 113043251 B CN113043251 B CN 113043251B CN 202110441900 A CN202110441900 A CN 202110441900A CN 113043251 B CN113043251 B CN 113043251B
Authority
CN
China
Prior art keywords
track
teaching
robot
dynamic motion
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110441900.XA
Other languages
English (en)
Other versions
CN113043251A (zh
Inventor
万俊
张兰春
葛敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University of Technology
Original Assignee
Jiangsu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Technology filed Critical Jiangsu University of Technology
Priority to CN202110441900.XA priority Critical patent/CN113043251B/zh
Publication of CN113043251A publication Critical patent/CN113043251A/zh
Application granted granted Critical
Publication of CN113043251B publication Critical patent/CN113043251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0081Programme-controlled manipulators with master teach-in means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Numerical Control (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种机器人示教再现轨迹学习方法,其技术方案要点是:包括以下步骤:Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;Step2:建立标准位置动态运动基元模型;Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;Step4:基于局部加权回归方法对示教轨迹进行学习;本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。

Description

一种机器人示教再现轨迹学习方法
技术领域
本发明涉及机器人轨迹学习领域,特别涉及一种机器人示教再现轨迹学习方法。
背景技术
目前,工业机器人虽然能够显著提高工业制造效率,但是仍然需要精确的编程,每个任务都被分解成一系列动作。该方法不能够从任务学习中得到经验,也不具有灵活性,若机器人末端任务稍微发生改变,机器人控制系统都需要重新编程,降低了机器人编程效率和机器人适应性。演示编程,也就是直接示教,似乎是解决这个问题非常有效的方法。在直接示教过程中,机器人基于操作者拖拽运动记录末端任务轨迹。动态系统常用来学习泛化机器人记录后的演示轨迹,即在给定系统初始状态、目标状态和示教轨迹,通过在线求解微分方程自动生成机器人的运动,用于复现相同的机器人示教轨迹。常用的动态系统方法有动态运动基元方法。
考虑到动态运动基元模型中的相变量基于指数函数单调递减,导致动态运动基元中的强迫函数在时间尺度上非均匀分布,收敛速度慢,由速度积分得到的位置误差大。Samantetal.提出相变量线性化,使得强迫函数在时间尺度上均匀分布,提高收敛精度。此外,Dimeasetal.,Kastritsietal.和Papageorgiouetal.分别基于人工势场原理建立了虚拟夹具方法,在位置动态运动基元输出的每个点上赋予吸引力,以此提高交互位置跟踪精度。但是,这中方法只能适用示教点数少的情况,否则耗时,增加系统计算负担。因此,对位置动态运动基元模型的改进,提高其收敛速度和收敛精度,是成功应用在机器人示教再现的关键所在。
发明内容
针对背景技术中提到的问题,本发明的目的是提供一种机器人示教再现轨迹学习方法,以解决背景技术中提到的问题。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种机器人示教再现轨迹学习方法,包括以下步骤:
Stepl:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
Step2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化。
较佳的,所述Step1中,所述机器人末端示教轨迹
Figure GDA0004232649580000021
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure GDA0004232649580000022
其中,
Figure GDA0004232649580000023
分别表示机器人末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
较佳的,所述Step2中,所述位置动态运动基元为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元包括转换系统函数和规范系统函数,所述转换系统函数定义为:
Figure GDA0004232649580000024
Figure GDA0004232649580000025
所述规范系统函数定义为:
Figure GDA0004232649580000031
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为位置动态运动基元非线性强迫函数。
较佳的,所述非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure GDA0004232649580000032
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure GDA0004232649580000033
i=1,…,Nw
Figure GDA0004232649580000034
为决定位置动态运动基元模型输出轨迹形状的惯性参数。
较佳的,所述Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,所述虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure GDA0004232649580000035
其中,
Figure GDA0004232649580000041
分别为型值点处的位置、速度和采样时刻点。
较佳的,所述Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的所述型值点处势场能量
Figure GDA0004232649580000042
为:
Figure GDA0004232649580000043
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure GDA0004232649580000044
为型值点处刚度因子;dt为采样周期;刚度因子/>
Figure GDA0004232649580000045
越大,第i个型值点/>
Figure GDA0004232649580000046
对pDMP吸引力越大;
B.采用高斯内核函数表示所述型值点处势场能量,即:
Figure GDA0004232649580000047
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义所述NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure GDA0004232649580000048
D.求取所述总势场能量G(pDMP)的梯度函数
Figure GDA0004232649580000049
即:
Figure GDA00042326495800000410
E.所述一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure GDA0004232649580000051
其中,
Figure GDA0004232649580000052
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
较佳的,所述Step3中,用一阶滤波方法对所述的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure GDA0004232649580000053
Figure GDA0004232649580000054
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
较佳的,所述Step3中,采用局部加权回归方法对所述示教轨迹的位置惯性参数
Figure GDA0004232649580000055
进行求取进行示教轨迹学习,所述位置惯性参数/>
Figure GDA0004232649580000056
决定所述动态运动基元系统轨迹输出的形状。
较佳的,基于所述机器人直接示教轨迹
Figure GDA0004232649580000057
得到系统目标强迫函数ftarg,为:
Figure GDA0004232649580000058
寻找最优的所述位置惯性参数
Figure GDA0004232649580000059
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure GDA0004232649580000061
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述轨迹学习位置惯性参数
Figure GDA0004232649580000062
Figure GDA0004232649580000063
i=1,2,…,Nw,j=x,y,z;
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Πi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure GDA0004232649580000064
其中,L,Πi为位置惯性参数辅助中间变量;
Figure GDA0004232649580000065
为采样时的目标位置。
综上所述,本发明主要具有以下有益效果:
本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。
附图说明
图1为本发明的方法流程图;
图2为本发明中机器人仿真门字型轨迹;
图3为本发明中标准位置动态运动基元方法的径向基函数在x轴方向位移分布图;
图4为本发明中仿真误差结果图;
图5为本发明中改进位置动态运动基元的型值点高斯内核函数在x轴方向位移分布图;
图6为本发明中改进位置动态运动基元的型值点高斯内核函数在y轴方向位移分布图;
图7为本发明中改进位置动态运动基元模型机器人轨迹学习泛化仿真结果图;
图8为本发明中泛化轨迹1机器人关节角度曲线仿真结果图;
图9为本发明中泛化轨迹2机器人关节角度曲线仿真结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参考图1至图9,一种机器人示教再现轨迹学习方法,包括以下步骤:
Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
St ep2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化。
较佳的,Step1中,机器人末端示教轨迹
Figure GDA0004232649580000071
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure GDA0004232649580000081
其中,
Figure GDA0004232649580000082
分别表示机器人末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
其中,Step2中,位置动态运动基元为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元包括转换系统函数和规范系统函数,转换系统函数定义为:
Figure GDA0004232649580000083
Figure GDA0004232649580000084
规范系统函数定义为:
Figure GDA0004232649580000085
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为位置动态运动基元非线性强迫函数。
其中,非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure GDA0004232649580000086
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure GDA0004232649580000091
i=1,…,Nw
Figure GDA0004232649580000092
为决定位置动态运动基元模型输出轨迹形状的惯性参数。
其中,Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure GDA0004232649580000093
其中,
Figure GDA0004232649580000094
分别为型值点处的位置、速度和采样时刻点。
其中,Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的型值点处势场能量
Figure GDA0004232649580000095
为:
Figure GDA0004232649580000096
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure GDA0004232649580000097
为型值点处刚度因子;dt为采样周期;刚度因子/>
Figure GDA0004232649580000098
越大,第i个型值点/>
Figure GDA0004232649580000099
对pDMP吸引力越大;
B.采用高斯内核函数表示型值点处势场能量,即:
Figure GDA00042326495800000910
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure GDA0004232649580000101
D.求取总势场能量G(pDMP)的梯度函数
Figure GDA0004232649580000102
即:
Figure GDA0004232649580000103
E.一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure GDA0004232649580000104
其中,
Figure GDA0004232649580000105
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
其中,Step3中,用一阶滤波方法对的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure GDA0004232649580000106
Figure GDA0004232649580000107
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
其中,Step3中,采用局部加权回归方法对示教轨迹的位置惯性参数
Figure GDA0004232649580000108
进行求取进行示教轨迹学习,位置惯性参数/>
Figure GDA0004232649580000111
决定动态运动基元系统轨迹输出的形状。
其中,基于所述机器人直接示教轨迹
Figure GDA0004232649580000112
得到系统目标强迫函数ftarg,为:
Figure GDA0004232649580000113
寻找最优的所述位置惯性参数
Figure GDA0004232649580000114
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure GDA0004232649580000115
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述轨迹学习位置惯性参数
Figure GDA0004232649580000116
Figure GDA0004232649580000117
i=1,2,…,Nw,j=x,y,z;
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Πi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure GDA0004232649580000118
其中,L,Πi为位置惯性参数辅助中间变量;
Figure GDA0004232649580000119
为采样时的目标位置。
其中,本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。
实施例2
一种机器人示教再现轨迹学习方法,包括:首先记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;建立标准位置动态运动基元模型;建立基于虚拟点势场函数的改进位置动态运动基元模型;最后,基于局部加权回归方法对示教轨迹进行学习泛化。
一、记录保存机器人末端示教轨迹
Figure GDA0004232649580000121
机器人末端示教轨迹
Figure GDA0004232649580000122
可以由机器人直接示教系统采集,经过系统滤波,得到连续平滑的轨迹,其定义为:
Figure GDA0004232649580000123
其中,
Figure GDA0004232649580000124
分别表示机器人末端示教轨迹的位置,速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
二、建立标准位置动态运动基元模型:
标准位置动态运动基元模型主要定义为:
Figure GDA0004232649580000125
Figure GDA0004232649580000126
Figure GDA0004232649580000127
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,为示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;pe为示教轨迹终点;fp(xs)为位置动态运动基元非线性强迫函数。
非线性强迫函数fp(xs)由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure GDA0004232649580000131
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure GDA0004232649580000132
i=1,…,Nw
Figure GDA0004232649580000133
为位置惯性参数。
三、建立基于虚拟点势场函数的改进位置动态运动基元模型:
改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数,以此提高轨迹收敛精度。虚拟点为示教轨迹中少数的NIM个示教点,定义为型值点,其记录信息表示为:
Figure GDA0004232649580000134
其中,
Figure GDA0004232649580000135
分别为型值点处的位置,速度和采样时刻点。
改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的型值点处势场能量
Figure GDA0004232649580000136
为:
Figure GDA0004232649580000137
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure GDA0004232649580000141
为型值点处刚度因子;dt为采样周期。可以看出,刚度因子/>
Figure GDA0004232649580000142
越大,第i个型值点/>
Figure GDA0004232649580000143
对pDMP吸引力越大。
B.采用高斯内核函数表示型值点处势场能量,即:
Figure GDA0004232649580000144
其中,σDMP为型值点势场能量高斯内核函数分布宽度。
C.定义NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure GDA0004232649580000145
D.求取总势场能量G(pDMP)的梯度函数
Figure GDA0004232649580000146
即:
Figure GDA0004232649580000147
E.一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure GDA0004232649580000148
其中,
Figure GDA0004232649580000149
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
采用一阶滤波方法对的改进位置动态运动基元模型的位置转换系统函数进行改进,避免初始时刻速度不连续,即:
Figure GDA0004232649580000151
Figure GDA0004232649580000152
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
其具体算法过程说明如下:
为了更容易体现标准位置动态运动基元模型方法和改进位置动态运动基元模型方法的性能差异,设定机器人末端示教轨迹为门字型轨迹,如图2所示中的虚线轨迹,P1=[0,0]Tmm,P2=[0,100]Tmm,P3=[200,100]Tmm,P4=[200,-20]Tmm,P1→P2→P3→P4,机器人示教轨迹记录保存为
Figure GDA0004232649580000153
轨迹上升初始时间为tu=0s,轨迹水平运动初始时间为th=0.35s,轨迹下降运动初始时间为td=0.96s。其余参数如下:
αz=36,βz=9,αx=7.2,αgp=12,τT=Tdemo,Nw=25,px0=0mm,pxe=200mm,py0=0mm,pye=-20mm。
图3所示为标准位置动态运动基元方法中的径向基函数Φi(xs)在x轴方向位移的分布图。从图中可以看出,Φi(xs)在位移方向上分布不均,多数集中在位移前一小段,导致的非线性强迫函数fp(xs)在x轴方向比例系数Dp,x=pxe-px0放大下不能够精确逼近示教轨迹
Figure GDA0004232649580000154
因此,标准位置动态运动基元模型输出的x轴位移相对示教轨迹/>
Figure GDA0004232649580000155
有明显的位置误差。同理,标准位置动态运动基元模型方法在y轴方向位移相对示教轨迹/>
Figure GDA0004232649580000156
亦有显著的位置误差。如图4所示,标准位置动态运动基元模型输出轨迹在x轴和y轴方向最大位置误差分别为max(Δxdmp)=4.841mm,max(Δydmp)=6.197mm。
为了克服上述标准位置动态运动基元方法的缺陷,改进的位置动态运动基元模型将P1、P2、P3和P4分别设置为在x轴和y轴方向上的型值点,即xctr=[0,0,200,200]Tmm,yctr=[0,100,100,-20]Tmm。图5和图6分别为x轴和y轴方向上的型值点高斯内核函数
Figure GDA0004232649580000161
分布图。由于xctr(1)=xctr(2)=0mm,xctr(3)=xctr(4)=200mm,yctr(2)=yctr(3)=100mm,所以两者分布均呈现对称分布,且相互独立。在P1、P2、P3和P4处分别设置虚拟点虚拟势场梯度函数/>
Figure GDA0004232649580000162
依据机器人末端位置调整机器人末端轨迹,因此,相对标准位置动态运动基元方法,本发明提出的改进位置动态运动基元方法输出的轨迹位置误差小于前者方法,其中,最大位置误差分布为max(Δxmdmp)=2.594mm,max(Δymdmp)=-3.412mm,如图4所示。因此,本发明提出的改进位置动态运动基元方法相对标准位置动态运动基元方法,能够提高机器人示教轨迹复现的位置精度。
图7所示为改进位置动态运动基元模型用于机器人轨迹学习泛化仿真结果。仿真内容为对示教轨迹P1→Pm→P2的弧线轨迹进行示教轨迹学习,并对示教轨迹进行泛化。从图中可以看出,泛化轨迹1能够以小误差复现示教轨迹,其机器人关节角度平滑连续,能够稳定地控制机器人运行轨迹,如图8所示。泛化轨迹2更新了示教轨迹终点目标至P3,无需再次进行轨迹示教学习。从图7和图9中可以看出,泛化轨迹2保持泛化轨迹1形状的同时,机器人关节角度曲线平滑连续,未出现抖动。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (1)

1.一种机器人示教再现轨迹学习方法,其特征在于:包括以下步骤:
Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
Step2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化;
所述Step1中,所述机器人的末端示教轨迹
Figure FDA0004247298890000011
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure FDA0004247298890000012
其中,
Figure FDA0004247298890000013
分别表示机器人的末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目;
所述Step2中,所述标准位置动态运动基元模型为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元模型包括转换系统函数和规范系统函数,所述转换系统函数定义为:
Figure FDA0004247298890000014
Figure FDA0004247298890000015
所述规范系统函数定义为:
Figure FDA0004247298890000016
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为标准位置动态运动基元模型非线性强迫函数;
所述非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure FDA0004247298890000021
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure FDA0004247298890000022
i=1,…,Nw;/>
Figure FDA0004247298890000025
为决定标准位置动态运动基元模型输出轨迹形状的位置惯性参数;
所述Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,所述虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure FDA0004247298890000023
其中,
Figure FDA0004247298890000024
分别为型值点处的位置、速度和采样时刻点;
所述Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的所述型值点处势场能量
Figure FDA0004247298890000031
为:
Figure FDA0004247298890000032
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure FDA0004247298890000033
为型值点处刚度因子;dt为采样周期;刚度因子/>
Figure FDA0004247298890000034
越大,第i个型值点/>
Figure FDA0004247298890000035
对pDMP吸引力越大;
B.采用高斯内核函数表示所述型值点处势场能量,即:
Figure FDA0004247298890000036
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义所述NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure FDA0004247298890000037
D.求取所述总势场能量G(pDMP)的梯度函数
Figure FDA00042472988900000310
即:
Figure FDA0004247298890000038
E.所述一维空间的虚拟点势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进位置动态运动基元模型,即:
Figure FDA0004247298890000039
其中,
Figure FDA0004247298890000041
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵;
所述Step3中,用一阶滤波方法对所述的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure FDA0004247298890000042
Figure FDA0004247298890000048
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果;
所述Step3中,采用局部加权回归方法对所述位置惯性参数
Figure FDA0004247298890000043
进行求取进行示教轨迹学习;
基于所述机器人直接示教轨迹
Figure FDA0004247298890000044
得到系统目标强迫函数ftarg,为:
Figure FDA0004247298890000045
寻找最优的所述位置惯性参数
Figure FDA0004247298890000046
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure FDA0004247298890000047
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述位置惯性参数
Figure FDA0004247298890000051
Figure FDA0004247298890000052
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Пi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure FDA0004247298890000053
其中,L,Πi为位置惯性参数辅助中间变量;
Figure FDA0004247298890000054
为采样时的目标位置。
CN202110441900.XA 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法 Active CN113043251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110441900.XA CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110441900.XA CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Publications (2)

Publication Number Publication Date
CN113043251A CN113043251A (zh) 2021-06-29
CN113043251B true CN113043251B (zh) 2023-07-07

Family

ID=76520064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110441900.XA Active CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Country Status (1)

Country Link
CN (1) CN113043251B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113977580B (zh) * 2021-10-29 2023-06-27 浙江工业大学 基于动态运动原语和自适应控制的机械臂模仿学习方法
CN114549269A (zh) * 2022-01-27 2022-05-27 苏州大学 基于动态运动基元的微纳操作机器人自动拾取纳米线方法
CN115524997B (zh) * 2022-09-28 2024-05-14 山东大学 基于强化与模仿学习的机器人动态操作布料方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9381643B2 (en) * 2014-07-03 2016-07-05 GM Global Technology Operations LLC Dynamical system-based robot velocity control
CN106444738B (zh) * 2016-05-24 2019-04-09 武汉科技大学 基于动态运动基元学习模型的移动机器人路径规划方法
CN110026987B (zh) * 2019-05-28 2022-04-19 广东工业大学 一种机械臂抓取轨迹的生成方法、装置、设备及存储介质
CN111890353B (zh) * 2020-06-24 2022-01-11 深圳市越疆科技有限公司 机器人示教轨迹复现方法、装置及计算机可读存储介质
CN112549028A (zh) * 2020-12-02 2021-03-26 中国科学院自动化研究所 基于动态运动基元和人工势场的双臂机器人轨迹规划方法

Also Published As

Publication number Publication date
CN113043251A (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN113043251B (zh) 一种机器人示教再现轨迹学习方法
CN109465825B (zh) 机械臂柔性关节的rbf神经网络自适应动态面控制方法
CN110202574B (zh) 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法
CN111872934B (zh) 一种基于隐半马尔可夫模型的机械臂控制方法及系统
US20080243307A1 (en) Apparatus and Method for Generating and Controlling the Motion of a Robot
CN112218744A (zh) 学习多足机器人的敏捷运动的系统和方法
CN112904728A (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
CN110815190A (zh) 一种工业机器人拖动示教方法及系统
CN114043480A (zh) 一种基于模糊控制的自适应阻抗控制算法
CN110861088A (zh) 一种冗余自由度机器人的运动优化方法
CN114348026B (zh) 一种车辆控制方法、装置、设备以及存储介质
CN115990888B (zh) 一种具有死区和时变约束功能的机械臂控制方法
CN115202293B (zh) 一种工业机器人两段式速度规划方法
CN113043266B (zh) 一种基于迭代学习的自适应力跟踪控制方法
CN115981328A (zh) 一种基于动态运动基元的轨迹规划与调整方法及系统
CN111002302B (zh) 结合高斯混合模型和动态系统的机械臂抓取轨迹规划方法
CN107398903B (zh) 工业机械手臂执行端的轨迹控制方法
CN116038697A (zh) 一种基于人工示教的牛仔裤自动喷涂方法和系统
CN113419433B (zh) 一种自平衡电动轮椅欠驱动系统跟踪控制器的设计方法
CN112975986B (zh) 基于径向基函数的机械臂点对点轨迹规划方法及装置
CN114077196A (zh) 一种基于改进Prandtl-Ishlinskii模型的压电驱动器复合控制方法
CN112684793A (zh) 一种离散系统中的机器人零半径过弯的轨迹跟踪控制方法
CN116079739B (zh) 一种基于跟踪微分器的机械臂末端位置与力变阻抗协同控制方法
CN117590754B (zh) 一种机器人系统的智能学习输出调控方法
CN113787514B (zh) 机械臂动态避碰规划方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant