CN113043251A - 一种机器人示教再现轨迹学习方法 - Google Patents

一种机器人示教再现轨迹学习方法 Download PDF

Info

Publication number
CN113043251A
CN113043251A CN202110441900.XA CN202110441900A CN113043251A CN 113043251 A CN113043251 A CN 113043251A CN 202110441900 A CN202110441900 A CN 202110441900A CN 113043251 A CN113043251 A CN 113043251A
Authority
CN
China
Prior art keywords
track
teaching
robot
dynamic motion
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110441900.XA
Other languages
English (en)
Other versions
CN113043251B (zh
Inventor
万俊
张兰春
葛敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University of Technology
Original Assignee
Jiangsu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Technology filed Critical Jiangsu University of Technology
Priority to CN202110441900.XA priority Critical patent/CN113043251B/zh
Publication of CN113043251A publication Critical patent/CN113043251A/zh
Application granted granted Critical
Publication of CN113043251B publication Critical patent/CN113043251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0081Programme-controlled manipulators with master teach-in means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Numerical Control (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种机器人示教再现轨迹学习方法,其技术方案要点是:包括以下步骤:Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;Step2:建立标准位置动态运动基元模型;Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;Step4:基于局部加权回归方法对示教轨迹进行学习;本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。

Description

一种机器人示教再现轨迹学习方法
技术领域
本发明涉及机器人轨迹学习领域,特别涉及一种机器人示教再现轨迹学习方法。
背景技术
目前,工业机器人虽然能够显著提高工业制造效率,但是仍然需要精确的编程,每个任务都被分解成一系列动作。该方法不能够从任务学习中得到经验,也不具有灵活性,若机器人末端任务稍微发生改变,机器人控制系统都需要重新编程,降低了机器人编程效率和机器人适应性。演示编程,也就是直接示教,似乎是解决这个问题非常有效的方法。在直接示教过程中,机器人基于操作者拖拽运动记录末端任务轨迹。动态系统常用来学习泛化机器人记录后的演示轨迹,即在给定系统初始状态、目标状态和示教轨迹,通过在线求解微分方程自动生成机器人的运动,用于复现相同的机器人示教轨迹。常用的动态系统方法有动态运动基元方法。
考虑到动态运动基元模型中的相变量基于指数函数单调递减,导致动态运动基元中的强迫函数在时间尺度上非均匀分布,收敛速度慢,由速度积分得到的位置误差大。Samantetal.提出相变量线性化,使得强迫函数在时间尺度上均匀分布,提高收敛精度。此外,Dimeasetal.,Kastritsietal.和Papageorgiouetal.分别基于人工势场原理建立了虚拟夹具方法,在位置动态运动基元输出的每个点上赋予吸引力,以此提高交互位置跟踪精度。但是,这中方法只能适用示教点数少的情况,否则耗时,增加系统计算负担。因此,对位置动态运动基元模型的改进,提高其收敛速度和收敛精度,是成功应用在机器人示教再现的关键所在。
发明内容
针对背景技术中提到的问题,本发明的目的是提供一种机器人示教再现轨迹学习方法,以解决背景技术中提到的问题。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种机器人示教再现轨迹学习方法,包括以下步骤:
Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
Step2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化。
较佳的,所述Step1中,所述机器人末端示教轨迹
Figure BDA0003035412760000021
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure BDA0003035412760000022
其中,
Figure BDA0003035412760000023
分别表示机器人末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
较佳的,所述Step2中,所述位置动态运动基元为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元包括转换系统函数和规范系统函数,所述转换系统函数定义为:
Figure BDA0003035412760000024
Figure BDA0003035412760000025
所述规范系统函数定义为:
Figure BDA0003035412760000031
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为位置动态运动基元非线性强迫函数。
较佳的,所述非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure BDA0003035412760000032
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure BDA0003035412760000033
Figure BDA0003035412760000034
Figure BDA0003035412760000035
为决定位置动态运动基元模型输出轨迹形状的惯性参数。
较佳的,所述Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,所述虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure BDA0003035412760000036
其中,
Figure BDA0003035412760000041
分别为型值点处的位置、速度和采样时刻点。
较佳的,所述Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的所述型值点处势场能量
Figure BDA0003035412760000042
为:
Figure BDA0003035412760000043
其中,
Figure BDA0003035412760000044
为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure BDA0003035412760000045
为型值点处刚度因子;dt为采样周期;刚度因子
Figure BDA0003035412760000046
越大,第i个型值点
Figure BDA0003035412760000047
对pDMP吸引力越大;
B.采用高斯内核函数表示所述型值点处势场能量,即:
Figure BDA0003035412760000048
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义所述NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure BDA0003035412760000049
D.求取所述总势场能量G(pDMP)的梯度函数
Figure BDA00030354127600000411
即:
Figure BDA00030354127600000410
E.所述一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure BDA0003035412760000051
其中,
Figure BDA0003035412760000052
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
较佳的,所述Step3中,用一阶滤波方法对所述的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure BDA0003035412760000053
Figure BDA0003035412760000054
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
较佳的,所述Step3中,采用局部加权回归方法对所述示教轨迹的位置惯性参数
Figure BDA0003035412760000058
进行求取进行示教轨迹学习,所述位置惯性参数
Figure BDA0003035412760000059
决定所述动态运动基元系统轨迹输出的形状。
较佳的,基于所述机器人直接示教轨迹
Figure BDA0003035412760000055
得到系统目标强迫函数ftarg,为:
Figure BDA0003035412760000056
寻找最优的所述位置惯性参数
Figure BDA0003035412760000057
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure BDA0003035412760000061
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述轨迹学习位置惯性参数
Figure BDA0003035412760000062
Figure BDA0003035412760000063
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Πi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure BDA0003035412760000064
其中,L,Πi为位置惯性参数辅助中间变量;
Figure BDA0003035412760000065
为采样时的目标位置。
综上所述,本发明主要具有以下有益效果:
本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。
附图说明
图1为本发明的方法流程图;
图2为本发明中机器人仿真门字型轨迹;
图3为本发明中标准位置动态运动基元方法的径向基函数在x轴方向位移分布图;
图4为本发明中仿真误差结果图;
图5为本发明中改进位置动态运动基元的型值点高斯内核函数在x轴方向位移分布图;
图6为本发明中改进位置动态运动基元的型值点高斯内核函数在y轴方向位移分布图;
图7为本发明中改进位置动态运动基元模型机器人轨迹学习泛化仿真结果图;
图8为本发明中泛化轨迹1机器人关节角度曲线仿真结果图;
图9为本发明中泛化轨迹2机器人关节角度曲线仿真结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参考图1至图9,一种机器人示教再现轨迹学习方法,包括以下步骤:
Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
Step2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化。
较佳的,Step1中,机器人末端示教轨迹
Figure BDA0003035412760000071
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure BDA0003035412760000081
其中,
Figure BDA0003035412760000082
分别表示机器人末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
其中,Step2中,位置动态运动基元为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元包括转换系统函数和规范系统函数,转换系统函数定义为:
Figure BDA0003035412760000083
Figure BDA0003035412760000084
规范系统函数定义为:
Figure BDA0003035412760000085
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为位置动态运动基元非线性强迫函数。
其中,非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure BDA0003035412760000086
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure BDA0003035412760000091
Figure BDA0003035412760000092
Figure BDA0003035412760000093
为决定位置动态运动基元模型输出轨迹形状的惯性参数。
其中,Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure BDA0003035412760000094
其中,
Figure BDA0003035412760000095
分别为型值点处的位置、速度和采样时刻点。
其中,Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的型值点处势场能量
Figure BDA0003035412760000096
为:
Figure BDA0003035412760000097
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure BDA0003035412760000098
为型值点处刚度因子;dt为采样周期;刚度因子
Figure BDA0003035412760000099
越大,第i个型值点
Figure BDA00030354127600000910
对pDMP吸引力越大;
B.采用高斯内核函数表示型值点处势场能量,即:
Figure BDA00030354127600000911
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure BDA0003035412760000101
D.求取总势场能量G(pDMP)的梯度函数
Figure BDA0003035412760000108
即:
Figure BDA0003035412760000102
E.一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure BDA0003035412760000103
其中,
Figure BDA0003035412760000104
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
其中,Step3中,用一阶滤波方法对的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure BDA0003035412760000105
Figure BDA0003035412760000106
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
其中,Step3中,采用局部加权回归方法对示教轨迹的位置惯性参数
Figure BDA0003035412760000107
进行求取进行示教轨迹学习,位置惯性参数
Figure BDA0003035412760000111
决定动态运动基元系统轨迹输出的形状。
其中,基于所述机器人直接示教轨迹
Figure BDA0003035412760000112
得到系统目标强迫函数ftarg,为:
Figure BDA0003035412760000113
寻找最优的所述位置惯性参数
Figure BDA0003035412760000114
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure BDA0003035412760000115
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述轨迹学习位置惯性参数
Figure BDA0003035412760000119
Figure BDA0003035412760000116
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Πi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure BDA0003035412760000117
其中,L,Πi为位置惯性参数辅助中间变量;
Figure BDA0003035412760000118
为采样时的目标位置。
其中,本机器人示教再现轨迹学习方法,其借鉴虚拟夹具方法和高斯核函数,对示教轨迹中少数个型值点位置建立虚拟点吸引力势场函数,并通过反馈耦合在标准位置动态运动基元转换系统函数中。相对原先的虚拟夹具方法,改进的位置动态运动基元模型无需对每个示教点建立势场函数,能够有效地提高位置动态运动基元输出轨迹的收敛精度和收敛速度。
实施例2
一种机器人示教再现轨迹学习方法,包括:首先记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;建立标准位置动态运动基元模型;建立基于虚拟点势场函数的改进位置动态运动基元模型;最后,基于局部加权回归方法对示教轨迹进行学习泛化。
一、记录保存机器人末端示教轨迹
Figure BDA0003035412760000121
机器人末端示教轨迹
Figure BDA0003035412760000122
可以由机器人直接示教系统采集,经过系统滤波,得到连续平滑的轨迹,其定义为:
Figure BDA0003035412760000123
其中,
Figure BDA0003035412760000124
分别表示机器人末端示教轨迹的位置,速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
二、建立标准位置动态运动基元模型:
标准位置动态运动基元模型主要定义为:
Figure BDA0003035412760000125
Figure BDA0003035412760000126
Figure BDA0003035412760000127
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,为示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;pe为示教轨迹终点;fp(xs)为位置动态运动基元非线性强迫函数。
非线性强迫函数fp(xs)由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure BDA0003035412760000131
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure BDA0003035412760000132
Figure BDA0003035412760000133
Figure BDA0003035412760000134
为位置惯性参数。
三、建立基于虚拟点势场函数的改进位置动态运动基元模型:
改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数,以此提高轨迹收敛精度。虚拟点为示教轨迹中少数的NIM个示教点,定义为型值点,其记录信息表示为:
Figure BDA0003035412760000135
其中,
Figure BDA0003035412760000136
分别为型值点处的位置,速度和采样时刻点。
改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的型值点处势场能量
Figure BDA0003035412760000137
为:
Figure BDA0003035412760000138
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure BDA0003035412760000141
为型值点处刚度因子;dt为采样周期。可以看出,刚度因子
Figure BDA0003035412760000142
越大,第i个型值点
Figure BDA0003035412760000143
对pDMP吸引力越大。
B.采用高斯内核函数表示型值点处势场能量,即:
Figure BDA0003035412760000144
其中,σDMP为型值点势场能量高斯内核函数分布宽度。
C.定义NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure BDA0003035412760000145
D.求取总势场能量G(pDMP)的梯度函数
Figure BDA0003035412760000149
即:
Figure BDA0003035412760000146
E.一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure BDA0003035412760000147
其中,
Figure BDA0003035412760000148
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
采用一阶滤波方法对的改进位置动态运动基元模型的位置转换系统函数进行改进,避免初始时刻速度不连续,即:
Figure BDA0003035412760000151
Figure BDA0003035412760000152
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
其具体算法过程说明如下:
为了更容易体现标准位置动态运动基元模型方法和改进位置动态运动基元模型方法的性能差异,设定机器人末端示教轨迹为门字型轨迹,如图2所示中的虚线轨迹,P1=[0,0]Tmm,P2=[0,100]Tmm,P3=[200,100]Tmm,P4=[200,-20]Tmm,P1→P2→P3→P4,机器人示教轨迹记录保存为
Figure BDA0003035412760000153
轨迹上升初始时间为tu=0s,轨迹水平运动初始时间为th=0.35s,轨迹下降运动初始时间为td=0.96s。其余参数如下:
αz=36,βz=9,αx=7.2,αgp=12,τT=Tdemo,Nw=25,px0=0mm,pxe=200mm,py0=0mm,pye=-20mm。
图3所示为标准位置动态运动基元方法中的径向基函数Φi(xs)在x轴方向位移的分布图。从图中可以看出,Φi(xs)在位移方向上分布不均,多数集中在位移前一小段,导致的非线性强迫函数fp(xs)在x轴方向比例系数Dp,x=pxe-px0放大下不能够精确逼近示教轨迹
Figure BDA0003035412760000154
因此,标准位置动态运动基元模型输出的x轴位移相对示教轨迹
Figure BDA0003035412760000155
有明显的位置误差。同理,标准位置动态运动基元模型方法在y轴方向位移相对示教轨迹
Figure BDA0003035412760000156
亦有显著的位置误差。如图4所示,标准位置动态运动基元模型输出轨迹在x轴和y轴方向最大位置误差分别为max(Δxdmp)=4.841mm,max(Δydmp)=6.197mm。
为了克服上述标准位置动态运动基元方法的缺陷,改进的位置动态运动基元模型将P1、P2、P3和P4分别设置为在x轴和y轴方向上的型值点,即xctr=[0,0,200,200]Tmm,yctr=[0,100,100,-20]Tmm。图5和图6分别为x轴和y轴方向上的型值点高斯内核函数
Figure BDA0003035412760000161
分布图。由于xctr(1)=xctr(2)=0mm,xctr(3)=xctr(4)=200mm,yctr(2)=yctr(3)=100mm,所以两者分布均呈现对称分布,且相互独立。在P1、P2、P3和P4处分别设置虚拟点虚拟势场梯度函数
Figure BDA0003035412760000162
依据机器人末端位置调整机器人末端轨迹,因此,相对标准位置动态运动基元方法,本发明提出的改进位置动态运动基元方法输出的轨迹位置误差小于前者方法,其中,最大位置误差分布为max(Δxmdmp)=2.594mm,max(Δymdmp)=-3.412mm,如图4所示。因此,本发明提出的改进位置动态运动基元方法相对标准位置动态运动基元方法,能够提高机器人示教轨迹复现的位置精度。
图7所示为改进位置动态运动基元模型用于机器人轨迹学习泛化仿真结果。仿真内容为对示教轨迹P1→Pm→P2的弧线轨迹进行示教轨迹学习,并对示教轨迹进行泛化。从图中可以看出,泛化轨迹1能够以小误差复现示教轨迹,其机器人关节角度平滑连续,能够稳定地控制机器人运行轨迹,如图8所示。泛化轨迹2更新了示教轨迹终点目标至P3,无需再次进行轨迹示教学习。从图7和图9中可以看出,泛化轨迹2保持泛化轨迹1形状的同时,机器人关节角度曲线平滑连续,未出现抖动。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种机器人示教再现轨迹学习方法,其特征在于:包括以下步骤:
Step1:记录保存机器人示教后的末端位置轨迹、速度轨迹、加速度轨迹和采样时间;
Step2:建立标准位置动态运动基元模型;
Step3:建立基于虚拟点势场函数的改进位置动态运动基元模型;
Step4:基于局部加权回归方法对示教轨迹进行学习泛化。
2.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step1中,所述机器人末端示教轨迹
Figure FDA0003035412750000011
由机器人直接示教系统采集,经过系统滤波得到连续平滑的轨迹,其定义为:
Figure FDA0003035412750000012
其中,
Figure FDA0003035412750000013
分别表示机器人末端示教轨迹的位置、速度和加速度;tk为采样时间;k为采样数目;T为采样总时间数目。
3.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step2中,所述位置动态运动基元为一种常用于建立机器人运动模型的方法,是通过一组由微分方程组建立的系统来描述被控制对象的运动状态,在不破坏系统稳定性的前提下确保被控对象所期望的行为,其中标准位置动态运动基元包括转换系统函数和规范系统函数,所述转换系统函数定义为:
Figure FDA0003035412750000014
Figure FDA0003035412750000015
所述规范系统函数定义为:
Figure FDA0003035412750000021
其中,xs∈[0,1]为相变量;z为辅助中间变量;τT为时间尺度参数,τT等于机器人示教轨迹运行总时间;p=(px,py,pz)T定义为机器人末端位置;
pe为示教轨迹终点,在τT>0,αz=4βz,αx>0条件下,被控对象逐渐收敛到唯一平衡点,p=pe,z=0;fp(xs)为位置动态运动基元非线性强迫函数。
4.根据权利要求3所述的一种机器人示教再现轨迹学习方法,其特征在于:所述非线性强迫函数fp(xs)使转换系统函数输出的轨迹连续光滑逼近示教轨迹,由一组Nw个径向基函数Φi(xs)线性加权叠加组成,即:
Figure FDA0003035412750000022
Φi(xs)=exp(-hi(xs-ci)2);
其中,位置缩放因子Dp=diag(pe-p0),p0为机器人示教轨迹起点;ci和hi分别是径向基函数分布中心和宽度,
Figure FDA0003035412750000023
Figure FDA0003035412750000024
Figure FDA0003035412750000025
为决定位置动态运动基元模型输出轨迹形状的惯性参数。
5.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step3中,改进位置动态运动基元模型在标准位置动态运动基元模型中嵌入了基于高斯内核函数的虚拟点势场函数以此提高轨迹收敛精度,所述虚拟点为示教轨迹中的NIM个示教点,定义为型值点,其记录信息表示为:
Figure FDA0003035412750000031
其中,
Figure FDA0003035412750000032
分别为型值点处的位置、速度和采样时刻点。
6.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step3中,改进位置动态运动基元模型的建立,具体包括以下步骤:
A.定义一维空间中的所述型值点处势场能量
Figure FDA0003035412750000033
为:
Figure FDA0003035412750000034
其中,pDMP为上一采样周期输出的机器人末端一维位置数据pDMP(tk-dt);
Figure FDA0003035412750000035
为型值点处刚度因子;dt为采样周期;刚度因子
Figure FDA0003035412750000036
越大,第i个型值点
Figure FDA0003035412750000037
对pDMP吸引力越大;
B.采用高斯内核函数表示所述型值点处势场能量,即:
Figure FDA0003035412750000038
其中,σDMP为型值点势场能量高斯内核函数分布宽度;
C.定义所述NIM个型值点所具有的总势场能量G(pDMP),表示为:
Figure FDA0003035412750000039
D.求取所述总势场能量G(pDMP)的梯度函数▽G(pDMP),即:
Figure FDA00030354127500000310
E.所述一维空间点虚拟势场扩展到三维操作空间内,并将其嵌入到标准位置动态运动基元模型中的位置转换系统函数中,得到改进的位置动态运动基元模型,即:
Figure FDA0003035412750000041
其中,
Figure FDA0003035412750000042
为虚拟点势场在x轴,y轴和z轴方向的刚度矩阵。
7.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step3中,用一阶滤波方法对所述的改进位置动态运动基元模型的位置转换系统函数进行改进以解决在初始时刻式(pe-p)≠0会造成机器人末端速度不连续的问题,表示为:
Figure FDA0003035412750000043
Figure FDA0003035412750000044
其中,αgp为一阶滤波常数;pr表示位置一阶滤波迭代计算结果。
8.根据权利要求1所述的一种机器人示教再现轨迹学习方法,其特征在于:所述Step3中,采用局部加权回归方法对所述示教轨迹的位置惯性参数
Figure FDA0003035412750000046
进行求取进行示教轨迹学习,所述位置惯性参数
Figure FDA0003035412750000047
决定所述动态运动基元系统轨迹输出的形状。
9.根据权利要求8所述的一种机器人示教再现轨迹学习方法,其特征在于:基于所述机器人直接示教轨迹
Figure FDA0003035412750000045
得到系统目标强迫函数ftarg,为:
Figure FDA0003035412750000051
寻找最优的所述位置惯性参数
Figure FDA0003035412750000052
使得由径向基函数Φi(xs)组成的所述非线性强迫函数fp(xs)与所述系统目标强迫函数ftarg之间的误差最小,即:
Figure FDA0003035412750000053
其中,pe为示教轨迹终点;p0为示教轨迹的初始位置点;
由于所述动态运动基元模型沿各坐标轴方向相互独立,因此分别求取在x轴、y轴和z轴方向上的所述轨迹学习位置惯性参数
Figure FDA0003035412750000057
Figure FDA0003035412750000054
L=(xs(0),xs(1),…,xs(T))T(pe-pdemo)j
Πi=diag(Φi(xs(0)),Φi(xs(1)),…,Φi(xs(T)));
Figure FDA0003035412750000055
其中,L,Πi为位置惯性参数辅助中间变量;
Figure FDA0003035412750000056
为采样时的目标位置。
CN202110441900.XA 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法 Active CN113043251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110441900.XA CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110441900.XA CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Publications (2)

Publication Number Publication Date
CN113043251A true CN113043251A (zh) 2021-06-29
CN113043251B CN113043251B (zh) 2023-07-07

Family

ID=76520064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110441900.XA Active CN113043251B (zh) 2021-04-23 2021-04-23 一种机器人示教再现轨迹学习方法

Country Status (1)

Country Link
CN (1) CN113043251B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113977580A (zh) * 2021-10-29 2022-01-28 浙江工业大学 基于动态运动原语和自适应控制的机械臂模仿学习方法
CN115524997A (zh) * 2022-09-28 2022-12-27 山东大学 基于强化与模仿学习的机器人动态操作布料方法及系统
WO2023142215A1 (zh) * 2022-01-27 2023-08-03 苏州大学 基于动态运动基元的微纳操作机器人自动拾取纳米线方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160000511A1 (en) * 2014-07-03 2016-01-07 GM Global Technology Operations LLC Dynamical system-based robot velocity control
CN106444738A (zh) * 2016-05-24 2017-02-22 武汉科技大学 基于动态运动基元学习模型的移动机器人路径规划方法
CN110026987A (zh) * 2019-05-28 2019-07-19 广东工业大学 一种机械臂抓取轨迹的生成方法、装置、设备及存储介质
CN111890353A (zh) * 2020-06-24 2020-11-06 深圳市越疆科技有限公司 机器人示教轨迹复现方法、装置及计算机可读存储介质
CN112549028A (zh) * 2020-12-02 2021-03-26 中国科学院自动化研究所 基于动态运动基元和人工势场的双臂机器人轨迹规划方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160000511A1 (en) * 2014-07-03 2016-01-07 GM Global Technology Operations LLC Dynamical system-based robot velocity control
CN105270385A (zh) * 2014-07-03 2016-01-27 通用汽车环球科技运作有限责任公司 基于动态系统的机器人速度控制
CN106444738A (zh) * 2016-05-24 2017-02-22 武汉科技大学 基于动态运动基元学习模型的移动机器人路径规划方法
CN110026987A (zh) * 2019-05-28 2019-07-19 广东工业大学 一种机械臂抓取轨迹的生成方法、装置、设备及存储介质
CN111890353A (zh) * 2020-06-24 2020-11-06 深圳市越疆科技有限公司 机器人示教轨迹复现方法、装置及计算机可读存储介质
CN112549028A (zh) * 2020-12-02 2021-03-26 中国科学院自动化研究所 基于动态运动基元和人工势场的双臂机器人轨迹规划方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113977580A (zh) * 2021-10-29 2022-01-28 浙江工业大学 基于动态运动原语和自适应控制的机械臂模仿学习方法
CN113977580B (zh) * 2021-10-29 2023-06-27 浙江工业大学 基于动态运动原语和自适应控制的机械臂模仿学习方法
WO2023142215A1 (zh) * 2022-01-27 2023-08-03 苏州大学 基于动态运动基元的微纳操作机器人自动拾取纳米线方法
CN115524997A (zh) * 2022-09-28 2022-12-27 山东大学 基于强化与模仿学习的机器人动态操作布料方法及系统
CN115524997B (zh) * 2022-09-28 2024-05-14 山东大学 基于强化与模仿学习的机器人动态操作布料方法及系统

Also Published As

Publication number Publication date
CN113043251B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN113043251A (zh) 一种机器人示教再现轨迹学习方法
CN108319144B (zh) 一种机器人轨迹跟踪控制方法及系统
CN110202574B (zh) 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法
JP3502154B2 (ja) データ記憶装置の制御方法および制御システム
Pereira et al. Adaptive input shaping for manoeuvring flexible structures using an algebraic identification technique
CN112631128B (zh) 一种多模异构信息融合的机器人装配技能学习方法及系统
Smith et al. An algorithm for automated fuzzy logic controller tuning
CN112207834A (zh) 一种基于干扰观测器的机器人关节系统控制方法及系统
JPH05127706A (ja) ニユーラルネツト型シミユレータ
CN115256386A (zh) 考虑跟踪误差约束的不确定机械臂神经自适应控制方法
CN115981328A (zh) 一种基于动态运动基元的轨迹规划与调整方法及系统
CN115720061A (zh) 基于有限时间的机电伺服系统模糊自适应反步控制方法
CN113043266A (zh) 一种基于迭代学习的自适应力跟踪控制方法
CN114545864A (zh) 一种电液伺服系统摩擦补偿控制方法
CN107398903B (zh) 工业机械手臂执行端的轨迹控制方法
CN112034869B (zh) 一种无人机变参神经动力学控制器的设计方法及其应用
CN114434449B (zh) 一种新型粒子群自适应阻抗控制方法及装置
CN107894709A (zh) 基于自适应评价网络冗余机器人视觉伺服控制
CN114488804A (zh) 基于事件触发的机器人变增益超螺旋滑模控制方法及系统
CN115344047A (zh) 基于神经网络模型的机器人切换式预测控制轨迹跟踪方法
CN112904855A (zh) 基于改进动态窗口的跟随机器人局部路径规划方法
CN110977965A (zh) 机器人及其控制方法、计算机存储介质
CN116382154B (zh) 一种基于事件触发的指定时间高精度控制方法
CN114326393B (zh) 非完整小车轨迹跟踪控制方法及装置
CN116661310A (zh) 基于变增益eso的差速轮式机器人鲁棒控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant