CN111673733B - 未知环境下机器人的智能自适应柔顺控制方法 - Google Patents

未知环境下机器人的智能自适应柔顺控制方法 Download PDF

Info

Publication number
CN111673733B
CN111673733B CN202010226048.XA CN202010226048A CN111673733B CN 111673733 B CN111673733 B CN 111673733B CN 202010226048 A CN202010226048 A CN 202010226048A CN 111673733 B CN111673733 B CN 111673733B
Authority
CN
China
Prior art keywords
robot
contact
task
tail end
particle swarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010226048.XA
Other languages
English (en)
Other versions
CN111673733A (zh
Inventor
翟敬梅
曾献文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202010226048.XA priority Critical patent/CN111673733B/zh
Publication of CN111673733A publication Critical patent/CN111673733A/zh
Application granted granted Critical
Publication of CN111673733B publication Critical patent/CN111673733B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种未知环境下机器人的智能自适应柔顺控制方法。所述方法通过图知识迁移学习优化粒子群运行参数,基于优化的粒子群辨识算法对环境接触动力学模型进行参数辨识,同时基于参数辨识结果指导阻抗控制参考位置的自校正调整以实现未知环境下精准力位双重控制的柔顺控制效果。本发明融合了基于接触动力学模型的粒子群辨识算法、阻抗控制参考位置的自校正调整,对于线弹性和非线弹性材料,都能克服其力学特性未知性,实现精准力位协同控制;提出粒子群运行参数的迁移学习优化方法,从历史辨识任务中学习辨识算法运行参数知识,进而针对目标辨识任务特征获得优化的粒子群辨识算法运行参数,提高了参数辨识系统在面向不同未知环境时的计算效率。

Description

未知环境下机器人的智能自适应柔顺控制方法
技术领域
本发明属于机器人的力位双重控制领域,具体涉及未知环境下机器人的智能自适应柔顺控制方法。
背景技术
随着“中国制造2025”制造强国战略的不断推进,机器人已经在工业、服务业领域获得越来越广泛的应用,所面临的工作任务也不再仅仅需要位置控制,在面对诸多作业场合如机器人打磨、装配作业、人体按摩、康复治疗作业时,需要进行机器人位置和力的双重控制如阻抗控制。上述作业往往面对作业环境未知的问题:一方面作业对象既有线弹性特征的材料,也有非线性弹性特征的柔顺材料;另一方面,即使同一材料的作业对象,不同区域的力学特性往往由于生物体征、组织结构等因素而存在变化,作业环境的未知性往往导致阻抗控制力跟踪误差较大甚至失去力跟踪能力。上述问题给机器人控制提出了更高的要求,即机器人要智能识别、并跟踪辨识变化的环境特征,在此基础上进行自适应力位控制以满足恒力作业需求。
相关研究表明机器人力、位控制器如阻抗控制器的稳定性及精准性往往受到环境力学特性的直接影响,因此对环境接触动力学的研究能够有效改善机器人阻抗控制器力控制性能。相关研究在机器人柔顺控制中采用纯刚度模型(杜光月.仿人机械手中医按摩手法的建模与柔顺控制[D].济南:山东建筑大学,2012.)、Kelvin-Voigt模型(Ishii H,Koga H,Obokawa Y,et al.Development and Experimental Evaluation of OralRehabilitation Robot that Provides Maxillofacial Massage to Patients withOral Disorders[J].The International Journal of Robotics Research,2009,28(9):1228-1239.)描述机器人与环境之间的接触动力学特征,上述研究的接触动力学模型所描述的环境刚度是线性的,适用于线弹性材料特征,但对于柔顺材料,则无法描述其非线性弹性特征。
阻抗控制要求建立准确的机械手与环境之间的接触动力学模型,但即便得到作业对象的受力-变形的数学表达,其参数也会由于不同作业对象的材料种类、组织结构而存在彼此间不同;即便同一作业对象,其不同作业区域之间也可能由于材料分布等原因表现出不同的力学特性,上述问题带来接触动力学模型参数的未知性问题,加之实际工程应用中,机器人控制延时、信号噪声的影响,面向未知环境工作的阻抗控制器往往不能实现稳定力位跟踪控制效果,需要在经典控制的基础上进行自适应调整,相关研究(Clarke D.W,Gawthrop P.J.Self-tuning controller[J].Electrical Engineers Proceedings ofthe Institution of,1979,122(9):929-934.)采用自校正控制在未知环境下进行环境参数的在线辨识和控制量的预测调整,但其递推最小二乘辨识模块无法适用于非线性辨识对象。
相关研究(Diolaiti N,Melchiorri C,Stramigioli S.Contact impedanceestimation for robotic systems[J].IEEE Transactions on Robotics,2005,21(5):925-935.Haddadi A,Hashtrudi-Zaad K.Real-Time Identification of Hunt–CrossleyDynamic Models of Contact Environments[J].IEEE Transactions on Robotics,2012,28(3):555-566.)对非线性对象进行线性化处理,一定程度上解决了最小二乘辨识对非线性对象的适用性,但是工程实际中,信号采集往往伴随噪声,最小二乘法的最大缺陷就是对有色噪声、数据波动基本没有抗干扰能力,导致参数辨识精度不高甚至辨识失败,此缺陷极大地影响了该算法的广泛应用。神经网络、进化算法等人工智能算法在解决参数辨识问题时承认待辨识问题的复杂性和非线性,同时由于直接在解空间进行搜索来进行参数辨识,对环境噪声也具有较高鲁棒性。但神经网络往往需要进行大量离线训练,进化算法中遗传算法求解过程涉及到繁琐的编码、解码过程,计算量相对较大,粒子群算法虽然求解过程和计算量相对简单,但由于运行参数设置、并行计算特性等因素作用,粒子群算法计算量仍大于最小二乘类算法,会对系统计算效率产生不良影响。
为解决上述研究现状在面向未知环境时柔顺控制所面对的问题,本发明将会建立未知环境的接触动力学模型,并基于粒子群算法进行接触动力学模型参数辨识,同时根据参数辨识结果指导自校正控制器对阻抗控制参考位置进行自适应调整以保证未知环境下的力位跟踪能力,最后对于粒子群算法运行参数的设置问题,本发明基于图知识迁移学习进行粒子群运行参数的优化学习,从而提升粒子群算法在面向新的目标辨识任务时的辨识速度。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种未知环境下机器人的智能自适应柔顺控制方法。
本发明的目的至少通过如下技术方案之一实现。
未知环境下机器人的智能自适应柔顺控制方法,包括以下步骤:
步骤1:在机器人目标作业路径内的作业对象上取少数局部采样点,机器人在局部采样点上进行法向运动采样得到机器人末端的受力数据与位置数据;
步骤2:采用基于任务相似度的源任务筛选算法,基于接触动力学模型进行步骤1中获取的机器人末端的受力数据与位置数据作为目标任务样本,来与源任务信息库的任务相似度进行计算,并基于任务相似度进行源任务的筛选;
步骤3:以辨识速度为优化目标,通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化,得到适用于目标作业对象力学特征的辨识算法运行参数;
步骤4:机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,实现柔顺接触,同时基于接触动力学模型,以步骤3中优化的运行参数控制粒子群辨识算法进行环境接触动力学模型参数辨识;
步骤5:以辨识得到的接触动力学模型参数指导自校正调节器根据机器人末端接触力进行阻抗控制参考位置的自适应调整;
步骤6:底层阻抗控制系统包括位置控制内环和力反馈外环,将自适应调整后的参考位置输入阻抗控制的位置控制内环,机器人位置控制器控制机器人末端按照参考位置运动,并将机器人末端接触力反馈给步骤5中的自校正调节器;
步骤7:机器人末端按照规划路径沿着作业对象表面切向运动,并循环步骤4中的环境接触动力学模型参数辨识及步骤5、步骤6,直到机器人末端按照规划的路径运动结束,实现未知环境下机器人的智能自适应柔顺控制。
进一步地,步骤1中,所述机器人作业路径,是指机器人与作业对象进行物理接触的应用场景下,提前规划的机器人末端执行器与作业对象进行接触的路径;所述少数局部采样点为同一肌肤区域中所取的作业路径上的1~2个路径点;所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力,工具坐标系原点位于机器人末端法兰盘中心,以法兰盘法向所指方向为工具坐标系z轴,x轴和y轴遵从右手定则,即右手拇指方向指向z轴时,右手食指方向为x轴,右手手腕方向为y轴;所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时,机器人末端相对于机器人基坐标系z轴的坐标,机器人基坐标系原点为机器人基座中心,以基座法向所指方向为坐标系z轴,x轴和y轴遵从上述右手定则。
进一步地,所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取,且末端接触力和位置数据是以相同的采样频率同时成对采集,即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。
进一步地,步骤2中,所述源任务信息库包括历史辨认任务储存的作业对象接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据;
所述接触动力学模型如下:
F=k(xe-x)n
其中F为作业对象的法向受力,k为弹性系数,n为幂指数项,x为作业对象变形时相对于机器人基坐标系z轴的位置,xe为作业对象未变形时相对于机器人基坐标系z轴的位置,基坐标系z轴与作业对象表面法向保持平行;当幂指数项n=1时接触动力学模型适用于线弹性材料,当不限定幂指数项数值时接触动力学模型既适用于线弹性材料,也适用于非线弹性柔顺材料;
所述作业对象接触动力学模型参数是指接触动力学模型中的不确定项:弹性系数k和幂指数项n;
所述粒子群辨识算法运行参数的运行参数是指粒子群算法的如下四个人为设定的运行参数:粒子最大移动速度vmax,局部学习因子c1、全局学习因子c2,惯性权重w。
进一步地,步骤2中,所述基于任务相似度的源任务筛选算法包括如下步骤:
S2.1、定义任务空间的样本对比矩阵Bi,j
Figure GDA0003385847920000041
其中:Bi,j为两个任务样本i,j的对比矩阵;k(i,m),n(i,m)为样本i的第m组变化的环境接触动力学参数,即机器人在样本i上进行接触作业时,随着机器末端的移动,机器人与作业对象接触点发生变化,作业对象接触动力学模型参数按照(k(i,1),n(i,1)),(k(i,2),n(i,2))……(k(i,m),n(i,m))发生变化;类似地,k(j,m),n(j,m)为样本j的第m组变化的接触动力学模型参数;
S2.2、定义列间距评价因子Sij
Figure GDA0003385847920000042
Si,j=||D2,1-D1,1,D2,2-D1,2...D2,n-1-D1,n-1||;
其中,||...||为范数,列间距评价因子Si,j越小则说明两样本i,j的参数变化幅度越一致;
S2.3、定义行间距评价因子δi,j
δi,j=||k(j,1)-k(i,1),n(j,1)-n(i,1),k(j,2)-k(i,2),n(j,2)-n(i,2),...k(j,n)-k(i,n),n(j,n)-n(i,n)||;
其中,行间距评价因子δi,j越小说明两样本i,j在不计参数变化幅度的情况下参数直接差距越小;
S2.4、基于列间距评价因子Sij和行间距评价因子δi,j进行源任务筛选,定义总体任务相似度评价指标:
χi,j=Z1*Si,j+Z2i,j
其中Z1、Z2为大于0的修正因子,根据采样数值确定其大小,以避免由于数量级差距造成的数据偏向某一评价因子;χi,j越小则两任务样本i,j相似度越高;
S2.5、基于总体任务相似度评价指标进行源任务筛选:
以粒子群辨识算法确定步骤1中获取的目标任务局部采样点的接触动力学模型参数,然后计算目标任务与源任务的任务相似度评价指标χi,j并升序排列,从中取前z个源任务作为后续迁移学习的源任务,记为
Figure GDA0003385847920000051
其中,源任务ti包括该任务的粒子群辨识算法运行参数、辨识得到的接触动力学模型参数、和辨识算法迭代次数数据。
进一步地,步骤3中,所述辨识速度具体是指粒子群辨识算法的迭代次数;所述通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化包括如下步骤:
S3.1、计算模型迁移图:
将源任务
Figure GDA0003385847920000052
中的所有源任务两两取出,记为ti和tj,i,j∈[1,z],进行任务ti对任务tj的粒子群运行参数迁移权值wij
wij=(Cj-Ci,j)/Cj
Cj表示任务tj的接触动力学模型mj在粒子群运行参数pj(vmax,c1,c2,w)控制下的辨识算法的辨识耗时;Ci,j表示接触动力学模型mj在任务ti的粒子群运行参数pi控制下的辨识算法的辨识耗时;所有任务两两之间的迁移权值wij构成了z×z维邻接迁移矩阵Az,矩阵元素定义如下:
Figure GDA0003385847920000053
采用模型迁移图G对迁移空间进行建模,G=(P,Az),其中
Figure GDA0003385847920000054
在面向新的作业对象进行参数辨识时,将其记为目标任务tz+1,然后将模型迁移图G拓展,使其包括目标任务tz+1:G=(P,Az+1);其中:
P=P∪{pz+1};
Figure GDA0003385847920000055
其中,w=(w1,w2,...wz)为源任务
Figure GDA0003385847920000056
的粒子群运行参数对目标任务tz+1的迁移权值;pz+1为目标任务在局部采样时所用的未优化粒子群运行参数;
S3.2、基于拓展模型迁移图的迁移函数学习:
迁移函数为每一个任务ti,分配一个针对其接触动力学模型mi的粒子群运行参数pi,拓展模型迁移图G=(P,Az+1)包括z+1个顶点与(z+1)×(z+1)个迁移权值,且拓展模型迁移图
Figure GDA0003385847920000061
与其图拉普拉斯矩阵
Figure GDA0003385847920000062
间存在映射关系:D为模型迁移图
Figure GDA0003385847920000063
的度对角矩阵,将
Figure GDA0003385847920000064
进行特征分解
Figure GDA0003385847920000065
其中
Figure GDA0003385847920000066
Figure GDA0003385847920000067
特征值对角矩阵,且有λ1≤λ2≤...≤λz+1,Q构成
Figure GDA0003385847920000068
的正交基向量矩阵;则必然存在一个(z+1)×4维的权值矩阵W,使得f=QW,取Q的前z行作为源任务的一组基,记作Q1,则采用最小二乘法,得到权值矩阵W各列元素:
Figure GDA0003385847920000069
其中f=(p1,p2......pz)T
Figure GDA00033858479200000610
是基于f的二阶导数惩罚项,用于抑制f中的高频部分以防止过拟合现象,f*,i表示矩阵f=(p1,p2......pn)T第i列的所有行,即*=1,2...z;
对上式进行求解即得:
Figure GDA00033858479200000611
求出权值矩阵W后,再利用迁移函数f=QW求得f,f的第(z+1)行转置后即得目标任务的优化迁移参数pz+1,即为适用于作业对象力学特征的辨识算法运行参数,在该优化参数控制下,粒子群辨识算法对目标任务的辨识速度将会得到有效提升。
进一步地,步骤4中,所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,是将作业对象表面位置xe输入阻抗控制期望位置xd,机器人阻抗控制的位置控制内环控制机器人按照期望位置xd运动,并将机器人末端接触力反馈给如下阻抗模型:
Figure GDA00033858479200000612
其中阻抗参数Md、Bd、Kd分别为期望阻抗模型的惯性矩阵、阻尼矩阵和刚度矩阵,F为反馈的实际接触力,x为机器人末端实际位置,xd为机器人期望轨迹点;
通过上述阻抗模型得出位置补偿量Δx=x-xd,令xd=xd+Δx,并循环上述控制和反馈补偿过程,直到接触力F≥1,即达到以阻抗参数控制的接触过程的柔顺性,避免机器人末端由未接触状态向接触状态过度过程中出现接触力冲击。
进一步地,步骤4中,所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤:
S4.1、参数辨识对象为接触动力学模型中的参数k和参数n,在2维的目标搜索空间中,定义N个2维粒子xi=(k,n)组成群落,所有粒子按照如下迭代律进行更新:
Figure GDA0003385847920000071
Figure GDA0003385847920000072
其中k表示第k次迭代,c1为局部学习因子,c2为全局学习因子,c1、c2∈(0,1),w为惯性权重。vi表示第i个粒子的移动速度,pbesti表示第i个粒子曾经到过的最好位置,gbest表示整个粒子群迄今为止搜索到的最好位置;评判粒子好坏的依据是适应度函数,将作业对象实际受力与接触动力学模型的力输出作比较,二者之间的差距以如下适应度函数作为评估标准:
Figure GDA0003385847920000073
其中,F为辨识过程中作业对象的实际受力信息,
Figure GDA0003385847920000074
为第i个粒子位置作为接触动力学模型参数时的模型力输出;
S4.2、粒子群寻优目标为缩小该适应度函数,循环步骤S4.1,直至适应度函数达到可接受的范围0<J<0.016N,此时迭代完成后适应度最小的粒子的位置gbesti为所求的全局最优解,其粒子位置即为所辨识出的参数值。
进一步地,步骤5中,所述阻抗控制参考位置为机器人末端要达到期望接触力所需要法向移动的位置量;所述阻抗控制参考位置的自适应调整包括如下步骤:
S5.1、将所建立的接触动力学模型转化为如下线性化形式:
ln(F)-ln(k)=n·ln(xe-x);
其中ln(k)、n为已辨识参数,上述线性化后的接触动力学模型吗对应如下形式的时间平移算子多项式:
A(z-1)y(t)=z-dB(z-1)u(t)+C(z-1)ξ(t);
其中:
u=ln(xe-x);
y=ln(F)-ln(k);
Figure GDA0003385847920000081
其中ξ(t)为方差为σ2的噪声,
Figure GDA0003385847920000082
中na为系数A的阶数,
Figure GDA0003385847920000083
为对应的na阶系数,
Figure GDA0003385847920000084
中nb为系数B的阶数,
Figure GDA0003385847920000085
为对应的nb阶系数,
Figure GDA0003385847920000086
中nc为系数C的阶数,
Figure GDA0003385847920000087
为对应的nc阶系数;
被控对象t时刻和以前时刻的输入输出数据记作:
{Yt,Ut}={y(t),y(t-1),...,u(t),u(t-1),...};
d≥1为控制延时,基于t时刻的输入u(t)和输出y(t)所满足的接触动力学关系,对t+d时刻的输出的预测记作
Figure GDA0003385847920000088
则有预测误差如下:
Figure GDA0003385847920000089
S5.2、满足性能指标
Figure GDA00033858479200000810
(此处E为数学期望值)的d步最优预测输出y*(t+d|t)必满足方程如下:
C(z-1)y*(t+d|t)=G(z-1)y(t)+F(z-1)u(t);
其中,系数E、F、G式满足如下Deophantine方程:
C(z-1)=A(z-1)E(z-1)+z-dG(z-1);
F(z-1)=B(z-1)E(z-1);
Figure GDA00033858479200000811
其中
Figure GDA00033858479200000812
中ne为系数E的阶数,
Figure GDA00033858479200000813
为对应的ne阶系数,
Figure GDA00033858479200000814
中ng为系数G的阶数,
Figure GDA00033858479200000815
为对应的ng阶系数,
Figure GDA00033858479200000816
中nf为系数F的阶数,
Figure GDA00033858479200000817
为对应的nf阶系数;B(z-1)为Hurwitz多项式,设控制目标是使输出y(t+d)跟踪期望输出yr(t+d),yr=ln(Fr)-ln(k),要满足如下性能指标:
J=min{E[(y(t+d)-yr(t+d))2]};
则得最小方差控制律为:
F(z-1)u(t)=C(z-1)yr(t+d)-G(z-1)y(t);
根据最小方差控制律所得u(t)经转换即可得到调整后的参考位置:xr=xe-eu(t)
进一步地,步骤6中,所述位置控制内环为机器人自身的位置控制器,所述力反馈外环即通过力传感器测量机器人末端接触力,并反馈给其他控制器作为输出反馈。
与现有技术相比,本发明具有以下优点:
(1)本发明提出的自适应阻抗控制方法,基于接触动力学模型辨识作业对象的接触动力学参数,结合自校正控制策略指导阻抗控制参考位置的自适应调整,能够克服线弹性、非线弹性作业环境的力学特性未知性,实现精准力位协同控制的柔顺控制效果。
(2)本发明能够适用于金属、橡胶、肌肤等各类线弹性、非线弹性材料的打磨、装配、按摩、康复治疗等应用场景,具有一定实用价值。
(3)本发明提出的基于多源迁移学习的粒子群辨识算法不仅能够更好地适用于非线性接触动力学模型,所提迁移学习优化方法能够通过学习接触动力学模型参数与辨识算法运行参数之间的映射关系,进而获得针对目标任务的优化的辨识算法运行参数,提高了参数辨识系统在面向不同作业环境时的计算效率。
附图说明
图1为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法的控制流程图;
图2为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法的装置结构图;
图3为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中粒子群算法运行参数的多源迁移学习优化方法流程图;
图4为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中接触动力学模型参数的粒子群辨识算法流程图;
图5为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中的自校正阻抗控制系统控制流程图;
图6为本发明实施例中接触动力学模型拟合图线与实验采集数据的对比图,其中a数据来自为腓肠肌部位,b数据来自比目鱼肌部位;
图7为本发明实施例中智能自适应阻抗控制的机器人与肌肤稳态接触力图;
图8为本发明实施例中优化的粒子群辨识算法的计算效率对比图。
具体实施方式
下面将结合附图和实例对本发明的具体实施作进一步说明,但本发明的实施和保护不限于此。
实施例:
本实施例为面向肌肤作业的未知环境下机器人的智能自适应柔顺控制方法,如图1所示,包括以下步骤:
步骤1:在机器人目标作业路径内的作业对象上取少数局部采样点,机器人在局部采样点上进行法向运动采样得到机器人末端的受力数据与位置数据;
所述机器人作业路径,是指机器人与作业对象进行物理接触的应用场景下,提前规划的机器人末端执行器与作业对象进行接触的路径;所述少数局部采样点为同一肌肤区域中所取的作业路径上的1~2个路径点;所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力,工具坐标系原点位于机器人末端法兰盘中心,以法兰盘法向所指方向为工具坐标系z轴,x轴和y轴遵从“右手定则”,即右手拇指方向指向z轴时,右手食指方向为x轴,右手手腕方向为y轴;所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时,机器人末端相对于机器人基坐标系z轴的坐标,机器人基坐标系原点为机器人基座中心,以基座法向所指方向为坐标系z轴,x轴和y轴遵从上述“右手定则”。
所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取,且末端接触力和位置数据均以500HZ采样频率同时成对采集,即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。
步骤2:采用基于任务相似度的源任务筛选算法,基于接触动力学模型进行步骤1中获取的机器人末端的受力数据与位置数据作为目标任务样本,来与源任务信息库的任务相似度进行计算,并基于任务相似度进行源任务的筛选;
所述源任务信息库包括历史辨认任务储存的作业对象接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据;
所述接触动力学模型如下:
F=k(xe-x)n
其中F为作业对象的法向受力,k为弹性系数,n为幂指数项,x为作业对象变形时相对于机器人基坐标系z轴的位置,xe为作业对象未变形时相对于机器人基坐标系z轴的位置,基坐标系z轴与作业对象表面法向保持平行;当幂指数项n=1时接触动力学模型适用于线弹性材料,当不限定幂指数项数值时接触动力学模型既适用于线弹性材料,也适用于非线弹性柔顺材料;
所述作业对象接触动力学模型参数是指接触动力学模型中的不确定项:弹性系数k和幂指数项n;
所述粒子群辨识算法运行参数的运行参数是指粒子群算法的如下四个人为设定的运行参数:粒子最大移动速度vmax,局部学习因子c1、全局学习因子c2,惯性权重w。
如图3所示,所述基于任务相似度的源任务筛选算法包括如下步骤:
S2.1、定义任务空间的样本对比矩阵Bi,j
Figure GDA0003385847920000111
其中:Bi,j为两个任务样本i,j的对比矩阵;k(i,m),n(i,m)为样本i的第m组变化的环境接触动力学参数,即机器人在样本i上进行接触作业时,随着机器末端的移动,机器人与作业对象接触点发生变化,作业对象接触动力学模型参数按照(k(i,1),n(i,1)),(k(i,2),n(i,2))……(k(i,m),n(i,m))发生变化;类似地,k(j,m),n(j,m)为样本j的第m组变化的接触动力学模型参数;
S2.2、定义列间距评价因子Sij
Figure GDA0003385847920000112
Si,j=||D2,1-D1,1,D2,2-D1,2...D2,n-1-D1,n-1||;
其中,||...||为范数,列间距评价因子Si,j越小则说明两样本i,j的参数变化幅度越一致;
S2.3、定义行间距评价因子δi,j
δi,j=||k(j,1)-k(i,1),n(j,1)-n(i,1),k(j,2)-k(i,2),n(j,2)-n(i,2),...k(j,n)-k(i,n),n(j,n)-n(i,n)||;
其中,行间距评价因子δi,j越小说明两样本i,j在不计参数变化幅度的情况下参数直接差距越小;
S2.4、基于列间距评价因子Sij和行间距评价因子δi,j进行源任务筛选,定义总体任务相似度评价指标:
χi,j=Z1*Si,j+Z2i,j
其中Z1、Z2为大于0的修正因子,根据采样数值确定其大小,以避免由于数量级差距造成的数据偏向某一评价因子;χi,j越小则两任务样本i,j相似度越高;
S2.5、基于总体任务相似度评价指标进行源任务筛选:
以粒子群辨识算法确定步骤1中获取的目标任务局部采样点的接触动力学模型参数,然后计算目标任务与源任务的任务相似度评价指标χi,j并升序排列,从中取前z个源任务作为后续迁移学习的源任务,记为
Figure GDA0003385847920000121
其中,源任务ti包括该任务的粒子群辨识算法运行参数、辨识得到的接触动力学模型参数、和辨识算法迭代次数数据。
步骤3:以辨识速度为优化目标,通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化,得到适用于目标作业对象力学特征的辨识算法运行参数;
所述辨识速度具体是指粒子群辨识算法的迭代次数;所述通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化包括如下步骤:
S3.1、计算模型迁移图:
将源任务
Figure GDA0003385847920000122
中的所有源任务两两取出,记为ti和tj,i,j∈[1,z],进行任务ti对任务tj的粒子群运行参数迁移权值wij
wij=(Cj-Ci,j)/Cj
Cj表示任务tj的接触动力学模型mj在粒子群运行参数pj(vmax,c1,c2,w)控制下的辨识算法的辨识耗时;Ci,j表示接触动力学模型mj在任务ti的粒子群运行参数pi控制下的辨识算法的辨识耗时;所有任务两两之间的迁移权值wij构成了z×z维邻接迁移矩阵Az,矩阵元素定义如下:
Figure GDA0003385847920000123
采用模型迁移图G对迁移空间进行建模,G=(P,Az),其中
Figure GDA0003385847920000124
在面向新的作业对象进行参数辨识时,将其记为目标任务tz+1,然后将模型迁移图G拓展,使其包括目标任务tz+1:G=(P,Az+1);其中:
P=P∪{pz+1};
Figure GDA0003385847920000131
其中,w=(w1,w2,...wz)为源任务
Figure GDA0003385847920000132
的粒子群运行参数对目标任务tz+1的迁移权值;pz+1为目标任务在局部采样时所用的未优化粒子群运行参数;
S3.2、基于拓展模型迁移图的迁移函数学习:
迁移函数为每一个任务ti,分配一个针对其接触动力学模型mi的粒子群运行参数pi,拓展模型迁移图G=(P,Az+1)包括z+1个顶点与(z+1)×(z+1)个迁移权值,且拓展模型迁移图
Figure GDA0003385847920000133
与其图拉普拉斯矩阵
Figure GDA0003385847920000134
之间存在映射关系:D为模型迁移图
Figure GDA0003385847920000135
的度对角矩阵,将
Figure GDA0003385847920000136
进行特征分解
Figure GDA0003385847920000137
其中
Figure GDA0003385847920000138
Figure GDA0003385847920000139
的特征值对角矩阵,且有λ1≤λ2≤...≤λz+1,Q构成
Figure GDA00033858479200001310
的正交基向量矩阵;则必然存在一个(z+1)×4维的权值矩阵W,使得f=QW,取Q的前z行作为源任务的一组基,记作Q1,则采用最小二乘法,得到权值矩阵W各列元素:
Figure GDA00033858479200001311
其中f=(p1,p2......pz)T
Figure GDA00033858479200001312
是基于f的二阶导数惩罚项,用于抑制f中的高频部分以防止过拟合现象,f*,i表示矩阵f=(p1,p2......pn)T第i列的所有行,即*=1,2...z;
对上式进行求解即得:
Figure GDA00033858479200001313
求出权值矩阵W后,再利用迁移函数f=QW求得f,f的第(z+1)行转置后即得目标任务的优化迁移参数pz+1,即为适用于作业对象力学特征的辨识算法运行参数,在该优化参数控制下,粒子群辨识算法对目标任务的辨识速度将会得到有效提升。
步骤4:机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,实现柔顺接触,同时基于接触动力学模型,以步骤3中优化的运行参数控制粒子群辨识算法进行环境接触动力学模型参数辨识;
所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,是将作业对象表面位置xe输入阻抗控制期望位置xd,机器人阻抗控制的位置控制内环控制机器人按照期望位置xd运动,并将机器人末端接触力反馈给如下阻抗模型:
Figure GDA0003385847920000141
其中阻抗参数Md、Bd、Kd分别为期望阻抗模型的惯性矩阵、阻尼矩阵和刚度矩阵,F为反馈的实际接触力,x为机器人末端实际位置,xd为机器人期望轨迹点;
通过上述阻抗模型得出位置补偿量Δx=x-xd,令xd=xd+Δx,并循环上述控制和反馈补偿过程,直到接触力F≥1,即达到以阻抗参数控制的接触过程的柔顺性,避免机器人末端由未接触状态向接触状态过度过程中出现接触力冲击。
如图4所示,所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤:
S4.1、参数辨识对象为接触动力学模型中的参数k和参数n,在2维的目标搜索空间中,定义N个2维粒子xi=(k,n)组成群落,所有粒子按照如下迭代律进行更新:
Figure GDA0003385847920000142
Figure GDA0003385847920000143
其中k表示第k次迭代,c1为局部学习因子,c2为全局学习因子,c1、c2∈(0,1),w为惯性权重。vi表示第i个粒子的移动速度,pbesti表示第i个粒子曾经到过的最好位置,gbest表示整个粒子群迄今为止搜索到的最好位置;评判粒子好坏的依据是适应度函数,将作业对象实际受力与接触动力学模型的力输出作比较,二者之间的差距以如下适应度函数作为评估标准:
Figure GDA0003385847920000144
其中,F为辨识过程中作业对象的实际受力信息,
Figure GDA0003385847920000145
为第i个粒子位置作为接触动力学模型参数时的模型力输出;
S4.2、粒子群寻优目标为缩小该适应度函数,循环步骤S4.1,直至适应度函数达到可接受的范围0<J<0.016N,此时迭代完成后适应度最小的粒子的位置gbesti为所求的全局最优解,其粒子位置即为所辨识出的参数值。
步骤5:以辨识得到的接触动力学模型参数指导自校正调节器根据机器人末端接触力进行阻抗控制参考位置的自适应调整;
所述阻抗控制参考位置为机器人末端要达到期望接触力所需要法向移动的位置量;如图5所示,所述阻抗控制参考位置的自适应调整包括如下步骤:
S5.1、将所建立的接触动力学模型转化为如下线性化形式:
ln(F)-ln(k)=n·ln(xe-x);
其中ln(k)、n为已辨识参数,上述线性化后的接触动力学模型吗对应如下形式的时间平移算子多项式:
A(z-1)y(t)=z-dB(z-1)u(t)+C(z-1)ξ(t);
其中:
u=ln(xe-x);
y=ln(F)-ln(k);
Figure GDA0003385847920000151
其中ξ(t)为方差为σ2的噪声,
Figure GDA0003385847920000152
中na为系数A的阶数,
Figure GDA0003385847920000153
为对应的na阶系数,
Figure GDA0003385847920000154
中nb为系数B的阶数,
Figure GDA0003385847920000155
为对应的nb阶系数,
Figure GDA0003385847920000156
中nc为系数C的阶数,
Figure GDA0003385847920000157
为对应的nc阶系数;
被控对象t时刻和以前时刻的输入输出数据记作:
{Yt,Ut}={y(t),y(t-1),...,u(t),u(t-1),...};
d≥1为控制延时,基于t时刻的输入u(t)和输出y(t)所满足的接触动力学关系,对t+d时刻的输出的预测记作
Figure GDA0003385847920000158
则有预测误差如下:
Figure GDA0003385847920000159
S5.2、满足性能指标
Figure GDA00033858479200001510
(此处E为数学期望值)的d步最优预测输出y*(t+d|t)必满足方程如下:
C(z-1)y*(t+d|t)=G(z-1)y(t)+F(z-1)u(t);
其中,系数E、F、G式满足如下Deophantine方程:
C(z-1)=A(z-1)E(z-1)+z-dG(z-1);
F(z-1)=B(z-1)E(z-1);
Figure GDA0003385847920000161
其中
Figure GDA0003385847920000162
中ne为系数E的阶数,
Figure GDA0003385847920000163
为对应的ne阶系数,
Figure GDA0003385847920000164
中ng为系数G的阶数,
Figure GDA0003385847920000165
为对应的ng阶系数,
Figure GDA0003385847920000166
中nf为系数F的阶数,
Figure GDA0003385847920000167
为对应的nf阶系数;B(z-1)为Hurwitz多项式,设控制目标是使输出y(t+d)跟踪期望输出yr(t+d),yr=ln(Fr)-ln(k),要满足如下性能指标:
J=min{E[(y(t+d)-yr(t+d))2]};
则得最小方差控制律为:
F(z-1)u(t)=C(z-1)yr(t+d)-G(z-1)y(t);
根据最小方差控制律所得u(t)经转换即可得到调整后的参考位置:xr=xe-eu(t)
步骤6:底层阻抗控制系统包括位置控制内环和力反馈外环,将自适应调整后的参考位置输入阻抗控制的位置控制内环,机器人位置控制器控制机器人末端按照参考位置运动,并将机器人末端接触力反馈给步骤5中的自校正调节器;
所述位置控制内环为机器人自身的位置控制器,所述力反馈外环即通过力传感器测量机器人末端接触力,并反馈给其他控制器作为输出反馈。
步骤7:机器人末端按照规划路径沿着作业对象表面切向运动,并循环步骤4中的环境接触动力学模型参数辨识及步骤5、步骤6,直到机器人末端按照规划的路径运动结束,实现未知环境下机器人的智能自适应柔顺控制。
图2为未知环境下机器人的智能自适应柔顺控制方法的装置结构图;本发明结合装置的应用步骤为:首先在PC主机5上运行采样程序;机器人控制柜4通过基于TCP/IP协议的远程通讯手段接收PC主机5的指令,控制UR3协作机器人3在肌肤即作业对象1上获取采样点进行法向位移采集获得采样点的受力数据与位置数据;将采样数据传送到PC主机5中控制系统的迁移学习模块;在PC主机5上运用本发明提出的多源迁移学习方法进行粒子群辨识算法运行参数优化;PC主机5按照规划的机器人末端运动路径将机器人位置指令发送给机器人控制柜4;UR3协作机器人3在阻抗控制算法控制下与肌肤作业对象1柔顺接触,同时以500HZ频率将UR3协作机器人3末端的末端接触力和位置数据信息经过控制柜发送给PC主机5,其中,所述末端接触力是由UR3协作机器人3末端的力传感器2采集到的;PC主机5接收UR3协作机器人3末端的末端接触力和位置数据信息,并传送到控制系统的粒子群参数辨识模块及自适应阻抗控制模块,对UR3协作机器人3末端的位置进行实时修正,得到满足期望力的UR3协作机器人3末端的参考位置并发送给机器人控制柜4;UR3协作机器人3按照参考位置进行运动并循环上一步骤,直至按规划路径结束运动。
图5为机器人自校正阻抗控制系统示意图,所述机器人自校正阻抗控制系统包括参数辨识模块、自适应调整模块、阻抗控制模块;将参数辨识模块辨识得到的接触动力学模型参数传入自适应调整模块进行Deophantine方程求解,得到跟踪期望接触力的最小方差控制律;按照最小方差控制律计算得到机器人末端位置作为阻抗控制参考位置xr输入阻抗控制模块,机器人按照参考位置进行移动并将末端力误差信息反馈给阻抗模型得到位置补偿,加上参考位置xr作为下一循环的期望轨迹xd;循环上述参数辨识模块、自适应调整模块、阻抗控制模块直到机器人末端按照路径规划与人体不再接触,任务结束。
为了验证本发明有效性,本实施例中,对人体腿部进行阻抗控制实验,具体步骤如下:
步骤Q1:在规划的机器人按压路径上取腿部比目鱼肌处和腓肠肌处取两点作为采样点,记为A、B两点,获取两采样点的力位数据:
Q1.1、将A点的三维坐标xe、机器人在A点的法向位移xf输入PC主机的通讯程序,传输给机器人控制柜;
Q1.2、机器人控制柜控制机器人运动到xe点并按垂直接触面方向向下移动xf,同时机器人力位传感器记录机器人末端的受力信息和位置信息,以500HZ频率发送给PC主机;
Q1.3、PC主机接收机器人控制柜反馈的机器人末端接触力和位置数据,并储存在F()、xz()数组;
Q1.4、PC主机将安全位置发送给机器人控制柜,控制机器人退出A点的物理接触;
Q1.5、对B点进行机器人末端接触力和位置数据的采集,步骤重复上述Q1.1~Q1.5;
步骤Q2:对获得的xz的每个记录值减去初始值xz(1),得到肌肤变形数据数组Δx(),根据数据(F,Δx),输入粒子群辨识程序进行肌肤接触动力学模型参数辨识;
步骤Q3:根据参数辨识模块辨识得到的采样点的肌肤接触动力学模型参数,输入多源迁移学习程序进行源任务筛选和粒子群运行参数优化,得到优化的粒子群算法运行参数;
步骤Q4:按照优化的参数设置粒子群算法运行参数,将A、B两处作业任务的期望接触力Fr设为3N和5N并输入自适应调整模块。
步骤Q5:将规划的机器人路径信息发送给控制柜,使机器人按运动路径与人体接触,同时开始在PC主机运行本发明所提出的自适应阻抗控制程序,实时计算机器人末端位置调整量并发送给控制柜,控制柜按照调整后的期望轨迹控制机器人位置移动,并采集机器人末端接触力和位置数据反馈给PC主机,输入到自适应阻抗控制程序的相应反馈数据接口,循环该步骤直至按规划路径结束运动。
图6为肌肤接触动力学模型拟合图线与实验采集数据的对比图,实验中粒子群辨识算法得到的肌肤接触动力学模型参数的拟合误差低于0.2N,表明所提辨识算法能够得到具有确定参数信息的、可精准反映作业对象受力-变形关系的接触动力学模型;图7为本实施例中机器人与肌肤稳态接触力示意图,接触力误差最终稳定在±0.5N之内,表明所提自适应阻抗控制系统能够准确跟踪期望接触力;图8为实验中优化的粒子群辨识算法的计算效率对比图,所提的粒子群算法运行参数优化方法使其辨识过程的迭代计算次数较标准粒子群算法下降了近35%,表明所提优化方法能够有效提高辨识算法的计算效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.未知环境下机器人的智能自适应柔顺控制方法,其特征在于,包括以下步骤:
步骤1:在机器人目标作业路径内的作业对象上取少数局部采样点,机器人在局部采样点上进行法向运动采样得到机器人末端的受力数据与位置数据;
步骤2:采用基于任务相似度的源任务筛选算法,基于环境接触动力学模型F=k(xe-x)n进行步骤1中获取的机器人末端的受力数据与位置数据作为目标任务样本,来与源任务信息库
Figure FDA0003385847910000011
的任务相似度进行计算,并基于任务相似度进行源任务的筛选;所述源任务信息库包括历史辨认任务储存的环境接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据;
所述环境接触动力学模型如下:
F=k(xe-x)n
其中F为作业对象的法向受力,k为弹性系数,n为幂指数项,x为作业对象变形时相对于机器人基坐标系z轴的位置,xe为作业对象未变形时相对于机器人基坐标系z轴的位置,基坐标系z轴与作业对象表面法向保持平行;当幂指数项n=1时环境接触动力学模型适用于线弹性材料,当不限定幂指数项数值时环境接触动力学模型既适用于线弹性材料,也适用于非线弹性柔顺材料;
所述环境接触动力学模型参数是指环境接触动力学模型中的不确定项:弹性系数k和幂指数项n;
所述粒子群辨识算法运行参数是指粒子群辨识算法的如下四个人为设定的运行参数:粒子最大移动速度vmax,局部学习因子c1、全局学习因子c2,惯性权重w;
步骤3:以辨识速度为优化目标,通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化,得到适用于目标作业对象力学特征的粒子群辨识算法运行参数;
步骤4:机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,实现柔顺接触,同时基于环境接触动力学模型,以步骤3中优化的粒子群辨识算法运行参数控制粒子群辨识算法进行环境接触动力学模型参数辨识;
步骤5:以辨识得到的环境接触动力学模型参数指导自校正调节器根据机器人末端接触力进行阻抗控制参考位置的自适应调整;
步骤6:底层阻抗控制系统包括位置控制内环和力反馈外环,将自适应调整后的参考位置输入阻抗控制的位置控制内环,机器人位置控制器控制机器人末端按照参考位置运动,并将机器人末端接触力反馈给步骤5中的自校正调节器;
步骤7:机器人末端按照规划路径沿着作业对象表面切向运动,并循环步骤4中的环境接触动力学模型参数辨识及步骤5、步骤6,直到机器人末端按照规划的路径运动结束,实现未知环境下机器人的智能自适应柔顺控制。
2.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤1中,所述机器人目标作业路径,是指机器人与作业对象进行物理接触的应用场景下,提前规划的机器人末端执行器与作业对象进行接触的路径;所述少数局部采样点为同一肌肤区域中所取的作业路径上的1~2个路径点;所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力,工具坐标系原点位于机器人末端法兰盘中心,以法兰盘法向所指方向为工具坐标系z轴,x轴和y轴遵从“右手定则”,即右手拇指方向指向z轴时,右手食指方向为x轴,右手手腕方向为y轴;所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时,机器人末端相对于机器人基坐标系z轴的坐标,机器人基坐标系原点为机器人基座中心,以基座法向所指方向为坐标系z轴,x轴和y轴遵从上述“右手定则”。
3.根据权利要求2所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取,且末端接触力和位置数据是以相同的采样频率同时成对采集,即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。
4.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤2中,所述基于任务相似度的源任务筛选算法包括如下步骤:
S2.1、定义任务空间的样本对比矩阵Bi,j
Figure FDA0003385847910000021
其中:Bi,j为两个任务样本i,j的对比矩阵;k(i,m),n(i,m)为样本i的第m组变化的环境接触动力学模型参数,即机器人在样本i上进行接触作业时,随着机器末端的移动,机器人与作业对象接触点发生变化,环境接触动力学模型参数按照(k(i,1),n(i,1)),(k(i,2),n(i,2))……(k(i,m),n(i,m))发生变化;k(j,m),n(j,m)为样本j的第m组变化的环境接触动力学模型参数;
S2.2、定义列间距评价因子Sij
Figure FDA0003385847910000031
Si,j=||D2,1-D1,1,D2,2-D1,2...D2,n-1-D1,n-1||;
其中,||...||为范数,列间距评价因子Si,j越小则说明两样本i,j的参数变化幅度越一致;
S2.3、定义行间距评价因子δi,j
δi,j=||k(j,1)-k(i,1),n(j,1)-n(i,1),k(j,2)-k(i,2),n(j,2)-n(i,2),...k(j,n)-k(i,n),n(j,n)-n(i,n)||;
其中,行间距评价因子δi,j越小说明两样本i,j在不计参数变化幅度的情况下参数直接差距越小;
S2.4、基于列间距评价因子Sij和行间距评价因子δi,j进行源任务筛选,定义总体任务相似度评价指标:
χi,j=Z1*Si,j+Z2i,j
其中Z1、Z2为大于0的修正因子,根据采样数值确定其大小,以避免由于数量级差距造成的数据偏向某一评价因子;χi,j越小则两任务样本i,j相似度越高;
S2.5、基于总体任务相似度评价指标进行源任务筛选:
以粒子群辨识算法确定步骤1中获取的目标任务局部采样点的环境接触动力学模型参数,然后计算目标任务与源任务的任务相似度评价指标χi,j并升序排列,从中取前z个源任务作为后续迁移学习的源任务,记为
Figure FDA0003385847910000032
其中,源任务ti包括该任务的粒子群辨识算法运行参数、辨识得到的环境接触动力学模型参数和辨识算法迭代次数数据。
5.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤3中,所述辨识速度具体是指粒子群辨识算法的迭代次数;所述通过图知识迁移学习算法进行粒子群辨识算法运行参数的优化包括如下步骤:
S3.1、计算模型迁移图:
将源任务
Figure FDA0003385847910000041
中的所有源任务两两取出,记为ti和tj,i,j∈[1,z],进行任务ti对任务tj的粒子群辨识算法运行参数迁移权值wij
wij=(Cj-Ci,j)/Cj
Cj表示任务tj的环境接触动力学模型mj在粒子群辨识算法运行参数pj(vmax,c1,c2,w)控制下的辨识算法的辨识耗时;Ci,j表示环境接触动力学模型mj在任务ti的粒子群辨识算法运行参数pi控制下的辨识算法的辨识耗时;所有任务两两之间的迁移权值wij构成了z×z维邻接迁移矩阵Az,矩阵元素定义如下:
Figure FDA0003385847910000042
采用模型迁移图G对迁移空间进行建模,G=(P,Az),其中
Figure FDA0003385847910000043
在面向新的作业对象进行参数辨识时,将其记为目标任务tz+1,然后将模型迁移图G拓展,使其包括目标任务tz+1
Figure FDA0003385847910000044
其中:
Figure FDA0003385847910000045
Figure FDA0003385847910000046
其中,
Figure FDA0003385847910000047
为源任务
Figure FDA0003385847910000048
的粒子群辨识算法运行参数对目标任务tz+1的迁移权值;pz+1为目标任务在局部采样时所用的未优化粒子群辨识算法运行参数;
S3.2、基于拓展模型迁移图的迁移函数学习:
迁移函数为每一个任务ti,分配一个针对其环境接触动力学模型mi的粒子群辨识算法运行参数pi,拓展模型迁移图
Figure FDA0003385847910000051
包括z+1个顶点与(z+1)×(z+1)个迁移权值,且拓展模型迁移图
Figure FDA0003385847910000052
与其图拉普拉斯矩阵
Figure FDA0003385847910000053
之间存在映射关系:D为模型迁移图
Figure FDA0003385847910000054
的度对角矩阵,将
Figure FDA0003385847910000055
进行特征分解
Figure FDA0003385847910000056
其中
Figure FDA0003385847910000057
Figure FDA0003385847910000058
的特征值对角矩阵,且有λ1≤λ2≤...≤λz+1
Figure FDA0003385847910000059
构成
Figure FDA00033858479100000510
的正交基向量矩阵;则必然存在一个(z+1)×4维的权值矩阵W,使得
Figure FDA00033858479100000511
即为迁移函数;取
Figure FDA00033858479100000512
的前z行作为源任务的一组基,记作Q1,则采用最小二乘法,得到权值矩阵W各列元素:
Figure FDA00033858479100000513
其中f=(p1,p2......pz)T
Figure FDA00033858479100000514
是基于f的二阶导数惩罚项,用于抑制f中的高频部分以防止过拟合现象,f*,i表示矩阵f=(p1,p2......pn)T第i列的所有行,即*=1,2...z;
对上式进行求解即得:
Figure FDA00033858479100000515
求出权值矩阵W后,利用迁移函数
Figure FDA00033858479100000516
求得
Figure FDA00033858479100000517
Figure FDA00033858479100000518
的第(z+1)行转置后即得目标任务的优化迁移参数
Figure FDA00033858479100000519
即为适用于作业对象力学特征的粒子群辨识算法运行参数,在该优化迁移参数控制下,粒子群辨识算法对目标任务的辨识速度将会得到有效提升。
6.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤4中,所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动,是将作业对象表面位置xe输入阻抗控制期望位置xd,机器人阻抗控制的位置控制内环控制机器人按照期望位置xd运动,并将机器人末端接触力反馈给如下阻抗模型:
Figure FDA00033858479100000520
其中阻抗参数Md、Bd、Kd分别为期望阻抗模型的惯性矩阵、阻尼矩阵和刚度矩阵,F为反馈的实际接触力,x为机器人末端实际位置,xd为机器人期望位置;
通过上述阻抗模型得出位置补偿量Δx=x-xd,令xd=xd+Δx,下发给机器人位置控制器,并循环上述阻抗控制和反馈补偿过程,直到接触力F≥1,即达到以阻抗参数控制的接触过程的柔顺性,避免机器人末端由未接触状态向接触状态过度过程中出现接触力冲击。
7.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤4中,所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤:
S4.1、参数辨识对象为环境接触动力学模型中的参数k和参数n,在2维的目标搜索空间中,定义N个2维粒子xi=(k,n)组成群落,所有粒子按照如下迭代律进行更新:
Figure FDA0003385847910000061
Figure FDA0003385847910000062
其中k表示第k次迭代,c1为局部学习因子,c2为全局学习因子,c1、c2∈(0,1),wpso为惯性权重;vi表示第i个粒子的移动速度,pbesti表示第i个粒子曾经到过的最好位置,gbest表示整个粒子群迄今为止搜索到的最好位置;评判粒子好坏的依据是适应度函数,将作业对象实际受力与环境接触动力学模型的力输出作比较,二者之间的差距以如下适应度函数作为评估标准:
Figure FDA0003385847910000063
其中,F为辨识过程中作业对象的实际受力信息,
Figure FDA0003385847910000064
为第i个粒子位置作为环境接触动力学模型参数时的模型力输出;
S4.2、粒子群寻优目标为缩小该适应度函数,循环步骤S4.1,直至适应度函数达到可接受的范围0<J<0.016N,此时迭代完成后适应度最小的粒子的位置gbesti为所求的全局最优解,其粒子位置即为所辨识出的参数值。
8.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤5中,所述阻抗控制参考位置为机器人末端要达到期望接触力所需要法向移动的位置量;所述阻抗控制参考位置的自适应调整包括如下步骤:
S5.1、将所建立的环境接触动力学模型转化为如下线性化形式:
ln(F)-ln(k)=n·ln(xe-x);
其中ln(k)、n为已辨识参数,上述线性化后的环境接触动力学模型对应如下形式的时间平移算子多项式:
A(z-1)y(t)=z-dB(z-1)u(t)+C(z-1)ξ(t);
其中:
u=ln(xe-x);
y=ln(F)-ln(k);
Figure FDA0003385847910000071
其中,ξ(t)为方差为σ2的噪声,
Figure FDA0003385847910000072
中na为系数A的阶数,
Figure FDA0003385847910000073
为对应的na阶系数,
Figure FDA0003385847910000074
中nb为系数B的阶数,
Figure FDA0003385847910000075
为对应的nb阶系数,
Figure FDA0003385847910000076
中nc为系数C的阶数,
Figure FDA0003385847910000077
为对应的nc阶系数;
被控对象t时刻和以前时刻的输入输出数据记作:
{Yt,Ut}={y(t),y(t-1),...,u(t),u(t-1),...};
d≥1为控制延时,基于t时刻的输入u(t)和输出y(t)所满足的接触动力学关系,对t+d时刻的输出的预测记作
Figure FDA0003385847910000078
则有预测误差如下:
Figure FDA0003385847910000079
S5.2、满足性能指标
Figure FDA00033858479100000710
的d步最优预测输出y*(t+d|t)必满足方程如下:
C(z-1)y*(t+d|t)=G(z-1)y(t)+F(z-1)u(t);
其中,此处
Figure FDA0003385847910000081
表示数学期望值;系数E(z-1)F(z-1)G(z-1)满足如下Deophantine方程:
C(z-1)=A(z-1)E(z-1)+z-dG(z-1);
F(z-1)=B(z-1)E(z-1);
Figure FDA0003385847910000082
其中,
Figure FDA0003385847910000083
中ne为系数E的阶数,
Figure FDA0003385847910000084
为对应的ne阶系数,
Figure FDA0003385847910000085
中ng为系数G的阶数,
Figure FDA0003385847910000086
为对应的ng阶系数,
Figure FDA0003385847910000087
中nf为系数F的阶数,
Figure FDA0003385847910000088
为对应的nf阶系数;B(z-1)为Hurwitz多项式,设控制目标是使输出y(t+d)跟踪期望输出yr(t+d),yr=ln(Fr)-ln(k),要满足如下性能指标:
J_controlAim=min{E[(y(t+d)-yr(t+d))2]};
则得最小方差控制律为:
F(z-1)u(t)=C(z-1)yr(t+d)-G(z-1)y(t);
根据最小方差控制律所得u(t)经转换即可得到调整后的参考位置:xr=xe-eu(t)
9.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法,其特征在于:步骤6中,所述位置控制内环为机器人自身的位置控制器,所述力反馈外环即通过力传感器测量机器人末端接触力,并反馈给其他控制器作为输出反馈。
CN202010226048.XA 2020-03-26 2020-03-26 未知环境下机器人的智能自适应柔顺控制方法 Expired - Fee Related CN111673733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010226048.XA CN111673733B (zh) 2020-03-26 2020-03-26 未知环境下机器人的智能自适应柔顺控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010226048.XA CN111673733B (zh) 2020-03-26 2020-03-26 未知环境下机器人的智能自适应柔顺控制方法

Publications (2)

Publication Number Publication Date
CN111673733A CN111673733A (zh) 2020-09-18
CN111673733B true CN111673733B (zh) 2022-03-29

Family

ID=72451356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010226048.XA Expired - Fee Related CN111673733B (zh) 2020-03-26 2020-03-26 未知环境下机器人的智能自适应柔顺控制方法

Country Status (1)

Country Link
CN (1) CN111673733B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112959321B (zh) * 2021-02-10 2022-03-11 桂林电子科技大学 基于改进pi结构的机器人柔性关节转换误差补偿方法
CN113110245B (zh) * 2021-05-17 2022-07-22 河南中烟工业有限责任公司 机器人的运行状态监测方法
CN115500954A (zh) * 2021-06-07 2022-12-23 深圳市精锋医疗科技股份有限公司 手术机器人及其臂的防碰撞方法、防碰撞系统
CN114434449B (zh) * 2022-04-02 2022-08-09 北京科技大学 一种新型粒子群自适应阻抗控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106272428A (zh) * 2016-09-13 2017-01-04 江苏大学 一种苹果采摘机器人末端执行器抓取力主动柔顺控制方法
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制系统及控制方法
CN110065070A (zh) * 2019-04-29 2019-07-30 华中科技大学 一种基于动力学模型的机器人自适应阻抗控制系统
CN110202574A (zh) * 2019-06-05 2019-09-06 南京航空航天大学 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法
CN110561438A (zh) * 2019-09-19 2019-12-13 华中科技大学 基于动力学参数辨识的工业机器人力/位柔顺控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106272428A (zh) * 2016-09-13 2017-01-04 江苏大学 一种苹果采摘机器人末端执行器抓取力主动柔顺控制方法
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制系统及控制方法
CN110065070A (zh) * 2019-04-29 2019-07-30 华中科技大学 一种基于动力学模型的机器人自适应阻抗控制系统
CN110202574A (zh) * 2019-06-05 2019-09-06 南京航空航天大学 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法
CN110561438A (zh) * 2019-09-19 2019-12-13 华中科技大学 基于动力学参数辨识的工业机器人力/位柔顺控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于图知识迁移的蚁群算法参数选择";王雪松等;《控制与决策》;20111231;第1855-1860页 *
"基于自适应粒子群遗传算法的柔性关节机器人动力学参数辨识";王跃灵等;《计量学报》;20200131;第60-66页 *

Also Published As

Publication number Publication date
CN111673733A (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN111673733B (zh) 未知环境下机器人的智能自适应柔顺控制方法
Xu et al. Compare contact model-based control and contact model-free learning: A survey of robotic peg-in-hole assembly strategies
Su et al. An incremental learning framework for human-like redundancy optimization of anthropomorphic manipulators
Wang et al. A framework of hybrid force/motion skills learning for robots
Jiang et al. A review of robotic assembly strategies for the full operation procedure: Planning, execution and evaluation
Huang et al. Learning a real time grasping strategy
CN109702740B (zh) 机器人柔顺性控制方法、装置、设备及存储介质
Sutanto et al. Learning latent space dynamics for tactile servoing
CN113341706B (zh) 基于深度强化学习的人机协作流水线系统
Graule et al. Somo: Fast and accurate simulations of continuum robots in complex environments
Wang et al. Pose accuracy compensation of mobile industry robot with binocular vision measurement and deep belief network
Hu et al. Robot positioning error compensation method based on deep neural network
CN113910218B (zh) 一种基于运动学与深度神经网络融合的机器人标定方法和装置
Skoglund et al. Programming-by-Demonstration of reaching motions—A next-state-planner approach
Gao et al. Time-optimal trajectory planning of industrial robots based on particle swarm optimization
Zhang et al. Deep learning reactive robotic grasping with a versatile vacuum gripper
Oller et al. Manipulation via membranes: High-resolution and highly deformable tactile sensing and control
Gullapalli Learning control under extreme uncertainty
Yan et al. Hierarchical policy learning with demonstration learning for robotic multiple peg-in-hole assembly tasks
CN115091467A (zh) 一种基于模糊Petri网的意图预测与消歧方法及系统
CN114952791A (zh) 肌肉骨骼机器人控制方法及装置
Yang et al. Seq2Seq Imitation Learning for Tactile Feedback-based Manipulation
Adel et al. End-effector position estimation and control of a flexible interconnected industrial manipulator using machine learning
Chen et al. Robust Zhang neural network for tracking control of parallel robot manipulators with unknown parameters
Wang et al. Optimizing Robot Arm Reaching Ability with Different Joints Functionality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220329