CN111673733B

CN111673733B - 未知环境下机器人的智能自适应柔顺控制方法

Info

Publication number: CN111673733B
Application number: CN202010226048.XA
Authority: CN
Inventors: 翟敬梅; 曾献文
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2022-03-29
Anticipated expiration: 2040-03-26
Also published as: CN111673733A

Abstract

本发明提供一种未知环境下机器人的智能自适应柔顺控制方法。所述方法通过图知识迁移学习优化粒子群运行参数，基于优化的粒子群辨识算法对环境接触动力学模型进行参数辨识，同时基于参数辨识结果指导阻抗控制参考位置的自校正调整以实现未知环境下精准力位双重控制的柔顺控制效果。本发明融合了基于接触动力学模型的粒子群辨识算法、阻抗控制参考位置的自校正调整，对于线弹性和非线弹性材料，都能克服其力学特性未知性，实现精准力位协同控制；提出粒子群运行参数的迁移学习优化方法，从历史辨识任务中学习辨识算法运行参数知识，进而针对目标辨识任务特征获得优化的粒子群辨识算法运行参数，提高了参数辨识系统在面向不同未知环境时的计算效率。

Description

未知环境下机器人的智能自适应柔顺控制方法

技术领域

本发明属于机器人的力位双重控制领域，具体涉及未知环境下机器人的智能自适应柔顺控制方法。

背景技术

随着“中国制造2025”制造强国战略的不断推进，机器人已经在工业、服务业领域获得越来越广泛的应用，所面临的工作任务也不再仅仅需要位置控制，在面对诸多作业场合如机器人打磨、装配作业、人体按摩、康复治疗作业时，需要进行机器人位置和力的双重控制如阻抗控制。上述作业往往面对作业环境未知的问题：一方面作业对象既有线弹性特征的材料，也有非线性弹性特征的柔顺材料；另一方面，即使同一材料的作业对象，不同区域的力学特性往往由于生物体征、组织结构等因素而存在变化，作业环境的未知性往往导致阻抗控制力跟踪误差较大甚至失去力跟踪能力。上述问题给机器人控制提出了更高的要求，即机器人要智能识别、并跟踪辨识变化的环境特征，在此基础上进行自适应力位控制以满足恒力作业需求。

相关研究表明机器人力、位控制器如阻抗控制器的稳定性及精准性往往受到环境力学特性的直接影响，因此对环境接触动力学的研究能够有效改善机器人阻抗控制器力控制性能。相关研究在机器人柔顺控制中采用纯刚度模型(杜光月.仿人机械手中医按摩手法的建模与柔顺控制[D].济南:山东建筑大学,2012.)、Kelvin-Voigt模型(Ishii H,Koga H,Obokawa Y,et al.Development and Experimental Evaluation of OralRehabilitation Robot that Provides Maxillofacial Massage to Patients withOral Disorders[J].The International Journal of Robotics Research,2009,28(9):1228-1239.)描述机器人与环境之间的接触动力学特征，上述研究的接触动力学模型所描述的环境刚度是线性的，适用于线弹性材料特征，但对于柔顺材料，则无法描述其非线性弹性特征。

阻抗控制要求建立准确的机械手与环境之间的接触动力学模型，但即便得到作业对象的受力-变形的数学表达，其参数也会由于不同作业对象的材料种类、组织结构而存在彼此间不同；即便同一作业对象，其不同作业区域之间也可能由于材料分布等原因表现出不同的力学特性，上述问题带来接触动力学模型参数的未知性问题，加之实际工程应用中，机器人控制延时、信号噪声的影响，面向未知环境工作的阻抗控制器往往不能实现稳定力位跟踪控制效果，需要在经典控制的基础上进行自适应调整，相关研究(Clarke D.W,Gawthrop P.J.Self-tuning controller[J].Electrical Engineers Proceedings ofthe Institution of,1979,122(9):929-934.)采用自校正控制在未知环境下进行环境参数的在线辨识和控制量的预测调整，但其递推最小二乘辨识模块无法适用于非线性辨识对象。

相关研究(Diolaiti N,Melchiorri C,Stramigioli S.Contact impedanceestimation for robotic systems[J].IEEE Transactions on Robotics,2005,21(5):925-935.Haddadi A,Hashtrudi-Zaad K.Real-Time Identification of Hunt–CrossleyDynamic Models of Contact Environments[J].IEEE Transactions on Robotics,2012,28(3):555-566.)对非线性对象进行线性化处理，一定程度上解决了最小二乘辨识对非线性对象的适用性，但是工程实际中，信号采集往往伴随噪声，最小二乘法的最大缺陷就是对有色噪声、数据波动基本没有抗干扰能力，导致参数辨识精度不高甚至辨识失败，此缺陷极大地影响了该算法的广泛应用。神经网络、进化算法等人工智能算法在解决参数辨识问题时承认待辨识问题的复杂性和非线性，同时由于直接在解空间进行搜索来进行参数辨识，对环境噪声也具有较高鲁棒性。但神经网络往往需要进行大量离线训练，进化算法中遗传算法求解过程涉及到繁琐的编码、解码过程，计算量相对较大，粒子群算法虽然求解过程和计算量相对简单，但由于运行参数设置、并行计算特性等因素作用，粒子群算法计算量仍大于最小二乘类算法，会对系统计算效率产生不良影响。

为解决上述研究现状在面向未知环境时柔顺控制所面对的问题，本发明将会建立未知环境的接触动力学模型，并基于粒子群算法进行接触动力学模型参数辨识，同时根据参数辨识结果指导自校正控制器对阻抗控制参考位置进行自适应调整以保证未知环境下的力位跟踪能力，最后对于粒子群算法运行参数的设置问题，本发明基于图知识迁移学习进行粒子群运行参数的优化学习，从而提升粒子群算法在面向新的目标辨识任务时的辨识速度。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足，提供一种未知环境下机器人的智能自适应柔顺控制方法。

本发明的目的至少通过如下技术方案之一实现。

未知环境下机器人的智能自适应柔顺控制方法，包括以下步骤：

步骤1：在机器人目标作业路径内的作业对象上取少数局部采样点，机器人在局部采样点上进行法向运动采样得到机器人末端的受力数据与位置数据；

步骤2：采用基于任务相似度的源任务筛选算法，基于接触动力学模型进行步骤1中获取的机器人末端的受力数据与位置数据作为目标任务样本，来与源任务信息库的任务相似度进行计算，并基于任务相似度进行源任务的筛选；

步骤3：以辨识速度为优化目标，通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化，得到适用于目标作业对象力学特征的辨识算法运行参数；

步骤4：机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动，实现柔顺接触，同时基于接触动力学模型，以步骤3中优化的运行参数控制粒子群辨识算法进行环境接触动力学模型参数辨识；

步骤5：以辨识得到的接触动力学模型参数指导自校正调节器根据机器人末端接触力进行阻抗控制参考位置的自适应调整；

步骤6：底层阻抗控制系统包括位置控制内环和力反馈外环，将自适应调整后的参考位置输入阻抗控制的位置控制内环，机器人位置控制器控制机器人末端按照参考位置运动，并将机器人末端接触力反馈给步骤5中的自校正调节器；

步骤7：机器人末端按照规划路径沿着作业对象表面切向运动，并循环步骤4中的环境接触动力学模型参数辨识及步骤5、步骤6，直到机器人末端按照规划的路径运动结束，实现未知环境下机器人的智能自适应柔顺控制。

进一步地，步骤1中，所述机器人作业路径，是指机器人与作业对象进行物理接触的应用场景下，提前规划的机器人末端执行器与作业对象进行接触的路径；所述少数局部采样点为同一肌肤区域中所取的作业路径上的1～2个路径点；所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力，工具坐标系原点位于机器人末端法兰盘中心，以法兰盘法向所指方向为工具坐标系z轴，x轴和y轴遵从右手定则，即右手拇指方向指向z轴时，右手食指方向为x轴，右手手腕方向为y轴；所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时，机器人末端相对于机器人基坐标系z轴的坐标，机器人基坐标系原点为机器人基座中心，以基座法向所指方向为坐标系z轴，x轴和y轴遵从上述右手定则。

进一步地，所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取，且末端接触力和位置数据是以相同的采样频率同时成对采集，即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。

进一步地，步骤2中，所述源任务信息库包括历史辨认任务储存的作业对象接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据；

所述接触动力学模型如下：

F＝k(x_e-x)ⁿ；

其中F为作业对象的法向受力，k为弹性系数，n为幂指数项，x为作业对象变形时相对于机器人基坐标系z轴的位置，x_e为作业对象未变形时相对于机器人基坐标系z轴的位置，基坐标系z轴与作业对象表面法向保持平行；当幂指数项n＝1时接触动力学模型适用于线弹性材料，当不限定幂指数项数值时接触动力学模型既适用于线弹性材料，也适用于非线弹性柔顺材料；

所述作业对象接触动力学模型参数是指接触动力学模型中的不确定项：弹性系数k和幂指数项n；

所述粒子群辨识算法运行参数的运行参数是指粒子群算法的如下四个人为设定的运行参数：粒子最大移动速度v_max，局部学习因子c₁、全局学习因子c₂，惯性权重w。

进一步地，步骤2中，所述基于任务相似度的源任务筛选算法包括如下步骤：

S2.1、定义任务空间的样本对比矩阵B_i,j：

其中：B_i,j为两个任务样本i,j的对比矩阵；k_(i,m),n_(i,m)为样本i的第m组变化的环境接触动力学参数，即机器人在样本i上进行接触作业时，随着机器末端的移动，机器人与作业对象接触点发生变化，作业对象接触动力学模型参数按照(k_(i,1),n_(i,1))，(k_(i,2),n_(i,2))……(k_(i,m),n_(i,m))发生变化；类似地，k_(j,m),n_(j,m)为样本j的第m组变化的接触动力学模型参数；

S2.2、定义列间距评价因子S_ij：

S_i,j＝||D_2,1-D_1,1,D_2,2-D_1,2...D_2,n-1-D_1,n-1||；

其中，||...||为范数，列间距评价因子S_i,j越小则说明两样本i,j的参数变化幅度越一致；

S2.3、定义行间距评价因子δ_i,j：

δ_i,j＝||k_(j,1)-k_(i,1),n_(j,1)-n_(i,1),k_(j,2)-k_(i,2),n_(j,2)-n_(i,2),...k_(j,n)-k_(i,n),n_(j,n)-n_(i,n)||；

其中，行间距评价因子δ_i,j越小说明两样本i,j在不计参数变化幅度的情况下参数直接差距越小；

S2.4、基于列间距评价因子S_ij和行间距评价因子δ_i,j进行源任务筛选，定义总体任务相似度评价指标：

χ_i,j＝Z₁*S_i,j+Z₂*δ_i,j；

其中Z₁、Z₂为大于0的修正因子，根据采样数值确定其大小，以避免由于数量级差距造成的数据偏向某一评价因子；χ_i,j越小则两任务样本i,j相似度越高；

S2.5、基于总体任务相似度评价指标进行源任务筛选：

以粒子群辨识算法确定步骤1中获取的目标任务局部采样点的接触动力学模型参数，然后计算目标任务与源任务的任务相似度评价指标χ_i,j并升序排列，从中取前z个源任务作为后续迁移学习的源任务，记为

其中，源任务t_i包括该任务的粒子群辨识算法运行参数、辨识得到的接触动力学模型参数、和辨识算法迭代次数数据。

进一步地，步骤3中，所述辨识速度具体是指粒子群辨识算法的迭代次数；所述通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化包括如下步骤：

S3.1、计算模型迁移图：

将源任务

中的所有源任务两两取出，记为t_i和t_j，i,j∈[1,z]，进行任务t_i对任务t_j的粒子群运行参数迁移权值w_ij：

w_ij＝(C_j-C_i,j)/C_j；

C_j表示任务t_j的接触动力学模型m_j在粒子群运行参数p_j(v_max,c₁,c₂,w)控制下的辨识算法的辨识耗时；C_i,j表示接触动力学模型m_j在任务t_i的粒子群运行参数p_i控制下的辨识算法的辨识耗时；所有任务两两之间的迁移权值w_ij构成了z×z维邻接迁移矩阵A_z，矩阵元素定义如下：

采用模型迁移图G对迁移空间进行建模，G＝(P,A_z)，其中

在面向新的作业对象进行参数辨识时，将其记为目标任务t_z+1，然后将模型迁移图G拓展，使其包括目标任务t_z+1：G＝(P,A_z+1)；其中：

P＝P∪{p_z+1}；

其中，w＝(w₁,w₂,...w_z)为源任务

的粒子群运行参数对目标任务t_z+1的迁移权值；p_z+1为目标任务在局部采样时所用的未优化粒子群运行参数；

S3.2、基于拓展模型迁移图的迁移函数学习：

迁移函数为每一个任务t_i，分配一个针对其接触动力学模型m_i的粒子群运行参数p_i，拓展模型迁移图G＝(P,A_z+1)包括z+1个顶点与(z+1)×(z+1)个迁移权值，且拓展模型迁移图

与其图拉普拉斯矩阵

间存在映射关系：D为模型迁移图

的度对角矩阵，将

进行特征分解

其中

是

特征值对角矩阵，且有λ₁≤λ₂≤...≤λ_z+1，Q构成

的正交基向量矩阵；则必然存在一个(z+1)×4维的权值矩阵W，使得f＝QW，取Q的前z行作为源任务的一组基,记作Q₁，则采用最小二乘法，得到权值矩阵W各列元素：

其中f＝(p₁,p₂......p_z)^T，

是基于f的二阶导数惩罚项，用于抑制f中的高频部分以防止过拟合现象，f_*,i表示矩阵f＝(p₁,p₂......p_n)^T第i列的所有行，即*＝1,2...z；

对上式进行求解即得：

求出权值矩阵W后，再利用迁移函数f＝QW求得f,f的第(z+1)行转置后即得目标任务的优化迁移参数p_z+1，即为适用于作业对象力学特征的辨识算法运行参数，在该优化参数控制下，粒子群辨识算法对目标任务的辨识速度将会得到有效提升。

进一步地，步骤4中，所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动，是将作业对象表面位置x_e输入阻抗控制期望位置x_d，机器人阻抗控制的位置控制内环控制机器人按照期望位置x_d运动，并将机器人末端接触力反馈给如下阻抗模型：

其中阻抗参数M_d、B_d、K_d分别为期望阻抗模型的惯性矩阵、阻尼矩阵和刚度矩阵，F为反馈的实际接触力，x为机器人末端实际位置,x_d为机器人期望轨迹点；

通过上述阻抗模型得出位置补偿量Δx＝x-x_d，令x_d＝x_d+Δx，并循环上述控制和反馈补偿过程，直到接触力F≥1，即达到以阻抗参数控制的接触过程的柔顺性，避免机器人末端由未接触状态向接触状态过度过程中出现接触力冲击。

进一步地，步骤4中，所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤：

S4.1、参数辨识对象为接触动力学模型中的参数k和参数n，在2维的目标搜索空间中，定义N个2维粒子x_i＝(k,n)组成群落，所有粒子按照如下迭代律进行更新：

其中k表示第k次迭代，c₁为局部学习因子，c₂为全局学习因子，c₁、c₂∈(0,1)，w为惯性权重。v_i表示第i个粒子的移动速度，pbest_i表示第i个粒子曾经到过的最好位置，gbest表示整个粒子群迄今为止搜索到的最好位置；评判粒子好坏的依据是适应度函数，将作业对象实际受力与接触动力学模型的力输出作比较，二者之间的差距以如下适应度函数作为评估标准：

其中，F为辨识过程中作业对象的实际受力信息，

为第i个粒子位置作为接触动力学模型参数时的模型力输出；

S4.2、粒子群寻优目标为缩小该适应度函数，循环步骤S4.1，直至适应度函数达到可接受的范围0＜J＜0.016N，此时迭代完成后适应度最小的粒子的位置gbest_i为所求的全局最优解，其粒子位置即为所辨识出的参数值。

进一步地，步骤5中，所述阻抗控制参考位置为机器人末端要达到期望接触力所需要法向移动的位置量；所述阻抗控制参考位置的自适应调整包括如下步骤：

S5.1、将所建立的接触动力学模型转化为如下线性化形式：

ln(F)-ln(k)＝n·ln(x_e-x)；

其中ln(k)、n为已辨识参数，上述线性化后的接触动力学模型吗对应如下形式的时间平移算子多项式：

A(z^-1)y(t)＝z^-dB(z^-1)u(t)+C(z^-1)ξ(t)；

其中：

u＝ln(x_e-x)；

y＝ln(F)-ln(k)；

其中ξ(t)为方差为σ²的噪声，

中n_a为系数A的阶数，

为对应的n_a阶系数，

中n_b为系数B的阶数，

为对应的n_b阶系数，

中n_c为系数C的阶数，

为对应的n_c阶系数；

被控对象t时刻和以前时刻的输入输出数据记作：

{Y^t,U^t}＝{y(t),y(t-1),...,u(t),u(t-1),...}；

d≥1为控制延时，基于t时刻的输入u(t)和输出y(t)所满足的接触动力学关系，对t+d时刻的输出的预测记作

则有预测误差如下：

S5.2、满足性能指标

(此处E为数学期望值)的d步最优预测输出y^*(t+d|t)必满足方程如下：

C(z^-1)y^*(t+d|t)＝G(z^-1)y(t)+F(z^-1)u(t)；

其中，系数E、F、G式满足如下Deophantine方程：

C(z^-1)＝A(z^-1)E(z^-1)+z^-dG(z^-1)；

F(z^-1)＝B(z^-1)E(z^-1)；

其中

中n_e为系数E的阶数，

为对应的n_e阶系数，

中n_g为系数G的阶数，

为对应的n_g阶系数，

中n_f为系数F的阶数，

为对应的n_f阶系数；B(z^-1)为Hurwitz多项式，设控制目标是使输出y(t+d)跟踪期望输出y_r(t+d)，y_r＝ln(F_r)-ln(k)，要满足如下性能指标：

J＝min{E[(y(t+d)-y_r(t+d))²]}；

则得最小方差控制律为：

F(z^-1)u(t)＝C(z^-1)y_r(t+d)-G(z^-1)y(t)；

根据最小方差控制律所得u(t)经转换即可得到调整后的参考位置：x_r＝x_e-e^u(t)。

进一步地，步骤6中，所述位置控制内环为机器人自身的位置控制器，所述力反馈外环即通过力传感器测量机器人末端接触力，并反馈给其他控制器作为输出反馈。

与现有技术相比，本发明具有以下优点：

(1)本发明提出的自适应阻抗控制方法，基于接触动力学模型辨识作业对象的接触动力学参数，结合自校正控制策略指导阻抗控制参考位置的自适应调整，能够克服线弹性、非线弹性作业环境的力学特性未知性，实现精准力位协同控制的柔顺控制效果。

(2)本发明能够适用于金属、橡胶、肌肤等各类线弹性、非线弹性材料的打磨、装配、按摩、康复治疗等应用场景，具有一定实用价值。

(3)本发明提出的基于多源迁移学习的粒子群辨识算法不仅能够更好地适用于非线性接触动力学模型，所提迁移学习优化方法能够通过学习接触动力学模型参数与辨识算法运行参数之间的映射关系，进而获得针对目标任务的优化的辨识算法运行参数，提高了参数辨识系统在面向不同作业环境时的计算效率。

附图说明

图1为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法的控制流程图；

图2为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法的装置结构图；

图3为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中粒子群算法运行参数的多源迁移学习优化方法流程图；

图4为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中接触动力学模型参数的粒子群辨识算法流程图；

图5为本发明实施例中所述未知环境下机器人的智能自适应柔顺控制方法中的自校正阻抗控制系统控制流程图；

图6为本发明实施例中接触动力学模型拟合图线与实验采集数据的对比图，其中a数据来自为腓肠肌部位，b数据来自比目鱼肌部位；

图7为本发明实施例中智能自适应阻抗控制的机器人与肌肤稳态接触力图；

图8为本发明实施例中优化的粒子群辨识算法的计算效率对比图。

具体实施方式

下面将结合附图和实例对本发明的具体实施作进一步说明，但本发明的实施和保护不限于此。

实施例：

本实施例为面向肌肤作业的未知环境下机器人的智能自适应柔顺控制方法，如图1所示，包括以下步骤：

所述机器人作业路径，是指机器人与作业对象进行物理接触的应用场景下，提前规划的机器人末端执行器与作业对象进行接触的路径；所述少数局部采样点为同一肌肤区域中所取的作业路径上的1～2个路径点；所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力，工具坐标系原点位于机器人末端法兰盘中心，以法兰盘法向所指方向为工具坐标系z轴，x轴和y轴遵从“右手定则”，即右手拇指方向指向z轴时，右手食指方向为x轴，右手手腕方向为y轴；所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时，机器人末端相对于机器人基坐标系z轴的坐标，机器人基坐标系原点为机器人基座中心，以基座法向所指方向为坐标系z轴，x轴和y轴遵从上述“右手定则”。

所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取，且末端接触力和位置数据均以500HZ采样频率同时成对采集，即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。

所述源任务信息库包括历史辨认任务储存的作业对象接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据；

所述接触动力学模型如下：

F＝k(x_e-x)ⁿ；

如图3所示，所述基于任务相似度的源任务筛选算法包括如下步骤：

S2.1、定义任务空间的样本对比矩阵B_i,j：

S2.2、定义列间距评价因子S_ij：

S_i,j＝||D_2,1-D_1,1,D_2,2-D_1,2...D_2,n-1-D_1,n-1||；

S2.3、定义行间距评价因子δ_i,j：

χ_i,j＝Z₁*S_i,j+Z₂*δ_i,j；

S2.5、基于总体任务相似度评价指标进行源任务筛选：

所述辨识速度具体是指粒子群辨识算法的迭代次数；所述通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化包括如下步骤：

S3.1、计算模型迁移图：

将源任务

w_ij＝(C_j-C_i,j)/C_j；

采用模型迁移图G对迁移空间进行建模，G＝(P,A_z)，其中

P＝P∪{p_z+1}；

其中，w＝(w₁,w₂,...w_z)为源任务

S3.2、基于拓展模型迁移图的迁移函数学习：

与其图拉普拉斯矩阵

之间存在映射关系：D为模型迁移图

的度对角矩阵，将

进行特征分解

其中

是

的特征值对角矩阵，且有λ₁≤λ₂≤...≤λ_z+1，Q构成

其中f＝(p₁,p₂......p_z)^T，

对上式进行求解即得：

所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动，是将作业对象表面位置x_e输入阻抗控制期望位置x_d，机器人阻抗控制的位置控制内环控制机器人按照期望位置x_d运动，并将机器人末端接触力反馈给如下阻抗模型：

如图4所示，所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤：

其中，F为辨识过程中作业对象的实际受力信息，

为第i个粒子位置作为接触动力学模型参数时的模型力输出；

所述阻抗控制参考位置为机器人末端要达到期望接触力所需要法向移动的位置量；如图5所示，所述阻抗控制参考位置的自适应调整包括如下步骤：

S5.1、将所建立的接触动力学模型转化为如下线性化形式：

ln(F)-ln(k)＝n·ln(x_e-x)；

A(z^-1)y(t)＝z^-dB(z^-1)u(t)+C(z^-1)ξ(t)；

其中：

u＝ln(x_e-x)；

y＝ln(F)-ln(k)；

其中ξ(t)为方差为σ²的噪声，

中n_a为系数A的阶数，

为对应的n_a阶系数，

中n_b为系数B的阶数，

为对应的n_b阶系数，

中n_c为系数C的阶数，

为对应的n_c阶系数；

被控对象t时刻和以前时刻的输入输出数据记作：

{Y^t,U^t}＝{y(t),y(t-1),...,u(t),u(t-1),...}；

则有预测误差如下：

S5.2、满足性能指标

C(z^-1)y^*(t+d|t)＝G(z^-1)y(t)+F(z^-1)u(t)；

其中，系数E、F、G式满足如下Deophantine方程：

C(z^-1)＝A(z^-1)E(z^-1)+z^-dG(z^-1)；

F(z^-1)＝B(z^-1)E(z^-1)；

其中

中n_e为系数E的阶数，

为对应的n_e阶系数，

中n_g为系数G的阶数，

为对应的n_g阶系数，

中n_f为系数F的阶数，

J＝min{E[(y(t+d)-y_r(t+d))²]}；

则得最小方差控制律为：

F(z^-1)u(t)＝C(z^-1)y_r(t+d)-G(z^-1)y(t)；

所述位置控制内环为机器人自身的位置控制器，所述力反馈外环即通过力传感器测量机器人末端接触力，并反馈给其他控制器作为输出反馈。

图2为未知环境下机器人的智能自适应柔顺控制方法的装置结构图；本发明结合装置的应用步骤为：首先在PC主机5上运行采样程序；机器人控制柜4通过基于TCP/IP协议的远程通讯手段接收PC主机5的指令，控制UR3协作机器人3在肌肤即作业对象1上获取采样点进行法向位移采集获得采样点的受力数据与位置数据；将采样数据传送到PC主机5中控制系统的迁移学习模块；在PC主机5上运用本发明提出的多源迁移学习方法进行粒子群辨识算法运行参数优化；PC主机5按照规划的机器人末端运动路径将机器人位置指令发送给机器人控制柜4；UR3协作机器人3在阻抗控制算法控制下与肌肤作业对象1柔顺接触，同时以500HZ频率将UR3协作机器人3末端的末端接触力和位置数据信息经过控制柜发送给PC主机5，其中，所述末端接触力是由UR3协作机器人3末端的力传感器2采集到的；PC主机5接收UR3协作机器人3末端的末端接触力和位置数据信息，并传送到控制系统的粒子群参数辨识模块及自适应阻抗控制模块，对UR3协作机器人3末端的位置进行实时修正，得到满足期望力的UR3协作机器人3末端的参考位置并发送给机器人控制柜4；UR3协作机器人3按照参考位置进行运动并循环上一步骤，直至按规划路径结束运动。

图5为机器人自校正阻抗控制系统示意图，所述机器人自校正阻抗控制系统包括参数辨识模块、自适应调整模块、阻抗控制模块；将参数辨识模块辨识得到的接触动力学模型参数传入自适应调整模块进行Deophantine方程求解，得到跟踪期望接触力的最小方差控制律；按照最小方差控制律计算得到机器人末端位置作为阻抗控制参考位置x_r输入阻抗控制模块，机器人按照参考位置进行移动并将末端力误差信息反馈给阻抗模型得到位置补偿，加上参考位置x_r作为下一循环的期望轨迹x_d；循环上述参数辨识模块、自适应调整模块、阻抗控制模块直到机器人末端按照路径规划与人体不再接触，任务结束。

为了验证本发明有效性，本实施例中，对人体腿部进行阻抗控制实验，具体步骤如下：

步骤Q1：在规划的机器人按压路径上取腿部比目鱼肌处和腓肠肌处取两点作为采样点，记为A、B两点，获取两采样点的力位数据：

Q1.1、将A点的三维坐标x_e、机器人在A点的法向位移x_f输入PC主机的通讯程序，传输给机器人控制柜；

Q1.2、机器人控制柜控制机器人运动到x_e点并按垂直接触面方向向下移动x_f，同时机器人力位传感器记录机器人末端的受力信息和位置信息，以500HZ频率发送给PC主机；

Q1.3、PC主机接收机器人控制柜反馈的机器人末端接触力和位置数据，并储存在F()、x_z()数组；

Q1.4、PC主机将安全位置发送给机器人控制柜，控制机器人退出A点的物理接触；

Q1.5、对B点进行机器人末端接触力和位置数据的采集，步骤重复上述Q1.1～Q1.5；

步骤Q2：对获得的x_z的每个记录值减去初始值x_z(1)，得到肌肤变形数据数组Δx()，根据数据(F,Δx)，输入粒子群辨识程序进行肌肤接触动力学模型参数辨识；

步骤Q3：根据参数辨识模块辨识得到的采样点的肌肤接触动力学模型参数，输入多源迁移学习程序进行源任务筛选和粒子群运行参数优化，得到优化的粒子群算法运行参数；

步骤Q4：按照优化的参数设置粒子群算法运行参数，将A、B两处作业任务的期望接触力F_r设为3N和5N并输入自适应调整模块。

步骤Q5：将规划的机器人路径信息发送给控制柜，使机器人按运动路径与人体接触，同时开始在PC主机运行本发明所提出的自适应阻抗控制程序，实时计算机器人末端位置调整量并发送给控制柜，控制柜按照调整后的期望轨迹控制机器人位置移动，并采集机器人末端接触力和位置数据反馈给PC主机，输入到自适应阻抗控制程序的相应反馈数据接口，循环该步骤直至按规划路径结束运动。

图6为肌肤接触动力学模型拟合图线与实验采集数据的对比图，实验中粒子群辨识算法得到的肌肤接触动力学模型参数的拟合误差低于0.2N，表明所提辨识算法能够得到具有确定参数信息的、可精准反映作业对象受力-变形关系的接触动力学模型；图7为本实施例中机器人与肌肤稳态接触力示意图，接触力误差最终稳定在±0.5N之内，表明所提自适应阻抗控制系统能够准确跟踪期望接触力；图8为实验中优化的粒子群辨识算法的计算效率对比图，所提的粒子群算法运行参数优化方法使其辨识过程的迭代计算次数较标准粒子群算法下降了近35％，表明所提优化方法能够有效提高辨识算法的计算效率。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.未知环境下机器人的智能自适应柔顺控制方法，其特征在于，包括以下步骤：

步骤2：采用基于任务相似度的源任务筛选算法，基于环境接触动力学模型F＝k(x_e-x)ⁿ进行步骤1中获取的机器人末端的受力数据与位置数据作为目标任务样本，来与源任务信息库

的任务相似度进行计算，并基于任务相似度进行源任务的筛选；所述源任务信息库包括历史辨认任务储存的环境接触动力学模型参数、粒子群辨识算法运行参数和辨识算法迭代次数数据；

所述环境接触动力学模型如下：

F＝k(x_e-x)ⁿ；

其中F为作业对象的法向受力，k为弹性系数，n为幂指数项，x为作业对象变形时相对于机器人基坐标系z轴的位置，x_e为作业对象未变形时相对于机器人基坐标系z轴的位置，基坐标系z轴与作业对象表面法向保持平行；当幂指数项n＝1时环境接触动力学模型适用于线弹性材料，当不限定幂指数项数值时环境接触动力学模型既适用于线弹性材料，也适用于非线弹性柔顺材料；

所述环境接触动力学模型参数是指环境接触动力学模型中的不确定项：弹性系数k和幂指数项n；

所述粒子群辨识算法运行参数是指粒子群辨识算法的如下四个人为设定的运行参数：粒子最大移动速度v_max，局部学习因子c₁、全局学习因子c₂，惯性权重w；

步骤3：以辨识速度为优化目标，通过图知识迁移学习算法进行粒子群辨识算法的运行参数优化，得到适用于目标作业对象力学特征的粒子群辨识算法运行参数；

步骤4：机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动，实现柔顺接触，同时基于环境接触动力学模型，以步骤3中优化的粒子群辨识算法运行参数控制粒子群辨识算法进行环境接触动力学模型参数辨识；

步骤5：以辨识得到的环境接触动力学模型参数指导自校正调节器根据机器人末端接触力进行阻抗控制参考位置的自适应调整；

2.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：步骤1中，所述机器人目标作业路径，是指机器人与作业对象进行物理接触的应用场景下，提前规划的机器人末端执行器与作业对象进行接触的路径；所述少数局部采样点为同一肌肤区域中所取的作业路径上的1～2个路径点；所述机器人末端的受力数据是指机器人末端力传感器采集到的末端工具坐标系z轴方向接触力，工具坐标系原点位于机器人末端法兰盘中心，以法兰盘法向所指方向为工具坐标系z轴，x轴和y轴遵从“右手定则”，即右手拇指方向指向z轴时，右手食指方向为x轴，右手手腕方向为y轴；所述机器人末端的位置数据是指作业表面法向平行于机器人基坐标系z轴时，机器人末端相对于机器人基坐标系z轴的坐标，机器人基坐标系原点为机器人基座中心，以基座法向所指方向为坐标系z轴，x轴和y轴遵从上述“右手定则”。

3.根据权利要求2所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：所采集的机器人末端的接触力和位置数据由机器人远程通讯平台实时读取，且末端接触力和位置数据是以相同的采样频率同时成对采集，即记录每一时刻的机器人末端的末端接触力和该时刻机器人末端的位置数据。

4.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：步骤2中，所述基于任务相似度的源任务筛选算法包括如下步骤：

S2.1、定义任务空间的样本对比矩阵B_i,j：

其中：B_i,j为两个任务样本i,j的对比矩阵；k_(i,m),n_(i,m)为样本i的第m组变化的环境接触动力学模型参数，即机器人在样本i上进行接触作业时，随着机器末端的移动，机器人与作业对象接触点发生变化，环境接触动力学模型参数按照(k_(i,1),n_(i,1))，(k_(i,2),n_(i,2))……(k_(i,m),n_(i,m))发生变化；k_(j,m),n_(j,m)为样本j的第m组变化的环境接触动力学模型参数；

S2.2、定义列间距评价因子S_ij：

S_i,j＝||D_2,1-D_1,1,D_2,2-D_1,2...D_2,n-1-D_1,n-1||；

S2.3、定义行间距评价因子δ_i,j：

χ_i,j＝Z₁*S_i,j+Z₂*δ_i,j；

S2.5、基于总体任务相似度评价指标进行源任务筛选：

以粒子群辨识算法确定步骤1中获取的目标任务局部采样点的环境接触动力学模型参数，然后计算目标任务与源任务的任务相似度评价指标χ_i,j并升序排列，从中取前z个源任务作为后续迁移学习的源任务，记为

其中，源任务t_i包括该任务的粒子群辨识算法运行参数、辨识得到的环境接触动力学模型参数和辨识算法迭代次数数据。

5.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：步骤3中，所述辨识速度具体是指粒子群辨识算法的迭代次数；所述通过图知识迁移学习算法进行粒子群辨识算法运行参数的优化包括如下步骤：

S3.1、计算模型迁移图：

将源任务

中的所有源任务两两取出，记为t_i和t_j，i,j∈[1,z]，进行任务t_i对任务t_j的粒子群辨识算法运行参数迁移权值w_ij：

w_ij＝(C_j-C_i,j)/C_j；

C_j表示任务t_j的环境接触动力学模型m_j在粒子群辨识算法运行参数p_j(v_max,c₁,c₂,w)控制下的辨识算法的辨识耗时；C_i,j表示环境接触动力学模型m_j在任务t_i的粒子群辨识算法运行参数p_i控制下的辨识算法的辨识耗时；所有任务两两之间的迁移权值w_ij构成了z×z维邻接迁移矩阵A_z，矩阵元素定义如下：

采用模型迁移图G对迁移空间进行建模，G＝(P,A_z)，其中

在面向新的作业对象进行参数辨识时，将其记为目标任务t_z+1，然后将模型迁移图G拓展，使其包括目标任务t_z+1：

其中：

其中，

为源任务

的粒子群辨识算法运行参数对目标任务t_z+1的迁移权值；p_z+1为目标任务在局部采样时所用的未优化粒子群辨识算法运行参数；

S3.2、基于拓展模型迁移图的迁移函数学习：

迁移函数为每一个任务t_i，分配一个针对其环境接触动力学模型m_i的粒子群辨识算法运行参数p_i，拓展模型迁移图

包括z+1个顶点与(z+1)×(z+1)个迁移权值，且拓展模型迁移图

与其图拉普拉斯矩阵

之间存在映射关系：D为模型迁移图

的度对角矩阵，将

进行特征分解

其中

是

的特征值对角矩阵，且有λ₁≤λ₂≤...≤λ_z+1，

构成

的正交基向量矩阵；则必然存在一个(z+1)×4维的权值矩阵W，使得

即为迁移函数；取

的前z行作为源任务的一组基,记作Q₁，则采用最小二乘法，得到权值矩阵W各列元素：

其中f＝(p₁,p₂......p_z)^T，

对上式进行求解即得：

求出权值矩阵W后，利用迁移函数

求得

的第(z+1)行转置后即得目标任务的优化迁移参数

即为适用于作业对象力学特征的粒子群辨识算法运行参数，在该优化迁移参数控制下，粒子群辨识算法对目标任务的辨识速度将会得到有效提升。

6.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：步骤4中，所述机器人的阻抗控制算法控制机器人从未接触状态向作业对象进行法向接触运动，是将作业对象表面位置x_e输入阻抗控制期望位置x_d，机器人阻抗控制的位置控制内环控制机器人按照期望位置x_d运动，并将机器人末端接触力反馈给如下阻抗模型：

其中阻抗参数M_d、B_d、K_d分别为期望阻抗模型的惯性矩阵、阻尼矩阵和刚度矩阵，F为反馈的实际接触力，x为机器人末端实际位置,x_d为机器人期望位置；

通过上述阻抗模型得出位置补偿量Δx＝x-x_d，令x_d＝x_d+Δx，下发给机器人位置控制器，并循环上述阻抗控制和反馈补偿过程，直到接触力F≥1，即达到以阻抗参数控制的接触过程的柔顺性，避免机器人末端由未接触状态向接触状态过度过程中出现接触力冲击。

7.根据权利要求1所述未知环境下机器人的智能自适应柔顺控制方法，其特征在于：步骤4中，所述粒子群辨识算法进行环境接触动力学模型参数辨识包括如下步骤：

S4.1、参数辨识对象为环境接触动力学模型中的参数k和参数n，在2维的目标搜索空间中，定义N个2维粒子x_i＝(k,n)组成群落，所有粒子按照如下迭代律进行更新：

其中k表示第k次迭代，c₁为局部学习因子，c₂为全局学习因子，c₁、c₂∈(0,1)，w_pso为惯性权重；v_i表示第i个粒子的移动速度，pbest_i表示第i个粒子曾经到过的最好位置，gbest表示整个粒子群迄今为止搜索到的最好位置；评判粒子好坏的依据是适应度函数，将作业对象实际受力与环境接触动力学模型的力输出作比较，二者之间的差距以如下适应度函数作为评估标准：