CN112428278B - 机械臂的控制方法、装置及人机协同模型的训练方法 - Google Patents

机械臂的控制方法、装置及人机协同模型的训练方法 Download PDF

Info

Publication number
CN112428278B
CN112428278B CN202011159428.2A CN202011159428A CN112428278B CN 112428278 B CN112428278 B CN 112428278B CN 202011159428 A CN202011159428 A CN 202011159428A CN 112428278 B CN112428278 B CN 112428278B
Authority
CN
China
Prior art keywords
human
mechanical arm
model
computer
pose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011159428.2A
Other languages
English (en)
Other versions
CN112428278A (zh
Inventor
段星光
田焕玉
温浩
田野
靳励行
孟繁盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202011159428.2A priority Critical patent/CN112428278B/zh
Publication of CN112428278A publication Critical patent/CN112428278A/zh
Priority to PCT/CN2021/082254 priority patent/WO2022088593A1/zh
Application granted granted Critical
Publication of CN112428278B publication Critical patent/CN112428278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J18/00Arms
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed

Abstract

本申请公开了一种机械臂的控制方法、装置及人机协同模型的训练方法。该机械臂的控制方法包括获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型;获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;根据所述最优轨迹对机械臂进行控制。本申请解决了机器人无法沿着人类意图的轨迹运动的问题。

Description

机械臂的控制方法、装置及人机协同模型的训练方法
技术领域
本申请涉及机械臂领域,具体而言,涉及一种机械臂的控制方法、装置及人机协同模型的训练方法。
背景技术
在骨科和穿刺机器人领域中,存在这样一类机器人,该机器人可以应用于手术领域,其与医生和和环境均有交互。这类机器人可以根据医生的交互力进行移动并对环境做功,然而,相关技术在面向特定轨迹进行拖动时(如圆弧,直线),机器人无法根据人类的表现行为来判断人类企图,使机器人无法沿着人类意图的轨迹运动,如何控制机器人以达到准确理解医生意图并优化机器人-医生的交互体验的目的,成为亟待解决的问题。
针对机器人无法沿着人类意图的轨迹运动的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种机械臂的控制方法,以解决机器人无法沿着人类意图的轨迹运动的问题。
为了实现上述目的,本申请提供了一种机械臂的控制方法、装置及人机协同模型的训练方法。
第一方面,本申请提供了一种机械臂的控制方法。
根据本申请的机械臂的控制方法包括:
获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型;
获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;
根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;
根据所述最优轨迹对机械臂进行控制。
进一步的,所述根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹包括:
通过模型预测控制MPC算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;
从所述多组随机轨迹中选择最优轨迹。
进一步的,所述从所述多组随机轨迹中选择最优轨迹包括:
从所述多组随机轨迹,通过最优轨迹控制算法,选择最优轨迹。
进一步的,所述根据所述最优轨迹对机械臂进行控制,包括:
获取机械臂的位置及姿态角运动信息;
对机械臂的位置及姿态角运动信息的法向分量,进行第一模式控制;
对机械臂的位置及姿态角运动信息的切向分量,进行第二模式控制;其中,所述第一模式为机械臂导纳大于所述第二模式的机械臂导纳的机器人引导模式;所述第二模式为人类导纳大于所述第一模式的人类导纳的人类引导模式。
第二方面,本申请提供了一种人机协同模型的训练方法,用于得到第一方面中的机械臂的控制方法中的人机协同模型。
根据本申请的人机协同模型的训练方法包括:
获取机械臂的多组人机交互力和所述多组人机交互力对应的多组机械臂位姿,所述多组人机交互力为多组原始人机交互力;
根据所述多组人机交互力和所述多组机械臂位姿,建立人机协同模型。
进一步的,在所述根据所述多组人机交互力和所述多组机械臂位姿,建立人机协同模型之后,所述方法还包括:
根据监督学习方法对人机协同模型进行优化。
第三方面,本申请提供了一种机械臂的控制装置。
根据本申请的机械臂的控制装置包括:
模型获取模块,用于获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型;
位姿获取模块,用于获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;
轨迹生成模块,用于根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;
控制模块,用于根据所述最优轨迹对机械臂进行控制。
进一步的,所述模型获取模块包括:
优化单元,用于根据对监督学习方法人机协同模型进行优化。
进一步的,所述轨迹生成模块包括:
随机轨迹生成单元,用于通过模型预测控制MPC算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;
最优轨迹生成单元,用于从所述多组随机轨迹中选择最优轨迹。
进一步的,所述最优轨迹生成单元还包括:
用于从所述多组随机轨迹,通过最优轨迹控制算法,选择最优轨迹。
进一步的,所述控制模块包括:
控制器控制单元,用于根据所述最优轨迹,通过机械臂的控制器对机械臂进行控制,其中,所述控制器包括对机械臂进行控制的内层控制器和对人机协同模型进行控制的外层控制器。
第四方面,本申请提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面提供的机械臂的控制方法和/或第二方面提供的人机协同模型的训练方法的步骤。
第五方面,本申请提供一种机器人,包括机械臂、传感器、控制器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的机械臂的控制方法和/或第二方面提供的人机协同模型的训练方法的步骤。
在本申请实施例中,通过人机协同模型确定当前时刻人机交互力对应的期望位姿,并根据机械臂当前时刻位姿和当前时刻人机交互力对应的期望位姿生成机械臂期望运动的最优轨迹,从而通过机械臂期望运动的最优轨迹对机械臂进行控制,达到了使机器人沿着人类意图的轨迹运动,从而实现了控制轨迹以达到准确理解医生意图并优化人机交互体验的技术效果进而解决了机器人无法沿着人类意图的轨迹运动的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的机械臂的控制方法的流程示意图;
图2是根据本申请实施例的人机协同模型训练方法的流程示意图;
图3是根据本申请实施例的机械臂的控制装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,该方法包括如下的步骤S11至步骤S14:
S11:获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型。
人机协同模型可以是机械臂的控制系统中预存的模型,也可以通过机器学习方法进行训练得到人机协同模型,也可以是通过机器学习方法训练后进行优化的人机协同模型。在该实施例中,示例的,人机协同模型为通过机器学习方法进行训练得到的,具体的训练方法以参见后面的实施例部分图2的说明。具体的,人机协同模型是经由高斯混合模型(Gaussian Mixture Model,以下简称为GMM)作为预训练的各种神经网络模型或高斯过程模型。
S12:获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿。
其中,人机交互力可以通过安装在机械臂上的力传感器直接获取。具体的,力传感器为多维力传感器。在该实施例中,示例的,力传感器通过三维力传感器或六维力传感器获取。将获取到的当前时刻的人机交互力输入至人机协同模型,可以得到预测的机械臂下一时刻的期望位姿。该期望位姿被应用于限定区域范围内路径切线方向的控制,且当期望位姿有较大偏离时退出该控制方法。人机交互力还可以为包含人机阻抗力的人机交互力。包含人机阻抗力的人机交互力先可以通过安装在机械臂上的力传感器获取,再对力传感器获取的力和对应的当前时刻位姿求解得到机械臂的虚拟约束(即人机阻抗力),从而可以通过对力传感器获取的人机交互力和求解得到的虚拟约束求和,确定包含人机阻抗力的人机交互力。
S13:根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂期运动的最优轨迹。
“根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹”具体为:通过模型预测控制(model predictive control,以下简称为MPC)算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;从所述多组随机轨迹中选择最优轨迹。
具体的,MPC是一种基于当前时刻的模型预测未来一段时间内的过程输出的,选取目标优化函数,预测未来输出序列并输出当前时刻控制量,下一时刻最新实测数据对前一时刻的过程输出序列进行反馈校正的算法。即,MPC可以使当前时刻的人机交互模型预测未来一段时间内输出的期望位姿。根据当前时刻的位姿和人机协同模型,可以通过MPC预测未来时间的期望位姿,并生成多组随机轨迹,并选择多组随机轨迹的最优轨迹。可选地,在该步骤中生成的机械臂运动的最优轨迹为在机械臂在限定区域范围内运动的最优轨迹,最优轨迹的特征是操作者在切线方向上可以控制前进、后退;但法线方向上由机器人自主控制。由于人类在切线上具有强控制能力,但在法线上机器人控制能力较强,操作者通过人机协同模型将期望位置传递给机械臂,机械臂通过跟踪期望位置在路径上的投影点实现拖动效果。
“从所述多组随机轨迹中选择最优轨迹”具体为:从所述多组随机轨迹,通过最优轨迹控制算法,选择最优轨迹。
具体的,选取最优轨迹可以通过线性二次型调节器算法、非线性二次型调节器(Iterative Linear Quadratic Regulator,以下简称iLQR)算法或微分动态规划进行确定,在此不进行限制。在该实施例中,示例的,选取最优轨迹通过最优轨迹控制算法中的iLQR算法进行确定。其中,iLQR算法可以得到状态非线性反馈的最优控制规律,易于构成闭环最优控制。即,通过iLQR算法可以确定多组随机轨迹中的最优轨迹。可选的,根据当前时刻位姿和当前时刻人机交互力的期望位姿在10ms至500ms间对运动轨迹(运动位置、速度)进行优化。其中,机器人在法线上具有关于位置的价值权重从而精准控制位置、在切线方向上人类具有较大的导纳值从而实现人类引导拖动。另外,人类在切线分量上比机器人的控制能力更强,但在法线分量上机器人的控制能力比人类更强。用户通过上述步骤中的人机协同模型将期望位置传递给机械臂,机械臂通过跟踪期望位置在路径上的投影点实现拖动效果。
S14:根据所述最优轨迹对机械臂进行控制。
“根据所述最优轨迹对机械臂进行控制”具体为:获取机械臂的位置及姿态角运动信息;对机械臂的位置及姿态角运动信息的法向分量,进行第一模式控制;对机械臂的位置及姿态角运动信息的切向分量,进行第二模式控制;其中,第一模式为机械臂导纳大于第二模式的机械臂导纳的机器人引导模式;第二模式为人类导纳大于第一模式的人类导纳的人类引导模式。
具体的,根据机器人动力学,通过机械臂实际运动的阻抗坐标系和机械臂期望运动的期望坐标系构建机械臂的误差反馈量,如式(1)所示:
Figure GDF0000018872000000071
其中,M(q)为机械臂在笛卡尔空间下的惯性矩阵,矩阵前三列单位为kg,后面所有的元素单位为Ns2/rad;q为关节角;x前三行单位为m,后面所有行对应的单位为rad;
Figure GDF0000018872000000072
为粘滞矩阵;g(q)为重力向量;fenv为环境交互力旋量,可以通过环境-机械臂交互的力传感器获取;f为人机交互力,可以通过上述步骤S11中的力传感器进行获取。
基于动力学表达,基于反馈线性化方法构建力控制器,完成对人类高刚度、对环境低刚度的机械臂内环表现。内环输入为阻抗坐标系位置和姿态,通过上述步骤中的iLQR方法可以机械臂各关节对应的运动最优轨迹,并根据式(1)的误差反馈量,进行分方向的控制。机械臂在路径跟踪过程中,当机械臂位置及姿态在法向子方向运动时,根据机器大导纳、用户小导纳对机械臂进行控制(即第一模式);当机械臂位置及姿态在切线子方向运动时,根据用户大导纳、机器小导纳对机械臂进行控制(即第二模式)。示例的,当根据人机协同模型得到期望位姿的预测Xt+1(0m,0.1m,0.1m,0.3°,0.1°,0.2°),可以根据用户大导纳、机器小导纳的原则对机械臂进行控制。其中,第一模式为机器人引导模式,第二模式为人类引导模式,第一模式和第二模式可以共存,但两种模式的运动方向不同。即,在法线方向上对机械臂进行第一模式控制;在切线方向上对机械臂进行第二模式控制。
从以上的描述中,可以看出,本发明实现了如下技术效果:
通过人机协同模型确定当前时刻人机交互力对应的期望位姿,从而可以确定机械臂当前时刻和预测时刻的预测位移,通过MPC生成预测位移的多组随机轨迹,再根据最优轨迹控制算法确定多组随机轨迹的最优轨迹,并获取机械臂的位置和姿态角运动信息,对机械臂进行控制,达到了使机器人沿着人类意图的轨迹运动的效果。
根据本申请实施例,还提供了一种用于得到上述机械臂的控制方法中的人机协同模型的方法,如图2所示,该人机协同模型训练方法包括如下的步骤S21、步骤S22:
S21:获取机械臂的多组人机交互力和所述多组人机交互力对应的多组机械臂位姿,所述多组人机交互力为多组原始人机交互力;
S22:根据所述多组人机交互力和所述多组机械臂位姿,建立人机协同模型。
人机交互力可以通过可以通过安装在机械臂上的力传感器直接获取。具体的,力传感器为多维力传感器。在该实施例中,示例的,力传感器通过六维力传感器获取。通过力传感器获取的训练力组包括X、Y、Z轴对应的三个训练力分量和三个训练力矩分量。机械臂位姿可以通过建立机械臂的包括X、Y、Z轴坐标系进行记录,具体的,机械臂位姿包括X、Y、Z轴对应的三个距离移动分量和三个角度移动分量。实例的,获取的人机交互力Wt(1N,0N,0N,0.1Nm,0.2Nm,0.3Nm),机械臂位姿Xt(0.01m,0.02m,0.01m,0.3°,0.4°,0.1°)。具体的,获取的多组人机交互力为3-5组。即,当获取的多组人机交互力为3组时,获取的机械臂位姿也为3组。人机交互力还可以为包含人机阻抗力的人机交互力。通过对力传感器获取的力和对应的当前时刻位姿求解得到的机械臂的虚拟约束(即人机阻抗力),从而可以通过对力传感器获取的人机交互力和求解得到的虚拟约束求和,确定包含人机阻抗力的人机交互力。
训练人机协同模型的模型输入可以为当前时刻的人机交互力和机械臂当前时刻位姿的采样值,也可以为当前时刻的人机交互力和机械臂期望位姿的采样值,并根据模型输入的采样值对人机协同模型进行训练。具体的,人机协同模型训练的网络模型可以是高斯混合模型(GaussianMixtureModel,以下简称为GMM)、贝叶斯网络模型、神经网络模型等,在此不进行限制。
具体的,步骤S21“获取机械臂的多组人机交互力和所述多组人机交互力对应的多组机械臂位姿”可以为在信赖区域下获取机械臂的多组人机交互力和所述多组人机交互力对应的多组机械臂位姿。其中,信赖区域是指为获取的人机交互力的力传感器的采样分布ps在预设KL散度阈值之间的区域,其中,KL散度指ps和人机协同模型之间的KL散度,如式(2)所示,KL散度可以表达为:
DKL(ps,pm)≤thKL (2)
其中,ps为力传感器的采样分布,ps由最大似然估计得到;pm为人机协同模型的模型分布,thKL为第一预设KL散度阈值,可以由用户进行设定,也可以由人机协同模型由机器学习方法通过用户在不同人机阻抗力的学习得到,(例如,第一预设KL散度阈值可以是-20)。
进一步的,在训练人机协同模型的模型之后,该方法还包括:判断人机协同模型是否为有效模型。
具体的,判断人机协同模型是否为有效模型,可以通过判断ps和pm之间的KL散度是否大于第二预设KL散度,若大于,则人机协同模型为有效模型。(例如,ps和pm之间的KL散度为-35,第二预设KL散度为-50,ps和pm之间的KL散度大于第二预设KL散度,则人机协同模型为有效模型)。
具体的,判断人机协同模型是否为有效模型,可以通过计算上述步骤中采集的人机交互力的似然度,并判断似然度是否大于第一预设似然度阈值,若大于,则人机协同模型为有效模型。例如,上述步骤中采集的人机交互力为W1(1N,0.5N,0N,0.1Nm,0.2Nm,0.3Nm);W2(2N,0.5N,0N,0.1Nm,0.2Nm,0.3Nm);W3(3N,0.5N,0N,0.1Nm,0.2Nm,0.3Nm),通过W1、W2、W3可以求解得到模型似然度=0.3,并判断第一预设似然度阈值是否小于模型似然度,若模型似然度大于模型似然度,则人机协同模型为有效模型(例如,模型似然度=5,第一预设似然度=2.5,模型似然度大于第一预设似然度,则人机协同模型为有效模型)。
进一步的,在所述根据所述多组人机交互力和所述多组机械臂位姿,建立人机协同模型之后,所述方法还包括:
根据监督学习方法对人机协同模型进行优化,生成优化后的人机协同模型。
利用监督学习方法对人机协同模型的参数进行优化包括采用先验信息,具体的,利用监督学习方法中的最大似然原理,对人机协同模型的参数进行优化,如式(3)所示,优化后的训练模型的对应参数为:
Figure GDF0000018872000000101
其中,pm为人机协同模型的模型分布,fh为通过力传感器获取的人机交互力,xd为机械臂位姿,t为当前时刻,t+1为下一时刻,θC为人机协同模型的参数。具体的,当人机协同模型为GMM时,θC为分模型序号;当人机协同模型为神经网络模型时,θC为连接节点无量纲权重。
示例的,在对人机协同模型的参数进行优化后,根据优化后的参数对人机协同模型进行优化。具体的,对人机协同模型不同的建模方式使用不同的优化方法,例如,当人机协同模型为GMM时,采用最大化(Expectation-Maximum,以下简称为EM)算法对人机协同模型进行优化;当人机协同模型为神经网络时,采用随机梯度下降(stochastic gradientdescent,以下简称为SGD)方法对人机人机协同模型进行优化。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述机械臂的控制方法的装置10,如图3所示,该机械臂的控制装置10包括:
模型获取模块11,用于获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型;
位姿获取模块12,用于获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;
轨迹生成模块13,用于根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;
控制模块14,用于根据所述最优轨迹对机械臂进行控制。
进一步的,所述模型获取模块11包括:
优化单元,用于根据监督学习方法对人机协同模型进行优化。
进一步的,所述轨迹生成模块13包括:
随机轨迹生成单元,用于通过模型预测控制MPC算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;
最优轨迹生成单元,用于从所述多组随机轨迹中选择最优轨迹。
进一步的,所述最优轨迹生成单元还包括:
用于从所述多组随机轨迹,通过最优轨迹控制算法,选择最优轨迹。
进一步的,所述控制模块14包括:
控制器控制单元,用于根据所述最优轨迹,通过机械臂的控制器对机械臂进行控制,其中,所述控制器包括对机械臂进行控制的内层控制器和对人机协同模型进行控制的外层控制器。
具体的,本实施例中各个模块的实现可以参考方法实施例中的相关实现,不再赘述。
从以上的描述中,可以看出,本申请实现了如下技术效果:
通过人机协同模型确定当前时刻人机交互力对应的期望位姿,从而可以确定机械臂当前时刻和预测时刻的预测位移,通过MPC生成预测位移的多组随机轨迹,再根据最优轨迹控制算法确定多组随机轨迹的最优轨迹,并获取机械臂的位置和姿态角运动信息,对机械臂进行控制,达到了使机器人沿着人类意图的轨迹运动的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (1)

1.一种机器人,其特征在于,包括:机械臂、传感器、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行机械臂的控制方法和/ 或人机协同模型的训练方法;
所述机械臂的控制方法,包括:
获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型,通过机器学习方法进行训练得到人机协同模型;训练人机协同模型的模型输入可以为当前时刻的人机交互力和机械臂当前时刻位姿的采样值,也可以为当前时刻的人机交互力和机械臂期望位姿的采样值,并根据模型输入的采样值对人机协同模型进行训练;
获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;
根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;
根据所述最优轨迹对机械臂进行控制;
所述最优轨迹的特征是操作者在切线方向上可以控制前进、后退;但法线方向上由机器人自主控制;
所述根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹包括:
通过模型预测控制MPC算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;
从所述多组随机轨迹中选择最优轨迹;
所述从所述多组随机轨迹中选择最优轨迹包括:
从所述多组随机轨迹,通过最优轨迹控制算法,选择最优轨迹;
所述根据所述最优轨迹对机械臂进行控制,包括:
获取机械臂的位置及姿态角运动信息;
对机械臂的位置及姿态角运动信息的法向分量,进行第一模式控制;
对机械臂的位置及姿态角运动信息的切向分量,进行第二模式控制;其中,所述第一模式为机械臂导纳大于所述第二模式的机械臂导纳的机器人引导模式;所述第二模式为人类导纳大于所述第一模式的人类导纳的人类引导模式;
根据机器人动力学,通过机械臂实际运动的阻抗坐标系和机械臂期望运动的期望坐标系构建机械臂的误差反馈量,如式所示:
Figure FDA0003863625450000021
其中,M(q)为机械臂在笛卡尔空间下的惯性矩阵,矩阵前三列单位为kg,后面所有的元素单位为Ns2/rad;q为关节角;x前三行单位为m,后面所有行对应的单位为rad;
Figure FDA0003863625450000022
为粘滞矩阵;g(q)为重力向量;fenv为环境交互力旋量,可以通过环境-机械臂交互的力传感器获取;f为人机交互力;
所述人机协同模型的训练方法包括:
在信赖区域下获取机械臂的多组人机交互力和所述多组人机交互力对应的多组机械臂位姿,其中,信赖区域是指为获取的人机交互力的力传感器的采样分布ps在预设KL散度阈值之间的区域,其中,KL散度指ps和人机协同模型之间的KL散度,如式所示,KL散度可以表达为:
DKL(ps,pm)≤thKL
其中,ps为力传感器的采样分布,ps由最大似然估计得到;pm为人机协同模型的模型分布,thKL为第一预设KL散度阈值,可以由用户进行设定,也可以由人机协同模型由机器学习方法通过用户在不同人机阻抗力的学习得到;
所述多组人机交互力和所述多组机械臂位姿,建立人机协同模型之后,所述方法还包括:
利用监督学习方法对人机协同模型的参数进行优化包括采用先验信息,具体的,利用监督学习方法中的最大似然原理,对人机协同模型的参数进行优化,如式所示,优化后的训练模型的对应参数为:
Figure FDA0003863625450000031
其中,pm为人机协同模型的模型分布,fh为通过力传感器获取的人机交互力,xd为机械臂位姿,t为当前时刻,t+1为下一时刻,θC为人机协同模型的参数,具体的,当人机协同模型为GMM时,θC为分模型序号;当人机协同模型为神经网络模型时,θC为连接节点无量纲权重;
所述机械臂的控制装置,包括:
模型获取模块,用于获取人机协同模型,其中所述人机协同模型为根据人机交互力确定机械臂期望位姿的模型;
位姿获取模块,用于获取当前时刻位姿,根据所述人机协同模型获取当前时刻人机交互力对应的期望位姿;
轨迹生成模块,用于根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿生成机械臂运动的最优轨迹;
控制模块,用于根据所述最优轨迹对机械臂进行控制;
所述轨迹生成模块包括:
随机轨迹生成单元,用于通过MPC算法,根据所述当前时刻位姿和所述当前时刻人机交互力对应的期望位姿,生成多组随机轨迹;
最优轨迹生成单元,从所述多组随机轨迹中选择最优轨迹;
所述机器人还包括,计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行所述的机械臂的控制方法和/或人机协同模型的训练方法。
CN202011159428.2A 2020-10-26 2020-10-26 机械臂的控制方法、装置及人机协同模型的训练方法 Active CN112428278B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011159428.2A CN112428278B (zh) 2020-10-26 2020-10-26 机械臂的控制方法、装置及人机协同模型的训练方法
PCT/CN2021/082254 WO2022088593A1 (zh) 2020-10-26 2021-03-23 机械臂的控制方法、装置及人机协同模型的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011159428.2A CN112428278B (zh) 2020-10-26 2020-10-26 机械臂的控制方法、装置及人机协同模型的训练方法

Publications (2)

Publication Number Publication Date
CN112428278A CN112428278A (zh) 2021-03-02
CN112428278B true CN112428278B (zh) 2022-11-15

Family

ID=74696144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011159428.2A Active CN112428278B (zh) 2020-10-26 2020-10-26 机械臂的控制方法、装置及人机协同模型的训练方法

Country Status (2)

Country Link
CN (1) CN112428278B (zh)
WO (1) WO2022088593A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112428278B (zh) * 2020-10-26 2022-11-15 北京理工大学 机械臂的控制方法、装置及人机协同模型的训练方法
CN113084814B (zh) * 2021-04-13 2022-05-10 中国科学院自动化研究所 基于分布位置优化实现肌肉骨骼机器人运动控制的方法
CN113177310B (zh) * 2021-04-25 2022-05-27 哈尔滨工业大学(深圳) 一种基于人体舒适度的机械臂抱人方法
CN113858201B (zh) * 2021-09-29 2023-04-25 清华大学 用于柔性驱动机器人的自适应变阻抗控制方法、系统与设备
CN113925607B (zh) * 2021-11-12 2024-02-27 上海微创医疗机器人(集团)股份有限公司 手术机器人操作训练方法、装置、系统、介质及设备
CN114147710B (zh) * 2021-11-27 2023-08-11 深圳市优必选科技股份有限公司 机器人的控制方法、装置、机器人及存储介质
CN114789443B (zh) * 2022-04-29 2024-02-23 广东工业大学 一种基于多源信息深度强化学习的机械臂控制方法及系统
CN114800523B (zh) * 2022-05-26 2023-12-01 江西省智能产业技术创新研究院 机械臂轨迹修正方法、系统、计算机及可读存储介质
CN114995132B (zh) * 2022-05-26 2023-01-17 哈尔滨工业大学(深圳) 一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质
CN115070764B (zh) * 2022-06-24 2023-05-23 中国科学院空间应用工程与技术中心 机械臂运动轨迹规划方法、系统、存储介质和电子设备
CN114800532B (zh) * 2022-06-27 2022-09-16 西南交通大学 机械臂控制参数确定方法、装置、设备、介质和机器人
CN115309044A (zh) * 2022-07-26 2022-11-08 福建工程学院 一种基于模型预测控制的机械臂角速度控制方法
CN116214527B (zh) * 2023-05-09 2023-08-11 南京泛美利机器人科技有限公司 一种增强人机协作适应性的三体协同智能决策方法和系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7741802B2 (en) * 2005-12-20 2010-06-22 Intuitive Surgical Operations, Inc. Medical robotic system with programmably controlled constraints on error dynamics
US8271132B2 (en) * 2008-03-13 2012-09-18 Battelle Energy Alliance, Llc System and method for seamless task-directed autonomy for robots
US8671005B2 (en) * 2006-11-01 2014-03-11 Microsoft Corporation Interactive 3D shortage tracking user interface
US20150294496A1 (en) * 2014-04-14 2015-10-15 GM Global Technology Operations LLC Probabilistic person-tracking using multi-view fusion
CN108027911A (zh) * 2015-07-29 2018-05-11 伊利诺斯工具制品有限公司 促进焊接即服务软件的系统及方法
US10213923B2 (en) * 2015-09-09 2019-02-26 Carbon Robotics, Inc. Robotic arm system and object avoidance methods
AU2017294796B2 (en) * 2016-07-15 2019-05-30 Fastbrick Ip Pty Ltd Brick/block laying machine incorporated in a vehicle
CN106406098B (zh) * 2016-11-22 2019-04-19 西北工业大学 一种机器人系统在未知环境下的人机交互控制方法
JP6390735B1 (ja) * 2017-03-14 2018-09-19 オムロン株式会社 制御システム
CN107121926A (zh) * 2017-05-08 2017-09-01 广东产品质量监督检验研究院 一种基于深度学习的工业机器人可靠性建模方法
CN106970594B (zh) * 2017-05-09 2019-02-12 京东方科技集团股份有限公司 一种柔性机械臂的轨迹规划方法
CN107457780B (zh) * 2017-06-13 2020-03-17 广州视源电子科技股份有限公司 控制机械臂运动的方法及装置、存储介质和终端设备
CN107202584B (zh) * 2017-07-06 2020-02-14 北京理工大学 一种行星精确着陆抗扰制导方法
CN108153153B (zh) * 2017-12-19 2020-09-11 哈尔滨工程大学 一种学习变阻抗控制系统及控制方法
CN108284444B (zh) * 2018-01-25 2021-05-11 南京工业大学 人机协作下基于Tc-ProMps算法的多模式人体动作预测方法
CN109048890B (zh) * 2018-07-13 2021-07-13 哈尔滨工业大学(深圳) 基于机器人的协调轨迹控制方法、系统、设备及存储介质
CN109048891B (zh) * 2018-07-25 2021-12-07 西北工业大学 基于自触发模型预测控制的中性浮力机器人姿态与轨迹控制方法
US20200089229A1 (en) * 2018-09-18 2020-03-19 GM Global Technology Operations LLC Systems and methods for using nonlinear model predictive control (mpc) for autonomous systems
CN109848983B (zh) * 2018-12-10 2020-07-28 华中科技大学 一种高顺应性人引导机器人协同作业的方法
CN110559082B (zh) * 2019-09-10 2020-07-31 深圳市精锋医疗科技有限公司 手术机器人及其机械臂的控制方法、控制装置
CN110524544A (zh) * 2019-10-08 2019-12-03 深圳前海达闼云端智能科技有限公司 一种机械臂运动的控制方法、终端和可读存储介质
CN110764416A (zh) * 2019-11-11 2020-02-07 河海大学 基于深度q网络的仿人机器人步态优化控制方法
CN111152220B (zh) * 2019-12-31 2021-07-06 浙江大学 一种基于人机融合的机械臂控制方法
CN111360839A (zh) * 2020-04-24 2020-07-03 哈尔滨派拉科技有限公司 一种基于运动轨迹的多构型机械臂分层级控制方法及系统
CN111660306B (zh) * 2020-05-27 2021-07-20 华中科技大学 一种基于操作者舒适度的机器人可变导纳控制方法及系统
CN111546315B (zh) * 2020-05-28 2022-11-29 济南大学 一种基于人机协作的机器人柔顺示教及再现方法
CN112428278B (zh) * 2020-10-26 2022-11-15 北京理工大学 机械臂的控制方法、装置及人机协同模型的训练方法

Also Published As

Publication number Publication date
CN112428278A (zh) 2021-03-02
WO2022088593A1 (zh) 2022-05-05

Similar Documents

Publication Publication Date Title
CN112428278B (zh) 机械臂的控制方法、装置及人机协同模型的训练方法
Lampe et al. Acquiring visual servoing reaching and grasping skills using neural reinforcement learning
Stulp et al. Reinforcement learning with sequences of motion primitives for robust manipulation
JP5750657B2 (ja) 強化学習装置、制御装置、および強化学習方法
JP5064524B2 (ja) 予測不可能で動的な複雑な環境において計画することを伴う自律型ロボット
Kartoun et al. A human-robot collaborative reinforcement learning algorithm
US20220305646A1 (en) Simulation-in-the-loop Tuning of Robot Parameters for System Modeling and Control
Ding et al. Collision avoidance with proximity servoing for redundant serial robot manipulators
CN112140101A (zh) 轨迹规划方法、装置及系统
CN114641375A (zh) 动态规划控制器
JP2022543926A (ja) ロボットシステムのためのデリバティブフリーモデル学習のシステムおよび設計
Schultz et al. Goal-predictive robotic teleoperation from noisy sensors
EP3911478A1 (en) System for emulating remote control of a physical robot
US20230286148A1 (en) Robot control parameter interpolation
JP2018089736A (ja) マスタスレーブシステム
CN114516060A (zh) 用于控制机器人装置的设备和方法
CN113814985B (zh) 一种机器人控制方法、控制柜及系统
CN113070878A (zh) 基于脉冲神经网络的机器人控制方法、机器人及存储介质
Medina et al. Considering human behavior uncertainty and disagreements in human–robot cooperative manipulation
JP7452657B2 (ja) 制御装置、制御方法及びプログラム
JP7263987B2 (ja) 制御装置、制御方法、及び制御プログラム
Khadivar et al. Adaptive fingers coordination for robust grasp and in-hand manipulation under disturbances and unknown dynamics
JP7416197B2 (ja) 制御装置、制御方法及びプログラム
Incremona et al. Experimental assessment of deep reinforcement learning for robot obstacle avoidance: a lpv control perspective
Tang et al. Robot-to-human handover with obstacle avoidance via continuous time recurrent neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant