CN115958606A - 机械臂避障轨迹规划方法、装置和电子设备 - Google Patents

机械臂避障轨迹规划方法、装置和电子设备 Download PDF

Info

Publication number
CN115958606A
CN115958606A CN202310035842.XA CN202310035842A CN115958606A CN 115958606 A CN115958606 A CN 115958606A CN 202310035842 A CN202310035842 A CN 202310035842A CN 115958606 A CN115958606 A CN 115958606A
Authority
CN
China
Prior art keywords
track
virtual force
gaussian mixture
model
mixture model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310035842.XA
Other languages
English (en)
Inventor
杨志华
董帅
邹昆
文琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China Zhongshan Institute
Original Assignee
University of Electronic Science and Technology of China Zhongshan Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China Zhongshan Institute filed Critical University of Electronic Science and Technology of China Zhongshan Institute
Priority to CN202310035842.XA priority Critical patent/CN115958606A/zh
Publication of CN115958606A publication Critical patent/CN115958606A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Manipulator (AREA)

Abstract

本申请提供一种机械臂避障轨迹规划方法、装置、电子设备和计算机可读存储介质,该方法的一具体实施方式包括:求取正向虚拟力轨迹和反向虚拟力轨迹;根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。该方法能够使新任务的避障轨迹在未知障碍信息的应用场景中满足避障要求,且其具有较大的调节幅度,能够较好地避开障碍。

Description

机械臂避障轨迹规划方法、装置和电子设备
技术领域
本申请涉及机械臂路径规划领域,具体而言,涉及一种机械臂避障轨迹规划方法、装置、电子设备和计算机可读存储介质。
背景技术
动态运动基元法(Dynamic Movement Primitive,简称DMP)是一种机械臂示教学习方法,其可以利用一个二阶模型来提取单条示教轨迹的信息,并将该示教轨迹编码为一个虚拟力。这样,对于新的任务,可以修改示教轨迹的起点信息和终点信息,并将虚拟力作用于该二阶模型,即可将示教轨迹迁移到新的任务,得到与示教轨迹形状相同的新轨迹。
高斯混合回归-动态运动基元法(Gaussian mixed regression-Dynamicmovement primitives,简称GMRDMP)是DMP和概率模型高斯混合模型(Gaussian mixedmodel,简称GMM)结合得到的方法,其利用DMP提取每条示教轨迹的虚拟力信息,并利用期望最大(expectation maximization,简称EM)算法来训练一个GMM学习多条轨迹信息。这样,对于新的任务,可以先用高斯混合回归(Gaussian mixed regression,简称GMR)还原出一条虚拟力轨迹,再将该虚拟力轨迹带入DMP模型,即可得到新任务的轨迹。
因此,在相关技术中存在利用GMP DMP得到新任务轨迹的方案。但在该方案中,GMPDMP只能基于已知障碍信息得到新任务轨迹,而由于避障现场所设置的摄像头视角有限或者机械臂没有相关信息采集功能,所以不便于获取障碍信息,继而导致GMP DMP不适用于未知障碍信息的应用场景。并且,该方案基于DMP模型的几个参数调整新任务的轨迹形状,使得轨迹形状的调节幅度较小,继而不能较好地避过障碍。
发明内容
本申请实施例的目的在于提供一种机械臂避障轨迹规划方法、装置、电子设备和计算机可读存储介质,用以使新任务的避障轨迹在未知障碍信息的应用场景中满足避障要求,且其具有较大的调节幅度,能够较好地避开障碍。
第一方面,本申请实施例提供了一种机械臂避障轨迹规划方法,该方法包括:求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。这样,能够使新任务的避障轨迹在未知障碍信息的应用场景中满足避障要求,且其具有较大的调节幅度,能够较好地避开障碍。
可选地,所述求取正向虚拟力轨迹和反向虚拟力轨迹,包括:基于动态运动基元法对应的计算式以及多条示教轨迹,确定对应的多条初始虚拟力轨迹;使用最大期望算法对所述多条初始虚拟力轨迹进行处理,得到初始高斯混合模型;利用高斯混合回归从所述初始高斯混合模型中还原出中间虚拟力轨迹,并将所述中间虚拟力轨迹、新任务的位置信息代入所述计算式,得到所述机械臂末端执行器的正向轨迹;在所述正向轨迹不满足避障要求时,将所述正向轨迹代入所述计算式中,得到所述正向虚拟力轨迹。这样,可以在已知多条示教轨迹的基础上,通过DMP计算式求取机械臂执行新任务时的正向轨迹。
可选地,所述求取正向虚拟力轨迹和反向虚拟力轨迹,还包括:获取所述新任务的位置信息;所述位置信息包括起点信息和终点信息;根据所述起点信息和所述终点信息得到所述新任务对应的直线路径,并对所述直线路径进行均匀采样,得到反向示教轨迹;将所述反向示教轨迹代入所述计算式,得到所述反向虚拟力轨迹。这样,可以使中间高斯混合模型的模型参数更加准确,以更利于规划出满足避障要求的避障轨迹。
可选地,所述根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数,包括:确定偏好参数;所述偏好参数表征使所述避障轨迹对应的虚拟力轨迹趋近于所述正向虚拟力轨迹或者所述反向虚拟力轨迹;根据所述偏好参数改进初始最大似然函数,得到所述中间高斯混合模型中的最大似然函数。这样,可以通过偏好参数改进初始最大似然函数,以赋予正向虚拟力轨迹和反向虚拟力轨迹对应的偏好程度,使避障轨迹对应的虚拟力轨迹能够位于两者之间,继而能够较好地避开障碍。
可选地,所述最大似然函数的表达式包括:
Figure BDA0004049238020000031
其中,λ表征所述偏好参数,λ的取值范围为[0,1];P表征概率密度函数,
Figure BDA0004049238020000032
表征所述中间高斯混合模型的模型参数,FM+1表征所述正向虚拟力轨迹,FM+2表征所述反向虚拟力轨迹。这样,通过该最大似然函数的表达式即可结合偏好参数以及中间高斯混合模型的模型参数权重值共同调节避障轨迹的形状,使得避障轨迹具有较大的调节幅度,能够较好地避开障碍。
可选地,基于以下步骤确定所述中间高斯混合模型对应的模型参数:基于初始高斯混合模型的模型参数,计算所述正向虚拟力轨迹以及所述反向虚拟力轨迹分别来自所述初始高斯混合模型的第K个子模型的概率;迭代计算每个子模型的期望、方差以及在所述初始高斯混合模型中发生的概率,得到所述中间高斯混合模型的模型参数。这样,可以基于初始高斯混合模型的模型参数,按照EM算法计算得到中间高斯混合模型的模型参数,此时的中间高斯混合模型也即已经收敛,继而可以用于引入模型参数的权重,得到目标高斯混合模型。
可选地,所述通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹,包括:在预设调整区间内调整所述模型参数的权重,得到连续变化且与所述示教轨迹形状一致的轨迹簇;将所述轨迹簇中满足避障要求的轨迹确定为所述避障轨迹。这样,机械臂基于满足避障要求的任一轨迹进行运动之后,均可以在未知障碍信息的应用场景中较好地避开障碍,顺利完成新任务。
第二方面,本申请实施例提供了一种机械臂避障轨迹规划装置,该装置包括:求取模块,用于求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;最大似然函数确定模块,用于根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;引入模块,用于在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;避障轨迹确定模块,用于根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。这样,能够使新任务的避障轨迹在未知障碍信息的应用场景中满足避障要求,且其具有较大的调节幅度,能够较好地避开障碍。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种机械臂避障轨迹规划方法的流程图;
图2为本申请实施例涉及的一种虚拟力轨迹分布示意图;
图3为本申请实施例提供的一种机械臂避障轨迹规划装置的结构框图;
图4为本申请实施例提供的一种用于执行机械臂避障轨迹规划方法的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
应当说明的是,在不冲突的情况下,本申请中的实施例或者实施例中的技术特征可以进行结合。
相关技术中,存在GMP DMP不适用于未知障碍信息的应用场景,以及由于新任务的轨迹形状的调节幅度较小而导致不能较好避开障碍的问题;为了解决该问题,本申请提供一种机械臂避障轨迹规划方法、装置、电子设备和计算机可读存储介质;进一步地,通过改进的期望最大算法训练中间高斯混合模型,并在该中间高斯混合模型收敛之后,引入模型参数的权重,以规划出新任务的轨迹。该轨迹能够在未知障碍信息的应用场景中满足避障要求,且具有较大的调节幅度,能够较好地避开障碍。
在一些应用场景中,上述机械臂避障轨迹规划方法可以应用于能够进行信息交互以及数据计算的服务器、终端或者云平台中。在这些应用场景中,上述的服务器、终端或者云平台可以预先与机械臂进行通信连接,以控制机械臂基于控制指令进行相关操作。上述控制指令例如可以包括指示机械臂根据避障轨迹运动。
以上相关技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。
请参考图1,其示出了本申请实施例提供的一种机械臂避障轨迹规划方法的流程图。如图1所示,该机械臂避障轨迹规划方法包括以下步骤101至步骤104。
步骤101,求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;
上述正向虚拟力轨迹例如可以视为通过DMP得到的虚拟力轨迹。也即,其可以通过机械臂的初始示教轨迹得到。在一些应用场景中,上述初始示教轨迹例如可以包括人工示教轨迹。
上述反向虚拟力轨迹例如可以视为不通过DMP得到的虚拟力轨迹,在一些应用场景中,反向虚拟力轨迹可以通过新任务的位置信息得到。该位置信息例如可以包括新任务的运动过程中所必经的多个位置的坐标信息。
步骤102,根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;
高斯混合模型,也即将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。继而,上述中间高斯混合模型可以视为将正向虚拟力轨迹以及反向虚拟力轨迹分解为若干的基于高斯概率密度函数形成的模型。
在一些应用场景中,在求取出正向虚拟力轨迹以及反向虚拟力轨迹之后,可以根据这两者确定中间高斯混合模型的最大似然函数。在这些应用场景中,例如可以将求取高斯概率密度函数的对数的函数作为最大似然函数。
步骤103,在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;
在一些应用场景中,在确定出中间高斯混合模型的最大似然函数之后,可以训练上述中间高斯混合模型,以使该中间高斯混合模型收敛。在这些应用场景中,可以在最大似然函数的函数值满足模型收敛要求时,视为该中间高斯混合模型收敛。上述模型收敛要求例如可以包括函数值小于预设收敛阈值(例如0.05、0.1等实质上可以视为模型参数随着最大似然函数的迭代计算变化较小的数值)。
中间高斯混合模型收敛之后,可以引入该中间高斯混合模型的模型参数对应的权重。上述模型参数例如可以包括每个中间高斯混合模型的子模型的期望、方差以及在中间高斯混合模型中发生的概率。在一些应用场景中,引入权重的模型参数例如可以为每个子模型的期望。
步骤104,根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。
在一些应用场景中,在确定出中间高斯混合模型的模型参数对应的权重之后,可以根据该模型参数对应的权重得到目标高斯混合模型对应的目标模型参数。例如,引入权重的模型参数为每个子模型的期望时,可以将每个子模型的期望与对应的权重相乘,以得到目标高斯混合模型中各个子模型的期望。
得到目标模型参数之后,也即可以视为确定出了目标高斯混合模型,继而可以将该目标高斯混合模型用于确定新任务的避障轨迹。
在本实施例中,可以通过期望最大算法训练得到中间高斯混合模型,并可以在该中间高斯混合模型收敛之后,引入其模型参数的权重得到目标高斯混合模型,以便于利用该目标高斯混合模型规划出机械臂执行新任务的避障轨迹。这样,在检测到机械臂执行新任务时传回的反馈信息(例如力传感器传回的力学量)时,可以根据反馈信息调节模型参数的权重值,以达到调节避障轨迹的目的。因此,本实施例可以不用预先获取障碍信息,就能够规划出机械臂执行新任务的避障轨迹。
并且,由于目标模型参数基于中间高斯混合模型的模型参数对应的权重得到,所以在调节权重值时,可以作用于基于目标高斯混合模型规划出的避障轨迹的外围邻近区域。因此,该避障轨迹具有较大的调节幅度。
也即,本实施例能够使新任务的避障轨迹在未知障碍信息的应用场景中满足避障要求,且其具有较大的调节幅度,能够较好地避开障碍。
在一些可选的实现方式中,上述步骤101中所述的求取正向虚拟力轨迹和反向虚拟力轨迹,包括以下子步骤:
子步骤1011,基于动态运动基元法对应的计算式以及多条示教轨迹,确定对应的多条初始虚拟力轨迹;
在一些应用场景中,在求取正向虚拟力轨迹时,可以基于动态运动基元法对应的计算式(下文简称DMP计算式)求取。该DMP计算式可以为
Figure BDA0004049238020000091
其中,X=[x,y,z]是机械臂末端执行器的位置变量,τ,α,β是常数,Xf是机械臂末端执行器的期望位置,F(s)=[fx(s),fy(s),fz(s)]T是待求解虚拟力,s是归一化以后的时间变量。s满足一阶系统。且,
Figure BDA0004049238020000092
其中,as为常数,s的初值可以为1,其可以从1单调减小,并最终收敛至0。
在这些应用场景中,可以等时间间隔获取M条长度为N的示教轨迹。该示教轨迹例如可以表示为:
Figure BDA0004049238020000093
将示教轨迹代入上述DMP计算式中,得到对应的多条初始虚拟力轨迹,该初始虚拟力轨迹例如可以表示为:
Figure BDA0004049238020000094
子步骤1012,使用最大期望算法对所述多条初始虚拟力轨迹进行处理,得到初始高斯混合模型;
确定出多条初始虚拟力轨迹之后,可以用最大期望算法(即EM算法)进行处理,以利用最大期望算法得到包含K个高斯分布的高斯混合模型(即初始高斯混合模型)。在一些应用场景中,上述K对应的取值例如可以包括3、5等数值。上述初始高斯混合模型例如可以表示为:
Figure BDA0004049238020000095
其中,uk可以表征每个子模型的期望、Σk可以表征每个子模型的方差,πk可以表征在模型中发生的概率,k可以表征子模型的个数。
子步骤1013,利用高斯混合回归从所述初始高斯混合模型中还原出中间虚拟力轨迹,并将所述中间虚拟力轨迹、新任务的位置信息代入所述计算式,得到所述机械臂末端执行器的正向轨迹;
得到初始高斯混合模型之后,可以进一步利用高斯混合回归从该初始高斯混合模型中还原出一条力的轨迹,该轨迹也即可以视为上述中间虚拟力轨迹,其例如可以表示为Frecover
继而,可以将该中间虚拟力轨迹、新任务的位置信息代入DMP计算式,即可得到机械臂末端执行器的轨迹。该轨迹也即可以视为上述正向轨迹,其例如可以表示为DM+1。在一些应用场景中,新任务的位置信息例如可以为新任务对应的起点坐标以及终点坐标。这样,可以将该起点坐标以及终点坐标代入DMP计算式中,并进行积分,以得到机械臂末端执行器的轨迹。
子步骤1014,在所述正向轨迹不满足避障要求时,将所述正向轨迹代入所述计算式中,得到所述正向虚拟力轨迹。
在一些应用场景中,得到机械臂末端执行器的正向轨迹之后,可以控制机械臂按照该正向轨迹运动,若机械臂的运动满足避障要求,可以将该正向轨迹确定为新任务的避障轨迹。
在另一些应用场景中,若机械臂的运动不满足避障要求,可以将正向轨迹代入DMP计算式中,以通过该DMP计算式计算出正向虚拟力轨迹,其例如可以表示为FM+1
在确定机械臂的运动是否满足避障要求时,例如可以通过摄像机采集运动图像,以通过查看该运动图像进行判定;例如也可以通过机械臂上安装的力传感器采集的受力信息确定是否遇到障碍进行判定。
在本实现方式中,可以在已知多条示教轨迹的基础上,通过DMP计算式求取机械臂执行新任务时的正向轨迹。
在一些可选的实现方式中,上述步骤101中所述的求取正向虚拟力轨迹和反向虚拟力轨迹,还可以包括以下子步骤:
子步骤1015,获取所述新任务的位置信息;所述位置信息包括起点信息和终点信息;
在一些应用场景中,在求取反向虚拟力轨迹时,可以先获取新任务的位置信息。该位置信息可以包括新任务对应的起点坐标和终点坐标。
子步骤1016,根据所述起点信息和所述终点信息得到所述新任务对应的直线路径,并对所述直线路径进行均匀采样,得到反向示教轨迹;
获取到新任务的起点坐标和终点坐标之后,可以确定两个坐标之间的直线路径,继而可以对该直线路径进行等步长均匀采样,得到针对于新任务的新示教轨迹,该新示教轨迹也即可以视为上述反向示教轨迹,其例如可以表示为DM+2
子步骤1017,将所述反向示教轨迹代入所述计算式,得到所述反向虚拟力轨迹。
得到反向示教轨迹之后,可以将该反向示教轨迹代入DMP计算式中,以通过DMP计算出对应的新虚拟力轨迹,该新虚拟力轨迹也即上述反向虚拟力轨迹,其例如可以表示为FM+2
在本实现方式中,可以通过新任务的位置信息确定出对应的直线路径,该直线路径也即可以视为执行新任务的最优路径,因此基于该直线路径所确定的反向示教轨迹可以视为机械臂执行新任务的最优轨迹。继而将基于其得到的反向虚拟力轨迹以及正向虚拟力轨迹用于确定中间高斯混合模型的最大似然函数之后,可以使中间高斯混合模型的模型参数更加准确,以更利于规划出满足避障要求的避障轨迹。
在一些可选的实现方式中,上述步骤102中所述的根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数,包括以下子步骤:
子步骤1021,确定偏好参数;所述偏好参数表征使所述避障轨迹对应的虚拟力轨迹趋近于所述正向虚拟力轨迹或者所述反向虚拟力轨迹;
在一些应用场景中,在确定最大似然函数时,可以确定偏好参数。该偏好参数可以使避障轨迹对应的虚拟力轨迹趋近于正向虚拟力轨迹或者反向虚拟力轨迹。例如,如图2所示,偏好参数可以使避障轨迹对应的虚拟力轨迹203趋近于正向虚拟力轨迹201或者反向虚拟力轨迹202。这样,偏好参数也即可以使避障轨迹趋近于正向轨迹或者反向示教轨迹。
在一些应用场景中,偏好参数对应的数值例如可以选取0、0.5、1。以使避障轨迹能够与正向轨迹或、反向示教轨迹重合,或者不偏向于任一轨迹,以使该避障轨迹更加贴合实际应用场景。此时,对应的模型参数可以包括:
Figure BDA0004049238020000121
子步骤1022,根据所述偏好参数改进初始最大似然函数,得到所述中间高斯混合模型中的最大似然函数。
上述初始最大似然函数也即对似然函数求对数得到的函数,其变量可以为上述正向虚拟力轨迹。
确定出偏好参数之后,可以根据该偏好参数改进初始最大似然函数。也即,在初始最大似然函数中添加变量反向虚拟力轨迹,并赋予正向虚拟力轨迹和反向虚拟力轨迹对应的偏好程度。例如,赋予正向虚拟力轨迹和反向虚拟力轨迹相同的偏好程度(也即,此时的偏好参数为0.5)。
在本实现方式中,可以通过偏好参数改进初始最大似然函数,以赋予正向虚拟力轨迹和反向虚拟力轨迹对应的偏好程度,使避障轨迹对应的虚拟力轨迹能够位于两者之间,继而能够较好地避开障碍。
在一些可选的实现方式中,所述最大似然函数的表达式包括:
Figure BDA0004049238020000122
其中,λ表征所述偏好参数,λ的取值范围为[0,1];P表征概率密度函数,
Figure BDA0004049238020000131
表征所述中间高斯混合模型的模型参数(θ={πkkk,k=1,2,…,K}),FM+1表征所述正向虚拟力轨迹,FM+2表征所述反向虚拟力轨迹。
在一些应用场景中,可以利用上述最大似然函数的表达式计算该最大似然函数的函数值,以判定中间高斯混合模型是否收敛。
在这些应用场景中,可以通过调节偏好参数的数值来调节避障轨迹的形状。这样,通过该最大似然函数的表达式即可结合偏好参数以及中间高斯混合模型的模型参数权重值共同调节避障轨迹的形状,使得避障轨迹具有较大的调节幅度,能够较好地避开障碍。
在一些可选的实现方式中,基于以下步骤确定所述中间高斯混合模型对应的模型参数:基于初始高斯混合模型的模型参数,计算所述正向虚拟力轨迹以及所述反向虚拟力轨迹分别来自所述初始高斯混合模型的第K个子模型的概率;迭代计算每个子模型的期望、方差以及在所述初始高斯混合模型中发生的概率,得到所述中间高斯混合模型的模型参数。
在一些应用场景中,可以通过EM算法计算中间高斯混合模型的模型参数。具体的,可以基于初始高斯混合模型的模型参数,分别计算正向虚拟力轨迹以及反向虚拟力轨迹来自于该初始高斯混合模型的第K个子模型的概率。并可以迭代计算出每个子模型的模型参数,继而得到中间高斯混合模型的模型参数。应当说明的是,EM算法具备收敛性,在一些应用场景中,当每个子模型的模型参数在连续几次迭代计算过程中的变化较小时,即可视为中间高斯混合模型收敛。
在这些应用场景中,通过EM算法计算中间高斯混合模型的模型参数(也即计算
Figure BDA0004049238020000132
的过程)可以通过以下计算过程实现:
(1)初始化参数;例如,可以将迭代计算的步骤数量初始化为1;也即,若以t表征该步骤数量,则可以令t=1;并可以初始化πk的值,例如
Figure BDA0004049238020000141
(2)求期望步骤;
具体的,此时可以令t=t+1,则可以得到正向虚拟力轨迹以及反向虚拟力轨迹分别来自初始高斯混合模型的第K个子模型的概率λ,该计算式可以包括:
Figure BDA0004049238020000142
其中,φ表征第k个子模型的高斯分布密度函数。
(3)求极大步骤;
具体的,此时中间高斯混合模型的各个模型参数的计算式可以包括:
Figure BDA0004049238020000143
Figure BDA0004049238020000144
在本实现方式中,可以基于初始高斯混合模型的模型参数,按照EM算法计算得到中间高斯混合模型的模型参数,此时的中间高斯混合模型也即已经收敛,继而可以用于引入模型参数的权重,得到目标高斯混合模型。
在一些应用场景中,若偏好参数的取值为0.5,则上述目标高斯混合模型对应的目标模型参数可以为:
Figure BDA0004049238020000145
在一些可选的实现方式中,上述步骤103中所述的通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹,包括:在预设调整区间内调整所述模型参数的权重,得到连续变化且与所述示教轨迹形状一致的轨迹簇;将所述轨迹簇中满足避障要求的轨迹确定为所述避障轨迹。
在一些应用场景中,在得到目标高斯混合模型的模型参数之后,可以通过调整权重值达到调整避障轨迹的目的。具体的,可以在预设调整区间内调整该权重值,以得到连续变化且与示教轨迹形状一致的轨迹簇。上述预设调整区间例如可以包括[-2,2]。
在这些应用场景中,在得到上述轨迹簇之后,可以将该轨迹簇中满足避障要求的轨迹确定为避障轨迹。这样,机械臂基于满足避障要求的任一轨迹进行运动之后,均可以在未知障碍信息的应用场景中较好地避开障碍,顺利完成新任务。
请参考图3,其示出了本申请实施例提供的一种机械臂避障轨迹规划装置的结构框图,该机械臂避障轨迹规划装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
可选地,上述机械臂避障轨迹规划装置包括求取模块301、最大似然函数确定模块302、引入模块303以及避障轨迹确定模块304。其中,求取模块301,用于求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;最大似然函数确定模块302,用于根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;引入模块303,用于在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;避障轨迹确定模块304,用于根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。
可选地,所述求取模块301进一步用于:基于动态运动基元法对应的计算式以及多条示教轨迹,确定对应的多条初始虚拟力轨迹;使用最大期望算法对所述多条初始虚拟力轨迹进行处理,得到初始高斯混合模型;利用高斯混合回归从所述初始高斯混合模型中还原出中间虚拟力轨迹,并将所述中间虚拟力轨迹、新任务的位置信息代入所述计算式,得到所述机械臂末端执行器的正向轨迹;在所述正向轨迹不满足避障要求时,将所述正向轨迹代入所述计算式中,得到所述正向虚拟力轨迹。
可选地,所述求取模块301还用于:获取所述新任务的位置信息;所述位置信息包括起点信息和终点信息;根据所述起点信息和所述终点信息得到所述新任务对应的直线路径,并对所述直线路径进行均匀采样,得到反向示教轨迹;将所述反向示教轨迹代入所述计算式,得到所述反向虚拟力轨迹。
可选地,所述最大似然函数确定模块302进一步用于:确定偏好参数;所述偏好参数表征使所述避障轨迹对应的虚拟力轨迹趋近于所述正向虚拟力轨迹或者所述反向虚拟力轨迹;根据所述偏好参数改进初始最大似然函数,得到所述中间高斯混合模型中的最大似然函数。
可选地,所述最大似然函数的表达式包括:
Figure BDA0004049238020000161
其中,λ表征所述偏好参数,λ的取值范围为[0,1];P表征概率密度函数,
Figure BDA0004049238020000162
表征所述中间高斯混合模型的模型参数,FM+1表征所述正向虚拟力轨迹,FM+2表征所述反向虚拟力轨迹。
可选地,基于以下步骤确定所述中间高斯混合模型对应的模型参数:基于初始高斯混合模型的模型参数,计算所述正向虚拟力轨迹以及所述反向虚拟力轨迹分别来自所述初始高斯混合模型的第K个子模型的概率;迭代计算每个子模型的期望、方差以及在所述初始高斯混合模型中发生的概率,得到所述中间高斯混合模型的模型参数。
可选地,所述避障轨迹确定模块304进一步用于:在预设调整区间内调整所述模型参数的权重,得到连续变化且与所述示教轨迹形状一致的轨迹簇;将所述轨迹簇中满足避障要求的轨迹确定为所述避障轨迹。
需要说明的是,本领域技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统或者装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再重复描述。
请参照图4,图4为本申请实施例提供的一种用于执行机械臂避障轨迹规划方法的电子设备的结构示意图,所述电子设备可以包括:至少一个处理器401,例如CPU,至少一个通信接口402,至少一个存储器403和至少一个通信总线404。其中,通信总线404用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口402用于与其他节点设备进行信令或数据的通信。存储器403可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器403可选的还可以是至少一个位于远离前述处理器的存储装置。存储器403中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器401执行时,电子设备可以执行上述图1所示方法过程。
可以理解,图4所示的结构仅为示意,所述电子设备还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,可以执行如图1所示方法实施例中电子设备所执行的方法过程。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如,该方法可以包括:求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种机械臂避障轨迹规划方法,其特征在于,包括:
求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;
根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;
在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;
根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。
2.根据权利要求1所述的方法,其特征在于,所述求取正向虚拟力轨迹和反向虚拟力轨迹,包括:
基于动态运动基元法对应的计算式以及多条示教轨迹,确定对应的多条初始虚拟力轨迹;
使用最大期望算法对所述多条初始虚拟力轨迹进行处理,得到初始高斯混合模型;
利用高斯混合回归从所述初始高斯混合模型中还原出中间虚拟力轨迹,并将所述中间虚拟力轨迹、新任务的位置信息代入所述计算式,得到所述机械臂末端执行器的正向轨迹;
在所述正向轨迹不满足避障要求时,将所述正向轨迹代入所述计算式中,得到所述正向虚拟力轨迹。
3.根据权利要求2所述的方法,其特征在于,所述求取正向虚拟力轨迹和反向虚拟力轨迹,还包括:
获取所述新任务的位置信息;所述位置信息包括起点信息和终点信息;
根据所述起点信息和所述终点信息得到所述新任务对应的直线路径,并对所述直线路径进行均匀采样,得到反向示教轨迹;
将所述反向示教轨迹代入所述计算式,得到所述反向虚拟力轨迹。
4.根据权利要求1所述的方法,其特征在于,所述根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数,包括:
确定偏好参数;所述偏好参数表征使所述避障轨迹对应的虚拟力轨迹趋近于所述正向虚拟力轨迹或者所述反向虚拟力轨迹;
根据所述偏好参数改进初始最大似然函数,得到所述中间高斯混合模型中的最大似然函数。
5.根据权利要求4所述的方法,其特征在于,所述最大似然函数的表达式包括:
Figure FDA0004049238010000021
其中,λ表征所述偏好参数,λ的取值范围为[0,1];P表征概率密度函数,
Figure FDA0004049238010000022
表征所述中间高斯混合模型的模型参数,FM+1表征所述正向虚拟力轨迹,FM+2表征所述反向虚拟力轨迹。
6.根据权利要求4或5所述的方法,其特征在于,基于以下步骤确定所述中间高斯混合模型对应的模型参数:
基于初始高斯混合模型的模型参数,计算所述正向虚拟力轨迹以及所述反向虚拟力轨迹分别来自所述初始高斯混合模型的第K个子模型的概率;
迭代计算每个子模型的期望、方差以及在所述初始高斯混合模型中发生的概率,得到所述中间高斯混合模型的模型参数。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹,包括:
在预设调整区间内调整所述模型参数的权重,得到连续变化且与所述示教轨迹形状一致的轨迹簇;
将所述轨迹簇中满足避障要求的轨迹确定为所述避障轨迹。
8.一种机械臂避障轨迹规划装置,其特征在于,包括:
求取模块,用于求取正向虚拟力轨迹和反向虚拟力轨迹;其中,所述正向虚拟力轨迹基于机械臂的初始示教轨迹求取,所述反向虚拟力轨迹基于新任务的位置信息求取;
最大似然函数确定模块,用于根据所述正向虚拟力轨迹以及所述反向虚拟力轨迹,确定中间高斯混合模型的最大似然函数;
引入模块,用于在所述最大似然函数的函数值满足模型收敛要求时,引入所述中间高斯混合模型的模型参数对应的权重;
避障轨迹确定模块,用于根据所述模型参数对应的权重得到目标高斯混合模型的目标模型参数,并通过所述目标高斯混合模型规划所述机械臂执行所述新任务的避障轨迹。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一所述的方法。
CN202310035842.XA 2023-01-10 2023-01-10 机械臂避障轨迹规划方法、装置和电子设备 Pending CN115958606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310035842.XA CN115958606A (zh) 2023-01-10 2023-01-10 机械臂避障轨迹规划方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310035842.XA CN115958606A (zh) 2023-01-10 2023-01-10 机械臂避障轨迹规划方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN115958606A true CN115958606A (zh) 2023-04-14

Family

ID=87358076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310035842.XA Pending CN115958606A (zh) 2023-01-10 2023-01-10 机械臂避障轨迹规划方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN115958606A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116494255A (zh) * 2023-06-30 2023-07-28 广州东焊智能装备有限公司 一种基于强化学习的空间机械臂路径规划系统
CN118003325A (zh) * 2024-02-28 2024-05-10 北京中科慧灵机器人技术有限公司 目标轨迹数据信息确定方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116494255A (zh) * 2023-06-30 2023-07-28 广州东焊智能装备有限公司 一种基于强化学习的空间机械臂路径规划系统
CN116494255B (zh) * 2023-06-30 2023-08-29 广州东焊智能装备有限公司 一种基于强化学习的空间机械臂路径规划系统
CN118003325A (zh) * 2024-02-28 2024-05-10 北京中科慧灵机器人技术有限公司 目标轨迹数据信息确定方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN115958606A (zh) 机械臂避障轨迹规划方法、装置和电子设备
US9361510B2 (en) Efficient facial landmark tracking using online shape regression method
Calinon et al. On learning the statistical representation of a task and generalizing it to various contexts
US20170213150A1 (en) Reinforcement learning using a partitioned input state space
Moldovan et al. Optimism-driven exploration for nonlinear systems
US11900244B1 (en) Attention-based deep reinforcement learning for autonomous agents
Judah et al. Active lmitation learning: formal and practical reductions to IID learning.
US20130243331A1 (en) Information processing device, information processing method, and program
CN112258557B (zh) 一种基于空间注意力特征聚合的视觉跟踪方法
CN113419424B (zh) 减少过估计的模型化强化学习机器人控制方法及系统
Fanger et al. Gaussian processes for dynamic movement primitives with application in knowledge-based cooperation
CN115860107B (zh) 一种基于多智能体深度强化学习的多机探寻方法及系统
CN111429481B (zh) 一种基于自适应表达的目标追踪方法、装置及终端
Hoyos et al. Incremental learning of skills in a task-parameterized Gaussian mixture model
CN112016678A (zh) 用于增强学习的策略生成网络的训练方法、装置和电子设备
Lv et al. Sam-rl: Sensing-aware model-based reinforcement learning via differentiable physics-based simulation and rendering
US9104980B2 (en) Information processing device, information processing method, and program
CN116543417A (zh) 人体姿态估计方法、装置、设备以及存储介质
CN113910221B (zh) 一种机械臂自主运动规划方法、装置、设备及存储介质
CN115665757A (zh) 分布式未知时变区域多自主体最优覆盖方法与系统
CN113011081B (zh) 一种基于元学习的无人机导航方法
CN110543919B (zh) 一种机器人定位控制方法、终端设备及存储介质
CN113505637A (zh) 一种用于直播流的实时虚拟主播动作捕捉方法及系统
CN112597959A (zh) 基于人工智能和计算机视觉的火车安全监控方法和装置
CN113012036B (zh) 基于生成流模型的人体运动风格迁移方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination