CN112605974A - 一种机器人复杂操作技能表征方法及系统 - Google Patents

一种机器人复杂操作技能表征方法及系统 Download PDF

Info

Publication number
CN112605974A
CN112605974A CN202011367328.9A CN202011367328A CN112605974A CN 112605974 A CN112605974 A CN 112605974A CN 202011367328 A CN202011367328 A CN 202011367328A CN 112605974 A CN112605974 A CN 112605974A
Authority
CN
China
Prior art keywords
operation skill
skill
robot
weight value
complex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011367328.9A
Other languages
English (en)
Inventor
吴鸿敏
徐智浩
周雪峰
程韬波
鄢武
苏泽荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202011367328.9A priority Critical patent/CN112605974A/zh
Publication of CN112605974A publication Critical patent/CN112605974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/0081Programme-controlled manipulators with master teach-in means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/08Programme-controlled manipulators characterised by modular constructions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Numerical Control (AREA)

Abstract

本发明公开了一种机器人复杂操作技能表征方法及系统,其方法包括:设定机器人在执行复杂任务时所需要的N个操作技能;对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。在本发明实施例中,通过结合二阶弹簧阻尼模型与有限状态机的应用,使得机器人具备一定的环境适应性及任务泛化性。

Description

一种机器人复杂操作技能表征方法及系统
技术领域
本发明涉及机器人技能学习技术领域,尤其涉及一种机器人复杂操作技能表征方法及系统。
背景技术
随着制造业的柔性化与智能化发展,对机器人的泛化性和环境适应性提出了更高的要求。一方面,在全球化市场竞争下,产品呈现多样化的种类和小批量定制化的生产方式,造成制造系统更短的迭代周期,传统依靠人工预定规则的机器人操作和编程方法在固定工作场景中得以广泛应用,执行简单重复性工作,例如搬运、焊接等,但在复杂多步的操作任务中依然存在编程效率低、环境适应性差、任务泛化性差等问题;另一方面,机器人的应用正在从传统围栏里独立的操作转化与人类共存环境下进行协作任务,对机器人灵活部署能力、安全性和环境适应性等提出更高要求。
机器人操作技能是指机器人基于自身的传感、感知、决策、规划与控制能力,在有限时间内操作环境中的特定物体,使该物体由初始状态到达目标状态。由于人类能够通过从经验数据中学习以及与环境交互来获得操作技能,造成机器人与人类相比在多模态感知、自主决策以及环境适应性和任务泛化性上还有较大差距,难以满足目前智能制造业对机器人技术应用的需求。近年来,随着机器人软硬件和人工智能技术的迅速发展,研究如何让机器人能够从人类示范数据中进行复杂操作技能学习与表征,进而实现机器人的快速编程与推广应用是目前机器人前沿研究的重点与难点。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种机器人复杂操作技能表征方法及系统,通过结合二阶弹簧阻尼模型与有限状态机的应用,使得机器人具备一定的环境适应性及任务泛化性。
为了解决上述问题,本发明提出了一种机器人复杂操作技能表征方法,其特征在于,所述方法包括:
设定机器人在执行复杂任务时所需要的N个操作技能;
对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
可选的实施方式,所述各类运动信息包括末端位姿信息、速度信息与加速度信息。
可选的实施方式,所述基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值包括:
基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数;
以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
可选的实施方式,所述目标强迫项函数的表达式为:
Figure BDA0002804509570000021
其中,K为弹簧系数,D为阻尼系数,g为目标位置,x0为初始位置,x为当前位置,v为当前速度,
Figure BDA0002804509570000022
为当前加速度,τ为时间尺度参数。
可选的实施方式,所述非线性干扰项的表达式为:
Figure BDA0002804509570000023
其中,ωi为权重系数,s为相参数,ψi(s)为高斯基函数,hi为宽度,ci为中心点。
可选的实施方式,所述基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型包括:
基于每一个操作技能所对应的权重值,获取每一个操作技能所对应的最终非线性干扰项;
基于每一个操作技能所对应的最终非线性干扰项,构建每一个操作技能所对应的二阶弹簧阻尼模型。
另外,本发明实施例还提供了一种机器人复杂操作技能表征系统,所述系统包括:
技能设定模块,用于设定机器人在执行复杂任务时所需要的N个操作技能;
信息提取模块,用于对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
参数学习模块,用于基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
模型表征模块,用于基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
可选的实施方式,所述各类运动信息包括末端位姿信息、速度信息与加速度信息。
可选的实施方式,所述参数学习模块用于基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数;以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
可选的实施方式,所述模型表征模块用于基于每一个操作技能所对应的权重值,获取每一个操作技能所对应的最终非线性干扰项;以及基于每一个操作技能所对应的最终非线性干扰项,构建每一个操作技能所对应的二阶弹簧阻尼模型。
在本发明实施例中,针对传统基于轨迹编码的机器人操作技能学习方法存在样本需求量大、效率低、运动稳定性差等问题,提出二阶弹簧阻尼模型并从人类一次性示教动作中学习,可提高对机器人的各项操作技能的学习效率、抗干扰性与运动稳定性;针对传统机器人复杂操作技能在实际生产制造中存在环境适应性差、任务泛化性差等问题,提出有限状态机并对机器人的各项操作技能进行表征,可降低对各项操作技能编程应用的维护难度与工作量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中的机器人复杂操作技能表征方法的流程示意图;
图2是本发明实施例中的机器人复杂操作技能表征系统的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例
请参阅图1,图1示出了本发明实施例中的机器人复杂操作技能表征方法的流程示意图。
如图1所示,一种机器人复杂操作技能表征方法,所述方法包括如下:
S101、设定机器人在执行复杂任务时所需要的N个操作技能;
在本发明实施例中,所述机器人的复杂任务可由N个操作技能进行表征,且各个操作技能是由人类对复杂任务的定义和理解进行划分取得的,主要考虑以下五方面因素:其一,每一个操作技能应保持独立的和完整的运动操作;其二,每一个操作技能中应保持机器人平滑的运动轨迹;其三,每一个操作技能中应保持模态信息的稳定性;其四,每一个操作技能中应保持一定时间长度的运动;其五,在满足所述机器人的复杂任务时可尽量减少操作技能的数量。
S102、对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
在本发明实施例中,针对所述N个操作技能进行各自建模需满足四方面因素:其一,从少量人类示范轨迹中学习;其二,具备强泛化性和抗干扰性,能有效地学习人类示范运动的意图,以提高机器人对不同环境的适应性;其三,未知参数少且学习效率高,以便于实现在线学习;其四,调用易于扩展或应用于多维的运动系统。基于上述所提及的因素,在所述机器人处于零力拖动模式下,通过人类一次性拖动所述机器人按照预期运动进行每一个操作技能的示教,并实时记录在每一个操作技能示教过程中的各类运动信息,包括所述机器人的末端位姿信息x(t)、速度信息v(t)与加速度信息
Figure BDA0002804509570000053
其中t∈[t0,t1,…,tN]为所对应操作技能的时间序列,同时记录在每一个操作技能示教过程中的起始点x0与终止点g。此外,在记录到原始的各类运动信息后,应利用滤波、时间对齐等方式对各类运动信息进行轨迹平滑处理,以保证每一个操作技能的示教质量。
S103、基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
本发明实施过程包括:
(1)基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数,其表达式为:
Figure BDA0002804509570000051
其中,K为弹簧系数,D为阻尼系数,g为目标位置,x0为初始位置,x为当前位置,v为当前速度,
Figure BDA0002804509570000052
为当前加速度,τ为时间尺度参数;需要说明的是,若针对任意一个操作技能所需要生成新运动轨迹的某一自由度上新目标位置(gnew-x0)与示教运动上目标位置(g-x0)的方向相反,则该自由度轨迹形状为示教轨迹的镜像;
(2)以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
具体的,首先设定每一个操作技能中的非线性干扰项为:
Figure BDA0002804509570000061
其中,ψi(s)为高斯基函数,hi为宽度,ci为中心点;ωi为权重系数,本发明实施例通过调整其权值可用来表达任意形状轨迹,并且由示教运动轨迹学习得到;s为相参数,当其初始值为1且单调收敛于0时,说明当前运动轨迹在靠近目标位置g过程中的外力作用越来越小,以保证向目标收敛的稳定性;
其次,利用最小化代价函数∑s[ftarget(s)-f(s)]2对每一个操作技能中的非线性干扰项f(s)进行限定,即通过所述最小化代价函数使得所述目标强迫项函数ftarget(s)与所述非线性干扰项f(s)尽可能逼近,以此确定每一个操作技能所对应的权重值ωi
S104、基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
本发明实施过程包括:
(1)基于每一个操作技能所对应的权重值ωi,获取每一个操作技能所对应的最终非线性干扰项f;
(2)基于每一个操作技能所对应的最终非线性干扰项f,构建每一个操作技能所对应的二阶弹簧阻尼模型;
具体的,为实现机器人运动描述的唯一性和直观性,本发明实施例提出通过在笛卡尔运动空间中对所述机器人的运动进行学习与泛化,并将所述机器人末端位姿的每个自由度运动对应着一个独立的变换系统(仅考虑空间状态与其时间导数之间的关系),即构建每一个操作技能所对应的二阶弹簧阻尼模型为:
Figure BDA0002804509570000071
其中,(g-x0)项表示运动轨迹形状的比例系数,用于在新目标点与示教轨迹目标点相距较大的情况下对运动轨迹形状进行缩放处理;τ作为时间尺度参数,用于调整运动生成的速度,且当τ值越大时则运动越快;
此外,考虑到所述N个操作技能中每一个操作技能所对应的二阶弹簧阻尼模型之间的相关耦合关系,可通过利用正维系统来实现,其表达式为
Figure BDA0002804509570000072
其中α为常量,
Figure BDA0002804509570000073
为角速度参数。
(3)利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
具体的,所述有限状态机是表示有限个状态(此处描述的状态即为操作技能)以及在这些状态之间转移的数学模型,通常由一个五元组表示为:M=(Q,q0,∑,δ,F),其中Q为有限个状态的非空有限集合、qi∈Q表示集合中的一个状态、q0为初始状态、∑为输入的条件指令、δ为状态间的转移函数、F为终止状态集合。在所述有限状态机运行过程中,每一个状态均存储有过去的相关信息,以反映所述有限状态机输入前后的变化;另外在所述有限状态机的内部系统存储着有向状态转换图来描述各个状态的执行顺序变更情况,可明确地指示不同状态间的转换关系及转换条件。
在实施过程中,明确记录所述N个操作技能中每一个操作技能的起始点与终止点,并将转换条件设定为:当执行当前操作技能至完成度为90%时,利用余下10%的传感数据与其他备选操作技能的起始10%的传感数据逐一进行殴几里得距离计算,并从中选取距离最小所对应的一个操作技能作为下一步应执行的操作技能。
在本发明实施例中,针对传统基于轨迹编码的机器人操作技能学习方法存在样本需求量大、效率低、运动稳定性差等问题,提出二阶弹簧阻尼模型并从人类一次性示教动作中学习,可提高对机器人的各项操作技能的学习效率、抗干扰性与运动稳定性;针对传统机器人复杂操作技能在实际生产制造中存在环境适应性差、任务泛化性差等问题,提出有限状态机并对机器人的各项操作技能进行表征,可降低对各项操作技能编程应用的维护难度与工作量。
实施例
请参阅图2,图2示出了本发明实施例中的机器人复杂操作技能表征系统的组成示意图。
如图2所示,一种机器人复杂操作技能表征系统,所述系统包括如下:
技能设定模块201,用于设定机器人在执行复杂任务时所需要的N个操作技能;
在本发明实施例中,所述机器人的复杂任务可由N个操作技能进行表征,且各个操作技能是由人类对复杂任务的定义和理解进行划分取得的,主要考虑以下五方面因素:其一,每一个操作技能应保持独立的和完整的运动操作;其二,每一个操作技能中应保持机器人平滑的运动轨迹;其三,每一个操作技能中应保持模态信息的稳定性;其四,每一个操作技能中应保持一定时间长度的运动;其五,在满足所述机器人的复杂任务时可尽量减少操作技能的数量。
信息提取模块202,用于对所述N个操作技能中每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
在本发明实施例中,针对所述N个操作技能进行各自建模需满足四方面因素:其一,从少量人类示范轨迹中学习;其二,具备强泛化性和抗干扰性,能有效地学习人类示范运动的意图,以提高机器人对不同环境的适应性;其三,未知参数少且学习效率高,以便于实现在线学习;其四,调用易于扩展或应用于多维的运动系统。基于上述所提及的因素,在所述机器人处于零力拖动模式下,通过人类一次性拖动所述机器人按照预期运动进行每一个操作技能的示教,并实时记录在每一个操作技能示教过程中的各类运动信息,包括所述机器人的末端位姿信息x(t)、速度信息v(t)与加速度信息
Figure BDA0002804509570000081
其中t∈[t0,t1,…,tN]为所对应操作技能的时间序列,同时记录在每一个操作技能示教过程中的起始点x0与终止点g。此外,在记录到原始的各类运动信息后,应利用滤波、时间对齐等方式对各类运动信息进行轨迹平滑处理,以保证每一个操作技能的示教质量。
参数学习模块203,用于基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
本发明实施过程包括:
(1)基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数,其表达式为:
Figure BDA0002804509570000091
其中,K为弹簧系数,D为阻尼系数,g为目标位置,x0为初始位置,x为当前位置,v为当前速度,
Figure BDA0002804509570000092
为当前加速度,τ为时间尺度参数;需要说明的是,若针对任意一个操作技能所需要生成新运动轨迹的某一自由度上新目标位置(gnew-x0)与示教运动上目标位置(g-x0)的方向相反,则该自由度轨迹形状为示教轨迹的镜像;
(2)以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
具体的,首先设定每一个操作技能中的非线性干扰项为:
Figure BDA0002804509570000093
其中,ψi(s)为高斯基函数,hi为宽度,ci为中心点;ωi为权重系数,本发明实施例通过调整其权值可用来表达任意形状轨迹,并且由示教运动轨迹学习得到;s为相参数,当其初始值为1且单调收敛于0时,说明当前运动轨迹在靠近目标位置g过程中的外力作用越来越小,以保证向目标收敛的稳定性;
其次,利用最小化代价函数∑s[ftarget(s)-f(s)]2对每一个操作技能中的非线性干扰项f(s)进行限定,即通过所述最小化代价函数使得所述目标强迫项函数ftarget(s)与所述非线性干扰项f(s)尽可能逼近,以此确定每一个操作技能所对应的权重值ωi
模型表征模块204,用于基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
本发明实施过程包括:
(1)基于每一个操作技能所对应的权重值ωi,获取每一个操作技能所对应的最终非线性干扰项f;
(2)基于每一个操作技能所对应的最终非线性干扰项f,构建每一个操作技能所对应的二阶弹簧阻尼模型;
具体的,为实现机器人运动描述的唯一性和直观性,本发明实施例提出通过在笛卡尔运动空间中对所述机器人的运动进行学习与泛化,并将所述机器人末端位姿的每个自由度运动对应着一个独立的变换系统(仅考虑空间状态与其时间导数之间的关系),即构建每一个操作技能所对应的二阶弹簧阻尼模型为:
Figure BDA0002804509570000101
其中,(g-x0)项表示运动轨迹形状的比例系数,用于在新目标点与示教轨迹目标点相距较大的情况下对运动轨迹形状进行缩放处理;τ作为时间尺度参数,用于调整运动生成的速度,且当τ值越大时则运动越快;
此外,考虑到所述N个操作技能中每一个操作技能所对应的二阶弹簧阻尼模型之间的相关耦合关系,可通过利用正维系统来实现,其表达式为
Figure BDA0002804509570000102
其中α为常量,
Figure BDA0002804509570000103
为角速度参数。
(3)利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
具体的,所述有限状态机是表示有限个状态(此处描述的状态即为操作技能)以及在这些状态之间转移的数学模型,通常由一个五元组表示为:M=(Q,q0,∑,δ,F),其中Q为有限个状态的非空有限集合、qi∈Q表示集合中的一个状态、q0为初始状态、∑为输入的条件指令、δ为状态间的转移函数、F为终止状态集合。在所述有限状态机运行过程中,每一个状态均存储有过去的相关信息,以反映所述有限状态机输入前后的变化;另外在所述有限状态机的内部系统存储着有向状态转换图来描述各个状态的执行顺序变更情况,可明确地指示不同状态间的转换关系及转换条件。
在实施过程中,明确记录所述N个操作技能中每一个操作技能的起始点与终止点,并将转换条件设定为:当执行当前操作技能至完成度为90%时,利用余下10%的传感数据与其他备选操作技能的起始10%的传感数据逐一进行殴几里得距离计算,并从中选取距离最小所对应的一个操作技能作为下一步应执行的操作技能。
在本发明实施例中,针对传统基于轨迹编码的机器人操作技能学习方法存在样本需求量大、效率低、运动稳定性差等问题,提出二阶弹簧阻尼模型并从人类一次性示教动作中学习,可提高对机器人的各项操作技能的学习效率、抗干扰性与运动稳定性;针对传统机器人复杂操作技能在实际生产制造中存在环境适应性差、任务泛化性差等问题,提出有限状态机并对机器人的各项操作技能进行表征,可降低对各项操作技能编程应用的维护难度与工作量。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种机器人复杂操作技能表征方法及系统进行了详细介绍,本文中采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种机器人复杂操作技能表征方法,其特征在于,所述方法包括:
设定机器人在执行复杂任务时所需要的N个操作技能;
对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
2.根据权利要求1所述的机器人复杂操作技能表征方法,其特征在于,所述各类运动信息包括末端位姿信息、速度信息与加速度信息。
3.根据权利要求2所述的机器人复杂操作技能表征方法,其特征在于,所述基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值包括:
基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数;
以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
4.根据权利要求3所述的机器人复杂操作技能表征方法,其特征在于,所述目标强迫项函数的表达式为:
Figure FDA0002804509560000011
其中,K为弹簧系数,D为阻尼系数,g为目标位置,x0为初始位置,x为当前位置,v为当前速度,
Figure FDA0002804509560000022
为当前加速度,τ为时间尺度参数。
5.根据权利要求4所述的机器人复杂操作技能表征方法,其特征在于,所述非线性干扰项的表达式为:
Figure FDA0002804509560000021
其中,ωi为权重系数,s为相参数,ψi(s)为高斯基函数,hi为宽度,ci为中心点。
6.根据权利要求5所述的机器人复杂操作技能表征方法,其特征在于,所述基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型包括:
基于每一个操作技能所对应的权重值,获取每一个操作技能所对应的最终非线性干扰项;
基于每一个操作技能所对应的最终非线性干扰项,构建每一个操作技能所对应的二阶弹簧阻尼模型。
7.一种机器人复杂操作技能表征系统,其特征在于,所述系统包括:
技能设定模块,用于设定机器人在执行复杂任务时所需要的N个操作技能;
信息提取模块,用于对所述N个操作技能中的每一个操作技能进行拖动示教,记录所述机器人在每一个操作技能示教过程中的各类运动信息;
参数学习模块,用于基于每一个操作技能示教过程中的各类运动信息,利用局部加权回归法获取每一个操作技能所对应的权重值;
模型表征模块,用于基于每一个操作技能所对应的权重值,构建每一个操作技能所对应的二阶弹簧阻尼模型,并利用有限状态机对每一个操作技能所对应的二阶弹簧阻尼模型进行序列化表征。
8.根据权利要求7所述的机器人复杂操作技能表征系统,其特征在于,所述各类运动信息包括末端位姿信息、速度信息与加速度信息。
9.根据权利要求8所述的机器人复杂操作技能表征系统,其特征在于,所述参数学习模块用于基于每一个操作技能示教过程中的各类运动信息,确定每一个操作技能所对应的目标强迫项函数;以每一个操作技能所对应的目标强迫项函数为调整基准,利用最小化代价函数对每一个操作技能中的非线性干扰项进行限定,并获取每一个操作技能所对应的权重值。
10.根据权利要求9所述的机器人复杂操作技能表征系统,其特征在于,所述模型表征模块用于基于每一个操作技能所对应的权重值,获取每一个操作技能所对应的最终非线性干扰项;以及基于每一个操作技能所对应的最终非线性干扰项,构建每一个操作技能所对应的二阶弹簧阻尼模型。
CN202011367328.9A 2020-11-27 2020-11-27 一种机器人复杂操作技能表征方法及系统 Pending CN112605974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011367328.9A CN112605974A (zh) 2020-11-27 2020-11-27 一种机器人复杂操作技能表征方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011367328.9A CN112605974A (zh) 2020-11-27 2020-11-27 一种机器人复杂操作技能表征方法及系统

Publications (1)

Publication Number Publication Date
CN112605974A true CN112605974A (zh) 2021-04-06

Family

ID=75228473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011367328.9A Pending CN112605974A (zh) 2020-11-27 2020-11-27 一种机器人复杂操作技能表征方法及系统

Country Status (1)

Country Link
CN (1) CN112605974A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114043478A (zh) * 2021-11-24 2022-02-15 深圳大学 机器人复杂操作技能表示方法、装置、智能终端和介质
CN114131598A (zh) * 2021-11-24 2022-03-04 深圳大学 层次化机器人技能表达方法、终端及计算机可读存储介质
CN116276995A (zh) * 2023-03-03 2023-06-23 北京航空航天大学 一种具有零空间避障能力的基于阻抗控制的人机协同方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100072587A (ko) * 2008-12-22 2010-07-01 삼성전자주식회사 로봇 및 그 균형 제어방법
CN108655026A (zh) * 2018-05-07 2018-10-16 上海交通大学 一种机器人快速示教分拣系统和方法
CN110026987A (zh) * 2019-05-28 2019-07-19 广东工业大学 一种机械臂抓取轨迹的生成方法、装置、设备及存储介质
CN110653801A (zh) * 2019-09-30 2020-01-07 哈尔滨工业大学 机器人操作臂的导引操纵系统及其柔顺操纵控制与示教学习方法
CN111618847A (zh) * 2020-04-22 2020-09-04 南通大学 基于深度强化学习与动态运动基元的机械臂自主抓取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100072587A (ko) * 2008-12-22 2010-07-01 삼성전자주식회사 로봇 및 그 균형 제어방법
CN108655026A (zh) * 2018-05-07 2018-10-16 上海交通大学 一种机器人快速示教分拣系统和方法
CN110026987A (zh) * 2019-05-28 2019-07-19 广东工业大学 一种机械臂抓取轨迹的生成方法、装置、设备及存储介质
CN110653801A (zh) * 2019-09-30 2020-01-07 哈尔滨工业大学 机器人操作臂的导引操纵系统及其柔顺操纵控制与示教学习方法
CN111618847A (zh) * 2020-04-22 2020-09-04 南通大学 基于深度强化学习与动态运动基元的机械臂自主抓取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SCOTT NIEKUM 等: "Learning and generalization of complex tasks from unstructured demonstrations", 《IEEE》 *
叶子涵 等: "基于视觉和动态运动基元的机械臂抓取轨迹规划", 《机器人技术与应用》 *
迟明善 等: "基于示教编程的共融机器人技能学习方法的研究进展", 《仪器仪表学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114043478A (zh) * 2021-11-24 2022-02-15 深圳大学 机器人复杂操作技能表示方法、装置、智能终端和介质
CN114131598A (zh) * 2021-11-24 2022-03-04 深圳大学 层次化机器人技能表达方法、终端及计算机可读存储介质
CN114131598B (zh) * 2021-11-24 2024-02-02 深圳大学 层次化机器人技能表达方法、终端及计算机可读存储介质
CN116276995A (zh) * 2023-03-03 2023-06-23 北京航空航天大学 一种具有零空间避障能力的基于阻抗控制的人机协同方法
CN116276995B (zh) * 2023-03-03 2023-09-08 北京航空航天大学 一种具有零空间避障能力的基于阻抗控制的人机协同方法

Similar Documents

Publication Publication Date Title
CN112605974A (zh) 一种机器人复杂操作技能表征方法及系统
Pastor et al. From dynamic movement primitives to associative skill memories
CN111872934B (zh) 一种基于隐半马尔可夫模型的机械臂控制方法及系统
Neumann et al. Neural learning of stable dynamical systems based on data-driven Lyapunov candidates
WO2020065001A1 (en) Learning motor primitives and training a machine learning system using a linear-feedback-stabilized policy
Seo et al. Non-certainty equivalent adaptive control for robot manipulator systems
CN113043275B (zh) 基于专家演示和强化学习的微零件装配方法
Dong et al. Learning and recognition of hybrid manipulation motions in variable environments using probabilistic flow tubes
CN115990875B (zh) 一种基于隐空间插值的柔性线缆状态预测与控制系统
Zhou et al. Advanced robot programming: A review
Fanger et al. Gaussian processes for dynamic movement primitives with application in knowledge-based cooperation
Lober et al. Multiple task optimization using dynamical movement primitives for whole-body reactive control
Ambhore A comprehensive study on robot learning from demonstration
Chen et al. Robot learning from multiple demonstrations with dynamic movement primitive
Eppner et al. Imitation learning with generalized task descriptions
CN114310888B (zh) 一种协作机器人可变刚度运动技能学习与调控方法及系统
Duan et al. Learning to avoid obstacles with minimal intervention control
Lutter et al. Building skill learning systems for robotics
Beik Mohammadi et al. Mixed-reality deep reinforcement learning for a reach-to-grasp task
Liu et al. A human-robot collaboration framework based on human motion prediction and task model in virtual environment
Wang et al. Multi-feature fusion for deep reinforcement learning: sequential control of mobile robots
Malone et al. Efficient motion-based task learning
Zhai et al. Effective learning and online modulation for robotic variable impedance skills
Coors Navigation of mobile robots in human environments with deep reinforcement learning
Yu et al. LSTM learn policy from dynamical system of demonstration motions for robot imitation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210406