CN116476081A - 一种机器人节律性技能学习方法及系统 - Google Patents

一种机器人节律性技能学习方法及系统 Download PDF

Info

Publication number
CN116476081A
CN116476081A CN202310735972.4A CN202310735972A CN116476081A CN 116476081 A CN116476081 A CN 116476081A CN 202310735972 A CN202310735972 A CN 202310735972A CN 116476081 A CN116476081 A CN 116476081A
Authority
CN
China
Prior art keywords
rhythmic
distribution
demonstration
representing
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310735972.4A
Other languages
English (en)
Other versions
CN116476081B (zh
Inventor
吴鸿敏
周雪峰
徐智浩
翟雪倩
廖昭洋
鄢武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202310735972.4A priority Critical patent/CN116476081B/zh
Publication of CN116476081A publication Critical patent/CN116476081A/zh
Application granted granted Critical
Publication of CN116476081B publication Critical patent/CN116476081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种机器人节律性技能学习方法及系统,该方法包括:获得机器人任务空间中位置与速度的多次演示运动轨迹;以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样获得一组能够描述节律性动态特性的非线性参考轨迹;将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。此后,将已知的线性变参数系统与机器人控制器相结合,实现人机节律性技能的传递,有效提升复杂任务需求下机器人的编程效率和稳定性。

Description

一种机器人节律性技能学习方法及系统
技术领域
本发明涉及人工智能技术领域,具体涉及一种机器人节律性技能学习方法及系统。
背景技术
近年来,随着人工智能理论与机器人应用的深度融合,以技能学习为核心的机器人高效编程技术已成为机器人领域的前沿重点研究方向,目的是从人机物理交互的经验数据中获得类人化操作技能,随后泛化到新的相近任务或不同环境中,提升机器人自适应性。然而,现有机器人技能学习方法的未知参数学习严重依赖于人类主观经验,且难以确保运动的全局稳定性,使现有技能模型局限于抓取、搬运等点到点、单步简单的任务,难以适用于抛磨、辅助康复等带有节律性运动轨迹的复杂任务。节律性运动是一种有节奏、有规律的运动,对于提升零部件表面加工质量、人体生命健康、疾病康复效果等方面具有重要意义,例如:零部件表面抛光和打磨等典型制造工艺的加工轨迹(摆线、螺旋线等),人体康复理疗以及偏瘫患者肢体康复训练的运动轨迹(周期往复运动等)等均表现出一定的节律性。同时,不同于传统点到点、单步简单的运动,节律性运动所形成的轨迹具有曲率高、非单调性、周期性等特点,大幅度提升了其研究的难度,相关研究技术尚未成熟,急需进一步探索。
发明内容
本发明的目的在于克服上述现有技术的不足,提供一种机器人节律性技能学习方法及系统,以获得机器人节律性技能,为机器人应用于复杂非线性任务提供技术支撑。
为实现上述目的,本发明的技术方案是:
第一方面,本发明提供一种种机器人节律性技能学习方法,所述方法包括:
获得机器人任务空间中位置与速度的多次演示运动轨迹;
以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样获得一组能够描述节律性动态特性的非线性参考轨迹;
将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。
进一步地,所述机器人任务空间中位置与速度的多次演示运动轨迹通过如下方式获得:
将机器人设置为重力补偿模式,以人机物理交互的方式进行多次牵引示教,并通过数据采集与预处理,获得机器人任务空间中位置与速度的多次演示运动轨迹。
进一步地,所述多次演示运动轨迹表示为,其中/>表示第/>次演示轨迹/>时刻的位置量,/>表示第/>次演示轨迹/>时刻的速度量,/>为对齐后各个演示轨迹的数据量,/>为总共演示次数。
进一步地,所述以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型包括:
以演示运动轨迹为参考,采用高斯混合模型建立成位置与速度的联合概率分布模型表示为:式中,/>分别表示演示位置与速度;表示高斯混合模型组件的个数;/>表示第/>个组件的先验概率,满足/>表示一个高维高斯分布模型;/>表示第/>个高斯分布的均值;/>表示第/>个高斯分布的协方差矩阵;/>表示整个高斯混合模型参数空间,/>表示第/>个组件的参数变量;
假设,构建非参数化高斯混合模型,实现从演示数据中自动确定最优的组件个数,模型参数分布两部分进行考虑,一是为模型先验概率参数/>设计先验分布,二是为模型高斯参数/>设计先验分布。
进一步地,所述先验概率参数设计先验分布包括:
假定,其中隐变量/>,各个元素/>,引入考虑数据相似性的中国餐馆过程模型作为/>的先验分布,表示为/>,其中
对某一数据点通过同步考虑数据点的速度方向性和位置相关性两方面的物理特性进行相似性度量/>的计算,即:其中,/>表示数据点的索引号,/>分别表示第/>个数据点的位置量和速度量,/>分别表示第/>个数据点的位置量和速度量;相似性度量的计算公式中任意两个数据点间的速度方向性由数据点速度向量的偏移余弦相似性计算得到,表示为/>其中,上标/>表示向量的轩置,/>表示向量的模长;位置相关性由高效核映射函数求得,采用高斯核函数表示为:/>其中,/>为指数函数,/>为尺度系数;利用考虑数据相似性的中国餐馆过程模型对观察数据点进行聚类,其概率分布描述为:其中,/>表示连续求积运算符,/>为集中系数,/>为数据点个数。
进一步地,所述高斯参数设计先验分布包括:
假设各个组件的均值与方差均未知的情况,采用维正态逆威沙特分布作为均值/>和方差/>的先验分布,表示为:其中,为标量分别表示对于此先验分布所产生均值和方差的信任程度,/>分别表示此先验分布的均值和方差。一般地,/>为所有组件/>的平均值。
第二方面,本发明提供一种机器人节律性技能学习系统,包括:
节律性技能演示模块,用于将机器人设置为重力补偿模式,以人机物理交互的方式进行多次牵引示教,并通过数据采集与预处理,获得机器人任务空间中位置与速度的多次演示运动轨迹;
节律性技能建模与学习模块,用于以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
节律性参考轨迹模块,用于采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样,获得一组能够描述节律性动态特性的非线性参考轨迹;
技能全局稳定性优化模块,用于将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。
本发明与现有技术相比,其有益效果在于:
本发明提出了基于非参数化高斯混合模型的机器人节律性技能建模方法,引入数据方向性和相关性的相似性度量指标,实现对高曲率、非单调性、周期性、高度非线性的运动轨迹的建模;提出了全局稳定的机器人节律性技能模型参数学习与优化方法,引入参数化二次型李雅普诺夫函数,实现技能模型在任意给定目标点情况下全局渐近收敛,获得全局稳定性。此后,将已知的线性变参数系统与机器人控制器相结合,实现人机节律性技能的传递,有效提升复杂任务需求下机器人的编程效率和稳定性,具有重要的科研意义和应用价值。
附图说明
图1为本发明实施例1提供的机器人节律性技能学习方法流程图;
图2为本发明实施例2提供的机器人节律性技能学习系统组成示意图;
图3为图2中机器人通讯与运动控制模块的主要组成示意图。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的说明。
随着协作机器人的快速发展与应用普及,以技能学习为核心的机器人高效编程技术已成为了机器人领域国际前沿重点研究方向,一般包括技能演示、技能建模、技能调控三个阶段,借助人-机操作技能迁移框架能够大幅度提升机器人操作灵巧性、任务泛化性和环境适应性。然而,现有技能学习方法以点到点、单步简单的任务为主,缺乏考虑含有节律性运动需求的任务,难以应用于抛磨、康复理疗等领域。本发明结合非参数化贝叶斯理论与非线性动态系统稳定性模型,创新性地提出一种非参数化全局稳定的机器人节律性技能学习方法及系统,获得机器人节律性技能,为机器人应用于复杂非线性任务提供技术支撑。
实施例1:
参阅图1所述,为本实施例提供的机器人节律性技能学习方法流程图,主要包括如下步骤:
101、获得机器人任务空间中位置与速度的多次演示运动轨迹;
102、以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
103、采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样获得一组能够描述节律性动态特性的非线性参考轨迹;
104、将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。
故而,通过本方法能够从人机物理交互的多次节律性演示轨迹中获得机器人节律性技能,有效提升机器人编程效率与环境适应性,对机器人抛磨、康复理疗等应用具有重要的科研意义与工程价值。
在一具体实施例中,上述步骤101包括:在给定节律性运动的任务需求情况下,将机器人设置为重力补偿模式,通过有作业经验的示教者以人机物理交互的方式对机器人进行多次牵引示教,并确保每次均能顺利完成任务。在演示过程中,通过上位机对演示数据进行采集与预处理,包括频率同步、异常点剔除和基于动态时间归整算法的演示轨迹对齐,进而获得机器人任务空间中位置与速度的多次演示运动轨迹,表示为,其中/>表示第/>次演示轨迹/>时刻的位置量,/>表示第/>次演示轨迹/>时刻的速度量,/>为对齐后各个演示轨迹的数据量,/>为总共演示次数/>
在一具体实施例中,上述步骤102包括:以演示运动轨迹为参考,采用常规高斯混合模型建立成位置与速度的联合概率分布模型,表示为:式中,/>分别表示演示位置与速度;/>表示高斯混合模型组件的个数;/>表示第/>个组件的先验概率,满足/>;/>表示一个高维高斯分布模型;/>表示第/>个高斯分布的均值;/>表示第/>个高斯分布的协方差矩阵;/>表示整个高斯混合模型参数空间,/>,/>表示第/>个组件的参数变量。由于节律性技能的运动轨迹具有复杂非线性、高曲率、非单调性等特征,难以依赖人为经验确定高斯混合模型的组件个数/>的取值,本发明假设/>,构建非参数化高斯混合模型,实现从演示数据中自动确定最优的组件个数。此时,模型参数可以分布两部分进行考虑,一是为模型先验概率参数/>设计先验分布,二是为模型高斯参数/>设计先验分布。
1)在先验概率参数的先验分布方面,本发明假定,其中隐变量,各个元素/>,引入考虑数据相似性的中国餐馆过程模型作为/>的先验分布,表示为/>,其中/>。此时,对于某一数据点而言,要么通过相似性度量将其归属于含有第/>个数据点的类,要么以正比于集中系数/>的概率另起一个新类。传统中国餐馆过程模型中只考虑数据点的数量进行聚类,无法保证同类别数据点的物理一致性,针对此问题,本发明通过同步考虑数据点的速度方向性/>和位置相关性/>两方面的物理特性进行相似性度量的计算,即:/>其中,/>表示数据点的索引号,/>分别表示第/>个数据点的位置量和速度量,/>分别表示第个数据点的位置量和速度量。相似性度量的计算公式中任意两个数据点间的速度方向性由数据点速度向量的偏移余弦相似性计算得到,表示为其中,上标/>表示向量的轩置,/>表示向量的模长。同样地,位置相关性由高效核映射函数求得,这里采用高斯核函数表示为:其中,/>为指数函数,/>为尺度系数。从而,利用考虑数据相似性的中国餐馆过程模型对观察数据点进行聚类,其概率分布描述为:其中,/>表示连续求积运算符,/>为集中系数,/>为数据点个数。
2)在模型高斯参数的先验分布方面,本发明假设各个组件的均值与方差均未知的情况,采用维(维数由数据点决定)正态逆威沙特分布作为均值/>和方差/>的先验分布,表示为:其中,为标量分别表示对于此先验分布所产生均值和方差的信任程度,/>分别表示此先验分布的均值和方差。一般地,/>为所有组件/>的平均值。
在一具体实施例中,上述步骤103包括:采用高斯混合回归方法建立非参数化混合高斯模型的条件概率分布,并通过采样,获得一组能够描述节律性动态特性的非线性参考轨迹。通过将数据点分为两部分:输入为位置量/>;输出为速度量/>,则相应组件的高斯模型参数表示为:/>从而,其中,式中变量/>为组件的比例系数。因此,通过利用/>的均值/>作为参考轨迹。
最后,将非线性参考轨迹转换为由多个线性动态系统组成,表示为:其中,进而将函数/>等价为一个线性变参数系统,其在任意平衡点/>处全局稳定性条件为:/>其中,为任意对称正定矩阵,符号/>表示数值偏好于零。本发明采用参数化二次型李雅普诺夫函数/>对线性变参数系统的全局稳定性条件进行验证,并通过设置最小化参考速度与动态系统速度的误差为目标函数,对线性变参数系统的未知参数和/>进行学习与优化,使得技能模型能够在任意给定目标点情况下实现全局渐近收敛,获得全局稳定性。此后,将已知的线性变参数系统与机器人控制器相结合,实现人机节律性技能的传递,有效提升复杂任务需求下机器人的编程效率和稳定性,具有重要的科研意义和应用价值。
综上,本发明提出了基于非参数化高斯混合模型的机器人节律性技能建模方法,引入数据方向性和相关性的相似性度量指标,实现对高曲率、非单调性、周期性、高度非线性的运动轨迹的建模;提出了全局稳定的机器人节律性技能模型参数学习与优化方法,引入参数化二次型李雅普诺夫函数,实现技能模型在任意给定目标点情况下全局渐近收敛,获得全局稳定性。此后,将已知的线性变参数系统与机器人控制器相结合,实现人机节律性技能的传递,有效提升复杂任务需求下机器人的编程效率和稳定性,具有重要的科研意义和应用价值。
实施例2:
参阅图2所示,为本实施例提供的机器人节律性技能学习系统的组成示意图,包括如下模块:
节律性技能演示模块,用于将机器人设置为重力补偿模式,以人机物理交互的方式进行多次牵引示教,并通过数据采集与预处理,获得机器人任务空间中位置与速度的多次演示运动轨迹;
节律性技能建模与学习模块,用于以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
节律性参考轨迹模块,用于采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样,获得一组能够描述节律性动态特性的非线性参考轨迹;
技能全局稳定性优化模块,用于将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。此后,如图3所示,将已知的线性变参数系统与机器人控制器相结合,实现人机节律性技能的传递。
具体地,节律性技能演示模块的工作原理和实施例1的步骤101相同、节律性技能建模与学习模块的工作原理和实施例1的步骤102相同、节律性参考轨迹模块的工作原理和实施例1的步骤103相同、技能全局稳定性优化模块和实施例1的步骤104相同,因此在本实施例中就不再赘述。
上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。

Claims (10)

1.一种机器人节律性技能学习方法,其特征在于,所述方法包括:
获得机器人任务空间中位置与速度的多次演示运动轨迹;
以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样获得一组能够描述节律性动态特性的非线性参考轨迹;
将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。
2.如权利要求1所述的机器人节律性技能学习方法,其特征在于,所述机器人任务空间中位置与速度的多次演示运动轨迹通过如下方式获得:
将机器人设置为重力补偿模式,以人机物理交互的方式进行多次牵引示教,并通过数据采集与预处理,获得机器人任务空间中位置与速度的多次演示运动轨迹。
3.如权利要求2所述的机器人节律性技能学习方法,其特征在于,所述多次演示运动轨迹表示为,其中/>表示第/>次演示轨迹/>时刻的位置量,/>表示第/>次演示轨迹/>时刻的速度量,/>为对齐后各个演示轨迹的数据量,/>为总共演示次数。
4.如权利要求1所述的机器人节律性技能学习方法,其特征在于,所述以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型包括:
以演示运动轨迹为参考,采用高斯混合模型建立成位置与速度的联合概率分布模型表示为:式中,/>分别表示演示位置与速度;/>表示高斯混合模型组件的个数;/>表示第/>个组件的先验概率,满足/>;/>表示一个高维高斯分布模型;/>表示第/>个高斯分布的均值;/>表示第/>个高斯分布的协方差矩阵;/>表示整个高斯混合模型参数空间,/>,/>表示第/>个组件的参数变量;
假设,构建非参数化高斯混合模型,实现从演示数据中自动确定最优的组件个数,模型参数分布两部分进行考虑,一是为模型先验概率参数/>设计先验分布,二是为模型高斯参数/>设计先验分布。
5.如权利要求4所述的机器人节律性技能学习方法,其特征在于,所述先验概率参数设计先验分布包括:
假定,其中隐变量/>,各个元素/>,引入考虑数据相似性的中国餐馆过程模型作为/>的先验分布,表示为/>,其中
对某一数据点通过同步考虑数据点的速度方向性和位置相关性两方面的物理特性进行相似性度量/>的计算,即:其中,/>表示数据点的索引号,/>分别表示第/>个数据点的位置量和速度量,/>分别表示第/>个数据点的位置量和速度量;相似性度量的计算公式中任意两个数据点间的速度方向性由数据点速度向量的偏移余弦相似性计算得到,表示为/>其中,上标/>表示向量的轩置,/>表示向量的模长;位置相关性由高效核映射函数求得,采用高斯核函数表示为:/>其中,/>为指数函数,/>为尺度系数;利用考虑数据相似性的中国餐馆过程模型对观察数据点进行聚类,其概率分布描述为:其中,/>表示连续求积运算符,/>为集中系数,/>为数据点个数。
6.如权利要求4所述的机器人节律性技能学习方法,其特征在于,所述高斯参数设计先验分布包括:
假设各个组件的均值与方差均未知的情况,采用维正态逆威沙特分布作为均值和方差/>的先验分布,表示为:其中,为标量分别表示对于此先验分布所产生均值和方差的信任程度,/>分别表示此先验分布的均值和方差;/>为所有组件/>的平均值。
7.一种机器人节律性技能学习系统,其特征在于,包括:
节律性技能演示模块,用于将机器人设置为重力补偿模式,以人机物理交互的方式进行多次牵引示教,并通过数据采集与预处理,获得机器人任务空间中位置与速度的多次演示运动轨迹;
节律性技能建模与学习模块,用于以演示运动轨迹为参考,构建适用于节律性运动轨迹建模与学习的非参数化高斯混合模型;
节律性参考轨迹模块,用于采用高斯混合回归方法建立非参数化高斯混合模型的条件概率分布,通过采样,获得一组能够描述节律性动态特性的非线性参考轨迹;
技能全局稳定性优化模块,用于将非线性参考轨迹转换为由多个线性动态系统组成,等价为一个线性变参数系统,采用参数化二次型李雅普诺夫函数对线性变参数系统进行未知参数的学习与优化,获得全局稳定性。
8.如权利要求7所述的机器人节律性技能学习系统,其特征在于,所述以演示运动轨迹为参考,采用高斯混合模型建立成位置与速度的联合概率分布模型表示为:式中,/>分别表示演示位置与速度;/>表示高斯混合模型组件的个数;/>表示第/>个组件的先验概率,满足/>;/>表示一个高维高斯分布模型;/>表示第/>个高斯分布的均值;/>表示第/>个高斯分布的协方差矩阵;/>表示整个高斯混合模型参数空间,/>,/>表示第/>个组件的参数变量;
假设,构建非参数化高斯混合模型,实现从演示数据中自动确定最优的组件个数,模型参数分布两部分进行考虑,一是为模型先验概率参数/>设计先验分布,二是为模型高斯参数/>设计先验分布。
9.如权利要求8所述的机器人节律性技能学习系统,其特征在于,所述先验概率参数设计先验分布包括:
假定,其中隐变量/>,各个元素/>,引入考虑数据相似性的中国餐馆过程模型作为/>的先验分布,表示为/>,其中
对某一数据点通过同步考虑数据点的速度方向性和位置相关性两方面的物理特性进行相似性度量/>的计算,即:其中,/>表示数据点的索引号,/>分别表示第/>个数据点的位置量和速度量,/>分别表示第/>个数据点的位置量和速度量;相似性度量的计算公式中任意两个数据点间的速度方向性由数据点速度向量的偏移余弦相似性计算得到,表示为/>其中,上标/>表示向量的轩置,/>表示向量的模长;位置相关性由高效核映射函数求得,采用高斯核函数表示为:/>其中,/>为指数函数,/>为尺度系数;利用考虑数据相似性的中国餐馆过程模型对观察数据点进行聚类,其概率分布描述为:其中,/>表示连续求积运算符,/>为集中系数,/>为数据点个数。
10.如权利要求8所述的机器人节律性技能学习系统,其特征在于,所述高斯参数设计先验分布包括:
假设各个组件的均值与方差均未知的情况,采用维正态逆威沙特分布作为均值和方差/>的先验分布,表示为:其中,为标量分别表示对于此先验分布所产生均值和方差的信任程度,/>分别表示此先验分布的均值和方差;/>为所有组件/>的平均值。
CN202310735972.4A 2023-06-21 2023-06-21 一种机器人节律性技能学习方法及系统 Active CN116476081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310735972.4A CN116476081B (zh) 2023-06-21 2023-06-21 一种机器人节律性技能学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310735972.4A CN116476081B (zh) 2023-06-21 2023-06-21 一种机器人节律性技能学习方法及系统

Publications (2)

Publication Number Publication Date
CN116476081A true CN116476081A (zh) 2023-07-25
CN116476081B CN116476081B (zh) 2023-09-15

Family

ID=87225415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310735972.4A Active CN116476081B (zh) 2023-06-21 2023-06-21 一种机器人节律性技能学习方法及系统

Country Status (1)

Country Link
CN (1) CN116476081B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151442A1 (en) * 2011-12-13 2013-06-13 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University) Method for learning task skill and robot using thereof
KR20130067345A (ko) * 2011-12-13 2013-06-24 한양대학교 산학협력단 작업 솜씨를 학습하는 방법 및 이를 이용한 로봇
CN105956601A (zh) * 2016-04-15 2016-09-21 北京工业大学 一种基于轨迹模仿的机器人汉字书写学习方法
CN109702744A (zh) * 2019-01-15 2019-05-03 北京工业大学 一种基于动态系统模型的机器人模仿学习的方法
CN110465952A (zh) * 2018-05-09 2019-11-19 郑州科技学院 一种基于轨迹模仿的机器人汉字书写和学习的方法
CN111251277A (zh) * 2020-01-31 2020-06-09 武汉大学 一种基于示教学习的人机协作工具递交系统及方法
CN115972197A (zh) * 2022-12-02 2023-04-18 河北工业大学 一种基于关节角轨迹编码的机器人动作演示学习方法
CN116079745A (zh) * 2023-03-27 2023-05-09 重庆大学 基于几何感知与节律动态运动基元的人机技能迁移方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151442A1 (en) * 2011-12-13 2013-06-13 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University) Method for learning task skill and robot using thereof
KR20130067345A (ko) * 2011-12-13 2013-06-24 한양대학교 산학협력단 작업 솜씨를 학습하는 방법 및 이를 이용한 로봇
CN105956601A (zh) * 2016-04-15 2016-09-21 北京工业大学 一种基于轨迹模仿的机器人汉字书写学习方法
CN110465952A (zh) * 2018-05-09 2019-11-19 郑州科技学院 一种基于轨迹模仿的机器人汉字书写和学习的方法
CN109702744A (zh) * 2019-01-15 2019-05-03 北京工业大学 一种基于动态系统模型的机器人模仿学习的方法
CN111251277A (zh) * 2020-01-31 2020-06-09 武汉大学 一种基于示教学习的人机协作工具递交系统及方法
CN115972197A (zh) * 2022-12-02 2023-04-18 河北工业大学 一种基于关节角轨迹编码的机器人动作演示学习方法
CN116079745A (zh) * 2023-03-27 2023-05-09 重庆大学 基于几何感知与节律动态运动基元的人机技能迁移方法

Also Published As

Publication number Publication date
CN116476081B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
WO2020207219A1 (zh) 一种利用环境预测优化非模型机器人多轴孔装配控制方法
Humaidi et al. A new adaptive synergetic control design for single link robot arm actuated by pneumatic muscles
CN109702744A (zh) 一种基于动态系统模型的机器人模仿学习的方法
CN112380616B (zh) 高复杂易形变航天舱段高精度数字孪生对接装配方法
Cao et al. A multi-objective particle swarm optimization for trajectory planning of fruit picking manipulator
CN105159294A (zh) 针对叉车模糊逻辑运动控制器的设计方法
CN101520857A (zh) 一种基于神经网络的永磁球形电动机逆运动学求解方法
CN105487496A (zh) 基于双目标并行island-hfc混合模型遗传编程算法的火电厂热工在线过程辨识及控制算法的优化方法
CN108427282A (zh) 一种基于示教学习的机器人逆运动学求解方法
WO2020118730A1 (zh) 机器人柔顺性控制方法、装置、设备及存储介质
Liu et al. A multitasking-oriented robot arm motion planning scheme based on deep reinforcement learning and twin synchro-control
CN116822380A (zh) 一种基于数字孪生在铜冶炼过程中尾气回收利用的协同优化方法
CN116476081B (zh) 一种机器人节律性技能学习方法及系统
Chen et al. Cooperative distributed model predictive control for robot in-hand manipulation
He et al. Time-optimal trajectory planning of 6-DOF manipulator based on fuzzy control
Zhang et al. Multi-Objective Optimal Trajectory Planning for Robotic Arms Using Deep Reinforcement Learning
Wang et al. LQR control and optimization for trajectory tracking of biomimetic robotic fish based on unreal engine
Zhang et al. An electromyography signals-based human-robot collaboration method for human skill learning and imitation
CN114030008B (zh) 一种基于数据驱动的工业机器人实训能耗测量方法
CN111158238B (zh) 一种基于粒子群算法的力反馈设备动力学参数估计算法
Zhang et al. A sample construction method in kinematics characteristics domain to identify the feed drive model
Xiao et al. Time-Optimal Trajectory Planning of Flexible Manipulator Moving along Multi-Constraint Continuous Path and Avoiding Obstacles
Zhao et al. Robotic peg-in-hole assembly based on reversible dynamic movement primitives and trajectory optimization
Yang et al. Optimized Cooperative Control of Error Port-Controlled Hamiltonian and Adaptive Backstepping Sliding Mode for a Multi-Joint Industrial Robot
Hou et al. Time-optimal Trajectory planning for the manipulator based on improved non-dominated sorting genetic algorithm II

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant