CN113059570B - 基于人体动态臂力估计模型的人-机器人协同控制方法 - Google Patents

基于人体动态臂力估计模型的人-机器人协同控制方法 Download PDF

Info

Publication number
CN113059570B
CN113059570B CN202110384023.7A CN202110384023A CN113059570B CN 113059570 B CN113059570 B CN 113059570B CN 202110384023 A CN202110384023 A CN 202110384023A CN 113059570 B CN113059570 B CN 113059570B
Authority
CN
China
Prior art keywords
human
robot
arm strength
human body
estimation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110384023.7A
Other languages
English (en)
Other versions
CN113059570A (zh
Inventor
张铁
孙韩磊
邹焱飚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110384023.7A priority Critical patent/CN113059570B/zh
Publication of CN113059570A publication Critical patent/CN113059570A/zh
Application granted granted Critical
Publication of CN113059570B publication Critical patent/CN113059570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/08Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
    • B25J13/087Controls for manipulators by means of sensing devices, e.g. viewing or touching devices for sensing other physical parameters, e.g. electrical or chemical properties
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1612Programme controls characterised by the hand, wrist, grip control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Manipulator (AREA)

Abstract

本发明提供了基于人体动态臂力估计模型的人‑机器人协同控制方法,包括以下步骤:采用小波滤波算法对采集的上肢肌肉及转角数据进行去噪处理,去除原始数据中的高斯白噪声;采用改进的均方根滤波器提取去噪后肌电信号的幅值信息,并通过离散低通滤波器进行平滑处理;基于深度学习算法,获得肌电信号与关节转动的关系,建立关节转动补偿模型,并将基于关节转动补偿模型获得的关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合;将数据融合后的肌电信号作为输入,手臂力量信息作为输出,采用长短时记忆神经网络训练人体动态臂力估计模型;最后依据估计得到的手臂力量结合PD控制算法,调节机器人位移,最终实现人与机器人的协同操作。

Description

基于人体动态臂力估计模型的人-机器人协同控制方法
技术领域
本发明属于人机交互领域和人工智能领域,具体涉及基于人体动态臂力估计模型的人-机器人协同控制方法。
背景技术
由于人机协作相较于机器人独立工作具有更高的灵活性,人与机器人间的关系在今后将更加紧密,人与机器人将实现信息共享,共同完成复杂任务。目前一个被广泛应用的人机交互接口就是力传感器,通过力传感器采集人类导师的肌肉力量信息,控制机器人实现人类导师的意图(Agravante,D.J.,Cherubini,A.,Bussy,A.,Gergondet,P.,&Kheddar,A.(2014).Collaborative Human-Humanoid Carrying Using Vision and HapticSensing.2014 IEEE International Conference on Robotics and Automation(ICRA),607-612.)。然而,力传感器容易受到交互环境以及操作空间的制约,完全依赖力传感器获取人类的肌肉力量信息的方法不切实际。随着科学工作者对人体生物信号的深入研究,发现人体肌电信号携带有大量人类的运动信息,对于建立新型的人机协作接口具有可行性。2014年,Luka Peternel等人借助肌电信号在线学习人类导师的运动轨迹和运动频率,机器人在自主阶段周期性地使用所学的运动信息完成特定任务(Peternel,L.,Petric,T.,Oztop,E.,&Babic,J.(2014).Teaching robots to cooperate with humans in dynamicmanipulation tasks based on multi-modal human-in-the-loop approach.AutonomousRobots,36(1-2),123-136.)。2017年,Luka Peternel等人又通过肌电信号将估计的人类运动刚度集成到机器人混合控制器,实现人机协同锯切、紧固螺栓等任务。2019年,JosephDelPreto等人通过上肢肌肉的肌电信号估计手臂刚度,通过完成人机协作搬运和装配任务。此外,这种利用肌电信号作为媒介提出的人类技能传递方法还被应用于手术医疗、康复训练等领域。目前常见的基于肌电信号的人机协作接口框架大多是通过监测人类导师肌电信号的变化估计手臂的刚度,并将估计刚度映射到机器人阻抗控制器的方法。然而,上述人机协作接口中并没有对估计刚度的精度进行标定,这种模型接口包含人类导师的行为信息低于力传感器的人机交互接口,限制了后期复杂模型的应用。因此设计一种估计人类导师肌肉力量的模型代替传统的力传感器对于人机协作技术的发展具有重要意义。
当前基于肌电信号对肌肉力量的估计主要以等距收缩为主,动态收缩的肌肉力量估计更为复杂,需要与肌肉动力学模型相结合,同时兼顾生理和非生理因素影响。研究表明,关节角度不但包含收缩类型、肌肉长度、肌肉力臂等信息,而且还会影响肌电信号的频谱及其振幅间的关系,因此考虑关节角度能够有效降低估计模型的复杂程度(Roman-Liu,D.,&Bartuzi,P.(2013).The influence of wrist posture on the time and frequencyEMG signal measures of forearm muscles.Gait&Posture,37(3).)。2007年,FaridMobasser利用与肘关节转动有关的上臂肌肉的肌电信号和肘关节角位置和速度等信息采用快速正交搜索(FOS)方法,研究了在等距、等张和轻载三种操作条件下肘关节力估算,但受备选基函数的限制,动态肌肉力量的估计精度不高。2015年,Javad Hashemi通过引入关节角度影响因子来校准并行串联辨识模型(PCI),实现肘关节在一定角度范围内的肌肉力估计。PCI模型同时考虑了估计模型的动态与非线性,是目前较为优秀的肌肉力量估计模型,但对于关节角度的影响采用插值拟合方式,忽略了关节角度与肌电信号的非线性关系,因此动态关节力估计精度较等距收缩预测精度差距明显。虽然科学工作者们验证了关节角度对动态肌肉力量估计的积极作用,但由于关节角度对关节力的影响过于复杂,仍需要进行深入研究。此外肌肉力量估计模型的延迟问题也是制约其在人机协作领域应用的一个重要问题。研究表明,肌电信号的滤波过程是造成肌肉力量估计延迟的主要原因。JavadHashemi采用移动窗口长度为400(400ms,0.6Hz)的平均滤波器对原始肌电信号进行处理,信号处理过程延迟约150ms,PCI模型计算过程延迟约20ms,因此估计的肌肉力量产生了约170ms的延迟现象。肌电信号信号处理过程中方法的选择既决定了特征信息的保留程度,又影响了特征提取的实时性,需深入研究。
发明内容
本发明的目的是提供一种基于人体动态臂力估计模型的人-机器人协同控制方法,旨在借助人体肌电信号,快速、便捷地获取人体的手臂力量,传递人类导师的运动意图,实现人与机器人的协同操作。本发明通过引入遗忘参数对特征提取方法进行优化;构建关节转动和肌电信号的深度学习模型使提取的肌电信号包含最少的关节旋转信息。采用与手臂力量相关的PD控制算法,依据人类的本能反应去控制机器人协同运动。该方法发挥了人和机器人的各自优势,利用机器人的超强体力,让机器人承担大部分的体力劳动,而利用人类导师自身的感知能力,为机器人提供指导。
本发明至少通过如下技术方案之一实现。
基于人体动态臂力估计模型的人-机器人协同控制方法,该方法主要包括信号采集及去噪、信号特征提取、人体动态臂力估计和人-机器人协同控制,分别对应如下步骤:
步骤1、采集手臂表面肌电信号、关节转角以及手臂力量信息为人体动态臂力估计模型的训练数据,并对训练数据进行预处理;
步骤2、采用改进的均方根滤波器提取去噪后肌电信号的幅值信息,并采用离散低通滤波器进行平滑处理;
步骤3、基于深度学习算法,获得肌电信号与关节转动的关系,建立关节转动补偿模型,并将关节转动补偿模型获得的关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合,将数据融合后的肌电信号作为长短时记忆神经网络的输入,手臂力量信息作为输出,采用长短时记忆神经网络训练人体动态臂力估计模型,以估计得到人体手臂力量;
步骤4、依据动态臂力估计模型估计得到的手臂力量结合PD控制算法,调节机器人位移,最终实现人与机器人的协同操作。
优选的,所述关节转动补偿模型采用RBF神经网络。
优选的,所述训练数据具体包括三角肌前部、中部、后部和肱二头肌、肱三头肌的表面肌电信号,肩关节与肘关节的关节转角以及手臂力量信息。
优选的,所述预处理具体是采用小波滤波算法对采集的数据进行去噪处理,去除原始数据中的高斯白噪声。
优选的,步骤1中,所述小波滤波算法采用6阶Daubechies基函数,软阈值处理。
优选的,所述改进的均方根滤波器表达式为:
Figure GDA0003549518860000041
式中,η为遗忘因子,Eraw[m]为第m个小波滤波后的肌电信号,ERMS[i]为第i个经改进均方根滤波处理的肌电信号,N为滤波器滑动窗口大小。
优选的,步骤2包括将差分规则应用于线性连续滤波器,得到离散低通滤波器,对提取的幅值信息进行平滑处理,其表达式为,
Figure GDA0003549518860000051
式中,ELPF[n]为第n个低通滤波数据,ξ为滤波器的差分权重。
优选的,步骤3中,关节转动补偿模型采用具有强化学习更新规则的RBF神经网络,获得关节转动的等效肌电信号,所述RBF神经网络表达式为,
Figure GDA0003549518860000052
式中,g(a,θ)是关节旋转的等效肌电信号,J为关节角度θ和角加速度a组成的输入矢量,即J=[a,θ],Jci=[aci,θci]为聚类中心向量,aci为关节角加速度聚类中心,θci为关节角度聚类中心,σi为隐含层第i个神经元的宽度向量,Ri(J)为隐含层第i个节点的基函数;Vi为输出层权重;d为输出层阈值;ζ为隐含层节数,将输出层阈值d看作基函数为-1的输出层权重,采用最小二乘法得到输出层权重Vi
RBF神经网络的聚类中心采用强化学习更新规则的Kohonen算法,其聚散中心向量的变化量ΔJci为,
ΔJci=2αr|iyi-pi|(J-Jci)
式中,iyi为第i个神经节点的Bernoulli二值分布值,Bernoulli二值分布方式为
Figure GDA0003549518860000053
pi为激活概率
Figure GDA0003549518860000054
si为当输入矢量J与聚类中心向量Jc的欧式距离,si=||J-Jci||,r为奖励值,当pi≥1-pi时,iyi取1,对神经元i采取奖励机制,当pi<1-pi时,iyi取0,对神经元i采取惩罚机制,奖惩策略如下:
Figure GDA0003549518860000061
式中,i*为选中更新的神经元节点,其选择方式为i*=argmin[si],ri为第i个神经节点的奖励值。
优选的,步骤3中,采用相减的方式对关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合,其表达式为:
Figure GDA0003549518860000062
其中,
Figure GDA0003549518860000063
是数据融合后的数据,
Figure GDA0003549518860000064
为肌电信号特征提取后的数据,f为1到5,分别代表三角肌前部、中部、后部和肱二头肌、肱三头肌。
优选的,步骤4的调节机器人位移的方式为:
Figure GDA0003549518860000065
式中,Fh为估计得到的臂力,
Figure GDA0003549518860000066
为估计得到的臂力的微分,Kp为比例系数,KD为微分系数,Δp为机器人位置增量。
与现有的技术相比,本发明的有益效果为:
获取人类的肌肉力量信息对于机器人学习人类的行为策略和操作技巧具有重要意义,特别是在人机协作领域。相较于采用力传感器获取人类导师的臂力信息,用肌电信号估计臂力的方式灵活便捷。实验发现采集的肌电信号不仅包括手臂输出的力量信息,还包括关节旋转信息,但目前借助肌电信号进行臂力估计的模型中没有考虑关节转角的影响,因此由于关节旋转信息的存在降低了手臂力量估计的准确性。
本发明中提出的基于人体动态臂力估计模型的人-机器人协同控制方法,在信号处理过程,引入遗忘参数对均方根滤波器进行改进,提高了模型的实时性,有效缓解信号处理过程的滞后问题。构建具有强化学习更新规则的关节转动补偿模型,使提取的肌电信号包含最少的关节旋转信息,提高了动态臂力估计的准确性。最后通过与臂力相关的PD控制算法,实现了人与机器人间的力信息共享,通过人与机器人的协同操作,大大降低了人类导师的劳动强度。
本发明的方法延迟小,臂力估计精度高,通过人与机器人间的力信息共享,能够准确识别人类导师的运动意图,充分发挥人和机器人的各自优势,大大降低了人类导师的劳动强度。
附图说明
图1为本发明实施例的基于人体动态臂力估计模型的人-机器人协同控制方法的流程图;
图2为本发明实施例的信号采集示意图;
图3为本发明实施例的人体动态臂力估计模型示意图;
图4为本发明实施例的人与机器人协同控制示意图。
具体实施方式
为了更好地理解本发明,下面结合附图对本发明作进一步地描述。
实施例1
本实施例一种基于人体动态臂力估计模型的人-机器人协同控制方法,如图1所示,包括以下步骤:
1)信号采集及去噪阶段
如图2所示,采用肌电传感器分别三角肌前部、中部、后部和肱二头肌、肱三头肌的表面肌电信号,采用测角仪分别肩关节转角θ1与肘关节转角θ2,采用力传感器采集手臂力量信息,并将上述采集数据作为人体动态臂力估计模型的训练数据,所述所述人体动态臂力估计模型包括关节转动补偿模型、长短时记忆神经网络,该模型为后续人-机器人的协同控制提供手臂力量信息。采用小波滤波算法对采集的数据进行去噪处理,去除原始数据中的高斯白噪声,其中小波滤波算法采用6阶Daubechies基函数,软阈值处理。
2)信号特征提取阶段,采用改进的均方根滤波器提取去噪后肌电信号的幅值信息,并采用离散低通滤波器进行平滑处理;
2-1)改进的均方根滤波器实现方法,所述改进方法为在传统的均方根滤波器中添加遗忘因子的方式。
肌电信号信号的均方根不仅包括肌力信息,还包括包络信息,其处理方法如下,
Figure GDA0003549518860000081
式中,Eraw[m]为第m个小波滤波后的肌电信号,ERMS1[i]为第i个经均方根滤波处理的肌电信号,N为滑动窗口长度。
均方根滤波的最大问题是所有数据的权值相同,不能突出当前信号的影响,造成严重延迟,因此考虑改进均方根滤波方法,通过改变信号的影响权重,突出当前信号,衰减过去信号,其表达式为:
Figure GDA0003549518860000082
式中,ERMS[i]为第i个经改进均方根滤波处理的肌电信号,fpm为第m个肌电信号的影响权重,ws为所有肌电信号影响权重之和,即
Figure GDA0003549518860000091
当fpm按照遗忘参数η等比衰减时,fpm可以表示为,
fpm=η-(i-m) (3)
此时,第i个信号为待处理数据的当前值,当m=i时,当前肌电信号的影响权重即为1。那么总肌电信号影响权重之和ws为
Figure GDA0003549518860000092
结合将公式(3)(4)代入公式(2)可得到改进的均方根滤波器为:
Figure GDA0003549518860000093
2-2)离散低通滤波器实现方法
滤波处理后的特征信号波动仍然很大,因此本发明将差分规则应用于线性连续滤波器,得到简单的离散低通滤波器,对提取的特征信号进行平滑处理。
Figure GDA0003549518860000094
式中,ELPF[n]为第n个低通滤波数据,ξ为滤波器的差分权重。
3)人体动态臂力估计阶段
如图3所示,基于深度学习算法,获得肌电信号与关节转动的关系,建立关节转动补偿模型,并将关节转动补偿模型获得的关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合,将数据融合后的肌电信号作为长短时记忆神经网络的输入,估计人体手臂力量;
3-1)关节转动补偿模型实现方法
关节转动补偿模型采用具有强化学习更新规则的RBF神经网络,获得关节转动的等效肌电信号,模型中RBF神经网络表达式为,
Figure GDA0003549518860000101
式中,g(a,θ)是关节旋转的等效肌电信号,J为关节角度θ和角加速度a组成的输入矢量,即J=[a,θ],Jci=[aci,θci]为聚类中心向量,aci为关节角加速度聚类中心,θci为关节角度聚类中心,σi为隐含层第i个神经元的宽度向量,Ri(J)为隐含层第i个节点的基函数;Vi为输出层权重;d为输出层阈值;ζ为隐含层节数,将输出层阈值d看作基函数为-1的输出层权重,采用最小二乘法得到输出层权重Vi
RBF神经网络的聚类中心采用强化学习更新规则的Kohonen算法。传统Kohonen聚类中心算法如下:
将输入矢量J=[a,θ]与聚类中心向量Jci=[ac,θc]的最小欧式范数作为最匹配节点,
Figure GDA0003549518860000102
该最优节点即为获胜节点,竞争学习更新规则为
ΔJci=[Δaci,Δθcj]=α[a-aci,θ-θci] (9)
式中,ΔJci为聚类中心矢量的变化量,Δaci为关节角度聚类中心增量,Δθci为关节角加速度度聚类中心增量,α为学习率。
在上述Kohonen算法的基础上采用强化学习更新规则,依照概率的大小来确定该获胜神经元是否被激活,若该神经元被激活则给出奖励信号,若未被激活则给出惩罚信号,对其他神经元则不更新其权值。采用Bernoulli分布算法构造二值神经元概率质量分布函数qi
Figure GDA0003549518860000111
式中pi为激活概率,iyi为二值法的输出数值(0或1),可以表示为,
Figure GDA0003549518860000112
函数h(si)将激活概率pi归算到[0,1]区间,且当输入矢量J与聚类中心向量Jc的欧式距离s越小,激活概率pi越大。
Figure GDA0003549518860000113
式中,i*为选中更新的神经元节点。
为了确保模型的收敛能力,采用梯度强化法作为奖励函数,
Figure GDA0003549518860000114
式中,r为奖励系数,bi为强化基准。
根据公式(11)(12),可将公式(13)简化为:
Figure GDA0003549518860000115
当pi≥1-pi时,iyi取1,对神经元i采取奖励机制,当pi<1-pi时,iyi取0,对神经元i采取惩罚机制,奖惩策略如下:
Figure GDA0003549518860000116
综上述,当bi=0时,聚散中心向量的变化量ΔJci为,
Figure GDA0003549518860000121
3-2)数据融合实现方法如下:
结合关节转动补偿模型,对关节转动补偿后等效肌电信号进行数据融合,其表达式为:
Figure GDA0003549518860000122
式中,
Figure GDA0003549518860000123
为数据融合后的数据,
Figure GDA0003549518860000124
为肌电信号特征提取后的数据,f为1到5,分别代表三角肌前部、中部、后部和肱二头肌、肱三头肌。
3-3)长短时记忆神经网络实现方法
肌肉收缩变化存在连续性,因此肌肉力量也不会发生突变。采用具有循环、记忆能力的长短时记忆神经网络作为肌肉力的估计模型可以很好地处理肌肉力的时间动态行为。该网络通过遗忘门、输入门、输出门及状态门来实现信息的保护和控制。将数据融合的肌电信号
Figure GDA0003549518860000125
作为输入变量,臂力Fh为输出变量,动态臂力估计方法如下:
(1)遗忘门fi决定了前一单元状态Ci-1的保留成分,其表达式为,
Figure GDA0003549518860000126
式中,
Figure GDA0003549518860000127
为长短时记忆神经网络第i-1次估计得到的臂力。
(2)输入门ii决定了当前输入参数
Figure GDA0003549518860000128
(
Figure GDA0003549518860000129
为当前的数据融合的肌电信号
Figure GDA00035495188600001210
与上一次估计得到的手臂力量
Figure GDA00035495188600001211
)加入当前状态单元Ci的信息成分,其表达式为,
Figure GDA00035495188600001212
(3)由遗忘门fi,输入门ii及前一单元状态Ci-1可得到当前状态单元Ci,其表达式为:
Figure GDA0003549518860000131
Figure GDA0003549518860000132
其中
Figure GDA0003549518860000133
为计算Ci的中间过渡参数。
(4)输出门决定当前状态单元Ci的输出情况,其表达式为,
Figure GDA0003549518860000134
Figure GDA0003549518860000135
式中Wf、Wi、Wc、Wo,和bf、bi、bc、bo分别为各阶段的权重及偏置。δ(·)为Sigmoid激活函数,tanh(·)为双曲正切激活函数。
Figure GDA0003549518860000136
为长短时记忆神经网络第i次估计得到的臂力。oi表示输出门的输出值。
4)人-机器人协同控制阶段,依据上一阶段估计得到的手臂力量结合PD控制算法,调节机器人位移,最终实现人与机器人的协同操作。
调节机器人位移的方式为:
Figure GDA0003549518860000137
式中,其中,Fh为估计得到的臂力,
Figure GDA0003549518860000138
为估计得到的臂力的微分,Kp为比例系数,KD为微分系数。Δp为机器人位置增量。
在人与机器人协作过程中,如图4所示,人类导师根据自己的观感意识判断机器人的位置,当机器人所处位置与人类导师期望位置存在偏差时,人类导师通过调节自身臂力的方式控制机器人按照人类意图运动。如图1所示,同时采集三角肌前部、中部、后部和肱二头肌、肱三头肌的表面肌电信号,肩关节与肘关节的关节转角以及手臂力量信息作为动态臂力估计模型的训练数据。采用小波滤波算法对采集的上肢肌肉及转角数据进行去噪处理,去除原始数据中的高斯白噪声;采用改进的均方根滤波器提取去噪后肌电信号的幅值信息,并通过离散低通滤波器进行平滑处理;基于深度学习算法,获得肌电信号与关节转动的关系,建立关节转动补偿模型,并将基于关节转动补偿模型获得的关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合;将数据融合后的肌电信号作为输入,手臂力量信息作为输出,采用长短时记忆神经网络训练人体动态臂力估计模型。模型训练完成后,仅需要三角肌前部、中部、后部和肱二头肌、肱三头肌的表面肌电信号,和肩关节与肘关节的关节转角信息,便能够估计人类导师的手臂力量。在人与机器人协作过程,工控机接收机器人发送的状态信息,基于获取的手臂力量结合PD控制算法,发送运动指令。机器人控制柜通过通信协议或通用传感器接口接收控制指令,控制机器人实现人类导师发出的指定运动。
实施例2
本实施例一种基于人体动态臂力估计模型的人-机器人协同控制方法,与实施例1相比,其不同之处在于人体动态臂力估计模型包括关节转动补偿模型,数据融合和BP神经网络。在人体动态臂力估计阶段,采用BP神经网络估计人体手臂力量;所述的BP神经网络结构为:
Figure GDA0003549518860000141
Figure GDA0003549518860000142
为BP神经网络的第f个输入节点的输入值,yf是隐藏节点的值,m是隐藏层节点的数量,n是输入层节点的数量,Fh是输出节点的值(估计的手臂力量),ωfi是一个输入节点和一个隐藏的节点之间的连接权重,ωkf是一个隐藏的节点和一个输出节点之间的连接权重,bin输入层节点阈值,和bhi隐藏层节点阈值。
实施例3
本实施例一种基于人体动态臂力估计模型的人-机器人协同控制方法,与实施例1相比,其不同之处在对上述的改进均方根滤波器的滑动窗口长度N和遗忘参数η进行贝叶斯优化,选择最优参数保留降低延时和最大程度上保留特征信息。
采用无载荷下关节转角θ与提取的特征信号ELPF的相关度|ρ|作为滤波器参数选取的评价标准。|ρ|越接近1,提取的特征信号ELPF与关节转角θ的相关性越高,表明此时特征信号包含的有用信息多,滤波延时小。
Figure GDA0003549518860000151
Cov(θ,ELPF)为特征提取信号ELPF与关节转角θ的协方差,Var|θ|为关节转角θ的方差,Var|ELPF|为提取的特征信号ELPF的方差。
采用传统的基于梯度的优化方式,需目标函数满足数学模型连续可导。而采用滑动窗口的滤波过程是离散的,因此不能采用传统的梯度优化方法,而贝叶斯优化可以通过使用概率代理模型评估复杂的目标函数实现参数的全局优化。贝叶斯优化主要包括概率代理模型和采集函数两个过程。
(1)概率代理模型
采用高斯过程对目标函数f(N,η)进行描述,通过观测数据
Figure GDA0003549518860000152
([Nii]为第i个样本点,yi为第i组样本点的观测值,t为样本点数量),依靠高斯过程便能够得到函数的后验概率
Figure GDA0003549518860000153
(
Figure GDA0003549518860000161
为预测得到的函数值,
Figure GDA0003549518860000162
的预测得到的样本点,D1:t观测数据集)。假设优化参数服从高斯分布,并构造高斯过程为:
f(N,η)~GP(μ(N,η),k([N,η],[N,η]λ)) (26)
式中,μ(N,η)为均值函数,为了简化运算将μ(N,η)=0,k([Nii],[Njj])为核函数,表示样本点[Nii],[Njj]的协方差,其表达式为:
Figure GDA0003549518860000163
式中,
Figure GDA0003549518860000164
为协方差振幅,为简化模型
Figure GDA0003549518860000165
取1,σN、ση分别为N和η的标准差。r为基函数。
高斯过程是一个随机变量的集合,任意有限个样本点X={[N11],…,[Ntt]}([Ntt]为第t组样本点)都存在一个联合高斯分布:
p(f|X)=N(0,K) (28)
f表示样本的目标函数值的集合{f1,f2,…,ft},K表示已知样本的协方差矩阵,其表达式为,
Figure GDA0003549518860000166
由于采集的肌电信号存在噪声,目标函数的计算中噪声干扰在所难免,因此观测结果yi可以表示为yi=f([Nii])+ε。假设噪声ε满足独立同分布,且服从高斯分布p(ε)=N(0,σ2),从而得到似然函数的表达式为:
p(y|f)=N(f,σ2I) (30)
其中,y表示观测值集合{y1,y2,…,yt},I为单位矩阵。结合式(25),观测值表达式可表示为:
Figure GDA0003549518860000171
对于一个预测样本点
Figure GDA0003549518860000172
根据高斯过程的性质,存在联合高斯分布为,
Figure GDA0003549518860000173
式中,y1;t表示1到t组样本点的观测值,
Figure GDA0003549518860000174
为预测函数值。k表示预测样本点
Figure GDA0003549518860000175
与其余样本的协方差组成的矩阵,其表达式为:
Figure GDA0003549518860000176
根据式(32),可得到
Figure GDA0003549518860000177
的后验概率为:
Figure GDA0003549518860000178
(2)采集函数
采集函数是选择下一个观测点的主动策略,由已观测数据集D1:t得到的后验分布,并通过对其最小化指导选择下一个观测点
Figure GDA0003549518860000179
寻找最优参数主要有两种策略,探索未知空间和在现有最大值附近搜索。采用上置信策略LCB对两种策略的采集函数进行平衡。
Figure GDA00035495188600001710
其中,参数βt通过调节期望μt([N,η])和方差σt([N,η])来平衡两种采集策略,。式(35)的最大值即为下一个观测点:
Figure GDA0003549518860000181
上述改进的方根滤波器参数优化过程实施时,采用无载荷下关节转角θ与提取的特征信号ELPF的相关度|ρ|作为滤波器参数选取的评价标准。贝叶斯优化的初始参数设置为:寻优空间S=[(Nmin:Nmax),(ηminmax)]=[(100:600),(0.9:1)],最大迭代次数itmax为30。经贝叶斯优化后发现,当N为300左右,η为0.986时,改进的方根滤波器最大程度上保留肌电信号的有用信息。
实施例4
本实施例一种基于人体动态臂力估计模型的人-机器人协同控制方法,与实施例1相比,其不同之处在于,设计了一种人在环控制方法。人类导师为驱动者,机器人为伴随者,根据人类导师的臂力反馈来调节机器人速度跟踪误差,将该过程看作导纳控制过程,其表达式为:
Figure GDA0003549518860000182
其中Fh为人类手臂力量,K和D为机械臂的虚拟刚度和阻尼矩阵,xa和xd分别为机械臂末端在被控方向的实际位置和参考位置。
Figure GDA0003549518860000183
分别为机械臂末端在被控方向的实际位置和参考位置的微分;
机器人的位置校准模块本质为单位响应时间Δt内的位置增量,因此位置增量与速度v的关系可近似表达为,
xa-xd=vΔt (38)
此时,机器人运动速度与臂力的关系为,
Figure GDA0003549518860000184
上述控制运算时,将人类导师的手臂和机器人末端看作虚拟的导纳控制,根据人类的臂力信息,控制机器人的速度调节。当人类导师对锯切速度不满时,会自然的调整手臂力量,当人类导师察觉将要触碰边界时,会改变手臂施力方向,人类导师可以根据触觉反馈和视觉反馈本能地控制机器人的协同运动。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (9)

1.基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,该方法主要包括信号采集及去噪、信号特征提取、人体动态臂力估计和人-机器人协同控制,分别对应如下步骤:
步骤1、采集手臂表面肌电信号、关节转角以及手臂力量信息为人体动态臂力估计模型的训练数据,并对训练数据进行预处理;
步骤2、采用改进的均方根滤波器提取去噪后肌电信号的幅值信息,并采用离散低通滤波器进行平滑处理;所述改进的均方根滤波器表达式为:
Figure FDA0003549518850000011
式中,η为遗忘因子,Eraw[m]为第m个小波滤波后的肌电信号,ERMS[i]为第i个经改进均方根滤波处理的肌电信号,N为滤波器滑动窗口大小;
步骤3、基于深度学习算法,获得肌电信号与关节转动的关系,建立关节转动补偿模型,并将关节转动补偿模型获得的关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合,将数据融合后的肌电信号作为长短时记忆神经网络的输入,手臂力量信息作为输出,采用长短时记忆神经网络训练人体动态臂力估计模型,以估计得到人体手臂力量;
步骤4、依据动态臂力估计模型估计得到的手臂力量结合PD控制算法,调节机器人位移,最终实现人与机器人的协同操作。
2.根据权利要求1所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,所述关节转动补偿模型采用RBF神经网络。
3.根据权利要求2所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,所述训练数据具体包括三角肌前部、中部、后部和肱二头肌、肱三头肌的表面肌电信号,肩关节与肘关节的关节转角以及手臂力量信息。
4.根据权利要求3所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,所述预处理具体是采用小波滤波算法对采集的数据进行去噪处理,去除原始数据中的高斯白噪声。
5.根据权利要求4所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,步骤1中,所述小波滤波算法采用6阶Daubechies基函数,软阈值处理。
6.根据权利要求5所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,步骤2包括将差分规则应用于线性连续滤波器,得到离散低通滤波器,对提取的幅值信息进行平滑处理,其表达式为,
Figure FDA0003549518850000021
式中,ELPF[n]为第n个低通滤波数据,ξ为滤波器的差分权重。
7.根据权利要求6所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,所述RBF神经网络表达式为,
Figure FDA0003549518850000022
式中,g(a,θ)是关节旋转的等效肌电信号,J为关节角度θ和角加速度a组成的输入矢量,即J=[a,θ],Jci=[aci,θci]为聚类中心向量,aci为关节角加速度聚类中心,θci为关节角度聚类中心,σi为隐含层第i个神经元的宽度向量,Ri(J)为隐含层第i个节点的基函数;Vi为输出层权重;d为输出层阈值;ζ为隐含层节数,将输出层阈值d看作基函数为-1的输出层权重,采用最小二乘法得到输出层权重Vi
RBF神经网络的聚类中心采用强化学习更新规则的Kohonen算法,其聚散中心向量的变化量ΔJci为,
ΔJci=2αr|iyi-pi|(J-Jci)
式中,iyi为第i个神经节点的Bernoulli二值分布值,Bernoulli二值分布方式为
Figure FDA0003549518850000031
pi为激活概率
Figure FDA0003549518850000032
si为当输入矢量J与聚类中心向量Jc的欧式距离,si=||J-Jci||,r为奖励值,当pi≥1-pi时,iyi取1,对神经元i采取奖励机制,当pi<1-pi时,iyi取0,对神经元i采取惩罚机制,奖惩策略如下:
Figure FDA0003549518850000033
式中,i*为选中更新的神经元节点,其选择方式为i*=argmin[si],ri为第i个神经节点的奖励值。
8.根据权利要求7所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,步骤3中,采用相减的方式对关节转动等效肌电信号与提取的肌电信号幅值信息进行数据融合,其表达式为:
Figure FDA0003549518850000034
其中,
Figure FDA0003549518850000035
是数据融合后的数据,
Figure FDA0003549518850000036
为肌电信号特征提取后的数据,f为1到5,分别代表三角肌前部、中部、后部和肱二头肌、肱三头肌。
9.根据权利要求8所述的基于人体动态臂力估计模型的人-机器人协同控制方法,其特征在于,步骤4的调节机器人位移的方式为:
Figure FDA0003549518850000041
式中,Fh为估计得到的臂力,
Figure FDA0003549518850000042
为估计得到的臂力的微分,Kp为比例系数,KD为微分系数,Δp为机器人位置增量。
CN202110384023.7A 2021-04-09 2021-04-09 基于人体动态臂力估计模型的人-机器人协同控制方法 Active CN113059570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110384023.7A CN113059570B (zh) 2021-04-09 2021-04-09 基于人体动态臂力估计模型的人-机器人协同控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110384023.7A CN113059570B (zh) 2021-04-09 2021-04-09 基于人体动态臂力估计模型的人-机器人协同控制方法

Publications (2)

Publication Number Publication Date
CN113059570A CN113059570A (zh) 2021-07-02
CN113059570B true CN113059570B (zh) 2022-05-24

Family

ID=76566150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110384023.7A Active CN113059570B (zh) 2021-04-09 2021-04-09 基于人体动态臂力估计模型的人-机器人协同控制方法

Country Status (1)

Country Link
CN (1) CN113059570B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114055461B (zh) * 2021-08-20 2023-02-14 华中科技大学 基于肌电接口的机器人力位同步遥操作控制方法及装置
CN114800442B (zh) * 2022-03-22 2023-07-25 华南理工大学 基于肌电信号和运动学冗余的机器人拖动示教系统与方法
CN116211289B (zh) * 2023-02-16 2023-08-25 北京戴来科技有限公司 上肢运动异常的在线分析方法、装置、系统和存储介质
CN116759031B (zh) * 2023-08-10 2024-01-26 内蒙古工业大学 一种基于ann的污泥灰混凝土材料配合比的设计方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775341B1 (en) * 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
CN109176525A (zh) * 2018-09-30 2019-01-11 上海神添实业有限公司 一种基于rbf的移动机械手自适应控制方法
CN111399640A (zh) * 2020-03-05 2020-07-10 南开大学 一种面向柔性臂的多模态人机交互控制方法
CN112276944A (zh) * 2020-10-19 2021-01-29 哈尔滨理工大学 一种基于意图识别的人机协作系统控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102113462B1 (ko) * 2017-02-09 2020-05-21 미쓰비시덴키 가부시키가이샤 위치 제어 장치 및 위치 제어 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775341B1 (en) * 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
CN109176525A (zh) * 2018-09-30 2019-01-11 上海神添实业有限公司 一种基于rbf的移动机械手自适应控制方法
CN111399640A (zh) * 2020-03-05 2020-07-10 南开大学 一种面向柔性臂的多模态人机交互控制方法
CN112276944A (zh) * 2020-10-19 2021-01-29 哈尔滨理工大学 一种基于意图识别的人机协作系统控制方法

Also Published As

Publication number Publication date
CN113059570A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN113059570B (zh) 基于人体动态臂力估计模型的人-机器人协同控制方法
Abu-Dakka et al. Variable impedance control and learning—A review
Bi et al. A review on EMG-based motor intention prediction of continuous human upper limb motion for human-robot collaboration
Su et al. Deep neural network approach in human-like redundancy optimization for anthropomorphic manipulators
Osu et al. Short-and long-term changes in joint co-contraction associated with motor learning as revealed from surface EMG
Zhao et al. A tandem robotic arm inverse kinematic solution based on an improved particle swarm algorithm
Luo et al. Estimation of EMG-based force using a neural-network-based approach
CN107618018B (zh) 一种基于肌电的机械手动作速度比例控制方法
CN111531537B (zh) 基于多传感器的机械臂控制方法
Abdollahi et al. Stable identification of nonlinear systems using neural networks: Theory and experiments
Li et al. Brain-actuated control of dual-arm robot manipulation with relative motion
Roveda et al. Fuzzy impedance control for enhancing capabilities of humans in onerous tasks execution
Huang et al. Joint torque estimation for the human arm from sEMG using backpropagation neural networks and autoencoders
Liu et al. An adaptive upper-arm EMG-based robot control system
Chen et al. Stiffness estimation and intention detection for human-robot collaboration
Zhang et al. An electromyography signals-based human-robot collaboration method for human skill learning and imitation
Zhang et al. Variable impedance control of finger exoskeleton for hand rehabilitation following stroke
Zhang et al. An estimation model of human dynamic arm strength with joint rotation compensation
Huo et al. Adaptive intention-driven variable impedance control for wearable robots with compliant actuators
Rahatabad Modelling and control human arm with fuzzy-genetic muscle model based on reinforcement learning: The muscle activation method
CN112380655B (zh) 一种基于rs-cmsa算法的机器人逆运动学求解方法
Trombetta et al. Variable structure human intention estimator with mobility and vision constraints as model selection criteria
Suryanarayanan et al. EMG-based interface for position tracking and control in VR environments and teleoperation
Ahmadian et al. ℒ 1–ℬℒ Adaptive Controller Design for Wrist Rehabilitation Robot
CN114952791A (zh) 肌肉骨骼机器人控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant