CN116859975A - 基于bp神经网络的轮腿机器人轮-足切换控制方法 - Google Patents
基于bp神经网络的轮腿机器人轮-足切换控制方法 Download PDFInfo
- Publication number
- CN116859975A CN116859975A CN202310972415.4A CN202310972415A CN116859975A CN 116859975 A CN116859975 A CN 116859975A CN 202310972415 A CN202310972415 A CN 202310972415A CN 116859975 A CN116859975 A CN 116859975A
- Authority
- CN
- China
- Prior art keywords
- wheel
- leg robot
- joint angle
- neural network
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000009471 action Effects 0.000 claims abstract description 21
- 238000006243 chemical reaction Methods 0.000 claims abstract description 9
- 210000002414 leg Anatomy 0.000 claims description 96
- 210000002683 foot Anatomy 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 24
- 230000009191 jumping Effects 0.000 claims description 24
- 210000000544 articulatio talocruralis Anatomy 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 9
- 210000001503 joint Anatomy 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000003139 buffering effect Effects 0.000 claims description 6
- 210000004394 hip joint Anatomy 0.000 claims description 6
- 210000000629 knee joint Anatomy 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 5
- 230000005484 gravity Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 238000012876 topography Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Manipulator (AREA)
Abstract
本发明公开了基于BP神经网络的轮腿机器人轮‑足切换控制方法,包括使用激光雷达识别地形地貌,主控制器根据地形情况下发切换指令。建立稳定状态时轮腿机器人轮式、足式以及跳跃动作态的质心轨迹方程,并储存在主控制器的数据库中;分布于轮腿机器人各关节处的角度编码器将(转换前)关节角度信息发送给主控制器,主控制器在数据库中搜索匹配与轮腿机器人实际状态最为接近的一组关节角度信息;将实际关节角度值与满足平衡要求的关节角度值的差值,输入到神经网络PID控制器中,经神经网络PID算法学习训练后,得到PID控制参数,发送给主控制器,主控制器发送脉冲以补偿误差,系统会快速响应达到稳定状态。
Description
技术领域
本发明涉及机器人技术领域,具体为基于BP神经网络的轮腿机器人轮-足切换控制方法。
背景技术
随着机器人技术不断发展,移动机器人越来越多地出现在人类的生活、工作等不同场景中。移动机器人主要有轮式机器人和足式机器人两类。轮式机器人结构简单、控制容易、移动速度快、效率高,但难以适应非平整地面等复杂地形。足式机器人一般为多关节机器人,相比于轮式机器人,其结构复杂、控制困难、移动速度低、效率低,但能够适应非平整地面等复杂地面。因此,结合两者优点,能够满足移动速度和效率要求,又能适应复杂地形,有相当广阔的应用前景。
针对搜救环境下复杂多变的地形环境,轮腿搜救机器人在复杂地形下具有良好的运动能力,未来结合多样化救援装备,可代替搜救人员进入危险复杂的区域执行搜救任务,提升突发事件应急处理能力与工作效率。轮式机器人运动模式简单且运动速度快,但在崎岖、起伏的地形下运动效率较差。双足相比于其他多足机器人有较少的腿数、更大的腿部空间等优势,其与轮式相结合能够发挥出轮足机器人更大的优势,更适合在人类的各种场景中广泛应用。轮足一体式,即在足式机器人腿部上安装轮式机构,这类机器人将轮子安装至腿部,即轮子和机器人躯体的连接经过了几个关节的连接,在轮式运动时各关节需要保持位置和刚度来确保轮式运动的稳定性。
但是,这种轮足机器人在一些复杂地形(比如斜坡、凹凸不平的地面上)进行轮足切换时,机械腿绕车体的运动时,车体的重心会发生变化,贸然进行轮足切换可能会导致机器人失去平衡,从而无法在复杂地形稳定进行轮足切换,于是,有鉴于此,针对现有的结构予以研究改良,提供基于BP神经网络的轮腿机器人轮-足切换控制方法,以期达到更具有实用价值性的目的。
发明内容
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明基于BP神经网络的轮腿机器人轮-足切换控制方法,包括:
步骤1、使用激光雷达识别地貌,采集地形信息并发送给主控制器;
步骤2、主控制器检测到地形发生变化,下发切换指令;
步骤3、分布于各个关节的角度编码器采集实际关节角度信息,发送给主控制器,主控制器基于关节角度信息匹配一组与实际关节角度最为接近的一组关节角度信息;
步骤4、实际关节角度与稳定状态下的关节角度的差值输入到神经网络PID控制器中;
步骤5、得到调整参数,返回给主控制器以补偿误差。
作为本发明的一种优选技术方案,所述激光雷达采集地形地貌信息,根据地形复杂度,设计一个阈值,主控制器则会基于现有运动状态的环境条件,与采集的地形进行比较判断,若未超出阈值,轮腿机器人运动状态则会保持原有状态不发生改变;
若超出阈值,主控制器则会下发切换指令;
切换模式分为三种:一种是轮式运动状态切换到足式运动状态,具体是指:轮式运动状态适用于平坦光滑的地面,在此环境状态下,轮腿机器人采用轮式运动模式可以在保持稳定运动状态下大幅提高运动效率,当轮腿机器人在轮式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出轮式运动模式的阈值,主控制器停止向踝关节电机发送脉冲,轮子停止转动,运动状态转变为足式运动模式;
另一种是足式运动状态切换到轮式运动状态,具体是指:
足式运动状态适用于不规则地面同时可以避障,在此环境状态下,轮腿机器人采用足式运动模式稳定性更高,适应环境变化能力更强,当轮腿机器人在足式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出足式运动模式的阈值,主控制器继续向踝关节电机发送脉冲,轮子开始转动,运动状态转变为轮式运动模式;
跳跃动作:则若激光雷达检测识别的地形为楼梯形地貌或陡坡,轮腿机器人需要进行跳跃动作完成避障,在进行跳跃动作之前,主控制器需要判断轮腿机器人的当前运动模式是否为足式运动状态,若判断结果为否,需要完成上述足式转换,若判断结果为是,主控器根据当前足式运动状态下的关节角度信息,对轮腿机器人起跳阶段的关于关节角度的质心轨迹进行最优匹配,并由神经网络PID控制器完成误差补偿,着地相采取同样的方式进行误差补偿,由此轮腿机器人可以柔顺的完成整个起跳动作。
作为本发明的一种优选技术方案,所述对于激光雷达采集并识别地形信息,具体方法如下:
轮腿机器人系统由三个坐标系组成,分别为世界坐标系ΣW、机身坐标系ΣB和激光雷达坐标系ΣL,坐标系方向均采用ROS系统的REP-103规则,即X轴正方向在前,Y轴正方向在左,Z轴正方向在上;
世界坐标系是静止不动的,用来作为其他坐标系的参考,当激光雷达在软腿机器人上固定之后,激光雷达坐标系和机身坐标系是一个移动的系,激光雷达开始工作时激,激光器会发射一个激光脉冲计时器,此时记录下射出时间,当激光脉冲返回时,计时器在记录下返回时间,利用两个时间的时间差即可计算出点到雷达中心的距离;
激光雷达在扫描时通过激光束的发射,可以测量出各个点到激光雷达中心的距离以及此时激光雷达自身的水平旋转角α和垂直角β,通过下式能够得到各点云的坐标为:
式中x,y,z分别为点在激光雷达坐标系下的坐标,R为采集的点云到激光雷达中心的距离,根据同一时刻发送的激光束返回的点云信息,经主控制器进行处理后,可以构建出环境的三维点云地图。
作为本发明的一种优选技术方案,所述轮腿机器人的髋关节、膝关节、踝关节分别安装有角度编码器,其角度值分别命名为θ1,θ2,θ3,另外设置一个角度θ表示轮腿机器人整体质心与双轮公共轴线重点的连线与竖直方向的倾角,轮腿机器人稳定的约束条件要求轮上部分的联合质心竖直投影需落在双轮公共轴线上,用表达式表示为θ≤0.5°。
作为本发明的一种优选技术方案,通过角度编码器获取了各关节角度之后,考虑到轮腿机器人行进过程中进行运动状态的变换,受到惯性的影响,轮腿机器人发生倾倒,需要进行预控制,主控制器首先需要根据轮腿机器人当前各关节角度值,在数据库中搜索与实际关节角度值最为接近的一组关节角度信息,具体表示如下:
假设θ1,θ2,θ3分别表示髋关节,膝关节,踝关节角度值,θ'1,θ'2,θ'3为数据库中轮腿机器人满足稳定条件的一组关节角度值:
(θ1-θ1')2+(θ2-θ2')2+(θ3-θ3')2≤e
为了快速找到一组与实际运动状态相近且满足平衡约束要求的关节角度变量,主控制器可根据上式进行搜索,当e足够小时,便可选定对应的数据库关节角度信息。
作为本发明的一种优选技术方案,基于各关节角度的质心评估函数具体如下:
首先基于轮腿机器人构建坐标系Rw,以轮子中心为圆心,两轮公共轴心为y轴,机身前进方向为x轴,竖直方向为z轴;在坐标系Rw中,机体质心坐标(xCoM,zCoM)可以表示各个连杆质心的坐标和:
在式中为了化表达:si=sinθi,ci=cosθi,cij=cos(θi+θi),sij=sin(θi+θj),由此得到机体质心与轮子圆心距离为l,连线与竖直方向的倾角为θ,其满足关系式:
由此我们得到了关于各关节角度的质心表达式,并得到了机体质心与轮子中心连线与竖直方向的倾角。
作为本发明的一种优选技术方案,所述跳跃预处理:构造轨迹生成器,使机器人可根据障碍物的高度规划此次跳跃的机体关于各关节角度的质心参照轨迹与足端参照轨迹,首先根据障碍物高度确定关键点处的位置与速度,然后采用三次样条插值法得到机体质心点与轮最小离地点的连续位置与速度,简称轮最小离地点为足端,基于构造的质心参照轨迹,主控制器搜索匹配到与轮腿机器人实际关节角度最为接近的关节角度值,以此点作为起跳点,进行跳跃动作;
跳跃过程:支撑相时,机器人双轮着地,腾空相时,机器人双轮离地,处于自由落体状态,将跳跃动作分为三个阶段,分为起跳,腾空,缓冲,起跳阶段通过腿部快速伸展,为机体躯干纵向加速,当达到期望速度,腿部开始收缩,进入腾空相,腾空相受到重力加速度,纵向速度不断减小,在此过程中腿部完成了收缩,并伸展到可保持正常站高H0的长度,准备落地,缓冲阶段,将纵向速度调整为零,并保持期望站高;
轮腿机器人即将着地时,根据轮腿机器人实际各关节的角度,基于数据库进行匹配,然后采用神经网络PID控制器对关节角度误差在线优化补偿,由此轮腿机器人可以平稳完成状态转换;
三次样条函数:图中H0,H1以及腿部最大收缩量Hs为常量,由轮腿机器人本体结构确定,Hpt由激光雷达检测台阶或障碍物高度确定,p2点的高度也随之确定:H2=Hs+Hpt,由于p2点的v2=0,根据能量守恒定律,可得:
其中,v1,v3分别为p1,p3处的速度,足端离地时间即腾空时间为t12+t23,为同时保证每一段期望轨迹的平滑以及初始点与结束点的位置(yinit,yend)、速度(vinit,vend)要求,采用三次样条函数生成连续轨迹。起跳阶段的纵向位置期望轨迹、p1p2阶段、p2p3阶段足端期望轨迹均由下式生成:
y=at3+bt2+c
其中:
c=vinit
d=yinit
a=(vendt-2yend+vinitt+2yinit)/T3
b=(vend-3aT2)/(2T)
其中,T为该段三次样条插值的总时长。
作为本发明的一种优选技术方案,所述神经网络结构设计如下:
首先采用三层BP神经网络结构,网络输入层的输入为:关节角度误差,期望关节角度,实际关节角度:
网络隐含层的输入、输出为:
式中,为隐含层加权系数,上角标(1)(2)(3)分别代表输入层,隐含层和输出层;
隐含层神经元的激活函数取正负对称的Sigmoid函数
网络输出层的输入输出为:
输出层输出节点分别对应三个可调参数kp,ki,kd,由于三者均不能为负值,所以输出层神经元的激活函数取非负的Sigmoid函数:
取性能指标函数为
按照梯度下降法修正网络的权系数,即按E(k)对加权系数的负梯度方向搜索调整,并附加一个使搜索快速收敛全局极小的惯性项:
式中,η为学习效率,α为惯性系数
经典增量式数字PID的控制算法为:u(k)=u(k-1)+Δu(k)
Δu(k)=kp(error(k)-error(k-1)+kierror(k)+kd(error(k)
其中-2error(k-1)+error(k-2))
并分别对kp,ki,kd求偏导:
对于加权系数学习算法做出如下规定:
其中输出层加权系数的学习算法为:
隐含层加权系数的学习算法如下:
式中,g'(·)=g(x)(1-g(x)),f'(·)=(1-f2(x))/2。
作为本发明的一种优选技术方案,BP神经网络PID控制器具体设计流程如下:
(1)确定BP神经网络的结构,即确定输入层节点数M和隐含层节点数Q,并给出各层加权系数的初值和选定学习速率η和惯性系数α;k表示迭代次数,初始值为1;
(2)经采样和数据匹配得到关节角度和期望关节角度q(k),qd(k),计算角度误差error(k)=q(k)-qd(k);
(3)计算神经网络各层神经元的输入输出,输出层的输出即为PID控制器的三个可调参数kp,ki,kd,进行神经网络学习,在线调整加权系数和实现PID控制参数的自适应调整。
本发明的有益效果是:
建立稳定状态时轮腿机器人轮式、足式以及跳跃动作态的质心轨迹方程,并储存在主控制器的数据库中;分布于轮腿机器人各关节处的角度编码器将(转换前)关节角度信息发送给主控制器,主控制器在数据库中搜索匹配与轮腿机器人实际状态最为接近的一组关节角度信息;将实际关节角度值与满足平衡要求的关节角度值的差值,输入到神经网络PID控制器中,经神经网络PID算法学习训练后,得到PID控制参数,发送给主控制器,主控制器发送脉冲以补偿误差,系统会快速响应达到稳定状态,具有较高的实用价值。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的整体控制流程图示意图;
图2是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的轮腿机器人腿部结构图;
图3是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的结构示意图;
图4是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的主控制器流程图;
图5是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的BP神经网络PID控制器;
图6是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的轮腿机器人系统坐标示意图;
图7是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的激光点云坐标示意;
图8是本发明基于BP神经网络的轮腿机器人轮-足切换控制方法的轮腿机器人机体与足端矢状面轨迹示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1-8所示,本发明基于BP神经网络的轮腿机器人轮-足切换控制方法,包括以下几个步骤:
步骤1、使用激光雷达识别地貌,采集地形信息并发送给主控制器;
步骤2、主控制器检测到地形发生变化,下发切换指令;
步骤3、分布于各个关节的角度编码器采集实际关节角度信息,发送给主控制器,主控制器基于关节角度信息匹配一组与实际关节角度最为接近的一组关节角度信息;
步骤4、实际关节角度与稳定状态下的关节角度的差值输入到神经网络PID控制器中;
步骤5、得到调整参数,返回给主控制器以补偿误差。
其中,所述激光雷达采集地形地貌信息,根据地形复杂度,设计一个阈值,主控制器则会基于现有运动状态的环境条件,与采集的地形进行比较判断,若未超出阈值,轮腿机器人运动状态则会保持原有状态不发生改变;
若超出阈值,主控制器则会下发切换指令;
切换模式分为三种:一种是轮式运动状态切换到足式运动状态,具体是指:轮式运动状态适用于平坦光滑的地面,在此环境状态下,轮腿机器人采用轮式运动模式可以在保持稳定运动状态下大幅提高运动效率,当轮腿机器人在轮式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出轮式运动模式的阈值,主控制器停止向踝关节电机发送脉冲,轮子停止转动,运动状态转变为足式运动模式;
另一种是足式运动状态切换到轮式运动状态,具体是指:
足式运动状态适用于不规则地面同时可以避障,在此环境状态下,轮腿机器人采用足式运动模式稳定性更高,适应环境变化能力更强,当轮腿机器人在足式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出足式运动模式的阈值,主控制器继续向踝关节电机发送脉冲,轮子开始转动,运动状态转变为轮式运动模式;
跳跃动作:则若激光雷达检测识别的地形为楼梯形地貌或陡坡,轮腿机器人需要进行跳跃动作完成避障,在进行跳跃动作之前,主控制器需要判断轮腿机器人的当前运动模式是否为足式运动状态,若判断结果为否,需要完成上述足式转换,若判断结果为是,主控器根据当前足式运动状态下的关节角度信息,对轮腿机器人起跳阶段的关于关节角度的质心轨迹进行最优匹配,并由神经网络PID控制器完成误差补偿,着地相采取同样的方式进行误差补偿,由此轮腿机器人可以柔顺的完成整个起跳动作。
其中,对于激光雷达采集并识别地形信息,具体方法如下:
轮腿机器人系统由三个坐标系组成,分别为世界坐标系ΣW、机身坐标系ΣB和激光雷达坐标系ΣL,坐标系方向均采用ROS系统的REP-103规则,即X轴正方向在前,Y轴正方向在左,Z轴正方向在上;
世界坐标系是静止不动的,用来作为其他坐标系的参考,当激光雷达在软腿机器人上固定之后,激光雷达坐标系和机身坐标系是一个移动的系,激光雷达开始工作时,激光器会发射一个激光脉冲计时器,此时记录下射出时间,当激光脉冲返回时,计时器在记录下返回时间,利用两个时间的时间差即可计算出点到雷达中心的距离;
激光雷达在扫描时通过激光束的发射,可以测量出各个点到激光雷达中心的距离以及此时激光雷达自身的水平旋转角α和垂直角β,通过下式能够得到各点云的坐标为:
式中x,y,z分别为点在激光雷达坐标系下的坐标,R为采集的点云到激光雷达中心的距离,根据同一时刻发送的激光束返回的点云信息,经主控制器进行处理后,可以构建出环境的三维点云地图。
其中,所述轮腿机器人的髋关节、膝关节、踝关节分别安装有角度编码器,其角度值分别命名为θ1,θ2,θ3,另外设置一个角度θ表示轮腿机器人整体质心与双轮公共轴线重点的连线与竖直方向的倾角,轮腿机器人稳定的约束条件要求轮上部分的联合质心竖直投影需落在双轮公共轴线上,用表达式表示为θ≤0.5°。
其中,通过角度编码器获取了各关节角度之后,考虑到轮腿机器人行进过程中进行运动状态的变换,受到惯性的影响,轮腿机器人发生倾倒,需要进行预控制,主控制器首先需要根据轮腿机器人当前各关节角度值,在数据库中搜索与实际关节角度值最为接近的一组关节角度信息,具体表示如下:
假设θ1,θ2,θ3分别表示髋关节,膝关节,踝关节角度值,θ'1,θ'2,θ'3为数据库中轮腿机器人满足稳定条件的一组关节角度值:
(θ1-θ1')2+(θ2-θ2')2+(θ3-θ3')2≤e
为了快速找到一组与实际运动状态相近且满足平衡约束要求的关节角度变量,主控制器可根据上式进行搜索,当e足够小时,便可选定对应的数据库关节角度信息。
其中,基于各关节角度的质心评估函数具体如下:
首先基于轮腿机器人构建坐标系Rw,以轮子中心为圆心,两轮公共轴心为y轴,机身前进方向为x轴,竖直方向为z轴;在坐标系Rw中,机体质心坐标(xCoM,zCoM)可以表示各个连杆质心的坐标和:
在式中为了化表达:si=sinθi,ci=cosθi,cij=cos(θi+θi),sij=sin(θi+θj),由此得到机体质心与轮子圆心距离为l,连线与竖直方向的倾角为θ,其满足关系式:
由此我们得到了关于各关节角度的质心表达式,并得到了机体质心与轮子中心连线与竖直方向的倾角。
其中,所述跳跃预处理:构造轨迹生成器,使机器人可根据障碍物的高度规划此次跳跃的机体关于各关节角度的质心参照轨迹与足端参照轨迹,首先根据障碍物高度确定关键点处的位置与速度,然后采用三次样条插值法得到机体质心点与轮最小离地点的连续位置与速度,简称轮最小离地点为足端,基于构造的质心参照轨迹,主控制器搜索匹配到与轮腿机器人实际关节角度最为接近的关节角度值,以此点作为起跳点,进行跳跃动作;
跳跃过程:支撑相时,机器人双轮着地,腾空相时,机器人双轮离地,处于自由落体状态,将跳跃动作分为三个阶段,分为起跳,腾空,缓冲,起跳阶段通过腿部快速伸展,为机体躯干纵向加速,当达到期望速度,腿部开始收缩,进入腾空相,腾空相受到重力加速度,纵向速度不断减小,在此过程中腿部完成了收缩,并伸展到可保持正常站高H0的长度,准备落地,缓冲阶段,将纵向速度调整为零,并保持期望站高;
轮腿机器人即将着地时,根据轮腿机器人实际各关节的角度,基于数据库进行匹配,然后采用神经网络PID控制器对关节角度误差在线优化补偿,由此轮腿机器人可以平稳完成状态转换。
三次样条函数:图中H0,H1以及腿部最大收缩量Hs为常量,由轮腿机器人本体结构确定,Hpt由激光雷达检测台阶或障碍物高度确定,p2点的高度也随之确定:H2=Hs+Hpt,由于p2点的v2=0,根据能量守恒定律,可得:
其中,v1,v3分别为p1,p3处的速度,足端离地时间即腾空时间为t12+t23,为同时保证每一段期望轨迹的平滑以及初始点与结束点的位置(yinit,yend)、速度(vinit,vend)要求,采用三次样条函数生成连续轨迹。起跳阶段的纵向位置期望轨迹、p1p2阶段、p2p3阶段足端期望轨迹均由下式生成:
y=at3+bt2+c
其中:
c=vinit
d=yinit
a=(vendt-2yend+vinitt+2yinit)/T3
b=(vend-3aT2)/(2T)
其中,T为该段三次样条插值的总时长。
其中,所述神经网络结构设计如下:
首先采用三层BP神经网络结构,网络输入层的输入为:关节角度误差,期望关节角度,实际关节角度:
网络隐含层的输入、输出为:
式中,为隐含层加权系数,上角标(1)(2)(3)分别代表输入层,隐含层和输出层;
隐含层神经元的激活函数取正负对称的Sigmoid函数
网络输出层的输入输出为:
输出层输出节点分别对应三个可调参数kp,ki,kd,由于三者均不能为负值,所以输出层神经元的激活函数取非负的Sigmoid函数:
取性能指标函数为
按照梯度下降法修正网络的权系数,即按对E(k)加权系数的负梯度方向搜索调整,并附加一个使搜索快速收敛全局极小的惯性项:
式中,η为学习效率,α为惯性系数
经典增量式数字PID的控制算法为:u(k)=u(k-1)+Δu(k)
Δu(k)=kp(error(k)-error(k-1)+kierror(k)+kd(error(k)
其中-2error(k-1)+error(k-2))
并分别对kp,ki,kd求偏导:
对于加权系数学习算法做出如下规定:
其中输出层加权系数的学习算法为:
隐含层加权系数的学习算法如下:
式中,g'(·)=g(x)(1-g(x)),f'(·)=(1-f2(x))/2。
其中,BP神经网络PID控制器具体设计流程如下:
(1)确定BP神经网络的结构,即确定输入层节点数M和隐含层节点数Q,并给出各层加权系数的初值和选定学习速率η和惯性系数α;k表示迭代次数,初始值为1;
(2)经采样和数据匹配得到关节角度和期望关节角度q(k),qd(k),计算角度误差error(k)=q(k)-qd(k);
(3)计算神经网络各层神经元的输入输出,输出层的输出即为PID控制器的三个可调参数kp,ki,kd,进行神经网络学习,在线调整加权系数和实现PID控制参数的自适应调整。
工作原理:使用时,使用激光雷达识别地形地貌,主控制器根据地形情况下发切换指令。建立稳定状态时轮腿机器人轮式、足式以及跳跃动作态的质心轨迹方程,并储存在主控制器的数据库中;分布于轮腿机器人各关节处的角度编码器将(转换前)关节角度信息发送给主控制器,主控制器在数据库中搜索匹配与轮腿机器人实际状态最为接近的一组关节角度信息;将实际关节角度值与满足平衡要求的关节角度值的差值,输入到神经网络PID控制器中,经神经网络PID算法学习训练后,得到PID控制参数,发送给主控制器,主控制器发送脉冲以补偿误差,系统会快速响应达到稳定状态。
最后应说明的是:在本发明的描述中,需要说明的是,术语“竖直”、“上”、“下”、“水平”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.基于BP神经网络的轮腿机器人轮-足切换控制方法,包括以下几个步骤:
步骤1、使用激光雷达识别地貌,采集地形信息并发送给主控制器;
步骤2、主控制器检测到地形发生变化,下发切换指令;
步骤3、分布于各个关节的角度编码器采集实际关节角度信息,发送给主控制器,主控制器基于关节角度信息匹配一组与实际关节角度最为接近的一组关节角度信息;
步骤4、实际关节角度与稳定状态下的关节角度的差值输入到神经网络PID控制器中;
步骤5、得到调整参数,返回给主控制器以补偿误差。
2.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,所述激光雷达采集地形地貌信息,根据地形复杂度,设计一个阈值,主控制器则会基于现有运动状态的环境条件,与采集的地形进行比较判断,若未超出阈值,轮腿机器人运动状态则会保持原有状态不发生改变;
若超出阈值,主控制器则会下发切换指令;
切换模式分为三种:一种是轮式运动状态切换到足式运动状态,具体是指:轮式运动状态适用于平坦光滑的地面,在此环境状态下,轮腿机器人采用轮式运动模式可以在保持稳定运动状态下大幅提高运动效率,当轮腿机器人在轮式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出轮式运动模式的阈值,主控制器停止向踝关节电机发送脉冲,轮子停止转动,运动状态转变为足式运动模式;
另一种是足式运动状态切换到轮式运动状态,具体是指:足式运动状态适用于不规则地面同时可以避障,在此环境状态下,轮腿机器人采用足式运动模式稳定性更高,适应环境变化能力更强,当轮腿机器人在足式运动状态下行进,若激光雷达采集的信息经处理后,判断出环境参数超出足式运动模式的阈值,主控制器继续向踝关节电机发送脉冲,轮子开始转动,运动状态转变为轮式运动模式;
跳跃动作:则若激光雷达检测识别的地形为楼梯形地貌或陡坡,轮腿机器人需要进行跳跃动作完成避障,在进行跳跃动作之前,主控制器需要判断轮腿机器人的当前运动模式是否为足式运动状态,若判断结果为否,需要完成上述足式转换,若判断结果为是,主控器根据当前足式运动状态下的关节角度信息,对轮腿机器人起跳阶段的关于关节角度的质心轨迹进行最优匹配,并由神经网络PID控制器完成误差补偿,着地相采取同样的方式进行误差补偿,由此轮腿机器人可以柔顺的完成整个起跳动作。
3.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,对于激光雷达采集并识别地形信息,具体方法如下:
轮腿机器人系统由三个坐标系组成,分别为世界坐标系ΣW、机身坐标系ΣB和激光雷达坐标系∑L,坐标系方向均采用ROS系统的REP-103规则,即X轴正方向在前,Y轴正方向在左,Z轴正方向在上;
世界坐标系是静止不动的,用来作为其他坐标系的参考,当激光雷达在软腿机器人上固定之后,激光雷达坐标系和机身坐标系是一个移动的系,激光雷达开始工作时,激光器会发射一个激光脉冲计时器,此时记录下射出时间,当激光脉冲返回时,计时器在记录下返回时间,利用两个时间的时间差即可计算出点到雷达中心的距离;
激光雷达在扫描时通过激光束的发射,可以测量出各个点到激光雷达中心的距离以及此时激光雷达自身的水平旋转角α和垂直角β,通过下式能够得到各点云的坐标为:
式中x,y,z分别为点在激光雷达坐标系下的坐标,R为采集的点云到激光雷达中心的距离,根据同一时刻发送的激光束返回的点云信息,经主控制器进行处理后,可以构建出环境的三维点云地图。
4.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,所述轮腿机器人的髋关节、膝关节、踝关节分别安装有角度编码器,其角度值分别命名为θ1,θ2,θ3,另外设置一个角度θ表示轮腿机器人整体质心与双轮公共轴线重点的连线与竖直方向的倾角,轮腿机器人稳定的约束条件要求轮上部分的联合质心竖直投影需落在双轮公共轴线上,用表达式表示为θ≤0.5。。
5.根据权利要求3所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,通过角度编码器获取了各关节角度之后,考虑到轮腿机器人行进过程中进行运动状态的变换,受到惯性的影响,轮腿机器人发生倾倒,需要进行预控制,主控制器首先需要根据轮腿机器人当前各关节角度值,在数据库中搜索与实际关节角度值最为接近的一组关节角度信息,具体表示如下:
假设θ1,θ2,θ3分别表示髋关节,膝关节,踝关节角度值,θ1',θ2',θ3'为数据库中轮腿机器人满足稳定条件的一组关节角度值:
(θ1-θ1')2+(θ2-θ2')2+(θ3-θ3')2≤e
为了快速找到一组与实际运动状态相近且满足平衡约束要求的关节角度变量,主控制器可根据上式进行搜索,当e足够小时,便可选定对应的数据库关节角度信息。
6.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,基于各关节角度的质心评估函数具体如下:
首先基于轮腿机器人构建坐标系Rw,以轮子中心为圆心,两轮公共轴心为y轴,机身前进方向为x轴,竖直方向为z轴;在坐标系Rw中,机体质心坐标(xCoM,zCoM)可以表示各个连杆质心的坐标和:
在式中为了化表达:si=sinθi,ci=cosθi,cij=cos(θi+θi),sij=sin(θi+θj),由此得到机体质心与轮子圆心距离为l,连线与竖直方向的倾角为θ,其满足关系式:
由此我们得到了关于各关节角度的质心表达式,并得到了机体质心与轮子中心连线与竖直方向的倾角。
7.根据权利要求2所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,所述跳跃预处理:构造轨迹生成器,使机器人可根据障碍物的高度规划此次跳跃的机体关于各关节角度的质心参照轨迹与足端参照轨迹,首先根据障碍物高度确定关键点处的位置与速度,然后采用三次样条插值法得到机体质心点与轮最小离地点的连续位置与速度,简称轮最小离地点为足端,基于构造的质心参照轨迹,主控制器搜索匹配到与轮腿机器人实际关节角度最为接近的关节角度值,以此点作为起跳点,进行跳跃动作;
跳跃过程:支撑相时,机器人双轮着地,腾空相时,机器人双轮离地,处于自由落体状态,将跳跃动作分为三个阶段,分为起跳,腾空,缓冲,起跳阶段通过腿部快速伸展,为机体躯干纵向加速,当达到期望速度,腿部开始收缩,进入腾空相,腾空相受到重力加速度,纵向速度不断减小,在此过程中腿部完成了收缩,并伸展到可保持正常站高H0的长度,准备落地,缓冲阶段,将纵向速度调整为零,并保持期望站高;
轮腿机器人即将着地时,根据轮腿机器人实际各关节的角度,基于数据库进行匹配,然后采用神经网络PID控制器对关节角度误差在线优化补偿,由此轮腿机器人可以平稳完成状态转换;
三次样条函数:图中H0,H1以及腿部最大收缩量Hs为常量,由轮腿机器人本体结构确定,Hpt由激光雷达检测台阶或障碍物高度确定,p2点的高度也随之确定:H2=Hs+Hpt,由于p2点的v2=0,根据能量守恒定律,可得:
其中,v1,v3分别为p1,p3处的速度,足端离地时间即腾空时间为t12+t23,为同时保证每一段期望轨迹的平滑以及初始点与结束点的位置(yinit,yend)、速度(vinit,vend)要求,采用三次样条函数生成连续轨迹,起跳阶段的纵向位置期望轨迹、p1p2阶段、p2p3阶段足端期望轨迹均由下式生成:
y=at3+bt2+c
其中:
c=vinit
d=yinit
a=(vendt-2yend+vinitt+2yinit)/T3
b=(vend-3aT2)/(2T)
其中,T为该段三次样条插值的总时长。
8.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,所述神经网络结构设计如下:
首先采用三层BP神经网络结构,网络输入层的输入为:关节角度误差,期望关节角度,实际关节角度:
网络隐含层的输入、输出为:
式中,为隐含层加权系数,上角标(1)(2)(3)分别代表输入层,隐含层和输出层;
隐含层神经元的激活函数取正负对称的Sigmoid函数
网络输出层的输入输出为:
输出层输出节点分别对应三个可调参数kp,ki,kd,由于三者均不能为负值,所以输出层神经元的激活函数取非负的Sigmoid函数:
取性能指标函数为
按照梯度下降法修正网络的权系数,即按对E(k)加权系数的负梯度方向搜索调整,并附加一个使搜索快速收敛全局极小的惯性项:
式中,η为学习效率,α为惯性系数
经典增量式数字PID的控制算法为:u(k)=u(k-1)+Δu(k)
Δu(k)=kp(error(k)-error(k-1)+kierror(k)+kd(error(k)
其中-2error(k-1)+error(k-2))
并分别对kp,ki,kd求偏导:
对于加权系数学习算法做出如下规定:
其中输出层加权系数的学习算法为:
隐含层加权系数的学习算法如下:
式中,g'(·)=g(x)(1-g(x)),f'(·)=(1-f2(x))/2。
9.根据权利要求1所述的基于BP神经网络的轮腿机器人轮-足切换控制方法,其特征在于,BP神经网络PID控制器具体设计流程如下:
(1)确定BP神经网络的结构,即确定输入层节点数M和隐含层节点数Q,并给出各层加权系数的初值和选定学习速率η和惯性系数α;k表示迭代次数,初始值为1;
(2)经采样和数据匹配得到关节角度和期望关节角度q(k),qd(k),计算角度误差error(k)=q(k)-qd(k);
(3)计算神经网络各层神经元的输入输出,输出层的输出即为PID控制器的三个可调参数kp,ki,kd,进行神经网络学习,在线调整加权系数和实现PID控制参数的自适应调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310972415.4A CN116859975A (zh) | 2023-08-03 | 2023-08-03 | 基于bp神经网络的轮腿机器人轮-足切换控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310972415.4A CN116859975A (zh) | 2023-08-03 | 2023-08-03 | 基于bp神经网络的轮腿机器人轮-足切换控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116859975A true CN116859975A (zh) | 2023-10-10 |
Family
ID=88223526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310972415.4A Pending CN116859975A (zh) | 2023-08-03 | 2023-08-03 | 基于bp神经网络的轮腿机器人轮-足切换控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116859975A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118067133A (zh) * | 2024-04-18 | 2024-05-24 | 北京理工大学 | 一种应用于单轮腿机器人的跳跃轨迹生成方法及设备 |
CN118219256A (zh) * | 2024-03-08 | 2024-06-21 | 北京小米机器人技术有限公司 | 运动轨迹生成方法、运动控制方法及相关装置 |
-
2023
- 2023-08-03 CN CN202310972415.4A patent/CN116859975A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118219256A (zh) * | 2024-03-08 | 2024-06-21 | 北京小米机器人技术有限公司 | 运动轨迹生成方法、运动控制方法及相关装置 |
CN118067133A (zh) * | 2024-04-18 | 2024-05-24 | 北京理工大学 | 一种应用于单轮腿机器人的跳跃轨迹生成方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112666939B (zh) | 一种基于深度强化学习的机器人路径规划算法 | |
CN116859975A (zh) | 基于bp神经网络的轮腿机器人轮-足切换控制方法 | |
CN112720462B (zh) | 一种机器人的轨迹规划系统和方法 | |
CN108333931B (zh) | 一种面向崎岖地形的四足机器人双层结构步态规划方法 | |
CN114022824A (zh) | 一种面向狭窄环境的四足机器人运动规划方法 | |
CN111290389B (zh) | 一种双足机器人落脚位置控制系统与方法 | |
Qiao et al. | A wheel-legged robot with active waist joint: design, analysis, and experimental results | |
Tan et al. | A hierarchical framework for quadruped locomotion based on reinforcement learning | |
Peng et al. | Leader-follower formation control of multiple nonholonomic robots based on backstepping | |
Fan et al. | A Review of Quadruped Robots: Structure, Control, and Autonomous Motion | |
Han et al. | A heuristic gait template planning and dynamic motion control for biped robots | |
Gupta et al. | Trajectory generation and step planning of a 12 DoF biped robot on uneven surface | |
Yang et al. | Proprioception and tail control enable extreme terrain traversal by quadruped robots | |
Li et al. | DDPG-Based Path Planning Approach for Autonomous Driving | |
Wang et al. | Locomotion planning for quadruped robot over rough terrain | |
Chen et al. | Reinforcement Learning for Reduced-order Models of Legged Robots | |
CN117474049A (zh) | 一种基于sac算法的六足机器人运动策略的训练方法 | |
Palmer et al. | Intelligent control of high-speed turning in a quadruped | |
Wang et al. | Obstacle detection and obstacle-surmounting planning for a wheel-legged robot based on Lidar | |
Lu et al. | A novel multi-configuration quadruped robot with redundant DOFs and its application scenario analysis | |
CN113829351A (zh) | 一种基于强化学习的移动机械臂的协同控制方法 | |
Bjelonic | Planning and Control for Hybrid Locomotion of Wheeled-Legged Robots | |
Huang et al. | Virtual Model Control for Dynamic Banlance of a Two Wheeled-legged Robot | |
Chu et al. | Locomotion Planning for Quadruped Robot Walking on Lunar Rough Terrain | |
Kouchaki et al. | Balance control of a humanoid robot using deepreinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |