CN104318071A - 一种基于线性落脚点补偿器的机器人行走控制方法 - Google Patents

一种基于线性落脚点补偿器的机器人行走控制方法 Download PDF

Info

Publication number
CN104318071A
CN104318071A CN201410520386.9A CN201410520386A CN104318071A CN 104318071 A CN104318071 A CN 104318071A CN 201410520386 A CN201410520386 A CN 201410520386A CN 104318071 A CN104318071 A CN 104318071A
Authority
CN
China
Prior art keywords
mrow
msub
compensator
linear
math
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410520386.9A
Other languages
English (en)
Inventor
陈启军
刘成菊
许涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201410520386.9A priority Critical patent/CN104318071A/zh
Publication of CN104318071A publication Critical patent/CN104318071A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Manipulator (AREA)

Abstract

本发明涉及一种基于线性落脚点补偿器的机器人行走控制方法,包括以下步骤:1)建立机器人的动力学模型;2)根据机器人的动力学模型,建立线性落脚点补偿器;3)通过尝试-评估-改进的学习方法,学习特定环境下的落脚点补偿器最优增益系数;4)验证所述方法在仿人机器人行走控制中的作用。与现有技术相比,本发明具有学习能力强,抗干扰能力强等优点。

Description

一种基于线性落脚点补偿器的机器人行走控制方法
技术领域
本发明涉及机器人控制领域,尤其是涉及一种基于线性落脚点补偿器的机器人行走控制方法。
背景技术
许多仿人机器人行走控制的研究人员将重点放在规划机器人的质心轨迹,使得机器人行走时的实际ZMP轨迹能精确地跟踪事先规划的ZMP轨迹。而该事先规划的ZMP轨迹一般是由预先规划的机器人的落脚位置(即落脚点)来决定的。这一类控制方法总体来说属于开环控制方法,对机器人预设轨迹的跟踪建立在对机器人可以完全控制的假设之上,即机器人的质心状态是完全可控的。事实上,由于仿人机器人与地面的接触是非稳固的,地面只能对仿人机器人提供推力而不能提供反向的吸引力。因此,仿人机器人的质心控制是半可控的。一旦机器人的落脚点决定了,机器人能够获得用来加速质心的力也就同时被限定在一定的区域以内。
另一方面,由于仿人机器人的落脚点决定了行走控制中质心的可控性,因此动态的调整仿人机器人的落脚点便可以调整机器人的动态特性及可控性,进而可以改善机器人对未知扰动的抑制能力。事实上,落脚点对双足行走的重要性在生物机械学领域已有较深入的研究。最近,在机器人领域也有一些利用落脚点补偿技巧提高仿人机器人行走控制鲁棒性的初步探索。目前的方法大多数是建立在简化的线性机器人动力学模型上,落脚点修改技巧无法动态调整且基于线性模型预测控制方法的计算量较大。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种学习能力强、可靠性高的基于线性落脚点补偿器的机器人行走控制方法。
本发明的目的可以通过以下技术方案来实现:
一种基于线性落脚点补偿器的机器人行走控制方法,包括以下步骤:
1)建立机器人的动力学模型;
2)根据机器人的动力学模型,建立线性落脚点补偿器;
3)通过尝试-评估-改进的学习方法,学习特定环境下的落脚点补偿器最优增益系数;
4)验证所述方法在仿人机器人行走控制中的作用。
所述的步骤1)包括以下步骤:
11)建立机器人三维线性倒立摆动力学模型,该动力学模型的表达式为:
x · c = Ax c + Bu x
xz=Cxc
其中, A = 0 1 0 0 0 1 0 0 0 , B = 0 0 1 , C = 1 0 - z c - z z g , x c = [ x c , x · c , x · · c ] T 为机器人质心在世界坐标系下沿x轴的位置、速度和加速度,ux为质心加速度的变化量并用来控制质心加速度,pc=[xc,yc,yc]T为质心在世界坐标系下的三维位置,而pz=[xz,yz,yz]T为ZMP在世界坐标系下的位置,g为重力加速度;
所述的步骤2)包括以下步骤:
21)定义落脚点补偿器的输出Δpf
Δp f ≡ ( Δp x f , Δp y f ) ;
22)定义线性落脚点补偿器为:
Δp x f = G Kx x ^ + G lx Σ i = 1 M ( p ^ x , i - p x , i ref )
Δp y f = G Ky y ^ + G ly Σ i = 1 M ( p ^ y , i - p y , i ref )
其中,为估计的支撑脚坐标系下质心位置、速度和加速度,为前i帧中估计的和参考的支撑脚坐标系下ZMP轨迹,GKx、GKy、Glx和Gly为增益系数;
23)选择最优的线性落脚点补偿器增益系数,使增益系数满足最小化的条件:
J f ≡ 1 n Σ j = 1 n ( α x Δp x , j + α y Δp y , j ) + 1 m Σ i = 1 m ( β x | Δp x , i f | + β y | Δp y , i f | ) + ξ
ξ ≡ γ ( π 2 - 1 2 a tan ( 2 n PG - 3 ) )
其中, 1 n Σ j = 1 n ( α x Δp x , j + α y Δp y , j ) 为ZMP的跟踪误差, 1 m Σ i = 1 m ( β x | Δp x , i f | + β y | Δp y , i f | ) 是为了保证输出不过大,ξ为一非线性函数,n为ZMP累计误差的帧数,αx和αy表示x轴和y轴分别所占的比例,m是统计过程落脚点修改的次数,βx和βy控制x和y轴的比例,PG为每步需要的时间帧数,γ为常系数。
所述的步骤3)包括以下步骤:
31)赋予机器人线性落脚补偿器初始增益系数φ0,并将待测参数R≡{r1,…rM}根据初始增益系数和原子策略集合ψi产生行走参数rj
rj={θ11,…,θNN}
φ≡[GKx,Glx,GKy,Gly]≡{θ1,…,θN}
ψi≡{-εi,0,+εi}
其中,Δ1…ΔN为ψi中随机抽取的值,-εi,εi为趋近于零的实数;
32)机器人按产生的多组行走参数行走,并搜集计算线性落脚点补偿器性能指标所需的数据;
33)在完成多组行走参数行走测试后,计算线性落脚点补偿器的当前梯度并且更新线性落脚点补偿器的增益系数;
34)机器人重复步骤31)-步骤33),通过迭代过程获取最优的线性落脚点补偿器参数。
所述的步骤33)包括以下步骤:
331)计算平均分值矩阵该矩阵表示在参数第n维选取策略-ε、0或+ε的所有rj的平均分值;
332)当时,计算平均分值Fn为0;否则平均分值为 F n = S ‾ n , + ϵ - S ‾ n , - ϵ ;
333)计算落脚点补偿器当前梯度为
334)更新落脚点补偿器的增益系数φ:
φ = φ + ▿ φ × η
其中,η为每次迭代的步长。
与现有技术相比,本发明具有以下优点:
一、学习能力强,通过引入基于策略梯度下降法的在线补偿器学习方法,实现了仿人机器人落脚点平衡技巧的自我学习。
二、抗干扰能力强,采用了学习后的线性落脚点补偿器,能够帮助仿人机器人抵御未知外部扰动。
附图说明
图1为本发明的方法流程图。
图2为仿人机器人无落脚点补偿器行走控制框图。
图3为带有线性落脚点补偿器的机器人行走控制框图。
图4为无落脚补偿器作用下机器人在冲击扰动下的行走数据。
图5为线性落脚补偿器作用下机器人在冲击扰动下的行走数据。
图6为X-Y平面下落脚点补偿器在弧线行走时的效果图。
图7为Y轴下落脚点补偿器在弧线行走时的效果图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例:
一种基于线性落脚点补偿器的机器人行走控制方法,包括以下步骤:
1)建立机器人的动力学模型;
2)根据机器人的动力学模型,建立线性落脚点补偿器;
3)通过尝试-评估-改进的学习方法,学习特定环境下的落脚点补偿器最优增益系数;
4)验证所述方法在仿人机器人行走控制中的作用。
如图3所示,该基于线性落脚点补偿器的机器人行走控制方法首先采用LMPC从规划的ZMP轨迹生成规划机器人质心轨迹控制机器人行走。根据测量的机器人质心状态和测量ZMP,采用FPC模块生成落脚点补偿量,修正ZMP生成器,最终影响机器人的动态响应G,实现机器人对行走扰动的抑制。
步骤1)包括以下步骤:
11)建立机器人三维线性倒立摆动力学模型,该动力学模型的表达式为:
x · c = Ax c + Bu x
xz=Cxc
其中, A = 0 1 0 0 0 1 0 0 0 , B = 0 0 1 , C = 1 0 - z c - z z g , x c = [ x c , x · c , x · · c ] T 为机器人质心在世界坐标系下沿x轴的位置、速度和加速度,ux为质心加速度的变化量并用来控制质心加速度,pc=[xc,yc,yc]T为质心在世界坐标系下的三维位置,而pz=[xz,yz,yz]T为ZMP在世界坐标系下的位置,g为重力加速度;
步骤2)包括以下步骤:
21)定义落脚点补偿器的输出Δpf
Δp f ≡ ( Δp x f , Δp y f ) ;
22)定义线性落脚点补偿器为:
Δp x f = G Kx x ^ + G lx Σ i = 1 M ( p ^ x , i - p x , i ref )
Δp y f = G Ky y ^ + G ly Σ i = 1 M ( p ^ y , i - p y , i ref )
其中,为估计的支撑脚坐标系下质心位置、速度和加速度,为前i帧中估计的和参考的支撑脚坐标系下ZMP轨迹,GKx、GKy、Glx和Gly为增益系数;
23)选择最优的线性落脚点补偿器增益系数,使增益系数满足最小化的条件:
J f ≡ 1 n Σ j = 1 n ( α x Δp x , j + α y Δp y , j ) + 1 m Σ i = 1 m ( β x | Δp x , i f | + β y | Δp y , i f | ) + ξ
ξ ≡ γ ( π 2 - 1 2 a tan ( 2 n PG - 3 ) )
其中, 1 n Σ j = 1 n ( α x Δp x , j + α y Δp y , j ) 为ZMP的跟踪误差, 1 m Σ i = 1 m ( β x | Δp x , i f | + β y | Δp y , i f | ) 是为了保证输出不过大,ξ为一非线性函数,n为ZMP累计误差的帧数,αx和αy表示x轴和y轴分别所占的比例,m是统计过程落脚点修改的次数,βx和βy控制x和y轴的比例,PG为每步需要的时间帧数,γ为常系数。
步骤3)包括以下步骤:
31)赋予机器人线性落脚补偿器初始增益系数φ0,并将待测参数R≡{r1,…rM}根据初始增益系数和原子策略集合ψi产生行走参数rj
rj={θ11,…,θNN}
φ≡[GKx,Glx,GKy,Gly]≡{θ1,…,θN}
ψi≡{-εi,0,+εi}
其中,Δ1…ΔN为ψi中随机抽取的值,-εi,εi为趋近于零的实数;
32)机器人按产生的多组行走参数行走,并搜集计算线性落脚点补偿器性能指标所需的数据;
33)在完成多组行走参数行走测试后,计算线性落脚点补偿器的当前梯度并且更新线性落脚点补偿器的增益系数;
34)机器人重复步骤31)-步骤33),通过迭代过程获取最优的线性落脚点补偿器参数。
步骤33)包括以下步骤:
331)计算平均分值矩阵该矩阵表示在参数第n维选取策略-ε、0或+ε的所有rj的平均分值;
332)当时,计算平均分值Fn为0;否则平均分值为 F n = S ‾ n , + ϵ - S ‾ n , - ϵ ;
333)计算落脚点补偿器当前梯度为
334)更新落脚点补偿器的增益系数φ:
φ = φ + ▿ φ × η
其中,η为每次迭代的步长。
如图4所示,在没有落脚点补偿的时候,机器人在扰动下行走ZMP逐渐发散并最终摔倒。如图5、6、7所示,在有落脚点补偿器的时候,机器人可以抑制扰动,实现稳定的行走。

Claims (5)

1.一种基于线性落脚点补偿器的机器人行走控制方法,其特征在于,包括以下步骤:
1)建立机器人的动力学模型;
2)根据机器人的动力学模型,建立线性落脚点补偿器;
3)通过尝试、评估和改进的学习方法,学习特定环境下的线性落脚点补偿器最优增益系数;
4)根据基于线性落脚点补偿器对仿人机器人行走进行预测控制。
2.根据权利要求1所述的一种基于线性落脚点补偿器的机器人行走控制方法,其特征在于,所述的步骤1)包括以下步骤:
11)建立机器人三维线性倒立摆动力学模型,该动力学模型的表达式为:
x · c = Ax c + Bu x
xz=Cxc
其中, A = 0 1 0 0 0 1 0 0 0 , B = 0 0 1 , C = 1 0 - z c - z z g , x c = [ x c , x · c , x · · c ] T 为机器人质心在世界坐标系下沿x轴的位置、速度和加速度,ux为质心加速度的变化量并用来控制质心加速度,pc=[xc,yc,yc]T为质心在世界坐标系下的三维位置,而pz=[xz,yz,yz]T为ZMP在世界坐标系下的位置,g为重力加速度;
3.根据权利要求1所述的一种基于线性落脚点补偿器的机器人行走控制方法,其特征在于,所述的步骤2)包括以下步骤:
21)定义线性落脚点补偿器的输出Δpf
Δ p f ≡ ( Δ p x f , Δ p y f ) ;
22)定义线性落脚点补偿器为:
Δ p x f = G Kx x ^ + G lx Σ i = 1 M ( p ^ x , i - p x , i ref )
Δ p y f = G Ky y ^ + G ly Σ i = 1 M ( p ^ y , i - p y , i ref )
其中,为估计的支撑脚坐标系下质心位置、速度和加速度,为前i帧中估计的和参考的支撑脚坐标系下ZMP轨迹,GKx、GKy、Glx和Gly为增益系数;
23)选择最优的线性落脚点补偿器增益系数,使增益系数满足最小化的条件:
J f ≡ 1 n Σ j = 1 n ( α x Δ p x , j + α y Δ p y , j ) + 1 m Σ i = 1 m ( β x | Δ p x , i f | + β y | Δ p y , i f | ) + ξ
ξ ≡ γ ( π 2 - 1 2 a tan ( 2 n PG - 3 ) )
其中,为ZMP的跟踪误差,是为了保证输出不过大,ξ为一非线性函数,n为ZMP累计误差的帧数,αx和αy表示x轴和y轴分别所占的比例,m是统计过程落脚点修改的次数,βx和βy控制x和y轴的比例,PG为每步需要的时间帧数,γ为常系数。
4.根据权利要求1所述的一种基于线性落脚点补偿器的机器人行走控制方法,其特征在于,所述的步骤3)包括以下步骤:
31)赋予机器人线性落脚补偿器初始增益系数φ0,并将待测参数R≡{r1,…rM}根据初始增益系数和原子策略集合ψi产生行走参数rj
rj={θ11,…,θNN}
φ≡[GKx,Glx,GKy,Gly]≡{θ1,…,θN}
ψi≡{-εi,0,+εi}
其中,Δ1…ΔN为ψi中随机抽取的值,-εi,εi为趋近于零的实数;
32)机器人按产生的多组行走参数行走,并搜集计算线性落脚点补偿器性能指标所需的数据;
33)在完成多组行走参数行走测试后,计算线性落脚点补偿器的当前梯度并且更新线性落脚点补偿器的增益系数;
34)机器人重复步骤31)-步骤33),通过迭代过程获取最优的线性落脚点补偿器参数。
5.根据权利要求4所述的一种基于线性落脚点补偿器的机器人行走控制方法,其特征在于,所述的步骤33)包括以下步骤:
331)计算平均分值矩阵该矩阵表示在参数第n维选取策略-ε、0或+ε的所有rj的平均分值;
332)当时,计算平均分值Fn为0;否则平均分值为 F n = S ‾ n , + ϵ - S ‾ n , - ϵ ;
333)计算落脚点补偿器当前梯度为
334)更新落脚点补偿器的增益系数φ:
φ = φ + ▿ φ × η
其中,η为每次迭代的步长。
CN201410520386.9A 2014-09-30 2014-09-30 一种基于线性落脚点补偿器的机器人行走控制方法 Pending CN104318071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410520386.9A CN104318071A (zh) 2014-09-30 2014-09-30 一种基于线性落脚点补偿器的机器人行走控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410520386.9A CN104318071A (zh) 2014-09-30 2014-09-30 一种基于线性落脚点补偿器的机器人行走控制方法

Publications (1)

Publication Number Publication Date
CN104318071A true CN104318071A (zh) 2015-01-28

Family

ID=52373302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410520386.9A Pending CN104318071A (zh) 2014-09-30 2014-09-30 一种基于线性落脚点补偿器的机器人行走控制方法

Country Status (1)

Country Link
CN (1) CN104318071A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105698795A (zh) * 2015-12-04 2016-06-22 天津大学 一种室内定位步长计算方法
CN106292288A (zh) * 2016-09-22 2017-01-04 同济大学 基于策略梯度学习法的模型参数修正方法及其应用
CN106597844A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 一种机器人防摔倒控制方法及系统
CN108345211A (zh) * 2017-01-23 2018-07-31 深圳市祈飞科技有限公司 双足仿人机器人及其非线性步态规划方法以及控制方法
CN110447562A (zh) * 2019-09-02 2019-11-15 中国农业科学院农业信息研究所 跛牛识别及自动分群方法及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013132731A (ja) * 2011-12-27 2013-07-08 Seiko Epson Corp ロボット制御システム、ロボットシステム及びロボット制御方法
CN103631142A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种用于轮式机器人轨迹跟踪的迭代学习算法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013132731A (ja) * 2011-12-27 2013-07-08 Seiko Epson Corp ロボット制御システム、ロボットシステム及びロボット制御方法
CN103631142A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种用于轮式机器人轨迹跟踪的迭代学习算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XU TAO等: "A Simple Rebalance Strategy for Omnidirectional Humanoids Walking by Learning Foot Positioning", 《PROCEEDINGS OF 2011 8TH ASIAN CONTROL CONFERENCE》 *
XU TAO等: "Rebalance Strategies for Humanoids Walking by Foot Positioning Compensator Based on Adaptive Heteroscedastic SpGPs", 《2011 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106597844A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 一种机器人防摔倒控制方法及系统
CN105698795A (zh) * 2015-12-04 2016-06-22 天津大学 一种室内定位步长计算方法
CN106292288A (zh) * 2016-09-22 2017-01-04 同济大学 基于策略梯度学习法的模型参数修正方法及其应用
CN106292288B (zh) * 2016-09-22 2017-10-24 同济大学 基于策略梯度学习法的模型参数修正方法及修正器
CN108345211A (zh) * 2017-01-23 2018-07-31 深圳市祈飞科技有限公司 双足仿人机器人及其非线性步态规划方法以及控制方法
CN110447562A (zh) * 2019-09-02 2019-11-15 中国农业科学院农业信息研究所 跛牛识别及自动分群方法及其系统
CN110447562B (zh) * 2019-09-02 2024-04-19 中国农业科学院农业信息研究所 跛牛识别及自动分群方法及其系统

Similar Documents

Publication Publication Date Title
CN104318071A (zh) 一种基于线性落脚点补偿器的机器人行走控制方法
Reher et al. Realizing dynamic and efficient bipedal locomotion on the humanoid robot DURUS
CN105700536B (zh) 基于绳系拖曳系统的主动星姿态和系绳摆振联合控制方法
Ali et al. Optimization of active steering control on vehicle with steer by wire system using Imperialist Competitive Algorithm (ICA)
CN107160398B (zh) 基于确定学习的全状态受限刚性机械臂安全可靠控制方法
CN103204193B (zh) 一种欠驱动双足机器人行走控制方法
CN113479347B (zh) 一种火箭垂直回收着陆段轨迹控制方法
CN102411304A (zh) 一种航天器小角度姿态机动控制参数优化方法
CN107390517B (zh) 用于列车ato系统的鲁棒自适应非奇异终端滑模控制方法
Ahmed et al. On replacing a PID controller with Neural Network controller for Segway
CN114510063B (zh) 一种无人履带车辆及其轨迹跟踪控制方法和系统
CN105759827B (zh) 一种抑制不期望柔性振动的航天器姿态控制系统
CN104898672A (zh) 一种仿人机器人行走轨迹的优化控制方法
CN107424503A (zh) 一种二阶无根系统的3d倒立摆装置及其控制方法
CN101794153B (zh) 智能小车点镇定控制方法
CN114995137A (zh) 基于深度强化学习的绳驱并联机器人控制方法
Dadashzadeh et al. Slip-based control of bipedal walking based on two-level control strategy
CN114660940A (zh) 一种基于深度强化学习ppo算法的磨削恒力控制方法
CN111353119B (zh) 一种基于轨道机械能的双足行走稳定性分析方法
Dong et al. On-line gait adjustment for humanoid robot robust walking based on divergence component of motion
Englsberger et al. Biologically inspired dead-beat controller for bipedal running in 3D
Lee et al. Reactive bipedal walking method for torque controlled robot
CN115951696A (zh) 一种四足机器人路面姿态自适应方法
CN104570732A (zh) 一种仿人机器人步行模式的在线生成方法
Bhatti et al. Fast and adaptive hopping height control of single-legged robot

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150128