CN113359707A - 一种基于双层模糊强化学习的六足机器人避障方法 - Google Patents

一种基于双层模糊强化学习的六足机器人避障方法 Download PDF

Info

Publication number
CN113359707A
CN113359707A CN202110545683.9A CN202110545683A CN113359707A CN 113359707 A CN113359707 A CN 113359707A CN 202110545683 A CN202110545683 A CN 202110545683A CN 113359707 A CN113359707 A CN 113359707A
Authority
CN
China
Prior art keywords
degrees
fuzzy
robot
rule
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110545683.9A
Other languages
English (en)
Inventor
李培杰
林志赟
韩志敏
王博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202110545683.9A priority Critical patent/CN113359707A/zh
Publication of CN113359707A publication Critical patent/CN113359707A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0255Control of position or course in two dimensions specially adapted to land vehicles using acoustic signals, e.g. ultra-sonic singals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Acoustics & Sound (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于双层模糊强化学习的六足机器人避障方法,步骤包括:六足机器人通过身体前方三个超声波传感器测量出机器人与周围障碍物的距离,然后将三个距离分别进行模糊推理,将测量的障碍物信息转换为有限的状态;然后计算出输出的动作变量,之后对动作变量再次进行模糊推理,结合两次模糊推理再利用sarsa(λ)训练出机器人在相应状态下所要采取的动作。本发明采用模糊sarsa(λ)的方法,可以很好的解决强化学习难以利用与连续状态的问题,也可以有效的解决模糊控制中模糊推理机制建立复杂的问题。

Description

一种基于双层模糊强化学习的六足机器人避障方法
技术领域
本发明属于仿生机器人领域,涉及一种基于双层模糊强化学习的六足机器人避障方法。
背景技术
随着智能控制领域的快速发展和机器人的广泛应用,人们期望机器人拥有更好的自主操作能力,在更多领域代替人类完成更加复杂的操作任务。仿生机器人的研究日益发展,对于移动机器人,轮式和履带式移动机器人平台在非结构化环境下应用受到地形的限制,多足机器人因腿部具有多个自由度,使运动灵活性大大增强,地形适应能力更高。相较于二足与四足机器人,六足机器人地形环境适应能力更强,在山区建设、资源勘探、核工业、矿井巡检、星球探测等非结构环境和路况复杂领域有着非常广阔的应用前景。
六足机器人移动和作业过程中,需要面对动态、未知以及不易预测的非结构化的复杂环境。传统预先编程、遥操作等常规方法,需要事先针对任务分析六足机器人的移动特性,存在周期长、工作量大、效率低且不能满足任务多样性的需求等诸多难题,严重限制了六足机器人的进一步应用。因此,需要采用机器学习的方法,弥补预先编程等常规方法的缺陷,提高六足机器人对环境的适应能力。
发明内容
本发明目的在于针对现有技术的不足,提出一种基于双层模糊强化学习的六足机器人避障方法,本发明所要解决的技术问题在于提高六足机器人对复杂环境的适应能力。
为达到上述目的,本发明的技术方案如下:一种基于双层模糊强化学习的六足机器人避障方法,该方法包括如下步骤:
S1:六足机器人前方装有三个超声波传感器,通过超声波传感器测量自身和障碍物之间的距离,并将三个超声波传感器分别测得的三个障碍物的距离进行模糊推理,将测量的连续的距离转换为离散的有限的状态,每个状态即为一个模糊规则;
S2:计算步骤S1模糊推理输出的动作变量,对动作变量再次进行模糊推理;
S3:结合两次模糊推理结果,根据q值大小,再利用sarsa(λ)训练出机器人在相应规则下所要采取的动作。
进一步地,步骤S1中,将测量的障碍物距离转换为有限的规则的具体步骤如下:
S11:用机器人前部的三个超声波传感器分别测量出机器人自身和机器人前方三个障碍物的距离信息;
S12:利用隶属度函数对距离信息进行模糊化处理,隶属度函数为:
Figure BDA0003073549420000021
每个障碍物的距离都对应近,中,远三个隶属度,于是三个障碍物距离信息可以转化为27个规则。式中x为障碍物距离,F(x)为隶属度。
进一步地,步骤S2中,计算输出的动作变量并对动作变量再次进行模糊推理的具体步骤如下:
S21:根据超声波传感器到障碍物的距离信息计算被激活的规则的激活度
Figure BDA0003073549420000022
如下:
Figure BDA0003073549420000023
式中,μ(x1),μ(x2),μ(x3)分别为三个障碍物距离模糊化处理后的隶属度;
S22:六足机器人转动的空间取[-60°,60°];向右转取正,直行取0,左转取负;然后平均划分为五个离散动作,取-60°,-30°,0°,30°,60°;
S23:测量距离会在27个规则中激活多个规则(激活度不为0),根据q值(初始化为0)的大小,用动作选择策略ε-greedy从5个离散动作中选择一个动作,称为激活动作,用
Figure BDA0003073549420000031
表示,j代表第几个规则;
S24:将从所有激活规则所选出的激活动作与被激活的规则的激活度
Figure BDA0003073549420000037
相乘并求和,得到距离信息为x时的连续动作变量C(x):
Figure BDA0003073549420000032
式中,
Figure BDA0003073549420000033
为第r个规则的激活度;
S25:将C(x)再次进行模糊化处理,模糊语言分为{LB,LS,Z,RS,RB}={“左大”,“左小”,“零”,“右小”,“右大”},论域范围是[-60°,60°],隶属度函数采用三角形函数,其中“左大”所对应的论域范围为[-60°,-30°],“左小”所对应的论域范围为[-60°,0°],其中“零”所对应的论域范围为[-30°,30°],“右小”所对应的论域范围为[0°,60°],其中“右大”所对应的论域范围为[30°,60°]。
第r条规则所对应的Q值分量为:
Figure BDA0003073549420000034
式中,σrj(C(x))为C(x)模糊化处理后的隶属度,qr,j为第r条规则下对应的第j个q值。
进一步地,步骤S3中,利用sarsa(λ)训练出机器人在相应规则下所要采取的动作的具体步骤如下:
S31:根据所求的Qr(x,C(x)),可以得到执行连续动作C(x)时的Q值:
Figure BDA0003073549420000035
Figure BDA0003073549420000036
Figure BDA0003073549420000041
S32:根据sarsa算法更新q值:
qt+1=qt+α[r+γQ(xt+1,ut+1)-Q(xt,ut)]et (8)
其中α是步长参数,ut为t时刻测得的三个距离推理得出的动作变量,γ是折扣因子,qt为t时刻的q值向量,et是t时刻的资格迹向量:Q(xt,ut)为步骤S31中计算出的Q值;
Figure BDA0003073549420000042
式中,et(r,j)为对应于qr,j的资格迹元素,λ的取值范围为[0,1];
S33:训练完毕,选择最大q值对应的动作作为模糊规则的后件部分,得到完备的模糊规则库。
本发明的有益效果在于:本发明采用模糊sarsa(λ)的方法,可以很好的解决强化学习难以利用与连续状态的问题,也可以有效的解决模糊控制中模糊推理机制建立复杂的问题。
通过模糊推理将距离信息转化为一个有限的状态集合,然后经过第一层模糊推理之后得到机器人需要进行的动作,之后再对动作进行第二层模糊推理,之后融合两次模糊推理结果更新资格迹,可以加快sarsa算法的收敛速度。
附图说明
图1为本发明具体实施例的六足机器人模型图;
图2为本发明具体实施例的六足机器人关节执行器结构图;
图3为六足机器人CPG步态图;
图4为本发明的方法框图;
图5为本发明方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
本发明的方法适用的硬件结构以图1所示的具体实施例进行说明,本方法可以应用于各类移动机器人,本实施例的六足机器人身体前方带有三个超声波传感器,用来进行机器人和前方三个障碍物之间距离的测量。
六足机器人运动系统中,由18个串联弹性执行器组成,图2为执行器的结构图,执行器驱动电机为无刷直流电机,电机驱动方法为六步换向法,逆变电路由多个开关元件(MOSFET等)进行电桥连接,用来将直流电源所提供的直流电转换为驱动无刷直流电机的交流电。位置、速度、力矩传感器由多个编码器组成,编码器U2主要用来计算输出位置及速度、编码器U1和编码器U2的差值信号主要用来计算输出力矩;减速器使用齿轮减速箱;弹性元件安装于减速器输出端以及执行器的输出法兰之间,编码器U2与编码器U1分别安装在弹性元件前后,用于形变量的检测,同时编码器U2还负责输出位置和速度的检测。
六足机器人的每条腿有三个自由度,总共18个自由度,每个自由度由一个执行器控制,机器人的步态主要有三足步态、波浪步态、转弯步态。六足机器人的各种步态采用CPG方法生成,CPG由六个Hopf振荡器组成全对称耦合,耦合方式见图3,每一个振荡器对应一条腿的髋关节,然后生成的信号经过映射函数的映射之后输出给每条腿的各个关节,得到输出的最佳动作之后六足机器人通过CPG生成的步态进行行走。
操作系统采用ROS操作系统,在Gazebo软件中建立机器人的避障模型,把避障过程转换为一个马尔科夫决策过程,通过传感器测量的距离,将之进行模糊化处理,然后利用sarsa(λ)算法学习出机器人在相应的状态下所要采取的最佳动作。
如图4所示,本发明提供了一种基于双层模糊强化学习的六足机器人避障方法,该方法包括如下步骤:
S1:六足机器人前方装有三个超声波传感器,通过超声波传感器测量自身和障碍物之间的距离,并将三个超声波传感器分别测得的三个障碍物的距离进行模糊推理,将测量的连续的距离转换为离散的有限的状态,每个状态即为一个模糊规则;具体步骤如下:
S11:用机器人前部的三个超声波传感器分别测量出机器人自身和机器人前方三个障碍物的距离信息;
S12:利用隶属度函数对距离信息进行模糊化处理,隶属度函数为:
Figure BDA0003073549420000061
每个障碍物的距离都对应近,中,远三个隶属度,于是三个障碍物距离信息可以转化为27个规则。式中x为障碍物距离,F(x)为隶属度。
S2:计算步骤S1模糊推理输出的动作变量,对动作变量再次进行模糊推理;具体步骤如下:
S21:根据超声波传感器到障碍物的距离信息计算被激活的规则的激活度
Figure BDA0003073549420000062
如下:
Figure BDA0003073549420000063
式中,μ(x1),μ(x2),μ(x3)分别为三个障碍物距离模糊化处理后的隶属度;
S22:六足机器人转动的空间取[-60°,60°];向右转取正,直行取0,左转取负;然后平均划分为五个离散动作,取-60°,-30°,0°,30°,60°;
S23:测量距离会在27个规则中激活多个规则(激活度不为0),根据q值(初始化为0)的大小,用动作选择策略ε-greedy从5个离散动作中选择一个动作,称为激活动作,用
Figure BDA0003073549420000064
表示,j代表第几个规则;
S24:将从所有激活规则所选出的激活动作与被激活的规则的激活度
Figure BDA0003073549420000065
相乘并求和,得到距离信息为x时的连续动作变量C(x):
Figure BDA0003073549420000071
式中,
Figure BDA0003073549420000072
为第r个规则的激活度;
S25:将C(x)再次进行模糊化处理,模糊语言分为{LB,LS,Z,RS,RB}={“左大”,“左小”,“零”,“右小”,“右大”},论域范围是[-60°,60°],隶属度函数采用三角形函数,其中“左大”所对应的论域范围为[-60°,-30°],“左小”所对应的论域范围为[-60°,0°],其中“零”所对应的论域范围为[-30°,30°],“右小”所对应的论域范围为[0°,60°],其中“右大”所对应的论域范围为[30°,60°]。
第r条规则所对应的Q值分量为:
Figure BDA0003073549420000073
式中,σr,j(C(x))为C(x)模糊化处理后的隶属度,qr,j为第r条规则下对应的第j个q值。
S3:结合两次模糊推理结果,根据q值大小,再利用sarsa(λ)训练出机器人在相应规则下所要采取的动作。具体步骤如下:
S31:根据所求的Qr(x,C(x)),可以得到执行连续动作C(x)时的Q值:
Figure BDA0003073549420000074
Figure BDA0003073549420000075
Figure BDA0003073549420000076
S32:根据sarsa算法更新q值:
qt+1=qt+α[r+γQ(xt+1,ut+1)-Q(xt,ut)]et (8)
其中α是步长参数,ut为t时刻测得的三个距离推理得出的动作变量,γ是折扣因子,qt为t时刻的q值向量,et是t时刻的资格迹向量:Q(xt,ut)为步骤S31中计算出的Q值;
Figure BDA0003073549420000081
式中,et(r,j)为对应于qr,j的资格迹元素,λ的取值范围为[0,1];
S33:训练完毕,选择最大q值对应的动作作为模糊规则的后件部分,得到完备的模糊规则库。

Claims (4)

1.一种基于双层模糊强化学习的六足机器人避障方法,其特征在于,该方法包括如下步骤:
S1:六足机器人前方装有三个超声波传感器,通过超声波传感器测量自身和障碍物之间的距离,并将三个超声波传感器分别测得的三个障碍物的距离进行模糊推理,将测量的连续的距离转换为离散的有限的状态,每个状态即为一个模糊规则;
S2:计算步骤S1模糊推理输出的动作变量,对动作变量再次进行模糊推理;
S3:结合两次模糊推理结果,根据q值大小,再利用sarsa(λ)训练出机器人在相应规则下所要采取的动作。
2.根据权利要求1所述的基于双层模糊强化学习的六足机器人避障方法,其特征在于,步骤S1中,将测量的障碍物距离转换为有限的规则的具体步骤如下:
S11:用机器人前部的三个超声波传感器分别测量出机器人自身和机器人前方三个障碍物的距离信息;
S12:利用隶属度函数对距离信息进行模糊化处理,隶属度函数为:
Figure FDA0003073549410000011
每个障碍物的距离都对应近,中,远三个隶属度,于是三个障碍物距离信息可以转化为27个规则。式中x为障碍物距离,F(x)为隶属度。
3.根据权利要求2所述的基于双层模糊强化学习的六足机器人避障方法,其特征在于,步骤S2中,计算输出的动作变量并对动作变量再次进行模糊推理的具体步骤如下:
S21:根据超声波传感器到障碍物的距离信息计算被激活的规则的激活度
Figure FDA0003073549410000021
如下:
Figure FDA0003073549410000022
式中,μ(x1),μ(x2),μ(x3)分别为三个障碍物距离模糊化处理后的隶属度;
S22:六足机器人转动的空间取[-60°,60°];向右转取正,直行取0,左转取负;然后平均划分为五个离散动作,取-60°,-30°,0°,30°,60°;
S23:测量距离会在27个规则中激活多个规则(激活度不为0),根据q值(初始化为0)的大小,用动作选择策略ε-greedy从5个离散动作中选择一个动作,称为激活动作,用
Figure FDA0003073549410000023
表示,j代表第几个规则;
S24:将从所有激活规则所选出的激活动作与被激活的规则的激活度
Figure FDA0003073549410000024
相乘并求和,得到距离信息为x时的连续动作变量C(x):
Figure FDA0003073549410000025
式中,
Figure FDA0003073549410000026
为第r个规则的激活度;
S25:将C(x)再次进行模糊化处理,模糊语言分为{LB,LS,Z,RS,RB}={“左大”,“左小”,“零”,“右小”,“右大”},论域范围是[-60°,60°],隶属度函数采用三角形函数,其中“左大”所对应的论域范围为[-60°,-30°],“左小”所对应的论域范围为[-60°,0°],其中“零”所对应的论域范围为[-30°,30°],“右小”所对应的论域范围为[0°,60°],其中“右大”所对应的论域范围为[30°,60°]。
第r条规则所对应的Q值分量为:
Figure FDA0003073549410000027
式中,σr,j(C(x))为C(x)模糊化处理后的隶属度,qr,j为第r条规则下对应的第j个q值。
4.根据权利要求3所述的基于双层模糊强化学习的六足机器人避障方法,其特征在于,步骤S3中,利用sarsa(λ)训练出机器人在相应规则下所要采取的动作的具体步骤如下:
S31:根据所求的Qr(x,C(x)),可以得到执行连续动作C(x)时的Q值:
Figure FDA0003073549410000031
Figure FDA0003073549410000032
Figure FDA0003073549410000033
S32:根据sarsa算法更新q值:
qt+1=qt+α[r+γQ(xt+1,ut+1)-Q(xt,ut)]et (8)
其中α是步长参数,ut为t时刻测得的三个距离推理得出的动作变量,γ是折扣因子,qt为t时刻的q值向量,et是t时刻的资格迹向量:Q(xt,ut)为步骤S31中计算出的Q值;
Figure FDA0003073549410000034
式中,et(r,j)为对应于qr,j的资格迹元素,λ的取值范围为[0,1];
S33:训练完毕,选择最大q值对应的动作作为模糊规则的后件部分,得到完备的模糊规则库。
CN202110545683.9A 2021-05-19 2021-05-19 一种基于双层模糊强化学习的六足机器人避障方法 Pending CN113359707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110545683.9A CN113359707A (zh) 2021-05-19 2021-05-19 一种基于双层模糊强化学习的六足机器人避障方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110545683.9A CN113359707A (zh) 2021-05-19 2021-05-19 一种基于双层模糊强化学习的六足机器人避障方法

Publications (1)

Publication Number Publication Date
CN113359707A true CN113359707A (zh) 2021-09-07

Family

ID=77526582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110545683.9A Pending CN113359707A (zh) 2021-05-19 2021-05-19 一种基于双层模糊强化学习的六足机器人避障方法

Country Status (1)

Country Link
CN (1) CN113359707A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114740857A (zh) * 2022-04-14 2022-07-12 国家能源集团乐东发电有限公司 一种基于强化学习的四足机器人运动控制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324196A (zh) * 2013-06-17 2013-09-25 南京邮电大学 基于模糊逻辑的多机器人路径规划与协调避碰方法
CN107562053A (zh) * 2017-08-30 2018-01-09 南京大学 一种基于模糊q学习的六足机器人避障方法
CN110780670A (zh) * 2019-09-19 2020-02-11 上海机器人产业技术研究院有限公司 基于模糊控制算法的机器人避障控制方法
CN111552183A (zh) * 2020-05-17 2020-08-18 南京大学 一种基于自适应权重强化学习的六足机器人避障方法
CN112631134A (zh) * 2021-01-05 2021-04-09 华南理工大学 一种基于模糊神经网络的智能小车避障方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324196A (zh) * 2013-06-17 2013-09-25 南京邮电大学 基于模糊逻辑的多机器人路径规划与协调避碰方法
CN107562053A (zh) * 2017-08-30 2018-01-09 南京大学 一种基于模糊q学习的六足机器人避障方法
CN110780670A (zh) * 2019-09-19 2020-02-11 上海机器人产业技术研究院有限公司 基于模糊控制算法的机器人避障控制方法
CN111552183A (zh) * 2020-05-17 2020-08-18 南京大学 一种基于自适应权重强化学习的六足机器人避障方法
CN112631134A (zh) * 2021-01-05 2021-04-09 华南理工大学 一种基于模糊神经网络的智能小车避障方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QUAN LIU ETC: ""A Sarsa( ) Algorithm Based on Double-Layer Fuzzy Reasoning"", 《MATHEMATICAL PROBLEMS IN ENGINEERING》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114740857A (zh) * 2022-04-14 2022-07-12 国家能源集团乐东发电有限公司 一种基于强化学习的四足机器人运动控制方法及系统

Similar Documents

Publication Publication Date Title
Kim et al. Online minimum-energy trajectory planning and control on a straight-line path for three-wheeled omnidirectional mobile robots
Bao et al. A fuzzy behavior-based architecture for mobile robot navigation in unknown environments
Ren et al. A new fuzzy intelligent obstacle avoidance control strategy for wheeled mobile robot
CN102402712A (zh) 基于神经网络的机器人强化学习初始化方法
CN113359707A (zh) 一种基于双层模糊强化学习的六足机器人避障方法
Xue et al. Gait planning and control of hexapod robot based on velocity vector
Farooq et al. Design and low cost implementation of a fuzzy logic controller for wall following behavior of a mobile robot
Malhotra et al. Development of a fuzzy logic based mobile robot for dynamic obstacle avoidance and goal acquisition in an unstructured environment
Nakamura et al. Path planning for mobile robot considering turnabouts on narrow road by deep Q-network
Nia et al. Virtual force field algorithm for a behaviour-based autonomous robot in unknown environments
Deng et al. Cpg-inspired gait generation and transition control for six wheel-legged robot
Parhi et al. Sugeno fuzzy based navigational controller of an intelligent mobile robot
Chiu et al. Fuzzy obstacle avoidance control of a two-wheeled mobile robot
Abdulshaheed et al. A review on snake robot locomotion, modelling, and controlling in challenging environment
Liu et al. Goal-driven motion control of snake robots with onboard cameras via policy improvement with path integrals
Habumuremyi et al. Mechanical design and MANFIS control of a leg for a new demining walking robot
Asad et al. Intelligent Obstacle Avoidance Controller for QBot2
Hung et al. Design of hierarchical fuzzy logic control for mobile robot system
Zeng et al. Design of Robot Path Planning Control Algorithm Based on Wavelet Neural Network
Colombetti et al. Robot shaping: The HAMSTER experiment
Farooq et al. Design, low cost implementation and comparison of MIMO Mamdani Fuzzy Logic Controllers for wall tracking behavior of mobile robot
Maravall et al. Automatic car parking: a reinforcement learning approach
Sasaki et al. Steady-state genetic algorithm for self-localization in illuminance measurement of a mobile robot
Lin Adaptive Control and Path Planning Algorithm for Intelligent Robots Based on Reinforcement Learning
Zhao et al. Research on control strategy of pneumatic soft bionic robot based on improved CPG

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210907