CN110955242A - 机器人导航方法、系统、机器人及存储介质 - Google Patents

机器人导航方法、系统、机器人及存储介质 Download PDF

Info

Publication number
CN110955242A
CN110955242A CN201911159641.0A CN201911159641A CN110955242A CN 110955242 A CN110955242 A CN 110955242A CN 201911159641 A CN201911159641 A CN 201911159641A CN 110955242 A CN110955242 A CN 110955242A
Authority
CN
China
Prior art keywords
strategy
robot
obstacle avoidance
track
cost map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911159641.0A
Other languages
English (en)
Other versions
CN110955242B (zh
Inventor
毕占甲
张健
刘志超
庞建新
熊友军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubtech Robotics Corp
Original Assignee
Ubtech Robotics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubtech Robotics Corp filed Critical Ubtech Robotics Corp
Priority to CN201911159641.0A priority Critical patent/CN110955242B/zh
Publication of CN110955242A publication Critical patent/CN110955242A/zh
Application granted granted Critical
Publication of CN110955242B publication Critical patent/CN110955242B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/12Target-seeking control

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本申请实施例公开了一种机器人导航方法、系统、机器人及计算机可读存储介质,其具体通过动态物体感知模块检测动态物体的运动状态信息,根据运动状态信息预测动态物体的运动轨迹;根据采集的障碍物数据,通过代价地图模块生成全局代价地图和局部代价地图;根据全局代价地图和机器人的导航目标点,通过全局规划器模块规划从机器人的当前位置到达导航目标点的全局路径;根据全局路径、局部代价地图、运动状态信息和运动轨迹,通过行为决策模块得到避障策略;根据避障策略和局部代价地图,通过局部规划器模块规划避障路径,并根据避障路径和避障策略控制机器人执行避障操作。本申请实施例可以提高机器人导航过程中的友好性和智能性。

Description

机器人导航方法、系统、机器人及存储介质
技术领域
本申请属于机器人技术领域,尤其涉及一种机器人导航方法、系统、机器人及计算机可读存储介质。
背景技术
随着机器人技术的不断发展和进步,机器人的应用也越来越广泛。
机器人自主导航技术是服务机器人领域在实际应用场景中的一项重要关键技术。尤其是在动态行人较多的场景下机器人导航需要同时具备安全性、智能性和友好性。
而现有的机器人导航框架都是把动态障碍物统一作为静态障碍物处理,未对动态障碍物的运动轨迹做出预测,常使机器人规划出来的路径干扰周边的行人,缺乏对人的友好性。同时,现有方案都是采用单一的局部路径规划器,规划出来的路径表现得比较程序化,缺乏智能性。
发明内容
本申请实施例提供一种机器人导航方法、系统、机器人及计算机可读存储介质,以解决现有机器人导航框架的友好性和智能性均较低的问题。
第一方面,本申请实施例提供一种机器人导航系统,包括:
动态物体感知模块,用于检测动态物体的运动状态信息,根据所述运动状态信息预测所述动态物体的运动轨迹;
代价地图模块,用于根据采集的障碍物数据生成全局代价地图和局部代价地图;
全局规划器模块,用于根据所述全局代价地图和机器人的导航目标点,规划从所述机器人的当前位置到达所述导航目标点的全局路径;
行为决策模块,用于根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,得到避障策略;
局部规划器模块,用于根据所述避障策略和所述局部代价地图规划避障路径,根据所述避障路径和所述避障策略控制机器人执行避障操作;
导航调度模块,用于调度所述全局规划器模块、所述局部规划器模块和所述行为决策模块。
可以看出,本申请实施例的机器人导航系统包括动态物体感知模块,通过该动态物体感知模块可以得到动态障碍物的运动状态信息,并对动态物体的轨迹进行预测,使得规划出来的路径对人的友好性更高;此外,该导航系统不仅包括局部规划器,还包括全局规划器,使得规划出来的路径的智能性更高。
结合第一方面,在一种可行的实现方式中,所述行为决策模块具体用于:
基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集;
对所述避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹;
对每个所述轨迹进行轨迹评价,得到轨迹评价结果;
根据所述轨迹评价结果,从所述避障策略集中选取最佳策略,所述最佳策略为所述避障策略。
结合第一方面,在一种可行的实现方式中,所述避障策略集包括前往目标策略、跟随行人策略和停止策略;
所述行为决策模块具体用于:
根据所述运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,所述运动状态信息包括行人的位置信息和速度信息;
基于预先设定的跟随行人策略机制,根据所述目标行人的位置信息和速度信息,以及所述机器人信息和所述状态数据,构建所述跟随行人策略;
基于预先设定的前往目标策略机制,根据所述全局路径和所述机器人信息构建所述前往目标策略;
基于预先设定的停止策略机制,根据所述机器人信息构建所述停止策略。
结合第一方面,在一种可行的实现方式中,所述行为决策模块具体用于:
通过预先构建的轨迹评价模型,对每个所述轨迹进行轨迹评价,得到所述轨迹评价结果;
其中,所述轨迹评价模型为C(X)=-α·R(X)+B(X),B(X)为惩罚函数,R(X)为奖励函数;
Figure BDA0002285713850000031
k是在未来T时间内按照时间仿真步长Δt递增的步数,σ是自然衰减系数,dr,j(k)表示机器人和行人j在第k步时二者之间的距离;
Figure BDA0002285713850000032
pr表示机器人的位置,
Figure BDA0002285713850000033
表示机器人当前位置到目标的单位方向矢量。
结合第一方面,在一种可行的实现方式中,所述局部规划器模块包括SFM局部规划器和TEB局部规划器;
所述局部规划器模块具体用于:
根据障碍物的种类选取目标规划器,所述目标规划器为所述SFM局部规划器和所述TEB局部规划器中的一种;
通过所述目标规划器,根据所述避障策略和所述局部代价地图规划避障路径,根据所述避障路径和所述避障策略控制机器人执行避障操作。
第二方面,本申请实施例提供一种机器人导航方法,应用于上述第一方面任一项所述的机器人导航系统,所述机器人导航方法包括:
通过动态物体感知模块检测动态物体的运动状态信息,根据所述运动状态信息预测所述动态物体的运动轨迹;
根据采集的障碍物数据,通过代价地图模块生成全局代价地图和局部代价地图;
根据所述全局代价地图和机器人的导航目标点,通过全局规划器模块规划从所述机器人的当前位置到达所述导航目标点的全局路径;
根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,通过行为决策模块得到避障策略;
根据所述避障策略和所述局部代价地图,通过局部规划器模块规划避障路径,并根据所述避障路径和所述避障策略控制机器人执行避障操作。
结合第二方面,在一种可行的实现方式中,根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,通过行为决策模块得到避障策略,包括:
基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集;
对所述避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹;
对每个所述轨迹进行轨迹评价,得到轨迹评价结果;
根据所述轨迹评价结果,从所述避障策略集中选取最佳策略,所述最佳策略为所述避障策略。
结合第二方面,在一种可行的实现方式中,所述避障策略集包括前往目标策略、跟随行人策略和停止策略;
所述基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集,包括:
根据所述运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,所述运动状态信息包括行人的位置信息和速度信息;
基于预先设定的跟随行人策略机制,根据所述目标行人的位置信息和速度信息,以及所述机器人信息和所述状态数据,构建所述跟随行人策略;
基于预先设定的前往目标策略机制,根据所述全局路径和所述机器人信息构建所述前往目标策略;
基于预先设定的停止策略机制,根据所述机器人信息构建所述停止策略。
第三方面,本申请实施例提供一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第二方面任一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第二方面任一项所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在机器人上运行时,使得机器人执行上述第二方面中任一项所述的方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种机器人导航系统的结构示意框图;
图2为本申请实施例提供的一种机器人导航方法的流程示意框图;
图3为本申请实施例提供的步骤S203的具体流程示意图;
图4为本申请实施例提供的机器人的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。
在详细介绍本申请实施例提供的技术方案之前,先对本申请实施例可能涉及的相关名词进行介绍。
社会力模型(Social force model,SFM)是基于社会力的模型,社会力是指智能体受到的目标引力、智能体斥力和障碍斥力所构成的合力。
其中,目标引力是用于描述目标对智能体的吸引力,其计算公式如下:
Figure BDA0002285713850000061
智能体斥力是用于描述智能体受到其他智能体的斥力,其计算公式如下:
Figure BDA0002285713850000062
障碍斥力是用于描述障碍物对智能体的斥力,其计算公式如下:
Figure BDA0002285713850000063
社会力的计算公式如下:
Figure BDA0002285713850000064
在上文描述中,智能体是行人和机器人的统称,i和j分别表示第i个智能体和第j个智能体,o表示第o个障碍物。ap、bp和di,j是智能体斥力自然参数,ao、bo和di,o是障碍斥力自然参数。
Figure BDA0002285713850000065
表示智能体i到目标所在方向的单位示例,ej→i表示智能体j到智能体i所在方向的单位矢量,eo→i表示从障碍物o到智能体i所在方向的单位矢量。
下面将通过具体实施例详细阐述本申请实施例提供的技术方案。
参见图1,为本申请实施例提供的一种机器人导航系统的结构示意框图,该系统可以包括动态物体感知模块11、代价地图模块12、全局规划器模块13、行为决策模块14、局部规划器模块15和导航调度模块16。
其中,动态物体感知模块11,用于检测动态物体的运动状态信息,根据运动状态信息预测动态物体的运动轨迹。
上述动态物体可以为行人和/或车辆,运动状态信息包括但限于位置和速度等信息。例如,通过上述动态物体感知模块感知机器人周边行人的速度和位置。机器人在检测到运动状态信息之后,可以预测出动态物体在未来一段时间段内的运动轨迹。
代价地图模块12,用于根据采集的障碍物数据生成全局代价地图和局部代价地图。该代价地图模块可以通过代价图的方式表述障碍物数据信息,障碍物数据信息可以具体通过传感器、地图数据和里程计等获得。得到的全局代价地图可以提供给全局规划器模块使用,而局部代价地图则可以提供给局部规划器模块和行为决策模块使用。
全局规划器模块13,用于根据全局代价地图和机器人的导航目标点,规划从机器人的当前位置到达导航目标点的全局路径。具体应用中,全局规划器模块具体用于按照既定频率实时规划出一条从机器人当前位置到目标点的可行路径,并将规划出来的全局路径提供给行为决策模块使用。
行为决策模块14,用于根据全局路径、局部代价地图、运动状态信息和运动轨迹,得到避障策略。
具体应用中,行为决策模块可以构建出包括多种策略的避障碍策略集,并按照既定频率实时从避障策略集中选取出一种最佳策略。
在一些实施例中,行为决策模块具体用于:基于预先设定的避障策略机制,根据全局路径、运动状态信息、运动轨迹和局部代价地图构建避障策略集;对避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹;对每个轨迹进行轨迹评价,得到轨迹评价结果;根据轨迹评价结果,从避障策略集中选取最佳策略,最佳策略为避障策略。
上述避障策略机制可以表征预先定义的避障策略有哪几种以及每一种避障策略的具体表现形式是什么。例如,预先定义的避障策略机制包括停止策略和前往目标策略,其中,停止策略是指控制机器人停止,前往目标策略是指控制机器人前往预先设定的目标。
上述避障策略集包括前往目标策略、跟随行人策略和停止策略。其中,前往目标策略:表示该目标引力中使用的目标就是智能体自身的目标。跟随行人策略:表示该目标引力是以第i个行人的位置作为目标。停止策略:表示此时的社会力是与机器人当前速度方向相反,大小为可变加速度,优选为最大加速度。
进一步地,行为决策模块具体用于:根据运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,运动状态信息包括行人的位置信息和速度信息;基于预先设定的跟随行人策略机制,根据目标行人的位置信息和速度信息,以及机器人信息和状态数据,构建跟随行人策略;基于预先设定的前往目标策略机制,根据全局路径和机器人信息构建前往目标策略;基于预先设定的停止策略机制,根据机器人信息构建停止策略。
具体地,先选取目标行人,该目标行人是指机器人需要跟随的行人,具体可以通过采集周围行人信息,例如,位置信息、速度信息等,然后再根据周围行人信息和每个行人的运动轨迹确定出需要跟随的第i个行人;确定跟随目标之后,再结合静态障碍物的所处位置和机器人本身的位置、速度和目标等信息,构建出相应的避障路径,以构建出上述跟随行人策略。
在构建过程中,周围行人可能很多,如果从数量较多的行人中选取出目标行人,计算量可能很大。为了进一步提高计算效率,可以先筛选出符合预设条件的候选行人,再从候选行人中选取出目标行人。
进一步地,可以将位于机器人前方预设距离以内,且速度方向与机器人的目标方向夹角在预设角度以内的行人作为候选行人;从候选行人中选取机器人跟随的目标行人。即在构建策略集时,将在机器人前方x米以内,且行人的运动速度方向和机器人的目标方向夹角在w°以内的行人作为候选行人。其中,上述预设距离和预设角度均可以根据实际需要进行设定,在此不再赘述。
前往目标策略机制是指机器人前往的目标是智能体自身的目标,即不改变机器人原来的目标,继续控制机器人向原来的目标方向前进。机器人原来的目标可以从机器人信息中的目标信息和全局路径中得知。
停止策略机制具体表现为机器人停止运动,其最终目的是为了让机器人停下来。而控制机器人停止运动的方式具体是向机器人施加一个反方向的虚拟外力,该外力的大小由停止策略中的可变加速度的大小决定。
可以理解的是,停止策略、前往目标策略和跟随行人策略的构建过程的执行顺序是任意的,在此不作限定。
构建完包括多个策略的避障策略集之后,需要从多种策略中选取出一个最佳策略。具体地,可以通过
Figure BDA0002285713850000091
计算每一种策略的轨迹;其中,xi为由位置和速度构成的智能体状态变量,其计算公式为:xi=[pi,vi]T,pi为智能体i的位置信息,vi为智能体i的速度信息。
Figure BDA0002285713850000092
为智能体状态变量的微分项,Δt为智能体i的更新周期。
Figure BDA0002285713850000093
的计算公式为:
Figure BDA0002285713850000094
ai为智能体在受到社会力Fi作用下的加速度。
智能体i在更新时间周期Δt内受到社会力为Fi,在该力作用下状态变量的更新为
Figure BDA0002285713850000095
基于此,可以计算出智能体在未来T时间内按照时间仿真步长Δt进行仿真对应的轨迹X。
得到多个策略的轨迹之后,可以通过预先构建的轨迹评价模型,对每个轨迹进行轨迹评价,得到轨迹评价结果。
其中,轨迹评价模型为C(X)=-α·R(X)+B(X),B(X)为惩罚函数,R(X)为奖励函数;
Figure BDA0002285713850000096
k是在未来T时间内按照时间仿真步长Δt递增的步数,σ是自然衰减系数,dr,j(k)表示机器人和行人j在第k步时二者之间的距离;
Figure BDA0002285713850000097
pr表示机器人的位置,
Figure BDA0002285713850000098
表示机器人当前位置到目标的单位方向矢量。
最后,基于轨迹评价结果,选取代价最大的策略作为最佳策略。
局部规划器模块15,用于根据避障策略和局部代价地图规划避障路径,根据避障路径和避障策略控制机器人执行避障操作。具体地应用中,局部规划器模块具体用于规划出一条合理的局部避障路径,并向机器人底盘输出最佳策略对应的速度,以控制机器人调整其当前的运动。
在一些实施例中,上述局部规划器模块15包括SFM局部规划器151和TEB(TimedElastic Band)局部规划器152。局部规划器模块具体用于:根据障碍物的种类选取目标规划器,目标规划器为SFM局部规划器和TEB局部规划器中的一种;通过目标规划器,根据避障策略和局部代价地图规划避障路径,根据避障路径和避障策略控制机器人执行避障操作。
例如,当障碍物是人时,则选择TEB局部规划器进行路径规划,而当障碍物为非人时,则选择SFM局部规划器进行路径规划。
导航调度模块16,用于调度全局规划器模块、局部规划器模块和行为决策模块。具体应用中,该模块用于统筹调度上面3个模块,使得这3个模块可以根据模块间数据流关系进行数据交互,同时又可以保证这些模块的并行调度。
可以看出,本申请实施例的机器人导航系统包括动态物体感知模块,通过该动态物体感知模块可以得到动态障碍物的运动状态信息,并对动态物体的轨迹进行预测,使得规划出来的路径对人的友好性更高;此外,该导航系统不仅包括局部规划器,还包括全局规划器,使得规划出来的路径的智能性更高。
参见图2,为本申请实施例提供的一种机器人导航方法的流程示意框图,该方法应用于上述任一项的机器人导航系统,该系统的相关介绍请参见上文相应内容,在此不再赘述。上述机器人导航方法可以包括:
步骤S201、通过动态物体感知模块检测动态物体的运动状态信息,根据运动状态信息预测动态物体的运动轨迹。
步骤S202、根据采集的障碍物数据,通过代价地图模块生成全局代价地图和局部代价地图。
步骤S203、根据全局代价地图和机器人的导航目标点,通过全局规划器模块规划从机器人的当前位置到达导航目标点的全局路径。
步骤S204、根据全局路径、局部代价地图、运动状态信息和运动轨迹,通过行为决策模块得到避障策略。
步骤S205、根据避障策略和局部代价地图,通过局部规划器模块规划避障路径,并根据避障路径和避障策略控制机器人执行避障操作。
需要说明的是,步骤S201~S205的相关介绍可以参见上文相应内容,在此不再赘述。
进一步地,参见图3示出的步骤S203的具体流程示意图,上述根据全局路径、局部代价地图、运动状态信息和运动轨迹,通过行为决策模块得到避障策略的具体过程可以包括:
步骤S301、基于预先设定的避障策略机制,根据全局路径、运动状态信息、运动轨迹和局部代价地图构建避障策略集。
步骤S302、对避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹。
步骤S303、对每个轨迹进行轨迹评价,得到轨迹评价结果。
步骤S304、根据轨迹评价结果,从避障策略集中选取最佳策略,最佳策略为避障策略。
更进一步地,上述避障策略集包括前往目标策略、跟随行人策略和停止策略。上述基于预先设定的避障策略机制,根据全局路径、运动状态信息、运动轨迹和局部代价地图构建避障策略集的具体过程可以包括:根据运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,运动状态信息包括行人的位置信息和速度信息;基于预先设定的跟随行人策略机制,根据目标行人的位置信息和速度信息,以及机器人信息和状态数据,构建跟随行人策略;基于预先设定的前往目标策略机制,根据全局路径和机器人信息构建前往目标策略;基于预先设定的停止策略机制,根据机器人信息构建停止策略。
在一种可行的实现方式中,上述对每个轨迹进行轨迹评价,得到轨迹评价结果的具体过程可以包括:通过预先构建的轨迹评价模型,对每个轨迹进行轨迹评价,得到轨迹评价结果;其中,轨迹评价模型为C(X)=-α·R(X)+B(X),B(X)为惩罚函数,R(X)为奖励函数;
Figure BDA0002285713850000111
k是在未来T时间内按照时间仿真步长Δt递增的步数,σ是自然衰减系数,dr,j(k)表示机器人和行人j在第k步时二者之间的距离;
Figure BDA0002285713850000121
pr表示机器人的位置,
Figure BDA0002285713850000122
表示机器人当前位置到目标的单位方向矢量。
在一种可行的实现方式中,上述局部规划器模块包括SFM局部规划器和TEB局部规划器;上述根据避障策略和局部代价地图,通过局部规划器模块规划避障路径,并根据避障路径和避障策略控制机器人执行避障操作的具体过程可以包括:根据障碍物的种类选取目标规划器,目标规划器为SFM局部规划器和TEB局部规划器中的一种;通过目标规划器,根据避障策略和局部代价地图规划避障路径,根据避障路径和避障策略控制机器人执行避障操作。
需要说明的是,本实施例提供的机器人导航方法与上述机器人导航系统相对应,相关介绍可以参见上文相应内容,在此不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
需要说明的是,上述系统模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见系统实施例部分,此处不再赘述。
图4为本申请一实施例提供的机器人的结构示意图。如图4所示,该实施例的机器人4包括:至少一个处理器40、存储器41以及存储在所述存储器41中并可在所述至少一个处理器40上运行的计算机程序42,所述处理器40执行所述计算机程序42时实现上述任意各个机器人导航方法实施例中的步骤。
所述机器人4的类型可以是任意的,例如,该机器人为服务型机器人。该机器人可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是机器人4的举例,并不构成对机器人4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备、底盘、传感器等等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),该处理器40还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41在一些实施例中可以是所述机器人4的内部存储单元,例如机器人4的硬盘或内存。所述存储器41在另一些实施例中也可以是所述机器人4的外部存储设备,例如所述机器人4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述机器人4的内部存储单元也包括外部存储设备。所述存储器41用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在机器人上运行时,使得机器人执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种机器人导航系统,其特征在于,包括:
动态物体感知模块,用于检测动态物体的运动状态信息,根据所述运动状态信息预测所述动态物体的运动轨迹;
代价地图模块,用于根据采集的障碍物数据生成全局代价地图和局部代价地图;
全局规划器模块,用于根据所述全局代价地图和机器人的导航目标点,规划从所述机器人的当前位置到达所述导航目标点的全局路径;
行为决策模块,用于根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,得到避障策略;
局部规划器模块,用于根据所述避障策略和所述局部代价地图规划避障路径,根据所述避障路径和所述避障策略控制机器人执行避障操作;
导航调度模块,用于调度所述全局规划器模块、所述局部规划器模块和所述行为决策模块。
2.如权利要求1所述的系统,其特征在于,所述行为决策模块具体用于:
基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集;
对所述避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹;
对每个所述轨迹进行轨迹评价,得到轨迹评价结果;
根据所述轨迹评价结果,从所述避障策略集中选取最佳策略,所述最佳策略为所述避障策略。
3.如权利要求2所述的系统,其特征在于,所述避障策略集包括前往目标策略、跟随行人策略和停止策略;
所述行为决策模块具体用于:
根据所述运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,所述运动状态信息包括行人的位置信息和速度信息;
基于预先设定的跟随行人策略机制,根据所述目标行人的位置信息和速度信息,以及所述机器人信息和所述状态数据,构建所述跟随行人策略;
基于预先设定的前往目标策略机制,根据所述全局路径和所述机器人信息构建所述前往目标策略;
基于预先设定的停止策略机制,根据所述机器人信息构建所述停止策略。
4.如权利要求2所述的系统,其特征在于,所述行为决策模块具体用于:
通过预先构建的轨迹评价模型,对每个所述轨迹进行轨迹评价,得到所述轨迹评价结果;
其中,所述轨迹评价模型为C(X)=-α·R(X)+B(X),B(X)为惩罚函数,R(X)为奖励函数;
Figure FDA0002285713840000021
k是在未来T时间内按照时间仿真步长Δt递增的步数,σ是自然衰减系数,dr,j(k)表示机器人和行人j在第k步时二者之间的距离;
Figure FDA0002285713840000022
pr表示机器人的位置,
Figure FDA0002285713840000023
表示机器人当前位置到目标的单位方向矢量。
5.如权利要求1至4任一项所述的系统,其特征在于,所述局部规划器模块包括SFM局部规划器和TEB局部规划器;
所述局部规划器模块具体用于:
根据障碍物的种类选取目标规划器,所述目标规划器为所述SFM局部规划器和所述TEB局部规划器中的一种;
通过所述目标规划器,根据所述避障策略和所述局部代价地图规划避障路径,根据所述避障路径和所述避障策略控制机器人执行避障操作。
6.一种机器人导航方法,其特征在于,应用于如权利要求1至5任一项所述的机器人导航系统,所述机器人导航方法包括:
通过动态物体感知模块检测动态物体的运动状态信息,根据所述运动状态信息预测所述动态物体的运动轨迹;
根据采集的障碍物数据,通过代价地图模块生成全局代价地图和局部代价地图;
根据所述全局代价地图和机器人的导航目标点,通过全局规划器模块规划从所述机器人的当前位置到达所述导航目标点的全局路径;
根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,通过行为决策模块得到避障策略;
根据所述避障策略和所述局部代价地图,通过局部规划器模块规划避障路径,并根据所述避障路径和所述避障策略控制机器人执行避障操作。
7.如权利要求6所述的方法,其特征在于,根据所述全局路径、所述局部代价地图、所述运动状态信息和所述运动轨迹,通过行为决策模块得到避障策略,包括:
基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集;
对所述避障策略集中的每一个策略进行轨迹正向仿真,得到每一个策略的轨迹;
对每个所述轨迹进行轨迹评价,得到轨迹评价结果;
根据所述轨迹评价结果,从所述避障策略集中选取最佳策略,所述最佳策略为所述避障策略。
8.如权利要求7所述的方法,其特征在于,所述避障策略集包括前往目标策略、跟随行人策略和停止策略;
所述基于预先设定的避障策略机制,根据所述全局路径、所述运动状态信息、所述运动轨迹和所述局部代价地图构建避障策略集,包括:
根据所述运动轨迹、行人的位置信息和速度信息,选取机器人跟随的目标行人;其中,所述运动状态信息包括行人的位置信息和速度信息;
基于预先设定的跟随行人策略机制,根据所述目标行人的位置信息和速度信息,以及所述机器人信息和所述状态数据,构建所述跟随行人策略;
基于预先设定的前往目标策略机制,根据所述全局路径和所述机器人信息构建所述前往目标策略;
基于预先设定的停止策略机制,根据所述机器人信息构建所述停止策略。
9.一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求6至8任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求6至8任一项所述的方法。
CN201911159641.0A 2019-11-22 2019-11-22 机器人导航方法、系统、机器人及存储介质 Active CN110955242B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159641.0A CN110955242B (zh) 2019-11-22 2019-11-22 机器人导航方法、系统、机器人及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159641.0A CN110955242B (zh) 2019-11-22 2019-11-22 机器人导航方法、系统、机器人及存储介质

Publications (2)

Publication Number Publication Date
CN110955242A true CN110955242A (zh) 2020-04-03
CN110955242B CN110955242B (zh) 2023-04-14

Family

ID=69978304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159641.0A Active CN110955242B (zh) 2019-11-22 2019-11-22 机器人导航方法、系统、机器人及存储介质

Country Status (1)

Country Link
CN (1) CN110955242B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111596668A (zh) * 2020-06-17 2020-08-28 苏州大学 基于逆向强化学习的移动机器人拟人化路径规划方法
CN112254727A (zh) * 2020-09-23 2021-01-22 锐捷网络股份有限公司 基于teb的路径规划方法及装置
CN112348434A (zh) * 2020-10-29 2021-02-09 济南浪潮高新科技投资发展有限公司 一种云化小区外卖全自动配送的方案
CN112506203A (zh) * 2020-12-14 2021-03-16 深圳市普渡科技有限公司 一种机器人运动动态反馈方法及系统
CN112859842A (zh) * 2020-12-31 2021-05-28 中山大学 一种路径跟随导航方法及其系统
CN113219988A (zh) * 2021-06-01 2021-08-06 苏州天准科技股份有限公司 避障路径智能规划方法、存储介质和无人巡检车
CN113341970A (zh) * 2021-06-01 2021-09-03 苏州天准科技股份有限公司 智能巡检导航避障系统、方法、存储介质和巡检车
CN113386141A (zh) * 2021-07-05 2021-09-14 上海高仙自动化科技发展有限公司 机器人控制方法、装置、设备及存储介质
CN113934205A (zh) * 2020-06-29 2022-01-14 百度(美国)有限责任公司 用于控制引导机器人的方法、装置、设备以及存储介质
WO2022017295A1 (zh) * 2020-07-20 2022-01-27 炬星科技(深圳)有限公司 一种避障规划方法、系统及设备
WO2022027911A1 (zh) * 2020-08-05 2022-02-10 深圳市优必选科技股份有限公司 机器人导航方法、装置、终端设备及存储介质
CN114089775A (zh) * 2022-01-20 2022-02-25 杭州蓝芯科技有限公司 移动机器人的停障控制方法与装置
CN114153216A (zh) * 2021-12-14 2022-03-08 浙江大学湖州研究院 基于深度强化学习和块规划的月面路径规划系统和方法
CN114326462A (zh) * 2021-11-16 2022-04-12 深圳市普渡科技有限公司 机器人系统、方法、计算机设备及存储介质
CN114371713A (zh) * 2022-01-12 2022-04-19 深圳鹏行智能研究有限公司 足式机器人的路径规划方法、电子设备及存储介质
CN114491299A (zh) * 2021-12-21 2022-05-13 重庆特斯联智慧科技股份有限公司 一种基于专家模型的行进策略判断方法和装置
CN114712181A (zh) * 2022-05-07 2022-07-08 河海大学 一种基于视觉slam的盲人避障导航系统
CN114740849A (zh) * 2022-04-07 2022-07-12 哈尔滨工业大学(深圳) 基于行人步行决策规则的移动机器人自主导航方法及装置
CN114879701A (zh) * 2022-06-23 2022-08-09 池州市安安新材科技有限公司 一种机器人轨道避障方法及系统
WO2023082492A1 (zh) * 2021-11-09 2023-05-19 中国民航大学 一种航站楼载人机器人路径拓展通行方法
CN117232531A (zh) * 2023-11-14 2023-12-15 长沙小钴科技有限公司 机器人导航规划方法及存储介质和终端设备
WO2024098438A1 (zh) * 2022-04-28 2024-05-16 西安交通大学 多智能体超视距网联协同感知动态决策方法及相关装置
CN112506203B (zh) * 2020-12-14 2024-05-28 深圳市普渡科技有限公司 一种机器人运动动态反馈方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105182979A (zh) * 2015-09-23 2015-12-23 上海物景智能科技有限公司 一种移动机器人障碍物检测及避让方法和系统
CN106406320A (zh) * 2016-11-29 2017-02-15 重庆重智机器人研究院有限公司 机器人路径规划方法及规划路线的机器人
CN106774347A (zh) * 2017-02-24 2017-05-31 安科智慧城市技术(中国)有限公司 室内动态环境下的机器人路径规划方法、装置和机器人
CN106949893A (zh) * 2017-03-24 2017-07-14 华中科技大学 一种三维避障的室内机器人导航方法和系统
CN110162063A (zh) * 2019-06-12 2019-08-23 北京洛必德科技有限公司 一种用于机器人自动充电的路径规划方法和装置
US20190286145A1 (en) * 2018-03-14 2019-09-19 Omron Adept Technologies, Inc. Method and Apparatus for Dynamic Obstacle Avoidance by Mobile Robots
CN110285813A (zh) * 2019-07-01 2019-09-27 东南大学 一种室内移动机器人人机共融导航装置及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105182979A (zh) * 2015-09-23 2015-12-23 上海物景智能科技有限公司 一种移动机器人障碍物检测及避让方法和系统
CN106406320A (zh) * 2016-11-29 2017-02-15 重庆重智机器人研究院有限公司 机器人路径规划方法及规划路线的机器人
CN106774347A (zh) * 2017-02-24 2017-05-31 安科智慧城市技术(中国)有限公司 室内动态环境下的机器人路径规划方法、装置和机器人
CN106949893A (zh) * 2017-03-24 2017-07-14 华中科技大学 一种三维避障的室内机器人导航方法和系统
US20190286145A1 (en) * 2018-03-14 2019-09-19 Omron Adept Technologies, Inc. Method and Apparatus for Dynamic Obstacle Avoidance by Mobile Robots
CN110162063A (zh) * 2019-06-12 2019-08-23 北京洛必德科技有限公司 一种用于机器人自动充电的路径规划方法和装置
CN110285813A (zh) * 2019-07-01 2019-09-27 东南大学 一种室内移动机器人人机共融导航装置及方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111596668A (zh) * 2020-06-17 2020-08-28 苏州大学 基于逆向强化学习的移动机器人拟人化路径规划方法
CN113934205A (zh) * 2020-06-29 2022-01-14 百度(美国)有限责任公司 用于控制引导机器人的方法、装置、设备以及存储介质
WO2022017295A1 (zh) * 2020-07-20 2022-01-27 炬星科技(深圳)有限公司 一种避障规划方法、系统及设备
WO2022027911A1 (zh) * 2020-08-05 2022-02-10 深圳市优必选科技股份有限公司 机器人导航方法、装置、终端设备及存储介质
CN112254727A (zh) * 2020-09-23 2021-01-22 锐捷网络股份有限公司 基于teb的路径规划方法及装置
CN112254727B (zh) * 2020-09-23 2022-10-14 锐捷网络股份有限公司 基于teb的路径规划方法及装置
CN112348434A (zh) * 2020-10-29 2021-02-09 济南浪潮高新科技投资发展有限公司 一种云化小区外卖全自动配送的方案
CN112506203A (zh) * 2020-12-14 2021-03-16 深圳市普渡科技有限公司 一种机器人运动动态反馈方法及系统
CN112506203B (zh) * 2020-12-14 2024-05-28 深圳市普渡科技有限公司 一种机器人运动动态反馈方法及系统
CN112859842A (zh) * 2020-12-31 2021-05-28 中山大学 一种路径跟随导航方法及其系统
CN112859842B (zh) * 2020-12-31 2022-06-14 中山大学 一种路径跟随导航方法及其系统
CN113341970A (zh) * 2021-06-01 2021-09-03 苏州天准科技股份有限公司 智能巡检导航避障系统、方法、存储介质和巡检车
CN113219988A (zh) * 2021-06-01 2021-08-06 苏州天准科技股份有限公司 避障路径智能规划方法、存储介质和无人巡检车
CN113219988B (zh) * 2021-06-01 2022-04-22 苏州天准科技股份有限公司 避障路径智能规划方法、存储介质和无人巡检车
CN113386141A (zh) * 2021-07-05 2021-09-14 上海高仙自动化科技发展有限公司 机器人控制方法、装置、设备及存储介质
WO2023082492A1 (zh) * 2021-11-09 2023-05-19 中国民航大学 一种航站楼载人机器人路径拓展通行方法
CN114326462A (zh) * 2021-11-16 2022-04-12 深圳市普渡科技有限公司 机器人系统、方法、计算机设备及存储介质
CN114153216A (zh) * 2021-12-14 2022-03-08 浙江大学湖州研究院 基于深度强化学习和块规划的月面路径规划系统和方法
CN114153216B (zh) * 2021-12-14 2023-10-03 浙江大学湖州研究院 基于深度强化学习和块规划的月面路径规划系统和方法
CN114491299A (zh) * 2021-12-21 2022-05-13 重庆特斯联智慧科技股份有限公司 一种基于专家模型的行进策略判断方法和装置
CN114491299B (zh) * 2021-12-21 2024-04-16 重庆特斯联智慧科技股份有限公司 一种基于专家模型的行进策略判断方法和装置
CN114371713A (zh) * 2022-01-12 2022-04-19 深圳鹏行智能研究有限公司 足式机器人的路径规划方法、电子设备及存储介质
CN114089775A (zh) * 2022-01-20 2022-02-25 杭州蓝芯科技有限公司 移动机器人的停障控制方法与装置
CN114740849A (zh) * 2022-04-07 2022-07-12 哈尔滨工业大学(深圳) 基于行人步行决策规则的移动机器人自主导航方法及装置
CN114740849B (zh) * 2022-04-07 2023-07-04 哈尔滨工业大学(深圳) 基于行人步行决策规则的移动机器人自主导航方法及装置
WO2024098438A1 (zh) * 2022-04-28 2024-05-16 西安交通大学 多智能体超视距网联协同感知动态决策方法及相关装置
CN114712181B (zh) * 2022-05-07 2023-04-07 河海大学 一种基于视觉slam的盲人避障导航系统
CN114712181A (zh) * 2022-05-07 2022-07-08 河海大学 一种基于视觉slam的盲人避障导航系统
CN114879701A (zh) * 2022-06-23 2022-08-09 池州市安安新材科技有限公司 一种机器人轨道避障方法及系统
CN117232531A (zh) * 2023-11-14 2023-12-15 长沙小钴科技有限公司 机器人导航规划方法及存储介质和终端设备
CN117232531B (zh) * 2023-11-14 2024-01-30 长沙小钴科技有限公司 机器人导航规划方法及存储介质和终端设备

Also Published As

Publication number Publication date
CN110955242B (zh) 2023-04-14

Similar Documents

Publication Publication Date Title
CN110955242B (zh) 机器人导航方法、系统、机器人及存储介质
CN110955241B (zh) 移动机器人避障方法、装置、移动机器人及存储介质
CN113805572B (zh) 运动规划的方法与装置
Wang et al. Formulation of deep reinforcement learning architecture toward autonomous driving for on-ramp merge
CN108645411B (zh) 基于粒子群算法的机器人路径规划方法、装置及终端设备
Jesus et al. Deep deterministic policy gradient for navigation of mobile robots in simulated environments
WO2022007179A1 (zh) 一种多agv运动规划方法、装置和系统
US11474529B2 (en) System and method for motion planning of an autonomous driving machine
US11740620B2 (en) Operational testing of autonomous vehicles
Wang et al. Autonomous ramp merge maneuver based on reinforcement learning with continuous action space
González et al. High-speed highway scene prediction based on driver models learned from demonstrations
US20120095740A1 (en) Simulation device, simulation method, and recording medium storing simulation program
CN111288995B (zh) 移动机器人的路径规划方法、路径规划装置及终端设备
Johnson et al. Experimental Evaluation and Formal Analysis of High‐Level Tasks with Dynamic Obstacle Anticipation on a Full‐Sized Autonomous Vehicle
Mirus et al. An investigation of vehicle behavior prediction using a vector power representation to encode spatial positions of multiple objects and neural networks
Chaudhuri et al. A comparative study of algorithms for intelligent traffic signal control
Jamshidi et al. Autonomous driving systems: Developing an approach based on a* and double q-learning
Calvo et al. Waves in isotropic totalistic cellular automata: Application to real-time robot navigation
Banerjee et al. A survey on physics informed reinforcement learning: Review and open problems
Luders et al. Probabilistically safe avoidance of dynamic obstacles with uncertain motion patterns
JP7297842B2 (ja) リスク尺度を示すパラメータに基づいて訓練されたモデルを使用して、与えられた状況に対するデバイスの行動を決定する方法およびシステム
WO2023014733A2 (en) System and methods of adaptive trajectory prediction for autonomous driving
CN113052252B (zh) 超参数确定方法、装置、深度强化学习框架、介质及设备
WO2021258847A1 (zh) 一种驾驶决策方法、装置及芯片
Youssef et al. Deep reinforcement learning with external control: Self-driving car application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant