CN108363393B - 一种智能运动设备及其导航方法和存储介质 - Google Patents

一种智能运动设备及其导航方法和存储介质 Download PDF

Info

Publication number
CN108363393B
CN108363393B CN201810114185.7A CN201810114185A CN108363393B CN 108363393 B CN108363393 B CN 108363393B CN 201810114185 A CN201810114185 A CN 201810114185A CN 108363393 B CN108363393 B CN 108363393B
Authority
CN
China
Prior art keywords
navigation
smart motion
motion equipment
information
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810114185.7A
Other languages
English (en)
Other versions
CN108363393A (zh
Inventor
周巍
吴伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810114185.7A priority Critical patent/CN108363393B/zh
Publication of CN108363393A publication Critical patent/CN108363393A/zh
Priority to PCT/CN2019/073876 priority patent/WO2019149214A1/zh
Priority to EP19746962.0A priority patent/EP3751376B1/en
Application granted granted Critical
Publication of CN108363393B publication Critical patent/CN108363393B/zh
Priority to US16/874,854 priority patent/US11247701B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0238Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using obstacle or wall sensors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/09Taking automatic action to avoid collision, e.g. braking and steering
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3453Special cost functions, i.e. other than distance or default speed limit of road segments
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0227Control of position or course in two dimensions specially adapted to land vehicles using mechanical sensing means, e.g. for sensing treated area
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0268Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
    • G05D1/0274Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means using mapping information stored in a memory device
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2420/00Indexing codes relating to the type of sensors based on the principle of their operation
    • B60W2420/40Photo or light sensitive means, e.g. infrared sensors
    • B60W2420/403Image sensing, e.g. optical camera
    • B60W2420/408
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/206Instruments for performing navigational calculations specially adapted for indoor navigation

Abstract

本发明实施例公开了智能运动设备及其导航方法和存储介质,应用于信息处理技术领域。在本实施例的方法中,智能运动设备会根据预置的导航计算函数确定导航策略,在根据导航策略运动时,当获取到智能运动设备的碰撞指示信息时,会根据碰撞指示信息调整导航计算函数。这样,当智能运动设备根据预置的导航计算函数确定的导航策略运动的过程中,可以根据智能运动设备发生碰撞的情况,不断地调整导航计算函数,最终使得通过调整后的导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。且本发明实施例的方法可以适用于具有任意导航计算函数的智能运动设备,且适用于智能运动设备在任意环境下的运动。

Description

一种智能运动设备及其导航方法和存储介质
技术领域
本发明涉及信息处理技术领域,特别涉及一种智能运动设备及其导航方法和存储介质。
背景技术
智能运动设备是根据预设的导航方法,在各种环境中执行向前,向后或旋转等运动的设备,比如机器人或无人车等,现有智能运动设备的导航方法主要包括:
获取智能运动设备所在环境的可行区域,且对智能运动设备的速度进行周期采样,得到一系列采样速度;然后模拟智能运动设备在一系列采样速度下,一定时间内的轨迹,并选取智能运动设备不发生碰撞的最佳轨迹对应速度,以驱动智能运动设备运动。现有的导航方法主要先对智能运动设备所在环境进行建模即获取可行区域,并且对智能运动设备进行建模,一旦模型建立好,在一定环境下,智能运动设备的运动是固定的。
但是实际上的智能运动设备的运动时并不理想化,智能运动设备的负载、元件老化、或电机散热等自身情况,及智能运动设备所在物理环境的干扰,比如地面材质造成的地面摩擦力或打滑等,都会造成智能运动设备在基于现有导航方法运动时的不确定性。最终使得智能运动设备在已建模的特定环境下运动时,还是会发生碰撞。
发明内容
本发明实施例提供一种智能运动设备及其导航方法和存储介质,实现了根据智能运动设备在运动时获取的碰撞指示信息调整导航策略。
本发明实施例第一方面提供一种智能运动设备的导航方法,包括:
根据预置的导航计算函数确定智能运动设备的导航策略;
在所述智能运动设备根据所述导航策略运动时,获取到所述智能运动设备的碰撞指示信息;
根据所述碰撞指示信息调整所述导航计算函数,以便所述智能运动设备根据所述调整后的导航计算函数确定导航策略。
本发明实施例第二方面提供一种智能运动设备,包括:
导航确定单元,用于根据预置的导航计算函数确定智能运动设备的导航策略;
指示获取单元,用于在所述智能运动设备根据所述导航策略运动时,获取到所述智能运动设备的碰撞指示信息;
调整单元,用于根据所述碰撞指示信息调整所述导航计算函数,以便所述智能运动设备根据所述调整后的导航计算函数确定导航策略。
本发明实施例第三方面提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如本发明实施例第一方面所述的智能运动设备的导航方法。
本发明实施例第四方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如本发明实施例第一方面所述的智能运动设备的导航方法。
可见,在本实施例的方法中,智能运动设备会根据预置的导航计算函数确定导航策略,在根据导航策略运动时,当获取到智能运动设备的碰撞指示信息时,会根据碰撞指示信息调整导航计算函数。这样,当智能运动设备根据预置的导航计算函数确定的导航策略运动的过程中,可以根据智能运动设备发生碰撞的情况,不断地调整导航计算函数,最终使得通过调整后的导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。且本发明实施例的方法可以适用于具有任意导航计算函数的智能运动设备,且适用于智能运动设备在任意环境下的运动。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种智能运动设备的导航方法的流程图;
图2是本发明应用实施例提供的机器人的导航方法的示意图;
图3是本发明实施例提供的一种智能运动设备的结构示意图;
图4是本发明实施例提供的另一种智能运动设备的结构示意图;
图5是本发明实施例提供的一种终端设备的逻辑结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种智能运动设备的导航方法,主要用于对智能运动设备的向前,向后,或旋转的运动进行导航,而智能运动设备可以是机器人或无人车等设备,具体地,智能运动设备可以通过如下方法实现导航:
根据预置的导航计算函数确定智能运动设备的导航策略;在智能运动设备根据导航策略运动时,获取到智能运动设备的碰撞指示信息;根据碰撞指示信息调整导航计算函数,以便智能运动设备根据调整后的导航计算函数确定导航策略。
这样,当智能运动设备根据预置的导航计算函数确定的导航策略运动的过程中,可以根据智能运动设备发生碰撞的情况,不断地调整导航计算函数,最终使得通过调整后的导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。本发明实施例的方法可以适用于具有任意导航计算函数的智能运动设备,且适用于智能运动设备在任意环境下的运动。
本发明实施例提供一种智能运动设备的导航方法,主要是由智能运动设备所执行的方法,流程图如图1所示,包括:
步骤101,根据预置的导航计算函数确定智能运动设备的导航策略。
可以理解,智能运动设备可以按照一定的周期发起本实施例的流程,具体地,智能运动设备可以按照一定的周期获取智能运动设备所在环境的环境信息,并根据获取到的环境信息及预置的导航计算函数确定智能运动设备的导航策略。
其中,环境信息主要用于表示与智能运动设备之间的距离在预置范围的环境中各个位置是否有障碍物占用,其中,环境中的障碍物可以分为固定障碍物和变动障碍物,固定障碍物是固定不变的实物,具体可以通过智能运动设备中包括的定位装置定位到智能运动设备的当前位置,并结合当前位置的地图数据库得到;而变动障碍物是临时增加的实物或运动的物体(比如行人或行驶的车等),具体是由智能运动设备中包括的视觉传感器或激光传感器扫描得到。
这里,视觉传感器或激光传感器一般会按照一定的频率扫描,得到与该智能运动设备之间的距离在一定范围内的环境中,各个位置的位置信息(比如环境坐标信息)及是否有障碍物的信息。
环境信息具体可以包括环境坐标信息与障碍物占用信息的对应关系,在实际应用过程中,该对应关系一般用代价数组来表示,在代价数组中包括多个元素值,这些元素值主要是用0到2之间的值,其中,0表示对应位置无障碍物,1表示对应位置有障碍物占用,2表示对应位置为未知空间,即还未获取到对应位置的障碍物情况,不清楚对应位置是否有障碍物占用;在代价数组中各个元素的位置信息即可以对应地表示环境中一个位置的环境坐标信息。这样,代价数组中任一位置的元素值,可以指示智能运动设备所在环境中的某一位置处是否有障碍物占用。
例如,某一代价数组可以用n*n的矩阵表示,比如可以为代价数组中(1,5)表示位置处的元素值为1,表示当前环境中(1,5)表示位置处有障碍物占用,其中,代价数组中(1,5)表示代价数组中第一行第五列的位置;(1,1)表示位置处的元素值为0,表示当前环境中(1,1)表示位置处无障碍物;(4,5)表示位置处的元素值为2,表示还未获取当前环境中(4,5)表示位置处是否占用障碍物的信息。
上述导航策略可以根据实际应用的不同而不同,比如智能运动设备是比较简单的机器人,智能运动设备的运动只需要由智能运动设备的内部处理器直接驱动,则导航策略主要可以包括前进、左前、右前、原地左转、原地右转、后退、左后或右后等导航方向的信息,而智能运动设备直行的具体速度值和旋转的具体速度值是固定不变的,可以事先预置到智能运动设备中。
在其它情况下,如果智能运动设备是比较复杂的无人车,这种情况下,智能运动设备的运动需要该智能运动设备中包括的多个部件的配合操作来驱动,则确定的导航策略中主要可以包括油门操作,刹车操作,方向盘左转或方向盘右转等对智能运动设备进行导航驱动的信息。
另外,上述预置的导航计算函数具体可以是事先预置在智能运动设备中的,具体可以包括但不限于如下两种方式:
(1)预置的导航计算函数包括:将代价数组(表示上述环境信息)与权重信息的乘积作为导航策略指示值。
这里导航策略指示值是用于指示导航方向的信息,或用于指示对智能运动设备进行导航驱动的信息,例如,导航策略指示值可以是具有8个元素的一维数组,分别用于指示是否前进、左前、右前、原地左转、原地右转、后退、左后和右后的信息,比如[0,1,0,0,0,0,0,0]可以指示左前的信息。
权重信息中可以包括多个权重值,权重值的个数与代价数组的维度等有关,例如代价数组为n*n的矩阵1,则权重信息可以为n*1的矩阵2,而矩阵2中每个元素则为一个权重值。
这样智能运行设备在执行本步骤时,可以先根据获取的环境信息(具体通过上述代价数组表示)及预置的导航计算函数计算得到导航策略指示值,然后再根据导航策略指示值确定智能运动设备的导航策略。
(2)预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,其中,第一长期期望为智能运动设备在当前环境信息s1下执行某一种导航策略ci的长期期望,可以记为Qci(s1);当前奖励信息用于表示智能运动设备在当前环境信息s1下执行某一种导航策略ci后产生的反馈,记为Rci|s1;第二长期期望为智能运动设备在估计环境信息s2下执行某一种导航策略ci的长期期望,可以记为Qci(s)。则预置的导航计算函数可以包括如下公式1:
Qci(s1)=Rci|s1+r*Qci(s) (1)
其中,当前环境信息s1是指智能运动设备在当前发起导航策略的计算周期(即当前计算周期)内,获取的环境信息;估计环境信息s是指智能运动设备估计的后续至少一个计算周期内(即确定导航策略的计算周期)的环境信息,具体可以根据计算周期的时长及某一种导航策略估计得到,可以是估计的当前计算周期之后的一个计算周期,或是多个计算周期的环境信息;第二长期期望的加权值为第二长期期望与对应权重值r的乘积,该权重值r可以是0到1之间的衰减系数。
上述公式1中的Rci|s1(即当前奖励信息)是指在ci|s1情况下的R值,具体是从预置的反馈模型中得到,反馈模型中包括在任一种环境信息下执行任一种导航策略的R值(即奖励信息),在初始根据公式1确定导航策略时,可以随机选定R值。R值具体可以根据智能运动设备所包括的传感器得到,如果智能运动设备通过碰撞传感器检测到与障碍物发生碰撞,则R可以为-2,如果通过激光传感器或视觉传感器检测到靠近障碍物(即智能运动设备朝某障碍物运动,且与该障碍物之间的距离小于某一值)时,则R可以为-1,检测到远离障碍物时(即智能运动设备背向某障碍物运动,且与该障碍物之间的距离大于某一值),R可以为2。
这样智能运行设备在执行本步骤时,可以先根据上述获取的环境信息及预置的导航计算函数,计算基于多种导航策略分别对应的多个第一长期期望值;并选取多个第一长期期望值中的最大值,且将选取的最大值对应的导航策略确定为智能运动设备的导航策略。
其中,一种导航策略是指某一种导航方向,比如前进、左前、右前、原地左转、原地右转、后退、左后或右后的信息;或者,一种导航策略是指使得智能运动设备朝某一方向运动的对智能运动设备进行导航驱动的信息。
步骤102,在智能运动设备根据步骤101确定的导航策略运动时,获取到智能运动设备的碰撞指示信息,该碰撞指示信息用于指示智能运动设备是否与环境中某一障碍物发生碰撞。
在智能运动设备中可以包括碰撞传感器,碰撞传感器包括内接触点和外接触点,内接触点设置在智能运动设备的底部,外接触点设置在智能运动设备底部的一层胶条上,该胶条具有弹性。当智能运动设备未与任何障碍物发生碰撞时,内接触点和外接触点不接触,则碰撞传感器感应到的信号一般为负值;而当智能运动设备与某一障碍物发生碰撞时,智能运动设备底部的胶条发生变形,使得内接触点和外接触点接触,这样碰撞传感器感应到的信号变为正值;当智能运动设备的碰撞解除后,智能运动设备底部的胶条的形变恢复,使得内接触点和外接触点不接触,这时碰撞传感器感应到的信号为负值。
由于智能运动设备的负载或老化等自身问题,或所在物理环境的干扰,智能运动设备在根据上述步骤101确定的导航策略运动时,可能会发生碰撞,这样,当智能运动设备中的碰撞传感器感应到的信号为正值,则智能运动设备获取到的碰撞指示信息用于指示智能运动设备发生碰撞;当智能运动设备中的碰撞传感器感应到的信号为负值,则智能运动设备获取到的碰撞指示信息用于指示智能运动设备未发生碰撞。
步骤103,根据步骤102中得到的碰撞指示信息调整导航计算函数,以便智能运动设备根据调整后的导航计算函数确定导航策略。
具体地,智能运动设备在执行本步骤的调整时,可以包括但不限于如下两种方式:
(1)在导航计算函数包括代价数组(用于表示上述环境信息)与相应的权重信息的乘积的情况下。
当碰撞指示信息指示智能运动设备未发生碰撞,则增加导航计算函数包括的权重信息中的至少一个权重值;当碰撞指示信息指示智能运动设备发生碰撞,降低权重信息中的至少一个权重值。这里至少一个权重值为决定上述步骤101确定的导航策略的权重值,而对某一权重值增加或降低的值可以预先设置在智能运动设备中,比如增加或降低0.1。
例如,在导航计算函数中,代价数组为3*3的矩阵1,即权重信息为3*1的矩阵2,即则导航策略指示值具体为矩阵1与矩阵2的乘积,具体为矩阵3,即[0,0,1],导航策略指示值中的每个元素分别用于指示是否前进,后退或左转的信息,则智能运动设备根据矩阵3确定的导航策略为:左转,而在权重信息中决定该导航策略“左转”的权重值为矩阵2中第三行第一列的权重值“1”。因此,如果上述碰撞指示信息指示智能运动设备发生碰撞,则会降低矩阵2中第三行第一列的权重值“1”。
(2)导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值的情况下。
在这种情况下,如果智能运动设备在上述步骤102中获取到的碰撞指示信息为发生碰撞,可以调整反馈模型中当前奖励信息,其中反馈模型中包括任一种环境信息下执行任一种导航策略的奖励信息。具体地,如果反馈模型中的当前奖励信息,与碰撞指示信息所指示的信息不一致,则调整反馈模型中的当前奖励信息与碰撞指示信息所指示的信息一致;如果一致,则保持反馈模型中的当前奖励信息不变。
例如,反馈模型中的当前奖励信息即R值为-1,表示智能运动设备靠近障碍物,而碰撞指示信息指示发生碰撞,则不一致,需要修改反馈模型中的当前奖励信息为-2,表示智能运动设备发生碰撞。
如果智能运动设备在上述步骤102中获取到的碰撞指示信息为未发生碰撞,则智能运动设备还需要根据其包括的激光传感器或视觉传感器获取的是否远离障碍物的第一指示信息,或是否靠近障碍物的第二指示信息等,调整所述反馈模型中的当前奖励信息。具体地,如果反馈模型中的当前奖励信息,与第一指示信息或第二指示信息所指示的信息不一致,则调整反馈模型中的当前奖励信息与第一指示信息(或第二指示信息)所指示的信息一致;如果一致,则保持反馈模型中的当前奖励信息不变。
如果导航计算函数是其它函数,则智能运动设备可以调整导航计算函数中固定参数的参数值。这里固定参数的参数值是指在根据导航计算函数确定导航策略的计算过程中所用到的不需要随时赋值的参数,比如权重,角度等参数。
需要说明的是,上述步骤101到103是智能运动设备对导航计算函数的一次调整过程,在实际应用中,需要按照上述步骤101到103的方法对导航计算函数进行多次调整,使得最终得到的导航计算函数为最佳导航计算函数。而智能运动设备在根据最佳导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。
在一个具体的应用中,智能运动设备在执行了上述步骤103后,还可以判断对导航计算函数的调整是否满足预置的停止条件,如果满足,则停止对导航计算函数的调整;如果不满足,还需要在下一次根据导航计算函数确定了导航策略后,根据碰撞指示信息再次调整导航计算函数。
其中预置的停止条件可以包括但不限于如下条件:对导航计算函数的调整次数达到预置的次数,及智能运动设备到达导航终点等。可以理解,智能运动设备在发起本实施例的流程时,可以随机选取导航起点和导航终点,或者可以提供选择导航起点和导航终点的用户界面,以供用户选择,这样智能运动设备可以根据是否到达导航终点的信息,来决定是否要停止调整导航计算函数。
可见,在本实施例的方法中,智能运动设备会根据预置的导航计算函数确定导航策略,在根据导航策略运动时,当获取到智能运动设备的碰撞指示信息时,会根据碰撞指示信息调整导航计算函数。这样,当智能运动设备根据预置的导航计算函数确定的导航策略运动的过程中,可以根据智能运动设备发生碰撞的情况,不断地调整导航计算函数,最终使得通过调整后的导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。且本发明实施例的方法可以适用于具有任意导航计算函数的智能运动设备,且适用于智能运动设备在任意环境下的运动。
需要说明的是,上述实施例中步骤101到103的方法是主要根据智能运动设备在运动过程中获取的碰撞指示信息来调整导航计算函数,这种调整方法比较简单。而在其它具体实施例中,为了对导航计算函数的调整更精确,智能运动设备还可以通过碰撞指示信息结合其它参数来调整导航计算函数,在一种情况下,智能运动设备在执行上述步骤103之前,如果碰撞指示信息指示智能运动设备发生碰撞,还可以获取智能运动设备发生碰撞的位置信息,该位置信息可以通过智能运动设备中包括的视觉传感器或激光传感器扫描得到。
这样,智能运动设备在执行上述步骤103中的调整步骤时,会根据该位置信息和碰撞指示信息调整导航计算函数,具体地:
如果上述步骤101中获取的环境信息中,该位置信息对应位置处未有障碍物占用,而碰撞指示信息又指示智能运动设备发生碰撞,这样产生不一致,可能是智能运动设备在获取环境信息后,在该环境中的对应位置处临时增加障碍物,或有移动的物体(比如行人或行驶的车辆等)。这样,智能运动设备在确定导航策略时,没有考虑到该位置处的障碍物,从而使得智能运动设备在根据导航策略运动时发生碰撞,而并不是由于导航计算函数的不精确而确定的导航策略不准确。因此,在这种情况下,智能运动设备不会调整导航计算函数,而是保持导航计算函数不变。
需要说明的是,智能运动设备还可以通过采集的基于该智能运动设备的其它参数来调整导航计算函数,在这里不进行一一举例说明。
以下以一个具体的应用实例来说明本发明实施例中智能运动设备的导航方法,在本实施例中,智能运动设备具体为机器人,该机器人包括各种传感器,即视觉传感器,激光传感器和碰撞传感器等,智能运动设备确定的导航策略具体为导航方向的信息,则如图2所示,机器人的导航方法包括:
步骤201,机器人通过视觉传感器或激光传感器按照一定的周期,扫描与该机器人之间的距离在预置范围内的环境中的环境信息,具体可以包括该范围内各个位置的位置信息和是否有障碍物占用的信息。
步骤202,机器人会根据扫描得到的环境信息确定代价数组,并根据代价数组和预置的导航计算函数确定导航策略,具体为导航方向。
具体地,一种情况下,机器人可以先将代价数组与权重信息的乘积作为导航策略指示值,具体为导航方向指示值,其中权重信息包括多个权重值。然后机器人根据导航方向指示值确定对应的导航方向。具体可以为:前进、左前、右前、原地左转、原地右转、后退、左后或右后的信息。
另一种情况下,机器人可以先根据当前发起的导航流程中获取的环境信息(即上述步骤201获取的环境信息)所表示的代价数组,记为s1,估计后续连续4个计算周期机器人对应环境信息所表示的代价数组,分别记为s2,s3,s4和s5。
然后针对某一种导航策略ci,根据上述公式1所示的导航策略可以得知第一长期期望值为:Qci(s1)=Rci|s1+r*Qci(s2),而Qci(s2)=Rci|s2+r*Qci(s3),……,依次类推,可以得到如下公式2:
Qci(s1)=Rci|s1+r*Rci|s2+r*r*Rci|s3+r*r*r*Rci|s4+r*r*r*r*Rc1|s5+…(2)
其中,取:
Qci(s1)=Rci|s1+r*Rci|s2+r*r*Rci|s3+r*r*r*Rci|s4+r*r*r*r*Rc1|s5得到某一种导航策略ci对应的第一长期期望值,这样,按照公式2,可以针对多种导航策略c1,c2,……,ck,分别得到对应的第一长期期望值为Qc1(s1),Qc2(s1),……,Qck(s1);最后再选取这些第一长其期望值中的最大值对应的导航策略为机器人的导航策略。
步骤203,机器人根据确定的导航方向驱动机器人的运动。
步骤204,在机器人运动的过程中,根据机器人通过碰撞传感器获取到碰撞指示信息。
步骤205,机器人根据碰撞指示信息调整导航计算函数。
具体地,如果预置的导航计算函数包括将代价数组与权重信息的乘积作为导航策略指示值,则当碰撞指示信息指示机器人未发生碰撞,增加上述导航计算函数的权重信息中的至少一个权重值,当碰撞指示信息指示机器人发生碰撞,降低权重信息中的至少一个权重值。其中,至少一个权重值为决定上述步骤202确定的导航方向的权重值。
如果导航计算函数包括第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,则如果碰撞指示信息指示机器人发生碰撞,调整反馈模型中的当前奖励信息,反馈模型中包括任一种环境信息下执行任一种导航策略的奖励信息;如果碰撞指示信息指示机器人未发生碰撞,根据机器人获取到的是否远离障碍物的第一指示信息,或是否靠近障碍物的第二指示信息,调整反馈模型中的当前奖励信息。
在调整导航计算函数后,如果机器人在下一周期再次扫描到机器人所在环境的环境信息,则机器人会基于调整后的导航计算函数执行如上步骤202到205。这样,可以重复执行上述步骤201到203,从而得到一个最佳导航计算函数。
本发明实施例还提供一种智能运动设备,比如机器人等,其结构示意图如图3所示,具体可以包括:
导航确定单元10,用于根据预置的导航计算函数确定智能运动设备的导航策略。这里,导航策略可以为导航方向的信息,和/或对所述智能运动设备进行导航驱动的信息等。
具体地,导航确定单元10,用于获取所述智能运动设备所在环境的环境信息,所述环境信息用于表示与所述智能运动设备之间的距离在预置范围内的环境中各个位置是否有障碍物占用;根据所述环境信息及预置的导航计算函数,确定所述智能运动设备的导航策略。
如果所述环境信息可以用代价数组表示,所述代价数组包括多个元素值,且代价数组中任一位置的元素值,用于指示所述智能运动设备所在环境中某一位置处是否有障碍物占用。
一种情况下,预置的导航计算函数具体包括:将所述代价数组与权重信息的乘积作为导航策略指示值,所述权重信息中包括多个权重值,这里,权重信息中包括多个权重值。则所述导航确定单元10在确定导航策略时,具体用于根据所述环境信息及导航计算函数计算导航策略指示值,并根据所述导航策略指示值确定对应的导航策略。
另一种情况下,预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,其中,所述第一长期期望为所述智能运动设备在当前环境信息下执行某一导航策略的长期期望,所述当前奖励信息用于表示所述智能运动设备在所述当前环境信息下执行某一导航策略的反馈,所述第二长期期望为所述智能运动设备在估计环境信息下执行某一导航执行策略的长期期望。则所述导航确定单元10在确定导航策略时,具体用于根据所述环境信息及预置的导航计算函数,计算基于多种导航策略分别对应的多个第一长期期望值;选取所述多个第一长期期望值中的最大值,并将所述最大值对应的导航策略确定为所述智能运动设备的导航策略。
指示获取单元11,用于在所述智能运动设备根据所述导航确定单元10确定的导航策略运动时,获取到所述智能运动设备的碰撞指示信息;
调整单元12,用于根据所述指示获取单元11获取的碰撞指示信息调整所述导航计算函数,以便所述智能运动设备根据所述调整后的导航计算函数确定导航策略。
一种情况下,预置的导航计算函数具体包括:将所述代价数组与权重信息的乘积作为导航策略指示值。则所述调整单元12,具体用于如果所述碰撞指示信息指示所述智能运动设备未发生碰撞,增加所述权重信息中的至少一个权重值;如果所述碰撞指示信息指示所述智能运动设备发生碰撞,降低所述至少一个权重值。这里至少一个权重值为决定上述导航确定单元10确定的导航策略的权重值。
另一种情况下,预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值。则调整单元12,具体用于如果所述碰撞指示信息指示所述智能运动设备发生碰撞,调整反馈模型中的所述当前奖励信息;所述反馈模型中包括任一种环境信息下执行任一种导航策略的奖励信息;如果所述碰撞指示信息指示所述智能运动设备未发生碰撞,根据所述智能运动设备获取到的是否远离障碍物的第一指示信息,或是否靠近障碍物的第二指示信息,调整所述反馈模型中的当前奖励信息。
可见,在本实施例的智能运动设备中,导航确定单元10会根据预置的导航计算函数确定导航策略,在根据导航策略运动时,当指示获取单元11获取到智能运动设备的碰撞指示信息时,调整单元12会根据碰撞指示信息调整导航计算函数。这样,当智能运动设备根据预置的导航计算函数确定的导航策略运动的过程中,可以根据智能运动设备发生碰撞的情况,不断地调整导航计算函数,最终使得通过调整后的导航计算函数确定导航策略后,根据确定的导航策略运动时,不会发生碰撞或很少发生碰撞。
参考图4所示,在一个具体的实施例中,智能运动设备除了可以包括如图3所示的结构外,还可以包括位置获取单元13和调整判断单元14,其中:
位置获取单元13,用于如果所述碰撞指示信息指示所述智能运动设备发生碰撞,获取所述智能运动设备发生碰撞的位置信息;则所述调整单元12,具体用于根据所述位置信息和所述碰撞指示信息调整所述导航计算函数,具体地,如果所述获取的环境信息中,所述位置信息对应位置处未有障碍物占用,保持所述导航计算函数不变。
调整判断单元14,用于判断对所述导航计算函数的调整是否满足如下条件,如果满足,通知所述调整单元12停止对所述导航计算函数进行调整:对所述导航计算函数的调整次数达到预置的次数,及所述智能运动设备到达导航终点等。
本发明实施例还提供一种终端设备,其逻辑结构示意图如图5所示,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括智能运动设备的导航应用程序,且该程序可以包括上述智能运动设备中的导航确定单元10,指示获取单元11、调整单元12、位置获取单元13和调整判断单元14,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中储存的智能运动设备的导航应用程序对应的一系列操作。
终端设备还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作系统223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由智能运动设备所执行的步骤可以基于该图5所示的终端设备的结构。
进一步地,如果该终端设备应用于智能运动设备,则该终端设备还可以包括转动轮26,图5中所示的只是一个逻辑结构示意图,实际转动轮26的形状一般为圆形,且设置在终端设备的底部,该转动轮26可以与中央处理器20通信连接,中央处理器20可以驱动转动轮26转动,并带动终端设备执行上述任一种导航策略。
该终端设备还会包括各种传感器27,比如视觉传感器271,激光传感器272和碰撞传感器273等,其中视觉传感器271一般设置在终端设备的顶部,激光传感器272会设置在终端设备的底部,该视觉传感器271和激光传感器272,都用于获取与所述终端设备之间的距离在预置范围内的环境中的环境信息,并传输给所述存储介质22进行储存。
碰撞传感器273一般是设置在终端设备底部的一个胶条上,该胶条具有弹性,用于获取所述终端设备的碰撞指示信息,并传输给所述处理器20。
需要说明的是,上述终端设备的结构是比较简单的应用,比如为简单的机器人,如果该终端设备应用于较复杂的无人车,则该终端设备还会包括导航驱动装置,比如油门,刹车和方向盘等,分别都与处理器20连接。
本发明实施例还提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述智能运动设备所执行的智能运动设备的导航方法。
本发明实施例还提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述智能运动设备所执行的智能运动设备的导航方法。
进一步地,终端设备还包括碰撞传感器;所述碰撞传感器,用于获取所述终端设备的碰撞指示信息,并传输给所述处理器。
且还会包括激光传感器,所述激光传感器,用于获取与所述终端设备在预置范围内的环境中的环境信息,并传输给所述存储介质进行储存。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。
以上对本发明实施例所提供的智能运动设备及其导航方法和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种智能运动设备的导航方法,其特征在于,包括:
根据预置的导航计算函数确定智能运动设备的导航策略;
在所述智能运动设备根据所述导航策略运动时,获取到所述智能运动设备的碰撞指示信息;所述碰撞指示信息用于指示智能运动设备是否与环境中某一障碍物发生碰撞,根据所述智能运动设备中碰撞传感器感应到的信号获取到;
根据所述碰撞指示信息调整所述导航计算函数,以便所述智能运动设备根据所述调整后的导航计算函数确定导航策略;
所述预置的导航计算函数,具体包括:将代价数组与权重信息的乘积作为导航策略指示值,所述权重信息中包括多个权重值,所述代价数组用于表示所述智能运动设备所在环境的环境信息;
或者,所述预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,其中,所述第一长期期望为所述智能运动设备在当前环境信息下执行某一导航策略的长期期望,所述当前奖励信息用于表示所述智能运动设备在所述当前环境信息下执行某一导航策略的反馈,所述第二长期期望为所述智能运动设备在估计环境信息下执行某一导航策略的长期期望。
2.如权利要求1所述的方法,其特征在于,所述根据预置的导航计算函数确定智能运动设备的导航策略,具体包括:
获取所述智能运动设备所在环境的环境信息,所述环境信息用于表示与所述智能运动设备之间的距离在预置范围内的环境中各个位置是否有障碍物占用;
根据所述环境信息及预置的导航计算函数,确定所述智能运动设备的导航策略。
3.如权利要求2所述的方法,其特征在于,所述环境信息用代价数组表示,所述代价数组中包括多个元素值,且代价数组中任一位置的元素值,用于指示所述智能运动设备所在环境中某一位置处是否有障碍物占用。
4.如权利要求3所述的方法,其特征在于,
如果所述预置的导航计算函数,具体包括:将所述代价数组与权重信息的乘积作为导航策略指示值,所述权重信息中包括多个权重值;
所述根据所述环境信息及预置的导航计算函数,确定所述智能运动设备的导航策略,具体包括:根据所述环境信息及导航计算函数计算导航策略指示值,并根据所述导航策略指示值确定对应的导航策略;
所述根据所述碰撞指示信息调整所述导航计算函数,具体包括:如果所述碰撞指示信息指示所述智能运动设备未发生碰撞,增加所述权重信息中的至少一个权重值;如果所述碰撞指示信息指示所述智能运动设备发生碰撞,降低所述权重信息中的至少一个权重值;
所述至少一个权重值为决定所述导航策略的权重值。
5.如权利要求2所述的方法,其特征在于,
如果所述预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,其中,所述第一长期期望为所述智能运动设备在当前环境信息下执行某一导航策略的长期期望,所述当前奖励信息用于表示所述智能运动设备在所述当前环境信息下执行某一导航策略的反馈,所述第二长期期望为所述智能运动设备在估计环境信息下执行某一导航策略的长期期望;
所述根据所述环境信息及预置的导航计算函数,确定所述智能运动设备的导航策略,具体包括:
根据所述环境信息及预置的导航计算函数,计算基于多种导航策略分别对应的多个第一长期期望值;
选取所述多个第一长期期望值中的最大值,并将所述最大值对应的导航策略确定为所述智能运动设备的导航策略。
6.如权利要求5所述的方法,其特征在于,所述根据所述碰撞指示信息调整所述导航计算函数,具体包括:
如果所述碰撞指示信息指示所述智能运动设备发生碰撞,调整反馈模型中的所述当前奖励信息;所述反馈模型中包括任一种环境信息下执行任一种导航策略的奖励信息;
如果所述碰撞指示信息指示所述智能运动设备未发生碰撞,根据所述智能运动设备获取到的是否远离障碍物的第一指示信息,或是否靠近障碍物的第二指示信息,调整所述反馈模型中的当前奖励信息。
7.如权利要求2至6任一项所述的方法,其特征在于,所述确定的导航策略为导航方向,和/或对所述智能运动设备进行导航驱动的信息。
8.如权利要求1至6任一项所述的方法,其特征在于,所述根据所述碰撞指示信息调整所述导航计算函数之前,所述方法还包括:
如果所述碰撞指示信息指示所述智能运动设备发生碰撞,获取所述智能运动设备发生碰撞的位置信息;
则所述根据所述碰撞指示信息调整所述导航计算函数,具体包括:根据所述位置信息和所述碰撞指示信息调整所述导航计算函数。
9.如权利要求8所述的方法,其特征在于,所述根据所述位置信息和所述碰撞指示信息调整所述导航计算函数,具体包括:
如果所述获取的环境信息中,所述位置信息对应位置处未有障碍物占用,保持所述导航计算函数不变。
10.如权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
如果对所述导航计算函数的调整满足如下条件时,停止对所述导航计算函数进行调整:对所述导航计算函数的调整次数达到预置的次数,所述智能运动设备到达导航终点。
11.一种智能运动设备,其特征在于,包括:
导航确定单元,用于根据预置的导航计算函数确定智能运动设备的导航策略;所述预置的导航计算函数,具体包括:将代价数组与权重信息的乘积作为导航策略指示值,所述权重信息中包括多个权重值,所述代价数组用于表示所述智能运动设备所在环境的环境信息;或者,所述预置的导航计算函数包括:第一长期期望为当前奖励信息与第二长期期望的加权值的相加值,其中,所述第一长期期望为所述智能运动设备在当前环境信息下执行某一导航策略的长期期望,所述当前奖励信息用于表示所述智能运动设备在所述当前环境信息下执行某一导航策略的反馈,所述第二长期期望为所述智能运动设备在估计环境信息下执行某一导航策略的长期期望;
指示获取单元,用于在所述智能运动设备根据所述导航策略运动时,获取到所述智能运动设备的碰撞指示信息;所述碰撞指示信息用于指示智能运动设备是否与环境中某一障碍物发生碰撞,根据所述智能运动设备中碰撞传感器感应到的信号获取到;
调整单元,用于根据所述碰撞指示信息调整所述导航计算函数,以便所述智能运动设备根据所述调整后的导航计算函数确定导航策略。
12.一种存储介质,其特征在于,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如权利要求1至10任一项所述的智能运动设备的导航方法。
13.一种终端设备,其特征在于,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如权利要求1至10任一项所述的智能运动设备的导航方法。
14.如权利要求13所述的终端设备,其特征在于,所述终端设备还包括碰撞传感器;
所述碰撞传感器,用于获取所述终端设备的碰撞指示信息,并传输给所述处理器。
15.如权利要求13或14所述的终端设备,其特征在于,所述终端设备还包括激光传感器,所述激光传感器,用于获取与所述终端设备之间的距离在预置范围内的环境中的环境信息,并传输给所述存储介质进行储存。
CN201810114185.7A 2018-02-05 2018-02-05 一种智能运动设备及其导航方法和存储介质 Active CN108363393B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810114185.7A CN108363393B (zh) 2018-02-05 2018-02-05 一种智能运动设备及其导航方法和存储介质
PCT/CN2019/073876 WO2019149214A1 (zh) 2018-02-05 2019-01-30 一种智能运动设备及其导航方法和存储介质
EP19746962.0A EP3751376B1 (en) 2018-02-05 2019-01-30 Smart movement device, navigation method thereof and storage medium
US16/874,854 US11247701B2 (en) 2018-02-05 2020-05-15 Smart moving device, navigation method thereof, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810114185.7A CN108363393B (zh) 2018-02-05 2018-02-05 一种智能运动设备及其导航方法和存储介质

Publications (2)

Publication Number Publication Date
CN108363393A CN108363393A (zh) 2018-08-03
CN108363393B true CN108363393B (zh) 2019-09-27

Family

ID=63004448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810114185.7A Active CN108363393B (zh) 2018-02-05 2018-02-05 一种智能运动设备及其导航方法和存储介质

Country Status (4)

Country Link
US (1) US11247701B2 (zh)
EP (1) EP3751376B1 (zh)
CN (1) CN108363393B (zh)
WO (1) WO2019149214A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363393B (zh) * 2018-02-05 2019-09-27 腾讯科技(深圳)有限公司 一种智能运动设备及其导航方法和存储介质
CN110109479A (zh) * 2019-04-24 2019-08-09 北京百度网讯科技有限公司 导航处理方法、装置、智能机器人及计算机可读存储介质
CN110456791A (zh) * 2019-07-30 2019-11-15 中国地质大学(武汉) 一种基于单目视觉的腿式移动机器人目标测距与识别系统
CN113324761B (zh) * 2020-02-28 2023-03-28 苏州宝时得电动工具有限公司 电动工具、车轮打滑确定系统及方法
CN113759901A (zh) * 2021-08-12 2021-12-07 杭州电子科技大学 一种基于深度强化学习的移动机器人自主避障方法
CN114485673B (zh) * 2022-02-09 2023-11-03 山东大学 基于深度强化学习的服务机器人人群感知导航方法及系统

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5006988A (en) * 1989-04-28 1991-04-09 University Of Michigan Obstacle-avoiding navigation system
US6720920B2 (en) * 1997-10-22 2004-04-13 Intelligent Technologies International Inc. Method and arrangement for communicating between vehicles
US8364366B2 (en) * 2005-06-24 2013-01-29 Deere & Company System and method for providing a safety zone associated with a vehicle
US8577538B2 (en) * 2006-07-14 2013-11-05 Irobot Corporation Method and system for controlling a remote vehicle
KR100791386B1 (ko) * 2006-08-18 2008-01-07 삼성전자주식회사 이동 로봇의 영역 분리 방법 및 장치
CN102288191B (zh) * 2011-05-26 2013-01-30 大连理工大学 一种智能导航小车
US8589013B2 (en) * 2011-10-25 2013-11-19 Jaybridge Robotics, Inc. Method and system for dynamically positioning a vehicle relative to another vehicle in motion
US9764468B2 (en) * 2013-03-15 2017-09-19 Brain Corporation Adaptive predictor apparatus and methods
CN103400392B (zh) * 2013-08-19 2016-06-22 山东鲁能智能技术有限公司 基于变电站巡检机器人的双目视觉导航系统及方法
CN103777639B (zh) * 2014-01-10 2015-06-24 哈尔滨工程大学 运动障碍环境中uuv三维航路规划方法
CN103926925B (zh) * 2014-04-22 2015-04-29 江苏久祥汽车电器集团有限公司 一种基于改进的vfh算法的定位与避障方法及机器人
CN105094124A (zh) * 2014-05-21 2015-11-25 防灾科技学院 基于操作条件反射进行自主路径探索的方法及模型
CN104050390B (zh) * 2014-06-30 2017-05-17 西南交通大学 一种基于可变维粒子群膜算法的移动机器人路径规划方法
CN105629970A (zh) * 2014-11-03 2016-06-01 贵州亿丰升华科技机器人有限公司 一种基于超声波的机器人定位避障方法
CN105116902A (zh) * 2015-09-09 2015-12-02 北京进化者机器人科技有限公司 一种移动机器人避障导航的方法和系统
WO2017120336A2 (en) * 2016-01-05 2017-07-13 Mobileye Vision Technologies Ltd. Trained navigational system with imposed constraints
US20170269594A1 (en) * 2016-03-16 2017-09-21 Bryan Sydnor Controlling an Unmanned Aerial System
CN105652876A (zh) * 2016-03-29 2016-06-08 北京工业大学 基于数组地图的移动机器人室内路径规划方法
US11429105B2 (en) * 2016-06-10 2022-08-30 Duke University Motion planning for autonomous vehicles and reconfigurable motion planning processors
CN106774310B (zh) * 2016-12-01 2019-11-19 中科金睛视觉科技(北京)有限公司 一种机器人导航方法
CN106598055B (zh) * 2017-01-19 2019-05-10 北京智行者科技有限公司 一种智能车局部路径规划方法及其装置、车辆
CN107168319B (zh) * 2017-06-01 2020-07-28 同济大学 一种基于模型预测控制的无人车避障方法
CN107168337A (zh) * 2017-07-04 2017-09-15 武汉视览科技有限公司 一种基于视觉识别的移动机器人路径规划与调度方法
CN107479547B (zh) * 2017-08-11 2020-11-24 同济大学 基于示教学习的决策树行为决策算法
WO2019139815A1 (en) * 2018-01-12 2019-07-18 Duke University Apparatus, method and article to facilitate motion planning of an autonomous vehicle in an environment having dynamic objects
CN108363393B (zh) * 2018-02-05 2019-09-27 腾讯科技(深圳)有限公司 一种智能运动设备及其导航方法和存储介质

Also Published As

Publication number Publication date
EP3751376A4 (en) 2021-03-31
US11247701B2 (en) 2022-02-15
EP3751376A1 (en) 2020-12-16
EP3751376B1 (en) 2023-07-19
WO2019149214A1 (zh) 2019-08-08
US20200276985A1 (en) 2020-09-03
CN108363393A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108363393B (zh) 一种智能运动设备及其导航方法和存储介质
US20200316773A1 (en) Adaptive predictor apparatus and methods
CN110136481B (zh) 一种基于深度强化学习的停车策略
US11634126B2 (en) Apparatus, methods and articles to facilitate motion planning in environments having dynamic obstacles
CN102207736B (zh) 基于贝塞尔曲线的机器人路径规划方法及装置
US9008840B1 (en) Apparatus and methods for reinforcement-guided supervised learning
CN109241552A (zh) 一种基于多约束目标的水下机器人运动规划方法
CN110488843A (zh) 避障方法、移动机器人及计算机可读存储介质
CN108153310A (zh) 一种基于人类行为模拟的移动机器人实时运动规划方法
CN113618739B (zh) 一种机器人动态避障方法、装置和机器人
CN107168309A (zh) 一种基于行为的多水下机器人路径规划方法
US20200218253A1 (en) Advanced control system with multiple control paradigms
JP2019113926A (ja) モデル予測制御装置
CN115469663A (zh) 面向自动驾驶的基于深度强化学习的端到端导航避障方法
CN112304314A (zh) 一种分布式多机器人的导航方法
CN111026121A (zh) 智能清扫车多层次立体避障控制方法及装置
US10035264B1 (en) Real time robot implementation of state machine
CN116858253A (zh) 一种适用室内环境的轻量性预测式导航方法及系统
CN117295589A (zh) 在训练和细化机器人控制策略中使用模仿学习的系统和方法
CN110717970B (zh) 一种基于离散碰撞检测的借助法线修正位置的移动方法
CN113927603A (zh) 机械臂拖动控制方法、装置、计算机设备以及存储介质
El-Fakdi et al. Two steps natural actor critic learning for underwater cable tracking
EP4339051A1 (en) Driving strategy determination method and apparatus, device, and vehicle
CN113110547B (zh) 一种微型航空飞行器的飞行控制方法、装置及设备
CN117666592A (zh) 一种群体机器人避障方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant