CN110825829A - 一种基于自然语言和语义地图实现机器人自主导航的方法 - Google Patents

一种基于自然语言和语义地图实现机器人自主导航的方法 Download PDF

Info

Publication number
CN110825829A
CN110825829A CN201910981685.5A CN201910981685A CN110825829A CN 110825829 A CN110825829 A CN 110825829A CN 201910981685 A CN201910981685 A CN 201910981685A CN 110825829 A CN110825829 A CN 110825829A
Authority
CN
China
Prior art keywords
natural language
instruction
robot
semantic map
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910981685.5A
Other languages
English (en)
Other versions
CN110825829B (zh
Inventor
董敏
聂宏蓄
毕盛
杨垲泓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201910981685.5A priority Critical patent/CN110825829B/zh
Publication of CN110825829A publication Critical patent/CN110825829A/zh
Application granted granted Critical
Publication of CN110825829B publication Critical patent/CN110825829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Databases & Information Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Navigation (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于自然语言和语义地图实现机器人自主导航的方法,包括步骤:1)获取机器人所处环境的语义地图;2)将获取到的语义地图描述成三元组集合;3)通过两组双层GRU编码器分别提取语义地图和自然语言指令的特征;4)通过注意力机制将语义地图的特征和自然语言指令的特征融合;5)通过双层GRU解码器逐步生成导航指令;6)将解码得到的导航指令转换成机器人可以执行的指令序列,机器人根据指令序列进行自主导航。本发明够利用自然语言指令进行机器人导航,在不需要预先获取精确度量地图的条件下,满足在各种环境下使机器人进行自主导航的需求。

Description

一种基于自然语言和语义地图实现机器人自主导航的方法
技术领域
本发明涉及自然语言处理、深度学习、自主导航的技术领域,尤其是指一种基于自然语言和语义地图实现机器人自主导航的方法。
背景技术
近年来,机器人自主导航在生产生活中应用越来越广泛,越来越多的应用场景需要精确且高效的自主导航技术。以往的自主导航方法,需要先对环境进行一次扫描,获取精确的度量地图,之后进行路径规划进行导航。获取精确的度量地图需要消耗大量的精力,并且地图的精准程度对导航效果的影响很大。因此基于语义地图以及自然语言的自主导航方法的研究具有重大意义。
目前,机器人自主导航研究方面主要采用基于精确度量地图的方法,但还面临如下问题:
(1)获取精确度量地图需要消耗大量的资源和时间对环境预先进行扫描,获取精确度量地图的成本较大。
(2)在一些难以观测的复杂场景下,获取精确度量地图的难度和开销更大,该类方法可能无法实施。
(3)导航效果取决于度量地图的精确程度,一些难以获取精确度量地图的场合,导航效果会变得很差。
(4)基于精确度量地图的自主导航方法,是基于环境的度量信息进行导航的,没有利用到环境的语义,拓扑信息。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于自然语言和语义地图实现机器人自主导航的方法,能够利用机器人所处环境的语义地图和自然语言指令,在无需预先获取精确度量地图的条件下进行机器人的自主导航。
为实现上述目的,本发明所提供的技术方案为:一种基于自然语言和语义地图实现机器人自主导航的方法,包括以下步骤:
1)获取机器人所处环境的语义地图,包括出发点、目的地及其它位置之间的拓扑关系;
2)将获取到的语义地图中各个位置用顶点表示,用顶点间的边表示顶点的通达关系,将每一对顶点之间的通达关系描述成三元组;
3)通过两组双层GRU编码器分别提取已描述成三元组集合的语义地图的特征和自然语言指令的特征;
4)通过注意力机制将语义地图的特征和自然语言指令的特征融合;
5)通过双层GRU解码器逐步生成导航指令;
6)将解码得到的导航指令转换成机器人能够执行的指令序列,机器人根据指令序列进行自主导航。
在步骤1)中,所述机器人所处环境的语义地图是指用于描述机器人所处环境的拓扑地图,包括表示环境中各个区域的顶点和表示顶点间相互通达关系的边。
在步骤2)中,每一对顶点之间的相互通达关系用一个三元组<pi,bi,pj>来表示,其中,pi表示出发点,pj表示目的地,bi表示机器人从出发点到目的地需要执行的指令。
在步骤3)中,通过两组双层GRU编码器分别提取语义地图和自然语言指令的特征,包括以下步骤:
3.1)每个包含N个三元组的语义地图M及每个包含L个词语的自然语言指令I分别描述为:
M={<p1,b1,q1>,...,<pN,bN,qN>}
I={l1,...,lL}
其中:地图中的第i个三元组表示为<pi,bi,qi>,下标i=1,2,3,...,N表示N个三元组的索引号;自然语言指令中的第i个词语表示为li,下标i=1,2,3,...,L表示自然语言指令中L个词语的索引号;
3.2)将三元组通过embedding层用向量表示,将自然语言指令通过embedding层用向量表示,三元组的向量表示和自然语言指令的向量表示分别描述为:
EM={g1,...,gN}
EL={i1,...,iL}
其中:语义地图中第i个三元组的embedding向量表示为gi,下标i=1,2,3,...,N表示N个三元组的embedding向量索引号;自然语言指令中第i个单词的embedding向量表示为ii,下标i=1,2,3,...,L表示自然语言指令中L个单词的embedding向量索引号;
3.3)将语义地图的embedding向量和自然语言指令的embedding向量分别通过双层GRU进行编码,获取特征向量,语义地图和自然语言指令的特征向量分别描述为:
FM={fg1,....,fgN}
FL={fi1,...,fiL}
其中:第i个三元组的特征向量表示为fgi,下标i=1,2,3,...,N表示N个三元组的特征向量索引号;自然语言指令中第i个词语的特征向量表示为fii,下标i=1,2,3,...,L表示自然语言指令中L个词语的特征向量索引号。
在步骤4)中,通过注意力机制将语义地图的特征和自然语言指令的特征融合,包括以下步骤:
4.1)对每一个三元组的特征向量,计算其关于自然语言指令中每个词语对应特征向量的注意力,其过程描述为:
ei=[fgiWfi1,...,fgiWfiL]
ai=softmax(ei)
其中,W表示不同维度的特征向量相乘时的权重,ei表示语义地图特征fgi关于自然语言指令的每一个特征向量的注意力向量,ai表示语义地图特征fgi关于自然语言指令的每一个特征向量的权重,fil表示自然语言指令中第l个词语的特征向量;
4.2)通过注意力权重将语义地图特征和自然语言指令特征融合,其过程描述为:
R={R1,...,RN}
其中,Ri表示N个融合特征向量第i个融合的特征向量,aij表示第i个三元组特征对第j个自然语言指令特征的注意力权重,fij表示第j个自然语言指令特征。
在步骤5)中,通过双层GRU解码器逐步生成导航指令,包括以下步骤:
5.1)将语义地图和自然语言指令的融合特征输入双层GRU解码器进行解码,解码过程描述为:
Figure BDA0002235391630000042
其中,
Figure BDA0002235391630000051
W1、W2分别是GRU解码器的参数,
Figure BDA0002235391630000052
表示第i个时间步的导航指令为指令集合中第s个指令的概率,hi-1表示GRU解码器中第i-1个时间步的隐藏状态,Ri表示当前时间步输入的融合特征向量;
5.2)预测当前时间步输出的导航指令,其过程描述为:
Figure BDA0002235391630000053
其中,下标i表示第i个时间步,上标1,...,S表示S个指令组成的指令集合的编号。
在步骤6)中,将解码得到的导航指令转换成机器人能够执行的单条指令的序列,将指令序列依次发送给机器人,机器人根据序列进行自主导航。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明提出使用语义地图进行机器人自主导航,节约了获取精确度量地图带来的开销并且可以适应复杂环境。
2、本发明提出结合自然语言指令进行机器人自主导航,能够更方便,高效的进行机器人自主导航。
3、本发明结合了自然语言指令和语义地图,通过结合两种不同模态信息的特征进行机器人自主导航,在保证导航效果的同时提高了导航效率,节约了开销。
附图说明
图1为本发明进行自主导航的流程示意图。
图2为基于注意力机制的特征提取及导航指令预测的模型架构构造过程示意图。其中,Behavioral graph是用于表示机器人所处环境的语义地图的三元组序列,Intruduction表示自然语言指令,它们时模型的输入;Triplet embedding和Intrductionembedding分别表示三元组序列的embedding向量和自然语言指令的embedding向量;Attention表示注意力模块,Auxiliary output表示附加输出;Blended features ofgraph and instruction表示语义地图的特征和自然语言指令的融合特征;Compactblended features of graph and instruction表示经过线性变换后的融合特征;GRU表示GRU模块,Mask Softmax表示通过softmax计算输出的导航指令的概率分布。
图3为注意力机制原理示意图。其中,左图为普通GRU模块的输入输出流程模型,右边为注意力模块的输入输出流程模型。其中,X为注意力模块的输入;GRU表示GRU模块,其输出的向量大小为(B,S,H),其中,B表示样本批量大小,S表示输入向量的长度,H表示输入向量的维度;FC表示全连接层,其输出的向量大小为(B,S,1);Sigmoid表示用于计算权重的激活函数;Scale表示将GRU的输出乘上权重的操作,X~表示注意力模块输出的向量,其大小为(B,S,H)。
具体实施方式
下面结合具体实施例及附图对本发明作进一步说明,但本发明的实施方式不限于此。
如图1至图3所示,本实施例所提供的基于自然语言和语义地图实现机器人自主导航的方法,包括以下步骤:
1)获取机器人所处环境的语义地图,包括出发点、目的地及其他位置之间的拓扑关系,所述机器人所处环境的语义地图是指用于描述机器人所处环境的拓扑地图,包括表示环境中各个区域的顶点和表示顶点间相互通达关系的边。
2)将获取到的语义地图中各个位置用顶点表示,用顶点间的边表示顶点的通达关系,将每一对顶点之间的通达关系描述成三元组,每一对顶点之间的相互通达关系用一个三元组<pi,bi,qi>来表示,其中,pi表示出发点,qi表示目的地,bi表示机器人从出发点到目的地需要执行的指令。
3)通过两组双层GRU编码器分别提取语义地图和自然语言指令的特征,包括以下步骤:
3.1)每个包含N个三元组的语义地图M及每个包含L词语的自然语言指令I分别描述为:
M={<p1,b1,q1>,...,<pN,bN,qN>}
I={l1,...,lL}
其中,地图中的第i个三元组表示为<pi,bi,qi>,下标i=1,2,3,...,N表示N个三元组的索引号;自然语言指令中的第i个词语表示为li,下标i=1,2,3,...,L表示自然语言指令中L个词语的索引号,获取到的三元组序列作为模型的输入,对应图2中的Behavioralgraph。
3.2)将三元组通过embedding层用向量表示,将自然语言指令通过embedding层用向量表示,三元组的向量表示和自然语言指令的向量表示分别描述为:
EM={g1,...,gN}
EL={i1,...,iL}
其中,语义地图中第i个三元组的embedding向量表示为gi,下标i=1,2,3,...,N表示N个三元组的embedding向量索引号;自然语言指令中第i个单词的embedding向量表示为ii,下标i=1,2,3,...,L表示自然语言指令中L个单词的embedding向量索引号,EM和EL分别对应图2中的Triplet embedding和Intrduction embedding。
3.3)将语义地图的embedding向量和自然语言指令的embedding向量分别通过双层GRU进行编码,获取特征向量,语义地图和自然语言指令的特征向量分别描述为:
FM={fg1,....,fgN}
FL={fi1,...,fiL}
其中:第i个三元组的特征向量表示为fgi,下标i=1,2,3,...,N表示N个三元组的特征向量索引号;自然语言指令中第i个词语的特征向量表示为fii,下标i=1,2,3,...,L表示自然语言指令中L个词语的特征向量索引号。
4)通过注意力机制将语义地图的特征和自然语言指令的特征融合,包括以下步骤:
4.1)对每一个三元组的特征向量,计算其关于自然语言指令中每个词语对应特征向量的注意力,其过程可以描述为:
ei=[fgiWfi1,...,fgiWfiL]
ai=softmax(ei)
其中,W表示不同维度的特征向量相乘时的权重,ei表示语义地图特征fgi关于自然语言指令的每一个特征向量的注意力向量,ai表示语义地图特征fgi关于自然语言指令的每一个特征向量的权重,fil表示自然语言指令中第l个词语的特征向量,注意力模块设计见图3。
4.2)通过注意力权重将语义地图特征和自然语言指令特征融合,其过程可以描述为:
R={R1,...,RN}
Figure BDA0002235391630000081
其中,Ri表示N个融合特征向量第i个融合的特征向量,aij表示第i个三元组特征对第j个自然语言指令特征的注意力权重,fij表示第j个自然语言指令特征,融合向量对应图2中的Blended features of graph and instruction。
5)通过双层GRU解码器逐步生成导航指令,包括以下步骤:
5.1)将语义地图和自然语言指令的融合特征输入双层GRU解码器进行解码,解码过程描述为:
Figure BDA0002235391630000091
其中,
Figure BDA0002235391630000092
W1、W2分别是GRU解码器的参数,表示第i个时间步的导航指令为指令集合中第s个指令的概率,hi-1表示GRU解码器中第i-1个时间步的隐藏状态,Ri表示当前时间步输入的融合特征向量。
5.2)预测当前时间步输出的导航指令,其过程可以描述为:
Figure BDA0002235391630000094
其中,下标i表示第i个时间步,上标1,...,S表示S个指令组成的指令集合的编号。
6)将解码得到的导航指令转换成机器人可以执行的行动序列,机器人根据行动序列进行自主导航,包括以下步骤:
6.1)将导航指令序列转换为机器人可以执行的单条指令的序列;
6.2)将指令序列依次发送给机器人,机器人进行自主导航。
综上所述,采用以上方案,本发明为机器人自主导航提供了新的方法,可以利用自然语言指令进行机器人导航,在不需要预先获取精确度量地图的条件下,满足在各种环境下使机器人进行自主导航的需求,具有研究价值,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种基于自然语言和语义地图实现机器人自主导航的方法,其特征在于,包括以下步骤:
1)获取机器人所处环境的语义地图,包括出发点、目的地及其它位置之间的拓扑关系;
2)将获取到的语义地图中各个位置用顶点表示,用顶点间的边表示顶点的通达关系,将每一对顶点之间的通达关系描述成三元组;
3)通过两组双层GRU编码器分别提取已描述成三元组集合的语义地图的特征和自然语言指令的特征;
4)通过注意力机制将语义地图的特征和自然语言指令的特征融合;
5)通过双层GRU解码器逐步生成导航指令;
6)将解码得到的导航指令转换成机器人能够执行的指令序列,机器人根据指令序列进行自主导航。
2.根据权利要求1所述的一种基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤1)中,所述机器人所处环境的语义地图是指用于描述机器人所处环境的拓扑地图,包括表示环境中各个区域的顶点和表示顶点间相互通达关系的边。
3.根据权利要求1所述的一种基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤2)中,每一对顶点之间的相互通达关系用一个三元组<pi,bi,pj>来表示,其中,pi表示出发点,pj表示目的地,bi表示机器人从出发点到目的地需要执行的指令。
4.根据权利要求1所述的基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤3)中,通过两组双层GRU编码器分别提取语义地图和自然语言指令的特征,包括以下步骤:
3.1)每个包含N个三元组的语义地图M及每个包含L个词语的自然语言指令I分别描述为:
M={<p1,b1,q1>,...,<pN,bN,qN>}
I={l1,...,lL}
其中:地图中的第i个三元组表示为<pi,bi,qi>,下标i=1,2,3,...,N表示N个三元组的索引号;自然语言指令中的第i个词语表示为li,下标i=1,2,3,...,L表示自然语言指令中L个词语的索引号;
3.2)将三元组通过embedding层用向量表示,将自然语言指令通过embedding层用向量表示,三元组的向量表示和自然语言指令的向量表示分别描述为:
EM={g1,...,gN}
EL={i1,...,iL}
其中:语义地图中第i个三元组的embedding向量表示为gi,下标i=1,2,3,...,N表示N个三元组的embedding向量索引号;自然语言指令中第i个单词的embedding向量表示为ii,下标i=1,2,3,...,L表示自然语言指令中L个单词的embedding向量索引号;
3.3)将语义地图的embedding向量和自然语言指令的embedding向量分别通过双层GRU进行编码,获取特征向量,语义地图和自然语言指令的特征向量分别描述为:
FM={fg1,....,fgN}
FL={fi1,...,fiL}
其中:第i个三元组的特征向量表示为fgi,下标i=1,2,3,...,N表示N个三元组的特征向量索引号;自然语言指令中第i个词语的特征向量表示为fii,下标i=1,2,3,...,L表示自然语言指令中L个词语的特征向量索引号。
5.根据权利要求1所述的基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤4)中,通过注意力机制将语义地图的特征和自然语言指令的特征融合,包括以下步骤:
4.1)对每一个三元组的特征向量,计算其关于自然语言指令中每个词语对应特征向量的注意力,其过程描述为:
ei=[fgiWfi1,...,fgiWfiL]
ai=soft max(ei)
其中,W表示不同维度的特征向量相乘时的权重,ei表示语义地图特征fgi关于自然语言指令的每一个特征向量的注意力向量,ai表示语义地图特征fgi关于自然语言指令的每一个特征向量的权重,fil表示自然语言指令中第l个词语的特征向量;
4.2)通过注意力权重将语义地图特征和自然语言指令特征融合,其过程描述为:
R={R1,...,RN}
Figure FDA0002235391620000031
其中,Ri表示N个融合特征向量第i个融合的特征向量,aij表示第i个三元组特征对第j个自然语言指令特征的注意力权重,fij表示第j个自然语言指令特征。
6.根据权利要求1所述的基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤5)中,通过双层GRU解码器逐步生成导航指令,包括以下步骤:
5.1)将语义地图和自然语言指令的融合特征输入双层GRU解码器进行解码,解码过程描述为:
Figure FDA0002235391620000041
其中,
Figure FDA0002235391620000042
W1、W2分别是GRU解码器的参数,
Figure FDA0002235391620000043
表示第i个时间步的导航指令为指令集合中第s个指令的概率,hi-1表示GRU解码器中第i-1个时间步的隐藏状态,Ri表示当前时间步输入的融合特征向量;
5.2)预测当前时间步输出的导航指令,其过程描述为:
Figure FDA0002235391620000044
其中,下标i表示第i个时间步,上标1,...,S表示S个指令组成的指令集合的编号。
7.根据权利要求1所述的基于自然语言和语义地图实现机器人自主导航的方法,其特征在于:在步骤6)中,将解码得到的导航指令转换成机器人能够执行的单条指令的序列,将指令序列依次发送给机器人,机器人根据序列进行自主导航。
CN201910981685.5A 2019-10-16 2019-10-16 一种基于自然语言和语义地图实现机器人自主导航的方法 Active CN110825829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910981685.5A CN110825829B (zh) 2019-10-16 2019-10-16 一种基于自然语言和语义地图实现机器人自主导航的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910981685.5A CN110825829B (zh) 2019-10-16 2019-10-16 一种基于自然语言和语义地图实现机器人自主导航的方法

Publications (2)

Publication Number Publication Date
CN110825829A true CN110825829A (zh) 2020-02-21
CN110825829B CN110825829B (zh) 2023-05-26

Family

ID=69549591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910981685.5A Active CN110825829B (zh) 2019-10-16 2019-10-16 一种基于自然语言和语义地图实现机器人自主导航的方法

Country Status (1)

Country Link
CN (1) CN110825829B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111496784A (zh) * 2020-03-27 2020-08-07 山东大学 一种用于机器人智能化服务的空间环境识别方法及系统
CN113420606A (zh) * 2021-05-31 2021-09-21 华南理工大学 一种基于自然语言和机器视觉实现机器人自主导航的方法
CN113485382A (zh) * 2021-08-26 2021-10-08 苏州大学 面向人机自然交互的移动机器人自主导航方法及系统
EP3879371A3 (en) * 2020-12-22 2021-11-10 Baidu USA LLC Natural language based indoor autonomous navigation
CN113670310A (zh) * 2021-07-27 2021-11-19 际络科技(上海)有限公司 视觉语音导航方法、装置、设备及存储介质
CN113836271A (zh) * 2021-09-28 2021-12-24 北京有竹居网络技术有限公司 自然语言处理的方法和产品
WO2022193813A1 (en) * 2021-03-15 2022-09-22 Midea Group Co., Ltd. Method and apparatus for localizing mobile robot in environment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684449A (zh) * 2018-12-20 2019-04-26 电子科技大学 一种基于注意力机制的自然语言语义表征方法
CN110210499A (zh) * 2019-06-03 2019-09-06 中国矿业大学 一种图像语义描述的自适应生成系统
WO2019183568A1 (en) * 2018-03-23 2019-09-26 Google Llc Controlling a robot based on free-form natural language input

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019183568A1 (en) * 2018-03-23 2019-09-26 Google Llc Controlling a robot based on free-form natural language input
CN109684449A (zh) * 2018-12-20 2019-04-26 电子科技大学 一种基于注意力机制的自然语言语义表征方法
CN110210499A (zh) * 2019-06-03 2019-09-06 中国矿业大学 一种图像语义描述的自适应生成系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PARATH SHAH等: "FollowNet: Robot Navigation by Following Natural Language Directions with Deep Reinforcement Learning", 《THIRD WORKSHOP IN MACHINE LEARNING IN THE PLANNING AND CONTROL OF ROBOT MOTION AT ICRA》 *
PETER ANDERSON等: "Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments", 《IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111496784A (zh) * 2020-03-27 2020-08-07 山东大学 一种用于机器人智能化服务的空间环境识别方法及系统
EP3879371A3 (en) * 2020-12-22 2021-11-10 Baidu USA LLC Natural language based indoor autonomous navigation
US11720108B2 (en) 2020-12-22 2023-08-08 Baidu Usa Llc Natural language based indoor autonomous navigation
WO2022193813A1 (en) * 2021-03-15 2022-09-22 Midea Group Co., Ltd. Method and apparatus for localizing mobile robot in environment
CN113420606A (zh) * 2021-05-31 2021-09-21 华南理工大学 一种基于自然语言和机器视觉实现机器人自主导航的方法
CN113670310A (zh) * 2021-07-27 2021-11-19 际络科技(上海)有限公司 视觉语音导航方法、装置、设备及存储介质
CN113670310B (zh) * 2021-07-27 2024-05-31 际络科技(上海)有限公司 视觉语音导航方法、装置、设备及存储介质
CN113485382A (zh) * 2021-08-26 2021-10-08 苏州大学 面向人机自然交互的移动机器人自主导航方法及系统
CN113836271A (zh) * 2021-09-28 2021-12-24 北京有竹居网络技术有限公司 自然语言处理的方法和产品
CN113836271B (zh) * 2021-09-28 2023-08-15 北京有竹居网络技术有限公司 自然语言处理的方法和产品

Also Published As

Publication number Publication date
CN110825829B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN110825829B (zh) 一种基于自然语言和语义地图实现机器人自主导航的方法
CN112330681B (zh) 一种基于注意力机制的轻量级网络实时语义分割方法
CN109241972B (zh) 基于深度学习的图像语义分割方法
CN113205466A (zh) 一种基于隐空间拓扑结构约束的残缺点云补全方法
CN109086768B (zh) 卷积神经网络的语义图像分割方法
CN110673840A (zh) 一种基于标签图嵌入技术的自动代码生成方法及系统
KR102305230B1 (ko) 객체 경계정보의 정확도 개선방법 및 장치
CN113822284B (zh) 一种基于边界注意力的rgbd图像语义分割方法
CN113361578A (zh) 图像处理模型的训练方法、装置、电子设备及存储介质
CN112418235B (zh) 一种基于膨胀最近邻特征增强的点云语义分割方法
CN113627093A (zh) 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法
CN113554032A (zh) 基于高度感知的多路并行网络的遥感图像分割方法
CN114913493A (zh) 一种基于深度学习的车道线检测方法
CN113420606B (zh) 一种基于自然语言和机器视觉实现机器人自主导航的方法
CN117454495A (zh) 一种基于建筑草图轮廓序列的cad矢量模型生成方法及装置
CN117725966A (zh) 草图序列重建模型的训练方法、几何模型重建方法及设备
Huang et al. Applications of large scale foundation models for autonomous driving
Wang et al. Combining ElasticFusion with PSPNet for RGB-D based indoor semantic mapping
Dang et al. Real-time semantic plane reconstruction on a monocular drone using sparse fusion
CN116561240A (zh) 电子地图处理方法、相关装置和介质
CN114743123A (zh) 一种基于隐函数三维表示和图神经网络的场景理解方法
CN112733934A (zh) 复杂环境下的多模态特征融合道路场景语义分割方法
Zheng et al. A Dual Encoder-Decoder Network for Self-supervised Monocular Depth Estimation
CN116030347B (zh) 一种基于注意力网络的高分辨率遥感影像建筑物提取方法
CN117011650B (zh) 一种图像编码器的确定方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant