CN113742458A - 一种面向机械臂抓取的自然语言指令消歧方法及系统 - Google Patents

一种面向机械臂抓取的自然语言指令消歧方法及系统 Download PDF

Info

Publication number
CN113742458A
CN113742458A CN202111101881.2A CN202111101881A CN113742458A CN 113742458 A CN113742458 A CN 113742458A CN 202111101881 A CN202111101881 A CN 202111101881A CN 113742458 A CN113742458 A CN 113742458A
Authority
CN
China
Prior art keywords
sentence
words
word
grabbing
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111101881.2A
Other languages
English (en)
Other versions
CN113742458B (zh
Inventor
迟文政
叶荣广
徐晴川
刘杰
洪阳
孙立宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202111101881.2A priority Critical patent/CN113742458B/zh
Publication of CN113742458A publication Critical patent/CN113742458A/zh
Application granted granted Critical
Publication of CN113742458B publication Critical patent/CN113742458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1658Programme controls characterised by programming, planning systems for manipulators characterised by programming language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种面向机械臂抓取的自然语言指令消歧方法及系统,包括以下步骤:标定物体抓取区域和释放区域的各点位置坐标;通过词预测模型训练生成词向量模型;对输入句子进行处理,基于词向量模型生成相应的句向量;通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性;对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;根据得到的句子时序逻辑形式,判别句子之间语义的一致性;通过堆栈确定句子时序逻辑中的指定物体;结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。本发明实现自然语言指令之间语义的一致性判别,进一步指导机械臂完成抓取任务。

Description

一种面向机械臂抓取的自然语言指令消歧方法及系统
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种面向机械臂抓取的自然语言指令消歧方法及系统。
背景技术
随着自然语言处理和人工智能技术的不断发展与突破,服务型机器人在人机交互中的表现更加自然。目前,由于国家对人工智能的大力扶持,智能服务型机器人的市场不断扩大,已有相关成熟的产品投入到了酒店、家庭、工厂等多种环境中。自然语言处理的语义消歧技术是指对于两个表达方式不同、语义相同的句子而言,能够实现两者之间语义的一致性判别。目前,对于复杂的、时序逻辑不同(语义相同)的自然语言指令而言,机器人难以正确理解其语义和实现语义的一致性判别。与此同时,自然语言指令控制机械臂已成为机器人操作研究领域的热点。机械臂已经能够根据简单的自然语言指令完成一些基本的操作任务,例如开关门、拿杯子等。然而由于自然语言指令表达的多样性,自然语言指令的消歧研究对于机械臂抓取至关重要。许多学者致力于去训练一个语义解析模型,将自然语言指令转化为一个可执行的逻辑程序,让机械臂再根据逻辑程序去实现抓取任务。
现有技术通过训练语义解析模型获得句子逻辑形式,其需要人工对不同的自然语言现象进行分类,并分别建立一个庞大的语料库,一一进行标注,进而通过神经网络模型进行训练,整个过程需要耗费大量的时间和人力。简单的自然语言指令通过训练好的语义解析模型会生成大量的逻辑程序,但其中包括许多虚假程序(部分能够实现自然语言指令的任务,但不能体现句子语义)。例如,当自然语言指令含有时序操作要求时,虚假程序虽然可能指导机械臂实现预期的任务效果,但是指导机械臂抓取的整个过程是错误的。因此,对于两句复杂的、时序逻辑不同(语义相同)并包含了不同自然语言现象的指令而言,训练一个获取句子逻辑形式的语义解析模型去实现句子之间的语义消歧是不可行的。即当前只能通过一些简单的自然语言指令指导机械臂完成基本的操作任务。对于复杂的、时序逻辑不同(语义相同)的自然语言指令而言,它们之间的语义消歧难以实现,进而不能正确指导机械臂实现相同的抓取任务。
发明内容
本发明的目的是提供一种面向机械臂抓取的自然语言指令消歧方法及系统,实现自然语言指令之间语义的一致性判别,进一步指导机械臂完成抓取任务。
为了解决上述技术问题,本发明提供了一种面向机械臂抓取的自然语言指令消歧方法,包括以下步骤:
S1:标定物体抓取区域和释放区域的各点位置坐标;
S2:对语料库进行分词处理后,通过词预测模型训练生成词向量模型;
S3:对输入句子进行处理,基于词向量模型生成相应的句向量;
S4:通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性,若一致则进行下一步骤,否则返回步骤S2;
S5:对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;
S6:根据得到的句子时序逻辑形式,判别句子之间语义的一致性,若一致则进行下一步骤,否则返回步骤S2;
S7:通过堆栈确定句子时序逻辑中的指定物体;
S8:结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。
作为本发明的进一步改进,所述步骤S1中位置坐标为机械臂末端的位姿。
作为本发明的进一步改进,所述步骤S2中,所述词预测模型采用Skip_gram模型或CBOW模型,词经过one-hot编码进入神经网络训练得到词向量模型。
作为本发明的进一步改进,所述步骤S3具体包括以下步骤:
S31:通过分词模块对句子进行分词,并统计句子分词的个数,记为n;
S32:计算每个词的权重,词的权重计算公式:
Figure BDA0003270954750000031
其中,xi表示一个句子中词语i的个数,yi表示整个语料库中词语i的个数;
S33:结合词向量模型和词的权重,计算句向量,句向量计算公式:
Figure BDA0003270954750000032
其中,sen_vec表示句向量,veci表示词向量,weighti表示词的权重。
作为本发明的进一步改进,所述步骤S4中的两个句向量之间的相似度计算,相似度计算公式:
Figure BDA0003270954750000033
其中,Ai、Bi分别是向量A和向量B的各分量,m表示向量的维度;
设定阈值为0.9,若相似度值大于0.9,则进行步骤S5;若相似度值小于0.9,则进行步骤S2。
作为本发明的进一步改进,所述步骤S5中具体包括以下步骤:
S51:通过分词模块对句子进行分词,提取有用词,删除停用词,所述有用词包括时间状语、动词、名词和属性词;
S52:根据时间状语优先级对时间状语进行排序,并将时间状语提到其所负责词的前面;
S53:对提取到的每个时间状语所负责的词进行判别,判别依据为时间状语后的名词是否有两个:若只有一个名词,则时序逻辑不完整;若有两个名词,则时序逻辑完整;其中,若只有一个时间状语所负责的时序逻辑不完整,则将其舍去;若有两个时间状语所负责的时序逻辑不完整,则将两个进行组合成时序逻辑完整形式;
S54:将动词提取到其对应的时序逻辑后面,删除时间状语,并对每个时序逻辑形式里的特定物体对调位置,获得规定的时序逻辑形式。
作为本发明的进一步改进,所述步骤S6具体包括以下步骤:遍历步骤S5中得到的时序逻辑形式,若除动词外,时序逻辑形式指令一致,则语义相同,进行步骤S7;若除动词外,时序逻辑指令不一致,则语义不同,返回步骤S2。
作为本发明的进一步改进,所述步骤S7具体包括以下步骤:将时序逻辑中的属性词压入到堆栈中,当物体存到堆栈中时则会弹出前面对应的参数词,并返回相应计算结果,循环往复,依次获取每个时序逻辑形式里的指定物体。
作为本发明的进一步改进,所述步骤S8具体包括以下步骤:根据S1中标记的坐标位置,对方位词进行赋值,机械臂根据方位词和具体赋值对指定物体进行抓取和摆放,并依次记录每个物体对应的位置。
一种面向机械臂抓取的自然语言指令消歧系统,包括:
标定单元,标定物体抓取区域和释放区域的各点位置坐标;
词向量模型,对语料库进行分词处理后,通过词预测模型训练生成词向量;
句向量模型,对输入句子进行处理,基于词向量模型生成相应的句向量;
相似度计算单元,通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
时序逻辑形式获取单元,对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;
判别单元,根据得到的句子时序逻辑形式,判别句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
获取物体单元,通过堆栈确定句子时序逻辑中的指定物体;
操作单元,结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。
本发明的有益效果:本发明将自然语言处理技术与机械臂相结合,提出句向量相似度计算模型和指令时序逻辑模型相结合的方法,用于判别自然语言指令之间语义的一致性,进而实现句子之间的语义消歧;同时,复杂的、带有时序逻辑的自然语言指令能够根据提出的方法获得句子简短的时序逻辑形式,从而进一步指导机械臂完成复杂的抓取任务。
附图说明
图1是本发明方法流程示意图;
图2是本发明时间状语优先级实例示意图;
图3是本发明实施例一机械臂抓取前示意图;
图4是本发明实施例一机械臂抓取后示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例一
参考图1,本发明实施例提供了一种面向机械臂抓取的自然语言指令消歧方法,包括以下步骤:
S1:坐标标定,标定物体抓取区域和释放区域的各点位置坐标;
S2:词向量模型,对语料库进行分词处理后,先采取Skip-gram模型和one_hot编码的方式,再通过神经网络训练得到词向量;
S3:句向量模型,对句子进行处理,基于词向量模型生成句向量;
S4:句子语义相似度计算,通过损失函数(cosin)计算两个句向量之间的相似度,设定阈值为0.9,初步判别两个句子之间语义的一致性;如果相似度值大于0.9,则进行步骤S5;如果相似度值小于0.9,则进行步骤S2;
S5:获取句子时序逻辑形式。对带有时序逻辑的自然语言指令进行分词、删除停用词(介词、定冠词、冠词等),然后对时间状语、指示代词等进行处理,从而获得规定好的句子时序逻辑形式;
S6:根据上述得到的句子时序逻辑形式,判别句子之间语义的一致性;
S7:通过堆栈的方式确定时序逻辑中的特定物体;
S8:结合方位词,机械臂对物体进行抓取和摆放,并依次记录每个物体对应的位置。
具体的,步骤S1中的标定的位置坐标即为机械臂10末端的位姿。如图3所示,本实施例实验标定的释放区域为九宫格,并用数字1,2,......,8,9依次分别表示每一个释放点,采用的机械臂10是安装在LEO移动机器人上的四轴台式机械臂;
步骤S2中的Skip_gram模型是指输入一个单词w,输出其上下文的单词wo1,wo2,...,woc,其中C为上下文窗口的大小。Skip_gram模型的主要参数包括:size、window、min_count和iter。其中size表示输出词向量的维度;window表示窗口的大小,即当前词与预测词在一个句子中的最大距离;min_count表示对字典做截断,即词频少于min_count次数的单词会被丢弃掉,默认值为5;iter表示迭代次数。词经过one_hot编码作为神经网络的输入,词向量作为神经网络的输出。Skip_gram模型中的参数经过不断的调试,选取的最合理的一组参数为:size=400,window=5,min_count=5,iter=5。
步骤S3中本次实验所用的句子是“先将蓝色方块放到红色方块的右边,再抓取粉色方块,然后把它放在红色方块的后边,最后将绿色方块放到粉色方块的左边”和“将粉色方块放在红色方块的后边之前,应该先把蓝色方块摆在红色方块的右边,接着抓取绿色放块,最后把它放到粉色方块的左边”,以第二个句子为例,具体处理步骤如下:
S31:通过jieba模块对句子进行分词,并统计分词的个数,即为33;
S32:句子中存在很多词对句子整体语义的理解作用不大,且出现的频率较高,例如停用词(介词、冠词、定冠词等)。因此,根据词频的方法,计算每个词的权重来降低停用词对整体语义的影响。以助词“的”为例,在句子中出现的次数是3,在整个与语料库中出现的次数为4642,则其权重的计算如公式(1)所示:
Figure BDA0003270954750000071
S33:结合词向量模型和词的权重,计算句向量。句向量计算如公式(2)所示:
Figure BDA0003270954750000072
其中,sen_vec表示维度是400的句向量,veci表示维度是400的词向量,weighti表示词的权重,33表示句子的分词个数。
步骤S4中的句子语义相似度计算是指对两个句向量进行计算,并且希望计算的结果能够很明显的看出句子之间语义的正相关性和负相关性程度,因此,采用余弦公式计算句向量之间的语义相似度。本实验上述两个句子的语义相似度计算结果,由公式(3)可得:
Figure BDA0003270954750000073
其中,400表示句子向量的维度,Ai、Bi分别表示向量A和向量B的各分量。由相似度计算结果可知,上述两个句子的相似度值大于0.9,因此初步判定两个句子的语义是相似的,进行步骤S5;
步骤S5中的句子时序逻辑形式获取(以第二个句子为例),包括以下步骤:
S51:通过jieba模块对句子进行分词,并提取出有用词(删除停用词),其中包括时间状语(之前、先、接着、最后)、动词(放、放到、摆在)、名词(方块)、属性词(红色、粉色、绿色、蓝色)、方向词(后边、左边、左边)。词的具体顺序如下:粉色→方块→放→红色→方块→后边→之前,先→蓝色→方块→摆在→红色→方块→右边,接着→绿色→方块,最后→放→粉色→方块→左边。
S52:根据时间状语优先级对时间状语进行排序,并将时间状语提到其所负责词的前面,时间状语优先级如图2所示。词的具体顺序如下:先→蓝色→方块→摆在→红色→方块→右边,之前→粉色→方块→放→红色→方块→后边,接着→绿色→方块,最后→放→粉色→方块→左边;
S53:由于指示代词不会被提取,导致有的时间状语负责的词并不是一个完整的时序逻辑形式。所以,如果要正确得到规定的时序逻辑形式,需要对提取到的每个时间状语所负责的词进行判别。判别依据是时间状语后的名词(物体)是否有两个:如果只有一个名词,则时序逻辑不完整;如果有两个名词,则时序逻辑完整。在上述情况下,如果只是单独的一个时间状语所负责的时序逻辑不完整,则将其舍去;如果是两个时间状语所负责的时序逻辑不完整,则将两个进行组合。由步骤S52可知,接着和最后两个时间状语的时序逻辑不完整,因此将它们进行组合。词的具体顺序如下:先→蓝色→方块→摆在→红色→方块→右边,之前→粉色→方块→放→红色→方块→后边,接着→绿色→方块→放→粉色→方块→左边;
S54:将动词提取到对应的时序逻辑后面,删除时间状语,并对每个时序逻辑形式里的特定物体对调位置,以获得规定的时序逻辑形式。时序逻辑形式如下:红色→方块→蓝色→方块→右边→摆在,红色→方块→粉色→方块→后边→放,粉色→方块→绿色→方块→左边→放。
步骤S6中句子语义一致性判别方式是指依次遍历两个自然语言指令的时序逻辑形式。经比较上述两个句子的时序逻辑形式一致,则进行步骤S7。
步骤S7中堆栈的实际应用以第二个时序逻辑为例。将时序逻辑中的第一个属性词(红色)压入到堆栈中,当物体(方块)存到堆栈中时则会弹出其前面对应的参数,并返回计算结果(红色方块)。同上,第二个属性词(绿色)压入到堆栈中,当物体(方块)存到堆栈中时则会弹出其前面对应的参数,并返回计算结果(绿色方块)。依次获取每个时序逻辑形式里的特定物体。
步骤S8中机械臂10抓取操作,方向词处理的计算值如表1所示:
方向词 计算值
+3
-3
-1
+1
表1
本实验机械臂10抓取和释放的具体步骤如下:
A、对于第一个时序逻辑而言,机械臂10先抓取第一个物体(红色方块)放在5号位,再结合方向词“右边”抓取第二个物体进行放置,则第二个物体(蓝色方块)的位置为第一个物体(红色方块)的位置加1,释放点为6号位,并记录各物体对应的释放点位;
B、对于第二个时序逻辑而言,机械臂10先判断第一个物体(红色方块)有没有被抓取,被抓取后则不进行操作,再结合方向词“后边”抓取第二个物体(粉色方块)进行放置,则第二个物体(粉色方块)的位置为第一个物体(红色方块)的位置减3,则释放点为2号位,并记录各物体对应的释放点位;
C、对于第三个时序逻辑而言,机械臂10先判断第一个物体(粉色方块)有没有被抓取,被抓取后则不进行操作,再结合方向词“左边”抓取第二个物体(绿色方块)进行放置,则第二个物体(绿色方块)的位置为第一个物体(粉色方块)的位置减1,则释放点为1号位,并记录各物体对应的释放点位;依此类推。本实验的自然语言指令消歧实现机械臂10的抓取任务,最终实现如图4所示。
实施例二
为充分证明本发明的有效性,本实施例搜集了200句带有时序逻辑的自然语言指令进行验证,即100对时序逻辑不同(语义相同)的自然语言指令。将自然语言指令分为4组进行实验,将4组语言指令按本发明方法进行操作,其中实验指标包括三部分:句子语义相似度计算的正确率、句子时序逻辑获取的正确率、机械臂抓取任务的成功率。实验数据如表2所示:
Figure BDA0003270954750000101
表2
由上表可知,句子语义相似度计算的正确率、句子时序逻辑获取的正确率、机械臂抓取任务的成功率均在90%以上,有效指导机械臂完成抓取任务。
实施例三
基于同一发明构思,本发明实施例提供了一种面向机械臂抓取的自然语言指令消歧系统,其解决问题的原理与所述一种面向机械臂抓取的自然语言指令消歧方法类似,重复之处不再赘述。
一种面向机械臂抓取的自然语言指令消歧系统,包括:
标定单元,标定物体抓取区域和释放区域的各点位置坐标;
词向量模型,对语料库进行分词处理后,通过词预测模型训练生成词向量;
句向量模型,对输入句子进行处理,基于词向量模型生成相应的句向量;
相似度计算单元,通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
时序逻辑形式获取单元,对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;
判别单元,根据得到的句子时序逻辑形式,判别句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
获取物体单元,通过堆栈确定句子时序逻辑中的指定物体;
操作单元,结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (10)

1.一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:包括以下步骤:
S1:标定物体抓取区域和释放区域的各点位置坐标;
S2:对语料库进行分词处理后,通过词预测模型训练生成词向量模型;
S3:对输入句子进行处理,基于词向量模型生成相应的句向量;
S4:通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性,若一致则进行下一步骤,否则返回步骤S2;
S5:对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;
S6:根据得到的句子时序逻辑形式,判别句子之间语义的一致性,若一致则进行下一步骤,否则返回步骤S2;
S7:通过堆栈确定句子时序逻辑中的指定物体;
S8:结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。
2.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S1中位置坐标为机械臂末端的位姿。
3.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S2中,所述词预测模型采用Skip_gram模型或CBOW模型,词经过one-hot编码进入神经网络训练得到词向量模型。
4.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S3具体包括以下步骤:
S31:通过分词模块对句子进行分词,并统计句子分词的个数,记为n;
S32:计算每个词的权重,词的权重计算公式:
Figure FDA0003270954740000021
其中,xi表示一个句子中词语i的个数,yi表示整个语料库中词语i的个数;
S33:结合词向量模型和词的权重,计算句向量,句向量计算公式:
Figure FDA0003270954740000022
其中,sen_vec表示句向量,veci表示词向量,weighti表示词的权重。
5.如权利要求4所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S4中的两个句向量之间的相似度计算,相似度计算公式:
Figure FDA0003270954740000023
其中,Ai、Bi分别是向量A和向量B的各分量,m表示向量的维度;
设定阈值为0.9,若相似度值大于0.9,则进行步骤S5;若相似度值小于0.9,则进行步骤S2。
6.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S5中具体包括以下步骤:
S51:通过分词模块对句子进行分词,提取有用词,删除停用词,所述有用词包括时间状语、动词、名词和属性词;
S52:根据时间状语优先级对时间状语进行排序,并将时间状语提到其所负责词的前面;
S53:对提取到的每个时间状语所负责的词进行判别,判别依据为时间状语后的名词是否有两个:若只有一个名词,则时序逻辑不完整;若有两个名词,则时序逻辑完整;其中,若只有一个时间状语所负责的时序逻辑不完整,则将其舍去;若有两个时间状语所负责的时序逻辑不完整,则将两个进行组合成时序逻辑完整形式;
S54:将动词提取到其对应的时序逻辑后面,删除时间状语,并对每个时序逻辑形式里的特定物体对调位置,获得规定的时序逻辑形式。
7.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S6具体包括以下步骤:遍历步骤S5中得到的时序逻辑形式,若除动词外,时序逻辑形式指令一致,则语义相同,进行步骤S7;若除动词外,时序逻辑指令不一致,则语义不同,返回步骤S2。
8.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S7具体包括以下步骤:将时序逻辑中的属性词压入到堆栈中,当物体存到堆栈中时则会弹出前面对应的参数词,并返回相应计算结果,循环往复,依次获取每个时序逻辑形式里的指定物体。
9.如权利要求1所述的一种面向机械臂抓取的自然语言指令消歧方法,其特征在于:所述步骤S8具体包括以下步骤:根据S1中标记的坐标位置,对方位词进行赋值,机械臂根据方位词和具体赋值对指定物体进行抓取和摆放,并依次记录每个物体对应的位置。
10.一种面向机械臂抓取的自然语言指令消歧系统,其特征在于:包括:
标定单元,标定物体抓取区域和释放区域的各点位置坐标;
词向量模型,对语料库进行分词处理后,通过词预测模型训练生成词向量;
句向量模型,对输入句子进行处理,基于词向量模型生成相应的句向量;
相似度计算单元,通过损失函数计算两个句向量之间的相似度,初步判别两个句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
时序逻辑形式获取单元,对句子提取有用词,并根据时间状语优先级重新排序,获得规定的句子时序逻辑形式;
判别单元,根据得到的句子时序逻辑形式,判别句子之间语义的一致性,若一致则进行下一单元,否则返回词向量模型;
获取物体单元,通过堆栈确定句子时序逻辑中的指定物体;
操作单元,结合方位词和位置坐标,机械臂对指定物体进行抓取和摆放。
CN202111101881.2A 2021-09-18 2021-09-18 一种面向机械臂抓取的自然语言指令消歧方法及系统 Active CN113742458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111101881.2A CN113742458B (zh) 2021-09-18 2021-09-18 一种面向机械臂抓取的自然语言指令消歧方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111101881.2A CN113742458B (zh) 2021-09-18 2021-09-18 一种面向机械臂抓取的自然语言指令消歧方法及系统

Publications (2)

Publication Number Publication Date
CN113742458A true CN113742458A (zh) 2021-12-03
CN113742458B CN113742458B (zh) 2023-04-25

Family

ID=78739978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111101881.2A Active CN113742458B (zh) 2021-09-18 2021-09-18 一种面向机械臂抓取的自然语言指令消歧方法及系统

Country Status (1)

Country Link
CN (1) CN113742458B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114789451A (zh) * 2022-06-07 2022-07-26 中迪机器人(盐城)有限公司 一种控制机械手臂夹取和放置物件的系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105931218A (zh) * 2016-04-07 2016-09-07 武汉科技大学 模块化机械臂的智能分拣方法
CN106126219A (zh) * 2016-06-20 2016-11-16 扬州大学 一种基于目标装配关系自然语言描述的机械手装配任务自主编程方法
CN108491382A (zh) * 2018-03-14 2018-09-04 四川大学 一种半监督生物医学文本语义消歧方法
CN111639165A (zh) * 2020-04-30 2020-09-08 南京理工大学 基于自然语言处理和深度学习的智能问答优化方法
US20200311956A1 (en) * 2019-03-25 2020-10-01 Dishcraft Robotics, Inc. Automated Manipulation Of Transparent Vessels

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105931218A (zh) * 2016-04-07 2016-09-07 武汉科技大学 模块化机械臂的智能分拣方法
CN106126219A (zh) * 2016-06-20 2016-11-16 扬州大学 一种基于目标装配关系自然语言描述的机械手装配任务自主编程方法
CN108491382A (zh) * 2018-03-14 2018-09-04 四川大学 一种半监督生物医学文本语义消歧方法
US20200311956A1 (en) * 2019-03-25 2020-10-01 Dishcraft Robotics, Inc. Automated Manipulation Of Transparent Vessels
CN111639165A (zh) * 2020-04-30 2020-09-08 南京理工大学 基于自然语言处理和深度学习的智能问答优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨琨 等: "基于语音和视觉联控的移动抓取机器人设计与实现", 《机电产品开发与创新》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114789451A (zh) * 2022-06-07 2022-07-26 中迪机器人(盐城)有限公司 一种控制机械手臂夹取和放置物件的系统及方法

Also Published As

Publication number Publication date
CN113742458B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
WO2022227207A1 (zh) 文本分类方法、装置、计算机设备和存储介质
US20210232376A1 (en) Vectorized representation method of software source code
CN109165284A (zh) 一种基于大数据的金融领域人机对话意图识别方法
CN110825877A (zh) 一种基于文本聚类的语义相似度分析方法
CN106502994A (zh) 一种文本的关键词提取的方法和装置
CN111475655B (zh) 一种基于配电网知识图谱的电力调度文本实体链接方法
Yongda et al. Research on multimodal human-robot interaction based on speech and gesture
CN113742458A (zh) 一种面向机械臂抓取的自然语言指令消歧方法及系统
CN110110402B (zh) 基于二叉决策图的资源分配系统可达状态的快速求解方法
CN110851594A (zh) 一种基于多通道深度学习模型的文本分类方法及其装置
WO2024098524A1 (zh) 文本视频的互检索及模型训练方法、装置、设备及介质
CN110472240A (zh) 基于tf-idf的文本特征提取方法和装置
CN111651993A (zh) 融合局部-全局字符级关联特征的中文命名实体识别方法
Zheng et al. BERT-Based Mixed Question Answering Matching Model
WO2022121146A1 (zh) 一种代码片段重要性的判断方法和装置
CN110377753B (zh) 基于关系触发词与gru模型的关系抽取方法及装置
CN109753646A (zh) 一种文章属性识别方法以及电子设备
CN110705277A (zh) 一种基于循环神经网络的中文词义消岐方法
CN115600595A (zh) 一种实体关系抽取方法、系统、设备及可读存储介质
Chong et al. Modeling of term-distance and term-occurrence information for improving n-gram language model performance
CN112765314B (zh) 一种基于电力本体知识库的电力信息检索方法
Zhang et al. Event Extraction for Military Target Motion in Open-source Military News
CN117725554A (zh) 一种基于视觉语言多模态融合的人机交互意图理解方法
Ye et al. A natural language instruction disambiguation method for robot grasping
CN110543569A (zh) 用于短文本意图识别的网络层结构及短文本意图识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant