CN117798911A - 一种物体抓取方法、装置、计算机可读存储介质及机器人 - Google Patents
一种物体抓取方法、装置、计算机可读存储介质及机器人 Download PDFInfo
- Publication number
- CN117798911A CN117798911A CN202311816588.3A CN202311816588A CN117798911A CN 117798911 A CN117798911 A CN 117798911A CN 202311816588 A CN202311816588 A CN 202311816588A CN 117798911 A CN117798911 A CN 117798911A
- Authority
- CN
- China
- Prior art keywords
- target
- grabbing
- pose
- determining
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 230000007246 mechanism Effects 0.000 claims abstract description 56
- 230000008859 change Effects 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 14
- 238000003062 neural network model Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 9
- 238000012805 post-processing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007711 solidification Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000016776 visual perception Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Manipulator (AREA)
Abstract
本申请属于机器人技术领域,尤其涉及一种物体抓取方法、装置、计算机可读存储介质及机器人。所述方法包括:获取RGB图像和对应的深度图;根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;根据所述物体类别确定所述目标物体的目标归置位置;根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。通过本申请,可以对物体类别进行识别,对确定与之对应的归置位置,在此基础上进行路径规划及抓取操作,具有较高的灵活性。
Description
技术领域
本申请属于机器人技术领域,尤其涉及一种物体抓取方法、装置、计算机可读存储介质及机器人。
背景技术
仿人机器人不仅在外观上与人相似,同时其运动自由度也与人极为接近,因此其有望帮助人类完成各种体力劳动,具体如搬运物体、操作环境机构等。而无论是搬运物体,还是操作环境机构,都要求机器人能够准确识别物体并抓取。但在现有技术中,机器人往往只能针对物体进行单一固化的抓取操作,灵活性较差。
发明内容
有鉴于此,本申请实施例提供了一种物体抓取方法、装置、计算机可读存储介质及机器人,以解决现有的物体抓取方法灵活性较差的问题。
本申请实施例的第一方面提供了一种物体抓取方法,可以包括:
获取RGB图像和对应的深度图;
根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;
根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;
根据所述物体类别确定所述目标物体的目标归置位置;
根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;
控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。
在第一方面的一种具体实现方式中,所述根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框,可以包括:
使用预设的物体检测模型对所述RGB图像进行物体检测,得到所述目标物体的所述物体类别和所述物体边界框;
其中,所述物体检测模型为预先训练得到的用于进行物体检测的神经网络模型。
在第一方面的一种具体实现方式中,所述根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿,可以包括:
根据所述深度图和所述物体边界框确定所述目标物体的物体深度图;
对所述物体深度图进行TSDF数据格式转换,得到所述目标物体的TSDF数据;
使用预设的抓取位姿生成模型对所述TSDF数据进行处理,得到所述目标抓取位姿;
其中,所述抓取位姿生成模型为预先训练得到的用于进行抓取位姿生成的神经网络模型。
在第一方面的一种具体实现方式中,所述根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径,可以包括:
分别确定与所述目标抓取位姿对应的预抓取位姿和预返回位姿;
确定由所述当前位置至所述预抓取位姿的第一无碰撞规划路径,并确定由所述预返回位姿至所述目标归置位置的第二无碰撞规划路径。
在第一方面的一种具体实现方式中,所述控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作,可以包括:
控制所述执行机构按照所述第一无碰撞规划路径由所述当前位置运动至所述预抓取位姿;
控制所述执行机构通过插值由所述预抓取位姿运动至所述目标抓取位姿;
控制所述执行机构抓取所述目标物体;
控制所述执行机构通过插值由所述目标抓取位姿运动至所述预返回位姿;
控制所述执行机构按照所述第二无碰撞规划路径由所述预返回位姿运动至所述目标归置位置;
控制所述执行机构放置所述目标物体。
在第一方面的一种具体实现方式中,在根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框之后,还可以包括:
根据所述物体边界框判断所述目标物体是否发生移动;
若所述目标物体发生移动,则结束当前的物体抓取流程,并重新执行新的物体抓取流程。
在第一方面的一种具体实现方式中,所述根据所述物体边界框判断所述目标物体是否发生移动,可以包括:
计算所述物体边界框的位置变化量;
若所述位置变化量大于预设的位置变化量阈值,则判定所述目标物体发生移动;
若所述位置变化量小于或等于所述位置变化量阈值,则判定所述目标物体未发生移动。
本申请实施例的第二方面提供了一种物体抓取装置,可以包括:
图像获取模块,用于获取RGB图像和对应的深度图;
物体信息确定模块,用于根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;
抓取位姿确定模块,用于根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;
归置位置确定模块,用于根据所述物体类别确定所述目标物体的目标归置位置;
规划路径确定模块,用于根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;
抓取操作控制模块,用于控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。
在第二方面的一种具体实现方式中,所述物体信息确定模块可以具体用于:使用预设的物体检测模型对所述RGB图像进行物体检测,得到所述目标物体的所述物体类别和所述物体边界框;
其中,所述物体检测模型为预先训练得到的用于进行物体检测的神经网络模型。
在第二方面的一种具体实现方式中,所述抓取位姿确定模块可以包括:
物体深度图确定单元,用于根据所述深度图和所述物体边界框确定所述目标物体的物体深度图;
数据格式转换单元,用于对所述物体深度图进行TSDF数据格式转换,得到所述目标物体的TSDF数据;
抓取位姿生成单元,用于使用预设的抓取位姿生成模型对所述TSDF数据进行处理,得到所述目标抓取位姿;
其中,所述抓取位姿生成模型为预先训练得到的用于进行抓取位姿生成的神经网络模型。
在第二方面的一种具体实现方式中,所述规划路径确定模块可以包括:
预抓取和预返回位姿确定单元,用于分别确定与所述目标抓取位姿对应的预抓取位姿和预返回位姿;
规划路径确定单元,用于确定由所述当前位置至所述预抓取位姿的第一无碰撞规划路径,并确定由所述预返回位姿至所述目标归置位置的第二无碰撞规划路径。
在第二方面的一种具体实现方式中,所述抓取操作控制模块可以包括:
第一控制单元,用于控制所述执行机构按照所述第一无碰撞规划路径由所述当前位置运动至所述预抓取位姿;
第二控制单元,用于控制所述执行机构通过插值由所述预抓取位姿运动至所述目标抓取位姿;
第三控制单元,用于控制所述执行机构抓取所述目标物体;
第四控制单元,用于控制所述执行机构通过插值由所述目标抓取位姿运动至所述预返回位姿;
第五控制单元,用于控制所述执行机构按照所述第二无碰撞规划路径由所述预返回位姿运动至所述目标归置位置;
第六控制单元,用于控制所述执行机构放置所述目标物体。
在第二方面的一种具体实现方式中,所述物体抓取装置还可以包括:
物体移动判断模块,用于根据所述物体边界框判断所述目标物体是否发生移动;
物体移动处理模块,用于若所述目标物体发生移动,则结束当前的物体抓取流程,并重新执行新的物体抓取流程。
在第二方面的一种具体实现方式中,所述物体移动判断模块可以具体用于:计算所述物体边界框的位置变化量;若所述位置变化量大于预设的位置变化量阈值,则判定所述目标物体发生移动;若所述位置变化量小于或等于所述位置变化量阈值,则判定所述目标物体未发生移动。
本申请实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种物体抓取方法的步骤。
本申请实施例的第四方面提供了一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种物体抓取方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在机器人上运行时,使得机器人执行上述任一种物体抓取方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例获取RGB图像和对应的深度图;根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;根据所述物体类别确定所述目标物体的目标归置位置;根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。通过本申请实施例,可以对物体类别进行识别,对确定与之对应的归置位置,在此基础上进行路径规划及抓取操作,具有较高的灵活性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例中一种物体抓取方法的一个实施例流程图;
图2为识别模块、规划模块和操作模块的交互示意图;
图3为本申请实施例中一种物体抓取装置的一个实施例结构图;
图4为本申请实施例中一种机器人的示意框图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
仿人机器人不仅在外观上与人相似,同时其运动自由度也与人极为接近,因此其有望帮助人类完成各种体力劳动,具体如搬运物体、操作环境机构等。而无论是搬运物体,还是操作环境机构,都要求机器人能够准确识别物体并抓取。但在现有技术中,机器人往往只能针对物体进行单一固化的抓取操作,灵活性较差。
在本申请实施例中,可以对物体类别进行识别,对确定与之对应的归置位置,在此基础上进行路径规划及抓取操作,具有较高的灵活性。
本申请实施例的执行主体可以为机器人,具体地,可以包括但不限于任意一种可以执行物体抓取操作的机器人。
请参阅图2,本申请实施例中一种物体抓取方法的一个实施例可以包括:
步骤S201、获取RGB图像和对应的深度图。
在本申请实施例中,可以通过预设的传感器进行RGB图像、深度图等视觉感知数据的采集,并输入至机器人的识别模块中进行处理。具体采用何种传感器可以根据实际情况进行设置,本申请实施例对此不作具体限定。
在本申请实施例的一种具体实现方式中,传感器可以为RGBD相机,通过RGBD相机可以直接采集到RGB图像和对应的深度图。
在本申请实施例的另一种具体实现方式中,传感器可以为双目相机或单目相机,可以直接采集到RGB图像,并进一步通过视差计算来得到与RGB图像对应的深度图。
需要说明的是,传感器需要与机器人的执行机构具有一定关联性,通常需要传感器可视范围与执行机构的工作空间范围有较大重叠部分。
步骤S202、根据RGB图像确定待抓取的目标物体的物体类别和物体边界框。
在本申请实施例中,识别模块可以使用预设的物体检测模型对RGB图像进行物体检测,从而得到目标物体的物体类别和物体边界框(Bounding Box)。
其中,物体检测模型为预先训练得到的用于进行物体检测的神经网络模型,可以根据实际情况采用现有技术中的任意一种神经网络模型,例如,可以包括但不限于YOLO(You Only Look Once)等模型,本申请实施例对此不作具体限定。
在对物体检测模型的训练过程中,可以首先进行RGB数据的采集,即通过传感器采集所需抓取物体的RGB图像,在具体采集过程中,尽可能考虑到执行时的环境情况,如果执行时的某些环境情况不会发生变化,则在数据采集时尽可能保证一致;如果执行时的某些环境会发生变换,则在采集数据时尽可能保证多样性以覆盖不同场景,具体环境的影响可以包括但不限于:相机分辨率,曝光,光照颜色,物体朝向,相机与物体相对位姿,待抓取物体的背景属性,是否存在遮挡等。在针对两类物体时,可以至少采集一百张图像用于网络训练,如果环境变化程度高,物体类别数目多,则相应增加训练样本数量。
在完成数据采集之后,可以根据实际情况采用现有技术中的任意一种标注方式或标注工具对采集的数据进行标注,其中,标注信息可以包括物体类别和物体边界框。
将完成数据标注后,可以将标注好的数据分为训练集和验证集,训练集数据分配通常多于验证集数据,然后进行网络训练,即可得到用于物体分类和跟踪的物体检测模型,该物体检测模型的输入数据为RGB图像,输出数据为图像中各个物体的物体类别和物体边界框。
在本申请实施例中,可以从检测到的各个物体中选取任意一个物体作为目标物体,也可以根据具体的应用场景选取符合要求的某个物体作为目标物体,本申请实施例对目标物体的选取方式不作具体限定。
识别模块在确定目标物体的物体类别之后,可以向机器人的规划模块以及操作模块发送目标物体的物体类别。
步骤S203、根据深度图和物体边界框确定针对目标物体的目标抓取位姿。
在本申请实施例中,识别模块可以首先根据深度图和物体边界框确定目标物体的物体深度图,例如,可以将目标物体的物体边界框与深度图进行取与操作,从而得到仅有目标物体部分的物体深度图。
在确定物体深度图之后,识别模块可以对物体深度图进行截断符号距离函数(Truncated Signed Distance Function,TSDF)数据格式转换,得到目标物体的TSDF数据,并使用预设的抓取位姿生成模型对TSDF数据进行处理,从而得到目标抓取位姿。
其中,抓取位姿生成模型为预先训练得到的用于进行抓取位姿生成的神经网络模型,可以根据实际情况采用现有技术中的任意一种神经网络模型,例如,可以包括但不限于抓取检测点生成网络(Volumetric Grasping Network,VGN)等模型,本申请实施例对此不作具体限定。
通过抓取位姿生成模型可以得到一系列的六维(6D)抓取位姿,抓取位姿生成模型在输出6D抓取位姿的同时会输出与之相对应的得分,分数范围为[0,1],分数越高表示抓取稳定性越高。在本申请实施例中,可以从中选取分数大于预设的分数阈值的6D抓取位姿作为针对目标物体的目标抓取位姿。其中,分数阈值的具体取值可以根据实际情况进行设置,例如,可以将其设置为0.6、0.7、0.8或者其它取值,本申请实施例对此不作具体限定。
在对抓取位姿生成模型的训练过程中,可以首先进行抓取数据的生成,在仿真环境中随机生成若干个物体,然后通过随机采样物体上的点云信息,来生成对应的抓取并执行,如果抓取成功则将该抓取标记为成功并记录环境,如果抓取失败则将该抓取标记为失败并记录环境,抓取失败的情况可以包括但不限于抓起物体但掉落、没有抓起物体、与其它物体发生碰撞或与环境发生碰撞等等。重复执行生成环境、生成抓取、执行抓取,直到采集到足够多的抓取数据。这种抓取数据的生成主要通过采样算法实现,一般失败情况多于成功情况,因此可以尽可能多的进行采样,直至采集足够多(例如,20万组)的成功样本,物体可以包括尽可能多的类别,以提高所训练模型的鲁棒性。
在完成抓取数据生成之后,可以对抓取数据进行清洗,剔除其中的无效样本,并使正负样本数量一致,即训练数据集中有一半的成功抓取样本和一半的失败抓取样本。
清洗之后,可以将抓取数据作为训练样本进行模型训练,即可得到能够自主生成6D抓取位姿的抓取位姿生成模型,该模型的输入数据为TSDF数据,输出为一连串的6D抓取位姿和对应的得分,得分越接近1,则模型认为该抓取越稳定,成功率越高。
步骤S204、根据物体类别确定目标物体的目标归置位置。
在本申请实施例中,可以为根据不同的物体类别,设置对应的不同的归置位置,即可以把不同类别的物体放到不同的地方,以实现分类功能。物体类别与归置位置之间的对应关系可以根据实际情况进行设置,本申请实施例对此不作具体限定。
规划模块在接收到识别模块发送的目标物体的物体类别之后,可以基于该对应关系确定出与目标物体的物体类别对应的归置位置,将其记为目标归置位置。
步骤S205、根据机器人的执行机构的当前位置、目标抓取位姿和目标归置位置,确定执行机构的规划路径。
在具体的抓取场景中,由于目标抓取位姿与目标物体过于接近,在进行碰撞检测时容易判断为发生碰撞,因此可以由识别模块分别确定与目标抓取位姿对应的预抓取位姿和预返回位姿。预抓取位姿和预返回位姿可以在目标抓取位姿的附近区域任意选取,以与目标抓取位姿足够接近,且不至于检测到碰撞为宜。
识别模块还可以对目标抓取位姿、预抓取位姿和预返回位姿进行后处理,如果满足后处理条件则对其进行输出,如果不满足条件则返回执行步骤S203,重新生成新的目标抓取位姿。其中,后处理条件可以包括但不限于:满足机械臂逆运动学解,在工作空间范围内,和/或,目标抓取位姿的得分足够高。
对于判断是否满足机械臂逆运动学解而言,可以将生成的目标抓取位姿从相机坐标系下变换到执行机构基座坐标系下,而后根据执行机构逆运动学解算判断是否有解。若无解则说明该目标抓取位姿不可到达,需要舍弃。
对于判断是否在工作空间范围内而言,因为大多数时候执行机构都不是单独存在,而是环境中通常有固定的碰撞物,比如以人形机器人为例,尽管在机器人的腰部位置,手臂存在逆解,但是手臂会在该点处发生碰撞,故不在工作空间内,对于超出工作空间范围的情况需要进行舍弃。
对于判断目标抓取位姿的得分是否足够高而言,步骤S203已经基于分数阈值进行了一次筛选,但如果有多个目标抓取位姿满足其它后处理要求,则需要在其中二次选择得分最高的目标抓取位姿。
在完成后处理之后,识别模块可以将目标抓取位姿发送给操作模块,将预抓取位姿和预返回位姿发送给规划模块,
规划模块在接收到预抓取位姿和预返回位姿之后,可以基于深度图确定由当前位置至预抓取位姿的第一无碰撞规划路径,并确定由预返回位姿至目标归置位置的第二无碰撞规划路径。
在本申请实施例中,可以根据实际情况采取现有技术中的任意一种路径规划算法,但出于动态性能考虑,期望所采取的路径规划算法的规划速度尽可能快,例如,可以采取RRT-Connect等路径规划算法,本申请实施例对此不作具体限定。
规划模块在完成路径规划之后,可以将规划得到的第一无碰撞规划路径和第二无碰撞规划路径发送到操作模块。
步骤S206、控制执行机构按照规划路径对目标物体进行抓取操作。
操作模块在接收到识别模块发送的目标抓取位姿,以及规划模块发送的第一无碰撞规划路径和第二无碰撞规划路径之后,可以分阶段执行整个抓取操作。
首先,操作模块可以控制执行机构按照第一无碰撞规划路径由当前位置运动至预抓取位姿。在本申请实施例的一种具体实现方式中,操作模块可以对第一无碰撞规划路径进行进一步插值处理,得到可以供电机执行的高频信号,并将其发送给电机执行。
在到达预抓取位姿之后,操作模块可以控制执行机构通过插值由预抓取位姿运动至目标抓取位姿。
当到达目标抓取位姿时,操作模块可以控制执行机构抓取目标物体,例如,可以闭合执行机构末端抓取部位,以夹持目标物体。
抓取到目标物体之后,操作模块可以控制执行机构通过插值由目标抓取位姿运动至预返回位姿。
在到达预返回位姿之后,操作模块可以控制执行机构按照第二无碰撞规划路径由预返回位姿运动至目标归置位置。在本申请实施例的一种具体实现方式中,操作模块可以对第二无碰撞规划路径进行进一步插值处理,得到可以供电机执行的高频信号,并将其发送给电机执行。
在到达目标归置位置之后,操作模块可以控制执行机构放置目标物体,例如,可以张开执行机构末端抓取部分,以放置目标物体。
在执行完成整个抓取操作之后,操作模块可以将操作完成的信号发送给识别模块和规划模块,此时机器人可以重新执行新的物体抓取流程。
在本申请实施例的一种具体实现方式中,考虑到抓取任务的复杂性,机器人还可以实现动态性能,即当在环境存在外界影响,导致目标物体发生移动后,执行机构仍然能够处理,实时地进行反应,执行新的抓取。
识别模块在确定出物体边界框之后,可以根据物体边界框判断目标物体是否发生移动。具体地,可以检测物体边界框在一定的窗口时间内是否足够平滑,若是,则记录其位置为pk,继续检测物体边界框在下一个窗口时间内是否足够平滑,若是,则记录新的pk,原来的位置记为pk-1。
在得到连续的两个窗口时间的物体边界框的位置之后,可以计算物体边界框的位置变化量,也即pk与pk-1之间的像素距离。若位置变化量大于预设的位置变化量阈值,则判定目标物体发生移动;若位置变化量小于或等于位置变化量阈值,则判定目标物体未发生移动。
若目标物体发生移动,则可以结束当前的物体抓取流程,并重新执行新的物体抓取流程。具体地,识别模块在判定目标物体发生移动之后,可以清空程序中所保存的最高得分抓取位姿,重新获取新的视觉感知数据并确定新的抓取位姿。识别模块还可以发送物体移动的信号给规划模块和执行模块,规划模块在收到物体移动的信号之后,可以清空程序中所保存的已接收到的预抓取位姿、预返回位姿和物体类别信息,重新等待识别模块发送新的数据。操作模块若在由当前位置运动至预抓取位姿时,或在由预抓取位姿运动至目标抓取位姿时接收到物体移动的信号,可以重新等待识别模块和规划模块发送新的数据;若在其它阶段接收到物体移动的信号,则可以不做处理。
如图2所示,在本申请实施例中,通过识别模块、规划模块、操作模块的各自处理与数据交互可以将整个物体抓取过程串联起来,实现针对物体的自主动态分类抓取,保证了在复杂的环境中将不同类别的物体归置到不同位置,并在执行过程中具有抗外界干扰的动态特性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的一种物体抓取方法,图3示出了本申请实施例提供的一种物体抓取装置的一个实施例结构图。
本实施例中,一种物体抓取装置可以包括:
图像获取模块301,用于获取RGB图像和对应的深度图;
物体信息确定模块302,用于根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;
抓取位姿确定模块303,用于根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;
归置位置确定模块304,用于根据所述物体类别确定所述目标物体的目标归置位置;
规划路径确定模块305,用于根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;
抓取操作控制模块306,用于控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。
在本申请实施例的一种具体实现方式中,所述物体信息确定模块可以具体用于:使用预设的物体检测模型对所述RGB图像进行物体检测,得到所述目标物体的所述物体类别和所述物体边界框;
其中,所述物体检测模型为预先训练得到的用于进行物体检测的神经网络模型。
在本申请实施例的一种具体实现方式中,所述抓取位姿确定模块可以包括:
物体深度图确定单元,用于根据所述深度图和所述物体边界框确定所述目标物体的物体深度图;
数据格式转换单元,用于对所述物体深度图进行TSDF数据格式转换,得到所述目标物体的TSDF数据;
抓取位姿生成单元,用于使用预设的抓取位姿生成模型对所述TSDF数据进行处理,得到所述目标抓取位姿;
其中,所述抓取位姿生成模型为预先训练得到的用于进行抓取位姿生成的神经网络模型。
在本申请实施例的一种具体实现方式中,所述规划路径确定模块可以包括:
预抓取和预返回位姿确定单元,用于分别确定与所述目标抓取位姿对应的预抓取位姿和预返回位姿;
规划路径确定单元,用于确定由所述当前位置至所述预抓取位姿的第一无碰撞规划路径,并确定由所述预返回位姿至所述目标归置位置的第二无碰撞规划路径。
在本申请实施例的一种具体实现方式中,所述抓取操作控制模块可以包括:
第一控制单元,用于控制所述执行机构按照所述第一无碰撞规划路径由所述当前位置运动至所述预抓取位姿;
第二控制单元,用于控制所述执行机构通过插值由所述预抓取位姿运动至所述目标抓取位姿;
第三控制单元,用于控制所述执行机构抓取所述目标物体;
第四控制单元,用于控制所述执行机构通过插值由所述目标抓取位姿运动至所述预返回位姿;
第五控制单元,用于控制所述执行机构按照所述第二无碰撞规划路径由所述预返回位姿运动至所述目标归置位置;
第六控制单元,用于控制所述执行机构放置所述目标物体。
在本申请实施例的一种具体实现方式中,所述物体抓取装置还可以包括:
物体移动判断模块,用于根据所述物体边界框判断所述目标物体是否发生移动;
物体移动处理模块,用于若所述目标物体发生移动,则结束当前的物体抓取流程,并重新执行新的物体抓取流程。
在本申请实施例的一种具体实现方式中,所述物体移动判断模块可以具体用于:计算所述物体边界框的位置变化量;若所述位置变化量大于预设的位置变化量阈值,则判定所述目标物体发生移动;若所述位置变化量小于或等于所述位置变化量阈值,则判定所述目标物体未发生移动。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图4示出了本申请实施例提供的一种机器人的示意框图,为了便于说明,仅示出了与本申请实施例相关的部分。
如图4所示,该实施例的机器人4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个物体抓取方法实施例中的步骤,例如图1所示的步骤S101至步骤S106。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至模块306的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述机器人4中的执行过程。
本领域技术人员可以理解,图4仅仅是机器人4的示例,并不构成对机器人4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述机器人4还可以包括输入输出设备、网络接入设备、总线等。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述机器人4的内部存储单元,例如机器人4的硬盘或内存。所述存储器41也可以是所述机器人4的外部存储设备,例如所述机器人4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述机器人4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述机器人4所需的其它程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/机器人和方法,可以通过其它的方式实现。例如,以上所描述的装置/机器人实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种物体抓取方法,其特征在于,包括:
获取RGB图像和对应的深度图;
根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;
根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;
根据所述物体类别确定所述目标物体的目标归置位置;
根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;
控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。
2.根据权利要求1所述的物体抓取方法,其特征在于,所述根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框,包括:
使用预设的物体检测模型对所述RGB图像进行物体检测,得到所述目标物体的所述物体类别和所述物体边界框;
其中,所述物体检测模型为预先训练得到的用于进行物体检测的神经网络模型。
3.根据权利要求1所述的物体抓取方法,其特征在于,所述根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿,包括:
根据所述深度图和所述物体边界框确定所述目标物体的物体深度图;
对所述物体深度图进行TSDF数据格式转换,得到所述目标物体的TSDF数据;
使用预设的抓取位姿生成模型对所述TSDF数据进行处理,得到所述目标抓取位姿;
其中,所述抓取位姿生成模型为预先训练得到的用于进行抓取位姿生成的神经网络模型。
4.根据权利要求1所述的物体抓取方法,其特征在于,所述根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径,包括:
分别确定与所述目标抓取位姿对应的预抓取位姿和预返回位姿;
确定由所述当前位置至所述预抓取位姿的第一无碰撞规划路径,并确定由所述预返回位姿至所述目标归置位置的第二无碰撞规划路径。
5.根据权利要求4所述的物体抓取方法,其特征在于,所述控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作,包括:
控制所述执行机构按照所述第一无碰撞规划路径由所述当前位置运动至所述预抓取位姿;
控制所述执行机构通过插值由所述预抓取位姿运动至所述目标抓取位姿;
控制所述执行机构抓取所述目标物体;
控制所述执行机构通过插值由所述目标抓取位姿运动至所述预返回位姿;
控制所述执行机构按照所述第二无碰撞规划路径由所述预返回位姿运动至所述目标归置位置;
控制所述执行机构放置所述目标物体。
6.根据权利要求1至5中任一项所述的物体抓取方法,其特征在于,在根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框之后,还包括:
根据所述物体边界框判断所述目标物体是否发生移动;
若所述目标物体发生移动,则结束当前的物体抓取流程,并重新执行新的物体抓取流程。
7.根据权利要求6所述的物体抓取方法,其特征在于,所述根据所述物体边界框判断所述目标物体是否发生移动,包括:
计算所述物体边界框的位置变化量;
若所述位置变化量大于预设的位置变化量阈值,则判定所述目标物体发生移动;
若所述位置变化量小于或等于所述位置变化量阈值,则判定所述目标物体未发生移动。
8.一种物体抓取装置,其特征在于,包括:
图像获取模块,用于获取RGB图像和对应的深度图;
物体信息确定模块,用于根据所述RGB图像确定待抓取的目标物体的物体类别和物体边界框;
抓取位姿确定模块,用于根据所述深度图和所述物体边界框确定针对所述目标物体的目标抓取位姿;
归置位置确定模块,用于根据所述物体类别确定所述目标物体的目标归置位置;
规划路径确定模块,用于根据机器人的执行机构的当前位置、所述目标抓取位姿和所述目标归置位置,确定所述执行机构的规划路径;
抓取操作控制模块,用于控制所述执行机构按照所述规划路径对所述目标物体进行抓取操作。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的物体抓取方法的步骤。
10.一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的物体抓取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311816588.3A CN117798911A (zh) | 2023-12-26 | 2023-12-26 | 一种物体抓取方法、装置、计算机可读存储介质及机器人 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311816588.3A CN117798911A (zh) | 2023-12-26 | 2023-12-26 | 一种物体抓取方法、装置、计算机可读存储介质及机器人 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117798911A true CN117798911A (zh) | 2024-04-02 |
Family
ID=90421203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311816588.3A Pending CN117798911A (zh) | 2023-12-26 | 2023-12-26 | 一种物体抓取方法、装置、计算机可读存储介质及机器人 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117798911A (zh) |
-
2023
- 2023-12-26 CN CN202311816588.3A patent/CN117798911A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11338435B2 (en) | Gripping system with machine learning | |
US9089966B2 (en) | Workpiece pick-up apparatus | |
US11741701B2 (en) | Autonomous task performance based on visual embeddings | |
US11205276B2 (en) | Object tracking method, object tracking device, electronic device and storage medium | |
CN111085997A (zh) | 基于点云获取和处理的抓取训练方法及系统 | |
WO2010099035A1 (en) | Body feature detection and human pose estimation using inner distance shape contexts | |
CN111091739B (zh) | 自动驾驶场景的生成方法、装置和存储介质 | |
CN109444146A (zh) | 一种工业加工产品的缺陷检测方法、装置及设备 | |
CN109955244B (zh) | 一种基于视觉伺服的抓取控制方法、装置和机器人 | |
CN110756462B (zh) | 电源适配器测试方法、装置、系统、控制装置及存储介质 | |
CN114952809A (zh) | 工件识别和位姿检测方法、系统及机械臂的抓取控制方法 | |
CN110673607B (zh) | 动态场景下的特征点提取方法、装置、及终端设备 | |
CN116416444B (zh) | 物体抓取点估计、模型训练及数据生成方法、装置及系统 | |
CN113172636B (zh) | 一种自动手眼标定方法、装置及存储介质 | |
CN114310892B (zh) | 基于点云数据碰撞检测的物体抓取方法、装置和设备 | |
CN117798911A (zh) | 一种物体抓取方法、装置、计算机可读存储介质及机器人 | |
CN113894779A (zh) | 一种应用于机器人交互的多模态数据处理方法 | |
CN112927278A (zh) | 控制方法、装置、机器人及计算机可读存储介质 | |
WO2022252959A1 (zh) | 机械臂控制方法、装置、电子设备和计算机可读存储介质 | |
CN117745824A (zh) | 抓取位姿生成方法、装置、电子设备及可读存储介质 | |
CN116587267A (zh) | 一种物体抓取方法、装置、计算机可读存储介质及机器人 | |
CN117325175A (zh) | 一种基于多视图融合的机械臂抓取方法、系统及机械臂 | |
Mohammed et al. | Deep Reinforcement Learning-Based Robotic Grasping in Clutter and Occlusion. Sustainability 2021, 13, 13686 | |
CN112837371A (zh) | 基于3d匹配的物体抓取方法、装置及计算设备 | |
CN117670928A (zh) | 对象跟踪方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |