CN109870983B - 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 - Google Patents

处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 Download PDF

Info

Publication number
CN109870983B
CN109870983B CN201810014627.0A CN201810014627A CN109870983B CN 109870983 B CN109870983 B CN 109870983B CN 201810014627 A CN201810014627 A CN 201810014627A CN 109870983 B CN109870983 B CN 109870983B
Authority
CN
China
Prior art keywords
image
stack
data
model
stacking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810014627.0A
Other languages
English (en)
Other versions
CN109870983A (zh
Inventor
李天剑
李鹏成
黄民
陈猛
刘诗晗
李宝杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Shangke Information Technology Co Ltd
Beijing Information Science and Technology University
Original Assignee
Beijing Jingdong Shangke Information Technology Co Ltd
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Shangke Information Technology Co Ltd, Beijing Information Science and Technology University filed Critical Beijing Jingdong Shangke Information Technology Co Ltd
Publication of CN109870983A publication Critical patent/CN109870983A/zh
Application granted granted Critical
Publication of CN109870983B publication Critical patent/CN109870983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Warehouses Or Storage Devices (AREA)

Abstract

本申请公开一种处理托盘堆垛图像的方法、装置及用于仓储拣货的系统。涉及计算机信息处理领域,该方法包括:获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。本申请公开的处理托盘堆垛图像的方法、装置及用于仓储拣货的系统,采用深度相机和彩色相机相结合实现了对垛形的准确识别,有利于机械手进行拆垛处理和后续工作。

Description

处理托盘堆垛图像的方法、装置及用于仓储拣货的系统
本公开要求申请日为2017年12月4日、申请号为CN201711262905.6、发明创造名称为《仓储拣货机器人系统》的发明专利申请的优先权。
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种处理托盘堆垛图像的方法、装置及用于仓储拣货的系统。
背景技术
工业4.0时代,随着人工智能(AI)技术的逐渐成熟和人力成本的升高,物流业对于AI的需求也越来越大,无人仓储,无人分拣,无人运输等物流发展上的需求,使AI逐渐映入人们的眼帘。基于人工智能和机器视觉的无人仓储或将成为AI+概念下的一个重要突破点。
在无人仓储,拆零拣选是一个重要作业环节。面对各种各样的商品尺寸及垛型,目前机器人很难做到高效的自动拆垛。由于对商品垛型的机器视觉检测方法还不成熟,大多需要仍人工拆垛,较难实现机器人自动化拆零拣选。
因此,需要一种新的处理托盘堆垛图像的方法、装置及用于仓储拣货的系统。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种处理托盘堆垛图像的方法、装置及用于仓储拣货的系统,采用深度相机和彩色相机相结合实现了对垛形的准确识别,有利于机械手进行拆垛处理和后续工作。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提出一种处理托盘堆垛图像的方法,该方法包括:获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。
在本公开的一种示例性实施例中,还包括:机械手通过所述托盘堆垛的参数,进行自动拆垛处理;以及其中,所述托盘堆垛的参数包括:纸箱中心坐标,纸箱倾斜角度,以及距离相机深度。
在本公开的一种示例性实施例中,还包括:通过托盘堆垛图像数据训练卷积神经网络模型,以获取所述识别模型。
在本公开的一种示例性实施例中,所述卷积神经网络模型,包括:Faster-RCNN模型;共享卷基层;以及RPN网络模型。
在本公开的一种示例性实施例中,通过模拟的托盘堆垛图像数据训练神经网络模型,以获取所述识别模型。
在本公开的一种示例性实施例中,所述通过模拟的托盘堆垛图像数据训练神经网络模型,以获取所述识别模型,包括:绘制矩形三维模型;以及将实际纸箱二维图像贴敷于所述三维模型以生成所述模拟的托盘堆垛图像数据。
在本公开的一种示例性实施例中,所述通过托盘堆垛图像数据训练神经网络模型,以获取所述识别模型,还包括:在所述神经网络模型训练时,引入模型误差。
在本公开的一种示例性实施例中,所述获取托盘堆垛的三基色图像与深度图像,包括:通过彩色相机获取托盘堆垛的三基色图像;以及通过深度相机获取托盘堆垛的深度图像。
在本公开的一种示例性实施例中,所述通过所述三基色图像与所述深度图像生成堆垛数据,包括:将所述深度图像进行预处理,以获得与所述三基色图像相同尺寸的第一图像;以及通过图像金字塔算法将所述第一图像与所述三基色图像进行对应,进而生成所述堆垛数据。
在本公开的一种示例性实施例中,所述将所述深度图像进行预处理,包括:将所述深度图像进行形态学处理。
根据本发明的一方面,提出一种处理托盘堆垛图像的装置,该装置包括:图像模块,用于获取托盘堆垛的三基色图像与深度图像;处理模块,用于通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;识别模块,用于将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及参数模块,用于对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。
在本公开的一种示例性实施例中,还包括:模型模块,用于通过托盘堆垛图像数据训练卷积神经网络模型,以获取所述识别模型。
根据本发明的一方面,提出一种用于仓储拣货的系统,该系统包括:拣选车,用于拣选对应的货物;所述拣选车包括:指令控制模块,用于获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数;机械手,用于通过所述托盘堆垛的参数将待拣选货物放置到所述拣选车中。
根据本发明的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
根据本发明的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
根据本发明的处理托盘堆垛图像的方法、装置及用于仓储拣货的系统,采用深度相机和彩色相机相结合实现了对垛形的准确识别,有利于机械手进行拆垛处理和后续工作。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种处理托盘堆垛图像的方法的系统框图。
图2是根据一示例性实施例示出的一种处理托盘堆垛图像的方法的流程图。
图3是根据另一示例性实施例示出的一种处理托盘堆垛图像的方法的示意图。
图4是根据另一示例性实施例示出的一种处理托盘堆垛图像的方法的流程图。
图5是根据一示例性实施例示出的一种处理托盘堆垛图像的方法中的识别效果图。
图6是根据一示例性实施例示出的一种处理托盘堆垛图像的装置的框图。
图7是根据一示例性实施例示出的一种用于仓储拣货的系统的框图。
图8是根据一示例性实施例示出的一种电子设备的框图。
图9示意性示出本公开示例性实施例中一种计算机可读存储介质示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。
图1是根据一示例性实施例示出的一种处理托盘堆垛图像的方法的系统框图。
如图1所示,用于仓储拣货的系统架构100可以包括拣选车101、拣选车102、穿梭车103,网络104和服务器105。网络104用以在拣选车101、拣选车102、穿梭车103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。拣选车101、拣选车102、穿梭车103上可以安装有各种控制类的客户端应用。拣选车101、拣选车102、穿梭车103可以是具有拣货功能的运输设备。
服务器105可以是提供各种服务的服务器,例如拣选车101、拣选车102、穿梭车103提供数据支持服务功能。数据支持服务器105可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标拣货信息、库存信息)反馈给拣选车101、拣选车102、或穿梭车103。需要说明的是,本申请实施例中,服务器105与拣选车101、拣选车102之间存在通信,拣选车101、拣选车102与穿梭车103之间存在通信,而数据支持服务器105与穿梭车103之间没有直接的通信联系。穿梭车103的控制指令来源于拣选车101或拣选车102,穿梭车103的与拣选车101或拣选车102之间的通信联系也可借助于网络104进行。而且,穿梭车103的控制指令来源于数据支持服务器105的情况也被包含在本公开的内容中。
在该示例性实施方式中,本发明提出的处理托盘堆垛图像的方法是以应用于大型电商仓储的货物拣选为例进行说明的。本领域技术人员容易理解的是,为将处理托盘堆垛图像的方法应用于其他领域的仓储货物拣选,而对下述的具体实施方式做出多种改型、添加、替代、删除或其他变化,这些变化仍在本发明提出的处理托盘堆垛图像的方法的原理的范围内。
图2是根据一示例性实施例示出的一种处理托盘堆垛图像的方法的流程图。
如图2所示,在S202中,获取托盘堆垛的三基色图像与深度图像。例如,通过彩色相机获取托盘堆垛的三基色(RGB)图像;以及通过深度相机获取托盘堆垛的深度图像。在本申请中,彩色相机是常见的数码相机。深度相机是一种特殊的相机,和传统相机不同,除了能拍出物体的平面图像外,还能测量出物体到相机位置的距离,从而实现3D(深度)成像。
在S204中,通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据。例如,将所述深度图像进行预处理,以获得与所述三基色图像相同尺寸的第一图像;以及通过图像金字塔算法将所述第一图像与所述三基色图像进行对应,进而生成所述堆垛数据。在本公开的一种示例性实施例中,所述将所述深度图像进行预处理,包括:将所述深度图像进行形态学处理。
在一个实施例中,深度相机和彩色相机获取到垛内所有箱子的深度图像和RGB图像的图像尺寸是不相同的,在深度相机中得到的图像尺寸为:512X424,在彩色相机中得到的图像尺寸为1920X1080。由于深度空间和RGB空间的像素尺寸是不一样的,并且深度图像的长宽比例和RGB图像的长宽比例也是不一样的,所以需要首先进行预处理,以便将这两种图像的尺寸等同,然后再进行映射。
在一个实施例中,例如在图像映射的过程中,通过循环依次访问上一步找的深度图像所有边缘像素,依次映射到RGB图像上,但由于深度图像尺寸小,RGB图像尺寸大,这样小尺寸映射大尺寸是像素点是离散的,所以要进行形态学处理,对其进行膨胀与腐蚀,再通过金字塔方法把RGB和深度图像对应上,最终得到RGB-D的四通道图像。RGB-D的四通道图像可作为堆垛数据进行后续处理。
在一个实施例中,形态学处理包括:膨胀与腐蚀,膨胀与腐蚀能够实现以下作用:1.消除噪声;2.分割出独立的图像元素,在图像中连接相邻的元素;3.寻找图像中的明显的极大值区域或者极小值区域;4.求出图像的梯度。
在S206中,将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标。例如,在caffe(Convolutional Architecturefor Fast Feature Embedding)的框架下,通过在识别模型进行物体识别和坐标标注的方法。caffe是一种常用的深度学习框架,在视频、图像处理方面应用较多。
可例如,采集实际物流仓库的中的大量垛型的真实图片,建立仓库数据集,包括箱子、托盘、垛型,借助开源的数据标注工具labelImg来制作训练集,最后利用caffe框架搭建Faster RCNN模型并进行训练,通过训练好的模型来识别输入的RGB-D的四通道图像。
在S208中,对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。输入的RGB-D的四通道图像经过识别模型中的四层单元的卷积层,再经过三层全连接层。最终的得到最上层待抓取纸箱的边框。得到边框之后,通过计算框的四个角,得出框的中心坐标的x,y。再将x,y映射到深度空间中(映射方法同上),通过深度相机和彩色相机的标定,得到纸箱中心坐标,纸箱倾斜角度,以及纸箱距离相机深度。
在本公开的一种示例性实施例中,还包括:机械手通过所述托盘堆垛的参数,进行自动拆垛处理;以及其中,所述托盘堆垛的参数包括:纸箱中心坐标,纸箱倾斜角度,以及距离相机深度。
根据本发明的处理托盘堆垛图像的方法,通过对三维视觉与深度学习相结合的方式,实时测量纸箱类商品托盘垛的顶层分布,为机械手实现自动拆垛提供实时抓取位置标定,进而实现由操作机械手的运动完成对托盘垛商品的拆零拣选。
根据本发明的处理托盘堆垛图像的方法,采用深度图像和彩色图像相结合的方法完成垛型的识别,如果单独用彩色图像,因为仓库的环境比较复杂,会出现很多干扰,如果单独用深度图像,因为摆放紧密,便又无法准确的逐个把箱子分割开,在本申请中采用深度相机和彩色相机相结合的方式实现了对垛形的准确识别。
应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。
在本公开的一种示例性实施例中,还包括:通过托盘堆垛图像数据训练卷积神经网络模型,以获取所述识别模型。其中,所述卷积神经网络模型,包括:Faster-RCNN模型;共享卷基层;以及RPN网络模型。
在一个实施例中,卷积神经网络基本结构主要是参考SSD检测算法而改进的。网络模型中的是基本网络RCNN,但是将RCNN后面的用于分类的全连接层(例如FC6和FC7层等)全部去掉。而在RCNN后面依次加上Conv6、Conv7、Conv8_2(包括1*1*256和3*3*512-s2两层卷积操作)以及Conv9_2(包括1*1*128和3*3*256-s2两层卷积操作)卷积层。其基本结构如图3所示。
将任意大小RGB-D图像输入已经训练好的深度神经网络,由卷积神经网络的特征提取后,经过根据RCNN、Conv7、Conv8_2和Conv9_2卷积层得到的四种不同尺度的特征图来预测物体边界框(Bounding Box)的位置以及相应的置信度(置信度是目标检测结果可信的程度),最后显示出纸箱的所在的边界框和中心坐标,检测结束。
由于本发明所用的识别模型是在Faster-RCNN的基础上通过共享卷积层,并新增了RPN网络。对于新增的网络需要重新训练,而对于Faster-RCNN网络只需在此基础上进行微调(fine-tuning)即可。本发明的实施例中,将RPN和Faster-RCNN采用联合训练的机制,这样两个网络能够同时共享卷积层并通过交替优化来学习共享的特征。
RPN训练。该网络有ZF模型或VGG16模型或VGG1024模型作为共享卷积层,将本发明提出的RPN网络连接在共享卷积层之后。该网络用ImageNet(ImageNet是一个计算机视觉系统识别项目名称,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。)预训练的模型初始化,RPN网络的权重采用均值为0,标准差为0.01的高斯分布进行初始化。用PASCAL数据集来对本发明的模型进行训练,最终得到RPN网络模型的参数;
1)Fast-RCNN训练。该网络在Faster-RCNN模型的基础上将前面卷积层(共享卷积层)替换为训练RPN网络时的模型,同时固定RPN网络的参数。Faster-RCNN模型直接使用已经训练好的模型进行权值的初始化。该模型同样使用PASCAL数据集进行训练。
2)RPN微调。此步骤中采用训练好的Faster-RCNN中的共享卷积层,固定共享卷积层,只微调RPN网络,让RPN网络得到训练,此时这两个网络就可以共享卷积层。此步骤中使用实验收集的数据(托盘和货物)对网络进行训练。
3)Faster-RCNN微调。采用共享卷积层,同时对Faster-RCNN中的FC层进行微调,此时这两个网络就形成了一个统一的网络。此步骤中使用实验收集的数据对网络进行训练。
在本公开的一种示例性实施例中,所述通过托盘堆垛图像数据训练神经网络模型,以获取所述识别模型,还包括:在所述神经网络模型训练时,引入模型误差。在仿真中人为引入模型误差,这样训练出来的结果起码能对付人工引入的噪声;定量衡量一个图像检索的抗干扰能力,以此作为依据在多个候选解中取最优。问题的复杂度降低后,仿真的失真带来的不利影响也随之变小。再加上噪声的情况下,让图像在对垛检索的时候能进一步的模仿现实的情况。
由于现实中的RGB-D四通道图像十分少见,所以想采集足够多的RGB-D的样本原来训练神经网络也非常困难,在一个实施例中,本申请中通过模拟的托盘堆垛图像数据训练神经网络模型,以获取所述识别模型,例如,绘制矩形三维模型;以及将实际纸箱二维图像贴敷于所述三维模型以生成所述模拟的托盘堆垛图像数据。具体如下:
1)首先,用AutoCAD软件手绘出若干矩形模拟堆垛时的样子,例如:完全没有经过任何操作的完整的堆垛,或者拆了几个箱子的剁,在由AutoCAD软件的二维图通过三维建模软件直接转换到各种不同垛的三维点云模型。在3D计算机图形中,Depth Map(深度图)是包含与视点的场景对象的表面的距离有关的信息的图像或图像通道。其中,DepthMap类似于灰度图像,只是它的每个像素值是传感器距离物体的实际距离。通常RGB图像和Depth是一一对应的。
2)把真实纸箱的二维RGB图像贴在三维模型上,让三维模型有颜色,看起来更接近真实纸箱图像。让虚拟出来的训练数据,足够相似于真实采集的数据。
3)在三维建模软件中截取不同的角度,并且把数据保存在相应的数据集中,作为深度神经网络的训练对象。例如,将1500个不同垛型的3D模型,随机摆成各种姿态并渲染出深度摄像头拍摄到的点云。在每种姿态下再随机生成最多100个候选框。按正态分布随机选取,最终总共得到了多达六百七十万个不同的点云+最上层纸箱框的组合。最后将每一张点云图进行旋转缩放,让每张图片中的边框都能框住。
把这模拟出来的图像数据,以RGB-D的形式,输入到神经网络中,以获取识别模型。
图4是根据另一示例性实施例示出的一种处理托盘堆垛图像的方法的流程图。图4是对本申请中的处理托盘堆垛图像的方法的示例性描述。
如图4所示,在S402中,通过深度相机获取深度图像,并将深度图像进行预处理。
在S404中,通过彩色相机获取彩色图像。
在S406中,通过深度图像与彩色图像获取四通道图像数据。
在S408中,将四通道图像数据输入识别模型中,所述识别模型通过Faster RCNN建立。
在S410中,通过识别模型获取堆垛顶层纸箱的像素坐标。
在S412中,进行相机坐标映射。
在S414中,获取纸箱中心坐标,纸箱倾斜角度,以及距离相机深度,以便机械手进行抓取工作。
通过本申请中的处理托盘堆垛图像的方法得到的纸箱图像识别效果图如图5所示。
根据本发明的处理托盘堆垛图像的方法,能够实时测量堆垛箱的顶层分布,获得各个箱子的顶部中心坐标(X,Y,Z)和箱子的方向角,为机械手实现自动拆垛提供实时数据。从而操作机械手的运动,去实现托盘垛商品的拆垛。
根据本发明的处理托盘堆垛图像的方法,通过深度学习做到目标检测,实现了对垛形的准确识别,把数据传输给机械手去拆垛和进行下一步工作,有效解决了现有技术中存在的拆垛问题。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图6是根据一示例性实施例示出的一种处理托盘堆垛图像的装置的框图。处理托盘堆垛图像的装置60包括:图像模块602,处理模块604,识别模块606,参数模块608。
其中,处理托盘堆垛图像的装置60中,图像模块602用于获取托盘堆垛的三基色图像与深度图像。例如,通过彩色相机获取托盘堆垛的三基色(RGB)图像;以及通过深度相机获取托盘堆垛的深度图像。在本申请中,彩色相机是常见的数码相机。
处理托盘堆垛图像的装置60中,处理模块604用于通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据。例如,将所述深度图像进行预处理,以获得与所述三基色图像相同尺寸的第一图像;以及通过图像金字塔算法将所述第一图像与所述三基色图像进行对应,进而生成所述堆垛数据。在本公开的一种示例性实施例中,所述将所述深度图像进行预处理,包括:将所述深度图像进行形态学处理。
处理托盘堆垛图像的装置60中,识别模块606用于将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标。例如,采集实际物流仓库的中的大量垛型的真实图片,建立仓库数据集,包括箱子、托盘、垛型,借助开源的数据标注工具labelImg来制作训练集,最后利用caffe框架搭建Faster RCNN模型并进行训练,通过训练好的模型来识别输入的RGB-D的四通道图像。
处理托盘堆垛图像的装置60中,参数模块608用于对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。输入的RGB-D的四通道图像经过识别模型中的四层单元的卷积层,再经过三层全连接层。最终的得到最上层待抓取纸箱的边框。得到边框之后,通过计算框的四个角,得出框的中心坐标的x,y。再将x,y映射到深度空间中(映射方法同上),通过深度相机和彩色相机的标定,得到纸箱中心坐标,纸箱倾斜角度,以及纸箱距离相机深度。
处理托盘堆垛图像的装置60中,还包括:模型模块(图中未示出),用于通过托盘堆垛图像数据训练卷积神经网络模型,以获取所述识别模型。通过托盘堆垛图像数据训练卷积神经网络模型,以获取所述识别模型。其中,所述卷积神经网络模型,包括:Faster-RCNN模型;共享卷基层;以及RPN网络模型。
图7是根据一示例性实施例示出的一种用于仓储拣货的系统的框图。用于仓储拣货的系统70包括:拣选车702,指令控制模块7024,机械手7026。
拣选车702用于拣选对应的货物;
拣选车702包括:指令控制模块7024用于获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。
机械手7026用于通过所述托盘堆垛的参数将待拣选货物放置到所述拣选车中。
图8是根据一示例性实施例示出的一种电子设备的框图。
下面参照图8来描述根据本发明的这种实施方式的电子设备200。图8显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图2,图4中所示的步骤。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。
图9示意性示出本公开示例性实施例中一种计算机可读存储介质示意图。
参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。
以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本发明可实施的范畴。

Claims (14)

1.一种处理托盘堆垛图像的方法,其特征在于,包括:
获取托盘堆垛的三基色图像与深度图像;
通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;
将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及
对所述识别结果进行坐标映射,获取所述托盘堆垛的参数;
其中,所述识别模型为根据卷积神经网络模型训练得到的,所述卷积神经网络模型包括:去掉全连接层的Faster-RCNN,与所述Faster-RCNN依次连接的Conv6、Conv7、Conv8_2以及Conv9_2的卷积层,以及与所述卷积层连接的RPN。
2.如权利要求1所述的方法,其特征在于,还包括:
机械手通过所述托盘堆垛的参数,进行自动拆垛处理;以及
其中,所述托盘堆垛的参数包括:纸箱中心坐标,纸箱倾斜角度,以及距离相机深度。
3.如权利要求1所述的方法,其特征在于,还包括:
通过托盘堆垛图像数据训练所述卷积神经网络模型,以获取所述识别模型。
4.如权利要求3所述的方法,其特征在于,通过模拟的托盘堆垛图像数据训练所述卷积神经网络模型,以获取所述识别模型。
5.如权利要求4所述的方法,其特征在于,所述通过模拟的托盘堆垛图像数据训练所述卷积神经网络模型,以获取所述识别模型,包括:
绘制矩形三维模型;以及
将实际纸箱二维图像贴敷于所述三维模型以生成所述模拟的托盘堆垛图像数据。
6.如权利要求4所述的方法,其特征在于,所述通过托盘堆垛图像数据训练所述卷积神经网络模型,以获取所述识别模型,还包括:
在所述卷积神经网络模型训练时,引入模型误差。
7.如权利要求1所述的方法,其特征在于,所述获取托盘堆垛的三基色图像与深度图像,包括:
通过彩色相机获取托盘堆垛的三基色图像;以及
通过深度相机获取托盘堆垛的深度图像。
8.如权利要求1所述的方法,其特征在于,所述通过所述三基色图像与所述深度图像生成堆垛数据,包括:
将所述深度图像进行预处理,以获得与所述三基色图像相同尺寸的第一图像;以及
通过图像金字塔算法将所述第一图像与所述三基色图像进行对应,进而生成所述堆垛数据。
9.如权利要求8所述的方法,其特征在于,所述将所述深度图像进行预处理,包括:
将所述深度图像进行形态学处理。
10.一种处理托盘堆垛图像的装置,其特征在于,包括:
图像模块,用于获取托盘堆垛的三基色图像与深度图像;
处理模块,用于通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;
识别模块,用于将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及
参数模块,用于对所述识别结果进行坐标映射,获取所述托盘堆垛的参数;
其中,所述识别模型为根据卷积神经网络模型训练得到的,所述卷积神经网络模型的包括:去掉全连接层的Faster-RCNN,与所述Faster-RCNN依次连接的Conv6、Conv7、Conv8_2以及Conv9_2的卷积层,以及与所述卷积层连接的RPN。
11.如权利要求10 所述的装置,其特征在于,还包括:
模型模块,用于通过托盘堆垛图像数据训练所述卷积神经网络模型,以获取所述识别模型。
12.一种用于仓储拣货的系统,其特征在于,包括:
拣选车,用于拣选对应的货物;
所述拣选车包括:
指令控制模块,用于获取托盘堆垛的三基色图像与深度图像;通过所述三基色图像与所述深度图像生成堆垛数据,所述堆垛数据为四通道图像数据;将所述堆垛数据输入到识别模型中以获取识别结果,所述识别结果包括所述托盘堆垛中顶层纸箱的像素坐标;以及对所述识别结果进行坐标映射,获取所述托盘堆垛的参数;
机械手,用于通过所述托盘堆垛的参数将待拣选货物放置到所述拣选车中;
其中,所述识别模型为根据卷积神经网络模型训练得到的,所述卷积神经网络模型包括:去掉全连接层的Faster-RCNN,与所述Faster-RCNN依次连接的Conv6、Conv7、Conv8_2以及Conv9_2的卷积层,以及与所述卷积层连接的RPN。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
CN201810014627.0A 2017-12-04 2018-01-08 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 Active CN109870983B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017112629056 2017-12-04
CN201711262905 2017-12-04

Publications (2)

Publication Number Publication Date
CN109870983A CN109870983A (zh) 2019-06-11
CN109870983B true CN109870983B (zh) 2022-01-04

Family

ID=63508872

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201810014437.9A Pending CN109867077A (zh) 2017-12-04 2018-01-08 用于仓储拣货的系统、方法、装置、拣选车及穿梭车
CN201810014627.0A Active CN109870983B (zh) 2017-12-04 2018-01-08 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统
CN201820132208.2U Active CN207876576U (zh) 2017-12-04 2018-01-25 机械手及具有该机械手的仓储拣货机器人系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201810014437.9A Pending CN109867077A (zh) 2017-12-04 2018-01-08 用于仓储拣货的系统、方法、装置、拣选车及穿梭车

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201820132208.2U Active CN207876576U (zh) 2017-12-04 2018-01-25 机械手及具有该机械手的仓储拣货机器人系统

Country Status (1)

Country Link
CN (3) CN109867077A (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109969178B (zh) * 2019-03-26 2021-09-21 齐鲁工业大学 基于多元传感器多物料自主搬运装置及方法
CN110040412A (zh) * 2019-04-24 2019-07-23 深圳市海柔创新科技有限公司 智能仓储系统、处理终端、仓储机器人及智能仓储方法
CN111768138A (zh) * 2019-06-17 2020-10-13 北京京东乾石科技有限公司 一种拣货方法、装置、设备及介质
CN110586489A (zh) * 2019-08-06 2019-12-20 广东工业大学 基于图像识别的物品分类智能车及其控制方法
CN112499075A (zh) * 2019-09-16 2021-03-16 北京京东乾石科技有限公司 货物自动拣选方法、装置和系统
CN110589331B (zh) * 2019-09-20 2024-04-05 上海发那科机器人有限公司 一种分料机器人系统及处理方法
CN111754515B (zh) * 2019-12-17 2024-03-01 北京京东乾石科技有限公司 堆叠物品的顺序抓取方法和装置
CN111126705B (zh) * 2019-12-25 2022-09-27 北京旷视机器人技术有限公司 密集仓储的搬运路径生成方法、装置及电子设备
CN111099363B (zh) * 2020-01-09 2021-10-22 湖南视比特机器人有限公司 码垛方法、码垛系统和存储介质
CN111524184B (zh) * 2020-04-21 2024-01-16 湖南视普瑞智能科技有限公司 一种基于3d视觉的智能拆垛方法及拆垛系统
CN113642817B (zh) * 2020-04-27 2024-05-24 北京京东振世信息技术有限公司 用于生成拣取任务信息的方法和装置
CN112308491A (zh) * 2020-11-09 2021-02-02 湖北普罗劳格科技股份有限公司 货物库存监测方法、装置、设备及计算机可读存储介质
CN112651297A (zh) * 2020-11-23 2021-04-13 北京旷视机器人技术有限公司 入库管理方法、装置、仓库管理系统和电子系统
CN112308922A (zh) * 2020-11-25 2021-02-02 南京鸿昌智能货架有限公司 一种基于深度学习的穿梭车自动寻货定位方法及系统
CN112818992B (zh) * 2021-02-26 2024-02-09 梅卡曼德(北京)机器人科技有限公司 一种堆垛箱体的识别方法
CN113762877B (zh) * 2021-03-25 2024-05-21 北京京东振世信息技术有限公司 一种仓库发货站台口的分配方法、装置、设备和介质
CN112793982B (zh) * 2021-03-25 2021-07-09 罗伯泰克自动化科技(苏州)有限公司 一种堆垛机取放货系统及其应用方法
CN113821002B (zh) * 2021-04-29 2024-03-08 宁波舜宇智能科技有限公司 分拣控制系统
CN113724322B (zh) * 2021-07-30 2024-05-07 上海动亦科技有限公司 一种用于无人叉车的货物托盘定位方法及系统
CN114275433B (zh) * 2021-12-30 2023-08-08 江苏永山窍档案管理服务有限公司 一种基于自动化设备任务调度的快速选择方法
CN114275437A (zh) * 2022-01-14 2022-04-05 沈阳新松机器人自动化股份有限公司 一种实现环形穿梭车智能选车的系统
CN116739478A (zh) * 2023-06-19 2023-09-12 广东云药科技有限公司 一种智能仓储人机交互货物管理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982560A (zh) * 2011-11-02 2013-03-20 微软公司 根据rgb和深度图像的表面分割
KR20160071898A (ko) * 2014-12-12 2016-06-22 동서대학교산학협력단 볼륨 컬러 패스 추출 및 채널 분리 기반의 익스플로전 디테일 제공 방법
CN106447677A (zh) * 2016-10-12 2017-02-22 广州视源电子科技股份有限公司 图像处理方法和装置
CN106573381A (zh) * 2014-06-04 2017-04-19 因特利格兰特总部有限责任公司 卡车卸载机可视化
CN106570903A (zh) * 2016-10-13 2017-04-19 华南理工大学 一种基于rgb‑d摄像头的视觉识别与定位方法
CN106709568A (zh) * 2016-12-16 2017-05-24 北京工业大学 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法
CN107341440A (zh) * 2017-05-08 2017-11-10 西安电子科技大学昆山创新研究院 基于多任务度量多核学习的室内rgb‑d场景图像识别方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996015964A1 (de) * 1994-11-24 1996-05-30 Siemens Aktiengesellschaft Kommissionierzelle
CN2665073Y (zh) * 2003-12-18 2004-12-22 云南昆船第一机械有限公司 轨道式直线型双工位穿梭车
FI126245B (fi) * 2005-03-09 2016-08-31 Konecranes Finland Oy Menetelmä paletittoman tavarakollin sijoittamiseksi ja luovuttamiseksi varastohyllystä ja kollien logistiikan hallitsemiseksi sekä laitteisto menetelmän toteuttamiseksi
JP4967318B2 (ja) * 2005-11-18 2012-07-04 ムラテックオートメーション株式会社 ストッカ
CN202864196U (zh) * 2012-09-25 2013-04-10 上海精星仓储设备工程有限公司 一种配备有自动化控制堆垛机与输送小车的自动化仓库
US9741009B2 (en) * 2013-09-09 2017-08-22 Dematic Corp. Transfer system and material-handling system and method using such transfer system
CN105184527A (zh) * 2015-07-23 2015-12-23 广东嘉腾机器人自动化有限公司 一种基于agv的仓储方法
CN105858029B (zh) * 2016-05-20 2018-07-10 湖北九州云仓科技发展有限公司 一种用于穿梭车的提升机
CN106743020A (zh) * 2017-01-10 2017-05-31 浙江思平智能科技有限公司 一种自动物料存取系统及其存取方法
CN206447090U (zh) * 2017-01-12 2017-08-29 机械工业第六设计研究院有限公司 多货位巷道式堆垛机
CN106672521B (zh) * 2017-03-30 2019-03-26 北京京东尚科信息技术有限公司 用于为物品确定存放位置的方法和装置
CN106960304B (zh) * 2017-03-31 2023-09-01 北京京东乾石科技有限公司 订单处理方法和装置
CN107215606A (zh) * 2017-05-23 2017-09-29 深圳爱淘城网络科技股份有限公司 一种分拣方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982560A (zh) * 2011-11-02 2013-03-20 微软公司 根据rgb和深度图像的表面分割
CN106573381A (zh) * 2014-06-04 2017-04-19 因特利格兰特总部有限责任公司 卡车卸载机可视化
KR20160071898A (ko) * 2014-12-12 2016-06-22 동서대학교산학협력단 볼륨 컬러 패스 추출 및 채널 분리 기반의 익스플로전 디테일 제공 방법
CN106447677A (zh) * 2016-10-12 2017-02-22 广州视源电子科技股份有限公司 图像处理方法和装置
CN106570903A (zh) * 2016-10-13 2017-04-19 华南理工大学 一种基于rgb‑d摄像头的视觉识别与定位方法
CN106709568A (zh) * 2016-12-16 2017-05-24 北京工业大学 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法
CN107341440A (zh) * 2017-05-08 2017-11-10 西安电子科技大学昆山创新研究院 基于多任务度量多核学习的室内rgb‑d场景图像识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的仓储托盘检测算法研究;刘江玉;《北京信息科技大学学报》;20170430;全文 *

Also Published As

Publication number Publication date
CN207876576U (zh) 2018-09-18
CN109867077A (zh) 2019-06-11
CN109870983A (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
CN109870983B (zh) 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统
CN111328396B (zh) 用于图像中的对象的姿态估计和模型检索
CN109816725B (zh) 一种基于深度学习的单目相机物体位姿估计方法及装置
US20210209797A1 (en) Point-based object localization from images
CN111161349B (zh) 物体姿态估计方法、装置与设备
CN107545263B (zh) 一种物体检测方法及装置
CN109409327B (zh) 基于端到端深度神经网络的rru模块物件位姿检测方法
CN111680678B (zh) 目标区域识别方法、装置、设备及可读存储介质
CN113052109A (zh) 一种3d目标检测系统及其3d目标检测方法
US20240153138A1 (en) Methods, systems, and computer-readable storage mediums for positioning target object
CN111445523A (zh) 果实位姿计算方法、装置、计算机设备及存储介质
CN111553949A (zh) 基于单帧rgb-d图像深度学习对不规则工件的定位抓取方法
CN113724388B (zh) 高精地图的生成方法、装置、设备以及存储介质
CN113191174A (zh) 物品定位方法和装置、机器人及计算机可读存储介质
CN112434618A (zh) 基于稀疏前景先验的视频目标检测方法、存储介质及设备
CN114565916A (zh) 目标检测模型训练方法、目标检测方法以及电子设备
CN110751090A (zh) 一种三维点云标注方法、装置及电子设备
CN112149348A (zh) 一种基于无人货柜场景的仿真空间模型训练数据生成方法
CN115116052A (zh) 一种果园荔枝识别方法、装置、设备及存储介质
CN117769724A (zh) 使用深度学习的对象检测和分类的合成数据集创建
CN116152345B (zh) 一种嵌入式系统实时物体6d位姿和距离估计方法
US20230169324A1 (en) Use synthetic dataset to train robotic depalletizing
US20240028784A1 (en) Segmenting a building scene
Broderick On the Feasiblity of Simulated Data for 3D Object Classification and Transfer Learning
CN118038440A (zh) 基于多任务分支检测的非合作航天器三维姿态检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant