CN109344707A - 一种应用于手眼机械臂系统的轻量的快速目标检测方法 - Google Patents

一种应用于手眼机械臂系统的轻量的快速目标检测方法 Download PDF

Info

Publication number
CN109344707A
CN109344707A CN201810991738.7A CN201810991738A CN109344707A CN 109344707 A CN109344707 A CN 109344707A CN 201810991738 A CN201810991738 A CN 201810991738A CN 109344707 A CN109344707 A CN 109344707A
Authority
CN
China
Prior art keywords
target
target detection
picture
trick
mechanical arm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810991738.7A
Other languages
English (en)
Inventor
张文翔
胡亮
刘琪
赵亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bowa (wuhan) Technology Co Ltd
Original Assignee
Bowa (wuhan) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bowa (wuhan) Technology Co Ltd filed Critical Bowa (wuhan) Technology Co Ltd
Priority to CN201810991738.7A priority Critical patent/CN109344707A/zh
Publication of CN109344707A publication Critical patent/CN109344707A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

一种应用于手眼机械臂系统的轻量的快速目标检测方法,它涉及计算机视觉领域,具体涉及一种应用于手眼机械臂系统的轻量的快速目标检测方法,它包括以下步骤:步骤一:训练集的采集:针对实际应用场景中的目标在各种情况下的图片进行采集,充分采集各种光照条件下,各种背景条件下目标的图片;步骤二:设计深度卷积网络模型并训练;步骤三:将训练好的模型应用于实际环境中的目标检测,输出图片中目标的类别及位置。采用上述技术方案后,本发明有益效果为:它既能保证实际使用精度性能要求,又能满足实时性要求的目标检测模型,降低原有的方法在嵌入式平台上的存储开销与计算开销,提高目标检测系统服务对象的工作效率。

Description

一种应用于手眼机械臂系统的轻量的快速目标检测方法
技术领域
本发明涉及计算机视觉领域,具体涉及一种应用于手眼机械臂系统的轻量的快速目标检测方法。
背景技术
近年来,随着计算机技术的发展以及计算机硬件性能的提升,计算机视觉领域的应用性能获得了重大提升。目标检测,作为其中的一项重要的、基础的任务,其识别精度以及定位准确率获得了显著提高。
传统的目标检测方法,主要使用HOG特征+SVM分类器的方法。但是,HOG特征是人工设计的,其不能满足自然图像中的具有任意姿态的目标检测的性能要求。随着深度学习技术的发展,其在目标检测领域取得了巨大的成功,性能完全超越了传统的检测方法。
深度学习在目标检测领域的应用方法主要分为两类,一类是RCNN系列等twostages的方法;一类是YOLO系列等one stages的方法。RCNN系列虽然map值高,但是其实时性非常差,即使是在titan x显卡上,faster RCNN也只有4-5fps的速度。与之相比,YOLO系列则有检测实时性强,map值能满足实际使用的特点。但是即使是原始版本的YOLO系列,其实时性也只是在顶级显卡(如titan x)上才能得到保证。如果不加处理就移植到嵌入式平台上(如TX2),其实时性无法保证。
原有的方法训练的网络模型较大,使得模型移植到嵌入式平台(TX2)上时无法保证实时性的要求,严重影响目标检测系统服务对象(如手眼机械臂系统)的工作效率。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种应用于手眼机械臂系统的轻量的快速目标检测方法,它既能保证实际使用精度性能要求,又能满足实时性要求的目标检测模型,降低原有的方法在嵌入式平台上的存储开销与计算开销,提高目标检测系统服务对象的工作效率。
为实现上述目的,本发明采用以下技术方案是:它包括以下步骤:
步骤一:训练集的采集:针对实际应用场景中的目标在各种情况下的图片进行采集,充分采集各种光照条件下,各种背景条件下目标的图片;
步骤二:设计深度卷积网络模型并训练;
步骤三:将训练好的模型应用于实际环境中的目标检测,输出图片中目标的类别及位置。
所述的步骤二训练时使用的方法为SGD随机梯度下降法。
采用上述技术方案后,本发明有益效果为:它既能保证实际使用精度性能要求,又能满足实时性要求的目标检测模型,降低原有的方法在嵌入式平台上的存储开销与计算开销,提高目标检测系统服务对象的工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的模型网络数据表格。
具体实施方式
参看图1所示,本具体实施方式采用的技术方案是:它包括以下步骤:
步骤一:训练集的采集:针对实际应用场景中的目标在各种情况下的图片进行采集,充分采集各种光照条件下,各种背景条件下目标的图片;
步骤二:设计深度卷积网络模型并训练;
步骤三:将训练好的模型应用于实际环境中的目标检测,输出图片中目标的类别及位置。
所述的步骤二训练时使用的方法为SGD随机梯度下降法。
模型的网络结构如图1所示,带*号的层为我们使用的1x1卷积核大小的卷积层,其主要目的是对特征进行压缩降维。最后一层卷积层为网络的输出层,其滤波器的个数为n,n由实际应用环境中需要检测的目标的类别数决定。决定公式如下:
考虑到实际应用环境中类别数较少,一般取1-3。若类别数为1,则n等于30。以此类推。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种应用于手眼机械臂系统的轻量的快速目标检测方法,其特征在于:它包括以下步骤:
步骤一:训练集的采集:针对实际应用场景中的目标在各种情况下的图片进行采集,充分采集各种光照条件下,各种背景条件下目标的图片;
步骤二:设计深度卷积网络模型并训练;
步骤三:将训练好的模型应用于实际环境中的目标检测,输出图片中目标的类别及位置。
2.根据权利要求1所述的一种应用于手眼机械臂系统的轻量的快速目标检测方法,其特征在于:所述的步骤二训练时使用的方法为SGD随机梯度下降法。
CN201810991738.7A 2018-08-29 2018-08-29 一种应用于手眼机械臂系统的轻量的快速目标检测方法 Pending CN109344707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810991738.7A CN109344707A (zh) 2018-08-29 2018-08-29 一种应用于手眼机械臂系统的轻量的快速目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810991738.7A CN109344707A (zh) 2018-08-29 2018-08-29 一种应用于手眼机械臂系统的轻量的快速目标检测方法

Publications (1)

Publication Number Publication Date
CN109344707A true CN109344707A (zh) 2019-02-15

Family

ID=65292103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810991738.7A Pending CN109344707A (zh) 2018-08-29 2018-08-29 一种应用于手眼机械臂系统的轻量的快速目标检测方法

Country Status (1)

Country Link
CN (1) CN109344707A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101402199A (zh) * 2008-10-20 2009-04-08 北京理工大学 基于视觉的手眼式低伺服精度机器人移动目标抓取方法
CN104463191A (zh) * 2014-10-30 2015-03-25 华南理工大学 一种基于注意机制的机器人视觉处理方法
WO2018076776A1 (zh) * 2016-10-25 2018-05-03 深圳光启合众科技有限公司 机器人、机械臂及其控制方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101402199A (zh) * 2008-10-20 2009-04-08 北京理工大学 基于视觉的手眼式低伺服精度机器人移动目标抓取方法
CN104463191A (zh) * 2014-10-30 2015-03-25 华南理工大学 一种基于注意机制的机器人视觉处理方法
WO2018076776A1 (zh) * 2016-10-25 2018-05-03 深圳光启合众科技有限公司 机器人、机械臂及其控制方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王志恒等: "基于语义分割的分拣系统目标检测与定位", 《计量与测试技术》 *
白成超等: "结合深度学习的机械臂视觉抓取控制", 《载人航天》 *

Similar Documents

Publication Publication Date Title
US20220004744A1 (en) Human posture detection method and apparatus, device and storage medium
CN108647668A (zh) 多尺度轻量级人脸检测模型的构建方法及基于该模型的人脸检测方法
CN109299716A (zh) 神经网络的训练方法、图像分割方法、装置、设备及介质
CN110059807A (zh) 图像处理方法、装置和存储介质
CN103983334B (zh) 一种信息处理的方法及电子设备
CN105701514B (zh) 一种用于零样本分类的多模态典型相关分析的方法
CN104899579A (zh) 人脸识别方法和装置
CN107679447A (zh) 面部特征点检测方法、装置及存储介质
CN105718940B (zh) 基于多组间因子分析的零样本图像分类方法
CN104463250A (zh) 一种基于达芬奇技术的手语识别翻译方法
CN111489401B (zh) 一种图像颜色恒常性处理方法、系统、设备和存储介质
CN109741293A (zh) 显著性检测方法及装置
US20200211220A1 (en) Method for Identifying an Object Instance and/or Orientation of an Object
CN110413816A (zh) 彩色草图图像搜索
CN105930790A (zh) 基于核稀疏编码的人体行为识别方法
CN110533069A (zh) 一种基于支持向量机算法的二维箔条分布特性识别方法
CN112966685B (zh) 用于场景文本识别的攻击网络训练方法、装置及相关设备
CN111339935A (zh) 一种基于可解释cnn图像分类模型的光学遥感图片分类方法
CN105469103B (zh) 基于低质量rgb-d数据的场景恢复方法及装置
CN108268872A (zh) 一种基于增量学习的鲁棒非负矩阵分解方法
CN103489000A (zh) 一种人体动作识别训练系统的实现方法
CN112597909A (zh) 一种用于人脸图片质量评价的方法与设备
CN109284700A (zh) 图像中多个人脸检测的方法、存储介质、设备及系统
CN105740879B (zh) 基于多模态判别分析的零样本图像分类方法
CN110969101A (zh) 一种基于hog和特征描述子的人脸检测与跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190215