CN110298292A

CN110298292A - 基于规则多边形物体角点检测的高精度实时抓取检测方法

Info

Publication number: CN110298292A
Application number: CN201910552263.6A
Authority: CN
Inventors: 李想; 左寅龙
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2019-06-25
Filing date: 2019-06-25
Publication date: 2019-10-01

Abstract

本发明公开一种基于规则多边形物体角点检测的高精度实时抓取检测方法，步骤为：采集多个规则物体的彩色图，对图片中物体及其角点进行标注，将图片中其他类似角点的非角点标注为负样本形成原始数据集；对原始数据集进行数据增强，并计算出增强后图像中的角点位置，建立完整可用、泛化能力强的数据集；构建深度卷积神经网络，利用已建立好的数据集对深度卷积网络进行训练；将待检测物体图像输入到深度卷积神经网络模型中，得到图像中待检测物体及其角点的位置信息；利用已知的待检测物体及其角点的位置信息，计算出抓取点的位置及姿态信息。本发明精确度和检测速度均有极大提高，且鲁棒性好，运行模型所需算力相对强化学习小很多，容易部署。

Description

基于规则多边形物体角点检测的高精度实时抓取检测方法

技术领域

本发明涉及一种目标抓取检测技术，具体为一种基于规则多边形物体角点检测的高精度实时抓取检测方法。

背景技术

近年来，随着工业4.0、中国制造2025、人工智能等一系列国家战略的提出和不断火热，机器人产业得到越来越多的重视。为了能让机器人智能化，需要为其配备一系列传感器以让其判断检测当前所处的工作环境，而为机器人加装摄像头为机器人添加视觉属性已成为很多机器人应用领域不可或缺的环节。而在机器人视觉应用中，目标的视觉抓取是一个十分重要的研究方向，在工业中的物品分拣、装配、存放等都需要让机器人通过视觉判断合理的抓取位置，在生活服务方面，也需要机器人通过稳健的抓取物体为人们提供便利。所以，物体抓取位置检测是一个十分重要的研究课题。

对于抓取检测，目前主要的方法有：1)基于传统图像处理方法，设计并提取物体特征，检测出物体轮廓和姿态；2)基于卷积神经网络的抓取检测，将物体的RGB或RGB-D信息送入深度卷积神经网络进行训练，训练后的网络通过网络各层的权重计算最终得出预测的抓取位置；3)基于深度强化学习的抓取检测，通过对机器人设置一系列奖惩机制，使得机器人在不断试错之后能合理判断物体的抓取位置和抓取方式。

上述方法中，方法1)需要人为设计和提取特征，泛化能力差；方法2)无需人为提取特征，泛化能力较好，但准确率还有待提高；方法3)通过机器人不断试错能得到一个鲁棒性好，能适应复杂环境的表现，但检测速度不够快，需要大量算力，对设备提出了较高的要求。

发明内容

针对现有技术中目标抓取检测准确率不高、鲁棒性差、检测速度不够快等不足，本发明要解决的问题是提供一种本发明的目的是提供一种基于规则多边形物体角点检测的高精度实时抓取检测方法，可极大提升对于规则多边形物体(尤其针对于矩形物体)的检测速度和抓取成功率。

为解决上述技术问题，本发明采用的技术方案是：

本发明一种基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于包括以下步骤：

1)采集多个规则物体的彩色图，并对图片中物体及其角点进行标注，同时，将图片中其他类似角点的非角点标注为负样本，形成原始数据集；

2)对原始数据集进行数据增强，并根据相应公式计算出增强后图像中的角点位置，建立完整可用、泛化能力强的数据集；

3)构建深度卷积神经网络，并利用已建立好的数据集对深度卷积网络进行训练；

4)将待检测物体图像输入到训练好的深度卷积神经网络模型中，得到图像中待检测物体及其角点的位置信息；

5)利用已知的待检测物体及其角点的位置信息，计算出抓取点的位置及姿态信息。

步骤1)中原始数据集通过以下过程得到：

101)采集多个形状规则且具备角点的物体的彩色图像；

102)对彩色图像中待检测物体的类别及位置进行标注；

103)对彩色图像中待检测物体的角点进行标注；

104)将彩色图像中可疑的类似角点的非角点标注为负样本；

105)最终获得含有待检测物体的类别、位置、角点以及非角点信息的原始数据集。

步骤2)建立一个完整可用、泛化能力强的数据集过程如下：

201)对原始数据集中的每张图像进行平移，平移的策略为上下左右随机一个方向，且平移后的图像应包含所有原图像中待检测物体的边界框，同时，计算出平移后待检测物体及其角点的位置的信息；

202)对每张图像进行水平翻转和垂直翻转，每种翻转方式有百分之五十的机会被采用，同时利用原标注信息计算出翻转后相应的标注信息；

203)对每张图像进行旋转，旋转策略为从0度到360度，每隔10度旋转一次，每张旋转后的图像有七分之二的概率保持原状，有七分之五的概率被从平移、翻转、加噪声、调节亮度、裁剪图像增强策略中随机选择一种进行进一步增强，同时根据不同的操作计算出增强后的标注信息；

204)对每张图像进行裁剪，裁剪的前提是不会导致待检测物体的信息丢失；

205)对每张图像分别进行加高斯噪声、调节亮度操作；

206)对每张图像从平移、翻转、加噪声、调节亮度、裁剪操作中随机选择两种进行增强处理，并计算出对应的标注信息，这个过程重复五次；

207)将步骤201)～206)得到的所有图像及其对应的标注信息处理保存为标准的VOC数据格式，最终得到增强后的强鲁棒性的数据集。

步骤3)构建深度卷积神经网络，并利用已建立好的数据集对深度卷积网络进行训练具体为：

301)利用步骤2)中得到的所有图像的标注信息，采用k-means聚类算法得到适合于该数据集的anchor值；

302)将图像分别划分成不同大小的网格，分别计算待检测物体边界框的中心点在不同网格中的位置，在具体某一个网格中相对于网格原点的偏移量以及边界框的长和宽；

303)构建深度卷积神经网络，包括设计卷积层的激活函数，输出层的分类/回归函数以及loss函数；

304)设置神经网络的训练参数，包括总的训练批次和迭代次数、每一个训练批次的大小、初始学习率以及学习衰减率；

305)将训练集中的图像输入到深度卷积神经网络中，采用基于Adam优化器的优化方法对交叉熵损失函数求最优解来优化神经网络的权重参数，直到达到设定的迭代次数，完成深度卷积神经网络的训练。

步骤5)利用已知的待检测物体及其角点的位置信息，计算出抓取点的位置及姿态信息具体为：

501)根据网络检测出的物体边界框将检测出的角点进行分类，过滤掉网络误检测出的噪点；

502)判断每个物体检测到的角点数是否正确：

503)若正确，计算出边界框中离所有角点距离最接近的点，即物体的形心，也是该物体的抓取点；

504)通过计算过抓取点且与最长边垂直的向量确定抓取姿态。

步骤502)如果判断每个物体检测到的角点数是否正确的结果为不正确，则转至步骤505)说明出现角点漏检的情况(概率很小)，则根据多边形的几何特征，如边相等，内角相等等方法，对漏检点进行补全；重复步骤503)及步骤504)。

本发明具有以下有益效果及优点：

1.本发明通过检测角点来实现抓取点的检测，相对于一般的直接预测抓取位置的深度神经网络，精确度极大提高；相对于传统的图像处理方法，检测速度极大提高，且鲁棒性好，训练好的模型对于一些从未见过的类似问题也有很好的检测效果，无需再人为设计和提取特征。且运行模型所需算力相对强化学习小很多，容易部署。

2.本发明建立了一套系统完整的数据增强方法，使得只需要采集少量的数据就能实现很好的检测效果，且过程简单易学，无技术难点。

3.本发明所涉及的方法对于小物体有很好的检测效果。

4.本发明方法同样适用于一些关键点的检测，如工业点焊机器人的焊接点检测等。

附图说明

图1为本发明基于角点检测的高精度实时抓取检测方法的流程图；

图2A为本发明中漏检角点就是的效果展示图；

图2B为本发明基于角点检测的抓取检测方法的整体效果展示图；

图3为本发明的深度卷积神经网络的结构图。

具体实施方式

下面结合说明书附图对本发明作进一步阐述。

如图1所示，本发明一种基于规则多边形物体角点检测的高精度实时抓取检测方法，包括以下步骤：

2)对原始数据集进行数据增强，包括对原始图片进行旋转、平移、翻转、裁剪、加高斯噪声以及亮度，并根据相应公式计算出增强后图像中的角点位置，建立一个完整可用、泛化能力强的数据集；

本发明中，规则多边形包括正多边形、矩形、等腰三角形、直角三角形以及等腰梯形等。

步骤1)中原始数据集通过以下过程得到：

101)采集多个形状规则且具备角点的物体(包括矩形)的彩色图像；

102)对彩色图像中待检测物体的类别及位置进行标注；

103)对彩色图像中待检测物体的角点进行标注；

104)将彩色图像中可疑的类似角点的非角点标注为负样本；

步骤2)建立一个完整可用、泛化能力强的数据集过程如下：

本实施例中，计算出图像中最左侧物体的最左侧坐标距离图像左侧边，即x＝0轴的距离，即为图像向左平移的最大距离，其他方向同理。

本实施例中，通过opencv库中的函数实现图像的翻转，对于标注信息的翻转，在水平翻转时，各点坐标y值不变，x值等于图像总的长度减去原x值；在垂直翻转时，各点坐标x值不变，y值等于图像总的长度减去原x值。

本实施例通过opencv函数计算出旋转矩阵，通过旋转矩阵实现图像以及标注信息的旋转。

本实施例中，计算出包括所有物体的最小框，随机去除最小框之外的部分图像。

205)对每张图像分别进行加高斯噪声、调节亮度操作；

本实施例将所有图像的路径以及标注信息依次按行写入一个文本文档中，路径和标注信息用空格分开，同个物体的标注信息用逗号分开，不同物体的标注信息用空格分开。

本实施例收集所有边界框的宽高维度，将其作为坐标建立一个二位坐标系，确定合适的anchor数，根据k-means聚类算法计算出合适的anchor值。

302)将图像分别划分成不同大小的网格，分别计算待检测物体边界框的中心点在不同网格中的位置，在具体某一个网格中相对于网格原点(左上角)的偏移量以及边界框的长和宽；

本实施例将图像分别划分成13x13，26x26，52x52的网格。

303)构建深度卷积神经网络，设计卷积层的激活函数为relu，输出层的激活函数为logstic回归函数，loss函数采用二值交叉熵损失函数以及均方差损失函数；

304)设置神经网络的训练参数，包括总的训练批次和迭代次数、每一个训练批次的大小、初始学习率、学习衰减率；

本实施例设置神经网络的训练参数，包括总的训练批次为100次，前50个批次的大小为64，后50个批次的大小为16，具体需要根据设备来不同配置来做出相应调整。每个批次的迭代次数为总数据量除以每一批次的大小，前50个批次的学习率设为0.001，后50个批次的初始学习率为0.0001，动量为0.9，学习率反比与累积梯度衰减。

深度卷积神经网络是基于YOLOv3的网络结构构建的，数据输入端采用的是包括彩色图的宽高通道数和张量数的4维图像数据，输出为13x13/26x26/52x52个向量，每个向量的长度为N，包括预测的每个边界框的信息x,y,w,h和置信度以及所有类别的概率，YOLOv3设定每个网格预测3个边界框，所以N＝3*(5+C)，其中C表示总的类别数量。

网络结构分为主干网络以及之后为实现特定功能的预测网络，主干网络主要由19个Res模块构成。先由一个卷积层(CONV)接上批标准化(BN)层在加上激活函数leaky_relu组成CBL模块；然后由两个CBL模块依次连接，并与该两个模块首尾相连的结果相加组成Res_unit模块；Resn模块由一个zero_pading层、一个CBL模块和n个Res_unit模块构成，而主干网络则有一个CBL模块、一个Res1模块、一个Res2模块、一个Res8模块、两个Res4模块相连构成，同时，每个Resn模块首尾连接形成特征级联，使得深层特征具有更好的表现力。在主干网络之后，在最后一个Res4模块后依次连接五个CBL模块加一个CBL模块和卷积层连接到第一个输出层y1，倒数第二个Res模块与最后一个Res4模块连接五个CBL模块的结果经过上采样拼接后，连接五个CBL模块和一个CBL模块加一个卷积层得到第二个输出层y2，Res8模块与形成y2的五个DBL层结果经过上采样拼接后，连接五个CBL模块和一个CBL模块加一个卷积层得到第三个输出层y3。神经网络结构如图3所示。

将y1、y2、y3输入到loss层做平均交并比计算、非极大值抑制以及二值交叉熵计算，再用Adam优化器对损失值进行优化处理。

二值交叉熵损失函数如下式表示：

其中和y_i分别表示预测值和真实值。

步骤4：将待检测物体图像输入到训练好的深度卷积神经网络模型中，得到图像中待检测物体及其角点的位置信息。

具体实施时，只需采集一张待检测物体的图像，输入训练好的网络模型中，程序会自动调整图片的大小以适应网络的输入，并通过层层权重的计算得到物体的边界框、类别和角点信息。也可以通过摄像头采集视频流，将每一帧图片传入网络中实现实时检测。

找到每个物体的边界框，遍历所有检测到的角点，若角点在某个边界框内，则该边界框内物体的角点数加1；

502)判断每个物体检测到的角点数是否正确：

单个物体检测到的角点小于等于实际角点数，主要判断检测到的角点是否小于实际角点，即角点是否漏检；

504)通过计算过抓取点且与最长边垂直的向量确定抓取姿态：

本实施例根据抓手的种类、材质等特征做出最合适最正确的计算方法，如对于平口钳，奇数边的多边形如三角形、五边形等都不太好抓，而对于吸盘式的抓手，只要检测出抓取点，一般都能抓取成功。本发明的试验对象为矩形物体，抓手为平口钳，故计算过抓取点且与最长边垂直的向量为机械臂提供抓手的方向和张开尺寸是一种行之有效的方法，具体效果如图2B所示。

505)若出现角点漏检的情况(概率很小)，则根据多边形的集合特征，如边相等，内角相等等方法，对漏检点进行补全；重复步骤503)及步骤504)。

如边相等，内角相等等方法，对漏检点进行补全，补全之后重复步骤503)及步骤504)。如矩形的角点数应为4，若角点数为3，则根据平行四边形中心点平分对角线的数学法则，找出任意两个点的中点，并将第三个点与其相连并延长相同长度即可算出三个候选点，根据该点需在边界框之中这一条件即可确定真实漏检点的位置，图2A中最左侧的点即为通过另外3个点按照该算法重新计算得到的第四个点。若角点数为2或1(几乎不会出现)，则放弃计算抓取点及其位姿。

本发明通过对形状规则且具有角点一类的物体进行角点检测，优化网络结构，提高这一类物体抓取位置检测的准确度和实时性，提升了具体场景下物体抓取检测系统的性能。

Claims

1.一种基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于包括以下步骤：

2.根据权利要求1所述的基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于步骤1)中原始数据集通过以下过程得到：

101)采集多个形状规则且具备角点的物体的彩色图像；

102)对彩色图像中待检测物体的类别及位置进行标注；

103)对彩色图像中待检测物体的角点进行标注；

104)将彩色图像中可疑的类似角点的非角点标注为负样本；

3.根据权利要求1所述的基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于步骤2)建立一个完整可用、泛化能力强的数据集过程如下：

205)对每张图像分别进行加高斯噪声、调节亮度操作；

4.根据权利要求1所述的基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于步骤3)构建深度卷积神经网络，并利用已建立好的数据集对深度卷积网络进行训练具体为：

5.根据权利要求1所述的基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于步骤5)利用已知的待检测物体及其角点的位置信息，计算出抓取点的位置及姿态信息具体为：

502)判断每个物体检测到的角点数是否正确：

504)通过计算过抓取点且与最长边垂直的向量确定抓取姿态。

6.根据权利要求5所述的基于规则多边形物体角点检测的高精度实时抓取检测方法，其特征在于步骤502)如果判断每个物体检测到的角点数是否正确的结果为不正确，则转至步骤505)说明出现角点漏检的情况，则根据多边形的几何特征，如边相等，内角相等等方法，对漏检点进行补全；重复步骤503)及步骤504)。