CN106683137A

CN106683137A - 基于人工标志的单目多目标识别与定位方法

Info

Publication number: CN106683137A
Application number: CN201710017616.3A
Authority: CN
Inventors: 缪燕子; 李晓东; 周笛; 金鑫; 卜淑萍; 许红盛; 金慧杰
Original assignee: China University of Mining and Technology CUMT
Current assignee: China University of Mining and Technology CUMT
Priority date: 2017-01-11
Filing date: 2017-01-11
Publication date: 2017-05-17
Anticipated expiration: 2037-01-11
Also published as: CN106683137B

Abstract

本发明公开了一种基于人工标志的单目多目标识别与定位方法。本方法包括以下步骤：对原始图像根据设定颜色进行二值化处理，得到二值图像；对二值图预处理后提取轮廓；对每个轮廓进行椭圆拟合，对形状不符合要求的椭圆进行剔除；椭圆两两组合，以椭圆长轴端点为顶点组成四边形；计算每个四边形的评价系数e；分析评价系数，进行多目标选取；将每个四边形的4个顶点作为特征点，使用迭代法求解PnP，依次获得相机相对每个标志的三维位姿。本发明用识别椭圆长轴代替识别线段，并针对多目标的识别提出一种评价系数，即使在复杂背景下，也可以有效筛选出标记目标并求出相对位姿，鲁棒性高；并且方案简单易行，算法具有较低的时间复杂度，能获得高帧率的计算结果，满足高实时性的要求。

Description

基于人工标志的单目多目标识别与定位方法

技术领域

本发明涉及计算机视觉技术领域，具体涉及一种基于人工标志的单目多目标识别与定位方法。

背景技术

在工业装配、无人机定点着陆和增强现实等领域，需要运用图像进行目标的识别与位姿估计，从而引导机器人的动作。

目标位姿获取的难点主要是因为相机采集的是二维图像，会损失物体的深度信息。一种解决方案是利用双目视觉，可以还原场景的深度信息，但是计算复杂，在计算能力较低的平台上难以实现。另一种方案是使用RGBD传感器直接获取深度信息，但相较于单目相机，其成本大幅增加。

基于人工标志的目标识别与定位是一种低成本、易实施的方案，但目前多数人工标志需要匹配、编码等步骤，存在识别过程复杂、多目标检测效率不高等问题。

发明内容

本发明的目的主要针对上述现有技术中的不足，提供一种了基于人工标志的简单高效的单目多目标识别与定位方法。

为了实现上述目的，本发明采用的技术方案是：

S1、根据设定颜色对原始图像进行二值化处理，得到二值图像；

S2、对二值图预处理后提取轮廓；

S3、对每个轮廓进行椭圆拟合，对形状不符合要求的椭圆进行剔除；

S4、将椭圆两两组合，以椭圆长轴端点为顶点组成四边形；

S5、计算每个四边形的评价系数e；

S6、分析评价系数e，进行多目标选取；

S7、将每个四边形的4个顶点作为特征点，使用迭代法求解PnP，依次获得相机相对每个标志的三维位姿。

在一些实施例中，其中获取的图像在640a×480b分辨率下，剔除椭圆轮廓的最小阈值为5ab像素，最大的阈值为6000ab像素，a和b为缩放系数。

在一些实施例中，四边形评价系数的计算方法为：

其中，Δθ为两个椭圆的角度差，λ为椭圆中心连线所在直线的角度，ϕ为两椭圆角度的平均值，l ₁和l ₂分别为两椭圆的长轴长度，阈值α，β分别取25和30。

在一些实施例中，其中多目标选取需要剔除掉e < ε的四边形，阈值ε取0.3，然后将剩下的k个四边形按e的大小降序排列。实际设置K个标志数，检测到k个标志，结果输出min(K,k)个标志。

本发明的有益效果在于：基于人工标志的单目多目标识别与定位，针对多目标的识别提出一种评价系数，即使在复杂背景下，也可以有效筛选出标记目标并求出相对位姿，鲁棒性高；并且方案简单易行，算法具有较低的时间复杂度，能获得高帧率的计算结果，足以满足高实时性的要求。

附图说明

图1为本发明的人工标志示意图。

图2为本发明的一个实施例流程示意图。

图3为本发明的特征四边形示意图。

图4为本发明的坐标系统示意图。

具体实施方式

以下结合附图以及具体实施例，对本发明进行详细说明。应当理解，此处所描述的具体实施例仅用于解释本发明，并不限定本发明。

本发明设计的人工标志如图1所示，标志由2个椭圆形和1个圆形组成，椭圆的长轴端点构成特征点，标志内的圆形用于确定特征点的顺序。

本发明提供一种单目多目标识别与定位方法，流程如图2所示，包括：

S1、对原始图像根据设定颜色进行二值化处理，得到二值图像；

S2、对二值图预处理后提取轮廓；

S4、将椭圆两两组合，以椭圆长轴端点为顶点组成四边形；

S5、计算每个四边形的评价系数e；

S6、分析评价系数e，进行多目标选取；

具体地，为了可以更好的去除干扰，使轮廓提取更加精确，将人工标志设置成蓝色，两个椭圆的长轴设置为边长为50mm的正方形的两条对边。

首先从相机或视频中获取一帧原始图像，分辨率定为640×480。根据图像中像素点的颜色进行二值分类。将原始图像的蓝色通道与红色通道作差，得到一幅单通道的图像，该单通道图像大于阈值的像素点置为255，否则置为0，由此得到一副二值图像。

然后对二值图进行预处理，对图像进行形态学滤波，执行腐蚀与膨胀操作，消除噪点，连通相邻区域。

提取每个闭合区域的外层轮廓，对周长在5像素到6000像素之内的轮廓用最小二乘法拟合椭圆，将检测到的n个椭圆进行下一步处理。

将n个椭圆两两组合，可以得到组以两椭圆长轴为对边的四边形。如图3所示为一个四边形，同时规定：

1.直线的角度定义为逆时针旋转到与y轴平行的旋转角度，取值范围[0°,180°)；

2.椭圆的角度θ定义为长轴所在直线l的角度，两个椭圆角度差Δθ定义为：

3.若两个椭圆心分别为E(x ₁，y ₁)和F(x ₂，y ₂)，为了求直线EF的角度λ，假设x ₁ <x ₂，使向量EF在y轴右半平面，则向量EF与y轴正半轴的夹角即λ：

4.四边形角度ϕ定义为两椭圆转角的平均值，同样其取值范围是[0°,180°)：

在上述前提下，本发明为每个四边形设计了一个评价系数e，其计算方法为：

其中α、β为相应阈值（α、β为经验值，本发明取α=25°、β=30°），|AB|、|CD|分别为线段AB、CD的长度。

e的三项乘积分别表示：

e ₁：两个椭圆的平行程度，越接近1越平行，即Δθ越趋近于0；

e ₂：两个椭圆关于直线m的对称程度，即直线EF与直线m的垂直程度，直线m为过四边形中心且角度为ϕ的直线，该值越接近1，说明两椭圆关于直线m越对称；

e ₃：两个椭圆的相似程度，越接近1大小越相似。

本发明设计的评价系数e考虑到形状、边长相对位置、大小等方面的因素，并通过平方项加速错误四边形e值的衰减，可以通过e值很好的度量检测到的四边形与标志的相似程度。

当组四边形的评价系数e计算完毕后，首先剔除掉e < ε的四边形（ε为经验值，本发明取0.3），然后将剩下的k个四边形按e的大小降序排列。如果设置的标志数为K个（K =0,1,2,3...），则在k个四边形中输出前min(K,k)个四边形。

依次检测每个四边形区域内的是否存在圆形标记，若存在，则在四边形的顶点中，根据欧式距离找到距圆形标记最近的一个顶点，设为起点A，对余下3个顶点以点A为中心逆时针排序，分别设为点B、点C、点D。

世界坐标的建立如图4所示，由于四边形是边长为50mm的正方形，所以其顶点的世界坐标分别为A(-25，25，0)，B(-25，-25，0)，C(25，-25，0)，D(25，25，0)。由上一步会得到四边形顶点ABCD的图像坐标，这就得到供求解位姿使用的4组数据。

根据相机的小孔成像模型，物体的世界坐标(X，Y，Z)和图像坐标(u，v)的映射关系：

其中矩阵K为相机的内参矩阵，通过相机标定得到。[R | t]=[r₁ r₂ r₃ | t]为所求物体相对于相机的位姿，由旋转矩阵R和平移向量t构成，也被称为外参矩阵。由于人工标志设在Z=0平面上，所以上式可以化简为：

此时未知量仅有s，r₁，r₂和t四个，并且内参矩阵K为满秩矩阵，所以由上述得到的四组世界坐标和图像坐标，即可求出s，r₁，r₂和t的唯一解，并且旋转矩阵R为单位正交阵，r₃可以根据r₁和r₂求出。

一个人工标志的相对位姿[R | t]求解完毕，剩下的标志重复上述的位姿求解步骤即可。

以上所述仅为本发明的优选实施例，并非对本发明作任何限制，凡是根据本发明说明书和附图内容所做的各种等效更改与变形，均包括在本发明的专利保护范围内。

Claims

1.一种基于人工标志的单目多目标识别方法，其特征在于，所述方法包含以下步骤：

S2、对二值图像预处理后提取轮廓；

S4、将椭圆两两组合，以椭圆长轴端点为顶点组成四边形；

S5、计算每个四边形的评价系数e；

S6、分析评价系数e，进行多目标选取；

2.根据权利要求1所述的方法，其特征在于，步骤S3中，图像在640a×480b分辨率下，剔除椭圆轮廓的最小阈值为5ab像素，最大的阈值为6000ab像素，a和b为缩放系数。

3.根据权利要求1所述的方法，其特征在于，步骤S5中，四边形评价系数的计算方法为：

4.根据权利要求1所述的方法，其特征在于，步骤S6中，多目标选取需要剔除掉e < ε的四边形，阈值ε取0.3，然后将剩下的k个四边形按e的大小降序排列，实际设置K个标志数，检测到k个标志，结果输出min(K,k)个标志。