CN111832542B

CN111832542B - 三目视觉识别与定位装置

Info

Publication number: CN111832542B
Application number: CN202010821493.0A
Authority: CN
Inventors: 李玮; 黄浩; 胡永明; 刘忠成; 王波; 周治坤; 刘冬
Original assignee: Wuhan Yisida Technology Co ltd; Hubei University
Current assignee: Wuhan Yisida Technology Co ltd; Hubei University
Priority date: 2020-08-15
Filing date: 2020-08-15
Publication date: 2024-04-16
Anticipated expiration: 2040-08-15
Also published as: CN111832542A

Abstract

本发明公开了一种三目视觉识别与定位装置，涉及图像处理方法技术领域。所述方法包括如下步骤：通过拍摄目标的照片，训练得到预训练的人工神经网络目标识别模型；在目标运动轨迹所在的平面中任意选取一个基准点，并预设第一摄像头、第二摄像头以及第三摄像头的三维坐标；第一至第三摄像头同时对目标进行抓拍，并分别生成图像Pic1，Pic2和Pic3；目标识别及定位运算服务器生成一组随机数，并找到与其对应的图像，使用预训练的人工神经网络目标识别模型对图片做目标识别得到识别出的目标的区域信息；根据识别出的目标的区域信息执行定位算法，最终计算得到目标的中心点的三维坐标。所述方法具有定位精度高等优点。

Description

三目视觉识别与定位装置

技术领域

本发明涉及图像处理方法技术领域，尤其涉及一种三目视觉识别与定位方法及装置。

背景技术

随着自动化技术系统的发展，导致物体运动轨迹的定位识别抓取技术的应用越来越广泛。目前各种视觉定位方法都存在或多或少缺陷，没有做到多源信息融合检测和信息交互算法，所以最终造成定位不精确或者无法定位。

发明内容

本发明所要解决的技术问题是如何提供一种定位精度高的三目视觉识别与定位方法。

为解决上述技术问题，本发明所采取的技术方案是：一种三目视觉识别与定位方法，其特征在于包括如下步骤：

通过拍摄目标的各个角度、各个局部、各种大小、各种光照条件下的照片，训练得到预训练的人工神经网络目标识别模型；

在目标运动轨迹所在的平面中任意选取一个基准点，并预设第一摄像头、第二摄像头以及第三摄像头的三维坐标分别为(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)；

第一摄像头、第二摄像头以及第三摄像头同时对目标进行抓拍，并分别生成图像Pic1，Pic2和Pic3，将图像传输到目标识别及定位运算服务器；

目标识别及定位运算服务器生成一组随机数，将数组[1，2，3]随机排序，得到数组[i1，i2，i3]；

分别判断i1，i2，i3的具体值，并找到与其对应的图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别得到识别出的目标的区域信息；

根据识别出的目标的区域信息执行定位算法，最终计算得到目标的中心点的三维坐标(xt，yt，zt)。

进一步的技术方案在于，所述的得到识别出的目标的区域信息的方法如下：

判断i1＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i1，1)，p(i1，2)，p(i1，3)，p(i1，4)]，其中i1为1、2或3；

判断i2＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i2，1)，p(i2，2)，p(i2，3)，p(i2，4)]，其中i2为1、2或3；

判断i3＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i3，1)，p(i3，2)，p(i3，3)，p(i3，4)]，其中i3为1、2或3。

进一步的技术方案在于，根据识别出的目标的区域信息执行定位算法的方法如下：

第一摄像头的水平像素点范围为[0，W1]，以中心点计算的水平视角度数范围为[-A1，A1]度，垂直像素点范围为[0，H1]，以中心点计算的垂直视角度数范围为[-B1，B1]度；

对于第一摄像头所采集图像Pic1经过目标检测得到目标的顺时针排列的四个顶点的像素点[p(1，1)，p(1，2)，p(1，3)，p(1，4)]，其中，p(1，1)的像素点包含水平像素点位置和垂直像素点位置，可表达为[w(1，1)，h(1，1)]，依次类推，可计算目标的中心点c1的像素点位置为[(w(1，1)+w(1，3))/2，(h(1，1)+h(1，3))/2]；

计算目标中心点c1相对于第一摄像头垂直中轴线的水平偏移角度α1＝A1×(w(1，1)+w(1，3)-W1)/W1；

计算目标中心点c1相对于第一摄像头垂直中轴线的垂直偏移角度β1＝B1×(h(1，1)+h(1，3)-H1)/H1；

计算目标中心点c1相对于第一摄像头垂直中轴线的综合偏移角度

同理，第二摄像头的水平像素点范围为[0，W2]，以中心点计算的水平视角度数范围为[-A2，A2]度，垂直像素点范围为[0，H2]，以中心点计算的垂直视角度数范围为[-B2，B2]度；

对于第二摄像头所采集图像Pic2经过目标检测得到目标的顺时针排列的四个顶点的像素点[p(2，1)，p(2，2)，p(2，3)，p(2，4)]，其中，p(2，1)的像素点包含水平像素点位置和垂直像素点位置，可表达为[w(2，1)，h(2，1)]，依次类推，可计算目标的中心点c2的像素点位置为[(w(2，1)+w(2，3))/2，(h(2，1)+h(2，3))/2]；

计算目标中心点c2相对于第二摄像头垂直中轴线的水平偏移角度α2＝A2×(w(2，1)+w(2，3)-W2)/W2；

计算目标中心点c2相对于第二摄像头垂直中轴线的垂直偏移角度β2＝B2×(h(2，1)+h(2，3)-H2)/H2；

计算目标中心点c2相对于第二摄像头垂直中轴线的综合偏移角度

同理，摄像头3的水平像素点范围为[0，W3]，以中心点计算的水平视角度数范围为[-A3，A3]度，垂直像素点范围为[0，H3]，以中心点计算的垂直视角度数范围为[-B3，B3]度；

对于摄像头3所采集图像Pic3经过目标检测得到目标的顺时针排列的四个顶点的像素点[p(3，1)，p(3，2)，p(3，3)，p(3，4)]，其中，p(3，1)的像素点包含水平像素点位置和垂直像素点位置，可表达为[w(3，1)，h(3，1)]，依次类推，可计算目标的中心点c3的像素点位置为[(w(3，1)+w(3，3))/2，(h(3，1)+h(3，3))/2]；

计算目标中心点c3相对于摄像头3垂直中轴线的水平偏移角度α3＝A3×(w(3，1)+w(3，3)-W3)/W3；

计算目标中心点c3相对于摄像头3垂直中轴线的垂直偏移角度β3＝B3×(h(3，1)+h(3，3)-H3)/H3；

计算目标中心点c3相对于摄像头3垂直中轴线的综合偏移角度

由预设的第一摄像头、第二摄像头以及第三摄像头的三维坐标分别为(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)，与待测的目标中心点的三维坐标(xt，yt，zt)之间的关系，可计算得到联立方程组：

将(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)，θ1，θ2，θ3的值代入到如上方程组中，即可计算得到：(xt，yt，zt)的值。

本发明还公开了一种三目视觉识别与定位装置，其特征在于包括：

图像采集模块：包括第一摄像头、第二摄像头以及第三摄像头，所述第一摄像头、第二摄像头以及第三摄像头用于同时对目标进行抓拍，并分别生成图像Pic1，Pic2和Pic3，将图像传输到目标识别及定位运算服务器；

目标识别及定位运算服务器：所述目标识别及定位运算服务器用于对图像采集模块采集的图像进行处理，计算出目标的中心点的三维坐标。

进一步的技术方案在于，所述目标识别及定位运算服务器包括：

人工神经网络目标识别模块：用于通过拍摄目标的各个角度、各个局部、各种大小、各种光照条件下的照片，训练得到预训练的人工神经网络目标识别模型；

摄像头坐标获取模块：在目标运动轨迹所在的平面中任意选取一个基准点，并预设第一摄像头、第二摄像头以及第三摄像头的三维坐标分别为(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)；

随机数组生成模块：用于生成一组随机数，将数组[1，2，3]随机排序，得到数组[i1，i2，i3]；

目标区域信息识别模块：分别判断i1，i2，i3的具体值，并找到与其对应的图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别得到识别出的目标的区域信息；

目标中心点计算模块：用于根据识别出的目标的区域信息执行定位算法，最终计算得到目标的中心点的三维坐标(xt，yt，zt)。

进一步的技术方案在于，所述目标区域信息识别模块包括：

第一顶点像素计算模块：判断i1＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i1，1)，p(i1，2)，p(i1，3)，p(i1，4)]，其中i1为1、2或3；

第二顶点像素计算模块：判断i2＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i2，1)，p(i2，2)，p(i2，3)，p(i2，4)]，其中i2为1、2或3；

第三顶点像素计算模块：判断i3＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i3，1)，p(i3，2)，p(i3，3)，p(i3，4)]，其中i3为1、2或3。

进一步的技术方案在于：所述装置还包括定位算法模块，用于根据识别出的目标的区域信息执行定位算法。

进一步的技术方案在于：所述第一摄像头、第二摄像头以及第三摄像头的硬件参数一致，所述第一摄像头、第二摄像头以及第三摄像头所组成的平面平行于目标运动轨迹所在的平面；所述第一摄像头、第二摄像头以及第三摄像头的图像拍摄角度一致，均垂直于目标运动轨迹所在的平面。

进一步的技术方案在于：所述第一摄像头、第二摄像头以及第三摄像头同时抓拍图像，并将图像传输到目标识别及定位运算服务器。

进一步的技术方案在于：所述摄像头与所述服务器之间通过有线或无线通信方式连接，进行数据交互。

采用上述技术方案所产生的有益效果在于：本申请所述方法和装置采用三个图像进行融合运算，从而消除了噪声和干扰，实现比以往方案更高的定位精度；每次循环中，随机排序的对三个摄像头采集图像的处理，降低了系统误差，提高了定位的精确度；通过定位算法，解决了摄像头所采集图像中的目标不全的问题，从而获得了更佳的定位精确度；通过三个像素头的同时图像采集，得到了信息冗余，利用冗余信息提升目标识别的准确度。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明实施例所述装置的原理框图；

图2是本发明实施例所述装置中目标识别及定位运算服务器的原理框图；

其中：1、目标运动轨迹；2、第一摄像头；3、第二摄像头；4、第三摄像头；5、目标。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

本发明实施例公开了一种三目视觉识别与定位方法，包括如下步骤：

步骤1)：通过拍摄目标的各个角度、各个局部、各种大小、各种光照条件下的照片，训练得到预训练的人工神经网络目标识别模型；

步骤2)：在目标运动轨迹1所在的平面中任意选取一个基准点，并预设第一第二摄像头、第二摄像头3以及第三摄像头4的三维坐标分别为(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)；

步骤3)：第一第二摄像头、第二摄像头3以及第三摄像头4同时对目标5进行抓拍，并分别生成图像Pic1，Pic2和Pic3，将图像传输到目标识别及定位运算服务器；

步骤4)：目标识别及定位运算服务器生成一组随机数，将数组[1，2，3]随机排序，得到数组[i1，i2，i3]；

步骤5)分别判断i1，i2，i3的具体值，并找到与其对应的图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别得到识别出的目标的区域信息；

步骤6)：根据识别出的目标的区域信息执行定位算法，最终计算得到目标的中心点的三维坐标(xt，yt，zt)；

步骤7)：循环，重复步骤3)-步骤6)的内容。(目标是可以运动的，因此做循环来一直检测并定位目标物体。)

进一步的，所述步骤5)进一步的包括如下步骤：

步骤5-1)：判断i1＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i1，1)，p(i1，2)，p(i1，3)，p(i1，4)]，其中i1为1、2或3；

步骤5-2)：判断i2＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i2，1)，p(i2，2)，p(i2，3)，p(i2，4)]，其中i2为1、2或3；

步骤5-3)：判断i3＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i3，1)，p(i3，2)，p(i3，3)，p(i3，4)]，其中i3为1、2或3。

进一步的，根据识别出的目标的区域信息执行定位算法的方法如下：

计算目标中心点c3相对于摄像头3垂直中轴线的综合偏移角度

如图1所示，本发明实施例还公开了一种三目视觉识别与定位装置，包括：

图像采集模块：包括第一第二摄像头、第二摄像头3以及第三摄像头4，所述第一第二摄像头、第二摄像头3以及第三摄像头4用于同时对目标5进行抓拍，并分别生成图像Pic1，Pic2和Pic3，将图像传输到目标识别及定位运算服务器；

进一步的，如图2所示，所述目标识别及定位运算服务器包括：

摄像头坐标获取模块：在目标运动轨迹所在的平面中任意选取一个基准点，并预设第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)的三维坐标分别为(x1，y1，z1)，(x2，y2，z2)，(x3，y3，z3)；

进一步的，如图2所示，所述目标区域信息识别模块包括：

进一步的，所述装置还包括定位算法模块，用于根据识别出的目标的区域信息执行定位算法。

进一步的，所述第一第二摄像头、第二摄像头3以及第三摄像头4的硬件参数一致，所述第一第二摄像头、第二摄像头3以及第三摄像头4所组成的平面平行于目标运动轨迹1所在的平面；所述第一第二摄像头、第二摄像头3以及第三摄像头4的图像拍摄角度一致，均垂直于目标运动轨迹1所在的平面。所述第一第二摄像头、第二摄像头3以及第三摄像头4同时抓拍图像，并将图像传输到目标识别及定位运算服务器。所述摄像头与所述服务器之间可以通过有线或无线通信方式连接，进行数据交互。

所述方法适合于通用的有定位需求的所有场景，特别是没有卫星定位信号的场景。采用三个图像进行融合运算，从而消除了噪声和干扰，实现比以往方案更高的定位精度；每次循环中，随机排序的对三个摄像头采集图像的处理，降低了系统误差，提高了定位的精确度；通过定位算法，解决了摄像头所采集图像中的目标不全的问题，从而获得了更佳的定位精确度；通过三个像素头的同时图像采集，得到了信息冗余，利用冗余信息提升目标识别的准确度。

Claims

1.一种三目视觉识别与定位装置，其特征在于包括：

图像采集模块：包括第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)，所述第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)用于同时对目标(5)进行抓拍，并分别生成图像Pic1，Pic2和Pic3，将图像传输到目标识别及定位运算服务器；

目标识别及定位运算服务器：所述目标识别及定位运算服务器用于对图像采集模块采集的图像进行处理，计算出目标的中心点的三维坐标；

所述目标识别及定位运算服务器包括：

目标中心点计算模块：用于根据识别出的目标的区域信息执行定位算法，最终计算得到目标的中心点的三维坐标(xt，yt，zt)；

所述目标区域信息识别模块包括：

第三顶点像素计算模块：判断i3＝1、2或3，相应的取图像Pic1、Pic2或Pic3，使用预训练的人工神经网络目标识别模型对图片做目标识别，得到识别出的目标的区域信息，顺时针排列的四个顶点的像素点为[p(i3，1)，p(i3，2)，p(i3，3)，p(i3，4)]，其中i3为1、2或3；

所述装置还包括定位算法模块，用于根据识别出的目标的区域信息执行定位算法；

所述第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)的硬件参数一致，所述第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)所组成的平面平行于目标运动轨迹(1)所在的平面；所述第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)的图像拍摄角度一致，均垂直于目标运动轨迹(1)所在的平面；

所述第一摄像头(2)、第二摄像头(3)以及第三摄像头(4)同时抓拍图像，并将图像传输到目标识别及定位运算服务器；

所述摄像头与所述服务器之间通过有线或无线通信方式连接，进行数据交互。