CN111583342B

CN111583342B - 一种基于双目视觉的目标快速定位方法及装置

Info

Publication number: CN111583342B
Application number: CN202010407645.2A
Authority: CN
Inventors: 王晔昕; 彭嫚; 刘召芹; 万文辉; 邸凯昌
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2020-05-14
Filing date: 2020-05-14
Publication date: 2024-02-23
Anticipated expiration: 2040-05-14
Also published as: CN111583342A

Abstract

本发明涉及一种基于双目视觉的目标快速定位方法及装置，其特征在于，包括以下步骤：1)对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络；2)获取待定位目标所在场景同一时刻的左影像和右影像；3)根据训练后的卷积神经网络，确定待定位目标分别在左影像和右影像的区域；4)对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；5)根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集；6)根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标，本发明可以广泛应用于目标定位领域中。

Description

一种基于双目视觉的目标快速定位方法及装置

技术领域

本发明是关于一种基于双目视觉的目标快速定位方法及装置，属于测量技术领域。

背景技术

采用两个摄像装置的双目视觉测量模式是视觉测量中一种重要的三维测量和定位方式，其原理是采用两个固定连接的相机，根据三角测量原理得到目标的三维信息。双目视觉测量模式由于其适用环境广泛、成本较低，在无人驾驶车、无人驾驶船、机器人和无人机等领域将发挥越来越重要的作用。

目前，依靠双目视觉测量模式来恢复深度信息的处理方式主要有两种：一是根据标定得到的相机参数和系统结构参数，首先对两个相机的影像做极线校正，然后在校正后的影像上进行同名特征点的匹配后计算生成视差图，根据视差图上的视差值信息来恢复三维信息；二是直接对双目视觉影像进行特征点提取和匹配得到同名特征点，然后根据相机内部参数和系统结构参数采用三角测量原理得到三维信息。

随着工业制造业发展，目前高清摄像机已非常普遍，在上述应用领域中也得到广泛应用。然而，高清摄像机拍摄得到的高分辨率影像较大，数据量是传统摄像机的几倍至几十倍，依靠上述传统恢复深度信息的处理方式已经无法实现快速实时地高精度目标定位。因此，研究一种适用于高清图像的基于双目视觉的目标快速定位方法具有重要意义。

发明内容

针对上述问题，本发明的目的是提供一种能够实现快速实时地高精度目标定位且适用于高清图像的基于双目视觉的目标快速定位方法及装置。

为实现上述目的，本发明采取以下技术方案：一种基于双目视觉的目标快速定位方法，包括以下步骤：1)对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络；2)通过标定后的双目视觉系统对待定位目标所在场景进行同步拍摄，获取待定位目标所在场景同一时刻的左影像和右影像；3)根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域；4)对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；5)根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集；6)根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标。

进一步地，所述步骤1)的具体过程为：1.1)对应于待定位目标所在场景的位置，在静止平台或运动平台上固定连接双目视觉系统，其中，双目视觉系统包括左相机和右相机；1.2)对双目视觉系统进行标定；1.3)对待定位目标进行数据采集，训练卷积神经网络。

进一步地，所述步骤1.2)的具体过程为：1.2.1)建立以左相机光心为原点的工作坐标系O_c-X_cY_cZ_c，其中，该工作坐标系为右手坐标系，深度方向为Z_c轴，X_c轴与Y_c轴分别平行于影像的x轴与y轴，控制场包括已知三维坐标的多个控制点；1.2.2)通过左相机和右相机对控制场中的控制点进行拍摄，提取控制点分别在左相机和右相机拍摄影像上的成像特征点，建立控制点三维坐标与二维影像坐标之间的映射关系；1.2.3)根据建立的映射关系，求解左相机和右相机的内部参数和畸变参数，以及右相机相对于左相机的系统结构参数。

进一步地，所述步骤3)的具体过程为：3.1)训练后的卷积神经网络包括卷积层、池化层和特征的分类层；3.2)将同一时刻的左影像和右影像同时输入至训练后的卷积神经网络，卷积神经网络的多层网络结构对输入的影像不断进行特征提取，通过分类层输出待定位目标的识别结果以及待定位目标的区域位置和范围，其中，左影像通过卷积神经网络特征提取后的M个待定位目标及其对应的区域集为T_L：{T_L1，T_L2，...，T_LM}，T_L1～T_LM表示左影像识别的待定位目标类别及其对应的区域；右影像通过卷积神经网络特征提取后的N个待定位目标及其对应的区域集为T_R：{T_R1，T_R2，...，T_RN}，其中，T_R1～T_RN表示右影像识别的待定位目标类别及其对应的区域；区域由(x，y，w，h)表示，分别为区域的左上顶点的图像坐标以及矩形的宽和高。

进一步地，所述步骤4)中当左影像和右影像中的待定位目标数量相同时，根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对待定位目标分别在左影像和右影像中的区域进行匹配，具体过程为：根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对左影像的区域集T_L进行排序，得到排序后的区域集；根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对右影像的区域集T_R进行排序，得到排序后的区域集；排序后的区域集中同一序号名称代表的区域为同一待定位目标。

进一步地，所述步骤4)中根据几何约束，对待定位目标分别在左影像和右影像中的区域进行匹配，具体过程为：根据标定后双目视觉系统的内部参数、畸变参数和系统结构参数，在标定场景图像中，通过建立的映射关系，采用直接线性变换8点法，计算双目视觉系统的F矩阵；记左影像的区域集T_L中每一待定位目标对应区域的中心点影像坐标为{x_L1，...x_L2...，x_Li...，x_LM}，其中，x_Li表示在左影像的图像坐标系坐标(x_Li，y_Li)；记右影像的区域集T_R中每一待定位目标对应区域的中心点影像坐标为{x_R1，...x_R2...，x_Rj...，x_RN}，其中，x_Rj表示在右影像的图像坐标系坐标(x_Rj，y_Rj)；若图像坐标系坐标x_Li和x_Rj满足下述几何约束，则图像坐标系坐标x_Li和x_Rj为同名区域：

进一步地，所述步骤5)的具体过程为：5.1)对于左影像和右影像中的一对同名区域，分别设置为对应的左ROI区域和右ROI区域；5.2)对左ROI区域和右ROI区域分别进行特征点提取，得到左ROI区域和右ROI区域的特征点集p_L和p_R；5.3)采用相关系数法，设定特征点集p_L和p_R中相关系数满足预先设定阈值的点对为同名特征点，得到对应的粗匹配特征点集p_L′和p_R′；5.4)对于左影像处理后的粗匹配特征点集p_L′中的每一同名特征点，设定右影像粗匹配特征点集p_R′中对应同名特征点的搜索窗口；5.5)采用最小二乘法，对于左影像的粗匹配特征点集p_L′中的每一同名特征点，根据设定的搜索窗口，确定右影像上的精匹配同名特征点，该对同名区域的精匹配特征点集为p_L″和p_R″；5.6)采用几何约束或RANSAC方法，对精匹配特征点集p_L″和p_R″进行误差剔除处理，得到处理后的精匹配特征点集p_L″和p_R″；5.7)进入所述步骤5.1)重新选取左影像和右影像中的一对同名区域，直至得到左影像和右影像中各对同名区域处理后的精匹配特征点集。

进一步地，所述步骤6)的具体过程为：6.1)根据精匹配特征点集为p_L″和p_R″，将待定位目标对应的同名区域中所有同名特征点的三维坐标换算为欧式距离值，并计算所有欧式距离值的方差；6.2)若方差大于预先设定的方差阈值，则去掉该方差对应的欧式距离值，进入步骤6.3)或6.4)或6.5)；6.3)对计算的欧式距离值进行排序，取排序后的欧式距离中间值对应的同名特征点的三维坐标作为待定位目标的三维坐标；6.4)对计算的欧式距离值进行排序，取与双目视觉系统距离最近的同名特征点的三维坐标作为待定位目标的三维坐标；6.5)计算余下欧式距离值的三维坐标平均值，并将其作为待定位目标的三维坐标。

一种基于双目视觉的目标快速定位装置，包括：预处理模块，用于对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络；双目相机采集模块，用于通过标定后的双目视觉系统对待定位目标所在场景进行同步拍摄，获取待定位目标所在场景同一时刻的左影像和右影像；特征提取识别模块，用于根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域；目标区域匹配模块，用于对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；特征点提取和匹配模块，用于根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集；三维定位模块，用于根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标。

进一步地，所述特征点提取和匹配模块包括：ROI区域设置单元，用于对于左影像和右影像中的一对同名区域，分别设置为对应的左ROI区域和右ROI区域；快速特征点提取单元，用于对左ROI区域和右ROI区域分别进行快速特征点提取，得到左ROI区域和右ROI区域的特征点集p_L和p_R；粗匹配特征点集确定单元，用于采用相关系数法，确定特征点集p_L和p_R中相关系数满足预先设定阈值的点对为同名特征点，得到对应的粗匹配特征点集p_L′和p_R′；搜索窗口设定单元，用于对于左影像的粗匹配特征点集p_L′中的每一同名特征点，设定右影像粗匹配特征点集p_R′中对应同名特征点的搜索窗口；精匹配特征点集确定单元，用于采用最小二乘法，对于左影像的粗匹配特征点集p_L′中的每一同名特征点，根据设定的搜索窗口，确定右影像上的精匹配同名特征点，该对同名区域的精匹配特征点集为p_L″和p_R″；误差剔除单元，用于采用几何约束或RANSAC方法，对精匹配特征点集p_L″和p_R″进行误差剔除处理，得到处理后的精匹配特征点集p_L″和p_R″。

本发明由于采取以上技术方案，其具有以下优点：

1、本发明的装置可置于静止平台或运动平台上，采用双目相机进行运动或静止目标的三维定位，具有非接触式、成本低的优点，可适用于静止或运动平台安装的双目视觉系统，对运动和静止目标进行快速实时地定位。

2、本发明的方法聚焦于目标区域，采用由粗到精的匹配方法，能够实现目标的高精度三维定位，具有高实时性和高精度的优点，可以为后续目标处置和装置平台提供有效安全保障和规划数据基础，可以广泛应用于目标定位领域中。

附图说明

图1是本发明方法的流程图；

图2是本发明方法中目标区域配对的示意图；

图3是本发明方法中目标区域配对的另一示意图；

图4是本发明装置的结构示意图。

具体实施方式

以下结合附图来对本发明进行详细的描绘。然而应当理解，附图的提供仅为了更好地理解本发明，它们不应该理解成对本发明的限制。

实施例一

如图1所示，本实施例提供一种基于双目视觉的目标快速定位方法，包括以下步骤：

1)对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络，具体为：

1.1)对应于待定位目标所在场景的位置，在静止平台或运动平台上固定连接双目视觉系统，其中，双目视觉系统包括左相机和右相机。

1.2)对双目视觉系统进行标定：

1.2.1)建立以左相机光心为原点的工作坐标系O_c-X_cY_cZ_c，其中，该工作坐标系为右手坐标系，深度方向为Z_c轴，X_c轴与Y_c轴分别平行于影像的x轴与y轴，控制场包括已知三维坐标的多个控制点。

1.2.2)通过左相机和右相机对控制场中的控制点进行拍摄，提取控制点分别在左相机和右相机拍摄影像上的成像特征点，建立控制点三维坐标与二维影像坐标之间的映射关系。

1.2.3)根据建立的映射关系，求解左相机和右相机的内部参数(包括焦距和主点位置坐标等)和畸变参数(包括径向畸变参数和切向畸变参数等)，以及右相机相对于左相机的系统结构参数(包括旋转矩阵和平移向量)，完成双目视觉系统的标定，其中，标定方法为现有技术公开的方法，具体过程在此不多做赘述。

1.3)对待定位目标进行数据采集，训练卷积神经网络：

1.3.1)采用单目或双目视觉系统对待定位N类目标所在场景进行拍摄，得到包含待定位N类目标的若干影像数据。

1.3.2)对得到的若干影像数据进行样本制作，确定待定位N类目标的标识(类别1，类别2，…，类别N)。

1.3.3)根据标识后的样本数据，训练卷积神经网络，得到适应于待定位N类目标特征的卷积神经网络权值文件。

2)通过标定后的双目视觉系统中的左相机和右相机，对待定位目标所在场景进行同步拍摄，同步控制双目视觉系统中左相机拍摄的左影像与右相机拍摄的右影像为同一时刻的场景，获取待定位目标所在场景同一时刻的左影像和右影像，其中，同步控制为现有技术，可由软件或硬件方式实现。

进一步地，左相机和右相机拍摄影像的同步控制精度应满足三维定位测量精度的要求，即通过同步控制获取的左相机和右相机拍摄的影像上，根据空间点对应成像点(同名点)计算得到的三维坐标(X,Y,Z)和理想情况下同一空间点对应成像点计算得到的三维坐标(X′,Y′,Z′)之间的差值应不大于三维定位测量误差的要求范围。

3)根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域，具体为：

3.1)训练后的卷积神经网络包括若干卷积层和池化层，有的层间包括非线性激活函数；训练后的卷积神经网络还包括特征的分类层；根据需要，训练后的卷积神经网络还包括特征归一化层和网络优化的相关层。

3.2)将同一时刻的左影像和右影像同时输入至训练后的卷积神经网络，卷积神经网络的多层网络结构对输入的影像不断进行抽象化特征提取，通过分类层输出待定位目标的识别结果以及待定位目标的区域位置和范围，其中，区域位置为矩形区域、方形区域或轮廓区域：

以矩形区域为例，记左影像通过卷积神经网络特征提取后的M个待定位目标及其对应的区域集为T_L：{T_L1，T_L2，...，T_LM}，其中，T_L1～T_LM表示左影像识别的待定位目标类别及其对应的矩形区域，矩形区域由(x，y，w，h)表示，分别为矩形的左上顶点的图像坐标以及矩形的宽和高；记右影像通过卷积神经网络特征提取后的N个待定位目标及其对应的区域集为T_R：{T_R1，T_R2，...，T_RN}，其中，T_R1～T_RN表示右影像识别的待定位目标类别及其对应的矩形区域。

4)对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中同一序号名称代表的区域(即同名区域)为同一待定位目标，具体为：

4.1)如图2所示，当M等于N即左影像和右影像中的待定位目标数量相同时，根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对待定位目标分别在左影像和右影像中的区域进行匹配：

4.1.1)根据待定位目标的区域位置中左上顶点的x坐标大小或者待定位目标的区域面积的大小，对左影像的区域集T_L进行排序，得到排序后的区域集T_L：{T_L1，T_L2，...，T_LM}。

4.1.2)根据待定位目标的区域位置中左上顶点的x坐标大小或者待定位目标的区域面积的大小，对右影像的区域集T_R进行排序，得到排序后的区域集T_R：{T_R1，T_R2，...，T_RN}。

4.1.3)排序后的区域集T_L′和T_R′中同一序号代表的区域为同一待定位目标，可作为配对的结果，例如：区域集T_L1′与T_R1′分别包括右相机拍摄的不同视角下的同一区域。

4.2)如图3所示，还可以根据几何约束，对待定位目标分别在左影像和右影像中的区域进行匹配，其中，M可以等于N也可以不等于N：

4.2.1)根据标定后双目视觉系统的内部参数、畸变参数和系统结构参数，在标定场景图像中，通过步骤1.2.2)中建立的映射关系，采用直接线性变换8点法，计算双目视觉系统的F矩阵，其中，直接线性变换8点法为现有技术公开的方法，具体过程在此不多做赘述。

在实际使用时，记左影像的区域集T_L中每一待定位目标对应区域的中心点影像坐标为{x_L1，...x_L2...，x_Li...，x_LM}，其中，x_Li表示在左影像的图像坐标系坐标(x_Li，y_Li)；记右影像的区域集T_R中每一待定位目标对应区域的中心点影像坐标为{x_R1，...x_R2...，x_Rj...，x_RN}，其中，x_Rj表示在右影像的图像坐标系坐标(x_Rj，y_Rj)。

4.2.2)根据计算的F矩阵和几何约束，对待定位目标分别在左影像和右影像中的区域进行匹配，即若图像坐标系坐标x_Li和x_Rj满足下述几何约束，则认为图像坐标系坐标x_Li和x_Rj为同名区域：

因为实际情况不可能得到零，所以接近零或小于预先设定的阈值的x_Li和x_Rj为匹配成功的同名区域。

5)采用粗匹配方法和精匹配方法，根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集，具体为：

5.1)对于左影像和右影像中的一对同名区域，分别设置为对应的左ROI(Researchof Interest，感兴趣区域)区域和右ROI区域。

5.2)对左ROI区域和右ROI区域分别进行特征点提取，得到左ROI区域和右ROI区域的特征点集p_L和p_R。

5.3)采用相关系数法，对特征点集p_L和p_R中的每一点均进行粗匹配，即设定特征点集p_L和p_R中相关系数满足预先设定阈值的点对为同名特征点，得到对应的粗匹配特征点集p_L′和p_R′。

5.4)对于左影像的粗匹配特征点集p_L′中的每一同名特征点，设定右影像粗匹配特征点集p_R′中对应同名特征点的搜索窗口大小。

5.5)采用最小二乘法，对于左影像的粗匹配特征点集p_L′中的每一同名特征点，根据设定的搜索窗口，确定右影像上对应的同名特征点为精匹配同名特征点，记右影像上所有精匹配特征点的点集为p_R″，该对同名区域的精匹配特征点集为p_L″和p_R″。

5.6)采用几何约束(1)或RANSAC(Random Sample Consensus，随机抽样一致)方法，对精匹配特征点集p_L″和p_R″进行误差剔除处理，得到处理后的精匹配特征点集p_L″和p_R″。

5.7)进入步骤5.1)重新选取左影像和右影像中的一对同名区域，直至得到左影像和右影像中各对同名区域处理后的精匹配特征点集。

6)采用三角测量原理，根据每一待定位目标的精匹配特征点集以及标定后双目视觉系统的内部参数、畸变参数和系统结构参数，确定对应待定位目标的三维坐标。由于每一待定位目标对应的同名区域有不止一对同名特征点，可以计算得到每对同名特征点对应的待定位目标的三维坐标，因此，可以采用下述且不局限于下述任何一种方式进行计算：

6.1)根据精匹配特征点集p_L″和p_R″，将待定位目标对应的同名区域中所有同名特征点的三维坐标换算为欧式距离值，并计算所有欧式距离值的方差。

6.2)若方差大于预先设定的方差阈值，则去掉该方差对应的欧式距离值，进入步骤6.3)或6.4)或6.5)。

6.3)对计算的欧式距离值进行排序，取排序后的欧式距离中间值对应的同名特征点的三维坐标作为待定位目标的三维坐标。

6.4)对计算的欧式距离值进行排序，取与双目视觉系统距离最近的同名特征点的三维坐标作为待定位目标的三维坐标。

6.5)计算余下欧式距离值的三维坐标平均值，并将其作为待定位目标的三维坐标。

实施例二

如图4所示，本实施例提供一种基于双目视觉的目标快速定位装置，包括：

预处理模块，用于对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络；

双目相机采集模块1，用于通过标定后的双目视觉系统对待定位目标所在场景进行同步拍摄，获取待定位目标所在场景同一时刻的左影像和右影像；

特征提取识别模块2，用于根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域；

目标区域匹配模块3，用于对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；

特征点提取和匹配模块4，用于根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集；

三维定位模块5，用于根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标。

在一个优选的实施例中，特征点提取和匹配模块4包括：

ROI区域设置单元，用于对于左影像和右影像中的一对同名区域，分别设置为对应的左ROI区域和右ROI区域；

快速特征点提取单元，用于对左ROI区域和右ROI区域分别进行快速特征点提取，得到左ROI区域和右ROI区域的特征点集p_L和p_R；

粗匹配特征点集确定单元，用于采用相关系数法，确定特征点集p_L和p_R中相关系数满足预先设定阈值的点对为同名特征点，得到对应的粗匹配特征点集p_L′和p_R′；

搜索窗口设定单元，用于对于左影像的粗匹配特征点集p_L′中的每一同名特征点，设定右影像粗匹配特征点集p_R′中对应同名特征点的搜索窗口；

精匹配特征点集确定单元，用于采用最小二乘法，对于左影像的粗匹配特征点集p_L′中的每一同名特征点，根据设定的搜索窗口，确定右影像上的精匹配同名特征点，该对同名区域的精匹配特征点集为p_L″和p_R″；

误差剔除单元，用于采用几何约束或RANSAC方法，对精匹配特征点集p_L″和p_R″进行误差剔除处理，得到处理后的精匹配特征点集p_L″和p_R″。

在一个优选的实施例中，三维定位模块中得到的三维坐标可为装置当前位置建立的坐标系下的三维坐标，也可根据该装置和运动平台上其它协同仪器之间的关系，换算到其它仪器建立的对应坐标系下，或根据其它基准坐标系和已知的坐标换算关系，将定位结果换算到其它基准坐标系下。

本领域技术人员应该明白，本发明实施例可以用例如计算机装置可执行的程序来实现，从而可以将它们存储在存储装置中由处理器来执行，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等；或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或操作制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件的结合。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于双目视觉的目标快速定位方法，其特征在于，包括以下步骤：

1)对应于待定位目标所在场景的位置，固定设置双目视觉系统，对双目视觉系统进行标定，并训练卷积神经网络；

2)通过标定后的双目视觉系统对待定位目标所在场景进行同步拍摄，获取待定位目标所在场景同一时刻的左影像和右影像；

3)根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域；

4)对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；

5)根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集，具体过程为：

5.1)对于左影像和右影像中的一对同名区域，分别设置为对应的左ROI区域和右ROI区域；

5.2)对左ROI区域和右ROI区域分别进行特征点提取，得到左ROI区域和右ROI区域的特征点集p_L和p_R；

5.3)采用相关系数法，设定特征点集p_L和p_R中相关系数满足预先设定阈值的点对为同名特征点，得到对应的粗匹配特征点集p_L′和p_R′；

5.4)对于左影像处理后的粗匹配特征点集p_L′中的每一同名特征点，设定右影像粗匹配特征点集p_R′中对应同名特征点的搜索窗口；

5.5)采用最小二乘法，对于左影像的粗匹配特征点集p_L′中的每一同名特征点，根据设定的搜索窗口，确定右影像上的精匹配同名特征点，该对同名区域的精匹配特征点集为p_L″和p_R″；

5.6)采用几何约束或RANSAC方法，对精匹配特征点集p_L″和p_R″进行误差剔除处理，得到处理后的精匹配特征点集p_L″和p_R″；

5.7)进入所述步骤5.1)重新选取左影像和右影像中的一对同名区域，直至得到左影像和右影像中各对同名区域处理后的精匹配特征点集；

6)根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标。

2.如权利要求1所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤1)的具体过程为：

1.1)对应于待定位目标所在场景的位置，在静止平台或运动平台上固定连接双目视觉系统，其中，双目视觉系统包括左相机和右相机；

1.2)对双目视觉系统进行标定；

1.3)对待定位目标进行数据采集，训练卷积神经网络。

3.如权利要求2所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤1.2)的具体过程为：

1.2.1)建立以左相机光心为原点的工作坐标系O_c-X_cY_cZ_c，其中，该工作坐标系为右手坐标系，深度方向为Z_c轴，X_c轴与Y_c轴分别平行于影像的x轴与y轴，控制场包括已知三维坐标的多个控制点；

1.2.2)通过左相机和右相机对控制场中的控制点进行拍摄，提取控制点分别在左相机和右相机拍摄影像上的成像特征点，建立控制点三维坐标与二维影像坐标之间的映射关系；

1.2.3)根据建立的映射关系，求解左相机和右相机的内部参数和畸变参数，以及右相机相对于左相机的系统结构参数。

4.如权利要求3所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤3)的具体过程为：

3.1)训练后的卷积神经网络包括卷积层、池化层和特征的分类层；

3.2)将同一时刻的左影像和右影像同时输入至训练后的卷积神经网络，卷积神经网络的多层网络结构对输入的影像不断进行特征提取，通过分类层输出待定位目标的识别结果以及待定位目标的区域位置和范围，其中，左影像通过卷积神经网络特征提取后的M个待定位目标及其对应的区域集为T_L：{T_L1，T_L2，...，T_LM}，T_L1～T_LM表示左影像识别的待定位目标类别及其对应的区域；右影像通过卷积神经网络特征提取后的N个待定位目标及其对应的区域集为T_R：{T_R1，T_R2，...，T_RN}，其中，T_R1～T_RN表示右影像识别的待定位目标类别及其对应的区域；区域由(x，y，w，h)表示，分别为区域的左上顶点的图像坐标以及矩形的宽和高。

5.如权利要求4所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤4)中当左影像和右影像中的待定位目标数量相同时，根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对待定位目标分别在左影像和右影像中的区域进行匹配，具体过程为：

根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对左影像的区域集T_L进行排序，得到排序后的区域集；

根据待定位目标的区域位置中左上顶点的x坐标大小，或者待定位目标的区域面积的大小，对右影像的区域集T_R进行排序，得到排序后的区域集；

排序后的区域集中同一序号名称代表的区域为同一待定位目标。

6.如权利要求4所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤4)中根据几何约束，对待定位目标分别在左影像和右影像中的区域进行匹配，具体过程为：

根据标定后双目视觉系统的内部参数、畸变参数和系统结构参数，在标定场景图像中，通过建立的映射关系，采用直接线性变换8点法，计算双目视觉系统的F矩阵；

记左影像的区域集T_L中每一待定位目标对应区域的中心点影像坐标为{x_L1，...x_L2...，x_Li...，x_LM}，其中，x_Li表示在左影像的图像坐标系坐标(x_Li，y_Li)；

记右影像的区域集T_R中每一待定位目标对应区域的中心点影像坐标为{x_R1，...x_R2...，x_Rj...，x_RN}，其中，x_Rj表示在右影像的图像坐标系坐标(x_Rj，y_Rj)；

若图像坐标系坐标x_Li和x_Rj满足下述几何约束则图像坐标系坐标x_Li和x_Rj为同名区域。

7.如权利要求6所述的一种基于双目视觉的目标快速定位方法，其特征在于，所述步骤6)的具体过程为：

6.1)根据精匹配特征点集为p_L″和p_R″，将待定位目标对应的同名区域中所有同名特征点的三维坐标换算为欧式距离值，并计算所有欧式距离值的方差；

6.2)若方差大于预先设定的方差阈值，则去掉该方差对应的欧式距离值，进入步骤6.3)或6.4)或6.5)；

6.3)对计算的欧式距离值进行排序，取排序后的欧式距离中间值对应的同名特征点的三维坐标作为待定位目标的三维坐标；

6.4)对计算的欧式距离值进行排序，取与双目视觉系统距离最近的同名特征点的三维坐标作为待定位目标的三维坐标；

8.一种基于权利要求1至7任一项所述的基于双目视觉的目标快速定位方法的基于双目视觉的目标快速定位装置，其特征在于，包括：

双目相机采集模块，用于通过标定后的双目视觉系统对待定位目标所在场景进行同步拍摄，获取待定位目标所在场景同一时刻的左影像和右影像；

特征提取识别模块，用于根据训练后的卷积神经网络，对获取的左影像和右影像进行特征提取，确定待定位目标分别在左影像和右影像的区域；

目标区域匹配模块，用于对待定位目标分别在左影像和右影像中的区域进行匹配，使得左影像和右影像中的同名区域为同一待定位目标；

特征点提取和匹配模块，用于根据左影像和右影像中的同名区域，确定每一待定位目标的精匹配特征点集；

三维定位模块，用于根据每一待定位目标的精匹配特征点集，确定对应待定位目标的三维坐标。

9.如权利要求8所述的一种基于双目视觉的目标快速定位装置，其特征在于，所述特征点提取和匹配模块包括：