CN111854678A

CN111854678A - 一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法

Info

Publication number: CN111854678A
Application number: CN202010691536.8A
Authority: CN
Inventors: 高飞; 邱琪; 葛一粟; 卢书芳; 翁立波
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-07-17
Filing date: 2020-07-17
Publication date: 2020-10-30
Anticipated expiration: 2040-07-17
Also published as: CN111854678B

Abstract

本发明提出了一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法，它包括对测量场地进行标定；对测量物体拍摄并制作数据集进行语义分割的训练；通过训练出的模型实现图像定位，结合本文的数学模型实现位置和姿态的测量。本发明基于单目视觉测量和语义分割，能适应各种宽度已知高度未知的物体，相关参数经过卡尔曼滤波优化，能够快速准确地实现定位。

Description

一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法

技术领域

本发明涉及视觉测量技术领域，具体是一种单目视觉下基于语义分割和卡尔曼滤波对目标物体相对于参照物的位置和姿态测量的方法。

背景技术

视觉测量是以计算机视觉为理论基础，对物体几何尺寸、位置或姿态的精确测量。它具有非接触性、测量精度高和速度快等特点，在质量监控、机器人导航、辅助泊车和港口自动化等多个领域有广阔的应用。近年来，区域间的交流协作日益紧密。港口作为全球贸易的流通载体，在区域经济发展中具有重要地位。面对港口集装箱吞吐量的不断增长，集装箱码头对装卸效率的要求越来越高。自动化地识别集装箱或集装箱卡车，辅助装卸货的位姿测量方法能极大地提高港口效率。

为了提高陆侧集装箱装卸作业的效率，国内外学术界、工业界提出了许多基于视觉方法实现集装箱卡车的无人引导。其中较为接近的方法包括：Jerney Mrovlj(MrovljeJ,

D.Automatic detection of the truck position using stereoscopy[C]//IEEE International Conference on Industrial Technology.IEEE,2012:755-759.)提出在集卡车架侧面安置标识块，然后用一对平行于地面的双目相机，识别标志块的精确位置，根据先验知识计算集装箱可能的位置并给出停靠建议。该方案的缺陷在于需要在集卡上安装标识块，对外来集卡不适用，而且该方案无法提供集卡相对于停车线的水平位置及偏斜角信息。汪韬(一种基于双目视觉的集卡定位与引导的方法及其系统，专利号：ZL201510599986.3)提出使用一对平行于地面，光轴与停车线共面的双目相机，先使用双目相机完成地面的标定，然后使用其中一个相机实现集卡定位，最后在显示屏中显示出清晰的示意图。该方案的缺陷一个是使用双目相机比单目相机成本更高，一个是相机安装难度较高，容易出现安装误差。发明专利(公开号： CN101096262A，名称：集装箱起重机的集卡车对位系统和方法)利用摄像机拍摄集卡图像并与起重机吊具轮廓比对完成粗定位，然后利用激光扫描集卡进行精确定位，该方案效率低、成本高。

综上所述，当前解决方案都有一定的局限性，无法在简易安装的基础上准确、经济地解决集卡位姿测量问题。

发明内容

为克服现有技术上的不足，本发明的目的在于提供一种单目视觉下基于语义分割实现集卡位姿测量的方法。它以语义分割对单目相机拍摄的图像进行图像定位，再结合卡尔曼滤波优化后的停车场地的物理参数，准确实现集卡位姿测量，并在显示屏上给出直观的结果。

所述的一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法，其特征在于包括如下步骤：

步骤1：根据实际场地大小定制一张正方形黑白格组成的标定板，将标定板边界平行于停车线放置在待测地面，固定相机拍取20幅图像，使用张氏标定法得到相机的内参矩阵K、外参矩阵R和T，并选择其中一幅清晰图像计算该图像对应的图像坐标到待测地面坐标的转换矩阵M；

步骤2：以步骤1中选取的图像建立待测地面的世界坐标系，具体为：取标定板中最接近停车线与车道交点的内部角点为原点，以标定板中平行于停车线的边界作为Y轴，平行于车道的边界作为X轴，垂直于地面向上过原点的射线为Z 轴；此时，相机坐标系中相机坐标为(0,0,0)，根据式(1)计算得到对应的世界坐标系中相机坐标为(X_w,Y_w,Z_w)；

其中，R和T为步骤1中的相机外参矩阵；

步骤3：使用工业相机拍摄至少3000张集卡不同位姿的图像作为样本，使用特征提取网络MobileNetV2和语义分割网络BiseNet，训练得到对集卡顶部的语义分割模型；

步骤4：记集卡端部线段的两个端点分别为A点和B点，点E为连接相机光心和点A的直线与待测平面的交点，点F为连接相机光心和点B的直线与待测平面的交点，由步骤3中语义分割得到点E、F的图像坐标，分别代入式(2)计算对应的世界坐标，再根据式(3)计算得到线段EF长度L_EF；

其中，M为相机的图像坐标到世界坐标的转换矩阵，(u，v，0)表示待测平面上点的图像坐标，(X，Y，0)表示该点对应的世界坐标，(X_E，Y_E，0)和(X_F，Y_F，0)分别表示点E、F对应的世界坐标；

步骤5：根据方程组(4)对L_EF进行k_max次迭代测量，其中，第k次迭代测量得到的L_EF的结果记为

将k＝0时L_EF的值记为

从后续迭代测量开始，

即k＝1,2,…，实现对L_EF真值的逼近测量；

其中，

P_k-1分别表示第k-1次对L_EF的迭代测量结果和对应的协方差，P₀设置为0，

分别表示第k次对L_EF的估计值和对应的协方差，L_k、K_k分别表示第k次直接测量结果和卡尔曼增益，R为事先设置的环境误差，其取值范围为0.01≤R≤10，k_max为最大测量次数；

步骤6：将步骤5迭代计算得到的

作为最终的L_EF代入式(5)，计算出集卡端部相对于停车线的实际距离l；

根据式(6)计算集卡端部直线与停车线的相对角度degree；计算得到l和degree，即实现了集卡的精确定位；

degree＝arctan((Y_E-Y_F)/(X_E-X_F)) (6)

其中，L_AB表示集卡端部线段AB的长度，L_EF表示该线段在待测平面上的投影EF 的长度，X_min为点E和F的X坐标中的最小值，X₁为相机垂直投影点的X坐标的绝对值，degree表示车端部与停车线的相对角度，arctan为反正切函数，(X_E，Y_E， 0)和(X_F，Y_F，0)分别表示点E、F的世界坐标。

与现有技术相比，本发明的有益效果为：本发明基于单目视觉测量和语义分割，成本低廉，算法鲁棒性高，能适应各种宽度已知高度未知的物体，计算速度优于双目视觉，相关参数经过卡尔曼滤波优化，能够快速准确地实现集卡定位，并且安装难度低，对相机安装角度无特殊要求，只需停车线和车端部在相机视野即可。

附图说明

图1为标定地面所需黑白格标定布示例；

图2为单目视觉车辆定位模型，以标定板中平行于停车线的边界作为Y轴，平行于车道的边界作为X轴，过两者交点O_w垂直于平面O的直线为Z轴建立世界坐标系，其中c为单目相机，A′B′为物体端部直线AB在图像平面的投影，CD 作为AB在平面O上的垂直投影；

图3为对XOZ平面的侧投影模型灰度图，其中h表示车端部到地面高度，H 表示相机到地面高度，X₁为相机到停车线水平距离，b表示测量误差CE，c表示实际停车距离，O_w为世界坐标原点，表示停车线L位置；

图4为AB在平面O上投影示意图，EF为AB沿着相机正方向在平面O上的投影；

图5为验证程序效果图灰度图。

具体实施方式

下面结合说明书附图和实例，对本发明进行进一步的说明。

如图1-5所示，本发明的一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法，具体包括如下步骤：

步骤1：根据实际场地大小定制一张如图1所示的正方形黑白格组成的标定板，将标定板边界平行于停车线放置在待测地面，固定相机拍取20幅图像，使用张氏标定法得到相机的内参矩阵K、外参矩阵R和T，并选择其中一幅清晰图像计算该图像对应的相机的图像坐标到待测地面坐标的转换矩阵M；

步骤2：如图2所示，以步骤1中选取的图像建立待测地面的世界坐标系，具体为：取标定板中最接近停车线与车道交点的内部角点为原点，以标定板中平行于停车线的边界作为Y轴，平行于车道的边界作为X轴，垂直于地面向上过原点的射线为Z轴；此时，相机坐标系中相机坐标为(0,0,0)，并根据式(1)计算得到世界坐标系中对应的相机坐标(X_w,Y_w,Z_w)；

其中，R和T为步骤1中的相机外参矩阵；

步骤3：使用工业相机拍取3000张集卡不同位姿的图像作为样本，使用特征提取网络MobileNetV2和语义分割网络BiseNet，训练得到对集卡顶部的语义分割模型；

步骤4：如图3所示，集卡端部线段的两个端点分别为A点和B点，X₁为相机垂直投影点的X坐标的绝对值，C为A点在待测平面的垂直投影，D为B 点的垂直投影，点E为连接相机光心和点A的直线与待测平面的交点，点F为连接相机光心和点B的直线与待测平面的交点，由步骤3中语义分割得到点E、F 的图像坐标，分别代入式(2)计算对应的世界坐标，再根据式(3)计算得到线段EF 长度L_EF；

将k＝0时L_EF的值记为

从后续迭代测量开始，即k＝1,2,…，实现对L_EF真值的逼近测量；

其中，

分别表示第k次对L_EF的估计值和对应的协方差，L_k、K_k分别表示第k次直接测量结果和卡尔曼增益，R为事先设置的环境误差，其取值范围为0.01≤R≤10，k_max为最大测量次数，即方程组(4)迭代计算的终止条件；在本实施例中，考虑停车测量的实时性及测量环境，设置k_max＝10，R＝0.1；

步骤6：将步骤5迭代计算得到的

作为最终的L_EF代入式(5)，计算出集卡端部相对于停车线的实际距离l；根据式(6)计算集卡端部直线与停车线的相对角度degree；计算得到l和degree，即实现了集卡的精确定位；

degree＝arctan((Y_E-Y_F)/(X_E-X_F)) (6)

其中，L_AB表示集卡端部线段AB的长度，L_EF表示该线段在待测平面上的投影EF 的长度，X_min为点E和F的X坐标中的最小值，X₁为相机垂直投影点的X坐标的绝对值，degree表示车端部与停车线的相对角度，arctan为反正切函数，(X_E，Y_E， 0)和(X_F，Y_F，0)分别表示点E、F的世界坐标；

步骤7：如图5所示，在程序中根据上述步骤计算结果，使用GDI绘制车道、停车线以及车辆相对位置，为集卡司机呈现直观的结果。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种单目视觉下基于语义分割和卡尔曼滤波的位姿测量方法，其特征在于包括如下步骤：

步骤2：以步骤1中选取的图像建立待测地面的世界坐标系，具体为：取标定板中最接近停车线与车道交点的内部角点为原点，以标定板中平行于停车线的边界作为Y轴，平行于车道的边界作为X轴，垂直于地面向上过原点的射线为Z轴；此时，相机坐标系中相机坐标为(0,0,0)，根据式(1)计算得到对应的世界坐标系中相机坐标为(X_w,Y_w,Z_w)；

其中，R和T为步骤1中的相机外参矩阵；

将k＝0时L_EF的值记为

其中，

步骤6：将步骤5迭代计算得到的

degree＝arctan((Y_E-Y_F)/(X_E-X_F)) (6)

其中，L_AB表示集卡端部线段AB的长度，L_EF表示该线段在待测平面上的投影EF的长度，X_min为点E和F的X坐标中的最小值，X₁为相机垂直投影点的X坐标的绝对值，degree表示车端部与停车线的相对角度，arctan为反正切函数，(X_E，Y_E，0)和(X_F，Y_F，0)分别表示点E、F的世界坐标。