CN114863375B

CN114863375B - 一种基于3d视觉识别的加油站车辆多视角定位方法

Info

Publication number: CN114863375B
Application number: CN202210652153.9A
Authority: CN
Inventors: 顾毅; 梁新乐; 辛伟
Original assignee: Wuxi Xuelang Shuzhi Technology Co ltd
Current assignee: Wuxi Xuelang Shuzhi Technology Co ltd
Priority date: 2022-06-10
Filing date: 2022-06-10
Publication date: 2023-06-30
Anticipated expiration: 2042-06-10
Also published as: CN114863375A

Abstract

本发明公开了一种基于3D视觉识别的加油站车辆多视角定位方法，该方法包括以下步骤：S1、预先配置若干监控相机，并将若干监控相机获取的路面图像转换为鸟瞰图；S2、对若干转换后的鸟瞰图进行拼接处理；S3、采用FCOS3D算法并结合监控相机内参矩阵，完成对车辆3D检测框的识别；S4、对车辆3D检测框的底面坐标进行转换，且在转换后进行检测框去重。实现加油站多相机的车辆检测，有效缓解了一般基于2D图像的简单车牌识别功能系统可扩展性低、成本过高的情况，为后续车辆身份识别及跟踪、无感支付、算法油枪分配等智慧功能打下基础，最大化利用现有监控设备，显著降低智能化改造成本。

Description

一种基于3D视觉识别的加油站车辆多视角定位方法

技术领域

本发明涉及视觉识别领域，具体来说，涉及一种基于3D视觉识别的加油站车辆多视角定位方法。

背景技术

随着人民生活水平的提高，加油站加油效率通常面临着巨大的业务压力，用户等待时间过长、加油流程过久、设备编排和管理低效等情况经常发生。与此同时，分析车辆数据热力分布图，预测加油站业务的波峰和波谷，轻松预测排队时间，灵活调整营销策略，智慧管理加油设备等需求逐渐成为智慧加油站升级发展的目标。

目前智慧加油站的建设方法一般是基于在油枪附近加装摄像头识别2D图像中的车牌信息，绑定支付账号，完成加油后自动扣款的方式，出于安全考虑加装摄像头需要对加油机进行重新设计，改造及推广普及难度过高，且此类方式可扩展空间小，重新设计加油机的成本过高，无法满足后续更多智能分析需求的建设。且存在一定安全隐患。利用现成的加油站监控摄像头实现车辆在整个站内的空间定位，以此达成一种更廉价延展性更大的智能化改造，日益成为智慧加油站发展的痛点。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出一种基于3D视觉识别的加油站车辆多视角定位方法，以克服现有相关技术所存在的上述技术问题。

为此，本发明采用的具体技术方案如下：

一种基于3D视觉识别的加油站车辆多视角定位方法，该方法包括以下步骤：

S1、预先配置若干监控相机，并将若干监控相机获取的路面图像转换为鸟瞰图；

其中，所述S1中预先配置若干监控相机，并将若干监控相机获取的路面图像转换为鸟瞰图还包括以下步骤：

S11、通过监控相机获取路面图像，并在路面图像上采样若干数量平行线条特征点；

S12、预估转换后对应点的坐标，并调用OpenCV库的getPerspectiveTransform函数，同时输入原图坐标点和预估的转换后对应点，求得P透视变换矩阵；

S13、调用perspectiveTransform函数，并输入原图及P透视变换矩阵，得到转换后的鸟瞰图；

S2、对若干转换后的鸟瞰图进行拼接处理；

其中，所述S2中对若干转换后的鸟瞰图进行拼接处理还包括以下步骤：

S21、计算鸟瞰图的色彩校正参数及全局调整参数，完成鸟瞰图的色彩校正；

所述S21中计算鸟瞰图的色彩校正参数及全局调整参数，完成鸟瞰图的色彩校正还包括以下步骤：

设定n幅待拼接的鸟瞰图P₁，P₂，…，P_i，…，P_n，P_i-1和P_i是相邻的两幅鸟瞰图，c∈{R，G，B}，i＝1，2，…，n，则鸟瞰图P的色彩校正参数a_c,i可由以下公式得到：

设定一个全局调节参数g_c，用来调整整个待拼接序列的色彩值，并计算彩色图像R，G，B三个通道的全局调节参数g_c，则使图像i的c通道的调节参数为g_ca_c,i，使调整参数接近1，则有最小二次方程：

结合最小二次方程，将色彩校正参数公式求导等于0，得到公式：

通过色彩校正参数a_c,i及全局调节参数g_c，对鸟瞰图P_i进行色彩校正；

式中，M指相邻图像的重叠区域，S_c,i-₁(s)指鸟瞰图P_i-1中的像素点S的像素值，S_c,i(s)指鸟瞰图P_i中的像素点S的像素值；^γ指参数，对于待拼接的第一幅鸟瞰图P，设定a_c,i＝1；

S22、基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准；

S23、基于加权融合算法对两个鸟瞰图进行融合，完成鸟瞰图的拼接；

其中，若监控相机获取的路面图像为鱼眼图像，则对鱼眼图像进行畸变校正处理；

S3、采用FCOS3D算法并结合监控相机内参矩阵，完成对车辆3D检测框的识别；

S4、对车辆3D检测框的底面坐标进行转换，且在转换后进行检测框去重。

进一步的，所述S2中对若干转换后的鸟瞰图进行拼接处理之前，将若干转换后的鸟瞰图中的部分图像进行上下翻转与对齐，并记录下每个相机图像的对应操作。

进一步的，所述S22中基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准时，每个鸟瞰图均包含确定的SIFT特征点，每个特征点包括尺度空间极值、特征点位置、特征点方向及特征点描述符。

进一步的，所述S23中基于加权融合算法对两个鸟瞰图进行融合，完成鸟瞰图的拼接还包括以下步骤：

设定两幅鸟瞰图的重叠区域中，权重函数d₁由1渐变至0，权重函数d₂由0渐变至1，实现前一幅鸟瞰图过渡至第二幅鸟瞰图；

融合后的图像为：

式中，f₁，f₂分别表示两幅鸟瞰图，d₁，d₂分别表示权重函数，x，y均为坐标参数。

进一步的，所述若监控相机获取的路面图像为鱼眼图像，则对鱼眼图像进行畸变校正处理还包括以下步骤：

设定鱼眼图像长为W，宽为H，鱼眼图像中任一点的坐标为(x'，y')，鱼眼图像的中心点为(W/2，H/2)，鱼眼图像畸变校正后对应的图像坐标为(u，v)，鱼眼图像中任一点至图像中心点的距离为r，则距离r的计算公式为：

建立一个容器，并建立鱼眼图像与校正后的图像的映射关系，并将该映射关系存储在容器内，采取一一映射的方式生成图像；

根据鱼眼图像边缘最大畸变曲线进行椭圆拟合，获得边缘椭圆半径r'，鱼眼图像畸变校正后图像中像素的坐标与原鱼眼图像中点坐标的映射函数为：

式中，β中为校正偏差系数，z为调整系数。

进一步的，所述S4中对车辆3D检测框的底面坐标进行转换还包括以下步骤：

获取检测框列表，并在每个检测框底面构建4个坐标；

利用P透视变换矩阵进行检测框的投影及相应翻转操作。

进一步的，所述S4中在转换后进行检测框去重时，采用NMS非极大抑制进行全图检测框的去重，并留下概率最大的非重叠检测框。

本发明的有益效果为：

(1)本发明提出一种基于3D视觉识别的加油站车辆多视角定位方法，采用加油站都具备的监控摄像头，通过3D车辆检测、BEV鸟瞰图空间定位等方式，实现加油站多相机的车辆检测，有效缓解了一般基于2D图像的简单车牌识别功能系统可扩展性低、成本过高的情况，为后续车辆身份识别及跟踪、无感支付、算法油枪分配等智慧功能打下基础。通过对鸟瞰图进行色彩调整，提高了鸟瞰图拼接效果，使得鸟瞰图融合效率提高。

(2)本发明提出一种基于3D视觉识别的加油站车辆多视角定位方法，能够最大化利用现有监控设备，实现车辆在整个加油站视野内的定位，显著降低智能化改造成本，并能够在此基础上进一步整合车辆跟踪、车牌识别、车辆型号统计、热力图分析等智慧功能，同时本发明适用于采用鱼眼监控相机的加油站，从而使得加油站改造成本进一步的降低。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种基于3D视觉识别的加油站车辆多视角定位方法的流程图；

图2是FCOS3D网络图；

图3是监控相机底面检测框投影；

图4是检测框去重后示意图。

具体实施方式

为进一步说明各实施例，本发明提供有附图，这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理，配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点，图中的组件并未按比例绘制，而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例，提供了一种基于3D视觉识别的加油站车辆多视角定位方法。

现结合附图和具体实施方式对本发明进一步说明，如图1所示，根据本发明实施例的基于3D视觉识别的加油站车辆多视角定位方法，该方法包括以下步骤：

S11、通过监控相机获取路面图像，并在路面图像上采样若干数量平行线条特征点(至少4个)；

S12、预估转换后对应点的坐标(需要靠实际观察和手动多次调试)，并调用OpenCV库的getPerspectiveTransform函数，同时输入原图坐标点和预估的转换后对应点，求得P透视变换矩阵，其中，OpenCV是一个基于Apache2.0许可(开源)发行的跨平台计算机视觉和机器学习软件库；

S13、调用perspectiveTransform函数，并输入原图及P透视变换矩阵，得到转换后的鸟瞰图。

转换鸟瞰图方式主要是要获取透视变换矩阵，一般有三种方法：

1.相机内外参数标定；

2.消失点估计；

3.采样平行线坐标点预估转换后对应点对计算。本发明采用第3种方式。

S2、对若干转换后的鸟瞰图进行拼接处理；转换后的鸟瞰图大小是相同的，均代表了路平面在整个加油站俯视图中的一块区域。

其中，所述S2中对若干转换后的鸟瞰图进行拼接处理之前，将若干转换后的鸟瞰图中的部分图像进行上下翻转与对齐，并记录下每个相机图像的对应操作，如透视变换-上下翻转。

所述S2中对若干转换后的鸟瞰图进行拼接处理还包括以下步骤：

S22、基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准；SIFT算法是一种提取局部特征的算法，RANSAC算法为随机抽样一致算法；

其中，若监控相机获取的路面图像为鱼眼图像，则对鱼眼图像进行畸变校正处理。

式中，M指相邻图像的重叠区域，S_c,i-₁(s)指鸟瞰图P_i-1中的像素点S的像素值，S_c,i(s)指鸟瞰图P_i中的像素点S的像素值；γ指参数，通常设定为2.2，对于待拼接的第一幅鸟瞰图P，设定a_c,i＝1。

所述S22中基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准时，每个鸟瞰图均包含确定的SIFT特征点，每个特征点包括尺度空间极值、特征点位置特征点方向及特征点描述符。

所述S23中基于加权融合算法对两个鸟瞰图进行融合，完成鸟瞰图的拼接还包括以下步骤：

融合后的图像为：

式中，f₁，f₂分别表示两幅鸟瞰图，d₁，d₂分别表示权重函数，x，y均为参数。

所述若监控相机获取的路面图像为鱼眼图像，则对鱼眼图像进行畸变校正处理还包括以下步骤：

式中，β中为校正偏差系数，z为调整系数。

S3、采用FCOS3D算法并结合监控相机内参矩阵(一般相机自带)，完成对车辆3D检测框的识别，如图2所示，FCOS3D是一种全卷积单阶段3D单目目标检测方法；

S4、对车辆3D检测框的底面坐标进行转换，且在转换后进行检测框去重；

其中，所述S4中对车辆3D检测框的底面坐标进行转换还包括以下步骤：

获取检测框列表，并在每个检测框底面构建4个坐标；

利用P透视变换矩阵进行检测框的投影及相应翻转操作，如图3所示。

所述S4中在转换后进行检测框去重时，由于多个相机投影检测框存在重叠，为了降低重复识别率，采用NMS非极大抑制进行全图检测框的去重，并留下概率最大的非重叠检测框，如图4所示。

综上所述，本发明提出一种基于3D视觉识别的加油站车辆多视角定位方法，采用加油站都具备的监控摄像头，通过3D车辆检测、BEV鸟瞰图空间定位等方式，实现加油站多相机的车辆检测，有效缓解了一般基于2D图像的简单车牌识别功能系统可扩展性低、成本过高的情况，为后续车辆身份识别及跟踪、无感支付、算法油枪分配等智慧功能打下基础。通过对鸟瞰图进行色彩调整，提高了鸟瞰图拼接效果，使得鸟瞰图融合效率提高。本发明提出一种基于3D视觉识别的加油站车辆多视角定位方法，能够最大化利用现有监控设备，实现车辆在整个加油站视野内的定位，显著降低智能化改造成本，并能够在此基础上进一步整合车辆跟踪、车牌识别、车辆型号统计、热力图分析等智慧功能，同时本发明适用于采用鱼眼监控相机的加油站，从而使得加油站改造成本进一步的降低。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于3D视觉识别的加油站车辆多视角定位方法，其特征在于，该方法包括以下步骤：

S2、对若干转换后的鸟瞰图进行拼接处理；所述S2中对若干转换后的鸟瞰图进行拼接处理之前，将若干转换后的鸟瞰图中的部分图像进行上下翻转与对齐，并记录下每个相机图像的对应操作；

式中，M指相邻图像的重叠区域，S_c,i-1(s)指鸟瞰图P_i-1中的像素点S的像素值，S_c,i(s)指鸟瞰图P_i中的像素点S的像素值；γ指参数，对于待拼接的第一幅鸟瞰图P，设定a_c,i＝1；

S22、基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准；

所述S4中对车辆3D检测框的底面坐标进行转换还包括以下步骤：

获取检测框列表，并在每个检测框底面构建4个坐标；

利用P透视变换矩阵进行检测框的投影及相应翻转操作。

2.根据权利要求1所述的一种基于3D视觉识别的加油站车辆多视角定位方法，其特征在于，所述S22中基于SIFT及RANSAC算法进行两个鸟瞰图的图像配准时，每个鸟瞰图均包含确定的SIFT特征点，每个特征点包括尺度空间极值、特征点位置、特征点方向及特征点描述符。

3.根据权利要求1所述的一种基于3D视觉识别的加油站车辆多视角定位方法，其特征在于，所述S23中基于加权融合算法对两个鸟瞰图进行融合，完成鸟瞰图的拼接还包括以下步骤：

融合后的图像为：

4.根据权利要求1所述的一种基于3D视觉识别的加油站车辆多视角定位方法，其特征在于，所述若监控相机获取的路面图像为鱼眼图像，则对鱼眼图像进行畸变校正处理还包括以下步骤：

式中，β中为校正偏差系数，z为调整系数。

5.根据权利要求1所述的一种基于3D视觉识别的加油站车辆多视角定位方法，其特征在于，所述S4中在转换后进行检测框去重时，采用NMS非极大抑制进行全图检测框的去重，并留下概率最大的非重叠检测框。