CN117789153B

CN117789153B - 基于计算机视觉的汽车油箱外盖定位系统及方法

Info

Publication number: CN117789153B
Application number: CN202410207322.7A
Authority: CN
Inventors: 施恒之
Original assignee: Zhejiang Yikm Intelligent Technology Co ltd
Current assignee: Zhejiang Yikm Intelligent Technology Co ltd
Priority date: 2024-02-26
Filing date: 2024-02-26
Publication date: 2024-05-03
Anticipated expiration: 2044-02-26
Also published as: CN117789153A

Abstract

本公开涉及一种基于计算机视觉的汽车油箱外盖定位系统及方法。该方法包括：获取由摄像头捕捉的汽车图像；提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；将二者输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，以确定汽车油箱外盖的位置。这样，可以提高加注燃料的效率和便利性。

Description

基于计算机视觉的汽车油箱外盖定位系统及方法

技术领域

本公开涉及计算机视觉技术领域，具体地，涉及一种基于计算机视觉的汽车油箱外盖定位系统及方法。

背景技术

汽车油箱外盖是汽车的重要部件之一，对其进行位置定位的准确性会影响到加注燃料的效率和便利性。传统的油箱外盖定位方法需要依靠人工观察，使得汽车智能化技术的发展受到限制。

计算机视觉是一种利用计算机和摄像设备对图像或视频进行处理与分析的技术领域。它涉及从图像或视频中获取信息、理解场景，甚至做出决策。计算机视觉技术的发展为实现汽车油箱外盖的智能定位提供了一种新的解决思路。

然而，现实环境中汽车场景复杂多变，光照条件不稳定，汽车外观差异较大，这些因素都给油箱外盖的准确定位带来挑战。因此，期待一种基于计算机视觉的汽车油箱外盖定位系统及方法。

发明内容

提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

第一方面，本公开提供了一种基于计算机视觉的汽车油箱外盖定位方法，所述方法包括：

获取由摄像头捕捉的汽车图像；

提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；

将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；

将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵；

基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置。

可选地，提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图，包括：对所述汽车图像进行预处理以得到预处理后汽车图像；将所述预处理后汽车图像通过基于金字塔网络的图像特征提取器以得到所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图。

可选地，所述基于金字塔网络的图像特征提取器的各层在非线性激活处理时使用Mish激活函数。

可选地，将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图，包括：以如下重参数化公式对所述汽车表面状态浅层特征图进行处理以得到所述强化汽车表面状态浅层特征图；其中，所述重参数化公式为：

其中，是所述汽车表面状态浅层特征图的均值，/>是所述汽车表面状态浅层特征图的方差，/>是从高斯分布中随机采样得到的第/>个值，/>是所述强化汽车表面状态浅层特征图中第/>个特征值。

可选地，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，包括：将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图；对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图；对所述校正后汽车表面多尺度特征图进行沿通道维度的全局均值池化以得到所述汽车表面多尺度特征矩阵。

可选地，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图，包括：对所述强化汽车表面状态语义特征图进行沿通道维度的全局平均池化以得到注意力特征向量；将所述注意力特征向量通过全连接层以得到注意力编码特征向量；以所述注意力编码特征向量中各个特征值作为权重对所述强化汽车表面状态浅层特征图进行加权相乘以得到注意力调整特征图；将所述注意力调整特征图和所述强化汽车表面状态语义特征图进行按位置相加处理以得到所述汽车表面多尺度特征图。

可选地，对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图，包括：对所述汽车表面多尺度特征图中各个汽车表面多尺度特征矩阵进行线性变换转换为正方矩阵以得到变换后汽车表面多尺度特征图；对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图。

可选地，基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置，包括：将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果；基于所述汽车语义分割结果，确定所述汽车油箱外盖的位置。

可选地，将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果，包括：使用所述Softmax函数对所述汽车表面多尺度特征矩阵中各个位置的特征值进行分类，以得到所述汽车语义分割结果，其中，所述汽车语义分割结果包含了所述汽车语义分割结果中各个像素点所属的类别标签，所述类别标签包括汽车油箱外盖区域和非汽车油箱外盖区域。

第二方面，本公开提供了一种基于计算机视觉的汽车油箱外盖定位系统，所述系统包括：

汽车图像获取模块，用于获取由摄像头捕捉的汽车图像；

特征提取模块，天天提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；

特征图强化模块，用于将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；

交互融合和降维处理模块，用于将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵；

汽车油箱外盖的位置确定模块，用于基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置。

采用上述技术方案，通过获取由摄像头捕捉的汽车图像；提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；将二者输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，以确定汽车油箱外盖的位置。这样，可以提高加注燃料的效率和便利性。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。在附图中：

图1是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位方法的流程图。

图2是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位系统的框图。

图3是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位方法的应用场景图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

传统的油箱外盖定位方法主要依靠人工观察，具体步骤包括：驾驶员或维修人员目视检查车辆后部，寻找油箱外盖；驾驶员或维修人员用手触摸车辆后部，以感受油箱外盖的凸起或凹陷；有时会使用手电筒或探针等工具辅助检查，以提高定位精度。

然而，这种传统方法需要大量的人工操作，耗时且效率低下；由于依赖于人工观察，定位精度可能受到主观因素影响；在光线不足或车辆后部有遮挡物的情况下，定位难度较大；无法与汽车智能化系统集成，限制了汽车智能化技术的发展。

计算机视觉是一个计算机科学领域，涉及使用计算机和摄像设备对图像或视频进行处理和分析，其目标是从图像或视频中获取信息、理解场景，甚至做出决策。计算机视觉技术包括：图像处理，用于对图像进行操作，以增强或提取特定特征。特征提取，用于从图像中识别和提取有意义的特征，如边缘、形状和纹理。物体识别，用于识别图像或视频中的特定物体或类别的过程。场景理解，用于对图像或视频中的场景进行高级理解，例如识别物体之间的关系和交互。决策制定，用于基于对图像或视频的分析做出决策，例如检测异常或分类对象。

计算机视觉技术可以为汽车油箱外盖的智能定位提供以下优势：计算机视觉算法可以自动处理图像或视频，无需人工干预；计算机视觉算法可以提供比人工观察更高的定位精度；计算机视觉算法可以处理光线不足、遮挡物等复杂环境；计算机视觉算法可以实时处理图像或视频，实现快速定位。

针对上述技术问题，本申请的技术构思是：利用基于深度学习的图像处理和计算机视觉技术来识别和定位油箱外盖区域，以提高加注燃料的效率和便利性。

应可以理解，计算机视觉算法可以自动识别和定位油箱外盖，无需驾驶员手动操作，这可以简化加油过程，提高效率。计算机视觉算法可以提供比人工观察更高的定位精度，从而减少加油时的溢出或喷洒。计算机视觉算法不受光线条件的影响，即使在夜间或低光照条件下也能准确识别和定位油箱外盖。通过自动化和简化加油过程，计算机视觉技术可以减少加油站的拥堵，提高加油效率。通过减少加油时的溢出或喷洒，计算机视觉技术可以提高加油站的安全性和环境友好性。

此外，基于深度学习的图像处理和计算机视觉技术还可以为汽车提供以下附加功能：计算机视觉算法可以检测油箱外盖是否打开、关闭或损坏，并向驾驶员发出警报。计算机视觉算法可以估计加油量，并向驾驶员提供有关何时停止加油的信息。计算机视觉技术可以记录加油历史，以便驾驶员跟踪燃油消耗和加油费用。

为了解决上述问题，本公开提供了一种基于计算机视觉的汽车油箱外盖定位系统及方法，通过获取由摄像头捕捉的汽车图像；提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；将二者输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，以确定汽车油箱外盖的位置。这样，可以提高加注燃料的效率和便利性。

以下结合附图对本公开的具体实施方式进行详细说明。

图1是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位方法的流程图，如图1所示，该方法包括：

步骤101、获取由摄像头捕捉的汽车图像；

步骤102、提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；

步骤103、将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；

步骤104、将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵；

步骤105、基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置。

在所述步骤 101中，获取由摄像头捕捉的汽车图像，确保摄像头清晰度高，照明条件良好，以获得高质量的图像。在所述步骤102中，使用合适的特征提取算法，例如卷积神经网络 (CNN)，以提取有意义的特征，其中，浅层特征可以捕获图像的低级细节，而语义特征可以捕获图像的高级概念。在所述步骤103中，选择合适的重参数化网络架构，例如可变形卷积网络 (DCN)，以增强特征图，特征图强化器可以增强特征图中的有用信息，抑制噪声和冗余。在所述步骤104中，使用适当的融合策略，例如注意力机制，以有效地融合浅层特征和语义特征。降维处理可以减少特征维度，提高计算效率，交互融合可以利用不同特征图的互补信息，而降维处理可以减少计算复杂度。在所述步骤105中，使用合适的定位算法，例如目标检测算法，以准确确定油箱外盖的位置，多尺度特征矩阵提供了不同尺度和抽象级别的信息，有助于提高定位精度。

通过遵循这些步骤，可以利用基于深度学习的图像处理和计算机视觉技术准确高效地识别和定位汽车油箱外盖，这可以提高加注燃料的效率和便利性，并为汽车提供额外的功能，例如油箱外盖状态监测和加油量监测。

基于此，在本申请的技术方案中，首先，获取由摄像头捕捉的汽车图像。这里，摄像头可以捕捉汽车的实时图像数据，提供对汽车外观和结构的视觉信息，这些数据作为后续处理和分析的重要数据来源，是实现对油箱外盖位置的准确定位的基础。

由摄像头捕捉的汽车实时图像数据通常包括以下信息：RGB 像素值，图像中每个像素的颜色信息，通常表示为红色、绿色和蓝色分量的组合；深度信息，如果摄像头支持深度感知，则图像数据还可能包含有关场景中物体与摄像头的距离信息；时间戳：**图像捕获的时间信息；相机参数，有关相机内参和外参的信息，例如焦距、光学中心和相机与汽车之间的相对位置；附加元数据，其他相关信息，例如图像的分辨率、文件格式和图像质量指标。

具体到油箱外盖定位任务，实时图像数据中以下信息尤为重要：汽车外观，图像中汽车的整体形状、颜色和纹理。油箱外盖区域，图像中油箱外盖区域的形状、颜色和纹理。周围环境，图像中油箱外盖周围环境的信息，例如加油站背景或其他车辆。

考虑到所述汽车图像可能受到各种噪声的影响，例如传感器噪声、压缩噪声等，这些噪声的存在会影响后续算法的性能。同时，所述汽车图像还可能存在由于光照不足或光照过度引起的亮度不均匀的情况，这也会影响对于汽车油箱外盖的定位和检测。此外，在实际的应用场景中，在拍摄所述汽车图像的过程中，汽车可能被其他物体或遮挡物遮挡，导致目标不完整，影响后续任务的准确性。因而，在本申请的技术方案中，期待对所述汽车图像进行预处理以在一定程度上减少或避免上述问题或噪声的出现，从而得到预处理后汽车图像。

在本公开的一个实施例中，提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图，包括：对所述汽车图像进行预处理以得到预处理后汽车图像；将所述预处理后汽车图像通过基于金字塔网络的图像特征提取器以得到所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图。

在本申请的实施例中，对所述汽车图像进行预处理可以包括但不限于以下几种手段：1.图像去噪：消除图像中的噪声，如高斯噪声、椒盐噪声等，以改善图像质量；2.图像增强：增强图像的对比度、亮度等属性，使图像更清晰、更易于分析；3.图像尺寸调整：调整图像的尺寸和分辨率，以适应后续处理算法的需求；4.色彩空间转换：将图像从一种色彩空间转换为另一种，如RGB到灰度图像的转换；5.直方图均衡化：调整图像的直方图分布，增强图像的对比度；6.图像旋转和裁剪：对图像进行旋转或裁剪，使其更好地适应后续处理算法的需求。

接着，将所述预处理后汽车图像通过基于金字塔网络的图像特征提取器以得到汽车表面状态浅层特征图和汽车表面状态语义特征图。其中，金字塔网络是一种具有多层次特征表示能力的网络结构，它可以保留在多层卷积操作的过程中容易被忽略和覆盖的浅层特征信息，同时还提取图像的深层语义特征信息。在汽车图像的处理中，使用金字塔网络可以有效地捕捉到汽车的表面状态浅层特征信息和表面状态语义特征信息等多尺度的特征信息。更具体地，汽车的表面状态浅层特征信息通常包含有关汽车表面纹理、颜色、形状等方面的信息，可以帮助识别汽车的外观特征；而汽车的表面状态语义特征信息则更侧重于对汽车表面的深层语义信息进行表示，包括识别车身、车窗、车轮等不同部位的信息，有助于理解汽车的结构和构成。

在本公开的一个实施例中，所述基于金字塔网络的图像特征提取器的各层在非线性激活处理时使用Mish激活函数。

随后，将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图。也就是，利用重参数化网络来构建特征图强化器，以学习到所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图中更具表征能力和高度抽象化特征的表示，从而增强所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图的信息表征，提高对汽车表面状态信息的建模和特征表示能力。具体来说，所述基于重参数化网络的特征图强化器通过引入先验性分布，例如高斯随机分布，来进行特征分布引导和规范。这样，通过引入重参数化的技巧，使得所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图在重构后都带有随机性，从而巧妙地起到在高维特征空间中进行数据增强的效果。

在本公开的一个实施例中，将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图，包括：以如下重参数化公式对所述汽车表面状态浅层特征图进行处理以得到所述强化汽车表面状态浅层特征图；其中，所述重参数化公式为：

接下来，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图；并对所述汽车表面多尺度特征图进行沿通道维度的全局均值池化以得到汽车表面多尺度特征矩阵。也就是，通过所述全局平均池化注意力融合模块来融合具有不同侧重点和不同深度的特征信息，并引入注意力机制以增强对重要特征的关注。这样，再所述对汽车表面多尺度特征图进行沿通道维度的全局均值池化可以将多尺度特征分布整合为统一的特征表示，并降低数据的维度，便于后续的语义分割处理。

在本公开的一个实施例中，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，包括：将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图；对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图；对所述校正后汽车表面多尺度特征图进行沿通道维度的全局均值池化以得到所述汽车表面多尺度特征矩阵。

具体来说，所述全局平均池化注意力融合模块的具体实现过程是将作为高层次特征的所述强化汽车表面状态语义特征图在通道维度上进行全局平均池化，此时高维特征图会被压缩变成向量表示，这个向量表示具有所述强化汽车表面状态语义特征图的全局感受野。再将此向量表示作为注意力信息与所述强化汽车表面状态浅层特征图进行融合，以指导所述强化汽车表面状态浅层特征图中的浅层信息还原语义类别信息，从而得到所述汽车表面多尺度特征图。这样以后，所述汽车表面多尺度特征图会具有更为丰富的特征表示。

在本公开的一个实施例中，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图，包括：对所述强化汽车表面状态语义特征图进行沿通道维度的全局平均池化以得到注意力特征向量；将所述注意力特征向量通过全连接层以得到注意力编码特征向量；以所述注意力编码特征向量中各个特征值作为权重对所述强化汽车表面状态浅层特征图进行加权相乘以得到注意力调整特征图；将所述注意力调整特征图和所述强化汽车表面状态语义特征图进行按位置相加处理以得到所述汽车表面多尺度特征图。

在本公开的一个实施例中，对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图，包括：对所述汽车表面多尺度特征图中各个汽车表面多尺度特征矩阵进行线性变换转换为正方矩阵以得到变换后汽车表面多尺度特征图；对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图。

在本申请的技术方案中，所述强化汽车表面状态浅层特征图和是强化汽车表面状态语义特征图分别表达所述预处理后汽车图像的基于金字塔网络的不同局部关联特征提取尺度下的跨深度图像语义特征表示，这样，考虑到跨尺度跨深度图像语义特征表示的通道维度分布差异，在将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块后，得到的所述汽车表面多尺度特征图的沿通道维度的各个特征矩阵的融合图像语义特征表示也会存在比较显著的分布偏差，从而影响对所述汽车表面多尺度特征图进行沿通道维度的全局均值池化得到的所述汽车表面多尺度特征矩阵的表达效果。

基于此，本申请的申请人期望提升所述汽车表面多尺度特征图的以特征矩阵特征分布为单位的分布整体性，具体地，首先将所述汽车表面多尺度特征图中的各个特征矩阵通过线性变换转换为正方矩阵，然后对所述汽车表面多尺度特征图以特征矩阵为单位，基于相邻特征矩阵的优化来进行校正，具体表示为：对所述汽车表面多尺度特征图中各个汽车表面多尺度特征矩阵进行线性变换转换为正方矩阵以得到变换后汽车表面多尺度特征图；以如下优化公式对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图；

其中，和/>分别是所述汽车表面多尺度特征图的第/>和第/>个特征矩阵，且/>和/>分别是特征矩阵/>和/>的全局均值，/>是所述校正后汽车表面多尺度特征图的第/>个特征矩阵，/>是所述汽车表面多尺度特征图的第个特征矩阵的转置矩阵，/>是所述汽车表面多尺度特征图的第/>个特征矩阵的倒数，/>表示按位置点乘，/>表示矩阵乘法。

这里，通过以所述汽车表面多尺度特征图的特征矩阵沿通道分布的中心作为通道维度下的场景传递的种子点，来将所述汽车表面多尺度特征图的特征矩阵的每个特征值通过矩阵相乘而进行稳健化的聚合和子采样提议，从而在所述汽车表面多尺度特征图的特征矩阵的每个特征值的参与基础上进行相邻特征矩阵的分布边界框传递定向约束，以在所述汽车表面多尺度特征图的整体沿通道维度由下而上的上下文关联的基础上提升所述汽车表面多尺度特征图的特征表示的整体性，从而提升所述汽车表面多尺度特征矩阵的表达效果，改进其语义分割结果的准确性。

进一步地，将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果；并基于所述汽车语义分割结果，确定汽车油箱外盖的位置。也就是，通过Softmax函数将特征映射到类别概率空间，从而实现对每个像素点的语义分类。值得一提的是，Softmax函数之所以适合用于语义分割，是因为它具有以下特点和优势：1.Softmax函数输出的是每个类别的概率分布，可以提供对每个像素点属于各个类别的置信度，有利于准确的语义分割结果；2.Softmax函数可以端到端地训练，通过反向传播算法优化网络参数，实现更好的语义分割效果；3.Softmax函数引入了非线性映射，能够处理复杂的特征表示，提高模型的表达能力，从而更好地适应语义分割任务的复杂性。

在本公开的一个实施例中，基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置，包括：将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果；基于所述汽车语义分割结果，确定所述汽车油箱外盖的位置。

进一步地，将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果，包括：使用所述Softmax函数对所述汽车表面多尺度特征矩阵中各个位置的特征值进行分类，以得到所述汽车语义分割结果，其中，所述汽车语义分割结果包含了所述汽车语义分割结果中各个像素点所属的类别标签，所述类别标签包括汽车油箱外盖区域和非汽车油箱外盖区域。

综上所述，采用上述方案，通过获取由摄像头捕捉的汽车图像；提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；将二者输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，以确定汽车油箱外盖的位置。这样，可以提高加注燃料的效率和便利性。

图2是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位系统的框图。如图2所示，该基于计算机视觉的汽车油箱外盖定位系统包括：

汽车图像获取模块210，用于获取由摄像头捕捉的汽车图像；

特征提取模块220，天天提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图；

特征图强化模块230，用于将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图；

交互融合和降维处理模块240，用于将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵；

汽车油箱外盖的位置确定模块250，用于基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置。

根据本公开的一个或多个实施例，示例1提供了一种基于计算机视觉的汽车油箱外盖定位方法，所述方法包括：

获取由摄像头捕捉的汽车图像；

根据本公开的一个或多个实施例，示例2提供了示例1的方法，提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图，包括：

对所述汽车图像进行预处理以得到预处理后汽车图像；

将所述预处理后汽车图像通过基于金字塔网络的图像特征提取器以得到所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图。

根据本公开的一个或多个实施例，示例3提供了示例2的方法，所述基于金字塔网络的图像特征提取器的各层在非线性激活处理时使用Mish激活函数。

根据本公开的一个或多个实施例，示例4提供了示例3的方法，将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图，包括：

以如下重参数化公式对所述汽车表面状态浅层特征图进行处理以得到所述强化汽车表面状态浅层特征图；其中，所述重参数化公式为：

根据本公开的一个或多个实施例，示例5提供了示例4的方法，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，包括：

将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图；

对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图；

对所述校正后汽车表面多尺度特征图进行沿通道维度的全局均值池化以得到所述汽车表面多尺度特征矩阵。

根据本公开的一个或多个实施例，示例6提供了示例5的方法，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图，包括：

对所述强化汽车表面状态语义特征图进行沿通道维度的全局平均池化以得到注意力特征向量；

将所述注意力特征向量通过全连接层以得到注意力编码特征向量；

以所述注意力编码特征向量中各个特征值作为权重对所述强化汽车表面状态浅层特征图进行加权相乘以得到注意力调整特征图；

将所述注意力调整特征图和所述强化汽车表面状态语义特征图进行按位置相加处理以得到所述汽车表面多尺度特征图。

根据本公开的一个或多个实施例，示例7提供了示例6的方法，对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图，包括：

对所述汽车表面多尺度特征图中各个汽车表面多尺度特征矩阵进行线性变换转换为正方矩阵以得到变换后汽车表面多尺度特征图；

对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图。

根据本公开的一个或多个实施例，示例8提供了示例7的方法，基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置，包括：

将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果；

基于所述汽车语义分割结果，确定所述汽车油箱外盖的位置。

根据本公开的一个或多个实施例，示例9提供了示例8的方法，将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果，包括：

使用所述Softmax函数对所述汽车表面多尺度特征矩阵中各个位置的特征值进行分类，以得到所述汽车语义分割结果，其中，所述汽车语义分割结果包含了所述汽车语义分割结果中各个像素点所属的类别标签，所述类别标签包括汽车油箱外盖区域和非汽车油箱外盖区域。

根据本公开的一个或多个实施例，示例10提供了一种基于计算机视觉的汽车油箱外盖定位系统，所述系统包括：

汽车图像获取模块，用于获取由摄像头捕捉的汽车图像；

图3是根据一示例性实施例示出的一种基于计算机视觉的汽车油箱外盖定位方法的应用场景图。如图3所示，在该应用场景中，首先，获取由摄像头捕捉的汽车图像（例如，如图3中所示意的C）；然后，将获取的汽车图像输入至部署有基于计算机视觉的汽车油箱外盖定位算法的服务器（例如，如图3中所示意的S）中，其中所述服务器能够基于计算机视觉的汽车油箱外盖定位算法对所述汽车图像进行处理，以确定汽车油箱外盖的位置。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

Claims

1.一种基于计算机视觉的汽车油箱外盖定位方法，其特征在于，包括：

获取由摄像头捕捉的汽车图像；

基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置；

其中，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图进行交互融合和降维处理以得到汽车表面多尺度特征矩阵，包括：

对所述校正后汽车表面多尺度特征图进行沿通道维度的全局均值池化以得到所述汽车表面多尺度特征矩阵；

其中，对所述汽车表面多尺度特征图进行特征分布校正以得到校正后汽车表面多尺度特征图，包括：

对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图；

其中，对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图，包括，以如下优化公式对所述变换后汽车表面多尺度特征图进行基于相邻特征矩阵的优化校正以得到所述校正后汽车表面多尺度特征图；其中，所述优化公式为：

其中，和/>分别是所述汽车表面多尺度特征图的第/>和第/>个特征矩阵，且/>和分别是特征矩阵/>和/>的全局均值，/>是所述校正后汽车表面多尺度特征图的第个特征矩阵，/>是所述汽车表面多尺度特征图的第/>个特征矩阵的转置矩阵，是所述汽车表面多尺度特征图的第/>个特征矩阵的倒数，/>表示按位置点乘，/>表示矩阵乘法；

其中，基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置，包括：

基于所述汽车语义分割结果，确定所述汽车油箱外盖的位置；

其中，将所述汽车表面多尺度特征矩阵输入基于Softmax函数的语义分割器以得到汽车语义分割结果，包括：

2.根据权利要求1所述的基于计算机视觉的汽车油箱外盖定位方法，其特征在于，提取所述汽车图像的表面状态浅层特征和表面状态语义特征以得到汽车表面状态浅层特征图和汽车表面状态语义特征图，包括：

对所述汽车图像进行预处理以得到预处理后汽车图像；

3.根据权利要求2所述的基于计算机视觉的汽车油箱外盖定位方法，其特征在于，所述基于金字塔网络的图像特征提取器的各层在非线性激活处理时使用Mish激活函数。

4.根据权利要求3所述的基于计算机视觉的汽车油箱外盖定位方法，其特征在于，将所述汽车表面状态浅层特征图和所述汽车表面状态语义特征图输入基于重参数化网络的特征图强化器以得到强化汽车表面状态浅层特征图和强化汽车表面状态语义特征图，包括：

5.根据权利要求4所述的基于计算机视觉的汽车油箱外盖定位方法，其特征在于，将所述强化汽车表面状态浅层特征图和所述强化汽车表面状态语义特征图通过全局平均池化注意力融合模块以得到汽车表面多尺度特征图，包括：

6.一种基于计算机视觉的汽车油箱外盖定位系统，其特征在于，包括：

汽车图像获取模块，用于获取由摄像头捕捉的汽车图像；

汽车油箱外盖的位置确定模块，用于基于所述汽车表面多尺度特征矩阵，确定汽车油箱外盖的位置；

其中，所述交互融合和降维处理模块，包括：

其中，所述汽车油箱外盖的位置确定模块，包括：