CN116051811B

CN116051811B - 区域识别方法、装置、计算机设备及计算机可读存储介质

Info

Publication number: CN116051811B
Application number: CN202310332165.8A
Authority: CN
Inventors: 王卓琛; 刘枢; 吕江波; 沈小勇
Original assignee: Shenzhen Smartmore Technology Co Ltd
Current assignee: Shenzhen Smartmore Technology Co Ltd
Priority date: 2023-03-31
Filing date: 2023-03-31
Publication date: 2023-07-04
Anticipated expiration: 2043-03-31
Also published as: CN116051811A

Abstract

本申请涉及一种区域识别方法、装置、计算机设备及计算机可读存储介质。方法包括：获取目标对象图；确定目标对象图中的多个子图像；针对每个子图像，确定子图像的位置数据；位置数据用于表征子图像在目标对象图中的位置；对子图像进行特征提取，得到子图像特征数据；基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。采用本方法，能够提高区域识别的准确性。

Description

区域识别方法、装置、计算机设备及计算机可读存储介质

技术领域

本申请涉及图像处理技术领域，特别是涉及一种区域识别方法、装置、计算机设备及计算机可读存储介质。

背景技术

随着图像处理技术的发展，出现了图像分割技术，图像分割是图像处理的关键步骤，也是图像理解的重要组成部分，通过图像分割技术能够识别图像中具有特殊意义的区域。

传统方法中，根据已有数据中区域灰度值的范围确定灰度阈值，通过将灰度阈值和图像像素进行比对，完成图像的分割，实现区域识别。但是，这种通过阈值比对实现区域识别的方法过于绝对，比较局限，准确性低。

发明内容

基于此，有必要针对上述技术问题，提供一种区域识别方法、装置、计算机设备、计算机可读存储介质以及计算机程序产品，能够提高区域识别的准确性。

第一方面，本申请提供了一种区域识别方法，包括：

获取目标对象图；

确定目标对象图中的多个子图像；

针对每个子图像，确定子图像的位置数据；位置数据用于表征子图像在目标对象图中的位置；

对子图像进行特征提取，得到子图像特征数据；

基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

第二方面，本申请提供了一种区域识别装置，包括：

获取模块，用于获取目标对象图；

第一确定模块，用于确定目标对象图中的多个子图像；

第二确定模块，用于针对每个子图像，确定子图像的位置数据；位置数据用于表征子图像在目标对象图中的位置；

提取模块，用于对子图像进行特征提取，得到子图像特征数据；

识别模块，用于基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

第三方面，本申请提供了一种计算机设备，计算机设备包括存储器和处理器，存储器存储有计算机程序，处理器执行该计算机程序时实现上述的方法中的步骤。

第四方面，本申请提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述的方法中的步骤。

第五方面，本申请提供了一种计算机程序产品，计算机程序产品包括计算机程序，该计算机程序被处理器执行时实现上述的方法中的步骤。

上述区域识别方法、装置、计算机设备、存储介质和计算机程序产品，通过确定获取的目标对象图中的每个子图像的位置数据，每个子图像的位置数据用于表征该子图像在目标对象图中的位置，子图像中各区域属于的区域类别往往与子图像在目标对象图中的位置比较相关，后续结合位置数据进行类别预测能够保证准确性。对子图像进行特征提取，得到子图像特征数据，相较于直接获取的灰度值，特征数据更能准确地表征子图像各个区域的属性，后续结合子图像特征数据进行类别预测能够进一步保证准确性。基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息，通过结合子图像特征数据和位置数据，能够准确地预测区域类别信息，提高了区域识别的准确性。

附图说明

图1为本申请实施例提供的一种区域识别方法的流程示意图；

图2为本申请实施例提供的实物图和目标对象图；

图3为本申请实施例提供的训练区域识别模型的示意图；

图4为本申请实施例提供的一种区域识别装置的结构框图；

图5为本申请实施例提供的一种计算机设备的内部结构图；

图6为本申请实施例提供的一种计算机设备的内部结构图；

图7为本申请实施例提供的一种计算机可读存储介质的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，本申请实施例提供了一种区域识别方法，以该方法应用于计算机设备进行举例说明，可以理解的是，计算机设备可以包括终端或服务器中的至少一种，该方法应用于终端，也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

S102，获取目标对象图。

其中，目标对象图是目标对象的图像。目标对象图包括目标对象的图像内容，即，目标对象图中呈现了目标对象。目标对象是指待进行区域识别的对象。

示例性地，计算机设备可以将目标对象的设计图或实物图中的至少一种确定为目标对象图。可以理解，设计图是指供制作目标对象的实体使用的版图。实物图是针对目标对象的实体进行采集得到的。

S104，确定目标对象图中的多个子图像。

其中，子图像是属于目标对象图的一部分。可以理解，目标对象图作为一个整体，子图像是从目标对象图中分解出的更小单元。

示例性地，计算机设备可以从目标对象图中裁剪出多个子图像。

在一些实施例中，计算机设备可以通过预设的剪裁框，从目标对象图中剪裁出固定大小的子图像。

在一些实施例中，计算机设备可以通过预设的剪裁框，按照裁剪方向对目标对象图进行裁剪，得到子图像。可以理解，在未剪裁部分小于预设的剪裁框大小的情况下，计算机设备可以按照逆裁剪方向对目标对象图进行裁剪，得到子图像，使得目标对象图被充分裁剪，避免遗漏目标对象图中的区域。

在一些实施例中，终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一些实施例中，目标对象可以是电元件载体或车辆行驶载体等中的至少一种。电元件载体用于承载电元件，可以是电路板。车辆行驶载体用于承载车辆行驶，可以是道路或轨道等。

在一些实施例中，目标对象可以是电路板。目标对象图可以是电路板的设计图。

在一些实施例中，目标对象图可以是经过矫正和/或滤波处理后的目标对象的实物图。可以理解，实物图中的区域相较于设计图往往具有形变的问题，通过对实物图进行矫正和/或滤波能够改善这种形变的问题，从而使得本申请提供的区域识别方法能够从设计图泛化到实物图上，提高了区域识别方法的适应性。

S106，针对每个子图像，确定子图像的位置数据；位置数据用于表征子图像在目标对象图中的位置。

示例性地，计算机设备可以针对每个子图像，确定该子图像上的参照点；将该参照点在目标对象图中的位置确定为该子图像的位置，得到该子图像的位置数据。

S108，对子图像进行特征提取，得到子图像特征数据。

示例性地，计算机设备可以对子图像进行编码处理，得到子图像的初始编码数据；将初始编码数据进行特征提取，得到子图像特征数据。

在一些实施例中，计算机设备可以对初始编码数据进行多尺度编码处理，得到多尺度编码数据；将多尺度编码数据进行解码处理，得到子图像特征数据。

在一些实施例中，计算机设备可以通过多层注意力模块分别对初始编码数据进行不同尺度的特征提取，得到多尺度编码数据。

在一些实施例中，计算机设备可以通过聚合每层注意力模块输出的编码数据，将全局和局部的注意力结合起来，从而实现多尺度编码数据的解码处理，以得到子图像特征数据。

在一些实施例中，计算机设备可以通过多层感知机对多尺度编码数据进行解码处理，得到子图像特征数据。

S110，基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

其中，区域类别信息用于表征子图像中各区域的区域类别。

示例性地，计算机设备可以将子图像特征数据和位置数据进行融合处理，得到融合特征数据；根据融合特征数据对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

需要说明的是，子图像并非完整的目标对象图，因此，子图像中的每个区域在整个目标对象图上的位置信息会丢失，影响区域的识别结果。本申请提供的区域识别方法确定子图像的位置数据，并将位置数据作为一个通道的特征图与子图像特征数据连接起来，将位置数据加入到类别预测的过程中，解决子图像中的每个区域在目标对象图上的位置信息丢失的问题，保证区域识别的准确性。

在一些实施例中，子图像可以包括焊盘区（Pad）、定位点（location-pad）、手指区（finger）、打件区（bump-line）或晶片区（bond-pad）等区域中的至少一种。上述的焊盘区、定位点、手指区、打件区和晶片区均为区域类别。

需要说明的是，本申请提供的区域识别方法能够用于电路板中的金面学料，金面学料是指对电路板图中金面部分的每个区域进行分类的任务，将金面分为pad、location-pad、finger、bump-line、bond-pad五个区域。

其中，pad的典型表征是圆形和方形，以及对称出现的类方形。location-pad的典型表征是三角形、十字形、L形，并且出现在图片的四个角落。finger的典型表征是不规则并且成排存在。bump-line的典型表征是大块方形、密集存在的不规则图形。bond-pad的典型表征是大块的方形，周围被finger环绕。

上述区域识别方法中，通过确定获取的目标对象图中的每个子图像的位置数据，每个子图像的位置数据用于表征该子图像在目标对象图中的位置，子图像中各区域属于的区域类别往往与子图像在目标对象图中的位置比较相关，后续结合位置数据进行类别预测能够保证准确性。对子图像进行特征提取，得到子图像特征数据，相较于直接获取的灰度值，特征数据更能准确地表征子图像各个区域的属性，后续结合子图像特征数据进行类别预测能够进一步保证准确性。基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息，通过结合子图像特征数据和位置数据，能够准确地预测区域类别信息，提高了区域识别的准确性。

在一些实施例中，针对每个子图像，确定子图像的位置数据，包括：

针对每个子图像，确定子图像上的参照点；

基于参照点与目标对象图的预设位置之间的距离，确定子图像的位置数据。

示例性地，计算机设备可以将每个子图像的中心点确定为参照点。目标对象图的预设位置可以是目标对象图的边界位置。计算机设备可以确定参照点到目标对象图的边界位置的距离，得到子图像的位置数据。

在一些实施例中，位置数据用于表征子图像相对目标对象图的中心的距离。计算机设备可以确定参照点到每个水平边界的距离，得到水平方向上的多个距离。计算机设备可以确定参照点到每个竖直边界的距离，得到竖直方向上的多个距离。计算机设备可以确定水平方向上的多个距离的比例以及竖直方向上的多个距离的比例，得到子图像的位置数据。可以理解，子图像的位置数据可以由子图像的中心度表示，代表了子图像相对目标对象图中心的距离。

在一些实施例中，目标对象图包括两个水平边界和两个竖直边界。

本实施例中，通过针对每个子图像，确定子图像上的参照点；基于参照点与目标对象图的预设位置之间的距离，确定子图像的位置数据，目标对象图中的区域的类别往往会与该区域在整个目标对象图的位置相关，子图像的位置数据能够指示子图像中各区域在目标对象图中的位置，进而后续结合位置数据进行类别预测能够得到准确的区域类别信息。

在一些实施例中，对子图像进行特征提取，得到子图像特征数据，包括：

对子图像进行重叠块编码处理，得到具有局部连续性的块编码数据；

对子图像进行位置编码处理，得到位置编码数据；位置编码数据用于表征子图像中各像素的位置；

对块编码数据和位置编码数据进行融合处理，得到子图像的初始编码数据；

对初始编码数据进行特征提取，得到子图像特征数据。

示例性地，计算机设备可以对从子图像提取的图像块进行重叠的块合并处理，以保持这些图像块的边缘连续，得到具有局部连续性的块编码数据。计算机设备可以对子图像中的像素进行位置编码处理，得到位置编码数据。计算机设备可以对块编码数据和位置编码数据进行连接，得到子图像的初始编码数据。

计算机设备可以对初始编码数据和位置数据进行连接，得到融合特征数据。计算机设备可以根据融合特征数据对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

本实施例中，对子图像进行重叠块编码处理，得到具有局部连续性的块编码数据；对子图像进行位置编码处理，得到位置编码数据，在目标对象图的区域识别任务中，很多区域是强依赖于相邻位置的信息的，通过充分地提取子图像中的位置信息，进而对块编码数据和位置编码数据进行融合处理，得到子图像的初始编码数据；将初始编码数据进行特征提取，得到子图像特征数据，后续能够保证区域识别的准确性。

在一些实施例中，子图像中的区域包括子图像中的连通域；基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息，包括：

根据子图像特征数据和位置数据进行像素级分类处理，得到子图像中每个像素对应的区域类别概率；每个像素对应的区域类别概率，是指像素所在区域属于各个区域类别的概率；

基于子图像中的连通域内的像素对应的区域类别概率，对子图像中的连通域进行区域级分类处理，得到连通域的区域类别信息。

示例性地，计算机设备可以将子图像特征数据和位置数据连接后进行卷积处理和上采样处理，得到子图像中每个像素对应的区域类别概率。可以理解，同区域内的多个像素共同代表了该区域，像素级分类就是针对每个像素进行类别预测，像素所在区域的区域类别就是该像素的区域类别。子图像中的区域可以是连通域。计算机设备可以根据子图像中的连通域内像素对应的区域类别概率，确定子图像中的每个连通域属于各个区域类别的概率，得到连通域的区域级分类数据。计算机设备可以基于区域级分类数据，确定连通域的区域类别信息。

在一些实施例中，计算机设备可以将融合特征数据输入至分割头（head），通过分割头进行卷积处理和上采样处理，得到子图像中每个像素对应的区域类别概率。可以理解，通过分割头可以将融合特征数据恢复到子图像大小，将通道数与输出区域类别数保持一致，从而实现像素级的分类。head由若干个卷积层和上采样层组成，可以是全卷积网络的分割头（FCN head）。

本实施例中，根据子图像特征数据和位置数据进行像素级分类处理，得到子图像中每个像素对应的区域类别概率；基于子图像中的连通域内的像素对应的区域类别概率，对子图像中的连通域进行区域级分类处理，得到连通域的区域类别信息，通过像素级分类后再进一步地进行区域级分类，能够准确地得到连通域的区域类别信息，提高了区域识别的准确性。

在一些实施例中，基于子图像中的连通域内的像素对应的区域类别概率，对子图像中的连通域进行区域级分类处理，得到连通域的区域类别信息，包括：

针对子图像中的每个连通域，对连通域内的像素在同一区域类别下对应的概率进行平均处理，得到连通域的区域级分类数据；区域级分类数据用于表征连通域属于各个区域类别的概率；

根据连通域的区域级分类数据，确定连通域的区域类别信息。

示例性地，计算机设备可以对每个连通域内多个像素在同一区域类别下对应的概率进行平均处理，确定连通域属于各区域类别的概率，以得到连通域的区域级分类数据。比如，连通域包括像素a、b和c。区域类别为3类。像素a在3个区域类别下对应的区域类别概率分别为P_a1、P_a2和P_a3，像素b在3个区域类别下对应的区域类别概率分别为P_b1、P_b2和P_b3，像素c在3个区域类别下对应的区域类别概率分别为P_c1、P_c2和P_c3。区域级分类数据包括（P_a1+P_b1+P_c1）/3、（P_a2+P_b2+P_c2）/3和（P_a3+P_b3+P_c3）/3这三个概率。

计算机设备可以从连通域的区域级分类数据中确定出最高概率，将最高概率的区域类别确定为该连通域的区域类别，以得到该连通域的区域类别信息。

可以理解，同一连通域中各像素的属性相同，同一连通域中各像素都是一个区域类别，通过对每个连通域中同区域类别下的概率进行平均处理后，将每个连通域中平均概率最高的区域类别确定为该连通域中每个像素的区域类别，从而得到连通域的区域类别信息。

本实施例中，针对子图像中的每个连通域，对连通域内的像素在同一区域类别下对应的概率进行平均处理，得到连通域的区域级分类数据；根据连通域的区域级分类数据，确定连通域的区域类别信息，通过像素级分类后再进一步地进行区域级分类，能够准确地确定连通域的区域类别信息，提高了区域识别的准确性。

在一些实施例中，计算机设备可以确定目标对象的实物图中的各连通域，得到初始处理后的实物图。计算机设备可以对初始处理后的实物图进行边缘矫正处理，得到目标对象图。

在一些实施例中，获取目标对象图，包括：

确定目标对象的实物图中的各连通域，得到初始处理后的实物图；

对初始处理后的实物图进行边缘矫正处理，得到初阶矫正后的实物图；

对初阶矫正后的实物图进行滤波处理，得到目标对象图。

示例性地，计算机设备可以对目标对象的实物图进行初步的区域划分，确定出目标对象的实物图中各连通域，得到初始处理后的实物图。计算机设备可以对初始处理后的实物图进行编码处理，以实现初阶边缘矫正，得到初阶矫正后的实物图。计算机设备可以对初阶矫正后的实物图进行滤波处理，以实现进阶边缘矫正，得到目标对象图。

需要说明的是，在目标对象为电路板的情况下，目标对象的实物图是对初始实物图进行处理得到的。可以理解，初始实物图可以是原始的实物图，目标对象的实物图可以法线贴图。目标对象的实物图相较于初始实物图的缺陷更少。因为电路板的设计图是完美平滑的，从设计图上可以直接获取金面、油墨面等各个区域，但是实物图不可以，实物图有噪声，实物图中每个区域像素值存在波动。因此需要要先将实物图通过各种处理变成接近设计图之后才能保证区域识别的准确性。

在一些实施例中，计算机设备可以通过区域分割模型对目标对象的实物图进行初步的区域划分，确定出目标对象的实物图中各连通域，得到初始处理后的实物图。初始处理后的实物图中各区域的边缘存在毛刺，需要进行矫正处理。

在一些实施例中，计算机设备可以通过序号编码器（label encoder）对初始处理后的实物图进行编码处理，得到初阶矫正后的实物图。其中，序号编码器是一种小型网络。

在一些实施例中，计算机设备可以对原始设计图进行形变，得到形变图。计算机设备可以将原始设计图确定为形变图的标签。计算机设备可以将添加标签的形变图确定为序号编码器的训练数据，对初始的序号编码器进行训练，得到训练完毕的序号编码器。

在一些实施例中，计算机设备可以对初阶矫正后的实物图进行众数滤波处理，将当前像素的预设范围内出现次数最多的像素值确定为当前像素的值，得到目标对象图。

在一些实施例中，计算机设备可以通过滤波器对初始矫正后的实物图进行滤波处理，得到滤波器输出的目标对象图。其中，预设范围是指针对滤波器预设的滤波范围。比如，滤波范围可以为5*5。

在一些实施例中，计算机设备可以对目标对象的实物图进行轮廓检测以实现初步的区域划分，确定出目标对象的实物图中各区域，得到初始处理后的实物图。

如图2所示，本申请实施例提供了一种实物图和目标对象图。计算机设备可以对实物图进行区域划分、编码处理以及众数滤波得到目标对象图。

本实施例中，确定目标对象的实物图中各连通域，得到初始处理后的实物图；将初始处理后的实物图进行边缘矫正处理，得到初阶矫正后的实物图；对初阶矫正后的实物图进行滤波处理，得到目标对象图，通过初始处理和多阶边缘矫正后的实物图，与目标对象的设计图接近，对于区域识别更加友好，能够提高区域识别的准确性。

在一些实施例中，子图像特征数据是对缩放后的子图像进行特征提取得到的；基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息，包括：

基于子图像特征数据和位置数据，对缩放后的子图像中的区域进行类别预测，得到缩放后的子图像中的区域的区域类别信息；

对缩放后的子图像进行还原处理，得到还原后的子图像；

将还原后的子图像中的区域的区域类别信息映射至目标对象图中，得到目标对象图的子图像中的区域的区域类别信息。

示例性地，计算机设备可以按照预设缩放比例获取缩放后的子图像。可以理解，计算机设备可以从缩放后的目标对象图确定出缩放后的子图像。计算机设备也可以对目标对象图中的子图像进行缩放得到缩放后的子图像。

计算机设备可以将子图像特征数据和位置数据进行连接得到融合特征数据。计算机设备可以根据融合特征数据对缩放后的子图像中的区域进行类别预测，得到缩放后的子图像中的区域的区域类别信息。计算机设备可以按照预设缩放比例对缩放后的子图像进行膨胀处理，得到膨胀后的子图像。

计算机设备可以将还原后的子图像中的区域与目标对象图中的区域进行对齐处理，从目标对象图中确定对齐后的区域。计算机设备可以将还原后的子图像中的区域的区域类别信息映射至对齐后的区域，得到目标对象图的子图像中的区域的区域类别信息。

本实施例中，基于子图像特征数据和位置数据，对缩放后的子图像中的区域进行类别预测，得到缩放后的子图像中的区域的区域类别信息；对缩放后的子图像进行还原处理，得到还原后的子图像，对缩放后的子图像进行区域识别，能够节约计算资源。将还原后的子图像中的区域的区域类别信息映射至目标对象图中，得到目标对象图的子图像中的区域的区域类别信息，相较于直接将还原后的子图像的区域类别信息作为结果，能够避免子图像缩放引起的边缘锯齿的影响。

在一些实施例中，子图像中的区域的区域类别信息是通过将子图像作为区域识别模型的输入确定的；方法还包括区域识别模型的训练步骤；区域识别模型的训练步骤包括：

确定样本图像中具有第一标签的参照区域；参照区域是从样本图像中的各区域中随机选择得到的；第一标签用于指示参照区域的区域类别信息；

从样本图像中剪裁出样本子图像；样本子图像包括参照区域的至少部分；

基于样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型。

其中，参照区域可以是从样本图像中随机选择的连通域。

示例性地，计算机设备可以从样本图像的各连通域中随机选择参照区域。计算机设备可以从参照区域中随机选择定位点。定位点用于定位样本图像中的裁剪位置。计算机设备可以通过剪裁框剪裁出样本子图像。样本子图像中包括定位点。计算机设备可以将样本子图像作为区域识别模型的训练数据，对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型。

在一些实施例中，计算机设备可以将定位点设置在剪裁框上的随机位置上，确定剪裁框在样本图像中的裁剪位置，进而通过剪裁框在裁剪位置处剪裁出样本子图像。可以理解，连通域的随机选择、定位点的随机选择以及裁剪位置的随机选择能够增加裁剪的随机性，能够达到丰富训练样本的效果。

在一些实施例中，计算机设备可以随机将定位点对应于剪裁框上的任意位置，以确定剪裁框在样本图像中的裁剪位置。

在一些实施例中，计算机设备可以对初始的区域识别模型进行训练，在训练过程中确定样本子图像中预设边缘范围内的像素不参与反向传播。

本实施例中，确定样本图像中具有第一标签的参照区域；从样本图像中剪裁出样本子图像；基于样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型，因为样本图像中每个区域的大小不相同，有的很大有的很小，如果直接在样本图像上随机裁剪，大区域被选到的概率会比小区域高很多，所以如果先随机地选择一个区域再裁剪，就可以保证每个部件被选中的概率是相同的，从而保证训练的准确性。

在一些实施例中，基于样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型，包括：

针对样本子图像中预设边缘范围内的像素添加第二标签，以得到标记后的样本子图像；第二标签用于表征像素在训练中不参与反向传播；

基于标记后的样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型。

示例性地，计算机设备可以针对样本子图像中预设边缘范围内的像素添加“ignore”标签，以得到标记后的样本子图像。计算机设备可以将标记后的样本子图像作为区域识别模型的训练数据，在对初始的区域识别模型进行训练的过程中，确定添加第二标签的像素不参与反向传播，以得到训练完毕的区域识别模型。

在一些实施例中，预设边缘范围可以是样本子图像边界相邻的100个像素。

在一些实施例中，计算机设备可以对训练完毕的区域识别模型进行通道剪裁，得到轻量化的区域识别模型。可以理解，通过轻量化的区域识别模型进行像素级分类处理，能够节约计算资源。

如图3所示，本申请实施例提供了一种训练区域识别模型的示意图。计算机设备可以从样本图像中确定出样本子图像。计算机设备可以确定样本子图像的位置数据。计算机设备可以将标记后的样本子图像确定为本轮主干网络的输入，得到本轮主干网络输出的样本子图像特征数据。计算机设备可以将样本子图像的位置数据与样本子图像特征数据连接后输入至分割头中，得到分割头输出的样本子图像中每个像素对应的区域类别概率。计算机设备可以针对样本子图像中的每个连通域进行概率平均处理，得到连通域的区域级分类数据。计算机设备可以基于连通域的区域级分类数据确定样本子图像中区域的区域类别信息。计算机设备可以在样本图像中使用不同的灰度或颜色标记每个连通域的区域类别，得到样本图像的区域的区域类别信息。每个灰度或颜色标识一种区域类别。可以理解，计算机设备可以朝着样本子图像中每个像素对应的区域类别概率更加符合各参照区域的第一标签的方向，对每轮主干网络和每轮分割头进行训练，以得到训练完毕的区域识别模型。

在一些实施例中，区域识别模型的输出是每个像素对应的区域类别概率。

在一些实施例中，区域识别模型包括主干网络和分割头。主干网络用于对子图像进行特征提取。分割头用于基于子图像特征数据和位置数据进行像素级分类处理。其中，主干网络可以是基于注意力机制的网络，主干网络包括位置编码层、重叠块编码层、多层注意力模块以及多个多层感知机。主干网络可以是添加位置编码层的segformer。分割头可以是FCNhead。

本实施例中，针对样本子图像中预设边缘范围内的像素添加第二标签，以得到标记后的样本子图像；第二标签用于表征像素在训练中不参与反向传播；基于标记后的样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型，当样本图像被裁剪时，处在裁剪框边缘的区域由于周围信息的缺失而很难准确的判断，那么这些区域的反向传播就会误导网络的训练，因此本方案将边框四周的区域置为ignore区域，使网络朝着正确的方向训练。

应该理解的是，虽然如上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种区域识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个区域识别装置实施例中的具体限定可以参见上文中对于区域识别方法的限定，在此不再赘述。

如图4所示，本申请实施例提供了一种区域识别装置400，包括：

获取模块402，用于获取目标对象图；

第一确定模块404，用于确定目标对象图中的多个子图像；

第二确定模块406，用于针对每个子图像，确定子图像的位置数据；位置数据用于表征子图像在目标对象图中的位置；

提取模块408，用于对子图像进行特征提取，得到子图像特征数据；

识别模块410，用于基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息。

在一些实施例中，在针对每个子图像，确定子图像的位置数据方面，第二确定模块406具体用于：

针对每个子图像，确定子图像上的参照点；

在一些实施例中，在对子图像进行特征提取，得到子图像特征数据方面，提取模块408具体用于：

对初始编码数据进行特征提取，得到子图像特征数据。

在一些实施例中，子图像中的区域包括子图像中的连通域；在基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息方面，识别模块410具体用于：

在一些实施例中，在基于子图像中的连通域内的像素对应的区域类别概率，对子图像中的连通域进行区域级分类处理，得到连通域的区域类别信息方面，识别模块410具体用于：

在一些实施例中，在获取目标对象图方面，获取模块402具体用于：

对初阶矫正后的实物图进行滤波处理，得到目标对象图。

在一些实施例中，子图像特征数据是对缩放后的子图像进行特征提取得到的；在基于子图像特征数据和位置数据，对子图像中的区域进行类别预测，得到子图像中的区域的区域类别信息方面，识别模块410具体用于：

对缩放后的子图像进行还原处理，得到还原后的子图像；

在一些实施例中，子图像中的区域的区域类别信息是通过将子图像作为区域识别模型的输入确定的；获取模块402还用于：确定样本图像中具有第一标签的参照区域；参照区域是从样本图像中的各区域中随机选择得到的；第一标签用于指示参照区域的区域类别信息；从样本图像中剪裁出样本子图像；样本子图像中包括参照区域的至少部分；针对样本子图像中预设边缘范围内的像素添加第二标签，以得到标记后的样本子图像；第二标签用于表征像素在训练中不参与反向传播；

上述区域识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器，也可以以软件形式存储于计算机设备中的存储器，以便于处理器调用执行以上各个模块对应的操作。

在一些实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O）及通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标对象图。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现上述的区域识别方法中的步骤。

在一些实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元以及输入装置。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的计算机设备进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC（近场通信）或其他技术实现。该计算机程序被处理器执行时以实现上述的区域识别方法中的步骤。该计算机设备的显示单元用于形成视觉可见的画面，可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图5或图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一些实施例中，提供了一种计算机设备，计算机设备包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一些实施例中，如图7所示提供了一种计算机可读存储介质的内部结构图，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一些实施例中，提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-OnlyMemory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（ReRAM）、磁变存储器（Magnetoresistive Random Access Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random AccessMemory，SRAM）或动态随机存取存储器（Dynamic RandomAccess Memory，DRAM）等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种区域识别方法，其特征在于，包括：

获取目标对象图；

通过预设的剪裁框，从所述目标对象图中裁剪出固定大小的多个子图像；

针对每个所述子图像，确定所述子图像的位置数据；所述位置数据用于表征所述子图像在所述目标对象图中的位置；

对所述子图像进行重叠块编码处理，得到具有局部连续性的块编码数据；

对所述子图像进行位置编码处理，得到位置编码数据；所述位置编码数据用于表征所述子图像中各像素的位置；

对所述块编码数据和所述位置编码数据进行融合处理，得到所述子图像的初始编码数据；

通过多层注意力模块分别对所述初始编码数据进行不同尺度的特征提取，得到多尺度编码数据；

通过聚合每层注意力模块输出的编码数据，将全局和局部的注意力结合起来，以进行所述多尺度编码数据的解码处理，得到子图像特征数据；

基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息。

2.根据权利要求1所述的方法，其特征在于，所述针对每个所述子图像，确定所述子图像的位置数据，包括：

针对每个所述子图像，确定所述子图像上的参照点；

基于所述参照点与所述目标对象图的预设位置之间的距离，确定所述子图像的位置数据。

3.根据权利要求1所述的方法，其特征在于，所述子图像中的区域包括所述子图像中的连通域；所述基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息，包括：

根据所述子图像特征数据和所述位置数据进行像素级分类处理，得到所述子图像中每个像素对应的区域类别概率；所述每个像素对应的区域类别概率，是指所述像素所在区域属于各个区域类别的概率；

基于所述子图像中的连通域内的像素对应的区域类别概率，对所述子图像中的连通域进行区域级分类处理，得到所述连通域的区域类别信息。

4.根据权利要求3所述的方法，其特征在于，所述基于所述子图像中的连通域内的像素对应的区域类别概率，对所述子图像中的连通域进行区域级分类处理，得到所述连通域的区域类别信息，包括：

针对所述子图像中的每个连通域，对所述连通域内的像素在同一区域类别下对应的概率进行平均处理，得到所述连通域的区域级分类数据；所述区域级分类数据用于表征所述连通域属于各个区域类别的概率；

根据所述连通域的区域级分类数据，确定所述连通域的区域类别信息。

5.根据权利要求1所述的方法，其特征在于，所述获取目标对象图，包括：

对所述初始处理后的实物图进行边缘矫正处理，得到初阶矫正后的实物图；

对所述初阶矫正后的实物图进行滤波处理，得到目标对象图。

6.根据权利要求1所述的方法，其特征在于，所述子图像特征数据是对缩放后的子图像进行特征提取得到的；所述基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息，包括：

基于所述子图像特征数据和所述位置数据，对所述缩放后的子图像中的区域进行类别预测，得到所述缩放后的子图像中的区域的区域类别信息；

对所述缩放后的子图像进行还原处理，得到还原后的子图像；

将所述还原后的子图像中的区域的区域类别信息映射至所述目标对象图中，得到所述目标对象图的所述子图像中的区域的区域类别信息。

7.根据权利要求1所述的方法，其特征在于，所述子图像中的区域的区域类别信息是通过将所述子图像作为区域识别模型的输入确定的；所述方法还包括所述区域识别模型的训练步骤；所述区域识别模型的训练步骤包括：

确定样本图像中具有第一标签的参照区域；所述参照区域是从所述样本图像中的各区域中随机选择得到的；所述第一标签用于指示所述参照区域的区域类别信息；

从所述样本图像中剪裁出样本子图像；所述样本子图像包括所述参照区域的至少部分；

针对所述样本子图像中预设边缘范围内的像素添加第二标签，以得到标记后的样本子图像；所述第二标签用于表征像素在训练中不参与反向传播；

基于所述标记后的样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型。

8.一种区域识别装置，其特征在于，包括：

获取模块，用于获取目标对象图；

第一确定模块，用于通过预设的剪裁框，从所述目标对象图中裁剪出固定大小的多个子图像；

第二确定模块，用于针对每个所述子图像，确定所述子图像的位置数据；所述位置数据用于表征所述子图像在所述目标对象图中的位置；

提取模块，用于对所述子图像进行重叠块编码处理，得到具有局部连续性的块编码数据；对所述子图像进行位置编码处理，得到位置编码数据；所述位置编码数据用于表征所述子图像中各像素的位置；对所述块编码数据和所述位置编码数据进行融合处理，得到所述子图像的初始编码数据；通过多层注意力模块分别对所述初始编码数据进行不同尺度的特征提取，得到多尺度编码数据；通过聚合每层注意力模块输出的编码数据，将全局和局部的注意力结合起来，以进行所述多尺度编码数据的解码处理，得到子图像特征数据；

识别模块，用于基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息。

9.根据权利要求8所述的装置，其特征在于，在所述针对每个所述子图像，确定所述子图像的位置数据方面，所述第二确定模块具体用于：

针对每个所述子图像，确定所述子图像上的参照点；

10.根据权利要求8所述的装置，其特征在于，所述子图像中的区域包括所述子图像中的连通域；在所述基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息方面，所述识别模块具体用于：

11.根据权利要求10所述的装置，其特征在于，在所述基于所述子图像中的连通域内的像素对应的区域类别概率，对所述子图像中的连通域进行区域级分类处理，得到所述连通域的区域类别信息方面，所述识别模块具体用于：

12.根据权利要求8所述的装置，其特征在于，在所述获取目标对象图方面，所述获取模块具体用于：

13.根据权利要求8所述的装置，其特征在于，所述子图像特征数据是对缩放后的子图像进行特征提取得到的；在所述基于所述子图像特征数据和所述位置数据，对所述子图像中的区域进行类别预测，得到所述子图像中的区域的区域类别信息方面，所述识别模块具体用于：

14.根据权利要求8所述的装置，其特征在于，所述子图像中的区域的区域类别信息是通过将所述子图像作为区域识别模型的输入确定的；所述获取模块还用于：确定样本图像中具有第一标签的参照区域；所述参照区域是从所述样本图像中的各区域中随机选择得到的；所述第一标签用于指示所述参照区域的区域类别信息；从所述样本图像中剪裁出样本子图像；所述样本子图像包括所述参照区域的至少部分；针对所述样本子图像中预设边缘范围内的像素添加第二标签，以得到标记后的样本子图像；所述第二标签用于表征像素在训练中不参与反向传播；基于所述标记后的样本子图像对初始的区域识别模型进行训练，以得到训练完毕的区域识别模型。

15.一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。