CN111653103A

CN111653103A - 一种目标对象的识别方法及装置

Info

Publication number: CN111653103A
Application number: CN202010377549.8A
Authority: CN
Inventors: 王利升
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2020-05-07
Filing date: 2020-05-07
Publication date: 2020-09-11

Abstract

本发明公开了一种目标对象的识别方法及装置，若参考图像中存在较多的目标对象时，可以增加第一权重与第二权重的比值，可以降低在识别过程中对目标对象的误判几率，提高目标对象的识别准确率，降低背景在识别过程中的响应度，从而提高目标对象的识别结果的真实性。并且，由于本发明实施例中根据目标识别模型对参考图像进行识别，之后再根据识别结果确定子区域内的目标对象，所以在该识别方法应用至室外停车场的应用场景中时，即使室外停车场处于沙土地中，也不会影响车辆的识别，从而有利于根据确定出的已停放的车辆确定空闲车位，进而实现对用户进行引导，提高用户的体验感受。

Description

一种目标对象的识别方法及装置

技术领域

本发明涉及图像处理技术领域，尤指一种目标对象的识别方法及装置。

背景技术

在停车场的管理过程中，为了便于向用户提示停车场中可停放的车辆数量、以及当前空闲车位的数量，需要对停车场内当前已停放的车辆进行统计和识别。

目前，对于室内停车场而言，一般可以在室内停车场内设置无线地磁检测传感器；具体地，室内停车场包括若干个停车位，每个停车位上可以设有地磁检测装置，地磁检测装置可以与信号接收基站进行连接，使得地磁检测装置可以将获取到的停车位的状态发送到信号接收基站，在信号接收基站与应用服务器连接时，通过应用服务器与用户终端连接后，展示给用户，也即向用户显示当前室内停车场内空闲车位的数量，以便于对用户进行引导。

然而，对于室外停车场而言，若室外停车场处于沙土地的场景时，则难以在沙土地上安装无线地磁检测传感器，也就难以识别出室外停车场中当前已停放的车辆，进而也就无法识别出空闲车位，无法向用户提示空闲车位的情况，最终无法实现对用户的引导。

基于此，如何实现对室外停车场中当前已停放的车辆进行识别，是本领域技术人员亟待解决的技术问题。

发明内容

本发明实施例提供了一种目标对象的识别方法及装置，用以实现对室外停车场中当前已停放的车辆进行识别。

第一方面，本发明实施例提供了一种目标对象的识别方法，应用于室外停车场，所述室外停车场所在区域包括至少一个待识别区域，所述待识别区域包括多个子区域，所述待识别区域对应设置有拍照设备；该识别方法包括：

在利用所述拍照设备对所述待识别区域进行拍照，得到所述待识别区域对应的参考图像时，根据预设的目标识别模型，对所述参考图像进行识别，得到识别结果；

根据所述识别结果，确定各所述子区域内的所述目标对象；

其中，所述目标识别模型为卷积神经网络模型，所述目标识别模型为：根据预设的样本图像和预设的损失函数，进行训练后得到的，所述样本图像中包括至少一个目标对象，所述损失函数包括：所述目标对象的训练结果对应的第一权重、以及背景的训练结果对应的第二权重，所述第一权重与所述第二权重的比值与所述样本图像中包括的所述目标对象的数量正相关，所述背景为所述参考图像中除所述目标对象之外的图像。

可选地，在本发明实施例中，所述目标识别模型的确定方法，具体为：

确定待训练的样本集合，所述样本集合包括多张所述样本图像，所述样本图像中标注有所述目标对象；

根据所述样本集合、以及预设的待训练的模型的初始参数，对待训练的模型进行训练得到初始训练结果；

在判断出所述初始训练结果与所述样本图像中所述目标对象的标注结果不匹配时，利用所述损失函数调整所述初始参数，并根据所述样本集合和调整后的初始参数，继续对所述待训练的模型进行训练，直至训练结果与所述样本图像中所述目标对象的标注结果相匹配时，根据该训练结果对应的调整后的初始参数，确定所述目标识别模型。

可选地，在本发明实施例中，所述拍照设备的设置位置根据以下条件中的至少一个确定：

各所述目标对象之间的相对位置关系；

所述参考图像中所述目标对象的数量；

所述参考图像中所述目标对象的尺寸；

所述拍照设备的拍摄角度。

可选地，在本发明实施例中，所述目标对象为需要停入所述室外停车场中的车辆，所述拍照设备的设置位置满足以下要求：

设置高度不小于20米；

所述参考图像中所述目标对象的像素尺寸不小于60*70；

所述参考图像中所述目标对象被其他目标对象遮挡的程度小于1/3。

可选地，在本发明实施例中，所述参考图像满足以下至少一个要求：

所述参考图像的外轮廓形状为长方形，且长边与短边的比值大于2；

所述长边对应的像素数量大于960；

所述目标对象为需要停入所述室外停车场中的车辆，所述参考图像中包括N排车位，每排包括M个车位，M为大于N的整数。

可选地，在本发明实施例中，所述第一权重与所述第二权重的比值为10至20。

可选地，在本发明实施例中，所述目标识别模型对应的损失函数还包括：类别的训练结果对应的第三权重，所述第三权重与所述第二权重的比值为5至10。

可选地，在本发明实施例中，所述卷积神经网络模型包括多级卷积层，最后一级所述卷积层中所述目标对象占用的网格数量大于3*3，最后一级所述卷积层的长边对应的网格数量大于60。

可选地，在本发明实施例中，所述目标对象为需要停入所述室外停车场中的车辆时，在根据所述识别结果，确定各所述子区域内的所述目标对象之后，还包括：

针对任一所述子区域执行以下过程：

判断所述子区域中是否标记有停车线；

若是，在根据该子区域内的停车线，确定出可停放的所述目标对象的规定数量时，根据该子区域对应的规定数量、以及确定出的该子区域内的所述目标对象，确定该子区域内空闲车位的数量；

若否，根据该子区域对应的预设数量、以及确定出的该子区域内的所述目标对象，确定该子区域内所述空闲车位的数量。

第二方面，本发明实施例提供了一种目标对象的识别装置，应用于室外停车场，所述室外停车场所在区域包括至少一个待识别区域，所述待识别区域包括多个子区域，所述待识别区域对应设置有拍照设备；该识别装置包括：

第一单元，用于在利用所述拍照设备对所述待识别区域进行拍照，得到所述待识别区域对应的参考图像时，根据预设的目标识别模型，对所述参考图像进行识别，得到识别结果；

第二单元，用于根据所述识别结果，确定各所述子区域内的所述目标对象；

第三方面，本发明实施例提供了一种目标对象的识别系统，包括：拍照设备、显示设备、以及如本发明实施例提供的上述目标对象的识别装置；

其中，所述拍照设备用于：对待识别区域进行拍照，得到所述待识别区域对应的参考图像，以使所述识别装置根据所述参考图像，识别出各子区域内的所述目标对象，并在所述显示设备上显示识别出的结果。

本发明有益效果如下：

本发明实施例提供的一种目标对象的识别方法及装置，若参考图像中存在较多的目标对象时，可以增加第一权重与第二权重的比值，可以降低在识别过程中对目标对象的误判几率，提高目标对象的识别准确率，降低背景在识别过程中的响应度，从而提高目标对象的识别结果的真实性。

并且，由于本发明实施例中根据目标识别模型对参考图像进行识别，之后再根据识别结果确定子区域内的目标对象，所以在该识别方法应用至室外停车场的应用场景中时，即使室外停车场处于沙土地中，也不会影响目标对象(即车辆)的识别，从而有利于根据确定出的已停放的车辆确定空闲车位，进而实现对用户进行引导，提高用户的体验感受。

附图说明

图1为本发明实施例中提供的一种识别方法的流程图；

图2为本发明实施例中提供的具体实施例的流程图；

图3为本发明实施例中提供的一种识别装置的结构示意图；

图4为本发明实施例中提供的一种识别系统的结构示意图。

具体实施方式

下面将结合附图，对本发明实施例提供的一种目标对象的识别方法及装置的具体实施方式进行详细地说明。需要说明的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种目标对象的识别方法，其中，应用于室外停车场，室外停车场所在区域包括至少一个待识别区域，待识别区域包括多个子区域，待识别区域对应设置有拍照设备；如图1所示，该识别方法可以包括：

S101、在利用拍照设备对待识别区域进行拍照，得到待识别区域对应的参考图像时，根据预设的目标识别模型，对参考图像进行识别，得到识别结果；其中，目标识别模型为卷积神经网络模型，目标识别模型为：根据预设的样本图像和预设的损失函数，进行训练后得到的，样本图像中包括至少一个目标对象，损失函数包括：目标对象的训练结果对应的第一权重、以及背景的训练结果对应的第二权重，第一权重与第二权重的比值与样本图像中包括的目标对象的数量正相关，背景为参考图像中除目标对象之外的图像；

说明一点，在训练过程中，因样本图像中包括目标对象(如车辆)，且识别过程中，非目标对象(例如但不限于除车辆之外的干扰，可以称之为背景)较多，如果损失函数中第一权重与第二权重的比值较小时，会增加背景的训练结果(也即训练过程中得到的识别结果)的响应度，而降低目标对象的训练结果的响应度，导致目标对象的训练结果的准确度降低。

因此，将第一权重与第二权重的比值与样本图像中包括的目标对象的数量设置为正相关，在样本图像中包括较多的目标对象时，增加第一权重与第二权重的比值，使得得到的目标识别模型在识别目标对象时具有较高的准确率，从而有利于提高目标对象的识别精确度。

其中，在根据目标识别模型对参考图像进行识别时，具体的识别过程可以参见现有技术，在此不再详述。

S102、根据识别结果，确定各子区域内的目标对象。

如此，在本发明实施例中，若参考图像中存在较多的目标对象时，可以增加第一权重与第二权重的比值，可以降低在识别过程中对目标对象的误判几率，提高目标对象的识别准确率，降低背景在识别过程中的响应度，从而提高目标对象的识别结果的真实性。

说明一点，在室外停车场所在区域可以包括多个待识别区域时，因每个待识别区域对应设置有一拍照设备，所以室外停车场所在区域需设置多个拍照设备，实现了多目标检测，解决了在停车场的出入口进行单目标检测时引起的检测和识别精度较低的问题，如此，可以对整个室外停车场所在区域进行准确有效地识别和控制，提高目标对象识别的准确度，为用户提供更加准确的信息，为用户提供更加准确、有效地引导。

可选地，在本发明实施例中，在应用至室外停车场的场景中时，因停车场一般包括多排停车位，每排包括多个停车位，所以在划分子区域时，可以将一排设置为一个子区域，以实现对每排停车位的准确检测和识别，为用户提供精确有效地引导。

可选地，在本发明实施例中，拍照设备的设置位置可以根据以下条件中的至少一个确定：

各目标对象之间的相对位置关系；

参考图像中目标对象的数量；

参考图像中目标对象的尺寸；

拍照设备的拍摄角度。

其中，在实际情况中，在对拍照设备的设置位置进行设置时，可以根据实际需要选择条件，以满足不同应用场景的需要，提高设计的灵活性。

当然，对于拍照设备的设置位置的限定，除了上述条件之外，还可以包括其他影响拍照设备的拍摄效果的条件，可以根据实际需要进行设置，在此并不限定。

如此，可以充分优化拍照设备的设置位置，解决因拍照设备的设置高度较低而出现的车辆遮挡的问题，还可以避免因拍照设备的设置高度较高导致目标对象难以被准确识别的问题出现，同时，还可以使得拍照设备的拍摄范围覆盖整个待识别区域，减少漏检的几率，从而有利于提高目标对象的识别准确度。

具体地，在本发明实施例中，在目标对象为需要停入室外停车场中的车辆时，拍照设备的设置位置可以满足以下要求：

设置高度不小于20米；

参考图像中目标对象的像素尺寸不小于60*70；

参考图像中目标对象被其他目标对象遮挡的程度小于1/3。

例如，若拍照设备满足上述要求时，拍照设备的拍摄范围可以覆盖4至6排停车位，每排停车位的可见范围可以为20-25辆车，如此可以使得可识别的目标对象的数量大于80，也即，拍照设备的拍摄范围内最少可以停放80辆车。

如此，可以大大提高拍照设备的拍摄范围，有利于减少拍照设备的设置数量，降低识别成本，同时还有利于提高目标对象的识别准确度。

在具体实施时，在本发明实施例中，在拍照设备按照上述设置方式进行设置时，拍照设备每采集一次得到的参考图像中包括的目标对象的数量可能较多，对应的每个目标对象的像素尺寸会较小，如此可能会影响识别的精度。

基于此，为了提高识别精度，可以从以下几个方面进行设置：

1、对参考图像进行设置。

可选地，在本发明实施例中，参考图像满足以下至少一个要求：

参考图像的外轮廓形状为长方形，且长边与短边的比值大于2；

长边对应的像素数量大于960；

目标对象为需要停入室外停车场中的车辆，参考图像中包括N排车位，每排包括M个车位，M为大于N的整数。

其中，以应用至室外停车场的场景为例，考虑拍照设备的景深导致远处车辆的畸变和遮挡影响，近景包含的目标对象的数量越多越好，并且要求参考图像中每排包括的车位数量大于排数，且满足长边与短边的比值大于2的要求，以减少遮挡和畸变。

并且，将长边对应的像素数量设置为大于960，可以有利于提高参考图像的分辨率，使得输入至目标识别模型中的参考图像具有较高的分辨率，进而使得对较小的目标对象保留的较多，有利于较小的目标对象的识别，从而提高目标对象的识别精度。

2、对目标识别模型进行设置。

2.1、对目标识别模型中的下采样级数的设置。

可选地，在本发明实施例中，在对下采样级数进行设置时，可以减少下采样级数，且需要满足以下要求：

在卷积神经网络模型包括多级卷积层时，最后一级卷积层中目标对象占用的网格(也可以称之为预测网格)数量大于3*3，且最后一级卷积层的长边对应的网格数量大于60。

其中，最后一级卷积层可以认为是上一级卷积层经过卷积计算后输出的特征，该特征包括的网格数可以用S*K来表示；若S大于K，那么最后一级卷积层的长边对应的网格数量大于60可以理解为：S大于60。

如此，通过上述设置，可以避免目标对象被进行多次缩放，进而避免目标对象的像素尺寸过小而导致的训练和检测时间过长，从而避免对目标识别模型的检测性能造成不良影响，在提高目标对象的识别精度的同时，提高目标识别模型的检测效率。

2.2、对目标识别模型对应的损失函数的设置。

可选地，在本发明实施例中，第一权重与第二权重的比值可以设置为10至20，以提高目标对象的识别的响应度，降低背景的识别的响应度，以有效地提高目标对象的识别精度。

并且，目标识别模型对应的损失函数除了包括第一权重和第二权重之外，还可以包括：类别的训练结果对应的第三权重，第三权重与第二权重的比值为5至10。

具体地，损失函数可以具体如下：

其中，f(x)表示损失函数，n表示每个卷积层中第n个网格，max表示每个卷积层包括的网格总数，λa表示第一权重，λc表示第二权重，λb表示第三权重，A1表示目标对象的预测结果，A2表示类别的预测结果，A3表示坐标回归确定结果，A4表示背景的预测结果。

可选地，在本发明实施例中，对于目标识别模型而言，在构建时可以采用以下过程：

过程1：确定待训练的样本集合，样本集合包括多张样本图像，样本图像中标注有目标对象；

其中，对于样本集合而言，可以准备较多的样本，以丰富样本集合中的素材，使得构建的目标识别模型可以具有较广的适用范围。

例如但不限于，样本集合中可以包括5000张样本图像，总共包含30万-40万的目标对象，且每张样本图像可以包含大量的目标对象。

可选地，在利用样本集合进行训练之前，可以对样本集合进行扩展处理。

例如但不限于：调整样本图像的亮度和饱和度，以适应阳光下车影、阴天和雨天的光线干扰。从而进一步丰富样本集合，扩展构建的目标识别模型的适用范围。

过程2：根据样本集合、以及预设的待训练的模型的初始参数，对待训练的模型进行训练得到初始训练结果；

其中，在训练时，可以利用DARKNET框架进行训练，当然也可以采用其他框架进行训练，只要能够实现训练即可，在此并不限定。

过程3：在判断出初始训练结果与样本图像中目标对象的标注结果不匹配时，利用损失函数调整初始参数，并根据样本集合和调整后的初始参数，继续对待训练的模型进行训练，直至训练结果与样本图像中目标对象的标注结果相匹配时，根据该训练结果对应的调整后的初始参数，确定目标识别模型。

在实际情况中，可能会存在卷积层中存在大量的网格反馈背景的预测结果，在训练开始时，由于大量的背景反馈，可能会导致用于响应坐标回归和类别的网格数量有限，如此，需要训练较长时间才能收敛坐标回归和类别这两项误差。

因此，可以调整第三权重和第二权重的比值，以减少训练的时间，进而快速地收敛坐标回归和类别这两项误差，即快速地完成训练，从而提高构建目标识别模型的效率。

并且，通过对第一权重、第二权重和第三权重的设置，可以保证目标对象较小且在坐标回归时实现高精度的处理，实现大量小目标对象的置信度及其坐标预测时的高精度回归，同时还可以避免其他背景对目标对象的预测干扰，从而可以大大提高在识别结果的准确度和召回率。

综上，通过从上述几个方面的设置，即使参考图像中包含较多的目标对象，但依然可以减少识别过程中的计算量，同时减少目标识别模型训练过程中的计算量和训练时间，使得识别装置依然具有较高的识别性能，具有较强的实用性。

在具体实施时，在本发明实施例中，在目标对象为需要停入室外停车场中的车辆时，在根据识别结果，确定各子区域内的目标对象之后，还包括：

针对任一子区域执行以下过程：

判断子区域中是否标记有停车线；

若是，在根据该子区域内的停车线，确定出可停放的目标对象的规定数量时，根据该子区域对应的规定数量、以及确定出的该子区域内的目标对象，确定该子区域内空闲车位的数量；

若否，根据该子区域对应的预设数量、以及确定出的该子区域内的目标对象，确定该子区域内空闲车位的数量。

如此，通过上述过程，可以根据确定出的子区域内的目标对象，确定该子区域内的空闲车位，从而实现对室外停车场中的空闲车位的识别，实现对用户的引导，提高用户的体验感受。

下面以具体实施例，对本发明实施例提供的识别方法进行说明。

结合图2所示的流程图，以第i个子区域为例。

S201、利用拍照设备对待识别区域进行拍照，得到对应的参考图像；

S202、根据预设的目标识别模型，对参考图像进行识别，得到识别结果；

S203、根据识别结果，确定第i个子区域内的目标对象；

S204、判断第i个子区域中是否标记有停车线；若是，执行S205；若否，执行S207；

S205、根据第i个子区域内的停车线，确定出可停放的目标对象的规定数量；

S206、根据第i个子区域对应的规定数量、以及确定出的第i个子区域内的目标对象，确定第i个子区域内空闲车位的数量；结束流程；

S207、根据第i个子区域对应的预设数量、以及确定出的第i个子区域内的目标对象，确定第i个子区域内空闲车位的数量。

基于同一发明构思，本发明实施例提供了一种目标对象的识别装置，该识别装置的实现原理与前述一种识别方法的实现原理类似，该识别装置的具体实施方式可以参见前述识别方法的实施例，重复之处不再赘述。

具体地，本发明实施例提供的一种目标对象的识别装置，应用于室外停车场，室外停车场所在区域包括至少一个待识别区域，待识别区域包括多个子区域，待识别区域对应设置有拍照设备；如图3所示，该识别装置可以包括：

第一单元301，用于在利用拍照设备对待识别区域进行拍照，得到待识别区域对应的参考图像时，根据预设的目标识别模型，对参考图像进行识别，得到识别结果；

第二单元302，用于根据识别结果，确定各子区域内的目标对象；

其中，目标识别模型对应的损失函数包括：目标对象的预测对应的第一权重、以及背景的预测对应的第二权重，第一权重与第二权重的比值为10至20，背景为参考图像中除目标对象之外的图像。

可选地，在本发明实施例中，第一单元301还用于确定目标识别模型。

可选地，在本发明实施例中，第一单元301具体用于：

确定待训练的样本集合，样本集合包括多张样本图像，样本图像中标注有目标对象；

根据样本集合、以及预设的待训练的模型的初始参数，对待训练的模型进行训练得到初始训练结果；

在判断出初始训练结果与样本图像中目标对象的标注结果不匹配时，利用损失函数调整初始参数，并根据样本集合和调整后的初始参数，继续对待训练的模型进行训练，直至训练结果与样本图像中目标对象的标注结果相匹配时，根据该训练结果对应的调整后的初始参数，确定目标识别模型。

可选地，在本发明实施例中，拍照设备的设置位置根据以下条件中的至少一个确定：

各目标对象之间的相对位置关系；

参考图像中目标对象的数量；

参考图像中目标对象的尺寸；

拍照设备的拍摄角度。

可选地，在本发明实施例中，目标对象为需要停入室外停车场中的车辆时，第二单元302还用于：

针对任一子区域执行以下过程：

在根据识别结果，确定对应子区域内的目标对象之后，判断子区域中是否标记有停车线；

基于同一发明构思，本发明实施例提供了一种目标对象的识别系统，如图4所示，可以包括：拍照设备401、显示设备402、以及如本发明实施例提供的上述目标对象的识别装置403；

其中，拍照设备401用于：对待识别区域进行拍照，得到待识别区域对应的参考图像，以使识别装置403根据参考图像，识别出各子区域内的目标对象，并在显示设备402上显示识别出的结果。

可选地，在本发明实施例中，可以设置为：待识别区域对应设置至少一个显示设备。

如此，可以有利于减少显示设备的安装数量，以降低识别系统的制作成本，同时实现了车位的有效引导。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种目标对象的识别方法，其特征在于，应用于室外停车场，所述室外停车场所在区域包括至少一个待识别区域，所述待识别区域包括多个子区域，所述待识别区域对应设置有拍照设备；该识别方法包括：

根据所述识别结果，确定各所述子区域内的所述目标对象；

2.如权利要求1所述的识别方法，其特征在于，所述目标识别模型的确定方法，具体为：

3.如权利要求1所述的识别方法，其特征在于，所述拍照设备的设置位置根据以下条件中的至少一个确定：

各所述目标对象之间的相对位置关系；

所述参考图像中所述目标对象的数量；

所述参考图像中所述目标对象的尺寸；

所述拍照设备的拍摄角度。

4.如权利要求3所述的识别方法，其特征在于，所述目标对象为需要停入所述室外停车场中的车辆，所述拍照设备的设置位置满足以下要求：

设置高度不小于20米；

所述参考图像中所述目标对象的像素尺寸不小于60*70；

5.如权利要求1所述的识别方法，其特征在于，所述参考图像满足以下至少一个要求：

所述长边对应的像素数量大于960；

6.如权利要求1所述的识别方法，其特征在于，所述第一权重与所述第二权重的比值为10至20。

7.如权利要求6所述的识别方法，其特征在于，所述目标识别模型对应的损失函数还包括：类别的训练结果对应的第三权重，所述第三权重与所述第二权重的比值为5至10。

8.如权利要求1所述的识别方法，其特征在于，所述卷积神经网络模型包括多级卷积层，最后一级所述卷积层中所述目标对象占用的网格数量大于3*3，且最后一级所述卷积层的长边对应的网格数量大于60。

9.如权利要求1-8任一项所述的识别方法，其特征在于，所述目标对象为需要停入所述室外停车场中的车辆时，在根据所述识别结果，确定各所述子区域内的所述目标对象之后，还包括：

针对任一所述子区域执行以下过程：

判断所述子区域中是否标记有停车线；

10.一种目标对象的识别装置，其特征在于，应用于室外停车场，所述室外停车场所在区域包括至少一个待识别区域，所述待识别区域包括多个子区域，所述待识别区域对应设置有拍照设备；该识别装置包括：

11.一种目标对象的识别系统，其特征在于，包括：拍照设备、显示设备、以及如权利要求8所述的目标对象的识别装置；