CN109635768B

CN109635768B - 一种图像帧中停车位状态检测方法、系统及相关设备

Info

Publication number: CN109635768B
Application number: CN201811564828.4A
Authority: CN
Inventors: 李锐
Original assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Current assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2023-02-28
Anticipated expiration: 2038-12-20
Also published as: CN109635768A

Abstract

本发明实施例提供了一种图像帧中停车位状态检测方法、系统及相关设备，用于提高空闲停车位识别速度。本发明实施例方法包括：获取目标车位的车位图像；对所述车位图像进行尺寸缩放，生成图像金字塔；将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的所述目标车位处于无车状态。基于深度学习的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型实现了停车位无车状态的多级检测，有效提高了空闲停车位的准确率及检测速度。

Description

一种图像帧中停车位状态检测方法、系统及相关设备

技术领域

本发明涉及智能停车场领域，尤其涉及一种图像帧中停车位状态检测方法、系统及相关设备。

背景技术

随着大型购物商城的不断涌现，配套的停车场规模也日益庞大，人们在享受其便利的购物环境的同时，也要忍受着停车时车位难寻、购物后难寻爱车的烦恼。在此背景下，车位引导系统大面积在各大城市铺开，为客户在停车以及寻车上带来了便利。

而目前基于视频监控、计算机视觉和图像处理技术的检测方式大都是基于采集到的车位图像与预设的背景图像进行逐一匹配，根据匹配的结果判断是否有空闲车位。然而，基于固定的背景识别，往往识别的场景有限，进而导致识别精度有限，其次，背景图像的逐一匹配往往耗时较多。

发明内容

本发明实施例提供了一种图像帧中停车位状态检测方法、系统及相关设备，用于提高空闲停车位识别速度。

本发明实施例第一方面提供了一种图像帧中停车位状态检测方法，其特征在于，包括：

获取目标车位的车位图像；

对所述车位图像进行尺寸缩放，生成图像金字塔；

将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；

若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的所述目标车位处于无车状态。

可选的，作为一种可能的实施方式，本发明实施例中，所述将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，包括：

将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行第一次全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

根据得分值大于第一阈值的矩形框对应的回归值对各个矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合；

采用非极大值抑制NMS算法在所述窗口集合中筛选出目标窗口；

将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值。

可选的，作为一种可能的实施方式，本发明实施例中，所述获取目标车位的车位图像，包括：

从视频中截取图像帧，所述图像帧中至少包含一个车位图像；

根据预先设置的标注区域从所述图像帧中截取目标车位对应的区域作为所述目标车位的车位图像。

可选的，作为一种可能的实施方式，本发明实施例中的图像帧中停车位状态检测方法还包括：

在各个时段和各种天气条件下，采集目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片；

在所述第一类样本图片中标注出车头所在的目标区域；

计算各个所述第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以所述平均值为中心，确定所有标注框的宽高比值的取值范围，所述取值范围覆盖超过50％标注框的宽高比；

以所述取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在所述第一类图像中生成第一预置数量的正样本，所述正样本所在的区域与所述目标区域重叠比例不小于50％；

采用移位、缩放、改变亮度或添加噪声的方式在所述第一类图像中生成第二预置数量的部分车头样本，所述部分车头样本所在的区域与所述目标区域重叠比例大于30％，且小于50％；

在所述第一类图像或第二类图像中生成第三预置数量的负样本，所述负样本所在的区域与所述目标区域重叠比例小于20％；

将所述第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本作为第一训练样本，采用MTCNN模型中的Pnet网络对所述第一训练样本进行训练得到所述Pnet网络模型；

采用所述Pnet网络模型检测第一类样本图片及所述第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值；

从所述候选框中识别出虚检样本，所述虚检样本为得分值大于所述第一阈值，但与目标区域重叠比例小于20％的样本；

将所述第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对所述第二训练样本进行训练得到所述Rnet网络模型。

本发明实施例第二方面提供了一种停车位状态检测系统，其特征在于，包括：

获取模块，用于获取目标车位的车位图像；

缩放模块，用于对所述车位图像进行尺寸缩放，生成图像金字塔；

第一检测模块，用于将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；

第一判断模块，用于判断是否存在得分值大于第二阈值的目标窗口，若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的所述目标车位处于无车状态。

可选的，作为一种可能的实施方式，本发明实施例中，所述第一检测模块包括：

第一检测单元，用于将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行第一次全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

修正单元，用于根据得分值大于第一阈值的矩形框对应的回归值对各个矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合；

抑制单元，采用非极大值抑制NMS算法在所述窗口集合中筛选出目标窗口；

第二检测单元，用于将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值。

可选的，作为一种可能的实施方式，本发明实施例中，所述获取模块包括：

第一截取单元，用于从视频中截取图像帧，所述图像帧中至少包含一个车位图像；

第二截取单元，用于根据预先设置的标注区域从所述图像帧中截取目标车位对应的区域作为所述目标车位的车位图像。

可选的，作为一种可能的实施方式，本发明实施例中的停车位状态检测系统还包括：

采集模块，用于在各个时段和各种天气条件下，采集目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片；

标注模块，用于在所述第一类样本图片中标注出车头所在的目标区域；

计算模块，用于计算各个所述第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以所述平均值为中心，确定所有标注框的宽高比值的取值范围，所述取值范围覆盖超过50％标注框的宽高比；

样本选择模块，以所述取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在所述第一类图像或第二类图像中生成第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本，所述正样本所在的区域与所述目标区域重叠比例不小于50％，所述部分车头样本所在的区域与所述目标区域重叠比例大于30％，且小于50％，所述负样本所在的区域与所述目标区域重叠比例小于20％；

第一训练模块，用于将所述第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本作为第一训练样本，采用MTCNN模型中的Pnet网络对所述第一训练样本进行训练得到所述Pnet网络模型；

第二检测模块，采用所述Pnet网络模型检测第一类样本图片及所述第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值；

识别模块，从所述候选框中识别出虚检样本，所述虚检样本为得分值大于所述第一阈值，但与目标区域重叠比例小于20％的样本；

第二训练模块，将所述第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对所述第二训练样本进行训练得到所述Rnet网络模型。

本发明实施例第三方面提供了一种停车位状态检测设备，其特征在于，所述停车位状态检测设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如第一方面及第一方面中任一种可能的实施例中的步骤。

本发明实施例第四方面提供了一种停车位状态检测设备可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如第一方面及第一方面中任一种可能的实施例中的步骤。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中可以对获取到的目标车位的车位图像进行尺寸缩放，生成图像金字塔，并将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口、各个目标窗口对应的得分值，若不存在得分值大于第一阈值的目标窗口，则判定当前图像帧中的目标车位处于无车状态。基于深度学习的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型实现了图像帧中的停车位的多级检测，有效提高了空闲停车位的准确率无需背景图像的逐一匹配，有效提高了空闲停车位识别速度。

附图说明

图1为本发明实施例中一种图像帧中停车位状态检测方法的一个实施例示意图；

图2为本发明实施例中的Pnet网络模型的一个可选的结构示意图；

图3为本发明实施例中一种图像帧中停车位状态检测方法的另一个实施例示意图；

图4为本发明实施例中的Rnet网络模型的一个可选的结构示意图；

图5为本发明实施例中一种图像帧中停车位状态检测方法的另一个实施例示意图；

图6为本发明实施例中一种停车位状态检测系统的一个实施例示意图；

图7为本发明实施例中一种停车位状态检测系统的另一个实施例示意图；

图8为本发明实施例中一种停车位状态检测系统的另一个实施例示意图；

图9为本发明实施例中一种停车位状态检测设备的一个实施例示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例采用了多任务卷积神经网络MTCNN模型，为了便于理解，先对MTCNN模型进行简单说明。常用的MTCNN模型由3个网络结构组成(Pnet、Rnet、Onet)。ProposalNetwork(Pnet)：该网络结构主要获得了待识别区域的候选窗口和边界框的回归向量。并用该边界框做回归，对候选窗口进行校准，然后通过非非极大值抑制(NMS)来合并高度重叠的候选框。Refine Network(Rnet)：该网络结构还是通过边界框回归和NMS来去掉那些虚检(检测结果与实际不符)区域，该网络结构和Pnet网络结构有差异，多了一个全连接层，所以会取得更好的抑制虚检的作用。Output Network(Onet)：该层比Rnet层又多了一层卷基层，所以处理的结果会更加精细，其作用和R-Net层作用一样。

为了便于理解，下面对本发明实施例中的具体流程进行描述，请参阅图1，本发明实施例中一种图像帧中停车位状态检测方法的一个实施例可包括：

101、获取目标车位的车位图像；

本发明实施例中，停车位状态检测设备可以基于停车位附近安装的摄像机间接获取目标车位的车位图像，也可以基于自身的摄像功能直接获取目标车位的车位图像，具体的获取方式，此处不做限定。

102、对车位图像进行尺寸缩放，生成图像金字塔；

实际运用中，停车位状态检测设备获取到的车位图像的尺寸及像素往往较大，例如1080P的车位图像，过大的像素往往会使得检测的速度降低。为了提高检测速度，本发明实施例中，停车位状态检测设备可以对车位图像进行尺寸缩放，生成一系列的缩放图像，组成图像金字塔，金字塔最顶层的图像需要满足Pnet网络模型的输入条件即可停止缩放，具体的缩放过程可以根据用户的需求进行合理的设置，具体此处不做限定。

例如，假设需要检测的车位框为540x 540像素，需要检测的车头为360x360，那么输入的540x 540像素图像可以先缩放为27x 27像素，第二层图像宽度可以为27x 0.7，高度为27x 0.7像素。经过2层金字塔后，就可以满足Pnet网络模型的输入条件。

103、将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；

在获取到目标车位的金字塔图像之后，可以将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，依次经过深度学习的Pnet网络模型与Rnet网络模型可以在各个图像中分别生成车头候选区域对应的目标窗口、各个目标窗口对应的得分值及回归值。为了提高检测速度，相对于现有的MTCNN模型，本发明实施例中不进行MTCNN模型中的Onet(Output Network)层检测。

104、若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的目标车位处于无车状态。

在经过Pnet网络模型与过Rnet网络模型的检测之后，停车位状态检测设备可以基于各个车头候选区域目标窗口的得分值判断目标车位是否存在车头，存在得分值大于第二阈值的目标窗口则说明当前图像帧中的目标车位可能有车，目标车位处于被占用状态；若不存在得分值大于第一阈值的目标窗口，则说明当前图像帧中的目标车位处于无车状态。具体的第二阈值可以是0.6至1之间的任意实数，具体此处不做限定。

本发明实施例中可以对获取到的目标车位的车位图像进行尺寸缩放，生成图像金字塔，并将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口、各个目标窗口对应的得分值，若不存在得分值大于第二阈值的目标窗口，则判定目标车位处于无车状态。基于深度学习的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型实现了停车位无车状态的多级检测，有效提高了空闲停车位的准确率，无需背景图像的逐一匹配，有效提高了空闲停车位识别速度。

在上述图1所示的实施例的基础上，基于Pnet网络模型的检测结果，若存在得分值大于第一阈值的矩形框则说明目标车位可能有车，也可能没车(即，出现虚检)，为了提高检测的准确率，需要对检测流程进行进一步的优化，请参阅图2，在上述图1所示的实施例的基础上，本发明实施例中一种图像帧中停车位状态检测方法的另一个实施例可包括：

201、获取目标车位的车位图像；

可选的，作为一种可能的实施方式，本发明实施例中的停车位状态检测设备可以从视频中截取图像帧，图像帧中至少包含一个车位图像；根据预先设置的标注区域从图像帧中截取目标车位对应的区域作为目标车位的车位图像。

例如，本发明实施例中可以采用一个摄像头同时录制三个停车位上的图像，然后根据预先设置的标注区域从图像帧中截取目标车位对应的区域作为目标车位的车位图像。可以理解的是，实际运用中还可以根据用户需求一个摄像头同时录制两个或一个停车位上的图像，具体此处不做限定。

202、对车位图像进行尺寸缩放，生成图像金字塔；

本发明实施例中的步骤201至202中描述的内容与上述图1所示的实施例中的步骤101至102中描述的内容类似，具体请参阅步骤101至102，此处不做赘述。

203、将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

示例性的，请参阅图3，图3为本发明实施例中的Pnet网络模型的一个可选的结构示意图。车头检测的Pnet输入的是18x 18的彩色图像，其具体的图像处理流程可以包括：首先，三个通道(RGB)的输入经过第一个卷积层(Conv1)，卷积核的大小为3x 3，得到10个16x16的feature map。然后再经过第一个池化层(Pooling1，窗口的大小为2x 2)，输出为10个8x 8的feature map。接着经过第二个卷积层(Conv2)，卷积核的大小为3x 3，得到16个6x6的feature map。再经过第二个池化层(Pooling1，窗口的大小为2x 2)，输出为16个3x 3的feature map。再经过第三个卷积层(Conv3)，卷积核的大小为3x 3，得到32个1x 1的feature map。最后经过卷积层(Conv4-1)，卷积核的大小为1x 1，得到两个分类得分(一个是正样本得分，一个是负样本得分)。经过卷积层(Conv4-2)，卷积核的大小为1x 1，得到四个回归值。

可以理解的是，上述图3所示的Pnet网络模型的结构示意图仅仅是实例性的，实际运用中还可以根据用户的需求合理的调整Pnet网络模型的内部结构，例如可以设置卷积核的大小为5x 5，具体此处不做限定。

204、根据得分值大于第一阈值的矩形框对应的回归值对各个矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合，并采用非极大值抑制NMS算法在窗口集合中筛选出目标窗口；

在经过Pnet网络模型的检测之后，停车位状态检测设备可以基于各个车头候选区域矩形框的得分值判断目标车位是否存在车头，存在得分值大于第一阈值的矩形框则说明目标车位可能有车根据得分值大于第一阈值的矩形框对应的回归值对各个矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合，并采用非极大值抑制NMS算法在窗口集合中筛选出目标窗口。具体的第一阈值可以是0.6至1之间的任意实数，具体此处不做限定。

存在得分值大于第一阈值的矩形框则说明目标车位可能有车，需要进一步识别。本发明实施例中采用MTCNN模型中的Rnet网络模型对得分值大于第一阈值的矩形框进行进一步识别。在将矩形框输入Rnet网络模型之前，需要根据回归值对得分值大于第一阈值的矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合，并采用非极大值抑制NMS算法在窗口集合中筛选出当前得分值最高的候选窗口作为一个目标窗口，并删除与该得分值最高的候选窗口的重叠比例超过预置阈值的窗口，然后对余下的窗口再次选取当前得分值最高的候选窗口作为一个目标窗口，并删除与该得分值最高的候选窗口的重叠比例超过预置阈值的窗口，循环上述删除的过程，直到窗口集合中不再存在候选窗口为止，这样就完成了非极大值抑制，筛选出一个或多个目标窗口。

205、将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值；

得到多个目标窗口之后，可以变换各个目标窗口进行尺寸，以满足Rnet网络模型的输入条件，并将尺寸变换之后的窗口输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值。

示例性的，请参阅图4，图4为本发明实施例中的Rnet网络模型的一个可选的结构示意图。车头检测的Rnet输入的是36x 36的灰度图像。其具体的图像处理流程可以包括：首先经过第一个卷积层(Conv1)，卷积核的大小为3x 3，得到28个34x 34的feature map。然后再经过第一个池化层(Pooling1，窗口的大小为3x 3，stride为2)，输出为28个17x 17的feature map。接着经过第二个卷积层(Conv2)，卷积核的大小为3x 3，得到48个15x 15的feature map。第四步经过第二个池化层(Pooling2，窗口的大小为3x 3，stride为2)，输出为48个7x 7的feature map。第五步经过第三个卷积层(Conv3)，卷积核的大小为2x 2，得到64个6x 6的feature map。第六步经过第三个池化层(Pooling3，窗口的大小为3x 3，stride为2)，输出为64个3x 3的feature map。第七步经过第一个全连接层(fc1)，得到128维的特征。第八步，经过全连接层fc2-1，得到两个分类得分(一个是正样本得分，一个是负样本得分)以及经过全连接层fc2-2，得到四个回归值。

可以理解的是，上述图4所示的Rnet网络模型的结构示意图仅仅是实例性的，实际运用中还可以根据用户的需求合理的调整Rnet网络模型的内部结构，例如可以设置卷积核的大小为5x 5，具体此处不做限定。

206、判断是否存在得分值大于第二阈值的目标窗口；

在经过Rnet网络模型的检测之后，停车位状态检测设备可以基于各个目标窗口的得分值判断目标车位是否存在车头，存在得分值大于第二阈值的矩形框则执行步骤208，输出判断结果为目标车位有车；若不存在得分值大于第二阈值的矩形框，则说明目标车位处于无车状态，可以执行步骤207，判定目标车位处于无车状态。

207、判定当前图像帧中的目标车位处于无车状态；

若不存在得分值大于第二阈值的目标窗口，则判定目标车位处于无车状态，可选的，判断一个车位是否空闲，必须综合至少两帧的结果判断目标车位的最终状态。例如，可以设置至少连续3帧图像中的目标车位处于无车状态才可以判定目标车位当前处于无车状态，进一步的可以基于车位引导系统向用户所属的客户端发送车位引导信息，指引用户找到无车占用的目标车位。可以理解的是，实际运用中，可以综合至少两帧的结果判断目标车位的最终状态，具体的判断逻辑此处不做限定。

208、判定当前图像帧中的目标车位处于占用状态。

本发明实施例中可以对获取到的目标车位的车位图像进行尺寸缩放，生成图像金字塔，并将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口、各个目标窗口对应的得分值，若不存在得分值大于第一阈值的目标窗口，则判定目标车位处于无车状态。基于深度学习的多任务卷积神经网络中的Pnet网络模型与Rnet网络模型实现了停车位无车状态的检测，无需背景图像的逐一匹配，有效提高了空闲停车位识别速度。

在上述图1至图4所示的实施例的基础上，下面将对本发明实施例中的多任务卷积神经网络MTCNN模型中的Pnet网络模型及Rnet网络模型的训练过程进行描述。请参阅图5，本发明实施例中一种图像帧中停车位状态检测方法的另一个实施例中还可以进一步包括MTCNN模型的训练，具体的MTCNN模型的训练过程可以包括：

501、在各个时段和各种天气条件下，采集目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片；

为了覆盖更多的识别场景，本发明实施例中的停车位状态检测设备可以在各个时段和各种天气条件下，采集目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片。

502、在第一类样本图片中标注出车头所在的目标区域；

对于第一类样本图片可以基于人工的操作，在第一类样本图片中标注出车头所在的目标区域。

503、计算各个第一类样本图片中车头的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以平均值为中心，确定所有标注框的宽高比值的取值范围；

在标注出车头所在的目标区域之后，就可以基于矩形框计算各个第一类样本图片中车头的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以平均值为中心，上下浮动一定范围就可以确定生成样本的宽高比的范围，确定所有生成样本的宽高比值的取值范围。具体的，该取值范围能覆盖大部分标注框的宽高比，该取值范围覆盖至少超过50％标注框的宽高比。

504、以取值范围之间的任一比值作为需要生成样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在在第一类图像中生成预置数量的正样本、部分车头样本及负样本；

在计算出各个第一类样本图像中的车头的宽度与高度的比值范围之后，在宽高比范围内随机选取一个宽高比的值，在全图范围内采用移位、缩放、改变亮度或添加噪声的方式生成样本区域，具体包括第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本。其中，正样本所在的区域与目标区域重叠比例不小于50％；部分车头样本所在的区域与目标区域重叠比例大于30％，且小于50％；负样本所在的区域与目标区域重叠比例小于20％。其中，可以设置正样本的数量为第一预置数量A，部分车头样本的数量为第二预置数量B，负样本的数量为第三预置数量C，可选的，可以设置A：B：C的比例为2：1：1，例如，可以标注5000张正样本，2500张部分车头样本，2500张负样本。具体的样本数量可以根据实际需求进行合理的设置，具体此处不做限定。

505、将第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本作为第一训练样本，采用MTCNN模型中的Pnet网络对第一训练样本进行训练得到Pnet网络模型；

在获取到第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本之后，可以将这些样本作为第一训练样本，采用MTCNN模型中的Pnet网络对第一训练样本进行训练得到Pnet网络模型，具体的MTCNN模型中的Pnet网络的实现过程为现有技术，此处不做赘述。

506、采用Pnet网络模型检测第一类样本图片及第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值；

单独的Pnet网络模型对样本进行检测时会出现检测结果与实际结果不符的虚检，有必要对虚检进行识别和过滤。在完成Pnet网络模型训练之后，可以采用Pnet网络模型检测第一类样本图片及第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值。

507、从候选框中识别出虚检样本；

停车位状态检测设备可以根据各个候选框的得分，识别出虚检样本，虚检样本为得分值大于第一阈值，但与目标区域重叠比例小于20％的候选框样本。

508、将第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对第二训练样本进行训练得到Rnet网络模型。

停车位状态检测设备可以将第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对第二训练样本进行训练得到Rnet网络模型。具体的MTCNN模型中的Rnet网络的实现过程为现有技术，此处不做赘述。

本发明实施例中，可以基于各个时段和各种天气条件下，目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片，基于这些样本图片进行样本抽取，提高了样本所在的场景的丰富性，使得训练之后的模型可以识别更多的场景下的车头，提高了识别的准确率。

可以理解的是，在本发明的各种实施例中，上述各步骤的序号的大小并不意味着执行顺序的先后，各步骤的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

本发明实施例中还提供了一种用于实现上述图像帧中停车位状态检测方法的系统，请参阅图6，本发明实施例中一种停车位状态检测系统的一个实施例可包括：

获取模块601，用于获取目标车位的车位图像；

缩放模块602，用于对车位图像进行尺寸缩放，生成图像金字塔；

第一检测模块603，用于将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；

第一判断模块604，用于判断是否存在得分值大于第二阈值的目标窗口，若不存在得分值大于第二阈值的目标窗口，则判定目标车位处于无车状态。

可选的，作为一种可能的实施方式，请参阅图7，本发明实施例中停车位状态检测系统中的第一检测模块603包括：

第一检测单元6031，用于将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行第一次全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

修正单元6032，用于根据得分值大于第一阈值的矩形框对应的回归值对各个矩形框进行修正生成对应的候选窗口，所有的候选窗口形成窗口集合；

抑制单元6033，采用非极大值抑制NMS算法在窗口集合中筛选出目标窗口；

第二检测单元6034，用于将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值。

可选的，作为一种可能的实施方式，本发明实施例中获取模块601包括：

第一截取单元6011，用于从视频中截取图像帧，图像帧中至少包含一个车位图像；

第二截取单元6012，用于根据预先设置的标注区域从图像帧中截取目标车位对应的区域作为目标车位的车位图像。

可选的，作为一种可能的实施方式，请参阅图8本发明实施例中停车位状态检测系统还包括：

采集模块605，用于在各个时段和各种天气条件下，采集目标车位有车情况下的第一类样本图片及目标车位无车情况下的第二类样本图片；

标注模块606，用于在第一类样本图片中标注出车头所在的目标区域；

计算模块607，用于计算各个第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以平均值为中心，确定所有标注框的宽高比值的取值范围，取值范围覆盖超过50％标注框的宽高比；

样本选择模块608，以取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在第一类图像或第二类图像中生成第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本，正样本所在的区域与目标区域重叠比例不小于50％，部分车头样本所在的区域与目标区域重叠比例大于30％，且小于50％，负样本所在的区域与目标区域重叠比例小于20％；

第一训练模块609，用于将第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本作为第一训练样本，采用MTCNN模型中的Pnet网络对第一训练样本进行训练得到Pnet网络模型；

第二检测模块610，采用Pnet网络模型检测第一类样本图片及第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值；

识别模块611，从候选框中识别出虚检样本，虚检样本为得分值大于第一阈值，但与目标区域重叠比例小于20％的样本；

第二训练模块612，将第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对第二训练样本进行训练得到Rnet网络模型。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

上面从功能化的角度对本申请实施例中的数据处理系统进行了描述，下面从硬件处理的角度对本申请实施例中的停车位状态检测设备进行描述。

本申请实施例还提供了一种停车位状态检测设备9，如图9所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。参考图9，停车位状态检测设备9包括：电源910、存储器920、处理器930、有线或无线网络接口940以及存储在存储器中并可在处理器上运行的计算机程序。处理器执行计算机程序时实现上述各个图像帧中停车位状态检测方法实施例中的步骤，例如图1所示的步骤101至104。或者，处理器执行计算机程序时实现上述各装置实施例中各模块或单元的功能。

本申请实施例中的一些实施例中，处理器用于执行存储器中存储的计算机程序时实现如下步骤：

获取目标车位的车位图像；

对车位图像进行尺寸缩放，生成图像金字塔；

将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，在各个图像中分别生成车头候选区域对应的目标窗口及各个目标窗口对应的得分值；

若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的目标车位处于无车状态。

可选的，本申请的一些实施例中，处理器还可以用于实现如下步骤：

将图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

采用非极大值抑制NMS算法在窗口集合中筛选出目标窗口；

从视频中截取图像帧，图像帧中至少包含一个车位图像；

根据预先设置的标注区域从图像帧中截取目标车位对应的区域作为目标车位的车位图像。

在第一类样本图片中标注出车头所在的目标区域；

计算各个第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以平均值为中心，确定所有标注框的宽高比值的取值范围，取值范围覆盖超过50％标注框的宽高比；

以取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在第一类图像中生成第一预置数量的正样本，正样本所在的区域与目标区域重叠比例不小于50％；

采用移位、缩放、改变亮度或添加噪声的方式在第一类图像中生成第二预置数量的部分车头样本，部分车头样本所在的区域与目标区域重叠比例大于30％，且小于50％；

在第一类图像或第二类图像中生成第三预置数量的负样本，负样本所在的区域与目标区域重叠比例小于20％；

将第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本作为第一训练样本，采用MTCNN模型中的Pnet网络对第一训练样本进行训练得到Pnet网络模型；

采用Pnet网络模型检测第一类样本图片及第二类样本图片生成车头候选区域对应的候选框、各个候选框对应的得分值；

从候选框中识别出虚检样本，虚检样本为得分值大于第一阈值，但与目标区域重叠比例小于20％的样本；

将第一预置数量的正样本、虚检样本及第二预置数量的部分车头样本作为第二训练样本，采用MTCNN模型中的Rnet网络对第二训练样本进行训练得到Rnet网络模型。

示例性的，计算机程序可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器中，并由处理器执行。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在计算机装置中的执行过程。

本领域技术人员可以理解，图9中示出的结构并不构成对停车位状态检测设备9的限定，停车位状态检测设备9可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，例如计算机装置还可以包括输入输出设备、总线等。

所称处理器可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，处理器是计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。

存储器可用于存储计算机程序和/或模块，处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现计算机装置的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本申请还提供了一种停车位状态检测设备可读存储介质，该停车位状态检测设备可读存储介质上存储有计算机程序，计算机程序被处理器执行时，可以实现如下步骤：

获取目标车位的车位图像；

对车位图像进行尺寸缩放，生成图像金字塔；

采用非极大值抑制NMS算法在窗口集合中筛选出目标窗口；

从视频中截取图像帧，图像帧中至少包含一个车位图像；

在第一类样本图片中标注出车头所在的目标区域；

采用预选框在第一类图像或第二类图像中生成第三预置数量的负样本，负样本所在的区域与目标区域重叠比例小于20％；

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种图像帧中停车位状态检测方法，其特征在于，包括：

获取目标车位的车位图像；

所述获取目标车位的车位图像包括：

根据预先设置的标注区域从所述图像帧中截取目标车位对应的区域作为所述目标车位的车位图像；

对所述车位图像进行尺寸缩放，生成图像金字塔；

所述将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型与Rnet网络模型中进行检测，包括：

将所述图像金字塔中的各个图像分别输入预置的多任务卷积神经网络MTCNN模型中的Pnet网络模型中进行全图检测，在各个图像中分别生成车头候选区域对应的矩形框、各个矩形框对应的得分值及回归值；

将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值；

若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的所述目标车位处于无车状态；

所述方法还包括：

在所述第一类样本图片中标注出车头所在的目标区域；

计算各个所述第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以所述平均值为中心，确定所有标注框的宽高比值的取值范围，所述取值范围覆盖超过50%标注框的宽高比；

以所述取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在所述第一类样本图片中生成第一预置数量的正样本，所述正样本所在的区域与所述目标区域重叠比例不小于50%；

采用移位、缩放、改变亮度或添加噪声的方式在所述第一类样本图片中生成第二预置数量的部分车头样本，所述部分车头样本所在的区域与所述目标区域重叠比例大于30%，且小于50%；

在所述第一类样本图片或所述第二类样本图片中生成第三预置数量的负样本，所述负样本所在的区域与所述目标区域重叠比例小于20%；

从所述候选框中识别出虚检样本，所述虚检样本为得分值大于所述第一阈值，但与目标区域重叠比例小于20%的样本；

2.一种停车位状态检测系统，其特征在于，包括：

获取模块，用于获取目标车位的车位图像；

所述获取模块包括：

第二截取单元，用于根据预先设置的标注区域从所述图像帧中截取目标车位对应的区域作为所述目标车位的车位图像

所述第一检测模块包括：

第二检测单元，用于将各个目标窗口进行尺寸变换之后输入MTCNN模型中的Rnet网络模型中进行检测，生成各个目标窗口对应的得分值；

第一判断模块，用于判断是否存在得分值大于第二阈值的目标窗口，若不存在得分值大于第二阈值的目标窗口，则判定当前图像帧中的所述目标车位处于无车状态；

所述系统还包括：

计算模块，用于计算各个所述第一类样本图片中标注框的宽度与高度的比值，并计算所有标注框的宽高比值的平均值，并以所述平均值为中心，确定所有标注框的宽高比值的取值范围，所述取值范围覆盖超过50%标注框的宽高比；

样本选择模块，以所述取值范围之间的任一比值作为需要生成的样本的宽度与高度的比值，采用移位、缩放、改变亮度或添加噪声的方式在所述第一类样本图片或所述第二类样本图片中生成第一预置数量的正样本、第二预置数量的部分车头样本及第三预置数量的负样本，所述正样本所在的区域与所述目标区域重叠比例不小于50%，所述部分车头样本所在的区域与所述目标区域重叠比例大于30%，且小于50%，所述负样本所在的区域与所述目标区域重叠比例小于20%；

识别模块，从所述候选框中识别出虚检样本，所述虚检样本为得分值大于所述第一阈值，但与目标区域重叠比例小于20%的样本；

3.一种停车位状态检测设备，其特征在于，所述停车位状态检测设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1中所述方法的步骤。

4.一种停车位状态检测设备可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1中所述方法的步骤。