CN115527074B

CN115527074B - 一种车辆检测框的生成方法、生成装置及计算机设备

Info

Publication number: CN115527074B
Application number: CN202211503146.9A
Authority: CN
Inventors: 范文洋
Original assignee: Shenzhen Yishi Huolala Technology Co Ltd
Current assignee: Shenzhen Yishi Huolala Technology Co Ltd
Priority date: 2022-11-29
Filing date: 2022-11-29
Publication date: 2023-03-07
Anticipated expiration: 2042-11-29
Also published as: CN115527074A

Abstract

本申请公开了一种车辆检测框的生成方法。车辆检测框的生成方法包括：获取待检测的二维图像；基于预先训练的检测模块，检测二维图像的分类分数及检测框参数；基于分类分数判断二维图像中是否包括车辆特征；若是，基于检测框参数生成车辆特征的三维检测框。本申请还公开了一种车辆检测框的生成装置、计算机设备及计算机可读存储介质。基于预先训练的检测模块检测二维图像的分类分数及检测框参数，在通过分类分数判断二维图像中存在车辆特征时，利用检测框参数生成车辆特征的三维检测框，三维检测框可以为用户提供车辆特征的更多信息，提升用户体验。

Description

一种车辆检测框的生成方法、生成装置及计算机设备

技术领域

本申请涉及车辆检测技术领域，特别涉及一种车辆检测框的生成方法、车辆检测框的生成装置、计算机设备及计算机可读存储介质。

背景技术

车辆检测在各种业务场景应用广泛，特别是在用户端，通过用户对车辆进行拍摄，并检测车辆目标，传给后续流程处理。在使用时，需要用户用手机实时地检测目标车辆，并在拍摄屏幕上呈现出结果。车辆检测通常是利用目标检测手段检测到车辆目标后，将车辆目标用一个矩形框框起来。然而，这种方式并不能体现车辆的空间信息和方向信息等信息，导致用户使用的体验较差。

发明内容

为解决上述背景技术中的至少一个技术问题，本申请实施方式提供了一种车辆检测框的生成方法、车辆检测框的生成装置、计算机设备及计算机可读存储介质。

本申请实施方式的车辆检测框的生成方法包括：

获取待检测的二维图像；

基于预先训练的检测模块，检测所述二维图像的分类分数及检测框参数；

基于所述分类分数判断所述二维图像中是否包括车辆特征；

若是，基于所述检测框参数生成所述车辆特征的三维检测框。

在某些实施方式中，基于所述分类分数判断所述二维图像中是否包括车辆特征，包括：

判断所述分类分数是否大于预设的分数阈值；

若是，则所述二维图像包括车辆特征；及

若否，则所述二维图像不包括车辆特征。

在某些实施方式中，在获取待检测的二维图像前，所述生成方法还包括：训练检测模块；所述训练检测模块，包括：

获取训练二维图像，所述训练二维图像中包括训练车辆特征；

在所述训练二维图像中标注所述训练车辆特征的训练检测框参数；及

将所述训练二维图像及所述训练检测框参数作为输入训练得到所述检测模块。

在某些实施方式中，所述训练检测框参数包括：

包围所述训练车辆特征的矩形框、所述训练车辆特征的车辆基面、所述训练车辆特征的车前截断距离、所述训练车辆特征的车前中点、所述训练车辆特征的方向角。

在某些实施方式中，所述检测框参数包括：

所述车辆特征的车辆基面、所述车辆特征的方向角、所述车辆特征的矩形框、所述车辆特征的透视系数。

在某些实施方式中，基于所述检测框参数生成所述车辆特征的三维检测框，包括：

基于所述车辆特征的车辆基面，计算所述车辆特征的车辆基面的中点坐标；

基于所述车辆特征的车辆基面及所述车辆特征的透视系数，计算所述车辆特征的前车框的宽和高；

基于所述中点坐标及所述车辆特征的方向角定义一射线，所述射线与所述车辆特征的矩形框交于一特征点；

以所述特征点为所述前车框的高的中点，作所述车辆特征的前车框；及

基于所述车辆特征的车辆基面及所述前车框，生成所述车辆特征的三维检测框。

在某些实施方式中，所述检测模块的模型骨架为ResNet网络。

本申请实施方式的车辆检测框的生成装置包括：

获取模块，所述获取模块用于获取待检测的二维图像；

预先训练的检测模块，所述检测模块用于检测所述二维图像的分类分数及检测框参数；

判断模块，所述判断模块用于基于所述分类分数判断所述二维图像中是否包括车辆特征；

生成模块，所述生成模块用于若包括车辆特征，基于所述检测框参数生成所述车辆特征的三维检测框。

本申请实施方式的计算机设备包括：一个或多个处理器；存储器；及一个或多个计算机程序，其中，所述一个或多个计算机程序被存储在所述存储器中，并被配置为由所述一个或多个处理器执行，所述一个或多个计算程序配置用于：执行本申请任一实施方式所述的车辆检测框的生成方法。

本申请实施方式的非易失性计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，使得所述处理器执行本申请任一实施方式所述的车辆检测框的生成方法。

本申请实施方式的车辆检测框的生成方法、车辆检测框的生成装置、计算机设备及计算机可读存储介质中，基于预先训练的检测模块检测二维图像的分类分数及检测框参数，在通过分类分数判断二维图像中存在车辆特征时，利用检测框参数生成车辆特征的三维检测框，三维检测框可以为用户提供车辆特征的更多信息，提升用户体验。

本申请实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点可以从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：

图1为本申请第一实施方式的车辆检测框的生成方法的流程示意图；

图2为本申请第二实施方式的车辆检测框的生成方法的流程示意图；

图3为本申请第三实施方式的车辆检测框的生成方法的流程示意图；

图4为本申请第四实施方式的训练二维图像的示意图；

图5为本申请第五实施方式的检测模块的模型结构示意图；

图6为本申请第六实施方式的车辆检测框的生成方法的流程示意图；

图7为本申请第七实施方式的三维检测框的示意图；

图8为本申请第八实施方式的车辆检测框的生成装置的模块示意图；

图9为本申请第九实施方式的车辆检测框的生成装置的模块示意图；

图10为本申请某些实施方式的计算机可读存储介质与处理器通信的示意图；

图11为本申请某些实施方式的计算机设备的示意图。

具体实施方式

下面详细描述本申请的实施方式，所述实施方式的示例在附图中示出，其中，相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请的实施方式，而不能理解为对本申请的实施方式的限制。

请参阅图1，图1为本申请第一实施方式的车辆检测框的生成方法的流程示意图，车辆检测框的生成方法包括步骤：

01：获取待检测的二维图像；

02：基于预先训练的检测模块，检测二维图像的分类分数及检测框参数；

03：基于分类分数判断二维图像中是否包括车辆特征；

04：若是，基于检测框参数生成车辆特征的三维检测框。

本申请实施方式的车辆检测框的生成方法中，基于预先训练的检测模块检测二维图像的分类分数及检测框参数，在通过分类分数判断二维图像中存在车辆特征时，利用检测框参数生成车辆特征的三维检测框，三维检测框可以为用户提供车辆特征的更多信息，提升用户体验。

具体地，步骤01中，获取待检测的二维图像，该二维图像可以是由单目相机拍摄的二维图像，该单目相机可以是行车记录仪、手机、平板、智能手表等设备拍摄的二维图像，在此不作限制。

步骤02中，基于预先训练的检测模块，检测二维图像的分类分数及检测框参数，其中，检测模块为预先基于人工智能训练得到的模块，再将检测模块导入到终端内，或者导入到与终端连接的服务器中进行使用。分类分数用于判断二维图像中是否包括预设的目标特征、检测框参数用于作出目标特征的三维检测框。

步骤03中，基于分类分数判断二维图像中是否包括车辆特征，可以理解，二维图像中不一定包括车辆特征，在生成三维检测框前，需要先确定二维图像中是否具有车辆特征。其中，车辆特征可以指二维图像中包括完整的车辆的图像、或者包括一定比例的车辆的图像（例如80%等）、或者包括一些必要的车辆的部位的图像（例如车头及车尾等），车辆特征的具体定义可以依据实际需求进行设定，在此不作限制。

步骤04中，若二维图像中包括车辆特征，则基于检测框参数生成车辆特征的三维检测框，需要说明的是，三维检测框为在二维图像中显示的裸眼3D效果的检测框，并不需要将二维图像转化为三维图像，也不需要获取二维图像中特征的深度信息。通过显示三维检测框，体现车辆特征的空间信息，提升显示效果，同时，不需要对车辆特征的深度信息进行提取，对于大范围的手机用户而言，只需要利用一个摄像头进行拍摄，就可以在手机上看到三维效果，大大地提升了用户体验。

当然，若二维图像中不包括车辆特征，则不需要生成三维检测框，可以继续实施步骤01。

请参阅图2，图2为本申请第二实施方式的车辆检测框的生成方法的流程示意图，在某些实施方式中，步骤03：基于分类分数判断二维图像中是否包括车辆特征，包括：

031：判断分类分数是否大于预设的分数阈值；

032：若是，则二维图像包括车辆特征；及

033：若否，则二维图像不包括车辆特征。

具体地，检测模块检测得到的分类分数可以是一个在一定范围内的数字，例如为大于0且小于1的数字，分类分数越大，表示二维图像中包括车辆特征的可能性越大，分类分数越小，表示二维图像中包括车辆特征的可能性越小。分数阈值为预先设定的一个定值，通过判断该分类分数与分数阈值之间的大小关系，可以判断二维图像中是否包括车辆特征。若分类分数大于分数阈值，则判断二维图像中包括车辆特征，若分类分数小于分数阈值，则判断二维图像中不包括车辆特征。

通过分类分数与分数阈值之间的大小关系，容易判断二维图像中是否包括车辆特征。

请参阅图3，图3为本申请第三实施方式的车辆检测框的生成方法的流程示意图，在某些实施方式中，在实施步骤01之前，生成方法还包括步骤05：训练检测模块。步骤05：训练检测模块包括步骤：

051：获取训练二维图像，训练二维图像中包括训练车辆特征；

052：在训练二维图像中标注训练车辆特征的训练检测框参数；及

053：将训练二维图像及训练检测框参数作为输入训练得到检测模块。

具体地，步骤051中，获取训练二维图像，训练二维图像中包括训练车辆特征，该训练二维图像可以是终端实时获取的，也可以是从图像资源库中挑选的，在此不作限制。请结合图4，图4为本申请第四实施方式的训练二维图像的示意图，图4中不带箭头的实线所示为训练二维图像中的车辆特征V。

步骤052中，在训练二维图像中标注训练车辆特征的训练检测框参数，可以通过人工的方式标注训练检测框参数，标注好的训练检测框参数可以作为训练的输入以对检测模块进行训练。

在一个例子中，训练检测框参数包括：包围训练车辆特征的矩形框、训练车辆特征的车辆基面、训练车辆特征的车前截断距离、训练车辆特征的车前中点、训练车辆特征的方向角。其中，训练车辆特征的矩形框为包围训练车辆特征的最小矩形框，训练车辆特征的车辆基面包含基面的宽高信息及中心点坐标，训练车辆特征的车前中点为车辆特征前部分的竖直方向的中点，训练车辆特征的方向角为车辆基面中心点与车前中点的连线与水平线的夹角，训练车辆特征的车前截断距离为车辆轮廓与矩形框边线交点之间的距离。

请结合图4所示的例子中，其中，训练车辆特征的矩形框为A、训练车辆特征的车辆基面为B、车辆基面中心点C、训练车辆特征的车前截断距离为D、训练车辆特征的车前中点为E、训练车辆特征的方向角为F。最终得到标注数据信息[(x1,y1),(x1,y2), (bx1,by2),(bx2,by2), (xc, yc), (fxc,fyc), alpha, l]。其中(x1,y1)和(x2,y2)为训练车辆特征的矩形框的左上角和右下角坐标，表示矩形框信息。(bx1,by2)和(bx2,by2)为车辆基面框的左上角和右下角坐标。(xc,yc)为车辆基面中心点坐标。(fxc,fyc)为车前中点坐标。alpha为方向角，l为车前截断距离。

步骤053中，将训练二维图像及训练检测框参数作为输入训练得到检测模块，其中，训练二维图像可以作为检测输入，检测框参数可以作为检测结果进行训练。

具体地，在一个例子中，训练二维图像经过ResNet（Residual Neural Network）基础骨架模型得到深度信息的提取。然后在分别经过不同的卷积分支，得到对应功能的输出特征图。特征图每个点都对应着原训练二维图像的特定区域，表示训练二维图像这个点位置的训练车辆特征信息。每个点位置的输出经过sigmoid算子处理得到区间为（0，1）的输出，对应输入图像尺寸的比例。比如对于车辆基面的（x1,y1）的结果，可以根据“分支输出-》sigmoid-》输出结果*原图尺寸-》（x1,y1）。

通过车前截断距离与车辆基面高度的比值得到透视系数的标签。最终车辆基面，矩形框和方向角用L1 loss进行梯度下降。透视系数与类别分类使用交叉熵Loss进行回归。模型骨架采用常见的ResNet等网络，对输入的训练二维图像进行下采样，得到输出特征图。利用输出特征图分别在通过分支卷积网络得到不同分支的输出。检测模块的模型结构如图5所示，图5为本申请第五实施方式的检测模块的模型结构示意图。

请参阅图6，图6为本申请第六实施方式的车辆检测框的生成方法的流程示意图，在某些实施方式中，步骤04：基于检测框参数生成车辆特征的三维检测框，包括步骤：

041：基于车辆特征的车辆基面，计算车辆特征的车辆基面的中点坐标；

042：基于车辆特征的车辆基面及车辆特征的透视系数，计算车辆特征的前车框的宽和高；

043：基于中点坐标及车辆特征的方向角定义一射线，射线与车辆特征的矩形框交于一特征点；

044：以特征点为前车框的高的中点，作车辆特征的前车框；及

045：基于车辆特征的车辆基面及前车框，生成车辆特征的三维检测框。

具体地，检测框参数包括车辆特征的车辆基面、车辆特征的方向角、车辆特征的矩形框、车辆特征的透视系数。在一个例子中，检测模块检测输出的检测框参数如下：

车辆基面：输出（bx1,by1）(bx2,by2)，

车辆方向角：输出alpha值，

车辆矩形框：输出（x1,y1）(x2,y2)，

透视系数：输出比例值 t （0<t<1），

在步骤041中，基于车辆特征的车辆基面，计算车辆特征的车辆基面的中点坐标，以图7为例，图7为本申请第七实施方式的三维检测框的示意图，车辆基面为K1，车辆基面K1的宽为a，高为b，车辆基面K1的中点坐标为M。

在步骤042中，基于车辆特征的车辆基面及车辆特征的透视系数，计算车辆特征的前车框的宽和高，如图7所示，前车框的高为c=透视系数*b，前车框的宽为d=透视系数*a。

在步骤043中，基于中点坐标及车辆特征的方向角定义一射线，射线与车辆特征的矩形框将于一特征点，如图7所示，中点坐标M与方向角可以定义一射线Z，该射线Z与矩形框X交于一特征点P。

在步骤044中，以特征点为前车框的高的中点，作车辆特征的前车框，如图7所示，以特征点P前车框的高的中点，作前车框的高为c，再作前车框的宽为d，得到车辆特征的前车框K2。

在步骤045中，基于车辆特征的车辆基面及前车框，生成车辆特征的三维检测框，如图7所示，连接车辆基面K1与前车框K2对应的角点，得到三维检测框K1+K2+K3。

请参阅图8，图8为本申请第八实施方式的车辆检测框的生成装置10的模块示意图，生成装置10包括获取模块11、预先训练的检测模块12、判断模块13及生成模块14。获取模块11可用于实施步骤01，即，获取模块11用于获取待检测的二维图像；检测模块12可用于实施步骤02，即，检测模块12用于检测二维图像的分类分数及检测框参数；判断模块13可用于实施步骤03，即，判断模块13用于基于分类分数判断二维图像中是否包括车辆特征；生成模块14可用于实施步骤04，即，生成模块14用于若包括车辆特征，基于检测框参数生成车辆特征的三维检测框。

请继续参阅图8，在某些实施方式中，判断模块13可用于实施步骤031、步骤032及步骤033，即，判断模块13可用于判断分类分数是否大于预设的分数阈值；若是，则二维图像包括车辆特征；及若否，则二维图像不包括车辆特征。

请参阅图9，图9为本申请第九实施方式的车辆检测框的生成装置10的模块示意图，在某些实施方式中，生成装置10还包括训练模块15，训练模块15可用于实施步骤05，即，训练模块15可用于训练检测模块12。具体地，训练模块15可用于实施步骤051、步骤052及步骤053，即，训练模块15可用于获取训练二维图像，训练二维图像中包括训练车辆特征；在训练二维图像中标注训练车辆特征的训练检测框参数；及将训练二维图像及训练检测框参数作为输入训练得到检测模块12。

请参阅图8，在某些实施方式中，生成模块14可用于实施步骤041、步骤042、步骤043、步骤044及步骤045，即，生成模块14可用于基于车辆特征的车辆基面，计算车辆特征的车辆基面的中点坐标；基于车辆特征的车辆基面及车辆特征的透视系数，计算车辆特征的前车框的宽和高；基于中点坐标及车辆特征的方向角定义一射线，射线与车辆特征的矩形框交于一特征点；以特征点为前车框的高的中点，作车辆特征的前车框；及基于车辆特征的车辆基面及前车框，生成车辆特征的三维检测框。

需要说明的是，车辆检测框的生成装置10实施本申请任一实施方式的车辆检测框的生成方法时的实施细节及所达到的效果，可以参考上述对车辆检测框的生方法的描述，在此不再赘述。

此外，请参阅图10，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现以上任一实施方式所述的车辆检测框的生方法。其中，所述计算机可读存储介质包括但不限于任何类型的盘（包括软盘、硬盘、光盘、CD-ROM、和磁光盘）、ROM（Read-Only Memory，只读存储器）、RAM（RandomAccess Memory，随即存储器）、EPROM（Erasable Programmable Read-Only Memory，可擦写可编程只读存储器）、EEPROM（Electrically Erasable Programmable Read-Only Memory，电可擦可编程只读存储器）、闪存、磁性卡片或光线卡片。也就是，存储设备包括由设备（例如，计算机、手机）以能够读的形式存储或传输信息的任何介质，可以是只读存储器，磁盘或光盘等。

本申请方法实施例的内容均适用于本存储介质实施例，本存储介质实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法达到的有益效果也相同，具体请参见方法实施例中的说明，在此不再赘述。

此外，请参阅图11，本申请实施例还提供了一种计算机设备，本实施例所述的计算机设备可以是服务器、个人计算机以及网络设备等设备。所述计算机设备包括一个或多个处理器、存储器、以及一个或多个计算机程序。其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行。一个或多个计算机程序配置用于执行以上任一实施方式所述的车辆检测框的生方法。

在本说明书的描述中，参考术语“一个实施方式”、“一些实施方式”、“示意性实施方式”、“示例”、“具体示例”或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

尽管上面已经示出和描述了本申请的实施方式，可以理解的是，上述实施方式是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。

Claims

1.一种车辆检测框的生成方法，其特征在于，所述生成方法包括：

获取待检测的二维图像；

基于预先训练的检测模块，检测所述二维图像的分类分数及检测框参数，所述检测框参数包括：车辆特征的车辆基面、车辆特征的方向角、车辆特征的矩形框、车辆特征的透视系数；

基于所述分类分数判断所述二维图像中是否包括车辆特征，所述分类分数用于判断二维图像中是否包括预设的目标特征，是一个在预定范围内的数字，分类分数越大，表示二维图像中包括车辆特征的可能性越大，分类分数越小，表示二维图像中包括车辆特征的可能性越小；

若是，基于所述检测框参数生成所述车辆特征的三维检测框，所述三维检测框为在二维图像中显示的裸眼3D效果的检测框，通过显示三维检测框，体现车辆特征的空间信息；

所述基于所述检测框参数生成所述车辆特征的三维检测框，包括：

2.根据权利要求1所述的车辆检测框的生成方法，其特征在于，基于所述分类分数判断所述二维图像中是否包括车辆特征，包括：

判断所述分类分数是否大于预设的分数阈值；

若是，则所述二维图像包括车辆特征；及

若否，则所述二维图像不包括车辆特征。

3.根据权利要求1所述的车辆检测框的生成方法，其特征在于，在获取待检测的二维图像前，所述生成方法还包括：训练检测模块；所述训练检测模块，包括：

4.根据权利要求3所述的车辆检测框的生成方法，其特征在于，所述训练检测框参数包括：

5.根据权利要求1所述的车辆检测框的生成方法，其特征在于，所述检测模块的模型骨架为ResNet网络。

6.一种车辆检测框的生成装置，其特征在于，所述生成装置包括：

获取模块，所述获取模块用于获取待检测的二维图像；

预先训练的检测模块，所述检测模块用于检测所述二维图像的分类分数及检测框参数，所述检测框参数包括：车辆特征的车辆基面、车辆特征的方向角、车辆特征的矩形框、车辆特征的透视系数；

判断模块，所述判断模块用于基于所述分类分数判断所述二维图像中是否包括车辆特征，所述分类分数用于判断二维图像中是否包括预设的目标特征，是一个在预定范围内的数字，分类分数越大，表示二维图像中包括车辆特征的可能性越大，分类分数越小，表示二维图像中包括车辆特征的可能性越小；

生成模块，所述生成模块用于若包括车辆特征，基于所述检测框参数生成所述车辆特征的三维检测框；所述基于所述检测框参数生成所述车辆特征的三维检测框，包括：基于所述车辆特征的车辆基面，计算所述车辆特征的车辆基面的中点坐标；基于所述车辆特征的车辆基面及所述车辆特征的透视系数，计算所述车辆特征的前车框的宽和高；基于所述中点坐标及所述车辆特征的方向角定义一射线，所述射线与所述车辆特征的矩形框交于一特征点；以所述特征点为所述前车框的高的中点，作所述车辆特征的前车框；及基于所述车辆特征的车辆基面及所述前车框，生成所述车辆特征的三维检测框；所述三维检测框为在二维图像中显示的裸眼3D效果的检测框，通过显示三维检测框，体现车辆特征的空间信息。

7.一种计算机设备，其特征在于，包括：

一个或多个处理器；

存储器；及

一个或多个计算机程序，其中，所述一个或多个计算机程序被存储在所述存储器中，并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序配置用于：执行权利要求1至5任意一项所述的车辆检测框的生成方法。

8.一种存储有计算机程序的非易失性计算机可读存储介质，其特征在于，当所述计算机程序被一个或多个处理器执行时，使得所述处理器执行权利要求1至5任意一项所述的车辆检测框的生成方法。