CN108376235A

CN108376235A - 图像检测方法、装置及计算机可读存储介质

Info

Publication number: CN108376235A
Application number: CN201810034651.0A
Authority: CN
Inventors: 刘新; 宋朝忠; 郭烽; 周晓帆
Original assignee: Shenzhen Yicheng Automatic Driving Technology Co Ltd
Current assignee: Shenzhen Yicheng Automatic Driving Technology Co Ltd
Priority date: 2018-01-15
Filing date: 2018-01-15
Publication date: 2018-08-07

Abstract

本发明公开了一种图像检测方法。该方法包括：获取训练样本，训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；对训练样本中提取出的第一特征进行分类并得到第一检测框坐标；根据分类结果、第一检测框坐标及真实分类信息和真实检测框坐标信息通过预设算法计算得到总损失；根据总损失通过梯度下降算法对卷积神经网络模型参数进行更新，并对训练数据进行迭代训练得到训练好的卷积神经网络模型；获取包含车辆和行人的待检测图像，利用训练好的卷积神经网络模型检测得到对应的车辆和行人信息。本发明还公开了一种图像检测装置及计算机可读存储介质。本发明基于卷积神经网络模型检测图像中的车辆和行人信息，可提高图像检测的准确率。

Description

图像检测方法、装置及计算机可读存储介质

技术领域

本发明涉及图像检测技术领域，尤其涉及一种图像检测方法、装置及计算机可读存储介质。

背景技术

随着交通事故的频繁发生与人们对智能汽车技术的日益关注，汽车智能辅助驾驶系统的研究与应用正在飞速发展，而车辆环境感知系统是汽车智能辅助驾驶系统的关键，其中周围车辆和行人的识别是环境感知系统的最为重要组成部分之一。获取周围的车辆或行人信息，可以为自适应巡航系统与自动紧急刹车系统等主动安全技术提供有力的技术。

目前，对于周围车辆和行人的识别主要是通过摄像机获取车辆周围环境的图像，然后通过图像检测技术识别图像中的车辆或行人信息。而现有的图像检测方法一般都基于手工设计特征的检测模型对图像中的车辆和行人信息进行检测，这种方法前期需要对图像进行复杂的预处理，还需要人为设计特征，其设计较为复杂，通用性不佳，且图像检测的准确率较差。

发明内容

本发明的主要目的在于提供一种图像检测方法、装置及计算机可读存储介质，旨在提高图像检测的准确率。

为实现上述目的，本发明提供一种图像检测方法，所述图像检测方法包括：

获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；

提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标；

根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失；

根据所述总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本进行迭代训练，得到训练好的卷积神经网络模型；

获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息。

可选地，所述提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标的步骤之前，包括：

基于迁移学习的方法从预设多分类模型中获得对应的原始特征提取网络模型，并根据所述原始特征提取网络模型构建所述卷积神经网络模型。

可选地，所述提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标的步骤，包括：

利用所述卷积神经网络模型生成与所述训练样本对应的第一原始特征图，并根据所述第一原始特征图得到包含有车辆和/或行人的第一区域坐标；

根据所述第一区域坐标和第一原始特征图获得对应的第一感兴趣区域，并提取所述第一感兴趣区域的第一特征；

对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标。

可选地，所述根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失的步骤，包括：

根据第一分类结果和所述训练样本的真实分类信息计算得到分类损失；

根据所述第一检测框坐标和所述训练样本的真实检测框坐标信息计算得到位置回归损失；

根据所述分类损失和位置回归损失以及各自对应的预设权重系数计算得到总损失。

可选地，所述车辆和行人信息包括车辆和行人分类信息及对应的第二检测框坐标信息，所述获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息的步骤，包括：

获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征；

根据所述第二特征检测得到所述车辆和行人分类信息及对应的第二检测框坐标信息。

可选地，所述获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征的步骤，包括：

获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型生成与所述待检测图像对应的第二原始特征图；

根据所述第二原始特征图得到包含有车辆和/或行人的第二区域坐标；

根据所述第二区域坐标和第二原始特征图获得对应的第二感兴趣区域，并提取所述第二感兴趣区域的第二特征。

可选地，所述获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的的步骤，包括：

获取经标注的包含车辆和行人的图像数据；

采用预设数据扩增方法对所述图像数据进行扩充，得到训练样本。

可选地，所述预设数据扩增方法包括图像平移方法、图像旋转方法、图像亮度变化方法、图像镜像方法、图像裁剪方法、图像缩放方法和图像模糊方法中的一种或多种。

此外，为实现上述目的，本发明还提供一种图像检测装置，所述图像检测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像检测程序，所述图像检测程序被所述处理器执行时实现如上所述的图像检测方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有图像检测程序，所述图像检测程序被处理器执行时实现如上所述的图像检测方法的步骤。

本发明提供一种图像检测方法、装置及计算机可读存储介质，通过获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标；根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失；根据所述总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本进行迭代训练，得到训练好的卷积神经网络模型；获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息。通过上述方式，本发明中终端首先获取训练样本，该训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的，通过预设数据扩增方法对图像数据进行扩充，无需手工设计图像特征，可提高卷积神经网络模型的准确率，进而提高图像检测的准确性和鲁棒性。然后通过构建的卷积神经网络模型提取该训练样本中其中一批图像数据的第一特征，进而对该第一特征进行分类，即确定对应目标物的类别(车辆或行人)，并根据该第一特征对应的坐标信息得到对应的第一检测框坐标，进而根据分类结果、第一检测框坐标及训练样本中标注的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失，根据该总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本中的每一批图像数据进行迭代训练，直至网络收敛，即总损失稳定下降到一个较小范围，从而得到训练好的卷积神经网络模型。本发明基于卷积神经网络模型，无需人工设计和提取特征，具有设计简单，鲁棒性好等优点，还可实现端到端的训练，自动逐层进行特征学习，整个过程直接优化总损失，从而得到训练好的卷积神经网络模型。通过该训练好的卷积神经网络模型检测待检测图像中的车辆和行人信息，可提高图像检测结果的准确率。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的终端结构示意图；

图2为本发明图像检测方法第一实施例的流程示意图；

图3为本发明实施例中根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失的细化流程示意图；

图4为本发明实施例中获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的的细化流程示意图；

图5为本发明实施例中获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息的细化流程示意图；

图6为本发明实施例中获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征的细化流程示意图；

图7为本发明图像检测方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在现有技术中，一般都基于手工设计特征的检测模型对图像中的车辆和行人信息进行检测，这种方法前期需要对图像进行复杂的预处理，还需要人为设计特征，其设计较为复杂，通用性不佳，且图像检测的准确率较差。

为了解决上述技术问题，本发明提供一种图像检测方法、装置及计算机可读存储介质，通过获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标；根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失；根据所述总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本进行迭代训练，得到训练好的卷积神经网络模型；获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息。通过上述方式，本发明中终端首先获取训练样本，该训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的，通过预设数据扩增方法对图像数据进行扩充，无需手工设计图像特征，可提高卷积神经网络模型的准确率，进而提高图像检测的准确性和鲁棒性。然后通过构建的卷积神经网络模型提取该训练样本中其中一批图像数据的第一特征，进而对该第一特征进行分类，即确定对应目标物的类别(车辆或行人)，并根据该第一特征对应的坐标信息得到对应的第一检测框坐标，进而根据分类结果、第一检测框坐标及训练样本中标注的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失，根据该总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本中的每一批图像数据进行迭代训练，直至网络收敛，即总损失稳定下降到一个较小范围，从而得到训练好的卷积神经网络模型。本发明基于卷积神经网络模型，无需人工设计和提取特征，具有设计简单，鲁棒性好等优点，还可实现端到端的训练，自动逐层进行特征学习，整个过程直接优化总损失，从而得到训练好的卷积神经网络模型。通过该训练好的卷积神经网络模型检测待检测图像中的车辆和行人信息，可提高图像检测结果的准确率。

请参阅图1，图1为本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是PC，也可以是平板电脑、便携计算机、智能手机等具有显示功能的可移动式终端设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、Wi-Fi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像检测程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的图像检测程序，并执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的图像检测程序，还执行以下操作：

进一步地，所述车辆和行人信息包括车辆和行人分类信息及对应的第二检测框坐标信息，处理器1001可以调用存储器1005中存储的图像检测程序，还执行以下操作：

获取经标注的包含车辆和行人的图像数据；

进一步地，所述预设数据扩增方法包括图像平移方法、图像旋转方法、图像亮度变化方法、图像镜像方法、图像裁剪方法、图像缩放方法和图像模糊方法中的一种或多种。

基于上述硬件结构，提出本发明图像检测方法实施例。

本发明提供一种图像检测方法。

请参阅图2，图2为本发明图像检测方法第一实施例的流程示意图。

在本发明实施例中，该图像检测方法包括：

步骤S10，获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；

在本发明实施例中，该图像检测方法主要用于检测图像中的车辆和行人信息，包括图像中的车辆和行人分类信息及对应的检测框坐标信息。本发明实施例的终端可以是PC，也可以是平板电脑、便携计算机、智能手机等具有显示功能的可移动式终端设备。

在本发明实施例中，终端首先获取训练样本，该训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的。其中，包含车辆和行人的图像可以来源于各大图像数据库和网络平台，例如ImageNet数据集、PASCALVOC数据集、百度图片等，还可以来源于道路监控视频录像。标注过程包括对图像中的目标物类别(车辆和行人)进行标注，还包括对目标物的检测框坐标进行标注。图像数据的扩充，则可以通过预设数据扩增方法进行扩充，其中预设数据扩增方法可以包括图像平移方法、图像旋转方法、图像亮度变化方法、图像镜像方法、图像裁剪方法、图像缩放方法和图像模糊方法中的一种或多种。

需要说明的是，采用数据扩增的方法对图像数据进行扩充，可基于已有的图像数据增大训练样本数据量，而无需获取其他的图像数据，无需手工设计图像特征，可节省时间和成本，而且训练样本数据量的增加，可提高卷积神经网络模型的准确率，进而提高图像检测的准确性和鲁棒性。

步骤S20，提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标；

然后，终端会利用构建的卷积神经网络模型去提取该训练样本中其中一批图像数据的第一特征，进而对该第一特征进行分类，并根据该第一特征对应的坐标信息得到对应的第一检测框坐标。具体的，可以先利用构建的卷积神经网络模型生成与该训练样本中其中一批图像数据对应的第一原始特征图，然后根据该第一原始特征图得到包含有车辆和/或行人(即目标物)的第一区域坐标，根据该第一区域坐标在第一原始特征图上截取得到对应的第一感兴趣区域，并提取第一感兴趣区域的第一特征，对该第一特征进行分类，即确定该目标物的类别(车辆或行人)，并根据该第一特征对应的坐标信息(即第一区域坐标)得到对应的第一检测框坐标。

步骤S30，根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失；

然后，终端根据分类结果、第一检测框坐标及训练样本中这批图像数据标注的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失。

具体的，请参阅图3，图3为本发明实施例中根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失的细化流程示意图。步骤S30包括：

步骤S31，根据第一分类结果和所述训练样本的真实分类信息计算得到分类损失；

步骤S32，根据所述第一检测框坐标和所述训练样本的真实检测框坐标信息计算得到位置回归损失；

步骤S33，根据所述分类损失和位置回归损失以及各自对应的预设权重系数计算得到总损失。

在本发明实施例中，终端先根据第一分类结果(即预测的分类结果)和该训练样本的真实分类信息计算得到分类损失，其中分类损失的计算公式为：

其中，k为真实标签值，N为一个批量的大小，

其中，K为类别数。

然后根据第一检测框坐标(即预测的检测框坐标)和训练样本的真实检测框坐标信息计算得到位置回归损失，其中位置回归损失的计算公式为：

其中，表示第一检测框坐标，d表示真实检测框坐标信息，{x₀,y₀,x₁,y₁}分别表示检测框左上角的x、y坐标与右下角的x、y坐标。

然后根据所述分类损失和位置回归损失以及各自对应的预设权重系数计算得到总损失，其中总损失的计算公式为：

L＝w₁·L_cls+w₂·L_loc，

其中，w₁为分类损失的权重系数，w₂为位置回归损失的权重系数，w₁和w₂可以均设为0.5，当然可以根据实际情况设置为其他数值。

步骤S40，根据所述总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本进行迭代训练，得到训练好的卷积神经网络模型；

根据该总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本中每一批图像数据进行迭代训练，即根据总损失来更新卷积神经网络模型中各层结点的梯度，进而更新各结点的权值参数，重复上述步骤S10至步骤S40，不断迭代直至网络收敛，即总损失稳定下降到一个较小范围(低于预设阈值或达到最小值)，此时，可得到训练好的卷积神经网络模型。通过梯度下降算法可求解大规模样本数据的优化问题，具体的梯度下降算法可参照现有技术，此处不做赘述。

步骤S50，获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息。

当终端获取到包含车辆和行人的待检测图像时，利用该训练好的卷积神经网络模型即可检测获得该待检测图像中的车辆和行人信息，其中，车辆和行人信息包括车辆和行人分类信息及对应的第二检测框坐标信息。具体的，终端在获取到包含车辆和行人的待检测图像时，利用训练好的卷积神经网络模型提取该待检测图像的第二特征，然后对该第二特征进行分类，确定该第二特征对应的第二感兴趣区域中目标物的类别(即为车辆或行人)，并输出对应的置信度，即车辆和行人分类信息包括目标物的类别(车辆或行人)和置信度，然后再根据该第二特征得到对应的第二检测框坐标信息。因此，本发明在获取到待检测图像时，即可利用训练好的卷积神经网络模型对待检测图像进行处理，具有较高的运行效率，此外，利用该训练好的卷积神经网络模型能够提取到具有高鲁棒性及高可靠性的图像特征，从而提高图像检测的准确率，对后期汽车智能辅助驾驶系统的探索和研究具有重要意义。

本发明实施例提供一种图像检测方法，通过获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的；提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标；根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失；根据所述总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本进行迭代训练，得到训练好的卷积神经网络模型；获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息。通过上述方式，本发明中终端首先获取训练样本，该训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的，通过预设数据扩增方法对图像数据进行扩充，无需手工设计图像特征，可提高卷积神经网络模型的准确率，进而提高图像检测的准确性和鲁棒性。然后通过构建的卷积神经网络模型提取该训练样本中其中一批图像数据的第一特征，进而对该第一特征进行分类，即确定对应目标物的类别(车辆或行人)，并根据该第一特征对应的坐标信息得到对应的第一检测框坐标，进而根据分类结果、第一检测框坐标及训练样本中标注的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失，根据该总损失通过梯度下降算法对卷积神经网络模型参数进行更新,并对所述训练样本中的每一批图像数据进行迭代训练，直至网络收敛，即总损失稳定下降到一个较小范围，从而得到训练好的卷积神经网络模型。本发明基于卷积神经网络模型，无需人工设计和提取特征，具有设计简单，鲁棒性好等优点，还可实现端到端的训练，自动逐层进行特征学习，整个过程直接优化总损失，从而得到训练好的卷积神经网络模型。通过该训练好的卷积神经网络模型检测待检测图像中的车辆和行人信息，可提高图像检测结果的准确率。

基于图2所示的第一实施例，具体的，请参阅图4，图4为本发明实施例中获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的的细化流程示意图。步骤S10包括：

步骤S11，获取经标注的包含车辆和行人的图像数据；

步骤S12，采用预设数据扩增方法对所述图像数据进行扩充，得到训练样本。

在本发明实施例中，终端首先获取经标注的包含车辆和行人的图像数据，其中，包含车辆和行人的图像数据可以来源于各大图像数据库和网络平台，例如ImageNet数据集、PASCAL VOC数据集、百度图片等，还可以来源于道路监控视频录像。标注过程包括对图像中的目标物类别(即为车辆或行人)进行标注，还包括对目标物(车辆或行人)的检测框坐标进行标注。需要说明的是，目标物的检测框坐标是指待检测图像中可能包括目标物的一个预设形状的区域，在实际应用中，为了方便检测，预设形状通常设定为矩形，对目标物的检测框坐标进行标注时，可以将矩形检测框的左上角坐标与右下角坐标记录下来，记为{x₀,y₀,x₁,y₁}。

然后采用预设数据扩增方法对所述图像数据进行扩充，得到训练样本。由于训练卷积神经网络模型需要大量的训练样本，而现有的公共图像数据集数据规模有限，因此需要对图像数据进行扩容，扩容的方式可以通过预设数据扩增方法进行扩充，其中，预设数据扩增方法可以包括图像平移方法、图像旋转方法、图像亮度变化方法、图像镜像方法、图像裁剪方法、图像缩放方法和图像模糊方法中的一种或多种。即对获取到的图像数据进行图像平移、图像旋转、调整图像亮度、图像镜像、裁剪图像、图像缩放和图像模糊等其中某些操作，来进行扩充，例如，对图像进行梯度为10°的旋转操作，或对图像进行0.6、0.9或1.5倍的缩放操作，采用数据扩增方法可扩大图像数据的数据量，提高卷积神经网络模型的准确率，进而提高图像检测的准确性和鲁棒性。需要说明的是，在扩充的同时，需对扩充图像中的目标物类别和检测框坐标进行标注，用于后续步骤中根据预测的分类结果和预测的检测框坐标来计算分类损失和位置回归损失，然后通过预设算法计算得到总损失，进而根据总损失来训练卷积神经网络模型。

基于图2所示的第一实施例，请参阅图5，图5为本发明实施例中获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息的细化流程示意图。步骤S50包括：

步骤S51，获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征；

在本发明实施例中，终端在获取到包含车辆和行人的待检测图像时，利用训练好的卷积神经网络模型提取该待检测图像的第二特征。

具体的，请参阅图6，图6为本发明实施例中获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征的细化流程示意图。步骤S51包括：

步骤S511，获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型生成与所述待检测图像对应的第二原始特征图；

步骤S512，根据所述第二原始特征图得到包含有车辆和/或行人的第二区域坐标；

步骤S513，根据所述第二区域坐标和第二原始特征图获得对应的第二感兴趣区域，并提取所述第二感兴趣区域的第二特征。

终端在获取到包含车辆和行人的待检测图像时，首先利用训练好的卷积神经网络模型生成与待检测图像对应的第二原始特征图，具体的，该第二原始特征图是通过该训练好的卷积神经网络模型中原始特征提取网络层生成的。然后再根据该第二原始特征图得到包含有车辆和/或行人(即目标物)的第二区域坐标，再根据该第二区域坐标在第二原始特征图上截取对应的第二感兴趣区域，通过训练好的卷积神经网络模型中的池化层提取该第二感兴趣区域的第二特征。

步骤S52，根据所述第二特征检测得到所述车辆和行人分类信息及对应的第二检测框坐标信息。

当终端提取到第二特征后，根据该第二特征检测得到待检测图像的车辆和行人信息，其中车辆和行人信息包括车辆和行人分类信息及对应的第二检测框坐标信息。具体的，终端可以利用该训练好的卷积神经网络模型对该第二特征进行分类，确定该第二特征对应的第二感兴趣区域中目标物的类别(即为车辆或行人)，并输出对应的置信度，即车辆和行人分类信息包括目标物的类别(车辆或行人)和置信度，然后再根据该第二特征得到对应的第二检测框坐标信息。

请参阅图7，图7为本发明图像检测方法第二实施例的流程示意图。

基于图2所示的第一实施例，在步骤S20之前，该图像检测方法还包括：

步骤S60，基于迁移学习的方法从预设多分类模型中获得对应的原始特征提取网络模型，并根据所述原始特征提取网络模型构建所述卷积神经网络模型。

在本发明实施例中，终端基于迁移学习的方法从预设多分类模型中获得对应的原始特征提取网络模型，并根据该原始特征提取网络模型构建卷积神经网络模型。迁移学习是指在相似而不同的领域、任务和分布之间进行知识迁移，即利用辅助领域的知识，帮助目标领域建立学习模型，且迁移学习不要求辅助数据与目标数据满足同分布的假设。在本发明实施例中，是基于迁移学习的方法训练一个多分类模型来初始化最终卷积神经网络模型参数，即将预设多分类模型中的特征提取网络部分迁移到新的卷积神经网络模型中的原始特征提取网络部分，作为新的卷积神经网络模型的前端部分来参与训练，从而可提取更为鲁棒的原始特征，同时节省训练时间和成本。其中，预设多分类模型为通过多次试验得到的，本发明不做公开。

此时，步骤S20可以包括：

步骤S21，利用所述卷积神经网络模型生成与所述训练样本对应的第一原始特征图，并根据所述第一原始特征图得到包含有车辆和/或行人的第一区域坐标；

步骤S22，根据所述第一区域坐标和第一原始特征图获得对应的第一感兴趣区域，并提取所述第一感兴趣区域的第一特征；

步骤S23，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标。

当基于迁移学习的方法构建出卷积神经网络模型后，利用该卷积神经网络模型生成与待检测图像对应的第一原始特征图，具体的，该第一原始特征图是通过该卷积神经网络模型中原始特征提取网络层生成的。然后再根据该第一原始特征图得到包含有车辆和/或行人(即目标物)的第一区域坐标，再根据该第一区域坐标在第一原始特征图上截取对应的第一感兴趣区域，通过该卷积神经网络模型中的池化层提取该第一感兴趣区域的第一特征。然后终端利用该卷积神经网络模型对该第一特征进行分类，确定该第一特征对应的第一感兴趣区域中目标物的类别(即为车辆或行人)，并根据该第一特征得到对应的第一检测框坐标。后续各步骤的具体实施例与上述各实施例基本相同，在此不作赘述。

本发明还提出一种图像检测装置，该图像检测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像检测程序，所述图像检测程序被所述处理器执行时实现如以上任一项实施例所述的图像检测方法的步骤。

本发明图像检测装置的具体实施例与上述图像检测方法各实施例基本相同，在此不作赘述。

本发明还提出一种计算机可读存储介质，该计算机可读存储介质上存储有图像检测程序，所述图像检测程序被处理器执行时实现如以上任一项实施例所述的图像检测方法的步骤。

本发明计算机可读存储介质的具体实施例与上述图像检测方法各实施例基本相同，在此不作赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种图像检测方法，其特征在于，所述图像检测方法包括以下步骤：

2.如权利要求1所述的图像检测方法，其特征在于，所述提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标的步骤之前，包括：

3.如权利要求2所述的图像检测方法，其特征在于，所述提取所述训练样本的第一特征，对所述第一特征进行分类，并根据所述第一特征对应的坐标信息得到对应的第一检测框坐标的步骤，包括：

4.如权利要求1所述的图像检测方法，其特征在于，所述根据分类结果、所述第一检测框坐标及所述训练样本的真实分类信息和真实检测框坐标信息，通过预设算法计算得到总损失的步骤，包括：

5.如权利要求1所述的图像检测方法，其特征在于，所述车辆和行人信息包括车辆和行人分类信息及对应的第二检测框坐标信息，所述获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型检测得到所述待检测图像的车辆和行人信息的步骤，包括：

6.如权利要求5所述的图像检测方法，其特征在于，所述获取包含车辆和行人的待检测图像，并利用所述训练好的卷积神经网络模型提取所述待检测图像的第二特征的步骤，包括：

7.如权利要求1所述的图像检测方法，其特征在于，所述获取训练样本，所述训练样本为对经标注的包含车辆和行人的图像数据进行扩充后得到的的步骤，包括：

获取经标注的包含车辆和行人的图像数据；

8.如权利要求7所述的图像检测方法，其特征在于，所述预设数据扩增方法包括图像平移方法、图像旋转方法、图像亮度变化方法、图像镜像方法、图像裁剪方法、图像缩放方法和图像模糊方法中的一种或多种。

9.一种图像检测装置，其特征在于，所述图像检测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像检测程序，所述图像检测程序被所述处理器执行时实现如权利要求1至8中任一项所述的图像检测方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有图像检测程序，所述图像检测程序被处理器执行时实现如权利要求1至8中任一项所述的图像检测方法的步骤。