CN111382870A

CN111382870A - 训练神经网络的方法以及装置

Info

Publication number: CN111382870A
Application number: CN202010152855.1A
Authority: CN
Inventors: 侯跃南; 马政; 刘春晓; 吕健勤
Original assignee: Sensetime Group Ltd
Current assignee: Sensetime Group Ltd
Priority date: 2020-03-06
Filing date: 2020-03-06
Publication date: 2020-07-07

Abstract

本公开提供了一种训练神经网络的方法、目标检测方法、行驶控制方法、装置、电子设备及存储介质，该方法包括：基于获取的训练样本图像，确定训练样本图像对应的多个目标区域样本图像；基于训练好的教师神经网络和多个目标区域样本图像，确定训练样本图像的第一关联度，以及基于待训练的学生神经网络和多个目标区域样本图像，确定训练样本图像的第二关联度；其中，第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度；基于确定的第一关联度和第二关联度，确定学生神经网络相比教师神经网络的损失信息；基于损失信息，调整学生神经网络的网络参数信息。

Description

训练神经网络的方法以及装置

技术领域

本公开涉及深度学习技术领域，具体而言，涉及一种训练神经网络的方法、目标检测方法、行驶控制方法、装置、电子设备及存储介质。

背景技术

由于设备的资源限制，可以在设备上部署参数量较少的简单神经网络，但是参数量较少的简单神经网络的准确度较低，故为了提高简单神经网络的准确度，可以选择知识蒸馏的方法确定简单神经网络的参数信息。

其中，知识蒸馏是将参数量大的复杂神经网络中学习到的知识传递给简单神经网络，进而确定简单神经网络的参数信息，以提升简单神经网络的性能。一般地，是对复杂神经网络输出的特征图和简单神经网络输出的特征图之间直接进行特征值的比较来调整简单神经网络的参数信息。

发明内容

有鉴于此，本公开至少提供一种训练神经网络的方法、目标检测方法、行驶控制方法、装置、电子设备及存储介质。

第一方面，本公开提供了一种训练神经网络的方法，包括：

基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像，其中，所述训练样本图像包含多个目标对象，每个目标区域样本图像中包含一个目标对象；

基于训练好的教师神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第一关联度，以及基于待训练的学生神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第二关联度；其中，所述第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度；

基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息；

基于所述损失信息，调整所述学生神经网络的网络参数信息。

采用上述方法，通过确定训练样本图像的第一关联度以及第二关联度，基于第一关联度以及第二关联度，确定学生神经网络相比教师神经网络的损失信息，基于得到该损失信息，调整学生神经网络的网络参数信息，使得学生神经网络得到的第二关联度与第一关联度相似，也即本公开实施例提供了一种基于关联度相似性来衡量两个神经网络之间的性能相似性的方法，在教师神经网络的性能较好时，得到的学生神经网络的性能也较好，进而提高了得到的学生神经网络的准确度。

一种可能的实施方式中，所述基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像，包括：

针对所述训练样本图像中的每个目标对象，对所述训练样本图像进行二值化处理，得到二值图像，其中，所述二值图像中该目标对象的像素值与其它目标对象的像素值不同；

基于每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像。

上述实施方式下，通过针对每个目标对象，对训练样本图像进行二值化处理，得到二值图像，进而基于每个目标对象对应的二值图像，得到训练样本图像对应的多个目标区域样本图像，为计算训练样本中每个目标对象与其他目标对象之间的关联度提供了数据支持。

一种可能的实施方式中，基于与每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像，包括：

将与每个目标对象对应的所述二值图像进行平滑卷积处理或图像形态学处理，得到所述训练样本图像对应的多个目标区域样本图像。

上述实施方式中，通过对二值图像进行平滑卷积处理或图像形态学处理，可以使得得到的多个目标区域样本图像中对应的目标对象的像素点的数量增多，使得多个目标区域样本图像中对应的目标对象的特征增加，进而基于多个目标区域样本图像计算关联度时，可以提高计算得到的关联度的准确度。

一种可能的实施方式中，根据以下步骤确定训练样本图像的关联度，所述关联度为所述第一关联度或所述第二关联度：

对所述训练样本图像进行特征提取，得到所述训练样本图像对应的特征图；

基于所述特征图以及所述多个目标区域样本图像，计算得到每个目标对象对应的统计信息；所述统计信息用于表征目标对象的像素值的分布特征；

基于每个目标对象对应的所述统计信息，计算得到所述关联度；

其中，当所述关联度为所述第一关联度时，利用所述教师神经网络对所述训练样本图像进行特征提取；当所述关联度为所述第二关联度时，利用所述学生神经网络对所述训练样本图像进行特征提取。

上述实施方式下，通过计算第一关联度以及第二关联度，即分别分析了教师神经网络中每个目标对象与其他目标对象之间的第一相似程度、以及学生神经网络中每个目标对象与其他目标对象之间的第二相似程度，为调整第二卷积神经网络的网络参数提供了数据支持，使得网络参数调整后的第二卷积神经网络得到的第二关联度与第一卷积神经网络得到的第一关联度相似，即使得第二卷积神经网络检测目标对象的准确度，与第一卷积神经网络相似，在第一卷积神经网络的准确度满足要求的时候，可以保证第二卷积神经网络的准确度。

一种可能的实施方式中，所述统计信息包括一阶矩信息、二阶矩信息、和三阶矩信息中的至少一种。

一种可能的实施方式中，根据以下步骤确定所述一阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、以及所述特征图中每个像素点的值，确定该目标对象对应的一阶矩信息。

一种可能的实施方式中，根据以下步骤确定所述二阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、所述特征图中每个像素点的值、以及该目标对象对应的一阶矩信息，确定该目标对象对应的二阶矩信息。

一种可能的实施方式中，根据以下步骤确定所述三阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、所述特征图中每个像素点的值、该目标对象对应的一阶矩信息、以及该目标对象对应的二阶矩信息，确定该目标对象对应的三阶矩信息。

上述实施方式中，通过计算训练样本图像中每个目标对象的一阶矩信息、二阶矩信息、三阶矩信息，其中，一阶矩信息表征目标对象对应的像素点的像素值的均值，二阶矩信息表征目标对象对应的像素点的像素值的方差，三阶距信息表征目标对象对应的像素点的像素值的偏度，增加了目标对象的统计信息的丰富性，为基于损失信息调整第二卷积神经网络的网络参数提供了更多的数据支持。

一种可能的实施方式中，基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息，包括：

基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的关联度损失信息；

基于所述学生神经网络的交叉熵损失信息、所述学生神经网络相比所述教师神经网络的注意力图损失信息、以及所述学生神经网络相比所述教师神经网络的关联度损失信息，确定所述学生神经网络相比所述教师神经网络的损失信息。

上述实施方式中，通过确定学生神经网络相比教师神经网络的损失信息，基于该损失信息调整学生神经网络的网络参数，可以使得学生神经网络得到的第二关联度与教师神经网络得到的第一关联度相似，在教师神经网络的性能满足要求时，可以保障学生神经网络的性能。

以下装置、电子设备等的效果描述参见上述方法的说明，这里不再赘述。

第二方面，本公开提供了一种目标检测方法，包括：

获取目标图像；

利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用第一方面或第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络。

第三方面，本公开提供了一种行驶控制方法，包括：

获取行驶装置在行驶过程中采集的道路图像；

利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用第一方面或第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络；

基于所述道路图像中包括的目标对象，控制所述行驶装置。

第四方面，本公开提供了一种训练神经网络的装置，包括：

目标区域样本图像确定模块，用于基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像，其中，所述训练样本图像包含多个目标对象，每个目标区域样本图像中包含一个目标对象；

关联度确定模块，用于基于训练好的教师神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第一关联度，以及基于待训练的学生神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第二关联度；其中，所述第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度；

损失信息确定模块，用于基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息；

调整模块，用于基于所述损失信息，调整所述学生神经网络的网络参数信息。

一种可能的实施方式中，所述目标区域样本图像确定模块，在基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像的情况下，用于：

基于与每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像。

一种可能的实施方式中，所述目标区域样本图像确定模块，在基于与每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像的情况下，用于：

一种可能的实施方式中，所述关联度确定模块，用于：

一种可能的实施方式中，所述关联度确定模块，用于根据以下步骤确定所述一阶矩信息：

一种可能的实施方式中，所述关联度确定模块，用于根据以下步骤确定所述二阶矩信息：

一种可能的实施方式中，所述关联度确定模块，用于根据以下步骤确定所述三阶矩信息：

一种可能的实施方式中，所述损失信息确定模块，在基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息的情况下，用于：

将所述学生神经网络的交叉熵损失信息、所述学生神经网络相比所述教师神经网络的注意力图损失信息、以及所述学生神经网络相比所述教师神经网络的关联度损失信息的和值，确定为所述学生神经网络相比所述教师神经网络的损失信息。

第五方面，本公开提供了一种目标检测装置，包括：

图像获取模块，用于获取目标图像；

检测模块，用于利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用第一方面或第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络。

第六方面，本公开提供了一种行驶控制装置，包括：

道路图像获取模块，用于获取行驶装置在行驶过程中采集的道路图像；

目标对象检测模块，用于利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用第一方面或第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络；

控制模块，用于基于所述道路图像中包括的目标对象，控制所述行驶装置。

第七方面，本公开提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的训练神经网络的方法的步骤、如上述第二方面或任一实施方式所述的目标检测方法的步骤、或者如上述第三方面或任一实施方式所述的行驶控制方法的步骤。

第八方面，本公开提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的训练神经网络的方法的步骤、如上述第二方面或任一实施方式所述的目标检测方法的步骤、或者如上述第三方面或任一实施方式所述的行驶控制方法的步骤。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种训练神经网络的方法的流程示意图；

图2示出了本公开实施例所提供的一种训练神经网络的方法中，基于获取的训练样本图像，确定训练样本图像对应的多个目标区域样本图像的方式的流程示意图；

图3示出了本公开实施例所提供的一种训练神经网络的方法中，确定训练样本图像的关联度的方式的流程示意图；

图4示出了本公开实施例所提供的一种训练神经网络的方法中，第一关联关系图的示意图；

图5示出了本公开实施例所提供的一种目标检测方法的流程示意图；

图6示出了本公开实施例所提供的一种行驶控制方法的流程示意图；

图7示出了本公开实施例所提供的一种训练神经网络的装置的架构示意图；

图8示出了本公开实施例所提供的一种目标检测装置的架构示意图；

图9示出了本公开实施例所提供的一种行驶控制装置的架构示意图；

图10示出了本公开实施例所提供的一种电子设备的结构示意图；

图11示出了本公开实施例所提供的一种电子设备的结构示意图；

图12示出了本公开实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

知识蒸馏是将参数量大的复杂神经网络(即教师神经网络)中学习到的知识传递给简单神经网络(学生神经网络)，确定简单神经网络的参数的方法。一般的，基于复杂神经网络获取训练样本对应的第一特征图，以及基于简单神经网络获取训练样本对应的第二特征图，确定第一特征图的特征值与第二特征图的特征值之间的差别信息；基于确定的差别信息调整简单神经网络的网络参数，使得简单神经网络输出的第二特征图与复杂神经网络输出的第一特征图相似，实现对简单神经网络的训练。

但是，在基于上述知识蒸馏方法确定简单神经网络时，需要对第一特征图中的特征值与第二特征图中的特征值进行一一比对，使得上述知识蒸馏方法得到的简单神经网络的过程较为繁琐。为了解决上述问题，本公开实施例提供了一种训练神经网络的方法。

为便于对本公开实施例进行理解，首先对本公开实施例所公开的训练神经网络的方法进行详细介绍。

参见图1所示，为本公开实施例所提供的一种训练神经网络的方法的流程示意图，该方法包括S101-S104。

S101，基于获取的训练样本图像，确定训练样本图像对应的多个目标区域样本图像，其中，训练样本图像包含多个目标对象，每个目标区域样本图像中包含一个目标对象。

S102，基于训练好的教师神经网络和多个目标区域样本图像，确定训练样本图像的第一关联度，以及基于待训练的学生神经网络和多个目标区域样本图像，确定训练样本图像的第二关联度；其中，第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度。

S103，基于确定的第一关联度和第二关联度，确定学生神经网络相比教师神经网络的损失信息。

S104，基于损失信息，调整学生神经网络的网络参数信息。

上述步骤中，通过确定训练样本图像的第一关联度以及第二关联度，基于第一关联度以及第二关联度，确定学生神经网络相比教师神经网络的损失信息，基于得到的该损失信息，调整学生神经网络的网络参数信息，使得学生神经网络得到的第二关联度与第一关联度相似，也即本公开实施例提供了一种基于关联度相似性来衡量两个神经网络之间的性能相似性的方法，在教师神经网络的性能较好时，得到的学生神经网络的性能也较好，进而提高了得到的学生神经网络的准确度。

以下对S101-S104进行说明。

针对S101：

示例性的，该方法可以应用于对路面标识进行检测的神经网络上，比如，路面标识可以包括双实线、斑马线、右转箭头等，则对应的训练样本图像可以为包括路面标识的图像。

本公开实施例中，在确定训练样本图像对应的多个目标区域样本图像之前，可以确定训练样本图像中包括的目标对象的全部类别，并将训练样本图像中包括的目标对象的全部类别进行标识。比如，若训练样本图像为包括路面标识的图像时，则可以将双实线标记为1、斑马线标记为2、右转箭头标记为3、…、直行标识标记为n-1、背景标记为n，n为大于1的正整数。

本公开实施例中，基于获取的训练样本图像，确定训练样本图像对应的多个目标区域样本图像。比如，若训练样本图像A中包括三个目标对象，三个目标对象可以为双实线、斑马线、以及背景，则确定训练样本图像A对应的三个目标区域样本图像，即得到训练样本图像A对应的包括双实线的目标区域样本图像M₁、包括斑马线的目标区域样本图像M₂、以及包括背景的目标区域样本图像M_n。比如，若训练样本图像B中包括两个目标对象，两个目标对象可以为直行标识、以及背景，则确定训练样本图像B对应的两个目标区域样本图像，即得到训练样本图像B对应的包括直行标识的目标区域样本图像M_n-1、以及包括背景的目标区域样本图像M_n。示例性的，可以使得每个训练样本图像中均包括背景类别。

一种可能的实施方式中，参见图2所示，基于获取的训练样本图像，确定训练样本图像对应的多个目标区域样本图像，包括：

S201，针对训练样本图像中的每个目标对象，对训练样本图像进行二值化处理，得到二值图像，其中，二值图像中该目标对象的像素值与其它目标对象的像素值不同；

S202，基于每个目标对象对应的二值图像，得到训练样本图像对应的多个目标区域样本图像。

承接上述实施例继续说明，若训练样本图像A中包括的目标对象为双实线、斑马线、以及背景，则针对双实线，对训练样本图像A进行二值化处理，将训练样本图像A中双实线对应的像素点的像素值设置为1，将训练样本图像A中除双实线上的像素点之外的其他像素点的像素值设置为0，得到双实线对应的二值图像；基于双实线对应的二值图像，可以得到训练样本图像A对应的包括双实线的目标区域样本图像。

同时，针对斑马线，对训练样本图像A进行二值化处理，将训练样本图像A中斑马线对应的像素点的像素值设置为1，将训练样本图像A中除斑马线上的像素点之外的其他像素点的像素值设置为0，得到斑马线对应的二值图像；基于斑马线对应的二值图像，可以得到训练样本图像A对应的包括双实线的目标区域样本图像。

进而，针对背景，对训练样本图像A进行二值化处理，将训练样本图像A中背景对应的像素点的像素值设置为1(即将训练样本图像A中除双实线以及斑马线上的像素点之外的其他像素点设置为1)，将训练样本图像A中除背景上的像素点之外的其他像素点的像素值设置为0(即将训练样本图像A中双实线以及斑马线上的像素点设置为0)，得到背景对应的二值图像；基于背景对应的二值图像，可以得到训练样本图像A对应的包括背景的目标区域样本图像。

上述实施方式中，通过针对每个目标对象，对训练样本图像进行二值化处理，得到二值图像，进而基于每个目标对象对应的二值图像，得到训练样本图像对应的多个目标区域样本图像，为计算训练样本中每个目标对象与其他目标对象之间的关联度提供了数据支持。

一种可能的实施方式中，基于与每个目标对象对应的二值图像，得到训练样本图像对应的多个目标区域样本图像，包括：

将与每个目标对象对应的二值图像进行平滑卷积处理或图像形态学处理，得到训练样本图像对应的多个目标区域样本图像。

示例性的，可以分别对斑马线对应的二值图像、双实线对应的二值图像、背景对应的二值图像进行平滑卷积处理或图像形态学处理，得到训练样本图像A对应的包含斑马线的目标区域样本图像、包含双实线的目标区域样本图像、包含背景的目标区域样本图像。

针对S102：

本公开实施例中，教师神经网络的网络结构可以比学生神经网络的网络结构复杂，即教师神经网络可以为网络结构复杂的神经网络，比如卷积层的数量较多的神经网络，学生神经网络可以为网络结构简单的神经网络，比如卷积层的数量较少的神经网络。其中，教师神经网络为训练好的神经网络，学生神经网络为待训练的神经网络，教师神经网络和学生神经网络所实现的功能是相同的。

本公开实施例中，第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度。比如，若训练样本图像A为包括双实线、斑马线、以及背景的图像，则训练样本图像A对应的第一关联度和第二关联度可以包括双实线与斑马线之间的关联度、双实线与背景之间的关联度、以及斑马线与背景之间的关联度。

一种可能的实施方式中，参见图3所示，根据以下步骤确定训练样本图像的关联度：

S301，对训练样本图像进行特征提取，得到训练样本图像对应的特征图；

S302，基于特征图以及多个目标区域样本图像，计算得到每个目标对象对应的统计信息；统计信息用于表征目标对象的像素值的分布特征；

S303，基于每个目标对象对应的统计信息，计算得到关联度；

其中，当关联度为第一关联度时，利用教师神经网络对训练样本图像进行特征提取；当关联度为第二关联度时，利用学生神经网络对训练样本图像进行特征提取。

本公开实施例中，针对第一关联度：将训练样本图像输入至教师神经网络中，得到训练样本图像对应的第一特征图；基于第一特征图以及多个目标区域样本图像，计算得到每个目标对象对应的第一统计信息；进而基于每个目标对象对应的第一统计信息，计算得到第一关联度。在得到的第一特征图的数量为c个时，则针对每个目标对象，可以基于每个第一特征图以及该目标对象对应的目标区域样本图像，得到该目标对象对应的第一统计信息，其中，该目标对象对应的第一统计信息可以为由c个元素组成的列向量。

其中，第二关联度的确定过程与第一关联度的确定过程相似，本公开实施例对此不在赘述。

上述实施方式中，通过计算第一关联度以及第二关联度，即分别分析了教师神经网络中每个目标对象与其他目标对象之间的第一相似程度、以及学生神经网络中每个目标对象与其他目标对象之间的第二相似程度，为调整第二卷积神经网络的网络参数提供了数据支持，使得网络参数调整后的第二卷积神经网络得到的第二关联度与第一卷积神经网络得到的第一关联度相似，即使得第二卷积神经网络检测目标对象的准确度，与第一卷积神经网络相似，在第一卷积神经网络的准确度满足要求的时候，可以保证第二卷积神经网络的准确度。

一种可能的实施方式中，统计信息包括一阶矩信息、二阶矩信息、和三阶矩信息中的至少一种。

一种可能的实施方式中，根据以下步骤确定一阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、以及特征图中每个像素点的值，确定该目标对象对应的一阶矩信息。

本公开实施例中，可以根据下述公式(1)确定每个目标对象的一阶矩信息：

其中，k为目标对象对应的类别标号，承接S101中示例进行说明，比如，双实线对应的k为1，斑马线对应的k为2，背景对应的k为n等，其中每个目标对象对应的k可以任意设置；μ₁(k)为类别标号为k的目标对象的一阶矩信息；|M(:,:,k)|为类别标号为k的目标对象在对应的目标区域样本图像中的像素点的数量，比如，训练样本图像A中，k＝1时，则|M(:,:,1)|为双实线在对应的目标区域样本图像M₁中的像素点的数量，即目标区域样本图像M₁中像素值为1的像素点的数量；i、j为像素点的坐标信息；M(i,j,k)为与k对应的目标区域样本图像中每一像素点的像素值，比如，训练样本图像A中，k＝1时，M(i,j,k)为目标区域样本图像M₁中每一像素点的像素值；F(i,j)为第一特征图中对应的每一像素点的像素值。

示例性的，若第一特征图中包括c个特征图，则μ₁(k)＝[μ₁(k,1),μ₁(k,2),…,μ₁(k,c)]。

本公开实施例中，可以根据公式(1)得到教师神经网络对应的每个目标对象的一阶矩信息，以及得到学生神经网络对应的每个目标对象的一阶矩信息。

一种可能的实施方式中，根据以下步骤确定二阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、特征图中每个像素点的值、以及该目标对象对应的一阶矩信息，确定该目标对象对应的二阶矩信息。

本公开实施例中，可以根据下述公式(2)确定每个目标对象的二阶矩信息：

其中，μ₁(k)为每个目标对象对应的一阶矩信息。示例性的，若第一特征图中包括c个特征图，则μ₂(k)＝[μ₂(k,1),μ₂(k,2),…,μ₂(k,c)]。

本公开实施例中，可以根据公式(2)得到教师神经网络对应的每个目标对象的二阶矩信息，以及得到学生神经网络对应的每个目标对象的二阶矩信息。

一种可能的实施方式中，根据以下步骤确定三阶矩信息：

针对每个目标对象，基于该目标对象对应的像素点数量、该目标对象所在的目标区域样本图像中每个像素点的值、特征图中每个像素点的值、该目标对象对应的一阶矩信息、以及该目标对象对应的二阶矩信息，确定该目标对象对应的三阶矩信息。

本公开实施例中，可以根据下述公式(3)确定每个目标对象的三阶矩信息：

其中，μ₃(k)为每个目标对象对应的三阶矩信息。示例性的，若第一特征图中包括c个特征图，则μ₃(k)＝[μ₃(k,1),μ₃(k,2),…,μ₃(k,c)]。

本公开实施例中，可以根据公式(3)得到教师神经网络对应的每个目标对象的三阶矩信息，以及得到学生神经网络对应的每个目标对象的三阶矩信息。

本公开实施例中，基于每个目标对象对应的统计信息，计算得到关联度时，可以根据以下公式(4)计算关联度：

本公开实施例中，可以得到训练样本图像中包括的任意两个目标对象之间的一阶矩的关联度、二阶矩关联度、以及三阶矩关联度。比如，若训练样本图像A为包括双实线、斑马线、以及背景的图像，则可以根据公式(4)分别得到训练样本图像A对应的第一关联度以及第二关联度，其中，第一关联度以及第二关联度中均包括双实线与斑马线之间的一阶矩的关联度、二阶矩的关联度、三阶矩的关联度，双实线与背景之间的一阶矩的关联度、二阶矩的关联度、三阶矩的关联度，以及斑马线与背景之间一阶矩的关联度、二阶矩的关联度、三阶矩的关联度。

本公开实施例中，在得到训练样本图像对应的第一关联度以及第二关联度之后，可以基于第一关联度以及第二关联度，确定训练样本图像对应的第一关联关系图、第二关联关系图，即得到训练样本图像对应的一阶矩的第一关联关系图、二阶矩的第一关联关系图、三阶矩的第一关联关系图，以及得到训练样本图像对应的一阶矩的第二关联关系图、二阶矩的第二关联关系图、三阶矩的第二关联关系图。其中，一阶矩的第一关联关系图和一阶矩的第二关联关系图可以表征为训练样本图像对应的均值图，二阶矩的第一关联关系图和二阶矩的第二关联关系图可以表征为训练样本图像对应的方差图，三阶矩的第一关联关系图和三阶矩的第二关联关系图可以表征为训练样本图像对应的偏度图。

参见图4所示，若训练样本图像C中包括目标对象A、目标对象B以及背景，图4中左边的图可以为训练样本图像C对应的一阶矩的第一关联关系图，图4中中间的图可以为训练样本图像C对应的二阶矩的第一关联关系图，图4中右边的图可以为训练样本图像C对应的三阶矩的第一关联关系图，其中，图4中包括目标对象A对应的节点401，目标对象B对应的节点402，背景对应的节点403，任意两个目标对象之间的距离为对应的目标对象之间的关联度，比如，图4中左边的图对应的节点401与节点402之间的距离即为目标对象A与目标对象B之间的一阶矩的第一关联度C(k_A,k_B,1)；图4中中间的图对应的节点401与节点402之间的距离即为目标对象A与目标对象B之间的二阶矩的第一关联度C(k_A,k_B,2)。其中，训练样本图像C对应的一阶矩的第二关联关系图、二阶矩的第二关联关系图、三阶矩的第二关联关系图与图4相似，本公开实施例对此不进行赘述。

针对S103：

一种可能的实施方式中，基于确定的第一关联度和第二关联度，确定学生神经网络相比教师神经网络的损失信息，包括：

基于确定的第一关联度和第二关联度，确定学生神经网络相比教师神经网络的关联度损失信息；

基于学生神经网络的交叉熵损失信息、学生神经网络相比教师神经网络的注意力图损失信息、以及学生神经网络相比教师神经网络的关联度损失信息，确定学生神经网络相比教师神经网络的损失信息。

本公开实施例中，学生神经网络相比教师神经网络的损失信息可以包括计算得到的学生神经网络的交叉熵损失信息、以及学生神经网络相比教师神经网络的注意力图损失信息、以及学生神经网络相比教师神经网络的关联度损失信息，即学生神经网络相比教师神经网络的损失信息可以如下公式(5)所示：

L＝L_seg(O,L)+α₁L_m(C_S,C_T)+α₂L_a(A_S,A_T)； (5)；

其中，L_seg(O,L)为学生神经网络的交叉熵损失信息，L_m(C_S,C_T)为学生神经网络相比教师神经网络的关联度损失信息，L_a(A_S,A_T)为学生神经网络相比教师神经网络的注意力图损失信息，α₁、α₂为设置的参数信息。其中，α₁、α₂的值可以根据实际需要进行设置。

示例性的，基于确定的第一关联度以及第二关联度，确定学生神经网络相比教师神经网络的关联度损失信息时，可以根据下述公式(6)计算得到学生神经网络相比教师神经网络的关联度损失信息：

其中，L_m(C_S,C_T)为学生神经网络相比教师神经网络的关联度损失信息；C_S(k₁,k₂,r)为确定的训练样本图像对应的第二关联度，C_T(k₁,k₂,r)为确定的训练样本图像对应的第一关联度。

承接S102的示例继续说明，若训练样本图像A对应的第一关联度包括双实线与斑马线之间的一阶矩的第一关联度C_T(k₁,k₂,1)、二阶矩的第一关联度C_T(k₁,k₂,2)、三阶矩的第一关联度C_T(k₁,k₂,3)，双实线与背景之间的一阶矩的第一关联度C_T(k₁,k_n,1)、二阶矩的第一关联度C_T(k₁,k_n,2)、三阶矩的第一关联度C_T(k₁,k_n,3)，以及斑马线与背景之间一阶矩的第一关联度C_T(k₂,k_n,1)、二阶矩的第一关联度C_T(k₂,k_n,2)、三阶矩的第一关联度C_T(k₂,k_n,3)；第二关联度包括双实线与斑马线之间的一阶矩的第二关联度C_S(k₁,k₂,1)、二阶矩的第二关联度C_S(k₁,k₂,2)、三阶矩的第二关联度C_S(k₁,k₂,3)，双实线与背景之间的一阶矩的第二关联度C_S(k₁,k_n,1)、二阶矩的第二关联度C_S(k₁,k_n,2)、三阶矩的第二关联度C_S(k₁,k_m,3)，以及斑马线与背景之间一阶矩的第二关联度C_S(k₂,k_n,1)、二阶矩的第二关联度C_S(k₂,k_n,2)、三阶矩的第二关联度C_S(k₂,k_n,3)；则将上述第一关联度以及第二关联度代入公式(6)中得到学生神经网络相比教师神经网络的损失信息。

本公开实施例中，可以基于训练样本图像对应的第一特征图以及第二特征图，分别得到教师神经网络对应的第一注意力图以及学生神经网络对应的第二注意力图；基于第一注意力图中每个像素点的像素值以及第二注意力图中国每个像素点的像素值，确定学生神经网络相比教师神经网络的注意力图损失信息。即学生神经网络相比教师神经网络的注意力图损失信息可以如下公式(7)所示：

其中，A_S(i,j)为学生神经网络对应的第二注意力图中每一像素点对应的像素值，A_T(i,j)为教师神经网络对应的第一注意力图中每一像素点对应的像素值。

针对S104：

本公开实施例中，可以基于损失信息，调整学生神经网络的网络参数信息，其中，该网络参数信息可以为学生神经网络的权重参数信息。具体的，可以基于每一训练样本图像，调整的学生神经网络的网络参数信息，直至学生神经网络满足预设的条件为止，比如，直至学生神经网络的准确度值大于设置的准确度阈值为止，或者，直至学生神经网络的损失值小于设置的损失阈值为止等。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

另外，本公开实施例还提供了一种目标检测方法，参见图5所示，该方法包括S501-S502。具体的：

S501，获取目标图像；

S502，利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用本公开实施例提供的训练神经网络的方法得到的学生神经网络。

另外，本公开实施例还提供了一种行驶控制方法，参见图6所示，该方法包括S601-S603。具体的：

S601，获取行驶装置在行驶过程中采集的道路图像。

S602，利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用本公开实施例提供的训练神经网络的方法得到的学生神经网络。

S603，基于所述道路图像中包括的目标对象，控制所述行驶装置。

示例性的，行驶装置可以为自动驾驶车辆、装有高级驾驶辅助系统(AdvancedDriving Assistance System，ADAS)的车辆、或者机器人等。道路图像可以为行驶装置在行驶过程中实时采集到的图像。目标对象可以为道路中可以能出现的任一标识、和/或任一物体和/或、任一对象。比如，目标对象可以为斑马线、右拐等路面标识，也可以为禁止停车等的标识牌，还可以为出现在道路上的动物、行人等，也可以为道路上的其他车辆等。

其中，在控制行驶装置时，可以控制行驶装置加速、减速、转向、制动等，或者可以播放语音提示信息，以提示驾驶员控制行驶装置加速、减速、转向、制动等。

基于相同的构思，本公开实施例还提供了一种训练神经网络的装置，参见图7所示，为本公开实施例提供的一种训练神经网络的装置的架构示意图，包括目标区域样本图像确定模块701、关联度确定模块702、损失信息确定模块703以及调整模块704，具体的：

目标区域样本图像确定模块701，用于基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像，其中，所述训练样本图像包含多个目标对象，每个目标区域样本图像中包含一个目标对象；

关联度确定模块702，用于基于训练好的教师神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第一关联度，以及基于待训练的学生神经网络和所述多个目标区域样本图像，确定所述训练样本图像的第二关联度；其中，所述第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度；

损失信息确定模块703，用于基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息；

调整模块704，用于基于所述损失信息，调整所述学生神经网络的网络参数信息。

一种可能的实施方式中，所述目标区域样本图像确定模块701，在基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像的情况下，用于：

一种可能的实施方式中，所述目标区域样本图像确定模块701，在基于与每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像的情况下，用于：

一种可能的实施方式中，所述关联度确定模块702，用于：

一种可能的实施方式中，所述关联度确定模块702，用于根据以下步骤确定所述一阶矩信息：

一种可能的实施方式中，所述关联度确定模块702，用于根据以下步骤确定所述二阶矩信息：

一种可能的实施方式中，所述关联度确定模块702，用于根据以下步骤确定所述三阶矩信息：

一种可能的实施方式中，所述损失信息确定模块703，在基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息的情况下，用于：

本公开实施例还提供了一种目标检测装置，参见图8所示，为本公开实施例提供的一种目标检测装置的架构示意图，包括图像获取模块801、检测模块802，具体的：

图像获取模块801，用于获取目标图像；

检测模块802，用于利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用第一方面或者第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络。

本公开实施例还提供了一种行驶控制装置，参见图9所示，为本公开实施例提供的一种行驶装置控制装置的架构示意图，包括道路图像获取模块901、目标对象检测模块902、控制模块903，具体的：

道路图像获取模块901，用于获取行驶装置在行驶过程中采集的道路图像；

目标对象检测模块902，用于利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用第一方面或者第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络；

控制模块903，用于基于所述道路图像中包括的目标对象，控制所述行驶装置。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模板可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

基于同一技术构思，本公开实施例还提供了一种电子设备。参照图10所示，为本公开实施例提供的电子设备的结构示意图，包括处理器1001、存储器1002、和总线1003。其中，存储器1002用于存储执行指令，包括内存10021和外部存储器10022；这里的内存10021也称内存储器，用于暂时存放处理器1001中的运算数据，以及与硬盘等外部存储器10022交换的数据，处理器1001通过内存10021与外部存储器10022进行数据交换，当电子设备1000运行时，处理器1001与存储器1002之间通过总线1003通信，使得处理器1001在执行以下指令：

基于同一技术构思，本公开实施例还提供了一种电子设备。参照图11所示，为本公开实施例提供的电子设备的结构示意图，包括处理器1101、存储器1102、和总线1103。其中，存储器1102用于存储执行指令，包括内存11021和外部存储器11022；这里的内存11021也称内存储器，用于暂时存放处理器1101中的运算数据，以及与硬盘等外部存储器11022交换的数据，处理器1101通过内存11021与外部存储器11022进行数据交换，当电子设备1100运行时，处理器1101与存储器1102之间通过总线1103通信，使得处理器1101在执行以下指令：

获取目标图像；

利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用第一方面或者第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络。

基于同一技术构思，本公开实施例还提供了一种电子设备。参照图12所示，为本公开实施例提供的电子设备的结构示意图，包括处理器1201、存储器1202、和总线1203。其中，存储器1202用于存储执行指令，包括内存12021和外部存储器12022；这里的内存12021也称内存储器，用于暂时存放处理器1201中的运算数据，以及与硬盘等外部存储器12022交换的数据，处理器1201通过内存12021与外部存储器12022进行数据交换，当电子设备1200运行时，处理器1201与存储器1202之间通过总线1203通信，使得处理器1201在执行以下指令：

获取行驶装置在行驶过程中采集的道路图像；

利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用第一方面或者第一方面任一实施方式所述的训练神经网络的方法得到的学生神经网络；

基于所述道路图像中包括的目标对象，控制所述行驶装置。

此外，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的训练神经网络的方法的步骤。

本公开实施例所提供的训练神经网络的方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的训练神经网络的方法的步骤，具体可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种训练神经网络的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于获取的训练样本图像，确定所述训练样本图像对应的多个目标区域样本图像，包括：

3.根据权利要求2所述的方法，其特征在于，基于与每个目标对象对应的所述二值图像，得到所述训练样本图像对应的多个目标区域样本图像，包括：

4.根据权利要求1所述的方法，其特征在于，根据以下步骤确定训练样本图像的关联度：

5.根据权利要求4所述的方法，其特征在于，所述统计信息包括一阶矩信息、二阶矩信息、和三阶矩信息中的至少一种。

6.根据权利要求5所述的方法，其特征在于，根据以下步骤确定所述一阶矩信息：

7.根据权利要求5所述的方法，其特征在于，根据以下步骤确定所述二阶矩信息：

8.根据权利要求5所述的方法，其特征在于，根据以下步骤确定所述三阶矩信息：

9.根据权利要求1所述的方法，其特征在于，基于确定的所述第一关联度和所述第二关联度，确定所述学生神经网络相比所述教师神经网络的损失信息，包括：

10.一种目标检测方法，其特征在于，包括：

获取目标图像；

利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用权利要求1至9任一项所述的训练神经网络的方法得到的学生神经网络。

11.一种行驶控制方法，其特征在于，包括：

获取行驶装置在行驶过程中采集的道路图像；

利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用权利要求1至9任一项所述的训练神经网络的方法得到的学生神经网络；

基于所述道路图像中包括的目标对象，控制所述行驶装置。

12.一种训练神经网络的装置，其特征在于，包括：

关联度确定模块，用于基于训练好的教师神经网络以及所述多个目标区域样本图像，确定所述训练样本图像的第一关联度，以及基于待训练的学生神经网络以及所述多个目标区域样本图像，确定所述训练样本图像的第二关联度；其中，所述第一关联度和第二关联度用于表征训练样本图像中包括的任意两个目标对象之间的相似程度；

13.一种目标检测装置，其特征在于，包括：

图像获取模块，用于获取目标图像；

检测模块，用于利用目标检测神经网络对所述目标图像进行目标检测，所述目标检测神经网络是采用权利要求1至9任一项所述的训练神经网络的方法得到的学生神经网络。

14.一种行驶控制装置，其特征在于，包括：

目标对象检测模块，用于利用目标检测神经网络对所述道路图像进行目标检测，确定所述道路图像中包括的目标对象；所述目标检测神经网络是采用权利要求1至9任一项所述的训练神经网络的方法得到的学生神经网络；

15.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的训练神经网络的方法的步骤、或执行权利要求10所述的目标检测方法、或执行权利要求11所述的行驶控制方法。

16.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至9任一所述的训练神经网络的方法的步骤、或执行权利要求10所述的目标检测方法、或执行权利要求11所述的行驶控制方法。