CN111783936A

CN111783936A - 卷积神经网络构建方法、装置、设备及介质

Info

Publication number: CN111783936A
Application number: CN202010414640.2A
Authority: CN
Inventors: 夏春龙
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-10-16
Anticipated expiration: 2040-05-15
Also published as: CN111783936B

Abstract

本发明实施例提供了一种卷积神经网络构建方法、装置、设备及介质，所述方法包括：从原始卷积神经网络中确定待替换的卷积模块，所述待替换的卷积模块包括多个卷积层，且所述待替换的卷积模块的输入端与输出端之间具有直连分支；将所述待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络，其中，所述感受野自适应模块用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；所述感受野自适应模块的输出与所述直连分支的输出之和，为下一个所述待替换的卷积模块的输入。

Description

卷积神经网络构建方法、装置、设备及介质

技术领域

本发明涉及深度学习技术领域，特别是涉及一种卷积神经网络构建方法、装置、设备及介质。

背景技术

图像识别是计算视觉领域的一项基本任务，能够识别或者验证图像中目标主体的身份、属性或类别。现有的图像识别方法主要是以神经网络为代表的可学习特征方法，神经网络由于其强大的、无需人为精细设计的、自适应的特征表达能力，被广泛应用于图像识别任务中。

实际中，为了提高识别效率，一般采用卷积神经网络进行图像识别。卷积神经网络包括多种框架模型，例如AlexNet、Resnet、Resnext、Mobilenet、Shufflenet和VGG等。这些模型可以通过逐层累计扩大模型的感受野，节省算力和存储资源，但是全局信息有丢失，且没有较高效的注意力机制，导致识别过程中提取到的信息并不是有效的关键信息。

针对这一问题，相关技术中提出了GoogLeNe，Res2net和3FPN等模型结构以缓解信息丢失以及感受野单一的问题。但是，这些模型仍然存在以下不足：模型设计仍然不够智能，对不同感受野的特征图进行特征提取的精度不高。

发明内容

鉴于上述问题，提出了本发明实施例的一种卷积神经网络构建方法、装置、系统、设备及介质，以便克服上述问题或者至少部分地解决上述问题。

为了解决上述问题，本发明的第一方面公开了一种卷积神经网络构建方法，所述方法包括：

从原始卷积神经网络中确定待替换的卷积模块，所述待替换的卷积模块包括多个卷积层，且所述待替换的卷积模块的输入端与输出端之间具有直连分支，所述待替换卷积模块的输入与所述直连分支的输入共享；

将所述待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络，其中，所述感受野自适应模块用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；所述感受野自适应模块的输出与所述直连分支的输出之和，为下一个所述待替换的卷积模块的输入。

可选地，所述感受野自适应模块包括：包括第一融合子模块、权重生成子模块、与每种感受野对应的特征图处理子模块以及第二融合子模块；

所述第一融合子模块用于对所述多种感受野的特征图进行融合，得到融合后的特征图；

所述权重生成子模块用于对所述融合后的特征图进行处理，以生成所述多种感受野各自对应的权重值；

与每种感受野对应的特征图处理子模块，用于根据该种感受野对应的权重值，对该种感受野的特征图进行处理，得到该种感受野的处理后特征图；

所述第二融合子模块，用于对多种感受野各自的处理后特征图进行融合，得到处理后的特征图。

可选地，所述感受野自适应模块还包括：多个卷积单元，所述多个卷积单元相互级联且卷积尺寸相同，一个卷积单元用于输出一种感受野的特征图，下一级的卷积单元的输入为上一级的卷积单元的输出。

可选地，所述权重生成子模块包括：

顺次连接的维度调整单元、全连接层以及softmax函数层；

其中，所述维度调整单元用于对所述融合后的特征图进行维度调整，所述维度调整单元为池化单元或预设卷积尺寸的卷积单元。

可选地，所述感受野自适应模块的输出端与所述直连分支的输出端之间设置有第一维度调整子模块，用于将所述感受野自适应模块输出的处理后的特征图的维度，调整至与所述直连分支输出的特征图的维度相同。

可选地，所述感受野自适应模块的输入端之前设置有第二维度调整子模块，用于对输入所述感受野自适应模块的特征图的维度进行调整，得到维度调整后的特征图，并输入所述感受野自适应模块。

可选地，所述方法还包括：以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型。

可选地，以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型，包括：

以样本图像集为训练样本，对所述目标卷积神经网络进行训练；

在训练过程中，获得多个经过不同训练次数的候选图像识别模型；

从多个所述候选图像识别模型中筛选满足预设测试条件的模型，得到用于进行图像识别的图像识别模型。

可选地，在得到用于进行图像识别的图像识别模型之后，所述方法包括：

获得待识别图像；

对所述待识别图像进行特征提取，得到所述待识别图像的特征图；

将所述待识别图像的特征图输入图像识别模型中，得到图像识别结果。

本发明的第二方面公开了一种卷积神经网络构建装置，所述装置包括：

确定模块，用于从原始卷积神经网络中确定待替换的卷积模块，所述待替换的卷积模块包括多个卷积层，且所述待替换的卷积模块的输入端与输出端之间具有直连分支，所述待替换卷积模块的输入与所述直连分支的输入共享；

替换模块，用于将所述待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络，其中，所述感受野自适应模块用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；所述感受野自适应模块的输出与所述直连分支的输出之和，为下一个所述待替换的卷积模块的输入。

本发明实施例的第三方面，还公开了一种电子设备，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述设备执行如本发明第一方面实施例所述的卷积神经网络构建方法。

本发明实施例的第四方面，还公开了一种计算机可读存储介质，其存储的计算机程序使得处理器执行如本发明第一方面实施例所述的卷积神经网络构建方法。

本发明实施例包括以下优点：

在本发明实施例中，可以将原始神经网络中待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络，其中，感受野自适应模块可以用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；进而该处理后的特征图可以与直连分支的输出之和作为下一个卷积模块的输入。如此，便构建了一个目标卷积神经网络，进而可以对该目标卷积神经网络进行训练，从而得到所需要的模型。

由于感受野自适应模块可以生成与多个感受野对应的权重值，则使得目标卷积神经网络可以自主学习到各个感受野的重要性，提高了模型设计的智能性，避免人为设计各个感受野对应的重要性时产生的不合理问题，进而提高了对不同感受野的特征图进行特征提取的精度，从而提高了图像识别的效率。又由于输入到感受野自适应模块的特征图可以与感受野自适应模块输出的处理后的特征图进行融合后输入到下一层，可以保证目标卷积神经网络的收敛。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例的一种原始卷积神经网络的结构示意图；

图2是本发明一实施例的一种卷积神经网络构建方法的步骤流图；

图3是本发明一实施例的一种感受野自适应模块的结构示意图；

图4是本发明一实施例的一种替换后的卷积模块的结构示意图；

图5是本发明一示例中替换后的卷积模块的结构示意图；

图6是示出了将图4或图3所示的感受野自适应模块替换到图1所示的卷积模块后的结构示意图；

图7是本发明一实施例的一种卷积神经网络构建装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

申请人鉴于相关技术中各类模型设计仍然不够智能，对不同感受野的特征图进行特征提取的精度不高的缺点，提出了一种卷积神经网络构建方法，该方法主要将原始的卷进神经网络模型中的卷积模块替换为感受野自适应模块，以自动学习不同感受野的重要性，从而提高模型的智能化，以提高特征提取的精度。

下面，对本发明的一种卷积神经网络构建方法进行详细阐述。需要说明的是：本发明提供的卷积神经网络构建方法可以应用于终端设备或服务器中。

参照图1所示，示出了本实施例的一种待处理的原始神经网络的网络结构图，如图1所示的原始神经网络为ResNet18，该ResNet18网络包括全连接层和多个卷积模块。

结合图1所示的卷积神经网络，对本实施例的一种卷积神经网络构建方法进行介绍。

参照图2所示，示出了本实施例的一种卷积神经网络构建方法的步骤流程图，如图2所示，具体可以包括以下步骤：

步骤S201：从原始卷积神经网络中确定待替换的卷积模块。

其中，所述待替换的卷积模块包括多个卷积层，且所述待替换的卷积模块的输入端与输出端之间具有直连分支，所述待替换卷积模块的输入与所述直连分支的输入共享。

一般而言，原始卷积神经网络中可以包括多个卷积模块，当然，原始卷积神经网络除包括多个卷积模块外，还可以包括池化层、全连接层等。池化层用于保留主要的特征同时减少参数和计算量，全连接层可以把得到的特征信息提取整合。其中，原始神经网络中的每个卷积模块都可以被确定为待替换的卷积模块，即本申请可以对原始神经网络的每个卷积模块进行替换。

其中，每个卷积模块可以用于对上一卷积模块输出的特征图进行卷积处理，以获得全局特征，进而再向下一卷积模块输出卷积处理后的特征图。卷积模块的输入端与输出端之间具有的直连分支可以理解为是将输入到该卷积模块的特征图直接输出，或者对输入到该卷积模块的特征图进行下采样后输出，之后，该直连分支的输出与该卷积模块的输出之和作为下一卷积模块的输入。

仍如图1所示，图1中虚线框中所标注出的便是一个卷积模块，可以看出ResNet18共包括8个卷积模块。其中，每个卷积模块可以包括两个卷积层，每个卷积模块在输入端和输出端均具有直连分支，该直连分支可以将输入到卷积模块的特征图直接输出，或对特征图进行下采样后再输出。

步骤S202：将所述待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络。

其中，所述感受野自适应模块用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；所述感受野自适应模块的输出与所述直连分支的输出之和，为下一个所述待替换的卷积模块的输入。

本实施例中，可以将待替换的卷积模块中所包括的多个卷积层替换为感受野自适应模块，这样，使得待替换的卷积模块的输入端和输出端之间的直连分支被保留。

具体而言，终端设备或服务器在将待替换的卷积模块替换为感受野自适应模块时，可以根据用户的替换指令，将待替换的卷积模块中的多个卷积层剔除，进而添加进感受野自适应模块，添加感受野自适应模块后便得到了目标卷积神经网络。其中，各个待替换的卷积模块之间的直连分支可以保持不变。

如图1所示，虚线框所框出的部分为一个待替换的卷积模块101，可以对其中的“conv3×3,128,/2”的卷积层和“conv3×3,128”的卷积层进行替换，将“conv3×3,128,/2”的卷积层和“conv3×3,128”的卷积层替换为感受野自适应模块。替换后，该卷积模块101的直连分支的输出与该感受野自适应模块的输出之和便可以作为下一个卷积模块的输入。

或者，如图1所示，若待替换的卷积模块是卷积模块102，则该卷积模块102的直连分支的输出与该感受野自适应模块的输出之和便可以作为后续的池化层的输入。

其中，感受野自适应模块可以用于为多种感受野分别生成对应的权重值，具体而言，多种感受野可以是指多种具有不同感受野的特征图，即，感受野自适应模块可以对输入的特征图进行多种不同尺度的卷积处理，进而得到多个不同感受野的特征图，并可以为多个不同感受野的特征图生成对应的权重值，进而按照多种感受野分别对应的权重值，对多种感受野的特征图进行处理，并输出处理后的特征图。

其中，一个感受野对应的权重值可以表征该感受野在多种感受野中的重要性，多种感受野各自对应的权重值之和可以为小于或等于1。

这样，通过感受野自适应模块便可以为多种感受野分别生成对应的权重值，从而使得模型可以自动学习到多种感受野的重要性，提高模型的智能性和输出的特征图的精度，从而提高识别的准确度和效率。

参照图3所示，示出了一种实施方式中的感受野自适应模块的结构示意图，如图3所示，所述感受野自适应模块300可以包括：第一融合子模块、权重生成子模块303、与每种感受野对应的特征图处理子模块以及第二融合子模块。

下面，结合图3所示，对此种实施方式下的感受野自适应模块中的各个子模块进行详细介绍：

首先，第一融合子模块可以用于对所述多种感受野的特征图进行融合，得到融合后的特征图。

本实施例中，第一融合子模块对多种感受野的特征图进行融合可以是指将多种感受野的特征图进行相加，进而得到融合后的特征图。具体实现中，该第一融合子模块还可以用于将融合后的特征图reshape(转换)成一个张量，例如，融合后的特征图为(N,C,H,W)，则可以将该特征图(N,C,H,W)reshape成(N,HW,C,1)的张量，进而将该(N,HW,C,1)作为融合后的特征图。

在又一种实施方式中，感受野自适应模块还可以用于得到多种感受野的特征图，即，感受野自适应模块可以生成多种感受野的特征图，并得到多种感受野各自对应的权重值。

如图3所示，感受野自适应模块还可以包括：多个卷积单元，所述多个卷积单元相互级联且卷积尺寸相同，一个卷积单元用于输出一种感受野的特征图，下一级的卷积单元的输入为上一级的卷积单元的输出。

此实施方式中，其中，级联的多个卷积单元均可以各自输出经卷积处理后的特征图，这样，使得多个卷积单元输出的特征图之间均可以共享部分感受野，进而可以获得多种感受野的特征图。

本实施方式中，卷积尺寸也可以理解为是卷积核大小，卷积尺寸不同，其局部感受野也不同，其中，多个卷积单元的参数可以相互独立。

示例地，如图3所示，感受野自适应模块包括二个级联的卷积单元301和302，每个卷积单元的卷积尺寸为conv3×3。其中，对于两个级联conv3×3的卷积单元，便相当于一个conv5×5的卷积尺寸，则前一个卷积单元输出的特征图是经conv3×3处理后的特征图，后一个卷积单元对该conv3×3处理后的特征图继续进行conv3×3的处理，得到conv5×5的特征图。

采用该实施方式时，多个卷积单元相互级联且卷积尺寸相同的情况下，下一级的卷积单元的输入即为上一级的卷积单元的输出，这样，在减小参数个数的同时，下一级的卷积单元便可以共享上一级卷积的单元输出的特征图，即下一级的卷积单元可以共享上一级的卷积单元的感受野。

其次，权重生成子模块可以用于对所述融合后的特征图进行处理，以生成所述多种感受野各自对应的权重值。

在得到融合后的特征图之后，可以将融合后的特征图输入到权重生成子模块，以输出与每种感受野对应的权重值。

在一种实施方式中，如图3所示，权重生成子模块303可以包括顺次连接的维度调整单元、全连接层以及softmax函数层。

在本实施方式中，权重生成子模块的维度调整单元可以先用于对融合后的特征图进行维度调整。具体而言，维度调整单元为池化单元或预设卷积尺寸的卷积单元，其中，池化单元可以采用平均池化或最大池化的处理方式对融合后的特征图进行自适应性降维，预设卷积尺寸的卷积单元可以是conv1x1的卷积单元。

示例地，输入到维度调整单元的融合后的特征图为(N,HW,C,1)，经维度调整单元后，得到特征图(N,1,C,1)，实际中，为了得到与多种感受野对应的权重值，维度调整单元可以继续将该特征图(N,1,C,1)reshape为特征图(N,C)的张量，将该(N,C)的张量作为维度调整后的特征图。

其中，全连接层可以用于对维度调整后的特征图进行信息整合，并将信息整合后的特征图输入到softmax函数层，该softmax函数层可以用于输出不同感受野的权重值，进而得到不同感受野特征的重要性，即得到与每个感受野单独对应的权重值。

最后，与每种感受野对应的特征图处理子模块303，可以用于根据该种感受野对应的权重值，对该种感受野的特征图进行处理，得到该种感受野的处理后特征图。

本实施方式中，每个感受野对应一个该感受野的特征图，且输出了该感受野对应的权重值，进而将该种感受野对应的权重值与该种感受野的特征图进行点乘，得到该种感受野的处理后特征图。

最后，第二融合子模块可以用于对多种感受野各自的处理后特征图进行融合，得到处理后的特征图。

在得到每种感受野的处理后特征图后，便可以将到每种感受野的处理后特征图输入到第二融合子模块，以对多种感受野的处理后特征图进行相加，从而得到处理后的特征图，并将该处理后的特征图输出。最后，可以将处理后的特征图与直连分支输出的特征图进行相加后作为下一个卷积模块的输入。

结合图3所示的感受野自适应模块的示意图，在一种实施方式中，为了减少感受野自适应模块的计算量，可以在感受野自适应模块中设置维度调整子模块。

参照图4所示，示出了该实施方式一种替换后的卷积模块的结构示意图，如图4所示，该替换后的卷积模块除包括感受野自适应模块外，还可以包括维度调整子模块。

下面，对该实施方式中维度调整子模块的具体设置进行详细阐述：

在一种具体实现中，感受野自适应模块的输出端与所述直连分支的输出端之间设置有第一维度调整子模块，用于将所述感受野自适应模块输出的处理后的特征图的维度，调整至与所述直连分支输出的特征图的维度相同。

具体实施时，可以根据直连分支输出的特征图的维度，对处理后的特征图的维度进行调整，以使处理后的特征图的维度与直连分支输出的特征图的维度相同，实际中，可以通过一个r_o参数和conv1×1的卷积核来控制处理后的特征图的维度。

在又一种具体实现中，感受野自适应模块的输入端之前设置有第二维度调整子模块，用于对输入所述感受野自适应模块的特征图的维度进行调整，得到维度调整后的特征图，并输入所述感受野自适应模块。

其中，在感受野自适应模块的输入端之前设置的第二维度调整子模块可以用于降低输入到感受野自适应模块的特征图的维度，进而减少计算量。实际中，可以通过一个r_i参数和conv1x1的卷积来降低输入的特征图的维度。

参照图5所示，示出了本发明一示例中被替换后的卷积模块的结构示意图，如图5所示，其中，AR为本实施例中的感受野自适应模块，右边的虚线框示出了感受野自适应模块的具体结构。

下面结合图5所示，按照对特征图处理的先后顺序，对本实施例中的各个模块进行完整阐述。

其中，输入到该卷积神经网络的特征图是(N,C,H,W)，其中，N表示输入到该原始卷积神经网络的图像的数量，C表示通道数，H表示特征图的的高、W表示特征图的宽。首先经过第二维度调整子模块“conv1x1，r_i”降维后，得到特征图(N,C/r_i,H,W)，之后，将该特征图(N,C/r_i,H,W)输入到感受野自适应模块AR。

接着，该感受野自适应模块AR对特征图(N,C/r_i,H,W)进行不同尺度的卷积处理，首先经过第一个卷积单元conv3x3后输出特征图(N,C/r_i,H',W')，该特征图(N,C/r_i,H',W')又经第二个卷积单元conv3x3后输出特征图(N,C/r_i,H',W')，将两个特征图(N,C/r_i,H',W')输入到第一融合子模块500进行相加后再进行reshape，得到融合后的特征图(N,H'W',C/r_i,1)。

之后，将该特征图(N,H'W',C/r_i,1)输入到conv1x1进行维度调整，即池化处理，进而得到特征图(N,1,C/r_i,1)，然后对该特征图(N,1,C/r_i,1)进行转换，得到特征图(N,C/r_i)，将该特征图(N,C/r_i)依次输入到全连接层FC和softmax函数层，得到由softmax函数层输出的与第一个卷积单元conv3x3输出的特征图(N,C/r_i,H',W')对应的权重值(N,C/r_i)，以及与第二个卷积单元conv3x3输出的特征图(N,C/r_i,H',W')对应的权重值(N,C/r_i)。

接着，与第一种感受野对应的特征图处理子模块501，对第一个卷积单元conv3x3输出的特征图(N,C/r_i,H',W')和对应的权重值(N,C/r_i)进行点乘，得到点乘后的特征图(N,C/r_i,H',W')；同理，与第二种感受野对应的特征图处理子模块502，对第二个卷积单元conv3x3输出的特征图(N,C/r_i,H',W')和对应的权重值(N,C/r_i)进行点乘，得到点乘后的特征图(N,C/r_i,H',W')。

接着，第二融合子模块503对两个点乘后的特征图进行相加，得到感受野自适应模块输出的处理后特征图(N,C/r_i,H',W')。

最后，由于第二融合子模块503输出的处理后特征图(N,C/r_i,H',W')是经“conv1x1，r_i”降维后的特征图，为了与直连分支输出的特征图(N,C,H,W)的维度保持一致，则可以将第二融合子模块503输出的处理后特征图(N,C/r_i,H',W')输入到第一维度调整子模块“conv1x1，r_o”进行升维，得到升维后的特征图(N,C_o,H',W')。

最后，将该升维后的特征图(N,C_o,H',W')与直连分支输出的特征图(N,C,H,W)进行相加后，输出到下一卷积模块。

参照图6所示，示出了将图4或图3所示的感受野自适应模块添加到图1所示的Resnet18后的网络结构示意图。其中，shortcut为直连分支。实际中，可以以样本图像集为训练样本，对如图6所示的模型进行训练，从而得到图像识别模型。所得到的图像识别模型与如图6所示的模型的结构相同。

其中，将卷积模块替换为感受野自适应模块后，便得到了目标卷积神经网络，该目标卷积神经网络的超参数设置可以与原始卷积神经网络一致，这样，目标卷积神经网络便可以继承到原始神经网络的超参数，从而可以直接将该目标卷积神经网络作为初始的图像识别模型对图像进行处理。即，得到的目标卷积神经网络由于继承了原始神经网络的超参数，从而可以直接作为图像识别模型对图像进行处理。

在一种实施方式中，在得到目标卷积神经网络后，也可以进一步完善该目标卷积神经网络，以提高目标卷积神经网络的图像处理效率。则相应地，可以以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型。

本实施例中，可以对该目标卷积神经网络进行训练，在训练该目标卷积神经网络时，设置的超参数可以与原始卷积神经网络一致。

其中，样本图像集中可以包括针对同一图像识别任务的多张样本图像，根据实际训练需求，每张样本图像可以携带标签也可以不携带标签。

其中，图像识别任务可以是人脸图像识别任务、图像分类任务、属性识别任务、指纹图像识别任务、虹膜图像识别任务等。则相应地，针对人脸图像识别任务，样本图像集中便可以包括多个来自不同人脸或同一人脸的人脸图像；针对属性识别任务，样本图像集中便可以包括多个具有不同属性的样本图像；针对指纹图像识别任务，样本图像集中便可以包括多个具有来自不同手指或同一手指的指纹图像；针对虹膜图像识别任务，样本图像集中便可以包括多个具有来自不同眼睛或同一眼睛的虹膜图像。

本实施例中，针对不同的图像识别任务，可以按照相应的相关技术对所述目标卷积神经网络进行训练，以得到图像识别模型，其中，所得到的图像识别模型的结构与目标卷积神经网络的结构一致。

在一种具体实现中，在以样本图像集为训练样本，对所述目标卷积神经网络进行训练时，可以将训练结束时的目标卷积神经网络，确定为用于进行图像识别的图像识别模型。

实际中，可以在图像识别的准确率达到预设准确率时，视为训练结束，进而将此时的目标卷积神经网络确定为图像识别模型。

在另一种具体实现中，在以样本图像集为训练样本，对所述目标卷积神经网络进行训练时，可以以样本图像集为训练样本，对所述目标卷积神经网络进行训练，并在训练过程中，获得多个经过不同训练次数的候选图像识别模型，进而，可以从多个所述候选图像识别模型中筛选满足预设测试条件的模型，得到用于进行图像识别的图像识别模型。

本具体实现中，可以将样本图像集中的多个图像样本分批次输入目标卷积神经网络进行训练，例如，分100批输入目标卷积神经网络进行训练，则会对目标卷积神经网络训练100次。

则实际中，可以将每一次训练结束时的目标卷积神经网络进行保存，例如，进行100次训练则保存100个目标卷积神经网络。或者，也可以在预设多次训练后，再将后续的每一次训练结束时的目标卷积神经网络进行保存，例如，在50次之后开始保存，则保存50个目标卷积神经网络。或者，可以将每N次训练结束时的目标卷积神经网络进行保存，例如，每10次训练进行保存，则保存了10个目标卷积神经网络。

其中，每次被保存的目标卷积神经网络可以作为候选图像识别模型，进而得到多个候选图像识别模型。

在得到多个候选图像识别模型后，便可以以测试样本为输入，对多个候选图像识别模型进行测试，以得到多个候选图像识别模型各自输出的测试结果。根据测试结果可以确定图像识别的准确率，进而可以从多个候选图像识别模型中筛选出准确率最高的候选图像识别模型，将准确率最高的候选图像识别模型确定为图像识别模型。但本发明实施例不以此为限，或者，还可以将迭代训练N次后得到的目标卷积神经网络，确定为该图像识别模型，其中N为正整数，其具体取值可以根据实际应用情况进行设置。

通过上述实施例，在得到图像识别模型后，便可以采用该图像识别模型进行图像识别，具体地，在利用图像识别模型进行图像识别时，具体可以包括以下步骤：

步骤S203：获得待识别图像。

其中，根据图像识别任务，待识别图像可以是人脸图像、指纹图像或针对一个特定对象所拍摄的图像。

步骤S204：对所述待识别图像进行特征提取，得到所述待识别图像的特征图。

本实施例中，可以对待识别图像进行特征提取，具体而言，可以是对待识别图像进行特征编码，以对待识别图像中的信息进行数学量化，从而得到待识别图像的特征图。

步骤S205：将所述待识别图像的特征图输入图像识别模型中，得到图像识别结果。

本实施例中，可以将待识别图像的特征图输入图像识别模型的输入端，图像识别模型可以对待识别图像的特征图进行池化处理、卷积处理等，其中，图像识别模型中每个卷积模块的感受野自适应模块可以生成与多种感受野对应的权重值，并根据多种感受野对应的权重值对多种感受野的特征图进行处理，输出处理后特征图，进而使得图像识别模型在对待识别图像进行识别时，可以自主学习不同感受野的重要性，从而提高特征图提取的精度。

本发明实施例，由于输入到感受野自适应模块的特征图可以与感受野自适应模块输出的处理后的特征图进行融合后输入到下一层，可以保证模型的收敛。又由于感受野自适应模块可以生成与多个感受野对应的权重值，则使得图像识别模块可以自主获得各个感受野的重要性，从而避免人为设计各个感受野对应的重要性时产生的不合理问题，进而提高了图像识别模型对图像进行识别的效率和准确率。

需要说明的是：在得到本申请实施例的目标卷积神经网络后，也可以继续对该目标卷积神经网络的结构进行完善，以提高目标卷积神经网络进行图像处理的效率和准确率。例如，可以在目标卷积神经网络的每个感受野自适应模块的输出端和直连分支的输出端之间可以增加全局自适应模块，全局自适应模块可以对感受野自适应模块输出的特征图在通道和空间上的权重进行充分分配，以提取更强的全局信息，该全局自适应模块的输出与直连分值的输出之和便可以作为下一个感受野自适应模块的输入。

当然，在实际中，还可以对感受野自适应模块的结构进行完善，例如，可以在感受野自适应模块中增加多尺度感知单元，其中，多尺度感知单元用于根据输入到该层的特征图，输出多种尺度的特征图，即输出多种感受野的特征图，进而由感受野自适应模块为多种感受野的特征图分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

基于同一发明构思，参考图7，示出了本发明实施例的一种卷积神经网络构建装置的框架示意图，如图7所示，具体可以包括以下模块：

确定模块701，用于从原始卷积神经网络中确定卷积模块的输出端，所述卷积模块包括多个卷积层，且所述卷积模块的输入端与输出端之间具有直连分支，所述卷积模块的输入与所述直连分支的输入共享；

替换模块702，用于将所述待替换的卷积模块替换为感受野自适应模块，得到目标卷积神经网络，其中，所述感受野自适应模块用于为多种感受野分别生成对应的权重值，以对所述多种感受野的特征图进行处理，并输出处理后的特征图；所述感受野自适应模块的输出与所述直连分支的输出之和，为下一个所述待替换的卷积模块的输入；

训练模块703，用于以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型。

可选地，所述权重生成子模块包括：顺次连接的维度调整单元、全连接层以及softmax函数层；

可选地，所述训练模块703，具体可以用于以样本图像集为训练样本，对所述目标卷积神经网络进行训练，将训练结束时的目标卷积神经网络，确定为用于进行图像识别的图像识别模型。

可选地，所述训练模块703，具体可以包括以下单元：

训练单元，用于以样本图像集为训练样本，对所述目标卷积神经网络进行训练；

保存单元，用于在训练过程中，获得多个经过不同训练次数的候选图像识别模型；

筛选单元，用于从多个所述候选图像识别模型中筛选满足预设测试条件的模型，得到用于进行图像识别的图像识别模型。

可选地，所述装置可以包括以下模块：

图像获得模块，用于获得待识别图像；

特征提取模块，用于对所述待识别图像进行特征提取，得到所述待识别图像的特征图；

图像输入模块，用于将所述待识别图像的特征图输入图像识别模型中，得到图像识别结果。

本发明实施例还提供了一种电子设备，该电子设备可以用于执行卷积神经网络构建方法，可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器被配置为执行所述的卷积神经网络构建方法。

本发明实施例还提供了一种计算机可读存储介质，其存储的计算机程序使得处理器执行如本发明实施例所述的卷积神经网络构建方法。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种卷积神经网络构建方法、装置、设备和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种卷积神经网络构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述感受野自适应模块包括：包括第一融合子模块、权重生成子模块、与每种感受野对应的特征图处理子模块以及第二融合子模块；

3.根据权利要求2所述的方法，其特征在于，所述感受野自适应模块还包括：多个卷积单元，所述多个卷积单元相互级联且卷积尺寸相同，一个卷积单元用于输出一种感受野的特征图，下一级的卷积单元的输入为上一级的卷积单元的输出。

4.根据权利要求2所述的方法，其特征在于，所述权重生成子模块包括：

顺次连接的维度调整单元、全连接层以及softmax函数层；

5.根据权利要求1所述的方法，其特征在于，所述感受野自适应模块的输出端与所述直连分支的输出端之间设置有第一维度调整子模块，用于将所述感受野自适应模块输出的处理后的特征图的维度，调整至与所述直连分支输出的特征图的维度相同。

6.根据权利要求1所述的方法，其特征在于，所述感受野自适应模块的输入端之前设置有第二维度调整子模块，用于对输入所述感受野自适应模块的特征图的维度进行调整，得到维度调整后的特征图，并输入所述感受野自适应模块。

7.根据权利要求1-6任一所述的方法，其特征在于，还包括：以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型。

8.根据权利要求7所述的方法，其特征在于，以样本图像集为训练样本，对所述目标卷积神经网络进行训练，得到用于进行图像识别的图像识别模型，包括：

9.根据权利要求7所述的方法，其特征在于，在得到用于进行图像识别的图像识别模型之后，所述方法包括：

获得待识别图像；

10.一种卷积神经网络构建装置，其特征在于，所述装置包括：

11.一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现如权利要求1-9任一所述的卷积神经网络构建方法。

12.一种计算机可读存储介质，其特征在于，其存储的计算机程序使得处理器执行如权利要求1-9任一所述的卷积神经网络构建方法。