CN111626373B

CN111626373B - 多尺度加宽残差网络、小目标识别检测网络及其优化方法

Info

Publication number: CN111626373B
Application number: CN202010484081.2A
Authority: CN
Inventors: 李文娟; 李兵; 胡卫明; 潘健; 原春锋; 王坚
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2020-06-01
Filing date: 2020-06-01
Publication date: 2023-07-25
Anticipated expiration: 2040-06-01
Also published as: CN111626373A

Abstract

本发明属于机器学习领域，具体涉及一种多尺度加宽残差网络、小目标识别检测网络及其优化方法，本发明多尺度加宽残差网络包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构；所述多尺度加宽卷积层，包括并行设置的多个不同尺度的卷积核，其输出为所述多个不同尺度的卷积核提取特征的合并；所述多尺度加宽残差网络单元结构，包括多个串联设置的所述多尺度加宽卷积层，设定两个所述多尺度加宽卷积层之间跃层连接，以直接将两层输出特征取大融合。基于本发明得到的特征进行小目标识别检测，可以提高小目标物体识别的准确度。

Description

多尺度加宽残差网络、小目标识别检测网络及其优化方法

技术领域

本发明属于机器学习领域，具体涉及一种多尺度加宽残差网络、小目标识别检测网络及其优化方法。

背景技术

随着计算机视觉的发展，特别是深度学习网络模型推广使用以来，物体检测技术取得了很大的进步。但是对于低像素、小目标物体的检测和图像分类，尚缺乏有效的检测识别算法，主要原因在于网络的结构设计和层数增加带来的信息损失对于小目标检测影响巨大。

卷积神经网络有多种模型，性能也在逐步提升。提升网络性能的常规策略基本有三种，一种是构建新组件，以达到新的功能要求；第二是加深网络，即增加网络层数；第三种则为加宽网络，即保持网络层数不变，使网络通道增加，用于更充分地提取特征。对于小目标识别，第一种和第三种方法更加有效。

因此，希望提出一种新的深度学习网络结构，该网络配备通过多尺度通道加宽模块，能尽可能多地提取各尺度有用的判别性特征因子，准确锁定图像中的物体轮廓，较好应对小目标、低像素等检测分类难题。

发明内容

为了解决现有技术中的上述问题，即为了提高了小目标检测的准确度，本发明的第一方面提出了一种多尺度加宽残差网络，包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构；

所述多尺度加宽卷积层，包括并行设置的多个不同尺度的卷积核，其输出为所述多个不同尺度的卷积核提取特征的合并；

所述多尺度加宽残差网络单元结构，包括多个串联设置的所述多尺度加宽卷积层，设定所述多尺度加宽卷积层之间跃层连接，以直接将不同层输出特征取大融合。

在一些优选实施方式中，所述多尺度加宽卷积层包括三个不同膨胀系数的卷积核。

在一些优选实施方式中，多尺度加宽卷积层中所述三个不同膨胀系数的卷积核，其膨胀系数分别为1、2、4，对应卷积核感受野大小分别为3×3、5×5、9×9，对应通道数分别是d、d/2、d/2，其中d为该层输入通道数。

在一些优选实施方式中，所述多个不同尺度的卷积核提取特征的合并为宽度为2d的特征输出。

在一些优选实施方式中，所述多尺度加宽残差网络单元结构中，所述多尺度加宽卷积层之间跃层连接，特征融合采用取大融合，保持特征通道与数量不变。

本发明的第二方面，提出了一种基于多尺度加宽残差网络的小目标识别检测网络，其特征在于，包括上述的多尺度加宽残差网络及分类器。

本发明的第三方面，提出了一种基于多尺度加宽残差网络的小目标识别检测网络优化方法，基于上述的基于多尺度加宽残差网络的小目标识别网络，通过预设的训练数据进行网络训练，获取优化后的多尺度加宽残差网络；

优化过程中采用的损失函数为A-softmax。

本发明的第四方面，提出了一种基于多尺度加宽残差网络的小目标识别检测方法，基于上述优化方法获取的优化后的基于多尺度加宽残差网络的小目标识别检测网络，对输入图像进行小目标的分类。

本发明的第五方面，提出了一种基于多尺度加宽残差网络的小目标识别检测系统，包括输入模块、特征提取模块、分类模块、输出模块，所述特征提取模块包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构；

所述多尺度加宽残差网络单元结构，包括多个串联设置的所述多尺度加宽卷积层，设定所述多尺度加宽卷积层之间跃层连接，以直接将不同层的输出特征取大融合。

本发明的第六方面，提出了一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于多尺度加宽残差网络的小目标识别检测网络优化方法，或上述的基于多尺度加宽残差网络的小目标识别检测方法。

本发明的第七方面，提出了一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；其特征在于，所述程序适于由处理器加载并执行以实现上述的基于多尺度加宽残差网络的小目标识别检测网络优化方法，或上述的基于多尺度加宽残差网络的小目标识别检测方法。

本发明的有益效果：

本发明一方面从多尺度加宽卷积的角度，替代池化实现的感受野范围扩大，可实现在同层提取不同范围内的有效特征；另一方面，采用残差网络的跃层连接，保证重要信息的快速流通。从而实现对小目标有效判别信息的挖掘和保留，因此更有利于小目标物体的检测识别，提高了小目标物体识别的准确度。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明一种实施例的多尺度加宽残差网络结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明的一种多尺度加宽残差网络，包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构；

为了更清晰地对本发明多尺度加宽残差网络进行说明，下面结合附图对本方发明方法一种实施例中各步骤进行展开详述。

本发明一种实施例的多尺度加宽残差网络，其特征提取部分主要由两种结构单元构成，一种为多尺度加宽卷积层，另一种为多尺度加宽残差网络单元结构，两种结构单元分别包括一个或多个，按照预设规则进行串联设置。

1、多尺度加宽卷积层

本实施例中采用同层多尺度卷积核特征提取的方法，其中，多尺度的卷积核通过膨胀卷积实现，以实现感受野的快速无损失变化。膨胀卷积的功能是保持卷积核大小不变，感受野范围增大，膨胀卷积形式为：

其中，p₀为图像x中的任意位置点，t为膨胀系数。通过多个不同膨胀系数的选择，达到多尺度卷积核特征提取的目的，w(·)为权重系数。{p_n|n＝1,2,…,N}，选取中的N个位置，/> 定义为：

本实施例中，多尺度膨胀系数配置为：通常利用三个不同膨胀系数(1,2,4)的膨胀卷积，从待检测图像中提取多尺度关键特征。

本实施例中，加宽网络的配置为：通常将网络扩展为原网络的2倍宽度。

具体来说，多尺度加宽卷积层包含两个部分，一是多尺度加宽，二是合并融合。首先设置三个尺度进行不同范围的特征提取，尺度因子分别为1、2和4，对应卷积核感受野大小分别为3×3、5×5和9×9，对应通道数分别是d、d/2和d/2(该层输入通道为d)；其次，将不同尺度的卷积结果合并起来，得到宽度为2d的特征输出。由此，可将网络原始宽度扩大2倍，即宽度由d变为2d。

多尺度加宽残差网络单元结构中，所述多尺度加宽卷积层之间跃层连接，特征融合采用取大融合，保持特征通道与数量不变。

本实施例将多个不同尺度的卷积核获得的特征信息进行合并。相比加深网络，优势在不损失图像空间信息的条件下，快速得到图像的多尺度特征信息y，其公式为

其中，为融合函数，这里采用合并，即concat的方法。膨胀系数的集合T＝{1,2,4}。

2、多尺度加宽残差网络单元结构

本实施例中，将多个多尺度加宽卷积层串联起来，再添加一个跃层连接，类似残差网络中的shortcut，构成多尺度加宽残差网络单元结构，实现重要信息的快速便捷传递。对应形式为

其中，y′_L为融合后的特征，为融合函数，这里采用竞争取大，即max的方法。y_l与y_L分别代表跃层连接相融合的第l层与第L层的输出。

将部分中间层的输出特征进行快捷通道传递，直接和后层通道特征取大融合，实现低层特征的有效保留，保证关键特征的快速有效传递，以及低层高层语义信息的有效融合，从而可以更准确地检测目标小物体的位置与类别信息。

本实施例通过将一个或多个上述多尺度加宽卷积层、多尺度加宽残差网络单元结构进行有效连接，作为本发明残差网络的特征提取部分，得到的卷积神经网络即为本发明的多尺度加宽残差网络。

如图1所示，在输入层和输出层之间设置有多尺度加宽卷积层(第一层)、多尺度加宽残差网络单元结构(第l层至第L层)，其中，第l层的输入通道为dl，三个尺度卷积核分别为尺度一、尺度二、尺度三，对应通道数分别是dl、dl/2、dl/2，特征合并后得到宽度为2dl的特征输出，第l层的输出通过跃层连接将尺度一、二、三合并后的宽度为2dl的特征输出与第L层得到宽度为2dL的特征输出进行取大融合，所得特征宽度仍为2dL。

本发明第二实施例的一种基于多尺度加宽残差网络的小目标识别检测网络，包括上述的多尺度加宽残差网络及分类器，可以在经过预设的训练数据训练后，用于小目标识别检测。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的基于多尺度加宽残差网络的小目标识别检测网络中的具体工作过程及有关说明，可以参考前述多尺度加宽残差网络实施例中的对应内容，在此不再赘述。

本发明第三实施例的基于多尺度加宽残差网络的小目标识别检测网络优化方法，基于上述的基于多尺度加宽残差网络的小目标识别网络，通过预设的训练数据进行网络训练，获取优化后的多尺度加宽残差网络；优化过程中采用的损失函数为A-softmax。

在训练过程中，将大量预设的训练集数据输入到上述多尺度加宽残差网络中，不断迭代，实现对最优参数的学习；并通过测试数据集对优化后的多尺度加宽残差网络进行测试。

本实施例中，采用全连接特征投影与A-softmax分类，其以权值归一化为前提，结合角度间距对通用的softmax损失函数进行改进，约束力更强，得到对图像类别的识别判定。

本发明第四实施例的基于多尺度加宽残差网络的小目标识别检测方法，基于上述优化方法获取的优化后的基于多尺度加宽残差网络的小目标识别检测网络，对输入图像进行小目标的分类。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的多尺度加宽残差网络优化方法、基于多尺度加宽残差网络的小目标识别检测方法中的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本发明第五实施例的一种基于多尺度加宽残差网络的小目标识别检测系统，包括输入模块、特征提取模块、分类模块、输出模块，其特征在于，所述特征提取模块包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构。

输入模块，配置为获取待检测图像数据。

所述多尺度加宽卷积层，包括并行设置的多个不同尺度的卷积核，其输出为所述多个不同尺度的卷积核提取特征的合并。

所述多尺度加宽残差网络单元结构，包括多个串联设置的所述多尺度加宽卷积层，设定两个所述多尺度加宽卷积层之间跃层连接，以直接将两层输出特征取大融合。

分类模块，配置为基于特征提取模块获取的特征信息进行小目标分类识别。

输出模块，配置为输出识别结果。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的基于多尺度加宽残差网络的小目标识别检测系统中的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的基于多尺度加宽残差网络的小目标识别检测系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第六实施例的一种存储装置，其中存储有多条程序，所述程序适于由处理器加载并执行以实现上述的基于多尺度加宽残差网络的小目标识别检测网络优化方法，或者上述基于多尺度加宽残差网络的小目标识别检测方法。

本发明第七实施例的一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；所述程序适于由处理器加载并执行以实现上述的基于多尺度加宽残差网络的小目标识别检测网络优化方法，或者上述基于多尺度加宽残差网络的小目标识别检测方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于多尺度加宽残差网络的小目标识别检测方法，应用于图像分类，其特征在于，该方法包括：

获取输入图像；通过基于多尺度加宽残差网络的小目标识别检测网络对所述输入图像进行分类；所述输入图像包括多个小目标物体；

所述基于多尺度加宽残差网络的小目标识别检测网络包括多尺度加宽残差网络、分类器；

所述多尺度加宽残差网络，包括串行连接的多尺度加宽卷积层、多尺度加宽残差网络单元结构；

2.根据权利要求1所述的一种基于多尺度加宽残差网络的小目标识别检测方法，其特征在于，所述多尺度加宽卷积层包括三个不同膨胀系数的卷积核。

3.根据权利要求2所述的一种基于多尺度加宽残差网络的小目标识别检测方法，其特征在于，多尺度加宽卷积层中所述三个不同膨胀系数的卷积核，其膨胀系数分别为1、2、4，对应卷积核感受野大小分别为3×3、5×5、9×9，对应通道数分别是d、d/2、d/2，其中d为该层输入通道数。

4.根据权利要求3所述的一种基于多尺度加宽残差网络的小目标识别检测方法，其特征在于，所述多个不同尺度的卷积核提取特征的合并为宽度为2d的特征输出。

5.根据权利要求1-4任一项所述的一种基于多尺度加宽残差网络的小目标识别检测方法，其特征在于，所述多尺度加宽残差网络单元结构中，所述多尺度加宽卷积层之间跃层连接，特征融合采用取大融合，保持特征通道与数量不变。

6.根据权利要求1所述的一种基于多尺度加宽残差网络的小目标识别检测方法，通过预设的训练数据进行网络训练，获取优化后的多尺度加宽残差网络；优化过程中采用的损失函数为A-softmax。

7.一种基于多尺度加宽残差网络的小目标识别检测系统，应用于图像分类，其特征在于，包括输入模块、特征提取模块、分类模块、输出模块；

所述输入模块，配置为获取待检测图像数据；

所述特征提取模块，配置为将所述待检测图像数据输入多尺度加宽残差网络，输出特征信息；

所述分类模块，配置为基于所述特征信息进行小目标分类识别；

所述输出模块，配置为输出识别结果；

8.一种存储装置，其中存储有多条程序，其特征在于，所述程序适于由处理器加载并执行以实现权利要求1-6任一项所述的基于多尺度加宽残差网络的小目标识别检测方法。

9.一种处理装置，包括处理器、存储装置；处理器，适于执行各条程序；存储装置，适于存储多条程序；其特征在于，所述程序适于由处理器加载并执行以实现权利要求1-6任一项所述的基于多尺度加宽残差网络的小目标识别检测方法。