CN110633735B

CN110633735B - 基于小波变换的渐进式深度卷积网络图像识别方法及装置

Info

Publication number: CN110633735B
Application number: CN201910783600.2A
Authority: CN
Inventors: 何志权; 曹文明; 刘启凡
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2019-08-23
Filing date: 2019-08-23
Publication date: 2021-07-30
Anticipated expiration: 2039-08-23
Also published as: CN110633735A

Abstract

本发明提供一种基于小波变换的渐进式深度卷积网络图像识别方法及装置所述方法包括：选取训练图像集，对训练图像进行小波分解，获得所述训练图像的成分图像；训练渐进式深度卷积神经网络模型；判断所述渐进式深度卷积神经网络模型是否稳定；若是，获取待识别图像，利用预先训练好的所述渐进式深度卷积神经网络模型识别图像。根据本发明的方案，利用图像小波变换所提供的对图像的多尺度、多层级的表示，进行渐进式深度卷积神经网络的设计，能自动选择最小化的成分图像组合来实现图像的准确识别，能够加快深度学习模型的运算速度，消耗最小化计算资源。

Description

基于小波变换的渐进式深度卷积网络图像识别方法及装置

技术领域

本发明涉及图像处理领域，尤其涉及一种基于小波变换的渐进式深度卷积网络图像识别方法及装置。

背景技术

近几年，深度学习模型得到了飞速的发展，在越来越多的领域得到了成功的应用，其中一个应用是进行图像识别。深度学习模型通常包含大量的参数，运行深度学习模型时需要占用大量的内存资源，并且还需要较大的运算量。现有的用于图像识别的使用了深度学习模型的深度神经网络，一但深度神经网络训练完毕，对任何输入图像，其网络结构、执行过程和计算复杂度都是固定不变的，无法适应动态变化的应用场景。例如图1A所示的场景复杂的小猫图像和图1B所示的场景简单的小猫图像，使用深度神经网络进行图像识别时，其执行过程、计算复杂度都是一样的。而实际上，图1B所示的场景简单的小猫图像使用低分辨率或少数的网络层级就可以实现准确的识别，使用固定层级的深度神经网络进行识别，会造成大量的计算资源的浪费。

现有技术中提出了可伸缩的深度学习神经网络，可伸缩的深度学习神经网络的实现方式是把主网络分成若干个层级，从待识别图像的原图提取特征，并通过复杂的决策网络来决定主网络在什么时候提前退出。现有的可伸缩的深度学习神经网络仍存在主网络层数固定、计算量大、资源消耗大、计算速度慢的不足。

发明内容

为解决上述技术问题，本发明提出了一种基于小波变换的渐进式深度卷积网络图像识别方法及装置，用以解决现有技术中主网络层数固定、计算量大、资源消耗大、计算速度慢的技术问题。

根据本发明的第一方面，提供一种基于小波变换的渐进式深度卷积网络图像识别方法，包括：

步骤S101：选取训练图像集，对训练图像X_k进行小波分解，获得所述训练图像的成分图像I₁…I_m；

步骤S102：训练渐进式深度卷积神经网络模型，包括：构建M个单独的DNN子网络N₁…N_i…N_M(1≤i≤M)组成的渐进式深度神经网络层，将所述成分图像I₁…I_m分别输入对应的DNN子网络N₁…N_m，输出成分图像I₁…I_m对应的特征F₁…F_m，各个数据通道R₁-R_m上进行特征融合，将通道R_i获得的成分图像I_i对应的特征F_i与在前的数据通道R_i-1对应的特征F_i-1融合，第一数据通道R₁融合后特征仍为F₁；将各通道上融合后的特征F₁…F_m分别输入各自对应的评估子网络E₁…E_m，各评估子网络E₁…E_m用于计算各评估子网络的损失函数，并将所述损失函数值输入决策控制网络，由决策控制网络确定识别训练图像X_k所需的DNN子网络的最少层级；

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

所述决策控制网络的损失函数的控制目标为最大化该损失函数；

其中α、β分别表示损失函数系数，取值均为0.1,L_E用于评价评估子网络，由所述评估子网络的输出和训练图像类别的交叉熵定义，

其中，M是评估子网络的个数，w_n是第n个评估子网络的权重，w_n＝γw_n-1，γ<1，y_n是第n个评估子网络的输出；

是训练图像的真正类别；

其中k是训练图像类别的下标，C是训练图像类别数目，L_CE()是评估子网络的损失函数，为交叉熵函数；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

其中C(s)是第s个DNN子网络的复杂度，用该子网络的参数个数来表示，N(x)是训练图像x所需要的DNN子网络个数，即需要多少个DNN子网络才能输出正确的分类结果,y_N(x)是N(x)个DNN子网络中最后一个DNN子网络的输出；

L_wavelet用于描述图像小波变换的损失，

其中x是训练图像，l是小波变换的阶数；

对训练图像X_k，通过所述决策控制网络决策，得到最早输出了正确分类结果的评估网络层级m，即E(X_k,m)＝1，表示训练图像X_k在第m个数据通路上最早得到正确分类识别，也即在第m层DNN子网最早得到正确分类识别；

步骤S103：判断所述渐进式深度卷积神经网络模型是否稳定，若否，进入步骤S101；若是，进入步骤S104；

步骤S104：获取待识别图像，利用预先训练好的所述渐进式深度卷积神经网络模型识别图像。

进一步地，所述DNN子网络N₁的输入与训练图像原图大小一致。

进一步地，所述决策控制网络为递归神经网络(RNN)。

进一步地，所述获得所述训练图像的成分图像I₁…I_m，为从JPEG2000的解码重建过程中选取和组合出不同的分辨率大小的低频率子带(Low-Frequency Subband)和不同图像质量的重建图作为成分图像，也可以选取高频子带(High-Frequency Subband)的重建图作为成分图像。

根据本发明第二方面，提供一种基于小波变换的渐进式深度卷积网络图像识别装置，包括：

生成成分图像模块：用于训练图像集，对训练图像X_k进行小波分解，获得所述训练图像的成分图像I₁…I_m；

训练模块：用于训练渐进式深度卷积神经网络模型，包括：构建M个单独的DNN子网络N₁…N_i…N_M(1≤i≤M)组成的渐进式深度神经网络层，将所述成分图像I₁…I_m分别输入对应的DNN子网络N₁…N_m，输出成分图像I₁…I_m对应的特征F₁…F_m，各个数据通道R₁-R_m上进行特征融合，将通道R_i获得的成分图像I_i对应的特征F_i与在前的数据通道R_i-1对应的特征F_i-1融合，第一数据通道R₁融合后特征仍为F₁；将各通道上融合后的特征F₁…F_m分别输入各自对应的评估子网络E₁…E_m，各评估子网络E₁…E_m用于计算各评估子网络的损失函数，并将所述损失函数值输入决策控制网络，由决策控制网络确定识别训练图像X_k所需的DNN子网络的最少层级；

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

是训练图像的真正类别；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

L_wavelet用于描述图像小波变换的损失，

其中x是训练图像，l是小波变换的阶数；

判断模块：用于判断所述渐进式深度卷积神经网络模型是否稳定；

图像识别模块：用于获取待识别图像，利用预先训练好的所述渐进式深度卷积神经网络模型识别图像。

进一步地，所述决策控制网络为递归神经网络(RNN)。

进一步地，所述生成成分图像模块，从JPEG2000的解码重建过程中选取和组合出不同的分辨率大小的低频率子带(Low-Frequency Subband)和不同图像质量的重建图作为成分图像，也可以选取高频子带(High-Frequency Subband)的重建图作为成分图像。

根据本发明第三方面，提供一种基于小波变换的渐进式深度卷积网络图像识别系统，包括：

处理器，用于执行多条指令；

存储器，用于存储多条指令；

其中，所述多条指令，用于由所述存储器存储，并由所述处理器加载并执行如前所述的基于小波变换的渐进式深度卷积网络图像识别方法。

根据本发明第四方面，提供一种计算机可读存储介质，所述存储介质中存储有多条指令；所述多条指令，用于由处理器加载并执行如前所述的基于小波变换的渐进式深度卷积网络图像识别方法。

根据本发明的上述方案，利用图像小波变换所提供的对图像的多尺度、多层级的表示，进行渐进式深度卷积神经网络的设计，能自动选择最小化的成分图像组合来实现图像的准确识别，能够优化深度卷积神经网络对计算资源的消耗，加快深度学习模型的运算速度，消耗最小化计算资源，能够实时识别图像。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明提供如下附图进行说明。在附图中：

图1A为场景复杂的小猫图像；

图1B为场景简单的小猫图像；

图2A为小波分解前的原图；

图2B为2阶小波分解的图像；

图3为本发明一个实施方式的基于小波变换的渐进式深度卷积神经网络的结构图；

图4为本发明提出的基于小波变换的渐进式深度卷积神经网络图像识别方法流程图；

图5为本发明提出的基于小波变换的渐进式深度卷积神经网络图像识别装置组成框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

首先结合图2A-图2B说明图像小波分解，图2A示出了小波分解前的原图，图2B示出了2阶小波分解的图像。

图像的小波变换通过小波分解从图像压缩码流可以提取不同的阶数，进而提取到不同的成分图像。这些成分图像各自包含原图不同的特征信息，彼此互补，并且整体数据量与原图一样。小波分解中，阶数每提高一级，图像尺寸就减小一半，图2B示出了2阶小波分解的图像。

以下结合图3说明本发明的基于小波变换的渐进式深度卷积神经网络的结构，图3示出了本发明的基于小波变换的渐进式深度卷积神经网络的结构图。如图3所示，

所述渐进式深度卷积神经网络具有渐进式深度神经网络层(DNN)、特征融合层、评估网络层、决策控制网络层。

所述渐进式深度神经网络层划分为M个单独的DNN子网络N₁…N_i…N_M(1≤i≤M)，每个DNN子网络N_i都包括网络层、卷积层和pooling层、输出层。每个DNN子网络N_i的输入是待识别图像经频域成分图像提取处理，即待识别图像经小波分解i阶后的图像I_i，也称第i个成分图像I_i。利用单独的DNN子网络N_i对成分图像I_i进行分析提取特征F_i，作为每个DNN子网络N_i的输出。优选地，最小的DNN子网络N₁，为了避免引入噪声，子网络N₁的输入和输入的待识别图像的原始图像大小一致。

每个DNN子网络N_i与其对应的特征融合层部分、评估网络层E_i之间构成数据通道R_i。在各个数据通道R_i对应的特征融合层部分，将该通道获得的成分图像I_i对应的特征F_i与在前的数据通道R_i-1对应的特征F_i-1融合。例如，第二个数据通道把第二个成分图像I₂的特征F₂与第一个成分图像I₁的特征F₁融合起来，即数据通道R₂上特征融合后的特征为F₁∪F₂。同理，在第m个数据通道R_m上特征融合后的特征为F₁∪F₂…∪F_m。第一数据通道R₁由于不存在在前数据通道，因此，其融合后特征仍为F₁。在各个数据通道R_i上，将融合后特征F_i作为评估子网络E_i的输入。

所述评估网络层划分为M个单独的评估子网络E₁…E_i…E_M(1≤i≤M)，每个评估子网络E_i。评估子网络E_i用于计算损失函数以评估当前子网络层级的输出是否满足了最终的要求，例如，是否满足了图像分类的准确率要求。并将输出作为决策控制网络层的输入。如果当前子网络层级的输出已经满足最终的要求，后续子网络N_i+1…N_M及其评估子网络E_i+1…E_M都不再需要参与评估及计算。

随着成分图像的增加和特征的不断融合，渐进式深度神经网络层对输入图像积累了越来越多的特征描述，视觉区分能力更强，识别图像分类的性能也越来越好。所述决策控制网络层用于确定对输入的图像，最少需要多少层级DNN子网络对其进行识别。本实施例中使用递归神经网络(RNN)来决策。

以下结合图4说明本发明的基于小波变换的渐进式深度卷积神经网络图像识别方法，图4示出了本发明的基于小波变换的渐进式深度卷积神经网络图像识别方法流程图。如图4所示，

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

其中α、β分别表示损失函数系数，默认取值均为0.1，可以在所述深度卷积神经网络模型训练阶段自适应修改,L_E用于评价评估子网络，由所述评估子网络的输出和训练图像类别的交叉熵定义，

是训练图像的真正类别；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

其中C(s)是第s个DNN子网络的复杂度，可以用该子网络的参数个数来表示，N(x)是训练图像x所需要的DNN子网络个数，即需要多少个DNN子网络才能输出正确的分类结果,y_N(x)是N(x)个DNN子网络中最后一个DNN子网络的输出，因为共有N(x)个单元，最后一个单元的输出性能是最好的；

L_wavelet用于描述图像小波变换的损失，

其中x是训练图像，l是小波变换的阶数；

所述步骤S101：选取训练图像集，对训练图像X_k进行小波分解，获得所述训练图像的成分图像I₁…I_m，还包括：

所述获得所述训练图像的成分图像I₁…I_m，可以从JPEG2000的解码重建过程中选取和组合出不同的分辨率大小的低频率子带(Low-Frequency Subband)和不同图像质量的重建图作为成分图像，也可以选取高频子带(High-Frequency Subband)的重建图作为成分图像。

步骤S102：训练渐进式深度卷积神经网络模型，还包括：

设置第n个评估子网络的权重w_n的权重公式为w_n＝γw_n-1，γ<1，每个评估子网络的权重是指数下降的，目的是为了让训练出的渐进式深度卷积神经网络模型倾向于用更少层的小波变换图像。

图像小波变换的损失L_wavelet还可以定义为训练图像X_k的原图与小波变换后得到的成分图像的均方误差。假设该图像的前面m个成分图像I₁,I₂,..,I_m被使用，通过这m个成分图像可以重建原图

那么

所述DNN子网络可以使用预先训练好的网络模型，模型训练时仅训练评价子网络和决策控制网络。

请参考图5，其为本发明提出的基于小波变换的渐进式深度卷积神经网络图像识别装置组成框图。以下结合图5说明本发明的基于小波变换的渐进式深度卷积神经网络图像识别装置，如图所示，该装置包括：

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

是训练图像的真正类别；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

L_wavelet用于描述图像小波变换的损失，

其中x是训练图像，l是小波变换的阶数；

进一步地，所述决策控制网络为递归神经网络(RNN)。

本发明实施例进一步给出一种基于小波变换的渐进式深度卷积网络图像识别系统，包括：

处理器，用于执行多条指令；

存储器，用于存储多条指令；

其中，所述多条指令，用于由所述存储器存储，并由所述处理器加载并执行如上所述的基于小波变换的渐进式深度卷积网络图像识别方法。

本发明实施例进一步给出一种计算机可读存储介质，所述存储介质中存储有多条指令；所述多条指令，用于由处理器加载并执行如上所述的基于小波变换的渐进式深度卷积网络图像识别方法。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，实体机服务器，或者网络云服务器等，需安装Windows或者Windows Server操作系统)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于小波变换的渐进式深度卷积网络图像识别方法，其特征在于，所述方法包括：

步骤S102：训练渐进式深度卷积神经网络模型，包括：构建M个单独的DNN子网络N₁…N_i…N_M组成的渐进式深度神经网络层，将所述成分图像I₁…I_m分别输入对应的DNN子网络N₁…N_m，输出成分图像I₁…I_m对应的特征F₁…F_m，各个数据通道R₁-R_m上进行特征融合，将通道R_i获得的成分图像I_i对应的特征F_i与在前的数据通道R_i-1对应的特征F_i-1融合，第一数据通道R₁融合后特征仍为F₁；将各通道上融合后的特征F₁…F_m分别输入各自对应的评估子网络E₁…E_m，各评估子网络E₁…E_m用于计算各评估子网络的损失函数，并将所述损失函数值输入决策控制网络，由决策控制网络确定识别训练图像X_k所需的DNN子网络的最少层级；其中，1≤i≤M；

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

其中α、β分别表示损失函数系数，取值均为0.1，L_E用于评价评估子网络，由所述评估子网络的输出和训练图像类别的交叉熵定义，

其中，M是评估子网络的个数，w_n是第n个评估子网络的权重，w_n＝γw_n-1，γ＜1，y_n是第n个评估子网络的输出；

是训练图像的真正类别；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

其中C(s)是第s个DNN子网络的复杂度，用该子网络的参数个数来表示，N(x)是训练图像X_k所需要的DNN子网络个数，即需要多少个DNN子网络才能输出正确的分类结果，y_N(x)是N(x)个DNN子网络中最后一个DNN子网络的输出；

L_wavelet用于描述图像小波变换的损失，

其中X_k是训练图像，l是小波变换的阶数；

对训练图像X_k，通过所述决策控制网络决策，得到最早输出了正确分类结果的评估网络层级α，即E(X_k，α)＝1，表示训练图像X_k在第α层DNN子网最早得到正确分类识别；

2.如权利要求1所述的基于小波变换的渐进式深度卷积网络图像识别方法，其特征在于，所述DNN子网络N₁的输入与训练图像原图大小一致。

3.如权利要求1所述的基于小波变换的渐进式深度卷积网络图像识别方法，其特征在于，所述决策控制网络为递归神经网络(RNN)。

4.一种基于小波变换的渐进式深度卷积网络图像识别装置，其特征在于，所述装置包括：

训练模块：用于训练渐进式深度卷积神经网络模型，包括：构建M个单独的DNN子网络N₁…N_i…N_M组成的渐进式深度神经网络层，将所述成分图像I₁…I_m分别输入对应的DNN子网络N₁…N_m，输出成分图像I₁…I_m对应的特征F₁…F_m，各个数据通道R₁-R_m上进行特征融合，将通道R_i获得的成分图像I_i对应的特征F_i与在前的数据通道R_i-1对应的特征F_i-1融合，第一数据通道R₁融合后特征仍为F₁；将各通道上融合后的特征F₁…F_m分别输入各自对应的评估子网络E₁…E_m，各评估子网络E₁…E_m用于计算各评估子网络的损失函数，并将所述损失函数值输入决策控制网络，由决策控制网络确定识别训练图像X_k所需的DNN子网络的最少层级；其中，1≤i≤M；

所述决策控制网络的损失函数定义为

L＝L_E+αL_CADP-βL_wavelet，

是训练图像的真正类别；

L_CADP用于优化最小化累积的计算复杂度和预测的误差；

L_wavelet用于描述图像小波变换的损失，

其中X_k是训练图像，l是小波变换的阶数；

5.如权利要求4所述的基于小波变换的渐进式深度卷积网络图像识别装置，其特征在于，所述DNN子网络N₁的输入与训练图像原图大小一致。

6.如权利要求4所述的基于小波变换的渐进式深度卷积网络图像识别装置，其特征在于，所述决策控制网络为递归神经网络(RNN)。

7.一种基于小波变换的渐进式深度卷积网络图像识别系统，其特征在于，包括：

处理器，用于执行多条指令；

存储器，用于存储多条指令；

其中，所述多条指令，用于由所述存储器存储，并由所述处理器加载并执行如权利要求1-3任一所述的基于小波变换的渐进式深度卷积网络图像识别方法。

8.一种计算机可读存储介质，其特征在于，所述存储介质中存储有多条指令；所述多条指令，用于由处理器加载并执行如权利要求1-3任一所述的基于小波变换的渐进式深度卷积网络图像识别方法。