CN112668656A - 一种图像分类方法、装置、计算机设备和存储介质 - Google Patents
一种图像分类方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112668656A CN112668656A CN202011628943.0A CN202011628943A CN112668656A CN 112668656 A CN112668656 A CN 112668656A CN 202011628943 A CN202011628943 A CN 202011628943A CN 112668656 A CN112668656 A CN 112668656A
- Authority
- CN
- China
- Prior art keywords
- dynamic
- activation function
- feature map
- image
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种图像分类方法、装置、计算机设备和存储介质。该方法包括:获取待分类图像;将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。本发明实施例实现了提升神经网络模型分类准确性。
Description
技术领域
本发明涉及图像技术领域,尤其涉及一种图像分类方法、装置、计算机设备和存储介质。
背景技术
随着科学技术的飞速发展,神经网络模型被应用至越来越多的领域当中,其中应用最广泛的是图像分类,进行图像分类时常采用卷积神经网络(CNN),在分类的过程中,需要使用激活函数来完成输入特征图的卷积。
ReLU(修正线性单元)激活函数是神经网络领域的里程碑技术,它可以简单直接地改善深度卷积神经网络的前向和反向传播性能,在ResNet、MobileNet等经典网络具有着广泛的应用。相较于之前使用的Sigmoid激活函数,Sigmoid在网络层数较深时容易出现梯度消失的现象,而ReLU并不会产生较小的梯度,输入小于零时会使部分神经元输出为零,从而导致网络的稀疏性,缓解过拟合的产生。
在图像分类的过程中,不同的输入特征图适应于不同的激活函数,但是现有的激活函数,无论是ReLU激活函数还是其衍生形式,譬如ReLU6、Leaky ReLU、PreLu、HardSwish等激活函数,这些激活函数均属于静态激活函数,对于不同的输入特征图来说,激活函数无法改变,从而导致分类的准确性下降。
发明内容
基于此,有必要针对上述问题,提出了一种图像分类方法、装置、计算机设备和存储介质。
第一方面,本发明实施例提供一种图像分类方法,所述方法包括:
获取待分类图像;
将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
第二方面,本发明实施例提供一种图像分类装置,所述装置包括:
图像获取模块,用于获取待分类图像;
图像分类模块,用于将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
第三方面,本发明实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待分类图像;
将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
第四方面,本发明实施例提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待分类图像;
将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
本发明实施例通过根据所述中间特征图生成的动态参数确定动态激活函数,将动态激活函数应用至图像分类模型,解决了对于不同的输入特征图来说,激活函数无法改变的问题,获得了提升神经网络模型分类准确性的有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中图像分类方法的应用环境图;
图2为一个实施例中图像分类方法的流程图;
图3为一个实施例中动态参数的生成方法的流程图;
图4为一个实施例中动态通道激活函数权重因子的生成方法的流程图;
图5为一个实施例中动态激活函数的生成和激活流程的示意图;
图6为一个实施例中图像分类方法中步骤S120的具体流程图;
图7为一个实施例中图像分类装置的结构框图;
图8为一个实施例中计算机设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为一个实施例中图像分类方法的应用环境图。参照图1,该图像分类方法应用于图像分类系统。该图像分类系统包括终端110和服务器120。终端110和服务器120通过网络连接,终端110具体可以是台式终端或移动终端,移动终端具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端110用于获取待分类图像,服务器120用于将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别。所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
如图2所示,在一个实施例中,提供了一种图像分类方法。该方法既可以应用于终端,也可以应用于服务器,本实施例以应用于终端举例说明。该图像分类方法具体包括如下步骤:
S110、获取待分类图像。
S120、将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
本实施例中,该方法可以应用于ILSVRC(ImageNet Large Scale VisualRecognition Challenge)竞赛中,在大数据集的ILSVRC竞赛中,使用的待分类图像为10万张图像,最后的分类类别包括1000类,此外该方法也可以直接应用于数据集较少的图像分类中。具体的,首先获取待分类图像,待分类图像可以为多个,然后将这些待分类图像依次输入至预先训练好的图像分类模型,最后该图像分类模型就可以输出每个待分类图像的分类类别。
其中,图像分类模型包括卷积层,即图像分类模型为卷积神经网络模型,因此述图像分类模型中包括卷积层,卷积层对应了一个动态激活函数,图像分类模型在获得待分类图像后,待分类图像作为该图像分类模型的输入特征图,卷积层会对输入特征图进行卷积处理得到中间特征图。得到中间特征图后,将该中间特征图输入至与该卷积层对应的动态激活函数,动态激活函数将对中间特征图进行非线性映射得到输出特征图。此时将得到的输出特征图继续输入至该图像分类模型的池化层、全连接层和输出层,就可以得到待分类图像的分类类别。进一步的,动态激活函数包括动态参数,而动态参数是根据中间特征图生成的,因此得到该中间特征图后,图像分类模型首先会根据中间特征图生成动态参数,从而确定动态激活函数,然后动态激活函数才将对中间特征图进行非线性映射得到输出特征图。
本发明实施例通过根据所述中间特征图生成的动态参数确定动态激活函数,将动态激活函数应用至图像分类模型,解决了对于不同的输入特征图来说,激活函数无法改变的问题,获得了提升神经网络模型分类准确性的有益效果。
在一个实施例中,如图3所示,还提供了一种动态参数的生成方法,该动态参数的生成方法具体包括如下步骤:
S210、对所述中间特征图进行自适应池化操作以得到第一一维向量。
S220、通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量。
S230、对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子。
本实施例中,动态激活函数是由N个激活函数和N个激活函数权重因子组成的,其中每个激活函数对应一个激活函数权重因子,即激活函数权重因子为动态激活函数的动态参数。该图像分类模型还包括动态参数生成模块,该动态参数生成模块基于注意力机制建立,用来生成激活函数权重因子,即动态参数。具体的,获得中间特征图后,动态参数生成模块首先对中间特征图进行自适应池化(Adaptive Average Pooling)操作以得到第一一维向量,其中中间特征图是一个三维张量,自适应池化可以指定中间特征图的空间尺寸,从而将中间特征图转换为一个一维向量,即第一一维向量,然后将第一一维向量输入至动态参数生成模块的全连接层(Fully-Connected Layer),全连接层可以改变向量的维度,从而对第一一维向量的长度进行转换以得到第二一维向量,使得第二一维向量的长度和激活函数权重因子的数量相等。最后,动态参数生成模块对第二一维向量进行归一化处理,通过归一化函数(Normalize)和逻辑回归函数(Softmax)进行归一化处理,从而得到动态激活函数的激活函数权重因子,其中,归一化函数可以将第二一维向量的每个数值归一化到0-1之间,逻辑回归函数使得所有数值的加和为1,避免了最后得到的动态激活函数的输出值过大,由此根据中间特征图生成动态参数,即生成每层卷积层对应的动态激活函数的激活函数权重因子。
本发明实施例通过对所述中间特征图进行自适应池化操作以得到第一一维向量;通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量;对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子,使得动态激活函数依赖于中间特征图,解决了对于不同的输入特征图来说,激活函数无法改变的问题,获得了提升神经网络模型分类准确性的有益效果。
在一个实施例中,如图4所示,还提供了一种动态通道激活函数权重因子的生成方法,该动态通道激活函数权重因子的生成方法具体包括如下步骤:
S310、对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量。
S320、通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量。
S330、对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。
本实施例中,输入特征图为一个三维张量C×W×H,其中C表示输入特征图的通道数,W×H表示输入特征图的空间分辨率,每个通道对应一个通道输入特征图,卷积层用于对每个通道输入特征图进行卷积处理得到每个通道对应的通道中间特征图。相应的,对于输入特征图的每个通道来说,动态激活函数包括C×N个动态通道激活函数,每个通道对应N个动态通道激活函数,每个动态通道激活函数对应一个动态通道激活函数权重因子,每个动态通道激活函数权重因子是根据通道中间特征图生成的,动态通道激活函数用于对相应的通道中间特征图进行非线性映射得到输出通道特征图。
具体的,对于每一个通道来说,生成该通道的动态通道激活函数权重因子时,首先将该通道的通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量,其中第三一维向量的长度为该通道中间特征图的通道数,因该通道中间特征图对应一个通道,第三一维向量的长度为1,然后通过全连接层对第三维向量的长度进行转换以得到长度为N的第四一维向量,其中第四一维向量的长度为动态通道激活函数的个数,即最后得到的动态通道激活函数权重因子的个数,最后对第四一维向量进行归一化处理以得到N个动态通道激活函数的动态通道激活函数权重因子。
进一步的,对于MobileNet-V3模型来说,实验表明浅层网络的激活函数适合选择ReLU6激活函数,而经过多层卷积后,后半段的深层网络适合替换为HardSwish激活函数,将中间特征图视为一个整体时,示例性的,一并参照图5,当图像分类模型为MobileNet-V3模型时,此时动态激活函数包括ReLU6激活函数和HardSwish激活函数,即N=2,此时假设中间特征图x的维度是Wx*Hx*Cx,特征图的空间分辨率Wx*Hx,通道数量为Cx,那么动态激活函数包括2×Cx个动态通道激活函数,即每个通道对应2个动态通道激活函数,中间特征图经过动态参数生成模块将生成2×Cx个动态通道激活函数权重因子。此时在中间特征图x固定的条件下,动态激活函数fg(x)(x)是N个,即2个不同激活函数的加权平均结果,ReLU6(xc)表示ReLU6激活函数对中间特征图x的非线性映射,其动态通道激活函数权重因子为HardSwish(xc)表示HardSwish激活函数对中间特征图x的非线性映射,其动态通道激活函数权重因子为那么对于中间特征图x的第c个通道的中间特征图xc的动态激活函数fg(x)(xc)可以为:
以此类推,中间特征图x的Cx个通道都通过这种方式激活输出,最后将Cx个通道的输出结果按照通道拼接,得到最终的输出特征图y=fg(x)(x)。
本发明实施例通过对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量;通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量;对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。解决了对于不同的输入特征图来说,激活函数无法改变的问题,获得了提升神经网络模型分类准确性的有益效果。
在一个实施例中,如图6所示,步骤S120具体包括如下步骤:
S410、将所述待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图。
S420、根据所述第一中间特征图确定第一动态激活函数的第一激活函数权重因子。
S430、使用所述第一动态激活函数对所述第一中间特征图进行非线性映射得到第一输出特征图。
S440、将所述第一输出特征图输入至第二层卷积层以得到第二中间特征图。
S450、根据所述第二中间特征图确定第二动态激活函数的第二激活函数权重因子。
S460、使用所述第二动态激活函数对所述第二中间特征图进行非线性映射得到第二输出特征图,直至得到尾层卷积层的最终输出特征图。
S470、根据所述最终输出特征图确定所述待分类图像的分类类别。
本实施例中,卷积层为多个,因此在图像分类模型执行分类时,具体的,首先将待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图,然后根据第一中间特征图确定第一动态激活函数的第一激活函数权重因子,并使用第一动态激活函数对第一中间特征图进行非线性映射得到第一输出特征图。进一步的,将第一输出特征图输入至第二层卷积层以得到第二中间特征图,然后根据第二中间特征图确定第二动态激活函数的第二激活函数权重因子,并使用第二动态激活函数对第二中间特征图进行非线性映射得到第二输出特征图,依此类推,将第N-1输出特征图输入至尾层卷积层以得到第N中间特征图,然后根据第N中间特征图确定第N动态激活函数的第N激活函数权重因子,并使用第N动态激活函数对第N中间特征图进行非线性映射得到尾层卷积层的最终输出特征图。
本发明实施例通过将动态激活函数应用至卷积神经网络模型,对于多层卷积层来说,仅仅增加微量的额外计算开销和参数量,便可以显著提高神经网络模型的性能和分类准确性。
如图7所示,在一个实施例中,提供了一种图像分类装置,该实施例提供的图像分类装置可执行本发明任意实施例所提供的图像分类方法,具备执行方法相应的功能模块和有益效果。该图像分类装置包括图像获取模块100和图像分类模块200。
具体的,图像获取模块100用于获取待分类图像;图像分类模块200用于将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
在一个实施例中,所述动态激活函数是由N个激活函数和N个激活函数权重因子组成,每个所述激活函数对应一个所述激活函数权重因子,所述激活函数权重因子为所述动态激活函数的动态参数。
在一个实施例中,该图像分类装置还包括参数生成模块300,参数生成模块300用于对所述中间特征图进行自适应池化操作以得到第一一维向量;通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量;对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子。
在一个实施例中,所述输入特征图包括C个通道,每个所述通道对应一个通道输入特征图,所述卷积层用于对每个所述通道输入特征图进行卷积处理得到每个通道对应的通道中间特征图;所述动态激活函数包括C×N个动态通道激活函数,每个所述通道对应N个动态通道激活函数,每个所述动态通道激活函数对应一个动态通道激活函数权重因子,每个所述动态通道激活函数权重因子是根据所述通道中间特征图生成的,所述动态通道激活函数用于对相应的通道中间特征图进行非线性映射得到输出通道特征图。
在一个实施例中,参数生成模块300具体用于对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量;通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量;对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。
在一个实施例中,所述卷积层为多个,图像分类模块200具体用于将所述待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图;根据所述第一中间特征图确定第一动态激活函数的第一激活函数权重因子;使用所述第一动态激活函数对所述第一中间特征图进行非线性映射得到第一输出特征图;将所述第一输出特征图输入至第二层卷积层以得到第二中间特征图;根据所述第二中间特征图确定第二动态激活函数的第二激活函数权重因子;使用所述第二动态激活函数对所述第二中间特征图进行非线性映射得到第二输出特征图,直至得到尾层卷积层的最终输出特征图;根据所述最终输出特征图确定所述待分类图像的分类类别。
在一个实施例中,所述图像分类模型为MobileNet-V3模型,所述动态激活函数包括ReLU6激活函数和HardSwish激活函数。
图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像分类方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像分类方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待分类图像;将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
在一个实施例中,所述动态激活函数是由N个激活函数和N个激活函数权重因子组成,每个所述激活函数对应一个所述激活函数权重因子,所述激活函数权重因子为所述动态激活函数的动态参数。
在一个实施例中,所述动态参数的生成包括:对所述中间特征图进行自适应池化操作以得到第一一维向量;通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量;对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子。
在一个实施例中,所述输入特征图包括C个通道,每个所述通道对应一个通道输入特征图,所述卷积层用于对每个所述通道输入特征图进行卷积处理得到每个通道对应的通道中间特征图;所述动态激活函数包括C×N个动态通道激活函数,每个所述通道对应N个动态通道激活函数,每个所述动态通道激活函数对应一个动态通道激活函数权重因子,每个所述动态通道激活函数权重因子是根据所述通道中间特征图生成的,所述动态通道激活函数用于对相应的通道中间特征图进行非线性映射得到输出通道特征图。
在一个实施例中,所述动态通道激活函数权重因子的生成包括:对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量;通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量;对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。
在一个实施例中,所述卷积层为多个,所述将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别包括:将所述待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图;根据所述第一中间特征图确定第一动态激活函数的第一激活函数权重因子;使用所述第一动态激活函数对所述第一中间特征图进行非线性映射得到第一输出特征图;将所述第一输出特征图输入至第二层卷积层以得到第二中间特征图;根据所述第二中间特征图确定第二动态激活函数的第二激活函数权重因子;使用所述第二动态激活函数对所述第二中间特征图进行非线性映射得到第二输出特征图,直至得到尾层卷积层的最终输出特征图;根据所述最终输出特征图确定所述待分类图像的分类类别。
在一个实施例中,所述图像分类模型为MobileNet-V3模型,所述动态激活函数包括ReLU6激活函数和HardSwish激活函数。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待分类图像;将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
在一个实施例中,所述动态激活函数是由N个激活函数和N个激活函数权重因子组成,每个所述激活函数对应一个所述激活函数权重因子,所述激活函数权重因子为所述动态激活函数的动态参数。
在一个实施例中,所述动态参数的生成包括:对所述中间特征图进行自适应池化操作以得到第一一维向量;通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量;对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子。
在一个实施例中,所述输入特征图包括C个通道,每个所述通道对应一个通道输入特征图,所述卷积层用于对每个所述通道输入特征图进行卷积处理得到每个通道对应的通道中间特征图;所述动态激活函数包括C×N个动态通道激活函数,每个所述通道对应N个动态通道激活函数,每个所述动态通道激活函数对应一个动态通道激活函数权重因子,每个所述动态通道激活函数权重因子是根据所述通道中间特征图生成的,所述动态通道激活函数用于对相应的通道中间特征图进行非线性映射得到输出通道特征图。
在一个实施例中,所述动态通道激活函数权重因子的生成包括:对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量;通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量;对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。
在一个实施例中,所述卷积层为多个,所述将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别包括:将所述待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图;根据所述第一中间特征图确定第一动态激活函数的第一激活函数权重因子;使用所述第一动态激活函数对所述第一中间特征图进行非线性映射得到第一输出特征图;将所述第一输出特征图输入至第二层卷积层以得到第二中间特征图;根据所述第二中间特征图确定第二动态激活函数的第二激活函数权重因子;使用所述第二动态激活函数对所述第二中间特征图进行非线性映射得到第二输出特征图,直至得到尾层卷积层的最终输出特征图;根据所述最终输出特征图确定所述待分类图像的分类类别。
在一个实施例中,所述图像分类模型为MobileNet-V3模型,所述动态激活函数包括ReLU6激活函数和HardSwish激活函数。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。请输入具体实施内容部分。
Claims (10)
1.一种图像分类方法,其特征在于,所述方法包括:
获取待分类图像;
将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
2.根据权利要求1所述的方法,其特征在于,所述动态激活函数是由N个激活函数和N个激活函数权重因子组成,每个所述激活函数对应一个所述激活函数权重因子,所述激活函数权重因子为所述动态激活函数的动态参数。
3.根据权利要求2所述的方法,其特征在于,所述动态参数的生成包括:
对所述中间特征图进行自适应池化操作以得到第一一维向量;
通过全连接层对所述第一一维向量的长度进行转换以得到第二一维向量;
对所述第二一维向量进行归一化处理以得到动态激活函数的激活函数权重因子。
4.根据权利要求2所述的方法,其特征在于,所述输入特征图包括C个通道,每个所述通道对应一个通道输入特征图,所述卷积层用于对每个所述通道输入特征图进行卷积处理得到每个通道对应的通道中间特征图;所述动态激活函数包括C×N个动态通道激活函数,每个所述通道对应N个动态通道激活函数,每个所述动态通道激活函数对应一个动态通道激活函数权重因子,每个所述动态通道激活函数权重因子是根据所述通道中间特征图生成的,所述动态通道激活函数用于对相应的通道中间特征图进行非线性映射得到输出通道特征图。
5.根据权利要求4所述的方法,其特征在于,所述动态通道激活函数权重因子的生成包括:
对所述通道中间特征图进行自适应池化操作以得到长度为1的第三一维向量;
通过全连接层对所述第三维向量的长度进行转换以得到长度为N的第四一维向量;
对所述第四一维向量进行归一化处理以得到N个所述动态通道激活函数的动态通道激活函数权重因子。
6.根据权利要求2所述的方法,其特征在于,所述卷积层为多个,所述将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别包括:
将所述待分类图像作为第一输入特征图,输入至预先训练好的图像分类模型的首层卷积层以得到第一中间特征图;
根据所述第一中间特征图确定第一动态激活函数的第一激活函数权重因子;
使用所述第一动态激活函数对所述第一中间特征图进行非线性映射得到第一输出特征图;
将所述第一输出特征图输入至第二层卷积层以得到第二中间特征图;
根据所述第二中间特征图确定第二动态激活函数的第二激活函数权重因子;
使用所述第二动态激活函数对所述第二中间特征图进行非线性映射得到第二输出特征图,直至得到尾层卷积层的最终输出特征图;
根据所述最终输出特征图确定所述待分类图像的分类类别。
7.根据权利要求1所述的方法,其特征在于,所述图像分类模型为MobileNet-V3模型,所述动态激活函数包括ReLU6激活函数和HardSwish激活函数。
8.一种图像分类装置,其特征在于,所述装置包括:
图像获取模块,用于获取待分类图像;
图像分类模块,用于将所述待分类图像作为输入特征图,使用预先训练好的图像分类模型得到所述待分类图像的分类类别,所述图像分类模型包括卷积层,所述卷积层对应一个动态激活函数,所述卷积层用于对所述输入特征图进行卷积处理得到中间特征图,所述动态激活函数包括动态参数,所述动态参数是根据所述中间特征图生成的,所述动态激活函数用于对所述中间特征图进行非线性映射得到输出特征图。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011628943.0A CN112668656B (zh) | 2020-12-30 | 2020-12-30 | 一种图像分类方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011628943.0A CN112668656B (zh) | 2020-12-30 | 2020-12-30 | 一种图像分类方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112668656A true CN112668656A (zh) | 2021-04-16 |
CN112668656B CN112668656B (zh) | 2023-10-13 |
Family
ID=75412733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011628943.0A Active CN112668656B (zh) | 2020-12-30 | 2020-12-30 | 一种图像分类方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668656B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113694500A (zh) * | 2021-06-30 | 2021-11-26 | 江苏腾武信息技术有限公司 | 基于卷积神经网络的橄榄球辅助裁判系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596258A (zh) * | 2018-04-27 | 2018-09-28 | 南京邮电大学 | 一种基于卷积神经网络随机池化的图像分类方法 |
CN110490813A (zh) * | 2019-07-05 | 2019-11-22 | 特斯联(北京)科技有限公司 | 卷积神经网络的特征图增强方法、装置、设备及介质 |
-
2020
- 2020-12-30 CN CN202011628943.0A patent/CN112668656B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596258A (zh) * | 2018-04-27 | 2018-09-28 | 南京邮电大学 | 一种基于卷积神经网络随机池化的图像分类方法 |
CN110490813A (zh) * | 2019-07-05 | 2019-11-22 | 特斯联(北京)科技有限公司 | 卷积神经网络的特征图增强方法、装置、设备及介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113694500A (zh) * | 2021-06-30 | 2021-11-26 | 江苏腾武信息技术有限公司 | 基于卷积神经网络的橄榄球辅助裁判系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112668656B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113593611B (zh) | 语音分类网络训练方法、装置、计算设备及存储介质 | |
Zeng et al. | Single image super-resolution using a polymorphic parallel CNN | |
JP2023523029A (ja) | 画像認識モデル生成方法、装置、コンピュータ機器及び記憶媒体 | |
Fan et al. | Neural sparse representation for image restoration | |
CN110781686B (zh) | 一种语句相似度计算方法、装置及计算机设备 | |
CN111062324A (zh) | 人脸检测方法、装置、计算机设备和存储介质 | |
CN114677548A (zh) | 基于阻变存储器的神经网络图像分类系统及方法 | |
JP2023541350A (ja) | 表畳み込みおよびアクセラレーション | |
CN112668656A (zh) | 一种图像分类方法、装置、计算机设备和存储介质 | |
CN109086386B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
WO2022141258A1 (zh) | 一种图像分类方法、计算机设备和存储介质 | |
CN110929779B (zh) | 重建神经元质量检测方法、有序点云分类方法及装置 | |
WO2023115814A1 (zh) | Fpga硬件架构及其数据处理方法、存储介质 | |
CN114638823B (zh) | 基于注意力机制序列模型的全切片图像分类方法及装置 | |
CN115169548A (zh) | 基于张量的持续学习方法和装置 | |
CN109583512B (zh) | 图像处理方法、装置及系统 | |
CN113902107A (zh) | 用于神经网络模型全连接层的数据处理方法、可读介质和电子设备 | |
CN114692745A (zh) | 数据处理方法、装置、集成芯片、电子设备及存储介质 | |
CN115272821A (zh) | 基于特征显著性的目标识别方法、装置和计算机设备 | |
WO2021253440A1 (en) | Depth-wise over-parameterization | |
WO2021159101A1 (en) | Fine-grained stochastic neural architecture search | |
CN111159450A (zh) | 图片分类方法、装置、计算机设备和存储介质 | |
CN110457700B (zh) | 短文本描述方法和装置 | |
KR102662997B1 (ko) | 뉴럴 네트워크를 이용한 초분광 이미지 분류 방법 및 장치 | |
CN111177493A (zh) | 数据处理方法、装置、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |