CN108596258A - 一种基于卷积神经网络随机池化的图像分类方法 - Google Patents
一种基于卷积神经网络随机池化的图像分类方法 Download PDFInfo
- Publication number
- CN108596258A CN108596258A CN201810391921.3A CN201810391921A CN108596258A CN 108596258 A CN108596258 A CN 108596258A CN 201810391921 A CN201810391921 A CN 201810391921A CN 108596258 A CN108596258 A CN 108596258A
- Authority
- CN
- China
- Prior art keywords
- neural networks
- convolutional neural
- training
- pond
- random pool
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本发明公开了一种基于卷积神经网络随机池化的图像分类方法,该方法包括如下步骤:将待处理图像数据集划分为训练集、测试集;设计分类任务的卷积神经网络;对图像训练集和测试集在输入训练卷积网络前进行预处理;将预处理后的训练集和测试集依次分批量导入卷积神经网络,卷积层得到四维张量特征图,使用激活函数激活特征图;将激活后的特征图导入池化层进行随机池化采样概率的运算;分别计算输出训练、测试阶段的随机池化响应;利用训练集训练卷积神经网络模型,利用分类训练好的模型完成对测试集的分类。本发明有效地解决了图像分类任务中,卷积神经网络随机池化通用于负值响应激活函数的问题,极大地提高了卷积神经网络泛化能力。
Description
技术领域
本发明属于计算机视觉、深度学习中卷积神经网络技术领域,具体涉及一种基于卷积神经网络随机池化的图像分类方法。
背景技术
卷积神经网络在许多视觉图像识别任务中具有极好的性能,尤其是近几年ImageNet的大尺度视觉识别挑战赛(ILSVRC)上取得了突破性的成绩。视觉图像识别性能在卷积神经网络的改善主要取决于两个方面:强大的网络模型和网络防止过拟合策略。深度卷积神经网络起先最大突破是在ILSVRC 2012年取得冠军的AlexNet,从此之后多种卷积神经网络结构出现:从ILSVRC 2013的ZFNet,Overfeat到ILSVRC 2014的GoogLeNet,VGGNet再到ILSVRC 2015的ResNet等。但是,随着网络容量的增加,例如,提高的深度,加宽的宽度等,卷积神经网络更容易过拟合。近几年,有多种正则化方法被提出减少网络过拟合的影响,包括权重衰减,dropout,数据增强技术等。
随机池化也被认为是一种正则化方法,相比较常用的最大池化它更容易减少网络过拟合影响。池化层是构成深度卷积神经网络的一个标准部分。常用的最大池化方法是一种确定的池化方法,它只需在每个池化区域找出最大的激活值作为输出,而对于随机池化,在池化区域内每个激活元素都有机会被选中成为输出。然而,对于具有负值响应的激活值,传统的随机池化方法受到了很大程度的限制。传统的随机池化方法仅仅适用于当时提出的ReLU这种具有非负激活响应的激活函数,这对于目前提出较新的具有负值响应的一些激活函数,例如Leaky ReLU,PReLU以及ELU等,完全无法适用。那么如何在图像分类识别任务中用卷积神经网络随机池化方法运算选取来自激活函数的负值响应成为主要问题。
发明内容
发明目的:针对现有技术存在的不足和缺陷,本发明提供一种基于卷积神经网络随机池化的图像分类方法,提高卷积神经网络在图像分类任务中的泛化能力和准确度,防止过拟合。
技术方案:为实现本发明的上述目的,本发明所采用的技术方案是:一种基于卷积神经网络随机池化的图像分类方法,该方法包括如下步骤:
(1)将待处理图像数据集划分为训练集、测试集;
(2)设计用于待处理图像数据集分类任务的卷积神经网络;
(3)对图像训练集和测试集在输入训练卷积网络前进行预处理;
(4)将预处理后的训练集和测试集依次分批量导入卷积神经网络结构中,卷积层得到四维张量特征图,使用激活函数激活特征图;
(5)将激活后的特征图导入卷积神经网络的池化层进行随机池化采样概率的运算;
(6)以每个池化域内采样概率形成的多项式分布进行采样,输出为训练阶段的随机池化响应;
(7)利用训练集训练卷积神经网络模型,利用分类训练好的卷积神经网络模型完成对测试集的分类。
其中,在步骤(2)中,设计用于待处理图像数据集分类任务的卷积神经网络包括层数,每层卷积核大小,每层特征图个数,全连接层的节点个数以及各层参数初始化策略,每层卷积层后的非线性激活函数具有负值响应的激活函数。
其中,在步骤(3)中,所述对图像训练集和测试集在输入训练卷积网络前进行预处理方法如下:首先将每张图像放缩到固定的尺寸大小,然后对于训练集和测试集,每张图片的每个通道内的像素点都减去训练集在每个通道的统计平均值,最后对图像的每个通道的像素值缩放到[0,1]区间。
其中,在步骤(5)中,随机池化采样概率的运算方法如下:该运算首先将激活后的特征图在每个池化域中减去该池化域中最小的激活值,再以池化域中平移得到的非负激活值,归一化计算得到每个池化域内激活值对应的采样概率。
其中,第j个池化域Rj内,每个激活元素ai的采样概率pi的计算方法如下:
其中,在步骤(6)中,以池化域内激活值的采样概率平均运算输出为测试阶段的随机池化响应。
其中,在步骤(7)中,按照基于mini-batch的随机梯度下降方法,利用训练集来训练卷积神经网络模型,利用分类训练好的卷积神经网络模型完成对测试集的分类。
有益效果:与现有技术相比,本发明具有以下优点:
本发明在具有池化层的深度卷积神经网络实现图像分类识别过程中,提出一种适用于卷积神经网络,通用于负值响应激活函数的随机池化方法在保证算法可行性的同时,极大的提高了卷积神经网络的泛化能力和准确度,防止过拟合。
附图说明
图1是本发明的一种基于卷积神经网络随机池化的图像分类方法流程图;
图2是非线性激活函数ReLU对于随机池化和传统随机池化在VGG-16卷积神经网络,CIFAR-10数据集下训练与测试分类错误率的比较;
图3是在不同类型负值响应激活函数的VGG-16卷积神经网络中,某随机池化层输入输出激活值大小的分布直方图;
图4是在VGG-16卷积神经网络下,ELU在CIFAR-10,CIFAR-100两个图像分类数据集具体训练、测试的分类错误率曲线。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
1、将待处理图像数据集划分为训练集、测试集,卷积神经网络对图像分类数据集的处理分为训练阶段和测试阶段。
2、设计一种用于待处理图像数据集分类任务的卷积神经网络结构,包括层数,每层卷积核大小,每层特征图个数,全连接层的节点个数以及各层参数初始化策略,每层卷积层后的非线性激活函数。
本发明设计一种类似于16层的VGG(VGG-16)的卷积神经网络结构,该网络结构的卷积层包含最后的三层全连接层一共是16层,每层卷积核的大小为3×3大小,越高层的卷积层输出的特征图个数越多,池化层池化域的大小为2×2,步长为2且没有重叠区域,全连接层节点个数根据分类数据集的图像的尺寸将其设定为512,各层的参数初始化策略选择的是MSRA的初始化方法。每层卷积层后的非线性激活函数可以是具有负值响应的激活函数,比如在ReLU上优化得到的Leaky ReLU,PReLU,ELU等。
3、对图像训练集和测试集在输入训练卷积网络前进行预处理,即先将每张图像放缩到固定的尺寸大小,再对训练集和测试集中的每张图片的每个通道的每个像素点减去训练集在每个通道的统计平均值,然后对图像的每个通道的像素值缩放到[0,1]区间,以此来提高网络训练时的准确率。
4、将预处理后的训练集和测试集依次分批量导入卷积神经网络结构中,即训练集分批量输入卷积神经网络,训练集每完成一轮对卷积神经网络的训练,就用测试集分批量输入网络测试已训练模型的效果。卷积层进行卷积运算得到四维张量特征图。卷积层的卷积运算对输入图像进行边缘特征提取,通过卷积核对输入的批量彩色图像或四维张量进行卷积运算,得到对应的特征图,将其记为c。再将非线性激活函数作用到每个特征图元素中得到激活后的特征图。激活函数表示为f(.),经过激活函数的特征图表示为a=f(c)。
5、将激活后的特征图导入池化层进行随机池化采样概率的运算
激活后的特征图a输入到池化层,池化层将在每个池化区域R中输出一个池化响应值s。对于传统的最大池化和平均池化方法,池化这个处理过程是确定的,池化层的处理过程如下:
其中,ai=f(ci),Rj是激活后的特征图a的第j个池化域,sj为第j个池化域池化响应输出。对于最大池化方法,可以表示为:
但是,最大池化和平均池化方法很容易导致网络过拟合,随机池化方法提出后被认为能够减缓该现象。与传统的池化方法不同的是,随机池化对于池化域处理的过程不是确定的,而是随机的,也就是池化域内每个激活元素都有机会被选中成为池化层的响应输出。传统的随机池化处理过程是根据池化域内每个非负激活元素的大小,计算采样概率来实现随机池化的。在第j个池化域Rj内,每个激活元素ai的采样概率pi计算如下:
其中,ak是属于池化域Rj内的激活元素。
从上述pi的计算可以很明显可以看出,该方法计算只适合非负响应的激活值。传统的随机池化当时提出时也只是考虑了ReLU这一种非负响应的激活函数,对如今具有负值响应的激活函数,如Leaky ReLU,PReLU和ELU等是完全无法适用的。
上述传统的随机池化方法计算采样概率对于负值响应的激活函数显然已无法适用,针对该问题,本发明提出了一种通用于负值响应激活函数的随机池化方法,该方法计算采样概率如下:
其中,ak是属于池化域Rj内的激活元素,表示池化域Rj中ai减去该池化域中最小的激活值再以池化域Rj中平移得到的非负值在Rj中归一化计算得到池化域内激活值对应的采样概率pi。
经过对池化域内每个激活值的平移为非负值操作,对其概率的计算才具有意义。该方法不严格等效于ReLU在传统的随机池化应用,但是相比却有较好的性能。图2显示了非线性激活函数ReLU对于随机池化(GeneralizedSto Pooling)和传统随机池化(StoPooling)在16层的VGG(VGG-16)卷积神经网络,CIFAR-10数据集下训练与测试分类错误率的比较。
同时也研究了对于负值响应激活函数保留负激活值的必要性,最常使用的最大池化方法,对于负值响应的激活值都存在一定程度的保留,那么对于池化域中不管是非负还是负值响应激活值应该都有机会被保留。图3显示了VGG-16网络下随机池化某池化层的输入(Input Activation)与输出(Output Pooled Activation)激活值大小的分布直方图。对于ReLU随机池化(GeneralizedSto Pooling)与传统的随机池化(Sto Pooling)分布上存在轻微区别,其中ELU上负值响应激活值分布的概率较高,更证明了负值响应激活值被保留的必要性。
6、以每个池化域内采样概率形成的多项式分布进行采样,输出为训练阶段的随机池化响应,训练阶段对应的池化响应值,可以表示为:
其中,位置l是根据上述第j个池化域内的|Rj|个概率值p形成的多项式分布,即采样得到。
上述池化响应值sj指的是训练阶段的随机池化输出,对于测试阶段,随机池化输出仅需要对池化域内所有激活值进行采样概率平均运算,如下:
7、基于mini-batch的随机梯度下降方法,利用训练集来训练卷积神经网络模型,利用分类训练好的卷积神经网络模型完成对测试集的分类。
将上述整个过程在Caffe框架下实现,该实施卷积神经网络在图像分类识别泛化能力效果验证所用图像分类数据集是CIFAR-10,CIFAR-100,分别为分10类,100类的训练集为50000张,测试集为10000张,大小为32×32的彩色图像。
表1为多种具有负值响应激活值的激活函数对于随机池化和最大池化在CIFAR-10,CIFAR-100两个图像分类数据集,且在本发明设计的VGG-16网络下测试分类准确率,其中表中GeneralizedSto指的是随机池化方法,Max表示的是最大池化方法。表1显示了,本发明的随机池化对于非线性激活函数不管是否为负值响应激活函数,训练出来的网络模型泛化能力都远优于常用标准的最大池化,其中具有负值响应激活值的激活函数ELU最明显,图4给出了其具体训练、测试的分类错误率曲线。
表1
图4显示了,VGG-16网络下ELU在CIFAR-10,CIFAR-100两个图像分类数据集,随机池化(GeneralizedSto Pooling)与常用标准的最大池化(Max Pooling)的图像分类识别性能比较。随机池化相比较于最大池化对于卷积神经网络具有更好的泛化能力。由本实施例的结果可以看出,本发明对卷积神经网络在图像分类中的泛化能力和准确度得到了很大的提升,充分证明了本发明的有效性。
Claims (7)
1.一种基于卷积神经网络随机池化的图像分类方法,其特征在于,该方法包括如下步骤:
(1)将待处理图像数据集划分为训练集、测试集;
(2)设计用于待处理图像数据集分类任务的卷积神经网络;
(3)对图像训练集和测试集在输入训练卷积网络前进行预处理;
(4)将预处理后的训练集和测试集依次分批量导入卷积神经网络结构中,卷积层得到四维张量特征图,使用激活函数激活特征图;
(5)将激活后的特征图导入卷积神经网络的池化层进行随机池化采样概率的运算;
(6)以每个池化域内采样概率形成的多项式分布进行采样,输出为训练阶段的随机池化响应;
(7)使用训练集训练卷积神经网络模型,利用分类训练好的卷积神经网络模型完成对测试集的分类。
2.根据权利要求1所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,在步骤(2)中,设计用于待处理图像数据集分类任务的卷积神经网络包括卷积神经网络层数,每层卷积核大小,每层特征图个数,全连接层的节点个数以及各层参数初始化策略,并且每层卷积层后的非线性激活函数是具有负值响应的激活函数。
3.根据权利要求1所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,在步骤(3)中,所述对图像训练集和测试集在输入训练卷积网络前进行预处理方法如下:首先将每张图像放缩到固定的尺寸大小,然后对于训练集和测试集,每张图片的每个通道内的像素点都减去训练集在每个通道的统计平均值,最后对图像的每个通道的像素值缩放到[0,1]区间。
4.根据权利要求1所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,在步骤(5)中,随机池化采样概率的运算方法如下:该运算首先将激活后的特征图在每个池化域中减去该池化域中最小的激活值,再以池化域中平移得到的非负激活值,归一化计算得到每个池化域内激活值对应的采样概率。
5.根据权利要求4所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,第j个池化域Rj内,每个激活元素ai的采样概率pi的计算方法如下:
6.根据权利要求1所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,在步骤(6)中,以池化域内激活值的采样概率平均运算输出为测试阶段的随机池化响应。
7.根据权利要求1所述的一种基于卷积神经网络随机池化的图像分类方法,其特征在于,在步骤(7)中,按照基于mini-batch的随机梯度下降方法,利用训练集来训练卷积神经网络模型,利用分类训练好的卷积神经网络模型完成对测试集的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810391921.3A CN108596258B (zh) | 2018-04-27 | 2018-04-27 | 一种基于卷积神经网络随机池化的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810391921.3A CN108596258B (zh) | 2018-04-27 | 2018-04-27 | 一种基于卷积神经网络随机池化的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108596258A true CN108596258A (zh) | 2018-09-28 |
CN108596258B CN108596258B (zh) | 2022-03-29 |
Family
ID=63610804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810391921.3A Active CN108596258B (zh) | 2018-04-27 | 2018-04-27 | 一种基于卷积神经网络随机池化的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596258B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109472316A (zh) * | 2018-11-16 | 2019-03-15 | 南通大学 | 一种基于深度学习的滤棒装盒质量识别方法 |
CN109670397A (zh) * | 2018-11-07 | 2019-04-23 | 北京达佳互联信息技术有限公司 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
CN109685119A (zh) * | 2018-12-07 | 2019-04-26 | 中国人民解放军陆军工程大学 | 一种随机最大池化深度卷积神经网络噪声图形分类方法 |
CN110399916A (zh) * | 2019-07-24 | 2019-11-01 | 淮阴工学院 | 一种基于图像增强和Inception网络的皮肤癌图像分类方法 |
CN110503645A (zh) * | 2019-08-29 | 2019-11-26 | 国合通用(青岛)测试评价有限公司 | 基于卷积神经网络对金相图片晶粒度进行判定的方法 |
CN110533090A (zh) * | 2019-08-21 | 2019-12-03 | 国网江苏省电力有限公司电力科学研究院 | 开关刀闸状态检测方法及装置 |
CN110781912A (zh) * | 2019-09-10 | 2020-02-11 | 东南大学 | 一种基于通道扩张倒置卷积神经网络的图像分类方法 |
CN110827260A (zh) * | 2019-11-04 | 2020-02-21 | 燕山大学 | 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法 |
CN111178237A (zh) * | 2019-12-27 | 2020-05-19 | 上海工程技术大学 | 一种路面状态识别方法 |
WO2020177108A1 (zh) * | 2019-03-01 | 2020-09-10 | 北京大学深圳研究生院 | 一种视频帧插值方法、装置及设备 |
CN111680711A (zh) * | 2020-04-08 | 2020-09-18 | 上海吴塘科技有限公司 | 基于卷积神经网络的Logo图像分类方法 |
CN111814831A (zh) * | 2020-06-10 | 2020-10-23 | 东莞东阳光科研发有限公司 | 一种测定腐蚀箔比容值的方法 |
CN111882565A (zh) * | 2020-07-28 | 2020-11-03 | 深圳市雨滴科技有限公司 | 一种图像二值化方法、装置、设备及存储介质 |
CN111898421A (zh) * | 2020-06-18 | 2020-11-06 | 东南大学 | 一种用于视频行为识别的正则化方法 |
CN111914612A (zh) * | 2020-05-21 | 2020-11-10 | 淮阴工学院 | 一种基于改进的卷积神经网络的施工图图元自适应识别方法 |
CN112149597A (zh) * | 2020-09-29 | 2020-12-29 | 中国水利水电科学研究院 | 一种基于深度学习的河流表面流速检测方法 |
CN112381020A (zh) * | 2020-11-20 | 2021-02-19 | 深圳市银星智能科技股份有限公司 | 一种视频场景识别方法、系统及电子设备 |
CN112668656A (zh) * | 2020-12-30 | 2021-04-16 | 深圳市优必选科技股份有限公司 | 一种图像分类方法、装置、计算机设备和存储介质 |
CN113128510A (zh) * | 2021-03-26 | 2021-07-16 | 武汉光谷信息技术股份有限公司 | 一种语义分割方法及系统 |
CN114742212A (zh) * | 2022-06-13 | 2022-07-12 | 南昌大学 | 一种电子数字信息重采样率估算方法 |
CN115578335A (zh) * | 2022-09-29 | 2023-01-06 | 西安理工大学 | 基于多尺度特征提取的声带白斑图像分类方法 |
CN116596885A (zh) * | 2023-05-19 | 2023-08-15 | 长江生态环保集团有限公司 | 一种排水管网状态实时检测方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890075A (zh) * | 2012-10-17 | 2013-01-23 | 中国环境科学研究院 | 一种地下水受有机物污染的快速判断方法 |
CN103996056A (zh) * | 2014-04-08 | 2014-08-20 | 浙江工业大学 | 一种基于深度学习的纹身图像分类方法 |
WO2014195132A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method of audio source separation and corresponding apparatus |
CN104408435A (zh) * | 2014-12-05 | 2015-03-11 | 浙江大学 | 一种基于随机池化卷积神经网络的人脸识别方法 |
CN104850845A (zh) * | 2015-05-30 | 2015-08-19 | 大连理工大学 | 一种基于非对称卷积神经网络的交通标志识别方法 |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN105913087A (zh) * | 2016-04-11 | 2016-08-31 | 天津大学 | 基于最优池化卷积神经网络的物体识别方法 |
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
US20170342465A1 (en) * | 2016-05-31 | 2017-11-30 | Cellular Research, Inc. | Error correction in amplification of samples |
CN107633513A (zh) * | 2017-09-18 | 2018-01-26 | 天津大学 | 基于深度学习的3d图像质量的度量方法 |
CN107871136A (zh) * | 2017-03-22 | 2018-04-03 | 中山大学 | 基于稀疏性随机池化的卷积神经网络的图像识别方法 |
-
2018
- 2018-04-27 CN CN201810391921.3A patent/CN108596258B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890075A (zh) * | 2012-10-17 | 2013-01-23 | 中国环境科学研究院 | 一种地下水受有机物污染的快速判断方法 |
WO2014195132A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method of audio source separation and corresponding apparatus |
CN103996056A (zh) * | 2014-04-08 | 2014-08-20 | 浙江工业大学 | 一种基于深度学习的纹身图像分类方法 |
CN104408435A (zh) * | 2014-12-05 | 2015-03-11 | 浙江大学 | 一种基于随机池化卷积神经网络的人脸识别方法 |
CN104850845A (zh) * | 2015-05-30 | 2015-08-19 | 大连理工大学 | 一种基于非对称卷积神经网络的交通标志识别方法 |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN105913087A (zh) * | 2016-04-11 | 2016-08-31 | 天津大学 | 基于最优池化卷积神经网络的物体识别方法 |
US20170342465A1 (en) * | 2016-05-31 | 2017-11-30 | Cellular Research, Inc. | Error correction in amplification of samples |
CN107871136A (zh) * | 2017-03-22 | 2018-04-03 | 中山大学 | 基于稀疏性随机池化的卷积神经网络的图像识别方法 |
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
CN107633513A (zh) * | 2017-09-18 | 2018-01-26 | 天津大学 | 基于深度学习的3d图像质量的度量方法 |
Non-Patent Citations (4)
Title |
---|
XIANG LI等: ""Decomposition strategy for the stochastic pooling problem"", 《JOURNAL OF GLOBAL OPTIMIZATION》 * |
ZEILER M D等: ""Stochastic Pooling for Regularization of Deep Convolutional Neural Networks"", 《EPRINT ARXIV》 * |
余萍等: ""基于非线性修正函数的卷积神经网络图像识别研究"", 《科学技术与工程》 * |
刘进涛等: ""基于熵值法的种业上市公司经营业绩评价"", 《研究与探索》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109670397A (zh) * | 2018-11-07 | 2019-04-23 | 北京达佳互联信息技术有限公司 | 人体骨骼关键点的检测方法、装置、电子设备及存储介质 |
US11373426B2 (en) | 2018-11-07 | 2022-06-28 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for detecting key points in skeleton, apparatus, electronic device and storage medium |
CN109472316A (zh) * | 2018-11-16 | 2019-03-15 | 南通大学 | 一种基于深度学习的滤棒装盒质量识别方法 |
CN109472316B (zh) * | 2018-11-16 | 2021-12-28 | 南通大学 | 一种基于深度学习的滤棒装盒质量识别方法 |
CN109685119A (zh) * | 2018-12-07 | 2019-04-26 | 中国人民解放军陆军工程大学 | 一种随机最大池化深度卷积神经网络噪声图形分类方法 |
CN109685119B (zh) * | 2018-12-07 | 2023-05-23 | 中国人民解放军陆军工程大学 | 一种随机最大池化深度卷积神经网络噪声图形分类方法 |
US11354541B2 (en) | 2019-03-01 | 2022-06-07 | Peking University Shenzhen Graduate School | Method, apparatus, and device for video frame interpolation |
WO2020177108A1 (zh) * | 2019-03-01 | 2020-09-10 | 北京大学深圳研究生院 | 一种视频帧插值方法、装置及设备 |
CN110399916A (zh) * | 2019-07-24 | 2019-11-01 | 淮阴工学院 | 一种基于图像增强和Inception网络的皮肤癌图像分类方法 |
CN110533090B (zh) * | 2019-08-21 | 2022-07-08 | 国网江苏省电力有限公司电力科学研究院 | 开关刀闸状态检测方法及装置 |
CN110533090A (zh) * | 2019-08-21 | 2019-12-03 | 国网江苏省电力有限公司电力科学研究院 | 开关刀闸状态检测方法及装置 |
CN110503645A (zh) * | 2019-08-29 | 2019-11-26 | 国合通用(青岛)测试评价有限公司 | 基于卷积神经网络对金相图片晶粒度进行判定的方法 |
CN110781912A (zh) * | 2019-09-10 | 2020-02-11 | 东南大学 | 一种基于通道扩张倒置卷积神经网络的图像分类方法 |
CN110827260B (zh) * | 2019-11-04 | 2023-04-21 | 燕山大学 | 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法 |
CN110827260A (zh) * | 2019-11-04 | 2020-02-21 | 燕山大学 | 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法 |
CN111178237A (zh) * | 2019-12-27 | 2020-05-19 | 上海工程技术大学 | 一种路面状态识别方法 |
CN111680711A (zh) * | 2020-04-08 | 2020-09-18 | 上海吴塘科技有限公司 | 基于卷积神经网络的Logo图像分类方法 |
CN111914612A (zh) * | 2020-05-21 | 2020-11-10 | 淮阴工学院 | 一种基于改进的卷积神经网络的施工图图元自适应识别方法 |
CN111914612B (zh) * | 2020-05-21 | 2024-03-01 | 淮阴工学院 | 一种基于改进的卷积神经网络的施工图图元自适应识别方法 |
CN111814831A (zh) * | 2020-06-10 | 2020-10-23 | 东莞东阳光科研发有限公司 | 一种测定腐蚀箔比容值的方法 |
CN111898421A (zh) * | 2020-06-18 | 2020-11-06 | 东南大学 | 一种用于视频行为识别的正则化方法 |
CN111882565A (zh) * | 2020-07-28 | 2020-11-03 | 深圳市雨滴科技有限公司 | 一种图像二值化方法、装置、设备及存储介质 |
CN112149597A (zh) * | 2020-09-29 | 2020-12-29 | 中国水利水电科学研究院 | 一种基于深度学习的河流表面流速检测方法 |
CN112381020A (zh) * | 2020-11-20 | 2021-02-19 | 深圳市银星智能科技股份有限公司 | 一种视频场景识别方法、系统及电子设备 |
CN112668656A (zh) * | 2020-12-30 | 2021-04-16 | 深圳市优必选科技股份有限公司 | 一种图像分类方法、装置、计算机设备和存储介质 |
CN112668656B (zh) * | 2020-12-30 | 2023-10-13 | 深圳市优必选科技股份有限公司 | 一种图像分类方法、装置、计算机设备和存储介质 |
CN113128510A (zh) * | 2021-03-26 | 2021-07-16 | 武汉光谷信息技术股份有限公司 | 一种语义分割方法及系统 |
CN114742212A (zh) * | 2022-06-13 | 2022-07-12 | 南昌大学 | 一种电子数字信息重采样率估算方法 |
CN115578335A (zh) * | 2022-09-29 | 2023-01-06 | 西安理工大学 | 基于多尺度特征提取的声带白斑图像分类方法 |
CN115578335B (zh) * | 2022-09-29 | 2023-05-05 | 西安理工大学 | 基于多尺度特征提取的声带白斑图像分类方法 |
CN116596885A (zh) * | 2023-05-19 | 2023-08-15 | 长江生态环保集团有限公司 | 一种排水管网状态实时检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108596258B (zh) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596258A (zh) | 一种基于卷积神经网络随机池化的图像分类方法 | |
CN109558832B (zh) | 一种人体姿态检测方法、装置、设备及存储介质 | |
CN110728209B (zh) | 一种姿态识别方法、装置、电子设备及存储介质 | |
WO2020238293A1 (zh) | 图像分类方法、神经网络的训练方法及装置 | |
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN110569756B (zh) | 人脸识别模型构建方法、识别方法、设备和存储介质 | |
CN110378381A (zh) | 物体检测方法、装置和计算机存储介质 | |
CN112613581B (zh) | 一种图像识别方法、系统、计算机设备和存储介质 | |
CN111860398B (zh) | 遥感图像目标检测方法、系统及终端设备 | |
CN111989689A (zh) | 用于识别图像内目标的方法和用于执行该方法的移动装置 | |
WO2021047587A1 (zh) | 手势识别方法、电子设备、计算机可读存储介质和芯片 | |
EP4006776A1 (en) | Image classification method and apparatus | |
CN113468996B (zh) | 一种基于边缘细化的伪装物体检测方法 | |
CN111738344A (zh) | 一种基于多尺度融合的快速目标检测方法 | |
WO2021238548A1 (zh) | 区域识别方法、装置、设备及可读存储介质 | |
CN113011253B (zh) | 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质 | |
CN114241277A (zh) | 注意力引导的多特征融合伪装目标检测方法、装置、设备及介质 | |
CN110837777A (zh) | 基于改进VGG-Net的部分遮挡的人脸表情识别方法 | |
CN113920516A (zh) | 一种基于孪生神经网络的书法字骨架匹配方法及系统 | |
CN111814682A (zh) | 人脸活体检测方法及装置 | |
CN115223239A (zh) | 一种手势识别方法、系统、计算机设备以及可读存储介质 | |
Zhang et al. | Residual attentive feature learning network for salient object detection | |
CN110363747A (zh) | 智能化异常细胞判断方法、装置及计算机可读存储介质 | |
CN113869282A (zh) | 人脸识别方法、超分模型训练方法及相关设备 | |
CN111881803B (zh) | 一种基于改进YOLOv3的畜脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |