CN111898695A - 一种便捷卷积方法 - Google Patents

一种便捷卷积方法 Download PDF

Info

Publication number
CN111898695A
CN111898695A CN202010791803.9A CN202010791803A CN111898695A CN 111898695 A CN111898695 A CN 111898695A CN 202010791803 A CN202010791803 A CN 202010791803A CN 111898695 A CN111898695 A CN 111898695A
Authority
CN
China
Prior art keywords
layer
pooling
window
convolution
convenient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010791803.9A
Other languages
English (en)
Inventor
盛建中
唐赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Wukongyu Artificial Intelligence Application Software Co ltd
Original Assignee
Wuhan Wukongyu Artificial Intelligence Application Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Wukongyu Artificial Intelligence Application Software Co ltd filed Critical Wuhan Wukongyu Artificial Intelligence Application Software Co ltd
Priority to CN202010791803.9A priority Critical patent/CN111898695A/zh
Publication of CN111898695A publication Critical patent/CN111898695A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明属于卷积神经网络在计算机视觉中的应用研究领域,具体涉及一种便捷卷积方法,包括以下步骤:从MNIST数据集中获取训练集与测试集,其中训练集包括60000个样本,测试集包括10000个样本,输入尺寸为28*28,输出尺寸为10,样本大小为50;构建一个具有两个完全连接层的二次卷积神经网络,每个便捷卷积层之后是随机池化层和ReLU层,第一个完全连接层的末尾是ReLU层,第二个完全连接层直接连接到softmax层,便捷卷积层和随机池化层均由模式K来控制操作模式;本发明提出的便捷卷积池化技术仅需要常规卷积运算的25%;本发明能有效加快卷积的训练和测试速度。

Description

一种便捷卷积方法
技术领域
本发明属于卷积神经网络在计算机视觉中的应用研究领域,具体涉及一种便捷卷积方法。
背景技术
卷积神经网络(CNNs)是一种有前途的机器学习算法,在各种计算机视觉任务中可实现卓越的性能,例如图像分类。这种成功的关键原因之一是它们的深层架构。实践证明更深层次的架构可以提供更好的性能。因此,在过去几年中CNN的性能主要通过设计更深入的体系结构得到了改进。神经网络在其模型中具有大量参数的情况并不少见,因此需要花费更多的时间来训练和测试网络。
发明内容
由于神经网络在模型中具有大量参数的情况并不少见,需要花费更多的时间来训练和测试网络。本发明提出了一种便捷卷积池化(ECP)方法,以加快训练和测试速度。
一种便捷卷积方法,包括以下步骤:
从MNIST数据集中获取训练集与测试集,其中训练集包括60000个样本,测试集包括10000个样本,输入尺寸为28*28,输出尺寸为10,样本大小为50;
构建一个具有两个完全连接层的二次卷积神经网络,每个便捷卷积层之后是随机池化层和ReLU层,第一个完全连接层的末尾是ReLU层,第二个完全连接层直接连接到softmax层,便捷卷积层和随机池化层均由模式K来控制操作模式;
利用训练集与测试集对构建的系统进行测试。
便捷卷积层和随机池化层均由模式K来控制操作模式,包括:
随机池化层模式K在池化之前被随机设置,随机池化层随机选择滑动窗口中四个像素中的一个像素来表示池化滑动窗口的输出,当模式K为0时,每次都从滑动窗口中选择第0个像素,选择出第一个像素0元素后,将滑动窗口向右滑动两步以获得第二个像素0元素,直到挑选出全部的像素0元素,随机池化层的输出特征图由这些像素0元素组成,当模式K为1、2、3时,对像素1、2、3元素执行相同的操作;
便捷卷积层使用与随机池化层相同的模式K进行控制,窗口0是用于在池化层中生成用于池化窗口的选定像素0元素的选定窗口,每个窗口0是在模式0下输入图像上的滑动卷积窗口,这些卷积窗口的输出是池化层中用于随机池化所需的像素,第一个窗口0在合并窗口中生成第一个像素0,第二个窗口0在合并窗口中生成第二个像素0,卷积窗口在输入图像上滑动以产生卷积层的输出特征,各种模式K确定各种窗口K,以生成合并窗口中所需的各种像素K元素,从左到右,从上到下滑动后,形成卷积层的特征图;
利用从输入图像中提取到的数据进行卷积计算,卷积计算公式如下:
Figure BDA0002624885060000021
其中,x(m,n)表示输入图像的大小,W(u,v)是卷积滤波器的权重矩阵。
本发明的有益效果在于:
(1)本发明提出的便捷卷积池化技术仅需要常规卷积运算的25%;
(2)本发明能有效加快卷积的训练和测试速度;
(3)本发明提出的新颖技术(ECP)可以转移到支持Python的任何平台。
附图说明
图1是ECP网络的总体架构;
图2是随机池化的工作示意图;
图3是平均池化的工作示意图;
图4是最大池化的工作示意图;
图5是便捷卷积的工作示意图;
图6是不同模式K下的随机池化示意图;
图7是ECP网络的收敛结果示意图;
图8是一个卷积层下随机池化的收敛性与平均/最大池化对比图;
图9是两个卷积层下随机池化的收敛性与平均/最大池化对比图;
图10是一个卷积层下ECP的收敛性与平均/最大池化对比图;
图11是两个卷积层下ECP的收敛性与平均/最大池化对比图。
具体实施方式
下面结合附图对本发明做进一步描述。
术语解释
1、CNN,Convolutional Neural Networks,卷积神经网络。基础的CNN由卷积(convolution),激活(activation),and池化(pooling)三种结构组成。CNN输出的结果是每幅图像特定特征空间。
2、ECP:EasyConvPooling,便捷卷积池化。本发明中ECP将取代传统的卷积和池化操作,我们从四个像素中随机选择一个像素,并且只执行所选像素的卷积操作。因此只需要四分之一的传统卷积计算。
一种便捷卷积方法,具体步骤包括:
从MNIST数据集中获取训练集与测试集,其中训练集包括60000个样本,测试集包括10000个样本。输入尺寸为28*28,输出尺寸为10,将样本大小设置为50。
与传统卷积和池化相比,本发明提出了ECP网络的总体架构。在图1中,我们设计了一个具有两个完全连接层的二次卷积神经网络。每个便捷卷积层之后是随机池化层和ReLU层。在完全连接层中,我们在第一层的末尾加了一个ReLU层,并将第二个完全连接层直接连接到softmax层。便捷卷积和随机池化都具有模式K来控制操作模式。为了确保它们在相同的模式K下匹配,每个便捷卷积层后面都跟随一个随机池化层,具体结构如下:
1、随机设置模式k;
在随机池中,本发明通过设置随机池化模式K来获得所选像素的索引。随机池化模式K代表池窗口中四个像素的位置索引,从0到3,从上到下,从左到右。随机池化模式K在池化之前被随机设置,因此我们可以弄清楚如何在上层进行便捷卷积。
2、随机池化;
在常规卷积中,我们需要计算每个卷积窗口的输出以生成特征图,但是在池化层中,只有四个像素中的一个(步长=2)来表示池化窗口的输出。在平均池中,我们计算四个像素的平均值来生成池窗口的输出;在最大池中,我们通过选择最大值像素来生成输出。随机池只是随机选择四个像素中的一个来表示池窗口的输出,减少75%的额外卷积。
图2演示了随机池化到底如何工作。一旦设置了随机池模式K,本发明就可以确定在虚线池化窗口中选择哪个像素。模式0表示每次都从合并窗口中选择第0个像素。选择第一个像素0元素后,我们将合并窗口向右滑动两步以获得第二个像素0元素。合并窗口每次从左到右,从上到下滑动两次。最后,随机池化的输出特征图由那些像素0元素组成。在模式1、2和3中,对像素1、2和3元素执行相同的操作。实际上,随机池化总是选择池窗口中相同位置的像素来构成池化窗口的输出,从而形成池化层的输出特征图。各种模式K表示合并窗口中各种像素的位置。
在传统的平均池化/最大池化中,池化窗口的输出始终是池化窗口的平均值/最大值。图2的中间是提出的随机池化,图3与图4是传统的平均池化/最大池化。
3、便捷卷积;
为了匹配和控制便捷卷积模式和随机池化模式,本发明使用相同的K来控制便捷卷积模式。由于卷积滑动窗口的重叠,本发明需要两个变量来定位所选卷积窗口的位置。在程序设计层面,本发明将便捷卷积中的两个变量与随机池化模式K相匹配,这样就可以使用便捷卷积层中的相同K来提取与随机池化匹配的相同位置的元素。
在分段随机池中,本发明通过设置随机池化模式K来获得所选像素的索引,然后使用相同的模式K进行便捷卷积。图5显示了本发明如何进行便捷卷积操作,它与随机池化非常相似。图中,输入图像上的每个卷积窗口都包含多个权重。为了获得下一层的特征图,在具有滑动卷积窗口的这些输入图像上执行卷积操作。窗口0是用于在池化层中生成用于池化窗口的选定像素0元素的选定窗口。每个窗口0是在模式0下输入图像上的滑动卷积窗口。这些卷积窗口的输出是池化层中用于随机池化所需的像素。在图2中,第一个窗口0在合并窗口中生成第一个像素0,第二个窗口0在合并窗口中生成第二个像素0。卷积窗口在输入图像上滑动以产生卷积层的输出特征。各种模式K确定各种窗口K,以生成合并窗口中所需的各种像素K元素。从左到右,从上到下滑动后,形成卷积层的特征图。
在常规卷积中,滑动卷积窗口在所有输入图像区域上滑动以生成特征图元素。在便捷卷积中,滑动卷积窗口仅滑动到窗口K位置以提取所选数据,从而以原始形状的四分之一减少了75%的额外数据。
从输入图像中提取所需数据后,本发明可以像往常一样轻松地计算卷积,减少75%的卷积。卷积计算公式如下:
Figure BDA0002624885060000041
其中x(m,n)是输入图像的大小,W(u,v)是卷积滤波器的权重矩阵。运算符“*”表示二维卷积。
在某些情况下,我们使用填充技术来保持输出形状不变。本发明在便捷卷积的输出中加入填充来恢复特征映射的形状,这样网络就可以正常运行了。为了便于卷积,本发明将相同的值填充到相邻的空像素上,如图5所示。
本发明为了验证所提出的技术ECP的时间性能,使用MNIST数据集对该技术和传统网络进行测试,同时评估了ECP的训练时间和测试时间。
一种便捷卷积方法,本实例使用来自美国国家标准与技术研究所的MNIST数据集来验证,具体步骤包括:
从数据集中获取训练集与测试集,其中训练集包括60000个样本,测试集包括10000个样本。测试本发明提出的ECP网络的性能,评估训练时间和测试时间。
本发明提出了一种称为便捷卷积池化(ECP)的有效技术,以加快训练和测试速度。此外,本发明使用提出的ECP和传统卷积方法设计了一个纯卷积的特殊测试,以比较它们在卷积上的实际操作时间。测试ECP的具体步骤包括:
将数据集的样本大小设置为50,学习率设置为0.001。MNIST数据集的输入尺寸为28*28,网络的输出尺寸为10。为了测试本发明提出的ECP的时间性能,我们将ECP网络与传统的最大/平均池化相比较,选择在MNIST数据库上进行100个时期的测试,结果如下表所示,第一列显示了准确度首次达到98%时的确切时间,其他列显示了时间性能。
方法 Iter(98%) 训练时间(ms) 测试时间(ms) 纯卷积时间(ms)
最大池化 3 299650.15 23814.87 4496.77
ECP 4 243077.47(1.23x) 13084.98(1.82x) 883.65(5.09x)
方法 Iter(98%) 训练时间(ms) 测试时间(ms) 纯卷积时间(ms)
平均池化 5 352544.96 21426.24 4496.77
ECP 4 243077.47(1.45x) 13084.98(1.64x) 883.65 5.09x)
除了时间性能外,在训练和测试步骤中,准确度是另一个关键参数。考虑到ECP的随机性,可能会导致准确度下降,我们首先对MNIST数据集进行200次训练,以确保在实验过程中获得最佳的精度。结果表明100次的训练结果已经足够。
在测试准确性的实验中,我们保持两层卷积网络不变,在K值不同的情况下,分别将ECP网络与传统的最大/平均池化相比较。结果如下表所示。
Figure BDA0002624885060000051
Figure BDA0002624885060000061
在随机池化和便捷卷积中,我们通过模式K随机设置一个参数,为了找出模式K对网络的影响,我们选择在不同模式K的情况下,分别使用随机池化技术和ECP技术在两层卷积网络上设计测试。结果如图6,7,其中图6是不同模式K下的随机池化,图7显示了ECP的收敛结果。为了测试网络深度对ECP网络的影响,我们选择不同的卷积层数(一层卷积,两层卷积)对ECP网络与最大/平均池化相比较。结果如下表所示。
Figure BDA0002624885060000062
本发明提出的ECP由两部分组成:便捷卷积和随机池化。为了比较随机池化与平均/最大池化的收敛性,我们选择在不同的卷积情况下(常规卷积,便捷卷积)进行对比。结果如图8,9是在一个卷积层和两个卷积层下的随机池化的收敛性与平均/最大池化,图10、11是一个卷积层和两个卷积层下的ECP的收敛性与平均/最大池化。
最终,ECP网络在MNIST数据集上的测试结果如下,从结果中中,我们可以看出在时间性能上,本发明提出的ECP与平均池化相比,训练时间上实现了1.45倍的加速,测试时间上实现了1.64倍的加速,卷积时间上实现了5.09倍的加速。
从实验结果的准确性上看,可以看出本发明提出的ECP在不损失准确性的情况下实现了良好的改进。根据图6、7,我们可以看出模式K对ECP的时间性能和准确性几乎没有影响。从表中,我们可以看出平均池化的性能要由于最大池化。与平均池化相比,我们获得了更高的性能加速,且准确性有所提高而不是下降。此外,与最大池化相比,本发明提出的ECP的时间性能在网络深度加深的情况下甚至更好,且精度损失很小。根据结果图8、9和图10、11,与传统的平均/最大池化相比,随机池化和ECP均可实现良好的收敛性。

Claims (2)

1.一种便捷卷积方法,其特征在于,包括以下步骤:
(1)从MNIST数据集中获取训练集与测试集,其中训练集包括60000个样本,测试集包括10000个样本,输入尺寸为28*28,输出尺寸为10,样本大小为50;
(2)构建一个具有两个完全连接层的二次卷积神经网络,每个便捷卷积层之后是随机池化层和ReLU层,第一个完全连接层的末尾是ReLU层,第二个完全连接层直接连接到softmax层,便捷卷积层和随机池化层均由模式K来控制操作模式;
(3)利用步骤(1)中的数据集对步骤(2)中构建的系统进行测试。
2.根据权利要求1所述的便捷卷积层和随机池化层均由模式K来控制操作模式,其特征在于,包括:
随机池化层模式K在池化之前被随机设置,随机池化层随机选择滑动窗口中四个像素中的一个像素来表示池化滑动窗口的输出,当模式K为0时,每次都从滑动窗口中选择第0个像素,选择出第一个像素0元素后,将滑动窗口向右滑动两步以获得第二个像素0元素,直到挑选出全部的像素0元素,随机池化层的输出特征图由这些像素0元素组成,当模式K为1、2、3时,对像素1、2、3元素执行相同的操作;
便捷卷积层使用与随机池化层相同的模式K进行控制,窗口0是用于在池化层中生成用于池化窗口的选定像素0元素的选定窗口,每个窗口0是在模式0下输入图像上的滑动卷积窗口,这些卷积窗口的输出是池化层中用于随机池化所需的像素,第一个窗口0在合并窗口中生成第一个像素0,第二个窗口0在合并窗口中生成第二个像素0,卷积窗口在输入图像上滑动以产生卷积层的输出特征,各种模式K确定各种窗口K,以生成合并窗口中所需的各种像素K元素,从左到右,从上到下滑动后,形成卷积层的特征图;
利用从输入图像中提取到的数据进行卷积计算,卷积计算公式如下:
Figure FDA0002624885050000011
其中,x(m,n)表示输入图像的大小,W(u,v)是卷积滤波器的权重矩阵。
CN202010791803.9A 2020-08-10 2020-08-10 一种便捷卷积方法 Pending CN111898695A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010791803.9A CN111898695A (zh) 2020-08-10 2020-08-10 一种便捷卷积方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010791803.9A CN111898695A (zh) 2020-08-10 2020-08-10 一种便捷卷积方法

Publications (1)

Publication Number Publication Date
CN111898695A true CN111898695A (zh) 2020-11-06

Family

ID=73246233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010791803.9A Pending CN111898695A (zh) 2020-08-10 2020-08-10 一种便捷卷积方法

Country Status (1)

Country Link
CN (1) CN111898695A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
US20170357879A1 (en) * 2017-08-01 2017-12-14 Retina-Ai Llc Systems and methods using weighted-ensemble supervised-learning for automatic detection of ophthalmic disease from images
CN107784320A (zh) * 2017-09-27 2018-03-09 电子科技大学 基于卷积支持向量机的雷达一维距离像目标识别方法
CN109871904A (zh) * 2019-03-11 2019-06-11 广东工业大学 甲骨文字识别模型及训练方法、系统、设备、计算机介质
US20190236411A1 (en) * 2016-09-14 2019-08-01 Konica Minolta Laboratory U.S.A., Inc. Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks
CN110398370A (zh) * 2019-08-20 2019-11-01 贵州大学 一种基于hts-cnn模型的轴承故障诊断方法
CN111460932A (zh) * 2020-03-17 2020-07-28 哈尔滨工程大学 基于自适应卷积的水声信号分类识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190236411A1 (en) * 2016-09-14 2019-08-01 Konica Minolta Laboratory U.S.A., Inc. Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks
CN107358260A (zh) * 2017-07-13 2017-11-17 西安电子科技大学 一种基于表面波cnn的多光谱图像分类方法
US20170357879A1 (en) * 2017-08-01 2017-12-14 Retina-Ai Llc Systems and methods using weighted-ensemble supervised-learning for automatic detection of ophthalmic disease from images
CN107784320A (zh) * 2017-09-27 2018-03-09 电子科技大学 基于卷积支持向量机的雷达一维距离像目标识别方法
CN109871904A (zh) * 2019-03-11 2019-06-11 广东工业大学 甲骨文字识别模型及训练方法、系统、设备、计算机介质
CN110398370A (zh) * 2019-08-20 2019-11-01 贵州大学 一种基于hts-cnn模型的轴承故障诊断方法
CN111460932A (zh) * 2020-03-17 2020-07-28 哈尔滨工程大学 基于自适应卷积的水声信号分类识别方法

Similar Documents

Publication Publication Date Title
CN112580263B (zh) 基于时空特征融合的涡扇发动机剩余使用寿命预测方法
CN111242841B (zh) 一种基于语义分割和深度学习的图片背景风格迁移方法
CN110807544B (zh) 一种基于机器学习的油田剩余油饱和度分布的预测方法
CN106228185A (zh) 一种基于神经网络的通用图像分类识别系统及方法
CN109087375B (zh) 基于深度学习的图像空洞填充方法
CN108629291B (zh) 一种抗网格效应的人脸深度预测方法
CN112085738B (zh) 一种基于生成对抗网络的图像分割方法
CN106067161A (zh) 一种对图像进行超分辨的方法
CN107679543A (zh) 稀疏自动编码器与极限学习机立体图像质量评价方法
CN111476247B (zh) 利用了1xK或Kx1卷积运算的CNN方法及装置
CN112446381B (zh) 一种利用全卷积网络驱动的基于测地线活动轮廓的混合语义分割方法
CN112489164B (zh) 基于改进深度可分离卷积神经网络的图像着色方法
CN112101364B (zh) 基于参数重要性增量学习的语义分割方法
CN106355210B (zh) 基于深度神经元响应模式的绝缘子红外图像特征表达方法
CN106951912A (zh) 一种果蔬外观变化识别模型的建立方法和识别方法
CN111488901A (zh) 在cnn中从多个模块内的输入图像提取特征的方法及装置
CN111027630A (zh) 一种基于卷积神经网络的图像分类方法
CN113705641A (zh) 基于富上下文网络的高光谱图像分类方法
CN110991621A (zh) 一种基于通道数搜索卷积神经网络的方法
CN111340133A (zh) 一种基于深度卷积神经网络的图像分类处理方法
CN105260736A (zh) 基于归一化非负稀疏编码器的图像快速特征表示方法
CN110222817A (zh) 基于学习自动机的卷积神经网络压缩方法、系统及介质
CN113888491A (zh) 基于非局部特征的多级高光谱图像递进超分方法及系统
CN113095501A (zh) 一种基于深度强化学习的不平衡分类决策树生成方法
CN111898695A (zh) 一种便捷卷积方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201106