CN107341549A - 一种基于多通道竞争卷积神经网络参数优化方法 - Google Patents
一种基于多通道竞争卷积神经网络参数优化方法 Download PDFInfo
- Publication number
- CN107341549A CN107341549A CN201710616495.4A CN201710616495A CN107341549A CN 107341549 A CN107341549 A CN 107341549A CN 201710616495 A CN201710616495 A CN 201710616495A CN 107341549 A CN107341549 A CN 107341549A
- Authority
- CN
- China
- Prior art keywords
- network
- sub
- parameter
- performance
- network performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于多通道竞争卷积神经网络参数优化方法,具体方法为:构建一个卷积神经子网络,将所构建的子网络复制N份,作为N个通道构建多通道卷积神经网络;所述N为大于等于2的自然数。与现有技术相比,基于多通道竞争卷积神经网络参数优化,模拟了人脑神经网络中神经元的激励、奖励与抑制的机制,解决了现有网络单一的参数初始化方式容易陷入局部最优的问题。
Description
技术领域
本发明涉及一种机器学习、神经网络、计算机视觉、大尺度图像识别领域,特别是涉及一种适用于任何神经网络的训练过程,基于多通道竞争卷积神经网络参数优化方法。
背景技术
近年来,深度卷积网络已经成为大尺度视觉识别最有力的武器。沿着深度学习技术,研究者们从网络结构以及网络深度的角度不断提出新的网络,并且取得了很好的性能。这些方法都遵循同一个流程:从输入图像开始,每一层都接收前一层的输入,然后经过一个非线性单元,再输入到下一层网络,直至输出层。整个过程采用反向传播的方式计算梯度,利用随机梯度下降法端对端地学习网络的参数。所以它们在训练过程中存在以下几个缺点:
1、一旦随机初始化参数固定,极有可能陷入局部最优值,从而造成对性能的影响;
2、每次迭代网络的所有权值系数都要调整,存在损失曲线稳定性及训练效率等问题;
3、目标函数的损失是固定的,不能在训练过程中进行相应的调整和改变。
进一步,我们从人脑的工作方式看:
1、人脑的学习是多向性发散的,人可以在很复杂、各种干扰的环境中去学习知识并且辨识目标,而现有网络在训练过程中往往选取单一的参数初始化设定方式;
2、人脑对外界环境具有很强的自我调整能力;人脑神经元在收到外界的激励,在给予相应响应的同时,还会奖励当前的神经元,从而抑制周围的其他神经元;在学习的过程中不断调整学习策略,以便做出更好的判决和奖励。而现有网络在训练过程中并没有进行相应的自我调整。
3、人脑在学习过程中具有很强的灵活性;不仅能够学习新知识,还能遗忘无用的冗余信息;既能采取“自下而上”的途径,还能通过“自上而下”的途径;采用自下而上的方式,人们可以从部件到区域不断抽象的方式辨识对象。而现有网络往往只采取端对端地“自下而上”的训练方法,忽略了“自上而下”的针对不同对象的注意力。
以上这些因素反映了现有卷积神经网络的局限性,在训练过程中进而影响到卷积神经网络的性能。传统的网络训练方法只通过一种随机化初始参数策略,然后端对端地更新单一网络的参数,网络的性能无法得到进一步提升。
因此,本专利基于“优胜劣汰”的思想,提出一种多通道竞争卷积神经网络,模拟了人脑神经网络中神经元的激励、奖励与抑制的机制,对卷积网络进行训练。在训练每次迭代过程中,我们按照最终的网络输出,选取最好结果的网络通道作为优胜者,指导下一次迭代的训练。适用于任何神经网络,在不同的平台具有很好的扩展性。
发明内容
本发明要解决的技术问题是提供一种卷积神经网络性能更高的,基于多通道竞争卷积神经网络参数优化方法。
现有卷积神经网络参数优化方法存在现有网络单一的参数初始化方式容易陷入局部最优的问题缺陷,和每次迭代网络的所有参数都根据损失调整存在稳定性及训练效率等问题缺陷。
本发明采用的技术方案如下:一种基于多通道竞争卷积神经网络参数优化方法,具体方法为:构建一个卷积神经子网络,将所构建的子网络复制N份,作为N个通道构建多通道卷积神经网络;所述N为大于等于2的自然数。
还包括对各个子网络进行优化的方法,具体方法步骤为:
一、对子网络进行参数初始化和学习率设定;
二、将训练样本输入到每个子网络中进行训练,找到网络性能最好的一个子网络,和网络性能最差的两个子网络;
三、对于网络性能最好的一个子网络,将所有学习到的参数保持不变,对于网络性能最差的两个子网络,首先从网络性能最好的一个子网络中每个滤波器中随机选取设定比例的滤波器系数,然后将网络性能最差的两个子网络中对应位置的参数替换为从网络性能最好的一个子网络中挑选出来的系数;
四、将参数替代后的各个子网络进行训练并得到其网络性能,对参数替代后的子网络和参数替代前的子网络的网络性能进行比较,如果参数替代后的网络网络性能比参数替代前的网络网络性能好,则用参数替代后的网络替换参数替代前的网络;如果参数替代后的网络网络性能比参数替代前的网络网络性能差,则保留参数替代前的网络;
五、循环步骤二到步骤四,并判断循环迭代次数是否达到循环迭代次数阈值,如果否,则继续循环骤二到步骤四的过程;如果是,则停止循环,选取训练网络性能最好的各个子网络作为最终的网络。
所述步骤二中,将训练样本输入到每个子网络中进行训练的具体方法为:将训练样本按照设定的批的大小随机分批,将每批样本输入到每个子网络中进行训练。
所述步骤二中,找到网络性能最好的一个子网络,和网络性能最差的两个子网络的具体方法为:迭代训练设定次数后,得到各个子网络及他们的损失误差,根据损失误差确定网络性能最好的一个子网络和网络性能最差的两个子网络;子网络的损失误差越小,则网络性能越好。
所述步骤三中所述随机选取设定比例的滤波器系数为随机选取50%的滤波器系数。
与现有技术相比,本发明的有益效果是:基于“优胜劣汰”的思想,模拟了人脑神经网络中神经元的激励、奖励与抑制的机制,对卷积网络进行训练;在训练每次迭代过程中,我们按照最终的网络输出,选取最好结果的网络通道作为优胜者,指导下一次迭代的训练。弥补了现有技术卷积神经网络只通过一种随机化初始参数策略,然后端对端地更新单一网络参数的方法,网络的性能得到了进一步提升。
附图说明
图1为本发明其中一实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本说明书(包括摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或者具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
具体实施例1
一种基于多通道竞争卷积神经网络参数优化方法,具体方法为:构建一个卷积神经子网络,将所构建的子网络复制N份,作为N个通道构建多通道卷积神经网络;所述N为大于等于2的自然数。
基于多通道竞争卷积神经网络参数优化,模拟了人脑神经网络中神经元的激励、奖励与抑制的机制,解决了现有网络单一的参数初始化方式容易陷入局部最优的问题。
类似现有卷积神经网络,将卷积层、池化层和非线性单元依次连接,作为一个模块;然后将该模块复制三份,串联在一起。最后一个模块后接两个全连接层。这样构建一个卷积神经子网络。
为了减少训练复杂度,在本具体实施例中,N小于等于5。其中,卷积层:滤波器大小为滤波器移动步长卷积谱个数为M。式中n表示第n个子网络通道,l表示子网络的第l层(l<=M)。这里,我们设定 第一个模块设定为M=256,第二个和第三个模块设置为M=512。池化层:池化层将小邻域内的特征点聚集得到新的特征。池化方法有(最大值池化max-pooling、平均池化average-pooling)。平均池化,即对邻域内特征点只求平均;最大值池化,即对邻域内特征点取最大。在本具体实施例中,采用最大值池化的池化方法,设定全连接层:可看做滤波器大小为1*1,移动步长为1的卷积层。
在每个子网络通道后添加损失层,目标函数采用softmaxloss形式。
具体实施例2
在具体实施例1的基础上,还包括对各个子网络进行优化的方法,具体方法步骤为:
一、对子网络进行参数初始化和学习率设定;
二、将训练样本输入到每个子网络中进行训练,找到网络性能最好的一个子网络,和网络性能最差的两个子网络;
三、对于网络性能最好的一个子网络,将所有学习到的参数保持不变,对于网络性能最差的两个子网络,首先从网络性能最好的一个子网络中每个滤波器中随机选取设定比例的滤波器系数,然后将网络性能最差的两个子网络中对应位置的参数替换为从网络性能最好的一个子网络中挑选出来的系数;
四、将参数替代后的各个子网络进行训练并得到其网络性能,对参数替代后的子网络和参数替代前的子网络的网络性能进行比较,如果参数替代后的网络网络性能比参数替代前的网络网络性能好,则用参数替代后的网络替换参数替代前的网络;如果参数替代后的网络网络性能比参数替代前的网络网络性能差,则保留参数替代前的网络;
五、循环步骤二到步骤四,并判断循环迭代次数是否达到循环迭代次数阈值,如果否,则继续循环骤二到步骤四的过程;如果是,则停止循环,选取网络性能最好的各个子网络作为最终的网络。
通过将“优胜劣汰”的竞争思想用于网络参数的更新提升卷积神经网络的特征表达能力,提升网络性能。
所述步骤一中,构建卷积滤波器参数初始化方法集:{Xavier,Gaussian,MSRA},每一个子网络随机选取一种参数初始化方式,每个子网络的学习率设定为αn。
具体实施例3
在具体实施例2的基础上,所述步骤二中,将训练样本输入到每个子网络中进行训练的具体方法为:将训练样本按照设定的批的大小(在本具体实施例中批大小设定为256)随机分批,将每批样本输入到每个子网络中进行训练。
具体实施例4
在具体实施例2或3的基础上,所述步骤二中,找到网络性能最好的一个子网络,和网络性能最差的两个子网络的具体方法为:迭代训练设定次数后,得到各个子网络及他们的误差,根据损失误差确定网络性能最好的一个子网络和网络性能最差的两个子网络;子网络的损失误差越小,则网络性能越好。
具体实施例5
在具体实施例2到4之一的基础上,所述步骤三中所述随机选取设定比例的滤波器系数为随机选取50%的滤波器系数。
具体实施例6
在具体实施例2到5之一的基础上,如图1所示,在本具体实施例中,将得到的各个子网络记为损失误差记为δn,n=1,...,N。δn越小,说明该子网络的网络性能越好。将各个子网络的损失按照从小到大的顺序排序,选取最前面的1个子网络作为优胜的网络,记为选取最后面2个子网络作为性能较差的网络,记为对于将所有学习到的参数保持不变;对于首先分别从网络中的每个滤波器中随机选取50%的滤波器系数,然后将中对应位置的参数替换为从中挑选出来的系数。
对修改之后的所有子网络进行训练,待所有子网络的分类损失误差达到平稳状态,就暂停当前阶段的训练。然后存储修改之后的网络参数比较和中各个子网络的损失误差。如果参数替换后的网络性能比优化前的网络性能好,这样就用优化后的网络替换优化前的网络如果参数替换后的网络性能比优化前的网络性能差,这样就丢弃优化后的网络保留优化前的网络继续挑选优胜的子网络。经过M(本具体实施例中为10)次迭代,然后将所有更新后的子网络进行训练。待训练结束,选取训练性能最好的子网络作为最终的网络。
用修改之后的网络进行训练,训练一定次数后,对比修改后和修改前的网络产生的误差大小,判断先前参数更新是否有效,保留性能好的网络用于后面的训练。通过不断地重复这个过程,最终可以训练出一个性能优异的网络,该网络的特征表达能力比传统方法训练的网络要有所提升。
AlexNet网络作为经典的图像分类网络,对随后各种网络的设计都具有十分重要的影响。此处以AlexNet解决Cifar-100数据库图像分类问题为例,阐述本发明的有效性。
首先将AlexNet作为单个子网络,构建5个同AlexNet结构的多通道网络。网络初始学习率设置为0.001,最大迭代次数30万次,批大小设置为256。
网络每经过5000次,按照损失误差排名,选取优胜的子网络,利用优胜的子网络参数部分替换性能较差的子网络参数,进一步训练到10000次,保留训练结果较好的网络,多次迭代直至选取最终输出的优胜子网络。
初步预判,经过本发明提出的算法训练之后的网络性能,比使用传统优化算法训练的网络性能要高出2%~3%。这样的结果证明了本发明的有效性。
Claims (5)
1.一种基于多通道竞争卷积神经网络参数优化方法,具体方法为:构建一个卷积神经子网络,将所构建的子网络复制N份,作为N个通道构建多通道卷积神经网络;所述N为大于等于2的自然数。
2.根据权利要求1所述的基于多通道竞争卷积神经网络参数优化方法,还包括对各个子网络进行优化的方法,具体方法步骤为:
一、对子网络进行参数初始化和学习率设定;
二、将训练样本输入到每个子网络中进行训练,找到网络性能最好的一个子网络,和网络性能最差的两个子网络;
三、对于网络性能最好的一个子网络,将所有学习到的参数保持不变,对于网络性能最差的两个子网络,首先从网络性能最好的一个子网络中每个滤波器中随机选取设定比例的滤波器系数,然后将网络性能最差的两个子网络中对应位置的参数替换为从网络性能最好的一个子网络中挑选出来的系数;
四、将参数替代后的各个子网络进行训练并得到其网络性能,对参数替代后的子网络和参数替代前的子网络的网络性能进行比较,如果参数替代后的网络网络性能比参数替代前的网络网络性能好,则用参数替代后的网络替换参数替代前的网络;如果参数替代后的网络网络性能比参数替代前的网络网络性能差,则保留参数替代前的网络;
五、循环步骤二到步骤四,并判断循环迭代次数是否达到循环迭代次数阈值,如果否,则继续循环骤二到步骤四的过程;如果是,则停止循环,选取训练网络性能最好的各个子网络作为最终的网络。
3.根据权利要求2所述的基于多通道竞争卷积神经网络参数优化方法,所述步骤二中,将训练样本输入到每个子网络中进行训练的具体方法为:将训练样本按照设定的批的大小随机分批,将每批样本输入到每个子网络中进行训练。
4.根据权利要求2或3所述的基于多通道竞争卷积神经网络参数优化方法,所述步骤二中,找到网络性能最好的一个子网络,和网络性能最差的两个子网络的具体方法为:迭代训练设定次数后,得到各个子网络及他们的损失误差,根据损失误差确定网络性能最好的一个子网络和网络性能最差的两个子网络;子网络的损失误差越小,则网络性能越好。
5.根据权利要求2所述的基于多通道竞争卷积神经网络参数优化方法,所述步骤三中所述随机选取设定比例的滤波器系数为随机选取50%的滤波器系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710616495.4A CN107341549A (zh) | 2017-07-26 | 2017-07-26 | 一种基于多通道竞争卷积神经网络参数优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710616495.4A CN107341549A (zh) | 2017-07-26 | 2017-07-26 | 一种基于多通道竞争卷积神经网络参数优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107341549A true CN107341549A (zh) | 2017-11-10 |
Family
ID=60216161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710616495.4A Pending CN107341549A (zh) | 2017-07-26 | 2017-07-26 | 一种基于多通道竞争卷积神经网络参数优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107341549A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280516A (zh) * | 2018-03-05 | 2018-07-13 | 山东领能电子科技有限公司 | 一种多组卷积神经网络之间互博智能进化的优化方法 |
CN108288090A (zh) * | 2018-01-08 | 2018-07-17 | 福州瑞芯微电子股份有限公司 | 一种并行竞争神经网络芯片的优化方法和装置 |
CN108764314A (zh) * | 2018-05-17 | 2018-11-06 | 北京邮电大学 | 一种结构化数据分类方法、装置、电子设备及存储介质 |
CN110322021A (zh) * | 2019-06-14 | 2019-10-11 | 清华大学 | 大规模网络表征学习的超参数优化方法和装置 |
-
2017
- 2017-07-26 CN CN201710616495.4A patent/CN107341549A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108288090A (zh) * | 2018-01-08 | 2018-07-17 | 福州瑞芯微电子股份有限公司 | 一种并行竞争神经网络芯片的优化方法和装置 |
CN108280516A (zh) * | 2018-03-05 | 2018-07-13 | 山东领能电子科技有限公司 | 一种多组卷积神经网络之间互博智能进化的优化方法 |
CN108280516B (zh) * | 2018-03-05 | 2021-05-11 | 山东领能电子科技有限公司 | 一种多组卷积神经网络之间互博智能进化的优化方法 |
CN108764314A (zh) * | 2018-05-17 | 2018-11-06 | 北京邮电大学 | 一种结构化数据分类方法、装置、电子设备及存储介质 |
CN110322021A (zh) * | 2019-06-14 | 2019-10-11 | 清华大学 | 大规模网络表征学习的超参数优化方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341549A (zh) | 一种基于多通道竞争卷积神经网络参数优化方法 | |
CN108629422A (zh) | 一种基于知识指导-战术感知的智能体学习方法 | |
Edelmann‐nusser et al. | Modeling and prediction of competitive performance in swimming upon neural networks | |
Nolfi et al. | Coevolving predator and prey robots: Do “arms races” arise in artificial evolution? | |
Wolpert et al. | Motor learning | |
CN110163093A (zh) | 一种基于遗传算法的路牌识别对抗防御方法 | |
CN110141867A (zh) | 一种游戏智能体训练方法及装置 | |
Zhao et al. | Self-teaching adaptive dynamic programming for Gomoku | |
CN104090573A (zh) | 一种基于蚁群算法的机器人足球动态决策装置及其方法 | |
CN108416391A (zh) | 基于视觉皮层处理机制及脉冲监督学习的图像分类方法 | |
CN113952733A (zh) | 一种多智能体自适应采样策略生成方法 | |
Ratcliffe et al. | Win or learn fast proximal policy optimisation | |
CN108447048A (zh) | 基于关注层的卷积神经网络图像特征处理方法 | |
Tan et al. | An modeling processing method for video games based on deep reinforcement learning | |
KR100850914B1 (ko) | 게임 캐릭터 제어방법 | |
JP2005516282A (ja) | 学習レートの非単調変化による性能の改善を伴う自己組織化特徴マップ | |
Miyashita et al. | Developing game AI agent behaving like human by mixing reinforcement learning and supervised learning | |
Abbott | Balancing homeostasis and learning in neural circuits | |
CN110533151A (zh) | 一种基于万有引力定律的萤火虫优化算法 | |
CN113426109B (zh) | 一种基于因式分解机进行棋牌游戏行为克隆的方法 | |
Mozgovoy et al. | Building a believable and effective agent for a 3D boxing simulation game | |
CN112131519A (zh) | 一种改进排球超级联赛算法在背包问题中的应用方法 | |
de Araújo et al. | An electronic-game framework for evaluating coevolutionary algorithms | |
DeLooze et al. | Bridge bidding with imperfect information | |
Nimoto et al. | Improvement of Agent Learning for a Card Game Based on Multi-channel ART Networks. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171110 |