CN111401405A - 一种多神经网络集成的图像分类方法及系统 - Google Patents

一种多神经网络集成的图像分类方法及系统 Download PDF

Info

Publication number
CN111401405A
CN111401405A CN202010107265.7A CN202010107265A CN111401405A CN 111401405 A CN111401405 A CN 111401405A CN 202010107265 A CN202010107265 A CN 202010107265A CN 111401405 A CN111401405 A CN 111401405A
Authority
CN
China
Prior art keywords
image
network
neural
integrated
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010107265.7A
Other languages
English (en)
Other versions
CN111401405B (zh
Inventor
沈项军
倪成功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN202010107265.7A priority Critical patent/CN111401405B/zh
Publication of CN111401405A publication Critical patent/CN111401405A/zh
Application granted granted Critical
Publication of CN111401405B publication Critical patent/CN111401405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多神经网络集成的图像分类方法及系统,采用多条神经网络结构,每条网络采用深度学习框架中卷积神经网络与全连接网络,接下来通过集成学习思想,将多个神经网络输出赋予不同权重组合在一起,进行训练,通过反向传播优化各个参数,直到损失函数收敛后,得到最终的分类结果。本发明的方法及系统有利于提高图像分类方法的有效性。

Description

一种多神经网络集成的图像分类方法及系统
技术领域
本发明属于图像分类技术领域,尤其是一种多神经网络集成的图像分类方法及系统。
背景技术
目前,图像识别是指利用计算机对图像进行处理,分析和理解,以识别各种不同模式的目标和对象的技术。现存的图像识别技术中所能实现的功能较少,比如在对图像处理和图像识别时,提取图像信息速度较慢,在进行识别时,准确率不高,并且在识别一些信息量较大的图像时,需要进行较长的时间,能够识别的图像范围较小,对快速发展的时代来说已经不适用了,急需识别速度和识别范围更广的技术。
综上所述,现有技术存在的问题是:现存的图像识别技术中所能实现的功能较少,比如在对图像处理和图像识别时,提取图像信息速度较慢,在进行识别时,准确率不高,并且在识别一些信息量较大的图像时,需要进行较长的时间,能够识别的图像范围较小,对快速发展的时代来说已经不适用了,急需识别速度和识别范围更广的技术。
发明内容
针对现有技术中的不足,本申请提出了一种多神经网络集成的图像分类方法及系统,采用了深度学习框架中卷积神经网络与全连接网络。在多条神经网络并行化进行训练,通过集成学习的思想,将多条神经网络得到的输出给予不同权重来组合,同时通过反向迭代继续更新,最终得到预测值,进一步提高图像分类的有效性。
本发明所采用的技术方案如下:
一种多神经网络集成的图像分类方法,包括如下步骤:
S1,数据集准备:获取图像数据样本集X以及X对应的图像数据标签集Y;
S2,将图像数据样本集X及其对应的图像数据标签集Y分为训练样本和测试样本;将训练样本输入多神经集成网络进行分类学习,获得多神经集成网络分类模型;
S3,将测试样本输入构建好的多神经集成网络分类模型,经多神经集成网络学习后输出最优参数,并输出预测结果。
进一步,所述多神经集成网络分类模型的构建方法为:将L个神经网络并行化处理,且各个神经网络分别赋予权重αi(i=1,2,…,L),满足αi≥0且
Figure RE-GDA0002508962760000011
再将L个神经网络进行集成获得多神经集成网络分类模型。
进一步,所述多神经集成网络的集成方法为:
Figure RE-GDA0002508962760000021
其中,αi是每条并行网络的权重,α是由αi构成的并行网络权重集合,N为训练样本数量,L是基回归器的个数,yn是样本的真实标签,wi是全连接网络的权重,w由wi构成全连接网络的权重集合,hi,n是全连接的输出,
Figure RE-GDA0002508962760000022
就是上述第i个神经网络的输出值fi,γ是控制系数收缩量的复杂性参数。
进一步,所述多神经集成网络中的wi和hi,n的求解方法为:反向传播求解wi,hi,n,对式 (1)中的参数wi,hi,n求偏导得到:
第i条网络的wi梯度:
Figure RE-GDA0002508962760000023
第i条网络的hi,n梯度:
Figure RE-GDA0002508962760000024
所述多神经集成网络中权重αi方法为:对式(1)采用增广拉格朗日乘数法构造出下式:
Figure RE-GDA0002508962760000025
对上式中参数αi求偏导得:
αi=[2hTwwTh+τ(1L*L+I)]-1(2hTwY+η1L*L-ξ-τ1L*L);
得到的αi与每条神经网络的输出
Figure RE-GDA0002508962760000026
组合得出集成的结果,再通过反向传播不断更新参数;直到式(1)的损失函数收敛即停止训练。
进一步,所述神经网络采用LeNet5网络结构。
一种多神经网络集成的图像分类系统,包括图像输入模块、多神经网络集成的图像训练模块、图像数据库模块、图像分类模块和输出结果模块;所述的图像输入模块将得到的图像数据导入多神经网络集成的图像训练模块;所述多神经网络集成的图像训练模块的输出端依次连接图像数据库模块、图像分类模块和输出结果模块。
进一步,所述图像输入模块将图像通过摄像头扫描处理输入到计算机当中,计算机会按照图像的容量大小进行保存;
进一步,将图像输入模块1得到的图像数据作为多神经网络集成的图像训练模块的训练数据集,训练数据集通过多神经网络集成的图像分类,利用了每条神经网络独自训练,再通过不同的权重集成,得到最终的预测结果。
进一步,所述图像数据库模块用于存储多神经网络集成的图像训练模块分类后的图像信息。
进一步,所述图像分类模块根据输入的指令对图像数据库模块中所存储的图像信息进行筛选,如果最终找到相匹配的图像信息,会在输出结果模块中输出。
本发明的有益效果:
1、在本发明中,多个神经网络是采用并行化网络结构,每条网络结构采用不同参数,通过并行化学习,可以通过每个不同形式并行网络的学习得到特征参数,通过最优化参数,可以得到最终预测结果。
2、此外,本发明中的多神经网络是每条神经网络结构独自训练,得到不同权重参数,将每层并行结构得到的输出进行集成连接,再通过反向传播共同优化每层网络中参数。通过我们的损失函数来评判训练情况。
附图说明
图1是本发明多神经网络集成的图像分类方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
如图1所示的一种多神经网络集成的图像分类方法,包括如下步骤:
S1,数据集准备:对于空间R,通过摄像头获取图像数据作为样本集,包括图像数据样本集X以及X对应的图像数据标签集Y;X=[x1,x2....xN]∈RN*q和 Y=[y1,y2....yN]∈RN *p,xN为第N张图像,yN为第N张图像的数据标签;N为样本数, q为X的维度,p为Y维度。
S2,将图像数据样本集X及其对应的图像数据标签集Y分为训练样本和测试样本;将训练样本输入多神经集成网络进行分类学习,获得多神经集成网络分类模型。
多神经集成网络分类模型的构建方法为:多神经集成网络是由L个神经网络行化,在本实施例中采用采用L个LeNet5网络结构,且各个神经网络分别赋予权重αi(i=1,2,…,L),满足αi≥0且
Figure RE-GDA0002508962760000041
再将L个神经网络进行集成获得多神经集成网络分类模型。以两个神经网络为例说明两条并行化网络:第一条网络结构采用:第一层为卷积核为5*5的卷积层,第二层为池化层,第三层为卷积核为5*5的卷积层,第四层为池化层,第五层使用relu激活函数的全连接层。第二条网络结构与第一条网络结构类似,区别在于卷积层采用卷积核为3*3,全连接采用的激活函数为sigmoid函数。两条网络输出再通过全连接在一起。
其中,多神经集成网络的集成方法为:
Figure RE-GDA0002508962760000042
其中,w由wi构成全连接网络的权重集合,αi是每条并行网络的权重,N为为训练样本数量,L是基回归器的个数,yn是样本的真实标签,wi是是全连接网络的权重,hi,n是全连接的输出,
Figure RE-GDA0002508962760000043
就是上述第i个神经网络的输出值fi,γ是控制系数收缩量的复杂性参数,α是由αi构成的并行网络权重集合,。
多神经集成网络中的wi和hi,n的求解方法为:反向传播求解wi,hi,n,对式(1)中的参数 wi,hi,n求偏导得到:
第i条网络的wi梯度:
Figure RE-GDA0002508962760000044
第i条网络的hi,n梯度:
Figure RE-GDA0002508962760000045
所述多神经集成网络中权重αi方法为:对式(1)采用增广拉格朗日乘数法构造出下式:
Figure RE-GDA0002508962760000046
对上式中参数αi求偏导得:
αi=[2hTwwTh+τ(1L*L+I)]-1(2hTwY+η1L*L-ξ-τ1L*L);
得到的αi与每条神经网络的输出hi,n组合得出集成的结果,再通过反向传播不断更新参数;直到式(1)的损失函数收敛即停止训练。
S3,训练样本在多神经集成网络学习后输出最优参数,并输出最终预测结果。
基于本发明所提出的一种多神经网络集成的图像分类方法,本发明还设计了一种多神经网络集成的图像分类系统,包括图像输入模块1、多神经网络集成的图像训练模块2、图像数据库模块3、图像分类模块4和输出结果模块5;所述的图像输入模块1将得到的图像数据导入多神经网络集成的图像训练模块2;所述多神经网络集成的图像训练模块2的输出端依次连接图像数据库模块3、图像分类模块4和输出结果模块5。
图像输入模块1将图像通过摄像头扫描处理输入到计算机当中,计算机会按照图像的容量大小进行保存。将图像输入模块1得到的图像数据作为多神经网络集成的图像训练模块2的训练数据集,训练数据集通过多神经网络集成的图像分类,利用了每条神经网络独自训练,再通过不同的权重集成,得到预测结果。图像数据库模块3用于存储多神经网络集成的图像训练模块2分类后的图像信息。图像分类模块4根据输入的指令对图像数据库模块3中所存储的图像信息进行筛选,如果最终找到相匹配的图像信息,会在输出结果模块5中输出。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (9)

1.一种多神经网络集成的图像分类方法,其特征在于,包括:数据集准备:获取图像数据样本集X以及X对应的图像数据标签集Y;将图像数据样本集X及其对应的图像数据标签集Y分为训练样本和测试样本;将训练样本输入多神经集成网络进行分类学习,获得多神经集成网络分类模型;将测试样本输入构建好的多神经集成网络分类模型,经多神经集成网络学习后输出最优参数,并输出预测结果;所述多神经集成网络分类模型的构建方法为:将L个神经网络并行化处理,且各个神经网络分别赋予权重αi,i=1、2、......、L,满足αi≥0且
Figure FDA0002388801990000011
再将L个神经网络进行集成获得多神经集成网络分类模型。
2.根据权利要求1所述的一种多神经网络集成的图像分类方法,其特征在于,所述多神经集成网络的集成方法为:
Figure FDA0002388801990000012
S.T. 1Tα=1,α>0
其中,αi是每条并行网络的权重,α是由αi构成的并行网络权重集合,N为训练样本数量,L是基回归器的个数,yn是样本的真实标签,wi是全连接网络的权重,w由wi构成全连接网络的权重集合,hi,n是全连接的输出,
Figure FDA0002388801990000013
就是上述第i个神经网络的输出值fi,γ是控制系数收缩量的复杂性参数。
3.根据权利要求2所述的一种多神经网络集成的图像分类方法,其特征在于,所述多神经集成网络中的wi和hi,n的求解方法为:反向传播求解wi,hi,n,对参数wi,hi,n求偏导得到:
第i条网络的wi梯度:
Figure FDA0002388801990000014
第i条网络的hi,n梯度:
Figure FDA0002388801990000015
所述权重αi求解的方法是采用增广拉格朗日乘数法构造出下式:
Figure FDA0002388801990000021
对上式中参数αi求偏导得:
αi=[2hTwwTh+τ(1L*L+I)]-1(2hTwY+η1L*L-ξ-τ1L*L);
得到的αi与每条神经网络的输出
Figure FDA0002388801990000022
组合得出集成的结果,再通过反向传播不断更新参数。
4.根据权利要求1-3中任意一项权利要求所述的一种多神经网络集成的图像分类方法,其特征在于,所述神经网络采用LeNet5网络结构。
5.一种基于权利要求4所述的多神经网络集成的图像分类方法的图像分类系统,其特征在于,包括图像输入模块(1)、多神经网络集成的图像训练模块(2)、图像数据库模块(3)、图像分类模块(4)和输出结果模块(5);所述的图像输入模块(1)将得到的图像数据导入多神经网络集成的图像训练模块(2);所述多神经网络集成的图像训练模块(2)的输出端依次连接图像数据库模块(3)、图像分类模块(4)和输出结果模块(5)。
6.根据权利要求5所述的一种多神经网络集成的图像分类系统,其特征在于,所述图像输入模块(1)将图像通过摄像头扫描处理输入到计算机当中,计算机会按照图像的容量大小进行保存。
7.根据权利要求5所述的一种多神经网络集成的图像分类系统,其特征在于,将图像输入模块(1)得到的图像数据作为多神经网络集成的图像训练模块(2)的训练数据集,训练数据集通过多神经网络集成的图像分类,利用了每条神经网络独自训练,再通过不同的权重集成,得到最终的预测结果。
8.根据权利要求5所述的一种多神经网络集成的图像分类系统,其特征在于,所述图像数据库模块(3)用于存储多神经网络集成的图像训练模块(2)分类后的图像信息。
9.根据权利要求5所述的一种多神经网络集成的图像分类系统,其特征在于,所述图像分类模块(4)根据输入的指令对图像数据库模块(3)中所存储的图像信息进行筛选,如果最终找到相匹配的图像信息,会在输出结果模块(5)中输出。
CN202010107265.7A 2020-02-21 2020-02-21 一种多神经网络集成的图像分类方法及系统 Active CN111401405B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010107265.7A CN111401405B (zh) 2020-02-21 2020-02-21 一种多神经网络集成的图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010107265.7A CN111401405B (zh) 2020-02-21 2020-02-21 一种多神经网络集成的图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN111401405A true CN111401405A (zh) 2020-07-10
CN111401405B CN111401405B (zh) 2023-07-21

Family

ID=71434004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010107265.7A Active CN111401405B (zh) 2020-02-21 2020-02-21 一种多神经网络集成的图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN111401405B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580720A (zh) * 2020-12-18 2021-03-30 华为技术有限公司 一种模型训练方法及装置
CN113343882A (zh) * 2021-06-21 2021-09-03 平安普惠企业管理有限公司 人群计数方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491726A (zh) * 2017-07-04 2017-12-19 重庆邮电大学 一种基于多通道并行卷积神经网络的实时表情识别方法
CN109376792A (zh) * 2018-11-07 2019-02-22 河北工业大学 基于多通道残差神经网络的光伏电池外观缺陷分类方法
CN110472667A (zh) * 2019-07-19 2019-11-19 广东工业大学 基于反卷积神经网络的小目标分类方法
CN110532900A (zh) * 2019-08-09 2019-12-03 西安电子科技大学 基于U-Net和LS-CNN的人脸表情识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491726A (zh) * 2017-07-04 2017-12-19 重庆邮电大学 一种基于多通道并行卷积神经网络的实时表情识别方法
CN109376792A (zh) * 2018-11-07 2019-02-22 河北工业大学 基于多通道残差神经网络的光伏电池外观缺陷分类方法
CN110472667A (zh) * 2019-07-19 2019-11-19 广东工业大学 基于反卷积神经网络的小目标分类方法
CN110532900A (zh) * 2019-08-09 2019-12-03 西安电子科技大学 基于U-Net和LS-CNN的人脸表情识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIANGJUN SHEN: "Image Subcategory Classification Based on Dempster-Shafer Evidence Theory" *
倪成功: "基于多核集成回归的图像分类研究" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580720A (zh) * 2020-12-18 2021-03-30 华为技术有限公司 一种模型训练方法及装置
CN113343882A (zh) * 2021-06-21 2021-09-03 平安普惠企业管理有限公司 人群计数方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111401405B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN113570029A (zh) 获取神经网络模型的方法、图像处理方法及装置
WO2022001805A1 (zh) 一种神经网络蒸馏方法及装置
CN112418392A (zh) 一种神经网络构建方法以及装置
CN111291809B (zh) 一种处理装置、方法及存储介质
CN110826596A (zh) 一种基于多尺度可变形卷积的语义分割方法
CN113705769A (zh) 一种神经网络训练方法以及装置
CN111882040A (zh) 基于通道数量搜索的卷积神经网络压缩方法
CN113298032A (zh) 基于深度学习的无人机视角图像的车辆目标检测方法
CN106339753A (zh) 一种有效提升卷积神经网络稳健性的方法
CN113326930A (zh) 数据处理方法、神经网络的训练方法及相关装置、设备
CN113592060A (zh) 一种神经网络优化方法以及装置
CN109376763A (zh) 基于多样本推理神经网络的样本分类方法、系统及介质
CN115601692A (zh) 数据处理方法、神经网络模型的训练方法及装置
CN110263855B (zh) 一种利用共基胶囊投影进行图像分类的方法
CN115565043A (zh) 结合多表征特征以及目标预测法进行目标检测的方法
CN114547299A (zh) 一种基于复合网络模型的短文本情感分类方法及装置
CN111401405A (zh) 一种多神经网络集成的图像分类方法及系统
Cao et al. Improving prediction accuracy in LSTM network model for aircraft testing flight data
CN117671666A (zh) 一种基于自适应图卷积神经网络的目标识别方法
CN111192240B (zh) 一种基于随机接入记忆的遥感图像目标检测方法
US20230154157A1 (en) Saliency-based input resampling for efficient object detection
CN114463636B (zh) 一种改进的复杂背景遥感图像目标检测方法及系统
CN114511785A (zh) 基于瓶颈注意力模块的遥感图像云检测方法及系统
CN113989655A (zh) 基于自动化深度学习的雷达或声呐图像目标检测与分类方法
Artemov et al. Subsystem for simple dynamic gesture recognition using 3DCNNLSTM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant