CN108875912A - 一种用于图像识别的神经网络模型 - Google Patents

一种用于图像识别的神经网络模型 Download PDF

Info

Publication number
CN108875912A
CN108875912A CN201810526107.8A CN201810526107A CN108875912A CN 108875912 A CN108875912 A CN 108875912A CN 201810526107 A CN201810526107 A CN 201810526107A CN 108875912 A CN108875912 A CN 108875912A
Authority
CN
China
Prior art keywords
layer
pond
full articulamentum
neural network
convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810526107.8A
Other languages
English (en)
Inventor
梁琨
段珺珂
张翼英
杨巨成
王聪
侯琳
都宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Science and Technology
Original Assignee
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Science and Technology filed Critical Tianjin University of Science and Technology
Priority to CN201810526107.8A priority Critical patent/CN108875912A/zh
Publication of CN108875912A publication Critical patent/CN108875912A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及一种用于图像识别的神经网络模型,由多个神经元连接在一起构成多层网络,所述多层网络包括卷积层、池化层和全连接层,卷积层用于提取特征向量,池化层对特征向量进一步筛选,全连接层进行最后的分类,各层之间通过激活函数连接在一起,并通过训练算法不断改进网络参数。本发明设计合理,该神经网络模型通过卷积层提取特征向量,通过池化层对向量进一步筛选,通过全连接层进行最后的分类,通过激活函数用于建立各层之间的连接关系并通过训练算法不断改进网络参数,从而提高图像中目标的识别率,为网络模型的设计、训练算法的选择提供新思路,可广泛用于图像识别领域。

Description

一种用于图像识别的神经网络模型
技术邻域
本发明属于人工智能技术领域,尤其是一种用于图像识别的神经网络模型。
背景技术
随着电子计算机技术逐渐成熟,数字图像技术被广泛应用于工农业生产和日常生活的各个领域。数字图像技术领域中图像的传输和存储技术已经非常成熟,而且应用广泛,而图像的分析和理解无论是理论还是应用与前者相比还有着很大的差距。
图像的识别作为图像分析和理解的核心问题一直是当前领域的热点与难点。图像识别技术的目的就是根据观测的图像,对其中的物体进行辨别与分类。一般来说,一个图像识别系统由三个部分组成:图像分割、图像特征提取和分类器的识别分类。图像切割是将图像划分为多个关键的区域,然后将每个区域的图像进行特征提取,最后对提取的特征进行判断,进而进行相应的分类工作。其中,图像分割与特征提取一直是图像处理领域的研究重点。在图像识别技术的发展过程中,先后出现过统计识别、结构识别、模糊识别的识别方法。但是这些方法大都存在着对结构复杂的模式难以抽取特征、干扰与噪声影响太大、难以建立隶属函数等缺点,导致识别的效果不佳。
深度学习是近几年来人工智能领域取得的重大突破之一,在图像识别、自然语言处理等诸多领域都取得了巨大的成功。卷积神经网络(Convolutional Neural Network,CNN)隶属于深度学习模型,是一种按误差逆向传播训练的多层前馈神经网络,能够通过反向传播不断调整网络的权值和阈值,是近年发展起来的一种高效识别方法。与传统模式识别方法不同的是,卷积神经网络能够从大量数据中自动学习特征,而非传统的手工设计特征。由于训练数据中可能包含成千上万的参数,手工设计出有效的特征将耗费很多时间。而卷积神经网络可以从新的训练数据自发而快速地学习到有效的特征表示。由于其具有很强的学习能力、高效的特征提取能力、分布式存储记忆等诸多优点,在图像识别领域具有广泛应用。最近几年,人工神经网络发展十分迅速,涌现出许多优秀的网络模型。但由于该技术目前还处于起步阶段,许多模型还处于丰富和完善中,目前能够投入实际应用的模型还不够多。
通过检索,尚未发现与本发明相关的专利公开文献。
发明内容
本发明的目的在于克服现有技术的不足,提出一种设计合理、精度高且性能稳定的用于图像识别的神经网络模型。
本发明解决其技术问题是采取以下技术方案实现的:
一种用于图像识别的神经网络模型,由多个神经元连接在一起构成多层网络,所述多层网络包括卷积层、池化层和全连接层,卷积层用于提取特征向量,池化层对特征向量进一步筛选,全连接层进行最后的分类,各层之间通过激活函数连接在一起,并通过训练算法不断改进网络参数。
进一步,所述神经元是神经网络结构对应的公式为:
其中,y表示x神经元的输出,f(x)表示激活函数,Wi表示第i个输入的权重,θ表示x神经元的阈值。
进一步,所述激活函数使用ReLU函数作为激活函数。
进一步,所述卷积层采用3×3的卷积核,其内积的计算公式为:
其中f(x)表示激活函数,wm,n表示第m行n列的权重,wb表示卷积核的阈值。
进一步,所述卷积层卷积层包括第一层卷积层、第二层卷积层和第三层卷积层;所述池化层池化层包括第一层池化层、第二层池化层和第三层池化层;所述全连接层包括第一层全连接层和第二层全连接层,各层的基本参数如下:
输入:128×128大小的图片,3通道;
第一层卷积层:8×8卷积核,输出向量长度为16;
第一层池化层:2×2的核;
第二层卷积层:5×5卷积核,输出向量长度为32;
第二层池化层:2×2的核;
第三层卷积层:5×5卷积核,输出向量长度为128;
第三层池化层:2×2的核;
第一层全连接层:将第三层池化层的输出连接成一个长度为1024的向量;
第二层全连接层:将第一层全连接层的输出连接成一个长度为1024的向量。
本发明的优点和积极效果是:
本发明设计合理,其通过卷积层提取特征向量,池化层对向量进一步筛选,全连接层进行最后的分类,通过激活函数用于建立各层之间的连接关系并通过训练算法不断改进网络参数,提高图像中目标的识别率,为网络模型的设计、训练算法的选择提供新思路,可广泛用于图像识别领域。
附图说明
图1为本发明中神经元的结构模型图。
图2为本发明中激活函数的函数图像。
图3为本发明中卷积算法示例图。
图4为本发明中池化算法示例图。
图5为本发明中神经网络的结构模型图。
具体实施方式
以下结合附图对本发明实施例做进一步详述。
一种用于图像识别的神经网络模型,由多个神经元连接在一起构成多层网络,多层网络包括卷积层、池化层和全连接层,卷积层用于提取特征向量,池化层对特征向量进一步筛选,全连接层进行最后的分类,各层之间通过激活函数连接在一起,并通过训练算法不断改进网络参数,从而提高识别率。
下面对神经网络模型的各个部分分别进行说明:
所述神经元是神经网络的基本组成部分,每个神经元与其他神经元相连,神经元收到来自其他n个神经元的输入信号,将总输入值与神经元的阈值进行比较,然后通过“激活函数”产生输出。神经元结构如图1所示,对应的公式如下:
其中,y表示x神经元的输出,f(x)表示激活函数,Wi表示第i个输入的权重,θ表示x神经元的阈值。
所述激活函数用于建立各层之间的连接关系。在神经网络中,每一层的输出的都是上一层输入的线性函数,所以无论是怎样的网络结构,输出都是输入的线性组合。然而大多数据往往都不是线性可分的,引入激活函数的目的是为了提升神经网络模型的表达能力,引入非线性因素,解决线性模型不能解决的问题。本模型中使用ReLU函数作为激活函数,函数图像如图2所示,对应公式如下:
f(x)=max(0,x) (2)
所述卷积层卷积层包括第一层卷积层、第二层卷积层和第三层卷积层。卷积层负责特征的提取,通过卷积核对图像的每个小分区进行内积,提取特征向量。由于图像上每一部分的统计特性是相通的,所以对于每个小分区,我们都使用同一个卷积核进行特征提取,如图3所示,假设使用大小为3×3的卷积核,内积的计算公式为:
其中f(x)表示激活函数,本例中使用ReLU函数,wm,n表示第m行n列的权重,wb表示卷积核的阈值。
所述池化层池化层包括第一层池化层、第二层池化层和第三层池化层。池化层用于对卷积层的结果进行采样,筛选重要的样本,本发明采用Max Pooling进行采样,即是取出n×n大小样本中的最大值,如图4所示。
所述全连接层包括第一层全连接层和第二层全连接层。全连接层中的每个神经元的输入都与上一层的所有神经元相连,输出与下一层的全部神经元相连,全连接层在整个网络中起到分类的作用,将之前提取的特征向量高度提纯,计算出图像最终所属的分类标签。
本网络模型各层的结构如图5所示,每层的基本参数如下:
输入:128×128大小的图片,3通道
第一层卷积层:8×8卷积核,输出向量长度为16
第一层池化层:2×2的核
第二层卷积层:5×5卷积核,输出向量长度为32
第二层池化层:2×2的核
第三层卷积层:5×5卷积核,输出向量长度为128
第三层池化层:2×2的核
第一层全连接层:将第三层池化层的输出连接成一个长度为1024的向量
第二层全连接层:将第一层全连接层的输出连接成一个长度为1024的向量
本神经网络模型采用如下训练算法进行神经网络的训练用于改进网络参数算法:
神经网络的训练过程属于有监督学习。训练算法的目的是根据网络在训练过程中的实际输出与期望输出之间的对比来调节各个神经元的权值。本发明使用梯度下降算法(Gradient Descent)进行训练,假设误差函数为:
其中y为实际结果,f(∑WiXi)为预测结果。当ΔC为最小时,就得到了最优的Wi,其推导过程如下:
在训练网络时,首先输入训练数据进行前向传播,在已知实际结果和得出预测结果后,使用训练算法计算误差,再将误差反向传播回输入层,更新权值。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本邻域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (5)

1.一种用于图像识别的神经网络模型,其特征在于:由多个神经元连接在一起构成多层网络,所述多层网络包括卷积层、池化层和全连接层,卷积层用于提取特征向量,池化层对特征向量进一步筛选,全连接层进行最后的分类,各层之间通过激活函数连接在一起,并通过训练算法不断改进网络参数。
2.根据权利要求1所述的一种用于图像识别的神经网络模型,其特征在于:所述神经元是神经网络结构对应的公式为:
其中,y表示x神经元的输出,f(x)表示激活函数,Wi表示第i个输入的权重,θ表示x神经元的阈值。
3.根据权利要求1所述的一种用于图像识别的神经网络模型,其特征在于:所述激活函数使用ReLU函数作为激活函数。
4.根据权利要求1所述的一种用于图像识别的神经网络模型,其特征在于:所述卷积层采用3×3的卷积核,其内积的计算公式为:
其中f(x)表示激活函数,wm,n表示第m行n列的权重,wb表示卷积核的阈值。
5.根据权利要求1至4任一项所述的一种用于图像识别的神经网络模型,其特征在于:所述卷积层卷积层包括第一层卷积层、第二层卷积层和第三层卷积层;所述池化层池化层包括第一层池化层、第二层池化层和第三层池化层;所述全连接层包括第一层全连接层和第二层全连接层,各层的基本参数如下:
输入:128×128大小的图片,3通道;
第一层卷积层:8×8卷积核,输出向量长度为16;
第一层池化层:2×2的核;
第二层卷积层:5×5卷积核,输出向量长度为32;
第二层池化层:2×2的核;
第三层卷积层:5×5卷积核,输出向量长度为128;
第三层池化层:2×2的核;
第一层全连接层:将第三层池化层的输出连接成一个长度为1024的向量;
第二层全连接层:将第一层全连接层的输出连接成一个长度为1024的向量。
CN201810526107.8A 2018-05-29 2018-05-29 一种用于图像识别的神经网络模型 Pending CN108875912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810526107.8A CN108875912A (zh) 2018-05-29 2018-05-29 一种用于图像识别的神经网络模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810526107.8A CN108875912A (zh) 2018-05-29 2018-05-29 一种用于图像识别的神经网络模型

Publications (1)

Publication Number Publication Date
CN108875912A true CN108875912A (zh) 2018-11-23

Family

ID=64335317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810526107.8A Pending CN108875912A (zh) 2018-05-29 2018-05-29 一种用于图像识别的神经网络模型

Country Status (1)

Country Link
CN (1) CN108875912A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657649A (zh) * 2019-01-14 2019-04-19 南京邮电大学 一种轻型心音神经网络的设计方法
CN110472494A (zh) * 2019-06-21 2019-11-19 深圳壹账通智能科技有限公司 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
CN110503191A (zh) * 2019-08-27 2019-11-26 四川博文讯通科技有限公司 一种面向视频分析的多层神经网络模型
CN110837570A (zh) * 2019-11-12 2020-02-25 北京交通大学 对图像数据进行无偏见分类的方法
CN113077423A (zh) * 2021-03-22 2021-07-06 中国人民解放军空军工程大学 基于卷积神经网络的激光选区熔化熔池图像分析系统
CN115826628A (zh) * 2023-02-22 2023-03-21 成都航空职业技术学院 基于NeRF神经网络的异构无人机视觉避障系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9373059B1 (en) * 2014-05-05 2016-06-21 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN106485251A (zh) * 2016-10-08 2017-03-08 天津工业大学 基于深度学习的鸡蛋胚胎分类
CN106934404A (zh) * 2017-03-10 2017-07-07 深圳市瀚晖威视科技有限公司 一种基于cnn卷积神经网络的图像火焰识别系统
CN107798381A (zh) * 2017-11-13 2018-03-13 河海大学 一种基于卷积神经网络的图像识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9373059B1 (en) * 2014-05-05 2016-06-21 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
CN106485251A (zh) * 2016-10-08 2017-03-08 天津工业大学 基于深度学习的鸡蛋胚胎分类
CN106934404A (zh) * 2017-03-10 2017-07-07 深圳市瀚晖威视科技有限公司 一种基于cnn卷积神经网络的图像火焰识别系统
CN107798381A (zh) * 2017-11-13 2018-03-13 河海大学 一种基于卷积神经网络的图像识别方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657649A (zh) * 2019-01-14 2019-04-19 南京邮电大学 一种轻型心音神经网络的设计方法
CN109657649B (zh) * 2019-01-14 2022-08-26 南京邮电大学 一种轻型心音神经网络的设计方法
CN110472494A (zh) * 2019-06-21 2019-11-19 深圳壹账通智能科技有限公司 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
CN110503191A (zh) * 2019-08-27 2019-11-26 四川博文讯通科技有限公司 一种面向视频分析的多层神经网络模型
CN110837570A (zh) * 2019-11-12 2020-02-25 北京交通大学 对图像数据进行无偏见分类的方法
CN110837570B (zh) * 2019-11-12 2021-10-08 北京交通大学 对图像数据进行无偏见分类的方法
CN113077423A (zh) * 2021-03-22 2021-07-06 中国人民解放军空军工程大学 基于卷积神经网络的激光选区熔化熔池图像分析系统
CN115826628A (zh) * 2023-02-22 2023-03-21 成都航空职业技术学院 基于NeRF神经网络的异构无人机视觉避障系统及方法
CN115826628B (zh) * 2023-02-22 2023-05-09 成都航空职业技术学院 基于NeRF神经网络的异构无人机视觉避障系统及方法

Similar Documents

Publication Publication Date Title
CN108875912A (zh) 一种用于图像识别的神经网络模型
Liu et al. Tomato diseases and pests detection based on improved Yolo V3 convolutional neural network
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
CN110096950A (zh) 一种基于关键帧的多特征融合行为识别方法
CN108647742A (zh) 基于轻量级神经网络的快速目标检测方法
CN104992223A (zh) 基于深度学习的密集人数估计方法
CN107330446A (zh) 一种面向图像分类的深度卷积神经网络的优化方法
CN108133188A (zh) 一种基于运动历史图像与卷积神经网络的行为识别方法
CN104217214A (zh) 基于可配置卷积神经网络的rgb-d人物行为识别方法
CN105512676A (zh) 一种智能终端上的食物识别方法
CN111127423B (zh) 一种基于cnn-bp神经网络算法水稻病虫害识别方法
CN107392224A (zh) 一种基于三通道卷积神经网络的作物病害识别算法
CN106845528A (zh) 一种基于K‑means与深度学习的图像分类算法
CN107403191A (zh) 一种具有深度结构的半监督超限学习机分类方法
CN104809469A (zh) 一种面向服务机器人的室内场景图像分类方法
CN112597980B (zh) 一种面向动态视觉传感器的类脑手势序列识别方法
CN111275165A (zh) 一种基于改进卷积神经网络的网络入侵检测方法
CN110263174A (zh) —基于焦点关注的主题类别分析方法
CN111666897A (zh) 基于卷积神经网络的斑石鲷个体识别方法
CN110991554B (zh) 一种基于改进pca的深度网络图像分类方法
CN112860904A (zh) 一种融入外部知识的生物医疗关系抽取方法
CN110599457B (zh) 一种基于bd胶囊网络的柑橘黄龙病分类方法
Chen et al. Deep convolutional network for citrus leaf diseases recognition
Luo et al. Features representation for flue-cured tobacco grading based on transfer learning to hard sample
CN111353043A (zh) 一种基于轻量化卷积神经网络的细粒度观点挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123