CN109460774A - 一种基于改进的卷积神经网络的鸟类识别方法 - Google Patents

一种基于改进的卷积神经网络的鸟类识别方法 Download PDF

Info

Publication number
CN109460774A
CN109460774A CN201811091554.1A CN201811091554A CN109460774A CN 109460774 A CN109460774 A CN 109460774A CN 201811091554 A CN201811091554 A CN 201811091554A CN 109460774 A CN109460774 A CN 109460774A
Authority
CN
China
Prior art keywords
birds
neural networks
convolutional neural
training
improved convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811091554.1A
Other languages
English (en)
Other versions
CN109460774B (zh
Inventor
邹腊梅
熊紫华
张松伟
李长峰
李晓光
陈婷
杨卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201811091554.1A priority Critical patent/CN109460774B/zh
Publication of CN109460774A publication Critical patent/CN109460774A/zh
Application granted granted Critical
Publication of CN109460774B publication Critical patent/CN109460774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开了一种基于改进的卷积神经网络的鸟类识别方法,包括:利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:构建样本鸟类图像的数据集;在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。本发明基于迁移学习的思想,对卷积神经网络进行改进,将其应用在鸟类属性识别上,在样本量有限的前提下,获得了比改进之前的网络更好的结果。

Description

一种基于改进的卷积神经网络的鸟类识别方法
技术领域
本发明属于图像识别和生物辨识领域,更具体地,涉及一种基于改进的卷积神经网络的鸟类识别方法。
背景技术
近年来,以卷积神经网络为代表的深度学习算法在很多计算机视觉领域都取得突破性的进展,尤其是图像分类、目标跟踪、图像分割、目标检测等。但是当数据集发生变化时,卷积神经网络学习到的特征和具体任务的匹配度就不高了,其模型的泛化能力就还有待提升,因此需要针对具体的任务和需求,设计出基于特征任务的卷积神经网络,以满足现实场景的需求。
然而现有技术中关于鸟类识别的准确率较低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于改进的卷积神经网络的鸟类识别方法,由此解决现有技术中关于鸟类识别的准确率较低的技术问题。
为实现上述目的,本发明提供了一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
进一步地,样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
进一步地,背景包括:海面、森林、天空和草地。
进一步地,姿态包括:行走、站立、跳跃和觅食。
进一步地,2层卷积层的卷积核依次为3x3和1x1。
进一步地,步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;
(3.3)使用SGD优化器进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器。
进一步地,预训练过程中,对改进的卷积神经网络的前4层卷积层的参数进行冻结。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明为保证模型在增加深度时的泛化能力,同时避免多次归一化的繁琐,在ResNet50输入层之后增加BN层;增加网络的深度是有助于提升模型的识别准确率的,因此,本发明在ResNet50基础之上增加两层卷积层。由于增加深度可以获得较高的训练准确率,但随之也使得模型的泛化能力下降,为提升模型的泛化能力,降低过拟合,本发明在FC层之前又增加一层Dropout层,防止过拟合。本发明通过以上方式对卷积神经网络的改进,保证鸟类数据可以获得更高的识别准确率。
(2)本发明在最后一层卷积层使用1x1的卷积核,保证增加网络的深度不会给模型带来过多的参数量而导致模型泛化能力下降,本发明基于迁移学习的思想,对卷积神经网络进行改进,将其应用在鸟类属性识别上,在样本量有限的前提下,获得了比改进之前的网络更好的结果。
附图说明
图1本发明实施例提供的一种基于改进的卷积神经网络的鸟类识别方法的流程图;
图2是本发明实施例提供的改进的卷积神经网络的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
进一步地,样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
进一步地,背景包括:海面、森林、天空和草地。
进一步地,姿态包括:行走、站立、跳跃和觅食。
进一步地,2层卷积层的卷积核依次为3x3和1x1。
进一步地,步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;
(3.3)使用SGD优化器进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器。
进一步地,预训练过程中,对改进的卷积神经网络的前4层卷积层的参数进行冻结。
实施例1
一种基于改进的卷积神经网络的鸟类识别方法,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
步骤(1)的具体实施方式为:从真实场景中获得不同种类的鸟类数据,数据集中同一类别的鸟类具有不同的背景(如,海面、森林、天空、草地等)及不同的姿态(如,行走、站立、跳跃、觅食等),保证模型能够在真实环境下得到较好的结果,提升模型的泛化能力。总计共9313张鸟类图像,83个类别,并将其中的80%作为训练集,余下的20%作为验证集。
通过以下方式对卷积神经网络的改进,保证鸟类数据可以获得更高的识别准确率。改进后的结构如图2所示,各层参数如表1所示。
表1各层参数
如表1所示,7×7、3×3和1×1分别表示7×7、3×3和1×1的卷积核,其后的数字表示特征图个数,如64表示64个特征图。
步骤(2)的具体实施方式为:
(2.1)为保证模型在增加深度时的泛化能力,同时避免多次归一化的繁琐,在ResNet50输入层之后增加BN层;
(2.2)增加网络的深度是有助于提升模型的识别准确率的,因此,在ResNet50基础之上增加两层卷积层。此外,为保证增加网络的深度不会给模型带来过多的参数量而导致模型泛化能力下降,最后一层卷积层使用1x1的卷积核;
(2.3)增加深度可以获得较高的训练准确率,但随之也使得模型的泛化能力下降,为提升模型的泛化能力,降低过拟合,在FC层之前又增加一层Dropout层。
步骤(3)的具体实施方式为:
(3.1)数据增强:采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练数据集进行增强,验证集不采取任何增强措施;
(3.2)迁移学习:使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;对conv1~conv4层的参数进行冻结,只更新余下的层;
(3.3)训练参数:本发明使用SGD(随机梯度下降)优化器进行参数更新,并将L2正则化系数设置为e-4,防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001。
本发明构建一种改进后的卷积神经网络,并通过学习训练在鸟类数据集上获得更高的识别准确率。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,包括:
利用鸟类识别器对待识别的鸟类图像进行识别,得到待识别的鸟类图像的鸟类类别;所述鸟类识别器的训练包括:
(1)构建样本鸟类图像的数据集;
(2)在卷积神经网络的ResNet50输入层之后增加BN层,在5层卷积层之后增加2层卷积层,在FC层之前增加Dropout层,得到改进的卷积神经网络;
(3)利用样本鸟类图像的数据集训练改进的卷积神经网络,得到鸟类识别器。
2.如权利要求1所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述样本鸟类图像的数据集中同一种类别的样本鸟类图像具有不同的背景和不同的姿态。
3.如权利要求2所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述背景包括:海面、森林、天空和草地。
4.如权利要求2所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述姿态包括:行走、站立、跳跃和觅食。
5.如权利要求1-4任一所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述2层卷积层的卷积核依次为3x3和1x1。
6.如权利要求1-4任一所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述步骤(3)包括:
(3.1)将数据集划分为训练集和验证集,采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对训练集进行增强,验证集不采取任何增强措施;
(3.2)使用数据集对改进的卷积神经网络进行预训练,得到初始网络参数,利用初始网络参数型对改进的卷积神经网络进行参数初始化;
(3.3)使用SGD优化器进行参数更新,并将L2正则化系数设置为e-4,利用增强的训练集训练改进的卷积神经网络,利用验证集进行验证,训练N轮后,得到鸟类识别器。
7.如权利要求6所述的一种基于改进的卷积神经网络的鸟类识别方法,其特征在于,所述预训练过程中,对改进的卷积神经网络的前4层卷积层的参数进行冻结。
CN201811091554.1A 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法 Active CN109460774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811091554.1A CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811091554.1A CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Publications (2)

Publication Number Publication Date
CN109460774A true CN109460774A (zh) 2019-03-12
CN109460774B CN109460774B (zh) 2022-04-22

Family

ID=65606809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811091554.1A Active CN109460774B (zh) 2018-09-18 2018-09-18 一种基于改进的卷积神经网络的鸟类识别方法

Country Status (1)

Country Link
CN (1) CN109460774B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059641A (zh) * 2019-04-23 2019-07-26 重庆工商大学 基于多预置点的深度鸟类识别算法
CN110063326A (zh) * 2019-04-30 2019-07-30 济南浪潮高新科技投资发展有限公司 基于卷积神经网络的智能驱鸟方法
CN110148408A (zh) * 2019-05-29 2019-08-20 上海电力学院 一种基于深度残差的中文语音识别方法
CN110837771A (zh) * 2019-09-17 2020-02-25 常熟理工学院 一种基于卷积神经网络的鸟类识别方法和装置
CN110969107A (zh) * 2019-11-25 2020-04-07 上海交通大学 基于网络模型鸟类种群识别分析方法及系统
CN112508072A (zh) * 2020-11-30 2021-03-16 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备
CN113255661A (zh) * 2021-04-15 2021-08-13 南昌大学 一种输电线路涉鸟故障相关鸟种图像识别方法
CN117611885A (zh) * 2023-11-17 2024-02-27 贵州省生物研究所 一种基于Canny边缘检测的候鸟生态调控方法
CN112508072B (zh) * 2020-11-30 2024-04-26 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030063670A1 (en) * 2001-09-28 2003-04-03 Koichi Masukura Image data processing method and article of manufacture
CN106954049A (zh) * 2017-05-13 2017-07-14 西安费斯达自动化工程有限公司 全景和精准图像跟踪系统的机场鸟类信息获取方法
CN107292340A (zh) * 2017-06-19 2017-10-24 南京农业大学 基于卷积神经网络的侧线鳞识别方法
CN107729363A (zh) * 2017-09-06 2018-02-23 上海交通大学 基于GoogLeNet网络模型鸟类种群识别分析方法
CN107977609A (zh) * 2017-11-20 2018-05-01 华南理工大学 一种基于cnn的指静脉身份验证方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030063670A1 (en) * 2001-09-28 2003-04-03 Koichi Masukura Image data processing method and article of manufacture
CN106954049A (zh) * 2017-05-13 2017-07-14 西安费斯达自动化工程有限公司 全景和精准图像跟踪系统的机场鸟类信息获取方法
CN107292340A (zh) * 2017-06-19 2017-10-24 南京农业大学 基于卷积神经网络的侧线鳞识别方法
CN107729363A (zh) * 2017-09-06 2018-02-23 上海交通大学 基于GoogLeNet网络模型鸟类种群识别分析方法
CN107977609A (zh) * 2017-11-20 2018-05-01 华南理工大学 一种基于cnn的指静脉身份验证方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059641A (zh) * 2019-04-23 2019-07-26 重庆工商大学 基于多预置点的深度鸟类识别算法
CN110063326A (zh) * 2019-04-30 2019-07-30 济南浪潮高新科技投资发展有限公司 基于卷积神经网络的智能驱鸟方法
CN110148408A (zh) * 2019-05-29 2019-08-20 上海电力学院 一种基于深度残差的中文语音识别方法
CN110837771A (zh) * 2019-09-17 2020-02-25 常熟理工学院 一种基于卷积神经网络的鸟类识别方法和装置
CN110969107A (zh) * 2019-11-25 2020-04-07 上海交通大学 基于网络模型鸟类种群识别分析方法及系统
CN112508072A (zh) * 2020-11-30 2021-03-16 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备
CN112508072B (zh) * 2020-11-30 2024-04-26 云南省烟草质量监督检测站 基于残差卷积神经网络的卷烟真假识别方法、装置和设备
CN113255661A (zh) * 2021-04-15 2021-08-13 南昌大学 一种输电线路涉鸟故障相关鸟种图像识别方法
CN113255661B (zh) * 2021-04-15 2022-07-12 南昌大学 一种输电线路涉鸟故障相关鸟种图像识别方法
CN117611885A (zh) * 2023-11-17 2024-02-27 贵州省生物研究所 一种基于Canny边缘检测的候鸟生态调控方法

Also Published As

Publication number Publication date
CN109460774B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN109460774A (zh) 一种基于改进的卷积神经网络的鸟类识别方法
CN105138993B (zh) 建立人脸识别模型的方法及装置
CN106407986B (zh) 一种基于深度模型的合成孔径雷达图像目标识别方法
AU2014368997B2 (en) System and method for identifying faces in unconstrained media
CN104599275B (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
WO2019100724A1 (zh) 训练多标签分类模型的方法和装置
CN110309856A (zh) 图像分类方法、神经网络的训练方法及装置
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
CN104866868B (zh) 基于深度神经网络的金属币识别方法和装置
US11429809B2 (en) Image processing method, image processing device, and storage medium
CN109584251A (zh) 一种基于单目标区域分割的舌体图像分割方法
CN109299716A (zh) 神经网络的训练方法、图像分割方法、装置、设备及介质
CN105205453B (zh) 基于深度自编码器的人眼检测和定位方法
CN109271895A (zh) 基于多尺度特征学习和特征分割的行人重识别方法
CN110084313A (zh) 一种生成物体检测模型的方法
CN106649487A (zh) 基于兴趣目标的图像检索方法
CN109271990A (zh) 一种针对rgb-d图像的语义分割方法及装置
CN106022363B (zh) 一种适用于自然场景下的中文文字识别方法
CN113191338B (zh) 一种行人重识别方法、装置、设备及可读存储介质
CN110084253A (zh) 一种生成物体检测模型的方法
CN109101938A (zh) 一种基于卷积神经网络的多标签年龄估计方法
CN109886153A (zh) 一种基于深度卷积神经网络的实时人脸检测方法
CN108733801A (zh) 一种面向数字人文的移动视觉检索方法
CN109886267A (zh) 一种基于最优特征选择的低对比度图像显著性检测方法
CN112419326B (zh) 图像分割数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant