CN110837771A

CN110837771A - 一种基于卷积神经网络的鸟类识别方法和装置

Info

Publication number: CN110837771A
Application number: CN201910875685.7A
Authority: CN
Inventors: 华斯亮; 徐健; 卞九辉; 华强; 张静亚; 刘玉申; 洪学鹍
Original assignee: Changshu Institute of Technology
Current assignee: Changshu Institute of Technology
Priority date: 2019-09-17
Filing date: 2019-09-17
Publication date: 2020-02-25

Abstract

本发明公开了一种基于卷积神经网络的鸟类识别方法，应用于一个或多个电子设备，所述方法包括以下步骤(1)采集端获取原始图片；(2)识别端接收照片；(3)对步骤(2)中接收的照片进行预处理，具体为优化的卷积神经网络MobileNetv2根据原始图像的像素，将图像进行具有重叠区域的分割、特征提取、特征选择和特征分类；(4)优化的目标识别模型识别预处理后的图像，并将识别结果按照切割大小和步长，拼接成原始图像的位置，对切割图像的重叠区域的识别结果做出融合处理；(5)对比鸟类图像的数据集识别鸟类并保存、统计；对于未识别出鸟类的照片，根据识别端的存储配置，可抛弃或保留或部分保留。本发明提供的上述方法，可有效提高图片的识别精度。

Description

一种基于卷积神经网络的鸟类识别方法和装置

技术领域

本发明一种基于卷积神经网络的鸟类识别方法和装置。

背景技术

近年来，以卷积神经网络为代表的深度学习算法在很多计算机视觉领域都取得突破性的进展，尤其是图像分类、目标跟踪、图像分割、目标检测等。但是当数据集发生变化时，卷积神经网络学习到的特征和具体任务的匹配度就不高了，其模型的泛化能力就还有待提升，因此需要针对具体的任务和需求，设计出基于特征任务的卷积神经网络，以满足现实场景的需求。

目前专利号为CN201811091554.1一种基于改进的卷积神经网络的鸟类识别方法；，包括：利用鸟类识别器对待识别的鸟类图像进行识别，得到待识别的鸟类图像的鸟类类别；所述鸟类识别器的训练包括：构建样本鸟类图像的数据集；在卷积神经网络的ResNet50输入层之后增加BN层，在5层卷积层之后增加2层卷积层，在FC层之前增加Dropout层，得到改进的卷积神经网络；利用样本鸟类图像的数据集训练改进的卷积神经网络，得到鸟类识别器。本发明基于迁移学习的思想，对卷积神经网络进行改进，将其应用在鸟类属性识别上，在样本量有限的前提下，获得了比改进之前的网络更好的结果。但是该专利在ResNet50上提出改进。ResNet50将输入限制在224x224像素，对于专业鸟类摄影中，鸟的图像面积占图片至少20％以上的的图片场景，具有显著的效果。但对于野外广角的固定摄像机来说，鸟在图片中只占有1％左右的图片面积。在这种场景下，CN201811091554.1提出的方法是不适用的。

发明内容

发明目的：为了克服现有技术的不足，本发明提供一种基于卷积神经网络的鸟类识别方法，用于识别在野外广角的固定摄像机拍摄的鸟占图片面积较少的鸟类识别方法。

本发明提供一种基于卷积神经网络的鸟类识别装置，用于采集图片，控制器接收并将图片传送至识别端，识别端接收图片进行具有重叠区域的分割、特征提取、特征选择和特征分类；目标识别模型对分割后图片按照切割大小和步长，拼接成原始图像的位置，并对切割图像的重叠区域的识别结果做出融合处理，得到识别图片。

技术方案：一种基于卷积神经网络的鸟类识别方法，应用于一个或多个电子设备，所述方法包括以下步骤

(1)采集端获取原始图片；

(2)识别端接收照片；

(3)对步骤(2)中接收的照片进行预处理，具体为优化的卷积神经网络MobileNetv2根据原始图像的像素，将图像进行具有重叠区域的分割、特征提取、特征选择和特征分类；

(4)优化的目标识别模型识别预处理后的图像，并将识别结果按照切割大小和步长，拼接成原始图像的位置，对切割图像的重叠区域的识别结果做出融合处理；

(5)对比鸟类图像的数据集识别鸟类并保存、统计；对于未识别出鸟类的照片，根据识别端的存储配置，可抛弃或保留或部分保留。

所述图片分辨率为1920像素*1080像素以上；图片格式为BMP、PNG、GIF和JPEG2000无损模式等无损编码格式。

所述采集端通过有线或无线将图片传输至识别端；在通过无线传输的情况下，采用4G或5G移动通信传输。

采集端的由树莓Pi、香蕉Pi、Swift Board、BeagleBoneBlac或CubieBoard等控制器控制。

所述步骤(3)所述的优化的卷积神经网络具体为卷积神经网络MobileNetv2宽度因子为[0.5,1.5]，输入分辨为[160,512]。

所述卷积神经网络MobileNetv2激活函数为ReLU6，其函数形式为min(max(0,x),6)。

所述目标识别模型为SSD，SSD通过若干个卷积层和全连接层，形成特征层，所述特征层用于提取目标类型和位置。

所述目标识别模型为或YOLOv3。

一种基于卷积神经网络的鸟类识别装置，所述装置包括有线或无线连接的采集端、识别端；采集端包括摄像头、控制器，摄像头与控制器通信连接；摄像头采集图片，控制器接收并将图片传送至识别端；

所述识别端具体为包含优化的卷积神经网络MobileNetv2的服务器，服务器接收图片，并对图片进行预处理；

目标识别模型包含优化的卷积神经网络MobileNetv2，对预处理后的图片按照切割大小和步长，拼接成原始图像的位置，并对切割图像的重叠区域的识别结果做出融合处理，得到识别图片。

所述摄像头数量为一个以上，所述摄像头上设信号收发器。

有益效果：本发明的一种基于卷积神经网络的鸟类识别方法和装置，相比现有技术，具有以下有益效果：

1.本发明通过提供一种优化后的卷积神经网络MobileNetv2，使识别端接收图片后对其进行具有重叠区域的分割、特征提取、特征选择和特征分类；目标识别模型对分割后图片按照切割大小和步长，拼接成原始图像的位置，并对切割图像的重叠区域的识别结果做出融合处理，得到识别图片。本发明通过上述方法，可有效提高图片的识别精度；

2.本发明包括采集端、识别端，图像采集和识别分离，集中对鸟类识别，降低整体成本。

3.本发明提工的优化后卷积神经网络，可将已识别的图片添加至训练库，进一步提高识别率；对于未识别出鸟类的照片，根据识别端的存储配置，可抛弃或保留或部分保留，这些照片经标记，可用于识别率中漏检率的统计，也有利于增加特殊情况的训练，提高识别率。

附图说明

图1为本发明结构示意图；

图2为ReLU6函数图；

图3为目标识别模型SSD结构示意图；

图4为目标识别模型YOLOv3结构示意图；

图5为实施例采集端拍摄原图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

如图1所示，一种基于卷积神经网络的鸟类识别方法，应用于一个或多个电子设备，所述方法包括以下步骤

(1)采集端获取原始图片；摄像头按照拍摄计划拍摄照片，获得3840像素*2160像素的图像，图片编码使用BMP、PNG、GIF和JPEG2000无损模式等无损编码格式；从下图5的实际照片中可见，鸟的形体较小，且离摄像头较远，鸟在照片中所占的比例小于20％；

控制器定时获得和传输照片至识别端，采集端通过有线或无线，将图片传输至识别端；通常采集端在野外，可采用4G或5G移动通信传输。所述控制器为树莓Pi、香蕉Pi、Swift Board、BeagleBoneBlac或CubieBoard等中的一种或多种；

(2)识别端接收照片；

(3)对步骤(2)中接收的照片进行预处理，具体为优化的卷积神经网络MobileNetv2根据原始图像的像素，识别端接收图片进行具有重叠区域的分割、特征提取、特征选择和特征分类；所述优化的卷积神经网络具体为卷积神经网络MobileNetv2宽度因子为[0.5,1.5]，输入分辨为[160,512]，其配置如表1所示，其中t是扩展比，c是block的输出特征的channel大小，n是block的重复次数，s是步长stride；

激活函数采用ReLU6，如图2所示，其函数形式为min(max(0,x),6)；优化的卷积神经网络MobileNetv2将图像进行具有重叠区域的分割，具体为将3840像素*2160像素的图像，切割成224像素*224像素，步长为180像素，这样图像与图像间至少有44个像素的重叠；

(4)如图3所示，优化的目标识别模型SSD包含优化的卷积神经网络MobileNetv2，用于识别预处理后的图像，SSD通过若干个卷积层和全连接层，形成额外的特征层，提取目标类型和位置；并将识别结果按照切割大小和步长，拼接成原始图像的位置，对切割图像的重叠区域的识别结果做出融合处理，得到识别图片；

(6)步骤(4)所述的目标识别，可采用，所述具体为YOLO的目标识别模型，将其中的YOLO darknet替换成MobileNet v2。

应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于卷积神经网络的鸟类识别方法，应用于一个或多个电子设备，其特征在于：所述方法包括以下步骤

(1)采集端获取原始图片；

(2)识别端接收照片；

2.根据权利要求1所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：所述图片分辨率为1920像素*1080像素以上；图片格式为BMP、PNG、GIF和JPEG2000无损模式等无损编码格式。

3.根据权利要求1或2所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：所述采集端通过有线或无线将图片传输至识别端；在通过无线传输的情况下，采用4G或5G移动通信传输。

4.根据权利要求3所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：采集端的由树莓Pi、香蕉Pi、Swift Board、BeagleBoneBlac或CubieBoard等控制器控制。

5.根据权利要求1所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：所述步骤(3)所述的优化的卷积神经网络具体为卷积神经网络MobileNetv2宽度因子为[0.5,1.5]，输入分辨为[160,512]。

6.根据权利要求1或4或5所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：所述卷积神经网络MobileNetv2激活函数为ReLU6，其函数形式为min(max(0,x),6)。

7.根据权利要求1所述的一张基于卷积神经网络的鸟类识别方法，其特征在于：所述目标识别模型为SSD，SSD通过若干个卷积层和全连接层，形成特征层，所述特征层用于提取目标类型和位置。

8.根据权利要求1或7所述的一种基于卷积神经网络的鸟类识别方法，其特征在于：所述目标识别模型为或YOLOv3。

9.一种基于卷积神经网络的鸟类识别装置，其特征在于：所述装置包括有线或无线连接的采集端、识别端；采集端包括摄像头、控制器，摄像头与控制器通信连接；摄像头采集图片，控制器接收并将图片传送至识别端；

10.根据权利要求9所述的一种基于卷积神经网络的鸟类识别装置，其特征在于：所述摄像头数量为一个以上，所述摄像头上设信号收发器。