CN113283306B

CN113283306B - 一种基于深度学习和迁移学习的啮齿动物识别分析的方法

Info

Publication number: CN113283306B
Application number: CN202110478772.6A
Authority: CN
Inventors: 韩立亮
Original assignee: Qingdao Yunzhi Environment Data Management Co ltd
Current assignee: Qingdao Yunzhi Environment Data Management Co ltd
Priority date: 2021-04-30
Filing date: 2021-04-30
Publication date: 2023-06-23
Anticipated expiration: 2041-04-30
Also published as: CN113283306A

Abstract

本发明公开了一种基于深度学习和迁移学习的啮齿动物识别分析的方法，属于动物分类和图像处理技术领域。包括以下步骤：S1：啮齿动物视频采集和预处理S2：啮齿动物数据集制作；S3：啮齿动物模型的构建和训练；S4：啮齿动物检测；S5：啮齿动物图像裁剪和超分辨率重建；S6：啮齿动物影像各部位分割；S7：数据清洗及各项身体指标数据计算；S8：啮齿动物分类。本发明的有益效果：本发明基于深度学习方法实现了对啮齿动物的检测、分类和各部位的分割，并计算了啮齿动物的各项身体指标数据，有效地提高了检测啮齿动物的准确率和效率，改变了传统啮齿动物分类的方式，并可以自动化地分割啮齿动物的各部位，有助于开展动物保护及有害生物害防控工作。

Description

一种基于深度学习和迁移学习的啮齿动物识别分析的方法

技术领域

本发明涉及智能分析技术领域，特别涉及一种基于深度学习和迁移学习的啮齿动物识别分析的方法。

背景技术

不同啮齿动物种类的危害方式不同，则防治重点不同，传统的监测手段以物理器械、化学药剂为主，需要专业人员进行操作，耗费大量的劳动力，且人为操作存在差异，进而导致监测结果受主观因素影响，监测效果较差。随着大数据、物联网、云计算、人工智能等学科技术不断发展，通过采用图像自动采集、数字图像处理、人工智能识别、无线传感传输等多项先进技术融合构建监测系统，对啮齿动物活动情况进行监测管理，工作人员通过网络监测到相关数据和图片、视频等信息，通过人工智能系统综合分析得到准确的监测数据，可从更多维度数据进行研究，建立啮齿动物种群动态预测预警模型，为生物多样性保护提供数据支持。

随着深度学习的不断发展，一些基于深度学习的目标检测和分割方法被提了出来。比如：YOLOv3、YOLOv4、faster R-CNN、mask R-CNN和YOLACT等，由于深度学习可以从大数据中自动学习图像的各层特征，低级特征通常指图像的边缘、线方向和颜色等，而高级特征通常指某些成分的形状和组合等。因此深度学习能够较好地提取图像的底层特征和高层的抽象特征，并将这些特征融合，从而为啮齿动物分类提供有效充分的特征依据，同时，对啮齿动物身体的各项指标进行计算，对研究啮齿动物也同样具有重要的意义。

发明内容

本发明的目的在于：利用深度学习和迁移学习对啮齿动物进行识别分析。

为了实现上述目的，本发明提供了一种基于深度学习和迁移学习的啮齿动物识别分析的方法，包括以下步骤：

S1：啮齿动物视频采集和预处理：通过视频录入系统采集啮齿动物视频数据，并对所述视频数据进行预处理，得到图像数据；

S2：啮齿动物数据集制作：依据动物分类学和深度学习的基础规则以及Mixup和CutMix的数据增强方法制作了啮齿动物数据集；

S3：啮齿动物模型的构建和训练；

S4：啮齿动物检测：采用经过参数优化的检测网络对预处理的图像数据进行检测，得到啮齿动物的最小外接矩形，去除背景和其它动物对分类和分割的影响；

S5：啮齿动物图像裁剪和超分辨率重建：

S51：根据啮齿动物的外接矩形轮廓将图像中的啮齿动物裁剪下来；

S52：采用构建的啮齿动物超分辨率重建网络对裁剪的图像进行超分辨率重建，以获取高质量的超分辨重建的图像数据；

S6：啮齿动物影像各部位分割：采用参数优化的啮齿动物分割网络模型对S5中超分辨重建的图像进行实例分割，得到啮齿动物各部位分割结果；

S7：数据清洗及各项身体指标数据计算：

S71：根据动物分类学基础规则、几何形态结构以及采用的深度学习模型的优化参数，自动选取符合使用要求的特征数据；

S72：依据分割结果和视频数据采集参数进行几何形态测量，采用叠印法实现结果的图形化，去除非形态变异的干扰，计算啮齿动物身体的各项指标；

S8：啮齿动物分类：将S5中的高质量图像与啮齿动物部分指标的文本数据进行数据融合，得到啮齿动物多模态数据作为啮齿动物分类网络的输入，采用参数优化的啮齿动物分类网络对多模态数据进行分类，得到啮齿动物类别。

优选地，所述步骤S2中啮齿动物数据集包括：啮齿动物检测数据集、啮齿动物分类数据集、啮齿动物分割数据集和啮齿动物超分辨重建数据集；所述啮齿动物检测数据集根据VOC数据集的制作规则进行制作；所述啮齿动物分割数据集依据COCO数据集的制作规则进行制作；所述啮齿动物分类数据集依据细粒度分类、多模态数据基础规则以及无监督的思想进行制作；所述啮齿动物超分辨率重建数据集依据无监督的思想进行制作。

优选地，所述步骤S3中啮齿动物模型的构建和训练的具体步骤包括：

S301：选取有监督的预训练算法对初始化的深度学习模型进行预训练，得到预训练深度学习网络模型；

S302：引入多核最大均值误差思想，基于深度学习构建啮齿动物检测网络，减小训练数据和测试数据之间的分布差异，使得训练后的模型在测试集上具有良好的迁移性；

S303：通过引入多核最大均值误差思想构建了啮齿动物分割网络，该网络结合深度卷积网络与空洞卷积网络并将多尺度卷积进行融合，利用多层感知机和度量学习的方式对每个像素进行分割和预测，实现实例分割，最终得到啮齿动物各部位分割结果；

S304：采用预训练的深度学习模型和啮齿动物检测数据集对构建的啮齿动物检测网络进行训练，优化网络参数，得到参数优化的啮齿动物检测网络；

S305：采用预训练的深度学习模型和啮齿动物分割数据集对构建的啮齿动物分割网络进行训练，优化网络参数，得到参数优化的啮齿动物分割网络；

S306：通过引入多核最大均值误差思想、多模态深度学习和深度自编码器聚类的思想，基于无监督学习的方式构建了啮齿动物分类网络；

S307：采用啮齿动物分类数据集对构建的深度学习啮齿动物分类网络进行训练，优化网络参数，得到参数优化的啮齿动物分类网络；

S308：依据零样本无监督方法和生成对抗网络构建深度学习啮齿动物超分辨率重建网络；

S309：采用啮齿动物超分辨重建数据集对构建的啮齿动物超分辨率重建网络进行训练，得到参数优化的啮齿动物超分辨率重建数据集。

优选地，所述步骤S4啮齿动物检测的具体步骤包括：

S401：将S1读取的每一帧图像数据逐一输入到检测网络中；

S402：采用特征提取网络得到图像的特征图；

S403：依据空间金字塔思想对得到的特征图进行特征融合，得到融合的不同特征级别的特征图；

S404：采用全局引导模块为不同特征级别的图层提供潜在显著物体的位置信息；

S405：采用构建的分类器对步骤S403得到的新特征图进行检测，得到啮齿动物的有向外接矩形和置信度分数；

S406：采用非极大抑制算法去除交并比较大的检测框，保留置信度分数高的边界框作为啮齿动物的检测结果。

优选地，所述步骤S52中超分辨率重建的具体步骤包括：

S521：判断步骤S51裁剪图像的大小，如果最长边大于等于1024像素，则不做任何处理；否则，对裁剪图像进行超分辨率重建；

S522：把裁剪后的啮齿动物图像输入到深度学习啮齿动物超分辨率重建网络中；

S523：对输入图像通过卷积神经网络提取图像特征，得到特征图；

S524：将特征图分解为边缘和纹理等多个成分，分别作为不同的频率子带，各部分独立重建；

S525：不同频率子带信息组合得到最终的超分辨率重建图像。

优选地，所述步骤S6啮齿动物影像各部位包括：尾巴、背部、躯干、耳廓、耳朵、眼睛、鼻子、头部。

优选地，所述步骤S6啮齿动物影像各部位分割的具体步骤为：

S601：将步骤S5中的超分辨率重建图像输入到参数优化的啮齿动物深度分割网络中；

S602：采用结合了空洞卷积的特征提取网络得到图像的特征图；

S603：采用构建的啮齿动物分类器预测步骤S602特征图各个位置的啮齿动物各部位类别和置信度分数；

S604：利用多层感知机和构建的分割机制对步骤S602特征图进行实例分割；

S605：对步骤S603和步骤S604中的结果采用构建的非极大抑制算法等操作得到啮齿动物各部位的分割结果。

优选地，所述步骤S7中的各项指标包括：头部角度、头部毛色及纹案、背部毛色及纹案、尾长、尾巴直径、尾巴毛色及纹案、身体尾端的角度、耳廓形状、耳朵长度、耳朵到眼睛距离、体长、身体轮廓周长、身体轮廓面积、体长与尾长的比值、耳朵长度与耳朵到眼睛距离的比值、啮齿动物体重。

优选地，所述步骤S72中啮齿动物身体的各项指标数据计算的具体步骤为：

S721：依据摄像头参数、拍摄高度和焦距计算地面采样间隔GSD；

S722：依据选取的分割结果和视频数据采集参数进行几何形态测量，采用叠印法实现结果的图形化，去除非形态变异的干扰；

S723：采用地面采样间隔GSD和图形化后的结果计算各项指标。

优选地，所述头部角度的计算方法为：根据步骤S605分割的两只耳朵掩码和鼻子掩码，计算每个掩码中心点的坐标，通过三个点的坐标以及图形化的结果计算头部方向相对于水平方向的角度。

优选地，所述头部毛色及纹案计算方法为：根据步骤S605分割的头部图像的RGB值得到毛色；将分割的头部图像转换为灰度图并对其进行局部二值模式操作，得到头部的纹案图像。

优选地，所述背部毛色及纹案计算方法为：根据步骤S605分割的背部图像的RGB值得到毛色；将分割的背部图像转换为灰度图并对其进行局部二值模式操作，得到背部的纹案图像。

优选地，所述尾巴毛色及纹案计算方法为：根据步骤S605分割的尾巴图像的RGB值得到毛色；将分割的尾巴图像转换为灰度图并对其进行局部二值模式操作，得到尾巴的纹案图像。

优选地，所述尾长的计算方法为：根据分割的尾巴掩码图像和图形化的结果得到尾巴掩码的逼近曲线，逼近曲线的长度×GSD即为尾巴的长度；所述尾巴直径的计算方法为：根据分割的尾巴掩码和图形化的结果计算尾部宽度，每个尾部宽度×GSD并计算均值得到尾巴直径；所述身体尾端的角度的计算方法为：通过尾巴掩码、躯干掩码和图形化的结果可得到身体尾端坐标，然后根据躯干掩码得到躯干轮廓，最后以尾端坐标为界限分别对该点附近区域的轮廓曲线进行线性回归，得到两条直线，两条直线的夹角为身体尾端的角度。

优选地，所述耳廓形状的计算方法为：耳廓掩码为耳廓的形状，或者通过掩码二值图和和图形化的结果得到外部轮廓作为耳廓的轮廓；所述耳朵长度的计算方法为：对耳朵掩码求最小外接圆，最小外接圆的直径×GSD为耳朵长度；所述耳朵到眼睛距离的计算方法为：根据两只耳朵的掩码、两个眼睛的掩码和图形化的结果计算每个掩码中心点的坐标，根据坐标和GSD得到耳朵到眼睛的距离。

优选地，所述体长的计算方法为：根据躯干掩码、头部的掩码和图形化的结果得到最小外接圆，最小外接圆的直径×GSD为啮齿动物的体长；所述身体轮廓周长的计算方法为：根据躯干掩码、头部掩码和尾部掩码得到掩码轮廓，轮廓像素点个数×GSD即为啮齿动物身体轮廓周长。

优选地，所述身体轮廓面积的计算方法为：将躯干掩码、头部掩码、尾部掩码和图形化的结果得到掩码的像素点个数，掩码的像素点个数×GSD的平方即为啮齿动物身体轮廓面积。

优选地，所述体长与尾长的比值：根据计算得到的体长与计算得到的尾长得到该比值；所述耳朵长度与耳朵到眼睛距离的比值的计算方法为：根据计算得到的耳朵长度与耳朵到眼睛距离得到该比值。

优选地，所述体重的计算方法为：通过不同啮齿动物在摄像头正下方时啮齿动物轮廓面积，测量啮齿动物体重；统计得到体重和啮齿动物轮廓面积的关系式；最后采用此关系式和啮齿动物身体轮廓面积计算得到啮齿动物的体重。

优选地，所述步骤S8啮齿动物分类的具体步骤为：

S801：将步骤S5得到的高质量的超分辨重建的图像数据与啮齿动物部分指标的文本数据进行数据融合，得到啮齿动物多模态数据；

S802：啮齿动物多模态数据经过结合了注意力机制的卷积神经网络后得到图像的特征图，该提取网络融合了有判别性的区域定位和细粒度特征，使得特征图保留了更多的啮齿动物分类特征；

S803：对步骤S802得到的特征图进行空间金字塔池化，得到固定长度的特征向量；

S804：将步骤S803的特征向量经过全连接层和构建的分类器得到啮齿动物类别和置信度分数，置信度分数最大的类别即为该图像的啮齿动物类别。

本发明的有益效果：本发明首先通过视频录入系统采集啮齿动物视频数据，并对所述视频数据进行预处理；然后，依据动物分类学和深度学习的基础规则制作啮齿动物数据集；其次，采用啮齿动物数据集对构建的啮齿动物检测网络、啮齿动物分割网络、啮齿动物分类网络和啮齿动物超分辨率重建网络进行训练，优化网络参数；接着，采用经过参数优化的啮齿动物检测网络对预处理的图像数据进行检测，得到啮齿动物的最小外接矩形；然后，根据啮齿动物的外接矩形轮廓通过参数优化的啮齿动物超分辨率重建网络进行超分辨率重建，得到超分辨率重建的图像；接着，采用参数优化的啮齿动物分割网络模型对超分辨率重建的图像进行分割，得到啮齿动物各部位的分割结果；然后，对分割结果进行数据清洗并计算啮齿动物的各项指标；最后，将超分辨率重建的图像与啮齿动物的部分身体指标的文本数据进行数据融合，得到啮齿动物多模态数据，采用参数优化的啮齿动物分类网络对啮齿动物多模态数据进行分类，得到啮齿动物类别。本发明基于深度学习和迁移学习方法实现了对啮齿动物的检测、分类和对各部位的分割，并计算了啮齿动物各项指标。相比于现有技术，有效地提高了检测啮齿动物的准确率和效率，改变了传统啮齿动物分类的方式，并可以自动化地分割啮齿动物的各部位，有助于开展鼠患防治工作。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单说明。显然，所描述的附图只是本发明的一部分实施例，而不是全部实施例，本领域的技术人员在不付出创造性劳动的前提下，还可以根据这些附图获得其他设计方案和附图。

图1为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的流程图；

图2为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S3的具体流程图；

图3为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S4的具体流程图；

图4为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S52的具体流程图；

图5为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S6的具体流程图；

图6为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S72的具体流程图；

图7为本发明一种基于深度学习和迁移学习的啮齿动物识别分析的方法的中步骤S8的具体流程图。

具体实施方式

下面结合附图以及实施例对本发明作进一步的说明。

一种基于深度学习和迁移学习的啮齿动物识别分析的方法，包括以下步骤：

S2：啮齿动物数据集制作：依据动物分类学和深度学习的基础规则以及Mixup和CutMix的数据增强方法制作了啮齿动物数据集，包括：啮齿动物检测数据集、啮齿动物分类数据集、啮齿动物分割数据集和啮齿动物超分辨重建数据集；

其中，啮齿动物检测数据集根据VOC数据集的制作规则进行制作；啮齿动物分割数据集依据COCO数据集的制作规则进行制作；啮齿动物分类数据集依据细粒度分类、多模态数据基础规则以及无监督的思想进行制作；超分辨率重建数据集依据无监督的思想进行制作；

S3：啮齿动物模型的构建和训练：

S4：啮齿动物检测：

S401：将S1读取的每一帧图像数据逐一输入到检测网络中；

S402：采用特征提取网络得到图像的特征图；

S406：采用非极大抑制算法去除交并比较大的检测框，保留置信度分数高的边界框作为啮齿动物的检测结果

S5：啮齿动物图像裁剪和超分辨率重建：

S525：不同频率子带信息组合得到最终的超分辨率重建图像。

S6：啮齿动物影像各部位分割：采用参数优化的啮齿动物分割网络模型对S5中超分辨重建的图像进行实例分，得到尾巴、背部、躯干、耳廓、耳朵、眼睛、鼻子、头部的影像。；

S7：数据清洗及各项身体指标数据计算，各项身体指标数据包括：头部角度、头部毛色及纹案、背部毛色及纹案、尾长、尾巴直径、尾巴毛色及纹案、身体尾端的角度、耳廓形状、耳朵长度、耳朵到眼睛距离、体长、身体轮廓周长、身体轮廓面积、体长与尾长的比值、耳朵长度与耳朵到眼睛距离的比值、啮齿动物体重：

S723：采用地面采样间隔GSD和图形化后的结果计算各项指标。

S8：啮齿动物分类：

各个部位的计算方法如下：

①头部角度：根据啮齿动物分割网络分割的两只耳朵掩码和鼻子掩码，计算每个掩码中心点的坐标，通过三个点的坐标以及图形化的结果计算头部方向相对于水平方向的角度。

②头部毛色及纹案：根据啮齿动物分割网络分割的头部图像的RGB值得到毛色；将分割的头部图像转换为灰度图并对其进行局部二值模式操作，得到头部的纹案图像。

③背部毛色及纹案：根据啮齿动物分割网络分割的背部图像的RGB值得到毛色；将分割的背部图像转换为灰度图并对其进行局部二值模式操作，得到背部的纹案图像。

④尾长：根据分割的尾巴掩码图像和图形化的结果得到尾巴掩码的逼近曲线，逼近曲线的长度×GSD即为尾巴的长度。

⑤尾巴直径：根据分割的尾巴掩码和图形化的结果计算尾部宽度，每个尾部宽度×GSD并计算均值得到尾巴直径。

⑥尾巴毛色及纹案：根据啮齿动物分割网络分割的尾巴图像的RGB值得到毛色；将分割的尾巴图像转换为灰度图并对其进行局部二值模式操作，得到尾巴的纹案图像。

⑦耳廓形状：耳廓掩码为耳廓的形状，或者通过掩码二值图得到外部轮廓作为耳廓的轮廓。

⑧耳朵长度：对耳朵掩码求最小外接圆，最小外接圆的直径×GSD为耳朵长度。

⑨耳朵到眼睛距离：根据两只耳朵的掩码和两个眼睛的掩码计算每个掩码中心点的坐标，根据坐标和GSD得到耳朵到眼睛的距离。

⑩身体尾端的角度：通过尾巴掩码、躯干掩码和图形化的结果可得到身体尾端坐标，然后根据躯干掩码得到躯干轮廓，最后以尾端坐标为界限分别对该点附近区域的轮廓曲线进行线性回归，得到两条直线，两条直线的夹角为身体尾端的角度。

⑪体长：根据躯干掩码、头部的掩码和图形化的结果得到最小外接圆，最小外接圆的直径×GSD为啮齿动物的体长。

⑫身体轮廓周长：根据躯干掩码、头部掩码和尾部掩码得到掩码轮廓，轮廓像素点个数×GSD为啮齿动物身体轮廓周长。

⑬身体轮廓面积：将躯干掩码、头部掩码、尾部掩码和图形化的结果得到掩码的像素点个数，掩码的像素点个数×GSD的平方即为啮齿动物身体轮廓面积。

⑭体长与尾长的比值：根据⑪计算得到的体长与④计算得到的尾长得到该比值

⑮耳朵长度与耳朵到眼睛距离的比值：根据⑧计算得到的耳朵长度与⑨计算得到的耳朵到眼睛距离得到该比值。

⑯体重：通过⑬得到不同啮齿动物在摄像头正下方时啮齿动物轮廓面积，测量啮齿动物体重；统计得到体重和啮齿动物轮廓面积的关系式；最后采用此关系式和啮齿动物身体轮廓面积计算得到啮齿动物的体重。

Claims

1.一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，包括以下步骤：

S3：啮齿动物模型的构建和训练；

S5：啮齿动物图像裁剪和超分辨率重建：

S6：啮齿动物影像各部位分割：采用参数优化的啮齿动物分割网络模型对步骤S5中超分辨重建的图像进行实例分割，得到啮齿动物各部位分割结果；

S7：数据清洗及各项身体指标数据计算：

S8：啮齿动物分类：将步骤S5中的高质量图像与啮齿动物部分指标的文本数据进行数据融合，得到啮齿动物多模态数据作为啮齿动物分类网络的输入，采用参数优化的啮齿动物分类网络对多模态数据进行分类，得到啮齿动物类别；

所述步骤S2中啮齿动物数据集包括：啮齿动物检测数据集、啮齿动物分类数据集、啮齿动物分割数据集和啮齿动物超分辨重建数据集；所述啮齿动物检测数据集根据VOC数据集的制作规则进行制作；所述啮齿动物分割数据集依据COCO数据集的制作规则进行制作；所述啮齿动物分类数据集依据细粒度分类、多模态数据基础规则以及无监督的思想进行制作；所述啮齿动物超分辨率重建数据集依据无监督的思想进行制作；

所述步骤S3中啮齿动物模型的构建和训练的具体步骤包括：

S309：采用啮齿动物超分辨重建数据集对构建的啮齿动物超分辨率重建网络进行训练，得到参数优化的啮齿动物超分辨率重建数据集；

所述步骤S7中的各项指标包括：头部角度、头部毛色及纹案、背部毛色及纹案、尾长、尾巴直径、尾巴毛色及纹案、身体尾端的角度、耳廓形状、耳朵长度、耳朵到眼睛距离、体长、身体轮廓周长、身体轮廓面积、体长与尾长的比值、耳朵长度与耳朵到眼睛距离的比值、啮齿动物体重。

2.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S4啮齿动物检测的具体步骤包括：

S401：将步骤S1读取的每一帧图像数据逐一输入到检测网络中；

S402：采用特征提取网络得到图像的特征图；

3.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S52中超分辨率重建的具体步骤包括：

S525：不同频率子带信息组合得到最终的超分辨率重建图像。

4.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S6啮齿动物影像各部位包括：尾巴、背部、躯干、耳廓、耳朵、眼睛、鼻子、头部。

5.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S6啮齿动物影像各部位分割的具体步骤为：

6.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S72中啮齿动物身体的各项指标数据计算的具体步骤为：

S723：采用地面采样间隔GSD和图形化后的结果计算各项指标。

7.根据权利要求1所述的一种基于深度学习和迁移学习的啮齿动物识别分析的方法，其特征在于，所述步骤S8啮齿动物分类的具体步骤为：

S802：啮齿动物多模态数据经过结合了注意力机制的卷积神经网络后得到图像的特征图，啮齿动物多模态数据经过结合了注意力机制的卷积神经网络融合了有判别性的区域定位和细粒度特征，使得特征图保留了更多的啮齿动物分类特征；