CN113569954A - 一种野生动物智能分类识别方法 - Google Patents

一种野生动物智能分类识别方法 Download PDF

Info

Publication number
CN113569954A
CN113569954A CN202110862477.0A CN202110862477A CN113569954A CN 113569954 A CN113569954 A CN 113569954A CN 202110862477 A CN202110862477 A CN 202110862477A CN 113569954 A CN113569954 A CN 113569954A
Authority
CN
China
Prior art keywords
confidence
animal
wild
classification
bounding box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110862477.0A
Other languages
English (en)
Inventor
纪萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wanjiang Institute of Technology
Original Assignee
Wanjiang Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wanjiang Institute of Technology filed Critical Wanjiang Institute of Technology
Priority to CN202110862477.0A priority Critical patent/CN113569954A/zh
Publication of CN113569954A publication Critical patent/CN113569954A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种野生动物智能分类识别方法,包括如下步骤:对所监测区域的野生动物进行分类,并收集区域内存在的不同种类的野生动物图片;通过软件对图片进行标注,制作标签数据集;利用yolo算法对数据集进行训练,构建模型库;预测动物类型。该方法通过对不同种类野生动物的图片制作标签,形成野生动物特征识别数据库,训练样本,建立动物模型,模型建立以后,人们就可以将拍摄的图片输入进去,系统自动识别出野生动物的类别,从而帮助人们及时快速地了解此片区域内的野生动物的情况。本发明具有识别速度快,识别精度高的优点,可以实时对野生动物进行检测,及时关注物种的活动范围,极大地节省了人力和物力,提高了监测效率。

Description

一种野生动物智能分类识别方法
技术领域
本发明涉及野生动物分类技术领域,特别是涉及一种野生动物智能分类识别方法。
背景技术
人和自然的和谐共生,是我们生态环境追求的理想目标,野生动物是自然界中生物资源的重要组成部分,保护野生动物资源是生态文明建设的重要组成部分。目前,传统的动物分类手段是通过人力深入到野外对野生动物进行跟踪调查,或者采用昂贵的视频图像拍摄识别,进行实时跟踪拍摄,但是,这都需要耗费大量的人力和物力,识别的精确度和效率都不高。因此,随着人工智能技术的飞速发展,将人工智能技术应用到野生动物的识别系统,是很有必要的。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足,提供一种野生动物智能分类识别方法,它能够节约人力物力,提高识别的精确度和效率。
为了解决上述技术问题,本发明的技术方案是:
一种野生动物智能分类识别方法,包括如下步骤:
A、对所监测区域的野生动物进行分类,并收集区域内存在的不同种类的野生动物图片;
B、通过软件对图片进行标注,制作标签数据集;
C、利用yolo算法对数据集进行训练,构建模型库;
D、预测动物类型。
进一步,所述步骤C包括如下步骤:
C1、将图片划分为S×S的网格,若发现有目标在网格中,则该网格负责检测这个目标;
C2、每个网格设置B个边界框boundingbox,每个边界区域回归自身位置的同时预测出一个置信度confidence;
C3、计算边界盒子的参数x,y,w,h和置信度;
其中每个边界框具有五个数值x,y,w,h和置信度,x,y是边界盒子相对于整张图片中心的距离,w,h是边界盒子左上角x相对于整张图像的宽度和高度,置信度是代表预测物体与真实物体的达成度;
所述置信度的计算公式如下:
Figure BDA0003186235410000021
其中,
Figure BDA0003186235410000022
指的是预测的边界框和真实的物体位置的交并比,Pr(object)是指一个物体落到边界框里面的概率,若预测的动物没有在这个区域里面,则这个置信度就为0;
C4、每个网格的中心预测出一个类别条件概率Pr(Classi|Object)值,即C值,其中所述C值反映的是每个网格中心与所预测物种的分类概率,不考虑边界盒子的情况;
C5、计算得出每个边界区域的特定置信度对应的分值class-specificconfidence score,公式如下:
Figure BDA0003186235410000023
Figure BDA0003186235410000024
C6、采用误差平方和不断地计算损失函数loss,损失函数指的是网络实际输出值与样本标签值之间的偏差,公式如下:loss=λcoord*坐标预测误差+(含object的boxconfidence预测误差+λnoobj*不含object的box confidence预测误差)+分类误差;
C7、根据迭代计算的loss值,训练出动物模型,构建成模型库。
进一步,所述步骤D包括输入拍摄的图片,根据训练完成的yolo动物模型,对图片进行识别分类,并进行预测输出。
进一步,所述预测输出包括如下步骤:
a、设置一个分值Score的阈值,低于该阈值的候选对象排除掉;
b、遍历每一个对象类别;
c、找到分值最大的那个对象及其边界框,添加到输出列表;
d、对于每个分值不为0的候选对象,计算其与上述步骤c中输出对象的边界框的交并比IOU;
e、根据预先设置的IOU阈值,所有高于该IOU阈值的候选对象排除掉;
f、若所有边界框在输出列表中或Score=0,则返回步骤b处理下一种对象;
g、输出列表即为预测的对象。
进一步,所述步骤D之后还包括如下步骤:通过图片识别出此区域野生动物的物种情况,对管理区域内动物的生存情况进行了解。
采用了上述技术方案,本发明具有以下的有益效果:
与现有技术相比,本发明的方法通过无人机拍摄野外照片,将图片输入到系统,系统就会自动识别出动物的类别。该方法通过对不同种类野生动物的图片制作标签,形成野生动物特征识别数据库,训练样本,建立动物模型。模型建立以后,人们就可以将拍摄的图片输入进去,系统自动识别出野生动物的类别,从而帮助人们及时快速地了解此片区域内的野生动物的情况。yolo算法是直接将物体检测视为一个回归问题进行求解,输入的图片数据只经过一次网络,即可得到整幅图像中所有的位置和它属于的类别以及相对应的置信概率。本方法具有识别速度快,识别精度高的优点,同时可以实时对野生动物进行检测,及时关注物种的活动范围,极大地节省了人力和物力,提高了监测效率。
附图说明
图1为本发明的动物智能分类识别流程图;
图2为训练动物样本流程图;
图3为动物类型预测流程图;
图4为损失函数计算公式的示意图。
具体实施方式
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明。
如图1-4所示,在本实施例中,提供一种野生动物智能分类识别方法,具体包含以下步骤:A、对所监测区域的野生动物进行分类,并收集区域内存在的不同种类的野生动物图片。在每张图像中标出所需训练的野生动物,LabelImg是标记图像的工具,使用LabelImg对图片进行贴标签操作,在选图片的过程中,要放入背景、光线不同的复杂的图片进行训练,以避免在进行图像识别时无法识别条件较差的图像。B、通过软件对图片进行标注,制作标签数据集,当标注后,软件会自动生成数据文件,数据文件为需要训练的图片进行标注。C、利用yolo算法对数据集进行训练,构建模型库;D、预测动物类型。
本实施例中的步骤C具体包含以下步骤:C1、将448*448的图片划分为S×S的网格,若发现有目标在这个网格中,则该网格负责检测这个目标。C2、每个网格设置B个边界框boundingbox,每个边界区域不仅要回归自身位置,同时也要预测出一个置信度confidence。C3、计算边界盒子的参数x,y,w,h和置信度,其中每个边界框具有五个数值x,y,w,h和置信度,x,y是边界盒子相对于整张图片中心的距离,w,h是边界盒子左上角x相对于整张图像的宽度和高度,置信度是代表预测物体与真实物体的达成度。置信度的数值反应的是这个边框包含预测物体的置信度,置信度的计算公式如下:
Figure BDA0003186235410000041
其中,
Figure BDA0003186235410000042
指的是预测的边界框和真实的物体位置的交并比,Pr(object)是指一个物体落到边界框里面的概率,如果预测的动物没有在这个区域里面,那么这个置信度就为0。C4、每个网格的中心预测出一个类别条件概率Pr(Classi|Object)值,即C值,其中C值反映的是每个网格中心与所预测物种的分类概率,不考虑边界盒子的情况。C5、计算得出每个边界区域的特定置信度对应的分值class-specific confidence score,在测定目标的时,每一个网格预测的类别条件概率和边界区域预测的置信度信息相乘,就得到每个边界区域的特定置信度对应的分值,公式如下:
Figure BDA0003186235410000043
Figure BDA0003186235410000044
需要说明的是本实施例中的YOLO检测网络包括24个卷积层和2个全连接层,其中,卷积层用来提取图像特征,全连接层用来预测图像位置和类别概率值,通过卷积网络的计算,输出的是S*S*(B*5+C)模块,其中S=7,B=2,C=20,也就是把图片分成了7*7的网络模块,每个模块深度是(B*5+C)的矩阵组成,其中每个边界盒子有五个参数组成,一个模块有两个边界盒子表示,每个模块对20个种类进行分类计算。C6、采用误差平方和的方式不断地计算损失函数loss,损失函数的计算体现的是网络实际输出值与样本标签值之间的偏差,公式如下:loss=λcoord*坐标预测误差+(含object的box confidence预测误差+λnoobj*不含object的boxconfidence预测误差)+分类误差。C7、根据迭代计算的loss值,训练出动物模型,构建成模型库。
参照附图4,本实施例中的具体公式计算如下:
Figure BDA0003186235410000051
其中预测误差中乘惩罚权重系数:λnoobj=0.5,λcoobj=5,由此可见,yolo对为位置误差的权重加大,可以进一度提高位置预测的精度,yolo是一个回归迭代算法,算法通过不断地计算loss值,进行迭代计算,最终达到理想的动物类别模型。
具体地,本实施例步骤D包括输入拍摄的图片,根据训练完成的yolo动物模型,对图片进行识别分类,并进行预测输出。当输入一张图片时,计算出一个7*7*30矩阵来表示图片中所有网格包含的对象的概率以及该对象可能的2个边界框位和置信度。另外,对高频、低频、色调、饱和度和明度的多尺度特征图片进行归一化处理,首先计算特征图的全局最大值Mmax,将特征图归一化到[0,Mmax]区间内,计算特征图除Mmax之外的所有局部最大值的平均值
Figure BDA0003186235410000061
Figure BDA0003186235410000062
乘以特征图,最后对特征图进行插值、叠加运算,求得与原图像尺寸相同的各特征的分量显著图,能够提高野生动物分类识别的精度。
同时,本实施例中的预测输出具体又分为以下步骤:a、设置一个分值Score的阈值,低于该阈值的候选对象排除掉;b、遍历每一个对象类别;c、找到分值最大的那个对象及其边界框,添加到输出列表;d、对于每个分值不为0的候选对象,计算其与上述步骤c中输出对象的边界框的交并比IOU;e、根据预先设置的IOU阈值,所有高于该IOU阈值的候选对象排除掉;f、如果所有边界框在输出列表中,或者说Score=0的,满足其一则返回步骤b处理下一种对象;g、最后输出列表即为预测的对象。该预测步骤操作简单,预测精度高,能够提高野生动物的分类精度。
在上述A、B、C、D步骤完成之后,可通过图片识别出此区域野生动物的物种情况,快速地对管理区域内动物的生存情况进行了解,以便于后期可以安排相应的开展研究调查活动,极大地节省了人力物力。
本实施例的方法在具体操作时,可通过无人机在野外拍摄照片,将图片输入到系统,系统就会自动识别出动物的类别。该方法通过对不同种类野生动物的图片制作标签,形成野生动物特征识别数据库,训练样本,建立动物模型。模型建立以后,人们就可以将拍摄的图片输入进去,系统自动识别出野生动物的类别,从而帮助人们及时快速地了解此片区域内的野生动物的情况。yolo算法是直接将物体检测视为一个回归问题进行求解,输入的图片数据只经过一次网络,即可得到整幅图像中所有的位置和它属于的类别以及相对应的置信概率。本方法具有识别速度快,识别精度高的优点,可以实时对野生动物进行检测,及时关注物种的活动范围,极大地节省了人力和物力,提高了监测效率。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上的具体实施例,对本发明解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种野生动物智能分类识别方法,其特征在于,包括如下步骤:
A、对所监测区域的野生动物进行分类,并收集区域内存在的不同种类的野生动物图片;
B、通过软件对图片进行标注,制作标签数据集;
C、利用yolo算法对数据集进行训练,构建模型库;
D、预测动物类型。
2.根据权利要求1所述的野生动物智能分类识别方法,其特征在于,所述步骤C包括如下步骤:
C1、将图片划分为S×S的网格,若发现有目标在网格中,则该网格负责检测这个目标;
C2、每个网格设置B个边界框(bounding box),每个边界区域回归自身位置的同时预测出一个置信度(confidence);
C3、计算边界盒子的参数(x,y,w,h)和置信度;
其中每个边界框具有五个数值x,y,w,h和置信度,(x,y)是边界盒子相对于整张图片中心的距离,(w,h)是边界盒子左上角x相对于整张图像的宽度和高度,置信度是代表预测物体与真实物体的达成度;
所述置信度的计算公式如下:
Figure FDA0003186235400000011
其中,
Figure FDA0003186235400000012
指的是预测的边界框和真实的物体位置的交并比,Pr(object)是指一个物体落到边界框里面的概率,若预测的动物没有在这个区域里面,则这个置信度就为0;
C4、每个网格的中心预测出一个类别条件概率Pr(Classi|Object)值,即C值,其中所述C值反映的是每个网格中心与所预测物种的分类概率,不考虑边界盒子的情况;
C5、计算得出每个边界区域的特定置信度对应的分值(class-specific confidencescore),公式如下:
Figure FDA0003186235400000013
Figure FDA0003186235400000014
C6、采用误差平方和不断地计算损失函数(loss),损失函数指的是网络实际输出值与样本标签值之间的偏差,公式如下:loss=λcoord*坐标预测误差+(含object的boxconfidence预测误差+λnoobj*不含object的box confidence预测误差)+分类误差;
C7、根据迭代计算的loss值,训练出动物模型,构建成模型库。
3.根据权利要求2所述的野生动物智能分类识别方法,其特征在于:所述步骤D包括输入拍摄的图片,根据训练完成的yolo动物模型,对图片进行识别分类,并进行预测输出。
4.根据权利要求3所述的野生动物智能分类识别方法,其特征在于,所述预测输出包括如下步骤:
a、设置一个分值(Score)的阈值,低于该阈值的候选对象排除掉;
b、遍历每一个对象类别;
c、找到分值最大的那个对象及其边界框,添加到输出列表;
d、对于每个分值不为0的候选对象,计算其与上述步骤c中输出对象的边界框的交并比IOU;
e、根据预先设置的IOU阈值,所有高于该IOU阈值的候选对象排除掉;
f、若所有边界框在输出列表中或Score=0,则返回步骤b处理下一种对象;
g、输出列表即为预测的对象。
5.根据权利要求1-4任一项所述的野生动物智能分类识别方法,其特征在于,所述步骤D之后还包括如下步骤:通过图片识别出此区域野生动物的物种情况,对管理区域内动物的生存情况进行了解。
CN202110862477.0A 2021-07-29 2021-07-29 一种野生动物智能分类识别方法 Withdrawn CN113569954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110862477.0A CN113569954A (zh) 2021-07-29 2021-07-29 一种野生动物智能分类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110862477.0A CN113569954A (zh) 2021-07-29 2021-07-29 一种野生动物智能分类识别方法

Publications (1)

Publication Number Publication Date
CN113569954A true CN113569954A (zh) 2021-10-29

Family

ID=78168825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110862477.0A Withdrawn CN113569954A (zh) 2021-07-29 2021-07-29 一种野生动物智能分类识别方法

Country Status (1)

Country Link
CN (1) CN113569954A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115331129A (zh) * 2022-10-14 2022-11-11 彼图科技(青岛)有限公司 一种基于无人机和人工智能的垃圾数据识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115331129A (zh) * 2022-10-14 2022-11-11 彼图科技(青岛)有限公司 一种基于无人机和人工智能的垃圾数据识别方法

Similar Documents

Publication Publication Date Title
CN109829399B (zh) 一种基于深度学习的车载道路场景点云自动分类方法
CN110059554B (zh) 一种基于交通场景的多支路目标检测方法
CN108961235B (zh) 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN108564097B (zh) 一种基于深度卷积神经网络的多尺度目标检测方法
CN113705478B (zh) 一种基于改进YOLOv5的红树林单木目标检测方法
CN109087510B (zh) 交通监测方法及装置
CN111563442A (zh) 基于激光雷达的点云和相机图像数据融合的slam方法及系统
CN111784685A (zh) 一种基于云边协同检测的输电线路缺陷图像识别方法
CN110826514A (zh) 一种基于深度学习的施工现场违章智能识别方法
CN109670405B (zh) 一种基于深度学习的复杂背景行人检测方法
CN111626128A (zh) 一种基于改进YOLOv3的果园环境下行人检测方法
CN111914839B (zh) 基于YOLOv3的同步端到端车牌定位与识别方法
CN110728252B (zh) 一种应用于区域人员运动轨迹监控的人脸检测方法
CN108711172B (zh) 基于细粒度分类的无人机识别与定位方法
CN110287798B (zh) 基于特征模块化和上下文融合的矢量网络行人检测方法
CN112633174B (zh) 一种基于改进的YOLOv4高穹顶场景下火灾检测方法、存储介质
CN115861619A (zh) 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与系统
CN113033516A (zh) 对象识别统计方法及装置、电子设备、存储介质
CN111753682A (zh) 一种基于目标检测算法的吊装区域动态监控方法
CN112990004A (zh) 一种基于光流法和深度学习卷积神经网络的黑烟车检测方法
CN113674216A (zh) 一种基于深度学习的地铁隧道病害检测方法
Geng et al. An improved helmet detection method for YOLOv3 on an unbalanced dataset
CN111540203B (zh) 基于Faster-RCNN调节绿灯通行时间的方法
CN113888754A (zh) 一种基于雷达视觉融合的车辆多属性识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20211029