CN112966762B - 一种野生动物检测方法、装置、存储介质及电子设备 - Google Patents
一种野生动物检测方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112966762B CN112966762B CN202110280866.2A CN202110280866A CN112966762B CN 112966762 B CN112966762 B CN 112966762B CN 202110280866 A CN202110280866 A CN 202110280866A CN 112966762 B CN112966762 B CN 112966762B
- Authority
- CN
- China
- Prior art keywords
- feature
- prediction
- group
- frames
- overlapped
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001465754 Metazoa Species 0.000 title claims abstract description 81
- 238000001514 detection method Methods 0.000 title claims abstract description 55
- 230000004927 fusion Effects 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000013507 mapping Methods 0.000 claims abstract description 18
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002401 inhibitory effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 13
- 238000012549 training Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241001466804 Carnivora Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种野生动物检测方法、装置、存储介质及电子设备,属于野生动物检测领域。进行检测时包括将待检测的野生动物图像输入特征提取网络提取特征;将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行特征融合;将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;对重叠的预测框进行筛选,输出动物检测结果。本发明通过充分融合网络浅层的细节信息和深层的语义信息,并且对重叠目标的预测框进行抑制,有效地提高了对野生动物的检测精度,从而对于野生动物的监管起到积极的作用。
Description
技术领域
本发明属于野生动物检测领域,具体涉及一种野生动物检测方法、装置、存储介质及电子设备。
背景技术
随着工业的发展,人类对自然的破坏日益严重,越来越多的野生动物濒临灭绝。野生动物的生存和繁衍对维护自然系统平衡,保持物种多样性,实现可持续发展具有重要的意义。为了有效监管野生动物,大量科学技术投入了野生动物检测领域,包括卫星遥感、DNA条形码、热红外相机以及GPS(全球定位系统)等。
近年来,利用计算机视觉进行野生动物检测的技术日益成熟,克服了传统方法分辨率低,数据传输慢等问题。利用监控相机捕捉野外场景后,将图像传至终端进行分析,利用目标检测算法对场景中的野生动物进行实时定位与分类,通过这一手段,对森林、高原和山谷等地区的野生动物进行有效的检测。例如申请号为201910261788.4的中国专利公开了一种基于多特征图融合的野生动物视频目标检测方法,该专利在进行野生动物检测时,包括获取视频序列图像,提取视频序列图像中每一帧图像的特征图;判断视频序列图像中的相邻帧图像是否满足融合条件;若相邻帧图像满足融合条件,则对相邻帧图像进行特征图融合;对融合后的特征图进行类别与目标框的预测,获得具有目标语义关联信息的最终检测结果。
然而,在野外场景下捕捉到的图像中,野生动物常常成群结队,并且由于物种的差异以及与监控相机的距离,目标间的尺寸差异悬殊,使得采集的野生动物图像中存在着多尺度和多目标的重合问题,从而严重影响了野生动物检测检测精度,使得利用现有技术进行野生动物检测时,检测效果不佳。
发明内容
技术问题:针对采集的野生动物图像中存在着多尺度和多目标的重合,导致野生动物检测的检测精度差的问题,本申请提供一种野生动物检测方法、装置、存储介质及电子设备,从而可以准确地对野生动物进行检测。
技术方案:第一方面,本申请提供一种野生动物检测方法,包括:
将待检测的野生动物图像输入特征提取网络提取特征;
将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行特征融合;
将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
对重叠的预测框进行筛选,输出动物检测结果。
进一步地,所述特征提取网络包括依次连接的CBL模块、第一残差块Res1、第二残差块Res2、第三残差块Res8、第四残差块Res8、第五残差块Res4,所述将待检测的野生动物图像输入特征提取网络提取特征的方法包括:
提取第三残差块Res8输出的第一特征;
提取第四残差块Res8输出的第二特征;
提取第五残差块Res4输出的第三特征。
进一步地,所述的将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行融合的方法包括:
将所述第三特征送入一个CBL模块,得到第四特征;
将所述第四特征送入一个CBL模块,并经过上采样得到第五特征;
将所述第二特征与第五特征进行Concat融合,得到第六特征;
将所述第六特征送入一个CBL模块,并经过上采样得到第七特征;
将所述第七特征与第一特征进行Concat融合,得到第八特征;
将所述第八特征与第一特征进行Add融合,得到第九特征;
将所述第九特征送入一个CBL模块,并经过下采样后,与第二特征及经过一个CBL模块进行处理的第六特征进行Add融合,得到第十特征;
将所述第十特征送入一个CBL模块,并经过下采样后,与第三特征、第四特征进行Add融合,得到第十一特征。
进一步地,在进行特征融合时,给进行融合的特征添加可学习的权重。
进一步地,所述对重叠的预测框进行筛选的,输出动物检测结果的方法包括:
在预测结果中,找出置信度最高的预测框B0,并将置信度小于第一阈值的预测框剔除掉;
计算每组重叠的预测框的合群度;
根据合群度对一组重叠的预测框进行度量,将合群度大于或等于第二阈值的预测框认作当前目标的预测结果,并对该组重叠的预测框进行抑制;将合群度小于第二阈值的预测框认作临近目标的预测结果,并将该组重叠的预测框保留。
进一步地,所述计算一组重叠框的合群度的方法为:
计算每个预测框在一组重叠的预测框中的合群度,计算公式为:
其中,vi表示预测框Bi在一组重叠的预测框中的合群度,si是预测框Bi对应的置信度,DIoU表示预测框Bi与预测框之间的交并比,i表示序号;
根据第三阈值对一组重叠的预测框进行筛选,若预测框的合群度大于或等于第三阈值,则该预测框用于计算该组重叠的预测框的合群度,若预测框的合群度小于第三阈值,则忽略;
计算一组重叠的预测框的合群度的公式为:
其中,表示一组重叠的预测框的合群度,n表示该组重叠的预测框中预测框的个数,Nt表示第三阈值。
进一步地,所述根据合群度对一组重叠的预测框进行度量的公式为:
其中,α表示合群系数,表示第二阈值。
第二方面,提供一种野生动物检测装置,包括:
特征提取单元,用于将待检测的野生动物图像输入特征提取网络进行特征提取;
特征融合单元,用于将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行融合;
映射输出单元,用于将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
筛选输出单元,用于对重叠的预测框进行筛选,输出动物检测结果。
第三方面,提供一种存储介质,其上存储有计算机程序,,所述程序被执行时实现所述方法的步骤。
第四方面,提供一种电子设备,包括:
摄像头,用于采集野生动物图像;
存储器,所述存储器中存储有计算机程序指令;以及
处理器,所述计算机程序指令在被所述处理器运行时使得所述处理器执行所述的野生动物检测方法。
有益效果:本发明与现有技术相比,具有以下优点:
本申请所给出的实施例,在进行特征融合时,充分融合了网络浅层的细节信息和深层的语义信息,优化了模型对多尺度目标的检测效果;通过度量一组重叠预测框的合群度,保留合群度低的预测框,抑制冗余的重叠框,因此会对重叠目标的预测框产生抑制作用,由此避免了检测过程中的漏检问题;因此通过对特征融合及预测框筛选两个方面着手提高,从而有效提高了野生动物的检测精度。
附图说明
图1为本申请实施例中野生动物检测网络模型的架构图;
图2为本申请的实施例中对图像增强后的效果图;
图3为本申请的实施例中野生动物检测方法的流程图;
图4为本申请的实施例中特征融合模块的简化图;
图5为申请的实施例中对预测框进行聚类的效果图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明,其中,术语“第一”、“第二”等仅用于便于描述的目的,而不能理解为对数量等的限制。
如图1示出了本申请中一个实施例用于野生动物检测的神经网络模型架构图,该神经网络模型包括特征提取网络、特征融合网络以及特征映射网络,在将神经网络模型应用于野生动物检测之前,需要对模型进行训练。在本申请的实施例中,训练神经网络模型时,首先构建了野生动物数据集。基于野外场景视频监控系统以及网络资源,收集野生动物图像,建立了包含十四万张野生动物图像的样本数据库,涵盖了187个野生动物类别,其中兽类77类,包括灵长目,鳞甲目,食肉目等;鸟类90类,包括鹈形目,鹳形目,雁形目等。
然后标注图像中的野生动物,保存目标的位置信息(x,y,w,h)和所属类别,其中x,y分别表示目标中心像素点的横纵坐标,w,h分别表示目标区域的宽和高。
并利用所构建的野生动物数据集对模型进行训练和优化。在本申请的实施例中,为了进一步优化模型的学习效果,使用CutOut等算法对训练数据进行增强,提升模型的泛化性能,并且自适应调整学习率以确保网络收敛到最优值,进行增强后部分样本的效果如图2所示。选取迭代过程中验证精度最高的模型作为最终的训练结果,该模型能够实现输入图像与目标位置及类别的高维映射,精确检测出图像中的野生动物。
通过训练好的模型进行野生动物检测,具体的,如图3示出了本申请的一个实施例中进行野生动物检测的流程图,包括:
步骤S1:将待检测的野生动物图像输入特征提取网络提取特征。在本申请的实施例中,特征提取网络基于YOLO v3的网络结构进行构建,包括依次连接的CBL模块、第一残差块Res1、第二残差块Res2、第三残差块Res8、第四残差块Res8、第五残差块Res4。其中,CBL是YOLO v3的基本组件,即卷积+BN+Leaky relu;Res-n代表res_block里含有多少个res_unit,即第一残差块Res1里包含1个res_unit,第二残差块Res2里包含2个res_unit,第三残差块Res8、第四残差块Res8里均包含8个res_unit,第五残差块Res4里包含4个res_unit,对于res_unit可参照resnet网络的结构,为现有技术,本申请中不作赘述。
在提取网络提取特征的方法包括:提取第三残差块Res8输出的第一特征;提取第四残差块Res8输出的第二特征;提取第五残差块Res4输出的第三特征。
步骤S2:将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行特征融合。具体的,在本申请的实施例中,特征融合是通过特征融合网络进行的,结合图1和图4所示,具体进行特征融合的方法为:将第三特征送入一个CBL模块,得到第四特征;将第四特征送入一个CBL模块,并经过上采样得到第五特征;将第二特征与第五特征进行Concat融合,得到第六特征;将第六特征送入一个CBL模块,并经过上采样得到第七特征;将第七特征与第一特征进行Concat融合,得到第八特征;将第八特征与第一特征进行Add融合,得到第九特征;将第九特征送入一个CBL模块,并经过下采样后,与第二特征及经过一个CBL模块进行处理的第六特征进行Add融合,得到第十特征;将第十特征送入一个CBL模块,并经过下采样后,与第三特征、第四特征进行Add融合,得到第十一特征。
本申请的实施例,在进行特征融合时,所给出的融合方法充分融合了网络浅层的细节信息和深层的语义信息,优化了模型对多尺度目标的检测效果。
根据上述特征融合的方法,可以很清晰的得到特征融合网络的结构,因此就不再对特征融合网络进行重复赘述。
在本申请的实施例中,为了表达不同特征的重要程度,模型在对特征进行融合时给进行融合的特征添加了可学习的权重w,优化了多尺度特征的融合效果,如图4示出了本申请的实施方式中,特征融合模块的简化结构图,其中,可以看出,在第四特征与第三特征以及第十特征进行Add融合时,第四特征赋予权重w10、第三特征赋予权重w12,第十特征赋予权重w11;当第五特征与第二特征进行Concat融合时,第四特征赋予权重w1、第二特征赋予权重w2;当第七特征与第一特征进行Concat融合时,第七特征赋予权重w3、第一特征赋予权重w4;当第八特征与第一特征进行Add融合时,第七特征赋予权重w5、第一特征赋予权重w6;在第九特征、第六特征以及第二特征进行Add融合时,第九特征赋予权重w8、第六特征赋予权重w7,第十特征赋予权重w9。所赋予的权重,在进行模型的训练时,能够学习到最优值。
步骤S3:将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度。
在本申请的一个实施例中,特征映射网络采用的是YOLOv3的特征映射网络,可参见图1所示,第九特征、第十特征、第十一特征分别通过一个CBL模块和一个卷积映射输出,最终得到预测框及其对应的类别和置信度。
步骤S4:对重叠的预测框进行筛选,输出动物检测结果。
在本申请的实施例中,对重叠的预测框进行筛选的方法为:
首先,在预测结果中,找出置信度最高的预测框B0,并将置信度小于第一阈值的预测框剔除掉;其中,第一阈值是指置信度的阈值。在步骤S3映射输出映射框对应的置信度后,一方面,很容易找到置信度最高的预测框B0,同时,利用置信度的阈值,过滤掉置信度比较小的预测框。
当预测框Bi与B0交并比较小,但置信度高于邻近的预测框时,需要将它保留下来,此时它很可能是临近目标的检测框。因此,在过滤掉置信度较小的预测框以后,计算每组重叠的预测框的合群度,在本申请中,计算一个预测框在一组重叠的预测框中的合群度,计算公式为:
其中,vi表示预测框Bi在一组重叠的预测框中的合群度,si是预测框Bi对应的置信度,DIoU表示预测框Bi与预测框之间的交并比,i表示序号。由于,并不是每个预测框都符合要求,如果将该组重叠的预测框中每个预测框的合群度均用来计算这组重叠的预测框的合群度,那么可能会因为部分预测框的合群度过分偏离,导致计算的不准确,从而影响预测的准确性,因此需要根据合群度的情况再进行依次筛选。具体的,在本申请的实施例中,根据第三阈值对一组重叠的预测框进行筛选,若预测框的合群度大于或等于第三阈值,则该预测框用于计算该组重叠的预测框的合群度,若预测框的合群度小于第三阈值,则忽略。
计算出该组重叠的预测框的合群度,计算公式为:
其中,表示一组重叠的预测框的合群度,n表示该组重叠的预测框中预测框的个数,Nt表示第三阈值。
最后,根据合群度对一组重叠的预测框进行度量,将合群度大于或等于第二阈值的预测框认作当前目标的预测结果,并对该组重叠的预测框进行抑制;将合群度小于第二阈值的预测框认作临近目标的预测结果,并将该组重叠的预测框保留用作之后的计算。具体的,根据合群度对一组重叠的预测框进行度量的公式为:
其中,α表示合群系数,表示第二阈值,在本申请的一个实施例中,α取0.5。
从上式可以看出,对于合群度大于或等于第二阈值的预测框,可以认为,该预测框与预测结果相同,那么,将该预测框的置信度抑制为0,此时,预测结果选择的是置信度最高的预测框B0;而对于合群度小于第二阈值的预测框,则保留下来,由于在进行野生动物检测时,并不是单一的检测出一个对象,因此将这些预测框保留下来,可以用于之后的计算。图5示出了利用上述方法预测框的聚类效果图,可以看出,利用上述的方法,对预测框的聚类效果比较好。
上述的方法通过度量一组重叠预测框的合群度,保留合群度低的预测框,抑制冗余的重叠框,因此会对重叠目标的预测框产生抑制作用,由此避免了检测过程中的漏检问题,从而有效提高了野生动物的检测精度。
因此,可以看出,利用本申请所提出的方法,从特征融合以及预测框筛选两个方面进行了改进,从而有效地提高了野生动物的检测精度。
为了对本申请所提出的方法的准确性做进一步的验证,本申请将所提出的方法与现有的方法进行对比,具体的,通过将本申请的方法与现有技术中的SSD、RetinaNet、CenterNet、CornerNet进行对比,并以mAP(均值平均精度)、Recall(召回率)、Precision(准确率)、F1 Score(F1得分)、FPS(每秒传输帧数)作为评价指标进行对比评价具体如表1所示:
表1通过评价指标对比检测效果
从表1可以看出,本申请所提出的方法具有相对其他几种方法具有最高的召回率、准确率以及F1得分,并且具有较高的FPS。SSD方法虽然具有最大的FPS,但是其准确率相对其他的方法却比较低;RetinaNet、CenterNet以及CornerNet,虽然具有较好的mAP值,但是他们的FPS却差不多只有SSD的一半,不能达到实时处理的效果。因此,综上可以看出,本申请的实施例中所提供的方法,相对于现有的方法,各项指标都较好,能够对野生动物进行实时准确地检测。当将所提供的方法部署应用时,可以对野生动物进行有效的监管,有利于生态环境的维护。
基于所提出的方法,本申请提供了一种用于野生动检测装置,在本申请的实施例中,该装置包括:
特征提取单元,用于将待检测的野生动物图像输入特征提取网络进行特征提取;
特征融合单元,用于将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行融合;
映射输出单元,用于将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
筛选输出单元,用于对重叠的预测框进行筛选,输出动物检测结果。
该装置中的各单元,与本申请提出的野生动物检测方法的各个相对应,在此处就不再赘述。
本申请还提供一种存储介质,该存储介质中存储有计算机程序,当程序被执行时,能够实现本申请所提出的方法的步骤,例如,作为本申请的一种实施方式,计算机程序被设置为:
将待检测的野生动物图像输入特征提取网络提取特征;
将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行特征融合;
将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
对重叠的预测框进行筛选,输出动物检测结果。
本申请同时提供一种电子设备,在一种实施方式中,该设备包括摄像头、存储器以及处理器,其中摄像头用于采集野生动物图像。
处理器可以为一个或多个,可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器同样可以为一个或多个,存储器可以为各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本申请的实施例中的野生动物检测方法。并且,存储器也可以存储在进行野生动物检测过程中各阶段产生的图像。
本申请的电子设备可以以多种形式存在,例如手机、电脑等设备,也可以专用于野生动物检测的系统存在。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
Claims (5)
1.一种野生动物检测方法,其特征在于,包括:
将待检测的野生动物图像输入特征提取网络提取特征;
将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行特征融合;
将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
对重叠的预测框进行筛选,输出动物检测结果;
所述特征提取网络包括依次连接的CBL模块、第一残差块Res1、第二残差块Res2、第三残差块Res8、第四残差块Res8、第五残差块Res4,所述将待检测的野生动物图像输入特征提取网络提取特征的方法包括:
提取第三残差块Res8输出的第一特征;
提取第四残差块Res8输出的第二特征;
提取第五残差块Res4输出的第三特征;
所述的将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行融合的方法包括:
将所述第三特征送入一个CBL模块,得到第四特征;
将所述第四特征送入一个CBL模块,并经过上采样得到第五特征;
将所述第二特征与第五特征进行Concat融合,得到第六特征;
将所述第六特征送入一个CBL模块,并经过上采样得到第七特征;
将所述第七特征与第一特征进行Concat融合,得到第八特征;
将所述第八特征与第一特征进行Add融合,得到第九特征;
将所述第九特征送入一个CBL模块,并经过下采样后,与第二特征及经过一个CBL模块进行处理的第六特征进行Add融合,得到第十特征;
将所述第十特征送入一个CBL模块,并经过下采样后,与第三特征、第四特征进行Add融合,得到第十一特征;
所述对重叠的预测框进行筛选,输出动物检测结果的方法包括:在预测结果中,找出置信度最高的预测框B0,并将置信度小于第一阈值的预测框剔除掉;计算每组重叠的预测框的合群度;根据合群度对一组重叠的预测框进行度量,将合群度大于或等于第二阈值的预测框认作当前目标的预测结果,并对该组重叠的预测框进行抑制;将合群度小于第二阈值的预测框认作临近目标的预测结果,并将该组重叠的预测框保留;
所述计算每组重叠的预测框的合群度的方法为:计算每个预测框在一组重叠的预测框中的合群度,计算公式为:
其中,vi表示预测框Bi在一组重叠的预测框中的合群度,si是预测框Bi对应的置信度,DIoU表示预测框Bi与预测框之间的交并比,i表示序号;
根据第三阈值对一组重叠的预测框进行筛选,若预测框的合群度大于或等于第三阈值,则该预测框用于计算该组重叠的预测框的合群度,若预测框的合群度小于第三阈值,则忽略;
计算一组重叠的预测框的合群度,计算公式为:
其中,表示一组重叠的预测框的合群度,n表示该组重叠的预测框中预测框的个数,Nt表示第三阈值;
所述根据合群度对一组重叠的预测框进行度量的公式为:
其中,α表示合群系数,表示第二阈值。
2.根据权利要求1所述的方法,其特征在于,在进行特征融合时,给进行融合的特征添加可学习的权重。
3.一种野生动物检测装置,用于实现权利要求1-2任一项所述的野生动物检测方法,其特征在于,包括:
特征提取单元,用于将待检测的野生动物图像输入特征提取网络进行特征提取;
特征融合单元,用于将提取到的特征与自底向下路径中对应的特征通过跳跃连接方式进行融合;
映射输出单元,用于将融合后的特征进行映射输出,得到预测框及其对应的类别和置信度;
筛选输出单元,用于对重叠的预测框进行筛选,输出动物检测结果。
4.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被执行时实现权利要求1-2任一项所述方法的步骤。
5.一种电子设备,其特征在于,包括:
摄像头,用于采集野生动物图像;
存储器,所述存储器中存储有计算机程序指令;以及
处理器,所述计算机程序指令在被所述处理器运行时使得所述处理器执行权利要求1-2任一项所述的野生动物检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110280866.2A CN112966762B (zh) | 2021-03-16 | 2021-03-16 | 一种野生动物检测方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110280866.2A CN112966762B (zh) | 2021-03-16 | 2021-03-16 | 一种野生动物检测方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966762A CN112966762A (zh) | 2021-06-15 |
CN112966762B true CN112966762B (zh) | 2023-12-26 |
Family
ID=76277881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110280866.2A Active CN112966762B (zh) | 2021-03-16 | 2021-03-16 | 一种野生动物检测方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966762B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435425B (zh) * | 2021-08-26 | 2021-12-07 | 绵阳职业技术学院 | 一种基于递归多特征融合的野生动物出没检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815886A (zh) * | 2019-01-21 | 2019-05-28 | 南京邮电大学 | 一种基于改进YOLOv3的行人和车辆检测方法及系统 |
CN109977943A (zh) * | 2019-02-14 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种基于yolo的图像目标识别方法、系统和存储介质 |
CN111767792A (zh) * | 2020-05-22 | 2020-10-13 | 上海大学 | 一种基于教室场景的多人关键点检测网络和方法 |
CN111783749A (zh) * | 2020-08-12 | 2020-10-16 | 成都佳华物链云科技有限公司 | 一种人脸检测方法、装置、电子设备及存储介质 |
CN112132025A (zh) * | 2020-09-23 | 2020-12-25 | 平安国际智慧城市科技股份有限公司 | 应急车道图像处理方法、装置、计算机设备及存储介质 |
CN112287788A (zh) * | 2020-10-20 | 2021-01-29 | 杭州电子科技大学 | 基于改进YOLOv3和改进NMS的行人检测方法 |
CN112417974A (zh) * | 2020-10-23 | 2021-02-26 | 西安科锐盛创新科技有限公司 | 一种公共卫生监控方法 |
-
2021
- 2021-03-16 CN CN202110280866.2A patent/CN112966762B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815886A (zh) * | 2019-01-21 | 2019-05-28 | 南京邮电大学 | 一种基于改进YOLOv3的行人和车辆检测方法及系统 |
CN109977943A (zh) * | 2019-02-14 | 2019-07-05 | 平安科技(深圳)有限公司 | 一种基于yolo的图像目标识别方法、系统和存储介质 |
WO2020164282A1 (zh) * | 2019-02-14 | 2020-08-20 | 平安科技(深圳)有限公司 | 基于yolo的图像目标识别方法、装置、电子设备和存储介质 |
CN111767792A (zh) * | 2020-05-22 | 2020-10-13 | 上海大学 | 一种基于教室场景的多人关键点检测网络和方法 |
CN111783749A (zh) * | 2020-08-12 | 2020-10-16 | 成都佳华物链云科技有限公司 | 一种人脸检测方法、装置、电子设备及存储介质 |
CN112132025A (zh) * | 2020-09-23 | 2020-12-25 | 平安国际智慧城市科技股份有限公司 | 应急车道图像处理方法、装置、计算机设备及存储介质 |
CN112287788A (zh) * | 2020-10-20 | 2021-01-29 | 杭州电子科技大学 | 基于改进YOLOv3和改进NMS的行人检测方法 |
CN112417974A (zh) * | 2020-10-23 | 2021-02-26 | 西安科锐盛创新科技有限公司 | 一种公共卫生监控方法 |
Non-Patent Citations (1)
Title |
---|
study on the evaluation method of sound phase cloud maps based on an improved yolov4 algorithm;Qinfeng Zhu et al;《sensors》;第20卷(第15期);1-18 * |
Also Published As
Publication number | Publication date |
---|---|
CN112966762A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875548B (zh) | 人物轨迹生成方法及装置、存储介质、电子设备 | |
CN109086811B (zh) | 多标签图像分类方法、装置及电子设备 | |
CN111401201A (zh) | 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法 | |
CN109902202B (zh) | 一种视频分类方法及装置 | |
CN109977895B (zh) | 一种基于多特征图融合的野生动物视频目标检测方法 | |
KR102328734B1 (ko) | 이미지를 분석하기 위해, 딥러닝 네트워크에 이용하기 위한 트레이닝 이미지에 대한 라벨링 신뢰도를 자동으로 평가하기 위한 방법 및 이를 이용한 신뢰도 평가 장치 | |
CN110689021A (zh) | 一种基于深度学习的低可见度环境下实时目标检测方法 | |
CN111275040B (zh) | 定位方法及装置、电子设备、计算机可读存储介质 | |
CN111553182A (zh) | 一种船只检索方法、装置及电子设备 | |
CN116681957B (zh) | 一种基于人工智能的图像识别方法及计算机设备 | |
CN111815576B (zh) | 金属部件腐蚀状况检测方法、装置、设备和存储介质 | |
CN113592007A (zh) | 一种基于知识蒸馏的不良图片识别系统、方法、计算机及存储介质 | |
CN112232971A (zh) | 反欺诈检测方法、装置、计算机设备和存储介质 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN112966762B (zh) | 一种野生动物检测方法、装置、存储介质及电子设备 | |
CN111178367A (zh) | 适应多物件尺寸的特征决定装置及方法 | |
CN111695572A (zh) | 一种基于卷积层特征提取的船只检索方法及装置 | |
CN111898418A (zh) | 一种基于t-tiny-yolo网络的人体异常行为检测方法 | |
CN114612659A (zh) | 一种基于融合模态对比学习的电力设备分割方法及系统 | |
CN113239883A (zh) | 分类模型的训练方法、装置、电子设备以及存储介质 | |
CN113269038A (zh) | 一种基于多尺度的行人检测方法 | |
CN116467485A (zh) | 一种视频图像检索构建系统及其方法 | |
CN111832351A (zh) | 一种事件检测方法、装置和计算机设备 | |
CN115588150A (zh) | 基于改进YOLOv5-L的宠物犬视频目标检测方法及系统 | |
CN114743048A (zh) | 检测异常秸秆图片的方法和检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |