CN114937266A - 一种基于yolox-s的硬壳蛤生物体征识别方法 - Google Patents

一种基于yolox-s的硬壳蛤生物体征识别方法 Download PDF

Info

Publication number
CN114937266A
CN114937266A CN202210451007.XA CN202210451007A CN114937266A CN 114937266 A CN114937266 A CN 114937266A CN 202210451007 A CN202210451007 A CN 202210451007A CN 114937266 A CN114937266 A CN 114937266A
Authority
CN
China
Prior art keywords
hard shell
yolox
clam
image
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210451007.XA
Other languages
English (en)
Inventor
张涛
姜永成
吴海云
李永仁
任东悦
王亚鑫
华秀萍
郭永军
卫勇
单慧勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Oceanology of CAS
Tianjin Agricultural University
Original Assignee
Institute of Oceanology of CAS
Tianjin Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Oceanology of CAS, Tianjin Agricultural University filed Critical Institute of Oceanology of CAS
Priority to CN202210451007.XA priority Critical patent/CN114937266A/zh
Publication of CN114937266A publication Critical patent/CN114937266A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于YOLOX‑S的硬壳蛤生物体征识别方法,包括以下步骤:S1、采集硬壳蛤图像构建数据集;S2、对YOLOX‑S模型进行改进,加入CBAM注意力机制;S3、输入待检测硬壳蛤图像,利用改进后的YOLOX‑S模型进行训练;S4、根据训练模型,输出预测图像,检测完成。本发明有益效果:利用机器视觉方法,实现硬壳蛤生物体征的快速识别,相较于传统人工方法,可以有效提高检测效率,减小人工误差;通过对传统的YOLOX‑S算法进行改进,通过加入CBAM注意力机制,有较好的检测效果。

Description

一种基于YOLOX-S的硬壳蛤生物体征识别方法
技术领域
本发明属于图像识别领域,尤其是涉及一种基于YOLOX-S的硬壳蛤生物体征识别方法。
背景技术
硬壳蛤,原分布于美国东海岸,属于一种埋栖型贝类。由于其适应能力强、味道鲜美、营养价值高、生长速度快,已成为我国浅海滩涂和池塘养殖的主要品种之一。近年来,随着人们生活水平的不断提高,对硬壳蛤的需求量不断增加,硬壳蛤苗供不应求。因此,工厂化人工育苗工作在国内大量开展。在硬壳蛤育苗过程中,硬壳蛤苗的生物学特征,如存活率、数量以及长宽尺寸等是蛤苗的重要品质指标。然而,目前的水产养殖产业领域中,硬壳蛤的养殖为粗放型养殖,对技术和管理要求不高,市场上每次交易的硬壳蛤苗数据巨大,传统的蛤苗计数方式仅仅通过人工称重方式,粗略计数,对蛤苗的存活状态往往依靠经验肉眼评估。人工评估方式极易引起误差,影响对蛤苗的品质的判断。
发明内容
有鉴于此,本发明旨在提出一种基于YOLOX-S的硬壳蛤生物体征识别方法,以至少解决背景技术中的至少一个问题。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于YOLOX-S的硬壳蛤生物体征识别方法,包括以下步骤:
S1、采集硬壳蛤图像构建数据集;
S2、对YOLOX-S模型进行改进,加入CBAM注意力机制;
S3、输入待检测硬壳蛤图像,利用改进后的YOLOX-S模型进行训练;
S4、根据训练模型,输出预测图像,检测完成。
进一步的,在步骤S1中,采集方法为:取硬壳蛤苗至载玻片上,在显微镜下拍摄采集图像构建成数据集,将数据集分为训练集、测试集和验证集。
进一步的,在步骤S2中,添加4个注意力机制模块,在主干网络提取出来的三个有效特征层增加了注意力机制,同时再对采样后的结果增加注意力机制。
进一步的,在步骤S3中,输入待检测硬壳蛤图像,选择使用VOC格式对改进后的YOLOX-S模型进行训练,处理的图片主要包含三个文件夹,其中Annotations存放的是xml标签数据,JPEGImages存放的是图片数据,ImageSets存放的是训练、验证、测试的txt文件。
进一步的,在步骤S1中,具体步骤如下:根据原始数据集中的硬壳蛤,使用Mosaic、MixUp、CutOut进行旋转、平移、增强对比度等数据增强的方法将初始的数据集数据进行分析扩充,然后对其进行标注,标注类别分为health健康和death死亡;然后将原始数据集图像的分辨率大小设置成一致,再与原始的图像数据的标签进行匹配,得到标注后的硬壳蛤识别图像和存活状态标签作为数据集。
进一步的,在步骤S2中,具体步骤如下:利用改进后的YOLOX-S模型的卷积神经网络对输入的训练集的硬壳蛤图像进行不同大小的卷积运算,在主干网络CSPDarknet后生成三个有效特征层,然后分别加入注意力机制模块,同时再针对采样后的结果加入注意力机制,加入的注意力机制均为CBAM模块。
进一步的,通过预测锚框数量的计算,实现硬壳蛤数量的计算,通过健康蛤像素值之间的距离绝对值相减实现硬壳蛤的长宽计算;
卷积神经网络结构包括:
局部卷积阶段,包括一维的卷积和池化等操作,利用YOLO卷积神经网络速度快的特点,对数据集图像的对比度增强处理和硬壳蛤死活特征的标记操作;
全局卷积阶段,包括YOLOX-S卷积神经网络的卷积与池化操作,对包含标记区域的硬壳蛤图像进行特征提取,再在传输到网络末层的全连接层进行最后的识别处理。
第二方面本方案公开了一种电子设备,包括处理器以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,所述处理器用于执行第一方面所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
第三方面本方案公开了一种服务器,包括至少一个处理器,以及与所述处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述处理器执行,以使所述至少一个处理器执行第一方面所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
第四方面本方案公开了一种计算机可读取存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
相对于现有技术,本发明所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法具有以下有益效果:
1、利用机器视觉方法,实现硬壳蛤生物体征(存活率、数量以及长宽)的快速识别,相较于传统人工方法,可以有效提高检测效率,减小人工误差。
2、通过对传统的YOLOX-S算法进行改进,通过加入CBAM注意力机制,有较好的检测效果。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明中的基于YOLOX-S模型的硬壳蛤生物体征识别方法的流程图;
图2为本发明中改进后YOLOX-S网络结构的结构示意图;
图3为本发明中的基于YOLOX-S模型的硬壳蛤生物体征识别方法的网络训练损失曲线图。
图4为本发明实验中YOLOX-S算法中健康硬壳蛤的P、R曲线图。
图5为本发明实验中YOLOX-S算法中死亡硬壳蛤的P、R曲线图。
图6为本发明实验中YOLOX-S算法中硬壳蛤的mAP曲线图。
图7为本发明中的实例检测结果图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
本发明提供了一种基于YOLOX-S的硬壳蛤生物体征,包括存活率、数量以及长宽识别方法。该方法实现了对硬壳蛤的存活率、数量和长宽的快速检测。避免了人工检测的误差,提高了水产养殖的智能化水平。
为了达到上述目的,所采用的技术方案是:一种基于YOLOX-S模型的硬壳蛤存活率、数量和长宽的识别方法,具体步骤如下:
S1、采集硬壳蛤图像构建数据集,具体的,取适量硬壳蛤苗至载玻片上,在显微镜下拍摄采集图像,构建数据集,图像大小为1280×720。数据集分为训练集、测试集和验证集。
S2、对YOLOX-S模型进行改进,加入CBAM注意力机制。本次模型改进一共添加了4个注意力机制模块,在主干网络提取出来的三个有效特征层增加了注意力机制,同时对上采样后的结果增加了注意力机制。
S3、输入待检测硬壳蛤图像,选择使用VOC格式对改进后的YOLOX-S进行训练,处理的图片主要包含三个文件夹,其中Annotations存放的是xml标签数据,JPEGImages存放的是图片数据,ImageSets存放的是训练、验证、测试的txt文件。
S4、根据训练模型,输出预测图像,检测完成。
上述的步骤S1包括以下步骤:
根据原始数据集中的硬壳蛤,使用Mosaic、MixUp、CutOut进行旋转、平移、增强对比度等数据增强的方法将初始的数据集数据进行分析扩充,然后对其进行标注,标注类别分为health(健康)和death(死亡);然后将原始数据集图像的分辨率大小设置成一致,同样的,与原始的图像数据的标签进行匹配,得到标注后的硬壳蛤识别图像和存活状态标签作为数据集。另一方面,所提到的数据集分为训练集和测试集,测试集用来测试硬壳蛤识别模型的精确性和鲁棒性。
所述的步骤S2包括以下步骤:
改进后的YOLOX-S模型的卷积神经网络对输入的训练集的硬壳蛤图像进行不同大小的卷积运算,在主干网络CSPDarknet后生成三个有效特征层,然后分别加入注意力机制模块,同时在上采样后的结果加入注意力机制,加入的注意力机制均为CBAM模块。
CBAM是将通道注意力与空间注意力机制进行了一个有效的结合,通道注意力机制的实现可以分为两个部分,对输入进来的单个特征层,分别进行全局平均池化和全局最大池化。之后对平均池化和最大池化的结果,利用共享的全连接层进行处理,对处理后的两个结果进行相加,然后取一个sigmoid,获得输入特征层每一个通道的权值(0-1之间)。在获得这个权值后,将这个权值乘上原输入特征层即可,这是上半部分通道注意力机制的远离过程。
CBAM的下半部分为空间注意力机制,对输入进来的特征层,在每一个特征点的通道上取最大值和平均值。之后将这两个结果进行一个堆叠,利用一次通道数为1的卷积调整通道数,然后取一个sigmoid,获得输入特征层每一个特征点的权值(0-1之间)。在获得这个权值后,将这个权值乘上原输入特征层即可。
所述的步骤S3包括以下步骤:
其中,所述的YOLOX网络结构分为三个部分,分别是主干特征提取网络CSPDarknet、加强特征提取网络FPN以及分类器与回归器YOLO head。首先,输入的图片会在CSPDarknet里面进行特征提取,提取到的特征可被称作特征层,是输入图片的特征集合。在主干部分,获取了三个特征层进行下一步网络的构建,这三个特征层称之为有效特征层;还使用了Focus网络结构,具体操作是在一张图片中每隔一个像素拿到一个值,这个时候获得了四个独立的特征层,然后将四个独立的特征层进行堆叠,此时宽高信息就集中到了通道信息,输入通道扩充了四倍;再经过卷积和一系列的残差结构。残差分为主干分支,侧分支,其中主干分支是1*1的一个卷积,再进行3*3的卷积操作,残差便不做处理,直接相加。其中的BN层,就相当于在Resnet中的残差,很好的缓解了退化问题,以及深度加深带来的梯度消失,梯度爆炸的问题。FPN即YOLOX-S的加强特征提取网络,在主干部分获得的三个有效特征层会在这一部分进行特征融合,目的是结合不同尺度的特征信息。在FPN部分,已经获得的有效特征层被用于继续提取特征。所述的YOLO Head是YOLOX-S的分类器与回归器,通过CSPDarknet和FPN,获得三个加强过的有效特征层。每一个特征层都有宽、高和通道数,将特征图看作一个又一个特征点的集合,每一个特征点都有通道数个特征。YOLO head对特征点进行判断,判断特征点是否有物体与其对应。因此,整个YOLOX-S网络所做的工作就是特征提取-特征加强-预测特征点对应的物体情况。
进一步的一种基于YOLOX-S的硬壳蛤数量、长宽与存活率识别方法,首先通过预测锚框数量的计算,实现硬壳蛤数量的计算。硬壳蛤识别为2分类问题,故设置其0为健康蛤,1为死亡蛤,从而实现其存活率的判断。长宽计算则是通过健康蛤像素值之间的距离绝对值相减实现的。其卷积神经网络结构包括:
(1)局部卷积阶段,包括一维的卷积和池化等操作,利用YOLO卷积神经网络速度快的特点,对数据集图像的对比度增强处理和硬壳蛤死活特征的标记操作。
(2)全局卷积阶段,包括YOLOX-S卷积神经网络的卷积与池化操作,对包含标记区域的硬壳蛤图像进行特征提取,再在传输到网络末层的全连接层进行最后的识别处理。
本发明提供一种基于YOLOX-S算法的硬壳蛤存活率、数量以及长宽识生物体征的别方法。图1所示是本发明的总体流程示意图,本申请包括以下步骤:
针对硬壳蛤的生物体征识别问题主要面临以下两项挑战:首先是显微镜下图像会因其自身光源以及所在环境的光线问题导致光照不均,为目标检测任务的执行增加了困难;第二是图像采集是在硬壳蛤处于大多数活性的状态,且在水中流动性强,采集的图像就会出现边缘化以及交叠,在目标检测时可能会产生候选框重叠问题。
S1、读入数据集中的图像,对图像进行分块阈值,可解决光照不均分割不足的问题。通过判断类间灰度差以排除纯背景或纯物体的干扰。
本步骤主要是针对上述的第一个挑战,解决显微镜下图像光照不均的问题。本发明采用分块阈值进行分割的方法对图像进行预处理,通过将图像分割成若干块,分别进行阈值分割,可以在一定程度上解决光照或反射造成的不均匀影响。选择的块要足够小,以便每个块的光照都近似均匀的,这样自动阈值时,在高灰度区域就会用高阈值分割,在低灰度区域就会用低阈值分割。本实施例中分块与硬壳蛤大小相当,分完块之后按块进行全局阈值法处理,但是需要注意的是有的块中只有背景,这个时候需要进行判断,排除对这种块的处理。用otsu方法中提到的可分性度量:
Figure BDA0003618618390000081
在计算出各个块的可分性度量之后,发现区分效果并不是很好,通过分析最大类间方差法,用分割阈值处的类间平均灰度差判断图像块的可分性,当图像中只有背景或只有物体时,由于灰度值比较接近,则用otsu法算出的“背景”和“前景”平均灰度差(类间灰度差)会很小,当块中只有背景时,平均灰度差与有物体时相差很大,选取特征区分效果很好。之后仅对既有物体又有背景的块进行自动阈值处理、二值化、填充孔洞,可以将每个硬壳蛤都被很好的分割出来,有效的解决了光线不均的问题。
S2、本步骤主要是针对上述的第二个挑战,采集的图像出现边缘化以及交叠,在目标检测时可能会产生候选框重叠的问题。
具体地,目标检测的过程中在同一目标的位置上会产生大量的候选框,这些候选框相互之间可能会有重叠,此时需要利用非极大值抑制找到最佳的目标边界框,消除冗余的边界框。非极大值抑制的流程如下:根据置信度得分进行排序、选择置信度最高的比边界框添加到最终输出列表中,将其从边界框列表中删除、计算所有边界框的面积、计算置信度最高的边界框与其它候选框的IoU、删除IoU大于阈值的边界框、重复上述过程,直至边界框列表为空。
具体解决办法就是减小IoU threshold(IoU阈值)。
S3、制作带有标注的硬壳蛤图像数据集;
所述的步骤S3包括以下步骤:
取适量硬壳蛤苗至载玻片上,在显微镜下拍摄采样1200张图像构建数据集,图像大小为1280×720。数据集按照8:1:1比例分为训练集、测试集、验证集三个部分。根据原始的数据集中的硬壳蛤,使用Mosaic、MixUp、CutOut进行旋转、平移、增强对比度等数据增强的方法将初始的数据集数据进行分析扩充,然后对其进行标注,数据集图像用LabelImg标注出目标区域以及类别,样本标签类别分为两类:health,表示目标区域为活的蛤苗;death,表示目标区域为死亡蛤苗。然后将原始数据集图像的分辨率大小设置成一致,同样的,与原始的图像数据的标签进行匹配,得到标注后的硬壳蛤识别图像和存活状态标签作为数据集。
S4、使用改进后的YOLOX-S模型的卷积神经网络提取数据集中硬壳蛤的多尺度特征,并训练硬壳蛤识别模型。改进后YOLOX-S网络结构如图2所示。
所述的步骤S4包括以下步骤:
改进后的YOLOX-S模型的卷积神经网络对输入的训练集的硬壳蛤图像进行不同大小的卷积运算,形成硬壳蛤图像的不同尺度的特征图,利用卷积神经网络学习硬壳蛤图像不同尺度的特征,实现对硬壳蛤多个尺度的检测。
S5、输入待检测硬壳蛤图像,选择使用VOC格式对YOLOX-S进行训练,处理的图片主要包含三个文件夹,其中Annotations存放的是xml标签数据,JPEGImages存放的是图片数据,ImageSets存放的是训练、验证、测试的txt文件。
所述的步骤S5包括以下步骤:
其中,所述的YOLOX网络结构分为三个部分,分别是主干特征提取网络CSPDarknet、加强特征提取网络FPN以及分类器与回归器YOLO head。首先,输入的图片会在CSPDarknet里面进行特征提取,提取到的特征可被称作特征层,是输入图片的特征集合。在主干部分,获取了三个特征层进行下一步网络的构建,这三个特征层称之为有效特征层;还使用了Focus网络结构,具体操作是在一张图片中每隔一个像素拿到一个值,获得了四个独立的特征层,然后将四个独立的特征层进行堆叠,此时宽高信息就集中到了通道信息,输入通道扩充了四倍;再经过卷积和一系列的残差结构。残差分为主干分支,侧分支,其中主干分支是1*1的一个卷积,再进行3*3的卷积操作,残差便不做处理,直接相加。其中的BN层,就相当于在Resnet中的残差,很好的缓解了退化问题,以及深度加深带来的梯度消失,梯度爆炸的问题。FPN即YOLOX-S的加强特征提取网络,在主干部分获得的三个有效特征层会在这一部分进行特征融合,目的是结合不同尺度的特征信息。在FPN部分,已经获得的有效特征层被用于继续提取特征,可以将不同shape的特征层进行特征融合,从下到上进行特征融合,在进行下采样,分别输出三个YOLO Head。其中特征提取部分分别提取中间层(80,80,256),中下层(40,40,512),底层(20,20,1024)。YOLO Head是YOLOX-S的分类器与回归器,通过CSPDarknet和FPN,获得三个加强过的有效特征层。每一个特征层都有宽、高和通道数,此时将特征图看作一个又一个特征点的集合,每一个特征点都有通道数个特征。所述的分类器与回归器YOLO head获得三个加强特征,这三个加强特征的shape分别为(20,20,1024)、(40,40,512)、(80,80,256),然后利用这三个shape的特征层传入YOLO Head获得预测结果。
进一步的一种基于YOLOX-S的硬壳蛤存活率、数量以及长宽识别方法,其卷积神经网络结构包括:
局部卷积阶段,包括一维的卷积和池化等操作,利用YOLO卷积神经网络速度快的特点,对数据集图像的对比度增强处理和硬壳蛤死活特征的标记操作。
全局卷积阶段,包括YOLOX-S卷积神经网络的卷积与池化操作,对包含标记区域的硬壳蛤图像进行特征提取,再在传输到网络末层的全连接层进行最后的识别处理。
S6、根据训练模型,输出预测图像,检测完成。
实验例:
在本实例中,采集了硬壳蛤苗图片,并对获取的数据集图片进行翻转、图像增强等处理,数据集图像用LabelImg标注出目标区域以及类别,得到标注后的硬壳蛤识别图像和存活状态标签,制成标准的VOC数据集格式。将构建的数据集以8:1:1比例随机划分为训练集、测试集和验证集。
对YOLOX-S模型进行改进,加入4个CBAM注意力机制,将改进后的YOLOX-S算法在pytorch框架下进行训练,输入的图片格式统一为1280×720,并经过Mosaic数据增强,经过150个周期后,请参阅附图3所示,训练集损失最终在1.42左右达到收敛,说明此算法的结果是可信的。
利用精准率(P)、召回率(R)与F1评估YOLOX-S算法。请参阅附图4,附图5,附图4为YOLOX-S算法中健康硬壳蛤的P、R曲线图,附图5为YOLOX-S算法中死亡硬壳蛤的P、R曲线图,其中精确率(Precision)、召回率(Recall)和F1的值越高,说明模型的性能越好,其计算公式如下:
Figure BDA0003618618390000111
Figure BDA0003618618390000112
Figure BDA0003618618390000121
式中:TP是正确识别,FP是错误识别,FN是遗漏识别的测试样本图像数量,单位:张。
平均精度AP(average precision)衡量模型在每个类别上训练的好坏,类平均精度mAP(Mean Average Precision)衡量训练出来的模型在所有类别上的好坏,其中AP和mAP计算公式如下:
Figure BDA0003618618390000122
Figure BDA0003618618390000123
利用AP公式求出mAP,其中r1,r2......rn是按升序排列的Precison插值处对应的Recall值,所有类别的AP就是mAP。
本实施例中,附图6为YOLOX-S算法中硬壳蛤的mAP的曲线图,附图7为本发明中的实例检测结果图,模型对硬壳蛤的存活状态识别类平均精度可达95.86%。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于,包括以下步骤:
S1、采集硬壳蛤图像构建数据集;
S2、对YOLOX-S模型进行改进,加入CBAM注意力机制;
S3、输入待检测硬壳蛤图像,利用改进后的YOLOX-S模型进行训练;
S4、根据训练模型,输出预测图像,检测完成。
2.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于,在步骤S1中,采集方法为:取硬壳蛤苗至载玻片上,在显微镜下拍摄采集图像构建成数据集,将数据集分为训练集、测试集和验证集。
3.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于:在步骤S2中,添加4个注意力机制模块,在主干网络提取出来的三个有效特征层增加了注意力机制,同时再对采样后的结果增加注意力机制。
4.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于:在步骤S3中,输入待检测硬壳蛤图像,选择使用VOC格式对改进后的YOLOX-S模型进行训练,处理的图片主要包含三个文件夹,其中Annotations存放的是xml标签数据,JPEGImages存放的是图片数据,ImageSets存放的是训练、验证、测试的txt文件。
5.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于,在步骤S1中,具体步骤如下:根据原始数据集中的硬壳蛤,使用Mosaic、MixUp、CutOut进行旋转、平移、增强对比度等数据增强的方法将初始的数据集数据进行分析扩充,然后对其进行标注,标注类别分为health健康和death死亡;然后将原始数据集图像的分辨率大小设置成一致,再与原始的图像数据的标签进行匹配,得到标注后的硬壳蛤识别图像和存活状态标签作为数据集。
6.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于,在步骤S2中,具体步骤如下:利用改进后的YOLOX-S模型的卷积神经网络对输入的训练集的硬壳蛤图像进行不同大小的卷积运算,在主干网络CSPDarknet后生成三个有效特征层,然后分别加入注意力机制模块,同时再针对采样后的结果加入注意力机制,加入的注意力机制均为CBAM模块。
7.根据权利要求1所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法,其特征在于,通过预测锚框数量的计算,实现硬壳蛤数量的计算,通过健康蛤像素值之间的距离绝对值相减实现硬壳蛤的长宽计算;
卷积神经网络结构包括:
局部卷积阶段,包括一维的卷积和池化等操作,利用YOLO卷积神经网络速度快的特点,对数据集图像的对比度增强处理和硬壳蛤死活特征的标记操作;
全局卷积阶段,包括YOLOX-S卷积神经网络的卷积与池化操作,对包含标记区域的硬壳蛤图像进行特征提取,再在传输到网络末层的全连接层进行最后的识别处理。
8.一种电子设备,包括处理器以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,其特征在于:所述处理器用于执行上述权利要求1-7任一所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
9.一种服务器,其特征在于:包括至少一个处理器,以及与所述处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述处理器执行,以使所述至少一个处理器执行如权利要求1-7任一所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
10.一种计算机可读取存储介质,存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7任一项所述的一种基于YOLOX-S的硬壳蛤生物体征识别方法。
CN202210451007.XA 2022-04-24 2022-04-24 一种基于yolox-s的硬壳蛤生物体征识别方法 Pending CN114937266A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210451007.XA CN114937266A (zh) 2022-04-24 2022-04-24 一种基于yolox-s的硬壳蛤生物体征识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210451007.XA CN114937266A (zh) 2022-04-24 2022-04-24 一种基于yolox-s的硬壳蛤生物体征识别方法

Publications (1)

Publication Number Publication Date
CN114937266A true CN114937266A (zh) 2022-08-23

Family

ID=82863251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210451007.XA Pending CN114937266A (zh) 2022-04-24 2022-04-24 一种基于yolox-s的硬壳蛤生物体征识别方法

Country Status (1)

Country Link
CN (1) CN114937266A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880646A (zh) * 2023-02-20 2023-03-31 中国民航大学 一种飞机入离位状态识别方法
CN117746463A (zh) * 2023-12-20 2024-03-22 脉得智能科技(无锡)有限公司 体征信息识别方法、系统和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880646A (zh) * 2023-02-20 2023-03-31 中国民航大学 一种飞机入离位状态识别方法
CN117746463A (zh) * 2023-12-20 2024-03-22 脉得智能科技(无锡)有限公司 体征信息识别方法、系统和电子设备

Similar Documents

Publication Publication Date Title
JP7496389B2 (ja) 画像解析方法、装置、プログラムおよび学習済み深層学習アルゴリズムの製造方法
CN111931684B (zh) 一种基于视频卫星数据鉴别特征的弱小目标检测方法
CN110956185B (zh) 一种图像显著目标的检测方法
CN111178197B (zh) 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法
CN109409365A (zh) 一种基于深度目标检测的待采摘水果识别和定位方法
CN108334848A (zh) 一种基于生成对抗网络的微小人脸识别方法
CN108288271A (zh) 基于三维残差网络的图像检测系统及方法
CN108596046A (zh) 一种基于深度学习的细胞检测计数方法及系统
CN107292298A (zh) 基于卷积神经网络和分类器模型的牛脸识别方法
CN108288506A (zh) 一种基于人工智能技术的癌症病理辅助诊断方法
CN108564085B (zh) 一种自动读取指针式仪表读数的方法
CN114937266A (zh) 一种基于yolox-s的硬壳蛤生物体征识别方法
CN108520273A (zh) 一种基于目标检测的稠密小商品快速检测识别方法
CN113574534A (zh) 使用基于距离的相似性标签的机器学习
CN111626993A (zh) 一种基于嵌入式FEFnet网络的图像自动检测计数方法及系统
CN109242826B (zh) 基于目标检测的移动设备端签状物根数计数方法及系统
CN114067444A (zh) 基于元伪标签和光照不变特征的人脸欺骗检测方法和系统
CN109543585A (zh) 基于卷积神经网络的水下光学目标检测与识别方法
CN114140665A (zh) 一种基于改进YOLOv5的密集小目标检测方法
CN116311310A (zh) 一种结合语义分割和序列预测的通用表格识别方法和装置
CN115272791B (zh) 一种基于YoloV5的茶叶用多目标检测定位方法
CN112926652A (zh) 一种基于深度学习的鱼类细粒度图像识别方法
Shihavuddin et al. Automated classification and thematic mapping of bacterial mats in the north sea
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及系统
CN109800616A (zh) 一种基于图像特征的二维码定位识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination