CN113420759A - 一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 - Google Patents
一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 Download PDFInfo
- Publication number
- CN113420759A CN113420759A CN202110653176.7A CN202110653176A CN113420759A CN 113420759 A CN113420759 A CN 113420759A CN 202110653176 A CN202110653176 A CN 202110653176A CN 113420759 A CN113420759 A CN 113420759A
- Authority
- CN
- China
- Prior art keywords
- dead fish
- feature
- scale
- features
- occlusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000251468 Actinopterygii Species 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 230000003044 adaptive effect Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000005728 strengthening Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 4
- 230000002401 inhibitory effect Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 230000001154 acute effect Effects 0.000 claims description 2
- 230000004927 fusion Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 1
- 230000008859 change Effects 0.000 abstract description 5
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于深度学习的抗遮挡与多尺度死鱼识别系统和方法,针对死鱼识别背景复杂、尺度变化大与遮挡等难点,对FasterRCNN识别模型进行了改进,以适应复杂水下环境的死鱼识别场景。本发明首先对待识别图像进行对比度受限的自适应直方图均衡处理,增强目标局部对比度;其次设计多尺度特征增强模块以处理大尺度范围的死鱼识别问题,并基于注意力机制设计抗遮挡模块,高亮目标区域,排除其他噪声等背景干扰;最终利用旋转矩形框表征死鱼目标,大幅提升了密集场景下死鱼的识别精度。
Description
技术领域
本发明涉及一种图像识别的应用技术领域,特别涉及水下死鱼识别技术,具体是一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法。
背景技术
在鱼类养殖过程中,由于养殖水体中存在细菌、寄生虫,或者养殖密度过大水体流动性不好导致氧浓度不够等原因,养殖过程中难免会发生鱼类死亡。鱼类死亡后先沉入水底,内脏器官发酵产生气体后浮上水面,在这个过程中死鱼在养殖网箱中的移动可能与其他活鱼接触或者被活鱼分食而导致病菌扩散。为了防止该问题发生,急需设计一种死鱼识别方法,能及时给出死鱼上浮之前的位置、数量等信息,为后续死鱼的提前清理与收集提供依据。
传统死鱼识别方法通常借助人工干预,但其智能化水平低,极大增加了人力物力。随着人工智能和深度学习的快速发展,图像目标识别技术应用越来越广,出现了FasterRCNN与YOLO等经典的识别模型,然而,这些方法均针对水上环境进行设计。《一种基于深度卷积神经网络的死鱼识别方法及预警系统》将原始Faster RCNN模型直接迁移到水下死鱼识别上。《基于图像识别的养殖鱼监控方法及系统》则直接将YOLO模型运用到鱼类识别上。上述方法均直接套用了现有模型,没有考虑并针对性解决以下四个方面的实际难题和因素,造成识别准确率低:(1)水下图像通常具有低对比度、低亮度等特点,与水上图像存在较大差异,无法直接迁移;(2)死鱼沉入水底后会出现死鱼之间或死鱼与活鱼之间的类内遮挡,同时死鱼也会被水草等干扰,出现类间遮挡,导致提取的识别特征容易被污染;(3)由于死鱼的类别、体积等差异,造成死鱼尺度变化范围大;(4)Faster RCNN等方法均采用水平矩形框表示目标位置,然而由于死鱼体态一般分布在不同方向,水平矩形框会包含大量无用背景信息,且在密集场景下,矩形框之间也会发生重叠,易被后处理阶段排除。
发明内容
为解决上述现有技术存在的不足和缺陷,申请人经过研发设计,现提供一种基于深度学习的死鱼识别方法,设计多尺度特征增强模块有效解决多尺度死鱼识别问题,该方法还设计基于注意力机制的抗遮挡模块,有效凸显前景,抑制背景干扰,此外,该方法通过预测表征死鱼位置的旋转矩形框,使得在密集场景下识别效果更好。
具体的,本发明是这样实现的:一种基于深度学习的抗遮挡与多尺度死鱼识别系统,包括:
死鱼识别数据集模块,用于获取并保存水下拍摄的水下图像,用于构建死鱼识别训练集、验证集与测试集;
图像特征提取模块,用于对水下图像进行预处理,提取图像底层边缘和高层抽象特征图;
多尺度特征加强模块,用于通过串联多个特征金字塔的方式,提高特征的多尺度表达能力。生成候选框对前景目标进行表示,并能自适应提取和融合不同尺度的区域候选框特征;
抗遮挡模块,用于通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰,得抗遮挡特征,
死鱼目标识别模块,用于以候选框特征为初始起点,结合抗遮挡特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
同时,基于上述的系统,本发明还公开了一种基于深度学习的抗遮挡与多尺度死鱼识别方法,
步骤S1、获取水下图像,建立训练和测试用的死鱼识别数据集,
步骤S2、行图像预处理,将图像输入图像特征提取模块,提取图像底层边缘和高层抽象特征图;
步骤S3、多尺度特征加强模块,通过串联多个特征金字塔的方式,提高特征的多尺度表达能力,得多尺度特征;
步骤S4、将多尺度特征生成水平矩形区域候选框,并设计一种自适应ROIAlign算法,用于自适应提取和融合不同尺度的区域候选框特征;
步骤S5、将区域候选框特征通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰;
步骤S6、以水平矩形区域候选框为初始起点,结合抗遮挡分支融合后的特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
本发明的工作原理和有益效果介绍:采用水下摄像机拍摄水下图像,制作用于训练和测试的死鱼识别数据集。同时设计图像预处理模块,为后续步骤提供高质量清晰的待识别图像;将图像输入ResNet特征提取模块,提取图像底层边缘和高层抽象特征图;输出特征图后,设计多尺度特征加强模块,通过串联多个特征金字塔的方式,提高特征的多尺度表达能力,以缓解死鱼尺度变化范围大而难以识别的问题;将多尺度特征输入到RPN网络,生成水平矩形区域候选框(ROI),表示前景目标(死鱼或活鱼),并设计一种自适应ROIAlign算法,用于自适应提取和融合不同尺度的候选框特征;将区域候选框特征输入到抗遮挡分支中,通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰,起到抗遮挡的目的;以生成的水平候选框为初始起点,结合抗遮挡分支融合后的特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。所述图像特征提取模块包括ResNet、VGG、MobileNets或Efficient通用系列网络,可按系统处理实时性需求进行选择。所述生成候选框包括RPN网络和自适应ROIAlign算法单元;首先将RPN网络输出的候选框的置信度进行排序,进而去除置信度低的框,然后再进行后续NMS操作,以提升算法后处理速度;
针对死鱼识别背景复杂、尺度变化大与遮挡等难点,对Faster RCNN识别模型进行了改进,以适应复杂水下环境的死鱼识别场景。本系统和方法在识别处理前,设计对比度受限的自适应直方图均衡化算法进行图像预处理,以改善图像细节信息和局部对比度,提高识别准确率;多尺度特征加强模块,通过串联多个特征金字塔提取丰富的多尺度信息,并且特征金字塔之间设计跨阶段连接单元进行特征重利用并解决网络变深引起的梯度消失问题。最终将相同步长的金字塔层进行累加后输出加强后的特征金字塔。自适应ROIAlign,不同于标准ROIAlign只在单一特征金字塔层提取特征,其可以自适应池化不同特征层的特征并进行融合,使小目标和大目标均能共享低层与高层信息。抗遮挡模块,结合注意力机制和标注的矩形框以弱监督的方式学习候选区域的掩码,该掩码强调目标可视化区域,抑制遮挡区域噪声等干扰,使得提取的特征更关注前景目标,同时特征判别性更强,具有较强的抗遮挡能力。使用旋转矩形框定位死鱼目标,在密集场景下,能无重叠框出死鱼位置。同时排除大量相似背景区域的干扰,提高训练的鲁棒性。
本发明首先对待识别图像进行对比度受限的自适应直方图均衡处理,增强目标局部对比度;其次设计多尺度特征增强模块以处理大尺度范围的死鱼识别问题,并基于注意力机制设计抗遮挡模块,高亮目标区域,排除其他噪声等背景干扰;最终利用旋转矩形框表征死鱼目标,大幅提升了密集场景下死鱼的识别精度。
附图说明
图1为死鱼识别模型结构图;
图2为数据集标注示意图;
图3为图1中的多尺度特征增强模块示意图;
图4为图3中的特征金字塔构建示意图;
图5为图3中的跨阶段连接单元示意图;
图6为图1的自适应ROIAlign示意图;
图7为图1中的抗遮挡模块示意图;
图8为旋转矩形框表示方法。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
实施例1:本发明提供了一种基于深度学习的抗遮挡与多尺度死鱼识别方法,具体流程如图1所示,步骤包括:
步骤1,采用水下摄像机拍摄水下图像,制作用于训练和测试的死鱼识别数据集。同时设计图像预处理模块,为后续步骤提供高质量清晰的待识别图像。
步骤2,将图像输入ResNet-50特征提取模块,提取图像底层边缘和高层抽象特征图。
步骤3,在步骤2的输出特征图后,设计多尺度特征加强模块,通过串联多个特征金字塔的方式,提高特征的多尺度表达能力,以缓解死鱼尺度变化范围大而难以识别的问题。
步骤4,将步骤3输出的多尺度特征输入到RPN网络,生成水平矩形区域候选框(ROI),表示前景目标(死鱼或活鱼),并设计一种自适应ROIAlign算法,用于自适应提取和融合不同尺度的候选框特征。
步骤5,将区域候选框特征输入到抗遮挡分支中,通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰,起到抗遮挡的目的。
步骤6,以步骤4生成的水平候选框为初始起点,结合抗遮挡分支融合后的特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
所述步骤1包括以下步骤:
步骤1-1,采用水下摄像机拍摄大量水下图像,进行死鱼/活鱼目标标注后,将数据集按6:3:1的比例划分为训练集、测试集和验证集。进一步地,标注方式如图2所示,首先根据死鱼的具体位置和大小,使用图中实线旋转矩形框标注,其表示为四个顶点(x1,y1,x2,y2,x3,y3,x4,y4)。进一步地,水平矩形框(x0,y0,xM,yM)用于RPN网络的训练,其生成方式为:
x0=min(x1,x4),y0=min(y1,y4),xM=max(x2,x3),yM=max(y2,y3)
步骤1-2,训练过程数据预处理:将训练图像先进行归一化处理,然后进行随机尺度缩放,并随机裁剪出一定大小的图像块,最后经过随机水平翻转和随机对比度受限的自适应直方图均衡后完成预处理,用于后续训练。
步骤1-3,测试过程数据预处理:先进行图像归一化,再进行随机对比度受限的自适应直方图均衡后完成预处理。
所述步骤2利用ResNet-50网络对输入的图像数据进行特征提取,得到如图1所示的Res1、Res2、Res3、Res4和Res5五个特征图,其通道数分别为128,256,512,1024,2048,步长分别为2,4,8,16,32。
所述步骤3中的多尺度特征增强模块如图3所示,包括以下步骤:
步骤3-1,特征金字塔生成:其生成方式如图4所示,首先将Res2、Res3、Res4和Res5输入特征通过一个侧向连接的1×1卷积,通道数降维至256,并采用双线性插值将高层低分辨率特征进行2倍上采样;然后将上采样后的特征与降低通道后的特征进行逐像素相加;最后使用3×3卷积融合相加后的特征图,获得当前的加强特征,重复上述步骤3次即生成由4层特征构成的特征金字塔。
步骤3-2,多阶段特征金字塔生成:将前一阶段生成的金字塔的输出作为下一阶段金字塔的输入,然后按照步骤3-1的方式构建下一阶段金字塔,以此串联的方式生成多阶段特征金字塔。
步骤3-3,多阶段特征金字塔之间通过跨阶段连接单元进行连接,该单元具体示意图如图5所示。首先使用1×1卷积,分别将前一阶段的特征进行通道降维,然后与当前阶段的特征经过降采样后进行累加,形成特征新的特征。所述空间注意力掩码生成单元,训练掩码标签通过标注的矩形框以弱监督的方式生成。
步骤3-4,多尺度特征生成过程如图3所示,n个阶段特征金字塔表示为{P1,P2,…,Pn},每个金字塔由4层特征{C1,C2,C3,C4}组成,其步长分别为4,8,16,32,将各个金字塔的相同步长的特征层进行逐像素累加,形成多尺度特征输出{F1,F2,F3,F4}。通常,n值设置的越大,处理性能越强,考虑到计算量的问题,可以将n设置为2,若要提升处理准确率,可以设置更大的n值。
所述步骤4为区域水平候选框生成与特征提取,其具体过程如图6所示,包含以下步骤:
步骤4-1,利用RPN网络生成水平候选框,这些候选框可能包含死鱼或活鱼。本发明不同于Faster RCNN中直接使用NMS方式滤除冗余候选框,而是首先将候选框的置信度进行排序,取前15000,然后再进行后续NMS操作,保留2000个候选框,而在测试阶段,取前5000个进行NMS,保留200个。RPN的其他环节均与Faster RCNN保持一致。
步骤4-2,Faster RCNN利用候选框的大小将其分配至{F1,F2,F3,F4},然后利用7×7池化核ROIAlign模块提取候选框对应的特征,本发明为了让不同大小的候选目标均能共享不同尺度的特征,将每个候选框均分配到所有层,如图6所示,然后利用ROIAlign模块提取特征,特征图大小为7×7×256。
步骤4-3,不同于Faster RCNN将特征经过全连接层进行特征转换,本发明为了能保留特征空间信息,利用3×3卷积进行处理。
步骤4-4,将处理完的特征进行最大值融合,最终输出特征维度为7×7×256。
所述步骤5为抗遮挡分支的构建,具体过程如图7所示:
步骤5-1,空间注意力掩码生成测试阶段。将步骤4输出的特征经过两个3×3卷积,每个卷积均利用ReLU进行非线性激活,然后使用1×1卷积将特征变换为1个通道的特征图,最后使用Sigmoid函数将输出值转换到0~1之间。
步骤5-2,空间注意力掩码生成训练阶段。为了训练掩码,本发明使用弱监督的方式计算掩码标签,具体地,将标注的矩形框内部的像素记为1,外部的像素记为0。此外,本发明使用二进制交叉熵损失函数监督掩码的训练过程,假设掩码标签为ci,预测掩码为pi,则掩码生成损失Lmask为:
其中,N表示像素个数,即N=7×7=49。
步骤5-3,将生成的掩码与输入特征进行加权,具体地,将两者进行逐像素相乘,以此高亮非遮挡目标部位,抑制其他非目标区域的干扰,使特征更具判别性,起到抗遮挡的目的。
步骤6为以步骤4生成的水平候选框为起点,对死鱼目标进行类别预测和旋转矩形框回归,其具体过程为:
步骤6-1,死鱼目标预测。本发明中,目标类别为死鱼、活鱼和背景3类,训练时,类别预测采用交叉熵损失函数。测试时,进行softmax概率归一化和最大值函数后,预测出类别和分类置信度。
步骤6-2,死鱼旋转矩形框回归。旋转矩形框示意图如图8所示,表示形式为(x,y,w,h,θ),其中(x,y)为旋转矩形框中心点,(w,h)为旋转矩形框的宽和高,θ表示旋转框的某一边与X轴呈锐角的角度,同时将该边定义为w,此时,θ∈[-π/2,0)。更进一步地,旋转矩形框回归的起点为RPN预测的水平候选框,其编码方式为:
在测试时,需要对预测值进行解码,解码规则如下:
步骤6-3,经过解码后获得旋转框检测结果,并使用旋转NMS去除冗余检测框,获得最终的死鱼识别结果。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种基于深度学习的抗遮挡与多尺度死鱼识别系统,其特征在于包括:
死鱼识别数据集模块,用于获取并保存水下拍摄的水下图像,用于构建死鱼识别训练集、验证集与测试集;
图像特征提取模块,用于对水下图像进行预处理,提取图像底层边缘和高层抽象特征图;
多尺度特征加强模块,用于通过串联多个特征金字塔的方式,提高特征的多尺度表达能力;生成候选框对前景目标进行表示,并能自适应提取和融合不同尺度的区域候选框特征;
抗遮挡模块,用于通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰,得抗遮挡特征。
死鱼目标识别模块,用于以候选框特征为初始起点,结合抗遮挡特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
2.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述死鱼识别数据集模块,包括死鱼类、活鱼类、背景类三大类别数据,并分为训练集、验证集和测试集三个数据集;所述的图像预处理模块,还用于设计对比度受限的自适应直方图均衡算法进行图像预处理,以改善图像细节信息和局部对比度;所述图像特征提取模块包括ResNet、VGG、MobileNets或Efficient通用系列网络,可按系统处理实时性需求进行选择。
3.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述多尺度特征加强模块,包括多阶段特征金字塔、跨阶段连接单元及多尺度特征生成三个部分,所述的多阶段特征金字塔生成方式为首先将图像特征提取模块的输出特征通过一个侧向连接的1×1卷积,通道数降维至256,并用双线性插值将高层低分辨率特征进行2倍上采样;然后将上采样后的特征与降低通道后的特征进行逐像素相加;最后使用3×3卷积融合相加后的特征图,获得当前的加强特征,重复上述步骤3次即生成单个由4层特征组成的特征金字塔。
4.根据权利要求3所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述多阶段特征金字塔由多个特征金字塔串联形成,将前一阶段生成的特征金字塔的输出作为下一阶段特征金字塔的输入,前面的特征金字塔表达浅层特征,后续的特征金字塔为深层特征,每个特征金字塔均包含丰富的多尺度信息;
所述跨阶段连接单元将上一阶段的特征传播到下一阶段,使当前特征能充分重利用之前的先验知识,加强特征表达能力;
所述的多尺度特征生成过程为,假设n个多阶段特征金字塔表示为{P1,P2,…,Pn},每个金字塔由4层特征{C1,C2,C3,C4}组成,其步长分别为4,8,16,32,将各金字塔相同步长的特征层进行逐像素累加,输出多尺度特征{F1,F2,F3,F4};其中,n设置为2或设置更大的n值。
5.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述生成候选框包括RPN网络和自适应ROIAlign算法单元;首先将RPN网络输出的候选框的置信度进行排序,进而去除置信度低的框,然后再进行后续NMS操作,以提升算法后处理速度;自适应ROIAlign算法单元,用于自适应池化不同特征层的特征并进行融合,先将生成的所有候选框均映射到步骤3生成的多尺度特征层{F1,F2,F3,F4},并进行池化核为7×7的ROIAlign操作,然后将生成的特征进行映射后完成融合。
6.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述抗遮挡模块包括空间注意力掩码生成单元和特征加权单元,空间注意力掩码生成单元用于提取候选框特征的7×7×256特征为输入,经过两个3×3卷积和一个1×1卷积后,将特征图映射为7×7×1维度,最终经过Sigmoid激活函数后,输出值在[0,1]之间的前景目标概率图;特征加权单元用于将概率图与原始输入特征进行逐像素相乘后作为分支的输出;
所述空间注意力掩码生成单元,训练掩码标签通过标注的矩形框以弱监督的方式生成。
7.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述旋转矩形框,表示形式为(x,y,w,h,θ),其中(x,y)为旋转矩形框中心点,(w,h)为旋转矩形框的宽和高,θ表示旋转框的某一边与X轴呈锐角的角度,同时将该边定义为w,此时,θ∈[-π/2,0)。
9.一种基于深度学习的抗遮挡与多尺度死鱼识别方法,其特征在于包括以下步骤:
步骤S1、获取水下图像,建立训练和测试用的死鱼识别数据集,
步骤S2、行图像预处理,将图像输入图像特征提取模块,提取图像底层边缘和高层抽象特征图;
步骤S3、多尺度特征加强模块,通过串联多个特征金字塔的方式,提高特征的多尺度表达能力,得多尺度特征;
步骤S4、将多尺度特征生成水平矩形区域候选框,并设计一种自适应ROIAlign算法,用于自适应提取和融合不同尺度的区域候选框特征;
步骤S5、将区域候选框特征通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰;
步骤S6、以水平矩形区域候选框为初始起点,结合抗遮挡分支融合后的特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
10.根据权利要求9所述的抗遮挡与多尺度死鱼识别方法,其特征在于:所述步骤S2中,设计对比度受限的自适应直方图均衡化算法进行图像预处理,以改善图像细节信息和局部对比度;
所述步骤S3中,将相同步长的金字塔层进行累加后输出加强后的特征金字塔;
所述步骤S4中,ROIAlign算法可以自适应池化不同特征层的特征并进行融合,使小目标和大目标均能共享低层与高层信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110653176.7A CN113420759B (zh) | 2021-06-11 | 2021-06-11 | 一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110653176.7A CN113420759B (zh) | 2021-06-11 | 2021-06-11 | 一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420759A true CN113420759A (zh) | 2021-09-21 |
CN113420759B CN113420759B (zh) | 2023-04-18 |
Family
ID=77788414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110653176.7A Active CN113420759B (zh) | 2021-06-11 | 2021-06-11 | 一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420759B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114170497A (zh) * | 2021-11-03 | 2022-03-11 | 中国农业大学 | 一种基于注意力模块的多尺度水下鱼群检测方法 |
CN115049952A (zh) * | 2022-04-24 | 2022-09-13 | 南京农业大学 | 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法 |
CN117115688A (zh) * | 2023-08-17 | 2023-11-24 | 广东海洋大学 | 基于深度学习的低亮度环境下死鱼识别计数系统及方法 |
CN114170497B (zh) * | 2021-11-03 | 2024-07-02 | 中国农业大学 | 一种基于注意力模块的多尺度水下鱼群检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543679A (zh) * | 2018-11-16 | 2019-03-29 | 南京师范大学 | 一种基于深度卷积神经网络的死鱼识别方法及预警系统 |
CN109583343A (zh) * | 2018-11-21 | 2019-04-05 | 荆门博谦信息科技有限公司 | 一种鱼类图像处理系统和方法 |
US20200394413A1 (en) * | 2019-06-17 | 2020-12-17 | The Regents of the University of California, Oakland, CA | Athlete style recognition system and method |
CN112766274A (zh) * | 2021-02-01 | 2021-05-07 | 长沙市盛唐科技有限公司 | 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统 |
CN112926652A (zh) * | 2021-02-25 | 2021-06-08 | 青岛科技大学 | 一种基于深度学习的鱼类细粒度图像识别方法 |
-
2021
- 2021-06-11 CN CN202110653176.7A patent/CN113420759B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543679A (zh) * | 2018-11-16 | 2019-03-29 | 南京师范大学 | 一种基于深度卷积神经网络的死鱼识别方法及预警系统 |
CN109583343A (zh) * | 2018-11-21 | 2019-04-05 | 荆门博谦信息科技有限公司 | 一种鱼类图像处理系统和方法 |
US20200394413A1 (en) * | 2019-06-17 | 2020-12-17 | The Regents of the University of California, Oakland, CA | Athlete style recognition system and method |
CN112766274A (zh) * | 2021-02-01 | 2021-05-07 | 长沙市盛唐科技有限公司 | 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统 |
CN112926652A (zh) * | 2021-02-25 | 2021-06-08 | 青岛科技大学 | 一种基于深度学习的鱼类细粒度图像识别方法 |
Non-Patent Citations (2)
Title |
---|
CHUANG YU等: ""Segmentation and measurement scheme for fish morphological features based on Mask R-CNN"", 《INFORMATION PROCESSING IN AGRICULTURE》 * |
LINGCAI ZENG等: ""Underwater target detection based on Faster R-CNN and adversarial occlusion network"", 《ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114170497A (zh) * | 2021-11-03 | 2022-03-11 | 中国农业大学 | 一种基于注意力模块的多尺度水下鱼群检测方法 |
CN114170497B (zh) * | 2021-11-03 | 2024-07-02 | 中国农业大学 | 一种基于注意力模块的多尺度水下鱼群检测方法 |
CN115049952A (zh) * | 2022-04-24 | 2022-09-13 | 南京农业大学 | 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法 |
CN115049952B (zh) * | 2022-04-24 | 2023-04-07 | 南京农业大学 | 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法 |
CN117115688A (zh) * | 2023-08-17 | 2023-11-24 | 广东海洋大学 | 基于深度学习的低亮度环境下死鱼识别计数系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113420759B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115797931B (zh) | 一种基于双分支特征融合的遥感图像语义分割方法及设备 | |
CN109934200B (zh) | 一种基于改进M-Net的RGB彩色遥感图像云检测方法及系统 | |
Isikdogan et al. | Seeing through the clouds with deepwatermap | |
CN111797712B (zh) | 基于多尺度特征融合网络的遥感影像云与云阴影检测方法 | |
CN112232349A (zh) | 模型训练方法、图像分割方法及装置 | |
CN113378906B (zh) | 一种特征自适应对齐的无监督域适应遥感图像语义分割方法 | |
CN116258719B (zh) | 基于多模态数据融合的浮选泡沫图像分割方法和装置 | |
WO2023000159A1 (zh) | 高分辨率遥感影像半监督分类方法、装置、设备及介质 | |
CN109558806A (zh) | 高分遥感图像变化的检测方法和系统 | |
CN113420759B (zh) | 一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法 | |
CN110751075A (zh) | 一种基于实例分割的遥感影像养殖塘检测方法 | |
CN112560865B (zh) | 一种室外大场景下点云的语义分割方法 | |
CN113888547A (zh) | 基于gan网络的无监督域自适应遥感道路语义分割方法 | |
CN114943876A (zh) | 一种多级语义融合的云和云影检测方法、设备及存储介质 | |
CN114220126A (zh) | 一种目标检测系统及获取方法 | |
CN115410081A (zh) | 一种多尺度聚合的云和云阴影辨识方法、系统、设备及存储介质 | |
CN115471746A (zh) | 一种基于深度学习的船舶目标识别检测方法 | |
CN115424059A (zh) | 一种基于像素级对比学习的遥感土地利用分类方法 | |
CN116246138A (zh) | 基于全卷积神经网络的红外-可见光图像目标级融合方法 | |
CN115713632A (zh) | 一种基于多尺度注意力机制的特征提取方法及装置 | |
CN112560719B (zh) | 基于多尺度卷积-多核池化的高分辨率影像水体提取方法 | |
CN117727046A (zh) | 新型山洪前端仪器仪表读数自动识别方法及系统 | |
CN117593187A (zh) | 基于元学习和Transformer的遥感图像任意尺度超分辨率重建方法 | |
CN111860668A (zh) | 一种针对原始3d点云处理的深度卷积网络的点云识别方法 | |
CN116778470A (zh) | 对象识别及对象识别模型训练方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |