CN114266757A - 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法 - Google Patents

一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法 Download PDF

Info

Publication number
CN114266757A
CN114266757A CN202111606103.9A CN202111606103A CN114266757A CN 114266757 A CN114266757 A CN 114266757A CN 202111606103 A CN202111606103 A CN 202111606103A CN 114266757 A CN114266757 A CN 114266757A
Authority
CN
China
Prior art keywords
scale
features
diabetic retinopathy
network
different scales
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111606103.9A
Other languages
English (en)
Inventor
王丹
刘思禹
赵青
赵文兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111606103.9A priority Critical patent/CN114266757A/zh
Publication of CN114266757A publication Critical patent/CN114266757A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法属于计算机软件领域,针对目前无法提取不同尺度病灶特征且难以关注重要病灶导致分级任务准确率低下的弊端。首先,使用具有不同卷积核大小的过滤器从眼底图像中提取特征,并给不同尺度的特征赋予不同的权重,使得深度学习网络可以学习并选择不同尺度的特征,以提高网络对于不同类型和尺寸病灶的识别能力。同时,融合不同尺度的特征,并使用融合了空间和通道信息的注意力机制对融合后的特征进行权重分配,以加强对高价值特征的选择,从而抑制其他无用特征,以此来提高分级准确率。本发明可以有效地提高对糖尿病性视网膜病变的分级准确率。

Description

一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级 方法
技术领域
本发明属于计算机软件领域,尤其涉及一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法。
背景技术
糖尿病性视网膜病变是一类常见的疾病,它包括微动脉瘤、出血、软性和硬性渗出,根据病灶的数量、大小等特征,可将糖尿病性视网膜病变分为五个等级,包括0级-无病变、1级-轻度病变、2级-中度病变、3级-重度病变和4级-增值性病变。对糖尿病性视网膜病变的自动化分级一直是深度学习领域的热点研究课题。然而,目前已有的方法有以下不足:第一,无法提取不同尺度的病灶信息;第二,无法给予重要病灶区域更多的关注。这使得目前基于深度学习的糖尿病性视网膜病变分级方法准确率不高且鲁棒性不强。
发明内容
有鉴于此,本发明的目的是提出一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法。该方法不仅可以从多尺度提取病灶信息,同时还能够关注重要病灶,从而提高分级准确性和鲁棒性。
为达到以上发明目的,经过研究讨论和反复实践,本方法最终确定包括以下步骤:
步骤1.构建训练集,并对其中的图像进行预处理;
步骤2.构建卷积模块ISK-Block:使用Pytorch框架编写基于多尺度融合注意力机制的卷积层模块,其中使用了不同大小的卷积核对图片进行多尺度特征提取并融合成新的特征图,然后通过改进的融合注意力机制提取不同尺度特征图对应的融合空间和通道注意力的注意力权值矩阵。最后通过多尺度选择框架计算不同尺度特征所占权重,结合注意力权值矩阵按权重将多尺度特征图进行融合,获取最终的融合特征图。
步骤3.构建网络:将不同数量的ISK-Block模块串联起来,并拼接上全连接层,映射到5个类别,形成完整的网络结构。经实验,可选的数量包括18,50,101。
步骤4.训练模型:将步骤1中处理好的数据输入步骤3中构建的网络进行训练。
步骤5.将训练好的模型对测试集进行判别,得到糖尿病性视网膜病变分类结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对实施例描述中所使用的附图加以简单地介绍。
图1基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法流程图
图2基于多尺度融合注意力机制的卷积模块ISK-Block的结构图
具体实施方式
本发明针对糖尿病性视网膜病变分级方法中无法提取多尺度特征、无法关注重要病灶导致准确率不高的问题,将多尺度特征提取和改进的融合注意力机制相结合,提出了一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法。
本发明中的重点为改进的卷积神经网络模块ISK-Block。该模块首先采用不同大小的卷积核对同一个特征图进行卷积操作,不同的卷积核大小意味着不同大小的感受野,即不同的尺度,将提取的不同尺度的特征图进行融合。然后对融合后的新特征图使用改进的融合注意力机制进行注意力计算,改进的融合注意力机制能够同时聚合通道和空间上的注意力,计算出重要特征的通道和空间位置,给予不同的权重,并用该权重重新为不同尺度的特征图进行加权。最后对加权后的不同尺度的特征图进行Softmax操作,给予不同尺的特征图不同的权重,并根据该权重将不同尺度的特征图融合成为新的特征图。
ISK-Block能够便捷的组成新的网络,具体来说,可以使用18、50或101个ISK-Block进行串联,拼接上全连接层将网络输出映射到多个类别,构成不同深度的完整网络结构。
图1可以描述本发明的几个步骤,具体说明如下。
步骤一:为了更好的训练网络,提高网络性能和效率,需要先对输入的眼底图片进行预处理。首先将图片中的黑色背景去除,防止其对网络的学习过程造成影响。然后将所有图片随机裁剪成224像素*224像素大小。最后,为了提高网络的计算效率,还需要将图片转成单通道灰度图像。
步骤二:使用Pytorch框架构建ISK-Block。图2为ISK-Block的网络结构。
(1)设表示通道数为C、长为H、宽为W的特征图的张量
Figure BDA0003433955230000021
为任意一层网络的输出,记为
Figure BDA0003433955230000022
首先对
Figure BDA0003433955230000023
进行多尺度特征提取,分别采用3*3和5*5卷积核对
Figure BDA0003433955230000024
进行卷积操作,即从两个不同尺度进行特征提取。记两个尺度分别为尺度a,尺度b,提取的特征图分别记为Ua、Ub。将Ua、Ub通过矩阵相加融合成为新的特征图U,此时U中包含了多尺度上的特征信息。计算方式如下:
U=Ua+Ub
(2)然后对U做融合特征提取,首先对U在不同的通道维度,沿特征图的高H方向和宽W方向分别进行融合特征提取。公式如下:
Figure BDA0003433955230000031
Figure BDA0003433955230000032
其中
Figure BDA0003433955230000033
分别为表示在通道c的特征图的h高度和w宽度上的融合特征的张量。ap是平均池化操作,Fap表示平均池化所对应的映射。
Figure BDA0003433955230000034
分别表示融合特征图U在通道c上的h高度和w宽度上的所有像素值组成的向量。Uc(i,j)表示融合特征图U在通道c上位置为(i,j)的像素的值。SH为表示所有通道上H方向的融合信息的张量,大小为C*H,SW为表示所有通道上W方向上的融合信息的张量,其张量大小为C*W。
(3)为方便后续计算,将SH和SW进行拼接后得到融合位置信息和通道信息的融合特征张量S,公式如下:
S=[SH,SW],S∈RC,N,N=H+W
其中[,]表示拼接操作,S为一个C*N的张量,N为H和W的和。
(4)接下来,对S进行注意力计算。具体来说,先使用一个全连接层fc将S从C*N维度降维到d*N维度,记降维后的张量为Z,其中Z∈Rd,N,d是一个可变参数,用来控制Z的维度,d=max(C/16,32),max表示取最大数操作。降维过程可用如下公式表示:
Figure BDA0003433955230000035
其中,
Figure BDA0003433955230000036
表示全连接层fc所对应的映射关系,
Figure BDA0003433955230000037
表示全连接层fc的参数矩阵,
Figure BDA0003433955230000038
表示批标准化操作(Batch Normalize),δ表示非线性操作ReLu。
Figure BDA0003433955230000039
将S从C*N维度降维到d*N维度,这样可以在不损失太多精度的情况下提高计算效率。
(5)融合位置信息和通道信息的注意力主要是通过Z来指导的。具体来说,对于从a尺度中提取的特征图Ua,首先使用1*1卷积核组成的卷积层将Z重新升维成C*N维的张量,并通过Sigmod激活函数激活,得到注意力权值矩阵ψa,其公式如下:
Figure BDA00034339552300000310
其中ψa∈RC,N
Figure BDA00034339552300000311
表示Ua对应的1*1卷积层对应的映射关系,Wa表示1*1卷积层的参数矩阵,Wa∈Rd,N,C,N,σ表示Sigmoid激活函数。
为了后续分别对H高度和W宽度上的权值分别计算,需将ψa分割为两部分
Figure BDA00034339552300000312
Figure BDA00034339552300000313
分别代表特征图Ua在不同通道上H方向的权值矩阵和W方向上的权值矩阵,其中
Figure BDA0003433955230000041
它描述了特征图Ua在不同通道上H方向或W方向上的特征的重要性。
对于b尺度上的特征图,其注意力权值矩阵ψb计算公式如下:
Figure BDA0003433955230000042
与特征图Ua相同,
Figure BDA0003433955230000043
表示Ub对应的1*1卷积层对应的映射关系,特征图Ub在不同通道上H方向的权值矩阵和W方向上的权值矩阵分别为
Figure BDA0003433955230000044
由ψb∈RC,N分割而成。
(6)最后为了对不同尺度上的特征给予不同的权重,使用Softmax来计算不同尺度上的特征所占比重,得到最终的权值矩阵。尺度a和尺度b在通道c上h高度和w高度对应的权重分别为
Figure BDA0003433955230000045
Figure BDA0003433955230000046
计算方式如下:
Figure BDA0003433955230000047
Figure BDA0003433955230000048
其中exp表示以自然常数e为底的指数函数,
Figure BDA0003433955230000049
表示张量
Figure BDA00034339552300000410
第c行第h列的值,
Figure BDA00034339552300000411
表示张量
Figure BDA00034339552300000412
第c行第w列的值,
Figure BDA00034339552300000413
表示张量
Figure BDA00034339552300000414
第c行第h列的值,
Figure BDA00034339552300000415
表示张量
Figure BDA00034339552300000416
第c行第w列的值。
Figure BDA00034339552300000417
分别表示尺度a在通道c上所有高度和宽度上对应的
Figure BDA00034339552300000418
组成的最终权值向量,用
Figure BDA00034339552300000419
分别表示尺度b在通道c上所有高度和宽度上对应的
Figure BDA00034339552300000420
Figure BDA00034339552300000421
组成的最终权值向量,其中
Figure BDA00034339552300000422
它们描述了不同尺度的特征图在c通道上不同方向上的特征的重要性。
(7)最后,使用最终得到的权值矩阵,对不同尺度的特征图进行加权并融合成为输出特征图V。具体来说,对于V的c通道,其计算方法如下:
Figure BDA00034339552300000423
其中
Figure BDA00034339552300000424
表示特征图Ua、Ub在c通道上任一像素点的值,
Figure BDA00034339552300000425
表示权值向量
Figure BDA00034339552300000426
的第i个元素的值,
Figure BDA00034339552300000427
表示权值向量
Figure BDA00034339552300000428
的第j个元素的值。
步骤三,使用不同数量的ISK-Block拼接成完整网络结构,经试验,有效的数量有18、50、101,最后使用全连接层将最终输出的特征图映射到糖尿病性视网膜病变的五个等级上。
步骤四,使用交叉熵函数作为损失函数,使用收敛速度快的Adam作为优化器,学习率为1*10-3,批次大小为64,对网络中的各参数进行随机赋值。通过早停法优化网络,当网络在验证集上的损失趋于平缓时,停止训练,保存网络参数。具体来说,当训练在50次迭代中,网络在验证集上的损失上下浮动不超过5%时,视为趋于平缓。
步骤五,使用训练出的模型对测试集图片进行预测。
综上所述,本发明提出的糖尿病性视网膜病变分级方法,能够提高视网膜病变区域不同尺度病灶的提取能力,并关注重要病灶,从而提升网络分级的准确性。
下表是本发明提出的分级方法在公开数据集Kaggle Eyepacs和Messidor-1上的全局准确率,其准确率超过了前人提出方法的准确率。
Figure BDA0003433955230000051
尽管已经出示和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和改变,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,包含如下步骤:
S1、获取数据集,下载公开的Kaggle EyePacs数据集,其中包含了不同程度糖尿病性视网膜病变的眼底图像;
S2、构建训练集,将数据集按照8:2的比例分割为训练集和验证集;
S3、对图像进行预处理操作,首先将眼底图片中的黑色背景去除,然后将所有图片随机裁剪成224像素*224像素大小,最后将所有图片转成单通道灰度图像;
S4、针对糖尿病性视网膜病变的多级分类任务,建立一种基于改进的多尺度融合注意力模块ISK-Block;
S5、使用不同数量的ISK-Block构建完整的深度卷积神经网络,并拼接上全连接层,将网络输出的特征图映射到糖尿病性视网膜病变的五个等级;
S6、使用构建的深度卷积神经网络在训练集上训练网络模型,训练时按照设定的学习率调整所述深度卷积神经网络的参数,从而得到针对糖尿病性视网膜多级分类任务的网络模型。
2.根据权利要求1所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,步骤S1中获取的眼底图像数据集,按照病患糖尿病性视网膜病变的严重程度,划分为0级-无病变、1级-轻度病变、2级-中度病变、3级-重度病变、4-级增值性病变五个等级。
3.根据权利要求1所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,步骤S2中,在按照8:2比例对数据集进行分割之前,需要对数据集中的图像进行翻转、旋转操作。
4.根据权利要求1所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,步骤S4所述ISK-Block模块首先对输入的通道数为C、高度为H、宽度为W的特征图进行多尺度特征提取,分别使用3*3和5*5的卷积核分别对特征图进行卷积操作,然后将卷积后获得的不同尺度的特征图进行矩阵相加,获得融合后的特征图;然后对融合后的特征图高度方向和宽度方向上的特征使用平均池化操作进行融合提取,并将提取后的特征张量拼接成融合了通道和空间特征的融合特征张量;接着对融合特征张量使用两个卷积层进行注意力计算,获得不同尺度所对应的注意力权值矩阵,并分别拆分成不同通道的高H方向和宽W方向上所对应的注意力权值矩阵;最后将两个不同尺度所对应的注意力权值矩阵按元素进行Softmax操作,获取不同尺度上的特征对应的权重矩阵,并使用该权重矩阵对不同尺度特征进行加权,并融合成为最终的输出特征图。
5.根据权利要求4所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,ISK-Block模块中对不同尺度提取的特征图进行融合,其特征在于,对于尺度a提取的特征图Ua和尺度b提取的特征图Ub,融合的特征图U的计算方式如下:
U=Ua+Ub
6.根据权利要求4所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,ISK-Block模块中对融合特征向量使用两个卷积层进行注意力计算,其特征在于,对于融合特征向量S,首先使用一个包含全连接层、批标准化操作、非线性ReLu操作的完整卷积层,将S从C*(H+W)维度降维到d*(H+W)维度的Z,其中d是一个可变参数,用来控制Z的维度,d=max(C/16,32),max表示取最大数操作;其公式表示为:
Figure FDA0003433955220000021
其中,Z∈Rd,H+W
Figure FDA0003433955220000022
表示全连接层所对应的映射关系,
Figure FDA0003433955220000023
表示全连接层的参数矩阵,
Figure FDA0003433955220000024
Figure FDA0003433955220000025
表示批标准化操作(Batch Normalize),δ表示非线性操作ReLu;
然后对于不同尺度,分别使用一个由1*1卷积核组成的卷积层对Z从d*(H+W)维度升维到C*(H+W)维度,并通过Sigmoid激活函数激活,获得该尺度对应的注意力权值矩阵ψ,其计算公式如下:
ψ=σ(F(Z))=σ(WZ)
其中ψ∈RC,H+W,F表示该尺度对应的1*1卷积核组成的卷积层所对应的映射,W表示卷积层对应的参数,W∈Rd,H+W,C,H+W,σ表示Sigmoid激活函数;
最后将ψ分割成H方向上和W方向上所对应的注意力权值矩阵ψH∈RC,H,ψW∈RC,W
7.根据权利要求4所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,ISK-Block模块中对两个不同尺度所对应的注意力权值矩阵按元素进行Softmax操作,其特征在于,对于a尺度所对应的H方向上和W方向上的注意力矩阵
Figure FDA0003433955220000031
和b尺度所对应的H方向上和W方向的注意力矩阵
Figure FDA0003433955220000032
分别将
Figure FDA0003433955220000033
Figure FDA0003433955220000034
按元素做Softmax操作,
Figure FDA0003433955220000035
Figure FDA0003433955220000036
按元素做Softmax操作,得到不同尺度在H方向上和W方向上所对应的最终的权重向量;尺度a和尺度b在通道c上h高度和w高度对应的权重分别为
Figure FDA0003433955220000037
Figure FDA0003433955220000038
计算方式如下:
Figure FDA0003433955220000039
Figure FDA00034339552200000310
其中exp表示以自然常数e为底的指数函数,
Figure FDA00034339552200000311
表示张量
Figure FDA00034339552200000312
第c行第h列的值,
Figure FDA00034339552200000313
表示张量
Figure FDA00034339552200000314
第c行第w列的值,
Figure FDA00034339552200000315
表示张量
Figure FDA00034339552200000316
第c行第h列的值,
Figure FDA00034339552200000317
表示张量
Figure FDA00034339552200000318
第c行第w列的值;
Figure FDA00034339552200000319
分别表示尺度a在通道c上所有高度和宽度上对应的
Figure FDA00034339552200000320
组成的最终权值向量,用
Figure FDA00034339552200000321
分别表示尺度b在通道c上所有高度和宽度上对应的
Figure FDA00034339552200000322
Figure FDA00034339552200000323
组成的最终权值向量,其中
Figure FDA00034339552200000324
它们描述了不同尺度的特征图在c通道上不同方向上的特征的重要性。
8.根据权利要求4所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,ISK-Block模块中使用权重矩阵对不同尺度特征进行加权,并融合成为最终的输出特征图,其特征在于,对于最终特征图V的c通道,其计算方式如下:
Figure FDA00034339552200000325
其中
Figure FDA00034339552200000326
表示特征图Ua、Ub在c通道上任一像素点的值,
Figure FDA00034339552200000327
Figure FDA00034339552200000328
表示权值向量
Figure FDA00034339552200000329
的第i个数的值,
Figure FDA00034339552200000330
表示权值向量
Figure FDA00034339552200000331
的第j个元素的值。
9.根据权利要求1所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,步骤S5中构建完整的深度卷积神经网络,其可用ISK-Block的数量,随网络深度增加,可选数量为18、50、101;该深度卷积神经网络使用交叉熵作为损失函数,使用Adam作为优化器。
10.根据权利要求1所述的一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法,其特征在于,步骤S6中训练深度卷积神经网络时,网络中的参数设为随机数,学习率为1*10-3,批次大小为64,通过早停法优化网络,当网络在验证集上的损失趋于平缓时,停止训练,保存网络参数;当训练在50次以上迭代,网络在验证集上的损失上下浮动不超过5%时,视为趋于平缓。
CN202111606103.9A 2021-12-25 2021-12-25 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法 Pending CN114266757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111606103.9A CN114266757A (zh) 2021-12-25 2021-12-25 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111606103.9A CN114266757A (zh) 2021-12-25 2021-12-25 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法

Publications (1)

Publication Number Publication Date
CN114266757A true CN114266757A (zh) 2022-04-01

Family

ID=80830576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111606103.9A Pending CN114266757A (zh) 2021-12-25 2021-12-25 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法

Country Status (1)

Country Link
CN (1) CN114266757A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115587979A (zh) * 2022-10-10 2023-01-10 山东财经大学 基于三阶段注意力网络的糖尿病视网膜病变分级的方法
CN116246331A (zh) * 2022-12-05 2023-06-09 苏州大学 一种圆锥角膜自动分级方法、装置及存储介质
CN116486183A (zh) * 2023-06-21 2023-07-25 耕宇牧星(北京)空间科技有限公司 基于多种注意力权重融合特征的sar图像建筑区分类方法
CN117496231A (zh) * 2023-10-24 2024-02-02 国药(武汉)精准医疗科技有限公司 糖尿病性视网膜病变图像分类方法、装置以及计算机设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115587979A (zh) * 2022-10-10 2023-01-10 山东财经大学 基于三阶段注意力网络的糖尿病视网膜病变分级的方法
CN115587979B (zh) * 2022-10-10 2023-08-15 山东财经大学 基于三阶段注意力网络的糖尿病视网膜病变分级的方法
CN116246331A (zh) * 2022-12-05 2023-06-09 苏州大学 一种圆锥角膜自动分级方法、装置及存储介质
CN116486183A (zh) * 2023-06-21 2023-07-25 耕宇牧星(北京)空间科技有限公司 基于多种注意力权重融合特征的sar图像建筑区分类方法
CN116486183B (zh) * 2023-06-21 2023-09-26 耕宇牧星(北京)空间科技有限公司 基于多种注意力权重融合特征的sar图像建筑区分类方法
CN117496231A (zh) * 2023-10-24 2024-02-02 国药(武汉)精准医疗科技有限公司 糖尿病性视网膜病变图像分类方法、装置以及计算机设备

Similar Documents

Publication Publication Date Title
CN114266757A (zh) 一种基于多尺度融合注意力机制的糖尿病性视网膜病变分级方法
AU2018102037A4 (en) A method of recognition of vehicle type based on deep learning
CN112241679B (zh) 一种垃圾自动分类的方法
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN111563431A (zh) 一种基于改进卷积神经网络的植物叶片病虫害识别方法
CN113554599B (zh) 一种基于人类视觉效应的视频质量评价方法
CN111553438A (zh) 一种基于卷积神经网络的图像识别方法
CN114565048A (zh) 基于自适应特征融合金字塔网络的三阶段害虫图像识别方法
CN113971764B (zh) 一种基于改进YOLOv3的遥感图像小目标检测方法
CN106650667A (zh) 一种基于支持向量机的行人检测方法及系统
CN109740656A (zh) 一种基于卷积神经网络的矿石分选方法
CN109815923B (zh) 基于lbp特征与深度学习的金针菇菇头分选识别方法
CN114663769B (zh) 一种基于YOLO v5的水果识别方法
CN116012721B (zh) 一种基于深度学习的水稻叶片病斑检测方法
CN112766283A (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN115937693A (zh) 一种基于遥感图像的道路识别方法及系统
CN113011506B (zh) 一种基于深度重分形频谱网络的纹理图像分类方法
CN112967296B (zh) 一种点云动态区域图卷积方法、分类方法及分割方法
CN118262149A (zh) 一种基于深度学习的农作物病虫害图像识别方法与系统
CN114170634A (zh) 基于DenseNet网络改进的手势图像特征提取方法
CN109741313B (zh) 独立成分分析和卷积神经网络的无参考图像质量评价方法
CN111507941A (zh) 一种用于美学质量评价的构图表征学习方法
CN114898417B (zh) 一种基于协调注意力深度神经网络的菊头蝠识别方法
CN116258899A (zh) 一种基于自定义轻量型卷积神经网络玉米种穗分类方法
CN110211122A (zh) 一种检测图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination