CN113537395B - 一种基于眼底图像的糖尿病性视网膜病变图像识别方法 - Google Patents

一种基于眼底图像的糖尿病性视网膜病变图像识别方法 Download PDF

Info

Publication number
CN113537395B
CN113537395B CN202110909914.XA CN202110909914A CN113537395B CN 113537395 B CN113537395 B CN 113537395B CN 202110909914 A CN202110909914 A CN 202110909914A CN 113537395 B CN113537395 B CN 113537395B
Authority
CN
China
Prior art keywords
class
categories
layer3
image
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110909914.XA
Other languages
English (en)
Other versions
CN113537395A (zh
Inventor
罗烨
谢加浩
王剑飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202110909914.XA priority Critical patent/CN113537395B/zh
Publication of CN113537395A publication Critical patent/CN113537395A/zh
Application granted granted Critical
Publication of CN113537395B publication Critical patent/CN113537395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

一种基于眼底图像的糖尿病性视网膜病变图像识别方法,眼底图片的病变区域与周围正常区域往往会呈现视觉上较为明显的不同特征,这些区域为感兴趣区域;考虑糖尿病性视网感兴趣区域,在传统分类网络中融合注意力机制算法;使用并改进Arcface loss的思路,对类别之间的渐进关系建模,使得模型对数据分布敏感。本发明考虑了医学图像的特征,在深度学习网络中融合了注意力特征,使得模型能够关注图像中的感兴趣区域,在数据规模有限的情况下也能收获较好的效果;此外,还考虑了糖尿病性视网膜图像不同类别之间的距离渐进关系,根据类别间距离建模,提出W‑Arcface loss,根据样本类别与真实标签的距离,动态调整Arcface loss中的惩罚项,进一步提升分类准确率。

Description

一种基于眼底图像的糖尿病性视网膜病变图像识别方法
技术领域
本发明属于深度学习图像处理领域,尤其涉及融合了注意力方法的医学图像分类方法。
背景技术
深度学习技术是机器学习领域中的一个研究方向。深度学习可以学习样本数据的内在规律和表示层次,这对大量样本信息诸如文字图片和声音等的解释有很大的帮助。它的最终目标是让机器能像人一样有分析学习能力,能够识别文字图像声音等数据。在计算机视觉领域,对于图像分类,分割,融合等目标,都发挥着重要作用。
Arcface loss是神经网络训练过程中损失函数的一种,通过将分类神经网络全连接层的输出映射到超球体空间中,并设置角度惩罚项,在角度空间中最大化分类界限,使得样本类间距离尽可能大,提升分类准确度。在医学图像领域,数据样本规模有限,类别之间又往往存在渐进关系,固定的惩罚项可能使模型难以学习到类别之间的关联。
糖尿病性视网膜病变是由糖尿病引发的微血管病变的一种疾病。糖尿病性视网膜病变会对视力造成严重损伤甚至导致失明,糖尿病性视网膜病变成为国内外面临的重要挑战。Google科研人员再两个数据集上使用深度学习的方法对糖尿病视网膜病变进行诊断,但是只能在区分正常和较严重的病变时能有较好的效果,区分多个类别尤其是轻微症状时效果欠佳,在区分四个等级的病变时仅有57.2%的准确率。
发明内容
本发明提出了一种基于眼底图像的糖尿病性视网膜图像识别分类方法,其特征在于,眼底图片的病变区域与周围正常区域往往会呈现视觉上较为明显的不同特征,这些区域为感兴趣区域;考虑糖尿病性视网感兴趣区域,在传统分类网络中融合注意力机制算法;此外,还考虑到医学图像分类的特性,不同类别间往往会有关联,使用并改进Arcface loss的思路,对类别之间的渐进关系建模,使得模型对数据分布敏感;
该方法具体包括以下步骤:
S1,获取Kaggle平台公开数据集Asia Pacific Tele-Ophthalmology Society(APTOS)并进行预处理;
S2,构建基于ResNet的分类网络,对预处理得到的数据集进行图像浅层和深层结构特征提取,并且在第二层和第三层网络间引入注意力块;
S3,考虑数据类别之间的联系,对Arcfaceloss进行改进,设计了W-Arcface loss作为损失函数,使模型能学习到类别之间的距离信息;
S4,训练分类网络,并使用Quadratic Kappa系数作为评估指标,该系数的计算方法如下:
Figure BDA0003203134010000021
Figure BDA0003203134010000022
Wij为类别i预测为类别j时的权重,N为类别的数量,Oij为将类别i预测为类别j的数量,Eij为实际类别i的总数*预测类别为j的总数除以所有类别的总数。
其中,上述图像预处理过程S1中,具体包括以下步骤:
S11,读取数据集中眼底图片;
S12,采用归一化方法进行亮度矫正,使得图片亮度均匀,明暗分布一致;
S13,设置去除黑边阈值为7像素值,统计每一行每一列像素值大于7的个数,删除统计量为0的边缘行列,自动对图像黑边进行去除;
S14,使用随机裁剪,水平翻转,竖直翻转进行数据增强;
S15,调整图片分辨率为224*224。
上述步骤S2中,分类网络以ResNet34为基础框架,包括卷积框架头模块(即Stem块),残差模块Layer1,残差模块Layer2,残差模块Layer3,残差模块Layer4,并在Layer2和Layer3之间加入注意力模块,将经过注意力模块处理后的输出Layer3_1与原来Layer3的输出进行拼接操作,再通过一个1*1卷积降维,得到新特征。具体包括以下步骤:
S21,将Layer3层的输出通过1*1卷积融合所有通道信息;
S22,进行空间维度归一化归一化公式如下:
Figure BDA0003203134010000031
其中fp,q代表特征图f上的第p行第q列的值,再通过一个sigmoid激活函数得到注意力图。
S23,对得到的注意力图进行插值,调整维度和Layer2一致;
S24,将插值后的结果与Layer2的输出点乘,得到Layer3_1;
S25,将Layer3_1和Layer3的输出拼接并经过1*1卷积降维,再输入layer4。
上述步骤S3中,损失函数使用了改进版的W-Arcface loss,将分类网络的全连接层和softmax转化为将特征映射到空间中的超球体,并且考虑了类别距离关系,动态选择惩罚项大小,具体包括以下步骤:S31,对Layer4的输出xi和全连接层参数W做归一化,具体如下公式所示:
Figure BDA0003203134010000032
Figure BDA0003203134010000033
其中,i为表示第i个样本,d为输出xi的维数,C为类别总数。
S32,再通过点积算出权重W和输入xi的夹角余弦,如下公式所示:
cos(θi)=WT·xi/(||W||||xi||),且
Figure BDA0003203134010000041
S33,之后,对传统的Arcface loss中的惩罚项m进行如下改进:对每个样本设置超参数向量:m=[m1,m2,…,mC],且对任意c≥k,有mc≥mk。即当第c的类别标签数值比第k类的标签数值要大时(即c≥k),则他们之间分类边界的距离也应该相应大一些(即mc≥mk)。通过这样的方式使得类别差距比较大的样本在分类边界上也相距较远。具体的,给定样本i及其真实类别标签yi,计算yi与类别标签向量y=[1,2,…,C]T中每个分量的绝对距离即dc=|yi-yc|,其中yc为y的第c个分量,根据距离的计算得到向量mi=[d1,d2,…,dc,…,dC]作为样本i的惩罚项,达到优化Arcface loss中惩罚项m的目的。S34,最后,根据上述距离的计算,每个样本都选择不同的惩罚项,最后提出的W-Arcface loss损失函数如下:
Figure BDA0003203134010000042
其中,函数exp()表示softmax操作,mi,c和θi,c分别表示第i个样本对应的mi和θi中的第c项;N为样本数量,C为类别数量,s为特征规模恢复因子,恢复之前归一化的影响。
本发明考虑了医学图像的特征,在深度学习网络中融合了注意力特征,使得模型能够关注图像中的感兴趣区域,在数据规模有限的情况下也能收获较好的效果;此外,还考虑了糖尿病性视网膜图像不同类别之间的距离渐进关系,根据类别间距离建模,提出W-Arcface loss,根据样本类别与真实标签的距离,动态调整Arcface loss中的惩罚项,进一步提升分类准确率。
本发明方法和系统技术方案本身不是直接用于诊断、筛查糖尿病性,符合专利法第25条。
附图说明
图1是本发明实施例提供的基于眼底图像的糖尿病性视网膜病图像识别系统流程图
图2是眼底图片去除黑边前后对比
图3是基于注意力机制的特征融合模型
图4是注意力块的实现
图5是注意力模块效果验证
图6是W-Arcface loss效果验证
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步信息说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施提供的基于眼底图像的糖尿病性视网膜图像识别系统包括如下步骤:
步骤一,数据预处理模块,我们的数据是Kaggle平台上的公开数据集AsiaPacific Tele-Ophthalmology Society(APTOS),该数据集是由印度亚拉文眼科医院收集。该数据集图像为眼底图片,根据图像特征进行了分级标注,分成三级。该数据集一共包括3662例训练数据,所有的数据都有医院真实采集的数据。为了验证模型的效果,将数据随机平均分成了5份用于交叉验证。
首先,采用归一化方法进行亮度矫正,使得图片亮度均匀,明暗分布一致;之后设置去除黑边阈值为7像素值,统计每一行每一列像素值大于7的个数,删除统计量为0的边缘行列,自动对图像黑边进行去除,去除黑边之后的图像可以参考图2;使用随机裁剪,水平翻转,竖直翻转进行数据增强;调整图片分辨率为224*224,得到最终的训练和验证数据。
步骤二,基于ResNet,结合注意力机制的特征提取网络构建,具体算法结构如图3,模型分成5个模块,依次为卷积框架头模块(即Stem模块),残差模块Layer1,残差模块Layer2,残差模块Layer3,残差模块Layer4。通过Layer3的输出,使用一个注意力块提取除包含特征空间维度信息的注意力图;基于获取的注意力图,结合Layer2的输出提取除浅层特征中的感兴趣特征,再使用一个新的Layer3_1学习更加专注于感兴趣区域的模型权重。为了防止原始的特征丢失,我们将最初Layer3的输出与经过注意力模块处理后的Layer3_1的输出进行拼接操作并通过一个1*1卷积降维,最后经过Layer4和激活函数得到结果。
注意力模块可参考图4,先通过一个1*1卷积融合所有通道的信息,这样得到的特征图只包含空间的维度并且在对应位置上融合了所有通道的信息,再对其进行归一化后直接通过一个sigmoid激活函数就可以得到最后的注意力图,归一化是为了防止特征的值全部太大或者全部太小,学习不到注意力信息。
注意力模块的设计能够自动学习到空间位置上的感兴趣区域,并且结合感兴趣区域指导学习,更聚焦于病灶区域信息的模型权重;同时我们的拼接操作同时保存了原始的特征信息和聚焦病灶的焦点信息,可以让模型自动分析出应该如何整合两种特征,学习的模型更具泛化性也不容易梯度消失。
步骤三,损失函数的设计,使用了Arcface-loss的超球体空间映射思路,但是考虑了医学图像类别之间关联性特点,依据距离建模,设计了W-Arcface-loss,具体实现方法如下:
首先对残差模块Layer4的输出xi和全连接层参数W做归一化,具体如下公式所示:
Figure BDA0003203134010000061
Figure BDA0003203134010000062
其中,i表示第i个样本,d为输出xi的维数,C为类别总数。
再通过点积算出权重W和输入xi的夹角余弦,如下公式所示:
cos(θi)=WT·xi/(||W||||xi||),且
Figure BDA0003203134010000063
之后,对传统的Arcface loss中的惩罚项m进行改进:
对每个样本设置超参数向量:m=[m1,m2,…,mC],且对任意c≥k,有mc≥mk。即当第c的类别标签数值比第k类的标签数值要大时(即c≥k),则他们之间分类边界的距离也应该相应大一些(即mc≥mk)。通过这样的方式使得类别差距比较大的样本在分类边界上也相距较远。具体的,给定样本i及其真实类别标签yi,计算yi与类别标签向量y=[1,2,…,C]T中每个分量的绝对距离即dc=|yi-yc|,其中yc为y的第c个分量,根据距离的计算得到向量mi=[d1,d2,…,dc,…,dC]作为样本i的惩罚项,达到动态调整Arcface loss中惩罚项m的目的。最后,改进的W-Arcface loss损失函数如下:
Figure BDA0003203134010000071
其中,函数exp()表示softmax操作;mi,c和θi,c分别表示第i个样本对应的mi和θi中的第c项;N为样本数量,C为类别数量,s为特征规模恢复因子,恢复之前归一化的影响。
对于每一个输入网络的样本,模型会根据样本真实类别和类别标签向量的距离设置一个合适的惩罚项mi。使得在分类任务中,输出的类别余弦角度值不仅要比别的类别小,而且至少要小mi才能作为正样本。这样的设计使得在医学图像样本有限的情况下,模型仍然易于学习到类别之间的关联,又使得损失函数满足了如下两点要求:1.能直接学到类别之间的距离关系。2.输出可以直接用于表示概率信息。
步骤四,模型训练和实验验证,将3662例数据平均分成了五份,网络使用凯明分布进行初始化,批归一化初始化权重为1,偏置为0;训练采用Adam优化器,学习率设置为0.001,一阶矩阵系数设置为0.9,二阶矩阵系数设置为0.999;所有模型均训练90轮,模型的输入大小为224*224;按照这套统一的标准来训练测试不同的模型。
为了验证注意力模块对结果的影响(图5)和W-Arcface loss对结果的影响(图6),使用Quadratic Kappa系数和准确率来衡量模型的有效性;根据图5图6容易看出,注意力模块和W-Arcface的引入,对模型的有效性尤其是Quadratic Kappa系数有着显著的提升。

Claims (3)

1.一种基于眼底图像的糖尿病性视网膜病变图像识别方法,其特征在于,眼底图片的病变区域与周围正常区域往往会呈现视觉上较为明显的不同特征,这些区域为感兴趣区域;考虑糖尿病性视网感兴趣区域,在传统分类网络中融合注意力机制算法;使用并改进Arcface loss的思路,对类别之间的渐进关系建模,使得模型对数据分布敏感;该方法具体包括以下步骤:
S1,获取Kaggle平台公开数据集Asia Pacific Tele-Ophthalmology Society(APTOS)并进行预处理;
S2,构建基于ResNet的分类网络,对预处理得到的数据集进行图像浅层和深层结构特征提取,并且在第二层和第三层网络间引入注意力块;
S3,考虑数据类别之间的联系,对Arcfaceloss进行改进,设计了W-Arcface loss作为损失函数,使模型能学习到类别之间的距离信息;
S4,训练分类网络,并使用Quadratic Kappa系数作为评估指标,该系数的计算方法如下:
Figure DEST_PATH_FDA0003203131000000011
Figure DEST_PATH_FDA0003203131000000012
Wo为类别i预测为类别j时的权重,N为类别的数量,Oij为将类别i预测为类别j的数量,Eij为实际类别i的总数*预测类别为j的总数除以所有类别的总数;
所述步骤S3中,损失函数使用了改进版的W-Arcface loss,将分类网络的全连接层和softmax转化为将特征映射到空间中的超球体,并且考虑了类别距离关系,动态选择惩罚项大小,具体包括以下步骤:
S31,对Layer4的输出xi和全连接层参数W做归一化,具体如下公式所示:
Figure DEST_PATH_FDA0003203131000000022
Figure DEST_PATH_FDA0003203131000000023
其中,i为表示第i个样本,d为输出xi的维数,C为类别总数;
S32,再通过点积算出权重W和输入xi的夹角余弦,如下公式所示:
cos(θi)=WT·xi/(||W||||xi||),且
Figure DEST_PATH_FDA0003203131000000031
S33,之后,对传统的Arcface loss中的惩罚项m进行如下改进:对每个样本设置超参数向量:m=[m1,m2,…,mC],且对任意c≥k,有mc≥mk;即当第c的类别标签数值比第k类的标签数值要大时(即c≥k),则他们之间分类边界的距离也应该相应大一些(即mc≥mk);通过这样的方式使得类别差距比较大的样本在分类边界上也相距较远;具体的,给定样本i及其真实类别标签yi,计算yi与类别标签向量y=[1,2,…,C]T中每个分量的绝对距离即dc=|yi-yc|,其中yc为y的第c个分量,根据距离的计算得到向量mi=[d1,d2,…,dc,…,dC]作为样本i的惩罚项,达到优化Arcface loss中惩罚项m的目的;
S34,最后,根据上述距离的计算,每个样本都选择不同的惩罚项,最后提出的W-Arcface loss损失函数如下:
Figure DEST_PATH_FDA0003203131000000032
其中,函数exp()表示softmax操作,mi,c和θi,c分别表示第i个样本对应的mi和θi中的第c项;N为样本数量,C为类别数量,s为特征规模恢复因子,恢复之前归一化的影响。
2.根据权利要求1所述的一种基于眼底图像的糖尿病性视网膜病变图像识别方法,其特征在于,所述步骤S1具体包括以下步骤:
S11,读取数据集中眼底图片;
S12,采用归一化方法进行亮度矫正,使得图片亮度均匀,明暗分布一致;
S13,设置去除黑边阈值为7像素值,统计每一行每一列像素值大于7的个数,删除统计量为0的边缘行列,自动对图像黑边进行去除;
S14,使用随机裁剪,水平翻转,竖直翻转进行数据增强;
S15,调整图片分辨率为224*224。
3.根据权利要求1所述的一种基于眼底图像的糖尿病性视网膜病变图像识别方法,其特征在于,所述步骤S2中,分类网络以ResNet34为基础框架,包括卷积框架头模块(即Stem块),残差模块Layer1,残差模块Layer2,残差模块Layer3,残差模块Layer4,并在Layer2和Layer3之间加入注意力模块,将经过注意力模块处理后的输出Layer3_1与原来Layer3的输出进行拼接操作,再通过一个1*1卷积降维,得到新特征;具体包括以下步骤:
S21,将Layer3层的输出通过1*1卷积融合所有通道信息;
S22,进行空间维度归一化,归一化公式如下:
Figure FDA0003592572940000022
其中fp,q代表特征图f上的第p行第q列的值,再通过一个sigmoid激活函数得到注意力图;
S23,对得到的注意力图进行插值,调整维度和Layer2一致;
S24,将插值后的结果与Layer2的输出点乘,得到Layer3_1;
S25,将Layer3_1和Layer3的输出拼接并经过1*1卷积降维,再输入layer4。
CN202110909914.XA 2021-08-09 2021-08-09 一种基于眼底图像的糖尿病性视网膜病变图像识别方法 Active CN113537395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110909914.XA CN113537395B (zh) 2021-08-09 2021-08-09 一种基于眼底图像的糖尿病性视网膜病变图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110909914.XA CN113537395B (zh) 2021-08-09 2021-08-09 一种基于眼底图像的糖尿病性视网膜病变图像识别方法

Publications (2)

Publication Number Publication Date
CN113537395A CN113537395A (zh) 2021-10-22
CN113537395B true CN113537395B (zh) 2022-07-08

Family

ID=78122225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110909914.XA Active CN113537395B (zh) 2021-08-09 2021-08-09 一种基于眼底图像的糖尿病性视网膜病变图像识别方法

Country Status (1)

Country Link
CN (1) CN113537395B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114419378B (zh) * 2022-03-28 2022-09-02 杭州未名信科科技有限公司 图像分类的方法、装置、电子设备及介质
CN115424084B (zh) * 2022-11-07 2023-03-24 浙江省人民医院 基于类别加权网络的眼底照片分类方法与装置
CN117350982B (zh) * 2023-10-23 2024-05-14 郑州大学 一种基于多医学图像的糖尿病肾病分析方法及系统
CN117994251A (zh) * 2024-04-03 2024-05-07 华中科技大学同济医学院附属同济医院 基于人工智能的糖尿病足溃疡严重程度评估方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021916A (zh) * 2017-12-31 2018-05-11 南京航空航天大学 基于注意力机制的深度学习糖尿病视网膜病变分类方法
CN109889436A (zh) * 2019-02-20 2019-06-14 北京航空航天大学 一种社交网络中垃圾邮件发送者的发现方法
CN110996123A (zh) * 2019-12-18 2020-04-10 广州市百果园信息技术有限公司 一种视频处理方法、装置、设备及介质
CN111709289A (zh) * 2020-05-18 2020-09-25 杭州电子科技大学 一种用于提高人体解析效果的多任务深度学习模型

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948712A (zh) * 2019-03-20 2019-06-28 天津工业大学 一种基于改进的Mask R-CNN的纳米颗粒尺寸测量方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021916A (zh) * 2017-12-31 2018-05-11 南京航空航天大学 基于注意力机制的深度学习糖尿病视网膜病变分类方法
CN109889436A (zh) * 2019-02-20 2019-06-14 北京航空航天大学 一种社交网络中垃圾邮件发送者的发现方法
CN110996123A (zh) * 2019-12-18 2020-04-10 广州市百果园信息技术有限公司 一种视频处理方法、装置、设备及介质
CN111709289A (zh) * 2020-05-18 2020-09-25 杭州电子科技大学 一种用于提高人体解析效果的多任务深度学习模型

Also Published As

Publication number Publication date
CN113537395A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN113537395B (zh) 一种基于眼底图像的糖尿病性视网膜病变图像识别方法
Jasim et al. Plant leaf diseases detection and classification using image processing and deep learning techniques
CN110503630B (zh) 一种基于三维深度学习模型的脑出血分类、定位与预测方法
CN111680614B (zh) 一种基于视频监控中的异常行为检测方法
CN110059586B (zh) 一种基于空洞残差注意力结构的虹膜定位分割系统
CN106778687B (zh) 基于局部评估和全局优化的注视点检测方法
CN115018824B (zh) 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法
CN105426875A (zh) 一种基于深度卷积神经网络的人脸识别方法和考勤系统
CN114846507A (zh) 用于使用人工智能(ai)模型进行非侵入性基因检测的方法和系统
Suganthi et al. Deep learning model for deep fake face recognition and detection
CN116958825B (zh) 一种移动式遥感图像采集方法及公路维护监测方法
CN111626994A (zh) 基于改进U-Net神经网络的设备故障缺陷诊断方法
CN111553438A (zh) 一种基于卷积神经网络的图像识别方法
CN111008570B (zh) 一种基于压缩-激励伪三维网络的视频理解方法
CN113240655A (zh) 一种自动检测眼底图像类型的方法、存储介质及装置
Velliangira et al. A novel forgery detection in image frames of the videos using enhanced convolutional neural network in face images
CN115239672A (zh) 缺陷检测方法及装置、设备、存储介质
CN116206227B (zh) 5g富媒体信息的图片审查系统、方法、电子设备及介质
Huang et al. DBFU-Net: Double branch fusion U-Net with hard example weighting train strategy to segment retinal vessel
CN115631526A (zh) 基于自监督学习技术的被遮挡的人脸表情识别方法及应用
CN117690178B (zh) 一种基于计算机视觉的人脸图像识别方法与系统
Villaret Efficient fundus image gradeability approach based on deep reconstruction-classification network
Khan et al. The Art of Seeing: A Computer Vision Journey into Object Detection
CN118072076A (zh) 一种蝇类幼虫物种分类方法、系统、设备和介质
CN117934907A (zh) 一种针对卷积神经网络的可解释性方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant