CN115908964B - 一种医学图像分类方法、系统、终端以及存储介质 - Google Patents
一种医学图像分类方法、系统、终端以及存储介质 Download PDFInfo
- Publication number
- CN115908964B CN115908964B CN202211143228.7A CN202211143228A CN115908964B CN 115908964 B CN115908964 B CN 115908964B CN 202211143228 A CN202211143228 A CN 202211143228A CN 115908964 B CN115908964 B CN 115908964B
- Authority
- CN
- China
- Prior art keywords
- medical image
- module
- medical
- sample size
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000007246 mechanism Effects 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000013136 deep learning model Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000013135 deep learning Methods 0.000 claims abstract description 17
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 238000010586 diagram Methods 0.000 claims description 59
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000003042 antagnostic effect Effects 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000005070 sampling Methods 0.000 abstract description 5
- 230000003902 lesion Effects 0.000 description 5
- 210000001525 retina Anatomy 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 206010012689 Diabetic retinopathy Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 208000002249 Diabetes Complications Diseases 0.000 description 1
- 208000017442 Retinal disease Diseases 0.000 description 1
- 206010038923 Retinopathy Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种医学图像分类方法、系统、终端以及存储介质。所述方法包括:收集不同类别的医学图像数据集;利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。本发明使用基于深度学习的图像生成和图像旋转技术对医学图像样本进行上采样处理,使用样本量均衡的医学图像样本训练基于逐元素注意力机制的深度学习模型,有效解决了医学图像数据集分布不平衡所存在的局限性,并有效提高模型的检测效率与分类精度。
Description
技术领域
本申请属于医学图像处理技术领域,特别涉及一种医学图像分类方法、系统、终端以及存储介质。
背景技术
目前糖尿病视网膜病变是糖尿病常见的慢性并发症之一,也是最常见的致盲性眼病。如果不及时治疗,可能会导致视力受损,严重时甚至失明,因此在初级阶段识别病变非常重要。传统技术中,眼科医生通常通过观察眼底视网膜图像以分辨患者是否存在糖尿病性视网膜病变。但对于一些县级医院或偏远地区的医生,则很难发现相关病例。
随着深度学习技术的发展,基于深度学习的视网膜眼底图像的自动化决策系统可以被用来帮助医生分辨眼底图像的病变类别。目前,眼底视网膜病变图像所属类别分类可以分为传统分类方法与基于深度学习的分类方法。传统分类方法利用手动提取眼底视网膜图像的纹理特征、形状特征以及颜色直方图特征等图像基本特征,将提取到的特征输入到机器学习算法(支持向量机、随机森林等)进行图像分类,该方法会丢失大量的有效信息,从而会导致分类结果不准确。基于深度学习的眼底视网膜图像分类方法属于一种端到端的应用场景,会自动提取图像特征,并将提取到的图像特征进行自动化分类。该方法存在的问题在于:针对眼底视网膜糖尿病性视网膜图片数据集分布不平衡所做的处理存在一定的局限,没有进行合理的处置,且模型分类算法存在一定的局限性。
发明内容
本申请提供了一种医学图像分类方法、系统、终端以及存储介质,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种医学图像分类方法,包括:
收集不同类别的医学图像数据集;
利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。
本申请实施例采取的技术方案还包括:所述收集不同类别的医学图像数据集还包括:
对所述医学图像数据集进行预处理,并将预处理后的医学图像数据集按照设定比例划分为训练集、验证集以及测试集。
本申请实施例采取的技术方案还包括:所述对所述医学图像数据集进行预处理包括图像归一化以及图像的resize操作,所述图像归一化公式为:
所述图像的resize操作具体为:利用最近邻插值算法将所述医学图像数据集中的医学图像的高宽放缩至设定大小。
本申请实施例采取的技术方案还包括:所述利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理具体为:
计算所述训练集中各个类别的医学图像样本量,筛选出医学图像样本量最多的类别N,并分别计算其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异值Diff;
判断是否成立,其中M表示所述其他类别的医学图像样本量,如果成立,表示所述其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异不大,则从所述其他类别的医学图像中随机抽取/>张医学图像,并对抽取的医学图像分别进行左右旋转、上下旋转以及系统旋转,生成新的医学图像,得到增强处理后的训练集;
判断是否成立,如果成立,表示所述其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异较大,则对所述其他类别中的所有医学图像分别进行左右旋转、上下旋转以及系统旋转,得到旋转后的医学图像;
将所述旋转后的医学图像输入训练好的对抗神经网络,所述对抗神经网络使用WGAN-GP算法生成Diff-4*M张新的医学图像,得到增强处理后的训练集。
本申请实施例采取的技术方案还包括:所述利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型具体为:
所述深度学习模型包括深度可分离卷积模块、第一残差模块、第二残差模块以及逐元素注意力机制模块,所述深度可分离卷积模块包括深度可分离层、批归一化层、relu激活函数和卷积层,所述逐元素注意力机制模块包括通道注意力子模块、高度注意力子模块以及宽度注意力子模块;
所述第一残差模块包括左侧和右侧两个分支,其输入的特征图维度为T∈RH,W,C,所述左侧分支为两个深度可分离卷积模块的串联,其特征图维度大小依次变换为RH,W,C//2,RH ,W,C,随后输入最大池化层,其特征图大小缩小一半特征图T∈RH/2,W/2,C;所述右侧分支包括卷积层,得到的特征图为特征图T∈RH/2,W/2,C,将所述左侧分支与右侧分支得到的特征图进行逐元素相加,并在最后添加一个逐元素注意力模块;
所述第二残差模块包括左侧和右侧两个分支,其输入的特征图维度为T∈RH,W,C,所述左侧分支为三个深度可分离卷积模块的串联,其输出特征图维度大小不变;将所述左侧分支与原始输入的特征图进行逐元素相加,并在最后添加一个逐元素注意力模块。
本申请实施例采取的技术方案还包括:在所述深度可分离卷积模块中,如果所述深度可分离层的步长为1,则所述深度可分离卷积模块的输入输出特征图大小保持一致;如果所述深度可分离层的步长为2,则所述深度可分离卷积模块的输出特征图高宽为输入特征图的一半。
本申请实施例采取的技术方案还包括:所述逐元素注意力机制模块的输入特征图张量为:T∈RH,W,C,其中H为特征图的高度,W为特征图的宽度,C为特征图的通道数;
所述通道注意力子模块包括两个分支,分别使用全局平均池化与全局最大池化对两个分支进行操作,分别得到Gm1∈RC,Gm2∈RC;随后将两个分支上的结果进行reshpe操作,分别得到Rs1∈R1,1,C,Rs2∈R1,1,C;得到特征图进行通道降低的全连接层,得到的特征图为Dense1∈R1,1,C/ratio,再连接一个通道恢复的全连接层,得到的特征图为Dense2∈R1,1,C;然后将两个分支的值进行逐元素相加并加入sigmoid激活函数,最后得到基于输入特征图的通道注意力权重值A∈R1,1,C;
所述宽度注意力子模块包括两个分支,用于在高度上分别进行均值计算与最大值计算,分别得到的特征图张量为Hm1∈R1,W,C,Hm2∈R1,W,C,然后将Hm1∈R1,W,C,Hm2∈R1,W,C进行拼接,得到特征向量Cc2∈R2,W,C;然后加入深度可分离卷积模块,在特征图高度上进行均值化处理,得到特征图M2∈R1,W,C;
所述高度注意力子模块包括两个分支,用于在宽度上分别进行均值计算与最大值计算,分别得到的特征图张量为Wm1∈RH,1,C,Wm2∈RH,1,C,然后将Wm1∈RH,1,C,Wm2∈RH,1,C进行拼接,得到特征向量Cc1∈RH,2,C;然后加入所述深度可分离卷积模块,在特征图宽度上进行均值化处理,得到特征图M1∈RH,1,C;最后将输入特征图T∈RH,W,C、通道注意力子模块输出特征图A∈R1,1,C、宽度注意力子模块M2∈R1,W,C、高度注意力子模块M2∈RH,1,C相乘,得到所述逐元素注意力机制模块的输出特征图向量T∈RH,W,C。
本申请实施例采取的另一技术方案为:一种医学图像分类系统,包括:
数据收集模块:用于收集不同类别的医学图像数据集;
数据增强模块:用于利用基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
模型训练模块:用于利用图像基础旋转变换以及所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
图像分类模块:用于通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。
本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现所述医学图像分类方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制医学图像分类。
本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述医学图像分类方法。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的医学图像分类方法、系统、终端以及存储介质提出了一种基于逐元素注意力机制的医学图像分类,通过收集不同类别的医学图像样本,使用基于深度学习的图像生成和图像旋转技术对医学图像样本进行上采样处理,以使得各个类别的医学图像样本达到均衡,最后使用样本量均衡的医学图像样本训练基于逐元素注意力机制的深度学习模型,利用训练好的深度学习模型对医学图像进行分类。本发明有效解决了医学图像数据集分布不平衡所存在的局限性,并有效提高模型的检测效率与分类精度。
附图说明
图1是本申请第一实施例的医学图像分类方法的流程图;
图2是本申请第二实施例的医学图像分类方法的流程图;
图3是本申请实施例的医学图像增强处理流程图;
图4是本申请实施例的基于逐元素注意力机制的深度学习模型构建流程图;
图5为本申请实施例中DSC模块搭建流程图;
图6为本申请实施例中Attention block模块搭建流程图;
图7为本申请实施例中Res block A模块搭建流程图;
图8为本申请实施例中Res block B模块搭建流程图;
图9为本申请实施例的医学图像分类系统结构示意图;
图10为本申请实施例的终端结构示意图;
图11为本申请实施例的存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请第一实施例的医学图像分类方法的流程图。本申请第一实施例的医学图像分类方法包括以下步骤:
S100:收集不同类别的医学图像数据集;
S110:利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
S120:利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
S130:通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。
本申请第一实施例的医学图像分类方法通过收集不同类别的医学图像样本,然后使用基于深度学习的图像生成和图像旋转技术对医学图像样本进行上采样处理,以使得各个类别的医学图像样本达到均衡,最后使用样本量均衡的医学图像样本训练基于逐元素注意力机制的深度学习模型,利用训练好的深度学习模型对医学图像进行分类。本发明有效解决了医学图像数据集分布不平衡所存在的局限性,并有效提高模型的检测效率与分类精度。
请参阅图2,是本申请第二实施例的医学图像分类方法的流程图。本申请第二实施例的医学图像分类方法包括以下步骤:
S200:收集不同类别的医学图像数据集;
本步骤中,收集的医学图像数据集包括:正常、轻度、中度、重度或增殖性病变5个类别,各个类别的样本量分别为25,810、2,443、5,292、873和708,具体可根据实际应用场景进行设定。可以理解,本申请适用于多种类型的医学图像分类,为便于说明,以下实施例中仅以糖尿病性视网膜病变医学图像为例。
S210:对医学图像数据集进行预处理,并将预处理后的医学图像数据集按照设定比例划分为训练集、验证集以及测试集;
本步骤中,图像预处理包括图像归一化以及resize(改变图像大小)操作。其中,图像归一化公式如下:
图像的resize操作具体为:利用最近邻插值算法将原始医学图像的高宽放缩到512*512。
本申请实施例中,训练集、验证集以及测试集的划分比例为6:2:2,具体可根据实际应用场景进行设定。
S220:利用图像基础旋转变换以及基于深度学习的图像生成算法对训练集中的医学图像进行图像增强处理,生成增强后的训练集数据;
本步骤中,由于收集到的医学图像数据集中各个类别的样本量存在严重的不平衡,因此本申请通过对训练集中不同类别的医学图像进行上采样增强处理,使训练集中各个类别的医学图像样本量达到平衡状态。具体地,请参阅图3,是本申请实施例的医学图像增强处理流程图,其具体包括以下步骤:
S221:计算训练集中各个类别的医学图像样本量,筛选出医学图像样本量最多的类别N,并分别计算其他类别的医学图像样本量与类别N的医学图像样本量之间的差异值Diff;
S222:判断是否成立,其中M表示其他类别的医学图像样本量,如果成立,表示其他类别的医学图像样本量与类别N的医学图像样本量之间的差异不大,则执行S223;
S223:从其他类别的医学图像中随机抽取张医学图像,并对抽取的医学图像分别进行左右旋转、上下旋转以及系统旋转,生成新的医学图像,得到增强处理后的训练集;
本步骤中,当各个类别之间的样本量差异较小时,根据差异值Diff将样本量较小的类别的医学图像进行旋转并生成新的医学图像,以使得各个类别的医学图像样本达到均衡。其中,在对医学图像进行左右旋转时,沿原始医学图像的垂直中心线进行旋转;在对医学图像进行上下旋转时,沿原始医学图像的水平中心线进行旋转。在对医学图像进行系统旋转时,先对医学图像进行左右旋转再对旋转后的医学图像进行上下旋转。
S224:判断是否成立,如果成立,表示其他类别的医学图像样本量与类别N的医学图像样本量之间的差异较大,则执行S225;
S225:对其他类别中的所有医学图像分别进行左右旋转、上下旋转以及系统旋转,得到旋转后的医学图像;
S226:将旋转后的医学图像输入训练好的对抗神经网络,对抗神经网络使用WGAN-GP算法生成Diff-4*M张新的医学图像,得到增强处理后的训练集;
其中,当各个类别之间的样本量差异悬殊时,仅仅通过对图像进行旋转生成新的图像仍然难以保持各个类别之间的样本量均衡,因此需要训练一个对抗神经网络,在对图像进行旋转后,基于旋转后的图像,利于对抗神经网络生成一定数量的新的医学图像,以使得各个类别的图像样本达到均衡。其中,对抗神经网络为使用WGAN-GP算法在各个类别的医学图像之间训练300次得到的网络模型。
S230:利用训练集训练得到基于逐元素注意力机制的深度学习模型;
本步骤中,请参阅图4,是本申请实施例的基于逐元素注意力机制的深度学习模型构建流程图。所述深度学习模型包括深度可分离卷积模块(DSC block)、第一残差模块(Resblock A)、第二残差模块(Res block B)以及逐元素注意力机制模块(Attention block)。
具体的,如图5所示,为本申请实施例中DSC模块搭建流程图。深度可分离卷积模块包括深度可分离层、批归一化层、relu激活函数和卷积层。深度可分离卷积模块作为本发明的基础模块,其使用深度可分离模块可以大大减少训练参数量。对于深度可分离卷积模块,其输入特征图的变化主要在深度可分离层,如果深度可分离层的步长为1,则深度可分离卷积模块的输入输出特征图大小保持一致;如果深度可分离层的步长为2,则深度可分离卷积模块的输出特征图高宽是输入特征图的一半。
如图6所示,为本申请实施例中Attention block模块搭建流程图。逐元素注意力机制模块包括通道注意力子模块、高度注意力子模块以及宽度注意力子模块。输入特征图张量为:T∈RH,W,C,其中H为特征图的高度,W为特征图的宽度,C为特征图的通道数。其中通道注意力子模块包括两个分支,分别使用全局平均池化与全局最大池化对其进行操作,分别得到Gm1∈RC,Gm2∈RC;随后将两个分支上的reshpe操作,分别得到Rs1∈R1,1,C,Rs2∈R1,1,C;得到特征图进行通道降低的全连接层,得到的特征图为Dense1∈R1,1,C/ratio,在本发明实施例中,ratio参数为8;在连接一个通道恢复的全连接层,得到的特征图为Dense2∈R1,1,C;然后将两个分支的值进行逐元素相加并加入sigmoid激活函数,最后得到基于输入特征图的通道注意力权重值A∈R1,1,C。其中宽度注意力子模块包括两个分支,用于在高度上分别进行均值计算与最大值计算,分别得到的特征图张量为Hm1∈R1,W,C,Hm2∈R1,W,C,然后将Hm1∈R1 ,W,C,Hm2∈R1,W,C进行拼接,得到特征向量Cc2∈R2,W,C;然后加入深度可分离卷积模块,在特征图高度上进行均值化处理,得到特征图M2∈R1,W,C。高度注意力子模块包括两个分支,用于在宽度上分别进行均值计算与最大值计算,分别得到的特征图张量为Wm1∈RH,1,C,Wm2∈RH ,1,C,然后将Wm1∈RH,1,C,Wm2∈RH,1,C进行拼接,得到特征向量Cc1∈RH,2,C;然后加入所述深度可分离卷积模块,在特征图宽度上进行均值化处理,得到特征图M1∈RH,1,C。将输入特征图T∈RH,W,C、通道注意力子模块输出特征图A∈R1,1,C、宽度注意力子模块M2∈R1,W,C、高度注意力子模块M1∈RH,1,C相乘,得到逐元素注意力机制模块的输出特征图向量T∈RH,W,C。
如图7所示,为本申请实施例中Res block A模块搭建流程图。第一残差模块包括左侧和右侧两个分支,输入特征图的特征图维度为T∈RH,W,C,输入该模块的通道数为C,其左侧分支为两个DSC block的串联,其特征图维度大小依次变换为RH,W,C//2,RH,W,C。随后输入最大池化层,其特征图大小缩小一半特征图T∈RH/2,W/2,C。右侧分支包括卷积层,得到的特征图为特征图T∈RH/2,W/2,C。逐元素相加是将左侧与右侧得到的特征图进行相加,最后添加一个逐元素注意力模块。
如图8所示,为本申请实施例中Res block B模块搭建流程图。第二残差模块包括左侧和右侧两个分支。输入特征图的特征图维度为T∈RH,W,C,其左侧分支为三个DSC block的串联,其特征图维度大小不变。逐元素相加是将左侧与原始输入得到的特征图进行相加,最后添加一个逐元素注意力模块。
如图4所示,整个深度学习模型的输入为医学图像,在本发明实施例中,输入特征图的大小为T512,512,3,其具体的分类算法包括:
第①步、将深度可分离卷积模块的步长设置为2,输出通道数设置为32,输入特征图经过处理后,输出的特征图大小变为T256,256,32;
第②步、将深度可分离卷积模块的步长设置为1,输出通道数设置为64,第①步的输出在经过第②步处理后,输出特征图大小变为T256,256,64;
第③步、Res block B的特征图维度大小不变,输出特征图大小为T256,256,64;
第④步、Res block A的输入通道数参数为80,特征图高宽缩小一半,通道数变为80,输出特征图大小为T128,128,80;
第⑤步、Res block B的特征图维度大小不变,输出特征图大小为T128,128,80;
第⑥步、Res block A的输入通道数参数为128,特征图高宽缩小一半,通道数变为128,输出特征图大小为T64,64,128;
第⑦步、Res block B的特征图维度大小不变,输出特征图大小为T64,64,128;
第⑧步、Res block A的输入通道数参数为160,特征图高宽缩小一半,通道数变为160,输出特征图大小为T32,32,160;
第⑨步、Res block B的特征图维度大小不变,输出特征图大小为T32,32,160;
第⑩步、Res block A的输入通道数参数为320,特征图高宽缩小一半,通道数变为320,输出特征图大小为T16,16,320;
第步、B block模块的特征图维度大小不变,输出特征图大小为T32,32,160;
第步、通过全局平均池化模块将特征图向量的高度宽度数值求平均值,得到特征维度变化为T160;
第步、在随机失活模块后连接神经元为class*10,激活函数为relu的全连接层,其中class为5,特征维度变为T5*50;
第步、在随机失活函数后连接神经元为class,激活函数的softmax的全连接层,并输出输入医学图像所属病变类别的概率值。
基于上述,本申请实施例通过提出一种逐元素注意力机制进行深度学习模型,在模型训练时,为每一个元素提供一个权重,使得模型提供每一个像素点的重要性分数值,从而提高了医学图像信息的利用率,降低无用信息的干扰。所述逐元素注意力机制可以插入到任何分类网络中,从而可以提高算法的评价指标。本申请实施例的深度学习模型在主干网络中使用了深度可分离技术,并与逐元素注意力机制进行融合,可以降低模型的参数量,并使用了“残差”思想以及“深度可分离卷积”思想,可以有效提高模型的检测效率与效果。
S240:将待分类的医学图像输入训练好的基于逐元素注意力机制的深度学习模型,通过基于逐元素注意力机制的深度学习模型输出医学图像的病变类别。
本申请第二实施例的医学图像分类方法提出了一种基于逐元素注意力机制的医学图像分类,首先收集不同类别的医学图像样本,然后对医学图像样本进行预处理,以获取高质量的图像样本;其次使用基于深度学习的图像生成和图像旋转技术对医学图像样本进行上采样处理,以使得各个类别的医学图像样本达到均衡,最后使用样本量均衡的医学图像样本训练基于逐元素注意力机制的深度学习模型,利用训练好的深度学习模型对医学图像进行分类。本发明有效解决了医学图像数据集分布不平衡所存在的局限性,并有效提高模型的检测效率与分类精度。
请参阅图9,为本申请实施例的医学图像分类系统结构示意图。本申请实施例的医学图像分类系统40包括:
数据收集模块41:用于收集不同类别的医学图像数据集;
数据增强模块42:用于利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
模型训练模块43:用于利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
图像分类模块44:用于通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。
请参阅图10,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。
存储器52存储有用于实现上述医学图像分类方法的程序指令。
处理器51用于执行存储器52存储的程序指令以控制医学图像分类。
其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图11,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种医学图像分类方法,其特征在于,包括:
收集不同类别的医学图像数据集;
利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类;
所述利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型具体为:
所述深度学习模型包括深度可分离卷积模块、第一残差模块、第二残差模块以及逐元素注意力机制模块,所述深度可分离卷积模块包括深度可分离层、批归一化层、relu激活函数和卷积层,所述逐元素注意力机制模块包括通道注意力子模块、高度注意力子模块以及宽度注意力子模块;
所述第一残差模块包括左侧和右侧两个分支,其输入的特征图维度为T∈RH,W,C,所述左侧分支为两个深度可分离卷积模块的串联,其特征图维度大小依次变换为RH,W,C//2,RH,W,C,随后输入最大池化层,其特征图大小缩小一半特征图T∈RH/2,W/2,C;所述右侧分支包括卷积层,得到的特征图为特征图T∈RH/2,W/2,C,将所述左侧分支与右侧分支得到的特征图进行逐元素相加,并在最后添加一个逐元素注意力模块;
所述第二残差模块包括左侧和右侧两个分支,其输入的特征图维度为T∈RH,W,C,所述左侧分支为三个深度可分离卷积模块的串联,其输出特征图维度大小不变;将所述左侧分支与原始输入的特征图进行逐元素相加,并在最后添加一个逐元素注意力模块;
所述逐元素注意力机制模块的输入特征图张量为:T∈RH,W,C,其中H为特征图的高度,W为特征图的宽度,C为特征图的通道数;
所述通道注意力子模块包括两个分支,分别使用全局平均池化与全局最大池化对两个分支进行操作,分别得到Gm1∈RC,Gm2∈RC;随后将两个分支上的结果进行reshpe操作,分别得到Rs1∈R1,1,C,Rs2∈R1,1,C;得到特征图进行通道降低的全连接层,得到的特征图为Dense1∈R1,1,C/ratio,再连接一个通道恢复的全连接层,得到的特征图为Dense2∈R1,1,C;然后将两个分支的值进行逐元素相加并加入sigmoid激活函数,最后得到基于输入特征图的通道注意力权重值A∈R1,1,C;
所述宽度注意力子模块包括两个分支,用于在高度上分别进行均值计算与最大值计算,分别得到的特征图张量为Hm1∈R1,W,C,Hm2∈R1,W,C,然后将Hm1∈R1,W,C,Hm2∈R1,W,C进行拼接,得到特征向量Cc2∈R2,W,C;然后加入深度可分离卷积模块,在特征图高度上进行均值化处理,得到特征图M2∈R1,W,C;
所述高度注意力子模块包括两个分支,用于在宽度上分别进行均值计算与最大值计算,分别得到的特征图张量为Wm1∈RH,1,C,Wm2∈RH,1,C,然后将Wm1∈RH,1,C,Wm2∈RH,1,C进行拼接,得到特征向量Cc1∈RH,2,C;然后加入所述深度可分离卷积模块,在特征图宽度上进行均值化处理,得到特征图M1∈RH,1,C;最后将输入特征图T∈RH,W,C、通道注意力子模块输出特征图A∈R1,1,C、宽度注意力子模块M2∈R1,W,C、高度注意力子模块M1∈RH,1,C相乘,得到所述逐元素注意力机制模块的输出特征图向量T∈RH,W,C。
2.根据权利要求1所述的医学图像分类方法,其特征在于,所述收集不同类别的医学图像数据集还包括:
对所述医学图像数据集进行预处理,并将预处理后的医学图像数据集按照设定比例划分为训练集、验证集以及测试集。
3.根据权利要求2所述的医学图像分类方法,其特征在于,所述对所述医学图像数据集进行预处理包括图像归一化以及图像的resize操作,所述图像归一化公式为:
所述图像的resize操作具体为:利用最近邻插值算法将所述医学图像数据集中的医学图像的高宽放缩至设定大小。
4.根据权利要求3所述的医学图像分类方法,其特征在于,所述利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理具体为:
计算所述训练集中各个类别的医学图像样本量,筛选出医学图像样本量最多的类别N,并分别计算其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异值Diff;
判断是否成立,其中M表示所述其他类别的医学图像样本量,如果成立,表示所述其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异不大,则从所述其他类别的医学图像中随机抽取/>张医学图像,并对抽取的医学图像分别进行左右旋转、上下旋转以及系统旋转,生成新的医学图像,得到增强处理后的训练集;
判断是否成立,如果成立,表示所述其他类别的医学图像样本量与所述类别N的医学图像样本量之间的差异较大,则对所述其他类别中的所有医学图像分别进行左右旋转、上下旋转以及系统旋转,得到旋转后的医学图像;
将所述旋转后的医学图像输入训练好的对抗神经网络,所述对抗神经网络使用WGAN-GP算法生成Diff-4*M张新的医学图像,得到增强处理后的训练集。
5.根据权利要求4所述的医学图像分类方法,其特征在于,在所述深度可分离卷积模块中,如果所述深度可分离层的步长为1,则所述深度可分离卷积模块的输入输出特征图大小保持一致;如果所述深度可分离层的步长为2,则所述深度可分离卷积模块的输出特征图高宽为输入特征图的一半。
6.一种利用权利要求1所述医学图像分类方法的医学图像分类系统,其特征在于,包括:
数据收集模块:用于收集不同类别的医学图像数据集;
数据增强模块:用于利用图像基础旋转变换以及基于深度学习的图像生成算法对所述医学图像数据集进行图像增强处理,生成样本量均衡的医学图像数据集;
模型训练模块:用于利用所述样本量均衡的医学图像数据集训练得到基于逐元素注意力机制的深度学习模型;
图像分类模块:用于通过所述基于逐元素注意力机制的深度学习模型对待分类医学图像进行分类。
7.一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现权利要求1-5任一项所述的医学图像分类方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制医学图像分类。
8.一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至5任一项所述医学图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211143228.7A CN115908964B (zh) | 2022-09-20 | 2022-09-20 | 一种医学图像分类方法、系统、终端以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211143228.7A CN115908964B (zh) | 2022-09-20 | 2022-09-20 | 一种医学图像分类方法、系统、终端以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115908964A CN115908964A (zh) | 2023-04-04 |
CN115908964B true CN115908964B (zh) | 2023-12-12 |
Family
ID=86484817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211143228.7A Active CN115908964B (zh) | 2022-09-20 | 2022-09-20 | 一种医学图像分类方法、系统、终端以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115908964B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689089A (zh) * | 2019-10-12 | 2020-01-14 | 电子科技大学 | 用于深度学习多类别医疗图像分类的主动增量训练方法 |
CN112270347A (zh) * | 2020-10-20 | 2021-01-26 | 西安工程大学 | 一种基于改进ssd的医疗废弃物分类检测方法 |
CN112700434A (zh) * | 2021-01-12 | 2021-04-23 | 苏州斯玛维科技有限公司 | 医学图像的分类方法及其分类装置 |
CN112949565A (zh) * | 2021-03-25 | 2021-06-11 | 重庆邮电大学 | 基于注意力机制的单样本部分遮挡人脸识别方法及系统 |
CN113378984A (zh) * | 2021-07-05 | 2021-09-10 | 国药(武汉)医学实验室有限公司 | 一种医学图像分类方法、系统、终端以及存储介质 |
CN114120030A (zh) * | 2021-11-01 | 2022-03-01 | 中国科学技术大学 | 基于注意力机制的医学图像处理方法及相关设备 |
CN114494195A (zh) * | 2022-01-26 | 2022-05-13 | 南通大学 | 用于眼底图像分类的小样本注意力机制并行孪生方法 |
CN114638814A (zh) * | 2022-03-29 | 2022-06-17 | 华南农业大学 | 基于ct图像的结直肠癌自动分期方法、系统、介质及设备 |
-
2022
- 2022-09-20 CN CN202211143228.7A patent/CN115908964B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689089A (zh) * | 2019-10-12 | 2020-01-14 | 电子科技大学 | 用于深度学习多类别医疗图像分类的主动增量训练方法 |
CN112270347A (zh) * | 2020-10-20 | 2021-01-26 | 西安工程大学 | 一种基于改进ssd的医疗废弃物分类检测方法 |
CN112700434A (zh) * | 2021-01-12 | 2021-04-23 | 苏州斯玛维科技有限公司 | 医学图像的分类方法及其分类装置 |
CN112949565A (zh) * | 2021-03-25 | 2021-06-11 | 重庆邮电大学 | 基于注意力机制的单样本部分遮挡人脸识别方法及系统 |
CN113378984A (zh) * | 2021-07-05 | 2021-09-10 | 国药(武汉)医学实验室有限公司 | 一种医学图像分类方法、系统、终端以及存储介质 |
CN114120030A (zh) * | 2021-11-01 | 2022-03-01 | 中国科学技术大学 | 基于注意力机制的医学图像处理方法及相关设备 |
CN114494195A (zh) * | 2022-01-26 | 2022-05-13 | 南通大学 | 用于眼底图像分类的小样本注意力机制并行孪生方法 |
CN114638814A (zh) * | 2022-03-29 | 2022-06-17 | 华南农业大学 | 基于ct图像的结直肠癌自动分期方法、系统、介质及设备 |
Non-Patent Citations (2)
Title |
---|
Coordinate Attention for Efficient Mobile Network Design;Qibin Hou et al.;arXiv;第1-10页 * |
Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions;Yichao Liu et al.;arXiv;第1-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115908964A (zh) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3674968B1 (en) | Image classification method, server and computer readable storage medium | |
CN108198184B (zh) | 造影图像中血管分割的方法和系统 | |
CN109118495B (zh) | 一种视网膜血管分割方法和装置 | |
CN112132817B (zh) | 一种混合注意力机制的眼底图像视网膜血管分割方法 | |
Abramoff et al. | Automated segmentation of the optic disc from stereo color photographs using physiologically plausible features | |
CN110236483B (zh) | 一种基于深度残差网络的糖尿病性视网膜病变检测的方法 | |
CN111882566B (zh) | 视网膜图像的血管分割方法、装置、设备及存储介质 | |
CN107464217A (zh) | 一种图像处理方法及装置 | |
CN110211685B (zh) | 基于完全关注机制的糖网筛查网络结构模型 | |
CN115731242A (zh) | 基于混合注意力机制和非对称卷积的视网膜血管分割方法 | |
CN114219719A (zh) | 基于双重注意力和多尺度特征的cnn医学ct图像去噪方法 | |
CN112927209A (zh) | 一种基于cnn的显著性检测系统和方法 | |
CN110610480B (zh) | 基于Attention机制的MCASPP神经网络眼底图像视杯视盘分割模型 | |
CN113011340B (zh) | 一种基于视网膜图像的心血管手术指标风险分类方法及系统 | |
CN115908964B (zh) | 一种医学图像分类方法、系统、终端以及存储介质 | |
CN113673396A (zh) | 一种孢子发芽率计算方法、装置及存储介质 | |
CN116958736A (zh) | 一种基于跨模态边缘引导的rgb-d显著性目标检测方法 | |
CN116740076A (zh) | 视网膜色素变性眼底图像中色素分割的网络模型及方法 | |
BERBAR | Diabetic retinopathy detection and grading using deep learning | |
CN116092667A (zh) | 基于多模态影像的疾病检测方法、系统、装置及存储介质 | |
CN109978819B (zh) | 一种基于低尺度血管检测分割视网膜血管的方法 | |
Alsuwat et al. | Prediction of Diabetic Retinopathy using Convolutional Neural Networks | |
Kiefer et al. | Automated Fundus Image Standardization Using a Dynamic Global Foreground Threshold Algorithm | |
Tojo et al. | Medical image denoising using scaled dual convolutional neural network (SD-CNN) | |
CN114119422B (zh) | 无参考低照度内窥镜图像质量增强方法、系统及相关组件 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |