CN117274282A - 一种基于知识蒸馏的医学图像分割方法、系统、设备 - Google Patents
一种基于知识蒸馏的医学图像分割方法、系统、设备 Download PDFInfo
- Publication number
- CN117274282A CN117274282A CN202311289531.2A CN202311289531A CN117274282A CN 117274282 A CN117274282 A CN 117274282A CN 202311289531 A CN202311289531 A CN 202311289531A CN 117274282 A CN117274282 A CN 117274282A
- Authority
- CN
- China
- Prior art keywords
- model
- parameters
- medical image
- segmentation
- student
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003709 image segmentation Methods 0.000 title claims abstract description 40
- 230000011218 segmentation Effects 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 26
- 239000011159 matrix material Substances 0.000 claims description 32
- 238000010586 diagram Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 238000004821 distillation Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000000998 batch distillation Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
- G06V10/7788—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors the supervisor being a human, e.g. interactive learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及智能医疗领域,具体涉及一种基于知识蒸馏的医学图像分割方法、系统、设备。包括获取医学图像;将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:S1:获取医学图像数据集及标签;S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练得到教师模型参数和学生模型参数,学生模型通过学习教师模型的参数更新自身参数得到更新后的学生模型参数,S3:判断更新后的学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。本申请提出的方法能够在轻量级的模型上实现较高的准确率,能够实时检测分割图像,具有很好临床价值。
Description
技术领域
本领域涉及智能医疗领域,具体涉及一种基于知识蒸馏的医学图像分割方法、系统、设备、计算机可存储介质。
背景技术
随着现代医学的不断发展,各种医疗影像设备应用于临床诊疗,CT图像、X光图像、超声图像、PET图像和MRI图像等均为医师诊断治疗发挥着重要的作用。医学图像分割的主要目的是从各类医学图像中自动分割出病灶区域,辅助医师更快、更准确地做出诊断,极大地提高了医师的诊断效率。因此,医学图像分割模型的分割效果就显得格外重要。与此同时,医学图像相对于自然图像而言,背景环境更为复杂,具体表现在结构边缘更为模糊、形状更为多变、纹理结构细节更为丰富,使得医学图像分割任务更加具有挑战性。随着深度学习在医学图像分割中的广泛应用,医学图像分割得到快速的发展。卷积神经网络的出现,尤其是全卷积神经网络的出现让深度学习模型具备了高速度、高精度和全自动的特点。这些方法通常需要大量的标注数据和计算资源来训练复杂的模型,如FCN、DeepLab、SegNeXt等。然而,这些模型在推理时需要较长的时间和较高的内存消耗,不适合用于实时的医学图像分割,并且由于医学图像的复杂性以及目标区域的多样性,导致医学图像在边缘区域分割不完全和图像上下文特征信息利用不充分的问题上受到限制。
为了解决推理时间过长,不具备实时性的问题,一种可行的方案是使用嵌入式AI处理器来加速宫腔镜图像目标检测。嵌入式AI处理器是一种专门设计用于执行人工智能任务的芯片,如NVIDIA Jetson Nano、Google Coral Edge TPU等。这些芯片具有低功耗、高性能、小尺寸等优点,可以在边缘设备上实现快速的图像处理和推理。然而,直接将深度学习模型部署到嵌入式AI处理器上仍然存在一些问题,如模型过大、计算量过高、精度损失等。
发明内容
针对上述问题,本文提出一种基于知识蒸馏的医学图像分割方法,利用更好的大模型训练轻量化的小模型,使得轻量化小模型获得更好的性能和精度,降低模型的参数量和计算量,具体方法如下:
获取医学图像;
将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练得到教师模型参数和学生模型参数,学生模型通过学习教师模型的参数更新自身参数得到更新后的学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断更新后的学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
进一步,从所述特征图得到所述边界损失参数的特征处理包括:提取所述编码模块的前N层特征图,N为大于等于1的自然数,将所述前N层特征图进行特征融合后做自注意力计算得到增强特征图,所述增强特征图结合真实边界共同计算出边界损失参数。
所述教师模型与所述学生模型通过计算语义相似度分别对每个图像生成一个像素到像素的像像关系矩阵、一个像素到区域的像区关系矩阵;并且通过计算不同图像之间的相似度生成跨图像关系矩阵。
进一步,所述跨图像关系矩阵是通过计算每一对图像关系矩阵的JS散度后转换为相似度值得到的,具体的公式为:
其中,和/>分别表示老师网络或学生网络的距离值和相似度值,/>和/>分别表示第i个图像和第j个图像的像像关系矩阵或像区关系矩阵,JS表示JS散度函数,λ是一个超参数。
进一步,对所述跨图像关系矩阵进行知识蒸馏,知识蒸馏产生的损失参数为:
其中,Lbatchp2p是批内像素到像素的关系知识蒸馏损失,Lmemoryp2p是批外像素到像素的关系知识蒸馏损失,Lmemoryp2r是批外像素到区域的关系知识蒸馏损失,B是批次大小,M是记忆库大小,和/>分别是老师网络和学生网络的跨图像相似度值,/>和/>分别是老师网络和学生网络的跨图像区域相似度值。
进一步,老师模型的损失参数包括下列的一种或几种:所述知识蒸馏产生的损失参数、传统的知识蒸馏损失参数、分割损害参数,学生模型的损失参数包括下列的一种或几种:传统的知识蒸馏损失参数、分割损害参数、边界损失参数通过加权计算得到总损失参数,所述总损失参数对学生模型进行参数更新。
进一步,损失老师模型的参数与学生模型的参数通过加权计算得到总损失参数,上述学生模型通过所述总损失参数更新模型得到更新后的学生模型。
本申请的目的在于提供一种基于知识蒸馏的医学图像分割系统,包括:
数据获取单元:获取医学图像;
图像分割单元:将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练,学生模型通过学习教师模型的参数更新自身参数得到新学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断新学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
本申请的目的在于提供一种基于知识蒸馏的医学图像分割设备,包括:
存储器与处理器,所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时实现任意一项上述的基于知识蒸馏的医学图像分割方法。
本申请的目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任意一项上述的基于知识蒸馏的医学图像分割方法。
本申请的优势:
1.本申请采用知识蒸馏技术让轻量化小模型学习大模型的参数,使得小模型达到更优的性能,能够满足实时处理医学图像的检测分割的需求。
2.本申请采用了边界增强模块用于图像分割中增强边界特征,提高模型在分割中的准确率。
3.本申请在进行知识蒸馏的学生模型在更新参数时综合了边界增强损失参数、传统的知识蒸馏损失参数、传统的分割损失参数、蒸馏跨图像关系矩阵产生的损失参数,通过计算像素与像素之间以及像素与区域之间的相似度,将全局像素相关性从教师转移到学生进行语义分割,从而在整幅图像之间传递结构化的像素与像素、像素与区域之间的关系,使得蒸馏的方法可以较好地应用于目标检测任务。将所得性能良好的轻量化模型在AI处理器上进行部署,可以加快推理速度,满足医学图像检测和诊断对实时性的要求。
4.本申请通过对医学图像进行实时预处理和特征提取,然后使用经过大模型焦点和全局知识蒸馏的网络模型对图像中的特定组织、器官和病变区域等关键目标进行定位分割,最后将检测结果输出到显示器上,本发明能够有效地提高医学图像分割的速度和准确度,满足医学图像分割的实时性需求,降低推理时间和计算资源的消耗。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1为本发明实施例提供的一种基于知识蒸馏的医学图像分割方法流程示意图;
图2为本发明实施例提供的一种基于知识蒸馏的医学图像分割系统示意图;
图3为本发明实施例提供的一种基于知识蒸馏的医学图像分割设备示意图;
图4为本发明实施例提供的模型构建过程的流程图;
图5为本发明实施例提供的学生模型BE-UNet的网络结构图;
图6为本发明实施例提供的边界增强模块结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S101、S102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图1本发明实施例提供的一种基于知识蒸馏的医学图像分割方法示意图,具体包括:
S101:获取医学图像;
在一个实施例中,医学图像包括:CT图像、X光图像、超声图像、PET图像和MRI图像,这些图像是当前疾病诊断过程中重要的诊断依据,通过计算机视觉技术、人工智能手段能够提供有效的诊断辅助,比如三维重建、病灶图像分割、人体姿态异常检测,临床疾病分型分类。
S102:将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练,学生模型通过学习教师模型的参数更新自身参数得到新学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断新学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
在一个实施例中,医学图像分割主要处理的是医学领域所涉及到的各种图像的分割问题,比如常见的核磁共振(MRI)扫描图像。其主要任务是,从这些医学图像中分割出兴趣区域,比如特定器官部位、兴趣目标(如肿瘤)等。医学图像分割与日常生活中常见场景的分割任务不同,医学图像(如MRI图像)由于图像获取设备的影响,会出现对比度低、信噪比低、光强低等问题;且器官本身存在运动和形变(如心脏),个体之间也有差异。这些因素导致了医学图像分割的难度和其自身的算法设计特点。
在一个实施例中,知识蒸馏是一种模型压缩方法,是一种基于“教师-学生网络思想”的训练方式,将复杂且大的模型作为教师模型,学生模型结构较为简单,用教师模型来辅助学生模型的训练,教师模型学习能力强,可以将它学到的知识迁移给学习能力相对弱的学生模型,以此来增强学生模型的泛化能力。复杂笨重但是效果好的教师模型不上线,就单纯是个导师角色,真正部署上线进行预测任务的是灵活轻巧的学生小模型;知识蒸馏的过程分为2个阶段:
1原始模型训练:训练"Teacher模型",它的特点是模型相对复杂,也可以由多个分别训练的模型集成而成。对"Teacher模型"不作任何关于模型架构、参数量、是否集成方面的限制,唯一的要求就是,对于输入X,其都能输出Y,其中Y经过softmax的映射,输出值对应相应类别的概率值。
2精简模型训练:训练"Student模型",它是参数量较小、模型结构相对简单的单模型。同样的,对于输入X,其都能输出Y,Y经过softmax映射后同样能输出对应相应类别的概率值。
在一个实施例中,所述教师模型与所述学生模型采用下列的一种或几种:SegGPT、SAM、SEEM、U-Net、SegNet、PSPNet、DeepLab v3+,学生模型中嵌入边界增强模块。
在一个实施例中,增强边界是加强图片中物体的边界,突出边界;不改变物体内部数据量,图像边缘上的灰度变化平缓,而边缘两侧灰度变化比较快,图像的边缘一般是指在局部不连续的图像特征,在图像分割中,为进一步提高分割性能,我们引入一个新的损失函数,称为边界增强损失,在训练过程中明确地关注边界区域。
在一个实施例中,知识蒸馏的损失函数可以表示为L=αLsoft+βLhard,Lsoft表示老师与学生网络输出的概率分布之间的离散度,Lhard表示输入图像的标签与网络输出的概率分布的交叉熵,也就是softmax函数输出的概率分布和标签之间的loss;蒸馏时先加热后冷凝,加热(训练)的意思就是说,通过一个变量把老师网络的输出变得更加soft,冷凝(测试)的时候就是把这个变量去掉。因为在使用KL(Kullback-Leible)离散度作为损失函数来训练网络,计算loss时,比较大的分量所占的比例也大,模型学习起来会比较快。所以,当学生网络想从老师网络中学习尽可能多的知识时,老师网络输出的概率值相对于整个概率分布值(softmax输出值)要尽量大。
在一个实施例中,在实际训练分割网络任务过程中,损失函数的选择尤为重要。对于语义分割而言,极有可能存在着正负样本不均衡,或者说类别不平衡的问题,因此选择一个合适的损失函数对于模型收敛以及准确预测有着至关重要的作用,常用的语义分割损失函数包括交叉熵、带权交叉熵、Focal loss、dice loss、IOU loss、Tversky loss。
在一个实施例中,所述特征图得到所述边界损失参数的特征处理包括:提取所述编码模块的前N层特征图,N为大于等于1的自然数,将所述前N层特征图进行特征融合后做自注意力计算得到增强特征图,所述增强特征图结合真实边界共同计算出边界损失参数。
在一个实施例中,所述教师模型与所述学生模型通过计算语义相似度分别对每个图像生成一个像素到像素的像像关系矩阵、一个像素到区域的像区关系矩阵;并且通过计算不同图像之间的相似度生成跨图像关系矩阵。
在一个实施例中,所述跨图像关系矩阵是通过计算每一对图像关系矩阵的JS散度后转换为相似度值得到的,具体的公式为:
其中,和/>分别表示老师网络或学生网络的距离值和相似度值,/>和/>分别表示第i个图像和第j个图像的像像关系矩阵或像区关系矩阵,JS表示JS散度函数,λ是一个超参数。
在一个实施例中,对所述跨图像关系矩阵进行知识蒸馏,知识蒸馏产生的损失参数为:
其中,Lbatchp2p是批内像素到像素的关系知识蒸馏损失,Lmemoryp2p是批外像素到像素的关系知识蒸馏损失,Lmemoryp2r是批外像素到区域的关系知识蒸馏损失,B是批次大小,M是记忆库大小,和/>分别是老师网络和学生网络的跨图像相似度值,/>和/>分别是老师网络和学生网络的跨图像区域相似度值。
在一个实施例中,老师模型的损失参数包括下列的一种或几种:所述知识蒸馏产生的损失参数、传统的知识蒸馏损失参数、分割损害参数,学生模型的损失参数包括下列的一种或几种:传统的知识蒸馏损失参数、分割损害参数、边界损失参数通过加权计算得到总损失参数,所述总损失参数对学生模型进行参数更新。
在一个实施例中,损失老师模型的参数与学生模型的参数通过加权计算得到总损失参数,上述学生模型通过所述总损失参数更新模型得到更新后的学生模型。
在一个实施例中,本发明的模型构建过程如图4所示,首先输入医学图像,对医学图像进行预处理,将处理后的医学图像分别输至教师模型和学生模型中,其次,计算两个模型的像素到像素相似度值、像素到区域相似度值、跨图像区域相似度值、传统的知识蒸馏损失参数、传统的分割损失参数,然后对相似度值进行蒸馏得到像素到像素、像素到区域、跨图像区域的关系矩阵损失参数,此外,学生模型还结合边界增强模块得到边界增强损失参数,将边界增强损失参数、传统的知识蒸馏损失参数、传统的分割损失参数、像素到像素、像素到区域、跨图像区域的关系矩阵损失参数通过计算得到总损失参数,学生模型根据总损失参数进行模型参数更新,判断训练参数是否达到预期值,若是则将训练好的学生模型部署到AI处理器中用于医疗分割,若否则回到图像预处理阶段重复后续步骤。
在一个实施例中,本发明的学生模型进行参数更新时包括:
使用传统的知识蒸馏损失参数和分割损失参数+边界增强损失参数;
使用传统的知识蒸馏损失参数和分割损失参数+像素到像素、像素到区域、跨图像区域的关系矩阵损失参数;
使用传统的知识蒸馏损失参数和分割损失参数+边界增强损失参数+像素到像素、像素到区域、跨图像区域的关系矩阵损失参数。
在一个具体实施例中,本发明选择SegGPT作为教师网络,BE-UNet模型作为学生网络,它们都可以进行医学图像目标分割任务,例如分割肿瘤、器官、血管等,将图像输入分别输入到教师网络和BE-UNet中,得到特征图。其中,BE-UNet是在传统的UNet基础上增加了边界增强模块(Boundary Enhancement Module),该模块将UNet网络中前两层网络得到的特征图进行融合并进行注意力计算,随后再将得到的特征图与真实边界计算得到边界分割损失,并将此特征图与BE-UNet最终输出的特征图融合共同参与最终分割图的生成,具体的BE-UNet网络结构如图5所示,学生模型包括输入层、编码模块、边界增强模块、解码模块、输出层;输入层将图像数据输至编码模块,编码模块编码后将特征图输至解码模块,由解码模块输出解码后的特征图,此外,编码模块的前两层输出的特征图输至边界增强模块输出增减特征图,解码后的特征图与增强特征图融合后从输出层输出图像;边界增强模块的结构图如图6所示,编码模块前两层分别收到的特征图经过一维卷积或一维卷积+上采样后进行特征图融合得到融合特征图,对融合特征图进行自注意力计算得到增强特征图,将增强特征与真实边界相结合计算得到增强边界损失参数,并且增强特征图参与最终分割,即与解码后的特征图融合。
在一个具体实施例中,本发明为每个图像生成一个像素到像素的关系矩阵和一个像素到区域的关系矩阵,分别表示每个像素与其他像素或区域的语义相似度。具体来说,对于每个图像,首先使用老师网络和学生网络分别提取其特征图,然后将特征图划分为若干个区域,每个区域包含一定数量的像素。接着,计算每个像素与其他像素或区域的余弦相似度,得到两个关系矩阵,具体公式为:
其中,和/>分别表示老师网络或学生网络的像素到像素和像素到区域的关系矩阵,Ft,s表示老师网络或学生网络的特征图,Gt,s表示老师网络或学生网络的区域特征。
然后,计算不同图像之间的关系矩阵的相似度,得到一个跨图像关系矩阵,表示每个图像与其他图像的结构化语义关系。具体来说,对于每一对图像,首先将它们的关系矩阵展平为向量,然后计算它们之间的JS散度,得到一个距离值。接着,将距离值转换为相似度值,得到一个跨图像关系矩阵,具体矩阵公式为:
其中,和/>分别表示老师网络或学生网络的距离值和相似度值,/>和/>分别表示第i个图像和第j个图像的关系矩阵(可以是Rp2p或Rp2r),JS表示JS散度函数,λ是一个超参数;
再后,利用跨图像关系矩阵作为知识蒸馏的目标,让学生网络模仿老师网络在不同图像之间的结构化语义关系,结合传统的知识蒸馏损失和分割损失计算最终的损失函数。
其中,传统的知识蒸馏损失和分割损失由以下公式给出:
其中,Ltask是分割损失,Lkd是传统的知识蒸馏损失,N是图像中的像素数量,C是类别数量,yi,c是第i个像素是否属于第c个类别的真实标签,pi,c是第i个像素属于第c个类别的预测概率,Ft(i)和FS(i)分别是老师网络和学生网络对第i个像素提取的特征向量,跨图像关系矩阵作为知识蒸馏的目标由以下公式给出:
其中,Lbatchp2p是批内像素到像素的关系知识蒸馏损失,Lmemoryp2p是批外像素到像素的关系知识蒸馏损失,Lmemoryp2r是批外像素到区域的关系知识蒸馏损失,B是批次大小,M是记忆库大小,和/>分别是老师网络和学生网络的跨图像相似度值(可以是Sp2p或Sp2r),和/>分别是老师网络和学生网络的跨图像区域相似度值;
最终的Ltotal损失函数由以下公式给出:
Ltotal=Ltask+Lkd+αLbatchp2p+βLmemoryp2p+γLmemoryp2r+LBE
其中,α,β和γ是三个超参数,用来控制不同部分损失函数的权重。
最后,将总损失用于优化学生网络的参数,使其尽可能接近教师网络的输出,同时保持良好的分割性能。通过这种方式,学生网络可以从教师网络中学习到更多的结构化语义关系知识,从而提高其对医学图像目标分割的能力;重复上述步骤(从教师模型和学生模型获得图像数据到学生模型更新参数),直到训练次数达到预期值;使用学生网络对新的医学图像进行目标分割,并评估其准确性和效率。
在一个具体实施例中,本发明从教师网络和学生网络的特征图中计算像素到像素的关系矩阵和像素到区域的关系矩阵,并使像素与像素,像素与区域的关系从教师网络传递到学生网络,使用跨图像关系损失来学习到教师网络中像素与像素和像素与区域之间的关系;使用传统的知识蒸馏损失和分割损失来学习教师网络的语义分割知识。
在一个具体实施例中,将训练得到的轻量最优模型部署到合适的AI处理器中,使用NNIE进行加速,利用AI处理器的强大加速能力加速异常检测过程,增强实时性。
在一个具体实施例中推理引擎可采用3588嵌入式AI处理器,经过大模型蒸馏优化过的模型可以方便地进行部署,在边缘设备上实现快速的图像处理和推理。
图2本发明实施例提供的一种基于知识蒸馏的医学图像分割系统示意图,具体包括:
数据获取单元:获取医学图像;
图像分割单元:将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练,学生模型通过学习教师模型的参数更新自身参数得到新学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断新学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
图3本发明实施例提供的一种基于知识蒸馏的医学图像分割设备示意图,具体包括:
存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行任意一项上述的一种基于知识蒸馏的医学图像分割方法。
一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序被处理器执行时任意一项上述的一种基于知识蒸馏的医学图像分割方法。
本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以改善本方法的性能。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的介质存储可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于知识蒸馏的医学图像分割方法,其特征在于,所述方法具体包括:获取医学图像;
将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;
所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练得到教师模型参数和学生模型参数,学生模型通过学习教师模型的参数更新自身参数得到更新后的学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断更新后的学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
2.根据权利要求1所述的基于知识蒸馏的医学图像分割方法,其特征在于,从所述特征图得到所述边界损失参数的特征处理包括:提取所述编码模块的前N层特征图,N为大于等于1的自然数,将所述前N层特征图进行特征融合后做自注意力计算得到增强特征图,所述增强特征图结合真实边界共同计算出边界损失参数。
3.根据权利要求1所述的基于知识蒸馏的医学图像分割方法,其特征在于,所述教师模型与所述学生模型通过计算语义相似度分别对每个图像生成一个像素到像素的像像关系矩阵、一个像素到区域的像区关系矩阵;并且通过计算不同图像之间的相似度生成跨图像关系矩阵。
4.根据权利要求3所述的基于知识蒸馏的医学图像分割方法,其特征在于,所述跨图像关系矩阵是通过计算每一对图像关系矩阵的JS散度后转换为相似度值得到的,具体的公式为:
其中,和/>分别表示老师网络或学生网络的距离值和相似度值,/>和/>分别表示第i个图像和第j个图像的像像关系矩阵或像区关系矩阵,JS表示JS散度函数,λ是一个超参数。
5.根据权利要求4所述的基于知识蒸馏的医学图像分割方法,其特征在于,对所述跨图像关系矩阵进行知识蒸馏,知识蒸馏产生的损失参数为:
其中,Lbatchp2p是批内像素到像素的关系知识蒸馏损失,Lmemoryp2p是批外像素到像素的关系知识蒸馏损失,Lmemoryp2r是批外像素到区域的关系知识蒸馏损失,B是批次大小,M是记忆库大小,和/>分别是老师网络和学生网络的跨图像相似度值,/>和/>分别是老师网络和学生网络的跨图像区域相似度值。
6.根据权利要求5所述的基于知识蒸馏的医学图像分割方法,其特征在于,老师模型的损失参数包括下列的一种或几种:所述知识蒸馏产生的损失参数、传统的知识蒸馏损失参数、分割损害参数,学生模型的损失参数包括下列的一种或几种:传统的知识蒸馏损失参数、分割损害参数、边界损失参数通过加权计算得到总损失参数,所述总损失参数对学生模型进行参数更新。
7.根据权利要求6所述的基于知识蒸馏的医学图像分割方法,其特征在于,损失老师模型的参数与学生模型的参数通过加权计算得到总损失参数,上述学生模型通过所述总损失参数更新模型得到更新后的学生模型。
8.一种基于知识蒸馏的医学图像分割系统,其特征在于,包括:
数据获取单元:获取医学图像;
图像分割单元:将所述医学图像输至训练好的分割模型进行目标分割中得到目标图像;所述训练好的分割模型的训练步骤包括:
S1:获取医学图像数据集及标签;
S2:将所述医学图像数据集及标签分别输至教师模型和学生模型中进行训练,学生模型通过学习教师模型的参数更新自身参数得到新学生模型参数,其中,学生模型由编码模块、边界增强模块、解码模块组成,所述编码模块进行特征提取得到特征图,所述边界增强模块依据所述特征图依次进行特征处理得到边界损失参数和增强特征图,所述解码模块对特征图进行解码后与增强特征图融合作为学生模型的输出;
S3:判断新学生模型参数是否达到预期值,若是则导出新学生模型作为分割模型,若否则回到S2。
9.一种基于知识蒸馏的医学图像分割设备,其特征在于,包括:
存储器与处理器,所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时实现权利要求1-7任意一项上述的基于知识蒸馏的医学图像分割方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项上述的基于知识蒸馏的医学图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311289531.2A CN117274282B (zh) | 2023-10-08 | 2023-10-08 | 一种基于知识蒸馏的医学图像分割方法、系统、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311289531.2A CN117274282B (zh) | 2023-10-08 | 2023-10-08 | 一种基于知识蒸馏的医学图像分割方法、系统、设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117274282A true CN117274282A (zh) | 2023-12-22 |
CN117274282B CN117274282B (zh) | 2024-04-19 |
Family
ID=89214051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311289531.2A Active CN117274282B (zh) | 2023-10-08 | 2023-10-08 | 一种基于知识蒸馏的医学图像分割方法、系统、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117274282B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472676A (zh) * | 2019-08-05 | 2019-11-19 | 首都医科大学附属北京朝阳医院 | 基于深度神经网络的胃早癌组织学图像分类系统 |
US20220374709A1 (en) * | 2020-11-20 | 2022-11-24 | Akasa, Inc. | System and/or method for machine learning using binary poly loss function |
CN115908253A (zh) * | 2022-10-18 | 2023-04-04 | 中科(黑龙江)数字经济研究院有限公司 | 一种基于知识蒸馏的跨域医学影像分割方法及装置 |
CN116030235A (zh) * | 2022-12-29 | 2023-04-28 | 北京百度网讯科技有限公司 | 目标检测模型训练方法、目标检测方法、装置和电子设备 |
CN116228792A (zh) * | 2023-02-14 | 2023-06-06 | 中国科学院苏州生物医学工程技术研究所 | 一种医学图像分割方法、系统及电子装置 |
CN116664840A (zh) * | 2023-05-31 | 2023-08-29 | 博衍科技(珠海)有限公司 | 一种基于互关系知识蒸馏的语义分割方法、装置及设备 |
-
2023
- 2023-10-08 CN CN202311289531.2A patent/CN117274282B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472676A (zh) * | 2019-08-05 | 2019-11-19 | 首都医科大学附属北京朝阳医院 | 基于深度神经网络的胃早癌组织学图像分类系统 |
US20220374709A1 (en) * | 2020-11-20 | 2022-11-24 | Akasa, Inc. | System and/or method for machine learning using binary poly loss function |
CN115908253A (zh) * | 2022-10-18 | 2023-04-04 | 中科(黑龙江)数字经济研究院有限公司 | 一种基于知识蒸馏的跨域医学影像分割方法及装置 |
CN116030235A (zh) * | 2022-12-29 | 2023-04-28 | 北京百度网讯科技有限公司 | 目标检测模型训练方法、目标检测方法、装置和电子设备 |
CN116228792A (zh) * | 2023-02-14 | 2023-06-06 | 中国科学院苏州生物医学工程技术研究所 | 一种医学图像分割方法、系统及电子装置 |
CN116664840A (zh) * | 2023-05-31 | 2023-08-29 | 博衍科技(珠海)有限公司 | 一种基于互关系知识蒸馏的语义分割方法、装置及设备 |
Non-Patent Citations (3)
Title |
---|
DIAN QIN等: "Efficient Medical Image Segmentation Based on Knowledge Distillation", 《 IEEE TRANSACTIONS ON MEDICAL IMAGING》, 20 June 2021 (2021-06-20), pages 3820 * |
XU, B等: "A knowledge-distillation-intergrated Pruning method for Vision Transformer", 《2022 21ST INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS AND INFORMATION TECHNOLOGIES》, 24 November 2022 (2022-11-24), pages 210 - 15 * |
孙海波等: "小剂量骨水泥弥散度的效果评价", 《中国组织工程研究》, 31 May 2018 (2018-05-31), pages 2140 - 2145 * |
Also Published As
Publication number | Publication date |
---|---|
CN117274282B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113077471B (zh) | 一种基于u型网络的医学图像分割方法 | |
US20210365717A1 (en) | Method and apparatus for segmenting a medical image, and storage medium | |
JP2023550844A (ja) | 深層形状学習に基づく肝臓ct自動分割方法 | |
CN114998210B (zh) | 一种基于深度学习目标检测的早产儿视网膜病变检测系统 | |
CN116309648A (zh) | 一种基于多注意力融合的医学图像分割模型构建方法 | |
CN113298830B (zh) | 一种基于自监督的急性颅内ich区域图像分割方法 | |
CN115731178A (zh) | 一种跨模态的无监督域自适应医学图像分割方法 | |
CN114549538A (zh) | 一种基于空间信息与特征通道的脑肿瘤医学图像分割方法 | |
CN117078692B (zh) | 一种基于自适应特征融合的医疗超声图像分割方法及系统 | |
CN115953345B (zh) | 脑出血医学图像的病变合成方法、装置及存储介质 | |
CN117274282B (zh) | 一种基于知识蒸馏的医学图像分割方法、系统、设备 | |
CN116229074A (zh) | 一种递进式边界区域优化的医学图像小样本分割方法 | |
Helmy et al. | Deep learning and computer vision techniques for microcirculation analysis: A review | |
Zheng et al. | Image segmentation of intestinal polyps using attention mechanism based on convolutional neural network | |
Wen et al. | A-PSPNet: A novel segmentation method of renal ultrasound image | |
Wang et al. | FBUNet: Full convolutional network based on fusion block architecture for biomedical image segmentation | |
CN114359308A (zh) | 一种基于边缘响应与非线性损失的主动脉夹层分割方法 | |
CN113707312A (zh) | 一种基于深度学习的血管定量识别的方法及装置 | |
CN110969117A (zh) | 一种基于Attention机制的全卷积神经网络的眼底图像分割方法 | |
CN112862089A (zh) | 一种具有可解释性的医学图像深度学习方法 | |
CN117649422B (zh) | 多模态图像分割模型的训练方法和多模态图像分割方法 | |
CN112330642B (zh) | 基于双输入全卷积网络的胰腺图像分割方法及系统 | |
CN116433607B (zh) | 基于关键区域特征双重加权融合的儿童手骨x光图像骨龄评估方法及系统 | |
Yao et al. | Image segmentation of skin lesions based on attention mechanism and deep convolutional neural network | |
Wu et al. | DFUNET: A Residual Network for Retinal Vessel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |