CN113920109A - 医疗影像识别模型训练方法、识别方法、装置及设备 - Google Patents
医疗影像识别模型训练方法、识别方法、装置及设备 Download PDFInfo
- Publication number
- CN113920109A CN113920109A CN202111275644.8A CN202111275644A CN113920109A CN 113920109 A CN113920109 A CN 113920109A CN 202111275644 A CN202111275644 A CN 202111275644A CN 113920109 A CN113920109 A CN 113920109A
- Authority
- CN
- China
- Prior art keywords
- image
- lung
- recognition
- region
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种医疗影像识别模型训练方法、识别方法、装置及设备,从三维医疗影像中提取M张切片图像组成的目标区域图像。从目标区域图像中选取连续N张切片图像作为训练样本输入待训练深度学习模型,获取识别预测结果,M、N为正整数。训练样本对应有中心切片图像识别标签。将识别预测结果和识别标签代入加权交叉熵损失函数获得交叉熵损失值。根据交叉熵损失值训练待训练深度学习模型。加权交叉熵损失函数中有识别标签类别对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数和识别标签类别数量确定,各个权重之和乘以修正系数为识别标签类别数量,权重的设置能缓解因正样本数量少造成的模型识别准确率低的情况。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及一种医疗影像识别模型训练方法、识别方法、装置及设备。
背景技术
在CT(Computed Tomography,电子计算机断层扫描)等技术中,利用X射线等对患者进行扫描,能够获得患者的原始数据,根据原始数据能够重建患者的三维医疗影像。
随着计算机视觉和人工智能的发展,使得可借助人工智能技术对三维医疗影像中的目标对象进行识别。三维医疗影像中是否包括目标对象有助于医生分析患者病情,可作为医生分析患者病情的参考依据。
目前,可以采用深度学习模型对三维医疗影像中的目标对象进行识别,但通常存在识别结果准确率不高、识别效果不好的问题。
发明内容
有鉴于此,本申请实施例提供一种医疗影像识别模型训练方法、识别方法、装置及设备,用于训练出识别准确率高的医疗影像识别模型,且基于医疗影像识别模型识别出的医疗影像中的目标对象是更加准确的。
为解决上述问题,本申请实施例提供的技术方案如下:
一种医疗影像识别模型的训练方法,所述方法包括:
从三维医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
将训练样本输入待训练深度学习模型,获得所述训练样本的识别预测结果,所述训练样本由从所述目标区域图像中选取的连续N张切片图像组成,所述训练样本的识别标签为所述训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M;
将所述训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,所述加权交叉熵损失函数针对每一识别标签类别设置对应的权重,所述权重根据具有该识别标签类别的训练样本数量、训练样本总数以及所述识别标签类别的数量确定,各个所述权重之和乘以修正系数为所述识别标签类别的数量;
根据所述交叉熵损失值训练所述待训练深度学习模型,重新执行所述将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
在一种可能的实现方式中,当所述三维医疗影像为肺部CT图像时,所述从三维医疗影像中提取目标区域图像,包括:
识别肺部CT图像中的肺部区域,得到肺部二值图像;
对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
根据所述肺部二值图像确定中纵膈区域二值图像;
将所述肺内组织区域二值图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图像的外接立方体区域作为目标区域图像。
在一种可能的实现方式中,所述识别肺部CT图像中的肺部区域,得到肺部二值图像,包括:
从肺部CT图像中确定符合预设CT值范围的区域,将所述符合预设CT值范围的区域设置为第一像素值,将所述肺部CT图像中的其他区域设置为第二像素值,生成预处理二值图像;
从所述预处理二值图像中识别连通域区域,从所述预处理二值图像中提取最大连通域区域作为候选肺部二值图像;
如果所述候选肺部二值图像的起始坐标满足预设条件,将所述候选肺部二值图像确定为肺部二值图像,所述肺部二值图像中为所述第一像素值的区域为肺部区域;
如果所述候选肺部二值图像的起始坐标不满足预设条件,重新设置所述预设CT值范围,从重新执行所述从肺部图像中确定符合预设CT值范围的区域以及后续步骤。
在一种可能的实现方式中,所述根据所述肺部二值图像确定中纵膈区域二值图像,包括:
将所述肺部二值图像的外接立方体区域向内缩进预设距离,得到缩进立方体区域;
将所述缩进立方体区域设置为第一像素值,将所述缩进立方体区域内的肺部区域设置为第二像素值,得到中纵膈区域二值图像。
在一种可能的实现方式中,所述方法还包括:
随机选取至少一个随机变换方式;
将所述切片图像按照目标随机变换方式在所述目标随机变换方式对应的变换范围内进行随机变换,重新生成所述切片图像,所述目标随机变换方式分别为选取的至少一个随机变换方式中的每一种。
一种医疗影像目标识别方法,所述方法包括:
从待识别医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
将从所述目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;所述连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;所述医疗影像识别模型是根据权利要求1-5任一项所述的医疗影像识别模型的训练方法训练得到的;
当所述中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定所述待识别医疗影像包含目标识别对象。
在一种可能的实现方式中,当所述待识别医疗影像为肺部CT图像时,所述从待识别医疗影像中提取目标区域图像,包括:
识别肺部CT图像中的肺部区域,得到肺部二值图像;
对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
根据所述肺部二值图像确定中纵膈区域二值图像;
将所述肺内组织区域图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图的外接立方体区域作为目标区域图像。
一种医疗影像识别模型的训练装置,所述装置包括:
提取单元,用于从三维医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元,用于将训练样本输入待训练深度学习模型,获得所述训练样本的识别预测结果,所述训练样本由从所述目标区域图像中选取的连续N张切片图像组成,所述训练样本的识别标签为所述训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M;
获取单元,用于将所述训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,所述加权交叉熵损失函数针对每一识别标签类别设置对应的权重,所述权重根据具有该识别标签类别的训练样本数量、训练样本总数以及所述识别标签类别的数量确定,各个所述权重之和乘以修正系数为所述识别标签类别的数量;
训练单元,用于根据所述交叉熵损失值训练所述待训练深度学习模型,重新执行所述将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
一种医疗影像目标识别装置,所述装置包括:
提取单元,用于从待识别医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元,用于将从所述目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;所述连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;所述医疗影像识别模型是根据上述的医疗影像识别模型的训练方法训练得到的;
确定单元,用于当所述中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定所述待识别医疗影像包含目标识别对象。
一种医疗影像识别模型的训练设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的医疗影像识别模型的训练方法。
一种医疗影像目标识别设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的医疗影像目标识别方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如上述的医疗影像识别模型的训练方法,或者执行如上述的医疗影像目标识别方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例提供了一种医疗影像识别模型训练方法、识别方法、装置及设备,医疗影像识别模型训练方法包括:从三维医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。从目标区域图像中选取连续的N张切片图像作为训练样本,N为正整数,N小于或等于M。将训练样本输入待训练深度学习模型,获取训练样本的识别预测结果。训练样本对应有识别标签,具体为训练样本的中心切片图像的识别标签。识别标签根据应用场景可分为不同类别。构建加权交叉熵损失函数,将训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值。根据交叉熵损失值训练待训练深度学习模型,达到预设条件时停止模型的训练,获得医疗影像识别模型。其中,加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,并满足各个权重之和乘以修正系数为识别标签的数量。基于此,由于权重和具有该识别标签类别的训练样本数量有关,则能够使得当训练样本中某一类别训练样本的数量少时,对该类别训练样本设置较大的权重值。由于权重值用于加权交叉熵损失函数值的计算,则相当于增大了该类别训练样本对应的损失量的惩罚系数,这在一定程度上能缓解因某一类别训练样本数量少造成的模型识别准确率低的情况,可以提高医疗影像识别模型的识别准确率。
附图说明
图1为本申请实施例提供的一种示例性场景的示意图;
图2为本申请实施例提供的一种医疗影像识别模型训练方法的流程图;
图3为本申请实施例提供的从三维医疗影像中提取目标区域图像的流程图;
图4为本申请实施例提供的一种医疗影像目标识别方法的流程图;
图5为本申请实施例提供的一种医疗影像识别模型训练装置的结构示意图;
图6为本申请实施例提供的一种医疗影像目标识别装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
为了便于理解和解释本申请实施例所提供的技术方案,下面先对本申请的背景技术进行介绍。
在CT等技术中,利用X射线等对目标对象进行扫描,能够获得目标对象的原始数据,根据原始数据能够重建患者的三维医疗图像。
随着计算机视觉和人工智能的发展,使得可借助人工智能技术对三维医疗图像中的目标对象进行识别。三维医疗影像中是否包括目标对象有助于医生分析患者病情,可作为医生分析患者病情的参考依据,目标对象例如病灶。
目前,可以采用深度学习模型对三维医疗图像中的目标对象进行识别,但通常存在识别结果准确率不高、识别效果不好的问题。在深度学习模型训练时,样本数据量至关重要,当不同类别的训练样本数据量平衡且样本数据量多时,训练得到的深度学习模型的准确性高。当不同类别的训练样本数据量不平衡,尤其是某一类别训练样本的数量远少于其他类别训练样本的数量时,会造成深度学习模型识别结果准确率不高、识别效果不好。例如,当采用有目标对象的三维医疗图像(可看作正样本)和无目标对象的三维医疗图像(可看作负样本)对深度学习模型进行训练时。深度学习模型用于识别三维医疗图像中有无目标对象。则若有目标对象的三维医疗图像的数量相比于无目标对象的三维医疗图像的数量过少时,会导致深度学习模型的准确性低。
基于此,本申请实施例提供了一种医疗影像识别模型训练方法、识别方法、装置及设备。为了便于理解本申请实施例提供的医疗影像识别模型训练方法,结合图1对其示例性应用场景进行说明,图1为本申请实施例提供的一种示例性场景的示意图。
如图1所示,从三维医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。目标区域图像为可能包含目标对象的图像区域。例如,当目标对象为病灶时,目标区域图像为可能存在病灶的图像区域。
从目标区域图像中选取连续的N张切片图像作为训练样本,N为正整数,N小于或等于M。将训练样本输入待训练深度学习模型,获取训练样本的识别预测结果。训练样本对应有识别标签,具体为训练样本的中心切片图像的识别标签。训练样本的识别标签可看作为训练样本识别预测结果的期望结果。识别标签根据应用场景可分为不同类别,例如,当应用场景为利用医疗影像识别模型识别有无病灶时,识别标签分为有病灶和无病灶两种识别标签类别,对应地,训练样本为有病灶图像(可看作正样本)或无病灶图像(可看作负样本)。
构建加权交叉熵损失函数,将训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值。根据交叉熵损失值训练待训练深度学习模型,达到预设条件时停止模型的训练,获得医疗影像识别模型。医疗影像识别模型即为训练完成的待训练深度学习模型。其中,加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,并满足各个权重之和乘以修正系数为识别标签。
需要说明的是,图1所示框图仅作为一种示例进行说明,本申请实施例提供的医疗影像识别模型训练方法并不仅限于上述示例。
基于上述说明,本申请实施例提供了一种医疗影像识别模型训练方法的具体实施方式。
参见图2,图2为本申请实施例提供的一种医疗影像识别模型训练方法的流程图。如图2所示,该方法包括S201-S204:
S201:从三维医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。
作为一种示例,在CT技术中,利用X射线等对患者进行扫描,能够获得患者的原始数据,根据原始数据能够重建患者的三维医疗影像,通过CT技术获得的三维医疗影像可称为三维CT图像。例如,三维肺部CT图像,三维脑部CT图像。可以理解的是,三维CT图像为切片图像,由多个切片图像组成。本申请实施例中的目标区域图像由M张切片图像组成。
目标区域图像为可能包含目标对象的图像区域,且目标区域图像小于三维医疗影像,为三维医疗影像中的部分图像。例如,当目标对象为病灶时,目标区域图像为三维医疗影像中可能存在病灶的图像区域。具体的,若病灶为肺栓塞,目标对象为肺栓塞,医疗影像识别模型可以为肺栓塞的识别模型。由于肺部栓塞存在于肺部血管中,且肺部血管和周边软组织相近又紧密粘连在一起。另外,肺部栓塞和肺中纵膈域也密切相关。则如果医疗影像识别模型可以为肺栓塞的识别模型,本申请实施例中可选目标区域图像为包括肺部血管、周边软组织和肺中纵膈域的图像。
基于此,相比于直接利用深度学习模型对整体的三维医疗影像进行目标对象的识别,从三维医疗影像中提取目标区域图像,再利用深度学习模型对目标区域图像进行识别,这样可以减轻深度学习特征识别的难度,便于深度学习模型对目标对象的识别,提高深度学习模型的识别效率和识别的准确性。
具体实施时,可采用图像处理技术从三维医疗影像中提取目标区域图像。当三维医疗影像为肺部CT图像时,本申请实施例提供了一种从三维医疗影像中提取目标区域图像的具体实施方式,具体请见下文S301-S305。可以理解的是,本申请实施例提供的医疗影像识别模型训练方法不仅限于用来识别肺部CT图像,还可用于识别脑部CT图像等其他类型医疗影像。
需要说明的是,在获取目标区域图像后,为了增加训练样本的数据量,提高待训练深度学习模型的泛化能力和鲁棒性,还可以对获取的目标区域图像进行数据增强处理,获取增强处理后的目标区域图像。本申请实施例的目标区域图像(即M张切片图像)可为初始提取出的目标区域图像进行数据增强处理后的目标区域图像。在一种可能的实现方式中,本申请实施例提供了一种数据增强的具体实施方式,具体请参见下文A1-A2。
S202:将训练样本输入待训练深度学习模型,获得训练样本的识别预测结果,训练样本由从目标区域图像中选取的连续N张切片图像组成,训练样本的识别标签为训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M。
在获取由M张切片图像组成的目标区域图像后,从目标区域图像中选取连续的N张切片图像作为训练样本。将训练样本输入待训练深度学习模型,便可获得训练样本对应的识别预测结果。
具体的,待训练深度学习模型用于识别训练样本的中心切片图像的类别(例如识别训练样本的中心切片图像是否包括目标对象)。训练样本对应有识别标签,相应地,训练样本的识别标签为训练样本的中心切片图像的识别标签(例如包括目标对象或不包括目标对象)。其中,N为正整数,N小于或等于M。当N为奇数时,训练样本的中心切片图像即为训练样本中心位置的切片图像。作为一种可选示例,当N为偶数时,训练样本的中心切片图像为训练样本中心位置的两张切片图像中的任一张切片图像。
举例说明,若待训练深度学习模型的输入层为3通道,则需同时输入连续的3张切片图像。连续的3张切片图像作为一个训练样本,其对应的识别标签为中心切片图像对应的识别标签。具体实施时,可从目标区域图像(即M张切片图像)中选取出所有的训练样本。从所有的训练样本中随机选取部分训练样本同时输入待训练深度学习模型,对待训练深度学习模型进行训练。需要说明的是,训练样本输入待训练深度学习模型前,要把训练样本中的切片图像大小统一都变换成待训练深度学习模型要求的输入图像尺寸,例如为512*512。
可以理解的是,选取N张连续切片图像,待训练深度学习模型可以提取到N张连续切片图像的图像特征,使提取的图像特征更为丰富,提取的图像特征均用于待训练深度识别模型对中心切片图像进行识别,使得待训练深度学习模型对中心切片图像的识别结果更加准确。
作为一种可选示例,待训练深度学习模型可采用EfficientNet-b7模型。在进行待训练深度学习模型训练前,需要初始化模型参数。可选地,可将在ImageNet上已训练好的参数进行迁移学习,作为本申请实施例中待训练深度学习模型的初始化模型参数。其中,ImageNet为一个用于视觉对象识别软件研究的大型可视化数据库。
作为另一种可选示例,为了提高待训练深度学习模型的泛化能力,防止待训练深度学习模型过拟合,可在EfficientNet-b7模型的卷积层与全连接层之间插入一层自适应平均池化层,然后在自适应平均池化层后增加dropout层。其中,全连接层输出的激活函数二分类为sigmoid函数,多分类为softmax函数。
S203:将训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,各个权重之和乘以修正系数为识别标签类别的数量。
在获取训练样本的识别预测结果和对应的识别标签后,将训练样本的识别预测结果和对应的识别标签输入到加权交叉熵损失函数中获得交叉熵损失值。交叉熵损失值用于训练待训练深度学习模型。
其中,训练样本对应的识别标签类别根据实际应用场景进行确定。作为一种可选示例,当目标对象为病灶,待训练深度学习模型用于识别训练样本的种类,且训练样本的种类为有病灶的图像和无病灶的图像时(即识别训练样本中是否存在病灶),识别标签类别为两种,分别为有病灶和无病灶。此时,加权交叉熵损失函数为加权二元交叉熵损失函数。
作为另一种可选示例,待训练深度学习模型用于识别训练样本的种类,且训练样本的种类为目标对象A、目标对象B和目标对象C时,识别标签类别为三种,分别为目标对象A、目标对象B和目标对象C。加权交叉熵损失函数适应性地进行修改。
需要说明的是,考虑到训练样本的不平衡,例如,正样本(例如有病灶图像)的数量远少于负样本。本申请实施例采用了加权交叉熵损失函数进行待训练深度学习模型的训练。加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,各个权重之和乘以修正系数为识别标签类别的数量。具体的,每一识别标签类别设置对应的权重的计算公式如下:
w=n_samples/(n_classes*n_sample)
其中,w为任一训练样本类别(或任一识别标签类别)对应的权重,n_samples为训练样本总数,n_classes为识别标签类别的数量,n_sample为具有该识别标签类别的训练样本数量。
基于此,由于权重和具有该识别标签类别的训练样本数量有关,则能够使得当训练样本中某一类别训练样本的数量少时,对该类别训练样本设置较大的权重值。由于权重值用于加权交叉熵损失函数值的计算,则相当于增大了该类别训练样本对应的损失量的惩罚系数,这在一定程度上能缓解因某一类别训练样本数量少造成的模型识别准确率低的情况,可以提高医疗影像识别模型的识别准确率。
另外,在训练样本类别极不平衡情况下,通过加权交叉熵损失函数确定的样本数量少的训练样本类别对应的权重值会过大。而权重过大或过小都会导致模型识别准确性下降。为了提高模型的识别准确性,本申请实施例引入一个限定条件:
(w1+w2+…+wk)*α=k
其中,w1…wk分别为每一识别标签类别对应的权重,共k个。k为n_classes,即识别标签类别的数量。α为修正系数,用于修正w1到wk。该限定条件保证了各个权重之和乘以修正系数为识别标签类别的数量。
在此基础上,将每一识别标签类别对应的实际权重设置为权重和修正系数的乘积,如w1*α为其中一种识别标签类别对应的实际权重。由此设置的权重或基于实际权重微调得到的权重均可提高待训练深度学习模型的识别准确性,能够避免产生巨大的权重值。
S204:根据交叉熵损失值训练待训练深度学习模型,重新执行将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
根据交叉熵损失值训练待训练深度学习模型,当达到预设条件时,获得医疗影像识别模型。其中,医疗影像识别模型为训练完成后的待训练深度学习模型。当没有达到预设条件时,更新模型参数,重新执行将训练样本输入待训练深度学习模型,直到达到预设条件。
作为一种可选示例,预设条件为交叉熵损失值达到预设阈值,或达到预设训练次数,或同时满足交叉熵损失值达到预设阈值和达到预设训练次数。其中,本申请实施例不限定预设阈值和预设训练次数,可根据实际应用场景的需求进行设定。
需要说明的是,在实际应用中,可通过采用多组训练样本多次训练待训练深度学习模型,得到对应的多个医疗影像识别模型。再对多个医疗影像识别模型进行评价,选取多个医疗影像识别模型中识别准确率最高的医疗影像识别模型作为最终的医疗影像识别模型。
作为一种可选示例,由于F1评分是一个综合考虑多方面因素的评价指标,是一个较好的模型评价基准,可通过F1评分来评价医疗影像识别模型的优劣。
具体实施时,F1评分的计算方法如下:
P=TP/(TP+FP)R=TP/(TP+FN)F1=2PR/(P+R)
其中,TP表示预测类别为真,识别标签类别为真,预测正确。FP表示预测类别为真,识别标签类别为假,预测错误。FN表示预测类别为假,识别标签类别为真,预测错误。P为预测精度,R为召回率。例如,当待训练深度学习模型用于识别训练样本的种类,且训练样本的种类为有病灶的图像和无病灶的图像时,识别标签类型分为有病灶或无病灶。在此场景中识别标签类别为真表示有病灶。识别标签类别为假表示无病灶。
预测精度是针对预测结果而言的,其含义是所有预测类别为真的训练样本中,识别标签类别为真的概率。召回率为在识别标签类别为真的训练样本中,预测类别为真的概率。F1评分同时考虑预测精度和召回率,让两者同时达到最高,取得平衡。
本申请实施例提供了一种医疗影像识别模型训练方法,包括:从三维医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。从目标区域图像中选取连续的N张切片图像作为训练样本,N为正整数。将训练样本输入待训练深度学习模型,获取训练样本的识别预测结果。训练样本对应有识别标签,具体为训练样本的中心切片图像的识别标签。识别标签根据应用场景可分为不同类别。构建加权交叉熵损失函数,将训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值。根据交叉熵损失值训练待训练深度学习模型,达到预设条件时停止模型的训练,获得医疗影像识别模型。其中,加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,并满足各个权重之和乘以修正系数为识别标签的数量。基于此,由于权重和具有该识别标签类别的训练样本数量有关,则能够使得当训练样本中某一类别训练样本的数量少时,对该类别训练样本设置较大的权重值。由于权重值用于加权交叉熵损失函数值的计算,则相当于增大了该类别训练样本对应的损失量的惩罚系数,这在一定程度上能缓解因某一类别训练样本数量少造成的模型识别准确率低的情况,可以提高医疗影像识别模型的识别准确率。
在一种可能的实现方式中,本申请实施例还提供了另一种医疗影像识别模型训练方法,除了上述S201-S204,该方法还包括:
A1:随机选取至少一个随机变换方式。
采用数据增强方法进行数据增强,例如RandAugment方法。其主要思想是基于随机变换的方式进行数据增强。
RandAugment方法有两个输入参数,分别为随机变换方式的数量和变换幅度。随机变换方式的数量为A1中至少一个随机变换方式的总数量。每种随机变换方式确定一个变换范围,根据变换范围进行图像变换。变换幅度为变换范围中右边界值的上限值,例如可取10。
随机变换方式例如为图像随机旋转方式、图像对比度增强方式、填充矩形增强方式和图像放大/缩小增强方式等四种方式。每种随机变换方式对应有变换指标。例如,图像随机旋转方式中的变换指标为转角,转角最小值为0,最大值为20。图像对比度增强方式中的变换指标为饱和度因子,饱和度因子最小值为0.1,最大值为1.9。填充矩形增强方式中的变换指标为矩形宽高与图像宽高比例系数,其最小值为0,最大值为0.4。图像放大/缩小增强方式中的变换指标为缩放倍数,缩放倍数最小值为0.8,最大值为1.2。
A2:将切片图像按照目标随机变换方式在目标随机变换方式对应的变换范围内进行随机变换,重新生成切片图像,目标随机变换方式分别为选取的至少一个随机变换方式中的每一种。
作为一种可选示例,变换范围为0到变换取值V之间的范围。变换幅度为变换取值V的最大值。确定每种随机变换方式中的变换取值V,变换取值V根据随机变换方式中变换指标的最大值和最小值确定,具体的计算方式如下:
V=min+(K/30)*(max-min)
其中,K为随机数,可利用泊松分布生成K。当K>30时,取K=30。min为每种随机变换方式中变换指标的最小值,max为每种随机变换方式中变换指标的最大值。
确定目标随机变换方式对应的变换范围后,将切片图像按照目标随机变换方式在目标随机变换方式对应的变换范围内进行随机变换,重新生成切片图像。其中,目标随机变换方式分别为选取的至少一个随机变换方式中的每一种。
基于A1-A2,对切片图像进行了数据增强,训练样本的数据量大,可使得待训练深度学习模型的泛化能力更强。
在实际应用中,当三维医疗影像为肺部CT图像时,利用肺部CT图像可进行肺部栓塞的识别。具体地,可利用肺部CT图像获取目标区域图像,再基于目标区域图像进行肺部栓塞的识别。
由此,基于上述方法实施例,本申请实施例结合图3提供了一种当三维医疗影像为肺部CT图像时,从三维医疗影像中提取目标区域图像的具体实施方式。其中,图3为本申请实施例提供的从三维医疗影像中提取目标区域图像的流程图。如图3所示,包括步骤S301-S305:
S301:识别肺部CT图像中的肺部区域,得到肺部二值图像。
需要说明的是,肺部CT图像中包括肺部区域、肺部血管和肺部血管周围软组织等区域。肺部栓塞位于肺部血管上。肺部CT图像的目标区域图像为包括肺部血管、肺部血管周围软组织和肺中纵膈的图像。
为了从三维医疗影像中提取目标区域图像,先识别肺部CT图像中的肺部区域,得到肺部二值图像。肺部二值图像为对肺部CT图像进行肺部区域和非肺部区域分割得到的图像。例如肺部区域用1表示,非肺部区域用0表示。
另外,为了保证分析的图像具有一致的特征,便于后续处理与识别,先对肺部CT图像进行再采样处理,使肺部CT图像的再采样的切片图像之间的间隔为1mm。然后,再对肺部CT图像进行窗体变换使得肺部CT图像的CT值在-1024到1024之间。基于此,再识别肺部CT图像中的肺部区域,得到肺部二值图像。
在一种可能的实现方式中,本申请实施例提供了一种识别肺部CT图像中的肺部区域,得到肺部二值图像的具体实施方式,具体请参见下文B1-B4。
S302:对肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像。
在获取肺部二值图像后,对肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像。在实际应用中,可以采用形态学闭运算进行填充。
可以理解的是,肺部二值图像中的空洞或缺口通常可看作是肺部血管及周边软组织。
需要说明的是,在对肺部二值图像中的空洞或缺口进行填充时,要尽可能地填满肺部二值图像中的空洞或缺口。
S303:将填充后的肺部二值图像与肺部二值图像进行差值运算,得到肺内组织区域二值图像。
将填充后的肺域二值图像与填充前的肺域二值图像做差值运算,即可得到肺部二值图像中的空洞或缺口的组织图像,即肺内组织区域二值图像。肺内组织区域二值图像主要为肺部血管及肺部血管周边软组织,由于肺栓塞位于肺部血管上,则肺内组织区域二值图像也可能包含完整的肺栓塞。
具体实施时,将填充后的肺域二值图像与填充前的肺域二值图像中对应的每个像素值进行差值运算,根据像素差值运算后的结果得到肺内组织区域二值图像。
S304:根据肺部二值图像确定中纵膈区域二值图像。
肺中纵膈区域表征心脏附近区域,由于肺栓塞和心脏附近区域关联性较强,为了识别更加准确肺栓塞,还需获取肺中纵膈区域对应的图像。
具体实施时,由于肺中纵膈区域位于两肺之间,因此可根据肺部二值图像确定中纵膈区域二值图像。中纵膈区域二值图像对应肺中纵膈区域。
在一种可能的实现方式中,本申请实施例提供了一种根据肺部二值图像确定中纵膈区域二值图像的具体实施方式,具体请参见下文C1-C2。
S305:将肺内组织区域二值图像以及中纵膈区域二值图像取并集得到组合二值图像,从肺部CT图像中切割出组合二值图像的外接立方体区域作为目标区域图像。
具体实施时,可获取组合二值图像的外接立方体区域的顶点坐标,根据顶点坐标从肺部CT图像中切割出组合二值图像的外接立方体区域,将其作为目标区域图像。
该目标区域图像最大限度去除了与肺栓塞识别无关的区域,避免了使用待训练深度学习模型进行识别时,肺部其他区域对识别过程的干扰。最后利用图像处理工具,把目标区域图像存成切片序列图像。
基于S301-S305内容可知,当三维医疗影像为肺部CT图像时,利用肺部CT图像先获取肺部CT图像中的目标区域图像,基于目标区域图像进行肺部栓塞的识别。相比于直接基于肺部CT图像进行肺栓塞的识别,基于目标区域图像进行肺栓塞识别,可缓解医疗影像识别模型的识别难度,提高医疗影像识别模型的识别准确度。
需要说明的是,当三维医疗影像为肺部CT图像时,获取目标区域图像后,利用目标区域图像对待训练深度学习方法进行训练。从目标区域图像获取的训练样本包括有肺栓塞图像和无肺栓塞图像两种类型。对应地,识别标签为有病灶和无病灶两种识别标签类别。
显然,上述实施例仅仅是本申请的一部分实施例,而不是全部的实施例。本申请实施例所提供的医疗影像识别模型的训练方法还可应用于其他识别模型的训练,例如识别脑部CT图像中病灶的模型。
在一种可能的实现方式中,本申请实施例提供了一种S301中识别肺部CT图像中的肺部区域,得到肺部二值图像的具体实施方式,包括:
B1:从肺部CT图像中确定符合预设CT值范围的区域,将符合预设CT值范围的区域设置为第一像素值,将肺部CT图像中的其他区域设置为第二像素值,生成预处理二值图像。
CT值反映了人体组织对X射线吸收程度。可以理解的是,预设CT值范围对应的区域大部分是肺部区域。例如,预设CT值范围为[-900,-600],最小值为-900,最大值为-600,表示[-900,-600]内的区域大部分为肺部区域。通过预设CT值范围对肺部CT图像进行多阈值分割操作,将符合预设CT值范围的区域设置为第一像素值,将肺部CT图像中的其他区域设置为第二像素值,获取分割后的预处理二值图像。
作为一种可选示例,第一像素值为1,第二像素值为0。
B2:从预处理二值图像中识别连通域区域,从预处理二值图像中提取最大连通域区域作为候选肺部二值图像。
预处理二值图像中的第一像素值对应的区域主要为肺部区域,此时,为了使肺部CT图像中的肺部区域分割更准确,获取预处理二值图像后,从预处理二值图像中识别连通域区域。连通域区域一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域。
在肺部CT图像中,肺部区域为最大的连通域区域。则为了使肺部CT图像中的肺部区域分割更准确,从预处理二值图像中提取最大连通域区域作为候选肺部二值图像。
具体实施时,最大连通域区域可通过体素点数量进行确定,体素相同且体素点数量最多的区域为最大连通域区域。
B3:如果候选肺部二值图像的起始坐标满足预设条件,将候选肺部二值图像确定为肺部二值图像,肺部二值图像中为第一像素值的区域为肺部区域。
为了保证分割的正确性,还需对候选肺部二值图像进行边界条件判断。通常肺部区域在肺部CT图像的中间,肺部区域的边界与肺部CT图像的边界有距离,若候选肺部二值图像的起始坐标满足预设条件,将候选肺部二值图像确定为肺部二值图像。例如,若候选肺部二值图像的X轴初始坐标大于10,表明B1-B2所得到的候选肺部二值图像为肺部二值图像。
显然,肺部区域为肺部二值图像中为第一像素值的区域。
B4:如果候选肺部二值图像的起始坐标不满足预设条件,重新设置预设CT值范围,重新执行从肺部图像中确定符合预设CT值范围的区域以及后续步骤。
当候选肺部二值图像的起始坐标不满足预设条件时,表明候选肺部二值图像和真实肺部二值图像有差别,需要重新设置预设CT值范围,例如重新设置为[-900,-350],并重新执行B1以及后续步骤。
基于B1-B4内容可知,实现了识别肺部CT图像中的肺部区域的目的,使得得到的肺部二值图像能更加准确地表征肺部区域。
在一种可能的实现方式中,本申请实施例提供了一种S304中根据肺部二值图像确定中纵膈区域二值图像的具体实施方式,包括:
C1:将肺部二值图像的外接立方体区域向内缩进预设距离,得到缩进立方体区域。
由于肺部二值图像为立体图像,可获取肺部二值图像的外接立方体区域。肺部二值图像的外接立方体区域表示肺部区域。
作为一种可选示例,依赖于肺部二值图像,计算该肺部二值图像的外接立方体初始顶点坐标及3个边长。其中,初始顶点坐标为肺部二值图像的外接立方体上顶点坐标值最小的顶点坐标。3个边长为外接立方体的长宽高。然后,把肺部二值图像的外接立方体各边向外接立方体的中心缩进预设距离,得到缩进立方体区域和缩进立方体区域的顶点坐标。
其中,预设距离大小可以根据实际应用场景中获取的图像效果来确定,这里不进行限定。
C2:将缩进立方体区域设置为第一像素值,将缩进立方体区域内的肺部区域设置为第二像素值,得到中纵膈区域二值图像。
设置缩进立方体区域为第一像素值,例如为1。具体实施时,可根据缩进立方体区域的顶点坐标设置缩进立方体区域为第一像素值。
缩进立方体区域中还含有肺部区域,需要再利用肺部二值图像,除去该缩进立方体区域中的肺部区域部分。即让缩进立方体区域中肺部区域部分设置为第二像素值,例如为0,获得中纵膈区域二值图像。
基于上述C1-C2的内容可知,实现了通过肺部二值图像确定中纵膈区域二值图像。若目标区域图像中包含中纵膈区域二值图像,能提高待训练深度学习模型对肺栓塞的识别准确率。
基于上述提供的医疗影像识别模型的训练方法的实施例,本申请实施例还提供了一种医疗影像目标识别方法。参见图4,图4为本申请实施例提供的一种医疗影像目标识别方法的流程图。如图4所示,该方法包括S401-S403:
S401:从待识别医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。
待识别医疗影像可以为肺部CT图像,或脑部CT图像。医疗影像识别模型基于待识别医疗影像中提取的目标区域图像进行目标对象的识别。
在一种可能的实现方式中,本申请实施例提供了一种从待识别医疗影像中提取目标区域图像的具体实施方式,具体请参见下文D1-D5。
S402:将从目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;医疗影像识别模型是根据上述任一项实施例的医疗影像识别模型的训练方法训练得到的。
其中,医疗影像识别模型是由上述任一实施例提供的医疗影像识别模型的训练方法训练完成的多个模型中F1评分最优的模型。
从M张切片图像中选择连续的N张切片图像,每连续的N张切片图像作为一个样本。具体地,连续的N张切片图像为第i张到第i+N-1张切片图像。其中,i分别取1到M-N+1范围内的每个整数。例如,M=100,N=3时,第一组图像中的连续3张切片图像为100张切片图像中的第1张到第3张,最后一组图像中的连续3张切片图像为100张切片图像中的第98张到第100张。
需要说明的是,在确定M张切片图像,或确定连续的N张切片图像之后,将切片图像的大小统一变换成医疗影像识别模型的图像输入尺寸,例如为512*512。将连续的N张切片图像按切片顺序输入医疗影像识别模型进行识别,获取连续的N张切片图像的中心切片图像的识别结果。中心切片图像的识别结果作为连续的N张切片图像的识别结果。识别结果包括中心切片图像的识别类别和识别类别对应的概率值,例如有病灶或无病灶,有病灶的概率值为0.7,无病灶的概率值为0.3。通常各个识别类别对应的概率值的和为1。确定中心切片图像对应的识别类型为概率超过概率阈值的识别类别。例如若概率阈值为0.5,则有病灶的概率超过了概率阈值,确定中心切片图像的识别类别为有病灶,即中心切片图像中存在病灶。
可以理解的是,当识别类别为两种时,概率阈值通常为0.5。当识别类别超过两种时,概率阈值可根据实际应用场景的实际需要进行确定。
S403:当中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定待识别医疗影像包含目标识别对象。
医疗影像识别模型用于识别中心切片图像的识别结果。当中心切片图像的识别结果为某一目标识别结果的数量大于数量阈值时,确定待识别医疗影像包含目标识别对象。例如,中心切片图像的识别结果为包含病灶的识别结果大于数量阈值时,确定整体待识别医疗影像包含病灶。这样,在一定程度上提高了医疗影像识别模型的识别准确率和可靠性,避免了只要存在目标识别结果就确定待识别医疗影像包含目标识别对象所存在的不准确的情况。
可以理解的是,数量阈值根据实际应用场景的实际需求进行设置,这里不对其进行限定。
基于上述S401-S403的内容可知,可利用训练完成的医疗影像识别模型识别待识别医疗影像中是否存在目标对象。由于训练过程中医疗影像识别模型能够在一定程度上能缓解因某一了下训练样本数量少造成的模型识别准确率低的情况,提高医疗影像识别模型的识别准确率。则基于医疗影像识别模型进行的目标对象的识别准确率较高。
在一种可能的实现方式中,本申请实施例提供了一种S401中从待识别医疗影像中提取目标区域图像的具体实施方式,包括:
D1:识别肺部CT图像中的肺部区域,得到肺部二值图像。
D2:对肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像。
D3:将填充后的肺部二值图像与肺部二值图像进行差值运算,得到肺内组织区域二值图像。
D4:根据肺部二值图像确定中纵膈区域二值图像。
D5:将肺内组织区域图像以及中纵膈区域二值图像取并集得到组合二值图像,从肺部CT图像中切割出组合二值图的外接立方体区域作为目标区域图像。
需要说明的是,D1-D5的技术详情可参见上述S301-S305所描述的实施例,这里不再重复赘述。
参见图5,图5为本申请实施例提供的一种医疗影像识别模型训练装置的结构示意图。如图5所示,该医疗影像识别模型训练装置包括:
提取单元501,用于从三维医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元502,用于将训练样本输入待训练深度学习模型,获得所述训练样本的识别预测结果,所述训练样本由从所述目标区域图像中选取的连续N张切片图像组成,所述训练样本的识别标签为所述训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M;
获取单元503,用于将所述训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,所述加权交叉熵损失函数针对每一识别标签类别设置对应的权重,所述权重根据具有该识别标签类别的训练样本数量、训练样本总数以及所述识别标签类别的数量确定,各个所述权重之和乘以修正系数为所述识别标签类别的数量;
训练单元504,用于根据所述交叉熵损失值训练所述待训练深度学习模型,重新执行所述将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
在一种可能的实现方式中,当所述三维医疗影像为肺部CT图像时,所述提取单元501,包括:
第一识别子单元,用于识别肺部CT图像中的肺部区域,得到肺部二值图像;
填充子单元,用于对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
运算子单元,用于将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
第一确定子单元,用于根据所述肺部二值图像确定中纵膈区域二值图像;
切割子单元,用于将所述肺内组织区域二值图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图像的外接立方体区域作为目标区域图像。
在一种可能的实现方式中,所述第一识别子单元,包括:
第二确定子单元,用于从肺部CT图像中确定符合预设CT值范围的区域,将所述符合预设CT值范围的区域设置为第一像素值,将所述肺部CT图像中的其他区域设置为第二像素值,生成预处理二值图像;
第二识别子单元,用于从所述预处理二值图像中识别连通域区域,从所述预处理二值图像中提取最大连通域区域作为候选肺部二值图像;
第三确定子单元,用于如果所述候选肺部二值图像的起始坐标满足预设条件,将所述候选肺部二值图像确定为肺部二值图像,所述肺部二值图像中为所述第一像素值的区域为肺部区域;
执行子单元,用于如果所述候选肺部二值图像的起始坐标不满足预设条件,重新设置所述预设CT值范围,从重新执行所述从肺部图像中确定符合预设CT值范围的区域以及后续步骤。
在一种可能的实现方式中,所述第一确定子单元,包括:
缩进子单元,用于将所述肺部二值图像的外接立方体区域向内缩进预设距离,得到缩进立方体区域;
设置子单元,用于将所述缩进立方体区域设置为第一像素值,将所述缩进立方体区域内的肺部区域设置为第二像素值,得到中纵膈区域二值图像。
在一种可能的实现方式中,所述装置还包括:
选取单元,用于随机选取至少一个随机变换方式;
随机变换单元,用于将所述切片图像按照目标随机变换方式在所述目标随机变换方式对应的变换范围内进行随机变换,重新生成所述切片图像,所述目标随机变换方式分别为选取的至少一个随机变换方式中的每一种。
需要说明的是,本申请实施例提供的医疗影像识别模型训练装置的技术详情可参见上述医疗影像识别模型训练方法的相关实施例,这里不再赘述。
参见图6,图6为本申请实施例提供的一种医疗影像目标识别装置的结构示意图。如图6所示,该医疗影像目标识别装置包括:
提取单元601,用于从待识别医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元602,用于将从所述目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;所述连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;所述医疗影像识别模型是根据上述任一项实施例所述的医疗影像识别模型的训练方法训练得到的;
确定单元603,用于当所述中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定所述待识别医疗影像包含目标识别对象。
在一种可能的实现方式中,当所述待识别医疗影像为肺部CT图像时,所述提取单元601,包括:
识别子单元,用于识别肺部CT图像中的肺部区域,得到肺部二值图像;
填充子单元,用于对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
运算子单元,用于将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
确定子单元,用于根据所述肺部二值图像确定中纵膈区域二值图像;
切割子单元,用于将所述肺内组织区域图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图的外接立方体区域作为目标区域图像。
需要说明的是,本申请实施例提供的医疗影像目标识别装置的技术详情可参见上述医疗影像目标识别方法的相关实施例,这里不再赘述。
另外,本申请实施例还提供了一种医疗影像识别模型的训练设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述任一项实施例所述的医疗影像识别模型的训练方法。
另外,本申请实施例还提供了一种医疗影像目标识别设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述任一项实施例所述的医疗影像目标识别方法。
另外,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如上述任一项实施例所述的医疗影像识别模型的训练方法,或者执行如上述实施例所述的医疗影像目标识别方法。
本申请实施例提供了一种医疗影像识别模型训练装置、识别装置及设备,医疗影像识别模型训练过程包括:从三维医疗影像中提取目标区域图像,目标区域图像由M张切片图像组成,M为正整数。从目标区域图像中选取连续的N张切片图像作为训练样本,N为正整数。将训练样本输入待训练深度学习模型,获取训练样本的识别预测结果。训练样本对应有识别标签,具体为训练样本的中心切片图像的识别标签。识别标签根据应用场景可分为不同类别。构建加权交叉熵损失函数,将训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值。根据交叉熵损失值训练待训练深度学习模型,达到预设条件时停止模型的训练,获得医疗影像识别模型。其中,加权交叉熵损失函数针对每一识别标签类别设置对应的权重,权重根据具有该识别标签类别的训练样本数量、训练样本总数以及识别标签类别的数量确定,并满足各个权重之和乘以修正系数为识别标签的数量。基于此,由于权重和具有该识别标签类别的训练样本数量有关,则能够使得当训练样本中某一类别训练样本的数量少时,对该类别训练样本设置较大的权重值。由于权重值用于加权交叉熵损失函数值的计算,则相当于增大了该类别训练样本对应的损失量的惩罚系数,这在一定程度上能缓解因某一类别训练样本数量少造成的模型识别准确率低的情况,可以提高医疗影像识别模型的识别准确率。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种医疗影像识别模型的训练方法,其特征在于,所述方法包括:
从三维医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
将训练样本输入待训练深度学习模型,获得所述训练样本的识别预测结果,所述训练样本由从所述目标区域图像中选取的连续N张切片图像组成,所述训练样本的识别标签为所述训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M;
将所述训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,所述加权交叉熵损失函数针对每一识别标签类别设置对应的权重,所述权重根据具有该识别标签类别的训练样本数量、训练样本总数以及所述识别标签类别的数量确定,各个所述权重之和乘以修正系数为所述识别标签类别的数量;
根据所述交叉熵损失值训练所述待训练深度学习模型,重新执行所述将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
2.根据权利要求1所述的方法,其特征在于,当所述三维医疗影像为肺部CT图像时,所述从三维医疗影像中提取目标区域图像,包括:
识别肺部CT图像中的肺部区域,得到肺部二值图像;
对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
根据所述肺部二值图像确定中纵膈区域二值图像;
将所述肺内组织区域二值图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图像的外接立方体区域作为目标区域图像。
3.根据权利要求2所述的方法,其特征在于,所述识别肺部CT图像中的肺部区域,得到肺部二值图像,包括:
从肺部CT图像中确定符合预设CT值范围的区域,将所述符合预设CT值范围的区域设置为第一像素值,将所述肺部CT图像中的其他区域设置为第二像素值,生成预处理二值图像;
从所述预处理二值图像中识别连通域区域,从所述预处理二值图像中提取最大连通域区域作为候选肺部二值图像;
如果所述候选肺部二值图像的起始坐标满足预设条件,将所述候选肺部二值图像确定为肺部二值图像,所述肺部二值图像中为所述第一像素值的区域为肺部区域;
如果所述候选肺部二值图像的起始坐标不满足预设条件,重新设置所述预设CT值范围,从重新执行所述从肺部图像中确定符合预设CT值范围的区域以及后续步骤。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述肺部二值图像确定中纵膈区域二值图像,包括:
将所述肺部二值图像的外接立方体区域向内缩进预设距离,得到缩进立方体区域;
将所述缩进立方体区域设置为第一像素值,将所述缩进立方体区域内的肺部区域设置为第二像素值,得到中纵膈区域二值图像。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
随机选取至少一个随机变换方式;
将所述切片图像按照目标随机变换方式在所述目标随机变换方式对应的变换范围内进行随机变换,重新生成所述切片图像,所述目标随机变换方式分别为选取的至少一个随机变换方式中的每一种。
6.一种医疗影像目标识别方法,其特征在于,所述方法包括:
从待识别医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
将从所述目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;所述连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;所述医疗影像识别模型是根据权利要求1-5任一项所述的医疗影像识别模型的训练方法训练得到的;
当所述中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定所述待识别医疗影像包含目标识别对象。
7.根据权利要求6所述的方法,其特征在于,当所述待识别医疗影像为肺部CT图像时,所述从待识别医疗影像中提取目标区域图像,包括:
识别肺部CT图像中的肺部区域,得到肺部二值图像;
对所述肺部二值图像中的空洞或缺口进行填充,得到填充后的肺部二值图像;
将所述填充后的肺部二值图像与所述肺部二值图像进行差值运算,得到肺内组织区域二值图像;
根据所述肺部二值图像确定中纵膈区域二值图像;
将所述肺内组织区域图像以及所述中纵膈区域二值图像取并集得到组合二值图像,从所述肺部CT图像中切割出所述组合二值图的外接立方体区域作为目标区域图像。
8.一种医疗影像识别模型的训练装置,其特征在于,所述装置包括:
提取单元,用于从三维医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元,用于将训练样本输入待训练深度学习模型,获得所述训练样本的识别预测结果,所述训练样本由从所述目标区域图像中选取的连续N张切片图像组成,所述训练样本的识别标签为所述训练样本的中心切片图像的识别标签,N为正整数,N小于或等于M;
获取单元,用于将所述训练样本的识别预测结果以及识别标签代入加权交叉熵损失函数获得交叉熵损失值,所述加权交叉熵损失函数针对每一识别标签类别设置对应的权重,所述权重根据具有该识别标签类别的训练样本数量、训练样本总数以及所述识别标签类别的数量确定,各个所述权重之和乘以修正系数为所述识别标签类别的数量;
训练单元,用于根据所述交叉熵损失值训练所述待训练深度学习模型,重新执行所述将训练样本输入待训练深度学习模型,直到达到预设条件,获得医疗影像识别模型。
9.一种医疗影像目标识别装置,其特征在于,所述装置包括:
提取单元,用于从待识别医疗影像中提取目标区域图像,所述目标区域图像由M张切片图像组成,M为正整数;
输入单元,用于将从所述目标区域图像中选取的连续N张切片图像输入医疗影像识别模型,得到连续N张切片图像的中心切片图像的识别结果;所述连续N张切片图像为第i张到第i+N-1张切片图像,i分别取1到M-N+1范围内的每个整数,i、N为正整数,N小于或等于M;所述医疗影像识别模型是根据权利要求1-5任一项所述的医疗影像识别模型的训练方法训练得到的;
确定单元,用于当所述中心切片图像的识别结果为目标识别结果的数量大于数量阈值,确定所述待识别医疗影像包含目标识别对象。
10.一种医疗影像识别模型的训练设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5任一项所述的医疗影像识别模型的训练方法。
11.一种医疗影像目标识别设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求6-7任一项所述的医疗影像目标识别方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如权利要求1-5任一项所述的医疗影像识别模型的训练方法,或者执行如权利要求6-7所述的医疗影像目标识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111275644.8A CN113920109A (zh) | 2021-10-29 | 2021-10-29 | 医疗影像识别模型训练方法、识别方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111275644.8A CN113920109A (zh) | 2021-10-29 | 2021-10-29 | 医疗影像识别模型训练方法、识别方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113920109A true CN113920109A (zh) | 2022-01-11 |
Family
ID=79244018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111275644.8A Pending CN113920109A (zh) | 2021-10-29 | 2021-10-29 | 医疗影像识别模型训练方法、识别方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113920109A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114648680A (zh) * | 2022-05-17 | 2022-06-21 | 腾讯科技(深圳)有限公司 | 图像识别模型的训练方法、装置、设备、介质及程序产品 |
CN116664953A (zh) * | 2023-06-28 | 2023-08-29 | 北京大学第三医院(北京大学第三临床医学院) | 2.5d肺炎医学ct影像分类装置及设备 |
WO2023165033A1 (zh) * | 2022-03-02 | 2023-09-07 | 深圳硅基智能科技有限公司 | 识别医学图像中的目标的模型训练、方法、设备及介质 |
-
2021
- 2021-10-29 CN CN202111275644.8A patent/CN113920109A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023165033A1 (zh) * | 2022-03-02 | 2023-09-07 | 深圳硅基智能科技有限公司 | 识别医学图像中的目标的模型训练、方法、设备及介质 |
CN114648680A (zh) * | 2022-05-17 | 2022-06-21 | 腾讯科技(深圳)有限公司 | 图像识别模型的训练方法、装置、设备、介质及程序产品 |
WO2023221697A1 (zh) * | 2022-05-17 | 2023-11-23 | 腾讯科技(深圳)有限公司 | 图像识别模型的训练方法、装置、设备、介质 |
CN116664953A (zh) * | 2023-06-28 | 2023-08-29 | 北京大学第三医院(北京大学第三临床医学院) | 2.5d肺炎医学ct影像分类装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232383B (zh) | 一种基于深度学习模型的病灶图像识别方法及病灶图像识别系统 | |
CN113920109A (zh) | 医疗影像识别模型训练方法、识别方法、装置及设备 | |
US10216979B2 (en) | Image processing apparatus, image processing method, and storage medium to detect parts of an object | |
CN110807788A (zh) | 医学图像处理方法、装置、电子设备及计算机存储介质 | |
US20200327721A1 (en) | Autonomous level identification of anatomical bony structures on 3d medical imagery | |
US9152926B2 (en) | Systems, methods, and media for updating a classifier | |
CN110310280B (zh) | 肝胆管及结石的图像识别方法、系统、设备及存储介质 | |
CN110136135B (zh) | 分割方法、装置、设备以及存储介质 | |
WO2007072391A2 (en) | Automatic 3-d object detection | |
CN111179295B (zh) | 改进的二维Otsu阈值图像分割方法和系统 | |
CN113012173A (zh) | 基于心脏mri的心脏分割模型和病理分类模型训练、心脏分割、病理分类方法及装置 | |
CN112419271A (zh) | 一种图像分割方法、装置及计算机可读存储介质 | |
CN112560962B (zh) | 骨骼动画的姿态匹配方法、装置、电子设备及存储介质 | |
CN111932495B (zh) | 一种医学图像检测方法、装置及存储介质 | |
CN112184684A (zh) | 一种改进的YOLO-v3算法及其在肺结节检测中的应用 | |
CN112949654A (zh) | 图像检测方法及相关装置、设备 | |
CN111260701A (zh) | 多模态视网膜眼底图像配准方法及装置 | |
Sirjani et al. | Automatic cardiac evaluations using a deep video object segmentation network | |
CN114170212A (zh) | 一种基于ct影像中肺小结节假阳检测方法及系统 | |
JP2006506163A (ja) | 肺結節のコンピュータ支援検出 | |
CN113298800A (zh) | 一种ct血管造影cta源图像的处理方法、装置及设备 | |
CN112750110A (zh) | 基于神经网络对肺部病灶区进行评估的评估系统和相关产品 | |
CN110929731B (zh) | 一种基于探路者智能搜索算法的医疗影像处理方法及装置 | |
CN112529918B (zh) | 一种脑部ct图像中脑室区域分割的方法、装置及设备 | |
CN109919098A (zh) | 目标对象的识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |