CN113450320B - 一种基于较深网络结构的超声结节分级与良恶性预测方法 - Google Patents
一种基于较深网络结构的超声结节分级与良恶性预测方法 Download PDFInfo
- Publication number
- CN113450320B CN113450320B CN202110675392.1A CN202110675392A CN113450320B CN 113450320 B CN113450320 B CN 113450320B CN 202110675392 A CN202110675392 A CN 202110675392A CN 113450320 B CN113450320 B CN 113450320B
- Authority
- CN
- China
- Prior art keywords
- nodule
- image
- classification
- benign
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
本发明涉及医学图像人工智能技术,旨在提供一种基于较深网络结构的超声结节分级与良恶性预测方法。包括:收集足量的超声结节图像,建立用于训练结节分割模型的数据集,以及分级和良恶性分类数据集;以EfficientNet‑B4网络结构作为基础网络,利用数据集进行训练,得到结节分割模型;修改全连接层并列输出结节分级和良恶性分类;使用加权交叉熵损失函数进行训练,得到分级与良恶性分类模型;利用两个模型,将待测试的静态超声图像输入、判断和结节分割,然后对超声图像中结节的分级和良恶性作出预测。与浅层网络相比,本发明提高了结节分割和分类准确率,其中结节分级与良恶性识别具有重要临床意义;可解决不同类别数量不平衡问题,提高样本较少类别的准确率。
Description
技术领域
本发明是关于医学图像人工智能技术领域,特别涉及基于深度卷积神经网络的超声结节的自动分割、分级和良恶性(良性倾向、恶性倾向)识别的方法。
背景技术
超声医生在灰阶图上找(分割)结节或对结节分级以及判断良恶性,通常是根据结节的灰阶特征(如边缘特征、回声类型、纵横比、结构特征、是否有微钙化等)进行判断的。
以乳腺为例,超声乳腺检查是目前常规体检中必不可少的检查项目,乳腺结节的早期发现及良恶性诊断对疾病的预防和治疗具有重要临床意义。
超声医生按照分级标准对结节进行分级,并决定是否要进行随访或穿刺等进一步检查。目前普遍采用美国放射学会(American College of Radiology,ACR)2013版BI-RADS分级方法,主要分为1类、2类、3类、4a类、4b类、4c类和5类,其中1类是阴性;2类良性;3类良性可能,建议随访;4类(可疑恶性)和5类(高度可疑恶性)需要穿刺等进一步检查。一般来说分级越高,实际手术病理检测的结节恶性的可能性就越大,不同分级的结节有不同的诊断和治疗标准。
但是根据超声医生的临床经验,如果严格按照分级标准,一些典型的良性病例也被划分为4类。而4类的恶性可能性只有>5%。
在按照分级标准进行标注的大量样本基础上,建立分割、分级、良恶性分类样本数据库和网络结构设计,可以部分实现自动探测结节、分级、良恶性识别。目前已有基于深度学习的乳腺结节自动探测和分级识别技术,其主要方法是:在大量有结节的超声乳腺图像上,首先由医生勾画出结节位置作为真实标签,在所有图像上训练结节分割模型;然后根据医生的BI-RADS分级数据,结合勾画的结节位置信息,训练分级分类模型;模型训练完成后,在实际应用中对输入的静态超声图像用分割网络判断是否有结节,再根据预测的结节位置和原始图像使用识别模型判断其BI-RADS分级。一般来说网络结构越深,模型预测的准确率越高。早期使用深度学习做乳腺结节探测和识别主要使用较小网络结构,如AlexNet、VGG、GoogleNet等,其主要原因是数据量比较少,而且超声图像内容单一。较深网络结构如ResNet、Inception系列由于数据量少、模型复杂度过高等原因很容易过拟合,其结节探测和BI-RADS分级识别的表现甚至不如小网络结构。随着积累的数据量逐渐增多,迫切需要比较深的网络结构提高预测准确率。
发明内容
本发明要解决的技术问题是,克服现有技术中的不足,提供一种基于较深网络结构的超声结节分级与良恶性预测方法。
为解决上述技术问题,本发明的解决方案是:
提供一种基于较深网络结构的超声结节分级与良恶性预测方法,包括以下步骤:
(1)收集足量的超声结节图像,勾画其中的结节位置,建立用于训练结节分割模型的数据集;根据勾画的结节位置信息,结合结节的BI-RADS分级结果、临床诊断结果和手术病理结果的数据,建立分级和良恶性分类数据集;
(2)以EfficientNet-B4网络结构作为基础网络,使用双倍尺寸(Double Size,DoubleSize)上采样和跳层连接方法构建分割网络;利用步骤(1)所述数据集进行训练,得到结节分割模型;
(3)以EfficientNet-B4网络结构作为基础网络,修改全连接层并列输出结节分级和良恶性分类;在步骤(1)所述数据集上使用加权交叉熵损失函数进行训练,得到分级与良恶性分类模型;
(4)将待测试的静态超声图像输入结节分割模型,判断输入图像中是否有结节及结节位置所在,进行结节分割;将分割结果和原始图像一并输入分级与良恶性分类模型,对超声图像中结节的BI-RADS分级和良恶性(即“良性倾向”和“恶性倾向)作出预测。
本发明中,所述步骤(1)包括:
(1.1)以病例为单位收集足量的术前超声灰阶图像,对文件进行重命名和匿名化处理;
以病例为单位的术前超声灰阶图像一般包含结节不同切面的多张图像,图像要求清晰,结节要求显示完整。血流图像和弹性图像不作为训练样本,因其与不同厂家的设备及人为设置参数有关,没有灰阶图稳定。构建结节分割数据集可以使用不含结节图像(例如正常乳腺),但不应超过病例数的1/5;由熟练医生按常规标准在所有数据集的超声图像上勾画出结节轮廓,生成包含结节区域的掩模图像。以经处理后的图像数据建立用于训练结节分割模型的数据集。
(1.2)根据美国放射学会的BI-RADS分级方法和临床经验,结合超声灰阶图像中勾画的结节位置信息和每个病例单位的手术病理结果,对步骤(1.1)中所得数据集进一步划分分级标签:2类结节设置标签0,3类结节设置标签1,4类结节设置标签2,5类结节设置标签3,共4类;同时根据病例的手术病理结果和良恶性分类结论,按结节的良恶性设置2个分类标签:良性倾向设置标签0,恶性倾向设置标签1;以经过处理后的图像数据建立用于训练分级和良恶性分类模型的数据集。
(1.3)以病例为单位,把前两个步骤获得的分割数据集、分级和良恶性分类数据集各自随机平均分成8份,取7份作为训练集,1份作为测试集。
本发明中,所述步骤(2)包括:
(2.1)建立结节分割网络
比较典型的网络结构主要有ZeilerNet(2013)、VggNet(2014)、Inception v4(2016)、ResNet(2016)、DenseNet(2017)、SKNet(2018)等。一般情况下网络越深模型预测准确率越高,但在数据量较少时,网络越深越难收敛,而且很容易过拟合,ResNet网络当前层的输入是上一层和前面多层的输出相加,解决了网络很深时梯度消失和退化问题,可以提高收敛速度和识别率。DenseNet和ResNet的基本思想相同,但DenseNet使用了更加密集的连接方式,SKNet等网络结构则引入了注意力机制,进一步提高了模型准确率。目前关于网络结构的研究方向主要是基于搜索方法的模型构建,如NASNet(2017)、EfficientNet(2019)等,自动搜索学习到的网络结构在预测精度和推理速度上都超越了人工设计的网络。
考虑硬件配置、模型效率以及数据量,本发明选择由移动反向瓶颈卷积(MobileInverted Bottleneck Convolution,MBConv)模块组成的EfficientNet-B4作为基础网络,其中移动反向瓶颈卷积模块由普通卷积层、深度可分离卷积、批归一化和Swish激活层组成,使用斯坦福大学创建的ImageNet在ILSVRC2012竞赛上的数据集训练EfficientNet-B4,作为后续网络的初始化参数。在EfficientNet-B4网络结构基础上使用DoubleSize上采样和跳层连接方法构建分割网络。DoubleSize上采样方法是一种替代双线性插值和反卷积上采样的方法:该网络层将输入特征图尺寸变为原来的2倍,通道数降为原来的1/4,总数据量保持不变,只需要简单的拷贝操作就可以完成,大大降低了计算复杂度和显存消耗。
原EfficientNet-B4的最后2层是全局池化层和全连接层,全连接层在全局池化层之后,建立结节分割网络需要去掉EfficientNet-B4最后2层,此时网络输出特征图尺寸是输入图像尺寸的1/32;在输出层之后连接1个3×3的卷积调整输出特征通道数,再使用DoubleSize上采样2倍,输出特征图尺寸变为网络输入图像尺寸的1/16;在EfficientNet-B4第1个输出特征图尺寸是网络输入图像尺寸的1/16的卷积层之后连接1个3×3卷积,设置输出通道数是32,作为跳层连接输出层;以特征通道连接的方式连接DoubleSize上采样输出层和跳层连接输出层,连接之后再使用3×3卷积减少输出通道数;最后在卷积层之后使用2个DoubleSize进行4倍上采样,得到分割概率图,概率图尺寸是网络输入图像尺寸的1/4。由于主网络输出的是图像高层语义特征,主要包含图像的全局信息,但缺少局部细节信息,通过这种跳层连接底层特征的方式可以使分割结果更加精确。
(2.2)分割网络构建完成后,根据输出概率图和输入的掩模图像设计自适应加权的欧式损失函数。由于大部分结节比较小,其像素区域占整张图像的比例比较小,不同结节大小也差异比较大,因此需要根据不同结节大小,设置不同区域像素分类的权重,小结节需要具有更大权重,而大结节权重可以适当减小,但仍然比背景权重大。
欧式损失函数定义为:
根据结节大小使用不同权重,加权后的损失函数:
权重的计算公式:
式中,s表示结节所占区域的像素数,γ根据样本中结节整体大小的分布情况设置,β是权重调节因子。自适应权重欧式损失函数既可以平衡结节和背景像素数比例不平衡问题,使网络模型训练时容易收敛,还可以调节不同大小结节的损失权重,小结节的权重会加大,这样可以避免漏检。
(2.3)在分割数据集上训练分割模型,在测试集上评价模型表现。
网络输入是超声结节图像的原图。采用批量训练时,对于不同尺寸图像采用填充背景方法,图像宽和高扩展为32的倍数。同批次图像根据宽和高的最大值设置网络输入的宽和高,对应的掩模图像做相同处理。扩展后图像归一化处理后输入网络,使用下采样1/4的掩模图像和网络输出的概率图计算损失函数并反向传播。训练过程中对数据做随机扰动,如翻转、对比度拉伸、添加随机噪声等,调整学习率下降策略、批次大小、冲量等参数,观察损失函数值变化和模型在测试集的表现,根据测试集的查准率-查全率(Precision-Recall,PR)曲线选取效果最好的一次模型参数作为分割模型。
本发明中,所述步骤(3)包括:
(3.1)使用EfficientNet-B4作为基础网络,去掉原有的全连接层,在全局池化层之后添加2个并列的全连接层,调整输出层神经元个数分别是4和2,对应分级和良恶性类别数,在全连接层之后再使用加权softmax交叉熵损失函数:
其中,C是类别数,y和z分别是输入真实标签和网络输出概率,wk是第k类的权重,yk第k类的真实标签,f(zk)是softmax输出;
(3.2)分级和良恶性训练数据预处理
假设识别网络输入的图像尺寸固定为M×M,在训练集上每次随机选取固定批次数据,每个数据包含一张超声图像和对应结节掩模图像,根据结节区域计算最小外接矩形及其中心坐标(x,y);每次训练迭代时,在中心坐标一定范围内进行随机平移,作为新的中心坐标,但中心坐标不能超出结节区域;根据最小外接矩形的最长边调整待识别结节区域,假设最长边长为W,如果W小于M,则识别区域为(M,M),否则识别区域为(W,W),根据新的坐标中心和识别区域裁剪超声图像和掩模图像;在裁剪后的图像上进行数据增广,如对比度、亮度拉伸、添加随机噪声和镜像等,最后进行数据归一化,把处理后的超声图像放在网络输入的第1、2通道,掩模图像放在第3通道。测试时中心坐标不做随机平移,裁剪后图像也不进行增广处理。
(3.3)训练分级与良恶性分类模型
学习率调整采用cosine方式,在分级和良恶性分类数据集的训练集上迭代50次,采用随机梯度下降法更新模型参数。使用受试者工作特征(Receiver OperatingCharacteristic,ROC)曲线的曲线下面积(Area Under Curve,AUC)评价训练过程中模型好坏,调整参数,选取AUC最高的模型作为分级与良恶性分类模型。
本发明中,所述步骤(4)包括:
(4.1)输入超声图像预测结节位置。输入的原始图像的宽和高扩展为32的倍数,扩展区域用0值填充,归一化处理后输入分割网络,网络最后1层输出预测的结节位置概率图,图像大小是输入的扩展图像的1/4,采用双线性插值放大到扩展图像大小,再根据扩展的像素信息还原回原图大小,选取合适的阈值生成预测的结节二值图像。
(4.2)在分割的结节区域内预测分级分值和良恶性。计算结节区域的最小外接矩形,根据训练和测试时的处理方法选取超声图像和结节掩模图像区域,归一化处理后输入网络,输出分级的4个概率值和良恶性疑似(即良性倾向和恶性倾向)的2个概率值。
应注意的是,该概率值只是基于超声图像特征的推断,并不是基于病理检测的结果,医生需要结合其它临床信息和检查结果,最终才能做出结节本身是良性还是恶性的诊断结论,以便进一步采取随访观察、穿刺手术等医疗处置方案。不能仅凭本发明的分析结果进行临床决策。
本发明中,超声图像是乳腺超声图像、甲状腺超声图像、肝脏超声图像中等类似超声图像的至少一种。
本发明还提供了一种基于较深网络结构的超声结节分级与良恶性预测系统,该系统是通过下述方法构建而成的:
(1)收集足量的超声结节图像,勾画其中的结节位置,建立用于训练结节分割模型的数据集;根据勾画的结节位置信息,结合结节的BI-RADS分级结果、临床诊断结果和手术病理结果的数据,建立分级和良恶性分类数据集;
(2)以EfficientNet-B4网络结构作为基础网络,使用双倍尺寸上采样和跳层连接方法构建分割网络;利用步骤(1)所述数据集进行训练,得到结节分割模型;
(3)以EfficientNet-B4网络结构作为基础网络,修改全连接层并列输出结节分级和良恶性分类;在步骤(1)所述数据集上使用加权交叉熵损失函数进行训练,得到分级与良恶性分类模型;
(4)利用前三个步骤获得的分级和良恶性分类数据集、结节分割模型和分级与良恶性分类模型,共同组成基于较深网络结构的超声结节分级与良恶性预测系统。
该系统中,步骤的具体实现方式,参照前述基于较深网络结构的超声结节分级与良恶性预测方法中所述步骤(1)-(3)的具体内容,此处不再重复表述。
与现有技术相比,本发明的有益效果是:
1、使用比较深的卷积神经网络在超声乳腺图像上训练结节分割、分级与良恶性分类模型,与浅层网络相比,提高了结节分割和分类准确率,其中结节分级与良恶性识别具有重要临床意义。
2、自适应权重欧式损失函数既可以平衡结节和背景像素数比例不平衡问题,使网络模型训练时容易收敛,还可以调节不同大小结节的损失权重,减少漏检和错检。分级与良恶性分类模型使用加权交叉熵损失函数可以解决不同类别数量不平衡问题,提高样本较少类别的准确率。
附图说明
图1为乳腺结节分割网络结构图。
图2为乳腺结节分级与良恶性分类网络结构图。
图3为乳腺结节分割模型在测试集上的查准率-查全率曲线。
图4为乳腺结节良恶性识别模型在测试集上的ROC曲线。
图5为乳腺结节分级分类模型在测试集上的ROC曲线。
具体实施方式
首先,申请人需要强调的是,本发明直接的技术目的是利用超声结节图像分割、分级和良恶性分类模型对超声结节图像进行准确分割、结节识别、分类。其最终预测的良恶性疑似结果只是一个概率性推断,并不是基于病理检测的结果。因此,本发明的预测结果不能直接作为医生的诊断依据,医生还结合临床信息及其它的检查结果,最终才能做出结节本身是良性还是恶性的诊断结论,以便进一步采取随访观察、穿刺手术等医疗处置方案。
因此,本发明的技术方案只能在医疗实践活动中作为一种辅助技术手段。本发明不能直接用于判断受验者是否存在某种疾病,更无法作为针对受验者的疾病治疗手段,因此本发明不具备疾病的诊断或治疗目的。
此外,本发明所述超声结节图像勾画、依据BI-RADS分级方法对结节等级进行划分、分类等操作,均为在实际工作中广泛应用的技术手段,具有严格的操作规程和标准。只要是在医院超声科室的在岗执业医生均可完成,不存在需要依据操作者个体经验判断的特别要求。
申请人认为,如在仔细阅读申请文件、准确理解本发明的实现原理和发明目的以后,在结合现有公知技术的情况下,本领域技术人员完全可以运用其掌握的软件编程技能实现本发明。凡本发明申请文件提及的均属此范畴,申请人不再一一列举。除特别说明的内容之外,本发明所述卷积神经网络的构建方法和训练方法均可采用本领域常规方式,故不再赘述。
下面结合附图与具体实施方式对本发明作进一步详细描述。实施例可以使本专业的专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
下面以乳腺超声结节为例,对本发明采用的较深网络结构的超声结节分级与良恶性预测方法进行举例说明。其具体步骤如下:
过程一,建立超声乳腺结节分割和分级与良恶性分类数据集
(1)收集超声乳腺数据,数据收集完成后进行文件重命名,裁剪图像上非超声区域,进行匿名化处理。以病例为单位,不需要血流图和弹性图,只需原始超声静态灰阶图像。构建结节分割数据集可以使用不含结节图像(即正常乳腺图像),但不应超过图像总数的1/5;构建分级数据集不要求有病理结果。只需熟练医生根据2013版ACRBI-RADS分级方法划分分级标签;构建良恶性分类数据集主要使用含有手术病理结果的病例和超声医生经验的良恶性分类数据。收集乳腺结节分割病例数不少于10万例,分级病例数不少于6万例,良恶性识别病例数不少于6万例。
(2)数据收集完成后,由超声科医生使用勾画工具在超声图像上勾画出结节轮廓,生成包含结节区域的掩模图像,结节区域像素值是255,背景区域像素值为0。在分级数据集上划分分级标签,2类结节设置标签0,3类结节设置标签1,4类结节设置标签2,5类结节设置标签3,共4类。根据手术病理结果划分良恶性标签,其中部分没有手术病理结果的典型良性结节可以放入良性数据集,良性设置标签0,恶性设置标签1,共2类。结节勾画、分级和良恶性分类过程是以人工方式按常规医学图像识别规则进行的,通常情况下,各医院超声检查科室的持证上岗医师均能完成该工作。
(3)以病例为单位,把分割数据集、分级和良恶性分类数据集各自随机平均分成8份,取7份作为训练集,1份作为测试集。
过程二,在乳腺结节分割数据集上训练分割模型
(1)选择由移动反向瓶颈卷积模块组成的基于搜索的EfficientNet-B4作为基础网络,使用斯坦福大学创建的ImageNet在ILSVRC2012竞赛上的数据集训练EfficientNet-B4,作为后续分割和识别网络的初始化参数。
(2)在EfficientNet-B4网络结构基础上使用DoubleSize上采样和跳层连接构建分割网络。具体方法:去掉EfficientNet-B4最后的全局池化层和全连接层,在最后输出层连接1个3×3的卷积调整输出特征通道数,然后经过DoubleSize上采样2倍,输出特征图尺寸变为网络输入图像尺寸的1/16;在EfficientNet-B4第1个输出特征图尺寸是网络输入图像尺寸1/16的输出层之后连接1个3×3卷积,设置输出通道数是32,作为跳层连接输出层;以特征通道连接的方式连接DoubleSize上采样输出层和跳层连接输出层,连接之后再使用3×3卷积减少输出特征通道数;最后在卷积层之后使用2个DoubleSize进行4倍上采样,得到分割概率图,尺寸是网络输入图像尺寸的1/4。
(3)分割网络构建完成后,使用自适应加权的欧式损失函数计算输出概率图和输入掩模图像的损失函数。欧式损失函数定义为:
权重的计算公式:
式中,s表示结节所占区域的像素数,y根据样本中结节整体大小的分布情况设置,β是权重调节因子。自适应权重欧式损失函数既可以平衡结节和背景像素数比例不平衡问题,还可以调节不同大小结节的损失权重,小结节的权重会加大,这样可以避免漏检。
(4)在分割数据集的训练集上训练分割模型,在测试集上评价模型表现。网络输入是超声原图,采用批量训练时,对于不同尺寸图像采用填充背景方法,图像宽和高扩展为32的倍数,同批次图像根据宽和高的最大值设置网络输入的宽和高,对应的掩模图像做相同处理。扩展后图像归一化处理后输入网络,使用下采样1/4的掩模图像和网络输出的概率图计算损失函数并反向传播。训练过程中对数据做随机扰动,如翻转、对比度拉伸、添加随机噪声等,调整学习率下降策略、批次大小、冲量等参数,观察损失函数值变化和模型在测试集的表现,根据测试集的PR曲线选取效果最好的一次模型参数作为分割模型。
过程三,在分级与良恶性分类数据集上训练分级与良恶性分类模型
(1)建立分级与良恶性分类网络。使用EfficientNet-B4作为基础网络,去掉原有的全连接层,在全局池化层之后添加2个并列的全连接层,调整全连接层输出神经元个数分别是4和2,对应分级和良恶性类别数,在全连接层之后再使用加权softmax交叉熵损失函数:
其中,C是类别数,y和z分别是输入真实标签和网络输出概率,wk是第k类的权重,yk第k类的真实标签,f(zk)是softmax输出。
(2)输入数据预处理。设识别网络输入的图像尺寸固定为M×M,在训练集上每次随机选取固定批次数据,每个数据包含一张超声图像和对应结节掩模图像,根据结节区域计算最小外接矩形及其中心坐标(x,y);每次训练迭代时,在中心坐标一定范围内进行随机平移,作为新的中心坐标,但中心坐标不能超出结节区域;根据最小外接矩形的最长边调整待识别结节区域,假设最长边长为W,如果W小于M,则识别区域为(M,M),否则识别区域为(W,W),根据新的坐标中心和识别区域裁剪超声图像和掩模图像;在裁剪后的图像上进行数据增广,如对比度、亮度拉伸、添加随机噪声和镜像等,最后进行数据归一化,把处理后的超声图像放在网络输入的第1、2通道,掩模图像放在第3通道。测试时中心坐标不做随机平移,裁剪后图像也不进行增广处理。
(3)训练分级与良恶性分类模型。学习率调整采用cosine方式,在训练集上迭代50次,采用随机梯度下降法更新模型参数。根据临床应用需要,结节分级为4类,良恶性识别为2类,使用在测试集的分类ROC曲线的AUC面积评价模型好坏,调整参数,选取AUC最高的模型作为分级与良恶性分类模型。
至此,利用前三个过程分别获得的分级和良恶性分类数据集、结节分割模型和分级与良恶性分类模型,即可共同组成基于较深网络结构的超声结节分级与良恶性预测系统。以下的过程四的描述内容,是对基于该系统的应用方法的进一步展示。
过程四,输入测试图像进行结节分割和预测分级分值与良恶性
(1)输入超声图像预测结节位置。首先把输入的原始图像的宽和高扩展为32的倍数,扩展区域用0值填充,归一化处理后输入预测系统的分割网络,网络输出结节位置概率图,尺寸是输入扩展图像的1/4,采用双线性插值放大到扩展图像大小,再根据扩展像素信息还原回原图大小,选取合适阈值生成预测的结节二值图像。
(2)在分割的结节区域内预测分级分值和良恶性。在预测的结节二值图像上获取结节的最小外接矩形,根据训练时的方法选取结节识别区域,归一化处理后输入网络,最后输出分级的4个概率值和良恶性疑似的2个概率值,其概率值之和是1。
根据上述分级和良恶性预测的概率值结果,超声医生还需要结合病人的临床信息、动态多切面和超声血流或弹性图像等的检查结果,最终才能做出结节本身是良性还是恶性的诊断结论,以便进一步采取随访观察、穿刺手术等医疗处置方案。
最后,需要注意的是,以上列举的仅是本发明的具体实施例。显然,本发明不限于以上实施例,还可以有很多变形和应用场景,如超声乳腺、超声肝脏、超声甲状腺等。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形,均应认为是本发明的保护范围。
Claims (6)
1.一种基于较深网络结构的超声结节分级与良恶性预测方法,其特征在于,包括以下步骤:
(1)收集足量的超声结节图像,勾画其中的结节位置,建立用于训练结节分割模型的数据集;根据勾画的结节位置信息,结合结节的BI-RADS分级结果、临床诊断结果和手术病理结果的数据,建立分级和良恶性分类数据集;
(2)以EfficientNet-B4网络结构作为基础网络,使用双倍尺寸上采样和跳层连接方法构建分割网络;利用步骤(1)所述数据集进行训练,得到结节分割模型;
该步骤具体包括:
(2.1)建立结节分割网络
选择由移动反向瓶颈卷积模块组成的EfficientNet-B4作为基础网络,在此基础上使用DoubleSize上采样和跳层连接方法构建分割网络;
去掉原EfficientNet-B4最后2层的全局池化层和全连接层,记为EfficientNet-B4基础分割网络,此时网络的输出特征图尺寸是输入图像尺寸的1/32;在EfficientNet-B4基础分割网络的最后一个输出层之后,连接1个3×3卷积调整输出特征通道数,然后使用DoubleSize上采样2倍,此时输出特征图尺寸变为网络输入图像尺寸的1/16;在EfficientNet-B4基础分割网络第1个输出特征图尺寸是网络输入图像尺寸的1/16的卷积层之后,连接1个输出特征通道数是32的3×3卷积层作为跳层连接输出层;以特征通道连接的方式将DoubleSize上采样输出层的输出和跳层连接输出层的输出连接起来,连接之后再使用3×3卷积减少输出特征通道数;最后在卷积层之后使用2个DoubleSize进行4倍上采样,得到分割概率图,概率图尺寸是网络输入图像尺寸的1/4;
(2.2)根据输出概率图和输入的掩模图像中的结节大小,设计自适应加权的欧式损失函数为:
根据结节大小使用不同权重,加权后的损失函数:
权重的计算公式:
式中,s表示结节所占区域的像素数,γ根据样本中结节整体大小的分布情况设置,β是权重调节因子;
(2.3)在分割数据集上训练分割模型,在测试集上评价模型表现;
以超声结节图像的原图作为分割网络的输入进行批量训练;对于不同尺寸图像采用填充背景方法,图像宽和高扩展为32的倍数,同批次图像根据宽和高的最大值设置网络输入的宽和高,对应的掩模图像做相同处理;扩展后图像归一化处理后输入网络,使用下采样1/4的掩模图像和网络输出的概率图计算损失函数并反向传播;训练过程中对数据做随机扰动操作并调整参数,观察损失函数值变化和模型在测试集的表现,根据测试集的查准率-查全率曲线选取效果最好的一次模型参数作为分割模型;
(3)以EfficientNet-B4网络结构作为基础网络,修改全连接层并列输出结节分级和良恶性分类;在步骤(1)所述数据集上使用加权交叉熵损失函数进行训练,得到分级与良恶性分类模型;
该步骤具体包括:
(3.1)建立分级与良恶性分类网络
使用EfficientNet-B4作为基础网络,去掉原有的全连接层,在全局池化层之后添加2个并列的全连接层,调整输出层神经元个数分别是4和2,对应分级和良恶性类别数,在全连接层之后再使用加权softmax交叉熵损失函数:
其中,C是类别数,y和z分别是输入真实标签和网络输出概率,wk是第k类的权重,yk第k类的真实标签,f(zk)是softmax输出;
(3.2)分级和良恶性训练数据的预处理
将输入的图像尺寸固定为M×M,在训练集上每次随机选取固定批次数据,每个数据包含一张超声图像和对应结节掩模图像,根据结节区域计算最小外接矩形及其中心坐标(x,y);每次训练迭代时,在中心坐标设定范围内进行随机平移,作为新的中心坐标,但中心坐标不能超出结节区域;根据最小外接矩形的最长边调整待识别结节区域,假设最长边长为W,如果W小于M,则识别区域为(M,M),否则识别区域为(W,W),根据新的坐标中心和识别区域裁剪超声图像和掩模图像;在裁剪后的图像上进行数据增广,然后进行数据归一化,把处理后的超声图像放在网络输入的第1、2通道,掩模图像放在第3通道;测试时中心坐标不做随机平移,裁剪后图像也不进行增广处理;
(3.3)训练分级与良恶性分类模型:
采用cosine方式调整学习率,在分级和良恶性分类数据集的训练集上迭代50次,采用随机梯度下降法更新模型参数;使用受试者工作特征曲线的曲线下面积评价训练过程中模型好坏,调整参数,选取AUC最高的模型作为分级与良恶性分类模型;
(4)将待测试的静态超声图像输入结节分割模型,判断输入图像中是否有结节及结节位置所在,进行结节分割;将分割结果和原始图像一并输入分级与良恶性分类模型,对超声图像中结节的BI-RADS分级和良恶性作出预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)具体包括:
(1.1)以病例为单位收集足量的术前超声灰阶图像,对文件进行重命名和匿名化处理;每个病例单位应包含结节不同切面的多张灰阶图像,确保图像清晰、结节显示完整;在超声灰阶图像上勾画出结节轮廓,生成包含结节区域的掩模图像;以经处理后的图像数据建立用于训练结节分割模型的数据集;
(1.2)根据美国放射学会的BI-RADS分级方法,结合超声灰阶图像中勾画的结节位置信息和每个病例单位的手术病理结果,对步骤(1.1)中所得数据集进一步划分4个分级标签:2类设置标签0,3类结节标签1,4类结节标签2,5类设置标签3;同时按结节的良恶性设置2个分类标签:良性设置标签0,恶性设置标签1;以经过处理后的图像数据,建立用于训练分级和良恶性分类模型的数据集;
(1.3)以病例为单位,把步骤(1.1)和(1.2)所得的两个数据集中的超声结节图像各自随机平均分成8份,取其中7份作为训练集,另1份作为测试集。
3.根据权利要求1所述的方法,其特征在于,所述步骤(4)包括:
(4.1)输入超声图像预测结节位置
将输入的原始图像的宽和高扩展为32的倍数,扩展区域用0值填充,归一化处理后输入结节分割网络;网络最后一层输出预测的结节位置概率图,图像大小是输入的扩展图像的1/4;采用双线性插值放大到扩展图像大小,再根据扩展的像素信息还原回原图大小,选取合适的阈值生成预测的结节二值图像;
(4.2)在分割的结节区域内对分级分值和良恶性可疑进行预测
计算结节区域的最小外接矩形,根据训练和测试时的处理方法选取超声图像和结节掩模图像区域,归一化处理后输入分级与良恶性分类模型,输出分级的4个概率值和良性倾向和恶性倾向的2个概率值,输出分级的4个概率值之和为1,良性倾向和恶性倾向的2个概率值之和也为1。
4.根据权利要求1所述的方法,其特征在于,所述超声图像是乳腺超声图像、肝脏超声图像或甲状腺超声图像中的至少一种。
5.一种基于较深网络结构的超声结节分级与良恶性预测系统,其特征在于,该系统是通过下述方法构建而成的:
(1)收集足量的超声结节图像,勾画其中的结节位置,建立用于训练结节分割模型的数据集;根据勾画的结节位置信息,结合结节的BI-RADS分级结果、临床诊断结果和手术病理结果的数据,建立分级和良恶性分类数据集;
(2)以EfficientNet-B4网络结构作为基础网络,使用双倍尺寸上采样和跳层连接方法构建分割网络;利用步骤(1)所述数据集进行训练,得到结节分割模型;具体包括:
(2.1)建立结节分割网络
选择由移动反向瓶颈卷积模块组成的EfficientNet-B4作为基础网络,在此基础上使用DoubleSize上采样和跳层连接方法构建分割网络;
去掉原EfficientNet-B4最后2层的全局池化层和全连接层,记为EfficientNet-B4基础分割网络,此时网络的输出特征图尺寸是输入图像尺寸的1/32;在EfficientNet-B4基础分割网络的最后一个输出层之后,连接1个3×3卷积调整输出特征通道数,然后使用DoubleSize上采样2倍,此时输出特征图尺寸变为网络输入图像尺寸的1/16;在EfficientNet-B4基础分割网络第1个输出特征图尺寸是网络输入图像尺寸的1/16的卷积层之后,连接1个输出特征通道数是32的3×3卷积层作为跳层连接输出层;以特征通道连接的方式将DoubleSize上采样输出层的输出和跳层连接输出层的输出连接起来,连接之后再使用3×3卷积减少输出特征通道数;最后在卷积层之后使用2个DoubleSize进行4倍上采样,得到分割概率图,概率图尺寸是网络输入图像尺寸的1/4;
(2.2)根据输出概率图和输入的掩模图像中的结节大小,设计自适应加权的欧式损失函数为:
根据结节大小使用不同权重,加权后的损失函数:
权重的计算公式:
式中,s表示结节所占区域的像素数,γ根据样本中结节整体大小的分布情况设置,β是权重调节因子;
(2.3)在分割数据集上训练分割模型,在测试集上评价模型表现;
以超声结节图像的原图作为分割网络的输入进行批量训练;对于不同尺寸图像采用填充背景方法,图像宽和高扩展为32的倍数,同批次图像根据宽和高的最大值设置网络输入的宽和高,对应的掩模图像做相同处理;扩展后图像归一化处理后输入网络,使用下采样1/4的掩模图像和网络输出的概率图计算损失函数并反向传播;训练过程中对数据做随机扰动操作并调整参数,观察损失函数值变化和模型在测试集的表现,根据测试集的查准率-查全率曲线选取效果最好的一次模型参数作为分割模型;
(3)以EfficientNet-B4网络结构作为基础网络,修改全连接层并列输出结节分级和良恶性分类;在步骤(1)所述数据集上使用加权交叉熵损失函数进行训练,得到分级与良恶性分类模型;具体包括:
(3.1)建立分级与良恶性分类网络
使用EfficientNet-B4作为基础网络,去掉原有的全连接层,在全局池化层之后添加2个并列的全连接层,调整输出层神经元个数分别是4和2,对应分级和良恶性类别数,在全连接层之后再使用加权softmax交叉熵损失函数:
其中,C是类别数,y和z分别是输入真实标签和网络输出概率,wk是第k类的权重,yk第k类的真实标签,f(zk)是softmax输出;
(3.2)分级和良恶性训练数据的预处理
将输入的图像尺寸固定为M×M,在训练集上每次随机选取固定批次数据,每个数据包含一张超声图像和对应结节掩模图像,根据结节区域计算最小外接矩形及其中心坐标(x,y);每次训练迭代时,在中心坐标设定范围内进行随机平移,作为新的中心坐标,但中心坐标不能超出结节区域;根据最小外接矩形的最长边调整待识别结节区域,假设最长边长为W,如果W小于M,则识别区域为(M,M),否则识别区域为(W,W),根据新的坐标中心和识别区域裁剪超声图像和掩模图像;在裁剪后的图像上进行数据增广,然后进行数据归一化,把处理后的超声图像放在网络输入的第1、2通道,掩模图像放在第3通道;测试时中心坐标不做随机平移,裁剪后图像也不进行增广处理;
(3.3)训练分级与良恶性分类模型:
采用cosine方式调整学习率,在分级和良恶性分类数据集的训练集上迭代50次,采用随机梯度下降法更新模型参数;使用受试者工作特征曲线的曲线下面积评价训练过程中模型好坏,调整参数,选取AUC最高的模型作为分级与良恶性分类模型;
(4)利用前三个步骤获得的分级和良恶性分类数据集、结节分割模型和分级与良恶性分类模型,共同组成基于较深网络结构的超声结节分级与良恶性预测系统。
6.根据权利要求5所述的系统,其特征在于,所述步骤(1)具体包括:
(1.1)以病例为单位收集足量的术前超声灰阶图像,对文件进行重命名和匿名化处理;每个病例单位应包含结节不同切面的多张灰阶图像,确保图像清晰、结节显示完整;在超声灰阶图像上勾画出结节轮廓,生成包含结节区域的掩模图像;以经处理后的图像数据建立用于训练结节分割模型的数据集;
(1.2)根据美国放射学会的BI-RADS分级方法,结合超声灰阶图像中勾画的结节位置信息和每个病例单位的手术病理结果,对步骤(1.1)中所得数据集进一步划分4个分级标签:2类设置标签0,3类结节标签1,4类结节标签2,5类设置标签3;同时按结节的良恶性设置2个分类标签:良性设置标签0,恶性设置标签1;以经过处理后的图像数据,建立用于训练分级和良恶性分类模型的数据集;
(1.3)以病例为单位,把步骤(1.1)和(1.2)所得的两个数据集中的超声结节图像各自随机平均分成8份,取其中7份作为训练集,另1份作为测试集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110675392.1A CN113450320B (zh) | 2021-06-17 | 2021-06-17 | 一种基于较深网络结构的超声结节分级与良恶性预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110675392.1A CN113450320B (zh) | 2021-06-17 | 2021-06-17 | 一种基于较深网络结构的超声结节分级与良恶性预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113450320A CN113450320A (zh) | 2021-09-28 |
CN113450320B true CN113450320B (zh) | 2022-11-29 |
Family
ID=77811756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110675392.1A Active CN113450320B (zh) | 2021-06-17 | 2021-06-17 | 一种基于较深网络结构的超声结节分级与良恶性预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113450320B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115990034A (zh) * | 2021-10-19 | 2023-04-21 | 复旦大学 | 一种随机空间采样的超快超声血流成像方法及系统 |
CN114219807B (zh) * | 2022-02-22 | 2022-07-12 | 成都爱迦飞诗特科技有限公司 | 乳腺超声检查图像分级方法、装置、设备和存储介质 |
CN114742761A (zh) * | 2022-03-14 | 2022-07-12 | 什维新智医疗科技(上海)有限公司 | 一种基于神经网络的结节良恶性判断装置 |
CN114881925A (zh) * | 2022-03-30 | 2022-08-09 | 什维新智医疗科技(上海)有限公司 | 一种基于弹性超声图像的结节良恶性判定装置 |
CN116612311A (zh) * | 2023-03-13 | 2023-08-18 | 浙江大学 | 一种面向样本不均衡的不合格免疫组化图像识别系统 |
CN117392125B (zh) * | 2023-12-08 | 2024-03-12 | 中山大学附属第五医院 | 基于深度卷积神经网络的乳腺超声图像分析方法和系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228124B (zh) * | 2016-07-17 | 2019-03-08 | 西安电子科技大学 | 基于卷积神经网络的sar图像目标检测方法 |
CN106778583B (zh) * | 2016-12-07 | 2019-12-17 | 北京理工大学 | 基于卷积神经网络的车辆属性识别方法与装置 |
CN107169974A (zh) * | 2017-05-26 | 2017-09-15 | 中国科学技术大学 | 一种基于多监督全卷积神经网络的图像分割方法 |
CN110097568B (zh) * | 2019-05-13 | 2023-06-09 | 中国石油大学(华东) | 一种基于时空双分支网络的视频对象检测与分割方法 |
EP4014201A1 (en) * | 2019-08-14 | 2022-06-22 | F. Hoffmann-La Roche AG | Three dimensional object segmentation of medical images localized with object detection |
US11468266B2 (en) * | 2019-09-27 | 2022-10-11 | Raytheon Company | Target identification in large image data |
CN110992365B (zh) * | 2019-11-04 | 2023-04-18 | 杭州电子科技大学 | 一种基于图像语义分割的损失函数及其设计方法 |
CN111210435B (zh) * | 2019-12-24 | 2022-10-18 | 重庆邮电大学 | 一种基于局部和全局特征增强模块的图像语义分割方法 |
CN111126278B (zh) * | 2019-12-24 | 2023-06-20 | 北京邮电大学 | 针对少类别场景的目标检测模型优化与加速的方法 |
CN111159450A (zh) * | 2019-12-30 | 2020-05-15 | 上海眼控科技股份有限公司 | 图片分类方法、装置、计算机设备和存储介质 |
CN111243042A (zh) * | 2020-02-28 | 2020-06-05 | 浙江德尚韵兴医疗科技有限公司 | 基于深度学习的超声甲状腺结节良恶性特征可视化的方法 |
CN111539930B (zh) * | 2020-04-21 | 2022-06-21 | 浙江德尚韵兴医疗科技有限公司 | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 |
CN112686903A (zh) * | 2020-12-07 | 2021-04-20 | 嘉兴职业技术学院 | 一种改进的高分辨率遥感图像语义分割模型 |
-
2021
- 2021-06-17 CN CN202110675392.1A patent/CN113450320B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113450320A (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113450320B (zh) | 一种基于较深网络结构的超声结节分级与良恶性预测方法 | |
US10140544B1 (en) | Enhanced convolutional neural network for image segmentation | |
CN108492297B (zh) | 基于深度级联卷积网络的mri脑肿瘤定位与瘤内分割方法 | |
CN111539930B (zh) | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 | |
CN108268870B (zh) | 基于对抗学习的多尺度特征融合超声图像语义分割方法 | |
Enokiya et al. | Automatic liver segmentation using U-Net with Wasserstein GANs | |
US6125194A (en) | Method and system for re-screening nodules in radiological images using multi-resolution processing, neural network, and image processing | |
US20090082637A1 (en) | Multi-modality fusion classifier with integrated non-imaging factors | |
US20230230241A1 (en) | System and method for detecting lung abnormalities | |
CN112365973B (zh) | 基于对抗网络和Faster R-CNN的肺结节辅助诊断系统 | |
Popescu et al. | Retinal blood vessel segmentation using pix2pix gan | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
CN111723817A (zh) | 一种肺结节辅助检测方法 | |
Maaliw et al. | AWFCNET: An attention-aware deep learning network with fusion classifier for breast cancer classification using enhanced mammograms | |
Gugulothu et al. | A novel deep learning approach for the detection and classification of lung nodules from ct images | |
Guo et al. | A new fuzzy-rough feature selection algorithm for mammographic risk analysis | |
Ellis et al. | Impact of hybrid supervision approaches on the performance of artificial intelligence for the classification of chest radiographs | |
Pal et al. | Detection of lung cancer using ct-scan image-deep learning approach | |
CN115311491A (zh) | 一种基于课程学习及空间注意力的骨折假阳性筛除方法 | |
Somasundaram et al. | An efficient detection of kidney stone based on hdvs deep learning approach | |
CN112862089A (zh) | 一种具有可解释性的医学图像深度学习方法 | |
Kalam et al. | Detection of brain tumor in MRI images using optimized ANFIS classifier | |
CN110969117A (zh) | 一种基于Attention机制的全卷积神经网络的眼底图像分割方法 | |
Zeeshan Aslam et al. | AML‐Net: Attention‐based multi‐scale lightweight model for brain tumour segmentation in internet of medical things | |
Mudduluru | Developing and Applying Hybrid Deep Learning Models for Computer-Aided Diagnosis of Medical Image Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |