CN116703901B - 肺部医学ct影像分割及分类装置及设备 - Google Patents

肺部医学ct影像分割及分类装置及设备 Download PDF

Info

Publication number
CN116703901B
CN116703901B CN202310970353.3A CN202310970353A CN116703901B CN 116703901 B CN116703901 B CN 116703901B CN 202310970353 A CN202310970353 A CN 202310970353A CN 116703901 B CN116703901 B CN 116703901B
Authority
CN
China
Prior art keywords
lung
medical
classification
segmentation
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310970353.3A
Other languages
English (en)
Other versions
CN116703901A (zh
Inventor
袁慧书
李书芳
王晓华
许锋
车培帅
尹文宇
叶凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Peking University Third Hospital Peking University Third Clinical Medical College
Original Assignee
Beijing University of Posts and Telecommunications
Peking University Third Hospital Peking University Third Clinical Medical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications, Peking University Third Hospital Peking University Third Clinical Medical College filed Critical Beijing University of Posts and Telecommunications
Priority to CN202310970353.3A priority Critical patent/CN116703901B/zh
Publication of CN116703901A publication Critical patent/CN116703901A/zh
Application granted granted Critical
Publication of CN116703901B publication Critical patent/CN116703901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本申请提供一种肺部医学CT影像分割及分类装置及设备,装置包括:目标肺实质提取模块用于基于预设的CT阈值对当前的目标肺部医学CT影像数据进行肺实质区域提取;多任务分割及分类模块用于将所述目标肺实质图像数据分别输入多个肺部医学CT影像分割及分类模型,以得到多个肺部病灶区域分割及病灶分类结果数据,肺部医学CT影像分割及分类模型为nnUNet优化模型;分割及分类结果确定模块用于确定目标肺部病灶区域分割及病灶分类结果数据。本申请能够实现对肺部医学CT影像的自动化病灶区域分割及病灶分类,并能够在不要求数量来源相同的基础上,有效提高肺部医学CT影像分割及分类结果的可靠性及准确性。

Description

肺部医学CT影像分割及分类装置及设备
技术领域
本申请涉及医疗辅助设备技术领域,尤其涉及肺部医学CT影像分割及分类装置及设备。
背景技术
在大数据及人工智能技术的背景下,组学研究已成为精准医疗的研究重点。目前,人工智能在胸部影像领域的应用较为成熟。人工智能精确检出肺结节,辅助X线筛查结核患者及低剂量CT筛查肿瘤,能精准分割肺部器官(肺叶段、支气管等)和肺结节等病灶,通过提取病灶高通量影像组学特征,能进一步精确鉴别疾病,评估疗效和预测患者预后。肺炎临床上面临的主要问题是在短时间内阅读和分析大量的肺部医学CT影像,准确识别出肺炎患者,这对影像科的读片和诊断是一个巨大的挑战。因此借助人工智能的辅助,实现快速、准确的影像学判断至关重要。
目前,尽管CT影像分割分类技术已经得到了广泛的研究,但由于各个医学CT影像的采样设备不同、病人体型差异等因素,因此使得采用这些医学CT影像训练后的单一分割模型的预测准确性低;同时,由于现有的分割模型多为2D(二维)模型,但是2D的分割模型不能充分利用数据的空间信息,而医疗影像的大部分数据都是3D(三维)的,因此使用2D的分割模型会由于其缺少切片之间的上下文关系而导致其对具有各向异性的数据分割效果不好,尤其针对3D的医学CT影像,当前的分割模型对其进行预测的准确性极为受限。
发明内容
鉴于此,本申请实施例提供了肺部医学CT影像分割及分类装置及设备,以消除或改善现有技术中存在的一个或更多个缺陷。
本申请的一个方面提供了一种肺部医学CT影像分割及分类装置,包括:
目标肺实质提取模块,用于基于预设的CT阈值对当前的目标肺部医学CT影像数据进行肺实质区域提取,以得到对应的目标肺实质图像数据;
多任务分割及分类模块,用于将所述目标肺实质图像数据分别输入多个肺部医学CT影像分割及分类模型,以使各个所述肺部医学CT影像分割及分类模型分别输出所述目标肺实质图像数据对应的肺部病灶区域分割及病灶分类结果数据,其中,所述肺部医学CT影像分割及分类模型为预先采用不同的各个历史肺实质图像数据对nnUNet优化模型训练后得到的,所述nnUNet优化模型为在nnUNet模型中增加通道注意力模块和深监督模块后生成的;
分割及分类结果确定模块,用于根据各个所述肺部病灶区域分割及病灶分类结果数据确定所述目标肺部医学CT影像数据唯一对应的目标肺部病灶区域分割及病灶分类结果数据。
在本申请的一些实施例中,还包括:与所述多任务分割及分类模块连接的多任务模型训练模块;
所述多任务模型训练模块,用于采用不同的各个设有标签的历史肺实质图像数据各自对应的历史肺实质图像数据分别训练多个nnUNet优化模型,以使得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型;
其中,所述标签包括:肺部病灶区域的位置信息以及分别用于表示无肺炎症状、大叶型肺炎、小叶型肺炎和间质型肺炎的各个标识。
在本申请的一些实施例中,还包括:与所述多任务模型训练模块连接的历史肺实质提取模块;
所述历史肺实质提取模块,用于基于预设的CT阈值,对各个设有标签的历史肺部医学CT影像数据分别进行肺实质区域提取,以得到各个所述历史肺部医学CT影像数据各自对应的历史肺实质图像数据。
在本申请的一些实施例中,还包括:与所述历史肺实质提取模块连接的历史影像预处理模块;
所述历史影像预处理模块,用于将获取的用于肺炎病灶历史诊断的各个历史肺部医学CT影像数据进行预处理,以得到对应的各个设有标签的历史肺实质图像数据。
在本申请的一些实施例中,还包括:分别连接至所述多任务模型训练模块和所述历史肺实质提取模块的数据增强模块;
所述数据增强模块,用于以预设的数据增强方式对各个所述历史肺实质图像数据进行数据增强处理,并将对应的数据增强结果划分为各个训练集,且每个训练集分别用于存储不同的各个历史肺实质图像数据;
其中,所述数据增强方式包括:随机旋转、随机缩放、随机弹性变换、伽马校正和增加镜像方式中的至少一种。
在本申请的一些实施例中,所述多任务模型训练模块包括:
模型训练及交叉验证单元,用于采用各个所述训练集分别训练多个nnUNet优化模型,并在训练过程中采用五折交叉验证方式对各个所述nnUNet优化模型在每轮迭代得到的模型参数进行交叉验证,并基于对应的交叉验证优化各个所述nnUNet优化模型,直到结束迭代后训练得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型。
在本申请的一些实施例中,所述多任务模型训练模块还包括:
模型优选单元,用于采用预设的测试肺实质图像数据对各个所述肺部医学CT影像分割及分类模型分别对预设的测试肺实质图像数据分别进行模型测试,并根据对应的测试结果在各个所述肺部医学CT影像分割及分类模型中择一作为肺部医学CT影像分割及分类最优模型;
相对应的,所述肺部医学CT影像分割及分类装置还包括:与所述目标肺实质提取模块连接的单任务分割及分类模块;
所述单任务分割及分类模块,用于将所述目标肺实质图像数据输入所述肺部医学CT影像分割及分类最优模型,以使该肺部医学CT影像分割及分类最优模型输出所述目标肺实质图像数据对应的目标肺部病灶区域分割及病灶分类结果数据。
在本申请的一些实施例中,所述历史肺实质提取模块包括:
肺实质提取单元,用于对各个设有标签的历史肺部医学CT影像数据分别执行预设的肺实质提取步骤,该肺实质提取步骤包括:基于预设的CT阈值在当前的历史肺部医学CT影像数据中获取肺部组织轮廓,对所述肺部组织轮廓进行填充以得到对应的肺部图像掩膜,再将所述肺部图像掩膜和所述肺部组织轮廓进行异或运算以得到对应的肺腔区域图像掩膜,并采用该肺腔区域图像掩膜对应的边界框对当前的历史肺部医学CT影像数据进行裁剪,以得到该历史肺部医学CT影像数据对应的历史肺实质图像数据;
重采样及标准化单元,用于对各个所述历史肺实质图像数据进行重采样和标准化处理。
在本申请的一些实施例中,所述肺部医学CT影像分割及分类模型包括:依次连接的编码器、连接模块和解码器,还包括:连接在所述编码器和解码器之间的各个跳跃连接模块,以及,设置在所述解码器中的深监督模块;
所述编码器包括依次连接的多个下采样模块,且每个所述下采样模块均包括:依次连接的两个下采样单元、通道注意力模块和最大池化层;
所述解码器包括依次连接的多个上采样模块,且每个所述上采样模块均包括:依次连接的两个上采样单元、通道注意力模块和转置卷积层;所述连接模块包括:依次连接的两个连接单元和一通道注意力模块;
各个所述跳跃连接模块分别连接一一对应的所述下采样模块和所述上采样模块;
所述深监督模块包括:多个辅助分类器;且所述解码器中的非首个且非末尾的上采样模块上分别设有所述辅助分类器;
所述下采样单元、所述上采样单元和所述连接单元均包括:依次连接的卷积层、实例归一化层和带泄露修正线性单元。
本申请的第二个方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的肺部医学CT影像分割及分类装置的功能。
本申请的第三个方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的肺部医学CT影像分割及分类装置的功能。
本申请提供的肺部医学CT影像分割及分类装置,包括:目标肺实质提取模块,用于基于预设的CT阈值对当前的目标肺部医学CT影像数据进行肺实质区域提取,以得到对应的目标肺实质图像数据,能够通过采用阈值法分割肺实质,使得训练模型所用的数据聚焦在肺部区域,能够在不要求数量来源相同的基础上,有效提高采用肺实质数据训练得到的模型应用的可靠性及预测结果的准确性;还包括:多任务分割及分类模块,用于将所述目标肺实质图像数据分别输入多个肺部医学CT影像分割及分类模型,以使各个所述肺部医学CT影像分割及分类模型分别输出所述目标肺实质图像数据对应的肺部病灶区域分割及病灶分类结果数据,分割及分类结果确定模块,用于根据各个所述肺部病灶区域分割及病灶分类结果数据确定所述目标肺部医学CT影像数据唯一对应的目标肺部病灶区域分割及病灶分类结果数据,能够通过采用多任务预测及多个结果汇总择一的方式,进一步提高得到的目标肺部病灶区域分割及病灶分类结果数据的可靠性及准确性;其中,所述肺部医学CT影像分割及分类模型为预先采用不同的各个历史肺实质图像数据对nnUNet优化模型训练后得到的,所述nnUNet优化模型为在nnUNet模型中增加通道注意力模块和深监督模块后生成的,通过采用增加通道注意力模块和深监督模块的nnUNet优化模型作为肺部医学CT影像分割及分类模型,能够进一步提高得到的目标肺部病灶区域分割及病灶分类结果数据的可靠性及准确性。
本申请的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本申请的实践而获知。本申请的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
本领域技术人员将会理解的是,能够用本申请实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本申请能够实现的上述和其他目的。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。附图中的部件不是成比例绘制的,而只是为了示出本申请的原理。为了便于示出和描述本申请的一些部分,附图中对应部分可能被放大,即,相对于依据本申请实际制造的示例性装置中的其它部件可能变得更大。在附图中:
图1为本申请一实施例中的肺部医学CT影像分割及分类装置的第一种结构示意图。
图2为本申请一实施例中的肺部医学CT影像分割及分类装置与其他设备之间的第一种连接关系示意图。
图3为本申请一实施例中的肺部医学CT影像分割及分类装置的第二种结构示意图。
图4为本申请一实施例中的肺部医学CT影像分割及分类装置的第三种结构示意图。
图5为本申请一实施例中的肺部医学CT影像分割及分类装置与其他设备之间的第二种连接关系示意图。
图6为本申请一实施例中的肺部医学CT影像分割及分类模型的总网络架构举例示意图。
图7为本申请一实施例中的肺部医学CT影像分割及分类模型中的SE模块的网络架构举例示意图。
图8为本申请应用实例中提供的肺部医学CT影像分割及分类模型的训练方法的流程示意图。
图9(a)为原始CT图像的举例示意图。
图9(b)为采用本申请提供的肺实质提取单元自原始CT图像提取出的肺实质掩码图的举例示意图。
图10(a)为原始切片的举例示意图。
图10(b)为医生对原始切片的注标签三维重建结果的举例示意图。
图10(c)为采用本申请提供的装置预测得到的针对原始切片所对应的三维重建结果的举例示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面结合实施方式和附图,对本申请做进一步详细说明。在此,本申请的示意性实施方式及其说明用于解释本申请,但并不作为对本申请的限定。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本申请,在附图中仅仅示出了与根据本申请的方案密切相关的结构和/或处理步骤,而省略了与本申请关系不大的其他细节。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
在此,还需要说明的是,如果没有特殊说明,术语“连接”在本文不仅可以指直接连接,也可以表示存在中间物的间接连接。
在下文中,将参考附图描述本申请的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
社区获得性肺炎CAP (community acquired pneumonia) 因其具有较高的发病率及死亡率,尤其是婴幼儿及老年人群健康的常见感染性疾病。影像学检查在肺炎的诊断中具有重要作用。
肺炎的CT可以表现为单发/多发、局限/弥漫的浸润影、磨玻璃密度影、实变影等,与其他肺部非感染性疾病的影像表现有重叠,要求放射科医师积累大量的经验以达到较高的诊断水平。采用传统目测检视的方法由放射科医师逐一排查患者的肺部 CT 影像,鉴别社区获得性肺炎、病毒肺炎和肺内非感染性疾病(如肺水肿、过敏性肺炎、早期肺腺癌等),既对诊断医师的理论和经验有较高的要求,且分类效率较低,主观性强,缺乏量化标准。因此,亟需一种装置来完成肺部CT影像中病灶的快速识别,实现肺炎的智能筛查与诊断,提供定量化指标,辅助临床医师的治疗决策。
近年来,大量学者已开发大量深度学习工具,用于肺内浸润影、磨玻璃密度影、实变影的自动分割、定量评估病变受累范围,自动诊断及预测疾病预后,建立的影像标志物在临床诊疗过程中显示出巨大的前景。有学者采用计算机辅助分析平台对患者胸部CT影像的肺炎区域进行自动分割,计算得出肺炎密度分布特征并降维至32个特征后,通过将上述特征作为自变量进行支持向量机SVM(Support Vector Machine)建模,发现多项式SVM模型鉴别诊断效果较好,其性能指标AUC为0.897,准确性、敏感性和特异性均为0.906。研究者通过开发深度学习模型在一定样本量训练下,能准确识别肺内浸润影、磨玻璃密度影及实变,并帮助鉴别病毒性肺炎、社区获得性肺炎及其他病变等。
基于此,本申请提供了肺部医学CT影像分割及分类装置及设备,采用三维(3D)模型进行训练,同时对病灶区域进行裁剪,可以显著提高病灶分割的精确度,同时多任务学习的训练方法可以为目标任务提供更强的归纳偏置,实现隐式数据增强。分割分类同时进行的训练方式能大大提高模型速度,满足实际场景中的高效需求,更有利于推广使用。
具体通过下述实施例进行详细说明。
本申请实施例提供一种可由肺部医学CT影像分割及分类装置实现的肺部医学CT影像分割及分类装置,参见图1,所述肺部医学CT影像分割及分类装置1具体包含有如下内容:
目标肺实质提取模块10,用于基于预设的CT阈值对当前的目标肺部医学CT影像数据进行肺实质区域提取,以得到对应的目标肺实质图像数据。
在本申请的一个或多个实施例中,所述目标肺部医学CT影像数据是指待进行病灶区域分割和病灶分类的3D肺部医学CT影像数据,所述目标肺实质图像数据是指从目标肺部医学CT影像数据中裁剪分割出的肺实质区域图像数据。可以理解的是,所述肺实质是指肺内各级支气管及其终端的肺泡结构,即与肺内空气接触的腔隙和管壁。
根据CT图像的特点,肺部医学CT影像数据是以不同的灰度来表示,反映器官和组织对X线的吸收程度。因此,与X线图像所示的黑白影像一样,黑影表示低吸收区,即低密度区,如肺部;白影表示高吸收区,即高密度区,如骨骼。
可以理解的是,所述CT阈值是指预设的CT值的阈值。具体来说:肺部医学CT影像数据不仅以不同灰度显示其密度的高低,还可用组织对X线的吸收系数说明其密度高低的程度,具有一个量的概念,即前述的CT值,用CT值说明密度。单位为Hu(Hounsfield unit)。水的吸收系数为10,CT值定为0Hu,人体中密度最高的骨皮质吸收系数最高,CT值定为+1000Hu,而空气密度最低,定为-1000Hu。人体中密度不同和各种组织的CT值则居于-1000Hu到+1000Hu的2000个分度之间。
在一种具体应用方式中,由于实际的CT值通常是大于-500,比如-320、-400,因此,所述CT阈值可以定为-1000至-320之间,尤其可以优选为:-500。
在目标肺实质提取模块10中,为了进一步提高肺部医学CT影像分割及分类的有效性及准确性,可以先接收CT采样设备采集的肺部医学CT影像数据,然后对肺部医学CT影像数据进行格式转换,转换为四维的NumPy数组及其对应的pickle文件格式,在此过程中同时完成匿名化操作,以得到对应的目标肺部医学CT影像数据。
多任务分割及分类模块20,用于将所述目标肺实质图像数据分别输入多个肺部医学CT影像分割及分类模型,以使各个所述肺部医学CT影像分割及分类模型分别输出所述目标肺实质图像数据对应的肺部病灶区域分割及病灶分类结果数据,其中,所述肺部医学CT影像分割及分类模型为预先采用不同的各个历史肺实质图像数据对nnUNet优化模型训练后得到的,所述nnUNet优化模型为在nnUNet模型中增加通道注意力模块和深监督模块后生成的。
在所述多任务分割及分类模块20中,肺部医学CT影像分割及分类模型的数量可以为至少2个,在一种举例中,可以优选5个肺部医学CT影像分割及分类模型分别根据所述目标肺实质图像数据对应输出各自预测得到的肺部病灶区域分割及病灶分类结果数据。
在多任务分割及分类模块20中,通道注意力模块可写为SE模块,SE模块通过引入一个压缩(Squeeze)操作和一个激发(Excitation)操作来建模通道之间的关系。在压缩阶段,它通过全局平均池化操作将卷积层的输出特征图(Feature Map)压缩成一个特征向量。然后,在激发阶段,通过使用全连接层和非线性激活函数,学习生成一个通道的权重向量。这个权重向量被应用于目标肺实质图像上的每个通道,以对不同通道的特征进行加权(Scale)。通过这种方式,SE模块能够自适应地学习到每个通道的重要性,并且根据任务的需要加权调整特征图中的通道贡献。这种注意力机制有助于网络更好地关注重要的特征通道,从而提高模型性能。
在上述nnUNet优化模型中,还可以加入了深监督(deep supervision)模块,通过添加额外的辅助分类器,作为网络分支来对主干网络进行监督,从而使浅层能够得到更加充分的训练,防止梯度消失和收敛速度过慢。
分割及分类结果确定模块30,用于根据各个所述肺部病灶区域分割及病灶分类结果数据确定所述目标肺部医学CT影像数据唯一对应的目标肺部病灶区域分割及病灶分类结果数据。
在分割及分类结果确定模块30中,若各个所述肺部病灶区域分割及病灶分类结果数据显示的目标肺部医学CT影像数据对应的病灶区域分割结果和病灶分类结果均相同,则将该相同的肺部病灶区域分割及病灶分类结果数据作为最终可以输出显示的目标肺部病灶区域分割及病灶分类结果数据。若各个所述肺部病灶区域分割及病灶分类结果数据显示的目标肺部医学CT影像数据对应的病灶区域分割结果和病灶分类结果存在不一致的情况,则可以采用投票机制,因为一个病人患一种肺炎,而训练时采用了多种病例同时训练,因此在预测阶段,可能会出现某些病人同时有大于一种病灶的结果,所以通过计算不同类型病灶点像素点数目,取多数病灶作为该病例的最终结果,其余的两类病灶都去掉。
本申请提供的肺部医学CT影像分割及分类装置进行肺部医学CT影像分割及分类的部分可以在服务器中执行,也可以在客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器,用于肺部医学CT影像分割及分类的具体处理。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备端之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
在此基础上,为了进一步提高肺部医学CT影像分割及分类的自动化程度及智能化程度,参见图2,所述肺部医学CT影像分割及分类装置1可以分别与肺部医学CT影像采集设备2和显示装置3(显示器或移动端设备等)之间通信连接,以从肺部医学CT影像采集设备2实时接收肺部医学CT影像数据,并将目标肺部病灶区域分割及病灶分类结果数据发送至所述显示装置3进行输出显示。
从上述描述可知,本申请实施例提供的肺部医学CT影像分割及分类装置,能够实现对肺部医学CT影像的自动化病灶区域分割及病灶分类,并能够在不要求数量来源相同的基础上,有效提高肺部医学CT影像分割及分类结果的可靠性及准确性。
为了进一步提高肺部医学CT影像分割及分类的有效性及准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图3,所述肺部医学CT影像分割及分类装置1还具体包含有如下内容:
与所述多任务分割及分类模块20连接的多任务模型训练模块40;
所述多任务模型训练模块40,用于采用不同的各个设有标签的历史肺实质图像数据各自对应的历史肺实质图像数据分别训练多个nnUNet优化模型,以使得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型;
其中,所述标签包括:肺部病灶区域的位置信息以及分别用于表示无肺炎症状、大叶型肺炎、小叶型肺炎和间质型肺炎的各个标识。例如:0代表正常、无肺炎症状,1代表大叶型肺炎,2代表小叶型肺炎,3代表间质型肺炎。肺炎病灶类型识别结果是指这四种标识各自对应的概率值。
为了进一步提高肺部医学CT影像分割及分类的有效性及准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图3,所述肺部医学CT影像分割及分类装置1具体包含有如下内容:
与所述多任务模型训练模块40连接的历史肺实质提取模块50;
所述历史肺实质提取模块50,用于基于预设的CT阈值,对各个设有标签的历史肺部医学CT影像数据分别进行肺实质区域提取,以得到各个所述历史肺部医学CT影像数据各自对应的历史肺实质图像数据。
为了进一步提高肺部医学CT影像分割及分类的有效性及准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图3,所述肺部医学CT影像分割及分类装置具体包含有如下内容:
与所述历史肺实质提取模块50连接的历史影像预处理模块60;
所述历史影像预处理模块60,用于将获取的用于肺炎病灶历史诊断的各个历史肺部医学CT影像数据进行预处理,以得到对应的各个设有标签的历史肺实质图像数据。
具体来说,可以从公开数据源处收集到多个(如147例)肺炎DICOM序列数据,其中大叶型肺炎48例,小叶型肺炎50例,间质型肺炎49例,按照9:1的比例对三种类型的肺炎DICOM序列数据随机划分训练集和测试集,得到训练集132例,测试集15例。将肺炎DICOM序列数据集转换为NIFTI格式,在此过程中隐去患者姓名年龄等隐私信息,仅保留对模型训练有用的数据。
为了进一步提高nnUNet优化模型的训练可靠性及预测精度,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图3,所述肺部医学CT影像分割及分类装置1还具体包含有如下内容:
分别连接至所述多任务模型训练模块40和所述历史肺实质提取模块50的数据增强模块70;
所述数据增强模块70,用于以预设的数据增强方式对各个所述历史肺实质图像数据进行数据增强处理,并将对应的数据增强结果划分为各个训练集,且每个训练集分别用于存储不同的各个历史肺实质图像数据;
其中,所述数据增强方式包括:随机旋转、随机缩放、随机弹性变换、伽马校正和增加镜像方式中的至少一种。
也就是说,可以采用随机旋转、随机缩放、随机弹性变换、伽马校正、镜像等数据增强的方式来增加训练的数据量,提高模型的泛化能力。
为了进一步提高肺部医学CT影像分割及分类的准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图4,所述肺部医学CT影像分割及分类装置1中的多任务模型训练模块40具体包含有如下内容:
模型训练及交叉验证单元41,用于采用各个所述训练集分别训练多个nnUNet优化模型,并在训练过程中采用五折交叉验证方式对各个所述nnUNet优化模型在每轮迭代得到的模型参数进行交叉验证,并基于对应的交叉验证优化各个所述nnUNet优化模型,直到结束迭代后训练得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型。
具体来说,训练过程中采用五折交叉验证的方式,让训练集中的每一部分数据都参与到训练和验证中,通过交叉验证选出平均误差最小的超参数作为最优的超参数,同时避免由于数据集划分不合理而导致的问题。
训练采用了混合损失函数,由骰子损失(Dice Loss)和焦点损失(Focal Loss)相加得到:
Loss = Dice Loss + Focal Loss
Dice loss的计算公式如下:
其中,与/>分别表示像素i的标签值与预测值,N为像素点总个数,等于单个样本的像素个数乘以批大小(batchsize)。
焦点损失(Focal Loss)的计算公式如下:
其中:
a为类别权重,用来权衡正负样本不均衡问题,λ为常数,一般取值为2,y为标签,p为预测正确的概率,表示计算出的焦点损失;/>表示模型的预测概率。
焦点损失(Focal Loss)通过增加调制因子来降低易分样本的损失贡献,解决难易样本数量不平衡的问题,使模型更加专注于难分的样本。
训练时采用SGD优化器,初始学习率为1e-2,采用Poly学习策略调整学习率,具体公式为:
其中,lr为新的学习率,base_lr为初始学习率,epoch为本次迭代次数,num_epoch为最大迭代次数,power为控制曲线形状的参数,设为0.9。
将五折交叉验证得到的模型分别计算其在验证集上的指标骰子dice得分,将得分最高的模型的参数作为最佳参数。
所有的预测都是基于块(patch)的。3D UNet的块大小最大为128×128×128。
使用滑动窗口方法预测图像,其中窗口大小等于训练期间使用的块大小,步长为窗口大小的一半,所以相邻的两个窗口会有大小为patch/2的重叠。为了抑制拼接伪影并减少靠近边界的位置的影响,应用了高斯重要性权重,从而增加了归一化指数函数softmax聚合中中心体素的权重。
为了进一步提高肺部医学CT影像分割及分类的准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图4,所述肺部医学CT影像分割及分类装置1中的多任务模型训练模块40还具体包含有如下内容:
与所述模型训练及交叉验证单元41连接的模型优选单元42,模型优选单元42用于采用预设的测试肺实质图像数据对各个所述肺部医学CT影像分割及分类模型分别对预设的测试肺实质图像数据分别进行模型测试,并根据对应的测试结果在各个所述肺部医学CT影像分割及分类模型中择一作为肺部医学CT影像分割及分类最优模型。
具体来说,用交叉验证进行模型选择,还可以从多种模型中选择出泛化能力最好的模型,避免发生过拟合。可以使用5个训练好的模型集成进行预测(5个模型是通过5折交叉验证产生的5个模型)。首先通过集成五折交叉验证产生的五个模型对目标CT进行预测,获取五个模型对每个像素点类型的预测概率,然后求五个模型概率的平均值,作为最终预测结果。通过大多数模型的预测结果来消除某些像素点被错误预测的概率,从而提高模型的鲁棒性。
相对应的,所述肺部医学CT影像分割及分类装置1还包括:与所述目标肺实质提取模块20连接的单任务分割及分类模块21;
所述单任务分割及分类模块21,用于将所述目标肺实质图像数据输入所述肺部医学CT影像分割及分类最优模型,以使该肺部医学CT影像分割及分类最优模型输出所述目标肺实质图像数据对应的目标肺部病灶区域分割及病灶分类结果数据。
为了进一步提高肺部医学CT影像分割及分类的有效性及准确性,在本申请实施例提供的一种肺部医学CT影像分割及分类装置中,参见图4,所述肺部医学CT影像分割及分类装置1中的历史肺实质提取模块50具体包含有如下内容:
肺实质提取单元51,用于对各个设有标签的历史肺部医学CT影像数据分别执行预设的肺实质提取步骤,该肺实质提取步骤包括:基于预设的CT阈值在当前的历史肺部医学CT影像数据中获取肺部组织轮廓,对所述肺部组织轮廓进行填充以得到对应的肺部图像掩膜,再将所述肺部图像掩膜和所述肺部组织轮廓进行异或运算以得到对应的肺腔区域图像掩膜,并采用该肺腔区域图像掩膜对应的边界框对当前的历史肺部医学CT影像数据进行裁剪,以得到该历史肺部医学CT影像数据对应的历史肺实质图像数据。
具体来说,通过挑选出肺部CT中HU值大于-500的区域,便可得到肺部组织的轮廓,再使用填充函数对肺部轮廓进行填充,即可得到肺部图像掩膜,此时再用肺部图像掩膜和肺部轮廓进行异或,即可得到一个只有肺腔区域的肺部图像掩膜。获得该肺部图像掩膜在三维坐标系中的X轴、Y轴和Z轴三个方向的边界值,即为肺部区域裁剪的边界框,利用边界框对原图进行裁剪,即可抽取出肺部的像素点。这样得到的就是主要的分割目标——肺实质,是我们最感兴趣的区域,去除了无用信息的干扰,提高模型的准确性。
重采样及标准化单元52,用于对各个所述历史肺实质图像数据进行重采样和标准化处理。
具体来说,重采样目的是解决在一些三维医学图像数据集中,不同的图像中单个体素voxel所代表的实际空间大小(spacing)不一致的问题。
CT图像是由一定数目由黑到白不同灰度的象素按矩阵排列所构成。这些象素反映的是相应体素的X线吸收系数。不同CT装置所得图像的象素大小及数目不同。大小可以是1.0×1.0mm,0.5×0.5mm不等;数目可以是256×256,即65536个,或512×512,即262144个不等。显然,象素越小,数目越多,构成图像越细致,即空间分辨力(spatial resolution)高。由于CT图像的特性,Z轴的空间大小一般较其他两个轴大,即存在各向异性。
首先统计每个样本的空间大小,根据空间大小中值判断数据集是否存在各向异性,确定重采样的目标空间大小,如果存在各向异性,对空间大小特别大的维度,取数据集中该维度空间大小值的10%分位点作为该维度的目标空间大小。本实例中重采样目标空间的spacing为(1.71,1.72,1.72),即每个体素所代表的空间大小,单位是毫米(mm)。
然后利用插值和调整大小(resize)的方式进行重采样,空间大的轴采用最近邻插值,其他轴采用三次样条(cubic spline)插值,保证不同图像数据中,每个体素所代表的实际物理空间一致。对标签图像,采用最近邻插值的方法。
另外,标准化的目的是让训练集中每张图像的灰度值都能具有相同的分布。本实例采用Z评分(Z-Scoring)标准化的方法,即减去均值除以标准差,经过处理的数据符合标准正态分布,即均值为0,标准差为1。均值和标准差使用整个训练集前景的均值和标准差。因为CT图像中,强度信息HU值能反映不同组织的物理性质,用整个训练集前景的统计信息,可以有效的利用HU值的额外信息。
首先收集整个CT影像训练集前景的统计信息,然后对每张图像采样十分之一的前景体素用于统计。然后调用Python的科学计算库NumPy中的函数统计整个训练集前景的均值,标准差,0.5%分位HU值,99.5%分位HU值,并利用这些统计信息对每张图像进行修剪clip以及z-scoring。因为CT图像中经常会有异常大的孤立值和异常小的孤立值,所以需要先将图像HU值clip到前景HU值[0.5, 99.5]百分比范围之间。
在此基础上,为了进一步提高肺部医学CT影像分割及分类的自动化程度及智能化程度,参见图5,所述肺部医学CT影像分割及分类装置1还可以与一肺部医学 CT影像数据库4之间通信连接,以自该肺部医学 CT影像数据库4收集到已公开的DICOM序列数据。
为了进一步提高肺炎CT影像分类过程的可靠性及准确性,参见图6,所述肺部医学CT影像分割及分类装置中的肺部医学CT影像分割及分类模型具体包含有如下内容:
依次连接的编码器、连接模块和解码器,还包括:连接在所述编码器和解码器之间的各个跳跃连接模块,以及,设置在所述解码器中的深监督模块;
所述编码器包括依次连接的多个下采样模块,且每个所述下采样模块均包括:依次连接的两个下采样单元、通道注意力模块和最大池化层;
所述解码器包括依次连接的多个上采样模块,且每个所述上采样模块均包括:依次连接的两个上采样单元、通道注意力模块和转置卷积层;所述连接模块包括:依次连接的两个连接单元和一通道注意力模块;
各个所述跳跃连接模块分别连接一一对应的所述下采样模块和所述上采样模块;
所述深监督模块包括:多个辅助分类器;且所述解码器中的非首个且非末尾的上采样模块上分别设有所述辅助分类器;
所述下采样单元、所述上采样单元和所述连接单元均包括:依次连接的卷积层、实例归一化层和带泄露修正线性单元。
具体来说, 肺部医学CT影像分割及分类模型的网络结构由编码器、解码器和跳跃连接三部分组成。编码器包括四个下采样模块,每个下采样模块包含两个3×3×3卷积层(Conv3D+IN+Leaky Relu),每个卷积层紧跟着一个实例归一化层(InstanceNormalization,IN)、一个带泄露修正线性单元(Leaky Rectified Linear Unit,LeakyReLU )和一个SE(Squeeze andExcitation)模块,在下采样模块末尾为步长为2的2×2×2最大池化层。解码器结构与编码器类似,只是最大池化层替换成了2×2×2的转置卷积层(transposed convolution)。
编码器和解码器之间采用两个3×3×3卷积层(Conv3D+IN+Leaky Relu)和一个SE模块连接。跳跃连接将同一深度的最大池化层之前的特征图和上采样模块中转置卷积层输出的特征图连接起来。由于特定深度的上采样模块利用了下采样模块在相应深度生成的特征图,所以编码器浅层冻结方法也可以保护相关解码器层的正激活。
SE模块能够自适应地学习到每个通道的重要性,并且根据任务的需要加权调整特征图中的通道贡献。这种注意力机制有助于网络更好地关注重要的特征通道,从而提高模型性能。参见图7,SE模块的结构具体为:依次连接的,其中,X代表中间输入特征图、代表中间输出特征图、H代表特征图高度、W代表特征图宽度、L代表特征图深度和C代表特征图通道数,乘号代表对应通道权重相乘,即将SE模块计算出来的各通道权重值分别和原特征图对应通道的矩阵相乘。
在上述UNet模型的上采样中,除了最底下的两层外,都加入了深监督(deepsupervision),通过添加两个额外的辅助分类器,作为网络分支来对主干网络进行监督,从而使浅层能够得到更加充分的训练,防止梯度消失和收敛速度过慢。
医学影像领域最常使用的后处理办法是连通分支算法,通过只保留最大连通域的方法来消除假阳性。但是在肺炎病灶分割中,不同类型的肺炎病灶CT表现并不相同,大叶性肺炎的病灶虽然通常是一整块,但是有可能双肺都有肺炎,不能只保留最大连通域,而小叶性和间质性肺炎的病灶更是由很多散落的点状片状病灶组成,所以不能只保留最大连通域。
我们采取基于投票和裁剪的后处理办法。首先是分割,进行预测前,对测试集数据进行与训练集相同的裁剪,提取出肺实质区域,裁去无用的干扰区域,提高分割结果的准确率。若各个所述肺部病灶区域分割及病灶分类结果数据显示的目标肺部医学CT影像数据对应的病灶区域分割结果和病灶分类结果存在不一致的情况,则可以采用投票机制,因为一个病人患一种肺炎,而训练时采用了多种病例同时训练,因此在预测阶段,可能会出现某些病人同时有大于一种病灶的结果,所以通过计算不同类型病灶点像素点数目,取多数病灶作为该病例的最终结果,其余的两类病灶都去掉。
其中,图9(a)为原始CT图像,图9(b)为采用本申请提供的肺实质提取单元自图9(a)展示的原始CT图像提取出的肺实质掩码图,比较结果可以得出肺实质提取效果很好。
另外,图10(a)为原始切片,图10(b)为医生对图10(a)展示的原始切片的注标签三维重建结果,图10(c)采用本申请提供的装置预测得到的图10(a)展示的原始切片所对应的模型预测三维重建结果,比较医生标注的标签三维重建的结果和模型预测的结果可以得出模型预测效果很好。
为了进一步说明上述实施例中的肺部医学CT影像分割及分类装置,本申请还提供一种采用肺部医学CT影像分割及分类装置实现的肺部医学CT影像分割及分类模型的训练方法的具体应用实例,在获取到所需的CT影像后,首先对数据集进行重采样。由于不同医院使用的设备不同,生产厂家不同,获取到的不同CT影像中单个体素所代表的实际空间大小也会有所差异。因为卷积神经网络只在体素空间提取信息,会忽略掉实际物理空间中的大小信息,通过重采样使不同数据的体素空间一致,可以避免上述差异性造成的问题。参见图8,所述肺部医学CT影像分割及分类模型的训练方法具体包含有如下内容:
S1:获取目标医学影像原始DICOM序列数据,对该数据做预处理,并将数据划分为训练集和测试集;
S2:基于阈值的感兴趣区域(ROI)提取。利用CT值包含的不同组织的强度信息,设定阈值获得目标组织的三维mask,根据mask的边界进行裁剪得到ROI;
在所述步骤S1和S2中,对获取的DICOM序列数据预处理包括以下几个步骤:
(1)对DICOM序列数据进行格式转换,转换为四维的NumPy数组及其对应的pickle文件格式,在此过程中同时完成匿名化操作,去除网络训练不需要的信息,如检查时间、患者年龄等;
(2)基于关注组织的HU值,对CT图像进行裁剪,获得感兴趣的组织区域,再通过填充和异或的方式,进一步获得组织内的像素点,缩小分割范围,去除无用信息,得到最终的待分割区域。
(3)统计每个样本的空间大小,根据空间大小中值判断数据集是否存在各向异性,确定重采样的目标空间大小,然后利用插值和resize的方式进行重采样,保证不同图像数据中,每个体素所代表的实际物理空间一致;
(4)统计整个训练集前景的均值、标准差、0.5%分为HU值、99.5%分为HU值,并利用这些统计信息对每张图像进行clip和z-scoring标准化,使经过处理的数据符合标准正态分布;
通过对数据类型的转换、裁剪、重采样和标准化等操作,重新生成了具有相同空间分布的数据集,并且对待分割的组织区域进行了增强,使待分割区域成为主体。
S3:基于nnUNet优化模型的病灶分割。获取预设神经网络模型,采用训练样本集对3D的预设神经网络模型进行训练,训练时进行数据增强,使用三种相似的数据同时进行训练,并采用五折交叉验证的方式对模型进行评估,结合Dice损失和Focal损失对预设神经网络模型进行迭代更新,得到目标分割模型;
S4:基于多模型输出的集成预测。分别在五折交叉验证的3D模型上进行预测,确定最佳的预测设置,然后集成五个模型的预测结果获得最终预测结果;
在所述步骤S4中,将五折交叉验证得到的模型分别计算其在验证集上的dice得分,将得分最高的模型的参数作为最佳参数。分别得到2D和3D模型的最佳模型参数。
使用滑动窗口方法预测图像。为了抑制拼接伪影并减少靠近边界的位置的影响,应用了高斯重要性权重,从而增加了softmax聚合中中心体素的权重。
使用了5个训练好的模型集成进行预测(5个模型是通过5折交叉验证产生的5个模型)来提高模型的鲁棒性。
S5:基于投票和裁剪的后处理。对分割结果进行后处理,进一步提高分割分类结果的准确性。
在所述步骤S5中,医学影像领域最常使用的后处理办法是连通分支算法,尤其是在器官分割中,通常需要分割的器官只有一个,所以通过只保留最大连通域的方法来消除假阳性。
首先所有的前景会被当作一个组件(多类别的1、2、3都被当作1),如果对除最大区域以外的所有分支的抑制提高了前景的平均dice而没有减小任何类别的dice,这一步将会被选择作为第一步的后处理步骤。
如果分割目标不止一个,需要更改后处理策略,通过去除体素或面积小于某阈值的连通分支的方法,来去除噪声的影响,提高分割准确率。
综上所述,本申请提供的应用实例能够实现对大叶型肺炎、小叶型肺炎和间质型肺炎的肺炎病灶分割、分类和量化评估,为基于肺部CT形态学影像实现肺炎的只能筛查与诊断,提供定量化指标,为临床医师的治疗决策提供了辅助。
与现有技术相比,本申请应用实例具有以下有益效果:
(1)本申请应用实例对获取的数据进行重采样和归一化,统一数据标准,避免数据来源不一致对模型的影响;
(2)本申请应用实例在3D空间采用阈值法分割肺实质,然后对输入数据进行裁剪,聚焦在肺部区域,剔除无用信息,只保留医生感兴趣的区域;
(3)通过基于深度学习的病灶分割分类方法,可是实现对多种肺炎的分割和分类,充分利用了CT序列影像的三维信息,标识出肺炎病灶的同时识别肺炎类型,可以更直观的辅助医生诊断;
(4)本申请应用实例提供了一种端到端的全自动肺炎检测方案,还能够以图像和报告形式提供肺炎病变的定量、定位、定性诊断结果,具有广泛的市场应用前景。
从临床的角度看,现有模型对肺炎进行分割的准确率较低,落地的使用价值不大,为了突破这一瓶颈,本申请应用实例提出了基于nnUNet优化模型的分割分类方法,通过对数据的裁剪和高效预处理,减少无用信息输入,同时采用3D模型,充分利用CT的空间信息,来实现高效准确的病灶分割分类。
本申请实施例还提供了一种电子设备,该电子设备可以包括处理器、存储器、接收器及发送器,处理器用于执行上述实施例提及的肺部医学CT影像分割及分类装置的功能,其中处理器和存储器可以通过总线或者其他方式连接,以通过总线连接为例。该接收器可通过有线或无线方式与处理器、存储器连接。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的肺部医学CT影像分割及分类装置对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的肺部医学CT影像分割及分类装置的功能。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述处理器执行时,执行实施例中的肺部医学CT影像分割及分类装置的功能。
在本申请的一些实施例中,用户设备可以包括处理器、存储器和收发单元,该收发单元可包括接收器和发送器,处理器、存储器、接收器和发送器可通过总线系统连接,存储器用于存储计算机指令,处理器用于执行存储器中存储的计算机指令,以控制收发单元收发信号。
作为一种实现方式,本申请中接收器和发送器的功能可以考虑通过收发电路或者收发的专用芯片来实现,处理器可以考虑通过专用处理芯片、处理电路或通用芯片实现。
作为另一种实现方式,可以考虑使用通用计算机的方式来实现本申请实施例提供的服务器。即将实现处理器,接收器和发送器功能的程序代码存储在存储器中,通用处理器通过执行存储器中的代码来实现处理器,接收器和发送器的功能。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现前述肺部医学CT影像分割及分类装置的功能。该计算机可读存储介质可以是有形存储介质,诸如随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、软盘、硬盘、可移动存储盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
本领域普通技术人员应该可以明白,结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法,能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
本申请中,针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (2)

1.一种肺部医学CT影像分割及分类装置,其特征在于,包括:
目标肺实质提取模块,用于基于预设的CT阈值对当前的目标肺部医学CT影像数据进行肺实质区域提取,以得到对应的目标肺实质图像数据;
多任务分割及分类模块,用于将所述目标肺实质图像数据分别输入多个肺部医学CT影像分割及分类模型,以使各个所述肺部医学CT影像分割及分类模型分别输出所述目标肺实质图像数据对应的肺部病灶区域分割及病灶分类结果数据,其中,所述肺部医学CT影像分割及分类模型为预先采用不同的各个历史肺实质图像数据对nnUNet优化模型训练后得到的,所述nnUNet优化模型为在nnUNet模型中增加通道注意力模块和深监督模块后生成的;
分割及分类结果确定模块,用于根据各个所述肺部病灶区域分割及病灶分类结果数据确定所述目标肺部医学CT影像数据唯一对应的目标肺部病灶区域分割及病灶分类结果数据;
所述肺部医学CT影像分割及分类装置还用于将所述目标肺实质图像数据输入一肺部医学CT影像分割及分类最优模型,以使该肺部医学CT影像分割及分类最优模型输出所述目标肺实质图像数据对应的目标肺部病灶区域分割及病灶分类结果数据,其中,所述肺部医学CT影像分割及分类最优模型为预先对各个所述肺部医学CT影像分割及分类模型分别对预设的测试肺实质图像数据分别进行模型测试,并根据对应的测试结果在各个所述肺部医学CT影像分割及分类模型中择一而得的;
其中,所述肺部医学CT影像分割及分类模型包括:依次连接的编码器、连接模块和解码器,还包括:连接在所述编码器和解码器之间的各个跳跃连接模块,以及,设置在所述解码器中的深监督模块;
所述编码器包括依次连接的多个下采样模块,且每个所述下采样模块均包括:依次连接的两个下采样单元、通道注意力模块和最大池化层;
所述解码器包括依次连接的多个上采样模块,且每个所述上采样模块均包括:依次连接的两个上采样单元、通道注意力模块和转置卷积层;所述连接模块包括:依次连接的两个连接单元和一通道注意力模块;
各个所述跳跃连接模块分别连接一一对应的所述下采样模块和所述上采样模块;
所述深监督模块包括:多个辅助分类器;且所述解码器中的非首个且非末尾的上采样模块上分别设有所述辅助分类器;
所述下采样单元、所述上采样单元和所述连接单元均包括:依次连接的卷积层、实例归一化层和带泄露修正线性单元;
所述的肺部医学CT影像分割及分类装置还包括:与所述多任务分割及分类模块连接的多任务模型训练模块;
所述多任务模型训练模块,用于采用不同的各个设有标签的历史肺实质图像数据各自对应的历史肺实质图像数据分别训练多个nnUNet优化模型,以使得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型;
其中,所述标签包括:肺部病灶区域的位置信息以及分别用于表示无肺炎症状、大叶型肺炎、小叶型肺炎和间质型肺炎的各个标识;
所述多任务模型训练模块包括:
模型训练及交叉验证单元,用于采用各个训练集分别训练多个nnUNet优化模型,并在训练过程中采用五折交叉验证方式对各个所述nnUNet优化模型在每轮迭代得到的模型参数进行交叉验证,并基于对应的交叉验证优化各个所述nnUNet优化模型,直到结束迭代后训练得到各个所述nnUNet优化模型分别对应的用于根据输入的肺实质图像数据对应输出肺部病灶区域分割及病灶分类结果数据的肺部医学CT影像分割及分类模型;
其中,所述在训练过程中采用五折交叉验证方式对各个所述nnUNet优化模型在每轮迭代得到的模型参数进行交叉验证,并基于对应的交叉验证优化各个所述nnUNet优化模型,包括:
训练采用混合损失函数Loss,由骰子损失Dice Loss和焦点损失Focal Loss相加得到;其中,骰子损失Dice Loss的计算公式如下:
其中,与/>分别表示第i个像素的标签值与预测值,N为像素点总个数,等于单个样本的像素个数乘以批大小;
焦点损失Focal Loss的计算公式如下:
其中:
a为类别权重,用来权衡正负样本不均衡问题;λ为常数,取值为2;y为标签;p为预测正确的概率;表示计算出的焦点损失;/>表示模型的预测概率;
训练时采用SGD优化器,初始学习率为1e-2,采用Poly学习策略调整学习率,具体公式为:
其中,lr为新的学习率,base_lr为初始学习率,epoch为本次迭代次数,num_epoch为最大迭代次数,power为控制曲线形状的参数,设为0.9;
针对五折交叉验证得到的模型参数,分别计算其在验证集上的指标骰子得分,将得分最高的模型参数作为当前最佳的模型参数;
所述肺部医学CT影像分割及分类装置还包括:与所述多任务模型训练模块连接的历史肺实质提取模块;
所述历史肺实质提取模块,用于基于预设的CT阈值,对各个设有标签的历史肺部医学CT影像数据分别进行肺实质区域提取,以得到各个所述历史肺部医学CT影像数据各自对应的历史肺实质图像数据;
所述的肺部医学CT影像分割及分类装置还包括:与所述历史肺实质提取模块连接的历史影像预处理模块;
所述历史影像预处理模块,用于将获取的用于肺炎病灶历史诊断的各个历史肺部医学CT影像数据进行预处理,以得到对应的各个设有标签的历史肺实质图像数据;
其中,所述将获取的用于肺炎病灶历史诊断的各个历史肺部医学CT影像数据进行预处理包括:对历史肺部医学CT影像数据进行格式转换,以转换为四维的NumPy数组及其对应的pickle文件格式,在此过程中同时完成匿名化操作,去除网络训练不需要的信息,其中,所述网络训练不需要的信息包括:检查时间和患者年龄;
所述历史肺实质提取模块包括:
肺实质提取单元,用于对各个设有标签的历史肺部医学CT影像数据分别执行预设的肺实质提取步骤,该肺实质提取步骤包括:基于预设的CT阈值在当前的历史肺部医学CT影像数据中获取肺部组织轮廓,对所述肺部组织轮廓进行填充以得到对应的肺部图像掩膜,再将所述肺部图像掩膜和所述肺部组织轮廓进行异或运算以得到对应的肺腔区域图像掩膜,并采用该肺腔区域图像掩膜对应的边界框对当前的历史肺部医学CT影像数据进行裁剪,以得到该历史肺部医学CT影像数据对应的历史肺实质图像数据;
重采样及标准化单元,用于对各个所述历史肺实质图像数据进行重采样和标准化处理;
其中,所述对各个所述历史肺实质图像数据进行重采样和标准化处理,包括:
统计每个样本的空间大小,根据空间大小中值判断各个样本是否存在各向异性,并确定重采样的目标空间大小,然后进行重采样,保证不同样本中,每个体素所代表的实际物理空间一致;
统计所有样本的前景的均值、标准差、0.5%分位HU值以及99.5%分位HU值,并利用这些统计信息对每个样本进行标准化处理,使经过处理的样本符合标准正态分布;
所述的肺部医学CT影像分割及分类装置还包括:分别连接至所述多任务模型训练模块和所述历史肺实质提取模块的数据增强模块;
所述数据增强模块,用于以预设的数据增强方式对各个所述历史肺实质图像数据进行数据增强处理,并将对应的数据增强结果划分为各个训练集,且每个训练集分别用于存储不同的各个历史肺实质图像数据;
其中,所述数据增强方式包括:随机旋转、随机缩放、随机弹性变换、伽马校正和增加镜像。
2.一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1所述的肺部医学CT影像分割及分类装置的功能。
CN202310970353.3A 2023-08-03 2023-08-03 肺部医学ct影像分割及分类装置及设备 Active CN116703901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310970353.3A CN116703901B (zh) 2023-08-03 2023-08-03 肺部医学ct影像分割及分类装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310970353.3A CN116703901B (zh) 2023-08-03 2023-08-03 肺部医学ct影像分割及分类装置及设备

Publications (2)

Publication Number Publication Date
CN116703901A CN116703901A (zh) 2023-09-05
CN116703901B true CN116703901B (zh) 2023-10-31

Family

ID=87839598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310970353.3A Active CN116703901B (zh) 2023-08-03 2023-08-03 肺部医学ct影像分割及分类装置及设备

Country Status (1)

Country Link
CN (1) CN116703901B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117456289B (zh) * 2023-12-25 2024-03-08 四川大学 一种基于深度学习的颌骨病变分割分类系统
CN117672470B (zh) * 2024-01-29 2024-06-18 北京大学 一种基于Web浏览器的医学影像辅助诊断装置
CN117934855B (zh) * 2024-03-22 2024-07-30 北京壹点灵动科技有限公司 医学图像分割方法和装置、存储介质及电子设备
CN118135340B (zh) * 2024-05-06 2024-07-23 天津市肿瘤医院(天津医科大学肿瘤医院) 基于肺区域分割的肺影像病灶预标记方法、系统及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136828A (zh) * 2019-05-16 2019-08-16 杭州健培科技有限公司 一种基于深度学习实现医学影像多任务辅助诊断的方法
CN111723817A (zh) * 2020-06-30 2020-09-29 重庆大学 一种肺结节辅助检测方法
CN111932559A (zh) * 2020-08-26 2020-11-13 上海市公共卫生临床中心 基于深度学习的新冠肺炎肺部病灶区域分割系统
WO2022225794A1 (en) * 2021-04-23 2022-10-27 The Johns Hopkins University Systems and methods for detecting and characterizing covid-19
CN115908438A (zh) * 2022-11-30 2023-04-04 华东交通大学 基于深度监督集成学习的ct影像病灶分割方法、系统和设备
CN116433660A (zh) * 2023-06-12 2023-07-14 吉林禾熙科技开发有限公司 医疗图像数据处理装置、电子设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136828A (zh) * 2019-05-16 2019-08-16 杭州健培科技有限公司 一种基于深度学习实现医学影像多任务辅助诊断的方法
CN111723817A (zh) * 2020-06-30 2020-09-29 重庆大学 一种肺结节辅助检测方法
CN111932559A (zh) * 2020-08-26 2020-11-13 上海市公共卫生临床中心 基于深度学习的新冠肺炎肺部病灶区域分割系统
WO2022225794A1 (en) * 2021-04-23 2022-10-27 The Johns Hopkins University Systems and methods for detecting and characterizing covid-19
CN115908438A (zh) * 2022-11-30 2023-04-04 华东交通大学 基于深度监督集成学习的ct影像病灶分割方法、系统和设备
CN116433660A (zh) * 2023-06-12 2023-07-14 吉林禾熙科技开发有限公司 医疗图像数据处理装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN116703901A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN116703901B (zh) 肺部医学ct影像分割及分类装置及设备
CN108389201B (zh) 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法
CN112292691B (zh) 用于使用深度学习提高癌症检测的方法与系统
CN108464840B (zh) 一种乳腺肿块自动检测方法及系统
CN111417980B (zh) 用于椎骨骨折的识别的三维医学图像分析方法和系统
CN112529894B (zh) 一种基于深度学习网络的甲状腺结节的诊断方法
Sogancioglu et al. Cardiomegaly detection on chest radiographs: Segmentation versus classification
CN111127466A (zh) 医学图像检测方法、装置、设备及存储介质
WO2021186592A1 (ja) 診断支援装置及びモデル生成装置
CN111553892B (zh) 基于深度学习的肺结节分割计算方法、装置及系统
CN113223005B (zh) 一种甲状腺结节自动分割及分级的智能系统
CN112508884B (zh) 一种癌变区域综合检测装置及方法
CN112365973B (zh) 基于对抗网络和Faster R-CNN的肺结节辅助诊断系统
CN112329871B (zh) 一种基于自校正卷积与通道注意力机制的肺结节检测方法
CN114998265A (zh) 一种基于改进U-Net的肝脏肿瘤分割方法
R-Prabha et al. Design of hybrid deep learning approach for covid-19 infected lung image segmentation
WO2021209887A1 (en) Rapid, accurate and machine-agnostic segmentation and quantification method and device for coronavirus ct-based diagnosis
CN116630680B (zh) 一种x线摄影联合超声的双模态影像分类方法及系统
CN111784652B (zh) 基于强化学习多尺度神经网络的mri分割方法
CN111028940B (zh) 肺结节多尺度检测方法、装置、设备及介质
CN115471512A (zh) 一种基于自监督对比学习的医学影像分割方法
CN117727441A (zh) 基于临床-融合影像计算机模型预测肺癌免疫疗效方法
CN112967254A (zh) 基于胸部ct影像肺部疾病识别和检测方法
US20230115927A1 (en) Systems and methods for plaque identification, plaque composition analysis, and plaque stability detection
CN112766333B (zh) 医学影像处理模型训练方法、医学影像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant