CN114974575A - 基于多特征融合的乳腺癌新辅助化疗疗效预测装置 - Google Patents

基于多特征融合的乳腺癌新辅助化疗疗效预测装置 Download PDF

Info

Publication number
CN114974575A
CN114974575A CN202210811491.2A CN202210811491A CN114974575A CN 114974575 A CN114974575 A CN 114974575A CN 202210811491 A CN202210811491 A CN 202210811491A CN 114974575 A CN114974575 A CN 114974575A
Authority
CN
China
Prior art keywords
image
modal
unit
mammary gland
curative effect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210811491.2A
Other languages
English (en)
Inventor
关贝
赵亚晨
王永吉
石清磊
曹崑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Software of CAS
Original Assignee
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Software of CAS filed Critical Institute of Software of CAS
Priority to CN202210811491.2A priority Critical patent/CN114974575A/zh
Publication of CN114974575A publication Critical patent/CN114974575A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Radiology & Medical Imaging (AREA)
  • Biomedical Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置,包括:图像获取模块,用于获取患者病灶区域的多模态乳腺影像;图像预处理模块,用于对每一模态乳腺影像进行图像剪裁,得到该模态乳腺影像的3D感兴趣区;病灶区域分割模块,用于根据各模态乳腺影像的3D感兴趣区,得到病灶区域;疗效诊断模块,用于计算并拼接所述病灶区域的放射特征向量与各3D感兴趣区的深度高级特征,并基于各模态乳腺影像的拼接向量,预测乳腺癌新辅助化疗的疗效。本发明能够高效无创地精准预测NAC疗效,为患者制定个性化的精准治疗方案。

Description

基于多特征融合的乳腺癌新辅助化疗疗效预测装置
技术领域
本发明涉及医学图像处理领域及深度学习领域,具体涉及一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置。
背景技术
乳腺癌是女性最常见的恶性肿瘤之一,每年确诊病例超过200万例,是女性癌症相关死亡的主要原因,严重危害女性的健康。对于局部晚期乳腺癌患者,通常采用肿块切除术或乳房切除术作为标准治疗方法,能够有效降低局部复发率。然而根治性手术可能会带来诸多后遗症及永久性造口,严重时会加速患者死亡,甚至有些具有严重症状表现的恶性肿瘤无法直接通过手术根治或不满足手术条件。研究表明,通过新辅助化疗(NeoadjuvantChemotherapy,NAC)能够缩小原发肿瘤体积、降低肿瘤分期及提高采用保乳术的治疗策略来替代乳房全切除术的可能性,是目前乳腺癌综合治疗中非常重要的手段。
但乳腺癌是一种高度异质性疾病,病人的治疗效果会受到肿瘤分子亚型、治疗方案等多种因素的影响,临床实验发现存在部分患者对NAC不敏感,且疗效个体差异大。精准预测NAC疗效有助于选择可能从NAC中获益的患者,并避免对化疗无效的患者进行过度术前化疗而错失手术时机,另一个优点是可以观察治疗的早期反应,从而在反应差的情况下快速修改治疗方案。因此,及时精准预测NAC疗效、调整治疗方案是临床工作的关键环节。
现阶段对NAC疗效评估的金标准是基于组织病理结果,但病理评估无法在治疗过程中实时监测肿瘤对化疗药物的反应,更不能早期预测肿瘤对NAC的应答情况,且这种有创的组织学活检存在时效性差、继发感染、难以重复检测、对病理科要求高等局限性。因此寻求能有效疗效预测的无创性手段是NAC中亟待解决的问题。无创的影像学检查可在治疗过程中多次进行,磁共振成像(Magnetic Resonance Imaging,MRI)是检测乳腺癌最敏感的影像学方法之一,且具有多种成像方式能从多方面提供有意义的信息。
目前,大部分使用MRI影像对乳腺NAC疗效的研究方法都是利用NAC前后的对比数据进行疗效评估,并不能解决疗效预测问题。绝大多数的疗效评估方法仅仅使用MRI成像方式中的一种成像序列,没有用到MRI多参数序列的优点,同时在特征提取阶段仅利用影像组学方法或者仅使用卷积神经网络方法,准确度有待提高且没有挖掘深层特征并高度融合数据特征。针对以上问题,因此需要提出一种面向多参数乳腺MRI医学影像序列的基于多特征融合的乳腺癌NAC预测病理完全反应方法及系统,为患者制定个性化的精准治疗方案。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置,能够高效无创地精准预测NAC疗效,为患者制定个性化的精准治疗方案。
本发明的技术内容包括:
一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置,包括:
图像获取模块,用于获取患者病灶区域的多模态乳腺影像,其中,所述多模态乳腺影像的模态包括:T2W1模态、DCE-MRI模态和DWI模态;
图像预处理模块,用于对每一模态乳腺影像进行图像剪裁,得到该模态乳腺影像的3D感兴趣区;
病灶区域分割模块,用于根据各模态乳腺影像的3D感兴趣区,得到病灶区域;
疗效诊断模块,用于计算并拼接所述病灶区域的放射特征向量与各3D感兴趣区的深度高级特征,并基于各模态乳腺影像的拼接向量,预测乳腺癌新辅助化疗的疗效。
可选地,所述图像预处理模块,还用于:
基于异源图像配准单元,对所述多模态乳腺影像进行异源图像配准;
基于图像去噪单元,对所述多模态乳腺影像进行图像去噪;
基于图像标准化单元,对所述多模态乳腺影像进行图像标准化;
基于图像增强单元,对所述多模态乳腺影像进行图像增强。
可选地,所述异源图像配准单元,用于:
使用基于标准互信息的刚体配准算法,以所述DCE-MRI模态的图像为固定图像,所述T2W1模态和所述DWI模态的图像分别作为浮动图像进行刚体变换,使得图中对应于空间同一位置的点一一对应。
可选地,所述图像去噪单元,用于:
使用的是Python工具包SimpleITK中的N4偏置场校正工具,去除所述乳腺影像中存在的低频强度不均匀的信号。
可选地,所述图像标准化单元,用于:
对所述T2W1模态、所述DCE-MRI模态和所述DWI模态的图像,分别采用Z-score方式进行规范化。
将规范化后的图像中各像素点的灰度值范围归一化。
可选地,所述病灶区域分割模块,用于:
构建基于3D-UNet的语义分割网络,其中,所述语义分割网络的结构为下采样路径的P层三维卷积层与P′次池化层、上采样路径的Q层三维卷积层与Q′次池化层,并将所述下采样路径中的子模块更换为带残差连接的子模块结构;
获取多模态样本乳腺影像,将T2W1模态、DCE-MRI模态和DWI模态的样本乳腺影像分别作为所述语义分割网络的输入图像,并以标记好的掩膜分割图像为训练目标训练所述语义分割网络,得到语义分割模型,其中,训练过程的损失函数Dice Loss=1-Dice,
Figure BDA0003739397110000031
Figure BDA0003739397110000032
ytrue表示实际分割标签,ypred表示预测输出图,smooth表示平滑项;
将T2W1模态、DCE-MRI模态和DWI模态的乳腺影像分别作为所述语义分割模型的输入图像,以得到所述病灶区域。
可选地,所述获取多模态样本乳腺影像,包括:
数据采集单元,用于按照患者为单位从数据库获取原始影像数据和对应的新辅助化疗疗效类别标签,所述新辅助化疗疗效类别标签包括:病理完全缓解和病理未完全缓解;
数据选择单元,用于根据疗效预测问题设定排除标准,以选择数据,其中,所述排除标准包括:治疗前未实行双侧乳腺磁共振成像检查的患者、未完成全周期新辅助化疗或因故中止治疗的患者、新辅助化疗后未进行手术者、术后病理评价不完善和远处转移患者;
数据标注单元,用于经由专业医师在医学标注软件ITK-SNAP上的标注结果综合得到病灶区域像素级标注;
数据整理单元,用于以患者为单位进行数据整合,将原始数据的DICOM文件格式转换为NIfTI文件。
可选地,所述疗效诊断模块,用于:
初始放射特征提取单元,用于选定需提取的放射特征,并使用开源影像组学分析软件对所述病灶区域进行放射特征提取,以得到初始放射特征;
放射特征计算单元,用于将所述初始放射特征的自编码器网络编码结果,输入若干个全连接层,得到所述病灶区域内的放射特征;
深度高级特征提取单元,用于将每一模态乳腺影像的3D感兴趣区输入基于ResNet50的卷积神经网络,得到该模态的深度高级特征;
向量拼接单元,用于拼接所述放射特征与每一模态的深度高级特征,得到相应模态乳腺影像的拼接向量;
预测单元,用于将各模态乳腺影像的拼接向量输入多实例学习网络,以使所述多实例学习网络中的注意层为每一模态乳腺影像的拼接向量赋予权重,所述多实例学习网络中的分类器基于各模态乳腺影像的拼接向量的加权求和结果,得到乳腺癌新辅助化疗的预测疗效。
可选地,初始放射特征提取单元,用于:
针对样本病灶区域,使用开源影像组学分析软件获取全部放射特征,所述全部放射特征包括:形态学特征、一阶灰度直方图特征、二阶与高阶纹理特征和基于滤波的特征;
使用随机森林算法对各放射特征进行重要性评分,以确定需提取的放射特征;
选定需提取的放射特征。
可选地,所述深度高级特征提取单元,用于:
针对DCE-MRI模态的乳腺影像,取阶段一、阶段三、阶段五的图像分别作为卷积神经网络的输入图像,以得到DCE-MRI模态的深度高级特征;
和,
针对T2W1模态的乳腺影像,将单通道的图像复制3份后,分别作为卷积神经网络的输入图像,以得到T2W1模态的深度高级特征;
和,
针对DWI模态的乳腺影像,将单通道的图像复制3份后,分别作为卷积神经网络的输入图像,以得到DWI模态的深度高级特征。
可选地,训练所述疗效预测模块的损失Loss=LMSE+αLCE,其中,LMSE表示训练所述自编码器网络的重建损失,LCE表述训练所述多实例学习网络的预测损失,α表示重建损失LMSE和预测损失LCE之间权衡的超参数。
本发明与现有技术相比的优点在于:
(1)本发明基于乳腺MRI进行NAC疗效预测,相比于病理检查具有无创性、时效性高的优点;相比于其他无创性影像学检查如CT、超声等,本发明使用的MRI由于具有良好的组织分辨率和多种成像模式使得在乳腺病灶检测方面具有独特优势;相比于其他利用MRI进行疗效预测的研究方法,本发明只使用NAC前的数据就能完成精准NAC疗效预测,应用前景更广。
(2)本发明提出了一种将传统放射特征和使用卷积神经网络提取的深度特征的多特征融合网络。而且相比于很多现有技术使用的2D医学图像,本发明面向3D医学影像数据,全面地考虑到病灶区域的三维结构性质,更加符合医生阅片思维。
(3)本发明提出了一种基于多实例学习的疗效预测模型解决多参数MRI序列中多模态问题,巧妙地将机器学习领域中的多实例学习思想应用到医学多模态图像中,通过使用病灶的不同模态提高疗效预测的识别性能。
(4)本发明将提出的疗效预测方法和模型封装成辅助诊断系统,使用系统诊断时不需要进行精确的病灶分割,从而避免了繁琐的分割步骤,这种端到端的方式自动化程度更高、实用性更强。封装成系统也极大提高了临床医生的可操作性及结果的直观性,与人工阅片相比速度快、效率高且准确率高。
附图说明
图1为本发明实施例所述的乳腺癌新辅助化疗疗效预测方法的总体框架图。
图2为本发明实施例所述的多特征融合网络的结构示意图。
图3为本发明实施例所述的基于多参数MRI序列的多实例学习网络的结构示意图。
图4为本发明实施例所述的乳腺癌新辅助化疗疗效预测诊断系统的组成示意图。
图5为本发明实施例所述的乳腺癌新辅助化疗疗效预测诊断系统的主界面图。
图6为本发明实施例所述的乳腺癌新辅助化疗疗效预测诊断系统的总体流程图。
具体实施方式
以下结合附图对本发明的实施例进一步详细说明。
本发明所采用的技术方案是:一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置,如图1所示,本发明的总体框架包括:
一、图像获取模块
图像获取模块用于获取患者病灶区域的多参数MRI序列(包括多种成像模态如T2W1、DCE-MRI和DWI)的乳腺影像。
二、图像预处理模块
图像预处理模块用于对获取的每个多参数MRI影像数据进行预处理操作,所述预处理操作包括:异源图像配准、图像去噪、图像剪裁、图像标准化及图像增强。
本发明首先使用基于标准互信息的刚性配准算法对DCE-MRI和T2W1、DWI进行配准,然后使用N4BiasFieldCorrection方法来校正MRI扫描过程中偏置场的影响以完成图像去噪。同时围绕病灶区域中心裁剪获得体素大小为W×H×D的3D感兴趣区域块,对区域块的每个模态图像先各自规范化,再将各个像素点的灰度值范围归一化。最后使用随机仿射变换、水平翻转、垂直翻转、随机旋转图像(范围10°)进行图像增强。
具体来说,图像预处理模块包括:
1、异源图像配准单元:因为获取的每个多参数MRI影像数据的T2W1、DCE-MRI和DWI三种模态在图像维度(Dimension)、体素间距(Voxel spacing)、原点(Origin)等信息上具有差异,使用基于标准互信息的刚体配准算法,以DCE-MRI为固定图像,T2W1和DWI分别作为浮动图像进行刚体变换使得两图中对应于空间同一位置的点一一对应起来,从而达到图像配准的目的。
其中标准互信息(Normalization Mutual Information,NMI)利用对图像灰度值的统计数据形成单个图像的灰度值概率函数和两个图像相似部分对应的灰度值联合概率函数,以此来衡量两幅图像的相关程度。标准互信息的计算公式如下:
Figure BDA0003739397110000061
其中H(R)是单幅图像的熵,H(R,F)是图像R和图像F的联合熵。
其中刚体配准算法是指在变换过程中只涉及平移和转动两种变换,插值方式为线性插值,此过程使用的是greedy开源工具。
2、图像去噪单元:使用N4BiasFieldCorrection方法来校正MRI扫描过程中偏置场的影响,其中偏置场是MRI图像数据中存在的低频强度不均匀的不良信号,会破坏MRI图像,此过程使用的是Python工具包SimpleITK中的N4偏置场校正工具。
3、图像剪裁单元:通过去除乳腺组织外的组织可以显著减少无关信息对后续流程的扰乱,围绕影像中病灶区域中心裁剪获得体素大小为W×H×D的3D感兴趣区(Volum ofInterest,VOI),获得固定的输入大小为128×128×48的VOI。
4、图像标准化单元:由于要处理的每个模态之间的灰度值差距较大,因此对每个模态图像先采用Z-score方式各自规范化,计算公式如下:
Figure BDA0003739397110000062
其中,I表示原始图像,Mean(I)表示原始图像的平均像素值,SD(I)表示原始图像像素值的标准差,O表示规范化后图像。
然后再将各个像素点的灰度值范围归一化,将其映射至[0,1]之间的浮点数。
5、图像增强单元:使用随机仿射变换、水平翻转、垂直翻转、轻微随机旋转图像(范围10°)进行图像增强。
三、病灶区域分割模块
病灶区域分割模块用于利用预处理后的多参数MRI样本影像数据构建并训练病灶区域分割模型,并基于病灶分割模型分割出的病灶区域位置。
1、多参数MRI样本影像数据的获取。
获取患者病灶区域的多参数MRI序列(包括多种成像模态如T2W1、DCE-MRI和DWI)的乳腺影像及对应的疗效类别标签(病理是否完全缓解),然后进行数据选择、数据标注及数据整理工作。
本发明首先从影像设备数据库中导出患者的多参数MRI序列(包括多种成像模态如T2W1、DCE-MRI和DWI)影像数据作为原始数据,同时获取该原始数据对应的NAC后的疗效病理诊断结果作为金标准。然后按照NAC的标准过程制订排除标准以筛选符合要求的高质量数据完成数据选择过程。在数据标注过程中使用常用医学标注软件中对原始数据的DCE-MRI图像进行病灶区域像素级标注,最终在数据整理过程中将原始数据进行格式转换,以患者为单位重新归纳目录和整理文件名。
具体来说,图像获取模块包括:
1、数据采集单元:从合作医院单位按照患者为单位从数据库获取原始影像数据和对应的NAC疗效类别标签,影像数据主要包括多参数MRI序列(T2W1、DCE-MRI、DWI三种模态)的乳腺影像,疗效类别诊断是通过将患者NAC前后病理诊断结果进一步归纳为病理完全缓解(pCR)和病理未完全缓解(non-pCR)两类标签。
2、数据选择单元:根据本发明所关注的NAC疗效预测问题,首先按照以下排除标准:治疗前未实行双侧乳腺MRI检查的患者、未完成全周期NAC或因故中止治疗的患者、NAC后未进行手术者、术后病理评价不完善、远处转移患者进行数据选择。
一示例中,根据纳入排除标准,在实验中回顾性收集了从2018年1月到12月就诊于一医院单位的女性乳腺癌患者308例,年龄18~77岁,平均50.0±10.2,其中pCR肿瘤病例98例,non-pCR肿瘤病例210例。
3、数据标注单元:为了准确获取患者病灶区域,取3名专业医师在医学标注软件ITK-SNAP上的标注结果综合得到病灶区域像素级标注。
4、数据整理单元:以患者为单位进行数据整合,将原始数据的DICOM文件格式转换为NIfTI文件。
一示例中,所述数据整合是按照患者编号命名目录名(例如Breast_Training_001),按照多参数MRI数据的模态命名文件(例如Breast_Training_001_DWI.nii)。
2.病灶区域分割
本发明将预处理后的3D多参数MRI影像数据作为训练数据,以病灶区域对应的像素级标注为训练目标,构建基于3D-UNet语义分割网络,根据该模型分割结果和训练目标计算损失函数,迭代训练该模型直至损失函数收敛或达到最大迭代次数,保存最优的模型作为病灶区域分割模型。
具体来说,病灶区域分割模块包括:
S301:将预处理后的大小为128×128×48的三个模态的VOI分别作为输入图像的一个通道,所以分割网络的输入为3×128×128×48,以标记好的掩膜分割图像为训练目标构建语义分割网络。网络的主干是著名的3D-UNet网络,该网络包括:下采样路径的4层三维卷积层(滤波器大小为[32,64,128,256,512])和3次池化层、上采样路径的3层三维卷积层(滤波器大小为[512,256,128,64])和3次上采样层以及跳跃连接组成。
S302:本发明对下采样路径中子模块进行了微小的调整,更换为带残差连接的子模块结构,在加深网络的同时避免过拟合。在训练过程中,使用Dice Loss,所述Dice Loss的计算公式为:
Dice loss=1-Dice
Figure BDA0003739397110000081
其中,ytrue表示实际分割标签,即人工勾画的金标准,ypred表示模型的预测输出图,加入smooth(平滑项)是为了防止分母出现0。
一示例中,所述3D-UNet语义分割网络,性能评估指数为IoU,初始学习率为0.001,使用回调函数动态调整学习速率,衰减系数设置为0.5。训练总次数为300次,训练的批次大小为16。
四、疗效诊断模块
本发明提出一个多特征融合网络将来自影像组学的特征和来自卷积神经网络的特征进行融合,第一个分支先将从影像中提取的传统放射特征输入到一个自编码器中来重建特征,第二个分支直接将影像输入到卷积神经网络提取深度特征,最终将这两种特征向量以拼接的方式进行多特征融合。
本发明还提出一个基于多参数MRI序列的多实例学习网络,首先将T2W1、DCE-MRI和DWI三种模态数据分别作为单个实例输入到步骤4中所述的多特征融合网络进行特征提取和融合,然后将得到的三种模态对应的特征实例输入到一个多实例学习网络来聚合患者所有模态的肿瘤病灶信息进行疗效预测。
1.多特征融合
S401:构建一个多特征融合网络将来自影像组学的特征和来自卷积神经网络的特征进行融合,多特征融合网络的具体方式如图2所示。首先网络的输入为三个模态的VOI和掩膜分割图像,VOI的大小经过裁剪后固定为128×128×48,因为DCE-MRI模态包括阶段一到阶段五共5个时序图像,取阶段一、三、五的图像分别作为图像的输入通道,所以DCE-MRI模态的输入为3×128×128×48;而T2W1和DWI模态为单通道,大小为1×128×128×48,为了保证多特征融合网络结构的一致性,此处将T2W1和DWI模态按照单通道转多通道的原理,将单通道的图像复制3份后得到输入为3×128×128×48。
S402:在构建多特征融合网络之前,需要使用开源影像组学分析软件(Pyradiomics)提取病灶区域内的放射特征,并将提取的特征以excel文件形式保存。
具体地,Pyradiomics中特征提取主要包含四类特征:1)形态学特征:描述如感兴趣区域(region of interest,ROI)区域的位置、形状和大小等特征。2)一阶灰度直方图特征:通过计算ROI中不同灰度级的频率分布得到相关统计特征。3)二阶和高阶纹理特征:描述图像中像素及其邻域的灰度值分布以表征纹理特征。4)基于滤波的特征:高斯拉普拉斯算子(LoG)常用于原始图像的边缘检测处理,在使用高斯函数减少噪声的基础上运用不同的滤波宽度来凸显图像的纹理特征。
针对每个病例的MRI多模态图像和分割图像分别进行上述特征的提取,提取出的每个病例的每个模态的初始特征共293个特征,使用特征降维后得到最终的100个特征,特征降维阶段使用的是机器学习中的随机森林算法对特征进行重要性评分,选取评分排序后的前100个特征作为初始放射特征。后续在测试过程中将对每个图像进行这100个特征的提取。
S403:多特征融合网络总体分为两个并行分支,第一个分支为通过自编码器网络fae重建来自影像组学的放射特征。其中自编码网络fae的功能是通过将初始放射特征作为学习目标,对初始放射特征进行表征学习。自编码网络fae由4层编码器和4层解码器组成,如图2所示,每一层都是具有ReLU激活的全连接层。
为了将多特征进行融合,将自编码器网络fae的最后一层编码器结果输入到3个全连接层,输出结果为特征向量mbi
具体地,在训练第一个分支的自编码器网络的过程中,采用的是均方误差损失(MSE Loss),所述MSE Loss的计算公式为:
Figure BDA0003739397110000091
其中,xrecon是经过自编码器重建后的影像特征,x是原始特征,N是训练样本总数。
S404:多特征融合网络总体分为两个并行分支,第二个分支为使用卷积神经网络fcnn作为特征提取器提取深度特征。基础网络框架是ResNet50,如图2所示,该网络由49个卷积层、1个全连接层和残差块内的跳跃连接组成。
具体地,此步骤通过fcnn特征提取得到深度高级特征向量nbi=fcnn(xbi),通过拼接的方式与S403步骤中得到的传统放射特征向量mbi进行多特征融合,得到融合后的特征向量zbi=(mbi,nbi)。
2.疗效预测诊断。
S405:构建一个基于多参数MRI序列的多实例学习网络,多实例学习网络的具体方式如图3所示。
具体地,多实例学习(MIL)是一种弱监督学习方法,最近被应用于深度学习,尤其是在病理学领域,在这里本发明将pCR疗效预测视为MIL问题。本发明的工作和之前的工作的不同之处在于,在多实例学习中,本发明以多参数MRI数据中的T2W1、DCE-MRI和DWI三种模态数据为“实例”(Instance),以一个病例的多参数MRI数据为“包”(Bag),通过训练多实例学习网络来聚合来自患者的所有病变的多模态信息进行疗效预测。
如图3所示,本发明将多参数MRI数据中多模态数据{xb1,xb2,xb3}定义为实例,将多参数MRI数据定义为包Xb,包的标签为Yb∈(0,1)。首先将T2W1、DCE-MRI和DWI三种模态数据分别作为单个实例输入到步骤4中所述的多特征融合网络进行特征提取和融合,然后得到了三种模态对应的特征实例集合Zb={zb1,zb2,zb3},其中zbi特征向量的大小为M。
为了给每个模态对应的特征向量赋予不同的权重,本发明在多实例学习网络中添加了一个注意层fatt,这个注意层由两层神经网络组成。注意力层fatt被定义为每个特征向量Zbi分配一个注意权重αbi,权重αbi加起来等于1,权重由模型决定,其中权重αbi公式如下:
Figure BDA0003739397110000101
其中w是L×1维度,V是L×M维度,都是可训练的参数,M代表特征向量的大小,L=50。
S406:根据上一步得到的权重αbi通过分类器gc(即一个平均池化层和一个具有sigmoid函数的全连接层)来预测pCR疗效标签:
p(Yb|Xb)=gc(fatt(Zb))
S407:在训练多实例学习网络的过程中,采用的是交叉熵损失(CE Loss),所述CELoss的计算公式为:
Figure BDA0003739397110000102
S408:使用联合损失Loss对自编码器fae、特征抽取器fcnn、注意层fatt和分类器gc进行联合训练,直至收敛。
Figure BDA0003739397110000111
其中α是重建误差LMSE和预测误差LCE之间权衡的超参数。在本发明的实验中,α=1提供了稳健的结果。
S409:模型训练中采用Adam优化器对模型参数进行优化,初始学习率设置为0.001,每2000次迭代减半。最大训练次数为300次,批量大小为16。
实验验证
本发明的模型评估采用ROC曲线下面积(AUC)和准确性(Acc)作为评估指标,通过5次重复的3倍交叉验证来预测pCR疗效。使用两种已知的机器学习算法对提取出来的放射特征进行训练:支持向量机(SVM)、随机森林(RF),表1为本发明和其他各种模型的分类性能的比较:
网络模型 AUC(95%CI) 准确度(%)
SVM 0.70 0.729
RF 0.725 0.74
3D-ResNet 0.62 0.64
本发明 0.856 0.87
表1本发明和其他各种模型的分类性能的比较
参阅图4,本实施例提供了一个基于多特征融合的乳腺癌新辅助化疗疗效预测系统,软件主界面参阅图5,其包括:
第一模块,图像读取与保存模块,主要提供加载MRI影像数据、显示图像和图像保存的功能,在此基础上扩展了三视图展示、切片转换、坐标显示等查看图像的进阶功能。
第二模块,图像预处理模块,主要提供对读取的MRI影像数据进行图像去噪、图像标准化、图像剪裁等预处理操作。
第三模块,病灶区域分割模块,通过将实验过程中训练得到的病灶区域分割模型集成到系统中,可以实现对病灶区域的高精度分割结果。
第四模块,疗效诊断模块,通过将实验过程中训练得到的基于多实例学习的疗效预测模型集成到系统中,可以实现对病灶区域的精准NAC疗效预测。
以下结合图6介绍利用乳腺癌新辅助化疗疗效预测系统实现乳腺癌病灶区域NAC疗效预测方法,包括如下步骤:
S1:点击【加载MRI影像数据】,选择要显示的乳腺MRI图像,支持加载的影像数据格式为DICOM格式。
S2:加载完成后将在右上方的【序列信息显示区】显示DICOM序列信息,在下方的【影像数据显示区】对MRI影像进行横轴位、矢状位和冠状位三视图的显示,并支持切片转换、坐标显示等其他查看图像功能。
S3:判断读取的图像是否需要预处理,包含图像去噪、图像标准化、图像剪裁等操作。如需要调用步骤S4,选择软件提供的预处理方法,否则转向步骤S5。
S4:根据用户选择的预处理方法,调用相应接口完成操作并显示。
S5:点击【NAC疗效预测】,软件后台将读取图像输入至病灶区域分割模型完成病灶区域分割。
S6:后台将得到病灶区域和图像一同输入至基于多实例学习的疗效预测模型进行多特征提取并融合后生成最终的疗效预测结果。
S7:输出并显示最终诊断结果,点击【图像保存】,选择要保存的影像视图(横轴位、矢状位、冠状位),将会保存当前展示区内所选的影像视图为.jpg格式存储至系统。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体,但并不能因此理解为对本发明专利范围的限制。应当指出,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应当以所附权利要求为准。

Claims (10)

1.一种基于多特征融合的乳腺癌新辅助化疗疗效预测装置,包括:
图像获取模块,用于获取患者病灶区域的多模态乳腺影像,其中,所述多模态乳腺影像的模态包括:T2W1模态、DCE-MRI模态和DWI模态;
图像预处理模块,用于对每一模态乳腺影像进行图像剪裁,得到该模态乳腺影像的3D感兴趣区;
病灶区域分割模块,用于根据各模态乳腺影像的3D感兴趣区,得到病灶区域;
疗效诊断模块,用于计算并拼接所述病灶区域的放射特征向量与各3D感兴趣区的深度高级特征,并基于各模态乳腺影像的拼接向量,预测乳腺癌新辅助化疗的疗效。
2.如权利要求1所述的方法,其特征在于,所述图像预处理模块,还用于:
基于异源图像配准单元,对所述多模态乳腺影像进行异源图像配准;
基于图像去噪单元,对所述多模态乳腺影像进行图像去噪;
基于图像标准化单元,对所述多模态乳腺影像进行图像标准化;
基于图像增强单元,对所述多模态乳腺影像进行图像增强。
3.如权利要求1所述的方法,其特征在于,所述异源图像配准单元,用于:
使用基于标准互信息的刚体配准算法,以所述DCE-MRI模态的图像为固定图像,所述T2W1模态和所述DWI模态的图像分别作为浮动图像进行刚体变换,使得图中对应于空间同一位置的点一一对应。
4.如权利要求1所述的方法,其特征在于,所述图像去噪单元,用于:所述图像标准化单元,用于:
对所述T2W1模态、所述DCE-MRI模态和所述DWI模态的图像,分别采用Z-score方式进行规范化。
将规范化后的图像中各像素点的灰度值范围归一化。
5.如权利要求1所述的方法,其特征在于,所述病灶区域分割模块,用于:
构建基于3D-UNet的语义分割网络,其中,所述语义分割网络的结构为下采样路径的P层三维卷积层与P′次池化层、上采样路径的Q层三维卷积层与Q′次池化层,并将所述下采样路径中的子模块更换为带残差连接的子模块结构;
获取多模态样本乳腺影像,将T2W1模态、DCE-MRI模态和DWI模态的样本乳腺影像分别作为所述语义分割网络的输入图像,并以标记好的掩膜分割图像为训练目标训练所述语义分割网络,得到语义分割模型,其中,训练过程的损失函数Dice Loss=1-Dice,
Figure FDA0003739397100000011
Figure FDA0003739397100000012
ytrue表示实际分割标签,ypred表示预测输出图,smooth表示平滑项;
将T2W1模态、DCE-MRI模态和DWI模态的乳腺影像分别作为所述语义分割模型的输入图像,以得到所述病灶区域。
6.如权利要求5所述的方法,其特征在于,所述获取多模态样本乳腺影像,包括:
数据采集单元,用于按照患者为单位从数据库获取原始影像数据和对应的新辅助化疗疗效类别标签,所述新辅助化疗疗效类别标签包括:病理完全缓解和病理未完全缓解;
数据选择单元,用于根据疗效预测问题设定排除标准,以选择数据,其中,所述排除标准包括:治疗前未实行双侧乳腺磁共振成像检查的患者、未完成全周期新辅助化疗或因故中止治疗的患者、新辅助化疗后未进行手术者、术后病理评价不完善和远处转移患者;
数据标注单元,用于经由专业医师在医学标注软件ITK-SNAP上的标注结果综合得到病灶区域像素级标注;
数据整理单元,用于以患者为单位进行数据整合,将原始数据的DICOM文件格式转换为NIfTI文件。
7.如权利要求1所述的方法,其特征在于,所述疗效诊断模块,用于:
初始放射特征提取单元,用于选定需提取的放射特征,并使用开源影像组学分析软件对所述病灶区域进行放射特征提取,以得到初始放射特征;
放射特征计算单元,用于将所述初始放射特征的自编码器网络编码结果,输入若干个全连接层,得到所述病灶区域内的放射特征;
深度高级特征提取单元,用于将每一模态乳腺影像的3D感兴趣区输入基于ResNet50的卷积神经网络,得到该模态的深度高级特征;
向量拼接单元,用于拼接所述放射特征与每一模态的深度高级特征,得到相应模态乳腺影像的拼接向量;
预测单元,用于将各模态乳腺影像的拼接向量输入多实例学习网络,以使所述多实例学习网络中的注意层为每一模态乳腺影像的拼接向量赋予权重,所述多实例学习网络中的分类器基于各模态乳腺影像的拼接向量的加权求和结果,得到乳腺癌新辅助化疗的预测疗效。
8.如权利要求7所述的方法,其特征在于,初始放射特征提取单元,用于:
针对样本病灶区域,使用开源影像组学分析软件获取全部放射特征,所述全部放射特征包括:形态学特征、一阶灰度直方图特征、二阶与高阶纹理特征和基于滤波的特征;
使用随机森林算法对各放射特征进行重要性评分,以确定需提取的放射特征;
选定需提取的放射特征。
9.如权利要求7所述的方法,其特征在于,所述深度高级特征提取单元,用于:
针对DCE-MRI模态的乳腺影像,取阶段一、阶段三、阶段五的图像分别作为卷积神经网络的输入图像,以得到DCE-MRI模态的深度高级特征;
和,
针对T2W1模态的乳腺影像,将单通道的图像复制3份后,分别作为卷积神经网络的输入图像,以得到T2W1模态的深度高级特征;
和,
针对DWI模态的乳腺影像,将单通道的图像复制3份后,分别作为卷积神经网络的输入图像,以得到DWI模态的深度高级特征。
10.如权利要求7所述的方法,其特征在于,训练所述疗效预测模块的损失Loss=LMSE+αLCE,其中,LMSE表示训练所述自编码器网络的重建损失,LCE表述训练所述多实例学习网络的预测损失,α表示重建损失LMSE和预测损失LCE之间权衡的超参数。
CN202210811491.2A 2022-07-11 2022-07-11 基于多特征融合的乳腺癌新辅助化疗疗效预测装置 Pending CN114974575A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210811491.2A CN114974575A (zh) 2022-07-11 2022-07-11 基于多特征融合的乳腺癌新辅助化疗疗效预测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210811491.2A CN114974575A (zh) 2022-07-11 2022-07-11 基于多特征融合的乳腺癌新辅助化疗疗效预测装置

Publications (1)

Publication Number Publication Date
CN114974575A true CN114974575A (zh) 2022-08-30

Family

ID=82970050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210811491.2A Pending CN114974575A (zh) 2022-07-11 2022-07-11 基于多特征融合的乳腺癌新辅助化疗疗效预测装置

Country Status (1)

Country Link
CN (1) CN114974575A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115830001A (zh) * 2022-12-22 2023-03-21 抖音视界有限公司 肠道图像处理方法、装置、存储介质及电子设备
CN116504399A (zh) * 2023-03-16 2023-07-28 重庆大学附属肿瘤医院 一种基于纵向DCE-MRI的乳腺癌新辅助化疗pCR预测方法
CN116861369A (zh) * 2023-09-04 2023-10-10 山东捷瑞数字科技股份有限公司 工业互联网异构数据融合的空压机健康评估方法及系统
CN117524501A (zh) * 2024-01-04 2024-02-06 长春职业技术学院 基于特征挖掘的多模态医学数据分析系统及方法
CN117982106A (zh) * 2024-04-02 2024-05-07 天津市肿瘤医院(天津医科大学肿瘤医院) 一种基于mri图像的乳腺癌化疗疗效预测系统及方法
CN118016283A (zh) * 2024-04-09 2024-05-10 北京科技大学 基于可解释的乳腺癌新辅助化疗pCR预测方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115830001A (zh) * 2022-12-22 2023-03-21 抖音视界有限公司 肠道图像处理方法、装置、存储介质及电子设备
CN115830001B (zh) * 2022-12-22 2023-09-08 抖音视界有限公司 肠道图像处理方法、装置、存储介质及电子设备
CN116504399A (zh) * 2023-03-16 2023-07-28 重庆大学附属肿瘤医院 一种基于纵向DCE-MRI的乳腺癌新辅助化疗pCR预测方法
CN116861369A (zh) * 2023-09-04 2023-10-10 山东捷瑞数字科技股份有限公司 工业互联网异构数据融合的空压机健康评估方法及系统
CN117524501A (zh) * 2024-01-04 2024-02-06 长春职业技术学院 基于特征挖掘的多模态医学数据分析系统及方法
CN117524501B (zh) * 2024-01-04 2024-03-19 长春职业技术学院 基于特征挖掘的多模态医学数据分析系统及方法
CN117982106A (zh) * 2024-04-02 2024-05-07 天津市肿瘤医院(天津医科大学肿瘤医院) 一种基于mri图像的乳腺癌化疗疗效预测系统及方法
CN118016283A (zh) * 2024-04-09 2024-05-10 北京科技大学 基于可解释的乳腺癌新辅助化疗pCR预测方法及系统

Similar Documents

Publication Publication Date Title
Al-Masni et al. Skin lesion segmentation in dermoscopy images via deep full resolution convolutional networks
CN110996789B (zh) 执行筛查、诊断或其他基于图像的分析任务的系统和方法
CN114974575A (zh) 基于多特征融合的乳腺癌新辅助化疗疗效预测装置
CN106682435B (zh) 一种多模型融合自动检测医学图像中病变的系统及方法
US7653263B2 (en) Method and system for volumetric comparative image analysis and diagnosis
Reshma et al. Detection of breast cancer using histopathological image classification dataset with deep learning techniques
US20080107323A1 (en) Computer Diagnosis of Malignancies and False Positives
MX2014007380A (es) Procesamiento y representacion de una imagen de mama.
Wang et al. Automatic breast tumor detection in ABVS images based on convolutional neural network and superpixel patterns
Kaur et al. Computer-aided diagnosis of renal lesions in CT images: a comprehensive survey and future prospects
EP4118617A1 (en) Automated detection of tumors based on image processing
CN110738633B (zh) 一种机体组织的三维图像处理方法及相关设备
Aslam et al. Liver-tumor detection using CNN ResUNet
Maalem et al. A deep-based compound model for lung cancer detection
Harrison et al. State-of-the-art of breast cancer diagnosis in medical images via convolutional neural networks (cnns)
Edwin et al. Liver and tumour segmentation from abdominal CT images using adaptive threshold method
Li et al. Architectural distortion detection based on superior–inferior directional context and anatomic prior knowledge in digital breast tomosynthesis
Jiang et al. A hybrid enhanced attention transformer network for medical ultrasound image segmentation
US20230162353A1 (en) Multistream fusion encoder for prostate lesion segmentation and classification
Chen et al. A new classification method in ultrasound images of benign and malignant thyroid nodules based on transfer learning and deep convolutional neural network
Li et al. A dual attention-guided 3D convolution network for automatic segmentation of prostate and tumor
Ye et al. Automated segmentation of mass regions in DBT images using a dilated DCNN approach
Hamdy et al. Densely Convolutional Networks for Breast Cancer Classification with Multi-Modal Image Fusion
Salehi et al. Investigation and simulation of different medical image processing algorithms to improve image quality using simulink matlab
Amritha et al. Liver tumor segmentation and classification using deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination