CN114926396B - 一种精神障碍类磁共振图像初步筛查模型构建方法 - Google Patents
一种精神障碍类磁共振图像初步筛查模型构建方法 Download PDFInfo
- Publication number
- CN114926396B CN114926396B CN202210389137.5A CN202210389137A CN114926396B CN 114926396 B CN114926396 B CN 114926396B CN 202210389137 A CN202210389137 A CN 202210389137A CN 114926396 B CN114926396 B CN 114926396B
- Authority
- CN
- China
- Prior art keywords
- model
- image
- brain
- classification
- magnetic resonance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000020016 psychiatric disease Diseases 0.000 title claims abstract description 37
- 238000012216 screening Methods 0.000 title claims abstract description 16
- 238000010276 construction Methods 0.000 title description 2
- 238000013145 classification model Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 31
- 210000004556 brain Anatomy 0.000 claims abstract description 26
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 19
- 238000002595 magnetic resonance imaging Methods 0.000 claims abstract description 9
- 210000003625 skull Anatomy 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 6
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 4
- 230000005821 brain abnormality Effects 0.000 claims abstract description 4
- 230000011157 brain segmentation Effects 0.000 claims abstract description 4
- 210000001519 tissue Anatomy 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 21
- 208000028017 Psychotic disease Diseases 0.000 claims description 7
- 239000013255 MILs Substances 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 238000002224 dissection Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 238000012360 testing method Methods 0.000 description 9
- 201000010099 disease Diseases 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000004195 computer-aided diagnosis Methods 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000002610 neuroimaging Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000698 schizophrenic effect Effects 0.000 description 3
- 208000020925 Bipolar disease Diseases 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000007428 craniotomy Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003001 depressive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Radiology & Medical Imaging (AREA)
- Pathology (AREA)
- Quality & Reliability (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Image Analysis (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
本发明提供了一种精神障碍类磁共振图像初步筛查模型构建方法,包括对多个受试者进行临床全脑MRI扫描,图像处理均在联影工作站;由神经放射科医生检查所有受试者的图像,以排除有明显脑异常或有图像伪影的受试者;将DICOM文件存储格式的数据转换为NIFTI格式,保存在3D模型图像中;用颅骨剥离工具去除骨体素以消除非组织的影响;通过大脑分割包获得代表大脑半球信息的去颅骨的脑模板,以T1WI‑nii、T2WI‑nii及相应的脑模板作为卷积神经网络模型的输入;卷积神经网络模型移除对图像类别置信分数贡献度低的特征通道及其对应的滤波器,降低模型冗余度,压缩模型的同时保持模型性能;基于问卷在患者级标记,以弱监督的方式训练分类模型,并对训练后的分类模型进行检验。
Description
技术领域
本发明涉及图像处理技术领域,特别地涉及一种精神障碍类磁共振图像初步筛查模型构建方法。
背景技术
精神障碍是一种严重残疾的常见病,影响着全世界约10-20%的普通人群,在每年发生的8万起自杀事件中占绝大部分。然而,精神障碍患者常常被忽视,人力和财政资源分配的负担比例在精神障碍患者中也远低于其他疾病。在全球范围内,精神卫生支出的中位数占政府卫生支出总额的2.4%,而据估计,精神障碍占伤残调整生命年(totaldisability-adjusted life-years,DALYs)总额的12%,占残疾生活年(years lived withdisability,YLDs)总额的35%,表明疾病负担与有效分配支出之间存在严重失衡。虽然填补这一空白是具有挑战性的,但用一种最有效的方法检测早期受精神疾病影响的个体和那些临床风险高的个体,是提供早期干预以改善临床结果和预防长期疾病损害的一个有意义的途径。
磁共振成像是一种先进的医学成像技术,用于描述大脑的解剖和功能改变,这有助于对精神障碍的临床风险、神经生物学过程和认知概况机制的理解。尽管以前大多数研究的病例/对照比较结果提供了信息,但在帮助个体识别处于临床高风险或已受疾病影响的受试者方面价值有限。然而,这些研究表明,精神疾病患者的大脑MRI数据有细微且可测量的变化,以及机器学习(ML)算法在神经成像中的应用,使其能够提取非常微小的信息,以区分精神障碍患者和健康受试者。在过去的深入研究中,精神分裂症患者与健康对照者分类的准确率在60%到100%之间,重度抑郁症患者分类准确率在50%到100%之间,双相情感障碍分类准确率在57%到100%之间。前期研究结果的存在相当大的异质性,因此目前需要新的方法,更广泛的验证和在特定临床环境中的应用,为未来计算机辅助判断(CAD) 精神疾病和其他应用带来希望。
在传统的ML模型中,最常用的是支持向量机(support vector machine,SVM),但其对缺失数据的稳定性和敏感性较低。相比之下,基于深度学习的神经网络保持了传统ML方法的优势,因此CAD在精神障碍类疾病学的神经影像学数据中显示出特别的前景。此外,深度学习算法在精确检测医学影像上的细微病灶方面显示出了与专家水平相当甚至超过其准确率的优势。然而,在以往的工作中,深度学习模型是在小数据集和少数患者中训练的。在每种精神障碍的研究中,样本量大多被限制在数百个,当这些参与者被进一步划分为训练和测试数据集时,当外部验证数据集无法获得时,情况变得更糟。这是导致先前研究结果差异的一个关键因素,导致训练模型的准确性较差,或者精度不错但泛化程度较差。因此,建立大规模数据集的CAD模型,并在不同的情况下使用外部参考标准进行测试,是在模型能够在真实的临床环境中使用之前必不可少的。
至于应用之前训练的ML模型的临床背景,开发一种诊断工具是为了帮助识别受试者是否患有特定的精神疾病(即精神分裂症vs健康对照)或将受试者区分为两种疾病(即精神分裂症vs双相情感障碍)。值得注意的是,所使用的图像是在研究目的下获得的,通常需要一个小时或更长时间才能获得。然而,在临床实践中,如果花一小时左右的时间扫描一个怀疑患有精神疾病的对象,然后通过将图像导入ML模型来确认诊断是没有意义的,尽管模型的平均准确率为70%-90%,但这实际上比与有经验的治疗精神障碍类疾病医生面谈要花费更多的金钱和时间。因此,目前的重点应从精确性和特异性的诊断精神障碍转向开发一种常用的筛查工具,以识别临床高风险或疾病早期的受试者,并在脆弱人群中开展早期干预。在这方面,应将不同精神障碍的患者作为一个整体来构建模型。这与先前研究提出的发展跨诊断精神障碍类疾病理学筛查方法的概念相一致,因为精神疾病有共同的遗传、影像学和精神障碍类疾病理学表现,它们更像是一个谱系,而不是单独的实体。
发明内容
针对上述现有技术中的问题,本申请提出了一种精神障碍类磁共振图像初步筛查模型构建方法,包括以下步骤:
步骤S1、对多个受试者进行全脑MRI扫描,扫描数据包括T1WI和T2WI,所有受试者的T1WI和T2WI图像均为DICOM的数据形式,图像处理均在联影工作站;
步骤S2、由神经放射科医生检查所有受试者的图像,以排除有明显脑异常或有图像伪影的受试者;
步骤S3、将DICOM文件存储格式的数据转换为NIFTI格式,保存在3D模型图像中;
步骤S4、用颅骨剥离工具去除骨体素以消除非组织的影响;
步骤S5、通过大脑分割包获得代表大脑半球信息的去颅骨的脑模板,以 T1WI-nii、T2WI-nii及相应的脑模板作为卷积神经网络模型的输入;
步骤S6、基于问卷在患者级标记,以弱监督的方式训练分类模型,移除所述分类模型中对图像类别置信分数贡献度低的特征通道及其对应的滤波器,降低模型冗余度,压缩模型的同时保持模型性能;
步骤S7、继续以弱监督的方式训练分类模型,并对训练后的分类模型进行检验。
优选地,所述分类模型将特征通道作为掩码反作用于输入图像,不同特征通道对正样本图像分类准确度的促进或抑制程度的不同,所述分类模型判别不同特征通道和滤波器的重要性。
优选地,压缩模型包括以下步骤:
步骤S61:选择任务数据集及待压缩模型;
步骤S62:选取正样本图像输入模型,获得各层输出特征图;
步骤S63:根据卷积神经网络模型输出的通道重要性置信分数,预设通道重要性置信分数阈值,移除重要程度低于预设通道重要性置信分数阈值的通道重要性置信分数;
步骤S64:微调压缩后的卷积神经网络模型,使其恢复精度。
优选地,步骤S61包括以下步骤:
步骤S611:给定图像分类数据集D和待压缩的卷积神经网络模型,训练一个卷积神经网络分类模型;
步骤S612:选取合适的超参数和优化器,迭代地训练分类模型,直到分类模型收敛并在图像分类数据集D上获得较高的分类准确率时,保存训练好的分类模型M。
优选地,步骤S62包括以下步骤:
步骤S621:从数据集中选取一张图像为Ic∈D,其类别标签为c,使其满足: c=argmax(M(Ic));
步骤S622:将图像Ic输入训练好的模型,针对模型的每一层,获得其输出特征图:
优选地,所述分类模型的训练通过MIL方案训练的两阶段方法,包括一个切片级分类器和一个患者级分类器。
优选地,所述切片级分类器将三维模型图像分成一系列切片,每个切片完全包含在单个图像中;每个图像来自数据集S={si:i=1,2,…,n},给定一个切片策略,组成数据包数据包/>包含了所有切片;设置每个受试者的切片数为23,作为使用脑模板的MIL的袋大小(mi);同时,通过对侧区域比较检测异常的策略,增强对异常脑区的识别,并对是否包含精神障碍类疾病相关异常类别进行分类;使用4个连续的下行块来提取每个切片的特征,其中包括两个卷积层、批处理归一化层、线性整流函数、最大池化层;然后采用全连接层在切片级上利用压缩的特征图生成分类结果。
上述技术特征可以各种适合的方式组合或由等效的技术特征来替代,只要能够达到本发明的目的。
本发明提供的一种精神障碍类磁共振图像初步筛查模型构建方法,与现有技术相比,至少具备有以下有益效果:1)有效利用以往病历大数据,采用深度学习的方法对大量精神障碍患者磁共振脑成像病例进行数据分析,特征提取和经验学习,为医生提供准确度较高的精神障碍疾病诊断辅助,使精神障碍诊断准确度独立于医生经验。2)极大的提高了诊断速度,可以使患者早发现早治疗,为患者的良好预后提供机会。3)自动化处理水平较高,自动化分析并智能检测精神障碍患者,可以极大地降低操作人员工作量。4)有效降低卷积神经网络部署所需的存储和内存空间、硬件算力等资源,扩大了卷积神经网络的应用平台范围。5)压缩后的模型可以直接应用于现有的软件平台和硬件设备中,简单方便,不需要特殊的平台和算法的支持。6)很好地利用了模型自身的特性,可解释性好,无需引入新的判别参数重要性的假设和标准。
附图说明
在下文中将基于实施例并参考附图来对本发明进行更详细的描述。其中:
图1显示了本发明的MIL方案训练示意图;
图2显示了本发明的模型参数移除操作示意图;
在附图中,相同的部件使用相同的附图标记。附图并未按照实际的比例。
具体实施方式
考虑到现有技术,在当前的研究中,我们采用基于多实例学习(MIL)的方法来训练和测试CAD模型,对大样本回顾性数据,对象为回顾性招募的14915名不同精神障碍患者和4538名健康对照组。另一个数据集有290名精神障碍患者和310名来自另一个独立中心的健康对照组,用于验证诊断性能和测试所建立模型的泛化性。为了进一步检验所建立的CAD模型在现实生活中的效用,在一项前瞻性研究中,我们收集了另外148名被试,他们都是医学院的大学生,据研究发现他们的精神疾病的患病率普遍较高。在这一部分中,每个参与者都获得了大脑MRI扫描、自评量表以及与经验丰富的治疗精神障碍类疾病医生的诊断访谈的数据。
下面将结合附图对本发明作进一步说明。
本发明提供了一种精神障碍类磁共振图像初步筛查模型构建方法,所有受试者均进行临床全脑MRI扫描,由经验丰富的神经放射科医生检查所有参与者的图像,以排除有明显脑异常或有图像伪影的参与者。
所有受试者的全脑MRI扫描图像为DICOM的数据形式,图像处理均在联影工作站。首先,由于DICOM的文件存储格式对机器学习不友好,我们将其转换为NIFTI(.nii)格式,将医疗数据保存在3D模型图像中。然后用颅骨剥离工具去除骨体素以消除非组织的影响。最后,我们通过大脑分割包获得代表大脑半球信息的去颅骨的脑模板,以T1WI-nii、T2WI-nii及相应的脑模板作为模型的输入,基于问卷在患者级标记,以弱监督的方式训练分类模型。
现有的卷积神经网络模型因参数量庞大而对应用的软硬件平台的存储和内存空间、算力等资源要求高,不能被广泛地应用于资源受限的平台。为了有效降低模型的资源消耗量,拓宽卷积神经网络模型的应用范围。本发明根据卷积神经网络过剩的预设编码空间导致模型参数冗余的原理,利用卷积神经网络提取的特征通道对图像类别置信分数贡献度不同的特点,通过将特征通道作为掩码反作用于输入图像,根据不同特征通道对正样本图像分类准确度的促进或抑制程度的不同,利用模型判别不同特征通道和滤波器的重要性。采取移除对图像类别置信分数贡献度低的特征通道及其对应的滤波器的方式,降低模型冗余度,达到压缩模型的同时尽可能保持模型性能的目的。处理步骤具体分为:
步骤1:选择任务数据集及待压缩模型。给定图像分类数据集D和待压缩的卷积神经网络模型,训练一个卷积神经网络分类模型。选取合适的超参数和优化器,迭代地训练分类模型,直到模型收敛并在图像分类数据集D上获得较高的分类准确率时,保存训练好的分类模型M。
步骤2:选取正样本图像输入模型,获得各层输出特征图。由于训练好的卷积神经网络具有对图像类别特征编码的能力,其对数据集中正样本的特征编码具有更高的准确度,这些编码以特征图的形式存在于分类模型各层的输出中。
设从数据集中选取一张图像为Ic∈D,其类别标签为c,使其满足:
c=argmax(M(Ic))
即分类模型对图像Ic的预测类别就是它的真实类别,我们将这样的图像Ic称为正样本图像。将图像Ic输入训练好的分类模型,针对分类模型的每一层,获得其输出特征图:
步骤3:根据分类模型输出的通道重要性置信分数,移除重要程度低的参数。分类模型对图像的特征编码由多个通道组合而成,由于预设的通道数过多导致编码空间过剩,因而造成分类模型参数冗余。然而,特征编码的不同通道由不同功能的滤波器提取图像特征生成,这些通道中编码的不同特征对分类模型输出的图像类别置信分数的贡献度是不同的。本发明利用这一特点移除分类模型中对图像类别置信分数贡献低的部分特征通道及提取这些特征的相应滤波器,通过减小编码空间的方式降低模型冗余。
本发明将不同的特征图通道作为输入图像的掩码,将其覆盖在输入图像上。若一个特征通道对图像类别置信分数的贡献度大,那么其作用在图像上会突出对分类有促进作用的特征,使得模型在该类别的预测置信分数上有较大的值;反之,若一个通道对图像类别置信分数的贡献度小,其作用后的图像则会降低模型对该类别的置信分数。由此确定不同特征通道及其滤波器的重要程度。
给定各层的剪枝率Pl=[p1,p2,…,pL],其中pl∈[0,1)表示预设的第l层要移除的通道和滤波器的比例。对于l=1,2,…,L,逐层迭代地执行如下过程:
其中⊙表示矩阵逐元素相乘。
(3)将Sl中的所有元素分批次输入到模型M中,得到它们对应的类别置信分数在第c类的值:
(4)获取第l层的剪枝率pl,将Yc中的元素按从小到大的顺序排序,选择其中的前Nl=nlpl个元素对应的下标索引序列。在模型f中,删除第l层中这些索引对应的的滤波器、第l+1层中这些索引对应的滤波器通道。本发明实施例中的模型参数移除操作如图2所示,其中矩形表示不同的特征通道,每行并列的菱形表示多个通道的滤波器,用“叉”号标记的是被模型判别为低重要程度的通道和滤波器,它们将被移除出模型。
步骤4:微调压缩后的模型,使其恢复精度。由于删除了模型中部分冗余的参数,导致模型在数据集D上的分类准确度有一定程度的下降。为了恢复模型准确度,需要将压缩后的模型再进行一定轮次的迭代训练,训练时适度降低学习率,直到模型收敛,此时模型的准确率得以恢复。保存此时的模型,即为被压缩的模型。
为了充分利用现有的数据,由经验丰富的治疗精神障碍类疾病医生基于问卷在患者级标记,以弱监督的方式训练分类模型。更具体地说,患者级诊断对特定3D模型图像中的所有切片进行弱标记。该方法是一种通过MIL方案训练的两阶段方法,包括一个切片级分类器,然后是一个患者级分类器,如图1所示。
MIL是标准监督机器学习场景的变体。在MI学习中,每个例子由一个多实例集(包)组成。每个包都有一个类标签,但是实例本身没有标记。这个学习是基于给定的示例包建立一个模型,可以准确预测其他数据集的分类标签。
将三维模型图像分成一系列切片(224×320像素),每个切片完全包含在单个图像中。每个图像来自我们的数据集S={si:i=1,2,…,n}可以看作是由实例集合组成的一个包。给定一个切片策略,我们也组成数据包 这个数据包是包含了所有切片。在这项工作中,我们设置每个受试者的切片数为23,作为使用脑模板的MIL的袋大小(mi),它是由所有受试者在训练集中的最大厚度推导出来的。同时,通过对侧区域比较检测异常的策略,增强了对异常脑区的识别,并对是否包含精神障碍类疾病相关异常类别进行分类。在这一部分中,我们使用4个连续的下行块来提取每个切片的特征,其中包括两个卷积层,批处理归一化层和线性整流函数,然后是最大池化层。然后采用全连接层在切片级上利用压缩的特征图生成(正/负)分类结果。
根据MIL假设,我们知道,如果受试者是患者,那么在一个数据袋里至少有一片切片被认为是阳性。相反,如果受试者是正常被试,它所有切片也必须是阴性的。给定一个数据袋中的被试图像Si,mi层数尽可能的根据它们的正概率进行详尽的分类和排名。如果一个袋子是阳性的,排名靠前的切片的概率应该超过0.5。同样,如果它是负的,上面的值应该低于0.5。我们认为/>是Si的可能性,所以可能性为:从上一个模块中,我们获得了袋子中每一片的特征图和类。然后,我们根据上述规则使用分类器对包内的个体进行诊断。
在本工作中,损失函数是由交叉熵损失/>和注意损失/>组成的。这被定义为交叉熵损失用来测量两种概率分布的不同,定义为/>其中/>代表是Si的分类。我们利用交叉熵损失去限制/>接近于/>来优化我们的网络参数。此外,注意力损失被定义为/> 其中FCcam表示全连接层的类激活映射,将网络注意力集中在脑组织上。
由于我们的数据集1中的P/N类的比例远离1,且有多种设备类型,我们采用了一种策略来平衡这个问题,以减少无用信息的影响。首先,我们计算所有装备中每种类别的最小数量N=Min{n(k,c)|k=1,2,3,4,5;c=0,1},其中k为设备类型, c为受试者的标签。然后,我们以N为标准,在训练处理过程中对每种设备的每个时间点的每个标签上的数据进行采样。换句话说,通过上述操作,我们在不平衡的数据集1中,实现了标签(P/N)和设备类型的平衡。
在测试时,每个受试者的测试数据集(包括数据集1和数据集2)的所有切片都被输入到训练好的网络中。取一个阈值(我们选择0.5),如果至少有一个切片是正的,则认为整个图像是正的。如果所有的切片都是负的,那么图像就是负的。
在一个实施例中,临床全脑MRI扫描信号,包括T1WI和T2WI。
在一个实施例中,在所有数据都是层厚大于6mm的情况下,切片之间的相关性几乎是不可见的。相对于对GPU内存要求较高的3D patch和x、y、z不同倍数的下采样,2D slice对内存的要求更低,每次迭代都可以将整个slice送入网络,使得每个slice的全局信息能够被合理的消耗。因此,我们在医学图像领域中选择基于切片而不是普通的3D patch来训练我们的模型,获取精神障碍的特征。
在一个实施例中,此外,我们将数据集1按照标签和厂商的比例,以8:2的比例打乱顺序并分为训练集和测试集,以保持训练集和测试集的分布一致。测试集是用于评估训练模型的图像集,数据集在训练过程中从未使用过。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。
Claims (7)
1.一种精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,包括以下步骤:
步骤S1、对多个受试者进行全脑MRI扫描,扫描数据包括T1WI和T2WI,受试者的T1WI和T2WI图像为DICOM的数据形式,图像处理均在联影工作站;
步骤S2、检查受试者的图像,以排除有明显脑异常或有图像伪影的受试者;
步骤S3、将DICOM文件存储格式的数据转换为NIFTI格式,保存在3D模型图像中;
步骤S4、用颅骨剥离工具去除骨体素以消除非组织的影响;
步骤S5、通过大脑分割包获得代表大脑半球信息的去颅骨的脑模板,以T1WI-nii、T2WI-nii及相应的脑模板作为卷积神经网络模型的输入;
步骤S6、基于问卷在患者级标记,以弱监督的方式训练分类模型,移除所述分类模型中对图像类别置信分数贡献度低的特征通道及其对应的滤波器,降低模型冗余度,压缩模型的同时保持模型性能;所述分类模型的训练通过MIL方案训练的两阶段方法,包括切片级分类器和患者级分类器;所述切片级分类器将三维模型图像分成一系列切片,每个切片完全包含在单个图像中;每个图像来自数据集S={si:i=1,2,…,n},给定切片策略,组成数据包数据包/>包含了所有切片;设置每个受试者的切片数,作为使用脑模板的MIL的袋大小mi;同时,通过对侧区域比较检测异常的策略,增强对异常脑区的识别,并对是否包含精神病相关异常类别进行分类;使用多个连续的下行块来提取每个切片的特征,其中包括两个卷积层、批处理归一化层、线性整流函数、最大池化层;然后采用全连接层在切片级上利用压缩的特征图生成分类结果;
步骤S7、继续以弱监督的方式训练分类模型,并对训练后的分类模型进行检验。
2.根据权利要求1所述的精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,所述分类模型将特征通道作为掩码反作用于输入图像,不同特征通道对正样本图像分类准确度的促进或抑制程度不同,所述分类模型判别不同特征通道和滤波器的重要性。
3.根据权利要求1所述的精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,压缩模型包括以下步骤:
步骤S61:选择任务数据集及待压缩模型;
步骤S62:选取正样本图像输入模型,获得各层输出特征图;
步骤S63:根据分类模型输出的通道重要性置信分数,预设通道重要性置信分数阈值,移除重要程度低于预设通道重要性置信分数阈值的通道重要性置信分数;
步骤S64:微调压缩后的分类模型,使其恢复精度。
4.根据权利要求3所述的精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,步骤S61包括以下步骤:
步骤S611:给定图像分类数据集D和待压缩的卷积神经网络模型,训练一个卷积神经网络分类模型;
步骤S612:选取合适的超参数和优化器,迭代地训练模型,直到模型收敛并在图像分类数据集D上获得较高的分类准确率时,保存训练好的模型M。
6.根据权利要求1所述的精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,所述分类模型包括一个切片级分类器和一个患者级分类器。
7.根据权利要求6所述的精神障碍类磁共振图像初步筛查模型构建方法,其特征在于,每个受试者的切片数为23,使用4个连续的下行块来提取每个切片的特征。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210389137.5A CN114926396B (zh) | 2022-04-13 | 2022-04-13 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
PCT/CN2023/093581 WO2023198224A1 (zh) | 2022-04-13 | 2023-05-11 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210389137.5A CN114926396B (zh) | 2022-04-13 | 2022-04-13 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114926396A CN114926396A (zh) | 2022-08-19 |
CN114926396B true CN114926396B (zh) | 2023-06-20 |
Family
ID=82807121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210389137.5A Active CN114926396B (zh) | 2022-04-13 | 2022-04-13 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114926396B (zh) |
WO (1) | WO2023198224A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114926396B (zh) * | 2022-04-13 | 2023-06-20 | 四川大学华西医院 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
CN117894057B (zh) * | 2024-03-11 | 2024-06-04 | 浙江大学滨江研究院 | 用于情感障碍辅助诊断的三维数字人脸处理方法与装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104519960A (zh) * | 2012-08-22 | 2015-04-15 | 美敦力公司 | 超声诊断和治疗管理系统及相关联的方法 |
US10853449B1 (en) * | 2016-01-05 | 2020-12-01 | Deepradiology, Inc. | Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3235427A1 (en) * | 2016-04-21 | 2017-10-25 | CodeBox Computerdienste GmbH | Method and system for estimating a location of an epileptogenic zone of a mammalian brain |
CN108288270B (zh) * | 2018-02-05 | 2022-06-03 | 南京邮电大学 | 一种基于通道修剪与全卷积深度学习的目标检测方法 |
CN108922599A (zh) * | 2018-06-27 | 2018-11-30 | 西南交通大学 | 一种基于mil的医学图像病灶点精确标注方法 |
CN113015977A (zh) * | 2018-06-29 | 2021-06-22 | 人工智能技术公司 | 使用自然语言处理的对疾病和病症的基于深度学习的诊断和转诊 |
WO2020086729A1 (en) * | 2018-10-23 | 2020-04-30 | Blackthorn Therapeutics, Inc. | Systems and methods for screening, diagnosing, and stratifying patients |
CN109359403B (zh) * | 2018-10-29 | 2023-04-18 | 上海市同济医院 | 一种基于面孔表情识别磁共振成像的精神分裂症早期诊断模型及其应用 |
CN110147834A (zh) * | 2019-05-10 | 2019-08-20 | 上海理工大学 | 基于稀疏化双线性卷积神经网络的细粒度图像分类方法 |
CN111047594B (zh) * | 2019-11-06 | 2023-04-07 | 安徽医科大学 | 肿瘤mri弱监督学习分析建模方法及其模型 |
CN110992351B (zh) * | 2019-12-12 | 2022-08-16 | 南京邮电大学 | 基于多输入卷积神经网络的sMRI图像分类方法和装置 |
WO2022051290A1 (en) * | 2020-09-02 | 2022-03-10 | Genentech, Inc. | Connected machine-learning models with joint training for lesion detection |
CN112529042B (zh) * | 2020-11-18 | 2024-04-05 | 南京航空航天大学 | 一种基于双重注意力多示例深度学习的医学图像分类方法 |
CN112674720B (zh) * | 2020-12-24 | 2022-03-22 | 四川大学 | 基于3d卷积神经网络的阿尔茨海默症的预判断方法 |
CN114926396B (zh) * | 2022-04-13 | 2023-06-20 | 四川大学华西医院 | 一种精神障碍类磁共振图像初步筛查模型构建方法 |
-
2022
- 2022-04-13 CN CN202210389137.5A patent/CN114926396B/zh active Active
-
2023
- 2023-05-11 WO PCT/CN2023/093581 patent/WO2023198224A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104519960A (zh) * | 2012-08-22 | 2015-04-15 | 美敦力公司 | 超声诊断和治疗管理系统及相关联的方法 |
US10853449B1 (en) * | 2016-01-05 | 2020-12-01 | Deepradiology, Inc. | Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis |
Also Published As
Publication number | Publication date |
---|---|
WO2023198224A1 (zh) | 2023-10-19 |
CN114926396A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Esmaeilzadeh et al. | End-to-end Parkinson disease diagnosis using brain MR-images by 3D-CNN | |
CN112101451B (zh) | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 | |
Rajini et al. | Computer aided detection of ischemic stroke using segmentation and texture features | |
CN114926396B (zh) | 一种精神障碍类磁共振图像初步筛查模型构建方法 | |
CN113768519B (zh) | 基于深度学习和静息态脑电数据分析病人意识水平的方法 | |
CN114693961A (zh) | 眼底照片分类方法、眼底图像处理方法和系统 | |
CN115330748A (zh) | 脑图像处理方法、计算机设备和存储介质 | |
CN115272295A (zh) | 基于时域-空域联合状态的动态脑功能网络分析方法及系统 | |
CN113796877A (zh) | 脑卒中预测值获取方法、装置及存储介质 | |
Tiwari et al. | Optimized ensemble of hybrid rnn-gan models for accurate and automated lung tumour detection from ct images | |
Ramachandran et al. | Mutual informative MapReduce and minimum quadrangle classification for brain tumor big data | |
Bhat et al. | Identification of intracranial hemorrhage using ResNeXt model | |
Abdullah et al. | A new procedure for lung region segmentation from computed tomography images | |
JP7413295B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN117727441A (zh) | 基于临床-融合影像计算机模型预测肺癌免疫疗效方法 | |
CN112766333B (zh) | 医学影像处理模型训练方法、医学影像处理方法及装置 | |
CN114550930A (zh) | 疾病预测方法、装置、设备及存储介质 | |
Wijerathna et al. | Brain Tumor Detection Using Image Processing | |
Akella et al. | A novel hybrid model for automatic diabetic retinopathy grading and multi-lesion recognition method based on SRCNN & YOLOv3 | |
CN112420190A (zh) | 一种人工智能辅助诊疗系统及其构建方法 | |
Varghese et al. | Discrimination between Alzheimer’s disease, mild cognitive impairment and normal aging using ANN based MR brain image segmentation | |
Baiju et al. | Glaucoma and diabetic retinopathy diagnosis using image mining | |
Ahmad et al. | Deep learning based mitosis detection for breast cancer prognosis | |
Jadhav et al. | Comparative Study of breast cancer detection methods | |
Yumuş et al. | Deep Convolutional Neural Networks Using SegNet for Automatic Spinal Canal Segmentation in Axial MRI |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |