CN106683081B - 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 - Google Patents
基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 Download PDFInfo
- Publication number
- CN106683081B CN106683081B CN201611171958.2A CN201611171958A CN106683081B CN 106683081 B CN106683081 B CN 106683081B CN 201611171958 A CN201611171958 A CN 201611171958A CN 106683081 B CN106683081 B CN 106683081B
- Authority
- CN
- China
- Prior art keywords
- features
- glioma
- grayscale value
- gray
- idh1
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000003147 molecular marker Substances 0.000 title claims abstract description 18
- 201000007983 brain glioma Diseases 0.000 title abstract description 9
- 206010018338 Glioma Diseases 0.000 claims abstract description 31
- 208000032612 Glial tumor Diseases 0.000 claims abstract description 30
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 30
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 25
- 210000004556 brain Anatomy 0.000 claims abstract description 18
- 230000011218 segmentation Effects 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 13
- 230000002068 genetic effect Effects 0.000 claims abstract description 10
- 238000003384 imaging method Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 7
- 238000012706 support-vector machine Methods 0.000 claims abstract description 3
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 claims abstract 7
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 claims abstract 7
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 claims abstract 7
- 238000000605 extraction Methods 0.000 claims description 26
- 238000003709 image segmentation Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 238000010832 independent-sample T-test Methods 0.000 claims description 6
- 238000012805 post-processing Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims description 4
- 230000035945 sensitivity Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 239000000084 colloidal system Substances 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000004195 computer-aided diagnosis Methods 0.000 abstract description 2
- 238000003759 clinical diagnosis Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 12
- 230000035772 mutation Effects 0.000 description 8
- 208000030173 low grade glioma Diseases 0.000 description 7
- 208000005017 glioblastoma Diseases 0.000 description 5
- 101000960235 Dictyostelium discoideum Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 208000029824 high grade glioma Diseases 0.000 description 2
- 201000011614 malignant glioma Diseases 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 101150020771 IDH gene Proteins 0.000 description 1
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 description 1
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011127 radiochemotherapy Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
本发明属于计算机辅助诊断技术领域,具体为一种基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统。本发明首先采用基于卷积神经网络的三维磁共振图像自动分割方法;对分割得到的肿瘤配准到标准脑图集,获取肿瘤分布的116个位置特征;通过计算得到分割肿瘤的21个灰度特征,15个形状特征,39个纹理特征;并对灰度特征和纹理特征进行三维小波分解得到8个子带的480个小波特征;最终从每个病例的三维T2‑Flair磁共振图像中获取671个高通量特征;采用p值筛选、遗传算法结合的特征筛选策略获得与IDH1高度相关的110个特征;采用支持向量机和AdaBoost分类器得到对IDH1预测精度为80%的分类。本发明作为影像组学新方法,为胶质瘤的临床诊断提供重要分子标记物的无损预测方案。
Description
技术领域
本发明属于计算机辅助诊断技术领域,具体为基于影像组学(Radiomics)的脑胶质瘤分子标记物无损预测方法和预测系统。
背景技术
胶质瘤是最常见的脑部恶性肿瘤,其中约30%为低级别胶质瘤(LGG,WHO分级I和II级)。尽管低级别胶质瘤有相对较好预后,但几乎所有的低级别胶质瘤都会发展为具有高死亡率的高级别胶质瘤。与胶质母细胞瘤(GBM,WHO IV级)相比,对LGG的基因表达分析和理解的研究相对欠缺。
IDH1(异柠檬酸脱氢酶1)具有显著的诊断、预后、预测价值,是胶质瘤中最重要的分子标记物[1]。大多数的较低级别胶质瘤(WHO II级和III级)及继发性的GBM都存在IDH1突变,而原发性的GBM中较少观察到IDH1突变;IDH1独立于常规预后指标与较长无进展生存期有关,含有IDH基因突变的高级别胶质瘤有显著较好预后;IDH1突变和1p/19q共缺失的低级别胶质瘤对放化疗敏感;IDH1野生型的低级别胶质瘤在分子及临床表现上与胶质母细胞瘤相似;IDH1突变的病人实施最大化切除可获得生存期的增加,因此IDH1突变可指导最大化肿瘤切除。正因为IDH1的重要临床价值,胶质瘤IDH1状态的评估无疑具有重要意义。现在临床上IDH1状态评估主要是通过获取肿瘤组织后进行基因测序得到。
无损IDH1状态的预测将极大的帮助临床进行胶质瘤的早期诊断和治疗方案制定。作为新兴的医学影像处理技术,影像组学通过从医学影像中自动提取高通量的图像特征,挖掘和建立图像特征和基因、蛋白、代谢、生理等指标的关联[2]。近期,影像组学已经应用在肺癌、乳腺癌、前列腺癌、头颈癌的分子分型、肿瘤异质性、肿瘤检测等的研究中,并取得了初步的成功。本发明的目的是设计一套从常规磁共振图像中提取高通量图像特征,进而得到以IDH1为例的分子标记物状态的标准化无损预测方法。
发明内容
本发明的目的是提出一种自动化、规范化的基于影像组学的脑胶质瘤分子标记物IDH1无损预测方法。
本发明构造的影像组学方法,框架如图1所示,包含了图像分割、配准、特征提取、特征筛选、分类决策等环节。
本发明提出的基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其步骤如下:
步骤一.图像分割
图像分割是影像组学中的关键和瓶颈问题,随着深度学习在图像处理领域的广泛应用,基于深度学习的医学影像自动分割显示出比传统方法更好的分割精度和鲁棒性。本发明中,我们采用了基于卷积神经网络的磁共振影像分割方法,在文献[3]报道方法的基础上进行了网络结果的调整,将磁共振图像的三维信息引入到传统二维CNN图像分割中,将全连接的条件随机场(CRF)被作为后处理环节加入到分割方法中,使得网络对对比度低的低级别胶质瘤也有很好的分割效果。
本发明设计的CNN胶质瘤磁共振影像分割方法,具有如图2(a)所示的结构。CNN网络中包括4层卷积层,2层池化层,2层全连接层。文献[3]中的CNN的输入为二维图像,即为二维CNN。由于低级别胶质瘤较高级别胶质瘤具有更小的尺寸、更低的图像对比度,直接用[3]的方法分割结果欠理想,因此针对低级别胶质瘤的分割,对CNN结构做了如下调整。一是将临近层的磁共振图像信息送入CNN网络中,见图2(b),即将相邻层的信息引入到当前层的训练中,实现了输入信息的三维化,使得网络对体积较小的胶质瘤也能得到较好的分割结果;二是将全连接的条件随机场(CRF)被作为后处理环节加入到胶质瘤的图像分割中,使得网络对对比度低的低级别胶质瘤也有很好的分割效果。
通过前后两个环节的改进,使分割效果的Dice相似系数从原始CNN的0.76提高到0.85。
我们使用卷积神经网络和条件随机场结合来改进脑胶质瘤的图像分割。首先将包含肿瘤区域的脑部磁共振图像划分为若干个小块,以中心点的类别作为目标输入到卷积神经网络进行训练,使用随机梯度下降法使网络的权值反向传递,获得稳定的网络。
在测试的阶段,我们将整幅图像输入到网络之中,将最后一个全连接层之后的特征图进行上采样至输入的大小,以作为条件随机场的单元势函数。条件随机场利用单元势函数的信息进行若干次循环,获得最后准确的肿瘤区域。
条件随机场(CRF)后处理环节的具体实现为,先计算如下每个像素点的单元势函数:
θu(xi)=-log P(xi) (1)
其中,P(xi)是最后一个全连接层的特征图经过上采样,θu(xi)是获得能单元势函数:
其中,E(x)是条件随机场的能量函数,θp(xi+xj)是任意两个像素点i和j之间的势函数,通过以下计算获得:
其中,μp(xi+xj)是判断两个点是不是同一个点,不是得话则是1。之后为定义的势函数的核,可以由以下计算所得
式中,pi和Ii代表像素i在CNN网络中的位置和灰度。可以看出,前一项为两个像素点位置和灰度值之间差别的权值,后一项为对于位置的模糊项。ω为两项的权值,σ为两项的方差,这5个参数和条件随机场的循环次数会影响分割的准确性,需要从训练集训练获得。在CNN分割结果的基础上,每层中具有最大相似度的区域被标定为肿瘤区域。
步骤二.特征提取
位置特征提取。首先将分割后的肿瘤配准到标准脑图集,标准脑图集采用MN152(Montreal Neurological Institute(MNI)),配准方法采用MNI提供的SPM12软件;采用Anatomical Automatic Labeling(AAL)方法将标准脑图集划分为116个感兴趣区域AVOI(anatomical volumes of interest);对配准到MN152的胶质瘤,统计其落于116个AVOIs的情况,若肿瘤落在某个AVOI的体素量大于10则认为该胶质瘤在此AVOI,记为1,否则记为0。因此对每个病例可得到116个0和1相间的字符串表示该胶质瘤在全脑的分布情况;
对IDH1突变型和野生型胶质分别统计在全脑发生的情况,通过独立样本T检验和U检验(Independent-samples T test and Mann-Whitney U test)统计两类胶质瘤位置分布的统计差异;将每个病例的位置分布表作为116个位置特征用于后继的影像组学(Radiomics)分析。
除了116个位置特征外,还提取了灰度特征21个,形状特征15个,纹理特征39个(这些特征的提取方法详见附录1)对灰度和纹理等60个特征进行三维小波分解,得到480个小波特征;共计671个特征。特征列表见表1。其中,各个特征的计算方法可参见[2],[4]-[6]。
上述高通量特征,共计671个,具体列表如下:
位置特征,共11个,统计肿瘤出现在AAL共116个分区的出现情况;
灰度特征,共21个,具体为:1)能量,2)直方图的熵,3)峰值,4)最大值,5)平均绝对误差,6)平均,7)中值,8)最小值,9)灰度范围,10)均方根,11)歪斜度,12)标准差,13)直方图均匀度,14)方差,15)高斯拟合的参数a,16)高斯拟合的参数b,17)高斯拟合的参数c,18)直方图均值,19)直方图方差,20)直方图歪斜度,21)直方图峰值。
形状特征,共15个,具体为:1)紧密度1,2)紧密度,3)最长距离,4)不对称度,5)类球度,6)表面积,7)表面积体积比,8)体积,9)面积边界框比,10)最长的椭圆长轴,11)最短的椭圆短轴,12)离心率,13)方向,14)紧致度,15)傅里叶描述子。
纹理特征,共39个,其中:
灰度共生矩阵,有8个,具体为:1)能量,2)对比度,3)相关度,4)同质性,5)方差,6)平均值之和,7)熵,8)不同度;
灰度行程矩阵,有13个,具体为:11)灰度不均匀性,12)长线不均匀性,13)长线百分比,14)低灰度值的线度量,15)高灰度值的线长度,16)短线的低灰度值的线度量,17)短线的高灰度值的线度量,18)长线的低灰度值的线度量,19)长线的高灰度值的线度量,20)灰度值方差,21)长线方差;
灰度区域大小矩阵,有13个,具体为:22)小区块度量,23)大区块度量,24)灰度不均匀性,25)区块不均匀性,26)区块百分比,27)低灰度值的区块度量,28)高灰度值的区块度量,29)小区域的低灰度值的区块度量,30)小区域的高灰度值的区块度量,31)大区域的低灰度值的区块度量,32)大区域的高灰度值的区块度量,33)灰度值方差,34)区块大小方差;
领域灰度矩阵,有5个,具体为:35)粗糙度,36)对比度,37)忙碌度,38)复杂度,39)强度;
小波,共480个,为小波三个方向的8个高频低频分量。
步骤三.特征筛选
671个高通量特征中,许多特征间是高度相关的冗余特征,若将这些特征直接用于IDH1的预测将会造成分类器的过敏感。本发明中,采用两步特征筛选法进行特征选择。第一步,基于独立样本t检验,选出p<0.05即有统计差异的特征,此步骤中共选择特征197个;第二步,采用改进的遗传算法对197个特征进行进一步筛选,得到110个特征。遗传算法[7]从随机产生的一群初始解开始搜索,种群中的个体称为染色体,每个染色体都是优化问题的一个解。通过模拟染色体的选择、交叉、变异,按照优胜劣汰的机制不断产生后代种群。选择策略的优劣直接决定了后代种群的性能,通常需要一个适应度函数对染色体的优劣程度进行评价,传统的适应度函数将分类的准确率作为标准。若仅采用分类准确率作为适应度函数,则会由于特征间的强相关性、冗余性造成搜索不到最优解。为了解决这个问题,本发明中提出一种基于最小冗余-最大相关(minimal-redundancy-maximal-relevance,mRMR)准则的适应度函数。在特征空间Ω内,已选特征子集S内特征间的最小冗余定义为:
其中,S代表特征子集的集合,I(di;dj)表示特征di与特征dj之间的互信息,m为特征子集的大小。S与目标类别c间的最大相关定义为:
其中,c为目标类别,I(di;c)为特征di与类别c之间的互信息。
则mRMR准则定义为:
即用选择最小冗余减去最大相关的最大值作为选择标准,将特征空间的若干个特征进行排序。
基于mRMR准则的适应度函数定义为:
其中,Accuracy为使用S所获得的分类准确率,Rank表示所选择特征的mRMR排序值之和。
步骤四.分类判决
将遗传算法选出的110个特征送入分类器进行IDH1状态预测,分类器采用经典的支持向量机和AdaBoost算法进行分类。
本发明采用留一法交叉验证(Leave-one-out cross-validation,LOOCV)作为验证模型,为全面评价Radiomics方法的IDH1预测性能,奔放没采用七个量化指标对预测性能进行定量化评价,分别为:准确度(accuracy,ACC)、敏感度(sensitivity,SENS)、特异度(specificity,SPEC)、阳性预测值(positive predictive value,PPV)、阴性预测值(negative predictive value,NPV)、Matthew相关系数(Matthew’s correlationcoefficient,MCC);另外,ROC曲线下的面积(area under the ROC curve,AUC)作为整体评估准则。各指标计算方法见附录2。
对应于上述胶质瘤分子标记物IDH1无损预测方法,本发明还构建了基于影像组学的胶质瘤分子标记物IDH1无损预测系统,其包括四个模块:图像分割模块,特征提取模块,特征筛选模块,分类判决模块,分别用于执行预测方法的图像分割、特征提取、特征筛选、分类判决四个步骤的操作运算;其中,图像分割模块包括上述公式(1)-(4)等的运算;特征提取模块分为位置提取子模块,灰度特征提取子模块,形状特征提取子模块,纹理特征提取子模块,小波分解计算子模块,分别用于执行置特征提取、灰度特征提取、形状特征提取、纹理特征提取、小波分解计算的操作运算;这些子模块中包含附录1中对应的计算公式。
本发明设计了一套从常规磁共振图像中提取高通量图像特征,进而得到分子标记物状态的标准化方法,从图像分割、特征提取、特征筛选、分类判决四个步骤设计了行之有效的解决方案,最终以IDH1预测为例获得了胶质瘤分子标记物的无损预测。
附图说明
图1、本发明提出Radiomics方法的流程图。
图2、(a)图像分割所用的改进卷积神经网络算法框图,(b)三维信息引入CNN示意图。
图3、76例IDH1突变和34例IDH1野生型的肿瘤在标准脑图集上叠加的结果。
图4、两类肿瘤位置分布差异显著区域。
图5、110例病例671个特征的无监督聚类热图。
图6、两分类器IDH1预测的ROC曲线图。
具体实施方式
以下是整个算法的具体实现步骤:
1、首先对原始图像进行去脑壳、灰度归一化等操作,对30例240片次公正图像进行手工标注作为CNN的训练集,将图像划分我32*32的小块送入网络进行训练。
2、采用图2所示的CNN对图像进行分割,随后用CRF能量随机场对分割结果进行调整。
3、将分割好的肿瘤用SPM12映射到标准脑图集MN152,对76例IDH1突变和34例IDH1野生型肿瘤在标准脑图集上进行分别叠加,将叠加结果划分为AAL116个分区,统计两类肿瘤在116个分区上的分布作为116个位置特征。
4、分别提取表一中所示的灰度、形状、纹理、小波特征共555个,加上116个位置特征,对每个病例共计提取671个特征。
5、对671个特征进行独立样本t检验,去除p>0.05的不显著特征;用改进遗传算法对筛选出的197个特征再进行筛选,最终得到110个特征。
6、基于110个特征,用SVM和Adaboost算法对IDH1进行预测,采用LOOCV留一法作为交叉验证法,统计预测准确度、灵敏度、特异性等8个指标。
结果分析
图3给出了76例IDH1突变和34例IDH1野生型的肿瘤在标准脑图集上叠加的结果,可见两类肿瘤在位置分布上有明显不同。将标准脑图划分为116个AAL分区后,两类肿瘤在第14,40,68,70和88个分区上有明显差异,五个区域的示意图见图4。
图5给出了110例病例671个特征的无监督聚类热图,图顶部蓝色和黄色分别表示特征无监督聚类效果,红色和绿色分别表示真实的IDH1状态,可见高通量特征与IDH1状态有强相关性。
表2给出了SVM和Adaboost分类器在不同特征数量下用留一法交叉验证得到对IDH1预测的结果。可见本发明提出的Radiomics方法能得到准确率为80%的IDH1预测,ROC曲线下面积达到86%。图6给出了两个分类器的ROC曲线图。
表2.两种分类算法在不同特征数量下的预测效果
附录1:
灰度特征:
1)能量
其中,N为图像体素的全部,X为像素点的灰度值。
2)直方图的熵
其中P为灰度值分布在直方图的区间Nl的数目。
3)峰值
5)均值
10)均方根
11)歪斜度
12)标准差
13)直方图的均匀度
14)方差
形状特征:
1)紧密度1
其中,V为肿瘤的体积,A为肿瘤的表面积。
2)紧密度2
4)不对称度
其中,R为肿瘤拟合的椭圆。
5)类球度
7)表面积体积比
纹理特征
灰度共生矩阵
1)能量
其中,p(i,j)为灰度共生矩阵,由以下定义:
其中,P(i,j)为灰度值i和灰度值j在三维空间的连接数,Ng为灰度值的总数。
2)对比度
3)相关度
其中,μi和μj为i和j的加权和。
4)同质性
5)方差
6)平均值之和
7)熵
8)不同度
灰度行程矩阵
9)短线度量
其中,p(i,j)为灰度行程矩阵,由以下定义:
其中,P(i,j)为长度为j的灰度值i的数目,Ng为灰度值的总数,Lr为长度的总数。
10)长线度量
11)灰度不均匀性
12)长线不均匀性
13)长线百分比
14)低灰度值的线度量
15)高灰度值的线长度
16)短线的低灰度值的线度量
17)短线的高灰度值的线度量
18)长线的低灰度值的线度量
19)长线的高灰度值的线度量
20)灰度值方差
其中,μi为i的加权和,类似的
21)长线方差
其中,μj为j的加权和,
灰度区域大小矩阵
22)小区块度量
其中,p(i,j)为灰度区域大小矩阵,由以下定义:
其中,P(i,j)为面积为j的灰度值i的数目,Ng为灰度值的总数,Lr为面积的总数。
23)大区块度量
24)灰度不均匀性
25)区块不均匀性
26)区块百分比
27)低灰度值的区块度量
28)高灰度值的区块度量
29)小区域的低灰度值的区块度量
30)小区域的高灰度值的区块度量
31)大区域的低灰度值的区块度量
32)大区域的高灰度值的区块度量
33)灰度值方差
其中,μi为i的加权和,类似的
34)区块大小方差
其中,μj为j的加权和,
领域灰度矩阵
35)粗糙度
其中,ε是一个很小的值,P(i)是灰度值i在三维空间的总和,
36)对比度
37)忙碌度
38)复杂度
39)强度
附录2:
其中,TP,FP,TN和FN分别代表了正确阳性,错误阳性,正确阴性和错误阴性代表的数目。
参考文献
[1]Weller M,Pfister SM,Wick W,Hegi ME,Reifenberger G,Stupp R(2013)Molecular neuro-oncology in clinical practice:a new horizon.Lancet Oncol.DOI:10.1016/S1470-2045(13)70168-2.
[2]Aerts HJ,Velazquez ER,Leijenaar RT,et al(2014)Decoding tumourphenotype by noninvasive imaging using a quantitativeradiomicsapproach.NatCommun.DOI:10.1038/ncomms5006.
[3]Pereira S,Pinto A,Alves V,Silva CA(2016)Brain Tumor Segmentationusing Convolutional Neural Networks in MRI Images.IEEE Trans Med Imaging.DOI:10.1109/TMI.2016.2538465.
[4]Vallières M,Freeman CR,Skamene SR,ElNaqa I(2015)A radiomics modelfrom joint FDG-PET and MRI texture features for the prediction of lungmetastases in soft-tissue sarcomas of the extremities.Phys Med Biol.DOI:10.1088/0031-9155/60/14/5471.
[5]Collewet G,Strzelecki M,Mariette F(2004)Influence of MRIacquisition protocols and image intensity normalization methods on textureclassification.MagnReson Imaging.DOI:10.1016/j.mri.2003.09.001.
[6]Haralick RM,Shanmugam K,Dinstein I(1990)Textural features forimage classification.IEEE Trans Syst Man Cybern B Cybern.DOI:10.1109/TSMC.1973.4309314.
[7]DebK,Pratap A,AgarwalS,Meyarivan T.A fast and elitistmultiobjective genetic algorithm:NSGA-II.IEEE T.Evolutionary Computation,2002,6:182-197.。
Claims (3)
1.一种基于影像组学的胶质瘤分子标记物IDH1无损预测系统,其特征在于,包括四个模块:图像分割模块,特征提取模块,特征筛选模块,分类判决模块;其中:
所述图像分割模块,用于执行图像分割操作;具体采用基于卷积神经网络的磁共振影像分割方法,CNN网络中包括4层卷积层,2层池化层,2层全连接层,对CNN结构做了如下调整:一是将临近层的磁共振图像信息送入CNN网络中,即将相邻层的信息引入到当前层的训练中,实现输入信息的三维化,使得网络对体积较小的胶质瘤也能得到较好的分割结果;二是将全连接的条件随机场被作为后处理环节加入到胶质瘤的图像分割中,使得网络对对比度低的低级别胶质瘤也有很好的分割效果;
条件随机场后处理环节的具体实现为,将CNN的最后一个全连接层的输出作为P(xi),计算如下能量函数:
其中,θu(xi)=-logP(xi) (1)
任意两个像素间的势计算如下:
其中,核函数如下式所示:
式中,up(xi+xj)计算两点是否相似,pi和Ii代表像素i在CNN网络中的位置和灰度;在CNN分割结果的基础上,每层中具有最大相似度的区域被标定为肿瘤区域;
所述特征提取模块,包括位置特征提取子模块、灰度特征提取子模块、形状特征提取子模块、纹理特征提取子模块、小波分解计算子模块,分别用于执行位置特征提取、灰度特征提取、形状特征提取、纹理特征提取、小波分解计算的操作运算;其中:
位置特征提取,首先将分割后的肿瘤配准到标准脑图集,标准脑图集采用MN152,配准方法采用MNI提供的SPM12软件;采用AAL方法将标准脑图集划分为116个感兴趣区域AVOI;对配准到MN152的胶质瘤,统计其落于116个AVOI的情况,若肿瘤落在某个AVOI的体素量大于10则认为该胶质瘤在此AVOI,记为1,否则记为0;于是对每个病例得到116个0和1相间的字符串表示该胶质瘤在全脑的分布情况;
对IDH1突变型和野生型胶质分别统计在全脑发生的情况,通过独立样本T检验和U检验统计两类胶质瘤位置分布的统计差异;将每个病例的位置分布表作为116个位置特征用于后继的影像组学分析;
除了提取116个位置特征外,还提取灰度特征21个,形状特征15个,纹理特征39个,对灰度特征和纹理特征共60个特征进行三维小波分解,得到480个小波特征;共计671个特征,也称为高通量特征;
所述特征筛选模块,对上述671个高通量特征,采用两步特征筛选法进行特征选择:第一步,基于独立样本t检验,选出p<0.05即有统计差异的特征,此步骤中共选择特征197个;第二步,采用改进的遗传算法对197个特征进行进一步筛选,得到110个特征;
其中所述改进的遗传算法,是在原遗传算法中改用一种基于最小冗余-最大相关准则的适应度函数,具体如下:
在特征空间Ω内,已选特征子集S内特征间的最小冗余定义为:
S与目标类别c间的最大相关定义为:
则基于最大相关-最小冗余mRMR准则定义为:
基于基于最大相关-最小冗余mRMR准则的适应度函数定义为:
其中,Accuracy为使用S所获得的分类准确率,Rank表示所选择特征的mRMR排序值之和;
所述分类判决模块是一个分类器,由遗传算法选出的110个特征送入分类器进行IDH1状态预测,分类器采用经典的支持向量机和AdaBoost算法进行分类。
2.根据权利要求1所述的基于影像组学的胶质瘤分子标记物IDH1无损预测系统,其特征在于,所述671个特征列表如下:
位置特征,共116个,统计肿瘤在AAL的共116个分区中出现的情况;
灰度特征,共21个,具体为:1)能量,2)直方图的熵,3)峰值,4)最大值,5)平均绝对误差,6)平均,7)中值,8)最小值,9)灰度范围,10)均方根,11)歪斜度,12)标准差,13)直方图均匀度,14)方差,15)高斯拟合的参数a,16)高斯拟合的参数b,17)高斯拟合的参数c,18)直方图均值,19)直方图方差,20)直方图歪斜度,21)直方图峰值;
形状特征,共15个,具体为:1)紧密度1,2)紧密度,3)最长距离,4)不对称度,5)类球度,6)表面积,7)表面积体积比,8)体积,9)面积边界框比,10)最长的椭圆长轴,11)最短的椭圆短轴,12)离心率,13)方向,14)紧致度,15)傅里叶描述子;
纹理特征,共39个,其中:
灰度共生矩阵,有8个,具体为:1)能量,2)对比度,3)相关度,4)同质性,5)方差,6)平均值之和,7)熵,8)不同度;
灰度行程矩阵,有13个,具体为:11)灰度不均匀性,12)长线不均匀性,13)长线百分比,14)低灰度值的线度量,15)高灰度值的线长度,16)短线的低灰度值的线度量,17)短线的高灰度值的线度量,18)长线的低灰度值的线度量,19)长线的高灰度值的线度量,20)灰度值方差,21)长线方差;
灰度区域大小矩阵,有13个,具体为:22)小区块度量,23)大区块度量,24)灰度不均匀性,25)区块不均匀性,26)区块百分比,27)低灰度值的区块度量,28)高灰度值的区块度量,29)小区域的低灰度值的区块度量,30)小区域的高灰度值的区块度量,31)大区域的低灰度值的区块度量,32)大区域的高灰度值的区块度量,33)灰度值方差,34)区块大小方差;
领域灰度矩阵,有5个,具体为:35)粗糙度,36)对比度,37)忙碌度,38)复杂度,39)强度;
小波,共480个,为小波三个方向的8个高频低频分量。
3.根据权利要求2所述的基于影像组学的胶质瘤分子标记物IDH1无损预测系统,其特征采用采用留一法交叉验证LOOCV作为验证模型,并用七个量化指标对预测性能进行定量化评价,分别为:准确度、敏感度、特异度、阳性预测值、阴性预测值、Matthew相关系数,另外,ROC曲线下的面积作为整体评估准则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611171958.2A CN106683081B (zh) | 2016-12-17 | 2016-12-17 | 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611171958.2A CN106683081B (zh) | 2016-12-17 | 2016-12-17 | 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106683081A CN106683081A (zh) | 2017-05-17 |
CN106683081B true CN106683081B (zh) | 2020-10-30 |
Family
ID=58870778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611171958.2A Active CN106683081B (zh) | 2016-12-17 | 2016-12-17 | 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106683081B (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108961259B (zh) * | 2017-05-25 | 2022-03-18 | 复旦大学 | 基于静息态功能磁共振的大脑功能区对侧定位方法 |
CN109242816B (zh) * | 2017-07-07 | 2022-01-18 | 复旦大学 | 基于静息态脑功能对侧定位的脑胶质瘤病理级别影像学辅助判定方法 |
CN107545571A (zh) * | 2017-09-22 | 2018-01-05 | 深圳天琴医疗科技有限公司 | 一种图像检测方法及装置 |
WO2019078154A1 (ja) * | 2017-10-18 | 2019-04-25 | 株式会社ニコン | 画像処理装置、顕微鏡システム、画像処理方法、及び画像処理プログラム |
CN108109140A (zh) * | 2017-12-18 | 2018-06-01 | 复旦大学 | 基于深度学习的低级别脑胶质瘤柠檬酸脱氢酶无损预测方法及系统 |
CN107967495B (zh) * | 2017-12-21 | 2020-06-05 | 中科智文(北京)科技有限公司 | 一种铜镜文物识别系统和方法 |
CN108416360B (zh) * | 2018-01-16 | 2022-03-29 | 华南理工大学 | 基于乳腺钼靶钙化特征的癌症诊断系统及方法 |
CN108053417B (zh) * | 2018-01-30 | 2019-12-17 | 浙江大学 | 一种基于混合粗分割特征的3D U-Net网络的肺分割装置 |
CN108376565B (zh) * | 2018-02-13 | 2022-07-19 | 北京市神经外科研究所 | 一种脑胶质瘤Ki-67表达水平的影像组学预测方法 |
EP3761871A1 (en) | 2018-03-07 | 2021-01-13 | Institut National De La Sante Et De La Recherche Medicale - Inserm | Method for early prediction of neurodegenerative decline |
CN108897984A (zh) * | 2018-05-07 | 2018-11-27 | 上海理工大学 | 基于ct影像组学特征与肺癌基因表达间相关性分析方法 |
CN108815721B (zh) * | 2018-05-18 | 2021-06-25 | 山东省肿瘤防治研究院(山东省肿瘤医院) | 一种照射剂量确定方法及系统 |
CN108898160B (zh) * | 2018-06-01 | 2022-04-08 | 中国人民解放军战略支援部队信息工程大学 | 基于cnn和影像组学特征融合的乳腺癌组织病理学分级方法 |
CN109191425B (zh) * | 2018-07-23 | 2022-02-11 | 中国科学院自动化研究所 | 基于多层神经网络模型医学影像分析方法 |
CN109242879A (zh) * | 2018-08-16 | 2019-01-18 | 北京航空航天大学青岛研究院 | 基于深度卷积神经网络的脑部胶质瘤核磁图像分割方法 |
CN109559296B (zh) * | 2018-10-08 | 2020-08-25 | 广州市大智网络科技有限公司 | 基于全卷积神经网络和互信息的医学图像配准方法及系统 |
CN109598266A (zh) * | 2018-10-24 | 2019-04-09 | 深圳大学 | 基于机器学习的下肢深静脉血栓溶栓疗效预测方法及系统 |
CN109271969B (zh) * | 2018-10-29 | 2020-03-24 | 北京青燕祥云科技有限公司 | 一种脑胶质瘤分级评价方法及其装置 |
CN109840554B (zh) * | 2018-12-26 | 2023-05-02 | 贵州联科卫信科技有限公司 | 一种基于svm-rfe-mrmr算法的阿兹海默症mri图像分类方法 |
CN109994155B (zh) * | 2019-03-29 | 2021-08-20 | 北京市商汤科技开发有限公司 | 一种基因变异识别方法、装置和存储介质 |
CN110136155B (zh) * | 2019-05-19 | 2022-10-21 | 绵阳逢研科技有限公司 | 一种图案边缘轨迹智能提取方法及其应用 |
CN110097921B (zh) * | 2019-05-30 | 2023-01-06 | 复旦大学 | 基于影像组学的胶质瘤内基因异质性可视化定量方法和系统 |
CN110458223B (zh) * | 2019-08-06 | 2023-03-17 | 湖南省华芯医疗器械有限公司 | 一种内镜下支气管肿瘤自动检测方法及检测系统 |
CN110838173B (zh) * | 2019-11-15 | 2023-06-02 | 天津医科大学 | 基于三维纹理特征的个体化脑共变网络构建方法 |
CN111008842B (zh) * | 2019-11-19 | 2023-08-25 | 中冶赛迪工程技术股份有限公司 | 一种茶叶检测方法、系统、电子设备及机器可读介质 |
CN111027548B (zh) * | 2019-12-06 | 2024-03-05 | 中国人民解放军第四军医大学 | 基于影像组学的脑胶质瘤分子标记物无损预测方法、系统 |
CN111292304A (zh) * | 2020-01-22 | 2020-06-16 | 青岛大学附属医院 | 一种基于深度神经网络的胰腺肿瘤病理自动诊断系统 |
CN111462116A (zh) * | 2020-05-13 | 2020-07-28 | 吉林大学第一医院 | 基于影像组学特征的多模态参数模型优化融合方法 |
CN111832563A (zh) * | 2020-07-17 | 2020-10-27 | 江苏大学附属医院 | 一种基于超声图像的智能化乳腺肿瘤辨别方法 |
CN112037167B (zh) * | 2020-07-21 | 2023-11-24 | 苏州动影信息科技有限公司 | 一种基于影像组学和遗传算法的目标区域确定系统 |
CN112561904A (zh) * | 2020-12-24 | 2021-03-26 | 凌云光技术股份有限公司 | 一种降低显示屏外观aoi缺陷误检率的方法及系统 |
CN112768072B (zh) * | 2021-01-12 | 2023-03-24 | 哈尔滨医科大学 | 基于影像组学定性算法构建癌症临床指标评估系统 |
CN113222887A (zh) * | 2021-03-03 | 2021-08-06 | 复旦大学附属华山医院 | 基于深度学习的纳米铁标记神经干细胞示踪的方法 |
CN114638875A (zh) * | 2022-05-23 | 2022-06-17 | 武汉依迅北斗时空技术股份有限公司 | 基于区域均匀度的立体匹配优化方法、装置、设备及介质 |
CN115062165B (zh) * | 2022-08-18 | 2022-12-06 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 基于读片知识图谱的医学影像诊断方法及装置 |
CN117711579A (zh) * | 2024-02-02 | 2024-03-15 | 首都医科大学宣武医院 | 基于多模态影像的脑胶质瘤病理可视化方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881686A (zh) * | 2015-05-28 | 2015-09-02 | 重庆大学 | 基于脑磁共振影像的Aβ蛋白沉积信息检测系统 |
CN105046692A (zh) * | 2015-07-01 | 2015-11-11 | 复旦大学 | 结合感兴趣区域和GrowCut算法的3D自动脑胶质瘤分割方法 |
CN106157307A (zh) * | 2016-06-27 | 2016-11-23 | 浙江工商大学 | 一种基于多尺度cnn和连续crf的单目图像深度估计方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9558268B2 (en) * | 2014-08-20 | 2017-01-31 | Mitsubishi Electric Research Laboratories, Inc. | Method for semantically labeling an image of a scene using recursive context propagation |
-
2016
- 2016-12-17 CN CN201611171958.2A patent/CN106683081B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881686A (zh) * | 2015-05-28 | 2015-09-02 | 重庆大学 | 基于脑磁共振影像的Aβ蛋白沉积信息检测系统 |
CN105046692A (zh) * | 2015-07-01 | 2015-11-11 | 复旦大学 | 结合感兴趣区域和GrowCut算法的3D自动脑胶质瘤分割方法 |
CN106157307A (zh) * | 2016-06-27 | 2016-11-23 | 浙江工商大学 | 一种基于多尺度cnn和连续crf的单目图像深度估计方法 |
Non-Patent Citations (3)
Title |
---|
Exploiting Deep Convolutional Network and Patch-level CRFs for Indoor Semantic Segmentation;Xingming Wu 等;《IEEE》;20161024;第150-155页 * |
Semantic Image Segmentation with Task-Specific Edge Detection Using CNNs and a Discriminatively Trained Domain Transform;Liang-Chieh Chen 等,;《IEEE》;20161212;第4545-4554页 * |
SparkCRF:一种基于Spark的并行CRFs算法实现;朱继召 等;《计算机研究与发展》;20160831;第1819-1828页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106683081A (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106683081B (zh) | 基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统 | |
CN108492297B (zh) | 基于深度级联卷积网络的mri脑肿瘤定位与瘤内分割方法 | |
Gupta et al. | Analysis of histopathological images for prediction of breast cancer using traditional classifiers with pre-trained CNN | |
Ertosun et al. | Automated grading of gliomas using deep learning in digital pathology images: a modular approach with ensemble of convolutional neural networks | |
CN104751178B (zh) | 基于形状模板匹配结合分类器的肺结节检测装置及方法 | |
CN114730463A (zh) | 用于组织图像分类的多实例学习器 | |
CN113316823A (zh) | 基于多模态机器学习的临床预测器 | |
Cooper et al. | An integrative approach for in silico glioma research | |
Li et al. | Lung nodule detection with deep learning in 3D thoracic MR images | |
CN110097921B (zh) | 基于影像组学的胶质瘤内基因异质性可视化定量方法和系统 | |
US20220237789A1 (en) | Weakly supervised multi-task learning for cell detection and segmentation | |
CN109191422B (zh) | 基于常规ct图像的缺血性脑卒中早期检测系统和方法 | |
Qu et al. | An experimental study of data heterogeneity in federated learning methods for medical imaging | |
Chapala et al. | ResNet: detection of invasive ductal carcinoma in breast histopathology images using deep learning | |
Kothari et al. | Histological image feature mining reveals emergent diagnostic properties for renal cancer | |
CN115496720A (zh) | 基于ViT机制模型的胃肠癌病理图像分割方法及相关设备 | |
Behar et al. | ResNet50-Based Effective Model for Breast Cancer Classification Using Histopathology Images. | |
Tan et al. | Applying machine learning for integration of multi-modal genomics data and imaging data to quantify heterogeneity in tumour tissues | |
Saha et al. | A new line symmetry distance based automatic clustering technique: application to image segmentation | |
Kumar et al. | Genetic Algorithm Based Feature Selection Brain Tumour Segmentation and Classification. | |
CN115985503B (zh) | 基于集成学习的癌症预测系统 | |
Xiang et al. | Segmentation method of multiple sclerosis lesions based on 3D‐CNN networks | |
González et al. | Deep convolutional neural network to predict 1p19q co-deletion and IDH1 mutation status from MRI in low grade gliomas | |
Ma et al. | Automatic pulmonary ground‐glass opacity nodules detection and classification based on 3D neural network | |
CN113889235A (zh) | 一种三维医学影像无监督特征抽取系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20170517 Assignee: Minge (Shanghai) Information Technology Co.,Ltd. Assignor: FUDAN University Contract record no.: X2023310000172 Denomination of invention: Non destructive prediction method and prediction system for molecular markers of glioma based on imaging omics Granted publication date: 20201030 License type: Exclusive License Record date: 20231211 |
|
EE01 | Entry into force of recordation of patent licensing contract |