CN116385441B - 一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 - Google Patents
一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 Download PDFInfo
- Publication number
- CN116385441B CN116385441B CN202310656698.1A CN202310656698A CN116385441B CN 116385441 B CN116385441 B CN 116385441B CN 202310656698 A CN202310656698 A CN 202310656698A CN 116385441 B CN116385441 B CN 116385441B
- Authority
- CN
- China
- Prior art keywords
- image
- histology
- features
- mri
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010133 Oligodendroglioma Diseases 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013517 stratification Methods 0.000 title claims abstract description 27
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 59
- 230000008236 biological pathway Effects 0.000 claims abstract description 40
- 238000004393 prognosis Methods 0.000 claims abstract description 38
- 230000004186 co-expression Effects 0.000 claims abstract description 30
- 238000003012 network analysis Methods 0.000 claims abstract description 28
- 238000010199 gene set enrichment analysis Methods 0.000 claims abstract description 27
- 238000012163 sequencing technique Methods 0.000 claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 238000003384 imaging method Methods 0.000 claims description 41
- 238000004458 analytical method Methods 0.000 claims description 38
- 230000007170 pathology Effects 0.000 claims description 27
- 230000004083 survival effect Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 20
- 230000037361 pathway Effects 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 8
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000000556 factor analysis Methods 0.000 claims description 6
- 238000001325 log-rank test Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000012314 multivariate regression analysis Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 abstract description 21
- 238000011282 treatment Methods 0.000 abstract description 12
- 230000007321 biological mechanism Effects 0.000 abstract description 10
- 238000010191 image analysis Methods 0.000 abstract description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 81
- 206010028980 Neoplasm Diseases 0.000 description 25
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 15
- 230000035772 mutation Effects 0.000 description 14
- 238000012217 deletion Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000003559 RNA-seq method Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000011331 genomic analysis Methods 0.000 description 8
- 206010018338 Glioma Diseases 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 210000003169 central nervous system Anatomy 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000001575 pathological effect Effects 0.000 description 6
- 230000002308 calcification Effects 0.000 description 5
- 238000010988 intraclass correlation coefficient Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 102000012011 Isocitrate Dehydrogenase Human genes 0.000 description 3
- 108010075869 Isocitrate Dehydrogenase Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 230000002980 postoperative effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000002491 angiogenic effect Effects 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010201 enrichment analysis Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000013427 histology analysis Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 238000002075 inversion recovery Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 208000030173 low grade glioma Diseases 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000004797 therapeutic response Effects 0.000 description 2
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 229910052688 Gadolinium Inorganic materials 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000011226 adjuvant chemotherapy Methods 0.000 description 1
- 238000011353 adjuvant radiotherapy Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004791 biological behavior Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002872 contrast media Substances 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- UIWYJDYFSGRHKR-UHFFFAOYSA-N gadolinium atom Chemical compound [Gd] UIWYJDYFSGRHKR-UHFFFAOYSA-N 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 201000010225 mixed cell type cancer Diseases 0.000 description 1
- 208000029638 mixed neoplasm Diseases 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000008289 pathophysiological mechanism Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000551 statistical hypothesis test Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Image Processing (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
本申请涉及影像分析技术领域,特别涉及一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,该方法包括以下步骤:获取MRI数据集;MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;基于MRI数据集,提取影像组学特征;并基于MRI数据集,得到转录组测序数据;基于影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,得到交叉通路;将影像组学特征与交叉通路进行关联,得到影像组学特征背后的关键生物学通路。本申请通过整合MRI影像和基因表达数据,能够深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
Description
技术领域
本申请实施例涉及影像分析技术领域,特别涉及一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统。
背景技术
少突胶质细胞瘤是一种原发性中枢神经系统恶性肿瘤,起源于少突胶质细胞群,约占成人大脑恶性肿瘤的4.9%。少突胶质细胞瘤的钙化是其特征性表现,在轴内脑肿瘤中发生率最高(约80%),并且在世界卫生组织(World Health Organization,WHO)3级肿瘤更常见。2021年WHO第五版中枢神经系统(Central Nervous System,CNS)肿瘤分类(CNS5),定义了少突胶质细胞瘤为异柠檬酸脱氢酶(Isocitrate Dehydrogenase,IDH)突变和1p/19q共缺失的弥漫性胶质瘤;取决于其恶性程度,可将少突胶质细胞瘤分为WHO 2级和3级。2级的少突胶质细胞瘤被认为是低级别肿瘤,而3级肿瘤被归类为高级别肿瘤。研究表明,IDH突变和1p/19q共缺失是积极的预后因素,并且与较好的生存预后相关。因此,少突胶质细胞瘤患者的总生存期(overall survival,OS)相对于其他恶性胶质瘤较长,中位生存期可达13-15年。
目前针对少突胶质细胞瘤的治疗方案主要是最大限度的安全手术切除联合辅助放疗和化疗,这已被证明是对患者预后有利的。然而,大多数患者仍会复发或少突胶质细胞瘤很有可能发展为更具侵袭性的肿瘤。复杂的遗传和表观遗传因素导致少突胶质细胞瘤的生存期范围很广。因此,需要开发非侵入性且具有预测性的预后标志物对少突胶质细胞瘤进行风险分层,以识别具有高风险患者,从而指导其个体化治疗。到目前为止,基于机器学习的影像基因组学对IDH突变伴1p/19q共缺失的少突胶质细胞瘤的预后价值仍不明确。此外,在少突胶质细胞瘤中影像组学特征和潜在生物学途径之间的联系需要进一步研究。少突胶质细胞瘤的影像基因组学分析需要大型数据集来训练和验证影像组学模型,由于少突胶质细胞瘤的罕见性,这可能很难获得。
发明内容
本申请实施例提供一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,利用MRI提取影像组学特征构建模型,评估IDH突变伴1p/19q共缺失少突胶质细胞瘤患者的影像组学标签相对于传统临床病理因素的预后增量预测价值。本申请通过整合MRI影像和基因表达数据,能够深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
为解决上述技术问题,第一方面,本申请实施例提供一种基于MRI对少突胶质细胞瘤进行风险分层的方法,包括以下步骤:首先,获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;接下来,基于所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;然后,基于所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;接下来,采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;最后,将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。
在一些示例性实施例中,基于所述MRI数据集,提取影像组学特征,包括:对所述MRI数据集进行预处理,得到配准图像;基于所述配准图像,提取大量定量影像组学特征;所述定量影像组学特征包括形状特征、强度特征和纹理特征;对大量定量影像组学特征进行处理,得到影像组学特征。
在一些示例性实施例中,所述对大量定量影像组学特征进行处理,得到影像组学特征,包括:采用滤波器对原始MRI图像进行转换或派生处理,得到小波特征和高斯-拉普拉斯特征;基于所述小波特征和所述高斯-拉普拉斯特征,得到影像组学特征;其中,小波特征是通过小波变换对原始MRI图像进行分解,然后提取不同频率的小波系数得到的特征;高斯-拉普拉斯特征是基于高斯滤波和拉普拉斯算子的特征提取方法,通过对原始MRI图像进行高斯滤波来抑制噪声和细节信息,然后再使用拉普拉斯算子提取原始MRI图像的整体结构和形态信息得到的特征。
在一些示例性实施例中,基于所述影像组学特征,得到最佳影像组学特征,包括:计算每个影像组学特征的组内相关系数值;基于所述组内相关系数值,对所述影像组学特征的可重复性和稳定性进行评估,并对所述影像组学特征进行筛选,得到剩余特征;对所述剩余特征进行单因素分析,评估所述剩余特征与患者生存期的相关性,计算单因素一致性指数,对所述剩余特征进行筛选,得到保留特征;使用套索回归和比例风险回归,去除所述保留特征中的冗余特征,并将不相关的特征系数设置为零,得到最佳影像组学特征。
在一些示例性实施例中,在基于最佳影像组学特征,构建影像组学模型之后,还包括: 对影像组学模型进行验证。
在一些示例性实施例中,所述对影像组学模型进行验证,包括:基于影像组学评分的截断值,将患者分为低风险组和高风险组;通过生存分析曲线分析评估影像组学标签与总生存期之间的关系,采用对数秩检验法来评估影像组学标签与总生存期之间的生存差异;所述影像组学标签为最佳影像组学特征;将相同的截断值应用于所述数据集,对影像组学模型进行验证。
在一些示例性实施例中,所述对影像组学模型进行验证,还包括:对临床病理危险因素和影像组学评分进行单因素回归分析,得到对患者预后有意义的因素;基于对患者预后有意义的因素,得到独立的危险因素,并将所述影像组学标签作为独立危险因素进行评估;基于多变量回归分析,将独立的临床病理危险因素纳入临床病理诺莫图中;将影像组学-临床病理诺莫图作为影像组学标签并结合独立的临床病理危险因素,对影像组学标签对患者预后评估的增量价值进行评估。
在一些示例性实施例中,将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路,包括:分别计算采用加权基因共表达网络分析方法得到的生物学通路基因组变异分析评分,以及采用基因集富集分析方法得到的生物学通路的基因组变异分析评分;将所述基因组变异分析评分与预后影像组学标签进行相关性分析,根据相关的生物学通路对影像组学特征进行解释,以及分析每个影像组学特征与其相应的生物学通路之间的对应关系。
第二方面,本申请实施例还提供了一种基于MRI对少突胶质细胞瘤进行风险分层的系统,依次连接的数据集模块、特征获取模块、模型构建模块以及数据分析模块;所述数据集模块用于获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;所述特征获取模块用于根据所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;所述模型构建模块用于根据所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型; 所述数据分析模块用于采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;并将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。
在一些示例性实施例中,所述模型构建模块包括依次连接的预处理模块、特征提取模块以及特征处理模块;所述预处理模块用于对所述MRI数据集进行预处理,得到配准图像;所述特征提取模块用于根据所述配准图像,提取大量定量影像组学特征;所述定量影像组学特征包括形状特征、强度特征和纹理特征;所述特征处理模块用于对大量定量影像组学特征进行处理,得到影像组学特征。
本申请实施例提供的技术方案至少具有以下优点:
本申请实施例提供一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,该方法包括以下步骤:首先,获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;接下来,基于所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;然后,基于所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;接下来,采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;最后,将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。
本申请提供的基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,利用MRI提取影像组学特征构建模型,评估IDH突变伴1p/19q共缺失少突胶质细胞瘤患者的影像组学标签相对于传统临床病理因素的预后增量预测价值。且前期实验的影像基因组学分析显示,预后影像组学特征与少突胶质细胞瘤的免疫、增殖、侵袭、血管生成和钙化生物学途径相关。此外,使用配对的少突胶质细胞瘤MRI和通过高通量测序技术获得的RNA测序数据,探究预后影像组学特征背后的生物学机制。通过整合影像和基因表达数据,可以深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,除非有特别申明,附图中的图不构成比例限制。
图1为本申请一实施例提供的一种基于MRI对少突胶质细胞瘤进行风险分层的方法的流程示意图;
图2A为本申请一实施例提供的影像特征提取的示意图;
图2B为本申请一实施例提供的构建影像组学模型的示意图;
图2C为本申请一实施例提供的影像基因组学分析的示意图;
图2D为本申请一实施例提供的通路证实的示意图;
图3为本申请一实施例提供的一种基于MRI对少突胶质细胞瘤进行风险分层的系统的结构示意图。
实施方式
由背景技术可知,现有技术中对少突胶质细胞瘤进行风险分层的研究较少,到目前为止,基于机器学习的影像基因组学对IDH突变伴1p/19q共缺失的少突胶质细胞瘤的预后价值仍不明确。此外,在少突胶质细胞瘤中影像组学特征和潜在生物学途径之间的联系需要进一步研究。少突胶质细胞瘤的影像基因组学分析需要大型数据集来训练和验证影像组学模型,由于少突胶质细胞瘤的罕见性,这可能很难获得。
影像组学是从磁共振图像(Magnetic Resonance Imaging,MRI)中提取了大量的定量图像特征,揭示了仅从图像中无法检测到的隐藏信息,并以非侵入性的方式提供了对肿瘤异质性信息。由于胶质瘤的独特生物学行为以及诊断和治疗相关的挑战性,人们对将影像组学应用于胶质瘤越来越感兴趣。最近,影像组学分析已被广泛用于预测胶质瘤的预后、诊断和治疗反应。在少突胶质细胞瘤中,影像组学分析已显示出对肿瘤潜在生物学见解的希望。少突胶质细胞瘤具有独特的分子生物学特性,具有异柠檬酸脱氢酶IDH突变和1p/19q共缺失,影像组学可以以非侵入性方式捕获肿瘤的复杂分子特征。一项研究使用影像组学分析来确定与IDH突变相关的成像特征,发现某些影像组学特征,如纹理和强度特征,与突变的存在显着相关,这表明影像组学分析可以用作检测IDH突变和1p/19q共缺失状态的非侵入性方法。此外,影像组学还可以用于预测胶质瘤的预后和治疗反应。一项研究发现,从低级别胶质瘤(Low grade glioma,LGG)治疗前 MRI中提取的影像组学特征与患者的生存期显著相关,而且可以识别对化疗受益的患者,这表明影像组学可用于根据对化疗的预测反应来个性化治疗决策。
影像基因组学是将基因组学和影像学相结合,利用基因组数据和影像数据来解释疾病的生物学机制和发病机理,可以帮助研究癌症的发展、预测肿瘤的治疗反应、评估药物疗效等。影像基因组学分析可以为胶质瘤的潜在生物学提供见解。一些研究使用影像基因组学分析来确定与肿瘤微环境中免疫细胞浸润程度相关的成像特征,研究发现,某些影像组学特征与免疫细胞的存在显着相关,表明影像基因组学分析可用于研究胶质瘤的免疫微环境,并可能确定免疫治疗的新靶点。另外,影像组学还具有指导少突胶质细胞瘤治疗决策的潜力。影像基因组学可以提供有关肿瘤潜在生物学的宝贵信息,例如其遗传谱和微环境,这些信息可以为治疗决策提供信息并改善患者预后。此外,在影像基因组学分析方法中,加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)和基因集富集分析(Gene Set Enrichment Analysis,GSEA)等分析方法可用于挖掘RNA测序数据。
为了解决上述技术问题,本申请实施例提供一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,该方法包括以下步骤:首先,获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;接下来,基于所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;然后,基于所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;接下来,采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;最后,将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。本申请提供的基于MRI对少突胶质细胞瘤进行风险分层的方法,通过利用MRI提取影像组学特征构建模型,评估IDH突变伴1p/19q共缺失少突胶质细胞瘤患者的影像组学标签相对于传统临床病理因素的预后增量预测价值。通过整合影像和基因表达数据,可以深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。
参看图1,本申请实施例提供了一种基于MRI对少突胶质细胞瘤进行风险分层的方法,包括以下步骤:
步骤S1、获取MRI数据集; MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据。
步骤S2、基于MRI数据集,提取影像组学特征;并基于MRI数据集,得到转录组测序数据。
步骤S3、基于影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型。
步骤S4、采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路。
步骤S5、将影像组学特征与交叉通路进行关联,得到影像组学特征背后的关键生物学通路。
本申请实施例提供的基于MRI对少突胶质细胞瘤进行风险分层的方法主要包括以下三个部分:影像组学特征提取、预后模型建立和影像基因组学分析。如图2A至图2D所示,首先,收集研究队列MRI数据,对其进行配准后进行影像组学特征提取(如图2A所示),选择最佳的预后影像组学特征,用来构建影像组学模型(如图2B所示)。其次,使用加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)和基因集富集分析(Gene Set Enrichment Analysis,GSEA)两种方法对转录组RNA测序数据进行的分析,识别两者的交叉生物学通路,得到交叉通路(如图2C所示)。最后,将影像组学特征与交叉通路进行了关联,并确定了影像组学特征背后的关键生物学通路(如图2D所示)。
本申请通过利用MRI提取影像组学特征构建模型,评估IDH突变伴1p/19q共缺失少突胶质细胞瘤患者的影像组学标签相对于传统临床病理因素的预后增量预测价值。此外,使用配对的少突胶质细胞瘤MRI和通过高通量测序技术获得的RNA测序数据,探究预后影像组学特征背后的生物学机制。通过整合影像和基因表达数据,可以深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
具体的,在步骤S1中获取MRI数据集时,通过设定“患者队列选择标准”进行数据的选择。本申请的研究的主要队列是在医院神经外科接受脑肿瘤手术切除并根据CNS5诊断为少突胶质细胞瘤的病例。其中,患者队列选择标准包括纳入标准和排除标准,分别如下所示:
纳入标准:
(1)术后组织病理和分子检测综合诊断为少突胶质细胞瘤的病例;
(2)术后随访的生存数据的可用性;
(3)术前多参数MRI序列的完整性和可用性;
(4)患者年龄≥18岁。
排除标准:
(1)确诊时未行手术治疗或仅行穿刺活检;
(2)未在医院行手术治疗;
(3)未在医院行术前MRI检查或术前MRI存在伪影、序列不全等;
(4)术后失访或非此肿瘤而导致死亡的病例。
经过上述筛选流程后,符合标准的患者被纳入研究队列。其中,研究队列中的部分患者具有配对转录组RNA测序数据。此外,通过临床病历系统获得每位患者的临床病理资料,包括:性别、年龄、放疗、化疗、肿瘤分级、术前卡氏功能状态评分(Karnofskyperformance status,KPS)、肿瘤切除程度(完全或不完全)。随访数据来自电话随访和患者回顾。
在得到MRI数据集之后,进行分子信息与转录组RNA测序的操作。具体的,部分患者在手术切除肿瘤组织后,常规进行了IDH或1p/19q的病理检测以确定相关基因的状态。为了确定未行这些相关检查患者的IDH和1p/19q基因状态,从病理科借调这部分患者的包埋组织蜡块,并采用了Sanger测序法和荧光原位杂交(fluorescence in situ hybridization,FISH)技术检测相应分子信息。另外,挑选部分入组的肿瘤标本进行RNA测序。
接下来,采用磁共振 (Magnetic Resonance,MR)设备对MRI图像进行参数采集。研究队列的所有患者在术前均需要经过3.0 T MR扫描仪进行检查,并采集相关图像。进入检查室前,将患者随身携带的金属性物品去除,避免产生金属伪影和重大安全事故。图像采集前,将患者头部置于线圈中心并固定,嘱患者避免活动,防止产生运动伪影。以0.1mmol/kg的剂量静脉注射钆基造影剂后立即获得T1c序列。磁共振成像方案包括T1WI,T2WI, T1c,FLAIR和ADC。
在一些实施例中,步骤S2中基于所述MRI数据集,提取影像组学特征,包括:
步骤S201、对所述MRI数据集进行预处理,得到配准图像。
步骤S202、基于所述配准图像,提取大量定量影像组学特征;所述定量影像组学特征包括形状特征、强度特征和纹理特征。
步骤S203、对大量定量影像组学特征进行处理,得到影像组学特征。
具体的,在步骤S2中,对所有纳入队列的MRI进行标准化处理(预处理),以减少误差。预处理步骤包括进行偏置场N4校正、去除颅骨影响、并进行各向同性体素线性插值重采样为1×1×1 mm3,以磁共振成像液体衰减反转恢复序列(Fluid Attenuated InversionRecovery,FLAIR)为模板并采用互信息相似度度量进行刚性配准。最后获得五幅配准图像。将三维感兴趣体积(volume of interest,VOI)定义为肿瘤核心和肿瘤周围水肿区域。首先由一位放射科医生在轴位FLAIR图像上使用ITK-SNAP软件(版本:3.4.0)手工绘制。为了选择更具鲁棒性的特征,后由另一位具有12年临床经验的神经外科医师对从纳入队列随机选择部分患者重新绘制,产生一个评估者间数据集。其中,两位医生都对患者队列中临床病理数据和生存情况毫不知情。
在一些实施例中,步骤S203中对大量定量影像组学特征进行处理,得到影像组学特征,包括:采用滤波器对原始MRI图像进行转换或派生处理,得到小波特征和高斯-拉普拉斯特征;基于所述小波特征和所述高斯-拉普拉斯特征,得到影像组学特征;其中,小波特征是通过小波变换对原始MRI图像进行分解,然后提取不同频率的小波系数得到的特征;高斯-拉普拉斯特征是基于高斯滤波和拉普拉斯算子的特征提取方法,通过对原始MRI图像进行高斯滤波来抑制噪声和细节信息,然后再使用拉普拉斯算子提取原始MRI图像的整体结构和形态信息得到的特征。
具体的,在提取影像组学特征时,采用开源Python软件包PyRadiomics(版本:2.2.0)从经过标准化处理后影像图像中提取了大量定量影像组学特征,包括形状、强度和纹理特征。为了使图像特征更全面和准确,提高图像分析的效果和准确性,使用滤波器在原始图像上进行转换或派生得到小波特征和高斯-拉普拉斯(Laplacian of Gaussian,LoG)特征。小波特征是通过小波变换对图像进行分解,然后提取不同频率的小波系数作为特征,通常包括低频系数和高频系数两部分。LoG特征是基于高斯滤波和拉普拉斯算子的特征提取方法,可以通过对图像进行高斯滤波来抑制噪声和细节信息,然后再使用拉普拉斯算子来提取图像的整体结构和形态信息。拉普拉斯算子包含四个级别:2.0、3.0、4.0和5.0。研究根据成像生物标志物标准化倡议进行特征提取。
在一些实施例中,步骤S3中基于所述影像组学特征,得到最佳影像组学特征,包括:
步骤S301、计算每个影像组学特征的组内相关系数值。
步骤S302、基于所述组内相关系数值,对所述影像组学特征的可重复性和稳定性进行评估,并对所述影像组学特征进行筛选,得到剩余特征。
步骤S303、对所述剩余特征进行单因素分析,评估所述剩余特征与患者生存期的相关性,计算单因素一致性指数,对所述剩余特征进行筛选,得到保留特征。
步骤S304、使用套索回归和比例风险回归,去除所述保留特征中的冗余特征,并将不相关的特征系数设置为零,得到最佳影像组学特征。
具体的,对于提取得到的影像组学特征特征首先进行z-score处理,使不同特征之间的量纲和尺度得到了统一,有利于特征之间的比较和组合,消除量纲影响,以便进行有效的特征选择。需要说明的是,z-score是z分数的意思,也称标准分数,是一种具有相等单位的量数。
选择最佳影像组学特征以构建模型的过程大致分为三个部分:(1)基于组内相关性系数(Intraclass Correlation Coefficient,ICC)评估影像组学特征的可重复性和稳定性,计算每个特征的ICC值,保留ICC>0.9的特征。(2)对剩余的特征进行单因素分析,评估其与患者生存期的相关性,计算单因素一致性指数(Consistency Index,C-index),选择C-index≥0.60和C-index<0.40的特征。(3)使用套索回归(Least absolute shrinkageand selection operator ,LASSO)和Cox比例风险回归,去除冗余特征,将不相关的特征系数设置为零。然后,采用10倍交叉验证评估模型的性能,从而避免模型在特定数据集上过度拟合的问题,同时,选择最优的正则化系数,以进一步提高模型的性能表现。
基于此,本申请通过计算ICC值评估影像组学特征的可重复性、进行特征单因素分析和LASSO-Cox回归分析,筛选得到最佳影像组学特征,以构成影像组学标签,用来预测少突胶质细胞瘤的生存预后。
在一些示例性实施例中,在步骤S3基于最佳影像组学特征,构建影像组学模型之后,还包括:对影像组学模型进行验证。
在一些实施例中,所述对影像组学模型进行验证,包括:基于影像组学评分的截断值,将患者分为低风险组和高风险组;通过生存分析曲线分析评估影像组学标签与总生存期之间的关系,采用对数秩检验法来评估影像组学标签与总生存期之间的生存差异;所述影像组学标签为最佳影像组学特征;将相同的截断值应用于所述数据集,对影像组学模型进行验证。
在一些实施例中,所述对影像组学模型进行验证,还包括:对临床病理危险因素和影像组学评分进行单因素回归分析,得到对患者预后有意义的因素;基于对患者预后有意义的因素,得到独立的危险因素,并将所述影像组学标签作为独立危险因素进行评估;基于多变量回归分析,将独立的临床病理危险因素纳入临床病理诺莫图中;将影像组学-临床病理诺莫图作为影像组学标签并结合独立的临床病理危险因素,对影像组学标签对患者预后评估的增量价值进行评估。
具体的,在影像组学模型构的构建与验证的规程中,首先,将经过特征筛选最终获得的影像组学特征组合成一个模型,通过特征的套索回归(LASSO)系数进行加权,形成一个线性组合。采用R包survminer在训练数据集中确定影像组学评分的截断值,将患者分为低风险组和高风险组。需要说明的是,survminer是专门用来进行生存分析可视化的R包,主要函数包括生存曲线、Cox模型的诊断以及竞争风险模型。
本申请通过生存分析(Kaplan-Meier,K-M)曲线分析评估影像组学标签与总生存期OS之间的关系,采用对数秩检验法(Log-rank)用来评估两组间的生存差异。将相同的截断值应用于验证数据集。进一步对临床病理危险因素和影像组学评分进行单因素Cox分析,获得对患者预后有意义的因素。然后,将P <0.05的所有因素纳入多因素Cox分析中,获得独立的危险因素,并对影像组学标签作为独立危险因素进行评估。基于多变量Cox分析,将独立的临床病理危险因素纳入临床病理诺莫图中,影像组学-临床诺莫图为影像组学标签结合独立的临床病理危险因素。对比两种诺莫图以评估影像组学标签对患者预后评估的增量价值。使用R包rms绘制校准曲线,比较影像组学-病理诺莫图和临床病理诺莫图的校准和鉴别性能,并比较观察和预测生存之间的校准性能。以R包survival计算C-index作为评价预后模型的指标。采用净重分类改进(Net ReclassificationImprovement ,NRI)评价影像组学模型的优缺点,采用赤池信息准则(Akaike information criterion ,AIC)评价模型的过拟合风险。最后,采用R包rmda绘制决策曲线,以评估模型在临床上的实际应用价值。
基于此,使用K-M分析评估影像组学标签与患者生存期之间的相关性。对临床病理危险因素和影像组学标签进行多因素Cox分析,基于独立的危险因素,绘制诺莫图,以预测个性化患者的生存率。需要说明的是,rms包是一个协助和简化建模的函数集,本申请采用R包rms绘制校准曲线;采用R包survival计算单因素一致性指数C-index作为评价预后模型的指标。为了验证诺莫图的临床实用性开发了二分类变量决策曲线(DCA曲线),本申请采用R包rmda绘制DCA曲线。
在步骤S4中,本申请使用WGCNA和GSEA两种分析方法获取交叉通路,以实现对影像基因组学的进一步分析。WGCNA是分析放射基因组学数据的强大方法,鉴定与影像组学特征共表达的基因模块,提供了一种识别成像表型潜在分子机制的方法。GSEA是一种广泛使用的生物信息学工具,用于在预定义的基因集或途径的背景下分析基因表达数据。
由于两种方法对基因富集的侧重点和分析思路不同,本研究结合WGCNA和GSEA,提高了影像基因组学分析中生物学途径识别的可重复性和可靠性。
具体的,WGCNA可用于分析基因表达数据,识别共表达的基因,并根据其相似的表达模式将它们分组到模块或簇中。对肿瘤组织基因表达数据进行共表达网络分析,可使用R包WGCNA实现。
以下是对WGCNA流程的详细说明:(1)数据预处理:对数据进行归一化以消除任何系统偏差并删除低质量样本。(2)基因共表达网络构建:首先使用基因间相关性加权值将相关矩阵转换为邻接矩阵。然后将邻接矩阵转换为拓扑重叠矩阵 (Topological OverlapMatrix ,TOM),测量两个基因之间共享邻居的程度。TOM 用于构建相互连接的基因模块网络,其中每个模块代表一组高度共表达的基因。(3)模块检测:使用层次聚类来识别共表达网络中的基因模块。首先计算每个基因对的 TOM 之间的差异性,然后使用聚类算法将具有相似 TOM 的基因分组到模块中。生成的树状图可以在特定高度切割以创建指定数量的基因模块。(4)模块表征:每个基因模块都有一个代表性表达谱,称为模块特征基因(ModuleEigengene,ME)。它是该模块内基因表达的总体特征,能够反映出该模块的基因表达状况。ME为模块内基因表达矩阵的第一主成分。然后,根据样本的基因组变异分析(Gene SetVariance Analysis,GSVA),确定了与影像组学评分显著相关的模块,其中假发现率(FalseDiscovery Rate,FDR)校正的P<0.05表示显著性。为了识别基因模块内富集的生物通路和过程,使用R包clusterProfiler获得功能富集通路,以FDR<0.05表示有统计学意义。
需要说明的是,R包clusterProfiler是一个解释组学数据的通用富集工具许多基因集的功能注释和富集分析,以及富集分析结果的可视化的R包。
GSEA是一种用于分析基因表达数据以识别差异表达的基因组的方法。以下是 对GSEA 流程的详细说明:(1)数据预处理:对数据进行归一化以消除任何系统偏差并缩放表达式值,生成的表达矩阵应仅包含高质量的样本和基因。(2)基因集的选择:从公开可用的数据库(KEGG、Reactome 、Gene Ontology、Hallmark、PID、BioCarta、WikiPathways)选择代表特定生物途径、过程或功能的基因集。(3)富集分数的计算:将基因集内基因的表达与基因集外基因的表达进行比较,以确定基因集在特定生物条件下是否显着富集。计算富集分数 (Enrichment Score,ES)反映基因集中的基因根据两种条件之间的差异表达在基因排名列表的顶部或底部被过度表达的程度。(4)统计显著性检验:随机排列样本标签并重新计算每个基因集的富集分数,重复多次以生成富集分数的空分布,用于计算每个基因集的归一化富集分数 (Normalized Enrichment Score,NES)。选择FDR<0.05且|NES|>1则表示显著性。计算通路对应的GSVA值,评估其与影像组学评分之间的相关性。FDR<0.05表示有统计学意义。
在一些实施例中,步骤S5中将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路,包括:
步骤S501、分别计算采用加权基因共表达网络分析方法得到的生物学通路基因组变异分析评分,以及采用基因集富集分析方法得到的生物学通路的基因组变异分析评分。
步骤S502、将所述基因组变异分析评分与预后影像组学标签进行相关性分析,根据相关的生物学通路对影像组学特征进行解释,以及分析每个影像组学特征与其相应的生物学通路之间的对应关系。
在步骤S5中,通过得到影像组学特征背后的关键生物学通路,实现对预后影像组学特征进行生物学解释。具体的,本申请使用WGCNA和GSEA两种分析方法,获得各自的富集通路结果。为了使结果更具可靠性、准确性和可重复性,减少异常数据和错误,我们采用了两种分析方法的交叉通路。然后,计算每个通路对应的GSVA评分,与预后影像组学标签进行Pearson相关性分析。根据相关的生物学通路对影像组学特征进行解释。绘制气泡图分析每个影像组学特征与其相应的生物学通路之间的关系。
相对于现有技术,本申请提供的基于MRI对少突胶质细胞瘤进行风险分层的方法的优势在于:首先,本申请根据CNS5提出的综合诊断重新分类,更加重视分子标记物在神经系统肿瘤分类中的作用,确定少突胶质细胞瘤的分子诊断为IDH突变和1p/19q共缺失,删除了在2016年WHO分类中的少突星形细胞瘤。因为根据分子标记物,形态学上的混合肿瘤通常可归类为星形细胞瘤或少突胶质细胞瘤。然后,本申请建立了一个基于机器学习的影像组学模型,并验证了少突胶质细胞瘤的风险分层。其次,本申请在影像基因组学分析时使用WGCNA和GSEA两种方法,从不同角度分析疾病相关的生物学途径,并对分析结果进行交叉验证。然后,取两者的交叉通路来揭示了预后影像组学特征背后的生物学基础,增强了富集通路的可靠性和准确性。第三,影像基因组学分析了少突胶质细胞瘤患者的多序列MRI数据和基因表达数据,并从中提取出与钙化形成相关的影像组学特征。通过进一步分析这些特征,本申请揭示了与少突胶质细胞瘤钙化形成相关的生物学解释,这有助于更好地理解该疾病的病理生理机制。
参看图3,本申请实施例还提供了一种基于MRI对少突胶质细胞瘤进行风险分层的系统,依次连接的数据集模块101、特征获取模块102、模型构建模块103以及数据分析模块104;数据集模块101用于获取MRI数据集; MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;特征获取模块102用于根据所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;模型构建模块103用于根据所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;数据分析模块104用于采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;并将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。
在一些实施例中,模型构建模块103包括依次连接的预处理模块1031、特征提取模块1032以及特征处理模块1033;预处理模块1031用于对所述MRI数据集进行预处理,得到配准图像;特征提取模块1032用于根据所述配准图像,提取大量定量影像组学特征;定量影像组学特征包括形状特征、强度特征和纹理特征;特征处理模块1033用于对大量定量影像组学特征进行处理,得到影像组学特征。
由以上技术方案,本申请实施例提供一种基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,该方法包括以下步骤:首先,获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;接下来,基于所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;然后,基于所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;接下来,采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;最后,将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路。
本申请提供的基于MRI对少突胶质细胞瘤进行风险分层的方法及系统,利用MRI提取影像组学特征构建模型,评估IDH突变伴1p/19q共缺失少突胶质细胞瘤患者的影像组学标签相对于传统临床病理因素的预后增量预测价值。且前期实验的影像基因组学分析显示,预后影像组学特征与少突胶质细胞瘤的免疫、增殖、侵袭、血管生成和钙化生物学途径相关。此外,使用配对的少突胶质细胞瘤MRI和通过高通量测序技术获得的RNA测序数据,探究预后影像组学特征背后的生物学机制。通过整合影像和基因表达数据,可以深入了解生物学机制和通路,并为患者的治疗和预后评估提供更具体的指导和预测。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (5)
1.一种基于MRI对少突胶质细胞瘤进行风险分层的方法,其特征在于,包括:
获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;
基于所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;
基于所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;
采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;
将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路;其中,
将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路,包括:
分别计算采用加权基因共表达网络分析方法得到的生物学通路基因组变异分析评分,以及采用基因集富集分析方法得到的生物学通路的基因组变异分析评分;
将所述基因组变异分析评分与预后影像组学标签进行相关性分析,根据相关的生物学通路对影像组学特征进行解释,以及分析每个影像组学特征与其相应的生物学通路之间的对应关系;
基于所述影像组学特征,得到最佳影像组学特征,包括:
计算每个影像组学特征的组内相关系数值;
基于所述组内相关系数值,对所述影像组学特征的可重复性和稳定性进行评估,并对所述影像组学特征进行筛选,得到剩余特征;
对所述剩余特征进行单因素分析,评估所述剩余特征与患者生存期的相关性,计算单因素一致性指数,对所述剩余特征进行筛选,得到保留特征;
使用套索回归和比例风险回归,去除所述保留特征中的冗余特征,并将不相关的特征系数设置为零,得到最佳影像组学特征;
在基于最佳影像组学特征,构建影像组学模型之后,还包括:
对影像组学模型进行验证;
所述对影像组学模型进行验证,包括:
基于影像组学评分的截断值,将患者分为低风险组和高风险组;
通过生存分析曲线分析评估影像组学标签与总生存期之间的关系,采用对数秩检验法来评估影像组学标签与总生存期之间的生存差异;所述影像组学标签为最佳影像组学特征;
将相同的截断值应用于所述数据集,对影像组学模型进行验证;
所述对影像组学模型进行验证,还包括:
对临床病理危险因素和影像组学评分进行单因素回归分析,得到对患者预后有意义的因素;
基于对患者预后有意义的因素,得到独立的危险因素,并将所述影像组学标签作为独立危险因素进行评估;
基于多变量回归分析,将独立的临床病理危险因素纳入临床病理诺莫图中;将影像组学-临床病理诺莫图作为影像组学标签并结合独立的临床病理危险因素,对影像组学标签对患者预后评估的增量价值进行评估。
2.根据权利要求1所述的基于MRI对少突胶质细胞瘤进行风险分层的方法,其特征在于,基于所述MRI数据集,提取影像组学特征,包括:
对所述MRI数据集进行预处理,得到配准图像;
基于所述配准图像,提取大量定量影像组学特征;所述定量影像组学特征包括形状特征、强度特征和纹理特征;
对大量定量影像组学特征进行处理,得到影像组学特征。
3.根据权利要求2所述的基于MRI对少突胶质细胞瘤进行风险分层的方法,其特征在于,所述对大量定量影像组学特征进行处理,得到影像组学特征,包括:
采用滤波器对原始MRI图像进行转换或派生处理,得到小波特征和高斯-拉普拉斯特征;
基于所述小波特征和所述高斯-拉普拉斯特征,得到影像组学特征;
其中,小波特征是通过小波变换对原始MRI图像进行分解,然后提取不同频率的小波系数得到的特征;高斯-拉普拉斯特征是基于高斯滤波和拉普拉斯算子的特征提取方法,通过对原始MRI图像进行高斯滤波来抑制噪声和细节信息,然后再使用拉普拉斯算子提取原始MRI图像的整体结构和形态信息得到的特征。
4.一种基于MRI对少突胶质细胞瘤进行风险分层的系统,其特征在于,依次连接的数据集模块、特征获取模块、模型构建模块以及数据分析模块;
所述数据集模块用于获取MRI数据集;所述MRI数据集包括少突胶质细胞瘤患者的磁共振图像数据;
所述特征获取模块用于根据所述MRI数据集,提取影像组学特征;并基于所述MRI数据集,得到转录组测序数据;
所述模型构建模块用于根据所述影像组学特征,得到最佳影像组学特征;并基于最佳影像组学特征,构建影像组学模型;
所述数据分析模块用于采用加权基因共表达网络分析以及基因集富集分析方法,对转录组测序数据进行分析,并对加权基因共表达网络分析与基因集富集分析的交叉生物学通路进行识别,得到交叉通路;并将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路;其中,
将所述影像组学特征与所述交叉通路进行关联,得到所述影像组学特征背后的关键生物学通路,包括:
分别计算采用加权基因共表达网络分析方法得到的生物学通路基因组变异分析评分,以及采用基因集富集分析方法得到的生物学通路的基因组变异分析评分;
将所述基因组变异分析评分与预后影像组学标签进行相关性分析,根据相关的生物学通路对影像组学特征进行解释,以及分析每个影像组学特征与其相应的生物学通路之间的对应关系;
基于所述影像组学特征,得到最佳影像组学特征,包括:
计算每个影像组学特征的组内相关系数值;
基于所述组内相关系数值,对所述影像组学特征的可重复性和稳定性进行评估,并对所述影像组学特征进行筛选,得到剩余特征;
对所述剩余特征进行单因素分析,评估所述剩余特征与患者生存期的相关性,计算单因素一致性指数,对所述剩余特征进行筛选,得到保留特征;
使用套索回归和比例风险回归,去除所述保留特征中的冗余特征,并将不相关的特征系数设置为零,得到最佳影像组学特征;
在基于最佳影像组学特征,构建影像组学模型之后,还包括:
对影像组学模型进行验证;
所述对影像组学模型进行验证,包括:
基于影像组学评分的截断值,将患者分为低风险组和高风险组;
通过生存分析曲线分析评估影像组学标签与总生存期之间的关系,采用对数秩检验法来评估影像组学标签与总生存期之间的生存差异;所述影像组学标签为最佳影像组学特征;
将相同的截断值应用于所述数据集,对影像组学模型进行验证;
所述对影像组学模型进行验证,还包括:
对临床病理危险因素和影像组学评分进行单因素回归分析,得到对患者预后有意义的因素;
基于对患者预后有意义的因素,得到独立的危险因素,并将所述影像组学标签作为独立危险因素进行评估;
基于多变量回归分析,将独立的临床病理危险因素纳入临床病理诺莫图中;将影像组学-临床病理诺莫图作为影像组学标签并结合独立的临床病理危险因素,对影像组学标签对患者预后评估的增量价值进行评估。
5.根据权利要求4所述的基于MRI对少突胶质细胞瘤进行风险分层的系统,其特征在于,所述模型构建模块包括依次连接的预处理模块、特征提取模块以及特征处理模块;
所述预处理模块用于对所述MRI数据集进行预处理,得到配准图像;
所述特征提取模块用于根据所述配准图像,提取大量定量影像组学特征;所述定量影像组学特征包括形状特征、强度特征和纹理特征;
所述特征处理模块用于对大量定量影像组学特征进行处理,得到影像组学特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310656698.1A CN116385441B (zh) | 2023-06-05 | 2023-06-05 | 一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310656698.1A CN116385441B (zh) | 2023-06-05 | 2023-06-05 | 一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116385441A CN116385441A (zh) | 2023-07-04 |
CN116385441B true CN116385441B (zh) | 2023-09-05 |
Family
ID=86980986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310656698.1A Active CN116385441B (zh) | 2023-06-05 | 2023-06-05 | 一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116385441B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116339A (zh) * | 2023-10-24 | 2023-11-24 | 中日友好医院(中日友好临床医学研究所) | 基于wgcna识别影像组学生物学特征的方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156484A (zh) * | 2016-06-08 | 2016-11-23 | 中国科学院自动化研究所 | 基于磁共振影像的脑疾病个体化预测方法和系统 |
CN106815481A (zh) * | 2017-01-19 | 2017-06-09 | 中国科学院深圳先进技术研究院 | 一种基于影像组学的生存期预测方法及装置 |
CN108897984A (zh) * | 2018-05-07 | 2018-11-27 | 上海理工大学 | 基于ct影像组学特征与肺癌基因表达间相关性分析方法 |
CN110895817A (zh) * | 2019-11-01 | 2020-03-20 | 复旦大学 | 一种基于影像组学分析的mri影像肝纤维化自动分级方法 |
WO2020092101A1 (en) * | 2018-10-31 | 2020-05-07 | Nantomics, Llc | Consensus molecular subtypes sidedness classification |
CN111657945A (zh) * | 2020-06-16 | 2020-09-15 | 中南大学湘雅医院 | 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法 |
CN112907555A (zh) * | 2021-03-11 | 2021-06-04 | 中国科学院深圳先进技术研究院 | 一种基于影像基因组学的生存预测方法和系统 |
CN113096757A (zh) * | 2021-04-29 | 2021-07-09 | 中国科学院深圳先进技术研究院 | 一种基于双区域影像组学的食管鳞癌生存预测方法和系统 |
CN113706435A (zh) * | 2020-05-09 | 2021-11-26 | 北京康兴顺达科贸有限公司 | 基于传统影像组学的胸部增强ct图像处理方法 |
CN115375640A (zh) * | 2022-08-11 | 2022-11-22 | 哈尔滨医科大学 | 一种肿瘤异质性识别方法、装置、电子设备、存储介质 |
CN115862857A (zh) * | 2022-11-25 | 2023-03-28 | 中国科学院深圳先进技术研究院 | 肿瘤免疫亚型预测方法、系统及计算机设备 |
CN116189761A (zh) * | 2022-12-09 | 2023-05-30 | 浙江大学 | 基于多组学数据的肝癌deb-tace联合pd-1抑制剂疗效精准预测方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3758601A4 (en) * | 2018-02-26 | 2021-11-17 | Mayo Foundation for Medical Education and Research | SYSTEMS AND METHODS FOR QUANTIFICATION OF MULTI-SCALE COMPETITIVE LANDSCAPES OF CLONAL DIVERSITY IN GLIOBLASTOMA |
EP3660172A1 (en) * | 2018-11-28 | 2020-06-03 | Bioscreening and Diagnostics LLC | Method for detection of traumatic brain injury (tbi) |
EP4147180A4 (en) * | 2020-05-04 | 2024-05-22 | Carmel Haifa University Economic Corporation Ltd. | PREDICTION OF THE BIOLOGICAL ROLE OF TISSUE RECEPTORS |
-
2023
- 2023-06-05 CN CN202310656698.1A patent/CN116385441B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156484A (zh) * | 2016-06-08 | 2016-11-23 | 中国科学院自动化研究所 | 基于磁共振影像的脑疾病个体化预测方法和系统 |
CN106815481A (zh) * | 2017-01-19 | 2017-06-09 | 中国科学院深圳先进技术研究院 | 一种基于影像组学的生存期预测方法及装置 |
CN108897984A (zh) * | 2018-05-07 | 2018-11-27 | 上海理工大学 | 基于ct影像组学特征与肺癌基因表达间相关性分析方法 |
WO2020092101A1 (en) * | 2018-10-31 | 2020-05-07 | Nantomics, Llc | Consensus molecular subtypes sidedness classification |
CN110895817A (zh) * | 2019-11-01 | 2020-03-20 | 复旦大学 | 一种基于影像组学分析的mri影像肝纤维化自动分级方法 |
CN113706435A (zh) * | 2020-05-09 | 2021-11-26 | 北京康兴顺达科贸有限公司 | 基于传统影像组学的胸部增强ct图像处理方法 |
CN111657945A (zh) * | 2020-06-16 | 2020-09-15 | 中南大学湘雅医院 | 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法 |
CN112907555A (zh) * | 2021-03-11 | 2021-06-04 | 中国科学院深圳先进技术研究院 | 一种基于影像基因组学的生存预测方法和系统 |
CN113096757A (zh) * | 2021-04-29 | 2021-07-09 | 中国科学院深圳先进技术研究院 | 一种基于双区域影像组学的食管鳞癌生存预测方法和系统 |
CN115375640A (zh) * | 2022-08-11 | 2022-11-22 | 哈尔滨医科大学 | 一种肿瘤异质性识别方法、装置、电子设备、存储介质 |
CN115862857A (zh) * | 2022-11-25 | 2023-03-28 | 中国科学院深圳先进技术研究院 | 肿瘤免疫亚型预测方法、系统及计算机设备 |
CN116189761A (zh) * | 2022-12-09 | 2023-05-30 | 浙江大学 | 基于多组学数据的肝癌deb-tace联合pd-1抑制剂疗效精准预测方法和装置 |
Non-Patent Citations (1)
Title |
---|
MRI 影像组学在脑胶质瘤临床评估中的研究应用;刘书涵等;《中国CT 和MRI 杂志》;第21卷(第3期);第178-180页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116385441A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sala et al. | Unravelling tumour heterogeneity using next-generation imaging: radiomics, radiogenomics, and habitat imaging | |
CN112289455A (zh) | 一种人工智能神经网络学习模型构建系统、构建方法 | |
Xu et al. | Applying artificial intelligence for cancer immunotherapy | |
Yap et al. | Verifying explainability of a deep learning tissue classifier trained on RNA-seq data | |
CN112086129B (zh) | 预测肿瘤组织cfDNA的方法及系统 | |
Phan et al. | Multiscale integration of-omic, imaging, and clinical data in biomedical informatics | |
WO2015023732A1 (en) | Systems, methods and devices for analyzing quantitative information obtained from radiological images | |
US20140040264A1 (en) | Method for estimation of information flow in biological networks | |
KR20020075265A (ko) | 임상 진단 서비스를 제공하는 방법 | |
CN116385441B (zh) | 一种基于mri对少突胶质细胞瘤进行风险分层的方法及系统 | |
Ladbury et al. | Integration of artificial intelligence in lung cancer: Rise of the machine | |
Aghamaleki et al. | Application of an artificial neural network in the diagnosis of chronic lymphocytic leukemia | |
CN111653314A (zh) | 一种分析识别淋巴管浸润的方法 | |
CN116705296A (zh) | 一种基于常规mri序列对gbm患者进行风险分层的方法及系统 | |
Meng et al. | The application of machine learning techniques in clinical drug therapy | |
Chakrabarty et al. | MRI-based classification of IDH mutation and 1p/19q codeletion status of gliomas using a 2.5 D hybrid multi-task convolutional neural network | |
Rajan et al. | Multi-class neural networks to predict lung cancer | |
JP2015089364A (ja) | 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置 | |
Le et al. | A transfer learning approach on MRI-based radiomics signature for overall survival prediction of low-grade and high-grade gliomas | |
Targonski et al. | Cellular state transformations using deep learning for precision medicine applications | |
CN113450877A (zh) | 一种基于多重免疫组化技术的生物标志物分析方法及其应用 | |
CN116312800A (zh) | 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质 | |
US20240194294A1 (en) | Artificial-intelligence-based method for detecting tumor-derived mutation of cell-free dna, and method for early diagnosis of cancer, using same | |
Wang et al. | Diffusion tensor imaging‐based machine learning for IDH wild‐type glioblastoma stratification to reveal the biological underpinning of radiomic features | |
Demetriou et al. | AI-enhanced digital pathology and radiogenomics in precision oncology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |