CN118398203A - 基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 - Google Patents
基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 Download PDFInfo
- Publication number
- CN118398203A CN118398203A CN202410305590.2A CN202410305590A CN118398203A CN 118398203 A CN118398203 A CN 118398203A CN 202410305590 A CN202410305590 A CN 202410305590A CN 118398203 A CN118398203 A CN 118398203A
- Authority
- CN
- China
- Prior art keywords
- image
- thyroid
- papillary
- features
- molecular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010033701 Papillary thyroid cancer Diseases 0.000 title claims abstract description 104
- 208000030045 thyroid gland papillary carcinoma Diseases 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000013135 deep learning Methods 0.000 claims abstract description 44
- 238000004393 prognosis Methods 0.000 claims abstract description 25
- 210000001685 thyroid gland Anatomy 0.000 claims abstract description 18
- 238000013526 transfer learning Methods 0.000 claims abstract description 6
- 230000014509 gene expression Effects 0.000 claims description 35
- 238000012795 verification Methods 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 239000002299 complementary DNA Substances 0.000 claims description 12
- 238000000611 regression analysis Methods 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 9
- 238000013518 transcription Methods 0.000 claims description 8
- 230000035897 transcription Effects 0.000 claims description 8
- 238000003384 imaging method Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000013508 migration Methods 0.000 claims description 6
- 230000005012 migration Effects 0.000 claims description 6
- 238000002604 ultrasonography Methods 0.000 claims description 6
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000012165 high-throughput sequencing Methods 0.000 claims description 4
- 238000010839 reverse transcription Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007477 logistic regression Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000002308 calcification Effects 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 230000003902 lesion Effects 0.000 claims description 2
- 238000013139 quantization Methods 0.000 claims description 2
- 238000013523 data management Methods 0.000 claims 1
- 238000010801 machine learning Methods 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 abstract description 21
- 230000004083 survival effect Effects 0.000 abstract description 10
- 238000011282 treatment Methods 0.000 abstract description 9
- 201000011510 cancer Diseases 0.000 abstract description 8
- 208000024770 Thyroid neoplasm Diseases 0.000 abstract description 7
- 201000002510 thyroid cancer Diseases 0.000 abstract description 7
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 4
- 230000007774 longterm Effects 0.000 abstract description 4
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 238000010200 validation analysis Methods 0.000 description 26
- 230000002757 inflammatory effect Effects 0.000 description 20
- 210000001519 tissue Anatomy 0.000 description 18
- 238000013517 stratification Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 206010061819 Disease recurrence Diseases 0.000 description 2
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 2
- 102000037982 Immune checkpoint proteins Human genes 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000011337 individualized treatment Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- XMBWDFGMSWQBCA-RNFDNDRNSA-M iodine-131(1-) Chemical compound [131I-] XMBWDFGMSWQBCA-RNFDNDRNSA-M 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于影像组学的甲状腺乳头状癌分子分型预测方法,通过迁移学习方法提取超声图像的深度学习影像组学特征,构建并验证了预测基于前期发明的甲状腺微小乳头状癌新分子分型的在线无创模型,同时在两个大型队列中评估了其预测长期无病生存的性能,可用于辅助甲状腺乳头状癌患者术前手术和术后治疗的临床决策。本发明可用于帮助区分复发风险不同的甲状腺癌患者,同时已成功在网页部署,是评估甲状腺乳头状癌患者预后的简便且有效的工具,在指导甲状腺乳头状癌个体化诊疗方面具有巨大潜力。
Description
技术领域
本发明涉及精准医疗技术技术领域,特别涉及一种基于影像组学的甲状腺乳头状癌分子分型预测方法及系统。
背景技术
甲状腺乳头状癌发病率在过去几十年中显著增加,部分原因是由于改善的诊断技术和普及的超声检查。虽然甲状腺乳头状癌的预后通常较好,但一部分患者可能会面临疾病复发的风险。甲状腺乳头状癌复发可能表现为局部复发、淋巴结转移或远处转移,这些复发事件需要密切监测和进一步的治疗干预,包括手术切除、放射性碘治疗或系统性治疗。此外,由于长期的监测和治疗需要,患者可能经历额外的手术、放射性碘治疗的副作用以及心理和生活质量上的压力。因此,对于甲状腺乳头状癌患者和临床医生来说,早期识别复发风险高的患者并采取适当的监测和治疗策略至关重要。
在医学领域,预测疾病复发以及开发预测工具一直是具有挑战性的任务。对于甲状腺癌来说,ATA风险分层系统是指南上推荐的预测患者复发的工具。然而,需要注意的是,由于同一风险类别内存在临床异质性,ATA系统并不是一个完美的风险评估工具。为了解决这种异质性,肿瘤的分子亚型分类已经成为一种有价值的方法,可以对患者进行更细致的分类。许多研究已经证明,在结合转录组学和外显子分析的情况下,可以准确识别高危患者。前期本课题组在甲状腺乳头状癌患者中已经发现了一种称为“炎症型”的独特分子亚型,该亚型与其他亚型相比具有不同的肿瘤免疫微环境,且其预后更差。肿瘤免疫微环境在癌症的进展、转移和治疗反应中起着关键作用,其在预后中的预测价值已经得到各种研究的支持。然而,先前的研究大多基于术后获取的组织样本,这在一定程度上存在样本选择偏差的固有限制,特别是由于肿瘤的异质性。此外,非侵入性方法在预测肿瘤分子亚型方面可能更受到患者的接受和欢迎,因为这些方法测试过程较快、费用较低且样本获取更为容易。因此,有必要开发一种非侵入性方法来预测甲状腺乳头状癌的肿瘤分子亚型。这将有助于更好地评估患者的风险,并为个体化治疗决策提供指导。
影像学成像在提供关于肿瘤表型的信息方面具有丰富的潜力,这些表型受到癌细胞内生物过程和肿瘤浸润免疫细胞的组成和功能等的影响。通过采用定量放射成像特征方法,可以揭示特定成像特征与分子表型之间的关联。近年来,许多研究已经开始探索成像特征与肿瘤免疫微环境以及各种突变分子之间的相关性。在甲状腺乳头状癌方面,已经有研究探讨了影像与BRAF突变之间的关系。然而,对这些发现的预后价值还需要进一步研究验证。此外,之前的研究大多基于人工提取的特征,这需要耗费大量人力且结果的稳定性有限。现阶段已经有很多研究利用人工智能方法来自动提取影像中的大量特征,并建立预测肿瘤表型的模型。例如,Li等人利用超过30万张超声图像建立了诊断甲状腺癌良恶性的ResNet-50深度学习模型,该模型已经在三个外部验证队列中进行了验证,并表明在识别甲状腺癌患者方面,该深度学习模型展现出与经验丰富的医生相似的敏感性和更高的特异性。这为人工智能在甲状腺癌中的应用提供了一个成功的案例。然而,需要进一步的研究来完善这些方法,并评估其在分子表型和预后方面的效果。
将影像学成像、肿瘤免疫微环境和分子表型等信息结合起来,有望为甲状腺乳头状癌患者的治疗决策和预后评估提供更准确的依据。目前关于如本发明的一种基于影像组学的甲状腺乳头状癌分子分型预测方法还未见报道。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于影像组学的甲状腺乳头状癌分子分型预测方法及系统。
本发明第一方面提供了一种基于影像组学的甲状腺乳头状癌分子分型预测方法,包括:
收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型;
获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征;
基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征;
引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头状癌分子分型预测模型,并在网页上部署所述预测模型;
对所述预测模型进行预后价值评估,得到预后价值评估结果。
本方案中,所述收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型,具体为:
收集两个不同中心的甲状腺乳头状癌患者的组织样本;
提取所述组织样本的总RNA,通过将总RNA进行逆转录为互补的cDNA,对所述cDNA进行建库操作;
通过高通量测序技术对建库的cDNA进行测序,得到基因表达数据;
获取参考基因组,将所述基因表达数据与参考基因组进行对比,识别并量化所述组织样本的基因表达水平;
比较甲状腺乳头状癌患者的基因表达数据与相应正常组织样本的数据,以识别差异表达的基因,将差异表达的基因进行聚类,识别患者之间的分子分型模式,得到聚类分析结果;
基于聚类分析结果,确定甲状腺乳头状癌的分子分型。
本方案中,所述获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征,具体为:
获取术前一个月内甲状腺乳头状癌患者的超声检查图像,获取标准甲状腺超声图像数据;
基于图像识别算法获取标准甲状腺超声图像数据的图像特征,所述图像特征包括图像轮廓特征、超声图像阴影特征;
根据所述图像特征对所述超声检查图像进行甲状腺超声图像进行识别,得到甲状腺乳头状癌患者的甲状腺超声检查图像;
利用迁移学习方法基于ResNet50预训练权重模型,将所述甲状腺超声检查图像导入所述模型中进行特征提取,得到甲状腺超声检查图像的深度学习影像特征,所述深度学习影像特征为纹理特征、钙化灶特征、囊性结构特征、占位性病变特征、超声回声强度特征。
本方案中,所述基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征,具体为:
引入Pearson相关性检验,将每个深度学习影像特征进行量化操作,得到量化特征;
通过所述量化特征识别深度学习影像特征的特征变量,计算所述特征变量中每个特征变量之间的Pearson相关性系数,得到特征变量之间的特征变量相关性数据;
根据所述特征变量相关型数据对相关性系数大于预设值的特征变量进行去除操作,得到降冗深度学习影像特征。
本方案中,所述引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头癌分子分型预测模型,并在网页上部署所述预测模型,具体为:
通过LASSO logistic回归分析算法对甲状腺乳头状癌的分子分型与所述降冗深度学习影像特征进行相关性分析,得到分子分型相关性数据,并通过十折交叉验证方法对所述分子分型相关性数据进行验证操作;
根据所述分子分型相关性数据确定与分子分型的强相关特征;
建立甲状腺乳头状癌分子分型预测模型,将所述强相关特征导入所述预测模型中进行训练,得到完整的甲状腺乳头状癌分子分型预测模型,将所述完整的甲状腺乳头状癌分子分型预测模型在网页上进行部署。
本方案中,所述对所述预测模型进行预后价值评估,得到预后价值评估结果,具体为:
获取两个预设样本量的验证队列,所述验证队列包括内部验证队列和外部验证队列2;
将所述验证队列导入甲状腺乳头状癌分子分型预测模型模型中对分子分型预测模型预后价值进行评估,得到评估结果;
根据所述评估结果确定所述预测模型的性能进行评估,得到模型性能评估结果。
本方案中,所述将所述完整的甲状腺乳头状癌分子分型预测模型在网页上进行部署中的网页部署工具为R软件和R包“shiny”;
本方案中,所述对分子分型预测模型预后价值进行评估是采用单因素COX、多因素COX和亚组分析完成的;
本发明第二方面还提供了一种基于影像组学的甲状腺乳头状癌分子分型预测系统,该系统包括:存储器、处理器,所述存储器中包括基于影像组学的甲状腺乳头状癌分子分型预测方法程序,所述基于影像组学的甲状腺乳头状癌分子分型预测方法程序被所述处理器执行时,实现如下步骤:
收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型;
获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征;
基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征;
引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头状癌分子分型预测模型,并在网页上部署所述预测模型;
对所述预测模型进行预后价值评估,得到预后价值评估结果。
本方案中,所述收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型,具体为:
收集两个不同中心的甲状腺乳头状癌患者的组织样本;
提取所述组织样本的总RNA,通过将总RNA进行逆转录为互补的cDNA,对所述cDNA进行建库操作;
通过高通量测序技术对建库的cDNA进行测序,得到基因表达数据;
获取参考基因组,将所述基因表达数据与参考基因组进行对比,识别并量化所述组织样本的基因表达水平;
比较甲状腺乳头状癌患者的基因表达数据与相应正常组织样本的数据,以识别差异表达的基因,将差异表达的基因进行聚类,识别患者之间的分子分型模式,得到聚类分析结果;
基于聚类分析结果,确定甲状腺乳头状癌的分子分型
本发明公开了一种基于影像组学的甲状腺乳头状癌分子分型预测方法,通过迁移学习方法提取超声图像的深度学习影像组学特征,构建并验证了预测基于前期发明的甲状腺微小乳头状癌新分子分型的在线无创模型,同时在两个大型队列中评估了其预测长期无病生存的性能,可用于辅助甲状腺乳头状癌患者术前手术和术后治疗的临床决策。本发明可用于帮助区分复发风险不同的甲状腺癌患者,同时已成功在网页部署,是评估甲状腺乳头状癌患者预后的简便且有效的工具,在指导甲状腺乳头状癌个体化诊疗方面具有巨大潜力。
附图说明
图1示出了本发明一种基于影像组学的甲状腺乳头状癌分子分型预测方法的流程图;
图2a示出了对甲状腺乳头状癌患者进行分子分型的示意图;
图2b示出了分子分型的临床特征示意图;
图2c-e示出了肿瘤免疫微环境特征示意图;
图2f示出了使用K-M生存分析评估不同分子分型的生存差异示意图;
图3示出了基于影像组学特征建立和验证预测分子分型的影像组学标签;
图3a示出了基于影像组学特征建立和验证预测分子分型的影像组学标签;
图3b示出了去除强相关特征后剩余深度学习放射特征的LASSO系数分布图;
图3c示出了纳入LASSO系数大于0.5的深度学习放射特征再次通过10倍交叉验证对LASSO模型调整参数λ的选择;
图3d示出了系数大于0.5的深度学习放射特征的LASSO系数分布图;
图3e示出了最终预测分子分型影像组学标签即DLRI纳入的深度学习放射特征及其系数;
图3f示出了DLRI在训练集的受试者工作特征曲线以及炎症型和非炎症型的分布对比;
图3g示出了DLRI在外部验证队列1的受试者工作特征曲线以及炎症型和非炎症型的分布对比;
图3h示出了基于网页部署的DLRI在线工具;
图4a示出了在内部验证队列中DLRI不同风险分组的K-M生存曲线;
图4b示出了在外部验证队列2中DLRI不同风险分组的K-M生存曲线。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于影像组学的甲状腺乳头状癌分子分型预测方法的流程图。
如图1所示,本发明第一方面提供了一种基于影像组学的甲状腺乳头状癌分子分型预测方法,包括:
1.本实施例收集两个不同中心(训练集和外部验证队列1)的甲状腺乳头状癌患者的组织样本,对其进行全转录组测序,得到基因表达数据,对外部验证队列1患者进行分子分型判断(图2a),对不同分子分型患者的提示炎症反应的临床指标(TPOAb和TgAb)进行对比,并采用单样本富集分析以评估外部验证队列1中不同分子分型的免疫状态,同时采用反卷积法对其免疫细胞浸润丰度进行评估,最后对免疫检查点相关基因的表达情况进行分析,综合评估前期发明预测分子分型的准确性,如图2b-e所示。与此同时,对不同分子分型患者的生存曲线进行对比,评估分子分型在外部验证队列1患者中的预后预测性能,如图2f所示。结果显示,根据前期发明,外部验证队列1中30例患者被预测为炎症亚型,46例被预测为非炎症型患者;炎症型患者拥有更多的TgAb阳性患者(P=0.017);炎症型患者表现出免疫得分的升高、T细胞的聚集及免疫检查点的高表达(P<0.05);炎症型患者较非炎症型患者预后更差(P=0.005);这些特征与前期发明中炎症亚型患者的特征一致,提示前期发明在筛选炎症型患者上的准确性。
2.本实施例纳入训练集和外部验证队列1患者的术前超声图像,利用迁移学习方法基于ResNet50预训练权重提取图像的深度学习影像组特征,共2048个。在训练集,首先去除高度相关(Pearson r>0.8)的特征(427个,保留1621个),再经过LASSO logistic回归选择与炎症亚型密切相关的特征,最终选择系数绝对值大于0.5的32个变量进行最终DLRI的建立。DLRI的建立过程及最终纳入的各项特征的系数见图3a-e。接着,在训练集和外部验证队列1中验证DLRI预测炎症亚型的性能。根据图3f所示,DLRI在训练集的AUC为0.97[95%可信区间(Confidence Interval,CI):0.93-1],且根据约登指数其最佳截断值为0.91,据此将患者分为DLRI低风险组(DLRI评分<0.91)和DLRI高风险组(DLRI评分≥0.91),同时炎症亚型的DLRI评分明显高于非炎症亚型的DLRI评分。根据图3g所示,DLRI在外部验证队列1中的AUC为0.82(95% CI:0.93-1),炎症亚型的DLRI评分明显高于非炎症亚型的DLRI评分。这些结果说明DLRI在筛选炎症型患者上表现佳。最后在网页成功部署DLRI(图3h),在线工具可在https://dlri20240227.shinyapps.io/shiny/使用。
3.本实施例同时纳入两个大样本量的验证队列(内部验证队列和外部验证队列2)来评估DLRI对甲状腺乳头状癌患者预后预测能力的评估。内部验证队列包含1108例甲状腺乳头状癌患者,根据DLRI和最佳截断值将患者分为DLRI高风险组(375,33.8%)和DLRI低风险组(733,66.2%)。外部验证队列2包含1258例甲状腺乳头状癌患者,根据DLRI和最佳截断值同样将患者分为DLRI高风险组(405,32.3%)和DLRI低风险组(853,67.8%)。K-M曲线明确表明,内部验证队列和外部验证队列2中高风险组和低风险组患者之间的预后分层具有统计学意义(P<0.05,图4)。此外,单因素COX分析和多因素COX分析显示,DLRI风险分层在两个大型验证队列中均是影响患者预后的独立危险因素(表1-4)。亚组分析显示,DLRI风险分层同样在大部分亚组中都是一个强有力的预后预测因子,且在甲状腺微小乳头状癌(肿瘤直径≤1cm)以及临床TNM分期为早期(I期和II期)的亚组,DLRI仍然可区分这些通常被认为预后较好的亚组中预后较差的患者(表5和表6)。
4.本实施例同时对比分析了DLRI与影像特征直接预测预后标签(DLRS)、2015ATA复发风险分层(2015ATA-RR)以及DLRI联合2015ATA-RR建立的模型(DLRI+2015ATA模型)在预测甲状腺乳头状癌患者预后方面的性能。根据表7所示,在拟合优度方面,DLRI在内部验证队列优和外部验证队列中均优于DLRS以及2015ATA-RR,同时DLRI可提高2015ATA-RR的拟合优度,两者联合的模型在所有模型中表现最优。预测精度方面,DLRI的C指数和时间依赖AUC在内部验证队列和外部验证队列2中均高于其他模型,同时DLRI联合2015ATA-RR建立的模型在内部验证队列中其C指数高达0.87,大幅度提升了2015ATA-RR模型的预测精度。综合来看,DLRI在预测预后方面拥有更好的区分能力,且具有更高的稳定性,外推性佳。
表1 DLRI风险分组和其他临床特征在内部验证队列中的单因素CoxPH回归分析
表2 DLRI风险分组和其他临床特征在内部验证队列中的多因素CoxPH回归分析
表3 DLRI风险分组和其他临床特征在外部验证队列2中的单因素CoxPH回归分析
表4 DLRI风险分组和其他临床特征在外部验证队列2中的多因素CoxPH回归分析
表5内部验证队列其他临床特征中DLRI风险分组与无病生存关系的亚组分析
表6外部验证队列2其他临床特征中DLRI风险分组与无病生存关系的亚组分析
表7 DLRI与其他模型预后性能的比较
本发明公开了一种基于影像组学的甲状腺乳头状癌分子分型预测方法,通过迁移学习方法提取超声图像的深度学习影像组学特征,构建并验证了预测基于前期发明的甲状腺微小乳头状癌新分子分型的在线无创模型,同时在两个大型队列中评估了其预测长期无病生存的性能,可用于辅助甲状腺乳头状癌患者术前手术和术后治疗的临床决策。本发明可用于帮助区分复发风险不同的甲状腺癌患者,同时已成功在网页部署,是评估甲状腺乳头状癌患者预后的简便且有效的工具,在指导甲状腺乳头状癌个体化诊疗方面具有巨大潜力。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,包括以下步骤:
收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型;
获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征;
基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征;
引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头状癌分子分型预测模型,并在网页上部署所述预测模型;
对所述预测模型进行预后价值评估,得到预后价值评估结果。
2.根据权利要求1所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型,具体为:
收集两个不同中心的甲状腺乳头状癌患者的组织样本,所述两个不同中心为训练集和外部验证队列1,所述训练集和外部验证队列1为机器学习中进行模型训练的数据集;
提取所述组织样本的总RNA,通过将总RNA进行逆转录为互补的cDNA,对所述cDNA进行建库操作;
通过高通量测序技术对建库的cDNA进行测序,得到基因表达数据;
获取参考基因组,将所述基因表达数据与参考基因组进行对比,识别并量化所述组织样本的基因表达水平;
比较甲状腺乳头状癌患者的基因表达数据与相应正常组织样本的数据,以识别差异表达的基因,将差异表达的基因进行聚类,识别患者之间的分子分型模式,得到聚类分析结果;
基于聚类分析结果,确定甲状腺乳头状癌的分子分型,所述确定甲状腺乳头状癌的分子分型为对患者进行分类,识别不同的分型或亚型,并了解其在分子水平上的差异。
3.根据权利要求1所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征,具体为:
获取术前一个月内甲状腺乳头状癌患者的超声检查图像,获取标准甲状腺超声图像数据;
基于图像识别算法获取标准甲状腺超声图像数据的图像特征,所述图像特征包括图像轮廓特征、超声图像阴影特征;
根据所述图像特征对所述超声检查图像进行甲状腺超声图像进行识别,得到甲状腺乳头状癌患者的甲状腺超声检查图像;
利用迁移学习方法基于ResNet50预训练权重模型,将所述甲状腺超声检查图像导入所述模型中进行特征提取,得到甲状腺超声检查图像的深度学习影像特征,所述深度学习影像特征代表超声图像中的高级语义信息,捕获到与甲状腺乳头状癌相关的特征模式和结构,所述深度学习影像特征为纹理特征、钙化灶特征、囊性结构特征、占位性病变特征、超声回声强度特征。
4.根据权利要求1所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征,具体为:
引入Pearson相关性检验,将每个深度学习影像特征进行量化操作,得到量化特征;
通过所述量化特征识别深度学习影像特征的特征变量,计算所述特征变量中每个特征变量之间的Pearson相关性系数,得到特征变量之间的特征变量相关性数据;
根据所述特征变量相关型数据对相关性系数大于预设值的特征变量进行去除操作,得到降冗深度学习影像特征。
5.根据权利要求1所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头癌分子分型预测模型,并在网页上部署所述预测模型,具体为:
通过LASSO logistic回归分析算法对甲状腺乳头状癌的分子分型与所述降冗深度学习影像特征进行相关性分析,得到分子分型相关性数据,并通过十折交叉验证方法对所述分子分型相关性数据进行验证操作;
根据所述分子分型相关性数据确定与分子分型的强相关特征;
建立甲状腺乳头状癌分子分型预测模型,将所述强相关特征导入所述预测模型中进行训练,得到完整的甲状腺乳头状癌分子分型预测模型,将所述完整的甲状腺乳头状癌分子分型预测模型在网页上进行部署。
6.根据权利要求1所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述对所述预测模型进行预后价值评估,得到预后价值评估结果,具体为:
获取两个预设样本量的验证队列,所述验证队列包括内部验证队列和外部验证队列2;
将所述验证队列导入甲状腺乳头状癌分子分型预测模型模型中对分子分型预测模型预后价值进行评估,得到评估结果;
根据所述评估结果确定所述预测模型的性能进行评估,得到模型性能评估结果。
7.根据权利要求5所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述将所述完整的甲状腺乳头状癌分子分型预测模型在网页上进行部署中的网页部署工具为R软件和R包“shiny”。
8.根据权利要求6所述的一种基于影像组学的甲状腺乳头状癌分子分型预测方法,其特征在于,所述对分子分型预测模型预后价值进行评估是采用单因素COX、多因素COX和亚组分析完成的。
9.一种基于影像组学的甲状腺乳头状癌分子分型预测系统,其特征在于,所述基于影像组学的甲状腺乳头状癌分子分型预测系统包括储存器以及处理器,所述储存器包括基于影像组学的甲状腺乳头状癌分子分型预测方法程序,所述基于影像组学的甲状腺乳头状癌分子分型预测方法程序被所述处理器执行时,实现如下步骤:
收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型;
获取甲状腺乳头状癌患者历史预设时间段内的超声图像数据,通过迁移学习方法对所述超声图像数据进行特征提取,得到深度学习影像特征;
基于过滤法对所述深度学习影像特征的强相关变量进行识别,对所述强相关变量进行去除操作,得到降冗深度学习影像特征;
引入回归分析方法,基于降冗深度学习影像特征建立甲状腺乳头状癌分子分型预测模型,并在网页上部署所述预测模型;
对所述预测模型进行预后价值评估,得到预后价值评估结果。
10.根据权利要求9所述的一种用于工程综合调度的主数据管理系统,其特征在于,所述收集甲状腺乳头状癌患者的组织样本,对所述组织样本进行全转录测序,得到基因表达数据,根据所述基因表达数据确定甲状腺乳头状癌的分子分型,具体为:
收集两个不同中心的甲状腺乳头状癌患者的组织样本;
提取所述组织样本的总RNA,通过将总RNA进行逆转录为互补的cDNA,对所述cDNA进行建库操作;
通过高通量测序技术对建库的cDNA进行测序,得到基因表达数据;
获取参考基因组,将所述基因表达数据与参考基因组进行对比,识别并量化所述组织样本的基因表达水平;
比较甲状腺乳头状癌患者的基因表达数据与相应正常组织样本的数据,以识别差异表达的基因,将差异表达的基因进行聚类,识别患者之间的分子分型模式,得到聚类分析结果;
基于聚类分析结果,确定甲状腺乳头状癌的分子分型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410305590.2A CN118398203A (zh) | 2024-03-18 | 2024-03-18 | 基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410305590.2A CN118398203A (zh) | 2024-03-18 | 2024-03-18 | 基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118398203A true CN118398203A (zh) | 2024-07-26 |
Family
ID=92007075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410305590.2A Pending CN118398203A (zh) | 2024-03-18 | 2024-03-18 | 基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118398203A (zh) |
-
2024
- 2024-03-18 CN CN202410305590.2A patent/CN118398203A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10713590B2 (en) | Bagged filtering method for selection and deselection of features for classification | |
CN108021788B (zh) | 基于细胞游离dna的深度测序数据提取生物标记物的方法和装置 | |
CN113234829B (zh) | 结肠癌预后评估基因集及其构建方法 | |
CN104046624B (zh) | 用于肺癌预后的基因及其应用 | |
CN115410713A (zh) | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 | |
CN111833963A (zh) | 一种cfDNA分类方法、装置和用途 | |
Li et al. | Multi-omics integrated circulating cell-free DNA genomic signatures enhanced the diagnostic performance of early-stage lung cancer and postoperative minimal residual disease | |
CN113257360A (zh) | 癌症筛查模型、癌症筛查模型的构建方法及构建装置 | |
CN115896242A (zh) | 一种基于外周血免疫特征的癌症智能筛查模型及方法 | |
Chen et al. | Progression-free survival prediction in small cell lung cancer based on Radiomics analysis of contrast-enhanced CT | |
CN115274118A (zh) | 一种构建睾丸肿瘤诊断和术后复发风险预测模型的方法 | |
CN114807377A (zh) | 膀胱癌预后生存期标志物的应用、评估装置以及计算机可读取介质 | |
CN111584064A (zh) | 一种结、直肠癌转移预测系统及其使用方法 | |
CN113362893A (zh) | 肿瘤筛查模型的构建方法及应用 | |
CN110760585A (zh) | 前列腺癌生物标志物及其应用 | |
Gao et al. | Radiomics analysis based on ultrasound images to distinguish the tumor stage and pathological grade of bladder cancer | |
CN117711615A (zh) | 基于影像组学的淋巴结转移状态分类预测方法及设备 | |
CN112382341A (zh) | 一种用于鉴定食管鳞癌预后相关的生物标志物的方法 | |
CN116805509A (zh) | 结直肠癌免疫治疗预测标志物的构建方法及应用 | |
CN113362897A (zh) | 基于核小体分布特征的肿瘤标志物筛选方法及应用 | |
CN118398203A (zh) | 基于影像组学的甲状腺乳头状癌分子分型预测方法及系统 | |
KR20240035560A (ko) | 향후 폐암의 위험을 예측하기 위한 시스템 및 방법 | |
Patra et al. | Two-layer deep feature fusion for detection of breast cancer using thermography images | |
KR20220133516A (ko) | 인공지능 기반 무세포 dna의 종양 유래 변이 검출 방법 및 이를 이용한 암 조기 진단 방법 | |
CN116646088B (zh) | 一种预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |