CN112185569A - 一种乳腺癌患者无病生存期预测模型及其构建方法 - Google Patents

一种乳腺癌患者无病生存期预测模型及其构建方法 Download PDF

Info

Publication number
CN112185569A
CN112185569A CN202010958385.8A CN202010958385A CN112185569A CN 112185569 A CN112185569 A CN 112185569A CN 202010958385 A CN202010958385 A CN 202010958385A CN 112185569 A CN112185569 A CN 112185569A
Authority
CN
China
Prior art keywords
prediction model
clinical
model
disease
free survival
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010958385.8A
Other languages
English (en)
Other versions
CN112185569B (zh
Inventor
姚和瑞
宋尔卫
余运芳
谭钰洁
陈勇健
何子凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Original Assignee
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen Memorial Hospital Sun Yat Sen University filed Critical Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority to CN202010958385.8A priority Critical patent/CN112185569B/zh
Publication of CN112185569A publication Critical patent/CN112185569A/zh
Application granted granted Critical
Publication of CN112185569B publication Critical patent/CN112185569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • A61B5/004Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room adapted for image acquisition of a particular organ or body part
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4306Detecting, measuring or recording for evaluating the reproductive systems for evaluating the female reproductive systems, e.g. gynaecological evaluations
    • A61B5/4312Breast evaluation or disorder diagnosis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本发明公开了一种乳腺癌患者无病生存期预测模型及其构建方法,本发明利用人工智能机器学习算法,基于乳腺癌患者的磁共振影像数据及临床特征数据基础,建立乳腺癌患者无病生存期的人工智能预测模型,可以将早期乳腺癌患者有效分为高危风险组和低危风险组。所述预测模型具有精准、简便、无创等优点,能够有效对早期乳腺癌患者术后无病生存期进行有效评价,有助于协助临床医生优化治疗方案,及早地对高危患者加强治疗干预,减少患者的复发风险,对指导临床治疗策略、加强临床治疗干预及后续的个体化随访具有重要的指导意义。

Description

一种乳腺癌患者无病生存期预测模型及其构建方法
技术领域
本发明属于生物医药领域,涉及一种乳腺癌患者无病生存期预测模型及其构建方法。
背景技术
乳腺癌是严重危害女性健康的恶性肿瘤,占女性恶性肿瘤发病率第一位,死亡率第五位,发病率亦呈逐年上升趋势。大约30%-40%的乳腺癌患者在接受手术及术后辅助治疗后,出现复发转移,最终发展为晚期乳腺癌,并且5年生存率不足23%。早期乳腺癌的复发转移风险研究显示,除年龄、肿瘤大小之外,术前腋窝淋巴结(ALN)状态、新辅助化疗后是否达病理完全缓解(pCR)、分子分型及相关基因表达情况等,也是评价预后的重要指标。
乳腺癌患者腋窝淋巴结状态影响手术方案及系统治疗决策,也作为肿瘤复发转移的独立危险因素。目前诊断方法主要为术前淋巴结穿刺术、术中前哨淋巴结活检(SLNB)与腋窝淋巴结清扫术(ALND)。术前进行淋巴结穿刺,或术中SLNB能使腋窝淋巴结阴性的乳腺癌患者可免行ALND,但两者方法均存在一定的假阴性率,且具有一定有创性。新辅助化疗现已成为局部晚期及部分早期乳癌的标准治疗方式之一。研究显示,20-30%新辅助化疗敏感者可达到pCR状态,且具有更好的无病生存期和总生存,pCR已成为远期生存获益的一个重要的预后因素。目前,只有手术病理检测是评估患者是否达到pCR的金标准。同时,基于分子分型、生物标志物、肿瘤分期等临床特征,相关的早期乳腺癌的复发风险预测模型发挥了一定作用但缺乏普适性。例如,通过21基因,70基因的检测进行肿瘤复发风险预测,使得70%临床低复发风险的早期乳腺癌患者免除辅助化疗。但是,这些手段大都限于特定人群的预测,更是缺乏有高证据级别的前瞻性研究支持。另外,一些重要的乳腺癌分子分型还尚无统一诊疗预测标准,比如预后较差的其他类型的三阴性乳腺癌人群。
发明内容
针对上述问题,本发明的目的是提供一种精准、简便、非有创性的早期乳腺癌患者术后无病生存期(DFS)的预测模型及其构建方法。
为实现上述目的,本发明采取的技术方案为:一种乳腺癌患者无病生存期预测模型的构建方法,包括以下步骤:
(1)、数据收集:收集和处理患者的磁共振图像数据、临床特征数据和随访资料数据;
(2)、建立影像组学预测模型:通过随机森林筛选磁共振图像数据中影响无病生存期的关键特征,并根据Cox比例风险模型建立相应的无病生存期预测模型;
(3)、建立临床病理特征预测模型:通过Cox比例风险模型筛选临床病理特征,并通过Cox比例风险模型建立基于临床特征的无病生存期预测模型;
(4)、建立综合预测模型:基于步骤(2)、(3)的模型,通过Cox比例风险模型得到综合预测模型。
本发明方法通过人工智能机器学习算法,以乳腺癌患者的磁共振(MR)影像数据、临床特征数据和随访资料基础,建立乳腺癌患者无病生存期的人工智能预测模型,对指导临床治疗策略、加强临床治疗干预及后续的个体化随访具有重要的指导意义。
作为本发明的优选实施方式,所述方法还包括将所述综合预测模型可视化生成相应的生成相应的可视化的列线图和/或进行验证的步骤。
生成列线图(nomogram)的可视化形式,模型更直观、简单,便于对该模型进行推广、应用。通过对模型进行验证可有效评估模型的效能。
更优选地,所述验证的步骤为通过R语言“pROC”数据包绘制诊断特异性曲线和/或临床决策分析曲线对所述综合预测模型进行分析。
通过计算诊断特异性曲线(即受试者工作特征曲线,receiver operatingcharacteristic curve,简称ROC曲线)相应的曲线下面积(AUC),可用于判断模型的准确性。AUC越接近于1,说明诊断效果越好。
临床决策分析曲线(Decision Curve Analysis,DCA)可进一步分析模型的临床应用价值,并指导实际应用。
作为本发明的优选实施方式,步骤(1)中所述的磁共振图像数据为患者使用1.5T或3.0T场强磁体进行乳腺磁共振成像检查得到数据,所述数据包括T1平扫增强序列、T2加权序列和扩散加权成像序列表观扩散系数序列。
作为本发明的优选实施方式,步骤(1)中所述磁共振图像数据的处理方式为:结合乳腺钼靶报告、乳腺超声检查报告和临床触诊中给出关于病变定位的信息,在所述图像序列中,依次对包含原发肿瘤和腋窝淋巴结的每个层面进行靶区边缘的勾画,提取包括形状、强度、纹理和小波的影像学特征。
作为本发明的优选实施方式,步骤(1)中所述的临床特征数据包括:确诊年龄、肿瘤个数、肿瘤大小、病理类型、病理组织学分级、临床肿瘤分期、临床淋巴结分期、病理肿瘤分期、病理淋巴结分期、病理TNM分期、ER状态、PR状态、HER-2状态、分子分型和手术方式。
作为本发明的优选实施方式,所述步骤(2)为:在全队列中进行了无监督一致聚类,进一步通过随机森林算法筛选得到影响患者无病生存期的关键因素。
作为本发明的优选实施方式,所述步骤(2)中的影像组学预测模型为联合T1+C、T2WI、DWI-ADC的多序列影像组学预测模型
本发明还要求保护所述方法构建的乳腺癌患者无病生存期预测模型。
作为本发明的优选实施方式,本发明提供了一种乳腺癌患者无病生存期的预测模型,所述预测模型包括风险预测公式=β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
Figure BDA0002677413260000031
Figure BDA0002677413260000041
Figure BDA0002677413260000051
Figure BDA0002677413260000061
使用该模型时,影像预测模型中各特征值为由提取软件自动生成得到,临床特征根据患者的情况进行赋值。假设患者有2个肿瘤,病理组织学分级为I,临床肿瘤分期为pT1,临床淋巴结分期为pN1,PR状态为阴性,Ki67表达为15~35,手术方式为保乳手术,则相应的临床特征模型分值为=0.9420×2+0.3346×1-0.0160×1+0.8280×2-0.4022×1+0.3440×2-0.5657×2,其余同理进行计算。
作为本发明的优选实施方式,所述预测模型还包括列线图;所述列线图包括第一行分数,分值范围为0~100;第二行多序列影像预测模型,分值范围为-1~2,分别对应第一行分值范围0~100均匀分布;第三行临床特征模型,分值范围为-1~2,分别对应第一行分值范围0~4均匀分布;第四行总分,分值范围为0~200;第五行为1年无病生存期概率,分值范围为0.9~0.4,对应第四行总分分值范围135~184非均匀分布;第六行为2年无病生存期概率,分值范围为0.9~0.1,对应第四行总分分值范围114~185非均匀分布;第七行为3年无病生存期概率,分值范围为0.9~0.1,对应第四行总分分值范围108~180非均匀分布。
所述列线图为根据得到的综合预测模型通过软件处理得到,更简洁、直观。根据多序列影像预测模型或临床特征模型计算得到的值,分别投射到第一行得到相应的分值,所述第四行总分为根据第二行多序列影像预测模型的分值投射到第一行分数和第三行临床特征模型的分值投射到第一行分数计算得到的总和,所述第四行总分投射到第五行数值,即为相应的患者第一年无病生存期概率,所述第四行总分投射到第六行数值,即为相应的患者第二年无病生存期概率,所述第四行总分投射到第七行数值,即为相应的患者第三年无病生存期概率。
本发明利用人工智能机器学习算法,基于乳腺癌患者的MR影像及临床特征数据基础,建立乳腺癌患者无病生存期的人工智能预测模型,可以将早期乳腺癌患者有效分为高危风险组和低危风险组。所述预测模型具有精准、简便、无创等优点,能够有效对早期乳腺癌患者术后无病生存期进行有效评价,有助于协助临床医生优化治疗方案,及早地对高危患者加强治疗干预,减少患者的复发风险,对指导临床治疗策略、加强临床治疗干预及后续的个体化随访具有重要的指导意义。
附图说明
图1为本发明构建乳腺癌患者无病生存期预测模型的技术路线。
图2为本发明综合预测模型的nomogram用于区分的高、低危风险患者。
图3为通过ROC曲线对本发明综合预测模型的效能评价结果。
图4为本发明综合预测模型、多序列影像预测模型、临床病理特征预测模型在训练组队列的临床决策性曲线分析结果。
图5为本发明综合预测模型多序列影像预测模型、临床病理特征预测模型在验证队列和全队列的临床决策性曲线分析结果。
图6为本发明乳腺癌患者无病生存期综合预测模型列线图。
具体实施方式
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。
本发明一种乳腺癌患者无病生存期预测模型的构建过程如下(技术路线如图1所示):
1.患者筛选
入组标准:(1)女性患者,年龄大于18岁;(2)早期乳腺癌患者(TNM分期I-III,根据8版AJCC分期);(3)患者已行病理组织学确诊为单侧原发乳腺癌,无伴远处器官转移;(4)患者已行手术或者腋窝淋巴结清扫手术,并行病理活检确定腋窝淋巴结状态;(5)已行术前乳腺及腋窝区域磁共振检查,包括T1平扫增强序列(T1+C)、T2加权序列(T2WI)、扩散加权成像序列表观扩散系数序列(DWI-ADC)。
排除标准:(1)患者在外部机构进行活检,且无法获得病理结果;(2)既往曾患除乳腺癌以外的肿瘤且未完全切除或完全切除该肿瘤少于3年;(3)MR造影质量不足以获得测量结果;(4)乳腺肿瘤与ALN在MR及术后病理检查中的相关性不明确。
根据上述标准,我们共对4家临床机构入组1717例早期乳腺癌患者进行入排筛选,有1214例患者符合入组。对符合入组条件病例进行收集磁共振图像、临床特征、随访资料等数据收集。评估病例数据质量,建立人工智能平台电子数据知识库。
2.患者样本数据收集和处理
(1)、磁共振图像的采集与数据处理
i.磁共振图像采集
收集患者1.5T或3.0T场强磁体进行乳腺MR成像结果。本发明数据的磁共振图像采集如下表1所示:
表1本发明的磁共振图像数据来源
Figure BDA0002677413260000081
Figure BDA0002677413260000091
Figure BDA0002677413260000101
ii.图像切割
请具有多年经验的放射科医师在每例病例中标注磁共振影像疑似乳腺癌肿瘤部位,利用3D Slicer 4.10.2软件在T1+C序列、T2WI序列、DWI-ADC序列中进行ROI勾画。勾画原则:依次对包含原发肿瘤和腋窝淋巴结的每个层面进行靶区边缘的勾画。为保证肿瘤及淋巴结勾画的准确性,两位医师双盲、独立勾画靶区。进一步结合乳腺钼靶报告、乳腺超声检查报告和临床触诊中给出关于病变定位的信息。
iii.影像组学特征的提取
利用3D Slicer 4.10.2软件的N4ITK模版对所有的磁共振图像转化为0-255(该模块的代码是N4算法)的强度,进行归一化处理,从而减少不同机器不同参数导致的磁共振图像的差异,使预测模型更具普适性。
在对应的肿瘤区域或腋窝淋巴结区域ROI范围内进行特征提取,我们提取的特征主要包括形状、强度、纹理和小波在内的各种影像学特征。
形状特征主要包括对肿瘤形状特性的描述,比如肿瘤长度、体积、表面积、边缘是否光滑等;强度特征主要是基于灰度的统计量,包含不限于肿瘤灰度的均值、方差、偏度、峰度等。
纹理特征的提取主要是基于灰度共生矩阵(gray-level co-occurrencematrix),灰度游程矩阵(gray-level run-length matrix)和灰度区域大小矩阵(gray-level size zone matrix)。
小波特征的提取基于对图像进行多尺度的小波滤波处理,然后对不同小波域的图像进行特征提取工作。
肿瘤或腋窝淋巴结的三维特征,具体包括8个形状特征,17个一阶统计特征,22个灰度共生矩阵(gray-level co-occurrence matrix)特征,14个灰度级游程矩阵(gray-level run-length matrix)特征,5个邻域灰度差矩阵(neigbouring gray tonedifference matrix)特征,从原始图像中提取13个灰度级区域矩阵(gray-level sizezone matrix)特征。然后应用3D Coiflet小波变换将原始图像分解为具有不同信号频率尺度的8个新图像。因此,每个序列(T1+C、T2WI、DWI-ADC)MR图像共可提取863个特征。
(2)、临床特征数据采集
临床特征信息采集内容包括:确诊年龄、肿瘤个数、肿瘤大小、病理类型、病理组织学分级、临床肿瘤分期、临床淋巴结分期、病理肿瘤分期、病理淋巴结分期、病理TNM分期、ER状态、PR状态、HER-2状态、分子分型、手术方式。
(3)、随访资料数据采集
随访资料采集内容主要为患者DFS时间,即从手术切除到手术后疾病复发或死亡(以先到者为准)的时间。
3.模型构建
将入组的1214例患者(全队列)以7:3的比例随机分为训练组队列(849例)及验证组队列(365例)。
(1)、基于磁共振影像特征建立预测无病生存期的影像预测模型
使用随机森林算法筛选出各序列中关键的影像特征(T1+C、T2WI、DWI-ADC序列均为30个),并利用Cox比例风险模型基于影像特征建立DFS预测模型:包括T1+C单序列影像预测模型、T2WI单序列影像预测模型和DWI-ADC单序列影像预测模型;其公式=β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
表2影像预测模型
Figure BDA0002677413260000121
Figure BDA0002677413260000131
Figure BDA0002677413260000141
进一步地,基于得到的单序列影像预测模型,通过Cox比例风险模型建立多序列影像预测模型,所述多序列影像预测模型的公式=β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
表3多序列影像预测模型
Figure BDA0002677413260000142
在训练组队列中绘制ROC曲线,结果显示:T1+C序列的1年、2年、3年DFS的预测效能AUC分别为0.81,0.78,0.73;T2WI序列的1年DFS、2年DFS和3年DFS的预测效能AUC分别为0.79,0.79,0.76;DWI-ADC序列的1年DFS、2年DFS和3年DFS的预测效能AUC分别为0.75,0.78,0.77。
T1+C单序列影像预测模型、T2WI单序列影像预测模型、DWIADC单序列影像预测模型联合建立的多序列影像特征模型的预测效能较单序列预测模型高,AUC分别为0.80,0.83,0.81。进一步在验证组队列和全队列中对模型进行验证,结果表明模型在验证组队列和全队列中也具有良好的预测效果。
进一步采用Kaplan-Meier法对多序列影像预测模型中训练队列中的患者进行生存分析,通过log-rank检验分析比较生存率的差别。结果显示,可将其分为高、低风险两组(HR=0.09,95%CI:0.05-0.17;P<0.001)。这个分组方式在验证组队列患者(HR=0.31,95%CI:0.10-1.00;P=0.45)及全队列患者(HR=0.12,95%CI:0.07-0.21;P<0.001)中具有良好的区分效能。
(2)、基于临床特征建立预测无病生存期的临床预测模型
采用Cox比例风险模型分别对训练组队列中患者临床病理特征进行单因素分析,发现肿瘤数量多,病理组织学分级高,病理TNM分期高,PR阴性,Ki67表达高、非保乳术患者与更差无病生存期相关,差异具有统计学意义(P<0.05),并进一步通过Cox比例风险模型构建得到相应的临床特征的无病生存期预测模型;模型公式==β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
表4临床病理特征预测模型
Figure BDA0002677413260000151
Figure BDA0002677413260000161
临床特征模型显示:在训练组队列中1年、2年、3年DFS的预测效能AUC分别为0.83、0.83、0.85;验证组队列中1年、2年、3年DFS的预测效能AUC分别为0.76、0.78、0.80;全队列中1年、2年、3年DFS的预测效能AUC分别为0.81、0.82、0.83。
根据临床特征可以将训练队列患者区分为高、低风险两组患者(HR=0.10,95%CI:0.05-0.19;P<0.001)。这个分组方式在验证组队列患者(HR=0.18,95%CI:0.07-0.45;P<0.001)及全队列患者(HR=0.12,95%CI:0.07-0.20;P<0.001)中具有良好的区分效能。
(3)、综合预测模型
为了建立一种方便临床应用的预测DFS的模型,通过多因素分析。多因素分析结果显示,临床病理特征和多序列影像组学特征是无病生存期的独立预测因子。把临床病理特征结合多序列影像组学特征,通过Logistic回归建立综合预测模型,模型公式=β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
表5综合预测模型
Figure BDA0002677413260000162
DFS综合预测模型可以有效区分训练组队列(HR=0.04,95%CI:0.01-0.11;P<0.001)、验证组队列(HR=0.04,95%CI:0.004-0.32;P<0.001)和全队列(HR=0.04,95%CI:0.01-0.09;P<0.001)中的高危和低危患者(见图2A、2B、2C)。DFS综合预测模型在训练组队列中1年、2年、3年DFS率的AUC值分别为0.87、0.90和0.89;在验证组队列中分别为0.89、0.91、0.90,在全队列中分别为0.88、0.90、0.89(见图3A、3B、3C)。
联合临床病理特征和多序列影像组学特征建立的综合预测模型预测效能比临床病理特征预测模型或多序列影像预测模型高。在进一步的亚组分析中,综合预测模型在不同分子分型中均有良好的预测效能。在Luminal A型患者中预测1年、2年、3年DFS分别为0.98、0.97、0.94;在Luminal B型中分别为0.86、0.88、0.88;在Her-2阳性型中分别为0.87、0.92、0.92;在三阴型患者中分别为0.75、0.90、0.90。。
进一步对训练组基于多序列影像组学建立的预测模型、基于临床病理特征建立的预测模型和基于多序列影像组学结合临床病理特征建立的综合预测模型进行临床决策性曲线分析。分析发现(见图4),如果当病人或医生预测ALN转移的阈值概率>10%及预测DFS的阈值概率>5%时,那么使用基于多序列影像组学结合临床病理特征建立的综合预测模型比单独基于多序列影像组学建立的预测模型或基于临床病理特征建立的预测模型更有利。进一步在验证组及总队列中进行验证,基于多序列影像组学结合临床病理特征建立的综合预测模型的临床效益也显示了比单独基于多序列影像组学建立的预测模型或基于临床病理特征建立的预测模型有更好的临床预测效能(见图5)。
对模型进行可视化处理,得到如图6的列线图。
所述列线图包括第一行分数,分值范围为0~100;第二行多序列影像预测模型,分值范围为-1~2,分别对应第一行分值范围0~100均匀分布;第三行临床特征模型,分值范围为-1~2,分别对应第一行分值范围0~4均匀分布;第四行总分,分值范围为0~200;第五行为1年DFS概率,分值范围为0.9~0.4,对应第四行总分分值范围135~184非均匀分布;第六行为2年DFS概率,分值范围为0.9~0.1,对应第四行总分分值范围114~185非均匀分布;第七行为3年DFS概率,分值范围为0.9~0.1,对应第四行总分分值范围108~180非均匀分布。
所述列线图为根据得到的综合预测模型通过软件处理得到,更简洁、直观。根据多序列影像预测模型或临床特征模型计算得到的值,分别投射到第一行得到相应的分值,所述第四行总分为根据第二行多序列影像预测模型的分值投射到第一行分数和第三行临床特征模型的分值投射到第一行分数计算得到的总和,所述第四行总分投射到第五行数值,即为相应的患者第一年DFS概率,所述第四行总分投射到第六行数值,即为相应的患者第二年DFS概率,所述第四行总分投射到第七行数值,即为相应的患者第三年DFS概率。
综上所述,我们建立并验证了一个基于多序列影像组学结合临床病理特征的创新的乳腺癌DFS综合预测模型。该可以将早期乳腺癌患者有效分为高危风险组和低危风险组,两组患者的DFS有显著统计学差异,且DFS综合预测模型预测患者DFS的预测效能明显提高,这对指导临床治疗策略、加强临床治疗干预及后续的个体化随访具有重要的指导意义。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (10)

1.一种乳腺癌患者无病生存期预测模型的构建方法,其特征在于,包括以下步骤:
(1)、数据收集:收集和处理患者的磁共振图像数据、临床特征数据和随访资料数据;
(2)、建立影像组学预测模型:通过随机森林筛选磁共振图像数据中影响无病生存期的关键特征,并根据Cox比例风险模型建立相应的无病生存期预测模型;
(3)、建立临床病理特征预测模型:通过Cox比例风险模型筛选临床病理特征,并通过Cox比例风险模型建立基于临床特征的无病生存期预测模型;
(4)、建立综合预测模型:基于步骤(2)、(3)的模型,通过Cox比例风险模型得到综合预测模型。
2.如权利要求1所述方法,其特征在于,所述方法还包括将所述综合预测模型生成相应的可视化的列线图和/或进行验证的步骤。
3.如权利要求2所述方法,其特征在于,所述验证的步骤为通过诊断特异性曲线和/或临床决策分析曲线对所述综合预测模型进行分析。
4.如权利要求1或2所述方法,其特征在于,步骤(1)中所述的磁共振图像数据为患者使用1.5T或3.0T场强磁体进行乳腺磁共振成像检查得到数据,所述数据包括T1平扫增强序列、T2加权序列和扩散加权成像序列表观扩散系数序列。
5.如权利要求4所述方法,其特征在于,步骤(1)中所述磁共振图像数据的处理方式为:结合乳腺钼靶报告、乳腺超声检查报告和临床触诊中给出关于病变定位的信息,在所述图像序列中,依次对包含原发肿瘤和腋窝淋巴结的每个层面进行靶区边缘的勾画,提取包括形状、强度、纹理和小波的影像学特征。
6.如权利要求1或2所述方法,其特征在于,步骤(1)中所述的临床特征数据包括:确诊年龄、肿瘤个数、肿瘤大小、病理类型、病理组织学分级、临床肿瘤分期、临床淋巴结分期、病理肿瘤分期、病理淋巴结分期、病理TNM分期、ER状态、PR状态、HER-2状态、分子分型和手术方式。
7.如权利要求1或2所述方法,其特征在于,所述步骤(2)中的影像组学预测模型为联合T1+C、T2WI、DWI-ADC的多序列影像组学预测模型。
8.如权利要求1~7任一项所述方法构建的乳腺癌患者无病生存期预测模型。
9.如权利要求8所述乳腺癌患者无病生存期预测模型,其特征在于,所述预测模型包括风险预测公式=β1x12x23x3+…+βkxk,其中,xk为各模型特征值,βk为各个模型中的特征的权重系数,具体如下表所示。
Figure FDA0002677413250000021
Figure FDA0002677413250000031
Figure FDA0002677413250000041
10.如权利要求9所述的乳腺癌患者无病生存期预测模型,其特征在于,所述预测模型还包括列线图;所述列线图包括第一行分数,分值范围为0~100;第二行多序列影像预测模型,分值范围为-1~2,分别对应第一行分值范围0~100均匀分布;第三行临床特征模型,分值范围为-1~2,分别对应第一行分值范围0~4均匀分布;第四行总分,分值范围为0~200;第五行为1年无病生存期概率,分值范围为0.9~0.4,对应第四行总分分值范围135~184非均匀分布;第六行为2年无病生存期概率,分值范围为0.9~0.1,对应第四行总分分值范围114~185非均匀分布;第七行为3年无病生存期概率,分值范围为0.9~0.1,对应第四行总分分值范围108~180非均匀分布。
CN202010958385.8A 2020-09-11 2020-09-11 一种乳腺癌患者无病生存期预测模型及其构建方法 Active CN112185569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010958385.8A CN112185569B (zh) 2020-09-11 2020-09-11 一种乳腺癌患者无病生存期预测模型及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010958385.8A CN112185569B (zh) 2020-09-11 2020-09-11 一种乳腺癌患者无病生存期预测模型及其构建方法

Publications (2)

Publication Number Publication Date
CN112185569A true CN112185569A (zh) 2021-01-05
CN112185569B CN112185569B (zh) 2022-02-25

Family

ID=73920737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010958385.8A Active CN112185569B (zh) 2020-09-11 2020-09-11 一种乳腺癌患者无病生存期预测模型及其构建方法

Country Status (1)

Country Link
CN (1) CN112185569B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802605A (zh) * 2021-01-13 2021-05-14 四川大学华西医院 一种转移性肾癌患者接受系统治疗后生存获益的预测模型及其建立方法和应用
CN113160965A (zh) * 2021-01-08 2021-07-23 福建医科大学附属第一医院 小肝癌早期复发概率预测模型的构建方法与预测方法
CN113393931A (zh) * 2021-06-16 2021-09-14 哈尔滨理工大学 一种基于系统动力学的乳腺癌诊断与治疗方法
CN113393938A (zh) * 2021-07-13 2021-09-14 华南理工大学 一种融合影像和临床特征信息的乳腺癌风险预测系统
CN113555115A (zh) * 2021-06-25 2021-10-26 中山大学孙逸仙纪念医院 基于影像组学构建乳腺癌患者淋巴结转移预测模型的方法
CN113643805A (zh) * 2021-08-10 2021-11-12 复旦大学附属华山医院 基于影像组学的脑膜瘤伽马刀治疗后水肿预测系统
CN113658696A (zh) * 2021-07-22 2021-11-16 四川大学华西医院 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统
CN114242240A (zh) * 2021-10-11 2022-03-25 四川大学华西医院 一种分化型甲状腺癌患者疾病持续复发预测模型
CN114596964A (zh) * 2022-05-09 2022-06-07 北京肿瘤医院(北京大学肿瘤医院) 预测brca突变患者对侧乳腺癌发病风险的模型及应用
CN114649094A (zh) * 2022-03-30 2022-06-21 广东省人民医院 一种基于核磁共振的乳腺癌多参数临床决策辅助装置
CN115148365A (zh) * 2022-05-31 2022-10-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 用于预测中枢神经系统生殖细胞肿瘤预后的方法及系统
CN115272253A (zh) * 2022-08-02 2022-11-01 中国医学科学院北京协和医院 一种前哨淋巴结图像分析的方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040010481A1 (en) * 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Time-dependent outcome prediction using neural networks
CN109493969A (zh) * 2018-09-11 2019-03-19 中山大学孙逸仙纪念医院 评估Paget`s病伴浸润性导管癌患者预后的模型及其应用
CN110265095A (zh) * 2019-05-22 2019-09-20 首都医科大学附属北京佑安医院 用于hcc复发及rfs的预测模型和诺模图的构建方法及应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040010481A1 (en) * 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Time-dependent outcome prediction using neural networks
CN109493969A (zh) * 2018-09-11 2019-03-19 中山大学孙逸仙纪念医院 评估Paget`s病伴浸润性导管癌患者预后的模型及其应用
CN110265095A (zh) * 2019-05-22 2019-09-20 首都医科大学附属北京佑安医院 用于hcc复发及rfs的预测模型和诺模图的构建方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SUNGWON KIM 等: "MRI Radiomic Features: Association with Disease-Free Survival in Patients with Triple-Negative Breast Cancer", 《SCIENTIFIC REPORTS》 *
谭钰洁 等: "首诊Ⅳ期乳腺癌生存预测模型建立并验证:一项基于机器算法的研究", 《岭南现代临床外科》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160965A (zh) * 2021-01-08 2021-07-23 福建医科大学附属第一医院 小肝癌早期复发概率预测模型的构建方法与预测方法
CN113160965B (zh) * 2021-01-08 2023-11-17 福建医科大学附属第一医院 小肝癌早期复发概率预测模型的构建方法与预测方法
CN112802605A (zh) * 2021-01-13 2021-05-14 四川大学华西医院 一种转移性肾癌患者接受系统治疗后生存获益的预测模型及其建立方法和应用
CN113393931A (zh) * 2021-06-16 2021-09-14 哈尔滨理工大学 一种基于系统动力学的乳腺癌诊断与治疗方法
CN113555115A (zh) * 2021-06-25 2021-10-26 中山大学孙逸仙纪念医院 基于影像组学构建乳腺癌患者淋巴结转移预测模型的方法
CN113393938A (zh) * 2021-07-13 2021-09-14 华南理工大学 一种融合影像和临床特征信息的乳腺癌风险预测系统
CN113393938B (zh) * 2021-07-13 2022-09-13 华南理工大学 一种融合影像和临床特征信息的乳腺癌风险预测系统
CN113658696A (zh) * 2021-07-22 2021-11-16 四川大学华西医院 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统
CN113658696B (zh) * 2021-07-22 2023-07-14 四川大学华西医院 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统
CN113643805B (zh) * 2021-08-10 2024-04-02 复旦大学附属华山医院 基于影像组学的脑膜瘤伽马刀治疗后水肿预测系统
CN113643805A (zh) * 2021-08-10 2021-11-12 复旦大学附属华山医院 基于影像组学的脑膜瘤伽马刀治疗后水肿预测系统
CN114242240A (zh) * 2021-10-11 2022-03-25 四川大学华西医院 一种分化型甲状腺癌患者疾病持续复发预测模型
CN114649094A (zh) * 2022-03-30 2022-06-21 广东省人民医院 一种基于核磁共振的乳腺癌多参数临床决策辅助装置
CN114649094B (zh) * 2022-03-30 2022-11-15 广东省人民医院 一种基于核磁共振的乳腺癌多参数临床决策辅助装置
CN114596964A (zh) * 2022-05-09 2022-06-07 北京肿瘤医院(北京大学肿瘤医院) 预测brca突变患者对侧乳腺癌发病风险的模型及应用
CN115148365A (zh) * 2022-05-31 2022-10-04 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 用于预测中枢神经系统生殖细胞肿瘤预后的方法及系统
CN115272253A (zh) * 2022-08-02 2022-11-01 中国医学科学院北京协和医院 一种前哨淋巴结图像分析的方法、装置及存储介质

Also Published As

Publication number Publication date
CN112185569B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN112185569B (zh) 一种乳腺癌患者无病生存期预测模型及其构建方法
Guo et al. Radiomics analysis on ultrasound for prediction of biologic behavior in breast invasive ductal carcinoma
Zhang et al. Computed tomography-based radiomics model for discriminating the risk stratification of gastrointestinal stromal tumors
CN112216395A (zh) 一种乳腺癌患者腋窝淋巴结转移预测模型及其构建方法
Zhou et al. Use of radiomics based on 18 F-FDG PET/CT and machine learning methods to aid clinical decision-making in the classification of solitary pulmonary lesions: an innovative approach
CN1518719A (zh) 根据多层面高分辩率计算机断层摄影图像自动检测肺肿瘤的方法和系统
CN113208640B (zh) 一种基于乳腺专用pet影像组学预测腋窝淋巴结转移的方法
CN111311558A (zh) 一种用于胰腺癌预测的影像组学模型的构建方法
Liang et al. A nomogram based on a multiparametric ultrasound radiomics model for discrimination between malignant and benign prostate lesions
Pareek et al. [Retracted] Predicting the Spread of Vessels in Initial Stage Cervical Cancer through Radiomics Strategy Based on Deep Learning Approach
Abbaspour et al. Endorectal ultrasound radiomics in locally advanced rectal cancer patients: despeckling and radiotherapy response prediction using machine learning
CN115067978B (zh) 一种骨肉瘤疗效评估方法及系统
Chen et al. CT radiomics model for discriminating the risk stratification of gastrointestinal stromal tumors: a multi-class classification and multi-center study
Qiu et al. A nomogram based on molecular biomarkers and radiomics to predict lymph node metastasis in breast cancer
Hong et al. Nomograms for prediction of breast cancer in breast imaging reporting and data system (BI-RADS) ultrasound category 4 or 5 lesions: a single-center retrospective study based on radiomics features
Wang et al. Non-invasive assessment of axillary lymph node metastasis risk in early invasive breast cancer adopting automated breast volume scanning-based radiomics nomogram: a multicenter study
CN113555115A (zh) 基于影像组学构建乳腺癌患者淋巴结转移预测模型的方法
Gao et al. Radiomics analysis based on ultrasound images to distinguish the tumor stage and pathological grade of bladder cancer
Mathur et al. Detecting malignancy of ovarian tumour using convolutional neural network: A review
Zhang et al. Radiomics based on CECT in differentiating kimura disease from lymph node metastases in head and neck: a non-invasive and reliable method
Yang et al. Current and potential applications of artificial intelligence in gastrointestinal stromal tumor imaging
CN111430030A (zh) 生物标志物在卵巢癌评估中的应用方法及系统
Deng et al. Machine learning models combining computed tomography semantic features and selected clinical variables for accurate prediction of the pathological grade of bladder cancer
Lu et al. A Review of the Role of Ultrasound Radiomics and Its Application and Limitations in the Investigation of Thyroid Disease
Wang et al. S2FLNet: Hepatic steatosis detection network with body shape

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant