CN113610845A - 肿瘤局部控制预测模型的构建方法、预测方法及电子设备 - Google Patents

肿瘤局部控制预测模型的构建方法、预测方法及电子设备 Download PDF

Info

Publication number
CN113610845A
CN113610845A CN202111056214.7A CN202111056214A CN113610845A CN 113610845 A CN113610845 A CN 113610845A CN 202111056214 A CN202111056214 A CN 202111056214A CN 113610845 A CN113610845 A CN 113610845A
Authority
CN
China
Prior art keywords
screening
model
tumor
omics
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111056214.7A
Other languages
English (en)
Other versions
CN113610845B (zh
Inventor
黄宝添
罗利梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital of Shantou University Medical College
Original Assignee
Cancer Hospital of Shantou University Medical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital of Shantou University Medical College filed Critical Cancer Hospital of Shantou University Medical College
Priority to CN202111056214.7A priority Critical patent/CN113610845B/zh
Publication of CN113610845A publication Critical patent/CN113610845A/zh
Application granted granted Critical
Publication of CN113610845B publication Critical patent/CN113610845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Abstract

本发明公开肿瘤局部控制预测模型的构建方法、预测方法及电子设备。模型构建方法,包括:获取立体定向放疗的肺癌患者治疗前的筛选临床因素的数据、治疗前的筛选剂量学因素的数据、治疗前的医学影像图、以及治疗后的肿瘤状态;基于医学影像图,得到关于该医学影像图的影像组学评分;以筛选临床因素的数据、筛选剂量学因素的数据、以及影像组学评分作为综合模型的输入,治疗后的肿瘤状态作为综合模型的输出,对综合模型进行训练,得到综合模型。本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。

Description

肿瘤局部控制预测模型的构建方法、预测方法及电子设备
技术领域
本发明涉及医学数据处理相关技术领域,特别是一种肿瘤局部控制预测模型的构建方法、预测方法及电子设备。
背景技术
随着放疗技术的进步,立体定向放疗(SBRT)在因各种内科合并症而无法耐受手术治疗和不愿意手术治疗的早期原发性肺癌患者中得到了进一步的运用,并且可以用于晚期原发性肺癌或者转移性肺癌的根治性或者新辅助或者辅助性治疗。这种精确的方式使用高剂量消融肿瘤和低剂量保护周围组织。肺癌患者经过SBRT后肿瘤局部控制率可观,正常组织的毒性小,但是也有部分患者肿瘤局部控制不佳。计算机断层扫描(CT)、18F-氟脱氧葡萄糖/正电子发射断层扫描(PET-CT)或活检是检测肿瘤复发的重要诊断工具,但是不能提前预测肿瘤局部状态或不能获得整个肿瘤的信息。最大标准化摄取值(SUVmax)可以用于预测SBRT后的局部复发,但是其预后价值尚不确定。另外的现有技术以影响肿瘤局部控制的临床和剂量学因素建立肿瘤局部控制率模型来计算肺癌患者SBRT后局部控制的可能性。然而,由于这些模型没有综合考虑反应肿瘤异质性的特征,所以导致局部控制率模型的预测效果结果差异较大,而且与临床数据中的局部控制率不具有统一性,难以辨别各个模型在肺癌的立体定向放疗中的适用性。
发明内容
基于此,有必要针对现有技术对于立体定向放疗的肺癌患者治疗后的肿瘤局部控制预测不准确的技术问题,提供一种肿瘤局部控制预测模型的构建方法、预测方法及电子设备。
本发明提供一种肿瘤局部控制预测模型的构建方法,包括:
获取立体定向放疗的肺癌患者治疗前的筛选临床因素的数据、治疗前的筛选剂量学因素的数据、治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败,所述筛选临床因素从多个临床因素中筛选得到,所述筛选剂量学因素从多个剂量学因素中筛选得到;
基于所述医学影像图,得到关于该医学影像图的影像组学评分;
以所述筛选临床因素的数据、筛选剂量学因素的数据、以及所述影像组学评分作为综合模型的输入,治疗后的肿瘤状态作为所述综合模型的输出,对所述综合模型进行训练,得到用于预测立体定向放疗的肺癌患者治疗后的肿瘤局部控制概率的综合模型。
进一步地,还包括:
获取立体定向放疗的肺癌患者治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败;
从所述医学影像图中提取多个筛选影像组学特征的数据,所述筛选影像组学特征从多个影像学特征中筛选得到,且所述筛选影像学特征的组间相关系数大于等于预设影像相关系数阈值;
所述影像组学模型为偏置值与多个筛选影像组学特征的数据的加权值之和,以所述筛选影像组学特征的数据作为影像组学模型的输入,治疗后的肿瘤状态作为所述影像组学模型的输出,对所述影像组学模型采用对数几率回归进行训练;
训练后,得到所述影像组学模型的偏置值以及每一所述影像学特征的权重;
所述基于所述医学影像图,得到关于该医学影像图的影像组学评分,具体包括:
从所述医学影像图中提取多个筛选影像组学特征的数据;
基于每个所述筛选影像组学特征的权重,计算该医学影像图的影像组学评分为多个所述筛选影像组学特征的数据的加权值和偏置值之和,所述偏置值和每个所述筛选影像组学特征的权重从预先训练的影像组学模型中获取。
更进一步地,还包括:
获取每一医学影像图的多个兴趣区域勾画图,每一医学影像图的多个兴趣区域勾画图为不同医生在同一医学影像图中勾画的感兴趣区域,将由同一医生勾画的兴趣区域勾画图作为一组图像组,计算每一影像组学特征在多组图像组之间的组间相关系数,将组间相关系数大于等于预设影像相关系数阈值作为第一影像学特征;
对符合正态分布和方差齐性检验的第一影像学特征进行独立样本t检验,对其余第一影像学特征进行秩和检验,保留差异性指标为显著性差异的第一影像学特征作为第二影像学特征;
执行最小绝对收缩和选择算法对第二影像学特征进行降维和选择,得到第三影像学特征;
利用逐步回归算法从第三影像学特征中剔除引起多重共线性的第三影像学特征,得到筛选影像组学特征。
更进一步地,所述筛选影像组学特征包括:低低低小波系数转换-灰度区域大小矩阵-短欲补偿特征、低高高小波系数转换-灰度共生矩阵-联合均值特征、低高高小波系数转换-邻域灰度差矩阵特征-复杂度特征、平方根-灰度共生矩阵-差值熵特征。
进一步地,还包括:
获取患者的多个临床因素的数据和多个剂量学因素的数据;
对每个临床因素的数据和每个剂量学因素的数据分别进行对数几率回归单因素分析;
将单因素分析中差异性指标为显著性差异的临床因素的和剂量学因素的进行多因素对数几率回归分析,通过逐步回归筛选算法,对临床因素和剂量学因素进行筛选,得到筛选临床因素和筛选剂量学因素。
进一步地,所述筛选临床因素数据为临床分期数据、血小板数据,所述筛选剂量学因素数据为肿瘤总体积内最小剂量。
再进一步地,所述对所述综合模型进行训练,具体包括:
对所述综合模型采用对数几率回归算法进行训练。
本发明提供一种电子设备,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如前所述的肿瘤局部控制预测模型的构建方法。
本发明提供一种肺癌患者治疗后肿瘤局部控制预测方法,采用如前所述的肿瘤局部控制预测模型的构建方法构建综合模型,所述方法包括:
获取立体定向放疗的待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图;
基于所述医学影像图,得到关于该医学影像图的影像组学评分;
将待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图的影像组学评分输入所述综合模型,得到待预测肺癌患者的治疗后肿瘤状态,所述肿瘤状态包括局部控制或局部失败。
本发明提供一种电子设备,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如前所述的肺癌患者治疗后肿瘤局部控制预测方法。
本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。
附图说明
图1为本发明一种肿瘤局部控制预测模型的构建方法的工作流程图;
图2为本发明一实施例提取和选择影像组学特征流程示意图;
图3a为影像组学特征Wavelet-LLL_glszm_SmallAreaEmphasis在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3b为影像组学特征Wavelet-LHH_glcm_JointAverage在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3c为影像组学特征Wavelet-LHH_ngtdm_Complexity在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3d为影像组学特征Squareroot_glcm_DifferenceEntropy在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3e为影像组学评分在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3f为影像组学评分在验证集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图4a为影像组学模型、临床模型和综合模型在训练组的受试者工作特征曲线ROC及ROC曲线下面积(AUC);
图4b为影像组学模型、临床模型和综合模型在验证组的受试者工作特征曲线ROC及ROC曲线下面积(AUC);
图4c为影像组学模型、临床模型和综合模型在训练组和验证组的ROC曲线下面积(AUC)比较;
图5为预测局部控制的综合模型中的各个特征的作用示意图;
图6a为评估肺癌患者局部控制的综合诺谟图;
图6b为训练组的诺谟图校准曲线;
图6c为验证组的诺谟图校准曲线;
图6d为训练组每个模型的决策曲线;
图6e为验证组每个模型的决策曲线;
图7为本发明一种电子设备的硬件结构示意图;
图8为本发明一实施例一种肺癌患者治疗后肿瘤局部控制预测方法的工作流程图;
图9为本发明一种电子设备的硬件结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
实施例一
如图1所示为本发明一种肿瘤局部控制预测模型的构建方法的工作流程图,包括:
步骤S101,获取立体定向放疗的肺癌患者治疗前的筛选临床因素的数据、治疗前的筛选剂量学因素的数据、治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败,所述筛选临床因素从多个临床因素中筛选得到,所述筛选剂量学因素从多个剂量学因素中筛选得到;
步骤S102,基于所述医学影像图,得到关于该医学影像图的影像组学评分;
步骤S103,以所述筛选临床因素的数据、筛选剂量学因素的数据、以及所述影像组学评分作为综合模型的输入,治疗后的肿瘤状态作为所述综合模型的输出,对所述综合模型进行训练,得到用于预测立体定向放疗的肺癌患者治疗后的肿瘤局部控制概率的综合模型。
具体来说,SBRT治疗后第一年每隔3个月检查CT,之后每半年检查CT,局部控制是指胸部CT片示肿瘤完全消退或放疗结束时虽有残留至少3个月后复查胸部CT示肿块无增大或有缩小并维持6个月以上。局部失败是指通过肺穿刺或支气管纤维镜下活检,病理组织学确诊或者通过胸部CT诊断;特点为治疗后病灶消失,以后又在原部位出现占位病灶,或治疗后的多次CT检查,原纤维化的基础上出现密度增高、血管增强强化、体积持续增大的肿块影像。
具体来说,步骤S101获取立体定向放疗的肺癌患者治疗前的筛选临床因素的数据、治疗前的筛选剂量学因素的数据、治疗前的医学影像图、以及治疗后的肿瘤状态作为模型训练数据。治疗后的肿瘤状态优选为原发性和转移性肺癌患者SBRT治疗后1年的局部控制或者局部失败。然后步骤S102对医学影像图计算影像组学评分。医学影像图包括但不限于计算机断层扫描(CT)、18F-氟脱氧葡萄糖/正电子发射断层扫描(PET-CT)。优选地,医学影像图为CT图像。影像组学是指从传统医学图像中全面提取肿瘤特征,以帮助决策和预测不同疾病的治疗效果和预后,包括肺癌、食管癌和前列腺癌。最后,步骤S103对训练数据进行训练,得到综合模型。该综合模型以所述筛选临床因素的数据、筛选剂量学因素的数据、以及所述影像组学评分作为综合模型的输入,以治疗后的肿瘤状态作为所述综合模型的输出。该综合模型即作为肿瘤局部控制预测模型。
本发明通过影像组学特征凸显了肿瘤的异质性,影像组学是应用生物信息学方法从医学图像中高通量地提取与肿瘤特征密切相关的定量影像学特征,可非侵入性地获得肉眼不可见的额外信息来预测潜在的肿瘤生物学行为包括组织形态、细胞分子、基因遗传等各个层次,即影像组学参数可揭示肿瘤的异质性,在肿瘤的诊疗的研究具有独特优势。
研究表明肺癌患者进行SBRT后的肿瘤局部控制状态受到多因素影响,主要包括临床因素(如肿瘤直径大小,分期,组织学等)和剂量学因素(如覆盖95%靶区的处方剂量、整个计划中最大剂量等)。本发明结合临床和剂量学因素综合评价可以增加个性化估计的价值,并且突出了多元分析的必要性,使得评价更加稳健和准确。并且当中涉及的变量来自临床可用数据,无需额外费用,这将增加的该评价的临床效用。
本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。
在其中一个实施例中,还包括:
获取立体定向放疗的肺癌患者治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败;
从所述医学影像图中提取多个筛选影像组学特征的数据,所述筛选影像组学特征从多个影像学特征中筛选得到,且所述筛选影像学特征的组间相关系数大于等于预设影像相关系数阈值;
所述影像组学模型为偏置值与多个筛选影像组学特征的数据的加权值之和,以所述筛选影像组学特征的数据作为影像组学模型的输入,治疗后的肿瘤状态作为所述影像组学模型的输出,对所述影像组学模型采用对数几率回归进行训练;
训练后,得到所述影像组学模型的偏置值以及每一所述影像学特征的权重;
所述基于所述医学影像图,得到关于该医学影像图的影像组学评分,具体包括:
从所述医学影像图中提取多个筛选影像组学特征的数据;
基于每个所述筛选影像组学特征的权重,计算该医学影像图的影像组学评分为多个所述筛选影像组学特征的数据的加权值和偏置值之和,所述偏置值和每个所述筛选影像组学特征的权重从预先训练的影像组学模型中获取。
具体来说,首先从所述医学影像图中提取多个筛选影像组学特征的数据。从图像中提取影像组学特征可以采用现有的图像提取肿瘤方式提取。
影像组学模型优选为逻辑回归模型。影像组学模型的模型形式为
Figure BDA0003254761970000081
其中,N为筛选影像组学特征的数量,wi为第i个筛选影像组
学特征的权重,b为偏置值,Ki为第i个筛选影像组学特征的数据。
影像组学模型以筛选影像组学特征的权重作为参数进行训练,通过肿瘤状态对影像组学模型中的权重进行参数优化,得到最终的影像组学模型。训练后的影像组学模型的参数即包括了每个筛选影像组学特征的权重。通过计算多个所述筛选影像组学特征的数据的加权值,则得到影像组学评分。由于影像组学评分是基于影像组学模型得到,因此,影像组学评分能够满足影像组学模型,使得与临床因素和剂量学因素结合训练得到的综合模型,既满足影像组学特征,又满足临床因素和剂量学因素。本实施例所选择的筛选影像组学特征,其组间相关系数大于等于预设影像相关系数阈值,因此该影像组学特征稳定。
在其中一个实施例中,还包括:
获取每一医学影像图的多个兴趣区域勾画图,每一医学影像图的多个兴趣区域勾画图为不同医生在同一医学影像图中勾画的感兴趣区域,将由同一医生勾画的兴趣区域勾画图作为一组图像组,计算每一影像组学特征在多组图像组之间的组间相关系数,将组间相关系数大于等于预设影像相关系数阈值作为第一影像学特征;
对符合正态分布和方差齐性检验的第一影像学特征进行独立样本t检验,对其余第一影像学特征进行秩和检验,保留差异性指标为显著性差异的第一影像学特征作为第二影像学特征;
执行最小绝对收缩和选择算法对第二影像学特征进行降维和选择,得到第三影像学特征;
利用逐步回归算法从第三影像学特征中剔除引起多重共线性的第三影像学特征,得到筛选影像组学特征。
具体来说,为了进一步增强影像组学特征的鲁棒性,由多名(例如两名)高年资放疗科医生勾画多例(例如30例)患者的感兴趣区域,通过计算组间相关系数(ICC)来评估特征在两组图像中的相关性,ICC大于0.75的特征被认为是稳定的和被选择进行分析。而为了防止过拟合,采用多种方法进行影像组学特征降维,通过符合正态分布和方差齐性检验的特征进行独立样本t检验,否则进行秩和检验即单因素检验,选择保留p值<0.05的特征,其中p值为差异性指标,p值<0.05即差异性指标为显著性差异。p值是在给定的自由度下,通过计算出统计量值,结合t分布,u分布或者z分布得到的概率,通过p值判断差异性是否达到显著水平。再使用R语言中的“glmnet”软件包执行LASSO算法对特征进行降维和选择,最后利用逐步回归筛选并剔除引起多重共线性的特征。最终得到筛选影像组学特征。多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。所以剔除引起多重共线性的特征可以准确区分每个解释变量的单独影响,可以使解释变量的显著性检验有意义,可以增加模型预测功能的准确性和稳定性。
本实施例所选择的影像组学特征稳定,且具有显著性差异。同时剔除了引起多重共线性的特征,可以准确区分每个解释变量的单独影响,可以使解释变量的显著性检验有意义,可以增加模型预测功能的准确性和稳定性。
在其中一个实施例中,所述筛选影像组学特征包括:低低低小波系数转换-灰度区域大小矩阵-短欲补偿特征、低高高小波系数转换-灰度共生矩阵-联合均值特征、低高高小波系数转换-邻域灰度差矩阵特征-复杂度特征、平方根-灰度共生矩阵-差值熵特征。
具体来说,低低低小波系数转换-灰度区域大小矩阵-短欲补偿特征为Wavelet-LLL_glszm_SmallAreaEmphasis,低高高小波系数转换-灰度共生矩阵-联合均值特征为Wavelet-LHH_glcm_JointAverage,低高高小波系数转换-邻域灰度差矩阵特征-复杂度特征为Wavelet-LHH_ngtdm_Complexity,平方根-灰度共生矩阵-差值熵特征为Squareroot_glcm_DifferenceEntropy。
在其中一个实施例中,还包括:
获取患者的多个临床因素的数据和多个剂量学因素的数据;
对每个临床因素的数据和每个剂量学因素的数据分别进行对数几率回归单因素分析;
将单因素分析中差异性指标为显著性差异的临床因素的和剂量学因素的进行多因素对数几率回归分析,通过逐步回归筛选算法,对临床因素和剂量学因素进行筛选,得到筛选临床因素和筛选剂量学因素。
具体来说,患者的临床因素和剂量学因素有多个。临床因素数据包括性别、年龄、吸烟史、BMI指数、KPS评分、肿瘤位置、临床分期、病理类型、肿瘤等效直径、肉眼肿瘤体积(GTV)、计划靶体积(PTV)、有无化疗、治疗前淋巴细胞、中性粒细胞、血小板、中性粒细胞与淋巴细胞比值(NLR)、血小板与淋巴细胞比值(PLR)、血红蛋白、固定器类型、是否进行4DCT扫描,肿瘤原发部位;剂量学因素数据包括覆盖95%靶区的处方剂量(D95)、整个计划中最大剂量(Dmax)、计划靶区内最小剂量(PTVmin)、平均剂量(PTVmean)、最大剂量(PTVmax)、剂量不均匀性(PTVmin/PTVmax)、肿瘤总体积内最小剂量(GTVmin)、平均剂量(GTVmean)、最大剂量(GTVmax)、剂量不均匀性(GTVmin/GTVmax)。从中需要筛选出合适的临床和剂量学因素。具体可以使用R语言分析影响肺癌患者SBRT治疗后1年肿瘤局部控制的临床和剂量学因素,logistic单因素分析中p<0.05的因素纳入多因素logistic回归分析,以P值作为差异性指标,P<0.05为显著性差异,通过逐步回归法筛选变量。
在其中一个实施例中,所述筛选临床因素数据为临床分期数据、血小板数据,所述筛选剂量学因素数据为肿瘤总体积内最小剂量。
在其中一个实施例中,所述对所述综合模型进行训练,具体包括:
对所述综合模型采用对数几率回归算法进行训练。
表1在训练组和验证组中,应用LR、DT、SVM建立影像组学模型的详细性能
Figure BDA0003254761970000111
Figure BDA0003254761970000121
LR:对数几率回归(logistic回归,又称逻辑回归),DT:决策树,SVM:支持向量机;准确性、灵敏性和特异性以百分比表示。
如上表所示,当利用决策树、支持向量机建立影像组学模型时,存在的或多或少的问题,如利用DT分类法建立的影像组学模型的分类能力没有统计学意义,模型的AUC低于0.5,或者将这些特征输入SVM分类器中,得到的模型性能较差,特异性较低;与上述方法相比,LR方法建立的模型表现出了最佳的性能和准确度,因此将用于后续建模。
本实施例采用对数几率回归算法,提高性能和准确度。
作为本发明的肿瘤局部控制预测模型构建,具体包括:
(1)病例收集
按照指南和建议收集符合条件的原发性和转移性肺癌接受立体定向放疗(SBRT)治疗的患者,以7:3的比例随机将患者分为训练组和验证组;收集患者的临床和剂量学因素资料和肿瘤局部控制情况;临床因素数据包括性别、年龄、吸烟史、BMI指数、KPS评分、肿瘤位置、临床分期、病理类型、肿瘤等效直径、肉眼肿瘤体积(GTV)、计划靶体积(PTV)、有无化疗、治疗前淋巴细胞、中性粒细胞、血小板、中性粒细胞与淋巴细胞比值(NLR)、血小板与淋巴细胞比值(PLR)、血红蛋白、固定器类型、是否进行4DCT扫描,肿瘤原发部位;剂量学因素数据包括覆盖95%靶区的处方剂量(D95)、整个计划中最大剂量(Dmax)、计划靶区内最小剂量(PTVmin)、计划靶区内平均剂量(PTVmean)、计划靶区内最大剂量(PTVmax)、计划靶区内剂量不均匀性(PTVmin/PTVmax)、肿瘤总体积内最小剂量(GTVmin)、肿瘤总体积内平均剂量(GTVmean)、肿瘤总体积内最大剂量(GTVmax)、肿瘤总体积内剂量不均匀性(GTVmin/GTVmax)。其中,剂量均为生物有效剂量(BEDs),采用α/β比值为10Gy的线性二次模型计算BEDs,BED=n×d×[1+d/(α/β)],n=治疗次数,d=分次剂量;并且利用受试者工作特征曲线(ROC)方法计算剂量的最佳截取点。
(2)筛选临床和剂量学因素
使用R语言分析影响肺癌患者SBRT治疗后1年肿瘤局部控制的临床和剂量学因素,将logistic单因素分析中p<0.05的因素纳入多因素logistic回归分析,通过逐步回归法筛选变量,以P值作为差异性指标,P<0.05为显著性差异,得到筛选临床因素和筛选剂量学因素。
(3)获得肿瘤CT图像和提取影像组学特征
收集患者医学影像图,具体为CT平扫图像,并由超过10年经验的放疗科医生手动勾画肿瘤感兴趣区域(ROI),利用python软件平台进行影像组学特征提取。图像预处理包括Original、LoG、Wavelet、Square、SquareRoot、Logarithm;影像组学特征的种类包括一阶特征,形状特征,纹理特征。并对原始数据采用z-score标准化。
(4)选择影像组学特征
首先通过R语言的“irr”包计算组间相关系数(ICC)选择稳定的影像组学特征,将一致性大于等于0.75的影像组学特征保留;接着通过独立样本t检验或Mann-Whitney U检验对特征进行单因素检验,将p值<0.05的影像组学特征保留;再使用R语言的“glmnet”包套索分析(LASSO)对特征进行降维分析;最后利用逐步回归筛选特征,得到筛选影像组学特征。
(5)选择最合适的分类器
使用逻辑回归(LR)、决策树(DT)、支持向量机(SVM)创建影像组学评分,决策树和支持向量机分别用R语言的“rpart”软件包和“e1071”软件包实现,根据模型的性能选择分类器用于后续模型建立。
(6)建立模型
根据最佳分类器建立三个模型,分别是由影像组学评分建立的影像组学模型,临床和剂量学因素建立的临床模型,影像组学评分结合临床和剂量学因素的综合模型。
(7)模型评价
根据模型的受试者工作特征曲线(ROC)的曲线下面积(AUC)、p值、准确性、敏感性、特异性和DeLong检验对各个模型进行比较确定预测局部控制的最佳模型。经过对比,可以确定影像组学评分结合临床和剂量学因素的综合模型的效果优于比单独模型包括临床因素模型和影像组学模型。因此,选择综合模型作为肿瘤局部控制预测模型。
(8)临床应用
利用R语言的“rms”包构建诺谟图进而预测肺癌患者的局部控制;使用Hosmer-Lemeshow检验和校正曲线判别诺谟图的校准能力,决策曲线计算临床最大净受益。
作为本发明一个构建肿瘤局部控制预测模型的例子,以129个肺癌肿瘤病灶进行建立肿瘤局部控制预测模型过程为例:
1 材料和方法
1.1 患者的选择
采集2012-2018年汕头大学医学院附属肿瘤医院诊断为原发性和转移性肺癌接受SBRT治疗的患者(N=134),排除照射部位为胸壁、纵隔、锥体的患者(N=4),排除失访的患者(N=18),排除未完成照射的患者(N=1)最后可得111个患者,18个重复病灶,129个肿瘤病灶;以7:3的比例随机将患者分为训练组和验证组;使用真空负压袋或头颈肩热塑面罩固定患者,采用仰卧位在患者平静呼吸下通过四维CT(4DCT)或三维CT(3DCT)扫描肿瘤;4DCT的内靶体积(ITV4D)由10个呼吸期的肿瘤总体积(GTVs)确定,3DCT的内靶体积(ITV3D)由呼气末和吸气末两个呼吸时相的GTV决定或者用模拟机透视观察肿瘤运动幅度描绘,计划靶体积(PTV)通过ITV在各个方向外扩5mm实现;在每次进行治疗前用锥束CT(CBCT)进行图像引导和肿瘤定位。
1.2定期随访
第一年每隔3个月检查CT,之后每半年检查CT,局部复发通过肺穿刺或支气管纤维镜下活检,病理组织学确诊或者通过胸部CT诊断;特点为治疗后病灶消失,以后又在原部位出现占位病灶,或治疗后的多次CT检查,原纤维化的基础上出现密度增高、血管增强强化、体积持续增大的肿块影像。
SBRT治疗后第一年每隔3个月检查CT,之后每半年检查CT,局部控制是指胸部CT片示肿瘤完全消退或放疗结束时虽有残留至少3个月后复查胸部CT示肿块无增大或有缩小并维持6个月以上。局部失败是指通过肺穿刺或支气管纤维镜下活检,病理组织学确诊或者通过胸部CT诊断;特点为治疗后病灶消失,以后又在原部位出现占位病灶,或治疗后的多次CT检查,原纤维化的基础上出现密度增高、血管增强强化、体积持续增大的肿块影像。
1.3收集数据
收集患者的临床和剂量学因素资料和肿瘤局部控制情况;计算剂量学因素的BED及最佳截取点。
1.4筛选临床和剂量学因素
使用R语言分析影响肺癌患者SBRT治疗后1年肿瘤局部控制的临床和剂量学因素,首先进行logistic单因素分析,接着将单因素中p<0.05的因素纳入进行多因素logistic回归分析,最后通过逐步回归法筛选变量,以P值作为差异性指标,P<0.05为显著性差异,得出最终进入模型的变量,即筛选临床因素和筛选剂量学因素。
1.5获得肿瘤CT图像和提取影像组学特征
收集患者SBRT治疗前的CT平扫图像并由超过10年经验的放疗科医生手动勾画肿瘤感兴趣区域(ROI),利用python软件平台进行影像组学特征提取。为了确定最佳的影像组学特征,图像预处理包括Original,LoG,Wavelet,Square,SquareRoot,Logarithm;特征种类包括一阶特征,形状特征,纹理特征包括灰度共生矩阵特征(GLCM)、灰度游程长度矩阵(GLRLM)、灰度尺寸区域矩阵(GLSZM)、邻域灰度差矩阵(NGTDM)、灰度相关矩阵(GLDM);并给予原始数据z-score标准化。
1.6选择重要稳定的影像组学特征
为了进一步增强影像组学特征的鲁棒性,由两名高年资放疗科医生勾画30例患者的感兴趣区域,通过计算组间相关系数(ICC)来评估特征在两组图像中的相关性,ICC大于0.75的影像组学特征被认为是稳定特征,选择ICC大于0.75的影像组学特征进行后续分析。为了防止过拟合,采用多种方法进行影像组学特征降维,将符合正态分布和方差齐性检验的影像组学特征进行独立样本t检验,其他影像组学特征进行秩和检验即单因素检验,保留p值<0.05的影像组学特征;再使用R语言中的“glmnet”软件包执行LASSO算法对p值>0.05的影像组学特征进行降维和选择,最后利用逐步回归筛选并剔除引起多重共线性的影像组学特征,得到筛选影像组学特征。
1.7选择最合适的分类器
根据选择的影像组学特征分别使用逻辑回归(LR)、决策树(DT)、支持向量机(SVM)创建影像组学评分,决策树和支持向量机分别用R语言的“rpart”软件包和“e1071”软件包实现,根据模型的性能即模型的受试者工作特征曲线(ROC)的曲线下面积(AUC)、p值、准确性、敏感性、特异性选择分类器用于后续模型建立。
1.8建立模型
根据最佳分类器建立三个模型,分别是由影像组学评分建立的影像组学模型,临床和剂量学因素建立的临床模型,影像组学评分结合临床和剂量学因素的综合模型。
1.9模型评价
根据模型的受试者工作特征曲线(ROC)的曲线下面积(AUC)、p值、准确性、敏感性、特异性和DeLong检验对影像组学模型、临床模型和组合模型进行比较,以确定预测局部控制的最佳模型。
1.10临床应用
为了给临床医生提供一个易于使用的工具,利用R语言的“rms”包构建由影像组学评分、临床和剂量学因素组合的诺谟图进而可视化地预测肺癌患者的局部控制;使用Hosmer-Lemeshow检验和校正曲线判别诺谟图的拟合程度和校准能力,决策曲线分析法计算影像组学模型、临床模型和组合模型的临床最大净受益。
2结果
2.1患者基本特征与局部复发情况
111例原发性和继发性肺癌患者的129个肿瘤进行SBRT治疗,训练组和验证组分别为89个和40个肿瘤,病人的基本情况见表2;93例男性(72.1%),平均年龄62岁,大多数肿瘤(82.9%)为周围型,少数肿瘤(18.6%)采用放化疗联合治疗,中位处方剂量为48Gy(范围:18~70Gy),中位放疗次数为4次(范围:1~12次),中位治疗时间为8天(范围:1~38天),SBRT治疗1年后,91例肿瘤局部控制,38例局部失败;D95的最佳临界点为80.43Gy;训练组和验证组患者的临床基线基本平衡表明病人分组是合理的。
表2在总体人群、训练组和验证组中肺癌患者的临床和剂量特征
Figure BDA0003254761970000171
Figure BDA0003254761970000181
Figure BDA0003254761970000191
Figure BDA0003254761970000201
GTV:肉眼肿瘤体积,PTV:计划靶体积,NLR:中性粒细胞与淋巴细胞比值,PLR:血小板与淋巴细胞比值,D95:覆盖95%靶区的处方剂量,Dmax:整个计划中最大剂量,PTVmin:计划靶区内最小剂量,PTVmean:计划靶区内平均剂量,PTVmax:计划靶区内最大剂量,PTVmin/PTVmax:计划靶区内剂量不均匀性,GTVmin:肿瘤总体积内最小剂量,GTVmean:肿瘤总体积内平均剂量,GTVmax:肿瘤总体积内最大剂量,GTVmin/GTVmax:肿瘤总体积内剂量不均匀性;采用卡方检验和t检验Wilcoxon检验计算训练数据集和验证数据集之间的统计差异。
2.2临床和剂量学因素筛选结果
单因素和多因素分析临床、剂量学因素与肺癌SBRT后1年肿瘤局部状态的关系。结果如表2所示:
单因素分析显示:临床分期、吸烟史、血小板、PLR、血红蛋白、D95、Dmax、PTVmin、PTVmax、PTVmean、GTVmin、GTVmax、GTVmean、PTVmin/PTVmax在1年肿瘤局部控制与局部失败两组中有显著性差异(P<0.05);
将上述有显著性差异的临床、剂量学因素进行多因素分析显示:临床分期、血小板和GTVmin是影响1年肿瘤局部状态的预后因素。
表3进行单因素和多因素分析与肺癌患者局部控制的相关临床和剂量因素
Figure BDA0003254761970000211
Figure BDA0003254761970000221
Figure BDA0003254761970000231
Figure BDA0003254761970000241
GTV:肉眼肿瘤体积,PTV:计划靶体积,NLR:中性粒细胞与淋巴细胞比值,PLR:血小板与淋巴细胞比值,D95:覆盖95%靶区的处方剂量,Dmax:整个计划中最大剂量,PTVmin:计划靶区内最小剂量,PTVmean:计划靶区内平均剂量,PTVmax:计划靶区内最大剂量,PTVmin/PTVmax:计划靶区内剂量不均匀性,GTVmin:肿瘤总体积内最小剂量,GTVmean:肿瘤总体积内平均剂量,GTVmax:肿瘤总体积内最大剂量,GTVmin/GTVmax:肿瘤总体积内剂量不均匀性。
2.3影像组学特征筛选结果
如图2所示为提取和选择影像组学特征流程示意图,包括:
步骤S201,首先在CT图像分割感兴趣区域:(a)为肺癌患者CT图像,(b)为勾画感兴趣区域,(c)为感兴趣区域的3D图像;
步骤S202,接着从感兴趣区域中提取影像组学特征;
步骤S203,最后对提取的特征进行降维处理:(d)为计算组间相关系数(ICC)示意图,选择大于等于0.75的影像组学特征,(e)(f)为套索回归分析,筛选出具备优良性能但是自变量个数较少的变量合集。(e)(f)为影像组学特征进行套索回归分析,随着惩罚系数越大,变量越少,根据受试者工作特征曲线下的面积选择合适的变量,筛选出具备优良性能但是自变量个数较少的变量合集。影像组学特征分别包括形状特征,一阶特征和纹理特征,纹理特征又包括GLCM、GLDM、GLRLM、GLSZM、NGTDM。其中,GLCM为灰度共生矩阵特征,即一个其行列数表示灰度值、单元格包含灰度值处于一定关系(角度、距离)次数的矩阵,也称为二阶直方图;GLDM为灰度相关矩阵,即在图像空间中相隔某距离的两像素之间会存在的灰度关系;GLRLM为灰度游程长度矩阵,即其中每个元素(i,j)描述了灰度级在指定的方向上和距离上连续出现的次数或概率;GLSZM为灰度尺寸区域矩阵,即在行和列处的元素存储具有灰度级和大小的区域(具有相同灰度级的连接体素)数量的矩阵;NGTDM为邻域灰度差矩阵,即像素i的灰度值与距离为d的邻近像素j的平均像素值的绝对差异。
经过图2步骤提取与选择影像组学特征,结果显示pyradiomics提取出1502个影像组学特征,包括14个形状特征、288个一阶特征和1200个纹理特征;排除组间ICC小于0.75的影像组学特征进而保留出1090个影像组学特征;为了防止过拟合,首先经过t检验和秩和检验中留下p值<0.05的46个影像组学特征,接着进行套索分析筛选出最佳的变量合集,共10个潜在的影像组学特征,最后为了防止共线性,通过逐步回归分析可得最终4个影像组学特征,这4个影像组学特征即筛选影像组学特征,分别是wavelet-LLL_glszm_SmallAreaEmphasis、wavelet-LHH_glcm_JointAverage、wavelet-LHH_ngtdm_Complexity、squareroot_glcm_DifferenceEntropy。
如图3a至3e分别显示在训练集的局部控制与局部失败两组患者中的4个影像组学特征和在训练集和验证集中局部控制与局部失败两组患者的影像组学评分的数据特点和整体分布。图3a至图3f中,纵坐标是指4个影像组学特征和影像组学评分的数值,横坐标是指局部控制与局部失败分组。其中:
图3a为影像组学特征Wavelet-LLL_glszm_SmallAreaEmphasis在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3b为影像组学特征Wavelet-LHH_glcm_JointAverage在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3c为影像组学特征Wavelet-LHH_ngtdm_Complexity在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3d为影像组学特征Squareroot_glcm_DifferenceEntropy在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值;
图3e为影像组学评分在训练集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值。
另外,图3f为影像组学评分在验证集的局部控制与局部失败两组患者中的数据特点,整体分布,组间差异和相应的p值。
图3a至3f评估两组影像组学特征和影像组学评分的差异,并指出相应的p值,p值通过独立样本t检验或者Wilcoxon秩和检验。图3a至3d显示了在训练组中验证了各个影像组学特征的意义,说明各个影像组学特征数值越大,肿瘤局部越有可能控制。
2.4选择最佳分类器
应用各种分类器建立影像组学模型的性能如表1所示,当利用决策树、支持向量机建立影像组学模型时,存在的或多或少的问题,如利用DT分类法建立的影像组学模型的分类能力没有统计学意义,模型的AUC低于0.5,或者将这些特征输入SVM分类器中,得到的模型性能较差,特异性较低;与上述方法相比,LR方法建立的模型表现出了最佳的性能和准确度,因此将用于后续建模。其中,AUC是指为受试者工作特征曲线下的面积,是衡量学习器优劣的一种性能评价指标,表示预测的正例排在负例前面的概率。AUC=1,指完美分类器,AUC=[0.85,0.95],指效果很好,AUC=[0.7,0.85],指效果一般,AUC=[0.5,0.7],指效果较低,AUC=0.5,指跟随机猜测一样以及模型没有预测价值,AUC<0.5,比随机猜测还差。
2.5预测模型构建
由上述所确定的4个影像组学特征作为筛选影像组学特征,建立影像组学模型,影像组学评分=-27.645+14.393×wavelet-LLL_glszm_SmallAreaEmphasi+8.075×wavelet-LHH_glcm_JointAverage-3.386×wavelet-LHH_ngtdm_Complexity+9.196×squareroot_glcm_DifferenceEntropy。
上述每个筛选影像组学特征的权重,通过如下方式获得:
获取立体定向放疗的肺癌患者治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败;
从所述医学影像图中提取多个筛选影像组学特征的数据,所述筛选影像组学特征从多个影像学特征中筛选得到,且所述筛选影像学特征的组间相关系数大于等于预设影像相关系数阈值;
所述影像组学模型为偏置值与多个筛选影像组学特征的数据的加权值之和,以所述筛选影像组学特征的数据作为影像组学模型的输入,治疗后的肿瘤状态作为所述影像组学模型的输出,对所述影像组学模型采用对数几率回归进行训练;
训练后,得到所述影像组学模型的偏置值以及每一所述影像学特征的权重。
影像组学模型优选为逻辑回归模型。影像组学模型的模型形式为
Figure BDA0003254761970000271
其中,N为筛选影像组学特征的数量,wi为第i个筛选影像组学特征的权重,b为偏置值,Ki为第i个筛选影像组学特征的数据。
以筛选影像组学特征的权重作为参数进行训练,通过肿瘤状态对影像组学模型中的权重进行参数优化,得到最终的影像组学模型。训练后的影像组学模型的参数即包括了每个筛选影像组学特征的权重。
为了说明影像组学评分在诺谟图上的有效性,影像组学评分在1年肿瘤局部控制组和局部失败组中的分布如图3e-3f所示,表明影像组学评分在两组中存在显著差异,评分定量值越大,则1年肿瘤局部控制的可能性越大。
2.6综合模型
采用临床分期、血小板和GTVmin建立临床模型,影像组学评分结合临床和剂量学因素建立综合模型。
具体来说,综合模型为逻辑回归模型。综合模型的模型形式为c+m1L1+m2L2+m3L3+m4L4,其中,c为偏置值,m1为临床分期的权重,L1为临床分期的数据,m2为血小板的权重,L2为血小板的数据,m3为GTVmin的权重,L3为GTVmin的数据,m4为影像组学评分的权重,L4为影像组学评分的数据。
以临床分期、血小板、GTVmin、影像组学评分的数据作为综合模型的输入,以肿瘤状态作为综合模型的输出,以临床分期、血小板、GTVmin、影像组学评分的权重作为参数进行训练,通过肿瘤状态对综合模型中的权重进行参数优化,得到最终的综合模型。训练后的模型,输入临床分期、血小板、GTVmin、影像组学评分的数据,经过c+m1L1+m2L2+m3L3+m4L4的计算,并对计算结果进行分类后,得出预测的肿瘤状态。
2.7预测模型评价
如表1和图4a至图4c所示,图4a为影像组学模型、临床模型和综合模型在训练组的受试者工作特征曲线ROC及ROC曲线下面积(AUC),图4a展示了影像组学模型受试者工作特征曲线41a、临床模型受试者工作特征曲线42a、以及综合模型受试者工作特征曲线43a。图4b为影像组学模型、临床模型和综合模型在验证组的受试者工作特征曲线ROC及ROC曲线下面积(AUC),图4b展示了影像组学模型受试者工作特征曲线41b、临床模型受试者工作特征曲线42b、以及综合模型受试者工作特征曲线43b。
图4c为影像组学模型、临床模型和综合模型在训练组和验证组的ROC曲线下面积(AUC)比较示意图。其中:P1为训练组的影像组学模型与临床模型的对比结果,P2为训练组的影像组学模型与综合模型的对比结果,P3为训练组的临床模型与综合模型的对比结果,P4为验证组的影像组学模型与临床模型的对比结果,P5为验证组的影像组学模型与综合模型的对比结果,P6为验证组的临床模型与综合模型的对比结果。*为表达显著性(P<0.05)。图4a和图4b用ROC曲线和DeLong检验比较了三个预测模型的AUC值,结果显示影像组学模型、临床模型和综合模型的AUC(95%置信区间(CI))在训练组中分别为0.811(95%CI:0.713-0.910)、0.845(95%CI:0.757-0.934)和0.911(95%CI:0.845-0.977),在验证组中分别为0.702(95%CI:0.507-0.898)、0.786(95%CI:0.638-0.933)和0.818(95%CI:0.659-0.978);影像组学模型、临床模型和综合模型的准确率在训练组中分别为67.4%、82.0%和85.4%,在试验组中分别为92.9%、77.5%和82.5%;在训练组中,综合模型预测1年肿瘤局部控制状况明显优于影像组学模型(P=0.025)和临床模型(P=0.033),而影像组学模型和临床模型性能表现相似(P=0.613);在验证集中,综合模型的效果优于比单独模型包括临床因素模型和影像组学模型,由于样本量少或者混杂因素影响表现没有统计学差异,但是也可以看出综合模型效果更好的趋势。综合模型详细情况以及每个选定特征的贡献如图5所示,其中回归系数值是线性预测系数,p值表示特征有无统计学意义。图5中的截距是指模型在y轴上的截距,代表模型的起点;回归系数表示每个选定特征每变动一单位,因变量将平均变动的数量,每个选定特征的回归系数越大,对肿瘤局部控制状态影响越大;P值<0.05表示选定特征的达到显著性,P值>=0.05表示选定特征的没有达到显著性。
2.7临床应用
基于综合模型最好,为了方便临床医生应用,通过影像组学评分、临床分期、血小板和GTVmin构建了可视化诺谟图预测肺癌患者的局部控制,如图6a所示;Hosmer-Lemeshow检验结果每个队列没有显著差异(训练队列,P=0.898,试验队列,P=0.891),表明列线图是可接受的;诺谟图的校正曲线证实在图6b的训练数据集和图6c的验证数据集中,预测1年肿瘤局部控制的概率与实际观察一致。通过对比训练组的影像组学模型诺谟图61d、训练组的临床模型诺谟图62d、训练组的综合模型诺模图63d、训练组的All诺谟图64d和训练组的None诺谟图65d,可以看出综合模型有利于预测1年肿瘤局部控制概率,综合模型诺谟图63d的曲线下面积大于其他两种模型的诺谟图。通过对比验证组的影像组学模型诺谟图61e、验证组的临床模型诺谟图62e、验证组的综合模型诺模图63e、验证组的All诺谟图64e和验证组的None诺谟图65e,可以看出综合模型有利于预测1年肿瘤局部控制概率,综合模型诺谟图63e的曲线下面积大于其他两种模型的诺谟图。因此,图6d和图6e表明综合模型诺谟图具有最高的临床可行性和实用性,All表示所有患者都接受干预即影像学随访的获益率,而None为所有病人都不接受干预的获益率。其中,图6b和图6c显示了实际曲线(Apparent)、校正曲线(Bias-corrected)与理想曲线(Ideal)校正曲线与理想曲线之间越相近,说明模型的预测能力越好。
如图7所示为本发明一种电子设备的硬件结构示意图,包括:
至少一个处理器701;以及,
与至少一个所述处理器701通信连接的存储器702;其中,
所述存储器702存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如前所述的肿瘤局部控制预测模型的构建方法。
图7中以一个处理器701为例。
电子设备还可以包括:输入装置703和显示装置704。
处理器701、存储器702、输入装置703及显示装置704可以通过总线或者其他方式连接,图中以通过总线连接为例。
存储器702作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的肿瘤局部控制预测模型的构建方法对应的程序指令/模块,例如,图1所示的方法流程。处理器701通过运行存储在存储器702中的非易失性软件程序、指令以及模块,从而执行各种功能应用以及数据处理,即实现上述实施例中的肿瘤局部控制预测模型的构建方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据肿瘤局部控制预测模型的构建方法的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至执行肿瘤局部控制预测模型的构建方法的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置703可接收输入的用户点击,以及产生与肿瘤局部控制预测模型的构建方法的用户设置以及功能控制有关的信号输入。显示装置704可包括显示屏等显示设备。
在所述一个或者多个模块存储在所述存储器702中,当被所述一个或者多个处理器701运行时,执行上述任意方法实施例中的肿瘤局部控制预测模型的构建方法。
本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。
本发明一实施例提供一种存储介质,所述存储介质存储计算机指令,当计算机执行所述计算机指令时,用于执行如前所述的肿瘤局部控制预测模型的构建方法的所有步骤。
如图8所示为本发明一实施例一种肺癌患者治疗后肿瘤局部控制预测方法的工作流程图,采用如前所述的肿瘤局部控制预测模型的构建方法构建综合模型,所述方法包括:
步骤S801,获取立体定向放疗的待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图;
步骤S802,基于所述医学影像图,得到关于该医学影像图的影像组学评分;
步骤S803,将待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图的影像组学评分输入所述综合模型,得到待预测肺癌患者的治疗后肿瘤状态,所述肿瘤状态包括局部控制或局部失败。
具体来说,在构建了如前所述的综合模型后,执行步骤S801,获取立体定向放疗的待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图。然后执行步骤S802,基于所述医学影像图,得到关于该医学影像图的影像组学评分。具体来说可以采用与构建综合模型时相同的影像组学评分计算方法,确定待预测肺癌患者的影像组学评分。
然后,执行步骤S803,将待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图的影像组学评分输入所述综合模型,得到待预测肺癌患者的治疗后肿瘤状态,所述肿瘤状态包括局部控制或局部失败。
具体来说,输入临床分期、血小板、GTVmin、影像组学评分的数据,经过综合模型对临床分期、血小板、GTVmin、影像组学评分的数据的加权计算,并对计算结果进行分类后,得出预测的肿瘤状态概率。
本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。
如图9所示为本发明一种电子设备的硬件结构示意图,包括:
至少一个处理器901;以及,
与至少一个所述处理器901通信连接的存储器902;其中,
所述存储器902存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如前所述的肺癌患者治疗后肿瘤局部控制预测方法。
图9中以一个处理器901为例。
电子设备还可以包括:输入装置903和显示装置904。
处理器901、存储器902、输入装置903及显示装置904可以通过总线或者其他方式连接,图中以通过总线连接为例。
存储器902作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的肺癌患者治疗后肿瘤局部控制预测方法对应的程序指令/模块,例如,图8所示的方法流程。处理器901通过运行存储在存储器902中的非易失性软件程序、指令以及模块,从而执行各种功能应用以及数据处理,即实现上述实施例中的肺癌患者治疗后肿瘤局部控制预测方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据肺癌患者治疗后肿瘤局部控制预测方法的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至执行肺癌患者治疗后肿瘤局部控制预测方法的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置903可接收输入的用户点击,以及产生与肺癌患者治疗后肿瘤局部控制预测方法的用户设置以及功能控制有关的信号输入。显示装置904可包括显示屏等显示设备。
在所述一个或者多个模块存储在所述存储器902中,当被所述一个或者多个处理器901运行时,执行上述任意方法实施例中的肺癌患者治疗后肿瘤局部控制预测方法。
本发明综合考虑肿瘤全部特征,纳入影像组学特征、临床因素和剂量学因素建立预测原发性和转移性肺癌患者SBRT治疗后1年的局部控制模型,大大提高了肺癌患者SBRT治疗后1年的局部控制预测准确率。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种肿瘤局部控制预测模型的构建方法,其特征在于,包括:
获取立体定向放疗的肺癌患者治疗前的筛选临床因素的数据、治疗前的筛选剂量学因素的数据、治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败,所述筛选临床因素从多个临床因素中筛选得到,所述筛选剂量学因素从多个剂量学因素中筛选得到;
基于所述医学影像图,得到关于该医学影像图的影像组学评分;
以所述筛选临床因素的数据、筛选剂量学因素的数据、以及所述影像组学评分作为综合模型的输入,治疗后的肿瘤状态作为所述综合模型的输出,对所述综合模型进行训练,得到用于预测立体定向放疗的肺癌患者治疗后的肿瘤局部控制概率的综合模型。
2.根据权利要求1所述的肿瘤局部控制预测模型的构建方法,其特征在于,还包括:
获取立体定向放疗的肺癌患者治疗前的医学影像图、以及治疗后的肿瘤状态,所述肿瘤状态包括局部控制或局部失败;
从所述医学影像图中提取多个筛选影像组学特征的数据,所述筛选影像组学特征从多个影像学特征中筛选得到,且所述筛选影像学特征的组间相关系数大于等于预设影像相关系数阈值;
所述影像组学模型为偏置值与多个筛选影像组学特征的数据的加权值之和,以所述筛选影像组学特征的数据作为影像组学模型的输入,治疗后的肿瘤状态作为所述影像组学模型的输出,对所述影像组学模型采用对数几率回归进行训练;
训练后,得到所述影像组学模型的偏置值以及每一所述影像学特征的权重;
所述基于所述医学影像图,得到关于该医学影像图的影像组学评分,具体包括:
从所述医学影像图中提取多个筛选影像组学特征的数据;
基于每个所述筛选影像组学特征的权重,计算该医学影像图的影像组学评分为多个所述筛选影像组学特征的数据的加权值和偏置值之和,所述偏置值和每个所述筛选影像组学特征的权重从预先训练的影像组学模型中获取。
3.根据权利要求2所述的肿瘤局部控制预测模型的构建方法,其特征在于,还包括:
获取每一医学影像图的多个兴趣区域勾画图,每一医学影像图的多个兴趣区域勾画图为不同医生在同一医学影像图中勾画的感兴趣区域,将由同一医生勾画的兴趣区域勾画图作为一组图像组,计算每一影像组学特征在多组图像组之间的组间相关系数,将组间相关系数大于等于预设影像相关系数阈值作为第一影像学特征;
对符合正态分布和方差齐性检验的第一影像学特征进行独立样本t检验,对其余第一影像学特征进行秩和检验,保留差异性指标为显著性差异的第一影像学特征作为第二影像学特征;
执行最小绝对收缩和选择算法对第二影像学特征进行降维和选择,得到第三影像学特征;
利用逐步回归算法从第三影像学特征中剔除引起多重共线性的第三影像学特征,得到筛选影像组学特征。
4.根据权利要求2所述的肿瘤局部控制预测模型的构建方法,其特征在于,所述筛选影像组学特征包括:低低低小波系数转换-灰度区域大小矩阵-短欲补偿特征、低高高小波系数转换-灰度共生矩阵-联合均值特征、低高高小波系数转换-邻域灰度差矩阵特征-复杂度特征、平方根-灰度共生矩阵-差值熵特征。
5.根据权利要求1所述的肿瘤局部控制预测模型的构建方法,其特征在于,还包括:
获取患者的多个临床因素的数据和多个剂量学因素的数据;
对每个临床因素的数据和每个剂量学因素的数据分别进行对数几率回归单因素分析;
将单因素分析中差异性指标为显著性差异的临床因素的和剂量学因素的进行多因素对数几率回归分析,通过逐步回归筛选算法,对临床因素和剂量学因素进行筛选,得到筛选临床因素和筛选剂量学因素。
6.根据权利要求1所述的肿瘤局部控制预测模型的构建方法,其特征在于,所述筛选临床因素数据为临床分期数据、血小板数据,所述筛选剂量学因素数据为肿瘤总体积内最小剂量。
7.根据权利要求1至6任一项所述的肿瘤局部控制预测模型的构建方法,其特征在于,所述对所述综合模型进行训练,具体包括:
对所述综合模型采用对数几率回归算法进行训练。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如权利要求1至7任一项所述的肿瘤局部控制预测模型的构建方法。
9.一种肺癌患者治疗后肿瘤局部控制预测方法,其特征在于,采用如权利要求1至7任一项所述的肿瘤局部控制预测模型的构建方法构建综合模型,所述方法包括:
获取立体定向放疗的待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图;
基于所述医学影像图,得到关于该医学影像图的影像组学评分;
将待预测肺癌患者治疗前的筛选临床因素的数据、筛选剂量学因素的数据、以及治疗前的医学影像图的影像组学评分输入所述综合模型,得到待预测肺癌患者的治疗后肿瘤状态,所述肿瘤状态包括局部控制或局部失败。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如权利要求9所述的肺癌患者治疗后肿瘤局部控制预测方法。
CN202111056214.7A 2021-09-09 2021-09-09 肿瘤局部控制预测模型的构建方法、预测方法及电子设备 Active CN113610845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111056214.7A CN113610845B (zh) 2021-09-09 2021-09-09 肿瘤局部控制预测模型的构建方法、预测方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111056214.7A CN113610845B (zh) 2021-09-09 2021-09-09 肿瘤局部控制预测模型的构建方法、预测方法及电子设备

Publications (2)

Publication Number Publication Date
CN113610845A true CN113610845A (zh) 2021-11-05
CN113610845B CN113610845B (zh) 2024-04-26

Family

ID=78310303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111056214.7A Active CN113610845B (zh) 2021-09-09 2021-09-09 肿瘤局部控制预测模型的构建方法、预测方法及电子设备

Country Status (1)

Country Link
CN (1) CN113610845B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115067978A (zh) * 2022-06-09 2022-09-20 北京积水潭医院 一种骨肉瘤疗效评估方法及系统
CN115131343A (zh) * 2022-08-03 2022-09-30 华中科技大学同济医学院附属同济医院 一种慢性鼻窦炎分型方法、装置、设备及可读存储介质
CN115295126A (zh) * 2022-09-29 2022-11-04 浙江省肿瘤医院 预测胃癌错配修复基因缺陷的模型
CN115376649A (zh) * 2022-09-29 2022-11-22 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置
WO2023193390A1 (zh) * 2022-04-06 2023-10-12 中国医学科学院肿瘤医院 在治疗前对直肠癌治疗抵抗及其分子机制的预测系统
CN116994653A (zh) * 2023-09-26 2023-11-03 南方医科大学南方医院 脓毒症诊断模型构建方法、化合物筛选方法及电子设备
CN117745717A (zh) * 2024-02-08 2024-03-22 江南大学附属医院 一种剂量学与深度学习特征预测放射性肺炎的方法及系统
WO2024065987A1 (zh) * 2022-09-27 2024-04-04 山东第一医科大学(山东省医学科学院) 一种基于影像、病理和基因多组学的肺癌预后预测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2565646A1 (en) * 2006-10-26 2008-04-26 Mcgill University Systems and methods of clinical state prediction utilizing medical image data
US20170053090A1 (en) * 2015-08-18 2017-02-23 Case Western Reserve University Treatment planning and evaluation for rectal cancer via image analytics
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN112292691A (zh) * 2018-06-18 2021-01-29 谷歌有限责任公司 用于使用深度学习提高癌症检测的方法与系统
CN112951406A (zh) * 2021-01-27 2021-06-11 安徽理工大学 一种基于ct影像组学的肺癌预后辅助评估方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2565646A1 (en) * 2006-10-26 2008-04-26 Mcgill University Systems and methods of clinical state prediction utilizing medical image data
US20170053090A1 (en) * 2015-08-18 2017-02-23 Case Western Reserve University Treatment planning and evaluation for rectal cancer via image analytics
CN112292691A (zh) * 2018-06-18 2021-01-29 谷歌有限责任公司 用于使用深度学习提高癌症检测的方法与系统
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN112951406A (zh) * 2021-01-27 2021-06-11 安徽理工大学 一种基于ct影像组学的肺癌预后辅助评估方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘智华;邬蒙;EMMANUEL TOUBOUL MICHEL SCHLIENGER;: "X射线立体定向放射外科治疗肺癌脑转移瘤预后因素分析(附79例分析)", 肿瘤预防与治疗, no. 01 *
祁力文: "IMRT/VMAT模式下III期非小细胞肺癌发生放射性肺炎的模型预测", 中国优秀硕士学位论文全文数据库医药卫生科技辑, no. 01, pages 5 - 22 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023193390A1 (zh) * 2022-04-06 2023-10-12 中国医学科学院肿瘤医院 在治疗前对直肠癌治疗抵抗及其分子机制的预测系统
CN115067978A (zh) * 2022-06-09 2022-09-20 北京积水潭医院 一种骨肉瘤疗效评估方法及系统
CN115131343A (zh) * 2022-08-03 2022-09-30 华中科技大学同济医学院附属同济医院 一种慢性鼻窦炎分型方法、装置、设备及可读存储介质
CN115131343B (zh) * 2022-08-03 2023-12-26 华中科技大学同济医学院附属同济医院 一种慢性鼻窦炎分型方法、装置、设备及可读存储介质
WO2024065987A1 (zh) * 2022-09-27 2024-04-04 山东第一医科大学(山东省医学科学院) 一种基于影像、病理和基因多组学的肺癌预后预测系统
CN115295126A (zh) * 2022-09-29 2022-11-04 浙江省肿瘤医院 预测胃癌错配修复基因缺陷的模型
CN115376649A (zh) * 2022-09-29 2022-11-22 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置
CN115376649B (zh) * 2022-09-29 2023-07-07 中日友好医院(中日友好临床医学研究所) 用于鞘内阿片类镇痛药的剂量预测方法及装置
CN116994653A (zh) * 2023-09-26 2023-11-03 南方医科大学南方医院 脓毒症诊断模型构建方法、化合物筛选方法及电子设备
CN117745717A (zh) * 2024-02-08 2024-03-22 江南大学附属医院 一种剂量学与深度学习特征预测放射性肺炎的方法及系统
CN117745717B (zh) * 2024-02-08 2024-04-26 江南大学附属医院 一种剂量学与深度学习特征预测放射性肺炎的方法及系统

Also Published As

Publication number Publication date
CN113610845B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN113610845B (zh) 肿瘤局部控制预测模型的构建方法、预测方法及电子设备
CN109994199B (zh) 基于计算机的诊断系统
CN107072624B (zh) 用于自动治疗计划的系统和方法
US7606405B2 (en) Dynamic tumor diagnostic and treatment system
JP5785184B2 (ja) 画像の医療データ及び非画像の医療データの両者の連続的な記憶及び統合された分析のための診断技術
Tolkachev et al. Deep learning for diagnosis and segmentation of pneumothorax: The results on the Kaggle competition and validation against radiologists
US20090234627A1 (en) Modeling lung cancer survival probability after or side-effects from therapy
EP3431005A1 (en) Inflammation estimation from x-ray image data
CN111028914A (zh) 人工智能引导的剂量预测方法与系统
EP3836157A1 (en) Method for obtaining disease-related clinical information
CN115036002A (zh) 一种基于多模态融合模型的治疗效果预测方法及终端设备
CN113017674B (zh) 基于胸部ct图像的egfr基因突变检测方法和系统
Li et al. A novel radiogenomics framework for genomic and image feature correlation using deep learning
Lv et al. Development and validation of a clinically applicable deep learning strategy (HONORS) for pulmonary nodule classification at CT: a retrospective multicentre study
WO2006119340A2 (en) Dynamic tumor diagnostic and treatment system
Gunasekaran Leveraging object detection for the identification of lung cancer
Meng et al. Artificial intelligence-based radiomics in bone tumors: Technical advances and clinical application
Aliboni et al. Quantitative CT analysis in chronic hypersensitivity pneumonitis: a convolutional neural network approach
Jalalifar et al. A self-attention-guided 3D deep residual network with big transfer to predict local failure in brain metastasis after radiotherapy using multi-channel MRI
CN114266729A (zh) 一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和系统
CN110992312B (zh) 医学图像处理方法、装置、存储介质及计算机设备
Kumar et al. Improved UNet deep learning model for automatic detection of lung cancer nodules
CN115274119B (zh) 一种融合多影像组学特征的免疫治疗预测模型的构建方法
Dandıl et al. A Mask R-CNN based Approach for Automatic Lung Segmentation in Computed Tomography Scans
CN111326259A (zh) 疾病趋势等级确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant