CN112329876A - 一种基于影像组学的结直肠癌预后预测方法及设备 - Google Patents

一种基于影像组学的结直肠癌预后预测方法及设备 Download PDF

Info

Publication number
CN112329876A
CN112329876A CN202011277794.8A CN202011277794A CN112329876A CN 112329876 A CN112329876 A CN 112329876A CN 202011277794 A CN202011277794 A CN 202011277794A CN 112329876 A CN112329876 A CN 112329876A
Authority
CN
China
Prior art keywords
patient
score
omics
colorectal cancer
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011277794.8A
Other languages
English (en)
Inventor
高峰
蔡都
段鑫
吴小剑
柯嘉
王伟
黄泽平
朱琪琪
钟敏儿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sixth Affiliated Hospital of Sun Yat Sen University
Original Assignee
Sixth Affiliated Hospital of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sixth Affiliated Hospital of Sun Yat Sen University filed Critical Sixth Affiliated Hospital of Sun Yat Sen University
Priority to CN202011277794.8A priority Critical patent/CN112329876A/zh
Publication of CN112329876A publication Critical patent/CN112329876A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/032Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请实施例提供一种基于影像组学的结直肠癌预后预测方法及设备,该方法包括提取患有结直肠癌的患者的医学图像中预设影像组学特征;根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。本申请实施例方法通过获取结直肠癌患者的医学图像中的影像组学特征,从而确定影像组学分数,然后根据影像组学分数与患者病理因素得到患者的预后预测结果,能够廉价、无创地为结直肠癌患者进行术前的有效干预,以及术后的预测。

Description

一种基于影像组学的结直肠癌预后预测方法及设备
技术领域
本申请涉及医学图像处理领域,具体而言,涉及一种基于影像组学的结直肠癌预后预测方法及设备。
背景技术
结直肠癌(CRC)是最常见的癌症之一,在全球癌症相关死亡原因里排第三位。尽管近年来癌症治疗领域取得了一些新进展,结直肠癌的5年总生存率仍然低于60%。以往结直肠癌的治疗方案主要是根据TNM分期、肿瘤大小、分化程度等临床病理因素来确定,没有充分考虑肿瘤的异质性。近年来随着测序成本的下降和生物信息学分析方法的发展,基因分子标记物已成为最常用也是研究最多的癌症相关分子标记物。
然而,基因检测需要花费高额的检测成本和较长的检测时间,给病人造成一定的经济负担,因此尽管许多基因分子标记物的预测性能很好,目前依然难以在临床大面积推广应用。此外,基因检测一般需要进行术前有创活检或者取一部分术后切除标本进行检测,前者需要承担检测的创伤与风险,后者无法根据检测结果在术前进行有效的干预。因此,有必要设计一种廉价、无创、可量化的结直肠癌预后预测方法。
发明内容
本申请实施例的目的在于提供一种基于影像组学的结直肠癌预后预测方法及设备,用以改善现有基因检测方法在结直肠癌预后预测中需要承担检测的创伤与风险,或者无法根据检测结果在术前进行有效的干预等问题。
第一方面,本申请实施例提供了一种基于影像组学的结直肠癌预后预测方法,所述方法包括:提取患有结直肠癌的患者的医学图像中预设影像组学特征;根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
在上述实现过程中,通过提取结直肠癌的患者的医学图像中预设影像组学特征,该预设影像组学特征能够描述组织或病变的特征,比如肿瘤形状、肿瘤质地等,可以为肿瘤评估提供丰富的信息;根据影像组学分数来反映患者的生存风险程度,可以直观地反映出患者的生存风险程度;然后根据影像组学分数与患者病理因素得到所述患者的预后预测结果,通过该方法能够廉价、无创伤性并且可量化结直肠癌患者的预后情况。
结合第一方面,在一种实施方式中,所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果,包括:根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
在上述实现过程中,通过构建列线图的方式来反映患者的预后预测结果,能够通过列线图将多个结直肠癌预测指标进行整合,从而直观地表达出影响结直肠癌各变量之间的相互关系。
结合第一方面,在另一种实施方式中,所述根据所述影像组学分数与患者病理因素构建列线图,包括:根据所述影像组学分数进行生存分析,获得所述影像组学分数与患者预后的相关性;根据所述影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果;根据所述分析结果构建列线图。
在上述实现过程中,根据影像组学分数进行生存分析能够表明影像组学特征与结直肠癌的生存预后显著相关,根据影像组学分数与患者病理因素进行单因素分析能够得出对结直肠癌的生存预后显著变量,通过多因素分析能够明确各变量之间的相关性,然后根据分析结果构建列线图,能够直观地反映结直肠癌的预后结果。
结合第一方面,在另一种实施方式中,在所述提取患有结直肠癌的患者的医学图像中预设影像组学特征之前,所述方法还包括:对训练集的医学图像进行特征提取,获取多个初始影像组学特征种类;根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类。
在上述实现过程中,根据多个初始影像组学特征确定出所述预设影像组学特征,能够有效地筛选出影响结直肠癌的关键特征,从而为结直肠癌的预后预测提供相关信息。
结合第一方面,在另一种实施方式中,所述根据所述多个初始影像组学特征种类确定出所述预设影像组学特征种类,包括:对所述多个初始影像组学特征进行标准化,得到高信号强度影像组学特征种类;对所述高信号强度影像组学特征种类进行筛选,得到所述预设影像组学特征的种类。
在上述实现过程中,通过对多个初始影像组学特征种类进行标准化,能够排除低信号强度的影像组学特征种类,得到高信号强度影像组学特征种类,从而进一步地对高信号强度影像组学特征种类进行筛选,得到关键影像组学特征种类。
结合第一方面,在另一种实施方式中,在所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果之后,所述方法还包括:获取所述患者在预测期的真实结果;将所述患者在预测期的真实结果与所述患者的预后预测结果进行对比,得到对比结果;根据所述对比结果确定所述患者的预后预测结果的准确性。
在上述实现过程中,通过将患者预测结果与真实结果进行对比,从而能够验证预测结果的准确性。
第二方面,本申请实施例提供了一种基于影像组学的结直肠癌预后预测设备,所述设备包括:信息获取模块,用于提取患有结直肠癌的患者的医学图像中预设影像组学特征;处理模块,用于根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;所述处理模块还用于根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
结合第二方面,在一种实施方式中,所述处理模块具体用于:根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
结合第二方面,在另一种实施方式中,所述处理模块具体用于:根据所述影像组学分数进行生存分析,获得所述影像组学分数与患者预后的相关性;根据所述影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果;根据所述分析结果构建列线图。
结合第二方面,在另一种实施方式中,所述信息获取模块在用于提取患有结直肠癌的患者的医学图像中预设影像组学特征之前,还用于:对训练集的医学图像进行特征提取,获取多个初始影像组学特征种类;根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类。
结合第二方面,在另一种实施方式中,所述信息获取模块具体用于:对所述多个初始影像组学特征种类进行标准化,得到高信号强度影像组学特征种类;对所述高信号强度影像组学特征种类进行筛选,得到所述预设影像组学特征的种类。
结合第二方面,在另一种实施方式中,所述处理模块具体用于:获取所述患者在预测期的真实结果;将所述患者在预测期的真实结果与所述患者的预后预测结果进行对比,得到对比结果;根据所述对比结果确定所述患者的预后预测结果的准确性。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器和总线,所述处理器通过所述总线与所述存储器相连,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被服务器执行时实现如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种基于影像组学的结直肠癌预后预测方法的流程图;
图2为本申请实施例提供的一种基于影像组学的结直肠癌预后预测设备的结构框图;
图3为本申请实施例提供的一种基于影像组学的结直肠癌预后预测实施例流程图;
图4为本申请实施例提供的一种时间依赖ROC曲线确定最佳阈值示意图;
图5为本申请实施例提供的一种列线图;
图6为本申请实施例提供的一种列线图评价校准曲线示意图;
图7为本申请实施例提供的一种列线图评价ROC曲线示意图;
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1为本申请实施例提供的一种基于影像组学的结直肠癌预后预测方法的流程图,该方法可以应用于图2所示的基于影像组学的结直肠癌预后预测设备,具体的,如图1所示的方法包括:
110,提取患有结直肠癌的患者的医学图像中预设影像组学特征。
在所述提取患有结直肠癌的患者的医学图像中预设影像组学特征之前,所述方法还包括:
对训练集的医学图像进行特征提取,获取多个初始影像组学特征种类;
根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类。
所述根据所述多个初始影像组学特征种类确定出所述预设影像组学特征种类,包括:
对所述多个初始影像组学特征种类进行标准化,得到高信号强度影像组学特征种类;
对所述高信号强度影像组学特征种类进行筛选,得到所述预设影像组学特征的种类。
本申请实施例中,影像组学特征可以是指医学图像的形状特征、灰度特征、纹理特征和大小特征,但本申请实施例并不限于此。
本申请实施例中的预后表示指根据经验预测的疾病发展情况。
在一种实施例中,首先获取患有结直肠癌的患者的电子计算机断层扫描(CT,Computed Tomography)图像或者磁共振成像(MRI,Magnetic Resonance Imaging)图像,经由专业临床医生对CT图像或者MRI图像进行勾画,利用专业软件勾画出感兴趣区域(ROI,region of interest)。
需要说明的是,上述医学图像是指结肠发生病变部位的医学图像;勾画感兴趣区域的专业软件可以是ITK-snap、Matlab和3d slicer中的至少一种,但本申请实施例并不限于此。
在一种实施例中,利用现有的程序对感兴趣区域的图像进行特征提取,获得多个初始影像组学特征,然后根据多个初始影像组学特征确定出关键的影像组学特征。
需要说明的是,现有的程序可以是python程序包(pyradiomics)、高斯函数差分(DOG,Difference of Gaussian)、尺度不变特征变换(SIFT,Scale-invariant featurestransform)和局部二值模式(LBP,Local Binary Pattern)中的至少一种,但本申请实施例并不限于此。
在一种实施例中,利用现有的程序对感兴趣区域的图像进行特征提取,获得多个初始影像组学特征,然后对多个初始影像组学特征进行标准化,得到高信号强度影像组学特征,进一步地,对高信号强度影像组学特征进行建模,从而筛选出关键影像组学特征。
需要说明的是,对多个初始影像组学特征进行标准化的方法可以是离差标准化(min-max标准化,Min-max normalization标准化)、标准差标准化(z-score标准化,zero-meannormalization标准化)和模糊量化法中的至少一种,但本申请实施例并不限于此。
需要说明的是,高信号强度影像组学特征表示在标准化过程中得分或者取值较大的影像组学特征。
需要说明的是,对高信号强度影像组学特征进行建模的方法可以采用套索算法(LASSO)回归模型、线性回归模型(Linear Regression)和逻辑回归模型(LogisticRegression)中的至少一种,但本申请实施例并不限于此。
需要说明的是,在为患者进行结直肠癌预后预测时,上述关键影像组学特征可以作为预设的影像组学特征,关键影像组学特征描述了组织或病变的特征,如肿瘤形状、肿瘤质地等,可以为肿瘤评估提供丰富的信息。
120,根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度。
在一种实施例中,基于上述关键影像组学特征计算出影像组学的分数,根据该分数确定患者的生存风险程度。
需要说明的是,上述生存风险程度可以表示患有结直肠癌的患者在手术后复发的风险程度,也可以表示患有结直肠癌的患者死亡的风险程度,但本申请实施例并不限于此。
130,根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果,包括:
根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
所述根据所述影像组学分数与患者病理因素构建列线图,包括:
根据所述影像组学分数进行生存分析,获得所述影像组学分数与患者预后的相关性;
根据所述影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果;
根据所述分析结果构建列线图。
在所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果之后,所述方法还包括:
获取所述患者在预测期的真实结果;
将所述患者在预测期的真实结果与所述患者的预后预测结果进行对比,得到对比结果;
根据所述对比结果确定所述患者的预后预测结果的准确性。
在一种实施例中,根据上述影像组学分数与患者病理因素得到患者的预后预测结果。
在一种实施例中,根据上述影像组学分数与患者病理因素构建列线图,通过列线图来反映患者的预后预测结果。
通过构建列线图的方式来反映患者的预后预测结果,能够通过列线图将多个结直肠癌预测指标进行整合,从而直观地表达出影响结直肠癌各变量之间的相互关系。
在一种实施例中,对上述影像组学分数进行生存分析,根据生存分析结果来判定影像组学特征与结直肠癌患者生存预后的相关性。
需要说明的是,生存分析的方法可以是线性回归、方差分析、logistic回归、Kaplan-Meier回归、Cox回归和log-rank检验中的至少一种,但本申请实施例并不限于此。
在一种实施例中,进一步地根据影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果,然后根据分析结果构建列线图。
需要说明的是,患者病理因素可以包括年龄、性别、癌胚抗原指标(血清CEA浓度)、分化程度和肿瘤分期(TNM,Tumor Node Metastasis)中的至少一种,但本申请实施例并不限于此。
在一种实施例中,分别对上述患者病理因素以及影像组学分数进行单因素分析,进一步对单因素分析显著的变量纳入多因素分析,基于多因素分析的结果,联合影像组学特征与TNM分期,构建列线图,从而根据列线图直观地来反映患者的预后预测结果。
在一种实施例中,还可以通过统计患者在预测期的真实结果,进一步地将真实结果与患者的预测结果进行对比,从而验证预后预测的准确性。
需要说明的是,验证预后预测的准确性的方式可以通过校准曲线、接受者操作特性曲线(ROC,receiver operating characteristic curve)、一致性指数(C-index,indexof concordance)以及ROC曲线下与坐标轴围成的面积(AUC,Area Under Curve)中的至少一种,但本申请实施例并不限于此。
通过提取结直肠癌的患者的医学图像中预设影像组学特征,该预设影像组学特征能够描述组织或病变的特征,比如肿瘤形状、肿瘤质地等,可以为肿瘤评估提供丰富的信息;根据影像组学分数来反映患者的生存风险程度,可以直观地反映出患者的生存风险程度;然后根据影像组学分数与患者病理因素得到所述患者的预后预测结果,通过该方法能够廉价、无创伤性并且可量化结直肠癌患者的预后情况。
请参照图2,图2为本申请实施例提供的一种基于影像组学的结直肠癌预后预测设备的结构框图;图2所提供的基于影像组学的结直肠癌预后预测设备与图1所述的方法对应,具有实现图1所述方法的功能模块。
在一种实施方式中,图2所提供的基于影像组学的结直肠癌预后预测设备包括:
信息获取模块210和处理模块220。
信息获取模块,用于提取患有结直肠癌的患者的医学图像中预设影像组学特征;
处理模块,用于根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;
所述处理模块还用于根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
在另一种实施方式中,所述处理模块具体用于:
根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
在另一种实施方式中,所述处理模块具体用于:
根据所述影像组学分数进行生存分析,获得所述影像组学分数与患者预后的相关性;
根据所述影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果;根据所述分析结果构建列线图。
在另一种实施方式中,所述信息获取模块在用于提取患有结直肠癌的患者的医学图像中预设影像组学特征之前,还用于:
对训练集的医学图像进行特征提取,获取多个初始影像组学特征种类;根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类。
在另一种实施方式中,所述信息获取模块具体用于:
对所述多个初始影像组学特征种类进行标准化,得到高信号强度影像组学特征种类;
对所述高信号强度影像组学特征种类进行筛选,得到所述预设影像组学特征的种类。
在另一种实施方式中,所述处理模块具体用于:
获取所述患者在预测期的真实结果;
将所述患者在预测期的真实结果与所述患者的预后预测结果进行对比,得到对比结果;
根据所述对比结果确定所述患者的预后预测结果的准确性。
需要说明的是,图2所提供的基于影像组学的结直肠癌预后预测设备,能够实现图1方法实施例中涉及基于影像组学的结直肠癌预后预测的各个过程。基于影像组学的结直肠癌预后预测设备中的各个模块的操作和/或功能,分别为了实现图1中的方法实施例中的相应流程。具体可参见上述方法实施例中的描述,为避免重复,此处适当省略详细描述。
前文简单描述了基于影像组学的结直肠癌预后预测方法,以及基于影像组学的结直肠癌预后预测设备,下面结合图3详细描述基于影像组学的结直肠癌预后预测实施例。
图3为本申请实施例提供的一种基于影像组学的结直肠癌预后预测实施例流程图,如图3所示的流程图包括:
310,提取图像中的影像组学特征。
收集381个病人的CT图像资料和基本临床信息,其中242人作为训练集,139人归入验证集。
经由专业临床医生对训练集中病人的CT图像进行勾画,利用专业软件ITK-snap勾画出感兴趣区域(ROI),通过python程序包(pyradiomics)对图像进行特征提取处理,提取得到107个影像组学特征。
320,提取关键影像组学特征以及计算影像组学分数。
针对上述107个影像组学特征进行z-score标准化,选取标准化过程中得分较高的85个影像组学特征;
进一步地,基于上述85个影像组学特征利用机器学习算法LASSO回归进行建模;
建模过程中以无复发生存率(DFS,disease free survival)为结局建立模型,当模型的惩罚系数λ为0.044时部分似然偏差(partial likelihood deviance)最小,此时模型效果最好,从而得到效果最好的模型;
将上述85个影像组学特征输入到建立好的模型中,得到5个系数不为零的影像组学特征,其他影像组学特征的系数都为零,因此,将这5个系数不为零的影像组学特征作为关键影像组学特征;
进一步地,通过时间依赖的ROC曲线确定影像组学分数的最佳阈值;
如图4所示,图4为本申请实施例提供的一种时间依赖ROC曲线确定最佳阈值示意图,基于上述5个关键影像组学特征的系数计算训练集中患者的影像组学分数,然后分析5年内的ROC曲线,选取影像组学分数的最佳阈值-0.077,当影像组学分数大于-0.077的患者归为高风险组,低于-0.077的患者归为低风险组。
上述影像组学特征分数的计算方法如下:
影像组学特征分数=特征Aⅹ0.075+特征Bⅹ(-0.070)+特征Cⅹ0.029+特征Dⅹ0.028+特征Eⅹ0.116;
其中特征A表示original_shape_Maximum2DdiameterRow,即原始形状最大二维横径;
特征B表示original_firstorder_RobustMeanAbsoluteDeviation,即原始一阶稳健平均绝对偏差;
特征C表示original_glrlm_LongRunLowGrayLevelEmphasis,即原始灰度行程矩阵长程灰度增强;
特征D表示original_glrlm_RunVariance,即原始灰度行程矩阵行程方差;
特征E表示original_glrlm_SizeZoneNonUniformityNormalized,即原始灰度行程矩阵大小区域非均匀性标准化。
330,生存分析以及单因素多因素分析。
基于上述5关键个影像组学特征,分别计算训练集和验证集结直肠癌患者的影像组学分数,然后利用Kaplan-Meier曲线和log-rank检验对训练集进行生存分析,利用Kaplan-Meier曲线和log-rank检验对验证集进行生存分析,分析结果表明在训练集和验证集中,基于影像组学分数的高低风险组与无病生存期(DFS)都有显著关联。
因此,生存分析结果显示影像组学特征在训练集和验证集都与预后显著相关。
进一步地,分别在训练集和验证集利用cox回归对年龄、性别、血清CEA浓度、分化程度、TNM分期、影像组学分数分别进行单因素分析,将单因素分析显著的变量进一步纳入多因素分析,分析结果如表1所示:
表1在在训练集和验证集中单因素分析与多因素分析结果
Figure BDA0002779700110000141
根据上述结果表明,影像组学分数(Rad-score)与TNM分期同时在训练集和验证集与结直肠癌预后显著相关,且影像组学特征是结直肠癌的独立预后因素。
340,结合患者临床病理因素构建列线图。
根据多因素分析结果,结合影像组学特征与TNM分期构建列线图,如图5所示,图5为本申请实施例提供的一种列线图,通过列线图能够反映出结直肠癌患者生存预后情况。
在列线图中,预后相关变量的坐标长度由回归模型中的系数决定。对于每个患者,将每个变量的得分加权相加计算总分。根据评价结果和总分在指定患者生存时间上的映射关系,得出患者无病生存的概率。
350,评价列线图预测效果。
通过训练集和验证集中3年DFS和5年DFS画校准曲线来反映列线图的预测效果,如图6所示,图6为本申请实施例提供的一种列线图评价校准曲线示意图。
在图6中,(a)表示训练集中基于结直肠癌影像组学分数3年DFS的校准曲线;
在图6中,(b)表示训练集中基于结直肠癌影像组学分数5年DFS的校准曲线;
在图6中,(c)表示验证集中基于结直肠癌影像组学分数3年DFS的校准曲线;
在图6中,(d)表示验证集中基于结直肠癌影像组学分数5年DFS的校准曲线。
点线在图的对角线上,代表理想状态下预后模型与实际数据之间完全拟合。实线说明了模型预测与实际生存概率之间的拟合程度。
根据校准曲线(a-d)显示,在训练集和验证集的预测值与真实值一致性都较好。
图7所示,图7为本申请实施例提供的一种列线图评价ROC曲线示意图,通过在训练集和验证集的ROC曲线来反映预测效果;
在图7中,(a)表示在训练集中的ROC曲线;
图中①表示影像组学分数与TNM分期结合的ROC曲线,其AUC值为0.734;
图中②表示单独使用TNM分期的ROC曲线,其AUC值为0.657;
图中③表示单独使用影像组学分数的ROC曲线,其AUC值为0.629;
上述其结果表明影像组学分数与TNM分期结合后的AUC值都大于单独使用影像组学分数或TNM分期的AUC值;
在图7中,(b)表示在验证集中的ROC曲线;
图中④表示影像组学分数与TNM分期结合的ROC曲线,其AUC值为0.860;
图中⑤表示单独使用TNM分期的ROC曲线,其AUC值为0.815;
图中⑥表示单独使用影像组学分数的ROC曲线,其AUC值为0.660;
其结果表明影像组学分数与TNM分期结合后的AUC值都大于单独使用影像组学分数或TNM分期的AUC值;
因此,通过ROC曲线比较发现,联合影像组学分数与TNM分期的预测效果要优于单独使用影像组学分数或TNM分期。
请参照图8,图8为本申请实施例提供的一种电子设备的结构示意图,所述电子设备可以包括:至少一个处理器810,例如CPU,至少一个通信接口820,至少一个存储器830和至少一个通信总线840。其中,通信总线840用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口820用于与其他节点设备进行信令或数据的通信。存储器830可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器830可选的还可以是至少一个位于远离前述处理器的存储装置。存储器830中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器810执行时,电子设备执行图1所示方法过程。
本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被服务器执行时实现图1所示的方法过程。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述系统装置的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个装置或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于影像组学的结直肠癌预后预测方法,其特征在于,所述方法包括:
提取患有结直肠癌的患者的医学图像中预设影像组学特征;
根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;
根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果,包括:
根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述影像组学分数与患者病理因素构建列线图,包括:
根据所述影像组学分数进行生存分析,获得所述影像组学分数与患者预后的相关性;
根据所述影像组学分数与患者病理因素进行单因素分析与多因素分析,获得分析结果;
根据所述分析结果构建列线图。
4.根据权利要求1所述的方法,其特征在于,在所述提取患有结直肠癌的患者的医学图像中预设影像组学特征之前,所述方法还包括:
对训练集的医学图像进行特征提取,获取多个初始影像组学特征种类;
根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类。
5.根据权利要求4所述的方法,其特征在于,所述根据所述多个初始影像组学特征种类确定出所述预设影像组学特征的种类,包括:
对所述多个初始影像组学特征种类进行标准化,得到高信号强度影像组学特征种类;
对所述高信号强度影像组学特征种类进行筛选,得到所述预设影像组学特征的种类。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果之后,所述方法还包括:
获取所述患者在预测期的真实结果;
将所述患者在预测期的真实结果与所述患者的预后预测结果进行对比,得到对比结果;
根据所述对比结果确定所述患者的预后预测结果的准确性。
7.一种基于影像组学的结直肠癌预后预测设备,其特征在于,所述设备包括:
信息获取模块,用于提取患有结直肠癌的患者的医学图像中预设影像组学特征;
处理模块,用于根据所述预设影像组学特征确定影像组学分数,其中所述影像组学分数用于表示所述患者的生存风险程度;
所述处理模块还用于根据所述影像组学分数与患者病理因素得到所述患者的预后预测结果。
8.根据权利要求7所述的设备,其特征在于,所述处理模块具体用于:
根据所述影像组学分数与患者病理因素构建列线图,其中所述列线图用于反映所述患者的预后预测结果。
9.一种电子设备,其特征在于,包括:
处理器、存储器和总线,所述处理器通过所述总线与所述存储器相连,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,用于实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被服务器执行时实现如权利要求1-6任一所述方法。
CN202011277794.8A 2020-11-16 2020-11-16 一种基于影像组学的结直肠癌预后预测方法及设备 Pending CN112329876A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011277794.8A CN112329876A (zh) 2020-11-16 2020-11-16 一种基于影像组学的结直肠癌预后预测方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011277794.8A CN112329876A (zh) 2020-11-16 2020-11-16 一种基于影像组学的结直肠癌预后预测方法及设备

Publications (1)

Publication Number Publication Date
CN112329876A true CN112329876A (zh) 2021-02-05

Family

ID=74317436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011277794.8A Pending CN112329876A (zh) 2020-11-16 2020-11-16 一种基于影像组学的结直肠癌预后预测方法及设备

Country Status (1)

Country Link
CN (1) CN112329876A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114496306A (zh) * 2022-01-28 2022-05-13 北京大学口腔医学院 基于机器学习的预后生存阶段预测方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105319364A (zh) * 2015-10-28 2016-02-10 中山大学附属肿瘤医院 用于预测小肝癌复发的联合诊断标记
CN106815481A (zh) * 2017-01-19 2017-06-09 中国科学院深圳先进技术研究院 一种基于影像组学的生存期预测方法及装置
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN111862085A (zh) * 2020-08-03 2020-10-30 徐州市肿瘤医院 一种周围型nsclc的隐匿性n2淋巴结转移的预测方法及系统
CN111915596A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种肺结节良恶性预测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105319364A (zh) * 2015-10-28 2016-02-10 中山大学附属肿瘤医院 用于预测小肝癌复发的联合诊断标记
CN106815481A (zh) * 2017-01-19 2017-06-09 中国科学院深圳先进技术研究院 一种基于影像组学的生存期预测方法及装置
CN111657945A (zh) * 2020-06-16 2020-09-15 中南大学湘雅医院 一种基于增强mri影像组学的鼻咽癌预后辅助评估方法
CN111862085A (zh) * 2020-08-03 2020-10-30 徐州市肿瘤医院 一种周围型nsclc的隐匿性n2淋巴结转移的预测方法及系统
CN111915596A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种肺结节良恶性预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114496306A (zh) * 2022-01-28 2022-05-13 北京大学口腔医学院 基于机器学习的预后生存阶段预测方法和系统
CN114496306B (zh) * 2022-01-28 2022-12-20 北京大学口腔医学院 基于机器学习的预后生存阶段预测方法和系统

Similar Documents

Publication Publication Date Title
US7418123B2 (en) Automated method and system for computerized image analysis for prognosis
US10783627B2 (en) Predicting cancer recurrence using local co-occurrence of cell morphology (LoCoM)
US9230320B2 (en) Computer aided diagnostic system incorporating shape analysis for diagnosing malignant lung nodules
Wu et al. Grading glioma by radiomics with feature selection based on mutual information
US9014456B2 (en) Computer aided diagnostic system incorporating appearance analysis for diagnosing malignant lung nodules
WO2021135774A1 (zh) 肿瘤预测方法、装置、云平台及计算机可读存储介质
CN105005714A (zh) 一种基于肿瘤表型特征的非小细胞肺癌预后方法
US9424460B2 (en) Tumor plus adjacent benign signature (TABS) for quantitative histomorphometry
Dandıl A Computer‐Aided Pipeline for Automatic Lung Cancer Classification on Computed Tomography Scans
Xu et al. Using transfer learning on whole slide images to predict tumor mutational burden in bladder cancer patients
CN113017674B (zh) 基于胸部ct图像的egfr基因突变检测方法和系统
JP2017215876A (ja) 類似画像検索プログラム、類似画像検索方法、及び類似画像検索装置
CN110992312B (zh) 医学图像处理方法、装置、存储介质及计算机设备
Giannini et al. Specificity improvement of a CAD system for multiparametric MR prostate cancer using texture features and artificial neural networks
CN112329876A (zh) 一种基于影像组学的结直肠癌预后预测方法及设备
CN115631387B (zh) 基于图卷积神经网络的肺癌病理高危因素预测方法和装置
CN117711615A (zh) 基于影像组学的淋巴结转移状态分类预测方法及设备
Ou et al. Sampling the spatial patterns of cancer: Optimized biopsy procedures for estimating prostate cancer volume and Gleason Score
Sicilia et al. Early radiomic experiences in classifying prostate cancer aggressiveness using 3D local binary patterns
CN116703880A (zh) 一种免疫状态预测模型构建方法、预测方法及构建装置
Xu et al. Prediction breast molecular typing of invasive ductal carcinoma based on dynamic contrast enhancement magnetic resonance imaging radiomics characteristics: a feasibility study
Thanya et al. Grey Wolf Optimizer Based Deep Learning for Pancreatic Nodule Detection.
Mousavi Moghaddam et al. Lung parenchyma segmentation from CT images with a fully automatic method
Mendi et al. Radiomic analysis of preoperative magnetic resonance imaging for the prediction of pituitary adenoma consistency
CN108538369B (zh) 中枢神经系统肿瘤影像数据的分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination