CN116993689A - 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质 - Google Patents

一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116993689A
CN116993689A CN202310913294.6A CN202310913294A CN116993689A CN 116993689 A CN116993689 A CN 116993689A CN 202310913294 A CN202310913294 A CN 202310913294A CN 116993689 A CN116993689 A CN 116993689A
Authority
CN
China
Prior art keywords
image
pancreatic cancer
mesothelin
sigma
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310913294.6A
Other languages
English (en)
Inventor
王斌杰
李宣乐
杨晓慧
秦长江
王长福
王智
贺祥
王小丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan university huaihe hospital
Original Assignee
Henan university huaihe hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan university huaihe hospital filed Critical Henan university huaihe hospital
Priority to CN202310913294.6A priority Critical patent/CN116993689A/zh
Publication of CN116993689A publication Critical patent/CN116993689A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及生物医学技术领域及医学图像处理领域,具体公开了一种预测胰腺癌间皮素表达水平的方法,该具体步骤为:S1、对胰腺癌患者胰腺部位肿瘤区域医学图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像;S2、提取所述感兴趣区域图像中的影像组学特征;S3、将步骤S2提取的影像组学特征的值输入评分预测模型,计算得到所述感兴趣区域图像的图像评分;S4、对步骤S3获得的图像评分进行定性分析,预测所述胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平。本发明的方法能够有效预测建间皮素在胰腺癌患者中的表达水平,预测的AUC能够达到0.843,灵敏度达到了80.00%,特异度达到了75.68%,具有较高的准确性,不仅为当前临床上对胰腺癌肿瘤细胞间皮素表达水平检测提供了一种新的手段,还能够为胰腺癌临床治疗提供新的参考,有利于临床医生确定更精准的胰腺癌治疗方案。

Description

一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存 储介质
技术领域
本发明涉及生物医学技术领域及医学图像处理领域,具体公开了一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质。
背景技术
胰腺癌是消化系统常见恶性肿瘤之一,其恶性程度高、起病隐匿,且随着生活水平的提高,饮食结构改变,其病率呈逐年递增之趋势。目前,手术是唯一可能治愈胰腺癌的方法,包括Whipple手术、胰腺体尾切除术等,但术后并发症较多,疗效不尽如人意,术后中位生存期不足20个月,并且存在手术方式难度大、适应症有限等问题。
CAR-T疗法(Chimeric Antigen Receptor(CAR)T-cell Therapy),即嵌合抗原受体T细胞免疫疗法,是指从患者血液中收集T细胞,进行基因修饰,增强其对抗癌细胞的靶向和杀伤能力并扩增后,再输入患者体内,属于免疫疗法中的一种,主要用于恶性血液病的治疗,效果较好,近年来临床上开始逐渐开展其包括胰腺癌在内的实体瘤的CAR-T试验及临床研究。
间皮素(Mesothelin,MSLN)是由MSLN基因编码的一种细胞表面糖蛋白。因其在80%-85%的胰腺癌中特异性高表达,在正常组织中很少表达,因此间皮素有可能成为CAR-T癌症治疗的重要靶点,目前已有临床治疗试验证实其有效性。但文献调研发现,仍有15%-20%胰腺癌患者对间皮素不表达,不适宜该CAR-T疗法。
目前胰腺病变的诊断主要依靠影像学检查及手术或穿刺活检,传统影像学检查缺少直接确诊证据,不能作为最终确诊方法,手术活检创伤较大,穿刺活检难度及风险较高。现有检测胰腺癌患者肿瘤细胞间皮素表达的途径可通过胰腺穿刺活检,实施的主要难度及问题在于:1.操作难度大:胰腺大部分位于腹膜后,操作难度较大,需要经验丰富的医生进行操作,否则可能会造成组织损伤;2.取样不全面:胰腺穿刺取组织只能获取局部组织样本,不能全面反映胰腺的病变情况,可能会漏诊或误诊;3.并发症风险较大:胰腺穿刺取组织是一种有一定风险的操作,可能会引起胰瘘、出血、感染等并发症,需要慎重考虑。因此,如何简单高效无创的鉴别间皮素在胰腺癌患者中的高表达状态,将成为未来以MSLN为靶点胰腺癌CAR-T疗法临床转化的首要问题。
发明内容
针对现有技术中存在的问题和不足,本发明的目的旨在提供一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质。
为实现发明目的,本发明采用的技术方案如下:
本发明第一方面提供了一种预测胰腺癌间皮素表达水平的方法,包括以下步骤:
S1、对胰腺癌患者胰腺部位肿瘤区域医学图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像;
S2、提取所述感兴趣区域图像中的影像组学特征;
S3、将步骤S2提取的影像组学特征的值输入评分预测模型,计算得到所述感兴趣区域图像的图像评分;
S4、对步骤S3获得的图像评分进行定性分析,预测所述胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平。
根据上述的方法,优选地,所述影像组学特征为:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
根据上述的方法,优选地,所述评分预测模型用于计算图像评分的计算公式为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis-0.0005047131428348803×log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis-8.705494728811606×wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;其中,Lasso(p)表示图像评分。
根据上述的方法,优选地,步骤S4中所述对步骤S3获得的图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平,包括:
将步骤S3获得的图像评分与预设阈值进行比对,根据图像评分与预设阈值的大小关系,将胰腺癌患者划分为间皮素高表达组或间皮素低表达组。
根据上述的方法,优选地,当图像评分大于或等于预设阈值时,将胰腺癌患者划分为间皮素高表达组;当图像评分小于预设阈值时,将胰腺癌患者划分为间皮素低表达组。
根据上述的方法,优选地,所述预设阈值为0.512159557。
根据上述的方法,优选地,所述医学图像为CT影像;更加优选地,所述CT影像为CT平扫影像。
根据上述的方法,优选地,所述感兴趣区域图像为二维感兴趣区域图像。
根据上述的方法,优选地,采用开源软件3D Slicer对胰腺部位肿瘤区域医学图像进行处理,分割出胰腺部位肿瘤区域医学图像中病灶的感兴趣区域(ROI)图像。
根据上述的方法,优选地,采用Pyradiomics计算语言平台提取所述感兴趣区域图像中的影像组学特征;Pyradiomics计算语言平台为开源Python软件包。
本发明第二方面提供了一种预测胰腺癌间皮素表达水平的系统。所述系统包括图像处理模块、特征提取模块、评分预测模块、图像分类模块;其中,所述图像处理模块用于对胰腺癌患者胰腺部位肿瘤区域医学图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像;所述特征提取模块用于提取所述感兴趣区域图像中的影像组学特征;所述评分预测模块中设有评分预测模型,用于根据特征提取模块提取的影像组学特征计算所述感兴趣区域图像的图像评分;所述预测及结果输出模块用于对所述图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平并输出预测结果。
根据上述的系统,优选地,所述所述影像组学特征为:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
根据上述的系统,优选地,所述评分预测模型用于计算图像评分的计算公式为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis-0.0005047131428348803×log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis-8.705494728811606×wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;其中,Lasso(p)表示图像评分。
根据上述的系统,优选地,预测及结果输出模块对所述图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平的具体操作为:将所述图像评分与预设阈值进行比对,根据图像评分与预设阈值的大小关系,将胰腺癌患者划分为间皮素高表达组或间皮素低表达组。更加优选地,当图像评分大于或等于预设阈值时,将胰腺癌患者划分为间皮素高表达组;当图像评分小于预设阈值时,将胰腺癌患者划分为间皮素低表达组。
根据上述的系统,优选地,所述预设阈值为0.512159557。
根据上述的系统,优选地,所述医学图像为CT影像;更加优选地,所述CT影像为CT平扫影像。
根据上述的系统,优选地,感兴趣区域图像为二维感兴趣区域图像。
根据上述的系统,优选地,所述图像处理模块采用开源软件3D Slicer(版本4.10.0)对胰腺部位肿瘤区域医学图像进行处理,分割出胰腺部位肿瘤区域医学图像中病灶的感兴趣区域(ROI)图像。
根据上述的系统,优选地,所述特征提取模块采用Pyradiomics计算语言平台提取所述感兴趣区域图像中的影像组学特征;Pyradiomics计算语言平台为开源Python软件包。
本发明第三方面提供了一种电子设备。所述电子设备包括存储器,至少一个处理器,所述存储器上存储有处理器可读的应用程序,所述处理器用于执行所述应用程序以实现上述第一方面所述的预测胰腺癌间皮素表达水平的方法。
本发明第四方面提供了一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器进行加载,以执行上述第一方面所述的预测胰腺癌间皮素表达水平的方法。
与现有技术相比,本发明取得的积极有益效果如下:
(1)本发明通过对胰腺癌患者胰腺部位肿瘤病灶CT影像进行处理,获取肿瘤病灶的ROI区域图像,并利用Pyradiomics提取ROI区域图像的影像组学特征,然后根据提取的影像组学特征预测胰腺癌肿瘤细胞间皮素表达水平。因此,采用本发明的方法能够有效预测建间皮素在胰腺癌患者中的表达水平,预测的AUC能够达到0.843,灵敏度达到了80.00%,特异度达到了75.68%,具有较高的准确性,不仅为当前临床上对胰腺癌肿瘤细胞间皮素表达水平检测提供了一种新的手段,还能够为胰腺癌临床治疗提供新的参考,有利于临床医生确定更精准的胰腺癌治疗方案;而且,本发明作为一种影像组学辅助诊断技术,具备无创、直观、易于操作、检测效率高、预测准确率高的优点,能减轻因疾病实施有创诊断带来的痛苦和经济负担,同时也弥补了当前常规诊断方法的不足。
(2)本发明从ROI区域图像提取出的影像组学特征均从肿瘤靶病灶获取而来,不受年龄、性别等个体因素差异干扰,具有通用性和普适性,因此,本发明的方法是具有普适性,在不同的环境下都能具有稳定的评估效果。
(3)本发明的预测系统能够基于胰腺部位肿瘤病灶增强CT影像预测胰腺癌肿瘤细胞间皮素表达水平,预测的AUC能够达到0.843,灵敏度达到了80.00%,特异度达到了75.68%,具有较高的准确性具有较高的准确性,不仅为当前临床上对胰腺癌肿瘤细胞间皮素表达水平检测提供了一种新的手段,还能够为胰腺癌临床治疗提供新的参考,有利于临床医生确定更精准的胰腺癌治疗方案。
附图说明
图1为胰腺癌患者胰腺部位肿瘤细胞间皮素素免疫组化染色结果图(均为光镜400倍下观察);其中,A为间皮素低表达病例,B为间皮素高表达病例;
图2为胰腺癌患者CT平扫序列的胰腺部位肿块勾画三层感兴趣区域示意图;其中,A、B、C分别为肿块最大径上、中、下三层感兴趣区的勾画示意图;
图3为本发明评分预测模型采用训练集、测试集鉴别区分胰腺癌间皮素高表达、低表达的ROC曲线图;其中A为训练集,B为测试集;
图4为本发明评分预测模型预测胰腺癌间皮素高表达、低表达的校准曲线图;其中A为训练集,B为测试集;横坐标代表结局事件(胰腺癌间皮素高表达)的预测概率,纵坐标代表结局事件发生的实际概率,对角线为最佳模型预测结果,各预测模型的曲线与对角线越接近则拟合效果越好;
图5为训练集和测试集中评分预测模型的决策曲线;横坐标代表阈值概率,纵坐标代表净获益,图中黑色平行线代表所有患者均按间皮素低表达处理,净获益为0,灰色中间的斜线代表所有患者均按间皮素高表达处理;净获益是一条斜率为负值的斜线,远离这两条线的曲线代表的模型有更好的临床净获益;红色中间的斜线代表根据列线图结果进行干预治疗的净获益。灰色斜线及红色斜线两侧为其95%的置信区间。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明的技术方案作进一步清楚、完整地描述。需要说明的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明以下实施例中采用的统计学方法如下:使用R软件(版本3.6.3,http://www.r-project.org)进行统计分析。logistic回归(包括LASSO回归)分析采用“glmnet”包,ROC分析采用“pROC”包。
实施例1:
一种预测胰腺癌间皮素表达水平的方法,包括以下步骤:
S1、获取胰腺癌患者胰腺部位肿瘤区域的CT平扫图像,对胰腺癌患者胰腺部位肿瘤区域CT平扫图像进行处理,获取所述肿瘤区域医学图像病灶的二维感兴趣区域图像;
S2、采用Pyradiomics计算语言平台提取所述二维感兴趣区域图像中的影像组学特征;
S3、将步骤S2提取的影像组学特征的值输入评分预测模型,计算得到所述二维感兴趣区域图像的图像评分;
S4、对步骤S3获得的图像评分进行定性分析,预测所述胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平。
步骤S1中,对胰腺癌患者胰腺部位肿瘤区域CT平扫图像进行处理,获取所述肿瘤区域医学图像病灶的二维感兴趣区域图像的具体操作为:采用开源软件3D Slicer(版本4.10.0)对胰腺癌患者胰腺部位肿瘤区域CT平扫图像沿病灶边缘逐层手动分割勾画感兴趣区域,得到所述肿瘤区域医学图像病灶的二维感兴趣区域图像。其中,分割出二维ROI区域图像这一过程是由腹部影像诊断医师(5年影像诊断经验)基于3D Slicer软件在CT平扫图像的轴位图像上,选择病灶横截面积最大图层并沿病灶边缘勾画ROI,实现二维ROI区域图像的分割。此外,为了最大限度地减少不同扫描方案或不同扫描设备对获取的CT平扫图像的干扰,本发明在采用3D Slicer软件分割出胰腺部位肿瘤图像中病灶的二维ROI区域图像之后,采用python软件(版本:3.7.0)的pyradiomics软件包(版本:3.0.1)中的线性插值算法对分割得到的二维ROI区域图像像进行各向同性重采样,体素大小为1mm×1mm×1mm。
步骤S2中,所述所述影像组学特征为:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
步骤S3中,所述评分预测模型用于计算图像评分的计算公式为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis-0.0005047131428348803×log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis-8.705494728811606×wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;其中,Lasso(p)表示图像评分。
步骤S4中,所述对步骤S3获得的图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平,包括:将步骤S3获得的图像评分与预设阈值进行比对,根据图像评分与预设阈值的大小关系,将胰腺癌患者划分为间皮素高表达组或间皮素低表达组。进一步地,当图像评分大于或等于预设阈值时,将胰腺癌患者划分为间皮素高表达组;当图像评分小于预设阈值时,将胰腺癌患者划分为间皮素低表达组;所述预设阈值为0.512159557。
进一步的,步骤S2中所述的影像组学特征是经过筛选得到的,步骤S3中所述动脉期评分预测模型是根据步骤S2筛选得到的影像组学特征建立的线性评分预测模型。步骤S2中所述的影像组学特征筛选及步骤S3中评分预测模型构建的具体方法步骤如下:
1、研究对象:
回顾性分析河南大学淮河医院2018年3月至2022年12月经病理确诊为胰腺癌患者的CT平扫检查资料。纳入标准:(1)术后病理确诊为胰腺癌(2)临床和影像资料完整(3)具有病理蜡块资料的病例。排除标准:(1)CT检查前接受过放、化疗手术治疗者(2)图像质量太差或病变太小(最大径<1cm)无法提取特征者。最终,本研究共纳入37例胰腺癌患者,男21例,女16例,年龄35~76岁,平均年龄64.16±9.40。
2、37例胰腺癌患者间皮素表达免疫组化结果判读
对37例胰腺癌病理蜡块取4mm包埋,进行间皮素免疫组化染色实验,定义胰腺癌胞膜或胞质内间皮素免疫组化阳性反应产物呈褐色或黄褐色颗粒即为阳性细胞。在光学显微镜下每张切片随机选取3个高倍镜视野(放大400倍)采集图像,应用Image-ProPlus 6.0软件(美国Media Cybernetics Image公司)选取所分析的阳性区域,并计算阳性面积率,来反映阳性蛋白的表达强度。阳性面积率=阳性区面积÷组织面积。将所测得的阳性面积率平均值按百分位分为4个等级:0~25%为阴性表达,26%~55%为弱阳性表,56%~75%为中强度阳性表达,76%~100%为高强度阳性表达。其中,将阴性及弱阳性(IOD值为0~50%)定义为低表达,将中强度阳性及高强度阳性(IOD值为51%~100%)定义为高表达。
经免疫组化染色检测发现,37例胰腺癌患者病理蜡块蜡块下病理组织肉眼多为灰白或灰黄的肿物(如图1所示);而且,经检测,37例胰腺癌患者中间皮素高表达者为18例(间皮素高表达组),低表达者为19例(间皮素低表达组)。
进一步对间皮素高表达组和低表达组的年龄、性别进行统计分析,其结果如表1所示。
表1间皮素高表达组和低表达组胰腺癌患者的年龄、性别统计分析结果
变量 高表达组 低表达组 统计值 P值
年龄 65[61.75,70.25] 65[61.5,70.5] 0.046 0.886
性别 11/8 10/8 * 0.887
注:*表示非参数检验Z值表示fisher确切概率法,无检验值。
由表1可知,间皮素高表达组和低表达组的年龄、性别均无显著性差异(P>0.05)。
3、CT图像的采集:
患者取仰卧位,上臂上抬,扫描时常规屏气,扫描范围从膈顶至双肾下极。
采用联影uCT 550+40排CT机,扫描参数:管电压120kV,管电流动态范围100~300mA,层厚4mm,层间距4mm。
采用Aquilion ONE 320排CT机,扫描参数:管电压120kV,管电流动态范围100~300mA,层厚5mm,层间距5mm。
4、CT图像的影像组学特征提取、筛选及评分模型的建立
(1)图像分割:
运用开源软件3D Slicer(版本4.10.0)对CT平扫序列图像(DICOM格式)沿病灶边缘逐层手动分割勾画感兴趣区域(ROI),并以每位患者病灶最大径为中心,以4mm为间隔,取上、中、下三层ROI区域(如图2所示),完成病灶部位二维ROI区域图像数据扩增。为探索影像组学特征在观察者间的稳定性,具有丰富经验的影像医师A、B分别完成所有患者病灶勾画。为探索影像组学特征在观察者内的稳定性,医师A在14天后对所有患者进行第二次勾画。采用一致性检验判定组间及组内相关系数,评估特征的稳定性。此外,为了最大限度地减少不同扫描方案或不同扫描设备对获取的CT平扫图像的干扰,本发明在采用3D Slicer软件分割出胰腺部位肿瘤图像中病灶的二维ROI区域图像之后,采用python软件(版本:3.7.0)的pyradiomics软件包(版本:3.0.1)中的线性插值算法对分割得到的二维ROI区域图像进行各向同性重采样,体素大小为1mm×1mm×1mm。
将扩增后的二维ROI图像(111张)按7:3随机划分为训练集和测试集,训练集用于选择特征、训练评分模型,测试集用于评分模型的验证及评价。
进一步对训练集和测试集胰腺癌患者的年龄、性别进行统计分析,其结果如表2所示。
表2训练集和测试集胰腺癌患者的年龄、性别统计分析结果
由表2可知,训练集和测试集胰腺癌患者的年龄、性别均无显著性差异(P>0.05)。
(2)影像组学特征提取及筛选
采用使用开源Python软件包(Pyradiomics计算语言平台)对训练集每个二维感兴趣区域图像进行影像组学特征提取,共提取得到1218个影像组学特征。使用开源软件python中(3.7.0版本)Scikit-Learn(0.23.0版本)工具包,对提取出的1218个影像组学特征进行Z-score标准化后,首先,使用最大相关最小冗余筛选(mRMR)方法对提取的所有特征数据进行初步筛选,得出重要性排名前20位的影像组学特征。然后使用最小化绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归对排名前20位影像组学特征进行嵌入式筛选降维,最终9个影像组学特征被纳入,9个影像组学特征包括2个一阶特征、2个灰度共生矩阵特征(gray-level co-occurrence matrix,GLCM)、1个灰度区域大小矩阵特征(gray-level size zone matrix,GLSZM)、2个灰度依赖矩阵(GrayLevel Dependence Matrix,GLDM)、2个灰度游程矩阵(Gray Level Run-Length Matrix,GLRLM)特征,具体如表3所示。
表3筛选出的最优影像组学特征信息
根据筛选到的9个影像组学特征的权重系数,其中log_sigma_1_0_mm_3D_glcm_Idn及wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis与分类结果具有显著相关性有较高权重,建立lasso回归评分预测模型。评分预测模型具体为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis-0.0005047131428348803×log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis-8.705494728811606×wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;其中,Lasso(p)表示图像评分。
利用构建的评分预测模型预测训练集中每位胰腺癌患者胰腺部位肿瘤区域CT影像的图像评分,并根据预测的图像评分与其对应的间皮素表达水平分组来绘制ROC曲线,获得曲线下面积(Area under the ROC curve,AUC),以约登指数最大时对应的Lasso(p)值为鉴别区分胰腺癌患者间皮素高表达、低表达的最佳截断值(即预设阈值),本发明评分预测模型的预设阈值为0.512159557。
实施例2:
一种预测胰腺癌间皮素表达水平的系统,该系统包括图像处理模块、特征提取模块、评分预测模块、图像分类模块。
所述图像处理模块用于对胰腺癌患者胰腺部位肿瘤区域CT平扫图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像。优选地,图像处理模块用于对胰腺癌患者胰腺部位肿瘤区域CT平扫图像进行处理的具体操作为:首先采用Pyradiomics中的线性插值算法对肿瘤区域CT平扫图像进行各向同性重采样,体素大小为1mm×1mm×1mm;然后采用开源软件3D Slicer(版本4.10.0)对胰腺癌患者胰腺部位肿瘤区域CT平扫图像沿病灶边缘逐层手动分割勾画感兴趣区域,得到所述肿瘤区域医学图像病灶的二维感兴趣区域图像。
所述特征提取模块用于提取所述二维感兴趣区域图像中的影像组学特征。提取到的影像组学特征具体如下:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
所述评分预测模块中设有评分预测模型,用于根据特征提取模块提取的影像组学特征计算所述感兴趣区域图像的图像评分。评分预测模型用于计算图像评分的计算公式为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis-0.0005047131428348803×log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis-8.705494728811606×wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;其中,Lasso(p)表示图像评分。将提取的9影像组学特征的值输入评分预测模型计算公式,即可得到图像评分。
所述预测及结果输出模块用于对所述图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平并输出预测结果。预测及结果输出模块对所述图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平的具体操作为:将所述图像评分与预设阈值进行比对,根据图像评分与预设阈值的大小关系,将胰腺癌患者划分为间皮素高表达组或间皮素低表达组。更加优选地,当图像评分大于或等于预设阈值时,将胰腺癌患者划分为间皮素高表达组;当图像评分小于预设阈值时,将胰腺癌患者划分为间皮素低表达组;所述预设阈值为0.512159557。
实施例3:
一种电子设备,包括存储器,至少一个处理器,所述存储器上存储有处理器可读的应用程序,所述处理器用于执行所述应用程序以实现实施例1所述的预测胰腺癌间皮素表达水平的方法.
实施例4:
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器进行加载,以执行实施例1所述的预测胰腺癌间皮素表达水平的方法。
本发明构建的评分预测模型性能评估:
分别在训练集和测试集(训练集和测试集的样本与实施例1相同)中验证评分预测模型性能。
1、ROC曲线(受试者工作曲线)评估
利用构建的评分预测模型预测训练集中每位胰腺癌患者胰腺部位肿瘤区域CT影像的图像评分,并根据预测的图像评分与其对应的间皮素表达水平分组来绘制ROC曲线(ROC曲线如图3中A所示)。以约登指数最大时对应的图像评分值作为评分预测模型鉴别区分胰腺癌患者间皮素高表达、低表达的最佳截断值(即预设阈值),并计算其灵敏度、特异度(如表4所示),用于评估评分预测模型的鉴别性能。
将测试集中样本CT影像的影像组学特征的值代入上述构建的评分预测模型,得到个样本的图像评分,根据预测图像评分绘制评分预测模型的ROC曲线(如图3中B所示),验证本发明评分预测模型用于鉴别区分胰腺癌间皮素高表达和低表达的价值。根据评分预测模型的最佳截断值,计算其对应的灵敏度、特异度(如表4所示)。
表4训练集和测试集中评分预测模型鉴别胰腺癌间皮素高表达、低表达的效能
样本集 AUC 95%CI 灵敏度 特异度
训练集 0.843 0.743to0.916 80.00% 75.68%
测试集 0.751 0.573to0.883 58.82% 88.24%
由图3和表4可知,该模型对胰腺癌间皮素的高表达预测有较高的敏感性与准确率,结果可靠。
2、校准度验证:
在训练集和测试集实验样本中,采用校准曲线(Calibration curveanalysis,CCA)评估本发明评分预测模型的校准能力。
具体方法为:采用bootstrap法,重复抽样1000次,分别在训练集和测试集实验样本中验证本发明建立的评分模型预测模型所预测的胰腺癌间皮素表达水平型与实际间皮素表达水平之间的校准曲线。结果如图4所示。
由图4可知,在训练集和验证集中,胰腺癌间皮素高表达状态的预测值和实测值之间均具有较好的一致性。
3、决策曲线评估
在训练集和测试集实验样本中,采用决策曲线(Decision curve analysis,DCA)评估本发明评分预测模型在不同阈值概率下所获得的临床净获益。具体结果如图5所示。
由图5可知,用评分预测模型预测间皮素高表达状态的临床净获益明显高于将其全部视为间皮素高表达或全部视为间皮素低表达,而且训练组的临床净获益高于测试组。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种预测胰腺癌间皮素表达水平的方法,其特征在于,包括以下步骤:
S1、对胰腺癌患者胰腺部位肿瘤区域医学图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像;
S2、提取所述感兴趣区域图像中的影像组学特征;
S3、将步骤S2提取的影像组学特征的值输入评分预测模型,计算得到所述感兴趣区域图像的图像评分;
S4、对步骤S3获得的图像评分进行定性分析,预测所述胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平。
2.根据权利要求1所述的方法,其特征在于,所述影像组学特征为:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
3.根据权利要求2所述的方法,其特征在于,所述评分预测模型用于计算图像评分的计算公式为:
Lasso(p)=4.9615-4.448885695438365×log_sigma_1_0_mm_3D_glcm_Idn
-0.3454534058016133×log_sigma_2_0_mm_3D_glcm_Imc1
-0.027764916599633777×log_sigma_3_0_mm_3D_firstorder_Kurtosis
-0.0005047131428348803×
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis
+0.004565373995182513×log_sigma_5_0_mm_3D_gldm_DependenceVariance
-0.007667307412539158×wavelet_LHL_firstorder_Kurtosis
-8.705494728811606×
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis
-0.03795048981662682×wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis
-0.8193320106336698×wavelet_LLL_glszm_LowGrayLevelZoneEmphasis;
其中,Lasso(p)表示图像评分。
4.根据权利要求1-3任一所述的方法,其特征在于,步骤S4中所述对步骤S3获得的图像评分进行定性分析,预测所述胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平,包括:
将步骤S3获得的图像评分与预设阈值进行比对,根据图像评分与预设阈值的大小关系,将胰腺癌患者划分为间皮素高表达组或间皮素低表达组。
5.根据权利要求4所述的方法,其特征在于,所述预设阈值为0.512159557;当图像评分大于或等于预设阈值时,将胰腺癌患者划分为间皮素高表达组;当图像评分小于预设阈值时,将胰腺癌患者划分为间皮素低表达组。
6.根据权利要求5所述的方法,其特征在于,所述医学图像为CT影像;所述感兴趣区域图像为二维感兴趣区域图像。
7.一种预测胰腺癌间皮素表达水平的系统,其特征在于,所述系统包括图像处理模块、特征提取模块、评分预测模块、图像分类模块;
其中,所述图像处理模块用于对胰腺癌患者胰腺部位肿瘤区域医学图像进行处理,获取所述肿瘤区域医学图像病灶的感兴趣区域图像;
所述特征提取模块用于提取所述感兴趣区域图像中的影像组学特征;
所述评分预测模块中设有评分预测模型,用于根据特征提取模块提取的影像组学特征计算所述感兴趣区域图像的图像评分;
所述预测及结果输出模块用于对所述图像评分进行定性分析,预测胰腺癌患者胰腺部位肿瘤细胞间皮素表达水平并输出预测结果。
8.根据权利要求7所述的系统,其特征在于,所述所述影像组学特征为:
log_sigma_1_0_mm_3D_glcm_Idn、
log_sigma_2_0_mm_3D_glcm_Imc1、
log_sigma_3_0_mm_3D_firstorder_Kurtosis、
log_sigma_4_0_mm_3D_glrlm_LongRunLowGrayLevelEmphasis、
log_sigma_5_0_mm_3D_gldm_DependenceVariance、
wavelet_LHL_firstorder_Kurtosis、
wavelet_HLH_gldm_SmallDependenceLowGrayLevelEmphasis、
wavelet_LLL_glrlm_LongRunLowGrayLevelEmphasis、
wavelet_LLL_glszm_LowGrayLevelZoneEmphasis。
9.一种电子设备,其特征在于,所述电子设备包括存储器,至少一个处理器,所述存储器上存储有处理器可读的应用程序,所述处理器用于执行所述应用程序以实现权利要求1-6任一所述的预测胰腺癌间皮素表达水平的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1-6任一所述的预测胰腺癌间皮素表达水平的方法。
CN202310913294.6A 2023-07-20 2023-07-20 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质 Pending CN116993689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310913294.6A CN116993689A (zh) 2023-07-20 2023-07-20 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310913294.6A CN116993689A (zh) 2023-07-20 2023-07-20 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116993689A true CN116993689A (zh) 2023-11-03

Family

ID=88522612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310913294.6A Pending CN116993689A (zh) 2023-07-20 2023-07-20 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116993689A (zh)

Similar Documents

Publication Publication Date Title
WO2017150497A1 (ja) 肺野病変の診断支援装置、該装置の制御方法及びプログラム
US20100087756A1 (en) Method of characterization and differentiation of tissue
Thein et al. An image preprocessing method for kidney stone segmentation in CT scan images
CN110728239B (zh) 一种利用深度学习的胃癌增强ct图像自动识别系统
US20240177302A1 (en) Cellular diagnostic and analysis methods
CN112767393A (zh) 一种基于机器学习的双模态影像组学磨玻璃结节分类方法
CN115067978B (zh) 一种骨肉瘤疗效评估方法及系统
Soomro et al. Haralick's texture analysis applied to colorectal T2-weighted MRI: A preliminary study of significance for cancer evolution
CN112071418B (zh) 基于增强ct影像组学的胃癌腹膜转移的预测系统及方法
CN114758175A (zh) 一种食管胃结合部肿瘤图像分类方法、系统、设备及存储介质
CN113393938B (zh) 一种融合影像和临床特征信息的乳腺癌风险预测系统
Anuradha et al. Identification of Suspicious Regions to Detect Oral Cancers At An Earlier Stage-A Literature Survey
Xing et al. Automatic detection of A‐line in lung ultrasound images using deep learning and image processing
CN116994754A (zh) 基于ct影像的糖尿病患者胰腺病变可视化评估方法
CN110738649A (zh) 一种用于胃癌增强CT图像自动识别的Faster RCNN网络的训练方法
CN115995295A (zh) 基于影像组学的乳腺癌骨转移治疗反应评估方法及系统
CN116993689A (zh) 一种预测胰腺癌间皮素表达水平的方法、系统、电子设备及存储介质
CN113838020B (zh) 一种基于钼靶影像的病变区域量化方法
AU2020103785A4 (en) Method for improving recognition rates of mri images of prostate tumors based on cad system
CN114783517A (zh) 基于影像组学及语义特征预测crlm患者的ras基因状态
WO2022153100A1 (en) A method for detecting breast cancer using artificial neural network
CN113850788A (zh) 一种判断膀胱癌肌层浸润状态的系统及其应用
US8935099B2 (en) Method and system for identifying, assessing, and managing cancer growth rates and potential metastasis
Kang et al. Predictive role of T2WI and ADC-derived texture parameters in differentiating Gleason score 3+ 4 and 4+ 3 prostate cancer
Bukhori et al. Classification of Breast Cancer Tumors using a Random Forest on Mammogram Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination