CN114998348B - 一种计算机可读存储介质及直肠癌预后预测模型构建系统 - Google Patents
一种计算机可读存储介质及直肠癌预后预测模型构建系统 Download PDFInfo
- Publication number
- CN114998348B CN114998348B CN202210929922.5A CN202210929922A CN114998348B CN 114998348 B CN114998348 B CN 114998348B CN 202210929922 A CN202210929922 A CN 202210929922A CN 114998348 B CN114998348 B CN 114998348B
- Authority
- CN
- China
- Prior art keywords
- image
- target
- features
- hematoxylin
- eosin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/54—Extraction of image or video features relating to texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及数字医疗技术领域,尤其是一种计算机可读存储介质及直肠癌预后预测模型构建系统,其中该计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以下步骤:构建数据集;根据所述病理组织切片图像,划定第一目标区域;利用所述第一目标区域,提取病理组学特征;根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域;利用所述第二目标区域,获取免疫评分;结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型。本发明预测效能显著高于传统临床病理特征模型,并且涉及到的实际操作难度低,获取方便且不干预正常临床工作流程,具有实际的应用价值。
Description
技术领域
本发明涉及数字医疗技术领域,尤其是一种计算机可读存储介质及直肠癌预后预测模型构建系统。
背景技术
病理组学(Pathomics)代表人工智能在数字病理学中的应用,呈新兴发展之势,通过对H&E(苏木素&伊红)成数字化的全视野数字病理切片图像(Whole slide image,WSI)并通过机器学习的方法加以病理特征提取,从而发挥其辅助诊断、分子异常预测、肿瘤微环境生物标志物识别以及预后评估等多方面的价值,并且这是对传统H&E切片的最大化利用及病理诊断的补充。随着肿瘤免疫治疗在肺癌等癌症中的推荐使用以来,肿瘤免疫微环境逐渐受到学者的关注并不断深入研究。nCRT(新辅助放化疗(Neoadjuvantchemoradiotherapy,nCRT)可提高LARC(nCRT+全直肠系膜切除术(Total mesorectalexcision,TME)+术后辅助化疗的“夹心饼”治疗模式)对免疫治疗的反应性。其中,T淋巴细胞是免疫微环境中的主要免疫细胞之一,免疫组化(Immunohistochemical, IHC)技术可检测组织中免疫细胞亚群表达的特异性抗原和定位;加之人工智能和数字病理的到来,基于IHC数字化图片的染色阳性细胞定量分析,学者通过计算肿瘤中心(The core of thetumor,CT)和浸润边缘(Invasive margin,IM)两区域的CD3+T淋巴细胞和CD8+T淋巴细胞的数量而开发了Immunoscore系统,Immunoscore越高,说明CRC患者具有更好的治疗效应和生存结局。其预后价值优于AJCC/UICC TNM分期系统(美国癌症联合委员会或国际抗癌联盟癌症分期系统),NCCN、ESMO、CSCO等指南对Immunoscore作为一分子标记物可指导肺癌、结肠癌患者术后辅助治疗及个体化精准治疗做了相关推荐。对于LARC,无论采用何种新辅助治疗方案,治疗后淋巴细胞密度均增高,治疗后整体肿瘤微环境中T细胞密度与肿瘤退缩程度和术后无病生存期DFS呈显著正相关。但目前对直肠癌组织进行免疫评分,并分析与预后的相关性,暂未见相关报道。无论直肠癌患者是否接受nCRT,AJCC(American JointCommittee on Cancer)等指南依然将TNM分期系统作为同样的预后分组。但国内外研究发现因TNM分期的不准确性导致目前仍然缺乏有效的工具预测直肠癌患者的预后。因此,在此基础上,有必要整合预后强相关的临床指标、挖掘强有力的肿瘤微环境组分指标等方法尽可能全面地从不同角度综合评估直肠癌患者的预后,从而达到个体化精准预测并指导治疗、改善直肠癌患者预后的目标。
发明内容
针对现有技术中的不足,第一方面,本发明提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以下步骤:构建数据集,所述数据集包括直肠癌患者的苏木素-伊红染色病理组织切片图像、免疫组化染色切片图像和临床病理信息;根据所述病理组织切片图像,划定第一目标区域;利用所述第一目标区域,提取病理组学特征,所述病理组学特征包括图片形态特征、图像强度特征、图像纹理特征和图像颗粒特征;根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域;利用所述第二目标区域,获取免疫评分;结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型。本发明通过整合预后强相关的临床指标,有效利用了肿瘤细胞、免疫细胞等特征的预后价值,其预测效能显著高于传统临床病理特征模型,全面地从不同角度综合评估直肠癌患者的预后,从而达到个体化精准预测并指导治疗、改善直肠癌患者预后的目标;同时本发明所涉及到的实际操作难度低,任务量少,获取方便且不干预正常临床工作流程,具有实际的应用价值。
可选地,所述构建数据集,包括如下步骤:设定数据筛选条件,所述筛选条件包括直肠癌患者的治疗时间、治疗方式和治疗状况;根据所述筛选条件,确定目标患者;提取所述目标患者的临床信息,所述临床信息包括所述目标患者的性别、年龄、BMI、ASA评分、血清CEA水平、肿瘤大小、肿瘤位置、手术方式、组织类型、病理TNM分期、术后并发症、术后辅助化疗;获取所述目标患者的苏木素-伊红染色病理组织切片图像和免疫组化染色切片图像。
可选地,所述根据所述病理组织切片图像,划定第一目标区域,包括如下步骤:确定所述苏木素-伊红染色病理组织切片图像中的第一肿瘤中心和第一浸润边缘;在所述第一浸润边缘内的区域中划取多个第一目标区域。
可选地,所述利用所述第一目标区域,提取病理组学特征,包括如下步骤:将多个所述第一目标区域转化第一灰阶图像;将多个所述第一目标区域分割成苏木素灰阶图像和伊红灰阶图像;利用所述苏木素灰阶图像提取图片形态特征;通过所述苏木素灰阶图像、所述伊红灰阶图像和所述第一灰阶图像分别获取图像强度特征、图像纹理特征和图像颗粒特征。
可选地,所述根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域,包括如下步骤:在所述免疫组化染色切片图像中,锁定与所述第一肿瘤中心对应的第二肿瘤中心;利用所述第二肿瘤中心,确定所述免疫组化染色切片图像的第二浸润边缘;在所述第二浸润边缘内的区域中划取多个第二目标区域。
可选地,所述利用所述第二目标区域,获取免疫评分,包括如下步骤:获取所述第二目标区域中,获取CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度;设定密度分割值;依据所述密度分割值,结合所述CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度获得免疫评分。
可选地,所述结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型,包括如下步骤:通过所述病理组学特征,筛选目标特征及对应的目标特征系数;根据所述目标特征及对应的目标特征系数,构建病理组学特征标签值公式,从而获得病理组学特征标签值;针对目标患者,结合临床信息、所述免疫评分和所述病理组学特征标签值,构建直肠癌预后预测模型。
可选地,所述病理组学特征标签值公式满足如下公式:
表示第一肿瘤中心区域的伊红灰阶图像中图像颗粒特征为13,此时,;表示第一肿瘤中心区域的第一灰阶图像中图像颗粒特征为3,
此时,;表示第一肿瘤中心区域的苏木素灰阶图像中图像强
度特征,此时,;表示第一肿瘤中心区域的第一灰阶图像中图像
强度特征,此时,;表示第一肿瘤中心区域的第一灰阶图像中图
像纹理特征方差,此时,;表示第一肿瘤中心区域的伊红灰阶图
像中图像复杂性熵,此时,;表示第一浸润边缘区域内伊红灰阶图
像中图像颗粒特征为7,此时,;表示第一浸润边缘区域内伊红
灰阶图像中图像颗粒特征为13,此时,;表示第一浸润边缘区
域内苏木素灰阶图像中图像颗粒特征为14,此时,;表示第一浸
润边缘区域内第一灰阶图像中图像颗粒特征为4,此时,;表示
第一浸润边缘区域内伊红灰阶图像中图像强度特征,此时,;
表示第一浸润边缘区域内苏木素灰阶图像中图像强度特征,此时,;表示第一浸润边缘区域内苏木素灰阶图像中图像短轴长度,此时,。
另一方面,本发明还提供一种直肠癌预后预测模型构建系统,包括输入设备、处理器、输出设备和存储器,其中,所述输入设备、处理器、输出设备和存储器相互连接,所述存储器包括如本发明第一方面所述的计算机可读存储介质,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令。本发明提供的系统结构紧凑,适用性强,极大程度地提高了运行效率。
附图说明
图1是本发明提供的计算机可读存储介质中程序指令的流程图;
图2是本发明对病理组学特征提取及免疫细胞计数的示意图;
图3是本发明构建免疫评分ISRC的示意图;
图4是本发明构建病理组学特征标签PSRC;
图5是本发明的直肠癌预后预测模型示意图;
图6是本发明的直肠癌预后预测模型与传统TNM分期模型对比的ROC曲线示意图。
图7是本发明的一种直肠癌预后预测模型构建系统的结构示意图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。
请参阅图1和图2,在一个实施例中,本发明提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以下步骤:
S1、构建数据集。
所述构建数据集,包括如下步骤:设定数据筛选条件,所述筛选条件包括直肠癌患者的治疗时间、治疗方式和治疗状况;根据所述筛选条件,确定目标患者;提取所述目标患者的临床信息,所述临床信息包括所述目标患者的性别、年龄、BMI、ASA评分、血清CEA水平、肿瘤大小、肿瘤位置、手术方式、组织类型、病理TNM分期、术后并发症、术后辅助化疗;获取所述目标患者的苏木素-伊红染色病理组织切片图像和免疫组化染色切片图像。所述数据集包括直肠癌患者的苏木素-伊红染色病理组织切片图像、免疫组化染色切片图像和临床病理信息。
在一个可选的实施例中,为构建所述数据集,设定了数据筛选条件,针对性地选取了2013年11月至2017年4月做过根治性直肠癌手术切除的200例目标患者;通过全自动数字切片扫描系统(PRECICE 600)获取目标患者苏木素-伊红染色病理组织切片和CD3&CD8免疫组化染色切片的全景扫描病理图像,成像倍数为20倍;通过在征得目标患者同意的前提下,提取其医疗档案,获取了该目标患者的性别、年龄、BMI、ASA评分、血清CEA水平、肿瘤大小、肿瘤位置、手术方式、组织类型、病理TNM分期、术后并发症、术后辅助化疗。其中,BMI为身体质量指数;ASA评分为美国麻醉医师协会情况评估的分级(ASA分级一般分为六级:ASA1级是指健康患者能耐受手术麻醉;ASA2级是指患者有轻度系统性疾病,没有功能障碍,能耐受手术麻醉;3级是患者有重度的系统性疾病,并有一定的功能受损,但尚能耐受麻醉;ASA4级是患者有重度系统性疾病,并且终生需要不间断的治疗,麻醉危险性极大,需要充分的、细致的麻醉前准备;ASA5级是指濒死患者,无论手术与否,在24小时内不大可能存活;ASA6级是指脑死亡患者)。
S2、根据所述病理组织切片图像,划定第一目标区域。
所述根据所述病理组织切片图像,划定第一目标区域,包括如下步骤:确定所述苏木素-伊红染色病理组织切片图像中的第一肿瘤中心和第一浸润边缘;在所述第一浸润边缘内的区域中划取多个第一目标区域。
在一个可选地实施例中,具体地,由两名副高级病理医生使用iViewer软件(一种病理学载玻片检视软件)选择第一肿瘤中心和第一浸润边缘,如若两位病理医生不一致将由病理科主任参与讨论,直到达成小组共识。确定第一肿瘤中心和第一浸润边缘后,病理科医生随机从该区域内选择5个500微米×500微米的区域作为第一目标区域。
S3、利用所述第一目标区域,提取病理组学特征。
所述利用所述第一目标区域,提取病理组学特征,包括如下步骤:将多个所述第一目标区域转化第一灰阶图像;将多个所述第一目标区域分割成苏木素灰阶图像和伊红灰阶图像;利用所述苏木素灰阶图像提取图片形态特征;通过所述苏木素灰阶图像、所述伊红灰阶图像和所述第一灰阶图像分别获取图像强度特征、图像纹理特征和图像颗粒特征。所述病理组学特征包括图片形态特征、图像强度特征、图像纹理特征和图像颗粒特征。
在一个可选地实施例中,采用了Cell Profiler (病理特征提取利器)软件提取病理组学特征,最终,从每个目标区域提取了198个病理组学特征,该198个病理组学特征包括:54个图像形态特征(Morphology features)、57个图像强度特征(Pixel intensityfeatures)、39个图像纹理特征(Texture features)和48个图像颗粒特征(Granularityfeatures)。
具体地,在本实施例中,使用Cell Profiler中“UnmixColors”模块将第一目标区域分割成苏木素灰阶图像和伊红灰阶图像,该第一目标区域为使用苏木素&伊红染色后的彩色图像;再使用Cell Profiler中“ColorToGray”模块的“Combine”功能将第一目标区域转化第一灰阶图像,即将苏木素灰阶图像和伊红灰阶图像组合成苏木素&伊红染色灰阶图。
使用Cell Profiler中“MeasureObjectSizeShape”模块提取苏木素灰阶图像形态特征(Morphology features),其中,图片形态特征包括面积(Area),周长(Perimeter),形成因数(FormFactor),固性(Solidity),范围(Extent),紧密度(Compactness),欧拉数(EulerNumber),中心值_X/Y(Center_X/Y),最大最小边界_X/Y (BoundingBoxMinimum/Maximum_X/Y),边界框面积(BoundingBoxArea),偏心度(Eccentricity),长轴长度(MajorAxisLength),短轴长度(MinorAxisLength),方位(Orientation),最大半径(MaximumRadius),中位半径(MedianRadius),平均半径(MeanRadius),最小Feret直径(MinFeretDiameter),最大Feret直径(MaxFeretDiameter),同等直径(EquivalentDiameter),Zernike形状特征 (Zernike shape features),Zernike shapefeatures包含计算了Zernike多项式0至9阶的共30个特征。
使用Cell Profiler中“MeasureObjectIntensity”模块分别提取苏木素灰阶图像、伊红灰阶图像和第一灰阶图像的图像强度特征(Pixel intensity features),其中图像强度特征包括综合强度(IntegratedIntensity),平均强度(MeanIntensity),强度标准差(StdIntensity),最小强度(MinIntensity),最大强度(MaxIntensity),综合强度边缘(IntegratedIntensityEdge),平均强度边缘(MeanIntensityEdge),强度边沿标准差(StdIntensityEdge),最小强度边沿(MinIntensityEdge),最大强度边缘(MaxIntensityEdge),质量位移(MassDisplacement),下四分位强度(LowerQuartileIntensity),中位强度(MedianIntensity),中位绝对偏差强度(MADIntensity),上四分位数强度(UpperQuartileIntensity),中心质量强度_X(CenterMassIntensity_X),中心质量强度_Y(CenterMassIntensity_Y),最大强度_X(MaxIntensity_X),最大强度_Y(MaxIntensity_Y)。
使用Cell Profiler中“MeasureTexture”模块分别提取苏木素灰阶图像、伊红灰阶图像和第一灰阶图像的图像纹理特征(Texture features),其中,图像纹理特征包括图像同质性(AngularSecondMoment),对比度(Contrast),相关性 (Correlation),纹理方差(Variance),图像异质性(InverseDifferenceMoment),归一化平均值(SumAverage),归一化方差(SumVariance),归一化熵(SumVariance),复杂性熵(Entropy),随机性熵(DifferenceEntropy),同现矩阵方差(DifferenceVariance),重复区域信息1(InfoMeas1),重复区域信息2(InfoMeas2)。
使用Cell Profiler中“MeasureGranularity”模块分别提取苏木素灰阶图像、伊红灰阶图像和第一灰阶图像的图像颗粒特征(Granularity features),该模块为颗粒度频谱范围内设置的每个实例返回一个测量值,最终提取了48个颗粒特征。
S4、根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域。
所述根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域,包括如下步骤:在所述免疫组化染色切片图像中,锁定与所述第一肿瘤中心对应的第二肿瘤中心;利用所述第二肿瘤中心,确定所述免疫组化染色切片图像的第二浸润边缘;在所述第二浸润边缘内的区域中划取多个第二目标区域。
在一个可选地实施例中,由两名副高级病理医生使用iViewer软件 (一种病理学载玻片检视软件)在第一肿瘤中心和第一浸润边缘的基础身上,在免疫组化染色切片图像确定对应的第二肿瘤中心和第二浸润边缘。如若两位病理医生不一致将由病理科主任参与讨论,直到达成小组共识。确定第二肿瘤中心和第二浸润边缘后,病理科医生随机从该区域内选择5个500微米×500微米的区域作为第二目标区域。
S5、利用所述第二目标区域,获取免疫评分。
所述利用所述第二目标区域,获取免疫评分,包括如下步骤:获取所述第二目标区域中,获取CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度;设定密度分割值;依据所述密度分割值,结合所述CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度获得免疫评分。
其中,CD3和CD8分子是淋巴细胞表面抗原,CD3+T淋巴细胞(CD3阳性T淋巴细胞)是人体总的成熟T淋巴细胞,表示人体免疫功能状态。CD8+T淋巴细胞(CD8阳性T淋巴细胞)是抑制/杀伤性T淋巴细胞,主要的功能是特异性直接杀伤靶细胞。具体地,CD3+CT代表在第二肿瘤区域中的CD3+ T淋巴细胞,CD8+CT代表在第二肿瘤区域中的CD8+ T淋巴细胞,CD3+IM代表在第二浸润边缘区域中的CD3+ T淋巴细胞,CD8+IM代表在第二浸润边缘区域中的CD8+ T淋巴细胞。
在一个可选地实施例中,采用QuPath软件(开源的医学病理图像分析平台,该软件可提供groovy语言脚本作运行接口,可供编写和运行,将标注的区域信息转换为量化数据进行进一步处理),针对第二目标区域,分别对免疫组化切片图像运行分析CD3+T淋巴细胞的Groovy脚本和分析CD8+T淋巴细胞的Groovy脚本,批量处理并自动化计算第二目标区域的计算CD3+T淋巴细胞和CD8+T淋巴细胞数目及密度,记录单位可以选择为cells/mm2,即每平方毫米的细胞数目。再利用QuPath软件中“survival”R包内的“surv_cutpoint”函数,以无病生存期为参考标准,设定CD3+CT、CD3+IM、CD8+CT、CD8+IM每项密度的密度分割值。请参见图3,根据密度分割值,将CD3+CT、CD3+IM、CD8+CT、CD8+IM每项细胞密度大于或等于密度分割值判定为高免疫反应,计为1分;反之,则判定为低免疫反应,计为0分。将每例患者的CD3+CT、CD3+IM、CD8+CT、CD8+IM的4组评分相加即为免疫评分IS,分值为0-4分。其中,0-1分为低ISRC组,2分为中ISRC组,3-4分为高ISRC组。
S6、结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型。
所述结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型,包括如下步骤:通过所述病理组学特征,筛选目标特征及对应的目标特征系数;根据所述目标特征及对应的目标特征系数,构建病理组学特征标签值公式,从而获得病理组学特征标签值;针对目标患者,结合临床信息、所述免疫评分和所述病理组学特征标签值,构建直肠癌预后预测模型。
在一个可选地实施例中,由于提取的病理组学特征参数信息量巨大,不乏掺杂着大量无关变量,为降低模型的变量维度,同时筛选出与直肠癌患者预后相关度最高的系列变量,使得模型建立更为准确,本实施例中通过LASSO Cox回归计算模型进行目标特征筛选以及计算目标特征系数,LASSO Cox回归计算模型能有效规避自变量过拟合和多重共线性的问题。
具体地,所述LASSO Cox回归计算模型通过R语言4.0.2版本中的“glmnet”包中的“glmnet”函数运行,通过函数运行,得出目标特征系数。请参见图4,横坐标为log (λ),纵坐标Coefficients表示协同因素,即所述病理组学特征。在本实施例中,根据所述目标特征及对应的目标特征系数,构建病理组学特征标签值公式,该病理组学特征标签值公式满足如下公式:
其中,表示病理组学特征标签,表示目标特征的数量,表示第项目标特
征对应的目标特征系数,表示第项目标特征的评分参数。具体地所述病理组学特征标
签值公式,其中,;表示第一肿瘤中心区域的伊红灰阶图像中图像颗粒特征为
13,此时,;表示第一肿瘤中心区域的第一灰阶图像中图像颗粒
特征为3,此时,;表示第一肿瘤中心区域的苏木素灰阶图像
中图像强度特征,此时,;表示第一肿瘤中心区域的第一灰阶图
像中图像强度特征,此时,;表示第一肿瘤中心区域的第一灰阶
图像中图像纹理特征方差,此时,;表示第一肿瘤中心区域的伊
红灰阶图像中图像复杂性熵,此时,;表示第一浸润边缘区域内伊
红灰阶图像中图像颗粒特征为7,此时,;表示第一浸润边缘区
域内伊红灰阶图像中图像颗粒特征为13,此时,;表示第一浸
润边缘区域内苏木素灰阶图像中图像颗粒特征为14,此时,;表
示第一浸润边缘区域内第一灰阶图像中图像颗粒特征为4,此时,;表示第一浸润边缘区域内伊红灰阶图像中图像强度特征,此时,;表示第一浸润边缘区域内苏木素灰阶图像中图像强度特征,
此时,;表示第一浸润边缘区域内苏木素灰阶图像中图像短轴
长度,此时,。
请参见图5,针对目标患者,结合临床信息、所述免疫评分和所述病理组学特征标签值进行多因素Cox回归分析,并将多因素Cox回归分析结构可视化从而构建出直肠癌预后预测模型。在图5中,可视化列线图包括平行建立分项分数线段、病理N分期线段(病理TNM分期)、病理组学特征标签PSRC线段、免疫评分ISRC线段。其中,所述分项分数线段上均匀排布有0分到100分之间的各个分数值;所述病理N分期线段的N0和N+点对应所述分项分数线段的0分点和30分点;所述免疫评分ISRC的高、中、低点分别对应所述分项分数线段的0分点、50分点和100分点;所述病理组学特征标签PSRC均匀排布数值0至8,数值0对应所述分项分数线段的0分点,数值8对应所述分项分数线段的65分点。通过该模型准确评估直肠癌患者的1年无病生存期的概率、3年无病生存期的概率和5年无病生存期的概率。
请参见图6,图6通过S1-S6步骤获得的直肠癌预后预测模型与传统TNM分期模型对比的时间依赖性ROC(Receiver operating characteristic curve,ROC)曲线示意图。其中,A线表示本发明的直肠癌预后预测模型,B线表示传统TNM分期模型,AUROC(Area Underthe ROC)被定义为ROC曲线下与坐标轴围成的面积,取值范围为0.5至1,AUROC越接近1,预测模型效能越高。本发明构建的预测模型AUROC值为0.896,传统TNM分期模型的AUROC值为0.724。本发明通过整合预后强相关的临床指标,有效利用了肿瘤细胞、免疫细胞等特征的预后价值,其预测效能显著高于传统临床病理特征模型,全面地从不同角度综合评估直肠癌患者的预后,从而达到个体化精准预测并指导治疗、改善直肠癌患者预后的目标;同时本发明所涉及到的实际操作难度低,任务量少,获取方便且不干预正常临床工作流程,具有实际的应用价值。
在一个实施例中,本发明还提供一种直肠癌预后预测模型构建系统,包括输入设备、处理器、输出设备和存储器,其中,所述输入设备、处理器、输出设备和存储器相互连接,所述存储器本发明的计算机可读存储介质,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令。本发明提供的系统结构紧凑,适用性强,极大程度地提高了运行效率。
请参阅图7,在一个可选地实施例中,该直肠癌预后预测模型构建系统700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器 (centralprocessing units,CPU)710;输入设备720可以用于获取苏木精&伊红染色和CD3、CD8免疫组化染色的病理切片全景图像;输出设备730可以用于将通过上述任一项方法得到的预测生存概率输出给目标终端进行显示;该存储器740可以包括只读存储器和随机存取存储器,并向处理器710提供指令和数据。存储器740的一部分还可以包括非易失性随机存取存储器。例如,存储器740还可以存储设备类型的信息。
该直肠预后预测模型构建系统700还可以包括一个或一个以上电源750,一个或一个以上有线或无线网络接口760,一个或一个以上操作系统770,例如Windows Serve,MacOS X,Unix,Linux,FreeBSD等操作系统,本系统结构紧凑,适用性强,极大程度地提高了运行效率。同时,本领域技术人员可以理解,图7示出的计算机设备结构并不构成对本申请提供的计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (6)
1.一种计算机可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行以下步骤:
构建数据集,所述数据集包括直肠癌患者的苏木素-伊红染色病理组织切片图像、免疫组化染色切片图像和临床病理信息;
根据所述病理组织切片图像,划定第一目标区域;
利用所述第一目标区域,提取病理组学特征,所述病理组学特征包括图片形态特征、图像强度特征、图像纹理特征和图像颗粒特征;
根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域;
利用所述第二目标区域,获取免疫评分;
结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型;
所述利用所述第二目标区域,获取免疫评分,包括如下步骤:
获取所述第二目标区域中,获取CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度;
设定密度分割值;
依据所述密度分割值,结合所述CD3+CT、CD3+IM、CD8+CT、CD8+IM的密度获得免疫评分;
所述结合所述病理组学特征和所述免疫评分,构建直肠癌预后预测模型,包括如下步骤:
通过所述病理组学特征,筛选目标特征及对应的目标特征系数;
根据所述目标特征及对应的目标特征系数,构建病理组学特征标签值公式,从而获得病理组学特征标签值;
针对目标患者,结合临床信息、所述免疫评分和所述病理组学特征标签值,构建直肠癌预后预测模型;
所述病理组学特征标签值公式满足如下公式:
2.根据权利要求1所述的计算机可读存储介质,其特征在于,所述构建数据集,包括如下步骤:
设定数据筛选条件,所述筛选条件包括直肠癌患者的治疗时间、治疗方式和治疗状况;
根据所述筛选条件,确定目标患者;
提取所述目标患者的临床信息,所述临床信息包括所述目标患者的性别、年龄、BMI、ASA评分、血清CEA水平、肿瘤大小、肿瘤位置、手术方式、组织类型、病理TNM分期、术后并发症、术后辅助化疗;
获取所述目标患者的苏木素-伊红染色病理组织切片图像和免疫组化染色切片图像。
3.根据权利要求1所述的计算机可读存储介质,其特征在于,所述根据所述病理组织切片图像,划定第一目标区域,包括如下步骤:
确定所述苏木素-伊红染色病理组织切片图像中的第一肿瘤中心和第一浸润边缘;
在所述第一浸润边缘内的区域中划取多个第一目标区域。
4.根据权利要求3所述计算机可读存储介质,其特征在于,所述利用所述第一目标区域,提取病理组学特征,包括如下步骤:
将多个所述第一目标区域转化第一灰阶图像;
将多个所述第一目标区域分割成苏木素灰阶图像和伊红灰阶图像;
利用所述苏木素灰阶图像提取图片形态特征;
通过所述苏木素灰阶图像、所述伊红灰阶图像和所述第一灰阶图像分别获取图像强度特征、图像纹理特征和图像颗粒特征。
5.根据权利要求3所述计算机可读存储介质,其特征在于,所述根据所述免疫组化染色切片图像,结合所述第一目标区域划定第二目标区域,包括如下步骤:
在所述免疫组化染色切片图像中,锁定与所述第一肿瘤中心对应的第二肿瘤中心;
利用所述第二肿瘤中心,确定所述免疫组化染色切片图像的第二浸润边缘;
在所述第二浸润边缘内的区域中划取多个第二目标区域。
6.一种直肠癌预后预测模型构建系统,其特征在于,包括输入设备、处理器、输出设备和存储器,其中,所述输入设备、处理器、输出设备和存储器相互连接,所述存储器包括如权利要求1-5任一项所述的计算机可读存储介质,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929922.5A CN114998348B (zh) | 2022-08-03 | 2022-08-03 | 一种计算机可读存储介质及直肠癌预后预测模型构建系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929922.5A CN114998348B (zh) | 2022-08-03 | 2022-08-03 | 一种计算机可读存储介质及直肠癌预后预测模型构建系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114998348A CN114998348A (zh) | 2022-09-02 |
CN114998348B true CN114998348B (zh) | 2022-11-01 |
Family
ID=83023030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210929922.5A Active CN114998348B (zh) | 2022-08-03 | 2022-08-03 | 一种计算机可读存储介质及直肠癌预后预测模型构建系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114998348B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116109559A (zh) * | 2022-11-22 | 2023-05-12 | 武汉楚精灵医疗科技有限公司 | 胃部标志物的浸润深度检测方法、装置及存储介质 |
CN116646088B (zh) * | 2023-07-27 | 2023-12-01 | 广东省人民医院 | 一种预测方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110391015A (zh) * | 2019-06-14 | 2019-10-29 | 广东省人民医院(广东省医学科学院) | 一种基于影像组学量化肿瘤免疫状态的方法 |
CN113454458A (zh) * | 2019-02-05 | 2021-09-28 | 文塔纳医疗系统公司 | 用于评估iv期结直肠癌中免疫细胞浸润的方法和系统 |
CN113466458A (zh) * | 2021-06-29 | 2021-10-01 | 复旦大学附属中山医院 | Gpx4、nox1和acsl4在结直肠癌预后评价上的应用 |
CN114664413A (zh) * | 2022-04-06 | 2022-06-24 | 中国医学科学院肿瘤医院 | 在治疗前对直肠癌治疗抵抗及其分子机制的预测系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016087592A1 (en) * | 2014-12-03 | 2016-06-09 | Ventana Medical Systems, Inc. | Systems and methods for early-stage cancer prognosis |
EP3659110A1 (en) * | 2017-07-24 | 2020-06-03 | Ventana Medical Systems, Inc. | Methods and systems for evaluation of immune cell infiltrate in tumor samples |
US11348237B2 (en) * | 2019-05-16 | 2022-05-31 | Retrace Labs | Artificial intelligence architecture for identification of periodontal features |
CN112011616B (zh) * | 2020-09-02 | 2022-10-14 | 上海顿慧医疗科技发展有限公司 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN113930506B (zh) * | 2021-09-23 | 2022-10-18 | 江苏大学附属医院 | 一种预测肝细胞癌预后和治疗抵抗的谷氨酰胺代谢基因标签评分系统 |
CN114299069B (zh) * | 2022-03-08 | 2022-05-13 | 南方医科大学南方医院 | 一种结直肠癌胶原评价和预后预测装置和存储介质 |
-
2022
- 2022-08-03 CN CN202210929922.5A patent/CN114998348B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113454458A (zh) * | 2019-02-05 | 2021-09-28 | 文塔纳医疗系统公司 | 用于评估iv期结直肠癌中免疫细胞浸润的方法和系统 |
CN110391015A (zh) * | 2019-06-14 | 2019-10-29 | 广东省人民医院(广东省医学科学院) | 一种基于影像组学量化肿瘤免疫状态的方法 |
CN113466458A (zh) * | 2021-06-29 | 2021-10-01 | 复旦大学附属中山医院 | Gpx4、nox1和acsl4在结直肠癌预后评价上的应用 |
CN114664413A (zh) * | 2022-04-06 | 2022-06-24 | 中国医学科学院肿瘤医院 | 在治疗前对直肠癌治疗抵抗及其分子机制的预测系统 |
Non-Patent Citations (3)
Title |
---|
CT-based radiomic features predict tumor grading and have prognostic value in patients with soft tissue sarcomas treated with neoadjuvant radiation therapy;Jan C. Peeken et al.;《Radiotherapy and Oncology》;20190405;第187-196页 * |
结直肠癌的早期诊断技术进展;严俊 等;《分子影像学杂志》;20190131;第42卷(第1期);第77-80页 * |
肿瘤微环境中免疫与基质细胞相关基因在肺腺癌中的预后价值;李世雄 等;《天津医科大学学报》;20220131;第28卷(第1期);第47-52页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114998348A (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114998348B (zh) | 一种计算机可读存储介质及直肠癌预后预测模型构建系统 | |
Lin et al. | Radiomics model of contrast‐enhanced MRI for early prediction of acute pancreatitis severity | |
WO2021135774A1 (zh) | 肿瘤预测方法、装置、云平台及计算机可读存储介质 | |
US11508066B2 (en) | Systems and methods to process electronic images for continuous biomarker prediction | |
Li et al. | Machine learning–based computational models derived from large-scale radiographic-radiomic images can help predict adverse histopathological status of gastric cancer | |
Wetstein et al. | Deep learning-based grading of ductal carcinoma in situ in breast histopathology images | |
Zhang et al. | Gadoxetic acid-enhanced MRI radiomics signature: Prediction of clinical outcome in hepatocellular carcinoma after surgical resection | |
Bassi et al. | Role of radiomics in predicting lung cancer spread through air spaces in a heterogeneous dataset | |
Cheng et al. | Multiparametric MRI-based Radiomics approaches on predicting response to neoadjuvant chemoradiotherapy (nCRT) in patients with rectal cancer | |
US12008747B2 (en) | Population-specific prediction of prostate cancer recurrence based on stromal morphology features | |
Cao et al. | Dynamic prediction of outcome for patients with ovarian cancer: application of a joint model for longitudinal cancer antigen 125 values | |
Chen et al. | A deep learning‐and CT image‐based prognostic model for the prediction of survival in non‐small cell lung cancer | |
Katsumata et al. | Pathological features and prognostic implications of ground-glass opacity components on computed tomography for clinical stage I lung adenocarcinoma | |
CN114529541A (zh) | 预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统 | |
Jiang et al. | Intratumoral analysis of digital breast tomosynthesis for predicting the Ki‐67 level in breast cancer: a multi‐center radiomics study | |
Cannella et al. | Performances and variability of CT radiomics for the prediction of microvascular invasion and survival in patients with HCC: a matter of chance or standardisation? | |
Li et al. | Contrast-enhanced CT-based radiomics for the differentiation of nodular goiter from papillary thyroid carcinoma in thyroid nodules | |
Wei et al. | Value of multimodal MRI radiomics and machine learning in predicting staging liver fibrosis and grading inflammatory activity | |
Zhang et al. | Deep learning-based methods for classification of microsatellite instability in endometrial cancer from HE-stained pathological images | |
Liang et al. | HTC-Net: Hashimoto’s thyroiditis ultrasound image classification model based on residual network reinforced by channel attention mechanism | |
Pushpa et al. | Liver fat analysis using optimized support vector machine with support vector regression | |
CN114300135A (zh) | 一种肝癌术后早期复发预测模型构建方法及装置 | |
Foran et al. | An expandable informatics framework for enhancing central cancer registries with digital pathology specimens, computational imaging tools, and advanced mining capabilities | |
Loménie et al. | Can AI predict epithelial lesion categories via automated analysis of cervical biopsies: The TissueNet challenge? | |
Wu et al. | Chest computed tomography radiomics to predict the outcome for patients with COVID-19 at an early stage |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |