CN113450920A - 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置 - Google Patents

一种非小细胞肺癌患者免疫治疗疗效预测方法及装置 Download PDF

Info

Publication number
CN113450920A
CN113450920A CN202110710886.9A CN202110710886A CN113450920A CN 113450920 A CN113450920 A CN 113450920A CN 202110710886 A CN202110710886 A CN 202110710886A CN 113450920 A CN113450920 A CN 113450920A
Authority
CN
China
Prior art keywords
subject
support vector
vector machine
benefit
immune checkpoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110710886.9A
Other languages
English (en)
Inventor
易坚
徐文魁
王佳茜
金皓玄
陈龙昀
苏小凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yutai Antigen Technology Co ltd
Original Assignee
Shenzhen Yutai Antigen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yutai Antigen Technology Co ltd filed Critical Shenzhen Yutai Antigen Technology Co ltd
Priority to CN202110710886.9A priority Critical patent/CN113450920A/zh
Publication of CN113450920A publication Critical patent/CN113450920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种非小细胞肺癌患者免疫治疗疗效预测方法及装置,该方法包括:使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者。本发明使用高准确性的算法对基因组学标记物构建了机器学习模型,与当前普遍使用TMB、ITH、HLA LOH等标志物相比,该模型提升了非小细胞肺癌患者免疫治疗疗效预测的准确性和稳定性,可以更精准辅助指导患者选择治疗方案。

Description

一种非小细胞肺癌患者免疫治疗疗效预测方法及装置
技术领域
本发明涉及精准医疗领域。具体而言,涉及一种非小细胞肺癌患者免疫治疗疗效预测方法及装置。
背景技术
关于生物标志物综合模型,尽管发现了越来越多的肿瘤免疫治疗基因组标志物,但是对于基因组生物标志物的联合使用,目前仍处于高低水平结合的初级阶段。之前的一项研究(参见文献1)使用了基因组学和转录组学生物标志物来构建多变量模型,但文章中关于非小细胞肺癌(NSCLC)患者的疗效预测的研究数据很少,没有开发出用于预测NSCLC的免疫治疗疗效的高准确性模型。
发明内容
根据第一方面,在一实施例中,提供一种预测非小细胞肺癌免疫治疗疗效的方法,包括:使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者。
根据第二方面,在一实施例中,提供一种用于预测非小细胞肺癌免疫治疗疗效的系统,所述系统包含分类器。
根据第三方面,在一实施例中,一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一实施例中,一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
依据上述实施例的非小细胞肺癌患者免疫治疗疗效预测方法及装置,本发明使用高准确性的算法对基因组学标记物构建了机器学习模型,与当前普遍使用TMB、ITH、HLALOH等标志物相比,该模型提升了非小细胞肺癌患者免疫治疗疗效预测的准确性和稳定性,可以更精准辅助指导患者选择治疗方案。
附图说明
图1为一实施例中的预测系统构建流程图;
图2为一实施例中的基因组学标志物筛选结果图;
图3为不同算法对患者疗效预测准确性的比较结果图;
图4为DCB_SVM模型以及不同生物标志物对患者疗效预测能力的ROC曲线图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接,”如无特别说明,均包括直接和间接连接(联接)。
1.肿瘤免疫治疗
免疫治疗是通过重新启动并维持肿瘤-免疫循环,恢复机体正常的抗肿瘤免疫反应,从而控制与清除肿瘤的一种治疗方法,大致分三类:免疫检查点抑制剂、过继细胞免疫疗法、肿瘤疫苗。
免疫治疗与靶向治疗相比最大的优势就体现在:一旦有效,能延长患者总生存期。本文中提到的免疫治疗主要指免疫检查点抑制剂治疗。
1.1免疫检查点抑制剂
在介绍免疫检查点抑制剂(Immune Checkpoint Inhibitor)的具体情况之前,我们先来了解一下免疫检查点分子(Immune Checkpoint Molecule):免疫细胞拥有的一组具有调节和控制免疫应答持久性同时保持自我耐受的信号通路分子,是免疫系统的调节者。
人体的免疫功能受到激发时会活化,“免疫检查点分子”类似于汽车的刹车系统,在免疫系统活化时适时“刹车,”使免疫系统的活化保持在正常的范围之内,避免免疫系统过度活化。肿瘤细胞常常出现免疫检查点分子过度表达或功能过强,阻碍免疫系统对肿瘤细胞的免疫活化过程。因此,要杀死肿瘤细胞,就要抑制肿瘤细胞的免疫检查点分子,免疫检查点抑制剂应运而生。当前研究较多的免疫检查点有:PD-1、PD-L1、CTLA-4等,其中最为成熟的为PD-1/PD-L1抑制剂。
2.生物标志物
生物标志物(Biomarker)是指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标。对于肿瘤免疫治疗研究,则一般指供客观测定、评价肿瘤患者治疗过程中某种特征的变化的生化指标,这个指标可以是一个具体的生物分子,也可以是一个综合计算结果。经过长期的摸索研究,目前较为成熟的免疫学生物标志物有程序性死亡受体-配体-1(Programmed Death-Ligand-1,PD-L1)、肿瘤突变负荷(TumorMutation Burden,TMB)、肿瘤新生抗原负荷(Tumor Mutation Burden,TNB)、HLA杂合性丢失(HLA loss of heterozygosity,HLA LOH)、微卫星不稳定性(MicrosatelliteInstability,MSI)等。
免疫检查点抑制剂(ICI)革新了非小细胞肺癌(NSCLC)患者的标准治疗方法。然而,ICI仅在某些患者中产生持久的反应。多项临床试验(参见文献2~4)已证实PDL1和TMB这两个标志物可以预测ICI的疗效。如今,越来越多的回顾性研究发现了与患者免疫治疗疗效相关的新基因组学生物标志物,如ITH、TNB、HLA LOH、HED、DDR(参见文献5~9)。
2.1常见的ICI治疗基因组生物标志物
肿瘤突变负荷:TMB
TMB指的是肿瘤基因组编码区中平均每百万碱基区域中检测到的体细胞突变数量,是一个新型的潜在免疫学生物标志物,该标志物与以往的标志物所指示的内容有所不同,指示的不是一个单一的蛋白或基因,而是一个综合性的统计学指标。
晚期NSCLC的III期临床试验Checkmate-227显示:TMB-H的患者(≥10muts/Mb)中,无论PD-L1表达如何,Nivo+Ipi vs Chemo,PFS率皆提高两倍以上(2.6倍vs 5.6倍)。
肿瘤新生抗原负荷:TNB
TNB:是肿瘤细胞在增殖过程中,由于基因突变而产生的与正常细胞不一样的蛋白编码序列,这些突变可以成为新的抗原被免疫细胞识别。TNB则指的是肿瘤基因组编码区中平均每百万碱基区域中检测到的新生抗原数量,检测过程中考虑了点突变、插入缺失、融合、SV、克隆性、HLA亲和力等因素,可作为TMB预测的补充指标。因此,结合TMB及其他指标预测TNB的过程,是模拟预测体细胞突变产生肿瘤新生抗原的过程。
HLA杂合性缺失:HLA LOH
MHC:位于细胞表面,参与抗原提呈,介导细胞间相互识别及诱导免疫应答,引起急而快排斥反应的抗原。人类的MHC通常被称为HLA。
所谓杂合性指的是在同源染色体上的一个或多个位点上有不同等位基因存在的状态。而缺失,就是DNA片段丢失,实际体现为该基因无法表达为相应蛋白质或不能发挥其原有功能。杂合性缺失就是某一特殊基因正常的两个成对等位基因丢失其中一个等位基因的部分或全部基因组序列(此处存在一个丢失程度的问题,通常若肿瘤组织较正常对照组织出现某一基因条带消失或密度减少50%以上,可判断为缺失)。
HLA LOH即指HLA成对等位基因丢失其中一个等位基因50%以上的基因组序列。由于HLA等位基因数量异常庞大,目前发现的已近两万个,每种HLA等位基因可表现出对同一新生抗原不同的亲和呈递能力。若其杂合性缺失将导致HLA识别新生抗原介导的免疫监视功能削弱,以致携带突变的肿瘤克隆易于免疫逃逸。
微卫星不稳定性:MSI
在介绍MSI之前,我们需了解基因的错配修复(Mismatch Repair,MMR):若DNA复制时因物理损伤、核苷酸错误掺入或基因重组发生碱基配对错误,MMR基因则能高度特异的识别错配碱基并修复,使核苷酸序列恢复正常。修复的过程是:识别出正确的链,切除掉不正确的部分,然后通过DNA聚合酶III和DNA连接酶的作用,合成正确配对的双链DNA。
主要的MMR基因有hMSH1-6、hMLH1-5等,任一MMR基因的突变都会导致细胞MMR功能缺陷,出现更多的复制错误,我们将其中较为特殊的一种情况——与正常细胞相比,肿瘤细胞中某一微卫星(1~6bp的简单序列)由于重复单位的插入或缺失而造成的微卫星长度改变,出现新的微卫星等位基因——称为MSI。
肿瘤内异质性:ITH
近年来,肿瘤内异质性(intratumoral heterogeneity,ITH)受到了越来越多的关注,被认为是影响肿瘤免疫耐药的主要因素之一。ITH实际上可认为是单个肿瘤中基因组多样性在空间或时间上的不均匀分布,由不断累积的基因突变所造成,这对精准的肿瘤治疗提出了相当大的挑战。2019年,以色列魏茨曼科学研究院的Yardena Samuels教授与美国国家癌症研究所的Eytan Ruppin教授联合团队发表的Cell文章中指出,在黑色素瘤中的ITH越高,免疫系统被抑制的程度越高,癌症进展更快,免疫治疗效果越差。
鉴于现有技术存在的缺陷,有必要探索使用机器学习方法建立基于基因组学生物标志物构建机器学习模型,以预测非小细胞肺癌患者的免疫治疗疗效。
本文中,肿瘤突变负荷(TMB)是指每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
在一实施例中,本发明所要解决的技术问题包括:哪些基因组学生物标志物可以用来预测非小细胞肺癌患者免疫治疗疗效。
在一实施例中,本发明所要解决的技术问题包括:应使用何种机器学习算法来组化生物标志物预测非小细胞肺癌患者免疫治疗疗效。
为了解决上述问题,在一实施例中,本发明筛选出非小细胞肺癌免疫治疗疗效相关的标志物。
根据第一方面,在一实施例中,提供一种预测非小细胞肺癌免疫治疗疗效的方法,包括:使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者。
在一实施例中,所述生物标志物包括但不限于肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的至少一种。
在一实施例中,所述生物标志物包括肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的全部。
在一实施例中,根据所述概率值与阈值的大小关系,判断受试者为临床持续受益或不可持续受益的受试者。具体的阈值可以根据需要进行设定,例如,可以使用算法默认的0.5作为阈值,也可以根据ROC曲线的约登指数确定最佳概率阈值等。
在一实施例中,所述概率值≥阈值时,判断受试者为临床持续受益的受试者。
在一实施例中,所述概率值<阈值时,判断受试者为不可持续受益的受试者。
在一实施例中,所述方法包括:将来自受试者的样本的生物标志物检测值输入模型,预测得到免疫治疗疗效结果。
在一实施例中,所述模型包含分类器。
在一实施例中,所述分类器包括但不限于K近邻分类(KNN)、逻辑回归(LR)、支持向量机(英文全称为support vector machine,简称SVM)、随机森林(RF)、梯度提升(GBC)中的至少一种。
在一实施例中,所述分类器包括支持向量机。
在一实施例中,所述支持向量机包括但不限于多项式支持向量机(polynomialSVM)、线性支持向量机(linear SVM)中的至少一种。
在一实施例中,所述支持向量机为多项式支持向量机。
在一实施例中,所述受试者为经过免疫检查点抑制剂治疗的非小细胞肺癌患者。
在一实施例中,所述非小细胞肺癌患者是通过病理组织诊断为非小细胞肺癌的患者。
在一实施例中,所述免疫检查点抑制剂所抑制的免疫检查点包括但不限于PD-1、PD-L1、CTLA-4中的至少一种。
在一实施例中,所述免疫检查点抑制剂包括但不限于PD-1抑制剂、PD-L1抑制剂、CTLA-4抑制剂等等中的至少一种,其中最为成熟的为PD-1抑制剂、PD-L1抑制剂。
CTLA4或CTLA-4(细胞毒性T淋巴细胞相关蛋白4),也称为CD152(分化簇152),是一种蛋白受体,其作为免疫检查点起作用并下调免疫应答。CTLA4在调节性T细胞中组成型表达,但在活化后仅在常规T细胞中上调,这种现象在癌症中特别显着。当与抗原呈递细胞表面上的CD80或CD86结合时,它起到“关闭”开关的作用。CTLA-4蛋白由小鼠的Ctla4基因和人类中的CTLA4基因编码。
PD-1(程序性死亡受体1),也称为CD279(分化簇279),是一种重要的免疫抑制分子。通过向下调节免疫系统对人体细胞的反应,以及通过抑制T细胞炎症活动来调节免疫系统并促进自身耐受。这可以预防自身免疫性疾病,但它也可以防止免疫系统杀死癌细胞。
术语“PD-L1”或“程序性细胞死亡配体1”在本文中是指来自任何脊椎动物源(包括哺乳动物(例如灵长类动物(例如,人类)和啮齿类动物(例如,小鼠和大鼠))的任何天然PD-L1。PD-L1在业内又称为CD274分子、CD274抗原、B7同系物1、PDCD1配体1、PDCD1LG1、PDCD1L1、B7H1、PDL1、程序性死亡蛋白配体1、B7-H1和B7-H。所述术语还涵盖PD-L1的天然变体,例如剪接变体或等位基因变体。例示性人类PD-L1的氨基酸序列可在UniProt登录号Q9NZQ7(SEQ ID NO:32)下找到。
在一实施例中,所述来自受试者的样本包括肿瘤组织样本、对照样本。
在一实施例中,所述肿瘤组织样本包括但不限于肿瘤新鲜组织样本、福尔马林固定和石蜡包埋(FFPE)的肿瘤组织样本中的至少一种。
在一实施例中,所述对照样本包括但不限于癌旁正常组织样本、外周血单个核细胞(PBMC)样本的至少一种。
根据第二方面,在一实施例中,提供一种用于预测非小细胞肺癌免疫治疗疗效的系统,所述系统包含分类器。
在一实施例中,所述系统的输出结果为受试者临床持续受益(DCB)或受试者不可持续受益(NDB)。
在一实施例中,所述分类器包括但不限于K近邻分类(KNN)、逻辑回归(LR)、支持向量机(英文全称为support vector machine,简称SVM)、随机森林(RF)、梯度提升(GBC)中的至少一种。
在一实施例中,所述分类器包括支持向量机。
在一实施例中,所述支持向量机包括但不限于多项式支持向量机(polynomialSVM)、线性支持向量机(linear SVM)中的至少一种。
在一实施例中,所述支持向量机为多项式支持向量机。
在一实施例中,所述系统包括由所述分类器构建的模型。
在一实施例中,所述模型的构建方法包括:包括将受试者按照免疫治疗疗效分成临床持续受益(DCB)和不可持续受益(NDB)两组,使用分类器构建得到所述模型。
在一实施例中,所述模型的构建方法还包括:将来自受试者的样本的生物标志物检测值纳入所述模型。
在一实施例中,所述生物标志物包括但不限于肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的至少一种。
在一实施例中,所述生物标志物包括肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的全部。
在一实施例中,用于构建模型的受试者包括经过免疫检查点抑制剂治疗的非小细胞肺癌患者。
在一实施例中,用于构建模型的受试者包括临床持续受益的免疫检查点抑制剂治疗患者以及不可持续受益的免疫检查点抑制剂治疗患者。
在一实施例中,所述受试者为经过免疫检查点抑制剂治疗的非小细胞肺癌患者。
在一实施例中,所述系统使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者。
在一实施例中,所述系统根据所述概率值与阈值的大小关系,判断受试者为临床持续受益或不可持续受益的受试者。
在一实施例中,所述概率值≥阈值时,判断受试者为临床持续受益的受试者;所述概率值<阈值时,判断受试者为不可持续受益的受试者。
根据第三方面,在一实施例中,一种装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
根据第四方面,在一实施例中,一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
根据第五方面,在一实施例中,提供肿瘤突变负荷(TMB)、肿瘤内异质性(intratumoral heterogeneity,ITH)、HLA杂合性缺失(HLA LOH)中的至少一种作为预测性指标在构建预测癌症的免疫治疗疗效的系统中的用途。
在一实施例中,所述癌症包括但不限于非小细胞肺癌。
在一实施例中,所述免疫治疗疗效包括免疫检查点抑制剂的治疗疗效。
在一实施例中,所述免疫检查点抑制剂所抑制的免疫检查点包括但不限于PD-1、PD-L1、CTLA-4等等。
在一实施例中,所述免疫检查点抑制剂包括但不限于PD-1抑制剂、PD-L1抑制剂、CTLA-4抑制剂等等中的至少一种,其中最为成熟的为PD-1抑制剂、PD-L1抑制剂。
在一实施例中,本发明提供一种基于机器学习算法组合肿瘤基因组标志物,用于预测非小细胞肺癌患者免疫治疗疗效。
在一实施例中,本发明使用SVM算法构建疗效预测模型,组合多个生物标记物预测非小细胞肺癌免疫治疗疗效。
在一实施例中,本发明筛选出和非小细胞肺癌免疫治疗治疗疗效最相关的三个基因组学生物标志物。
在一实施例中,本发明使用SVM算法对基因组学标记物构建了机器学习模型(DCB_SVM),与当前普遍使用TMB、ITH、HLA LOH等标志物相比,DCB_SVM模型提升了非小细胞肺癌患者免疫治疗疗效预测的准确性和稳定性,可以更精准辅助指导患者选择治疗方案。
实施例1
1、筛选标志物
本实施例收集了公开发表(参见文献5)的69名接受抗PD-(L)1治疗的NSCLC患者队列的基因组测序数据和治疗疗效数据,以训练疗效预测机器学习模型。将“天梯计划”临床科学研究中招募的21例PD-(L)1治疗患者的基因组测序数据(使用YuceOneTM Plus产品进行测序)和疗效数据,作为第一个验证集;将公开队列(参见文献10)中89例接受PD-(L)1或PD-(L)1联合CTLA4治疗的NSCLC患者的基因组测序数据和治疗疗效数据作为第二个验证集,用于验证疗效预测机器学习模型。并基于肿瘤样本和对照样本的基因组测序数据分析检测了TMB、ITH、HLALOH、MSI、HED等基因组生物标志物。按照最佳疗效评估结果将患者按照免疫治疗疗效分成了临床持续受益(DCB)和不可持续受益(NDB)两组,持续临床获益(DCB)是指免疫治疗后,最佳疗效评估为完全缓解(CR)、部分缓解(PR)或疾病稳定(SD)但持续24周以上,无持久获益(NDB)是指免疫治疗后,最佳疗效评估为疾病进展(PD)或SD持续少于24周。图1所示为本实施例的预测系统构建流程图,训练集中的DCB、NDB患者数量分别是20、49;验证集1中的DCB、NDB患者数量分别是10、11;验证集2中的DCB、NDB患者数量分别是33、41。
本实施例中,使用裕策生物的TruNeo算法计算得到TNB标志物。使用公开发表的方法(参见文献11)分析HLA-I基因(HLA-A、HLA-B、HLA-C)分型,使用LOHHLA算法(参见文献7)计算每个HLA基因的LOH状态,并统计每个患者中发生LOH的HLA基因总数作为最终的HLALOH标志物。使用MSIsensor程序计算得到MSI标志物。使用公开发表的算法(参加文献5)计算得到ITH标志物。
本实施例对训练集样本数据进行特征工程操作,用基于逻辑回归算法的递归特征消除方法,筛选出非小细胞肺癌患者免疫治疗疗效最有预测能力的三个生物标志物:TMB、ITH、HLALOH(见图2)。
完成标志物筛选后,本实施例对训练集使用了K近邻分类(KNN)、逻辑回归(LR)、支持向量机(SVM_poly,SVM_linear)、随机森林(RF)和梯度提升(GBC)等算法分别建立模型,模型中纳入了特征工程中筛选的TMB、ITH、HLALOH三个生物标志物(每个模型同时纳入TMB、ITH、HLALOH三个生物标志物)。使用10折交叉验证来训练模型,并评估不同模型对患者免疫治疗疗效的预测准确性。如图3所示为各算法模型的预测结果图,图中polynomial SVM是指多项式支持向量机,linear SVM是指线性支持向量机,最终确认polynomial SVM算法在10折交叉验证中的预测准确性平均值最高,且方差较小,模型比较稳定。本实施例将该模型命名为DCB_SVM模型。
如图4所示,为了验证DCB_SVM模型的疗效预测能力,并且与3个单独的基因组学生物标志物(TMB,ITH,HLALOH)的预测能力进行比较。本实施例分别用DCB_SVM模型和单独的三个生物标志物(TMB,ITH,HLALOH)预测训练集和验证集中患者的免疫治疗疗效,结合患者的真实免疫治疗疗效信息画出表示疗效预测能力的受试者接受曲线(ROC),并计算ROC曲线下面积(AUC)。图4中,X轴的FPR是指假阳性率,Y轴的TPR是指真阳性率,“Baseline”是指基线,“Train”是指训练集,“Validation1”是指验证集1,“Validation2”是指验证集2。
TPR:在所有实际为阳性的样本中,被正确地判断为阳性之比率。TPR=TP/(TP+FN)。
FPR:在所有实际为阴性的样本中,被错误地判断为阳性之比率。FPR=FP/(FP+TN)。
TP是指真阳性样本数,FN是指假阴性样本数,FP是指假阳性样本数,TN是指真阴性样本数。
从图4中可以发现,DCB_SVM模型(同时纳入TMB、ITH、HLALOH三个生物标志物)在三个数据集中都展现出对DCB患者有较高的预测性能(AUC分别为0.82,0.78,0.78)。单独使用TMB进行DCB、NDB疗效患者预测,TMB在三个数据集的AUC分别是:0.7,0.68,0.74;单独使用ITH进行DCB、NDB疗效患者预测,ITH在三个数据集的AUC分别是:0.68,0.72,0.55;单独使用HLALOH进行DCB、NDB疗效患者预测,HLALOH在三个数据集的AUC分别是:0.58,0.41,0.58。这显示出DCB_SVM模型在不同的非小细胞肺癌免疫治疗数据集中都有更高且更稳定的疗效预测准确性,且优于单独使用基因组学标志物进行疗效预测。因此,DCB_SVM可以更准确地预测非小细胞患者免疫治疗疗效。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
参考文献:
1.Litchfield K,Reading JL,Puttick C,et al.Meta-analysis of tumor-andT cell-intrinsic mechanisms of sensitization to checkpoint inhibition.Cell2021;1–19
2.Giroux Leprieur E,Dumenil C,Julie C,et al.Immunotherapyrevolutionises non-small-cell lung cancer therapy:Results,perspectives andnew challenges.Eur.J.Cancer 2017;78:16–23
3.Tang J,Yu JX,Hubbard-Lucey VM,et al.The clinical trial landscapefor PD1/PDl1 immune checkpoint inhibitors.Nat.Rev.Drug Discov.2018;17:854–855
4.Samstein RM,Lee CH,Shoushtari AN,et al.Tumor mutational loadpredicts survival after immunotherapy across multiple cancertypes.Nat.Genet.2019;51:202–206
5.Fang W,Jin H,Zhou H,et al.Intratumoral heterogeneity as apredictive biomarker in anti-PD-(L)1therapies for non-small cell lungcancer.Mol.Cancer 2021;20:1–6
6.Luksza M,Riaz N,Makarov V,et al.A neoantigen fitness model predictstumour response to checkpoint blockade immunotherapy.Nature 2017;551:517–520
7.McGranahan N,Rosenthal R,Hiley CT,et al.Allele-Specific HLA Lossand Immune Escape in Lung Cancer Evolution.Cell 2017;171:1259-1271.e11
8.Chowell D,Krishna C,Pierini F,et al.Evolutionary divergence of HLAclass I genotype impacts efficacy of cancer immunotherapy.Nat.Med.2019;25:1715–1720
9.Wang Z,Zhao J,Wang G,et al.Comutations in DNA damage responsepathways serve as potential biomarkers for immune checkpoint blockade.CancerRes.2018;78:6486–6496
10.Anagnostou V,Niknafs N,Marrone K,et al.Multimodal genomic featurespredictoutcome of immune checkpoint blockade in non-small-cell lungcancer.Nat.Cancer 2020;1:99–111
11.Yi J,Chen L,Xiao Y,et al.Investigations of sequencing data andsample type on HLA class Ia typing with different computational tools[J].Briefings in Bioinformatics,2021,22(3):bbaa143.
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种预测非小细胞肺癌免疫治疗疗效的方法,其特征在于,包括:使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者。
2.如权利要求1所述的方法,其特征在于,所述生物标志物为肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的至少一种。
3.如权利要求1所述的方法,其特征在于,根据所述概率值与阈值的大小关系,判断受试者为临床持续受益或不可持续受益的受试者。
4.如权利要求3所述的方法,其特征在于,所述概率值≥阈值时,判断受试者为临床持续受益的受试者;所述概率值<阈值时,判断受试者为不可持续受益的受试者。
5.如权利要求1所述的方法,其特征在于,所述方法包括:将来自受试者的样本的生物标志物检测值输入模型,预测得到免疫治疗疗效结果;
和/或,所述模型包含分类器;
和/或,所述分类器为K近邻分类、逻辑回归、支持向量机、随机森林、梯度提升中的至少一种;
和/或,所述分类器包括支持向量机;
和/或,所述支持向量机包括多项式支持向量机、线性支持向量机中的至少一种;
和/或,所述支持向量机为多项式支持向量机。
6.如权利要求1方法,其特征在于,所述受试者为经过免疫检查点抑制剂治疗的非小细胞肺癌患者;
和/或,所述免疫检查点抑制剂所抑制的免疫检查点为PD-1、PD-L1、CTLA-4中的至少一种;
和/或,所述免疫检查点抑制剂为PD-1抑制剂、PD-L1抑制剂、CTLA-4抑制剂中的至少一种;
和/或,所述来自受试者的样本包括肿瘤组织样本、对照样本;
和/或,所述肿瘤组织样本包括肿瘤新鲜组织样本、福尔马林固定和石蜡包埋(FFPE)的肿瘤组织样本中的至少一种;
和/或,所述对照样本包括癌旁正常组织样本、外周血单个核细胞(PBMC)样本的至少一种。
7.一种用于预测非小细胞肺癌免疫治疗疗效的系统,其特征在于,所述系统包含分类器,所述系统的输出结果为受试者临床持续受益或受试者不可持续受益。
8.如权利要求7所述的系统,其特征在于,所述分类器为K近邻分类、逻辑回归、支持向量机、随机森林、梯度提升中的至少一种;
和/或,所述分类器包括支持向量机;
和/或,所述支持向量机包括多项式支持向量机、线性支持向量机中的至少一种;
和/或,所述支持向量机包括多项式支持向量机;
和/或,所述系统包括由所述分类器构建的模型;
和/或,所述模型的构建方法包括:包括将受试者按照免疫治疗疗效分成临床持续受益(DCB)和不可持续受益(NDB)两组,使用分类器构建得到所述模型;
和/或,所述模型的构建方法还包括:将来自受试者的样本的生物标志物纳入所述模型;
和/或,所述生物标志物为肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的至少一种;
和/或,所述生物标志物包括肿瘤突变负荷、肿瘤内异质性、HLA杂合性缺失中的全部;
和/或,用于构建模型的受试者包括经过免疫检查点抑制剂治疗的非小细胞肺癌患者;
和/或,所述免疫检查点抑制剂所抑制的免疫检查点为PD-1、PD-L1、CTLA-4中的至少一种;
和/或,所述免疫检查点抑制剂为PD-1抑制剂、PD-L1抑制剂、CTLA-4抑制剂中的至少一种;
和/或,用于构建模型的受试者包括临床持续受益的免疫检查点抑制剂治疗患者以及不可持续受益的免疫检查点抑制剂治疗患者;
和/或,所述受试者为经过免疫检查点抑制剂治疗的非小细胞肺癌患者;
和/或,所述系统使用来自受试者的样本的生物标志物检测结果进行计算,得到受试者临床持续受益的概率值,根据所述概率值,判断受试者为临床持续受益或不可持续受益的受试者;
和/或,所述系统根据所述概率值与阈值的大小关系,判断受试者为临床持续受益或不可持续受益的受试者;
和/或,所述概率值≥阈值时,判断受试者为临床持续受益的受试者;所述概率值<阈值时,判断受试者为不可持续受益的受试者的受试者。
9.一种装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1~6任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述介质上存储有程序,所述程序能够被处理器执行以实现如权利要求1~6任意一项所述的方法。
CN202110710886.9A 2021-06-25 2021-06-25 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置 Pending CN113450920A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110710886.9A CN113450920A (zh) 2021-06-25 2021-06-25 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110710886.9A CN113450920A (zh) 2021-06-25 2021-06-25 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置

Publications (1)

Publication Number Publication Date
CN113450920A true CN113450920A (zh) 2021-09-28

Family

ID=77812796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110710886.9A Pending CN113450920A (zh) 2021-06-25 2021-06-25 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置

Country Status (1)

Country Link
CN (1) CN113450920A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114220486A (zh) * 2021-11-26 2022-03-22 贵州医科大学第二附属医院 一种基于支持向量机的肺癌免疫联合化疗效果预测
CN114974420A (zh) * 2021-10-29 2022-08-30 无锡臻和生物科技有限公司 预测胃肠肿瘤免疫检查点抑制剂疗效的标志物及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111979323A (zh) * 2020-08-28 2020-11-24 深圳裕策生物科技有限公司 用于预测肿瘤免疫治疗效果的生物标志物检测方法及系统
CN112143810A (zh) * 2020-09-29 2020-12-29 南方医科大学中西医结合医院 一组用于预测癌症免疫治疗效果的基因标志物及其应用
CN112771581A (zh) * 2018-07-30 2021-05-07 纪念斯隆凯特琳癌症中心 用于对免疫疗法和放射疗法的分割、结果预测和纵向应答监测的多模态、多分辨率深度学习神经网络

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112771581A (zh) * 2018-07-30 2021-05-07 纪念斯隆凯特琳癌症中心 用于对免疫疗法和放射疗法的分割、结果预测和纵向应答监测的多模态、多分辨率深度学习神经网络
CN111979323A (zh) * 2020-08-28 2020-11-24 深圳裕策生物科技有限公司 用于预测肿瘤免疫治疗效果的生物标志物检测方法及系统
CN112143810A (zh) * 2020-09-29 2020-12-29 南方医科大学中西医结合医院 一组用于预测癌症免疫治疗效果的基因标志物及其应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114974420A (zh) * 2021-10-29 2022-08-30 无锡臻和生物科技有限公司 预测胃肠肿瘤免疫检查点抑制剂疗效的标志物及其应用
CN114220486A (zh) * 2021-11-26 2022-03-22 贵州医科大学第二附属医院 一种基于支持向量机的肺癌免疫联合化疗效果预测
CN114220486B (zh) * 2021-11-26 2023-02-28 贵州医科大学第二附属医院 一种基于支持向量机的肺癌免疫联合化疗效果预测

Similar Documents

Publication Publication Date Title
Ghorani et al. Differential binding affinity of mutated peptides for MHC class I is a predictor of survival in advanced lung cancer and melanoma
CN109937452B (zh) 免疫疗法标志及其用途
CN108796055B (zh) 基于二代测序的肿瘤新生抗原检测方法、装置和存储介质
US11485784B2 (en) Ranking system for immunogenic cancer-specific epitopes
CN113450920A (zh) 一种非小细胞肺癌患者免疫治疗疗效预测方法及装置
CA3217623A1 (en) Compositions and method for optimized peptide vaccines using residue optimization
CN113053458B (zh) 一种肿瘤新生抗原负荷的预测方法及装置
CN114929899A (zh) 一种新抗原的筛选方法、系统及其用途
WO2018064547A1 (en) Methods for classifying somatic variations
Wang et al. Predicting durable responses to immune checkpoint inhibitors in non-small-cell lung cancer using a multi-feature model
Pagadala et al. Germline modifiers of the tumor immune microenvironment implicate drivers of cancer risk and immunotherapy response
WO2021148573A1 (en) In vitro method for identifying efficient therapeutic molecules for treating pancreatic ductal adenocarcinoma
Cao et al. Identification and development of a novel 4-gene immune-related signature to predict osteosarcoma prognosis
Huang et al. Identification of immune-related subtypes and characterization of tumor microenvironment infiltration in bladder cancer
Shao et al. HLA class II immunogenic mutation burden predicts response to immune checkpoint blockade
Borden et al. Neoantigen fitness model predicts lower immune recognition of cutaneous squamous cell carcinomas than actinic keratoses
Wu et al. Quantification of neoantigen-mediated immunoediting in cancer evolution
Jiang et al. New prognostic gene signature and immune escape mechanisms of bladder cancer
Zhong et al. Identification and Validation of a Potential Prognostic 7‐lncRNA Signature for Predicting Survival in Patients with Multiple Myeloma
KR102188376B1 (ko) 암 유전체 염기서열 변이, 전사체 발현 및 환자 생존 정보를 이용한 맞춤형 항암 치료 방법 및 시스템
CN112292464A (zh) 肿瘤功能突变和表位负荷作为免疫治疗反应的改进的预测性生物标志
CN115424740A (zh) 基于ngs和深度学习的肿瘤免疫治疗效果预测系统
Kalya et al. Machine Learning based Survival Group Prediction in Glioblastoma
Kalfakakou et al. Pitfalls in variant annotation for hereditary cancer diagnostics: The example of Illumina® VariantStudio®
Wang et al. Prognostic value of four immune-related genes in lower-grade gliomas: a biomarker discovery study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210928

RJ01 Rejection of invention patent application after publication