CN114242157A - 基于bGMS预测非小细胞肺癌免疫治疗疗效 - Google Patents

基于bGMS预测非小细胞肺癌免疫治疗疗效 Download PDF

Info

Publication number
CN114242157A
CN114242157A CN202111630526.4A CN202111630526A CN114242157A CN 114242157 A CN114242157 A CN 114242157A CN 202111630526 A CN202111630526 A CN 202111630526A CN 114242157 A CN114242157 A CN 114242157A
Authority
CN
China
Prior art keywords
model
bgms
mutation
gene
immunotherapy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111630526.4A
Other languages
English (en)
Other versions
CN114242157B (zh
Inventor
刘满姣
夏思健
郭昊
颜林林
任用
李诗濛
张贝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xiansheng Diagnostic Technology Co ltd
Nanjing Xiansheng Medical Laboratory Co ltd
Jiangsu Xiansheng Medical Diagnosis Co ltd
Original Assignee
Nanjing Xiansheng Diagnostic Technology Co ltd
Nanjing Xiansheng Medical Laboratory Co ltd
Jiangsu Xiansheng Medical Diagnosis Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xiansheng Diagnostic Technology Co ltd, Nanjing Xiansheng Medical Laboratory Co ltd, Jiangsu Xiansheng Medical Diagnosis Co ltd filed Critical Nanjing Xiansheng Diagnostic Technology Co ltd
Priority to CN202111630526.4A priority Critical patent/CN114242157B/zh
Publication of CN114242157A publication Critical patent/CN114242157A/zh
Application granted granted Critical
Publication of CN114242157B publication Critical patent/CN114242157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型构建方法及其应用。所述方法以cfDNA基因突变为模型输入,以总生存期为疗效评价指标,利用LASSO‑Cox回归方法进行模型构建,获得综合模型并计算bGMS,可预测NSCLC患者的生存风险和免疫治疗响应状况。与当前普遍基于肿瘤组织的标志物相比,本发明具有样本更易获得、无创等优点;与使用传统bTMB标志物相比,具有更高准确性。

Description

基于bGMS预测非小细胞肺癌免疫治疗疗效
技术领域
本发明涉及生信分析领域,具体涉及一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型构建方法及应用。
背景技术
近年来,随着对肿瘤微环境免疫逃逸机制的深入研究,以程序死亡受体1(programmed cell death 1,PD-1)/程序性死亡配体1(programmed cell death ligand1,PD-L1)和抗细胞毒性T淋巴细胞相关蛋白4(Cytotoxic T-lymphocyte-associatedprotein 4,CTLA-4)等免疫检查点抑制剂(Immune Checkpoint inhibitor,ICI)为主的免疫疗法已经在实体瘤治疗中得到广泛的应用,在非小细胞肺癌(non-small cell lungcancer,NSCLC)治疗领域更是被纳入为一线治疗手段。得益于ICI免疫疗法的发展,癌症患者的生存期明显提高,甚至使癌症治愈成为可能。然而,并不是所有患者都适合免疫治疗或能从免疫治疗中获益,这就需要对患者进行精准的分群或分型。
目前,用于非小细胞肺癌免疫疗效预测的生物标志物尚未有统一的标准,其中研究较多的两种组织生物标志物是PD-L1和肿瘤突变负荷(Tissue Tumor MutationalBurden,tTMB)。PD-L1是肿瘤细胞发生免疫逃逸的最为关键的表面蛋白之一。根据最新的美国国家综合癌症网络(National Comprehensive Cancer Network,NCCN)指南,对肿瘤组织PD-L1表达量的检测已经成为NSCLC患者确诊后的1类推荐检测项。一般来说,PD-L1表达量高的患者,接受免疫治疗的疗效越好。然而,越来越多的临床数据表明,PD-L1低表达患者也能从ICI治疗中获益,并且疗效与PD-L1高表达的患者相当。此外,病理组织的位置差异可能会影响对PD-L1表达量的判断。TMB是指每百万碱基中,能检测到的体细胞特定基因组区域发生非同义突变的总数。基于肿瘤组织的TMB数量检测可在一定程度上反映肿瘤新生抗原的水平。这些抗原数量的增多往往有助于肿瘤对ICI免疫治疗的响应,因此,较高的组织TMB的NCSLC患者通常更能从ICI免疫治疗中获益。然而,以上所述的生物标志物存在一定缺陷。首先,它们均需要进行组织取样,但临床组织样本一般较为珍贵且存在取样困难。其次,由于肿瘤组织内异质性的存在,它们并不能准确反映肿瘤细胞和肿瘤免疫微环境的真实情况。
相对组织活检,液体活检由于具有容易获取、可动态检测和能克服肿瘤异质性的特点,目前已经成为癌症早期筛查和免疫疗效预测最热门的研究方向之一。细胞游离DNA(cell-free DNA,cfDNA)是一种游离在血液的DNA片段,主要的来源是机体内凋亡或坏死细胞。在实体瘤中,肿瘤组织内的细胞增殖旺盛,更新换代速度快,坏死的细胞会释放DNA到血液中,而这些肿瘤细胞来源的cfDNA就称为ctDNA。由于ctDNA携带有与原发肿瘤组织相同的突变信息,基于ctDNA的无创液体活检技术,已经在癌症早筛、产前诊断和预后评估等方面获得广泛应用。
在NSCLC中,已有一些研究逐步探索基于血液TMB(blood TMB,bTMB),即血液中细胞游离DNA中存在的基因突变数量,作为cfDNA生物标志物,用于免疫治疗疗效预测。不过,有研究表明,bTMB能预测NSCLC患者免疫治疗后的无进展生存期(Progress FreeSurvival,PFS)获益,但对总生存期(Overall Survival,OS)的预测效果并不理想。因此有学者利用突变频率(Allele Frequency)对bTMB进行校正,提出LAF-bTMB(Low allelefrequency bTMB)指标,即血样样本中检测到的低频突变总数用于NSCLC患者免疫治疗疗效预测。但是无论是基于bTMB、LAF-bTMB,其计算需要大panel甚至是全外显子组的测序,存在成本较高的局限性。
ICI免疫疗法给肿瘤患者带来的益处是显而易见的,然而,并不是所有患者适合ICI免疫治疗或能从中获益,因此,亟需开发更多有效可靠的生物标志物,指导ICI的临床应用。本发明基于cfDNA突变特征,结合LASSO-Cox回归方法,提出了计算bGMS的模型,可用于非小细胞肺癌免疫疗效预测。该模型具有样本更易获得、无创的优点;且与使用bTMB标志物相比,具有更高的准确性。
有鉴于此,特提出本发明。
发明内容
针对上述技术问题,本发明的目的是提供一种基于cfDNA突变进行NSCLC免疫治疗疗效预测的模型构建方法、模型及其应用。
为实现以上目的,本发明提供的技术方案如下:
本发明首先提供一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型构建方法,所述方法包括以下步骤:
步骤一:获取非小细胞肺癌患者免疫治疗队列数据,将数据按样本分为训练集和验证集,所述数据包含cfDNA基因突变和反应治疗疗效的疗效评价指标;
步骤二:利用训练集数据进行模型构建:
1)以cfDNA突变作为模型输入,以反应治疗疗效的疗效评价指标(优选为OS和/或PFS)作为被预测指标,构建预测模型;
2)构建整合多次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应系数;
3)基于基因突变及其对应系数,对血液基因组突变打分,计算血液中游离基因组突变评分bGMS;
所述bGMS定义公式为
Figure BDA0003438966110000031
其中,i表示经过LASSO-Cox筛选的特征基因,n表示经过LASSO-Cox筛选的特征基因总数;muti表示特征基因是否突变状态,当muti=0表示未发生突变,当muti=1表示发生突变;coefi表示特征基因对应的回归系数;
4)确定分割点(cutoff值),将患者的风险等级分为高低两组;
进一步的,所述方法还包括如下步骤:
步骤三:将所构建的模型在验证集中进行验证,确认模型在独立的验证数据集中仍具有预测效能。
进一步的,所述1)中,
所述预测模型的构建使用LASSO-Cox构建预测模型;
优选的,所述构建过程中,为获得更具鲁棒性的模型,进行多次随机的模型构建,每次模型构建中均进行5折交叉验证,获得突变基因的系数;
更优选的,为获得更具鲁棒性的模型,进行200次随机的模型构建,每次模型构建中均进行5折交叉验证,获得突变基因的系数。
进一步的,所述2)中,
所述对应系数为多次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
优选的,所述2)具体为构建整合200次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应的系数,其中整合模型中基因的系数是200次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
进一步的,所述3)中,所述bGMS具体=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
进一步的,所述4)中,
确定分割点(cutoff值),将风险等级分为高低两组:若患者bGMS大于分割点,则判断为治疗有效,若患者bGMS小于分割点,则判断治疗无效;优选的,所述分割点=0。
本发明还提供一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型,其特征在于,所述模型包括如下模块:
模块一:用于获取非小细胞肺癌患者免疫治疗队列数据,将数据按样本分为训练集和验证集;所述数据包含cfDNA基因突变,OS和/或PFS评价指标;
模块二:利用训练集数据进行模型构建:
1)以cfDNA突变作为模型输入,以反应治疗疗效的疗效评价指标(优选为OS和/或PFS)作为被预测指标,构建预测模型;
2)构建整合多次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应系数;
3)基于基因突变及其对应系数,计算血液中游离基因组突变评分bGMS;
所述bGMS定义公式为
Figure BDA0003438966110000041
其中,i表示经过LASSO-Cox筛选的特征基因,n表示经过LASSO-Cox筛选的特征基因总数;muti表示特征基因是否突变状态,当muti=0表示未发生突变,当muti=1表示发生突变;coefi表示特征基因对应的回归系数;
4)确定分割点(cutoff值),将患者的风险等级分为高低两组;
模块三:基于构建的模型预测非小细胞肺癌的免疫治疗疗效。
进一步的,所述1)中,
所述预测模型的构建使用LASSO-Cox构建预测模型;
优选的,所述构建过程中,为获得更具鲁棒性的模型,进行多次随机的模型构建,每次模型构建中均进行5折交叉验证,获得突变基因的系数;
进一步的,所述2)中,
所述对应系数为多次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
优选的,所述2)具体为构建整合200次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应的系数,其中整合模型中基因的系数是200次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
进一步的,所述bGMS具体=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+
(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
进一步的,所述4)中,
确定分割点,将风险等级分为高低两组:若患者bGMS大于分割点,则判断为治疗有效,若患者bGMS小于分割点,则判断治疗无效;优选的,所述分割点=0。
本发明还提供一种bGMS作为预测非小细胞肺癌的免疫治疗疗效的标记物应用。
本发明还提供一种用于检测bGMS的试剂的如下应用:
1)在预测非小细胞肺癌的免疫治疗疗效中的应用;
2)在制备预测非小细胞肺癌的免疫治疗疗效的试剂中的应用。
本发明还提供一种用于检测基因TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6和ATR突变的试剂的如下应用:
1)在预测非小细胞肺癌的免疫治疗疗效中的应用;
2)在制备预测非小细胞肺癌的免疫治疗疗效的试剂中的应用。
进一步的,所述基因bGMS与TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6和ATR突变满足:bGMS=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
本发明还提供一种用于预测非小细胞肺癌的免疫治疗疗效的生物标志物,其包括基因TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6、ATR的突变。
所述突变满足bGMS=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+
(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
本发明还提供一种用于预测非小细胞肺癌免疫治疗疗效的试剂盒,包含用于检测bGMS的试剂。
本发明还提供一种用于预测非小细胞肺癌免疫治疗疗效的试剂盒,包含特异性检测TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6、ATR基因突变的试剂。
优选的,所述试剂盒中还包含选自核酸提取试剂、基因的特异性引物或探针、PCR试剂和核酸测序试剂中的一种或多种。
本发明还提供一种装置,包括:至少一个存储器,用于存储程序;至少一个处理器,用于加载所述程序以执行如上述任一项所述方法。
本发明还提供一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现如上述任一项所述方法。
本发明有益的技术效果:
1、本发明仅利用15个基因的突变值构建预测模型,简单易行,可准确有效地预测NSCLC免疫治疗疗效。
2、本发明模型建立利用的是血浆cfDNA突变谱,样本取样相对容易,对患者的创伤较少。
3、本发明首次提出基于bGMS可用于非小细胞肺癌免疫治疗疗效预测。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1LASSO-Cox模型基因筛选以及对应的回归系数;
图2训练集和验证集的患者bGMS值曲线;
图3训练集和验证集患者的bGMS值与生存状态图;
图4训练集和验证集高低bGMS组总生存期(OS)Kaplan-Meier曲线图;
图5训练集和验证集高低bGMS组无进展生存期(PFS)Kaplan-Meier曲线图;
图6训练集和验证集中bGMS和临床候选预测因子的单因素Cox回归分析;
图7总生存期(OS)的多因素Cox回归森林图;
图8无进展生存期(PFS)的多因素Cox回归分析森林图;
图9bGMS,bTMB和LAF-bTMB预测不同时间点生存状态的ROC曲线;
图10训练集队列中高(右)低(左)bGMS组接受化疗(Docetaxel)和免疫治疗(MPDL3280A)患者的OS生存曲线;
图11验证集队列中高(右)低(左)bGMS组接受化疗(Docetaxel)和免疫治疗(MPDL3280A)患者的OS生存曲线。
具体实施方式
下面将结合实施例对本申请的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本申请,而不应视为限制本申请的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。
以下基本术语或定义仅仅是为了帮助理解本发明而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。除非在下文中另有定义,本发明具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本发明。
如本发明中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
本发明中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本发明描述的实施方案能以不同于本发明描述或举例说明的其它顺序实施。
本发明所述的肿瘤突变负荷(tumor mutation burden,TMB),也称为ML(MutationLoad),一般是指肿瘤基因组内存在体细胞突变的数量。根据测序平台和测序方法的不同,TMB又被定义为肿瘤基因组区域或外显子编码区域中,每兆碱基发生的基因编码错误、碱基替换突变和插入缺失突变的总数,单位为muts/MB或muts/exome。根据样本来源的不同,TMB可分为肿瘤TMB(tTMB)和血液TMB(bTMB)。tTMB是指利用肿瘤组织计算的TMB值,通常所述的高TMB,是指tTMB高。bTMB,即血液TMB,是根据血液样本中循环肿瘤DNA变异计算的TMB,可间接反映肿瘤组织中的TMB情况。研究表明,在同一患者的tTMB和bTMB具有一定正相关。TMB反映的是肿瘤细胞内突变累积的数量以及新生抗原的表达水平。理论上,高TMB的患者,机体内肿瘤细胞新生抗原越多,抗肿瘤T细胞增殖越多,对免疫检查点抑制剂治疗越敏感,疗效越好。
在一实施例中,所述的低等位基因频率-血液肿瘤突变负荷(Low allelefrequency Btmb,LAF-bTMB)是将患者最大体细胞等位基因频率(或ctDNA含量)纳入bTMB计算公式而得到的一种新型评价TMB的指标。研究表明,LAF-bTMB能有效预测NSCLC患者的总生存期获益。
本发明中所述的靶向捕获二代测序,又称靶向重测序。靶向重测序是对一组基因或部分基因组区域进行二代测序的方法,相对于全基因组测序,具有更高的性价比和更深的测序深度。
本发明所述的基于cfDNA突变进行NSCLC免疫治疗疗效预测的模型构建方法,大体是如下步骤(如下不做发明限制):
步骤一:获取非小细胞肺癌(non-small cell lung cancer,NSCLC)患者免疫治疗队列数据,数据包含cfDNA基因突变和OS、PFS等反应治疗疗效的疗效评价指标。将数据按样本分为训练集和验证集。
步骤二:利用训练集数据进行模型构建,包括以下步骤:
(1)以cfDNA突变作为模型输入,以OS作为被预测指标,使用LASSO-Cox方法构建预测模型。为获得更具鲁棒性的模型,进行例如200次随机的模型构建,每次模型构建中均进行5折交叉验证,获得突变基因的系数。
(2)构建整合200次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应的系数,其中整合模型中基因的系数是200次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
(3)计算bGMS,其计算方式为纳入模型中的基因的突变状态(0或1)乘以对应系数的和,即
Figure BDA0003438966110000091
(4)确定分割点(cutoff值),将患者的风险等级分为高低两组。若患者bGMS大于分割点,则判断为治疗有效,若患者bGMS小于分割点,则判断治疗无效。
步骤三:将所构建的模型在验证集中进行验证,确认模型在独立的验证数据集中仍具有预测效能。
本发明中的术语“cfDNA”是指由于细胞坏死或凋亡而释放在体液中的循环游离DNA(circulating cell-free DNA,cfDNA),优选的,是来源于肿瘤细胞的cfDNA,即肿瘤循环DNA(circulating tumor DNA,ctDNA)。
本发明中的术语“突变”是指细胞内遗传物质,即脱氧核糖核酸(Deoxyribonucleic acid,DNA),发生的变异。突变包括但不限于DNA序列单碱基引起的点突变、基因缺失或重排等。
本发明所述的免疫检查点是指存在于活化的免疫细胞表面,并能维持自身免疫耐受的一系列受体蛋白,包括抑制型和激活型。在肿瘤的发生和发展过程中,肿瘤细胞通常会表达与免疫检查点相结合的配体来抑制免疫细胞抗肿瘤功能,造成免疫逃逸。目前,已发现的免疫检查点包括PD-1、CTLA-4、LAG3、TIM3、TIGIT和BTLA等。
本发明所述的免疫检查点抑制剂是基于免疫检查点开发的一系列单抗类药物,主要是用于阻断肿瘤细胞与免疫细胞的相互作用,从而激活机体对肿瘤细胞的免疫杀伤功能。临床上常用的抑制剂有PD-1/PD-L1抑制剂和CTLA-4抑制剂。所述的PD-1抑制剂进一步可以选择为Nivolumab(Opdivo;BMS-936558)、Pembrolizumab(Keytruda;MK-3475)、lambrolizumab(MK-3475)、Pidilizumab(CT-011)、特瑞普利单抗(JS001)、信迪利单抗(IBI308)、卡瑞利珠单抗(艾瑞卡)以及替雷利珠单抗(百泽安)中的一种或多种。所述PD-L1抑制剂进一步可以选择为MPDL3280A(Tecentriq;Atezolizumab)、JS003、Durvalumab(Imfinzi)、Avelumab(Bavencio)、BMS-936559、MEDI4736以及MSB0010718C中的一种或多种。所述的CTLA-4抑制剂进一步可以选择为伊匹木单抗(Ipilimumab)。
本发明所述非小细胞肺癌患者是根据病理学组织特征和临床症状诊断为非小细胞肺癌的病人。
本发明所述的免疫疗效评价指标包括生存、肿瘤反应和实体瘤的疗效评价指标,其中生存指标有总生存期和中位生存期;肿瘤反应指标有无进展生存期、疾病进展时间、客观缓解率和疾病控制时间等;实体瘤指标有疾病进展、疾病稳定、部分缓解和完全缓解等。
在一实施例中,所述的中位生存期(Median Survival Time),又称半数生存期,即当累积生存率为0.5时对应的生存时间。
本发明所述的测序深度,又称测序覆盖比,是指在二代测序中,测序得到的碱基总量占物种基因组大小的比例,也可定义为基因组中每个碱基被测序到的平均次数。所述的基因外显子碱基覆盖度中位数是指在全外显子测序后,计算对测序获得的目标基因序列占该基因外显子区域比例的中位数值。
本发明所述的最大体细胞等位基因突变频率是指通过二代测序对每个样本测定出的所有体细胞突变的最大等位基因频率。体细胞突变是肿瘤发生的重要原因之一,最大体细胞等位基因突变频率可反映体细胞突变累积的情况。
在本发明所述的LASSO回归(the least absolute shrinkage and selectionoperator)是一种在常规对自变量和因变量进行广义线性模型拟合的基础上,加入变量筛选和复杂度调整规则的建模方法。LASSO回归最大的优势在把意义不大或无意义的自变量系数压缩为0,而使更有意义的自变量纳入模型。
在本发明所述的Cox回归,又称比例风险回归模型,是一种探究一个或多个预测变量(或因素)对生存状态和生存时间影响的分析方法。
在本发明中,所述的交叉验证包括但不限于保留交叉验证(Hand-out crossvalidation)、K折交叉验证(K-fold cross validation)和留一法(Leave one out),它是一种寻找最优参数,从而对模型进行选择的方法。其中,K折交叉验证的基本过程是,在一个数据集中,首先将其平均分为K组,其中K-1组作模型训练,其余用于预测,并计算该次分组的预测误差,如此重复K次后,最终得到所有预测误差的平均值。
在一实施例中,所述的cfDNA是指机体内肿瘤组织的细胞坏死或凋亡后,释放到外周血的游离DNA片段。这些肿瘤来源的cfDNA,可反映肿瘤组织内细胞的基因突变情况。
在一实施例中,所述筛选出构建预测模型的突变基因以及对应的系数是使用LASSO-Cox方法和交叉验证确定的。
在一实施例中,所述LASSO-Cox方法具体为在LASSO线性回归的基础上联合Cox模型筛选影响患者总生存期的突变基因数。
在一实施例中,所述交叉验证为5-折交叉验证,就是在每一次的模型构建时,先把训练集数据分成5份,将其中的4份作为训练集,其余1份作为交叉验证集。接着,交叉验证重复5次,取5次准确率的平均值作为该模型的评价指标,最终确定每一次模型的突变基因系数。
本发明所述的bGMS(blood genomic mutation signature)是对血液基因组突变打分,具体是指血液中游离基因组的突变评分。
在一实施例中,所述突变基因有15个,这些基因分别是TP53(Tumor protein p53,肿瘤蛋白53)、RB1(RB Transcriptional Corepressor 1,视网膜母细胞瘤基因1)、PTCH1(Patched 1,补丁基因1)、PIK3C3(Phosphatidylinositol 3-kinase catalytic subunittype 3,磷酸肌醇-3-激酶3)、MET(MET Proto-Oncogene,Receptor Tyrosine Kinase,c-MET酪氨酸激酶受体)、KEAP1(Kelch Like ECH Associated Protein 1,kelch样ech相关蛋白1)、GRM3(Glutamate metabotropic receptor 3,代谢型谷氨酸受体3)、GABRA6(Gamma-aminobutyric acid type A receptor alpha6 subunit,G氨基丁酸A型受体α6)、FLT4(Fmsrelated tyrosine kinase 4,Fms相关的酪氨酸激酶4)、FLT1(Fms related tyrosinekinase 1,血管内皮生长因子受体1)、EPHA7(EPH Receptor A7,肝配蛋白A受体7)、BRAF(B-Raf Proto-Oncogene,Serine/Threonine Kinase,RAF家族丝氨酸/苏氨酸蛋白激酶)、ATR(Ataxia-telangiectasia mutated and Rad 3related protein,突变基因Rad3相关蛋白)、ATM(Ataxia telangiectasia-mutated gene,共济失调毛细血管扩张突变基因)以及APC(Adenomatous polyposis coli,腺瘤性息肉病基因)。
在一具体特定的实施例中,本发明的bGMS计算公式如下:
bGMS=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
在一实施例中,本发明最佳分割点(cutoff值)的确定是使用R包survminer的sur_cutpoint函数直接计算获得。
在一实施例中,所述的sur_cutpoint函数是用于计算生存资料连续自变量的截断值。该函数的基本原理是使用最大选择轶检验(Maximally selected ranked statistics,Maxstat),即通过对连续型自变量进行多次二分组,最终选择一个使因变量能够在两组间差异最大的分割点。本发明利用bGMS作为自变量,生存时间和生存状态作为因变量,最终选择bGMS等于0作为分割点。其中,bGMS≤0的患者被预测为低风险,免疫治疗有效,bGMS>0的患者被预测为高风险,免疫治疗无效。
如下为具体的实施例。
1.数据集
本发明使用的数据集来源于2018年Gandara DR等发表在杂志《NatrureMedicine》的研究。该研究涉及两项非小细胞肺癌患者临床试验,分别是3期OAK试验和2期POPLAR实验(表1)。最终的临床试验表明,无论是OAK还是POPLAR,与化疗药物Doc etaxel相比,接受MPDL3280A免疫治疗的NSCLC患者的总生存期均得到延长。数据集包含以上两项试验所有入组患者的临床基线资料、免疫治疗疗效评价指标和血浆cfDNA靶向捕获二代测序获得的315个基因突变数据。
表1本发明使用的数据集
Figure BDA0003438966110000121
Figure BDA0003438966110000131
2.临床指标
本发明涉及的临床指标基线数据包括种族、性别、年龄、肺病病灶组织学特征、吸烟与否、总生存期(OS)和相应的删失数据、无进展生存期(PFS)和相应的删失数据等。在本发明的OS定义为从随机化开始到因任何原因导致死亡的时间,为这两个临床研究的首要终点。PFS定义为患者入组到首次记录到疾病进展或因任何原因导致死亡的时间,作为这两个临床研究的次要终点。删失数据的0表示censored,即无事件发生或删失,1表示diseased,即有结局时间发生。
3.基于cfDNA突变的ICIs免疫治疗疗效预测模型建立
本发明首先将OAK和POPLAR研究中的接受免疫治疗的患者数据分成训练集(Training)和验证集(Validation),接着,根据基因外显子碱基覆盖度中位数(Exoncoverage median)大于800且最大体细胞等位基因突变频率(Maximum Somatic VariantAllele Frequency,MASF)大于0.01的过滤条件对两个数据集中的病人进行筛选。最终,训练集共有319位患者数据满足条件,而验证集则有105位。
使用训练集的cfDNA突变数据和OS作为自变量和因变量,用LASSO-Cox方法构建预测模型。LASSO-Cox方法的基本分析思路是利用LASSO模型惩罚回归系数数量的机制对高维的突变基因数进行降维,从而获得更优的Cox回归模型。研究表明,综合模型(ensemblmodels)更具鲁棒性并且较少受到初始随机数种子的影响。为构建综合模型,我们使用不同的随机种子进行了200次LASSO-Cox模型的构建。在每次模型构建中,利用五折交叉检验进行参数优化,获得输入基因的回归系数。在最终的综合模型中,对输入的基因,我们计算在200次模型训练中得到的系数的平均值作为该基因的最终回归系数,回归系数为0的基因则不纳入模型。最终共有15个基因纳入到预测模型中。
LASSO-Cox方法的R语言实现核心代码如下:
>library(“glmnet”)
>library(“survival”)
>data_mutation=read.csv(file=“cfDNA_genes.csv”,header=T)
>x<-as.matrix(data_mutation)
>y<-data.matrix(Surv(train_data$OS,train_data$OS.status))
>seeds=seq(from=1,to=1000,by=5)
>coef_list=list()
>for(i in seeds){
set.seed(i)
fitcv<-cv.glmnet(x,y,family="cox",alpha=1,nfolds=5)
coef_list[[i]]=as.matrix(coef(fitcv,s="lambda.min"))
}
4.bGMS计算及最佳分割点确定
利用得到的15个特征基因回归系数与对应的基因突变数,按照以下公式计算训练集每一位病人的bGMS:
Figure BDA0003438966110000141
公式中,i表示经过LASSO-Cox筛选的特征基因,n表示经过LASSO-Cox筛选的特征基因总数;muti表示特征基因是否突变状态,当muti=0表示未发生突变,当muti=1表示发生突变;coefi表示特征基因对应的回归系数。最佳分割点的确定是利用最大选择对数秩检验,寻找最佳分割点(cutpoint),使bGMS高低两组患者在生存时间和生存状态的差异最显著。具体实现的R语言核心代码如下:
>library(“survminer”)
>res_cut<-sur_cutpoint(data,time=“OS”,time=“OS.status”,varia bles=“bGMSscore”)
>cutpoint=res_cut$cutpoint[[1]]
计算返回的分割点为0,因此,将训练集中患者bGMS大于0,作为高风险组,小于或等于0的为低风险组。按照上述的bGMS计算方式和分组对验证集进行同样的处理。
4.模型的评估
利用“survival”和“survivalROC”R语言包分别绘制训练集和验证集不同时间点的受试者工作特征(ROC)曲线并计算曲线下面积。时间依赖的ROC曲线可检测模型对特定时间生存状态的诊断能力。一般来说,AUC越大,ROC曲线越靠近左上角,模型的诊断能力越好。在本实施例中,我们比较了bGMS和其他两个基于cfDNA突变的指标bTMB和LAF-bTMB对患者免疫治疗预后预测的效果。
5.生存分析、单因素和多因素Cox回归分析
使用Kaplan-Meier方法对训练集和验证集中低风险和高风险组的生存结局进行分析,绘制生存曲线。单因素和多因素Cox回归分析依赖于“survival”R语言包的coxph()函数。对临床基线数据中多个指标或特征,例如年龄、性别、吸烟与否,TMB等,根据不同的标准转换成二分类变量。利用单因素Cox回归分别分析这些变量和bGMS分组,对总生存期的影响,并进行变量筛选。基于单因素回归分析筛选结果,对具有统计学差异的变量进行多因素Cox回归分析,判断bGMS是否能够作为总生存期长短的独立预测因子。
6.统计学分析
生存分析使用Kaplan-Meier方法进行估计,采用对数秩检验比较两组生存曲线是否具有显著性,计算p值,p值小于0.05表示具有统计学差异。风险比(Hazard Ratio,HR)用于估计某一因素或变量导致结局事件风险变化的倍数,通常HR值大于1是危险因素,小于1是有益因素,等于1说明该因素对生存状态和生存时间不起作用。所有统计学分析均使用RV.4.0.3软件。
实施例1基于cfDNA基因突变谱和总生存期进行LASSO-Cox模型训练及bGMS计算
以训练集的每一位接受免疫治疗患者的基因突变谱(数据形式为一个每行为一个基因,每一列为一个样本,数值1表示该个体该基因发生了突变,0表示该个体该基因未发生突变)和OS分别作为自变量和因变量,用LASSO方法选择重要的特征基因并计算对应的回归系数,并用Cox回归构建免疫治疗生存预测模型。特别地,本发明进行了200次随机模型建立,并对每一次模型都进行5折交叉验证,最终将所有回归系数的均值用于突变基因数筛选。最终本模型共纳入15个突变基因入选,对应的回归系数如图1所示。
根据模型构建的bGMS计算公式,首先计算训练集和验证集每一位患者的bGMS,然后按照分割点将患者分为高风险和低风险组。在训练集和验证集中,对患者的bGMS进行由低到高的排序,探究高低风险患者的分布情况,以及bGMS与死亡患者人数的关系。图2示的是每一位患者的bGMS曲线。横坐标代表的是bGMS由小到大排列的患者,纵坐标表示bGMS,虚线表示截断值,即cutoff等于0时对应的病人。在训练集中,高风险组患者有180位,低风险组有139位。而在验证集中,高风险组患者有63位,低风险患者有42位。图3展示的是每一位患者的bGMS与总生存期的关系。横坐标是按照bGMS从小到大排序的患者,纵坐标是总生存期。图例中0代表存活患者,1代表死亡患者。虚线代表在bGMS cutoff值。可见无论是在训练集还是验证集,在虚线右侧的高bGMS区域,代表死亡病人的点密度逐渐增加,表明随着bGMS的逐渐增大,死亡的病人人数也在增多。
实施例2在训练集和验证集中分析患者bGMS高低与免疫治疗疗效的关系
使用Kaplan-Meier方法分别对训练集和验证集中高低bGMS两组进行生存曲线绘制,并使用log-rank检验分析两组之间差异显著性(图4和图5)。生存曲线的横坐标为患者生存时间(以月为单位),纵坐标代表总生存率或无进展生存率。在训练集中,与高bGMS组患者相比,低bGMS组患者在接受免疫治疗后的中位OS和中位PFS均显著延长,p值均小于0.05。在验证集中也得到相似的结果。说明基于模型建立的bGMS值分组可显著区分接受免疫治疗的NSCLC患者生存状况,用于患者预后预测。
实施例3单因素和多因素Cox回归分析
为判断bGMS是否为NSCLC免疫治疗疗效预测的独立预测因子,将bGMS与临床基线数据中其他预测因子,在训练集和验证集分别进行OS和PFS的单因素和多因素Cox回归分析。单因素Cox回归共分析包括bGMS在内的13个因子,包括NSCLC患者的性别、年龄、血液TMB、LAF-bTMB、是否是鳞状NSCLC、体力状况为1或0、吸烟史、亚洲人种还是白种人、转移灶数目是否大于或等于3、中位肿瘤直径总和是否大于或等于72.5、先前接受一次或两次治疗以及PD-L1表达量的高低(图6)。在单因素分析中,无论是OS还是PFS,bGMS在训练集和验证集的Log-rank检验p值均小于0.05,具有统计学差异,且HR>1。随后,我们进行多因素Cox回归分析,结果展示在森林图中(图7,图8)。森林图中bGMS分组1为低风险,2为高风险;是否是鳞状NSCLC的1为非鳞状,2为鳞状;体力指数1代表活动能力完全正常,2代表能自由活动但不能从事较重体力活动;转移位点数小于3为1,大于或等于3为2。多因素Cox回归结果表明,无论是训练集还是验证集,仅有bGMS在OS和PFS具有统计学意义。以上结果说明低bGMS患者接受免疫治疗的疗效优于高bGMS患者,bGMS可作为NSCLC患者免疫治疗疗效预后的独立预后因子。
实施例4bGMS与bTMB、LAF-bTMB预测效果比较
在本实施例中,我们比较了bGMS和其他两个基于cfDNA突变的指标bTMB和LAF-bTMB对患者免疫治疗预后预测的效果。评价方法为绘制时间依赖的ROC曲线,计算曲线下面积(AUC),检测模型对特定时间生存状态的判断能力。AUC越大,ROC曲线越靠近左上角,表明模型的预测效果越好。结果展示在图9中。结果表明,bGMS对不同时间点(6个月,12个月,24个月)的预测效果均优于bTMB和LAF-bTMB。
实施例5bGMS用于筛选相比化疗更能从免疫治疗中获益的患者
本实施例中,我们比较了低bGMS和高bGMS两组患者,接受化疗(Docetaxel)和免疫治疗(MPDL3280A)两种治疗方式的预后情况。在POPLAR队列中,低bGMS组患者接受免疫治疗的OS显著优于化疗(median OS:18.6vs 12.4个月,P<0.05),两种治疗方式的风险比(HR)为0.53,95%CI为0.31~0.90。而在高bGMS人群,接受两种治疗方式的患者OS没有明显差别(图10)。在OAK队列中,同样也观察到与化疗相比,低风险组患者更适合于免疫治疗,并获得更长的总生存期(median OS:19.9vs 8.38个月,P<0.01),两种治疗方式的风险比(HR)为0.44,95%CI为0.33~0.60(图11)。
本实施例的结果可以看出,与化疗相比,低bGMS患者更能从免疫治疗中获益。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型的构建方法,其特征在于,所述方法包括以下步骤:
步骤一:获取非小细胞肺癌患者免疫治疗队列数据,将数据按样本分为训练集和验证集,所述数据包含cfDNA基因突变和反应治疗疗效的疗效评价指标;
步骤二:利用训练集数据进行模型构建:
1)以cfDNA突变作为模型输入,以反应治疗疗效的疗效评价指标(优选OS和/或PFS)作为被预测指标,构建预测模型;
2)构建整合多次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应系数;
3)基于基因突变及对应系数,计算血液中游离基因组突变评分bGMS(blood genomicmutation signature);
所述bGMS定义公式为
Figure FDA0003438966100000011
其中,i表示经过LASSO-Cox筛选的特征基因,n表示经过LASSO-Cox筛选的特征基因总数;muti表示特征基因是否突变状态,当muti=0表示未发生突变,当muti=1表示发生突变;coefi表示特征基因对应的回归系数;
4)确定分割点,将患者的风险等级分为高低两组;
优选的,所述方法还包括如下步骤:
步骤三:将所构建的模型在验证集中进行验证。
2.权利要求1所述的模型构建方法,其特征在于,所述1)中,
所述预测模型的构建使用LASSO-Cox构建预测模型;
优选的,所述构建过程中,为获得更具鲁棒性的模型,进行多次随机的模型构建,每次模型构建中均进行5折交叉验证,获得突变基因的系数。
3.权利要求1-2任一所述的模型构建方法,其特征在于,所述2)中,
所述对应系数为多次训练中所得到的系数的平均值,系数等于0的基因不纳入模型。
4.权利要求1-3任一所述的模型构建方法,其特征在于,所述3)中,
所述bGMS具体=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
5.权利要求1-4任一所述的模型构建方法,其特征在于,所述4)中,
确定分割点,将风险等级分为高低两组:若患者bGMS大于分割点,则判断为治疗有效,若患者bGMS小于分割点,则判断治疗无效;优选的,所述分割点=0。
6.一种基于cfDNA突变进行非小细胞肺癌免疫治疗疗效预测的模型,其特征在于,所述模型包括如下模块:
模块一:用于获取非小细胞肺癌患者免疫治疗队列数据,将数据按样本分为训练集和验证集;
模块二:利用训练集数据进行模型构建:
1)以cfDNA突变作为模型输入,以反应治疗疗效的疗效评价指标(优选为OS和/或PFS)作为被预测指标,构建预测模型;
2)构建整合多次结果的综合模型,获得影响免疫治疗疗效的cfDNA基因突变及其对应系数;
3)基于基因突变及其对应系数,计算血液中游离基因组突变评分bGMS;
所述bGMS定义公式为
Figure FDA0003438966100000021
其中,i表示经过LASSO-Cox筛选的特征基因,n表示经过LASSO-Cox筛选的特征基因总数;muti表示特征基因是否突变状态,当muti=0表示未发生突变,当muti=1表示发生突变;coefi表示特征基因对应的回归系数;
4)确定分割点,将患者的风险等级分为高低两组;
模块三:基于构建的模型预测非小细胞肺癌的免疫治疗疗效。
7.用于检测bGMS的试剂,或用于检测基因TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6和ATR突变的试剂的如下任一应用:
1)在预测非小细胞肺癌的免疫治疗疗效中的应用;
2)在制备预测非小细胞肺癌的免疫治疗疗效的试剂中的应用。
8.权利要求7所述的应用,其特征在于,所述bGMS与基因TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6和ATR突变满足:bGMS=(0.018290887*TP53)+(0.050893165*KEAP1)+(0.024641*APC)+(0.004875089*FLT4)+(0.003746885*FLT1)+(0.005235822*BRAF)+(0.002520376*RB1)+(0.0020396*PTCH1)+(-0.001324723*ATM)+(-0.000794*MET)+(-0.001261613*GRM3)+(0.001618796*PIK3C3)+(0.000277626*EPHA7)+(-0.000387385*GABRA6)+(-0.0001808*ATR)。
9.一种用于预测非小细胞肺癌免疫治疗疗效的试剂盒,其特征在于,
包含用于检测bGMS的试剂;
或特异性检测TP53、KEAP1、APC、FLT4、FLT1、BRAF、RB1、PTCH1、ATM、MET、GRM3、PIK3C3、EPHA7、GABRA6、ATR基因突变的试剂;
优选的,所述试剂盒中还包含选自核酸提取试剂、基因的特异性引物或探针、PCR试剂和核酸测序试剂中的一种或多种。
10.一种装置,其特征在于,包括:至少一个存储器,用于存储程序;至少一个处理器,用于加载所述程序以执行如权利要求1-5任一项所述方法。
CN202111630526.4A 2021-12-28 2021-12-28 基于bGMS预测非小细胞肺癌免疫治疗疗效 Active CN114242157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111630526.4A CN114242157B (zh) 2021-12-28 2021-12-28 基于bGMS预测非小细胞肺癌免疫治疗疗效

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111630526.4A CN114242157B (zh) 2021-12-28 2021-12-28 基于bGMS预测非小细胞肺癌免疫治疗疗效

Publications (2)

Publication Number Publication Date
CN114242157A true CN114242157A (zh) 2022-03-25
CN114242157B CN114242157B (zh) 2023-03-21

Family

ID=80743876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111630526.4A Active CN114242157B (zh) 2021-12-28 2021-12-28 基于bGMS预测非小细胞肺癌免疫治疗疗效

Country Status (1)

Country Link
CN (1) CN114242157B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999653A (zh) * 2022-06-17 2022-09-02 中国医学科学院肿瘤医院 一种非小细胞肺癌免疫治疗疗效的预测模型的训练方法以及预测装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096739A (zh) * 2021-04-09 2021-07-09 东南大学 一种卵巢癌的免疫预后诊断标志物组合的分析方法
WO2021164713A1 (zh) * 2020-02-21 2021-08-26 杭州凯保罗生物科技有限公司 与肿瘤免疫治疗效果相关的生物标志物及其应用
CN113462773A (zh) * 2021-05-19 2021-10-01 山东大学 一种预测胃癌患者生存风险、免疫治疗响应和细胞焦亡诱导剂适用性的标志物及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021164713A1 (zh) * 2020-02-21 2021-08-26 杭州凯保罗生物科技有限公司 与肿瘤免疫治疗效果相关的生物标志物及其应用
CN113096739A (zh) * 2021-04-09 2021-07-09 东南大学 一种卵巢癌的免疫预后诊断标志物组合的分析方法
CN113462773A (zh) * 2021-05-19 2021-10-01 山东大学 一种预测胃癌患者生存风险、免疫治疗响应和细胞焦亡诱导剂适用性的标志物及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIAMAO LIN: "A 5-Genomic Mutation Signature Can Predict the Survival for Patients With NSCLC Receiving Atezolizumab", 《FRONT IMMUNOL》 *
邴志桐: "多维度分析扶正抗癌方联合吉非替尼抑制耐药非小细胞肺癌增殖机制研究", 《中国博士学位论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114999653A (zh) * 2022-06-17 2022-09-02 中国医学科学院肿瘤医院 一种非小细胞肺癌免疫治疗疗效的预测模型的训练方法以及预测装置

Also Published As

Publication number Publication date
CN114242157B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
Nabet et al. Noninvasive early identification of therapeutic benefit from immune checkpoint inhibition
JP6721665B2 (ja) 目的遺伝子発現の線形結合を用いた細胞信号伝達経路活性の評価
JP6902083B2 (ja) マルチマーカーリスク層別化
US20240112811A1 (en) Methods and machine learning systems for predicting the likelihood or risk of having cancer
EP2510116A2 (en) Biomarker assay for diagnosis and classification of cardiovascular disease
US9940383B2 (en) Method, an arrangement and a computer program product for analysing a biological or medical sample
KR102044094B1 (ko) 딥 러닝 기반 유전체 발현량 해석을 통한 암 또는 정상 판별 방법 및 그 장치
CN113853444A (zh) 癌症患者生存率的预测方法
US10172581B2 (en) Methods of assessing tumor growth
US20220170909A1 (en) Radiomic signature for predicting lung cancer immunotherapy response
CN114242157B (zh) 基于bGMS预测非小细胞肺癌免疫治疗疗效
US20120117018A1 (en) Method for the systematic evaluation of the prognostic properties of gene pairs of medical conditions, and certain gene pairs identified
Peng et al. A somatic mutation signature predicts the best overall response to anti-programmed cell death protein-1 treatment in epidermal growth factor receptor/anaplastic lymphoma kinase-negative non-squamous non-small cell lung cancer
WO2023017525A1 (en) Predicting patient response
Chen et al. Peripheral blood transcriptome sequencing reveals rejection-relevant genes in long-term heart transplantation
Ranasinghe et al. Relationship between serum markers and volume of liver metastases in castration-resistant prostate cancer
US10083274B2 (en) Non-hypergeometric overlap probability
US20180181705A1 (en) Method, an arrangement and a computer program product for analysing a biological or medical sample
JP2020523991A (ja) Praegnant転移性乳癌コホートにおける不良アウトカムの予後指標因子
Johansen et al. Predictive genetic testing for coronary artery disease
Veytsman et al. Practical detection of biological age: why it is not a trivial task
JP7386897B2 (ja) 高悪性度漿液性卵巣癌における予後予測の方法
CN117476097B (zh) 一种基于三级淋巴结构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用
Liao et al. Identification of GBP2 and TMSB10 as Immune-associated Genes in Hypertension Nephropathy by Integrated Bioinformatics Analysis and Machine Learning
EP3874274B1 (en) Methods for predicting a response to bevacizumab or platinum-based chemotherapy or both in patients with ovarian cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant