CN117074679B - 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用 - Google Patents

生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用 Download PDF

Info

Publication number
CN117074679B
CN117074679B CN202311224930.0A CN202311224930A CN117074679B CN 117074679 B CN117074679 B CN 117074679B CN 202311224930 A CN202311224930 A CN 202311224930A CN 117074679 B CN117074679 B CN 117074679B
Authority
CN
China
Prior art keywords
chemotherapy
esophageal cancer
immunotherapy
data
protein expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311224930.0A
Other languages
English (en)
Other versions
CN117074679A (zh
Inventor
李明珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aipu Tikang Biotechnology Co ltd
Original Assignee
Shanghai Aipu Tikang Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aipu Tikang Biotechnology Co ltd filed Critical Shanghai Aipu Tikang Biotechnology Co ltd
Priority to CN202311224930.0A priority Critical patent/CN117074679B/zh
Publication of CN117074679A publication Critical patent/CN117074679A/zh
Application granted granted Critical
Publication of CN117074679B publication Critical patent/CN117074679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Urology & Nephrology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • Hematology (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)

Abstract

本发明公开了一种生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用。所述生物标志物组合可以预测食管癌患者接受免疫治疗联合化疗治疗的食管癌效果,具有高灵敏度和高特异性的优点,为预测食管癌患者接受免疫治疗联合化疗治疗治疗提供有利的技术支持。

Description

生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效 果中的应用
技术领域
本发明属于生物信息学领域,具体涉及一种生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用。
背景技术
食管癌(Esophageal cancer,EC)是常见的恶性消化道肿瘤之一,也是世界上第六大致死率较高的癌症。食管癌根据病理组织分型主要分为两类:食管鳞状细胞癌和食管腺癌。90%的食管癌患者是食管鳞状细胞癌。到目前为止,仍缺乏针对食管癌的有效靶向治疗方式。晚期食管癌病人的首选治疗方法是外科手术。对于一些没有手术治疗机会的患者,只能靠药物提高生活质量甚至维持生存。近年来,随着免疫抑制剂的研究,免疫治疗在多种肿瘤中取得很好的治疗效果。其中卡瑞利珠单抗(Camrelizumab;艾瑞卡),一种PD1抑制剂,它是我国原研且唯一进入医保的PD1抑制剂。艾瑞卡联合紫杉醇和卡铂(TC)方案也是不可切除局部晚期/复发或转移性食管鳞癌患者的一线治疗方案。但是药物耐受问题仍未得到解决,食管癌治疗的总体预后仍处于较差水平。在临床上,肿瘤的治疗效果存在较大的个体差异,但是药物个性化的选择依据过少,临床急需指导个体化精准医疗的标志物,从而缓解药物耐受问题。
因此,为了实现食管癌的个体化治疗,有必要根据分子遗传学和病理学特征来识别亚类,发现并应用相应的靶基因。此外,在食管癌研究中,已经报道了可以根据食管癌的亚型对食管癌的预后进行分类的结果。目前已涌现的多项研究性专利均是基于基因组和转录组的基因表达水平实现对食管癌的早期筛查,如食管癌预后标志物及其应用(专利号CN106701992A),食管癌的诊治标志物(专利号CN105886627B)。然而在临床中,针对食管癌患者的一线治疗方案艾瑞卡抗PD1免疫治疗或联合其他化疗方案(例如联合紫杉醇,或卡铂/铂类)仍未实现有效的治疗方案抉择。
蛋白质组学在揭示肿瘤发生的复杂分子事件,如肿瘤发生、侵袭、转移和对治疗耐受上起了重大作用。蛋白质组学肿瘤诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多地运用于肿瘤检测。而且,这些肿瘤标志物的研究往往是基于一定量的实验数据,所涉及的癌症种类和样本量都相对有限。因此,通过收集蛋白质组数据,利用大数据分析方法,建立预测治疗有效的模型,有助于实现个性化化疗,对患者推荐合适的治疗方案具有重要的临床意义。
发明内容
针对现有技术中缺少预测艾瑞卡联合化疗(紫杉醇+铂类)治疗食管癌效果的技术方案的缺陷,本发明提供了一种生物标志物组合及其在预测免疫治疗联合化疗治疗(艾瑞卡联合化疗治疗)食管癌效果中的应用。所述生物标志物组合至少包括SPTB、FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7,此时可达到验证集中预测准确率、诊断灵敏度和特异性均为90%、92%和88%,所述生物标志物组合至多可扩展至包括如本发明所述的298种蛋白质分子生物标志物,其预测准确率、诊断灵敏度和特异性均较高。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物组合,所述生物标志物组合包括以下一种或多种蛋白质:SPTB、FGG、FGB、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7。
优选地,所述生物标志物组合还包括ADD2。更优选地,所述生物标志物组合进一步还包括ARF1。
进一步更优选地,所述生物标志物组合还包括以下一个或多个生物标志物:ARF1、KRTAP3-3、BOLA1、TMEM50B、TSEN54、FNTB、NWD1、MBIP、MAPKBP1、MMACHC、PIGN、RAPGEF2、FANCD2、INSR、ILDR1、CUTC、BAG4、PTGR2、HPR、CACTIN、MGAT5、OCA2、PGK2、BSDC1、NLRP10、TACO1、KATNA1、NHSL2、MCC、LAMC3、ACTG2、AKR1C2、REEP3、FETUB、CEP290、ZC3H7B、KRT85、FHL2、ADD2、FADS2、FGFR1OP、HBG1、GP5、FGG、CHI3L1、GALNS、NEFM、EMC10、FGB、FGA、GP1BA、ANK1、SPTB、CCNK、F2、MAP4K4、SPTA1、SLC4A1、PLEK、CALML5、PSME1、NDUFS4、RAP1A、FAM129A、PPP1R9B、CLASP2、GIMAP4、LMF2、EML2、ELL、PRPF38A、DFFA、ASAH1、ERAP1、CYFIP2、PPP1R21、TMED10、CEPT1、LSP1、CIRBP、STAT1、GNG12、POLR1C、FYB、ANP32E、SUGT1、APOA2、HIST1H1D、CD97、MOV10、GBP2、GGT5、SCFD1、SUMF1、SUCLG1、FBP1、SLC25A22、SLC1A5、LTA4H、PAK1、HIST1H1C、EXOC7、SKP1、DNAJC7、EIF3M、NANS、FKBP11、ATP1B3、C1orf52、PTPRC、ELP3、RPS26、STX4、TMX2、SMC6、PIK3C2A、TMED1、LYN、NDUFB7、CD74、WDFY1、HLA-DPB1、ATP6V1G1、COASY、TMED5、SPCS2、TAP2、PPOX、EPB41L1、MUC1、SPTLC1、SLC7A1、HLA-DRA、CRAT、AP1M1、HLA-E、HLA-B、MTMR6、CTBP1、LYNX1、CD14、TBC1D10C、CDK9、SGPL1、ABCD1、PSME2、C5orf51、IKBKG、TBC1D4、COTL1、AMFR、TRIM22、FMNL1、RGS19、CSTA、HECTD1、CECR1、DPYD、ITGAX、NR3C1、WDR45B、NIPSNAP3A、LZTFL1、SLFN11、EPB41L3、LRCH1、SHKBP1、NGLY1、ACSL4、WIPF2、LGALS9、ARRB1、TAPBP、CDC16、KPNA7、C16orf80、CPSF3L、FUCA1、CASP1、CUL3、ZBP1、SPCS3、OSTC、SORT1、NFYC、USMG5、EMILIN2、CROCC、CDKN2AIPNL、RNF214、LSR、ITM2B、UBA7、ACE、C8orf33、ATG9A、AKAP8L、HTT、CCDC9、ASB15、MPHOSPH8、CROT、ITGB7、DNLZ、SEMA4B、VPS13C、PANK4、BPIFB1、ALPL、MAP3K4、BACH1、ATP13A1、ARMC5、SLC35B2、INTS2、LSM5、CASP10、NCF4、DCAF11、FLG2、CD8A、CC2D1B、COX15、SEL1L、KLK13、GIMAP8、NHEJ1、CLCC1、EXOSC9、VAV1、SORL1、MAN1A1、PRKAG1、RASAL3、DNAJC17、ANGPTL2、CHCHD4、GBP5、FCGR1A、SYNJ2、SASH3、HMCN1、TMEM161A、APOL3、ZBTB7A、MOB2、TFAM、WAC、NUDT18、SCLY、LCN1、NCS1、MICU2、APOL2、CXorf38、STK17B、CD99L2、ACADS、FNBP1L、ATG16L1、NAV2、CRYBG3、NFATC2、C3orf17、LARS2、CLK2、C12orf44、SLC30A5、GPCPD1、PTPMT1、TRAPPC2L、PPP1R13B、DAPP1、CEP350、LILRB5、CHL1、RECQL5、FAM46C、SLC27A2、RENBP、C10orf137、PUS3、ARAP3、CEP128、ZEB2、VAMP5、ZBTB21、CEP44、MAD2L1BP、STAT4、MYO19、GAS7、C5orf22、LMBRD2、PDCL、THEMIS、ARGLU1和PADI3。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物组合在预测免疫治疗联合化疗治疗食管癌效果中的应用;其中,所述生物标志物组合为如本发明所述的生物标志物组合;所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测如本发明技术方案所述的生物标志物组合的试剂。
在本发明一较佳实施方案中,所述试剂用于检测所述生物标志物的表达水平;所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
在本发明一较佳实施方案中,所述生物分子试剂选自引物、探针和抗体。
在本发明一较佳实施方案中,所述试剂为用于转录组和/或蛋白质组测序的试剂。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测如本发明技术方案所述的生物标志物组合的试剂在制备预测免疫治疗联合化疗治疗食管癌效果的制剂中的应用;所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
为解决上述技术问题,本发明提供的一个技术方案为:一种试剂盒,所述试剂盒包含如本发明所述的试剂和/或如本发明所述的生物标志物组合。
为解决上述技术问题,本发明提供的一个技术方案为:一种预测免疫治疗联合化疗治疗食管癌效果的方法,所述方法包括检测待测的组织样本中的生物标志物的表达水平;所述生物标志物包括本发明所述的生物标志物组合中的一种或多种生物标志物;所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
在本发明一较佳实施方案中,所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述预测免疫治疗联合化疗治疗食管癌效果的方法为非诊断目的的。
在本发明一较佳实施方案中,所述组织样本为食管癌组织样本,所述食管癌组织样本的患者经过免疫治疗联合化疗治疗。
本发明中,所述“非诊断目的”是指出于科学研究、病理数据统计的目的,适用场景包括验证动物模型是否成功构建、体外药效实验、肿瘤的流行病学统计等。
为解决上述技术问题,本发明提供的一个技术方案为:一种免疫治疗联合化疗治疗食管癌效果预测模型的构建方法,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述免疫治疗联合化疗治疗食管癌效果预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源为食管癌治疗前患者的组织样本;所述蛋白质表达量数据包括本发明所述的生物标志物组合的蛋白质表达量数据。
所述患者包括对免疫治疗联合化疗治疗敏感的患者和对免疫治疗联合化疗治疗非敏感的患者。
在本发明一较佳实施方案中,所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DDA(data-dependent acquisition,数据依赖性)检测方式采集。
在本发明一较佳实施方案中,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库。
在本发明一较佳实施方案中,采用经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT(Fractionof total,定义为该蛋白质的iBAQ(intensity-based absolute-protein-quantification)除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一较佳实施方案中,所述蛋白质表达量数据输入广义线性回归模型前,先将所述蛋白质表达量数据分为发现队列和验证队列。优选地,所述发现队列和验证队列的比例为6:4-9:1,更优选为8:2。
在本发明一较佳实施方案中,输入广义线性回归模型的蛋白质满足:敏感患者的组织样本中表达量/非敏感患者的组织样本中表达量>1.5或者敏感患者的组织样本中表达量/非敏感患者的组织样本中表达量<0.67,且Wilcoxon rank-sum test检验的p值小于0.05。
在本发明一较佳实施方案中,所述广义线性回归模型的参数为:采用向后回归的方法筛选标志物,并利用R包Caret的train功能进行模型训练和predict函数进行预测。优选地,所述广义线性回归模型的R包包括:predict.model=train(formula,data=train_data,method="glm",family='binomial')(formula:模型公式,输入的分子组合;train_data:训练集);预测代码:predict(predict.model,test_data)(predict.model:训练集得到的预测模型,test_data:内部或者外部验证集)。
为解决上述技术问题,本发明提供的一个技术方案为:一种免疫治疗联合化疗治疗食管癌效果预测模型,所述免疫治疗联合化疗治疗食管癌效果预测模型由本发明所述的构建方法建构得到。
在本发明一较佳实施方案中,所述构建免疫治疗联合化疗治疗食管癌效果预测模型的方法中输入广义线性回归模型的蛋白质表达量数据包括本发明所述的生物标志物组合的蛋白质表达量数据。
为解决上述技术问题,本发明提供的一个技术方案为:一种样本是否适用免疫治疗联合化疗治疗食管癌的预测方法,所述预测方法包括将待测的样本的蛋白质表达量数据输入如本发明所述的免疫治疗联合化疗治疗食管癌效果预测模型,得到样本是否适用免疫治疗联合化疗治疗食管癌的结果;所述蛋白质表达量数据包括本发明所述的生物标志物组合的蛋白质表达量数据。优选地,所述预测方法为非诊断目的的。
所述非诊断目的的应用场景例如检测体外样本中是否为免疫治疗联合化疗治疗食管癌有效的样本。
在本发明一较佳实施方案中,所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DDA(data-dependent acquisition,数据依赖性)检测方式采集。
在本发明一较佳实施方案中,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库。
在本发明一较佳实施方案中,采用经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT(Fractionof total,定义为该蛋白质的iBAQ(intensity-based absolute-protein-quantification)除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于预测免疫治疗联合化疗治疗食管癌效果的系统,所述系统包括:
数据接收模块,用于接收或输入组织样本中的蛋白质表达量数据,所述蛋白质表达量数据包括本发明所述的生物标志物组合的蛋白质表达量数据。
判断并输出模块,用于在所述接收或输入完成后,通过如本发明所述的免疫治疗联合化疗治疗食管癌效果预测模型,输出对所述组织样本的个体是否适用免疫治疗联合化疗治疗食管癌的判断结果;所述是否适用免疫治疗联合化疗治疗食管癌的判断标准为:当所述蛋白质表达量数据满足敏感预测概率大于或等于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌具有治疗效果”;当所述蛋白质表达量数据满足敏感预测概率小于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌不具有治疗效果”。
在本发明一较佳实施方案中,所述组织样本为食管癌组织样本,所述食管癌组织样本的患者经过免疫治疗联合化疗治疗。优选地,所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。更优选地,所述铂类为卡铂。
在本发明一较佳实施方案中,所述系统还包括数据处理模块,用于采集组织样本中的蛋白质表达量数据。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DDA(data-dependent acquisition,数据依赖性)检测方式采集。
在本发明一较佳实施方案中,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库。
在本发明一较佳实施方案中,采用经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT(Fractionof total,定义为该蛋白质的iBAQ(intensity-based absolute-protein-quantification)除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机辅助的免疫治疗联合化疗治疗食管癌效果预测方法,所述免疫治疗联合化疗治疗食管癌效果预测方法包括以下步骤:
步骤1:接收或输入组织样本中的蛋白质表达量数据,所述蛋白质表达量数据包括本发明所述的生物标志物组合的蛋白质表达量数据;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如本发明所述的免疫治疗联合化疗治疗食管癌效果预测模型,输出对所述组织样本的个体是否适用免疫治疗联合化疗治疗食管癌的判断结果。所述是否适用免疫治疗联合化疗治疗食管癌的判断标准为:当所述蛋白质表达量数据满足敏感预测概率大于或等于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌具有治疗效果”;当所述蛋白质表达量数据满足敏感预测概率小于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌不具有治疗效果”。
所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
在本发明一较佳实施方案中,所述免疫治疗联合化疗治疗食管癌效果预测方法还包括步骤0:采集组织样本中的蛋白质表达量数据。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DDA(data-dependent acquisition,数据依赖性)检测方式采集。
在本发明一较佳实施方案中,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库。
在本发明一较佳实施方案中,采用经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT(Fractionof total,定义为该蛋白质的iBAQ(intensity-based absolute-protein-quantification)除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如本文所述的系统的功能,或实现如本文所述的预测方法的步骤。
为解决上述技术问题,本发明提供的一个技术方案为:一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如本文所述的系统的功能,或如本文所述的预测方法的步骤。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
本发明提供的生物标志物组合在食管癌患者免疫治疗联合化疗的敏感临床样本和不敏感临床样本之间的表达水平存在显著变化,且经过模型检验,所述生物标志物组合与食管癌患者对免疫治疗联合化疗的敏感和不敏感存在显著的相关性,因此本发明提供的生物标志物组合可以预测食管癌患者接受艾瑞卡联合化疗(紫杉醇+铂类,优选为紫杉醇+卡铂)治疗的食管癌效果,具有高灵敏度和高特异性的优点,为预测食管癌患者接受艾瑞卡联合化疗治疗提供有利的技术支持。
基于本发明的生物标志物组合研制相应的系统、计算机可读存储介质、电子设备和开发的预测方法,具有广泛的科研价值并为食管癌患者提供个性化预测,为患者推荐是否适合接受该艾瑞卡联合化疗治疗的方案。
附图说明
图1为单个蛋白鉴定数目和53例里的蛋白鉴定累计曲线。
图2为本发明所述第1组的生物标志物组合在训练集(左)和内部验证集(右)中的灵敏度和特异性结果(其中20%训练集为内部验证集)。
图3为本发明所述第2组的生物标志物组合在训练集(左)和内部验证集(右)中的灵敏度和特异性结果(其中20%样本为内部验证集)。
图4为第5组-第10组的预测的准确率、灵敏度和特异性结果(其中20%训练集为内部验证集)。
图5为预测免疫治疗联合化疗治疗食管癌效果的系统的结构示意图。
图6为电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例中所需的艾瑞卡免疫治疗和(紫杉醇+卡铂)化疗治疗方案,总共53例食管癌患者的治疗前的临床样本,包括治疗敏感组和非敏感组分别为24例和29例。本研究的设计和实施由医学伦理委员会通过伦理投票批准和监督。已获得所有患者的书面知情同意。
实施例1食管癌治疗前的临床样本的预处理
临床样本为福尔马林固定石蜡包埋组织。样品预处理:从石蜡块上取3-10μm厚的切片进行宏观解剖,二甲苯脱蜡,乙醇洗涤,风干处理,获得白片,同时苏木精-伊红对3μm厚的切片进行染色作为肿瘤镜下对切片中肿瘤细胞含量进行评估判断并划选肿瘤区域,通过苏木素(蓝色)和伊红(红色)的红蓝色染色显示组织和细胞的形态,肿瘤往往会表现出蓝染的肿瘤细胞体积增大,大小不等,核浆比增大,核分裂相增多,核仁可见的组织学特点。镜下化选肿瘤细胞大于80%的区域获得肿瘤样本。利用10μm厚的切片收集对应的肿瘤样本至离心管中,-80℃冻存备用。
实施例2临床样本的蛋白质及肽段提取
将FFPE(实施例1中制备的肿瘤样本)组织收集于EP管,加入等量的裂解缓冲液(2% DOC,10mM TCEP,40mM CAA,100mM Tris-HCL pH 8.0,1mM PMSF),99℃加热,冷却至室温;加入5μg胰蛋白酶,于37℃温育18-20小时进行酶解;酶解结束后加入10%甲酸终止酶解,并涡旋3分钟,37℃温育后离心收集上清并加入萃取液(甲酸+乙腈),震荡,60℃真空抽干;将抽干后的肽段用10mM碳酸氢铵(pH 10.0)溶解后,12000g离心3分钟,进行脱盐处理,脱盐前需要制备并活化柱子(2片3M C18膜),活化顺序为:一份100%乙腈2次,一份50%乙腈2次,一份0.1%甲酸平衡柱2次后,将样本上清装入柱2次,一份0.1%甲酸脱盐2次。最后,加入一份洗脱缓冲液(0.1%甲酸,50%乙腈)2次,收集洗脱液,取脱盐后的溶液进行抽干,获得含有用于质谱检测所需的肽段的肽段样品。
实施例3临床样本的质谱检测
用Q-Exactive HF-X混合四极轨道阱质谱仪(Thermo Fisher Scientific,Rockford,IL,USA)和高效液相色谱系统(EASY nLC 1200,Thermo Fisher)进行检测,并得到所述肽段样品对应的质谱数据。具体操作为:
抽干的所述肽段样品重新溶解在溶剂A(0.1%甲酸的水溶液)中,上样至trap柱(100μm×2cm;粒子大小,3μm;孔径大小,),后在分析柱上进行分离(150μm×12cm,粒子大小,1.9μm;孔径大小,/>),梯度为5-35%流动相B(80%乙腈和0.1%甲酸)洗脱,流速为600nL/min,合计洗脱75分钟。对QE-HFX进行MS分析,一次全扫描(300-1400m/z,分辨率=12000),离子阱中允许进入的最大离子数(automatic gain control target,AGC target)为3E+06离子,随后进行高能量碰撞诱导离解(隔离窗口为1.6m/z,碰撞能量为27%,AGCtarget为5E+04离子,最大注入时间为30ms,动态排除设置为18秒)。液相色谱串联质谱系统使用Xcalibur软件(Thermo Scientific)控制进行数据采集。
实施例4质谱数据的处理
所有数据均使用Firmiana(V1.0)进行处理。Firmiana是一个基于Galaxy系统的工作流,由用户登录界面、原数据、识别与量化、数据分析和知识挖掘等多个功能模块组成。质谱原始文件根据人类国家生物技术信息中心(NCBI)的Refseq蛋白质数据库(updated on04-07-2013,32,015entries)进行检索。选择胰蛋白酶作为蛋白水解酶,最大允许两个漏切位点,固定修饰为carbamidomethyl(C),动态修饰为protein acetyl(protein N-term),oxidation(M)。第一个搜索质量耐受性为20ppm,主要搜索肽耐受性为0.5da。肽谱匹配(PSMs)和蛋白质的错误发现率(FDR)均小于1%。将所鉴定的肽段定量结果记为所有参考谱库中色谱碎片离子峰面积的平均值。使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量。本发明计算了峰面积值作为相应蛋白质的一部分。总分数(FOT)用于表示样品中特定蛋白质的标准化丰度。FOT定义为蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ。选择具有至少一条专属肽段(unique peptide)且1%FDR的蛋白质。
实施例5筛选蛋白质标记物
分析蛋白质标记物的表达量,选取有效鉴定蛋白。
在53(24治疗敏感+29治疗非敏感)例样本每单例样本鉴定的蛋白质平均数目5459,总共鉴定到10977种蛋白质,单个蛋白鉴定数目和53例里的蛋白鉴定累计曲线如图1所示。本发明以每种蛋白质在特定样本中的表达量占该样本中所有蛋白质表达量的比例(fraction of total,FOT)作为其归一化的表达量。将FOT值乘以10e5,作为最终的输入值。
实施例6建立预测模型
首先,在53例样本中进行蛋白差异表达的分析。在免疫治疗联合化疗治疗食管癌敏感样本来源的患者的治疗前癌组织样本和免疫治疗联合化疗治疗食管癌非敏感样本来源的患者的治疗前癌组织样本之间通过对比选取表达存在显著差异的分子(FOT差异倍数大于1.5倍或者<0.67,且Wilcoxon rank-sum test检验p值小于0.05),共298种蛋白被选出作为候选标志物。
建立预测免疫治疗联合化疗治疗食管癌效果的模型:
基于广义线性逻辑回归分类器,在训练集中,将各候选标志物的FOT值输入如下所示的R包建立预测模型:R软件的基础函数step逐步回归的方法进行筛选模型的预测标志物;用Caret包中的train函数进行模型训练;用prdict函数在验证集中进行模型的验证;
最终在建立的DDA采集的蛋白质组数据中筛选得到免疫治疗联合化疗治疗食管癌敏感组织样本/食管癌非敏感组织样本的蛋白质分子生物标志物,如以下组别所示。以下各组均使用上述的训练集和验证集,具体见如下:
第1组
对食管癌患者临床样本中的8种蛋白质分子生物标志物(SPTB、FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7)的相对表达水平计算其预测准确度、灵敏度及特异性,其中包括42例训练集(其中治疗敏感25例,治疗非敏感17例),在训练集上(其中治疗敏感4例,治疗非敏感7例),准确率为88.10%,灵敏度和特异性分别为88.46%和87.5%,AUC为0.927(图2的左);剩余11例为内部验证集,内部验证集上准确率为90.91%,灵敏度和特异性分别为80%和100%,AUC为0.964(图2的右)。
第2组
对食管癌患者临床样本中的9种蛋白质分子生物标志物(ADD2、SPTB、FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7)的相对表达水平计算其预测准确度、灵敏度及特异性,其中包括42例训练集(其中治疗敏感25例,治疗非敏感17例),预测准确率为90%,灵敏度和特异性分别为92%和88%,AUC为0.927(图3的左);剩余11例为内部验证集(其中治疗敏感4例,治疗非敏感7例),预测准确率为91%,灵敏度和特异性分别为80%和100%,AUC为0.964(图3的右)。对于待治疗食管癌患者,根据蛋白质分子生物标志物的表达水平,得到该患者使用艾瑞卡联合TC化疗的不同反应的输出结果,从而向该患者推荐或不推荐该治疗方案(见表1)。
当评估模型的性能时,发现当艾瑞卡联合TC化疗方案治疗的敏感预测概率大于或等于0.5时,输出预测结果为“免疫治疗艾瑞卡联合TC化疗对食管癌具有治疗效果”;当所述蛋白质表达量数据满足敏感预测概率小于0.5时,输出预测结果为“免疫治疗艾瑞卡联合TC化疗对食管癌不具有治疗效果”。
要注意的是,预测模型不提供明确阈值,但为了方便后续分析,这里选择0.5作为预测的阈值。
表1第1组标志物的预测及输出结果(外部验证集)
第3组
在第2组生物标志物的基础上,增加蛋白质分子生物标志物ARF1,对该10种蛋白质分子生物标志物(ADD2、SPTB、FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214、NDUFB7和ARF1)组成蛋白质分子生物标志物组合的相对表达水平计算其预测准确度,灵敏度及特异性。在训练集中(其中治疗敏感25例,治疗非敏感17例),预测准确率为90.48%,诊断灵敏度92%,特异性88.24%,AUC为0.927;内部验证集中(其中治疗敏感4例,治疗非敏感7例),预测准确率为90.91%,诊断灵敏度80%,特异性100%AUC为0.964。对于待治疗食管癌患者,根据蛋白质分子生物标志物的表达水平,得到该患者使用艾瑞卡联合TC化疗的不同反应的输出结果,从而向该患者推荐或不推荐该治疗方案(见表2)。
表2第3组标志物的预测及输出结果(外部验证集)
第4组
在第3组的基础上,扩展为298种蛋白质分子生物标志物(ARF1、KRTAP3-3、BOLA1、TMEM50B、TSEN54、FNTB、NWD1、MBIP、MAPKBP1、MMACHC、PIGN、RAPGEF2、FANCD2、INSR、ILDR1、CUTC、BAG4、PTGR2、HPR、CACTIN、MGAT5、OCA2、PGK2、BSDC1、NLRP10、TACO1、KATNA1、NHSL2、MCC、LAMC3、ACTG2、AKR1C2、REEP3、FETUB、CEP290、ZC3H7B、KRT85、FHL2、ADD2、FADS2、FGFR1OP、HBG1、GP5、FGG、CHI3L1、GALNS、NEFM、EMC10、FGB、FGA、GP1BA、ANK1、SPTB、CCNK、F2、MAP4K4、SPTA1、SLC4A1、PLEK、CALML5、PSME1、NDUFS4、RAP1A、FAM129A、PPP1R9B、CLASP2、GIMAP4、LMF2、EML2、ELL、PRPF38A、DFFA、ASAH1、ERAP1、CYFIP2、PPP1R21、TMED10、CEPT1、LSP1、CIRBP、STAT1、GNG12、POLR1C、FYB、ANP32E、SUGT1、APOA2、HIST1H1D、CD97、MOV10、GBP2、GGT5、SCFD1、SUMF1、SUCLG1、FBP1、SLC25A22、SLC1A5、LTA4H、PAK1、HIST1H1C、EXOC7、SKP1、DNAJC7、EIF3M、NANS、FKBP11、ATP1B3、C1orf52、PTPRC、ELP3、RPS26、STX4、TMX2、SMC6、PIK3C2A、TMED1、LYN、NDUFB7、CD74、WDFY1、HLA-DPB1、ATP6V1G1、COASY、TMED5、SPCS2、TAP2、PPOX、EPB41L1、MUC1、SPTLC1、SLC7A1、HLA-DRA、CRAT、AP1M1、HLA-E、HLA-B、MTMR6、CTBP1、LYNX1、CD14、TBC1D10C、CDK9、SGPL1、ABCD1、PSME2、C5orf51、IKBKG、TBC1D4、COTL1、AMFR、TRIM22、FMNL1、RGS19、CSTA、HECTD1、CECR1、DPYD、ITGAX、NR3C1、WDR45B、NIPSNAP3A、LZTFL1、SLFN11、EPB41L3、LRCH1、SHKBP1、NGLY1、ACSL4、WIPF2、LGALS9、ARRB1、TAPBP、CDC16、KPNA7、C16orf80、CPSF3L、FUCA1、CASP1、CUL3、ZBP1、SPCS3、OSTC、SORT1、NFYC、USMG5、EMILIN2、CROCC、CDKN2AIPNL、RNF214、LSR、ITM2B、UBA7、ACE、C8orf33、ATG9A、AKAP8L、HTT、CCDC9、ASB15、MPHOSPH8、CROT、ITGB7、DNLZ、SEMA4B、VPS13C、PANK4、BPIFB1、ALPL、MAP3K4、BACH1、ATP13A1、ARMC5、SLC35B2、INTS2、LSM5、CASP10、NCF4、DCAF11、FLG2、CD8A、CC2D1B、COX15、SEL1L、KLK13、GIMAP8、NHEJ1、CLCC1、EXOSC9、VAV1、SORL1、MAN1A1、PRKAG1、RASAL3、DNAJC17、ANGPTL2、CHCHD4、GBP5、FCGR1A、SYNJ2、SASH3、HMCN1、TMEM161A、APOL3、ZBTB7A、MOB2、TFAM、WAC、NUDT18、SCLY、LCN1、NCS1、MICU2、APOL2、CXorf38、STK17B、CD99L2、ACADS、FNBP1L、ATG16L1、NAV2、CRYBG3、NFATC2、C3orf17、LARS2、CLK2、C12orf44、SLC30A5、GPCPD1、PTPMT1、TRAPPC2L、PPP1R13B、DAPP1、CEP350、LILRB5、CHL1、RECQL5、FAM46C、SLC27A2、RENBP、C10orf137、PUS3、ARAP3、CEP128、ZEB2、VAMP5、ZBTB21、CEP44、MAD2L1BP、STAT4、MYO19、GAS7、C5orf22、LMBRD2、PDCL、THEMIS、ARGLU1和PADI3),对这298种蛋白质分子生物标志物的相对表达水平计算其预测准确度,其中包括42例训练集(其中治疗敏感25例,治疗非敏感17例),预测准确率为100%,诊断灵敏度100.00%,特异性100.00%,AUC为1,剩余11例为内部验证集(其中治疗敏感4例,治疗非敏感7例),预测准确率为72.7%,诊断灵敏度60%,特异性83.33%,AUC为0.714。对于待治疗食管癌患者,根据蛋白质分子标志物的表达水平,得到该患者使用艾瑞卡联合TC化疗的不同反应的输出结果,从而向该患者推荐或不推荐该治疗方案(见表3)
表3第4组标志物的预测及输出结果(外部验证集)
由上述结果可知,将食管癌患者的临床样本中的8种蛋白质分子生物标志物(见第1组)联用,可用于预测食管患者接受艾瑞卡联合TC化疗后是否可以产生肿瘤消退的有效治疗效果。
在此基础上增加蛋白分子生物标志物(如第2组、第3组和第4组),均可很好地预测食管癌患者接受艾瑞卡联合TC化疗后是否可以产生肿瘤消退的有效治疗效果。
实施例5预测食管癌免疫治疗联合化疗治疗效果的系统
预测食管癌免疫治疗联合化疗治疗效果的系统61:数据接收模块52和判断并输出模块53,优选还包括数据处理模块51(见图6)。
所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。优选地,所述铂类为卡铂。
数据处理模块51用于收集患者食管癌组织样本中所述生物标志物组合的蛋白质表达量数据,并将其传输给数据处理模块。
数据接收模块52用于将接收或输入生物标志物组合的蛋白质表达量数据按如实施例4所述的数据分析方法进行分析,得到计算结果。其中,所述生物标志物组合的蛋白质表达量数据可通过数据收集模块51进行收集,亦可从其他来源获取所述生物标志物组合的蛋白质表达量数据。
判断并输出模块53用于判断所述的计算结果是否符合预设的判断条件,即敏感预测概率大于非敏感预测概率,以预测是否适用免疫治疗联合化疗治疗食管癌效果,并输出预测结果;其中,在所述判断并输出模块中,所述是否适用免疫治疗联合化疗治疗食管癌效果的判断标准为:当所述表达量数据满足敏感预测概率大于或等于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌具有治疗效果”;当所述表达量数据满足敏感预测概率小于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌不具有治疗效果”。
实施例6电子设备
本实施例提供了一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现本发明实施例4中预测食管癌免疫治疗联合化疗(优选为紫杉醇和铂类药物)治疗效果的方法。
图5示出了本实施例的硬件结构示意图,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例4的数据分析方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例7计算机可读存储介质
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例4中预测食管癌免疫治疗联合化疗(优选为紫杉醇和铂类药物)治疗效果的方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现本发明实施例4中预测食管癌免疫治疗联合化疗(优选为紫杉醇和铂类药物)治疗效果的方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
对比例1种类更少的蛋白质分子生物标志物组合的预测效果
在第1组的7种蛋白分子生物标志物的基础上减少蛋白质分子生物标志物种类形成种类更少的蛋白质分子生物标志物组合,以与实施例1-4相同的数据库、分析方法、训练集和验证集,计算各组的预测准确度。
第5组
在缺失ADD2和SPTB蛋白的情况下,标志物组合为FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7。在训练集上,准确率为83.33%,灵敏度和特异性分别为87.50%和77.78%,AUC为0.913;测试集上准确率为90.91%,灵敏度和特异性分别为80%和100%,AUC为0.929。
第6组
在缺失ADD2、SPTB和FGA蛋白的情况下,标志物组合为FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7。在训练集上,准确率为85.71%,灵敏度和特异性分别为88%和82.35%,AUC为0.927;测试集上准确率为72.73%,灵敏度和特异性分别为57.14%和100%,AUC为0.927。
第7组
在缺失ADD2、SPTB、FGA和FGG蛋白的情况下,标志物组合为ZC3H7B、LSR、WIPF2、RNF214和NDUFB7。在训练集上,准确率为85.71%,灵敏度和特异性分别为88%和82.35%,AUC为0.918;测试集上准确率为72.73%,灵敏度和特异性分别为57.14%和100%,AUC为0.929。
第8组
在缺失ADD2、SPTB、FGA、FGG和ZC3H7B蛋白的情况下,标志物组合为LSR、WIPF2、RNF214和NDUFB7。在训练集上,准确率为73.81%,灵敏度和特异性分别为75%和71.43%,AUC为0.922;测试集上准确率为72.73%,灵敏度和特异性分别为57.14%和100%,AUC为0.893。
第9组
在缺失ADD2、SPTB、FGA、FGG、ZC3H7B、LSR蛋白的情况下,标志物组合为WIPF2、RNF214和NDUFB7。在训练集上,准确率为71.43%,灵敏度和特异性分别为72.41%和69.23%,AUC为0.795;测试集上准确率为63.64%,灵敏度和特异性分别为50%和100%,AUC为0.750。
第10组
在缺失ADD2、SPTB、FGA、FGG、ZC3H7B、LSR和WIPF2蛋白的情况下,标志物组合为RNF214和NDUFB7。在训练集上,准确率为66.67%,灵敏度和特异性分别为66.67%和66.67%,AUC为0.732;测试集上准确率为81.82%,灵敏度和特异性分别为66.67%和100%,AUC为0.893。
如图4所示,此结果表明,随着最少标志物组合蛋白质数目的逐次缺失,标志物组合预测的准确率下降,并且灵敏度和特异性也降低;因此,标志物组合ADD2、SPTB、FGA、FGG、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7中的蛋白质是保证预测准确率,灵敏度和特异性的必需蛋白质标志物。
表4第1组~第10组标志物结果汇总
最后,上述具体实施方法仅用以说明本发明的技术方案,而非对其限制。

Claims (11)

1.一种检测生物标志物组合的试剂在制备预测免疫治疗联合化疗治疗食管癌效果的试剂盒中的应用;其特征在于,所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗,所述生物标志物组合为:
(1)SPTB、FGG、FGB、ZC3H7B、LSR、WIPF2、RNF214和NDUFB7;
(2)SPTB、FGG、FGB、ZC3H7B、LSR、WIPF2、RNF214、NDUFB7和ADD2;
(3)SPTB、FGG、FGB、ZC3H7B、LSR、WIPF2、RNF214、NDUFB7、ADD2和ARF1;或,
(4)ARF1、KRTAP3-3、BOLA1、TMEM50B、TSEN54、FNTB、NWD1、MBIP、MAPKBP1、MMACHC、PIGN、RAPGEF2、FANCD2、INSR、ILDR1、CUTC、BAG4、PTGR2、HPR、CACTIN、MGAT5、OCA2、PGK2、BSDC1、NLRP10、TACO1、KATNA1、NHSL2、MCC、LAMC3、ACTG2、AKR1C2、REEP3、FETUB、CEP290、ZC3H7B、KRT85、FHL2、ADD2、FADS2、FGFR1OP、HBG1、GP5、FGG、CHI3L1、GALNS、NEFM、EMC10、FGB、FGA、GP1BA、ANK1、SPTB、CCNK、F2、MAP4K4、SPTA1、SLC4A1、PLEK、CALML5、PSME1、NDUFS4、RAP1A、FAM129A、PPP1R9B、CLASP2、GIMAP4、LMF2、EML2、ELL、PRPF38A、DFFA、ASAH1、ERAP1、CYFIP2、PPP1R21、TMED10、CEPT1、LSP1、CIRBP、STAT1、GNG12、POLR1C、FYB、ANP32E、SUGT1、APOA2、HIST1H1D、CD97、MOV10、GBP2、GGT5、SCFD1、SUMF1、SUCLG1、FBP1、SLC25A22、SLC1A5、LTA4H、PAK1、HIST1H1C、EXOC7、SKP1、DNAJC7、EIF3M、NANS、FKBP11、ATP1B3、C1orf52、PTPRC、ELP3、RPS26、STX4、TMX2、SMC6、PIK3C2A、TMED1、LYN、NDUFB7、CD74、WDFY1、HLA-DPB1、ATP6V1G1、COASY、TMED5、SPCS2、TAP2、PPOX、EPB41L1、MUC1、SPTLC1、SLC7A1、HLA-DRA、CRAT、AP1M1、HLA-E、HLA-B、MTMR6、CTBP1、LYNX1、CD14、TBC1D10C、CDK9、SGPL1、ABCD1、PSME2、C5orf51、IKBKG、TBC1D4、COTL1、AMFR、TRIM22、FMNL1、RGS19、CSTA、HECTD1、CECR1、DPYD、ITGAX、NR3C1、WDR45B、NIPSNAP3A、LZTFL1、SLFN11、EPB41L3、LRCH1、SHKBP1、NGLY1、ACSL4、WIPF2、LGALS9、ARRB1、TAPBP、CDC16、KPNA7、C16orf80、CPSF3L、FUCA1、CASP1、CUL3、ZBP1、SPCS3、OSTC、SORT1、NFYC、USMG5、EMILIN2、CROCC、CDKN2AIPNL、RNF214、LSR、ITM2B、UBA7、ACE、C8orf33、ATG9A、AKAP8L、HTT、CCDC9、ASB15、MPHOSPH8、CROT、ITGB7、DNLZ、SEMA4B、VPS13C、PANK4、BPIFB1、ALPL、MAP3K4、BACH1、ATP13A1、ARMC5、SLC35B2、INTS2、LSM5、CASP10、NCF4、DCAF11、FLG2、CD8A、CC2D1B、COX15、SEL1L、KLK13、GIMAP8、NHEJ1、CLCC1、EXOSC9、VAV1、SORL1、MAN1A1、PRKAG1、RASAL3、DNAJC17、ANGPTL2、CHCHD4、GBP5、FCGR1A、SYNJ2、SASH3、HMCN1、TMEM161A、APOL3、ZBTB7A、MOB2、TFAM、WAC、NUDT18、SCLY、LCN1、NCS1、MICU2、APOL2、CXorf38、STK17B、CD99L2、ACADS、FNBP1L、ATG16L1、NAV2、CRYBG3、NFATC2、C3orf17、LARS2、CLK2、C12orf44、SLC30A5、GPCPD1、PTPMT1、TRAPPC2L、PPP1R13B、DAPP1、CEP350、LILRB5、CHL1、RECQL5、FAM46C、SLC27A2、RENBP、C10orf137、PUS3、ARAP3、CEP128、ZEB2、VAMP5、ZBTB21、CEP44、MAD2L1BP、STAT4、MYO19、GAS7、C5orf22、LMBRD2、PDCL、THEMIS、ARGLU1和PADI3。
2.如权利要求1所述的应用,其特征在于,所述铂类为卡铂,所述试剂用于检测所述标志物组合的表达水平,所述表达水平为蛋白表达水平。
3.如权利要求2所述的应用,其特征在于,所述试剂为用于蛋白质组测序的试剂。
4.一种免疫治疗联合化疗治疗食管癌效果预测模型的构建方法,其特征在于,所述方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述免疫治疗联合化疗治疗食管癌效果预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源为食管癌治疗前患者的组织样本;所述蛋白质表达量数据包括如权利要求1所述的生物标志物组合的蛋白质表达量数据;所述患者包括对免疫治疗联合化疗治疗敏感的患者和对免疫治疗联合化疗治疗非敏感的患者;
所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗;
所述蛋白质表达量数据通过LC-MS技术得到,使用DDA检测方式采集;和/或,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配;和/或,输入广义线性回归模型的蛋白质满足:敏感患者的组织样本中表达量/非敏感患者的组织样本中表达量>1.5或者敏感患者的组织样本中表达量/非敏感患者的组织样本中表达量<0.67,且Wilcoxon rank-sumtest检验的p值小于0.05;和/或,所述广义线性回归模型的参数为:采用向后回归的方法筛选标志物,并利用R包Caret的train功能进行模型训练和predict函数进行预测。
5.如权利要求4所述的构建方法,其特征在于,所述铂类为卡铂。
6.一种免疫治疗联合化疗治疗食管癌效果预测模型,其特征在于,所述免疫治疗联合化疗治疗食管癌效果预测模型由权利要求4或5所述的构建方法建构得到;
所述免疫治疗联合化疗治疗食管癌效果预测模型的构建方法中输入广义线性回归模型的蛋白质表达量数据包括如权利要求1所述的生物标志物组合的蛋白质表达量数据。
7.一种用于预测免疫治疗联合化疗治疗食管癌效果的系统,其特征在于,所述系统包括:
数据接收模块,用于接收或输入组织样本中的蛋白质表达量数据,所述蛋白质表达量数据包括如权利要求1所述的生物标志物组合的蛋白质表达量数据;
判断并输出模块,用于在所述接收或输入完成后,通过如权利要求6所述的免疫治疗联合化疗治疗食管癌效果预测模型,输出对所述组织样本的个体是否适用免疫治疗联合化疗治疗食管癌的判断结果;所述是否适用免疫治疗联合化疗治疗食管癌的判断标准为:当所述蛋白质表达量数据满足敏感预测概率大于或等于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌具有治疗效果”;当所述蛋白质表达量数据满足敏感预测概率小于0.5时,输出预测结果为“免疫治疗联合化疗治疗对食管癌不具有治疗效果”;所述组织样本为食管癌组织样本,所述食管癌组织样本的患者经过免疫治疗联合化疗治疗;所述免疫治疗联合化疗治疗为艾瑞卡联合紫杉醇+铂类的化疗。
8.如权利要求7所述的系统,其特征在于,所述铂类为卡铂。
9.如权利要求8所述的系统,其特征在于,所述系统还包括数据处理模块,用于采集组织样本中的蛋白质表达量数据。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如权利要求7-9任一项所述的系统的功能。
11.一种电子设备,其特征在于,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求7-9任一项所述的系统的功能。
CN202311224930.0A 2023-09-20 2023-09-20 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用 Active CN117074679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311224930.0A CN117074679B (zh) 2023-09-20 2023-09-20 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311224930.0A CN117074679B (zh) 2023-09-20 2023-09-20 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用

Publications (2)

Publication Number Publication Date
CN117074679A CN117074679A (zh) 2023-11-17
CN117074679B true CN117074679B (zh) 2024-06-11

Family

ID=88713615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311224930.0A Active CN117074679B (zh) 2023-09-20 2023-09-20 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用

Country Status (1)

Country Link
CN (1) CN117074679B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117587128B (zh) * 2023-11-20 2024-10-22 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测和/或诊断结直肠癌中的应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114622023A (zh) * 2021-09-09 2022-06-14 四川省肿瘤医院 一种预测肿瘤化疗联合免疫治疗疗效的标志物及其应用
CN115612738A (zh) * 2022-09-27 2023-01-17 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测胃癌治疗效果中的应用
CN115678995A (zh) * 2022-09-27 2023-02-03 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN116769900A (zh) * 2023-06-01 2023-09-19 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测asd疾病进程中的应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ562237A (en) * 2007-10-05 2011-02-25 Pacific Edge Biotechnology Ltd Proliferation signature and prognosis for gastrointestinal cancer
US20160041153A1 (en) * 2008-11-12 2016-02-11 Kirk Brown Biomarker compositions and markers
BR112013031591A2 (pt) * 2011-06-07 2016-12-13 Caris Life Sciences Luxembourg Holdings S A R L biomarcadores de circulação para câncer

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114622023A (zh) * 2021-09-09 2022-06-14 四川省肿瘤医院 一种预测肿瘤化疗联合免疫治疗疗效的标志物及其应用
CN115612738A (zh) * 2022-09-27 2023-01-17 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测胃癌治疗效果中的应用
CN115678995A (zh) * 2022-09-27 2023-02-03 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN116769900A (zh) * 2023-06-01 2023-09-19 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测asd疾病进程中的应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
双向电泳联合MALDI-TOF-MS技术在筛选食管癌铂类耐药患者中的应用研究;马俊等;现代生物医学进展;20151110(第31期);第6107-6111页 *

Also Published As

Publication number Publication date
CN117074679A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
US11041866B2 (en) Pancreatic cancer biomarkers and uses thereof
CA2809282C (en) Mesothelioma biomarkers and uses thereof
DK2340506T3 (en) Biomarkers of lung cancer and uses thereof
KR101921945B1 (ko) 폐암 바이오마커 및 그것의 용도
US20120101002A1 (en) Lung Cancer Biomarkers and Uses Thereof
US20120143805A1 (en) Cancer Biomarkers and Uses Thereof
WO2011031344A1 (en) Cancer biomarkers and uses thereof
WO2013190092A1 (en) Gene signatures for copd diagnosis
CN115612738A (zh) 生物标志物组合及其在预测胃癌治疗效果中的应用
CN116024338B (zh) 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN117074679B (zh) 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用
CN115678994A (zh) 一种生物标志物组合、含其的试剂及其应用
CN115678995A (zh) 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN115678993A (zh) 一种生物标志物组合、含其的试剂及其应用
Fertig et al. Application of genomic and proteomic technologies in biomarker discovery
Reinders et al. Platform independent protein-based cell-of-origin subtyping of diffuse large B-cell lymphoma in formalin-fixed paraffin-embedded tissue
US20220065872A1 (en) Lung Cancer Biomarkers and Uses Thereof
Zhang et al. Expression of p42. 3 in non-small cell lung cancer
CN117089621B (zh) 生物标志物组合及其在预测结直肠癌疗效中的应用
Becker et al. Proteomic Analysis of Spatial Heterogeneity Identifies HMGB2 as Putative Biomarker of Tumor Progression in Adult-Type Diffuse Astrocytomas
WO2019158705A1 (en) Patient classification and prognostic method
CN115954046A (zh) 一种胃癌个性化治疗决策方法、系统及含其的存储介质
EP2607494A1 (en) Biomarkers for lung cancer risk assessment
CN118534004A (zh) Tlr3在预估bcg化疗对nmibc患者有效性中的应用
WO2019122415A1 (en) A gene signature for prognosticating gleason 7 prostate cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant