CN114624449A - 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用 - Google Patents

预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用 Download PDF

Info

Publication number
CN114624449A
CN114624449A CN202210299567.8A CN202210299567A CN114624449A CN 114624449 A CN114624449 A CN 114624449A CN 202210299567 A CN202210299567 A CN 202210299567A CN 114624449 A CN114624449 A CN 114624449A
Authority
CN
China
Prior art keywords
combination
antibody
vaccination
protein
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210299567.8A
Other languages
English (en)
Other versions
CN114624449B (zh
Inventor
郭天南
施军平
王瑛睿
朱倩茹
胡一凡
邵丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affiliated Hospital Of Hangzhou Normal University (hangzhou Second People's Hospital)
West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine
Original Assignee
Affiliated Hospital Of Hangzhou Normal University (hangzhou Second People's Hospital)
West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affiliated Hospital Of Hangzhou Normal University (hangzhou Second People's Hospital), West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine filed Critical Affiliated Hospital Of Hangzhou Normal University (hangzhou Second People's Hospital)
Priority to CN202210299567.8A priority Critical patent/CN114624449B/zh
Publication of CN114624449A publication Critical patent/CN114624449A/zh
Application granted granted Critical
Publication of CN114624449B publication Critical patent/CN114624449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种预测COVID‑19疫苗接种后不同免疫应答人群的蛋白标志物及应用,通过对外周血淋巴细胞以及血清的蛋白标志物进行筛选,得到特定的蛋白标记物组合,设计抗体产生预测模型以及抗体维持预测模型,基于预测结果对接种疫苗前的受试者是否产生抗体以及抗体的维持情况进行预测,可以为加强针接种提供指导,并可能有利于缓解全球疫苗生产和接种的不均衡现象的问题,应对新冠长时间大流行。

Description

预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物及 应用
技术领域
本发明涉及生物医药领域,特别涉及一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物及应用。
背景技术
冠状病毒(COVID-19)的大流行引起了严重的全球公共卫生危机和社会混乱,这就促使人类紧急授权和使用多种新冠疫苗,临床试验已经表明现有的新冠疫苗有强大的免疫原性,并在多种人群中都有良好的耐受性。
然而,疫苗的中和滴度会随着时间延长而下降,且由于每个个体的免疫状态和身体素质存在差异,进而导致不同个体内中和抗体持续时间各有长短,这就导致了不同个体在接种相同的新冠疫苗后对新冠病毒的抵抗性是不同的。另外,新冠病毒本身也会变异而发生针对已有新冠疫苗的突破性感染,比如针对新冠疫苗的免疫逃逸变体(如Omicron3)。尽管针对特定变体的定制疫苗接种对于预防COVID-19十分重要,但迄今为止新冠疫苗的研发尚未追赶上新冠病毒变异的速度。目前针对以上问题采取的方式是无差别的接种疫苗加强针,但是这项举措给新冠疫苗的生产和供应带来了很大压力。
实际上并不是所有个体都需要进行接种疫苗加强针,也并不是所有的个体都适用相同的疫苗接种策略,也就是说,不同个体是否需要接种疫苗加强针以及何时接种的接种策略是存在差异的,但目前暂无技术研究可针对新冠抗体在人群中产生和维持的异质性提供合理化的接种策略。
目前大部分针对新冠病毒的研究围绕于对确诊新冠的新冠患者进行轻重型区分,并无关于预测疫苗接种后不同免疫应答人群的异质性的研究。如果可以通过相应蛋白在人们接种疫苗前预测哪些人群无法产生抗体,哪些人群产生后会在6个月后消失,就可以协助有关部门更有针对性的开展新冠疫苗加强针的接种,以及进行疫苗接种种类、间隔等接种策略的调整,这些举措可能有利于缓解全球疫苗生产和接种的不均衡现象的问题,并有利于应对新冠长时间大流行,但目前市面上在该方面的研究还属于技术空白。
发明内容
本发明的目的在于提供一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物及应用,可基于外周血淋巴细胞和/或血清的蛋白中的特定蛋白标志物,输入模型中预测COVID-19疫苗接种后不同免疫应答人群产生抗体以及抗体维持的情况。
本方案可通过受试者在疫苗接种前特定蛋白标志物的表达差异,预测COVID-19疫苗接种后不同免疫应答人群的异质性,即包括了第一针疫苗接种57天后的抗体产生情况,以及180天后抗体维持情况。对于抗体维持情况良好的受试者可以适当延迟疫苗加强针接种的间隔,对于抗体维持情况较差的受试者可以适当缩短疫苗加强针接种的间隔,对于不会产生抗体的受试者可以取消疫苗接种计划或者更换其他种类的疫苗,进而协助相关部门对受试者开展针对性的疫苗加强针的接种,以及疫苗种类、间隔的调整,可以缓解全球疫苗生产和接种的不均衡性,提高接种效率的同时节约资源的浪费。
另外,本方案仅需通过一份血液样本即可完成抗体产生情况的预测和/或抗体维持情况的预测,可根据实际需求选择预测模型进行预测,以对受试者接种疫苗后的免疫应答做出预测。
第一方面,本方案提供一种预测COVID-19疫苗接种后不同免疫应答人群的的蛋白标志物,包括:选自外周血淋巴细胞的蛋白标志物组合,其中蛋白标志物组合选自:Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合。
本方案提供一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物,包括:选自血清的蛋白标志物组合,其中蛋白标志物组合选自:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合。
本方案基于以上蛋白标记物组合分别搭建对应的抗体产生预测模型,且本方内针对外周血淋巴细胞和血清都可以设计对应的抗体产生预测模型,可准确的预测受试者接种疫苗57天后的抗体产生情况。
第二方面,本方案还提供了一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,包括蛋白标记物组合作为检测靶标在制备预测受试者COVID-19抗体产生情况的试剂盒中的应用。
若检测靶标是外周血淋巴细胞,此时包括以下步骤:通过试剂盒检测受试者外周血淋巴细胞中蛋白标志物组合的相对表达量,蛋白标志物组合的相对表达量与受试者COVID-19抗体产生情况相关联,其中蛋白标志物组合为:Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或:Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合。
对应的,将外周血淋巴细胞的蛋白标志物组合的相对表达量输入到抗体产生预测模型中,基于预测结果预测受试者是否可产生抗体。预测值越高则表示受试者产生抗体的概率越高。
若检测靶标是血清的话,此时包括步骤:通过试剂盒检测受试者血清中蛋白标志物组合的相对表达量,蛋白标志物组合的相对表达量与受试者COVID-19抗体产生结果相关联,其中蛋白标志物组合为:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合。
对应的,将血清中对应的蛋白标志物组合的相对表达量输入到抗体产生预测模型中,基于预测结果预测受试者是否可产生抗体。预测值越高则表示受试者产生抗体的概率越高。
第三方面,本方案还提供了一种抗体产生预测模型的构建方法,包括:以能产生抗体和不能产生抗体的受试者的外周血淋巴细胞中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合为:Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合,抗体预测模型可预测受试者是否能产生抗体。
本方案还提供了一种抗体产生预测模型的构建方法,包括:以能产生抗体和不能产生抗体的受试者的血清中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合为:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合。
第四方面,本方案提供一种预测COVID-19疫苗接种后不同免疫应答人群的外周血淋巴细胞的蛋白标志物组合,包括:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;或Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合。
本方案基于以上外周血淋巴细胞的蛋白标记物组合分别搭建对应的抗体维持预测模型,可准确的预测受试者接种疫苗180天后的抗体维持情况。
第五方面,本方案还提供了一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,包括蛋白标记物组合作为检测靶标在制备预测受试者COVID-19抗体维持情况的试剂盒中的应用。
检测靶标是外周血淋巴细胞,此时包括以下步骤:通过试剂盒检测受试者外周血淋巴细胞中蛋白标志物的相对表达量,蛋白标志物的相对表达量与受试者COVID-19抗体产生情况相关联,其中蛋白标志物组合为:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合。
对应的,将外周血淋巴细胞的蛋白标记物组合的相对表达量输入到抗体维持预测模型中,基于预测结果预测受试者在注射疫苗后的180天是否依旧有抗体,预测值越高则表示受试者维持抗体的能力越高。
第六方面,本方案还提供了一种抗体维持预测模型的构建方法,包括:以能产生抗体和不能产生抗体的受试者的外周血淋巴细胞中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合为:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;或Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合,抗体维持模型可预测受试者的抗体是否能被维持。
换言之,本方案针对外周血淋巴细胞和血清设计了蛋白标志物组合来预测受试者在接受疫苗后能否产生抗体,本方案以接种疫苗后57天后作为时间节点进行预测;若预测该受试者在接种疫苗57后能产生抗体的话,则可再用外周血淋巴细胞的蛋白标志物组合来预测受试者产生的抗体能够维持至180天。若某受试者体内产生的抗体能够维持到180天的话,则对于该受试者而言可不接种疫苗加强针。
本专利基于外周血淋巴细胞(PBMC)和血清蛋白组学的数据,筛选得到了多个模型基于疫苗接种前的蛋白标志物,预测COVID-19疫苗接种后不同免疫应答人群,可以及早对抗体产生和维持进行预判。模型分别是:1.对应基于PBMC的蛋白标记物组合的抗体产生预测模型,用于预测接种第一针疫苗57天后抗体生成情况;2.对应基于血清的蛋白标记物组合,用于预测接种第一针疫苗57天后抗体生成情况;3.对于基于PBMC的蛋白标记物组合,用于预测接种第一针疫苗180天后抗体维持的情况。此外,可以把PBMC的一组蛋白和Serum的一组蛋白结合使用,能提高诊断准确率。此专利有利于更加针对性的接种疫苗,对于高效节约并有效的开展疫苗加强针的接种,以及未来疫苗的研发具有重大意义。
附图说明
图1是针对PBMC和血清进行TMT标记的定量蛋白质组学分析的研究设计图。
图2是基于图1进行的实验的质量控制(QC)样本的变异系数(CV)。
图3是基于图1进行的实验的技术重复样本的质量控制评估。
图4和图5分别对33批次以及三个不同免疫反应组的所有蛋白质组的PBMC(D)和血清样品(E)的蛋白质组数据进行PCA分析。
图6是抗体产生模型在测试集中进行测试的研究设计图。
图7-13是抗体产生模型筛选出来的五种PBMC蛋白质的示意图。
图14-20是抗体产生模型筛选出来的七种血清蛋白质及其SHAP值。
图21是抗体维持模型在测试集中进行测试的研究设计图。
图22-28是抗体维持模型筛选出来的五种PBMC蛋白质及其SHAP值。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,以下说明本方案针对抗体产生预测模型的蛋白标记物的选取过程:
分析样本:第一组受试者:137名健康参与者;第二组受试者:26名健康参与者,选取第一组受试者和第二组受试者接种疫苗前的PBMC和血清样本,并进行TMT标记的蛋白组学分析。
针对临床队列样本进行实验设计,综合考虑人群的不同临床特征,使样本尽可能均匀分散,以最大程度避免批次效应。
一.对COVID-19疫苗接种前受试者的外周血淋巴细胞和血清的蛋白组学分析:
a.外周血淋巴细胞蛋白质组学分析:
在装有蛋白质样本的PCT微管(MicroTubes)中,加入30μL 6M尿素+2M硫脲(溶于100mM的TEAB中)的裂解缓冲液中变性,再加入用10mM三(2-羧基乙基)膦(TCEP)+40mM碘乙酰胺(IAA),于30℃进行高压循环辅助的裂解和还原烷基化过程:25s 45kPsi高压和10s环境压力的交替循环,进行90个循环的。接着加入Lys-C和Trypsin,为保证蛋白酶Lys-C和Trypsin的酶解活性,将溶液进一步稀释至尿素浓度降低到1.2M以下。压力循环仪辅助蛋白消化过程:50s 20kPsi高压和10s环境压力的交替,进行120个循环的。加入终浓度为1%的三氟乙酸终止酶切反应。
b.血清蛋白质组学分析
血清样本先去除高丰度蛋白(Thermo Fisher ScientificTM,San Jose,USA),然后加入50μL 8M尿素(溶于100mM的TEAB中)的裂解缓冲液中变性。再加入用10mM三(2-羧基乙基)膦(TCEP)32℃孵育30分钟,然后黑暗中于40mM碘乙酰胺(IAA)孵育30分钟,还原并烷基化蛋白裂解物。用100mM TEAB 200μL进一步稀释后,再以胰蛋白酶:底物为1:50比例下在32℃下消化4小时,继而再加入同等比例的胰蛋白酶在32℃下消化12小时。加入32μL 10%三氟乙酸(TFA)停止反应。
经过a和b消化后的肽段使用除盐柱进行清洗除盐后,使用TMTpro 16plex按照厂家说明书对多肽进行标记。本设计方案将样本分为33批次进行TMTpro16plex标记,每批样品数量相同。对于每个批次的TMT样品,采用nanflow DIONEX UltiMate 3000RSLCnano系统(Thermo Fisher Scientific,San Jose,USA)和XBridge Peptide BEH C18色谱柱(
Figure BDA0003564947790000081
5μm×4.6mm×250mm)(Waters,Milford,MA,USA)。样品采用5%—35%乙腈(ACN)在10mM氨水(pH=10.0)中梯度分离,流速为1mL/min。TMT标记的肽经该系统被分离为30个馏分,这些馏分再进一步合并为15个馏分。
使用nanoflow DIONEX UltiMate 3000RSLCnano系统(Thermo FisherScientific,San Jose,USA),并联合Orbitrap 480高分辨率质谱(Thermo FisherScientific,San Jose,USA),采用数据依赖采集(DDA)模式,在线对每个馏分进行分析。
分析时,样本首先以6ul/min的速度加载到预载柱(3μm,
Figure BDA0003564947790000091
20mm*75μm i.d.)上,然后以300nL/min的流速,将加载在预载柱上的样品,冲洗至分析柱(1.9μm,120a,150毫米*75μm)中进行进一步的在线分离,分析时间为30分钟,LC梯度为从7%到30%的缓冲液B(缓冲液A为2%ACN,98%H2O(含0.1%FA),缓冲液B为98%ACN(含0.1%FA)。所有试剂均为MS级。质谱参数方面MS1的m/z范围为375—1800,分辨率为60,000(200m/z),AGC为3e6,最大离子注入时间(max IT)为50ms。前体离子进行MS/MS的二级碎裂,其分辨率为30,000(200m/z),AGC为200%,max IT为86ms(血清)以及100ms(PBMC)。启用了turbo-TMT和高级峰测定,隔离窗口设置为0.7m/z。
使用Proteome Discoverer(版本2.4.1.15,Thermo Fisher Scientific)和蛋白质数据库(从UniProtKB下载)对质谱数据进行分析。酶被设置为胰蛋白酶,有两个缺失的切割耐受性。静态修饰为半胱氨酸氨基甲基化(+57.021464)、赖氨酸残基及肽段N端TMTpro(+304.207145),可变修饰为蛋氨酸氧化(+15.994915)和肽段N端乙酰化(+42.010565)。前体离子质量偏差设置为10ppm,碎裂离子质量偏差设置为0.02Da。
经过以上分析本发明人对PBMC的7342个蛋白质和血清的1715个蛋白质进行了鉴定和定量,去除缺失率高于90%的蛋白质,如图1所示得到PBMC的6331个蛋白质和血清的961个蛋白质。如图2和图3所示,在质量控制分析中,质量控制(QC)样本的变异系数(CV)的中位数为18.38%,血清数据为19.32%,技术重复样本的Pearson相关性为98.09%,血清为96.82%。如图4和图5所示,对PBMC和血清蛋白质组数据通过PCA降维分析发现,在不同的批次之间,不同的免疫应答组间没有显著的批次效应,证明本方案获取的数据真实可靠。
二、对COVID-19疫苗接种后受试者的外周血淋巴细胞和血清进行差异蛋白筛选:
对第一组的137名受试者进行疫苗接种,基于接种情况将受试者分为三组:0号组:一直没有产生抗体;1号组:第28天产生抗体;2号组:第57天产生抗体。
根据p-value寻找不同组之间的差异蛋白:将产生抗体的组和没有产生抗体的组对每个蛋白进行对照计算p-value,分别为0号组vs 1号组,0号组vs 2号组和0号组vs 1号组+2号组,产生三组p-value,分别保存p-value小于0.05的对应的第一组蛋白。
再根据fold change寻找不同组(依旧是上面的三组)之间的差异蛋白:产生三组fold change,分别保存|log2(fold change)|大于0.25的对应的第二组蛋白。
根据ANOVA分析寻找不同组之间的差异蛋白:我们将0组,1组,2组数据根据每个蛋白进行ANOVA分析,计算每个蛋白的ANOVAp-value,保存p-value小于0.05的对应的第三组蛋白。
将第一组蛋白、第二组蛋白和第三组蛋白取并集,删除其中缺失率大于50%的蛋白。这边对缺失率进行说明:假设有100个数据,对于A蛋白,有51个数据没有检测到A蛋白,对于B蛋白,有50个数据没有检测到B蛋白,那么A蛋白的缺失率大于50%,B蛋白的缺失率没有大于50%。
对于有缺失值的蛋白,将缺失值补充为该蛋白在数据集中出现的最小值并保存为蛋白矩阵,该蛋白矩阵作为训练样本可被用于训练抗体产生预测模型。
三、抗体产生预测模型的构建:
将训练样本按照4:1的比例随机划分为训练集(N=110)和验证集(N=27),在训练集中通过XGBoost模型筛选出PBMC和血清的蛋白标记物组合,并在验证集中进行验证,PBMC和血清单独的抗体产生预测模型在验证集中最优的模型的AUC为1.00。
XGBoost模型细节如下:
1)采用XGBoost的Python软件包(1.4.2版),在PBMC和血清数据中以蛋白相对表达 作为变量,建立了机器学习模型,以预测疫苗接种后57天抗体情况的预测以及验证。
2)对参数进行网格搜索,包括learning_rate(0.25~0.3,步长0.05),subsample(0.5~0.95,步长0.05),colsample_bytree(0.5~0.95,步长0.05),colsample_bylevel(0.5~0.95,步长0.05),scale_pos_weight(0.2~1,步长0.2)。
3)根据2)中参数建立xgboost模型进行特征排序。具体的,对遍历的每一组参数A用xgboost可以对每一个特征计算一个特征重要性,然后进行排序,排序完的特征一个个添加入蛋白矩阵后用参数A建立模型,计算验证集的最高AUC。
4)根据3)中排序的特征一个个添加进模型,取得在验证集最高AUC对应的特征数量N
5)对比2)中不同参数的4)的结果,取得在验证集最高AUC对应的参数作为抗体产生模型的参数。
如图7-20所示,本方案筛选得到的蛋白标记物组合为:
PBMC:
组合1:Q9H3U1,Q13158,Q96C86,P01871,O43639
组合2:Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871
组合3:Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18。
Serum:
组合1:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481
组合2:P09960,P08294,P28799,P49747,P54802,O95428,P00736
组合3:P49747,Q06481,O00299,P28799,P08294,O43852,P00746。
四、预测
本方案选取得到的抗体产生模型在第二组受试者26人中进行测试,如图6所示,对应PBMC的抗体产生预测模型预测的AUC为0.84,对应血清的抗体产生预测模型预测AUC为0.82,联合PBMC和血清模型预测的模型AUC为0.8。测试具体的过程是:采取受试者的外周血或血清,进行蛋白组学处理后得到蛋白标记物组合相对表达量输入到抗体产生模型中,得到PBMC的抗体产生预测模型预测的AUC为0.84,血清的抗体产生预测模型预测AUC为0.82,联合PBMC和血清模型预测的的抗体产生预测模型AUC为0.87。结果如图6所示。
实施例二,以下说明本方案针对抗体维持预测模型的蛋白标记物的选取过程:
本方案选择了107名在57天血清检测结果呈阳性的受试者,并去除14名血清阴性者和另外16名缺乏在180天的临床指标的受试者,作为发现集。并按照4:1的比例将发现集随机划分为训练集(N=86)和验证集(N=21),通过在疫苗接种前(0天)收集的PBMC蛋白组合建模,可以达到在内部验证集中AUC为1.00,在独立测试集(队列4,N=20)中进行预测的AUC为0.79的,这表明PBMC的蛋白质组学可以较为出色得预测57天和180天后的抗体反应情况.
一、对COVID-19疫苗受试者的外周血淋巴细胞进行差异蛋白筛选:
将受试者根据标签分为两组:0号组(抗体会在180天消失),1号组(抗体不会消失)。
1)根据p-value寻找不同组之间的差异蛋白:将抗体消失的组和抗体没有消失的组对每个蛋白进行对照计算p-value,分别保存p-value小于0.05的对应的蛋白
2)根据fold change寻找不同组之间的差异蛋白:将抗体消失的组和抗体没有消失的组对每个蛋白进行对照计算fold change,分别保存|log2(foldchange)|大于0.25的对应的蛋白
3)将2)~3)的蛋白取并集,并删除其中缺失率大于50%的蛋白
4)对于有缺失值的蛋白,将缺失值补充为该蛋白在数据集中出现的最小值并保存(测试时需要用),这个蛋白矩阵作为最终的蛋白矩阵进行训练。
5)抗体维持预测模型的构建:
如图22-28所示,本方案对训练集按照4:1的比例,随机划分为训练集(N=86)和验证集(N=21),在训练集通过XGBoost模型筛选出PBMC的蛋白组合进行建模,并在验证集中进行验证,PBMC和血清单独的模型在验证集中最优的模型的AUC为1.00,选取此模型在第二批接种疫苗人群20人中,进行测试,PBMC模型预测的AUC为0.79。此模型的训练细节与抗体产生预测模型中的训练细节相同。
基于抗体维持预测模型和不同的数据划分,如图9所示能够取得一些蛋白组合能够用于试剂盒开发:
PBMC:
组合1:Q9ULZ3,Q13614,Q96CD2,P15056
组合2:Q96CD2,O14639,Q13614,P42166,Q9ULZ3
组合3:Q96CD2,Q12972,Q13614。
本发明不局限于上述最佳实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是具有与本申请相同或相近似的技术方案,均落在本发明的保护范围之内。

Claims (10)

1.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物,其特征在于,包括:选自外周血淋巴细胞的蛋白标志物组合,其中蛋白标志物组合选自:
Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或
Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合,用于预测受试者接种疫苗后是否会产生抗体。
2.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物,其特征在于,包括:选自血清的蛋白标志物组合,其中蛋白标志物组合选自:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合,用于预测受试者接种疫苗后是否会产生抗体。
3.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,其特征在于,包括:通过试剂盒检测受试者外周血淋巴细胞中蛋白标志物组合的相对表达量,蛋白标志物组合的相对表达量与受试者COVID-19抗体产生情况相关联,其中蛋白标志物组合选自:Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合。
4.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,其特征在于,包括:通过试剂盒检测受试者血清中蛋白标志物组合的相对表达量,蛋白标志物组合的相对表达量与受试者COVID-19抗体产生结果相关联,其中蛋白标志物组合选自:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合。
5.一种抗体产生预测模型的构建方法,其特征在于,包括:以能产生抗体和不能产生抗体的受试者的外周血淋巴细胞中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合选自:Q9H3U1,Q13158,Q96C86,P01871,O43639的任意蛋白的组合;或Q9H3U1,Q9NUJ1,Q12981,P78406,Q13642,Q16740,P01871的任意蛋白的组合;或Q15119,P16671,O00443,Q9BPW8,P01871,O75582,O43294,Q9UL18的任意蛋白的组合,用于预测受试者是否能产生抗体。
6.一种抗体产生预测模型的构建方法,其特征在于,包括:以能产生抗体和不能产生抗体的受试者的血清中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合选自:Q13103,P09960,P54802,Q9UK55,P08294,Q6WN34,Q06481的任意蛋白的组合;或P09960,P08294,P28799,P49747,P54802,O95428,P00736的任意蛋白的组合;或P49747,Q06481,O00299,P28799,P08294,O43852,P00746的任意蛋白的组合。
7.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物,其特征在于,包括:选自外周血淋巴细胞的蛋白标志物组合,其中蛋白标志物组合选自:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;或Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合,用于预测受试者接种疫苗后能否维持抗体。
8.一种预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,其特征在于,包括:通过试剂盒检测受试者外周血淋巴细胞中蛋白标志物的相对表达量,蛋白标志物的相对表达量与受试者COVID-19抗体产生情况相关联,其中蛋白标志物组合选自:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;或Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合,用于预测受试者接种疫苗后能否维持抗体。
9.一种抗体维持预测模型的构建方法,其特征在于,包括:以能产生抗体和不能产生抗体的受试者的外周血淋巴细胞中蛋白标志物组合的相对表达量作为训练样本训练机器学习模型得到,其中蛋白标志物组合选自:Q9ULZ3,Q13614,Q96CD2,P15056的任意蛋白的组合;或Q96CD2,O14639,Q13614,P42166,Q9ULZ3的任意蛋白的组合;或Q96CD2,Q12972,Q13614的任意蛋白的组合,用于预测受试者的抗体是否维持抗体。
10.根据权利要求3,4或8任一所述的预测COVID-19疫苗接种后不同免疫应答人群的蛋白标志物的应用,其特征在于,对接种疫苗的受试者采用不同的疫苗接种策略。
CN202210299567.8A 2022-03-25 2022-03-25 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用 Active CN114624449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210299567.8A CN114624449B (zh) 2022-03-25 2022-03-25 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210299567.8A CN114624449B (zh) 2022-03-25 2022-03-25 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用

Publications (2)

Publication Number Publication Date
CN114624449A true CN114624449A (zh) 2022-06-14
CN114624449B CN114624449B (zh) 2024-10-18

Family

ID=81903196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210299567.8A Active CN114624449B (zh) 2022-03-25 2022-03-25 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用

Country Status (1)

Country Link
CN (1) CN114624449B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115184614A (zh) * 2022-06-14 2022-10-14 北京大学 免疫效度或临床相对免疫效度在评价受试者的疫苗应答强度中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022028917A2 (en) * 2020-08-03 2022-02-10 Sciomics Gmbh Methods for the determination of the predisposition for a severe or critical course of a covid-19-disease from a mild or moderate course of a covid-19-disease in a subject
WO2022048250A1 (zh) * 2020-09-03 2022-03-10 北京臻知医学科技有限责任公司 一组用于预测2019冠状病毒病免疫检查点风暴的标志物、应用及其试剂盒

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022028917A2 (en) * 2020-08-03 2022-02-10 Sciomics Gmbh Methods for the determination of the predisposition for a severe or critical course of a covid-19-disease from a mild or moderate course of a covid-19-disease in a subject
WO2022048250A1 (zh) * 2020-09-03 2022-03-10 北京臻知医学科技有限责任公司 一组用于预测2019冠状病毒病免疫检查点风暴的标志物、应用及其试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG 等: "Longitudinal proteomic investigation of COVID-19 vaccination", PROTEIN & CELL, vol. 14, no. 9, 30 September 2023 (2023-09-30), pages 668 - 682 *
柯英;王静;涂杰霞;蒋正方;: "15例新型冠状病毒感染患者免疫状态分析及胸腺肽制剂的应用", 实用医院临床杂志, vol. 17, no. 02, 31 March 2020 (2020-03-31), pages 35 - 37 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115184614A (zh) * 2022-06-14 2022-10-14 北京大学 免疫效度或临床相对免疫效度在评价受试者的疫苗应答强度中的应用
CN115184614B (zh) * 2022-06-14 2023-11-03 北京大学 免疫效度或临床相对免疫效度在评价受试者的疫苗应答强度中的应用

Also Published As

Publication number Publication date
CN114624449B (zh) 2024-10-18

Similar Documents

Publication Publication Date Title
Champion et al. Defining your product profile and maintaining control over it, part 2
EP2966985B1 (en) Identification and monitoring of monoclonal immunoglobulins by molecular mass
Yan et al. Index-ion triggered MS2 ion quantification: a novel proteomics approach for reproducible detection and quantification of targeted proteins in complex mixtures
Martins et al. Mass spectrometry–based method targeting Ig variable regions for assessment of minimal residual disease in multiple myeloma
CN114624449A (zh) 预测covid-19疫苗接种后不同免疫应答人群的蛋白标志物及应用
CA2417767A1 (en) Peptides presented by cells
Huynh et al. Evaluation of the necessity and the feasibility of the standardization of procalcitonin measurements: activities of IFCC WG-PCT with involvement of all stakeholders
CN105518461B (zh) 改进抗体稳定性的方法
Heuberger et al. Sensitivity and specificity of detection methods for erythropoietin doping in cyclists
Li et al. Using transcriptomics, proteomics and phosphoproteomics as new approach methodology (NAM) to define biological responses for chemical safety assessment
US20090132171A1 (en) Screening Method for Specific Protein in Proteome Comprehensive Analysis
WO2014160237A2 (en) Methods of prognosing preeclampsia
CN117074541A (zh) 预测卵巢癌病人辅助化疗敏感性的蛋白标志物及应用
CN114839253A (zh) 血清或血浆中低分子量蛋白定量分析方法及应用
WO2023125741A1 (zh) 一种评价疫苗质量和疫苗保护效期的方法
WO2023125749A1 (zh) 一种评价个体是否完成疫苗接种或个体免疫变化的方法
CN112834751A (zh) 一种家用型检测芝麻过敏原的高灵敏试剂盒、其检测方法和应用
CN102047112A (zh) 用于检测老化、及伴随有血管障碍的疾病的组合物、试剂盒及方法
Allgoewer et al. High-resolution proteomics identifies potential new markers of Zika and dengue infections
CN116794320A (zh) 用于评价多种疫苗免疫效应的质谱试剂盒
CN116577442A (zh) 用于评价多种疫苗免疫效应的质谱模型及其构建方法
KR102728037B1 (ko) 질량분석법 기반의 우울장애, 양극성장애 및 조현병 구분용 바이오마커 및 그 용도
CN118414666A (zh) 提取关于蛋白质序列修饰的信息的方法
KR20230173319A (ko) 질량분석법 기반의 우울장애, 양극성장애 및 조현병 구분용 바이오마커 및 그 용도
WO2023152513A1 (en) Peptides for use in assessing the status of the immune system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant