CN111983241B - 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法 - Google Patents

诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法 Download PDF

Info

Publication number
CN111983241B
CN111983241B CN202010919301.XA CN202010919301A CN111983241B CN 111983241 B CN111983241 B CN 111983241B CN 202010919301 A CN202010919301 A CN 202010919301A CN 111983241 B CN111983241 B CN 111983241B
Authority
CN
China
Prior art keywords
protein
leu
ala
glu
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010919301.XA
Other languages
English (en)
Other versions
CN111983241A (zh
Inventor
庹清章
蒲兴华
戴伦治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202010919301.XA priority Critical patent/CN111983241B/zh
Publication of CN111983241A publication Critical patent/CN111983241A/zh
Application granted granted Critical
Publication of CN111983241B publication Critical patent/CN111983241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/573Immunoassay; Biospecific binding assay; Materials therefor for enzymes or isoenzymes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70525ICAM molecules, e.g. CD50, CD54, CD102
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/2814Dementia; Cognitive disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/2814Dementia; Cognitive disorders
    • G01N2800/2821Alzheimer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medical Informatics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Neurosurgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Neurology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法,涉及脑卒中诊断技术领域。本发明公开的蛋白标志物选自ATP5B蛋白、OPCML蛋白和MOG蛋白中的至少一种。本发明公开了新的用于诊断发生脑卒中后是否存在认知障碍的蛋白标志物,采用本发明公开的蛋白标志物对脑卒中发生后是否存在认知障碍进行诊断,具有更高的灵敏度和特异度。

Description

诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法
技术领域
本发明涉及脑卒中诊断技术领域,具体而言,涉及诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法。
背景技术
血管性认知障碍(Vascular Cognitive Impairment,VCI)据估计占所有确诊认知障碍人群的50%-70%。VCI强调是一个连续的过程,是指由脑血管病的危险因素(如高血压、糖尿病等)、或脑血管病引起的从轻度认知损害到失智的一类综合征。我国人群脑血管病发病率显著上升,其中将近一半会出现VCI。相对于另一种常见认知障碍——阿尔兹海默病(Alzheimer’s disease,AD),VCI的发病机制研究刚起步,临床上缺乏病理学分子影像、外周标志物等有效预测手段。目前对于脑卒中后认知障碍的诊断主要是通过临床认知量表实现,并无客观指标来反映认知障碍情况。现有研究尚未发现临床公认可用的特异性分子标志物,这极大地阻碍了VCI病人的早期诊断,并为后续的治疗带来巨大困难。
鉴于此,特提出本发明。
发明内容
本发明的目的在于提供诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法。
本发明是这样实现的:
一方面,本发明提供一种诊断脑卒中患者存在认知障碍的蛋白标志物,所述蛋白标志物选自ATP5B蛋白、OPCML蛋白和MOG蛋白中的至少一种。
在可选的实施方式中,所述蛋白标志物还包括GFAP蛋白。
本发明的研究发现,存在认知障碍脑卒中患者和不存在认知障碍脑卒中患者两组群体中存在差异表达蛋白,例如ATP5B蛋白、OPCML蛋白、MOG蛋白和GFAP蛋白;说明这些差异表达蛋白可以单独或联合作为诊断脑卒中患者是否存在认知障碍的蛋白标志物;进一步地,本发明以这些差异表达蛋白作为变量构建预测脑卒中患者是否存在认知障碍风险的模型,经验证,该预测模型具有较高的灵敏度和特异度,能够较为准确地进行预测。
本发明为脑卒中发生后是否存在认知障碍的诊断提供了新的标志物和策略。
其中,ATP5B蛋白、OPCML蛋白、MOG蛋白和GFAP蛋白的氨基酸序列分别如SEQ IDNO.1-4所示,或与其具有至少95%的同源性。
ATP5B蛋白序列(SEQ ID NO.1)如下,或与如下序列具有至少95%的同源性:
MLGFVGRVAAAPASGALRRLTPSASLPPAQLLLRAAPTAVHPVRDYAAQTSPSPKAGAATGRIVAVIGAVVDVQFDEGLPPILNALEVQGRETRLVLEVAQHLGESTVRTIAMDGTEGLVRGQKVLDSGAPIKIPVGPETLGRIMNVIGEPIDERGPIKTKQFAPIHAEAPEFMEMSVEQEILVTGIKVVDLLAPYAKGGKIGLFGGAGVGKTVLIMELINNVAKAHGGYSVFAGVGERTREGNDLYHEMIESGVINLKDATSKVALVYGQMNEPPGARARVALTGLTVAEYFRDQEGQDVLLFIDNIFRFTQAGSEVSALLGRIPSAVGYQPTLATDMGTMQERITTTKKGSITSVQAIYVPADDLTDPAPATTFAHLDATTVLSRAIAELGIYPAVDPLDSTSRIMDPNIVGSEHYDVARGVQKILQDYKSLQDIIAILGMDELSEEDKLTVSRARKIQRFLSQPFQVAEVFTGHMGKLVPLKETIKGFQQILAGEYDHLPEQAFYMVGPIEEAVAKADKLAEEHSS。
OPCML蛋白序列(SEQ ID NO.2)如下,或与如下序列具有至少95%的同源性:
MGVCGYLFLPWKCLVVVSLRLLFLVPTGVPVRSGDATFPKAMDNVTVRQGESATLRCTIDDRVTRVAWLNRSTILYAGNDKWSIDPRVIILVNTPTQYSIMIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVPPQIMNISSDITVNEGSSVTLLCLAIGRPEPTVTWRHLSVKEGQGFVSEDEYLEISDIKRDQSGEYECSALNDVAAPDVRKVKITVNYPPYISKAKNTGVSVGQKGILSCEASAVPMAEFQWFKEETRLATGLDGMRIENKGRMSTLTFFNVSEKDYGNYTCVATNKLGNTNASITLYGPGAVIDGVNSASRALACLWLSGTLLAHFFIKF。
MOG蛋白序列(SEQ ID NO.3)如下,或与如下序列具有至少95%的同源性:
MASLSRPSLPSCLCSFLLLLLLQVSSSYAGQFRVIGPRHPIRALVGDEVELPCRISPGKNATGMEVGWYRPPFSRVVHLYRNGKDQDGDQAPEYRGRTELLKDAIGEGKVTLRIRNVRFSDEGGFTCFFRDHSYQEEAAMELKVEDPFYWVSPGVLVLLAVLPVLLLQITVGLIFLCLQYRLRGKLRAEIENLHRTFDPHFLRVPCWKITLFVIVPVLGPLVALIICYNWLHRRLAGQFLEELRNPF。
GFAP蛋白序列(SEQ ID NO.4)如下,或与如下序列具有至少95%的同源性:
MERRRITSAARRSYVSSGEMMVGGLAPGRRLGPGTRLSLARMPPPLPTRVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQNKALAAELNQLRAKEPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQKLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQEQLARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAELLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEEEGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRETSLDTKSVSEGHLKRNIVVKTVEMRDGEVIKESKQEHKDVM。
另一方面,本发明提供检测如上所述的蛋白标志物的试剂在制备用于诊断脑卒中患者存在认知障碍的试剂盒中的应用。
基于此本发明的研究发现,检测上述蛋白标志物的试剂具有新的用途,例如制备用于诊断脑卒中患者存在认知障碍的试剂盒。
在可选的实施方式中,所述试剂包括抗所述蛋白标志物的抗体。
在可选的实施方式中,所述抗体包括抗ATP5B蛋白抗体、抗OPCML蛋白抗体、抗MOG蛋白抗体和抗GFAP蛋白抗体。
需要说明的是,本领域技术人员可以利用本领域常规的方法例如酶联免疫吸附试验(ELISA)或化学发光法等检测上述蛋白标志物的存在或浓度,采用这些方法进行检测所使用的抗体是容易获得的。
再一方面,本发明提供一种用于诊断脑卒中患者存在认知障碍的试剂盒,其包括检测如上所述的蛋白标志物的试剂。
在可选的实施方式中,所述试剂包括抗所述蛋白标志物的抗体。
在可选的实施方式中,所述抗体包括抗ATP5B蛋白抗体、抗OPCML蛋白抗体、抗MOG蛋白抗体和抗GFAP蛋白抗体。
在本发明公开了上述蛋白标志物的氨基酸序列的基础上,本领域技术人员通过本领域常规方法容易获得上述蛋白标志物的抗体。
再一方面,本发明提供一种用于预测脑卒中患者是否存在认知障碍风险的模型的训练方法,其包括如下步骤:
步骤S1:获取样本中的蛋白标志物浓度数据,所述样本来自脑卒中患者;所述蛋白标志物为如上所述的蛋白标志物;
步骤S2:利用获得的蛋白标志物浓度数据对预设建立的机器学习模型进行训练,获得用于预测脑卒中患者是否存在认知障碍风险的模型。
在可选的实施方式中,所述蛋白标志物包括ATP5B蛋白、OPCML蛋白、MOG蛋白以及GFAP蛋白。
需要说明的是,蛋白标志物浓度数据可以通过本领域常规的方法进行检测例如酶联免疫吸附试验(ELISA)的方法检测得到,也可以采用本领域常规的色谱串联质谱的方法进行检测得到。
在可选的实施方式中,所述预先建立的机器学习模型通过以下至少一个算法构建:随机森林算法、贝叶斯分类器、多元非线性回归拟合方法、Adaboost算法、支持向量机、K均值算法、决策树算法、K近邻算法、线性回归、逻辑回归、隐马尔可夫模型、神经网络、极限学习机和聚类算法中的至少一种。
在可选的实施方式中,所述样本为血液样本。
血液样本可以是全血样本,血浆样本或血清样本,本领域技术人员可以需要进行合理选择。
在可选的实施方式中,所述样本的数量至少为20份,优选为28份。
本领域技术人员可以根据实际需要合适数量的样本进行模型训练。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1:血浆蛋白质组学研究策略;血浆样品除去高丰度蛋白后,通过胰蛋白酶酶解成多肽,TMT试剂标记多肽,等量混合之后,用HPLC分离并合并成10分组分,最后经LC-MS/MS检测。
图2:缺血性脑卒中发生后发生认知障碍M1与未发生认知障碍M0的差异蛋白火山图分析;横坐标表示代谢物比值取对数,纵坐标表示两组各蛋白进行T-test检验所得的P-value;其中蓝色表示下调蛋白,橙色表示上调蛋白,灰色表示无显著变化蛋白;蛋白变化比值=缺血性脑卒中发生认知障碍(M1)各蛋白丰度中位数/缺血性脑卒中未发生认知障碍(M0)各蛋白丰度中位数。
图3:缺血性脑卒中发生后发生认知障碍(M1)中下调蛋白KEGG通路分析;NFLD:Non-alcoholic fatty liver disease(非酒精性脂肪肝);GDM:Glyoxylate anddicarboxylate metabolism(乙醛酸和二羧酸代谢);ALS:Amyotrophic lateralsclerosis(肌萎缩侧索硬化);VLID:Valine,leucine and isoleucine degradation(缬氨酸,亮氨酸和异亮氨酸的降解);CMM:Cysteine and methionine metabolism(半胱氨酸和蛋氨酸的代谢)。
图4:缺血性脑卒中与认知障碍相关的差异性蛋白;A:缺血性脑卒中发生后发生认知障碍(M1)与未发生认知障碍(M0)的差异蛋白富集热图;B:发生认知障碍(M1)中下调蛋白KEGG通路富集;NFLD:Non-alcoholic fatty liver disease GDM:Glyoxylate anddicarboxylate metabolism ALS:Amyotrophic lateral sclerosis VLID Valine,leucine and isoleucine degradation CMM Cysteine and methionine metabolism。
图5:缺血性脑卒中发生后发生认知障碍(M1)与未发生认知障碍(M0)的病人血浆差异蛋白生物过程分析;A:缺血性脑卒中发生后发生认知障碍(M1)组中下调蛋白的生物过程分析;B:缺血性脑卒中发生后发生认知障碍(M1)组中上调蛋白的生物过程分析;MDND:midbrain dopaminergic neuron differentiation(中脑多巴胺能神经元分化);NRIASP:negative regulation of intrinsic apoptotic signaling pathway(内源性凋亡信号通路的负调控);CCCC:cell communication by chemical coupling(化学偶联细胞通讯);CCGABAergic:cerebral cortex GABAergic interneuron development(大脑皮层GABA能中间神经元发育);EOBIPM:embryonic olfactory bulb interneuron precursor migration(胚胎嗅球间神经元前体迁移);PRCEA:positive regulation of cysteine-typeendopeptidase activity involved in apoptotic process(凋亡过程中半胱氨酸型内肽酶活性的正调控);ROSM:reactive oxygen species metabolic process(活性氧代谢过程);ECDIIPGD:epithelial cell differentiation involved in prostate glanddevelopment(前列腺发育中涉及的上皮细胞分化);PROTMVT:positive regulation oftelomere maintenance via telomerase(端粒酶对端粒维持的正调控作用);ARCM:auditory receptor cell morphogenesis(听觉受体细胞形态发生);LDLPR:low-densitylipoprotein particle remodeling(低密度脂蛋白颗粒重塑);RROS:response toreactive oxygen species(对活性氧的反应)。
图6:缺血性脑卒中发生后发生认知障碍M1与未发生认知障碍M0的差异蛋白细胞成分分析;左侧:缺血性脑卒中发生后发生认知障碍(M1)中下调蛋白的细胞成分分析;右侧:缺血性脑卒中发生后发生认知障碍(M1)中上调蛋白的细胞成分分析;MIS:mitochondrial intermembrane space(线粒体膜间隙)。
图7:缺血性脑卒中发生后发生认知障碍M1与未发生认知障碍M0的差异蛋白基因本体论分子功能分析;A:缺血性脑卒中发生后发生认知障碍(M1)中下调蛋白的分子功能;B:缺血性脑卒中发生后发生认知障碍(M1)中上调蛋白的分子功能分析。
图8:随机森林预测模型所纳入变量贡献分类重要性对比。
图9:随机森林模型ROC曲线。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
蛋白质是生命物质的基础,是构成细胞的基本有机物,是生命活动的主要承担者,在细胞代谢等方面起着重要作用,其具有时空特异性。人的基因组通常情况下是恒定不变的,但是蛋白质在不同的细胞和器官中,或在同一组细胞在不同的环境下或者不同时段其内部蛋白表达水平却千差万别。因此,研究蛋白质结构和功能是生物学的一个核心内容。随着基因组学概念的提出,在1994年由Wilkins在Siena双向凝胶电泳会议上首次提出蛋白质组学的概念。蛋白质组学主要研究细胞或者组织样品中蛋白质组的表达、修饰水平、细胞定位、相互作用等,系统阐述蛋白质生物学功能。根据不同的研究目的,蛋白质组学一般分为差异蛋白质组学与功能蛋白质组学。差异蛋白质组学是定量比较不同条件下样品全部蛋白质表达水平的差异,描绘出整个蛋白表达图谱,试图找到疾病、药物处理等条件下发生显著变化的蛋白质。功能蛋白质组学的目的则是研究生物体内与某个功能相关或者某个条件下特定一群蛋白质。液相-高分辨质谱联用仪是实现蛋白组学研究的核心仪器,通过分析离子的荷质比(m/z)和拼接碎片化离子,确定多肽和蛋白质序列,实现对蛋白质的高通量检测。蛋白质组学也在生命科学研究中广泛应用,涉及到动物学、植物学、疾病诊断、医药研发、病毒学、肿瘤研究等多个领域。
近年来,蛋白质组学技术在检测通量、定性分析和定量分析的精准度等方面都有了明显的提高。现常用的定量方法包括稳定同位素标记定量(SILAC)、等重同位素标记定量(如TMT和iTRAQ)等。然而,受到同位素标签数量的限制,在进行大批样品实验时,以LabelFree和DIA为代表的非标记定量蛋白质组学技术则具有更多优势。目前已经形成了iTRAQ,TMT,Label Free,DIA/SWATH,SILAC等定量技术为核心的蛋白质组学技术。等重同位素标记定量法是对蛋白质进行体外同位素标记,然后利用质谱在MS2层面对多肽和蛋白进行定量,常用的等重同位素试剂包括TMT[46]和iTRAQ。这些等重同位素标签的结构和原理基本类似,以TMT法为例,TMT试剂由三部分构成,包括反应基团、平衡基团和报告基团,TMT试剂通过反应基团与多肽上赖氨酸侧链或多肽氨基末端相连,多个样品中的同一条TMT标记的蛋白多肽在MS1图谱上有相同的峰,通过二级质谱的碎裂之后,可利用低荷质比区的报告基团丰度实现对多肽和蛋白质进行定量。等重同位素标记蛋白定量方法特点如下:1)样品的适应范围广,基本上不受样品种类限制;2)定量的样品数目较多,根据不同的报告离子,可以实现同时对高达16个样品定性定量分析;3)准确度较高,可以准确反映不同样品间的蛋白差异。但也存在一些问题,如对母离子进行筛选时不可避免的会筛选到共洗脱离子,这些离子也有报告基团,一同经过二级质谱的碎裂之后,共洗脱离子报告基团和母离子的报告基团混合,会对样品本身的定量结果产生一定影响,出现比例压缩现象。现在通过分更多的多肽组分,或者设置小的分离窗口,或者利用MS3碎裂定量,或者利用气相纯化以定量的准确性。
本实施例中,为了得到缺血性脑卒中的蛋白组,选择基于等重同位素标记试剂TMT的定量蛋白质组学技术,可以同时对多组样品准确定量,TMT试剂最高可标记10组样品(图1)。该方法标记效率高、定量精确、灵敏度高且通量高,但容易受到共洗脱的干扰;因此,为了降低共洗脱干扰,采用0.6Da的母离子分离窗口。此外,为了提高检测限定量到更多的蛋白,将标记后的混合多肽均在碱性(pH=10)性条件下使用高效液相色谱仪将混合后的样品分成120个组分,再将样品按分级梯度交叉混合成10个样品在酸性(pH=3)条件下除盐,随后进行LC-MS/MS分析,得到的raw文件,再用Maxquant(版本1.6)软件,基于Swiss-Prothuman protein sequence database(20413序列)进行搜库。其中样品包含缺血性脑卒中组(M)28人;缺血性脑卒中组中12人的MoCA评分为0;16人的MoCA评分为1;即缺血性脑卒中组中包含无认知障碍(M0)12人、认知障碍患者(M1)16人。
表1缺血性脑卒中组基本信息
Figure BDA0002666134090000061
具体实验方法如下:
1血浆白蛋白/IgG去除
(1)取血浆样本(病人发病3个月后采集)60μL,加入540μL binding buffer(10mM磷酸氢二钠溶液)里,温和混匀。
(2)去掉柱子蓝盖子,倒转去除存储缓冲液,再去除tip。加850μL bindingbuffer,重力作用下流过柱子,丢弃流下的液体。
(3)加入稀释后的上层血浆,重力作用下流过柱子,收集流下的液体。
(4)加入600μL 10mM Na2HPO4溶液,洗柱子,收集流下的液体;重复一次。
(5)三次收集的样品转移至2mL EP管,加蛋白酶抑制剂和磷酸酶抑制剂,测蛋白浓度。
(6)柱子用100mM Glyine洗3次;1*PBS洗2-3次;保存于binding buffer中。
2蛋白浓度测定
采用Bradford法测定蛋白样品浓度,其原理是利用游离状态下的考马斯亮蓝为红色,在488nm波长处有最大吸收;而与蛋白结合后的考马斯亮蓝呈青色,色素-蛋白复合物的最大光吸收在595nm波长处。其光吸收值与蛋白浓度成正相关关系,因此可利用该方法对溶液中的蛋白浓度进行测定。操作流程如下:
(1)开启核酸蛋白浓度测定仪,选择程序protein,设置参数为1μL+1000μL。
(2)空白组取10μL 10mM Na2HPO4溶液于EP管中;实验组取白蛋白/IgG去除的蛋白样品10μL于EP管中。
(3)向上述EP管加入90μL Bradford,涡旋混匀后,离心,使液体集中于EP管底部。
(4)取上述反应液10μL,加入990μL Bradford,涡旋混匀后,离心,室温放置2min。
(5)先用空白校正后,依次对样品进行浓度测定,记录数值。
3蛋白样品SDS-PAGE凝胶电泳定量
根据测定好的浓度,取出50μg蛋白量对应的蛋白溶液体积,加入一定体积的5xloading buffer使其稀释成1x,再加入一定体积的1x loading Buffer定容到50μL将样品制备成1μg/μL,涡旋混匀。样品制好后,将其放在干式恒温金属浴中,95oC煮5min。完成后,冰上冷却后离心。
配置12%分离胶:选择1.0mm的垂直电泳后玻板,配置分离胶,混匀后迅速将其灌注到固定好的玻板中,用无水乙醇压胶消除气泡。待分离胶完全凝固后,倒掉无水乙醇,纯水冲洗净去掉无水乙醇,倒置晾干。配置浓缩胶,混匀后迅速灌注于玻璃板中,插上梳子,待其完全凝固后使用。
电泳:将配置好的凝胶置于电泳槽中,向内槽中倒入一定量的1x电泳液,拔下梳子,按照顺序上样,以蛋白marker作为对照,每个样品的上10μg,补足内外槽电泳液。先用80v的恒定电压跑胶,待溴酚蓝条带完全进入分离胶后,改变电压为120v,继续跑胶。待溴酚蓝条带即将跑出玻板下缘时,停止跑胶。
考马斯亮蓝染色:待电泳完成后,小心拆下凝胶,将其置于干净带盖塑料盒中,加入染料,置于水平摇床上,缓慢摇动室温染色30min。
脱色:将已经染好的胶置于干净带盖塑料盒中,加入脱色液,置于水平摇床上,快速摇动,待条带显现背景完全消除后,倒掉脱色液,换成水,室温继续脱色。
4蛋白样品前处理经过SDS-PAGE凝胶电泳检测血浆白蛋白/IgG去除效果后,对样品进行前处理:
(1)蛋白样品还原烷基化:取各个样品50μg于1.5mL EP管中,用真空冷冻干燥机将样品冻干。用50μL 6M尿素将样品溶解,各样品加入2.5μL 200mM TCEP后,涡旋混匀,瞬时离心,将EP管置于恒温混匀器中,设置转速为850rpm,反应1h后取出置于冰上。按照2.4.12中的配方,避光配置375mM IAA。每个样品避光加入2.5μL 375mM IAA,涡旋混匀,瞬时离心后于MT-360震荡混匀器室温避光反应30min。
(2)蛋白酶解:ThermoMixer C恒温混匀器预热到37℃。将样品稀释至2M终浓度的尿素中,各加入1μL(1μg/μL)胰酶,涡旋混匀,瞬时离心后,置于恒温混匀器,设置转速为1000rpm,反应12~16小时后,取出样品,各样品中加入10%TFA调PH至3左右,灭活未反应完全的胰酶。
5蛋白样品TMT标记
a)将TMT标记试剂从-20℃冰箱中取出,放至室温。每管TMT标记试剂共0.8mg,各加42μL乙腈充分溶解。
b)首先将酶解好的多肽样品各取出12.5μL(即12.5μg)于新的1.5mL EP管中。
c)向各样品中加入5μL(即100μg)对应标签的TMT试剂,涡旋混匀并瞬时离心后,置于MT-360震荡混匀器室温反应1h。
d)终止标记:向各反应完全的样品中加入1μL 5%羟胺,涡旋混匀并瞬时离心后,置于MT-360震荡混匀器室温反应15min。
e)将同一组反应完全的样品合并至同一EP管中,真空浓缩干燥。
6混合多肽样品脱盐
将浓缩干燥后的混合多肽样品按照如下方法进行脱盐:
a)将样品溶解于300μL 0.1%TFA,并用10%TFA调pH为2-3。
b)甲醇活化C18固相萃取柱。萃取柱填料为100mg,总体积为1mL。每次1mL甲醇活化,活化2次。
c)0.1%TFA平衡C18固相萃取柱。每次1mL 0.1%TFA,平衡3次。
d)载样。使溶解后的多肽样品自由流过萃取柱,重复载样5次。
e)0.1%TFA脱盐,每次1mL,共计3次。
f)1mL 80%ACN洗脱。洗脱下来的样品置于真空浓缩仪进行干燥,干燥完成后保存于-80℃冰箱备用。
7HPLC分离混合多肽样品
使用的仪器是Agilent-1260高效液相色谱,分离柱选用的是Agilent 4.6x250 mmC18反向色谱柱,进样环的规格是500μL载样量。
首先配置所需的流动相Buffer A和Buffer B,同时准备HPLC级别的水和甲醇。使用前,利用非接触式超声仪超声4瓶液体各15min,排除液体中的气泡。完成后,将各缓冲液装配到对应的泵上,A泵对应甲醇,B泵对应水,C泵对应Buffer A,D泵对应Buffer B。
随后用300μL Buffer A溶解上述干燥后的混合多肽样品,并于常温离心机10000g离心10min。所有准备工作完成后,打开仪器控制软件并开启仪器。待仪器完全开启后,设定仪器柱温为37℃,检测波长为214nm,流速为1mL/min。
准备工作完成后,首先在线排除4个泵对应管道中的气泡,然后用甲醇活化C18反向色谱柱,直至基线稳定。活化完成后,用Buffer A平衡C18反向色谱柱,直至基线均稳定。冲洗色谱柱的同时,用HPLC级的甲醇和Buffer A依次冲洗进样环三次。
以上步骤完成后,进样溶解好的混合多肽样品,并按照预先设定的HPLC梯度洗脱程序(表2)分离多肽样品。按照编号从小到大依次收集洗脱的样品,每管1mL,共收集120管。收集完成后,保存分离样品的信号谱图,并先用95%(5%甲醇)冲洗C18反向色谱柱,至基线稳定,然后用95%甲醇冲洗C18反向色谱柱,直至基线稳定,并将C18反向色谱柱保存于95%甲醇中。
表2 HPLC梯度洗脱条件
Figure BDA0002666134090000091
8多肽样品质谱进样前处理
将分离后的多肽样品用真空浓缩仪去除有机溶剂,再每间隔10个合并成一个组分,共计10个。利用真空冷冻干燥机冻干每个组分。随后对每个样品用Ziptip脱盐柱脱盐。本实验中选用的Ziptip最大载样量为5μg多肽。脱盐流程如下:
a)20μL质谱级0.1%FA溶解各个样品,并用质谱级5%FA调pH为2-3。
b)质谱级乙腈活化Ziptip脱盐柱3次,每次20μL,舍弃。
c)质谱级50%乙腈活化Ziptip脱盐柱3次,每次20μL,舍弃。
d)质谱级0.1%FA平衡Ziptip脱盐柱6次,每次20μL,舍弃。
e)载样:反复吸打溶解好的多肽样品,每次20μL,总共20次以上,保留。
f)脱盐:质谱级0.1%FA脱盐,每次20μL,共计10次,舍弃。
g)洗脱:30μL 50%乙腈洗脱Ziptip脱盐柱上的多肽样品,反复吸打,每次20μL,共计10次,保留。
h)洗脱后的样品,于真空浓缩仪中干燥,完成后保存于-20℃冰箱,待质谱进样。
9液质联用多肽样品分析
(1)使用的是100μm(内径)×2cm(长度)的预柱和75μm(内径)×12cm(长度)的分析柱。预柱和分析柱均装载DIKMA公司的C18填料。
(2)首先配置Nano-LC buffer A和Nano-LC buffer B,并将除盐后的多肽样品复溶于buffer A中。配置好的buffer A/B置于非接触式超声仪中超声20min,排除液体中的气泡。将bufffer A置于A泵中,buffer B置于B泵中,在线排除系统管道中的气泡。随后用已知质荷比的标准品对质谱检测器进行校准,误差满足在10ppm范围内。
(3)设置质谱参数。一级扫描和二级扫描质谱参数如表3。
表3质谱参数
Figure BDA0002666134090000101
此外,选择信号在2e5以上谱图做二级质谱,除电荷为+1、+8、>+8价态之外的母离子被筛选进行二级质谱分析,多肽自动匹配天然同位素峰,动态排除(dynamic exclude)时间为50.0ms。离子传输管温度为320℃,离子源电压为2.50千伏(KVS透镜的无线电频率为55.0。
(4)设定液相流速为300nL/min,参数如表4。此外,载样最大压力设定为250.0Bar,流动相为buffer A,总体积12μL。预柱的平衡压力为250.0Bar流动相为buffer A,总体积为6μL,分析柱的平衡压力为300.0Bar,流动相为bufferA,总体积为4μL。每次采样完成后,液相系统自动洗针,按照标准每次取100μL0.1%甲酸溶液。
表4 EASY-nanoLC洗脱梯度设置
Figure BDA0002666134090000102
(5)样品准备:除盐后的样品先用10μL含2%乙腈、0.1%甲酸水溶液充分溶解,10000g、4℃离心10min,取上清9.5μL加入到样品瓶中,依次放置于液相的样品盘。
(6)在控制质谱的电脑上按照样品放置的位置提交上样的序列,按照设定好的液相和质谱参数进行液质联用分析。
10原始数据搜库
同一个样品的10个组分的raw文件合并在一起搜库。搜库软件为Maxquant(版本1.6),参考的数据库为Swiss-Prot human protein sequence database(20413序列,2017/01/14更新)。母离子质量偏差为10ppm范围内,碎片离子质量偏差在0.02Da以内。允许最大有2个胰酶(Trypsin)漏切位点,设置半胱氨酸的脲基甲基化(Carbamidomethyl_C)为固定修饰,蛋氨酸的氧化Oxidation_M为动态修饰。选择二级离子定量TMT-10plex,蛋白和多肽的错误发现率均小于1%。
11数据处理过程
定量蛋白筛选条件:搜库完成后,得到的txt文件用excel打开,去除表中被标注为reverse和contaminant的蛋白,peptide counts为1的蛋白,报告基团在各样品中丰度均为零的蛋白后,余下的蛋白即为本次实验中的定量蛋白。取56个样本中均定量到的蛋白数的并集为本次实验中总共鉴定到的蛋白数;取56个样本中均定量到的蛋白数的交集为共同定量的蛋白数。取28个样本(即50%的比例)中共同定量到的蛋白进行功能蛋白的分析。
12结果:
(1)经T检验后(p<0.05),M0和M1蛋白变化比例大于1.2倍为显著变化的蛋白质。统计结果显示,有166个蛋白(包括有ATP5B蛋白、OPCML蛋白、MOG蛋白和GFAP蛋白)在发生认知障碍(M1)中下调,有13个蛋白质在发生认知障碍(M1)中上调,表明发病3个月后认知障碍组和非认知障碍组的血浆蛋白存在巨大的差异(图2)。
(2)对这些差异蛋白进行KEGG富集分析,发现发生认知障碍(M1)的缺血性脑卒中患者中下调的蛋白主要富集在碳代谢、帕金森病、阿尔茨海默病、氧化磷酸化、非酒精性脂肪肝(NAFLD)、柠檬酸循环(TCA循环)、糖酵解等通路,下调蛋白参与个代谢通路的基因详见图3。发生认知障碍患者血浆中(M1)上调蛋白因数目较少而未富集出显著的通路(图4),上调的蛋白信息详见表5。
表5认知障碍患者血浆中上调蛋白
Figure BDA0002666134090000121
(3)为了研究这些差异蛋白参与的生物过程、分子功能以及细胞成分,我们利用DAVID6.8进行了GO功能注释分析。首先是差异蛋白生物过程分析,如图4所示。可以发现在缺血性脑卒中发生后发生认知障碍(M1中下调的蛋白主要参与的生物过程有中脑多巴胺能神经元分化(midbrain dopaminergic neuron differentiation)、成纤维细胞迁移的调控regulation of fibroblast migration)、糖原生物合成过程(glycogen biosyntheticprocess)、蛋白质折叠(protein folding)、内源性凋亡信号通路的负调控(negativeregulation of intrinsic apoptotic signaling pathway)、三羧酸循环(tricarboxylicacid cycle)、活性氧代谢过程(reactive oxygen species metabolic process)、细胞氧化还原稳态(cell redox homeostasis)、碳水化合物代谢过程(carbohydrate metabolicprocess)、轴突形成(axonogenesis)等(见图5中A),这里值得注意的是钙离子流动也是下调。
在缺血性脑卒中发生后发生认知障碍(M1)中上调的蛋白主要参与的生物过程有脂蛋白分解代谢过程(lipoprotein catabolic process)、脂蛋白生物合成过程(lipoprotein biosynthetic process低密度脂蛋白颗粒重塑(ow-density lipoproteinparticle remodeling、胆固醇流出(cholesterol efflux)、甘油三酯分解代谢过程triglyceride catabolic process)、脂蛋白代谢过程(lipoprotein metabolicprocess)、胆固醇稳态(cholesterol homeostasis)、胆固醇代谢过程(cholesterolmetabolic process)、脂质转运(lipid transport等(图5中B)。
差异蛋白组成分析发现在缺血性脑卒中发生后发生认知障碍(M1中下调的蛋白主要富集到组成成分除了与胞外体、胞浆、膜、微管等各个细胞都包含的主成分外,其它大部分都是线粒体、线粒体呼吸链复合体、线粒体内膜、丙酮酸脱氢酶复合物、线粒体膜间隙、线粒体类核仁等能量代谢相关的主成分,这说明发生认知障碍与能量代谢相关(图6)。
缺血性脑卒中发生后发生认知障碍(M1中上调的蛋白主要富集到除了常规的细胞外区、细胞外间隙、胞外体、细胞外基质、质膜等,我们还可以发现中密度脂蛋白颗粒、低密度脂蛋白颗粒、乳糜微粒、极低密度脂蛋白颗粒等与脂蛋白相关的成分表达量也相对升高这提示我们血液中脂蛋白的含量与是否发现认知障碍有关,这一结论也与前期代谢物研究结果具有一致性。
(4)分子功能分析发现在缺血性脑卒中发生认知障碍(M1患者血浆中下调的蛋白主要的分子功能是与NAD、NADH结合相关(图7中A。此外,与钙离子结合相关的蛋白也相应的发生了下调。钙离子在机体内扮演重要角色,如促进神经递质分泌、心机细胞收缩等。在发生认知障碍(M1患者血浆中上调的蛋白主要的分子功能仍是与脂质转运、胆固醇转运、低密度脂蛋白颗粒受体结合、胆固醇结合、磷脂结合、脂质结合等与脂质代谢相关的蛋白(图7中B)。这与前面代谢物的结果,以及蛋白与生物进程、细胞成分的分析结果都是一致的即能量代谢下调与脂质堆积和认知障碍的发生密切相关。
实施例2
建立随机森林预测模型脑卒中发生后是否存在认知障碍
从以上差异分析,发现脑卒中发生后认知障碍组和非认知障碍组的血浆蛋白存在巨大的差异。为了验证缺血性脑卒中后是否存在与认知障碍相关的蛋白标志物,选取FDR<0.05且在28个病人中均被鉴定到的差异蛋白GFAP、ATP5B、OPCML和MOG,建立随机森林预测模型来验证这些蛋白是否可作为缺血性脑卒中后是否发生认知障碍的蛋白标志物。
使用筛选出来的变量建立预测模型及采用三折交叉验证的方式(将样本随机分为三组,两组作为验证集,一组作为训练集,依次进行训练和验证)进行评估。在选择进入模型构建的变量中不同蛋白进行分类时产生的平均减少基尼系数如图8所示,可以看出GFAP、ATP5B、OPCML、MOG这四个蛋白平均减少基尼系数依次递减。随机森林预测模型结果如表6和图9所示。
表6基于随机森林模型对验证数据集的分类
Figure BDA0002666134090000141
从表6中可以看出,所构建的随机森林预测模型灵敏度:16/17=94.12%;特异度:11/11=100%;阳性预测值:16/16=100%;阴性预测值:11/12=91.67%;诊断准确率:(16+11)/28=96.43%。通过绘制受试者特征曲线(ROC),求得曲线下面积(Area under curve,AUC)为0.9635(图9),这说明筛选出的上述差异蛋白,可以作为缺血性脑卒中发生后是否发生认知障碍的生物标志物。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 四川大学华西医院
<120> 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 529
<212> PRT
<213> 人工序列
<400> 1
Met Leu Gly Phe Val Gly Arg Val Ala Ala Ala Pro Ala Ser Gly Ala
1 5 10 15
Leu Arg Arg Leu Thr Pro Ser Ala Ser Leu Pro Pro Ala Gln Leu Leu
20 25 30
Leu Arg Ala Ala Pro Thr Ala Val His Pro Val Arg Asp Tyr Ala Ala
35 40 45
Gln Thr Ser Pro Ser Pro Lys Ala Gly Ala Ala Thr Gly Arg Ile Val
50 55 60
Ala Val Ile Gly Ala Val Val Asp Val Gln Phe Asp Glu Gly Leu Pro
65 70 75 80
Pro Ile Leu Asn Ala Leu Glu Val Gln Gly Arg Glu Thr Arg Leu Val
85 90 95
Leu Glu Val Ala Gln His Leu Gly Glu Ser Thr Val Arg Thr Ile Ala
100 105 110
Met Asp Gly Thr Glu Gly Leu Val Arg Gly Gln Lys Val Leu Asp Ser
115 120 125
Gly Ala Pro Ile Lys Ile Pro Val Gly Pro Glu Thr Leu Gly Arg Ile
130 135 140
Met Asn Val Ile Gly Glu Pro Ile Asp Glu Arg Gly Pro Ile Lys Thr
145 150 155 160
Lys Gln Phe Ala Pro Ile His Ala Glu Ala Pro Glu Phe Met Glu Met
165 170 175
Ser Val Glu Gln Glu Ile Leu Val Thr Gly Ile Lys Val Val Asp Leu
180 185 190
Leu Ala Pro Tyr Ala Lys Gly Gly Lys Ile Gly Leu Phe Gly Gly Ala
195 200 205
Gly Val Gly Lys Thr Val Leu Ile Met Glu Leu Ile Asn Asn Val Ala
210 215 220
Lys Ala His Gly Gly Tyr Ser Val Phe Ala Gly Val Gly Glu Arg Thr
225 230 235 240
Arg Glu Gly Asn Asp Leu Tyr His Glu Met Ile Glu Ser Gly Val Ile
245 250 255
Asn Leu Lys Asp Ala Thr Ser Lys Val Ala Leu Val Tyr Gly Gln Met
260 265 270
Asn Glu Pro Pro Gly Ala Arg Ala Arg Val Ala Leu Thr Gly Leu Thr
275 280 285
Val Ala Glu Tyr Phe Arg Asp Gln Glu Gly Gln Asp Val Leu Leu Phe
290 295 300
Ile Asp Asn Ile Phe Arg Phe Thr Gln Ala Gly Ser Glu Val Ser Ala
305 310 315 320
Leu Leu Gly Arg Ile Pro Ser Ala Val Gly Tyr Gln Pro Thr Leu Ala
325 330 335
Thr Asp Met Gly Thr Met Gln Glu Arg Ile Thr Thr Thr Lys Lys Gly
340 345 350
Ser Ile Thr Ser Val Gln Ala Ile Tyr Val Pro Ala Asp Asp Leu Thr
355 360 365
Asp Pro Ala Pro Ala Thr Thr Phe Ala His Leu Asp Ala Thr Thr Val
370 375 380
Leu Ser Arg Ala Ile Ala Glu Leu Gly Ile Tyr Pro Ala Val Asp Pro
385 390 395 400
Leu Asp Ser Thr Ser Arg Ile Met Asp Pro Asn Ile Val Gly Ser Glu
405 410 415
His Tyr Asp Val Ala Arg Gly Val Gln Lys Ile Leu Gln Asp Tyr Lys
420 425 430
Ser Leu Gln Asp Ile Ile Ala Ile Leu Gly Met Asp Glu Leu Ser Glu
435 440 445
Glu Asp Lys Leu Thr Val Ser Arg Ala Arg Lys Ile Gln Arg Phe Leu
450 455 460
Ser Gln Pro Phe Gln Val Ala Glu Val Phe Thr Gly His Met Gly Lys
465 470 475 480
Leu Val Pro Leu Lys Glu Thr Ile Lys Gly Phe Gln Gln Ile Leu Ala
485 490 495
Gly Glu Tyr Asp His Leu Pro Glu Gln Ala Phe Tyr Met Val Gly Pro
500 505 510
Ile Glu Glu Ala Val Ala Lys Ala Asp Lys Leu Ala Glu Glu His Ser
515 520 525
Ser
<210> 2
<211> 345
<212> PRT
<213> 人工序列
<400> 2
Met Gly Val Cys Gly Tyr Leu Phe Leu Pro Trp Lys Cys Leu Val Val
1 5 10 15
Val Ser Leu Arg Leu Leu Phe Leu Val Pro Thr Gly Val Pro Val Arg
20 25 30
Ser Gly Asp Ala Thr Phe Pro Lys Ala Met Asp Asn Val Thr Val Arg
35 40 45
Gln Gly Glu Ser Ala Thr Leu Arg Cys Thr Ile Asp Asp Arg Val Thr
50 55 60
Arg Val Ala Trp Leu Asn Arg Ser Thr Ile Leu Tyr Ala Gly Asn Asp
65 70 75 80
Lys Trp Ser Ile Asp Pro Arg Val Ile Ile Leu Val Asn Thr Pro Thr
85 90 95
Gln Tyr Ser Ile Met Ile Gln Asn Val Asp Val Tyr Asp Glu Gly Pro
100 105 110
Tyr Thr Cys Ser Val Gln Thr Asp Asn His Pro Lys Thr Ser Arg Val
115 120 125
His Leu Ile Val Gln Val Pro Pro Gln Ile Met Asn Ile Ser Ser Asp
130 135 140
Ile Thr Val Asn Glu Gly Ser Ser Val Thr Leu Leu Cys Leu Ala Ile
145 150 155 160
Gly Arg Pro Glu Pro Thr Val Thr Trp Arg His Leu Ser Val Lys Glu
165 170 175
Gly Gln Gly Phe Val Ser Glu Asp Glu Tyr Leu Glu Ile Ser Asp Ile
180 185 190
Lys Arg Asp Gln Ser Gly Glu Tyr Glu Cys Ser Ala Leu Asn Asp Val
195 200 205
Ala Ala Pro Asp Val Arg Lys Val Lys Ile Thr Val Asn Tyr Pro Pro
210 215 220
Tyr Ile Ser Lys Ala Lys Asn Thr Gly Val Ser Val Gly Gln Lys Gly
225 230 235 240
Ile Leu Ser Cys Glu Ala Ser Ala Val Pro Met Ala Glu Phe Gln Trp
245 250 255
Phe Lys Glu Glu Thr Arg Leu Ala Thr Gly Leu Asp Gly Met Arg Ile
260 265 270
Glu Asn Lys Gly Arg Met Ser Thr Leu Thr Phe Phe Asn Val Ser Glu
275 280 285
Lys Asp Tyr Gly Asn Tyr Thr Cys Val Ala Thr Asn Lys Leu Gly Asn
290 295 300
Thr Asn Ala Ser Ile Thr Leu Tyr Gly Pro Gly Ala Val Ile Asp Gly
305 310 315 320
Val Asn Ser Ala Ser Arg Ala Leu Ala Cys Leu Trp Leu Ser Gly Thr
325 330 335
Leu Leu Ala His Phe Phe Ile Lys Phe
340 345
<210> 3
<211> 247
<212> PRT
<213> 人工序列
<400> 3
Met Ala Ser Leu Ser Arg Pro Ser Leu Pro Ser Cys Leu Cys Ser Phe
1 5 10 15
Leu Leu Leu Leu Leu Leu Gln Val Ser Ser Ser Tyr Ala Gly Gln Phe
20 25 30
Arg Val Ile Gly Pro Arg His Pro Ile Arg Ala Leu Val Gly Asp Glu
35 40 45
Val Glu Leu Pro Cys Arg Ile Ser Pro Gly Lys Asn Ala Thr Gly Met
50 55 60
Glu Val Gly Trp Tyr Arg Pro Pro Phe Ser Arg Val Val His Leu Tyr
65 70 75 80
Arg Asn Gly Lys Asp Gln Asp Gly Asp Gln Ala Pro Glu Tyr Arg Gly
85 90 95
Arg Thr Glu Leu Leu Lys Asp Ala Ile Gly Glu Gly Lys Val Thr Leu
100 105 110
Arg Ile Arg Asn Val Arg Phe Ser Asp Glu Gly Gly Phe Thr Cys Phe
115 120 125
Phe Arg Asp His Ser Tyr Gln Glu Glu Ala Ala Met Glu Leu Lys Val
130 135 140
Glu Asp Pro Phe Tyr Trp Val Ser Pro Gly Val Leu Val Leu Leu Ala
145 150 155 160
Val Leu Pro Val Leu Leu Leu Gln Ile Thr Val Gly Leu Ile Phe Leu
165 170 175
Cys Leu Gln Tyr Arg Leu Arg Gly Lys Leu Arg Ala Glu Ile Glu Asn
180 185 190
Leu His Arg Thr Phe Asp Pro His Phe Leu Arg Val Pro Cys Trp Lys
195 200 205
Ile Thr Leu Phe Val Ile Val Pro Val Leu Gly Pro Leu Val Ala Leu
210 215 220
Ile Ile Cys Tyr Asn Trp Leu His Arg Arg Leu Ala Gly Gln Phe Leu
225 230 235 240
Glu Glu Leu Arg Asn Pro Phe
245
<210> 4
<211> 432
<212> PRT
<213> 人工序列
<400> 4
Met Glu Arg Arg Arg Ile Thr Ser Ala Ala Arg Arg Ser Tyr Val Ser
1 5 10 15
Ser Gly Glu Met Met Val Gly Gly Leu Ala Pro Gly Arg Arg Leu Gly
20 25 30
Pro Gly Thr Arg Leu Ser Leu Ala Arg Met Pro Pro Pro Leu Pro Thr
35 40 45
Arg Val Asp Phe Ser Leu Ala Gly Ala Leu Asn Ala Gly Phe Lys Glu
50 55 60
Thr Arg Ala Ser Glu Arg Ala Glu Met Met Glu Leu Asn Asp Arg Phe
65 70 75 80
Ala Ser Tyr Ile Glu Lys Val Arg Phe Leu Glu Gln Gln Asn Lys Ala
85 90 95
Leu Ala Ala Glu Leu Asn Gln Leu Arg Ala Lys Glu Pro Thr Lys Leu
100 105 110
Ala Asp Val Tyr Gln Ala Glu Leu Arg Glu Leu Arg Leu Arg Leu Asp
115 120 125
Gln Leu Thr Ala Asn Ser Ala Arg Leu Glu Val Glu Arg Asp Asn Leu
130 135 140
Ala Gln Asp Leu Ala Thr Val Arg Gln Lys Leu Gln Asp Glu Thr Asn
145 150 155 160
Leu Arg Leu Glu Ala Glu Asn Asn Leu Ala Ala Tyr Arg Gln Glu Ala
165 170 175
Asp Glu Ala Thr Leu Ala Arg Leu Asp Leu Glu Arg Lys Ile Glu Ser
180 185 190
Leu Glu Glu Glu Ile Arg Phe Leu Arg Lys Ile His Glu Glu Glu Val
195 200 205
Arg Glu Leu Gln Glu Gln Leu Ala Arg Gln Gln Val His Val Glu Leu
210 215 220
Asp Val Ala Lys Pro Asp Leu Thr Ala Ala Leu Lys Glu Ile Arg Thr
225 230 235 240
Gln Tyr Glu Ala Met Ala Ser Ser Asn Met His Glu Ala Glu Glu Trp
245 250 255
Tyr Arg Ser Lys Phe Ala Asp Leu Thr Asp Ala Ala Ala Arg Asn Ala
260 265 270
Glu Leu Leu Arg Gln Ala Lys His Glu Ala Asn Asp Tyr Arg Arg Gln
275 280 285
Leu Gln Ser Leu Thr Cys Asp Leu Glu Ser Leu Arg Gly Thr Asn Glu
290 295 300
Ser Leu Glu Arg Gln Met Arg Glu Gln Glu Glu Arg His Val Arg Glu
305 310 315 320
Ala Ala Ser Tyr Gln Glu Ala Leu Ala Arg Leu Glu Glu Glu Gly Gln
325 330 335
Ser Leu Lys Asp Glu Met Ala Arg His Leu Gln Glu Tyr Gln Asp Leu
340 345 350
Leu Asn Val Lys Leu Ala Leu Asp Ile Glu Ile Ala Thr Tyr Arg Lys
355 360 365
Leu Leu Glu Gly Glu Glu Asn Arg Ile Thr Ile Pro Val Gln Thr Phe
370 375 380
Ser Asn Leu Gln Ile Arg Glu Thr Ser Leu Asp Thr Lys Ser Val Ser
385 390 395 400
Glu Gly His Leu Lys Arg Asn Ile Val Val Lys Thr Val Glu Met Arg
405 410 415
Asp Gly Glu Val Ile Lys Glu Ser Lys Gln Glu His Lys Asp Val Met
420 425 430

Claims (6)

1.检测蛋白标志物的试剂在制备用于诊断脑卒中患者存在认知障碍的试剂盒中的应用;
所述蛋白标志物包括ATP5B蛋白、OPCML蛋白、MOG蛋白和GFAP蛋白;
所述试剂包括抗所述蛋白标志物的抗体。
2.一种用于预测脑卒中患者是否存在认知障碍风险的模型的训练方法,其特征在于,其包括如下步骤:
步骤S1:获取样本中的蛋白标志物浓度数据,所述样本来自脑卒中患者;所述蛋白标志物为权利要求1所述的蛋白标志物;
步骤S2:利用获得的蛋白标志物浓度数据对预先建立的机器学习模型进行训练,获得用于预测脑卒中患者是否存在认知障碍风险的模型。
3.根据权利要求2所述的训练方法,其特征在于,所述预先建立的机器学习模型通过以下至少一个算法构建:随机森林算法、贝叶斯分类器、多元非线性回归拟合方法、Adaboost算法、支持向量机、K均值算法、决策树算法、K近邻算法、线性回归、逻辑回归、神经网络、隐马尔可夫模型、极限学习机和聚类算法中的至少一种。
4.根据权利要求2所述的训练方法,其特征在于,所述样本为血液样本。
5.根据权利要求4所述的训练方法,其特征在于,所述样本的数量至少为20份。
6.根据权利要求5所述的训练方法,其特征在于,所述样本的数量为28份。
CN202010919301.XA 2020-09-04 2020-09-04 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法 Active CN111983241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010919301.XA CN111983241B (zh) 2020-09-04 2020-09-04 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010919301.XA CN111983241B (zh) 2020-09-04 2020-09-04 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法

Publications (2)

Publication Number Publication Date
CN111983241A CN111983241A (zh) 2020-11-24
CN111983241B true CN111983241B (zh) 2022-05-20

Family

ID=73448082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010919301.XA Active CN111983241B (zh) 2020-09-04 2020-09-04 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法

Country Status (1)

Country Link
CN (1) CN111983241B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114005546B (zh) * 2021-12-31 2022-05-03 四川大学华西医院 一种基于随机森林模型特征空间拟合的病情预测方法
CN115517682B (zh) * 2022-11-25 2023-01-31 四川大学华西医院 基于胃肠电信号的认知功能障碍预测系统及构建方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2322163A1 (en) * 2009-11-03 2011-05-18 Pharnext New therapeutics approaches for treating alzheimer disease
JP5808349B2 (ja) * 2010-03-01 2015-11-10 カリス ライフ サイエンシズ スウィッツァーランド ホールディングスゲーエムベーハー セラノーシスのためのバイオマーカー
TW201138808A (en) * 2010-05-03 2011-11-16 Bristol Myers Squibb Co Serum albumin binding molecules
US8685404B2 (en) * 2011-01-31 2014-04-01 Oregon Health & Science University Recombinant T-cell receptor ligand for the treatment of cognitive and neuropsychiatric impairment induced by substance addiction
EP3452101A2 (en) * 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
US11725232B2 (en) * 2016-10-31 2023-08-15 The Hong Kong University Of Science And Technology Compositions, methods and kits for detection of genetic variants for alzheimer's disease
SG11202000331YA (en) * 2017-07-13 2020-02-27 Michael David Forrest Therapeutic modulators of the reverse mode of atp synthase
WO2019034862A1 (en) * 2017-08-14 2019-02-21 Apitope Technology (Bristol) Limited METHOD
US20210311076A1 (en) * 2018-07-16 2021-10-07 University Of Virginia Patent Foundation Compositions and methods of diagnosis and treatment for neurological diseases
US20220096520A1 (en) * 2018-12-06 2022-03-31 Arcturus Therapeutics, Inc. Modified proteins and associated methods of treatment
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN110658314B (zh) * 2019-10-12 2021-06-29 四川大学 化合物的靶点的鉴定方法、化合物与靶标相互作用的检测方法和化合物药效的评价方法

Also Published As

Publication number Publication date
CN111983241A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
EP3510402B1 (en) Detection of cancer biomarkers using nanoparticles
Sadowski et al. Quantitative proteomic approach to study subcellular localization of membrane proteins
CN111983241B (zh) 诊断脑卒中认知障碍的蛋白标志物以及模型的训练方法
CN111562338B (zh) 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用
CN109709220B (zh) 一种用于诊断膀胱癌的联合标志物及试剂盒和应用
Xu et al. Discovery of potential plasma protein biomarkers for acute myocardial infarction via proteomics
US20090053828A1 (en) Detection of glycopeptides and glycoproteins for medical diagnostics
Guo et al. Recent advances in the analysis of polysialic acid from complex biological systems
Manta et al. Tools to evaluate the conformation of protein products
Gao et al. Offline coupling of asymmetrical flow field-flow fractionation and capillary electrophoresis for separation of extracellular vesicles
Dowling et al. Recent advances in clinical proteomics using mass spectrometry
Liang et al. Detection of salivary protein biomarkers of saliva secretion disorder in a primary Sjögren syndrome murine model
CN107102152B (zh) 尿液中心肌梗死的蛋白标志物及其在诊断和预后中的用途
Wildsmith et al. Method for the simultaneous quantitation of apolipoprotein E isoforms using tandem mass spectrometry
Abdulwahab et al. Association of TATA box-binding protein-associated factor RNA polymerase I subunit C (TAF1C) with T2DM
Zhao et al. Polymeric nanoassemblies for enrichment and detection of peptides and proteins in human breast milk
CN114593979A (zh) 一种基于质谱检测体液样本里中低丰度蛋白的方法
CN108957013B (zh) 与骨关节炎相关的iglon5和serpinb13蛋白及其应用
Govorun et al. Proteomics and peptidomics in fundamental and applied medical studies
Nguyen et al. Isolation protocols and mitochondrial content for plasma extracellular vesicles
CN103570826A (zh) 新一代宫颈癌特异预警血浆蛋白
Lee et al. Development of a parallel microbore hollow fiber enzyme reactor platform for online 18O-labeling: Application to lectin-specific lung cancer N-glycoproteome
Šoić et al. In a pursuit of optimal glycan fluorescent label for negative MS mode for high-throughput N-glycan analysis
Shushkova et al. Quantitative proteomics of human blood exosomes
CN113447654B (zh) 质谱技术检测尿液中psm-e分子水平在制备用于早期诊断前列腺癌产品中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant