CN117051102A - 生物标志物组合在制备预测帕金森病的产品中的应用 - Google Patents

生物标志物组合在制备预测帕金森病的产品中的应用 Download PDF

Info

Publication number
CN117051102A
CN117051102A CN202311316316.7A CN202311316316A CN117051102A CN 117051102 A CN117051102 A CN 117051102A CN 202311316316 A CN202311316316 A CN 202311316316A CN 117051102 A CN117051102 A CN 117051102A
Authority
CN
China
Prior art keywords
sample
parkinsonism
biomarker
protein
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311316316.7A
Other languages
English (en)
Other versions
CN117051102B (zh
Inventor
李明珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aipu Tikang Biotechnology Co ltd
Original Assignee
Shanghai Aipu Tikang Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aipu Tikang Biotechnology Co ltd filed Critical Shanghai Aipu Tikang Biotechnology Co ltd
Priority to CN202311316316.7A priority Critical patent/CN117051102B/zh
Publication of CN117051102A publication Critical patent/CN117051102A/zh
Application granted granted Critical
Publication of CN117051102B publication Critical patent/CN117051102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/2835Movement disorders, e.g. Parkinson, Huntington, Tourette

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开一种生物标志物组合在制备预测或诊断帕金森病的产品中的应用,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。本发明中31种蛋白生物标志物组合可以作为帕金森病患者的风险预估与检测,具有高灵敏度和高特异性的优点,为帕金森病患者早期筛查诊断、干预治疗等提供有利的技术支持。

Description

生物标志物组合在制备预测帕金森病的产品中的应用
技术领域
本发明属于生物医药技术和诊断领域,具体涉及一种生物标志物组合在制备预测或诊断帕金森病的产品中的应用。
背景技术
帕金森病(Parkinson’sdisease,PD)是中老年人常见的一种神经系统变性疾病,也是中老年人最常见的锥体外系疾病。PD影响超过1%的人口,是仅次于阿尔茨海默氏症的第二大神经退行性疾病。随着预期寿命的延长,到2030年患病人数可能从600万人增加到1200万人。65岁以上人群患病率为1000/10万,随年龄增高,男性稍多于女性。PD的临床表现主要为运动迟缓、静止性震颤、肌肉强直、步态姿势异常、抑郁等症状,其发病机制迄今不明。
目前,常用的PD诊断手段包括以下几个方面:成像生物标志物(如分子成像、经颅超声检查、磁共振成像)、心理情感报告、嗅觉视力障碍评估和生化生物标志物等。成像生物标志物具有无创、安全等优势,但是更多是提供解剖图像技术,不能尽早的发现脑部组织病变;心理情感报告、嗅觉视力障碍等评估手段不具有诊断特异性且标志物重现性较低,但可以结合神经影像学确证疾病;目前临床上开发了大量的生化生物标志物(例如DJ-1、α-突触核蛋白、神经丝轻链、溶酶体酶等)用于早期PD检测,这些生化生物标志物还需要进一步的研究确认,为精准医疗提供方案。
尽管在PD患者管理和临床研究方面付出了艰巨的努力,但在诊断、跟踪疾病进展和改善预后等方面的技术并不理想。目前,PD治疗的重大局限在于多数主要症状出现晚,大多数患者往往在发病的中后期才被确诊,现有的治疗手段以药物干预为主,但药物干预只能减轻PD症状,不能完全根治。因此,迫切需要具有高敏感性和高特异性的可用于早期诊断、检测疾病进展的生物标志物变得尤为重要。
发明内容
本发明为了解决上述技术问题,提供了一种生物标志物组合在制备预测或诊断帕金森病的产品中的应用。
本发明第一方面提供一种生物标志物组合在制备预测或诊断帕金森病的产品中的应用,其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
本发明第二方面提供一种用于检测生物标志物组合的试剂,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
在某一较佳实施方案中,所述试剂用于检测所述生物标志物组合的表达水平。
在某一较佳实施方案中,所述试剂为与所述生物标志物特异性结合的试剂,或者为与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
在某一较佳实施方案中,所述试剂为用于基因组、转录组和/或蛋白质组测序的试剂。
在某一较佳实施方案中,所述表达水平为蛋白表达水平和/或mRNA转录水平,和/或,所述生物分子试剂选自引物、探针和抗体中的一种或多种。
本发明第三方面提供一种生物标志物组合,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
本发明第四方面提供一种试剂盒,所述试剂盒包含如本发明第二方面所述的试剂和/或如本发明第三方面所述的生物标志物组合。
本发明第五方面提供一种构建帕金森病预测模型的方法,所述方法包括:将样本中的生物标志物组合对应的蛋白表达量数据输入含广义线性回归模型的Caret R包中进行机器学习,得到帕金森病预测模型;
所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
本发明所述的Caret R包的代码为开源的。
在某一较佳实施方案中,所述样本包括但不限于帕金森病患者的体液外泌体,例如唾液、血液(血清或血浆)、尿液和脑脊液等。
在一具体实施方案中,所述广义线性回归模型的参数为:采用向后回归的方法筛选标志物,并利用R包Caret的train功能进行模型训练和predict函数进行预测。优选地,所述广义线性回归模型的R包包括:predict.model = train(formula, data= train_data,method = "glm", family='binomial') (formula:模型公式,输入的分子组合;train_data:训练集);预测代码:predict( predict.model, test_data)(predict.model:训练集得到的预测模型,test_data:内部或者外部验证集)。
优选地,检验的样本为帕金森病患者的唾液。
在某一较佳实施方案中,在进行机器学习前,所述样本经DDA方式采集所述蛋白表达量数据,并通过Firmiana软件进行肽段匹配。
在某一较佳实施方案中,所述样本包括帕金森病患者和健康人。
在某一较佳实施方案中,输入广义线性回归模型的蛋白表达量数据满足:样本中所述生物标志物组合对应的蛋白表达量为健康人的相应蛋白表达量的1.5倍或1.5倍以上,且t-test检验p值小于0.05。
在某一较佳实施方案中,所述肽段匹配利用UniProt人类蛋白质数据库。
在某一较佳实施方案中,在进行机器学习前,对所述样本进行分组,得到建模组样本和验证组样本。
所述建模组样本用于帕金森病预测模型构建,所述验证组样本用于验证所述帕金森病预测模型。
在某一较佳实施方案中,输入广义线性回归模型的蛋白量表达数据为蛋白频度大于或大于等于30%。
在某一较佳实施方案中,采用验证组样本进行验证的步骤包括:计算样本中生物标志物组合的蛋白表达量数据的特异性曲线的线下面积、灵敏度和特异性;并根据所述线下面积、灵敏度和特异性判断预测模型的准确性。
在某一较佳实施方案中,所述方法中还包括判断样本是否患帕金森病,当概率大于或大于等于0.5,则判断为样本患帕金森病;当概率小于0.5,则判断样本不患帕金森病。
在本发明一较佳实施方案中,所述蛋白表达量数据通过LC-MS技术得到,使用DDA(data-dependent acquisition,数据依赖性)检测方式采集。
优选地,所述DDA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库。
进一步优选地,采用Firmiana处理后的蛋白表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ(intensity-based absolute-protein-quantification)除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白表达量数据输入广义线性回归模型 。
本发明第六方面提供一种帕金森病的预测模型,所述预测模型通过如本发明第五方面所述的方法构建获得。
本发明第七方面提供一种针对帕金森病的预测系统,所述预测系统包括分析判断模块,所述分析判断模块中含有如本发明第六方面所述的预测模型,用于输出样本是否患帕金森病的预测结果;
其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
在某一较佳实施方案中,所述检测模块检测待测样本中的生物标志物组合对应的蛋白表达水平,并将表达水平数据传输至所述分析判断模块。
本发明第八方面提供一种预测帕金森病的方法,通过如本发明第二方面所述的试剂、如本发明第三方面所述的生物标志物组合、如本发明第四方面所述的试剂盒、如本发明第六方面所述的预测模型或如本发明第七方面所述的预测系统对样本进行预测。
本发明第九方面提供一种如本发明第二方面所述的试剂、如本发明第三方面所述的生物标志物组合、如本发明第四方面所述的试剂盒、如本发明第六方面所述的预测模型或如本发明第七方面所述的预测系统在帕金森病预测中的应用。
本发明第十方面提供一种如本发明第二方面所述的试剂在制备预测或诊断帕金森病的试剂盒中的应用;其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
本发明第十一方面提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如本发明第八方面所述的方法的步骤,或实现如本发明第六方面所述的预测模型或如本发明第七方面所述的预测系统的功能。
本发明第十二方面提供一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如本发明第八方面所述的方法的步骤,或实现如本发明第六方面所述的预测模型或如本发明第七方面所述的预测系统的功能。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
通过实验发现本发明提供的31种蛋白生物标志物在帕金森病患者的唾液样本中的表达水平存在显著变化,因此本发明中提供的这些蛋白生物标志物组合可以作为帕金森病患者的风险预估与检测,具有高灵敏度和高特异性的优点,为帕金森病患者早期筛查诊断、干预治疗等提供有利的技术支持。基于帕金森病患者的唾液蛋白生物标志物研制相应的辅助早期诊断试剂盒,具有广泛的科研价值并为早期临床诊断、干预治疗等提供了巨大的便利。
附图说明
图1显示31个蛋白分子生物标志物联用在帕金森疾病组和健康对照组的训练集中的ROC曲线。
图2为31个蛋白分子生物标志物联用在帕金森疾病组和健康对照组的训练集中的混淆矩阵结果,包括预测准确率(阳性准确率为75.47%、阴性准确率为98.99%),灵敏度(97.56%)和特异性(88.29%)结果。
图3显示31个蛋白分子生物标志物联用在帕金森疾病组和健康对照组的内部验证集中的ROC曲线。
图4为31个蛋白分子生物标志物联用在帕金森疾病组和健康对照组的内部验证集中的混淆矩阵结果,包括预测准确率(阳性准确率为73.08%、阴性准确率为92.00%),灵敏度(90.48%)和特异性(76.67%)结果。
图5为预测帕金森病风险的系统的结构示意图。
图6为电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例中所需的帕金森疾病组和健康对照组样本均来自复旦大学附属华山医院,其中124例帕金森疾病组和79例健康对照组。本研究的设计和实施由复旦大学附属华山医院伦理审查委员会通过伦理投票批准和监督。已获得所有患者的书面知情同意。
实施例1
1、PD唾液样本前处理
向50μL唾液样本中加入100uL浓度为50mM的碳酸氢铵,涡旋混匀1min,将样品95℃加热孵育4min使蛋白质热变性,冷却至室温后,向体系中加入2μg胰蛋白酶(Trypsin),于37℃下振荡18h,然后向体系中加入10μL氨水停止酶解。将酶解后肽段样本进行脱盐处理,抽干,冻存于-80℃直至质谱检测。
2、PD唾液样本的质谱检测
用OrbitrapFusionLumos三合一高分辨质谱系统(ThermoFisherScientific,Rockford,USA)串联高效液相色谱系统(EASY-nLC1200,ThermoFisher)进行检测,并得到该肽样品对应的全蛋白的质谱数据。具体操作为:
采用纳流液相色谱,色谱柱为自制C18色谱柱(150μmID×8cm,1.9μm/120Å填料)。柱温箱温度60℃。将干粉状肽使用上样缓冲液(0.1%甲酸的水溶液)复溶,上样后经色谱柱分离,以600nL/min的线性6–30%流动相B(ACN和0.1%甲酸)洗脱,利用150min液相梯度结合数据依赖性获取(DDA)的质谱检测手段。DDA质谱检测参数设置如下:离子模式为正离子;一级质谱分辨率120K,最大注入时间为80ms,AGCTarget为3e6,扫描范围为300-1400m/z;二级质谱分辨率7.5K,最大注入时间为20ms,AGCTarget为5e4,碰撞能量27%;液相色谱串联质谱系统使用Xcalibur软件控制进行数据采集。
3、数据分析
所有数据均使用Firmiana对UniProt人蛋白质数据库(于2013.07.04更新,32015个条目)进行搜索处理。Firmiana是一个基于Galaxy系统的工作流,由用户登录界面、原数据、识别与量化、数据分析和知识挖掘等多个功能模块组成。母离子的质量差为20ppm,子离子的质量差为50mmu。最多允许两个漏切位点。搜索引擎将半胱氨酸氨基甲酰甲基化设置为固定修饰,将甲硫氨酸的N-乙酰化和氧化设置为可变修饰。母离子电荷范围设为+2,+3和+4。错误发现率(FDR)设为1%。
将所鉴定的肽段定量结果记为所有参考谱库中色谱碎片离子峰面积的平均值。使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量。我们计算了峰面积值作为相应蛋白质的一部分。总分数(FOT)用于表示样品中特定蛋白质的标准化丰度。FOT定义为蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ。选择具有至少一条专属肽段(uniquepeptide)且1%FDR的蛋白质进行进一步分析。
4、建立预测模型
将124例阳性病例和79例阴性病例作为建模组。首先通过Frequency>30%,筛选出807种较为广泛最存在的蛋白质。再在帕金森病患者的样本和健康样本之间通过对比选取表达存在显著差异的分子(FOT差异倍数大于1.5倍,且t-test检验p值小于0.05),共136种蛋白被选出作为候选标志物。
基于回归分类器,并依据广义线性回归分析,将各候选标志物的FOT值输入CaretR包建立预测模型。根据Caret R包的代码筛选出以下蛋白分子标志物作为预测帕金森病的最优标注物组合:CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH。
具体地,所述广义线性回归模型的参数为:采用向后回归的方法筛选标志物,并利用R包Caret的train功能进行模型训练和predict函数进行预测。优选地,所述广义线性回归模型的R包包括:predict.model = train(formula, data= train_data, method = "glm", family='binomial') (formula:模型公式,输入的分子组合;train_data:训练集);预测代码:predict( predict.model, test_data)(predict.model:训练集得到的预测模型,test_data:内部或者外部验证集)。 其中,对样本的判断是根据广义线性回归分析进行分析的,若标志物组合的表达水平的概率大于0.5,则判定为正样本,否则是负样本。
在复旦大学附属华山医院的帕金森病患者的唾液样本中筛选得到的31种蛋白生物标志物(CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH),并建立了分析这些标志物的模型。对这31种标志物的蛋白相对表达水平绘制ROC曲线(Receiver Operating Curve)计算AUC(Area Under the ROC Curve),所有样本包括124例阳性病例,79例阴性病例。75%的样本作为训练集(99例阳性病例,53例阴性病例,输入模型的训练集原始检测数据见表1,即训练集中蛋白的表达矩阵,为FOT值),其AUC=0.872(见图1)。由图2可知,训练集中模型的诊断灵敏度97.56%,特异性88.29%,阳性准确率为75.47%,阴性准确率为98.99%。25%的样本作为验证集(25例阳性病例,26例阴性病例,输入模型的验证集集原始检测数据见表2,即验证集中蛋白的表达矩阵,为FOT值),其AUC=0.825(见图3)。由图4可知,验证集中模型的诊断灵敏度90.48%,特异性76.67%,阳性准确率为73.08%、阴性准确率为92.00%。
分析方法参见Karimollah Hajian-Tilaki, Receiver OperatingCharacteristic (ROC) Curve Analysis for Medical Diagnostic Test Evaluation,Caspian J Intern Med2013; 4(2): 627-635。
表1 输入模型的训练集原始检测数据
表2 输入模型的验证集原始检测数据
由上述结果可知,帕金森病患者唾液中的31种蛋白生物标志物(CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH)联用,可用于帕金森病患者的早期筛查及诊断。
对于待测样本是否为帕金森病的患者,将蛋白质分子生物标志物的经如上所述的DDA收集的表达水平(FOT)输入所得预测模型,得到判断是否为帕金森病的输出结果。
实施例2 预测帕金森病风险的系统
预测帕金森病风险的系统61:数据处理模块52和判断并输出模块53,还包括数据收集模块51(图5)。
数据收集模块51用于收集患者帕金森病组织样本中所述生物标志物组合的表达水平数据,并将其传输给数据处理模块。
数据处理模块52用于将接收或输入生物标志物组合的表达水平数据按如实施例1所述的数据分析方法进行分析,得到计算结果。其中,所述生物标志物组合的表达水平数据可通过数据收集模块51进行收集,亦可从其他来源获取所述生物标志物组合的表达水平数据。
判断并输出模块53用于判断所述的计算结果是否符合预设的判断条件,即患帕金森病风险概率大于或等于不患帕金森病风险预测概率,以预测帕金森病的风险,并输出预测结果;其中,在所述判断并输出模块中,当所述表达水平数据满足所述判断条件患帕金森病风险的概率大于或等于不患帕金森病的风险预测概率时,输出预测结果为“具有患帕金森病风险”;当所述表达水平数据不满足所述判断条件患帕金森病风险概率小于不患帕金森病风险预测概率时,输出预测结果为“不具有患帕金森病的风险”。
实施例3 电子设备
本实施例提供了一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现本发明实施例1中预测帕金森病风险的方法。
图6示出了本实施例的硬件结构示意图,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序,和/或工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1的数据分析方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4 计算机可读存储介质
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例1中预测帕金森病风险的方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现本发明实施例1中预测帕金森病风险的方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
最后,上述具体实施方法仅用以说明本发明的技术方案,而非对其限制。
生物标志物全称(可参考genecards数据库)
CDC42:Cell Division Cycle 42
PRKCSH:Protein Kinase C Substrate 80K-H
KLK6:Kallikrein Related Peptidase 6
H6PD:Hexose-6-Phosphate Dehydrogenase
SAA1:Serum Amyloid A1
KIAA1244:Brefeldin A-inhibited guanine nucleotide-exchange protein 3
APOD:Apolipoprotein D
PEBP4:Phosphatidylethanolamine Binding Protein 4
LMNB1:Lamin B1
ITIH1:Inter-Alpha-Trypsin Inhibitor Heavy Chain 1
KNG1:Kininogen 1
PDGFC:Platelet Derived Growth Factor C
MNDA:Myeloid Cell Nuclear Differentiation Antigen
CNN2:Calponin 2
DSC3:Desmocollin 3
FCN3:Ficolin 3
PRDX1:Peroxiredoxin 1
PSMB5:Proteasome 20S Subunit Beta 5
MARCKS:Myristoylated Alanine Rich Protein Kinase C Substrate
AFM:Afamin
ITIH2:Inter-Alpha-Trypsin Inhibitor Heavy Chain 2
GPX3:Glutathione Peroxidase 3
SERPINC1:Serpin Family C Member 1
SERPINA6:Serpin Family A Member 6
PON1:Paraoxonase 1
GNS:Glucosamine (N-Acetyl)-6-Sulfatase
CTSL:Cathepsin L
CLEC3B:C-Type Lectin Domain Family 3 Member B
CD55:CD55 Molecule (Cromer Blood Group)
ORM1:Orosomucoid 1
GAPDH:Glyceraldehyde-3-Phosphate Dehydrogenase。

Claims (14)

1.一种生物标志物组合在制备预测或诊断帕金森病的产品中的应用,其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
2.一种用于检测生物标志物组合的试剂,其特征在于,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
3.如权利要求2所述的试剂,其特征在于,所述试剂用于检测所述生物标志物组合的表达水平;
和/或,所述试剂为与所述生物标志物特异性结合的试剂,或者为与编码所述生物标志物的核酸特异性杂交的生物分子试剂;
和/或,所述试剂为用于基因组、转录组和/或蛋白质组测序的试剂。
4.如权利要求3所述的试剂,其特征在于,所述表达水平为蛋白表达水平和/或mRNA转录水平,和/或,所述生物分子试剂选自引物、探针和抗体中的一种或多种。
5.一种试剂盒,其特征在于,所述试剂盒包含如权利要求2~4任一项所述的试剂。
6. 一种构建帕金森病预测模型的方法,其特征在于,所述方法包括:将来自患者样本中的生物标志物组合对应的蛋白表达量数据输入含广义线性回归模型的Caret R包中进行机器学习,得到帕金森病预测模型;
所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
7.如权利要求6所述的方法,其特征在于,所述样本来自血浆、尿液、唾液或脑脊液;
和/或,在进行机器学习前,所述样本经DDA方式采集所述蛋白表达量数据,并通过Firmiana软件进行肽段匹配;
和/或,所述样本包括帕金森病患者和健康人;
和/或,输入广义线性回归模型的蛋白表达量数据满足:样本中所述生物标志物组合对应的蛋白表达量为健康人的相应蛋白表达量1.5或1.5以上,且t-test检验p值小于0.05。
8.如权利要求7所述的方法,其特征在于,所述肽段匹配利用UniProt人类蛋白质数据库;
和/或,在进行机器学习前,对所述样本进行分组,得到建模组样本和验证组样本,建模组样本用于帕金森病预测模型构建,验证组样本用于验证所述帕金森病预测模型;
和/或,输入广义线性回归模型的蛋白量表达数据为蛋白频度大于或大于等于30%;
和/或,采用验证组样本进行验证的步骤包括:计算样本中生物标志物组合的蛋白表达量数据的特异性曲线的线下面积、灵敏度和特异性;并根据所述线下面积、灵敏度和特异性判断预测模型的准确性;
和/或,所述方法中还包括判断样本是否患帕金森病,当概率大于或大于等于0.5,则判断为样本患帕金森病;概率小于0.5,则判断样本不患帕金森病。
9.一种帕金森病的预测模型,其特征在于,所述预测模型通过如权利要求6~8任一项所述的方法构建获得。
10.一种针对帕金森病的预测系统,其特征在于,所述预测系统包括分析判断模块;所述分析判断模块中含有如权利要求9所述的预测模型,用于输出样本是否患帕金森病的预测结果;
其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
11.如权利要求10所述的预测系统,其特征在于,所述预测系统还包括检测模块,所述检测模块检测待测样本中的生物标志物组合对应的蛋白表达水平,并将表达水平数据传输至所述分析判断模块。
12.如权利要求2~4任一项所述的试剂在制备预测或诊断帕金森病的药物中的应用;其中,所述生物标志物组合由CDC42、PRKCSH、KLK6、H6PD、SAA1、KIAA1244、APOD、PEBP4、LMNB1、ITIH1、KNG1、PDGFC、MNDA、CNN2、DSC3、FCN3、PRDX1、PSMB5、MARCKS、AFM、ITIH2、GPX3、SERPINC1、SERPINA6、PON1、GNS、CTSL、CLEC3B、CD55、ORM1和GAPDH组成。
13.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,可实现如权利要求9所述的预测模型或如权利要求10或11所述的预测系统的功能。
14.一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序以实现如权利要求9所述的预测模型或如权利要求10或11所述的预测系统的功能。
CN202311316316.7A 2023-10-12 2023-10-12 生物标志物组合在制备预测帕金森病的产品中的应用 Active CN117051102B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311316316.7A CN117051102B (zh) 2023-10-12 2023-10-12 生物标志物组合在制备预测帕金森病的产品中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311316316.7A CN117051102B (zh) 2023-10-12 2023-10-12 生物标志物组合在制备预测帕金森病的产品中的应用

Publications (2)

Publication Number Publication Date
CN117051102A true CN117051102A (zh) 2023-11-14
CN117051102B CN117051102B (zh) 2024-01-26

Family

ID=88661286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311316316.7A Active CN117051102B (zh) 2023-10-12 2023-10-12 生物标志物组合在制备预测帕金森病的产品中的应用

Country Status (1)

Country Link
CN (1) CN117051102B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120192298A1 (en) * 2009-07-24 2012-07-26 Sigma Aldrich Co. Llc Method for genome editing
WO2020049135A1 (en) * 2018-09-05 2020-03-12 Amoneta Diagnostics Sas Long non-coding rnas (lncrnas) for the diagnosis and therapeutics of brain disorders, in particular cognitive disorders
KR102100588B1 (ko) * 2019-06-24 2020-04-13 재단법인 대구경북첨단의료산업진흥재단 뇌미세혈관 손상 뇌질환 진단용 바이오 마커 조성물
WO2020251263A1 (ko) * 2019-06-10 2020-12-17 연세대학교 산학협력단 뇌신경계 질환의 진단용 바이오마커
CN113398244A (zh) * 2021-05-28 2021-09-17 南方医科大学 一种治疗帕金森病的制剂及其应用
WO2021230379A1 (ja) * 2020-05-14 2021-11-18 花王株式会社 パーキンソン病の検出方法
WO2022187690A1 (en) * 2021-03-05 2022-09-09 Umbra Therapeutics Inc. Covalent binding compounds for the treatment of disease
CN116457462A (zh) * 2020-09-18 2023-07-18 工匠开发实验室公司 用于高效和特异性基因组编辑的构建体和其用途

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120192298A1 (en) * 2009-07-24 2012-07-26 Sigma Aldrich Co. Llc Method for genome editing
WO2020049135A1 (en) * 2018-09-05 2020-03-12 Amoneta Diagnostics Sas Long non-coding rnas (lncrnas) for the diagnosis and therapeutics of brain disorders, in particular cognitive disorders
WO2020251263A1 (ko) * 2019-06-10 2020-12-17 연세대학교 산학협력단 뇌신경계 질환의 진단용 바이오마커
KR102100588B1 (ko) * 2019-06-24 2020-04-13 재단법인 대구경북첨단의료산업진흥재단 뇌미세혈관 손상 뇌질환 진단용 바이오 마커 조성물
WO2021230379A1 (ja) * 2020-05-14 2021-11-18 花王株式会社 パーキンソン病の検出方法
CN116457462A (zh) * 2020-09-18 2023-07-18 工匠开发实验室公司 用于高效和特异性基因组编辑的构建体和其用途
WO2022187690A1 (en) * 2021-03-05 2022-09-09 Umbra Therapeutics Inc. Covalent binding compounds for the treatment of disease
CN113398244A (zh) * 2021-05-28 2021-09-17 南方医科大学 一种治疗帕金森病的制剂及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHI-TONG WANG;WEN-QI CUI;DAN PAN;MIN JIANG;BING CHANG;LI-XUAN SANG;: "Tea polyphenols and their chemopreventive and therapeutic effects on colorectal cancer", WORLD JOURNAL OF GASTROENTEROLOGY, no. 06 *
裴艳涛;蒋瑞萍;寇国栋;齐志广;赵宝华;: "生物分子开关研究进展", 现代生物医学进展, no. 08 *

Also Published As

Publication number Publication date
CN117051102B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
Sigdel et al. Shotgun proteomics identifies proteins specific for acute renal transplant rejection
Shilov et al. The Paragon Algorithm, a next generation search engine that uses sequence temperature values and feature probabilities to identify peptides from tandem mass spectra
Fusaro et al. Prediction of high-responding peptides for targeted protein assays by mass spectrometry
Albalat et al. Clinical application of urinary proteomics/peptidomics
US20040153249A1 (en) System, software and methods for biomarker identification
Nigjeh et al. Quantitative proteomics based on optimized data-independent acquisition in plasma analysis
CN111479934A (zh) 用于诊断和治疗监测的生物学指标的鉴定和用途
US20080086272A1 (en) Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases
Dawson et al. Urinary proteomics to support diagnosis of stroke
WO2007112055A2 (en) Apolipoprotein fingerprinting technique
US20130210667A1 (en) Biomarkers for Predicting Kidney and Glomerular Pathologies
CN116732164A (zh) 生物标志物组合及其在预测asd疾病中的应用
Rossi et al. Biomarker discovery in asthma and COPD by proteomic approaches
JP2006510875A (ja) コンステレーションマッピングおよびそれらの使用
Watson et al. Quantitative mass spectrometry analysis of cerebrospinal fluid protein biomarkers in Alzheimer’s disease
WO2015164616A1 (en) Biomarkers for detection of tuberculosis
Kentsis Challenges and opportunities for discovery of disease biomarkers using urine proteomics
Cantley et al. Development of a targeted urine proteome assay for kidney diseases
Cummins et al. Advances in proteomic profiling of pediatric kidney diseases
Christians et al. The role of proteomics in the study of kidney diseases and in the development of diagnostic tools
CN112305122B (zh) 代谢物标志物及其在疾病中的应用
US20110136241A1 (en) Type ii diabetes molecular bioprofile and method and system of using the same
JP7218019B2 (ja) 質量スペクトルからの存在物の同定の方法
CN117051102B (zh) 生物标志物组合在制备预测帕金森病的产品中的应用
Alves et al. Calibrating E-values for MS 2 database search methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant