CN117079710B - 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用 - Google Patents

生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用 Download PDF

Info

Publication number
CN117079710B
CN117079710B CN202311051624.1A CN202311051624A CN117079710B CN 117079710 B CN117079710 B CN 117079710B CN 202311051624 A CN202311051624 A CN 202311051624A CN 117079710 B CN117079710 B CN 117079710B
Authority
CN
China
Prior art keywords
utuc
muscle
infiltration
data
protein expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311051624.1A
Other languages
English (en)
Other versions
CN117079710A (zh
Inventor
李明珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aipu Tikang Biotechnology Co ltd
Original Assignee
Shanghai Aipu Tikang Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aipu Tikang Biotechnology Co ltd filed Critical Shanghai Aipu Tikang Biotechnology Co ltd
Priority to CN202311051624.1A priority Critical patent/CN117079710B/zh
Publication of CN117079710A publication Critical patent/CN117079710A/zh
Application granted granted Critical
Publication of CN117079710B publication Critical patent/CN117079710B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physiology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种构建UTUC肌肉浸润预测模型的方法、UTUC肌肉浸润预测模型、样本是否为UTUC肌肉浸润的预测方法、用于预测UTUC肌肉浸润的系统、生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用及一种生物标志物组合。所述生物标志物与UTUC肌肉浸润存在较高的相关性,所述UTUC肌肉浸润预测模型在检测UTUC肌肉浸润方面具有较高的准确率、灵敏度和特异性。

Description

生物标志物及其在预测和/或诊断UTUC肌肉浸润中的应用
技术领域
本发明属于生物医药技术和诊断领域,具体涉及一种构建UTUC肌肉浸润预测模型的方法、UTUC肌肉浸润预测模型、用于预测UTUC肌肉浸润的系统、生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用及一种生物标志物组合。
背景技术
上尿路尿路上皮癌(Upper tract urothelial carcinoma,UTUC)包括输尿管和肾盂癌,相对不常见,仅占尿路上皮癌(UC)的5%~10%。约75%的UTUC患者表现为血尿(肉眼或镜下),较少见的症状是侧腹疼痛或可触及肿块。55%~59%的UTUC患者在诊断时有肌肉侵犯,肌层浸润性UTUC(MI-UTUC)预后极差。肿瘤分期为pT2/pT3的UTUC患者的5年特异性生存率为小于50%,pT4的小于10%。疑似UTUC的患者需要接受侵入性检查,如计算机断层扫描(CT)尿路造影、逆行肾盂造影或输尿管镜检查,以明确诊断。但这些方法很难在疾病的早期发现。尿细胞学是一种无创性检测方法,但其诊断UTUC或MI-UTUC的灵敏度和特异性均较低。因此,寻找可靠的生物标志物来诊断UTUC是否肌肉浸润是改善临床管理和患者预后的关键任务。
血浆样本易于获得且是无创的,血浆蛋白是血浆的主要功能成分,在信号传导、转运和抗感染等多种生物学过程中发挥关键作用。目前,血浆蛋白质组学技术已被广泛应用于各种疾病的研究,如前列腺癌、新型冠状病毒感染、以及酒精相关性肝病等。蛋白质组学肿瘤诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多地运用于肿瘤检测。而且,这些肿瘤标志物的研究往往是基于一定量的实验数据,所涉及的癌症种类和样本量都相对有限。因此,通过收集血浆蛋白质组数据,利用大数据分析方法,建立预测模型,有助于更好地诊断和监测UTUC患者,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
发明内容
针对现有技术中缺少便捷且准确的诊断UTUC(Upper tract urothelialcarcinoma,上尿路尿路上皮癌)是否肌肉浸润的技术的缺陷,基于高灵敏度、高分辨率、高精准的现代质谱技术,结合生物信息学分析及机器学习,本发明提供了一种构建UTUC肌肉浸润预测模型的方法、UTUC肌肉浸润预测模型、样本是否为UTUC肌肉浸润的预测方法、用于预测UTUC肌肉浸润的系统、生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用及一种生物标志物组合,所述生物标志物与UTUC肌肉浸润存在较高的相关性,所述UTUC肌肉浸润预测模型在检测UTUC肌肉浸润方面具有较高的准确率、灵敏度和特异性。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用;其中,所述生物标志物包括以下一种或多种蛋白质:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂,所述生物标志物包括以下一种或多种蛋白质:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述试剂用于检测所述生物标志物的表达水平;所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述试剂为用于转录组和/或蛋白质组测序的试剂。
在本发明一较佳实施方案中,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
在本发明一较佳实施方案中,所述生物分子试剂选自引物、探针和抗体。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用;所述生物标志物包括以下一种或多种蛋白质:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述试剂如本发明前文所述。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物组合,所述生物标志物组合包括以下一种或多种蛋白质:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
为解决上述技术问题,本发明提供的一个技术方案为:一种试剂盒,所述试剂盒包含如发明所述的试剂和如本发明所述的生物标志物组合。
为解决上述技术问题,本发明提供的一个技术方案为:一种检测UTUC肌肉浸润的方法,所述方法包括检测待测血浆样本中的生物标志物的表达水平;所述生物标志物包括以下一种或多种蛋白质:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述检测UTUC肌肉浸润的方法为非诊断目的的。
本发明中,所述“非诊断目的”是指出于科学研究、病理数据统计的目的,适用场景包括验证动物模型是否成功构建、体外药效实验、肿瘤的流行病学统计等。
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC肌肉浸润预测模型的构建方法,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述UTUC肌肉浸润预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含UTUC肌肉浸润患者的血浆样本和UTUC非肌肉浸润患者的血浆样本;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一更佳实施方案中,所述PRM检测方式可参考PMID:36347856和PMID:27958391。优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1所示。
在本发明一较佳实施方案中,所述UTUC非肌肉浸润患者的血浆样本和UTUC肌肉浸润患者的血浆样本的数量比例为1:4-2:1,例如2:5、5:3、109:242和31:53。
在本发明一较佳实施方案中,输入广义线性回归模型的蛋白质满足:UTUC肌肉浸润患者的血浆样本中表达量/UTUC无肌肉浸润的血浆样本中表达量>1.5或<0.67,且Wilcoxon rank-sum test检验并经Benjamini-Hochberg校正的p值小于0.05。
在本发明一较佳实施方案中,所述广义线性回归模型的参数为:采用向后逐步回归方法筛选标志物,并利用R包glm功能进行预测。优选地,所述广义线性回归模型的R包包括:
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC肌肉浸润预测模型,所述UTUC肌肉浸润预测模型由如本发明所述的UTUC肌肉浸润预测模型的构建方法建构得到。
在本发明一较佳实施方案中,所述构建方法中输入广义线性回归模型的蛋白质由SPAG9、HNRNPL、ATP6AP1和TWF2构成。
在本发明一较佳实施方案中,所述生物标志物由SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3构成。
为解决上述技术问题,本发明提供的一个技术方案为:一种样本是否为UTUC肌肉浸润的预测方法,所述预测方法包括将样本的蛋白质表达量数据输入如本发明所述的UTUC肌肉浸润预测模型,得到样本是否为UTUC肌肉浸润的结果;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述预测方法为非诊断目的的。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一更佳实施方案中,所述PRM检测方式为对蛋白质表达量数据通过各蛋白质的2-3种靶向肽进行PRM。优选地,所述PRM检测方式可参考PMID:36347856和PMID:27958391。更优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1所示。
在本发明一较佳实施方案中,所述结果的判断标准为:所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,所述UTUC肌肉浸润预测模型输出的UTUC肌肉浸润概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。具体地,当预测结果越接近于1或0,预测结果越准确,例如所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率越接近1时,输出的“UTUC非肌肉浸润”预测结果越准确;所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率越接近0时,输出的“UTUC肌肉浸润”预测结果越准确。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于预测UTUC肌肉浸润的系统,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2;
判断并输出模块,用于在所述接收或输入完成后,通过如本发明所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果;所述是否为UTUC肌肉浸润的结果的判断标准为:所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,所述UTUC肌肉浸润预测模型输出的UTUC肌肉浸润概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。具体地,当预测结果越接近于1或0,预测结果越准确,例如所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率越接近1时,输出的“UTUC非肌肉浸润”预测结果越准确;所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率越接近0时,输出的“UTUC肌肉浸润”预测结果越准确。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
在本发明一较佳实施方案中,所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据。优选地,所述采集为通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配,所述肽段匹配的数据库优选为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一更佳实施方案中,所述PRM检测方式为对蛋白质表达量数据通过各蛋白质的2-3种靶向肽进行PRM。优选地,所述PRM检测方式可参考PMID:36347856和PMID:27958391。更优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1所示。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机辅助的UTUC肌肉浸润预测方法,所述UTUC肌肉浸润预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如本发明所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果。
在本发明一较佳实施方案中,所述UTUC肌肉浸润预测方法还包括步骤0:采集血浆样本中的蛋白质表达量数据。优选地,所述采集为通过LS-MA技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式或PRM(parallel reactionmonitoring,平行反应检测)检测方式采集。
在本发明一更佳实施方案中,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配,所述肽段匹配的数据库优选为UniProt人类蛋白质数据库;和/或采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT;再将各蛋白的FOT作为蛋白质表达量数据输入所述UTUC肌肉浸润预测模型。
在本发明一更佳实施方案中,所述PRM检测方式为对蛋白质表达量数据通过各蛋白质的2-3种靶向肽进行PRM。优选地,所述PRM检测方式可参考PMID:36347856和PMID:27958391。更优选地,PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索,并用Skyline-daily报道的片段总面积对蛋白质进行量化;选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。例如所述PRM检测方式中使用的靶向肽段如表1所示。
在本发明一较佳实施方案中,所述生物标志物还包括TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如本发明所述的系统的功能,或实现如本发明所述的UTUC肌肉浸润预测方法的步骤。
本发明中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现如本发明所述的系统的功能,或实现如本发明所述的UTUC肌肉浸润预测方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
为解决上述技术问题,本发明提供的一个技术方案为:一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如本发明所述的系统的功能,或实现如本发明所述的UTUC肌肉浸润预测方法的步骤。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
本发明提供的UTUC肌肉浸润预测模型和生物标志物可以检测UTUC是否产生肌肉浸润,具有高灵敏度和高特异性的优点,具有广泛的科研价值并为个体提供个性化的UTUC肌肉浸润检测,有利支持了UTUC肌肉浸润的检测,对治疗UTUC肌肉浸润患者的临床决策具有重要意义。
具有广泛的科研价值并为上尿路尿路上皮癌患者提供个性化预测,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
附图说明
图1为本发明所述检测UTUC肌肉浸润的血浆生物标志物组合在发现队列的受试者工作特征曲线(ROC)图。
图2为本发明所述检测UTUC肌肉浸润的血浆生物标志物组合在验证队列的受试者工作特征曲线(ROC)图。
图3为鉴定蛋白的累计曲线图。
图4为预测UTUC肌肉浸润的系统的结构示意图。
图5为电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例中所需的确诊为上尿路尿路上皮癌(UTUC)患者的术前血浆样本的435例,其中351例为发现队列(109例为UTUC非肌肉浸润,242例为UTUC肌肉浸润),84例为独立验证队列(31例为UTUC非肌肉浸润,53例为UTUC肌肉浸润)。本研究的设计和实施由医学伦理委员会通过伦理投票批准和监督。已获得所有患者的书面知情同意。
实施例1上尿路尿路上皮癌术前的血浆临床样本的预处理
临床样本为术前血浆样本。样品预处理:收集新鲜血液加入到盛有抗凝剂的管中,颠倒混匀,充分抗凝,1000-2000×g离心10min,取上层淡黄色透明液体即为血浆,存至离心管中,-80冻存备用。
实施例2临床样本的蛋白质及肽段提取
2μL血浆样品与100μL 50mM碳酸氢铵缓冲液混合,混合液在95℃金属浴5min后冷却至室温,在37℃恒温箱中,酶蛋白质量比为1:25的条件下用胰蛋白酶(Promega,Catalog:V528A)消化17小时。然后在每个管中加入5μL的氨水,旋涡混匀,终止酶解。在60℃真空干燥器(SpeedVac,Eppendorf)中进行抽干。抽干后,取100μL 0.1%甲酸复溶,并漩涡震荡3min,离心5min(12000g),取上清进行脱盐。脱盐前需要制备并活化柱子(2片3M C18膜),活化顺序为:90μL 100%乙腈2次,90μL 50%乙腈和80%乙腈依次1次,90μL 50%乙腈1次。90μL0.1%甲酸平衡柱2次后,将管上清装入柱2次,90μL 0.1%甲酸脱盐2次。最后,加入90μL洗脱缓冲液(0.1%甲酸,50%乙腈)2次,收集洗脱液。60℃真空抽干,获得用于质谱检测所需的肽段。
实施例3临床样本的质谱检测
用Q-Exactive HF-X混合四极轨道阱质谱仪(Thermo Fisher Scientific,Rockford,IL,USA)和高效液相色谱系统(EASY nLC 1200,Thermo Fisher)进行检测,并得到该肽样品对应的质谱数据。具体操作为:
抽干的肽样品重新溶解在溶剂A(0.1%甲酸的水溶液)中,60℃,150μm I.D.×8cm色谱柱上分离(C18,1.9μm,Dr.Maisch GmbH)。流动相A和B分别为99.9/0.1%水/甲酸(v/v)和80/20/0.1%乙腈/水/甲酸(v/v/v)。质谱条件设置为数据非依赖性(data-independent acquisition,DIA)或平行反应检测(parallel reaction monitoring,PRM,参考文章:PMID:36347856,PMID:27958391)。
DIA采集的循环模式为1个一级全扫描+30个可变窗口DIA扫描;一级扫描范围为300-1400m/z;一级检测:轨道阱质量分析器,分辨率:60k(@200m/z);离子选择模式:四级杆;AGC:4.0e5;二级碎裂模式:高能碰撞解离;碰撞能量:30%;二级检测:轨道阱质量分析器;分辨率:15k@200m/z;30个可变窗口具体为:300-346m/z,346-414m/z,414-453.5m/z,453.5-484.5m/z,484.5-512.5m/z,512.5-541.5m/z,541.5-570.5m/z,570.5-597m/z,597-621m/z,621-645m/z,645-668m/z,668-691m/z,691-714.5m/z,714.5-738m/z,738-762.5m/z,762.5-787m/z,787-809.5m/z,809.5-832m/z,832-856.5m/z,856.5-881.5m/z,881.5-908m/z,908-936m/z,936-963.5m/z,963.5-993.5m/z,993.5-1027.5m/z,1027.5-1062.5m/z,1062.5-1104m/z,1104-1157m/z,1157-1224.5m/z,1224.5-1331.5m/z。液相色谱串联质谱系统使用Xcalibur软件(Thermo Scientific)控制进行数据采集。
在验证队列中,选择血浆生物标志物的2-3种靶向肽(靶向肽段信息见表1)进行平行反应检测(parallel reaction monitoring,PRM)。在PRM模式下,离子选择模式为四极杆,碎裂模式为高能碰撞解离。流动相与DIA方法中提到的相同。一级检测:分辨率为60,000,AGC为3E6,最大IT为20MS,扫描范围为300~1400m/z。然后通过1.2Th的m/z窗口分离目标前体,随后在27%归一化碰撞能量下碎裂。产物离子扫描分辨率为10005,AGC为1E6,最大注入时间为25ms。
表1靶向肽段信息
蛋白 肽段 SEQ ID NO: 质荷比[Da]
SPAG9 AGPSAQEPGSQTPLK 1 734.36242
SPAG9 AVEQEDELSDVSQGGSK 2 593.27996
HNRNPL SKPGAAMVEMADGYAVDR 3 950.42751
HNRNPL QPAIMPGQSYGLEDGSCSYK 4 735.31279
ATP6AP1 LPYTASSGLMAPR 5 690.35632
ATP6AP1 HWFTMER 6 511.72337
TWF2 QKMVNYIQMKLDLER 7 642.33027
TWF2 HTHEGDPLESVVFIYSMPGYK 8 1211.57152
实施例4质谱数据的收集和处理
所有DIA数据均使用Firmiana(V1.0)进行处理。Firmiana是一个基于Galaxy系统的工作流,由用户登录界面、原数据、识别与量化、数据分析和知识挖掘等多个功能模块组成。使用FragPipe(v12.1)和MSFragger(2.2)(DIA数据)和Mascot搜索引擎(DDA数据)在UniProt人类蛋白质数据库(更新于2019.12.17,20406项)中搜索数据。选择胰蛋白酶作为蛋白水解酶,最大允许两个漏切位点,固定修饰为carbamidomethyl(C),动态修饰为protein acetyl(protein N-term),oxidation(M)。第一个搜索质量耐受性为20ppm,主要搜索肽耐受性为0.5da。数据根据诱饵数据库进行搜索,蛋白质鉴定以1%的错误发现率(FDR)被接受。利用SpectraST软件将DDA数据的结果合并到谱图库中。共有327个库作为参考谱图库。
DIA数据采用DIA-NN(v1.7.0)进行分析。DIA-NN采用默认设置(前驱体FDR:5%,Log lev:1,质量精度:20ppm,MS1精度:10ppm,扫描窗口:30,隐式蛋白组:基因,定量策略:稳健LC(高精度))。通过所有参考谱图库的色谱片段离子峰面积的平均值来计算识别肽的定量。使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量。计算了峰面积值作为相应蛋白质的一部分。总分数(FOT)用于表示样品中特定蛋白质的标准化丰度。FOT定义为特定蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ。
PRM原始数据由Skyline-daily(4.2.1.19004,华盛顿大学,美国)搜索。用Skyline-daily报道的片段总面积对蛋白质进行量化。选择多肽,并在样本中测试其信号的稳定性和峰的形状,以供最终量化,并参考skyline提供的排名。
实施例5筛选蛋白质标记物
分析蛋白质标记物的表达量,选取有效鉴定蛋白。
351例样本,样本鉴定的蛋白质数目在1586-2257之间。如图3所示的累计曲线图,在351个样本中,总共鉴定到8890种蛋白质。本发明以每种蛋白质在特定样本中的表达量占该样本中所有蛋白质表达量的比例(fraction of total,FOT)作为其归一化的表达量,再将FOT值乘以1e5作为最终的输入值。
实施例6建立预测模型
将上述435例UTUC患者的血浆样本分为包括351例的发现队列和84例的验证队列。
首先,通过Frequency>30%,筛选出2112较为广泛最存在的蛋白质。再在发现队列的UTUC肌肉浸润样本和UTUC非UTUC肌肉浸润样本之间通过对比选取表达存在显著差异的分子(FOT差异倍数大于1.5倍,即UTUC肌肉浸润患者的血浆样本中表达量/UTUC无肌肉浸润的血浆样本中表达量>1.5或<0.67,且Wilcoxon rank-sum test检验并经Benjamini-Hochberg校正的p值小于0.05),共46种蛋白被选出作为候选标志物。将这46中蛋白的FOT值输入如下的机器学习方法,建立预测UTUC肌肉浸润的模型:
基于广义线性回归模型的机器学习算法,将各候选标志物的FOT值输入如下所示的R包建立UTUC肌肉浸润预测模型:
/>
在发现队列中,进行了80/20或者70/30的测试和训练集的拆分,并进行了10折交叉验证,其具有较好的鲁棒性。基于42个差异蛋白,采用向后逐步回归方法筛选分类器的蛋白,按分子特征重要性排名筛选得到12种蛋白质分子生物标志物(TST、HPCAL1、HNRNPL、TWF2、CNOT11、SPAG9、ITGAV、NSUN2、ACAT1、ATP6AP1、EARS2和SLC25A3),根据这12种蛋白的相对表达水平计算ROC-AUC为0.805(见图1)。对于不能确定是否有肌肉浸润的UTUC患者,将蛋白质分子生物标志物经如上所述的DIA收集的表达水平(FOT)输入所得预测模型,得到判断是否为肌肉浸润性上尿路尿路上皮癌的输出结果(见表2)。对于某未知样本,模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,模型输出的UTUC肌肉浸润预测概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。具体地,当预测概率越接近于1或0时,预测结果越准确,例如模型输出的UTUC非肌肉浸润预测概率越接近1时,输出的“UTUC非肌肉浸润”预测结果越准确;模型输出的UTUC非肌肉浸润预测概率越接近0时,输出的“UTUC肌肉浸润”预测结果越准确。
由于目前现有无创技术(不需要手术)对于判断是否为肌肉浸润性上尿路尿路上皮癌的AUC较低或没有相关的区分是否为肌肉浸润性无创技术研究报道,比如目前临床上采用的尿脱落细胞学检测并不能较好的检测出上尿路尿路上皮癌(AUC<0.62)(参考文章:PMID:21320275,PMID:27958391)。故相比于现有技术的检测方式,本发明提供的标志物和模型可以实现对UTUC是否浸润的无创且便捷UTUC的检测。
表2 12种标志物的预测及输出结果
实施例7PRM数据的独立验证
在84例验证队列中,通过PRM对发现队列中筛选得到的12种蛋白质分子生物标志物的4种蛋白质分子生物标志物(SPAG9、HNRNPL、ATP6AP1和TWF2)进行验证,根据这4种蛋白的相对表达水平,计算ROC-AUC为0.75(见图2)。对于不能确定是否有肌肉浸润的UTUC患者,将上述4种蛋白质分子生物标志物经如上所述的PRM收集的表达水平输入所得预测模型,得到判断是否为肌肉浸润性上尿路尿路上皮癌的输出结果(见表3)。
表3 PRM数据的预测及输出结果
同样地,对于某未知样本,模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,模型输出的UTUC肌肉浸润预测概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。具体地,当预测概率越接近于1或0时,预测结果越准确,例如模型输出的UTUC非肌肉浸润预测概率越接近1时,输出的“UTUC非肌肉浸润”预测结果越准确;模型输出的UTUC非肌肉浸润预测概率越接近0时,输出的“UTUC肌肉浸润”预测结果越准确。
实施例8预测UTUC肌肉浸润的系统
预测UTUC肌肉浸润的系统61:数据接收模块52和判断并输出模块53,优选还包括数据处理模块51(见图4)。
数据处理模块51用于采集血浆样本中的蛋白质表达量数据,并将其传输给数据接收模块。
数据接收模块52用于将接收或输入血浆样本中的蛋白质表达量数据输入判断并输出模块53。其中,所述蛋白质表达量数据可通过数据处理模块51进行收集,亦可从其他来源获取所述蛋白质表达量数据。
判断并输出模块53用于在所述接收或输入完成后,通过如实施例6所述的UTUC肌肉浸润预测模型,输出对血浆样本的个体是否为UTUC肌肉浸润的判断结果。
实施例9电子设备
本实施例提供了一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现本发明实施例6中检测UTUC肌肉浸润的方法。
图5示出了本实施例的硬件结构示意图,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例4的数据分析方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例9计算机可读存储介质
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例6中检测UTUC肌肉浸润的方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现本发明实施例4中检测UTUC肌肉浸润的方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
最后,上述具体实施方法仅用以说明本发明的技术方案,而非对其限制。

Claims (30)

1.一种生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用,其特征在于,所述生物标志物由蛋白质SPAG9、HNRNPL、ATP6AP1和TWF2组成。
2.一种生物标志物在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用,其特征在于,所述生物标志物由蛋白质SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3组成。
3.一种用于检测生物标志物的试剂,其特征在于,所述生物标志物由蛋白质SPAG9、HNRNPL、ATP6AP1和TWF2组成。
4.一种用于检测生物标志物的试剂,其特征在于,所述生物标志物由SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3组成;和/或,所述试剂用于检测所述生物标志物的表达水平,所述表达水平为蛋白表达水平和/或mRNA转录水平。
5.如权利要求3或4所述的试剂,其特征在于,所述试剂为用于转录组和/或蛋白质组测序的试剂;和/或,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
6.如权利要求5所述的试剂,其特征在于,所述生物分子试剂选自引物、探针和抗体。
7.一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用,其特征在于,所述生物标志物由蛋白质SPAG9、HNRNPL、ATP6AP1和TWF2组成。
8.一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC肌肉浸润的试剂盒中的应用,其特征在于,所述生物标志物由SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3组成;和/或,所述试剂为如权利要求3-6任一项所述的试剂。
9.一种生物标志物组合,其特征在于,所述生物标志物组合由蛋白质SPAG9、HNRNPL、ATP6AP1和TWF2组成。
10.一种生物标志物组合,其特征在于,所述生物标志物组合由SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3组成。
11.一种试剂盒,其特征在于,所述试剂盒包含如权利要求3-6中任一项所述的试剂和如权利要求9或10所述的生物标志物组合。
12.一种UTUC肌肉浸润预测模型的构建方法,其特征在于,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述UTUC肌肉浸润预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含UTUC肌肉浸润患者的血浆样本和UTUC非肌肉浸润患者的血浆样本;所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3;
和/或,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式或PRM检测方式采集;所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配;所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型;
和/或,所述UTUC非肌肉浸润患者的血浆样本和UTUC肌肉浸润患者的血浆样本的数量比例为1:4-2:1;和/或,输入广义线性回归模型的蛋白质满足:UTUC肌肉浸润患者的血浆样本中表达量/UTUC无肌肉浸润的血浆样本中表达量>1.5或<0.67,且Wilcoxon rank-sumtest检验并经Benjamini-Hochberg校正的p值小于0.05;和/或,所述广义线性回归模型的参数为:采用向后逐步回归方法筛选标志物,并利用R包glm功能进行预测。
13.如权利要求12所述的构建方法,其特征在于,所述UTUC非肌肉浸润患者的血浆样本和UTUC肌肉浸润患者的血浆样本的数量比例为2:5、5:3、109:242和31:53。
14.一种UTUC肌肉浸润预测模型,其特征在于,所述UTUC肌肉浸润预测模型由如权利要求12或13所述的构建方法建构得到。
15.一种样本是否为UTUC肌肉浸润的预测方法,其特征在于,所述预测方法包括将样本的蛋白质表达量数据输入如权利要求14所述的UTUC肌肉浸润预测模型,得到样本是否为UTUC肌肉浸润的结果;所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2。
16.一种样本是否为UTUC肌肉浸润的预测方法,其特征在于,所述预测方法包括将样本的蛋白质表达量数据输入如权利要求14所述的UTUC肌肉浸润预测模型,得到样本是否为UTUC肌肉浸润的结果;所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3;和/或,所述预测方法为非诊断目的的。
17.如权利要求15或16所述的预测方法,其特征在于,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式或PRM检测方式采集。
18.如权利要求17所述的预测方法,其特征在于,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。
19.如权利要求18所述的预测方法,其特征在于,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
20.如权利要求15-19任一项所述的预测方法,其特征在于,所述结果的判断标准为:所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,所述UTUC肌肉浸润预测模型输出的UTUC肌肉浸润概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。
21.一种用于预测UTUC肌肉浸润的系统,其特征在于,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2;
判断并输出模块,用于在所述接收或输入完成后,通过如权利要求14所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果;所述是否为UTUC肌肉浸润的结果的判断标准为:所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,所述UTUC肌肉浸润预测模型输出的UTUC肌肉浸润概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。
22.一种用于预测UTUC肌肉浸润的系统,其特征在于,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3;
判断并输出模块,用于在所述接收或输入完成后,通过如权利要求14所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果;所述是否为UTUC肌肉浸润的结果的判断标准为:所述UTUC肌肉浸润预测模型输出的UTUC非肌肉浸润预测概率>0.5时,输出预测结果为“UTUC非肌肉浸润”,否则输出预测结果为“UTUC肌肉浸润”;或者,所述UTUC肌肉浸润预测模型输出的UTUC肌肉浸润概率>0.5时,输出预测结果为“UTUC肌肉浸润”,否则输出预测结果为“UTUC非肌肉浸润”。
23.如权利要求21或22所述的系统,其特征在于,所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据。
24.如权利要求23所述的系统,其特征在于,所述采集为通过LC-MS技术得到,使用DIA检测方式或PRM检测方式采集。
25.如权利要求24所述的系统,其特征在于,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配。
26.如权利要求25所述的系统,其特征在于,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量,计算各蛋白质的FOT;再将各蛋白的FOT作为蛋白质表达量数据输入数据接收模块。
27.一种计算机辅助的UTUC肌肉浸润预测方法,其特征在于,所述UTUC肌肉浸润预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1和TWF2;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如权利要求14所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果。
28.一种计算机辅助的UTUC肌肉浸润预测方法,其特征在于,所述UTUC肌肉浸润预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据为以下生物标志物的蛋白质表达量数据:SPAG9、HNRNPL、ATP6AP1、TWF2、TST、HPCAL1、CNOT11、ITGAV、NSUN2、ACAT1、EARS2和SLC25A3组成;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如权利要求14所述的UTUC肌肉浸润预测模型,输出对所述血浆样本的个体是否为UTUC肌肉浸润的判断结果。
29.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,可实现如权利要求21-26中任一项所述的系统的功能,或实现如权利要求27或28所述的计算机辅助的UTUC肌肉浸润预测方法的步骤。
30.一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序以实现如权利要求21-26中任一项所述的系统的功能,或实现如权利要求27或28所述的计算机辅助的UTUC肌肉浸润预测方法的步骤。
CN202311051624.1A 2023-08-18 2023-08-18 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用 Active CN117079710B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311051624.1A CN117079710B (zh) 2023-08-18 2023-08-18 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311051624.1A CN117079710B (zh) 2023-08-18 2023-08-18 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用

Publications (2)

Publication Number Publication Date
CN117079710A CN117079710A (zh) 2023-11-17
CN117079710B true CN117079710B (zh) 2024-05-31

Family

ID=88714742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311051624.1A Active CN117079710B (zh) 2023-08-18 2023-08-18 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用

Country Status (1)

Country Link
CN (1) CN117079710B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173478A1 (en) * 2012-05-15 2013-11-21 Predictive Biosciences, Inc. Screening assay for bladder cancer
JP2018179962A (ja) * 2017-04-06 2018-11-15 国立大学法人弘前大学 N結合型糖鎖を利用した尿路上皮癌の診断方法
WO2022012420A1 (zh) * 2020-07-17 2022-01-20 信达生物制药(苏州)有限公司 一种核苷酸组合及其应用
CN114047337A (zh) * 2021-12-27 2022-02-15 复旦大学附属中山医院 一种与肝细胞癌患者预后相关的分子标志物、免疫组化试剂盒及其应用
CN114107502A (zh) * 2021-11-29 2022-03-01 四川大学华西医院 一种上尿路上皮癌诊断标志物及其应用
WO2023098804A1 (zh) * 2021-12-03 2023-06-08 中国医学科学院北京协和医院 尿液蛋白标志物在诊断遗传性血管水肿中的用途
CN116338204A (zh) * 2023-02-13 2023-06-27 中国医学科学院北京协和医院 血浆蛋白标志物在结节性硬化相关肾血管平滑肌脂肪瘤鉴别诊断和预后预测中的应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013086429A2 (en) * 2011-12-09 2013-06-13 Veracyte, Inc. Methods and compositions for classification of samples
WO2015061890A1 (en) * 2013-11-04 2015-05-07 The University Of British Columbia Cancer biomarkers and classifiers and uses thereof
BR112018073414A2 (pt) * 2016-05-16 2019-08-27 Checkmab S R L molécula, composição farmacêutica, e, métodos in vitro para prognosticar e/ou diagnosticar e/ou avaliar o risco de desenvolver e/ou para monitorar a progressão e/ou para monitorar a eficácia de um tratamento terapêutico e/ou para a triagem de um tratamento terapêutico de um tumor, para tratar e/ou prevenir tumor e para identificar uma molécula.
KR102170297B1 (ko) * 2019-12-16 2020-10-26 주식회사 루닛 조직병리체학 데이터의 해석 정보를 제공하는 방법 및 시스템

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173478A1 (en) * 2012-05-15 2013-11-21 Predictive Biosciences, Inc. Screening assay for bladder cancer
JP2018179962A (ja) * 2017-04-06 2018-11-15 国立大学法人弘前大学 N結合型糖鎖を利用した尿路上皮癌の診断方法
WO2022012420A1 (zh) * 2020-07-17 2022-01-20 信达生物制药(苏州)有限公司 一种核苷酸组合及其应用
CN114107502A (zh) * 2021-11-29 2022-03-01 四川大学华西医院 一种上尿路上皮癌诊断标志物及其应用
WO2023098804A1 (zh) * 2021-12-03 2023-06-08 中国医学科学院北京协和医院 尿液蛋白标志物在诊断遗传性血管水肿中的用途
CN114047337A (zh) * 2021-12-27 2022-02-15 复旦大学附属中山医院 一种与肝细胞癌患者预后相关的分子标志物、免疫组化试剂盒及其应用
CN116338204A (zh) * 2023-02-13 2023-06-27 中国医学科学院北京协和医院 血浆蛋白标志物在结节性硬化相关肾血管平滑肌脂肪瘤鉴别诊断和预后预测中的应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Lnc RNA在食管癌中的研究进展;王鹏;申文豪;郭卿;张玮;姚娟;余磊;杨颂;黄俊星;;南通大学学报(医学版);20200515(第03期);72-79 *
MicroRNA as a Biomarker for Diagnostic, Prognostic, and Therapeutic Purpose in Urinary Tract Cancer;Amro M. Soliman;《MDPI》;20211126;1-19页 *
Plasma proteomic profiling discovers molecular features associated with upper tract urothelial carcinoma;Yuanyuan Qu等;《cell reports medicine》;20230919;1-26 *

Also Published As

Publication number Publication date
CN117079710A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
Liotta et al. Serum peptidome for cancer detection: spinning biologic trash into diagnostic gold
US20060088894A1 (en) Prostate cancer biomarkers
CN115575636B (zh) 一种用于肺癌检测的生物标志物及其系统
CN114414704B (zh) 评估甲状腺结节恶性程度或概率的系统、模型及试剂盒
CN116024338B (zh) 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN112071363A (zh) 胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法
US20050100967A1 (en) Detection of endometrial pathology
CN117051113B (zh) 生物标志物组合在制备预测结直肠癌的试剂盒中的应用
CN117074679B (zh) 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用
Wouters Proteomics: methodologies and applications in oncology
CN117079710B (zh) 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用
US20070184511A1 (en) Method for Diagnosing a Person Having Sjogren&#39;s Syndrome
CN117187385B (zh) 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用
CN117004729B (zh) 生物标志物及其在预测和/或诊断utuc进展时间中的应用
EP2674758A1 (en) A computational method for mapping peptides to proteins using sequencing data
CN114822854A (zh) 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用
CN117089621B (zh) 生物标志物组合及其在预测结直肠癌疗效中的应用
CN115678993A (zh) 一种生物标志物组合、含其的试剂及其应用
CN117089621A (zh) 生物标志物组合及其在预测结直肠癌疗效中的应用
CN112037852A (zh) 一种t1期结直肠癌淋巴结转移预测方法和系统
CN117070635B (zh) 生物标志物组合在制备预测透明性肾细胞癌的试剂盒中的应用
CN112924685B (zh) 抑郁症生物标志物和包括其的诊断试剂盒
CN117051112B (zh) 生物标志物组合在制备预测淋巴瘤的试剂盒中的应用
Lesur et al. Highly multiplexed targeted plasma proteomics quantifies several hundred blood proteins in serum from colorectal carcinoma patients
CN116469471A (zh) 一种利用蛋白质组学检测t1期结直肠癌淋巴结转移的模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant