CN117187385A - 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用 - Google Patents

生物标志物在制备预测和/或诊断utuc的试剂盒中的应用 Download PDF

Info

Publication number
CN117187385A
CN117187385A CN202311053305.4A CN202311053305A CN117187385A CN 117187385 A CN117187385 A CN 117187385A CN 202311053305 A CN202311053305 A CN 202311053305A CN 117187385 A CN117187385 A CN 117187385A
Authority
CN
China
Prior art keywords
utuc
protein expression
data
protein
biomarker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311053305.4A
Other languages
English (en)
Other versions
CN117187385B (zh
Inventor
李明珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Aipu Tikang Biotechnology Co ltd
Original Assignee
Shanghai Aipu Tikang Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Aipu Tikang Biotechnology Co ltd filed Critical Shanghai Aipu Tikang Biotechnology Co ltd
Priority to CN202311053305.4A priority Critical patent/CN117187385B/zh
Publication of CN117187385A publication Critical patent/CN117187385A/zh
Application granted granted Critical
Publication of CN117187385B publication Critical patent/CN117187385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种构建UTUC预测模型的方法、UTUC预测模型、样本是否为UTUC的预测方法、用于预测UTUC的系统、生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC的试剂盒中的应用及一种生物标志物组合。所述生物标志物与UTUC存在较高的相关性,所述UTUC预测模型在检测UTUC方面具有较高的准确率、灵敏度和特异性。

Description

生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用
技术领域
本发明属于生物医药技术和诊断领域,具体涉及一种构建UTUC预测模型的方法、UTUC预测模型、用于预测UTUC的系统、生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC的试剂盒中的应用及一种生物标志物组合。
背景技术
上尿路尿路上皮癌(Upper tract urothelial carcinoma,UTUC)包括输尿管和肾盂癌,相对不常见,仅占尿路上皮癌(UC)的5%~10%。约75%的UTUC患者表现为血尿(肉眼或镜下),较少见的症状是侧腹疼痛或可触及肿块。55%~59%的UTUC患者在诊断时有肌肉侵犯,肌层浸润性UTUC(MI-UTUC)预后极差。肿瘤分期为pT2/pT3的UTUC患者的5年特异性生存率为小于50%,pT4的小于10%。疑似UTUC的患者需要接受侵入性检查,如计算机断层扫描(CT)尿路造影、逆行肾盂造影或输尿管镜检查,以明确诊断。但这些方法很难在疾病的早期发现。尿细胞学是一种无创性检测方法,但其诊断UTUC或MI-UTUC的灵敏度和特异性均较低。因此,寻找可靠的生物标志物来诊断UTUC是改善临床管理和患者预后的关键任务。
血浆样本易于获得且是无创的,血浆蛋白是血浆的主要功能成分,在信号传导、转运和抗感染等多种生物学过程中发挥关键作用。目前,血浆蛋白质组学技术已被广泛应用于各种疾病的研究,如前列腺癌以及酒精相关性肝病等。蛋白质组学肿瘤诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多地运用于肿瘤检测。而且,这些肿瘤标志物的研究往往是基于一定量的实验数据,所涉及的癌症种类和样本量都相对有限。因此,通过收集血浆蛋白质组数据,利用大数据分析方法,建立预测模型,有助于更好地诊断和监测UTUC患者,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
发明内容
针对现有技术中缺少便捷且准确的诊断UTUC(Upper tract urothelialcarcinoma,上尿路尿路上皮癌)的技术的缺陷,基于高灵敏度、高分辨率、高精准的现代质谱技术,结合生物信息学分析及机器学习,本发明提供了一种构建UTUC预测模型的方法、UTUC预测模型、样本是否为UTUC的预测方法、用于预测UTUC的系统、生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用、用于检测生物标志物的试剂、用于检测生物标志物的试剂在制备预测和/或诊断UTUC的试剂盒中的应用及一种生物标志物组合,所述生物标志物与UTUC存在较高的相关性,所述UTUC预测模型在检测UTUC方面具有较高的准确率、灵敏度和特异性。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用;其中,所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂,所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
在本发明一较佳实施方案中,所述试剂用于检测所述生物标志物的表达水平;所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述试剂为用于转录组和/或蛋白质组测序的试剂。
在本发明一较佳实施方案中,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂。
在本发明一较佳实施方案中,所述生物分子试剂选自引物、探针和抗体。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC的试剂盒中的应用;所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
在本发明一较佳实施方案中,所述试剂如本发明前文所述。
为解决上述技术问题,本发明提供的一个技术方案为:一种生物标志物组合,所述生物标志物组合包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
为解决上述技术问题,本发明提供的一个技术方案为:一种试剂盒,所述试剂盒包含如发明所述的试剂和如本发明所述的生物标志物组合。
为解决上述技术问题,本发明提供的一个技术方案为:一种检测UTUC的方法,所述方法包括检测待测血浆样本中的生物标志物的表达水平;所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
在本发明一较佳实施方案中,所述表达水平为蛋白表达水平和/或mRNA转录水平。
在本发明一较佳实施方案中,所述检测UTUC的方法为非诊断目的的。
本发明中,所述“非诊断目的”是指出于科学研究、病理数据统计的目的,适用场景包括验证动物模型是否成功构建、体外药效实验、肿瘤的流行病学统计等。
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC预测模型的构建方法,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述UTUC预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含UTUC患者的血浆样本和健康的血浆样本;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式采集。优选地,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一较佳实施方案中,所述蛋白质表达量数据输入广义线性回归模型前,先将所述UTUC患者的血浆样本分为发现队列和验证队列,所述发现队列和验证队列同时还包括相同的健康的血浆样本。优选地,所述发现队列和验证队列中UTUC患者的血浆样本的比例为2:1-8:1,更优选为4:1。
在本发明一较佳实施方案中,输入广义线性回归模型的蛋白质满足:UTUC患者的血浆样本中表达量/健康的血浆样本中表达量>2,且Wilcoxon rank-sum test检验并经Benjamini-Hochberg校正的p值小于0.05。
在本发明一较佳实施方案中,所述广义线性回归模型的参数为:采用向后逐步回归方法筛选标志物,并利用R包glm功能进行预测。优选地,所述广义线性回归模型的R包包括:
为解决上述技术问题,本发明提供的一个技术方案为:一种UTUC预测模型,所述UTUC预测模型由如本发明所述的UTUC预测模型的构建方法建构得到。
在本发明一较佳实施方案中,所述构建方法中输入广义线性回归模型模型的蛋白质由C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1构成。
为解决上述技术问题,本发明提供的一个技术方案为:一种样本是否为UTUC的预测方法,所述预测方法包括将样本的蛋白质表达量数据输入如本发明所述的UTUC预测模型,得到样本是否为UTUC的结果;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
在本发明一较佳实施方案中,所述预测方法为非诊断目的的。
所述预非诊断目的的应用场景例如检测体外样本中是否混杂UTUC细胞。
在本发明一较佳实施方案中,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA(data-independent acquisition,数据非依赖性)检测方式采集。优选地,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配。更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
在本发明一较佳实施方案中,所述结果的判断标准为:所述UTUC预测模型输出的非UTUC预测概率>0.5时,输出预测结果为“非UTUC”,否则输出预测结果为“UTUC”;或者,所述UTUC预测模型输出的UTUC预测概率>0.5时,输出预测结果为“UTUC”,否则输出预测结果为“非UTUC”。具体地,当预测结果越接近于1或0,预测结果越准确,例如所述UTUC预测模型输出的非UTUC预测概率越接近1时,输出的“非UTUC”预测结果越准确;所述UTUC预测模型输出的非UTUC预测概率越接近0时,输出的“UTUC”预测结果越准确。
为解决上述技术问题,本发明提供的一个技术方案为:一种用于预测UTUC的系统,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
判断并输出模块,用于在所述接收或输入完成后,通过如本发明所述的UTUC预测模型,输出对所述血浆样本的个体是否为UTUC的判断结果;所述是否为UTUC的结果判断标准为:所述UTUC预测模型输出的非UTUC预测概率>0.5时,输出预测结果为“非UTUC”,否则输出预测结果为“UTUC”;或者,所述UTUC预测模型输出的UTUC预测概率>0.5时,输出预测结果为“UTUC”,否则输出预测结果为“非UTUC”。具体地,当预测结果越接近于1或0,预测结果越准确,例如所述UTUC预测模型输出的非UTUC预测概率越接近1时,输出的“非UTUC”预测结果越准确;所述UTUC预测模型输出的非UTUC预测概率越接近0时,输出的“UTUC”预测结果越准确。
在本发明一较佳实施方案中,所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据。优选地,所述采集为通过LS-MA技术得到,使用DIA检测方式采集蛋白质表达量数据。更优选地,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配,所述肽段匹配的数据库优选为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机辅助的UTUC预测方法,所述UTUC预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如本发明所述的UTUC预测模型,输出对所述血浆样本的个体是否为UTUC的判断结果。
在本发明一较佳实施方案中,所述UTUC预测方法还包括步骤0:采集血浆样本中的蛋白质表达量数据。优选地,所述采集为通过LS-MA技术得到,使用DIA检测方式采集蛋白质表达量数据。更优选地,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配,所述肽段匹配的数据库优选为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ(Intensity-based absolute-protein-quantification,无标签的基于强度的绝对定量)方法进行蛋白质定量,计算各蛋白质的FOT(Fraction of total,定义为该蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ),并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
为解决上述技术问题,本发明提供的一个技术方案为:一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如本发明所述的系统的功能,或实现如本发明所述的UTUC预测方法的步骤。
本发明中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现如本发明所述的系统的功能,或实现如本发明所述的UTUC预测方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
为解决上述技术问题,本发明提供的一个技术方案为:一种电子设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如本发明所述的系统的功能,或实现如本发明所述的UTUC预测方法的步骤。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
本发明提供的UTUC预测模型和生物标志物可以检测UTUC,具有高灵敏度和高特异性的优点,具有广泛的科研价值并为个体提供个性化的UTUC检测,有利支持了UTUC的检测,对治疗UTUC患者的临床决策具有重要意义。
具有广泛的科研价值并为上尿路尿路上皮癌患者提供个性化预测,对于帮助指导UTUC患者的咨询、随访安排、辅助治疗、临床决策等具有重要意义。
附图说明
图1为本发明所述检测上尿路尿路上皮癌的血浆生物标志物组合在发现队列的受试者工作特征曲线(ROC)图。
图2为本发明所述检测上尿路尿路上皮癌的血浆生物标志物组合在验证队列的受试者工作特征曲线(ROC)图。
图3为鉴定蛋白的累计曲线图。
图4为检测UTUC的系统的结构示意图。
图5为电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例中所需的确诊为上尿路尿路上皮癌患者的术前血浆样本的451例(362例为发现队列,89例为验证队列),以及作为健康对照的血浆样本239例(发现队列及验证队列均使用该239例健康对照的血浆样本)。本研究的设计和实施由医学伦理委员会通过伦理投票批准和监督。已获得所有患者的书面知情同意。
实施例1上尿路尿路上皮癌术前的血浆临床样本和健康对照的血浆样本的预处理
临床样本为UTUC患者的术前的血浆样本和健康人的血浆样本。样品预处理:收集新鲜血液加入到盛有抗凝剂的管中,颠倒混匀,充分抗凝,1000-2000×g离心10min,取上层淡黄色透明液体即为血浆,存至离心管中,-80冻存备用。
实施例2临床样本的蛋白质及肽段提取
2μL血浆样品与100μL 50mM碳酸氢铵缓冲液混合,混合液在95℃金属浴5min后冷却至室温,在37℃恒温箱中,酶蛋白质量比为1:25的条件下用胰蛋白酶(Promega,Catalog:V528A)消化17小时。然后在每个管中加入5μL的氨水,旋涡混匀,终止酶解。在60℃真空干燥器(SpeedVac,Eppendorf)中进行抽干。抽干后,取100μL 0.1%甲酸复溶,并漩涡震荡3min,离心5min(12000g),取上清进行脱盐。脱盐前需要制备并活化柱子(2片3M C18膜),活化顺序为:90μL 100%乙腈2次,90μL 50%乙腈和80%乙腈依次1次,90μL 50%乙腈1次。90μL0.1%甲酸平衡柱2次后,将管上清装入柱2次,90μL 0.1%甲酸脱盐2次。最后,加入90μL洗脱缓冲液(0.1%甲酸,50%乙腈)2次,收集洗脱液。60℃真空抽干,获得用于质谱检测所需的肽段。
实施例3临床样本的质谱检测
用Q-Exactive HF-X混合四极轨道阱质谱仪(Thermo Fisher Scientific,Rockford,IL,USA)和高效液相色谱系统(EASY nLC 1200,Thermo Fisher)进行检测,并得到该肽样品对应的质谱数据。具体操作为:
抽干的肽样品重新溶解在溶剂A(0.1%甲酸的水溶液)中,60℃,150μm I.D.×8cm色谱柱上分离(C18,1.9μm,Dr.Maisch GmbH)。流动相A和B分别为99.9/0.1%水/甲酸(v/v)和80/20/0.1%乙腈/水/甲酸(v/v/v)。质谱条件设置为数据非依赖性(data-independent acquisition,DIA)或平行反应检测(parallel reaction monitoring,PRM)。
DIA采集的循环模式为1个一级全扫描+30个可变窗口DIA扫描;一级扫描范围为300-1400m/z;一级检测:轨道阱质量分析器,分辨率:60k(@200m/z);离子选择模式:四级杆;AGC:4.0e5;二级碎裂模式:高能碰撞解离;碰撞能量:30%;二级检测:轨道阱质量分析器;分辨率:15k@200m/z;30个可变窗口具体为:300-346m/z,346-414m/z,414-453.5m/z,453.5-484.5m/z,484.5-512.5m/z,512.5-541.5m/z,541.5-570.5m/z,570.5-597m/z,597-621m/z,621-645m/z,645-668m/z,668-691m/z,691-714.5m/z,714.5-738m/z,738-762.5m/z,762.5-787m/z,787-809.5m/z,809.5-832m/z,832-856.5m/z,856.5-881.5m/z,881.5-908m/z,908-936m/z,936-963.5m/z,963.5-993.5m/z,993.5-1027.5m/z,1027.5-1062.5m/z,1062.5-1104m/z,1104-1157m/z,1157-1224.5m/z,1224.5-1331.5m/z。液相色谱串联质谱系统使用Xcalibur软件(Thermo Scientific)控制进行数据采集。
实施例4质谱数据的收集和处理
所有DIA数据均使用Firmiana(V1.0)进行处理。Firmiana是一个基于Galaxy系统的工作流,由用户登录界面、原数据、识别与量化、数据分析和知识挖掘等多个功能模块组成。使用FragPipe(v12.1)和MSFragger(2.2)(DIA数据)和Mascot搜索引擎(DDA数据)在UniProt人类蛋白质数据库(更新于2019.12.17,20406项)中搜索数据。选择胰蛋白酶作为蛋白水解酶,最大允许两个漏切位点,固定修饰为carbamidomethyl(C),动态修饰为protein acetyl(protein N-term),oxidation(M)。第一个搜索质量耐受性为20ppm,主要搜索肽耐受性为0.5da。数据根据诱饵数据库进行搜索,蛋白质鉴定以1%的错误发现率(FDR)被接受。利用SpectraST软件将DDA数据的结果合并到谱图库中。共有327个库作为参考谱图库。
DIA数据采用DIA-NN(v1.7.0)进行分析。DIA-NN采用默认设置(前驱体FDR:5%,Log lev:1,质量精度:20ppm,MS1精度:10ppm,扫描窗口:30,隐式蛋白组:基因,定量策略:稳健LC(高精度))。通过所有参考谱图库的色谱片段离子峰面积的平均值来计算识别肽的定量。使用无标签的基于强度的绝对定量(iBAQ)方法进行蛋白质定量。计算了峰面积值作为相应蛋白质的一部分。总分数(FOT)用于表示样品中特定蛋白质的标准化丰度。FOT定义为蛋白质的iBAQ除以样品中所有已鉴定蛋白质的总iBAQ。
实施例5筛选蛋白质标记物
分析蛋白质标记物的表达量,选取有效鉴定蛋白。
690(451+239)例样本,样本鉴定的蛋白质数目在1586-2257之间。如图3所示的累计曲线图,在690个样本中,总共鉴定到9336种蛋白质。本发明以每种蛋白质在特定样本中的表达量占该样本中所有蛋白质表达量的比例(fraction of total,FOT)作为其归一化的表达量,再将FOT值乘以1e5作为最终的输入值。
实施例6建立预测模型
首先,通过Frequency>90%,筛选出563种较为广泛存在的蛋白质。再在发现队列的UTUC样本和健康样本之间通过对比选取表达存在显著差异的分子(FOT差异倍数大于2倍,即UTUC患者的血浆样本中表达量/健康的血浆样本中表达量>2,且Wilcoxon rank-sumtest检验并经Benjamini-Hochberg校正的p值小于0.05),共10种蛋白被选出作为候选标志物。
建立预测UTUC的模型:
基于广义线性回归模型的机器学习算法,将各候选标志物的FOT值输入如下所示的R包建立预测模型:
在发现队列中,基于DIA数据筛选得到10种蛋白质分子生物标志物(C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1),并建立了以这10中蛋白分子标志物建立的模型。在发现队列中,该模型的预测准确率为99.6%,诊断灵敏度99.6%,特异性99.7%(见图1),在验证队列中,受试者工作特征曲线的平均曲线下面积(AUC)为0.91(见图2)。对于待确诊是否为上尿路尿路上皮癌的患者,将蛋白质分子生物标志物的经如上所述的DIA收集的表达水平(FOT)输入所得预测模型,得到判断是否为上尿路尿路上皮癌的输出结果(见表1)。对于某未知样本,模型输出的非UTUC预测概率>0.5时,输出预测结果为“非UTUC”,否则输出预测结果为“UTUC”;或者,模型输出的UTUC预测概率>0.5时,输出预测结果为“UTUC”,否则输出预测结果为“非UTUC”。具体地,当预测概率越接近于1或0时,预测结果越准确,例如模型输出的非UTUC预测概率越接近1时,输出的“非UTUC”预测结果越准确;模型输出的非UTUC预测概率越接近0时,输出的“UTUC”预测结果越准确。
表1 10种标志物的预测及输出结果
患者编号 非UTUC预测概率 UTUC预测概率 是否为UTUC
#1 0.98 1.21E-04
#2 1.61E-05 0.97
#3 1.28E-06 1
#4 5.34E-05 0.99
#5 0.98 1.93E-07
实施例7检测UTUC的系统
检测UTUC的系统61:数据接收模块52和判断并输出模块53,优选还包括数据处理模块51(见图4)。
数据处理模块51用于采集血浆样本中的蛋白质表达量数据,并将其传输给数据接收模块。
数据接收模块52用于将接收或输入血浆样本中的蛋白质表达量数据输入判断并输出模块53。其中,所述蛋白质表达量数据可通过数据处理模块51进行收集,亦可从其他来源获取所述蛋白质表达量数据。
判断并输出模块53用于在所述接收或输入完成后,通过如实施例6所述的UTUC预测模型,输出对血浆样本的个体是否为UTUC的判断结果。
实施例8电子设备
本实施例提供了一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现本发明实施例6中检测UTUC的方法。
图5示出了本实施例的硬件结构示意图,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例4的数据分析方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例9计算机可读存储介质
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例6中检测UTUC的方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现本发明实施例4中检测UTUC的方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
最后,上述具体实施方法仅用以说明本发明的技术方案,而非对其限制。

Claims (13)

1.一种生物标志物在制备预测和/或诊断UTUC的试剂盒中的应用,其特征在于,所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
2.一种用于检测生物标志物的试剂,其特征在于,所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
较佳地:
所述试剂用于检测所述生物标志物的表达水平,所述表达水平为蛋白质表达水平和/或mRNA转录水平,所述试剂优选为用于转录组和/或蛋白质组测序的试剂;和/或,所述试剂为与所述生物标志物特异性结合,或者与编码所述生物标志物的核酸特异性杂交的生物分子试剂,所述生物分子试剂优选自引物、探针和抗体。
3.一种用于检测生物标志物的试剂在制备预测和/或诊断UTUC的试剂盒中的应用,其特征在于,所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
优选地,所述试剂为如权利要求2所述的试剂。
4.一种生物标志物组合,其特征在于,所述生物标志物组合包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1。
5.一种试剂盒,其特征在于,所述试剂盒包含如权利要求2所述的试剂和如权利要求4所述的生物标志物组合。
6.一种检测UTUC的方法,其特征在于,所述方法包括检测待测血浆样本中的生物标志物的表达水平;所述生物标志物包括以下一种或多种蛋白质:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
较佳地,所述表达水平为蛋白表达水平和/或mRNA转录水平;和/或,所述检测UTUC的方法为非诊断目的的。
7.一种UTUC预测模型的构建方法,其特征在于,所述构建方法包括:
将蛋白质表达量数据库中的蛋白质表达量数据输入广义线性回归模型进行机器学习,构建得到所述UTUC预测模型;所述蛋白质表达量数据库中蛋白质表达量数据的来源包含UTUC患者的血浆样本和健康的血浆样本;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
较佳地,所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式采集;优选地,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配;更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型;
和/或,
所述蛋白质表达量数据输入广义线性回归模型前,先将所述UTUC患者的血浆样本分为发现队列和验证队列,所述发现队列和验证队列同时还包括相同的健康的血浆样本,所述发现队列和验证队列中UTUC患者的血浆样本的比例优选为2:1-8:1;和/或,输入广义线性回归模型的蛋白质满足:UTUC患者的血浆样本中表达量/健康的血浆样本中表达量>2,且Wilcoxon rank-sum test检验并经Benjamini-Hochberg校正的p值小于0.05;和/或,所述广义线性回归模型的参数为:采用向后逐步回归方法筛选标志物,并利用R包glm功能进行预测。
8.一种UTUC预测模型,其特征在于,所述UTUC预测模型由如权利要求7所述的构建方法建构得到。
9.一种样本是否为UTUC的预测方法,其特征在于,所述预测方法包括将样本的蛋白质表达量数据输入如权利要求8所述的UTUC预测模型,得到样本是否为UTUC的结果;所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
较佳地:
所述蛋白质表达量数据通过LC-MS技术得到,使用DIA检测方式采集;优选地,所述DIA检测方式采集的数据经Firmiana软件进行肽段匹配;更优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库,和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型;
更佳地:
所述结果的判断标准为:所述UTUC预测模型输出的非UTUC预测概率>0.5时,输出预测结果为“非UTUC”,否则输出预测结果为“UTUC”;或者,所述UTUC预测模型输出的UTUC预测概率>0.5时,输出预测结果为“UTUC”,否则输出预测结果为“非UTUC”。
10.一种用于预测UTUC的系统,其特征在于,所述系统包括:
数据接收模块,用于接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
判断并输出模块,用于在所述接收或输入完成后,通过如权利要求8所述的UTUC预测模型,输出对所述血浆样本的个体是否为UTUC的判断结果;所述是否为UTUC的结果判断标准为:所述UTUC预测模型输出的非UTUC预测概率>0.5时,输出预测结果为“非UTUC”,否则输出预测结果为“UTUC”;或者,所述UTUC预测模型输出的UTUC预测概率>0.5时,输出预测结果为“UTUC”,否则输出预测结果为“非UTUC”;
较佳地:
所述系统还包括数据处理模块,用于采集血浆样本中的蛋白质表达量数据;优选地,所述采集为通过LS-MA技术得到,使用DIA检测方式采集蛋白质表达量数据;更优选地,所述DIA检测方式采集的蛋白质表达量数据通过Firmiana软件进行肽段匹配;进一步优选地,所述肽段匹配的数据库为UniProt人类蛋白质数据库;和/或,采用DIA-NN分析经Firmiana处理后的蛋白质表达量数据:使用iBAQ方法进行蛋白质定量,计算各蛋白质的FOT,并将各蛋白的FOT作为蛋白质表达量数据输入广义线性回归模型。
11.一种计算机辅助的UTUC预测方法,其特征在于,所述UTUC预测方法包括以下步骤:
步骤1:接收或输入血浆样本中的蛋白质表达量数据,所述蛋白质表达量数据包括以下生物标志物的蛋白质表达量数据:C2、ANX6、THUMPD1、CD44、CPN1、HBZ、LRPPRC、S100A8、SAA2和SAA1;
步骤2:将步骤1接收或输入的蛋白质表达量数据输入如权利要求8所述的UTUC预测模型,输出对所述血浆样本的个体是否为UTUC的判断结果。
12.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时,可实现如权利要求10所述的系统的功能,或实现如权利要求11所述的UTUC预测方法的步骤。
13.一种电子设备,其特征在于,其包括存储器和处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求10所述的系统的功能,或实现如权利要求11所述的UTUC预测方法的步骤。
CN202311053305.4A 2023-08-18 2023-08-18 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用 Active CN117187385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311053305.4A CN117187385B (zh) 2023-08-18 2023-08-18 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311053305.4A CN117187385B (zh) 2023-08-18 2023-08-18 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用

Publications (2)

Publication Number Publication Date
CN117187385A true CN117187385A (zh) 2023-12-08
CN117187385B CN117187385B (zh) 2024-05-14

Family

ID=88997080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311053305.4A Active CN117187385B (zh) 2023-08-18 2023-08-18 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用

Country Status (1)

Country Link
CN (1) CN117187385B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103782174A (zh) * 2011-06-07 2014-05-07 卡里斯生命科学卢森堡控股有限责任公司 用于癌症的循环生物标志物
CN106944163A (zh) * 2017-01-24 2017-07-14 瑞汉智芯医疗科技(嘉善)有限公司 一种针对尿路上皮癌的尿脱落肿瘤细胞的免疫荧光染色技术
WO2022191566A1 (ko) * 2021-03-08 2022-09-15 (주)아큐레시스바이오 췌장암의 진단용 조성물
CN115612738A (zh) * 2022-09-27 2023-01-17 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测胃癌治疗效果中的应用
CN115678994A (zh) * 2022-01-27 2023-02-03 上海爱谱蒂康生物科技有限公司 一种生物标志物组合、含其的试剂及其应用
CN116024338A (zh) * 2022-09-27 2023-04-28 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN116479132A (zh) * 2023-04-26 2023-07-25 上海交通大学医学院附属仁济医院 膀胱癌甲基化位点标志物及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103782174A (zh) * 2011-06-07 2014-05-07 卡里斯生命科学卢森堡控股有限责任公司 用于癌症的循环生物标志物
CN106944163A (zh) * 2017-01-24 2017-07-14 瑞汉智芯医疗科技(嘉善)有限公司 一种针对尿路上皮癌的尿脱落肿瘤细胞的免疫荧光染色技术
WO2022191566A1 (ko) * 2021-03-08 2022-09-15 (주)아큐레시스바이오 췌장암의 진단용 조성물
CN115678994A (zh) * 2022-01-27 2023-02-03 上海爱谱蒂康生物科技有限公司 一种生物标志物组合、含其的试剂及其应用
CN115612738A (zh) * 2022-09-27 2023-01-17 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测胃癌治疗效果中的应用
CN116024338A (zh) * 2022-09-27 2023-04-28 上海爱谱蒂康生物科技有限公司 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN116479132A (zh) * 2023-04-26 2023-07-25 上海交通大学医学院附属仁济医院 膀胱癌甲基化位点标志物及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
单立平;李波;张墨;吴斌;宋永胜;: "肾盂尿路上皮癌CD44和CD8表达生物学意义的探讨", 中华肿瘤防治杂志, no. 14, 28 July 2013 (2013-07-28) *
张豪杰;盛璐;陶晶;陈然;孙忠全;钱伟庆;: "达芬奇机器人辅助下手术治疗双侧输尿管癌合并浸润性膀胱癌一例", 中华腔镜泌尿外科杂志(电子版), no. 06, 1 December 2016 (2016-12-01) *
李沐寒;邢添瑛;贺慧颖;: "复发性膀胱尿路上皮癌中IMP3和CD44蛋白表达", 中国肿瘤临床, no. 08, 30 April 2015 (2015-04-30) *

Also Published As

Publication number Publication date
CN117187385B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
US20040153249A1 (en) System, software and methods for biomarker identification
US20060088894A1 (en) Prostate cancer biomarkers
CN114414704B (zh) 评估甲状腺结节恶性程度或概率的系统、模型及试剂盒
SG173310A1 (en) Apolipoprotein fingerprinting technique
CN116024338B (zh) 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN115678994A (zh) 一种生物标志物组合、含其的试剂及其应用
US20050100967A1 (en) Detection of endometrial pathology
CN116732164A (zh) 生物标志物组合及其在预测asd疾病中的应用
CN117051113B (zh) 生物标志物组合在制备预测结直肠癌的试剂盒中的应用
CN117187385B (zh) 生物标志物在制备预测和/或诊断utuc的试剂盒中的应用
US20070184511A1 (en) Method for Diagnosing a Person Having Sjogren's Syndrome
CN117079710B (zh) 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用
CN117004729B (zh) 生物标志物及其在预测和/或诊断utuc进展时间中的应用
CN117079710A (zh) 生物标志物及其在预测和/或诊断utuc肌肉浸润中的应用
CN115678993A (zh) 一种生物标志物组合、含其的试剂及其应用
EP2674758A1 (en) A computational method for mapping peptides to proteins using sequencing data
CN117089621A (zh) 生物标志物组合及其在预测结直肠癌疗效中的应用
CN112037852A (zh) 一种t1期结直肠癌淋巴结转移预测方法和系统
CN117070635B (zh) 生物标志物组合在制备预测透明性肾细胞癌的试剂盒中的应用
CN112924685B (zh) 抑郁症生物标志物和包括其的诊断试剂盒
CN117074679B (zh) 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用
CN117051102B (zh) 生物标志物组合在制备预测帕金森病的产品中的应用
CN116469471A (zh) 一种利用蛋白质组学检测t1期结直肠癌淋巴结转移的模型
CN117074679A (zh) 生物标志物组合及其在预测免疫治疗联合化疗治疗食管癌效果中的应用
CN115954046A (zh) 一种胃癌个性化治疗决策方法、系统及含其的存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant