CN114822854A - 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 - Google Patents
胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 Download PDFInfo
- Publication number
- CN114822854A CN114822854A CN202210733363.0A CN202210733363A CN114822854A CN 114822854 A CN114822854 A CN 114822854A CN 202210733363 A CN202210733363 A CN 202210733363A CN 114822854 A CN114822854 A CN 114822854A
- Authority
- CN
- China
- Prior art keywords
- gastric
- progression
- gastric mucosa
- lesion
- gastric cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种个体尿蛋白与胃癌及胃黏膜病变进展关联的分析方法;并通过计算尿蛋白表达与胃黏膜组织病理状态、胃黏膜病变进展的关系,从而建立胃癌以及胃黏膜病变进展相关的尿蛋白标志物数据库;进而建立胃黏膜病变样本疾病进展风险评分体系。本发明基于无创方法,通过分子流行病学研究手段,结合生物信息学分析及机器学习,整合微观与宏观胃癌病因危险因素,建立胃黏膜病变进展风险预测模型为胃癌早筛和精准预防打下基础。
Description
技术领域
本发明涉及医学诊断领域,具体涉及一种胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用。
背景技术
胃癌位居全球癌症相关死亡的第四位。早期胃癌预后良好,I期胃癌的5年生存率高达90%,但由于发病隐匿,大多数胃癌患者在中晚期才被诊断出来,导致胃癌的总体5年生存率很低。因此,识别胃癌发生的高风险人群并进行适宜干预,以及提高胃癌的早诊率,对于降低胃癌疾病负担至关重要。目前胃癌诊断的金标准是胃镜检查与活检样本病理诊断,尽管大规模的人群内窥镜筛查有助于提高胃癌早期检出率,但具有侵入性和高风险性,且费用高、耗时长、对专业队伍高度依赖,使得在大多数中低收入国家,基于全人群策略的胃镜筛查并不可行。基于非侵入性方法寻找生物标志物,对有效识别胃癌高危人群以利于分级干预和提高胃癌早期检出率、改善胃癌预后至关重要。
胃癌,尤其是常见的肠型胃癌,其发生经历胃黏膜病变长期复杂的演变过程,从轻度胃黏膜病变如浅表性胃炎(SG)和慢性萎缩性胃炎(CAG)到重度胃黏膜病变如肠上皮化生(IM)和低级别上皮内瘤变(LGIN),最后到高级别上皮内瘤变(HGIN)和浸润性胃癌。开展涵盖各级别胃黏膜病变和胃癌的分子流行病学研究,特别是依托胃黏膜病变的前瞻性随访,从而发现胃黏膜病变进展和胃癌发生风险相关的分子特征,这对胃癌的人群风险分层、分级干预和早期诊断有重要的意义。
尿液是常用的液体活检样本,与其他生物样本相比,其收集是无创的,而且能大量获得,可以用于大规模人群筛查的生物标志物检测。尿液中的蛋白质除了来自泌尿生殖道以外,还来自整体循环系统,携带着能够反映机体生理状况的重要信息。事实上,癌细胞、凋亡细胞和坏死细胞均可向微环境和血液中释放蛋白质,然后被肾脏过滤和重吸收,最终进入尿液。因此,尿液中含有稳定的多肽和含量低但功能重要的蛋白质,可以进行可靠测量。相比血液而言,尿液中的蛋白不会受到稳态机制的影响,能更敏感地反映机体变化,因而能够更好地观察丰度低的关键功能蛋白的变化。随着高通量技术的日趋成熟,尿液蛋白质组学研究为揭示胃黏膜病变进展为癌相关分子特征、探索胃癌新型生物标志物提供了新途径和机会。既往肾癌、膀胱癌和肺癌相关蛋白质组学研究表明尿液蛋白具备作为生物标志物的潜力。目前胃癌的尿蛋白质组学研究较少,且并无对胃癌发病机制模型中不同胃黏膜病变和早期胃癌相关尿蛋白质组学特征和差异性分子标签的系统探讨。
发明内容
针对目前胃癌早筛的无创蛋白标志物的缺乏,本发明提供如下的技术方案:
本发明第一个方面,提供一种胃黏膜病变样本疾病进展风险评分体系的建立方法,所述方法包括如下步骤:
1)利用尿蛋白标志物建立风险评分公式;所述尿蛋白标志物是既与胃癌显著相关又与胃黏膜病变进展显著相关的蛋白;所述风险评分公式为:
风险评分 = β 1 X 1 + β 2 X 2 + β 3 X 3 +…β n X n
β为纳入权利要求1步骤3)中所得的蛋白n的Logistic回归模型中的回归系数,X为蛋白n的标准化iFOT值;
2)分析风险评分与胃黏膜病变进展关系
对疾病进展结局进行判定,并将临床变量纳入关联分析,再基于多因素非条件Logistic回归建模分析风险评分与胃黏膜病变进展之间的关系。
在一种实施方式中,所述尿蛋白标志物通过如下方法筛选:
(1)分析蛋白表达与组织病理胃黏膜病变状态关系,筛选与胃癌显著相关蛋白:
a)胃黏膜病变状态根据组织病理诊断分为SG、CAG、IM、DYS、GC, 分别以轻度胃黏膜病变(SG/CAG)和重度胃黏膜病变(IM/DYS)为参照,及胃癌(GC)蛋白表达差异;
b)纳入关联分析的临床变量:性别、年龄;
c)关联分析方法:正交偏最小二乘法判别分析(OPLS-DA),多因素非条件Logistic回归;
其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄;选择OPLS-DA 分析VIP值>1且Logistic回归P值<0.05的蛋白;
(2)分析蛋白表达与胃黏膜病变进展关系,筛选与胃黏膜病变进展显著相关的蛋白:
a) 疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;
b) 纳入关联分析的临床变量:性别、年龄和基线组织病理诊断
c) 关联分析方法:多因素非条件Logistic回归;
其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄和基线组织病理诊断,P <0.05。
在一种实施方式中,所述步骤2)分析风险评分与胃黏膜病变进展关系的具体方法为:
a)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;
b)纳入关联分析的临床变量:性别、年龄和基线组织病理诊断;
c)关联分析方法:多因素非条件Logistic回归;
其中,所述多因素非条件Logistic回归所校正的临床变量是:性别、年龄和基线组织病理诊断。
在一种优选的实施方式中,所述风险评分公式为
0.311×ANXA11+0.936×CDC42+0.277×NAPA+0.243×SLC25A4。
本发明的第二个方面,提供一种尿蛋白标志物在制备胃癌高风险人群识别检测试剂盒和/或芯片中的应用,所述尿蛋白标志物选自ANXA11、CDC42、NAPA、SLC25A4、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANGPTL2、CAPG、CETP、COX4I1、CTSC、EEF1A1、EEF1A2、GOT2、GPRC5B、GUSB、HADHB、HNRNPA2B1、HSP90B1、HSPA5、HSPA6、HSPD1、IGFALS、LAP3、MFI2、NAGLU、PDXK、PHB、RHOA、SGSH、SLC25A5、SLC25A6、SUCLG2、TUBB、TUBB2A、TUBB3、TUBB4A、TUBB4B、TUBB6和/或UQCRC2。
本发明的第三个方面,一种尿蛋白标志物在制备胃粘膜病变进展检测试剂盒和/或芯片中的应用,所述尿蛋白标志物选自ACO1、AHSG、ALDH7A1、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANXA11、ANXA4、ANXA5、ANXA6、ARPC4、ASAH1、ATIC、ATP6V1A、ATP6V1B1、ATP6V1B2、BAIAP2、BASP1、CAB39、CAND1、CDC42、CNP、COL6A1、CRYL1、EHD4、EPS8、GALNS、GLB1、KRT77、LAMP2、LDHA、LDHB、MSN、MUC1、MXRA5、MYH9、NAPA、NAPRT1、PEBP1、PGM1、PIGR、PPIA、PPIC、PRCP、PRDX6、QSOX1、RBP5、RDX、RPS27A、SLC25A4、SLC44A2、TCP1、THY1、TSG101、UBA52、UBB、UBC、VASN、VDAC3、VPS4A、ZG16B、C1RL、LRP2、MFI2和/或SLC12A3。
本发明的第四个方面,提供一种尿蛋白标志物在诊断早期胃癌和/或胃黏膜病变的产品中的应用,所述生物标志物包括ANXA11、CDC42、NAPA、SLC25A4。
在一种实施方式中,所述产品包括检测所述生物标志物表达水平的试剂。
在一种实施方式中,所述检测所述生物标志物表达水平的试剂包括检测引物和/或探针。
在一种实施方式中,所述产品是试剂盒或基因芯片。
本发明的有益效果是:
1)本发明选择尿液作为样本,可以无创且大量的收集,适用于大规模筛查。
2)尿液中含有丰度低但重要的蛋白,能全面的反应机体生理、病理状态。
3)本发明采用高灵敏度、高分辨率、高精准的高通量质谱技术以更进一步地挖掘极低丰度蛋白质的特征信息,可以实现更高的检测效率。
4)通过病例对照结合前瞻性随访来探究与胃癌及胃黏膜病变进展相关尿蛋白标志物,为胃癌病因学探索提供了重要线索;
5)本发明基于高灵敏度、高分辨率、高精准的现代质谱技术,通过定量蛋白质组学研究筛选和寻找不同胃黏膜病变与胃癌组、胃黏膜病变进展与非进展组尿液样本之间的差异表达蛋白,经过多因素分析,建立胃癌及胃黏膜病变进展相关分子标志物数据库。通过分子流行病学研究手段,结合生物信息学分析及机器学习,整合微观与宏观胃癌病因危险因素,建立胃黏膜病变进展风险预测模型,为最终构建全面系统的胃癌预防策略提供理论依据。
附图说明
图1是SG/CAG、IM/LGIN和胃癌组中可检测到的蛋白质数量分布图。
图2是255例胃黏膜组织样本蛋白表达谱预处理结果。
图3是风险评分与胃黏膜病变进展风险关系-多因素非条件Logistic回归森林图。
图4是进展风险预测模型图-随机森林模型受试者工作特征曲线(ROC)图。
具体实施方式
下面结合具体实施例对本发明作示例性说明。下述实施例中的实验方法,如无特别说明,均为常规方法。下述实施例中所使用的材料、试剂等,如无特殊说明,均可通过商业途径获得。
实施例1. 获得不同胃黏膜病变和胃癌尿液样本的蛋白质表达谱数据
实验样本为来自本实验室在山东省临朐县所建立的胃癌高发流行病学现场及北京大学肿瘤医院胃肠肿瘤中心的255例不同胃黏膜病变和胃癌患者清晨中段尿液样本,所有患者均已签署知情同意书。
针对255例临床胃镜活检胃黏膜组织样本进行蛋白质提取和分析,通过该步骤获得每一样本对应的蛋白质组数据集,包括蛋白的种类、数量和各种蛋白的定量值。
一、样本获取步骤
1、取材:用15mL采尿杯收集约15mL清晨中段尿;
2、分装:用胶头滴管将尿液分装到5mL含硼酸防腐剂的冻存管中;
3、存储:将冻存管存储于-80℃低温冰箱中保存。
二、蛋白质定量步骤
1、解冻:将5mL解冻的尿液置于清洁的超滤管中;
2、离心:在200000 g转速下超速离心70分钟;
3、清洗:向离心沉淀物中加入0.5 mol/L 的DTT缓冲液在65℃下加热30分钟,以去除其中的尿调蛋白;再用洗涤缓冲液(10mM TEA,100mM NaCl,pH 7.4)洗涤沉淀物两次;
4、蛋白酶解:超滤管更换新的收集管,加入胰酶,消化过夜;
5、肽段收集:将超滤管离心,14,000g、20min,保留收集管中的肽段,再加入质谱水200ul,离心清洗一次,保留第二次收集的肽段,两次收集的肽段合并后真空抽干,得到的产物用于质谱检测。
三、质谱方法:
为Thermo公司新型液质联用-串联质谱(LC-MS/MS),预柱和分析柱均使用C18填料。所用的流动相为A液(H2O∶FA=99.8∶0.2)和B 液(ACN∶FA=99.8∶0.2)。将抽干的肽段用上样缓冲液(H2O∶CH3OH∶FA=94.8∶5∶0.2)充分溶解,12 000 r/min离心10 min,上样质谱分析。具体步骤参照CN108445097A中具体实施方式部分“三、胃癌蛋白样品的质谱检测”部分。
四、质谱数据的解析与蛋白质定量
LC-MS/MS原始数据在Proteome Discoverer 1.4(Thermo Fisher Scientific)中处理,并使用Mascot搜索引擎(Matrix Science 2.3)针对NCBI human Refseq蛋白质数据库(2013年7月4日发布)进行搜索。将母离子质量偏差设为20ppm,子离子设置为50ppm,计算所鉴定到的肽段在的MS1峰下面积,错误发现率低于1%的肽段被保留下来。具体步骤参照CN108445097A中具体实施方式部分“四、胃癌蛋白样品的质谱数据分析”部分。
五、肽段质控:
筛选条件:
条件1: 唯一肽段数 >=1 并且高质量肽段数 >=2
条件2: 高质量肽段数 >=3
唯一肽段是指只在一个蛋白中存在的肽段;
高质量肽段是指Mascot评分在20分以上的肽段, 即二级谱鉴定时的严格程度;
满足上面条件1或2的蛋白保留进行下一步分析。
实施例2. 胃癌及胃黏膜病变进展相关分子标志物数据库的建立及诊断生物标志物的筛选
1、蛋白表达谱预处理和实验过滤
(1)高置信蛋白筛选:要求定量的蛋白含有至少一条专属肽段(unique peptide)且Mascot离子分值(ion score)大于等于20,且至少二条离子分值大于等于20的肽段,或者三条离子分值大于等于20的肽段;
(2)基于总和的定量数据标准化:采用基于峰面积的非标记定量iBAQ法,某个蛋白的iBAQ值即为该蛋白所有对应肽段峰面积之和与理论肽段数之商。通过计算鉴定到的每个蛋白iBAQ值与鉴定到的所有蛋白iBAQ值之和的比值对数据进行归一化处理,得到定量值(iFOT值);
(3)以实施例1的胃黏膜病变样本为例,剔除低于1/2以上样本中未检测到的蛋白,该步骤可根据不同癌症、不同样本类型的实际蛋白鉴定数进行调整。
结果如图1所示,实施例1的255例不同胃黏膜病变和胃癌尿液样本中共鉴定到3540个高可信度蛋白;图2为255例胃黏膜组织样本蛋白表达谱预处理结果。
2. 鉴定并验证蛋白表达与组织病理胃黏膜病变状态之间的关系
(1)以胃黏膜病变蛋白质组学数据为例,分别以轻度胃黏膜病变(SG/CAG)和重度胃黏膜病变(IM/LGIN)为参照,探索及胃癌(GC)蛋白表达差异;
(2)纳入关联分析的临床变量:患者性别及年龄;
(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄)和OPSL-DA。采用R语言glm函数,Logistic回归的公式为:病变分组~性别+年龄+蛋白(即,以病变分组为因变量,年龄、性别和蛋白为模型中的自变量,后文中均按照此格式表示Logistic回归公式),参数family设置为 binomial(link = "logit")进行Logistic回归分析;采用R语言ropls包opls函数进行OPLS-DA判别分析。
结果如表1所示:鉴定并验证43个蛋白与胃癌显著相关,其中28个蛋白正相关,15个蛋白负相关。
表1 胃癌相关尿蛋白a
a非条件Logistic回归校正年龄、性别。所展示的为以轻度胃黏膜病变或重度胃黏膜病变为参照,发现集与验证集中胃癌组VIP值均>1且Logistic回归P值<0.05的尿蛋白。CAG,慢性萎缩性胃炎;GC,胃癌;IM,肠化生;LGIN,低度上皮内瘤变;SG,浅表性胃炎;或者,比值比;VIP,变量投影重要性。
3. 鉴定并验证蛋白表达与胃黏膜病变进展之间的关系
(1)以胃黏膜病变尿蛋白质组学数据为例,疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为非进展;
(2)纳入关联分析的临床变量:患者性别、年龄、基线组织病理诊断;
(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄、基线组织病理诊断),采用R语言glm函数,Logistic回归公式为:病变分组~性别+年龄+基线组织病理诊断+蛋白,参数family设置为 binomial(link = "logit")。
结果如表2所示:鉴定出67个尿蛋白与胃黏膜病变进展显著相关,66个为正相关,一个为负相关。
表2 胃黏膜病变进展显著相关蛋白a
a 非条件Logistic回归,校正性别,年龄及基线组织病理。显著性水平为单侧P<0.05。
实施例3 胃黏膜病变样本疾病进展风险评分体系的建立
1. 胃黏膜病变进展及胃癌相关分子标志物筛选:根据实施例2获得的结果,选择既与胃癌显著相关又与胃黏膜病变进展显著相关且方向一致的蛋白——ANXA11、CDC42、NAPA、SLC25A4。
2. 胃黏膜病变进展风险评分体系的建立:将ANXA11、CDC42、NAPA、SLC25A4作为标志物,通过前述蛋白表达与胃黏膜病变进展关系回归系数及蛋白表达量建立风险评分公式:
风险评分 = β 1 X 1 + β 2 X 2 + β 3 X 3 +…β n X n
本实施例中,n为4,即为ANXA11、CDC42、NAPA、SLC25A4四种蛋白,β为每种蛋白Logistic回归模型中的回归系数,X为每种蛋白的标准化iFOT值。其中回归系数即以胃黏膜病变进展为因变量,将这四个蛋白为自变量纳入到Logistic回归模型中得到的回归系数。蛋白质定量采用基于峰面积的非标记定量iBAQ法,某个蛋白的iBAQ值即为该蛋白所有对应肽段峰面积之和与理论肽段数之商。通过计算鉴定到的每个蛋白iBAQ值与鉴定到的所有蛋白iBAQ值之和的比值对数据进行归一化处理,得到定量值(iFOT值)。再将iFOT值按蛋白进行标准化即得到标准化的iFOT值。
因此根据上面公式计算:
风险评分 = 0.311×ANXA11+0.936×CDC42+0.277×NAPA+0.243×SLC25A4.
3. 风险评分与胃黏膜病变进展关系
根据上述风险评分公式对疾病进展结局进行判定,并将临床变量(性别、年龄和基线组织病理诊断)纳入关联分析,再基于多因素非条件Logistic回归(校正性别、年龄和基线组织病理诊断)建模以分析胃黏膜病变风险评分与胃黏膜病变进展之间的关系,具体操作为:
(1)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG(轻度、中度、重度)、IM(轻度、中度、重度)、LGIN、HGIN、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降者或不变者判定为疾病非进展;
(2)纳入关联分析的临床变量:性别、年龄、基线组织病理诊断;
(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄、基线组织病理诊断),采用R语言glm函数,Logistic回归公式为:疾病进展与否~性别+年龄+基线组织病理诊断+风险评分,参数family设置为 binomial(link = "logit")。
结果如图3所示,风险评分与疾病进展显著正相关,风险评分每增加一个标准差,疾病进展风险增加2.63倍。
实施例4 利用风险评分构建胃黏膜病变进展风险预测模型
1、胃黏膜病变进展风险预测模型的构建具体过程为:
1)自变量筛选:性别、年龄、基线组织病理诊断和风险评分;
2)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG(轻度、中度、重度)、IM(轻度、中度、重度)、LGIN、HGIN、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降者或不变者判定为疾病非进展;
3)病变进展风险分类器构建:选择R语言xgboost软件包,xgboost函数,纳入筛选后的变量,参数objective设置为binary:logistic,eval_metric设为logloss ,max_depth、eta、nround等参数可根据数据运行情况进行调整。
a)分类器选择:极端梯度提升算法;也可以选择支持随机森林等其他机器学习分类算法或者人工智能模型;
b)数据输入:筛选后纳入的自变量;
c)算法准确性测试:十折交叉验证。
构建结果如图4所示,分类器1包含性别、年龄和基线组织病理诊断,所获得的受试者工作特征曲线(ROC)下面积(AUC)=0.59;分类器2包含性别、年龄、基线组织病理诊断、风险评分,所获得的AUC=0.80。分类器2与分类器1比较,Delong’s test P=0.016,存在显著性差异。
4)分类器应用:
a)前处理:表达谱数据预处理,风险评分;
b)输入:筛选后纳入的自变量;
c)中间过程:分类器特征匹配,疾病进展预测:选择R语言xgboost软件包,xgboost函数,纳入筛选后的变量,公式:进展情况~性别+年龄+基线组织病理诊断+风险评分),参数objective设置为binary:logistic,eval_metric设为logloss,max_depth设为3、eta设为0.2、nround设为25,cv.nfold设为10。通过predict函数给出预测标签;
d)输出:疾病进展/非进展。
2. 结果
表3是以本研究中有胃黏膜病变进展信息的患者样本,通过上述步骤4)输出得到的结果,即我们所构建出的预测模型所得到的预测结果。
表3 十折交叉验证预测结果
Subjects | Prediction | Non-progression | Progression |
Exp039181 | Non-progression | 0.64 | 0.36 |
Exp039182 | Non-progression | 0.65 | 0.35 |
Exp039186 | Non-progression | 0.56 | 0.44 |
Exp039191 | Progression | 0.36 | 0.64 |
Exp039198 | Non-progression | 0.80 | 0.20 |
Exp039199 | Non-progression | 0.50 | 0.50 |
Exp039216 | Non-progression | 0.64 | 0.36 |
Exp039218 | Progression | 0.34 | 0.66 |
Exp039220 | Non-progression | 0.82 | 0.18 |
Exp039223 | Progression | 0.22 | 0.78 |
Exp039227 | Progression | 0.25 | 0.75 |
Exp039231 | Progression | 0.20 | 0.80 |
Exp039234 | Non-progression | 0.64 | 0.36 |
Exp039246 | Non-progression | 0.78 | 0.22 |
Exp039262 | Non-progression | 0.58 | 0.42 |
Exp039271 | Progression | 0.41 | 0.59 |
Exp039281 | Non-progression | 0.54 | 0.46 |
Exp039298 | Progression | 0.18 | 0.82 |
Exp039301 | Non-progression | 0.56 | 0.44 |
Exp039304 | Non-progression | 0.84 | 0.16 |
Exp039305 | Progression | 0.30 | 0.70 |
Exp039306 | Progression | 0.48 | 0.52 |
Exp039307 | Progression | 0.46 | 0.54 |
Exp039309 | Non-progression | 0.71 | 0.29 |
Exp039311 | Non-progression | 0.81 | 0.19 |
Exp039312 | Non-progression | 0.77 | 0.23 |
Exp039314 | Non-progression | 0.58 | 0.42 |
Exp039315 | Progression | 0.33 | 0.67 |
Exp039319 | Non-progression | 0.61 | 0.39 |
Exp039320 | Progression | 0.49 | 0.51 |
Exp039325 | Non-progression | 0.73 | 0.27 |
Exp039327 | Non-progression | 0.63 | 0.37 |
Exp039431 | Non-progression | 0.72 | 0.28 |
Exp039436 | Non-progression | 0.66 | 0.34 |
Exp039439 | Progression | 0.30 | 0.70 |
Exp039458 | Non-progression | 0.79 | 0.21 |
Exp039467 | Non-progression | 0.64 | 0.36 |
Exp039473 | Progression | 0.20 | 0.80 |
Exp039475 | Non-progression | 0.73 | 0.27 |
Exp039476 | Non-progression | 0.55 | 0.45 |
Exp039483 | Non-progression | 0.74 | 0.26 |
Exp039485 | Progression | 0.10 | 0.90 |
Exp039486 | Non-progression | 0.81 | 0.19 |
Exp039493 | Non-progression | 0.76 | 0.24 |
Exp039496 | Progression | 0.44 | 0.56 |
Exp039499 | Non-progression | 0.72 | 0.28 |
Exp039501 | Progression | 0.47 | 0.53 |
Exp039503 | Progression | 0.27 | 0.73 |
Exp039504 | Progression | 0.33 | 0.67 |
Exp039508 | Progression | 0.17 | 0.83 |
Exp039511 | Progression | 0.35 | 0.65 |
Exp039512 | Non-progression | 0.87 | 0.13 |
Exp039513 | Non-progression | 0.69 | 0.31 |
Exp039514 | Progression | 0.43 | 0.57 |
Exp039515 | Non-progression | 0.61 | 0.39 |
Exp039519 | Non-progression | 0.68 | 0.32 |
Exp039521 | Non-progression | 0.72 | 0.28 |
Exp039522 | Progression | 0.44 | 0.56 |
Exp039523 | Progression | 0.46 | 0.54 |
Exp039524 | Non-progression | 0.66 | 0.34 |
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。
Claims (10)
1.一种胃黏膜病变样本疾病进展风险评分体系的建立方法,其特征在于,包括如下步骤:
1)利用尿蛋白标志物建立风险评分公式;所述尿蛋白标志物是既与胃癌显著相关又与胃黏膜病变进展显著相关的蛋白;所述风险评分公式为:
风险评分 = β 1 X 1 + β 2 X 2 + β 3 X 3 +…β n X n
β为纳入权利要求1步骤3)中所得的蛋白n的Logistic回归模型中的回归系数,X为蛋白n的标准化iFOT值;
2)分析风险评分与胃黏膜病变进展关系
对疾病进展结局进行判定,并将临床变量纳入关联分析,再基于多因素非条件Logistic回归建模分析风险评分与胃黏膜病变进展之间的关系。
2.如权利要求1所述的方法,其中,所述尿蛋白标志物通过如下方法筛选:
(1)分析蛋白表达与组织病理胃黏膜病变状态关系,筛选与胃癌显著相关蛋白:
a) 胃黏膜病变状态根据组织病理诊断分为SG、CAG、IM、DYS、GC, 分别以轻度胃黏膜病变(SG/CAG)和重度胃黏膜病变(IM/DYS)为参照,及胃癌(GC)蛋白表达差异;
b) 纳入关联分析的临床变量:性别、年龄;
c) 关联分析方法:正交偏最小二乘法判别分析(OPLS-DA),多因素非条件Logistic回归;
其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄;选择OPLS-DA 分析VIP值>1且Logistic回归P值<0.05的蛋白;
(2)分析蛋白表达与胃黏膜病变进展关系,筛选与胃黏膜病变进展显著相关的蛋白:
a) 疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;
b) 纳入关联分析的临床变量:性别、年龄和基线组织病理诊断;
c) 关联分析方法:多因素非条件Logistic回归;
其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄和基线组织病理诊断,P <0.05。
3.如权利要求1所述的方法,其特征在于, 所述步骤2)分析风险评分与胃黏膜病变进展关系的具体方法为:
a) 疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;
b) 纳入关联分析的临床变量:性别、年龄和基线组织病理诊断;
c) 关联分析方法:多因素非条件Logistic回归;
其中,所述多因素非条件Logistic回归所校正的临床变量是:性别、年龄和基线组织病理诊断。
4.如权利要求1所述的方法,其特征在于,所述风险评分公式为
0.311×ANXA11+0.936×CDC42+0.277×NAPA+0.243×SLC25A4。
5.一种尿蛋白标志物在制备胃癌高风险人群识别检测试剂盒和/或芯片中的应用,其特征在于,所述尿蛋白标志物选自ANXA11、CDC42、NAPA、SLC25A4、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANGPTL2、CAPG、CETP、COX4I1、CTSC、EEF1A1、EEF1A2、GOT2、GPRC5B、GUSB、HADHB、HNRNPA2B1、HSP90B1、HSPA5、HSPA6、HSPD1、IGFALS、LAP3、MFI2、NAGLU、PDXK、PHB、RHOA、SGSH、SLC25A5、SLC25A6、SUCLG2、TUBB、TUBB2A、TUBB3、TUBB4A、TUBB4B、TUBB6和/或UQCRC2。
6.一种尿蛋白标志物在制备胃粘膜病变进展检测试剂盒和/或芯片中的应用,其特征在于,所述尿蛋白标志物选自ACO1、AHSG、ALDH7A1、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANXA11、ANXA4、ANXA5、ANXA6、ARPC4、ASAH1、ATIC、ATP6V1A、ATP6V1B1、ATP6V1B2、BAIAP2、BASP1、CAB39、CAND1、CDC42、CNP、COL6A1、CRYL1、EHD4、EPS8、GALNS、GLB1、KRT77、LAMP2、LDHA、LDHB、MSN、MUC1、MXRA5、MYH9、NAPA、NAPRT1、PEBP1、PGM1、PIGR、PPIA、PPIC、PRCP、PRDX6、QSOX1、RBP5、RDX、RPS27A、SLC25A4、SLC44A2、TCP1、THY1、TSG101、UBA52、UBB、UBC、VASN、VDAC3、VPS4A、ZG16B、C1RL、LRP2、MFI2和/或SLC12A3。
7.一种尿蛋白标志物在诊断早期胃癌和/或胃黏膜病变的产品中的应用,其特征在于,所述生物标志物包括ANXA11、CDC42、NAPA、SLC25A4。
8.如权利要求7所述的应用,其特征在于,所述产品包括检测所述生物标志物表达水平的试剂。
9.如权利要求8所述的应用,其特征在于,所述检测所述生物标志物表达水平的试剂包括检测引物和/或探针。
10.如权利要求8所述的应用,其特征在于,所述产品是试剂、试剂盒或基因芯片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210733363.0A CN114822854B (zh) | 2022-06-27 | 2022-06-27 | 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210733363.0A CN114822854B (zh) | 2022-06-27 | 2022-06-27 | 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114822854A true CN114822854A (zh) | 2022-07-29 |
CN114822854B CN114822854B (zh) | 2023-03-24 |
Family
ID=82522809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210733363.0A Active CN114822854B (zh) | 2022-06-27 | 2022-06-27 | 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114822854B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116516008A (zh) * | 2023-05-04 | 2023-08-01 | 中国中医科学院望京医院(中国中医科学院骨伤科研究所) | 胃粘膜肠上皮化生标志物jun及其应用 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070099209A1 (en) * | 2005-06-13 | 2007-05-03 | The Regents Of The University Of Michigan | Compositions and methods for treating and diagnosing cancer |
WO2017008894A1 (en) * | 2015-07-13 | 2017-01-19 | University Of Geneva | Biomarker panels for brain injury complications |
US20170220773A1 (en) * | 2016-02-03 | 2017-08-03 | Medidata Solutions, Inc. | System and method for contextualized tracking of the progress of a clinical study |
US20180166174A1 (en) * | 2016-08-02 | 2018-06-14 | Thomas J. Lewis | Disease Mitigation and Elimination Health Learning Engine |
CN108334747A (zh) * | 2017-01-20 | 2018-07-27 | 北京蛋白质组研究中心 | 获取肿瘤尿蛋白标志物的方法及得到的肿瘤相关离群尿蛋白库 |
CN110157801A (zh) * | 2018-02-12 | 2019-08-23 | 清华大学 | 一种组合标志物及其在制备胃癌发生风险预测试剂盒中的应用及其测定系统和方法 |
CN112071363A (zh) * | 2020-07-21 | 2020-12-11 | 北京谷海天目生物医学科技有限公司 | 胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法 |
CN113450873A (zh) * | 2021-05-14 | 2021-09-28 | 山东大学 | 一种预测胃癌预后和免疫治疗适用性的标志物及其应用 |
CN113981087A (zh) * | 2021-11-15 | 2022-01-28 | 浙江省肿瘤医院 | 一种用于辅助诊断胃癌的生物标志物及其应用 |
-
2022
- 2022-06-27 CN CN202210733363.0A patent/CN114822854B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070099209A1 (en) * | 2005-06-13 | 2007-05-03 | The Regents Of The University Of Michigan | Compositions and methods for treating and diagnosing cancer |
WO2017008894A1 (en) * | 2015-07-13 | 2017-01-19 | University Of Geneva | Biomarker panels for brain injury complications |
US20170220773A1 (en) * | 2016-02-03 | 2017-08-03 | Medidata Solutions, Inc. | System and method for contextualized tracking of the progress of a clinical study |
US20180166174A1 (en) * | 2016-08-02 | 2018-06-14 | Thomas J. Lewis | Disease Mitigation and Elimination Health Learning Engine |
CN108334747A (zh) * | 2017-01-20 | 2018-07-27 | 北京蛋白质组研究中心 | 获取肿瘤尿蛋白标志物的方法及得到的肿瘤相关离群尿蛋白库 |
CN110157801A (zh) * | 2018-02-12 | 2019-08-23 | 清华大学 | 一种组合标志物及其在制备胃癌发生风险预测试剂盒中的应用及其测定系统和方法 |
CN112071363A (zh) * | 2020-07-21 | 2020-12-11 | 北京谷海天目生物医学科技有限公司 | 胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法 |
CN113450873A (zh) * | 2021-05-14 | 2021-09-28 | 山东大学 | 一种预测胃癌预后和免疫治疗适用性的标志物及其应用 |
CN113981087A (zh) * | 2021-11-15 | 2022-01-28 | 浙江省肿瘤医院 | 一种用于辅助诊断胃癌的生物标志物及其应用 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116516008A (zh) * | 2023-05-04 | 2023-08-01 | 中国中医科学院望京医院(中国中医科学院骨伤科研究所) | 胃粘膜肠上皮化生标志物jun及其应用 |
CN116516008B (zh) * | 2023-05-04 | 2024-05-07 | 中国中医科学院望京医院(中国中医科学院骨伤科研究所) | 胃粘膜肠上皮化生标志物jun及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN114822854B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yildiz et al. | Diagnostic accuracy of MALDI mass spectrometric analysis of unfractionated serum in lung cancer | |
EP2295975B1 (en) | Determining the expression status of human epidermal growth factor receptor 2 (HER2) in biological samples | |
CN108414660B (zh) | 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用 | |
CN113960235B (zh) | 生物标志物在制备肺癌检测试剂中的用途和方法 | |
CN115575636B (zh) | 一种用于肺癌检测的生物标志物及其系统 | |
US20180100858A1 (en) | Protein biomarker panels for detecting colorectal cancer and advanced adenoma | |
CN112071363A (zh) | 胃黏膜病变蛋白质分子分型、病变进展及胃癌相关蛋白标志物、预测病变进展风险的方法 | |
CN112748191A (zh) | 诊断急性疾病的小分子代谢物生物标志物及其筛选方法和应用 | |
CN114822854B (zh) | 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用 | |
US20150087728A1 (en) | Compositions, methods and kits for diagnosis of lung cancer | |
CN116879558B (zh) | 卵巢癌诊断标志物、检测试剂及检测试剂盒 | |
CN115032395A (zh) | 鉴别肺腺癌和良性肺部结节的血浆蛋白标志物及其应用 | |
CN115575553A (zh) | 血清代谢标志物作为检测egfr突变的应用以及检测系统 | |
US20050158745A1 (en) | Methods and compositions for detection of nasopharyngeal carcinoma | |
CN108334747B (zh) | 获取肿瘤尿蛋白标志物的方法及得到的肿瘤相关离群尿蛋白库 | |
CN113785199B (zh) | 用于诊断结肠直肠癌和/或其癌前阶段的蛋白质特征 | |
CN111751551B (zh) | 蛋白分子作为诊断肝硬化的生物标志物及其预后方法 | |
CN114441770A (zh) | 恶性间皮瘤的血浆蛋白生物标志物及其应用 | |
CN114496220A (zh) | 一种发掘和检测肿瘤初步筛选指标的荧光探针快速设计方法 | |
CN112037852A (zh) | 一种t1期结直肠癌淋巴结转移预测方法和系统 | |
CN115598348A (zh) | 一种早期胃癌标志物的筛选及制作检测用蛋白芯片的方法 | |
CN112379095A (zh) | 一种2型糖尿病患者肺腺癌诊断标志物pzp及其elisa试剂盒 | |
CN111748624A (zh) | 用于预测肝癌是否复发的生物标志物 | |
CN112986588B (zh) | 脂质标志物在制备结直肠癌检测试剂盒中的用途 | |
CN116735889B (zh) | 一种用于结直肠癌早期筛查的蛋白质标志物、试剂盒及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |