CN114813908A - 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用 - Google Patents

一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用 Download PDF

Info

Publication number
CN114813908A
CN114813908A CN202210129411.5A CN202210129411A CN114813908A CN 114813908 A CN114813908 A CN 114813908A CN 202210129411 A CN202210129411 A CN 202210129411A CN 114813908 A CN114813908 A CN 114813908A
Authority
CN
China
Prior art keywords
serum
breast cancer
fingerprint
model
metabolic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210129411.5A
Other languages
English (en)
Inventor
钱昆
黄议达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202210129411.5A priority Critical patent/CN114813908A/zh
Publication of CN114813908A publication Critical patent/CN114813908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/64Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using wave or particle radiation to ionise a gas, e.g. in an ionisation chamber

Abstract

本发明公开了一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用,涉及乳腺癌检测技术领域,包括预处理血清样本和无机纳米颗粒、在质谱靶板上进行样品制备和基质制备、在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集以及对血清代谢指纹进行统计学分析等步骤,具有高检测重现性、快速的分析速度和最少的样本消耗等效果,实现了针对乳腺癌的高效诊断性能。

Description

一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与 应用
技术领域
本发明涉及乳腺癌检测技术领域,尤其涉及一种乳腺癌的血清代谢指纹图谱构建方法及其应用。
背景技术
乳腺癌是当前世界上最常见的癌症,全世界每年有超过1300万新病例和45万人死亡,高性能分析化学方法对于乳腺癌的早期有效诊断和治疗至关重要。目前,临床 上对乳腺癌的诊断仍依赖于常规的组织病理学分类方法和影像学工具,如乳房X线 摄影、磁共振成像和超声等。然而,这些方法需要大型仪器或严格的操作,耗时长且 结果并不可靠。
近来,越来越多的乳腺癌研究强调了代谢组学在其早期诊断以及治疗和预后预测中的价值,已开发出诸如核磁共振光谱(NMR)和质谱(MS)等分析技术用于癌症代谢组 的全面筛查。然而,MS在液相和气相检测中的应用依赖于通过色谱法进行样品纯化 和代谢物富集,严重限制了分析速度和分析通量。激光解吸/电离(LDI)-MS使用纳米 颗粒基质替代色谱法进行固相检测,有助于推动乳腺癌代谢组分析。此外,使用基于 血液样本的液体活检具有易操作、非侵入和高通量的优势,可以作为促进早期检测、 预测转移潜力和选择治疗方式的有效工具。
因此,LDI-MS技术结合生物信息学方法有可能构建乳腺癌的血清代谢指纹图谱,筛选出特异性强的乳腺癌代谢生物标志物,实现对乳腺癌的高效、准确、快速诊断以 及预后预测。
发明内容
有鉴于现有技术的上述缺陷,本发明提供了一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用,旨在实现对乳腺癌的高效、准确、快速诊断以及预后预测。
在本发明的实施方式中,一种乳腺癌血清代谢指纹模型的构建方法,包括以下步骤:
步骤1、预处理血清样本;
步骤2、预处理无机纳米颗粒;
步骤3、在质谱靶板上进行样品制备,每个稀释后的血清样本点样1μL,室温下 干燥;
步骤4、在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;
步骤5、在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集;
步骤6、对血清代谢指纹进行机器学习。
进一步地,步骤1具体为将血清样本用去离子水稀释10倍。
进一步地,步骤2具体为将无机纳米颗粒用去离子水配成1mg/mL的基质溶液。
进一步地,步骤6具体包括:
步骤6.1、在MATLAB R2020a上对步骤5采集的血清代谢指纹进行预处理,得到 m/z信号;
步骤6.2、将指纹图谱划分成训练集和测试集;
步骤6.3、在MATLAB R2020a上使用弹性网络算法在训练集上对m/z信号进行特 征选择,并设置弹性网络算法中频率参数的阈值,得到m/z特征;
步骤6.4、在Orange 3.25.0上使用神经网络在训练集上进行模型训练,得到模 型在训练集上的诊断性能;
步骤6.5、在Orange 3.25.0上使用步骤6.4中训练好的模型在测试集进行预测,得到神经网络在测试集上的诊断性能。
进一步地,步骤6.2所述训练集和测试集均包括乳腺癌病人组和对照组的血清代谢指纹图谱。
优选的,步骤6.3所述阈值为95%。
本发明还提供一种如权利要求4所述的乳腺癌血清代谢指纹模型的构建方法在预后预测中的应用,其特征在于,在SPSS上使用比例风险回归模型进行多因素回归分析, 具体包括以下步骤:
S1:采集具有完整随访信息的血清样本的血清代谢指纹;
S2:在MATLAB R2020a上对血清代谢指纹进行预处理,得到m/z信号;
S3:将步骤1中的血清样本划分成训练集和测试集;
S4:在SPSS上使用比例风险回归模型在训练集上对m/z信号进行多因素回归分析,并设置参数p value的阈值,得到m/z特征及其对应系数,由该特征和系数线性加和 构成代谢预后评分系统;
S5:使用步骤4中得到的评分系统对所有样本进行评分,将所有样本分为高风险组和低风险组;
S7:在Orange 3.25.0上使用生存分析,验证训练集和测试集中高风险组和低 风险组生存情况。
优选的,所述阈值为0.05。
本发明最后提供一种乳腺癌血清代谢生物标志物组合,包括甘油酸、烟酰胺、组胺、尿嘧啶、胸腺嘧啶、3,4-二碘吡唑和脱氢苯丙氨酸。
本发明与其他乳腺癌的检测方法比较所具备的有益效果为:
1.具有高检测重现性(血清样本中约95%的特征强度变异系数(CV)<30%)、快 速的分析速度(每个样本约30秒)和最少的样本消耗(每个样本约100nL)。
2.通过对血清代谢指纹的机器学习,我们实现了针对乳腺癌的高效诊断性能,诊断曲线下面积(AUC)为0.948(95%置信区间(CI):0.922-0.973)。此外,由血清代谢 指纹构建的代谢预后评分系统可以有效地预测了患者的预后和生存(p<0.005)。
3.开发了一种基于7个代谢生物标志物组合的诊断模型,具有准确的乳腺癌诊断效率,AUC为0.865(95%CI:0.820-0.911)。
以下将结合附图对本发明的技术方案及产生的技术效果作进一步说明,以充分地了解本发明的目的和效果。
附图说明
图1是乳腺癌病人及对照组血清代表性代谢指纹;
图2是325个样本血清谢指纹预处理后301个m/z信号对应热图;
图3是生物标志物组合和单个生物标志物诊断乳腺癌的性能对比图;
图4代谢预后评分系统在训练集中的预测性能示意图。
具体实施方式
以下参考说明书附图介绍本发明的优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限 于文中提到的实施例。
实施例一、使用纳米颗粒增强激光解吸/电离质谱技术,进行血清代谢指纹采集:
仪器与试剂的准备:纳米颗粒增强激光解吸/电离飞行时间质谱,血清样本,去离子水,基质(无机纳米颗粒);
步骤1:将血清样本用去离子水稀释10倍;
步骤2:将无机纳米颗粒用去离子水配成1mg/mL的基质溶液;
步骤3:在质谱靶板上进行样品制备,每个稀释后的血清样本点样1μL,室温下 干燥;
步骤4:在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;
步骤5:在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集;
步骤6:得到血清代谢指纹,用于后续分析。
实施例二、对乳腺癌病人和对照组血清代谢指纹进行机器学习,实现对乳腺癌的精准诊断:
仪器与试剂的准备:MATLAB R2020a,Orange 3.25.0;
步骤1:通过实施例一,对325个血清样本(156个对照组和169个乳腺癌病人) 进行血清代谢指纹采集,结果如附图1所示;
步骤2:在MATLAB R2020a上对325个血清代谢指纹进行预处理,包括谱线平 滑、基线校正和谱峰联配,得到301个m/z信号,结果如附图2所示;
步骤3:将325个病人划分成训练集(260个样本,包括135个乳腺癌病人和125 个对照组)和测试集(65个样本,包括34个乳腺癌病人和31个对照组);
步骤4:在MATLAB R2020a上使用弹性网络算法在训练集上对301个m/z信号 进行特征选择,并设置弹性网络算法中频率参数的阈值为95%,得到36个m/z特征;
步骤5:在Orange 3.25.0上使用神经网络在训练集进行模型训练,得到模型在训练集上的诊断性能(表1);
步骤6:在Orange 3.25.0上使用步骤6中训练好的模型在测试集进行预测,得到神经网络在测试集上的诊断性能(表1)。
Figure BDA0003502031520000041
实施例三、进行血清中乳腺癌生物标志物鉴定,通过生物标志物组合实现对乳腺癌的精准诊断:
仪器与试剂的准备:纳米颗粒增强激光解吸/电离飞行时间质谱,纳米颗粒增强激光解吸/电离傅里叶变换离子回旋共振质谱,血清样本,去离子水,基质(无机纳米颗 粒);
步骤1:将血清样本用去离子水稀释10倍;
步骤2:将无机纳米颗粒用去离子水配成1mg/mL的基质溶液;
步骤3:在质谱靶板上进行样品制备,每个稀释后的房水样本点样1μL,室温 下干燥;
步骤4:在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;
步骤5:在基质辅助激光解吸电离傅里叶变换离子回旋共振质谱仪中得到血清中乳腺癌生物标志物的精准分子量;
步骤6:在基质辅助激光解吸电离飞行时间质谱中得到血清中乳腺癌生物标志物的二级质谱谱图;
步骤7:对质谱检测结果进行分析,鉴定出7个代谢生物标志物(表2);
Figure BDA0003502031520000042
Figure BDA0003502031520000051
步骤8:相比于单个标志物,7个标志物组合在乳腺癌诊断时表现出最好的性能,结果如附图3所示。
实施例四、对乳腺癌病人和对照组血清代谢指纹进行比例风险回归模型分析,实现对乳腺癌的精准预后预测:
仪器与试剂的准备:MATLAB R2020a,SPSS 22.0;
步骤1:通过步骤一,对具有完整随访信息的143个血清样本进行血清代谢指纹 采集;
步骤2:在MATLAB R2020a上对143个血清代谢指纹进行预处理,包括谱线平 滑、基线校正和谱峰联配,得到301个m/z信号;
步骤3:将143个病人划分成训练集(96个样本)和测试集(47个样本);
步骤4:在SPSS上使用比例风险回归模型在训练集上对301个m/z信号进行多因 素回归分析,并设置参数p value的阈值为0.05,得到4个m/z特征及其对应系数(表 3),由该特征和系数线性加和构成代谢预后评分系统。
序号 m/z 系数 系数标准差 p-value
1 113.000 9.751 3.240 0.003
2 119.106 -125.480 51.788 0.015
3 203.105 13.056 3.067 0.000
4 349.314 1192.961 394.139 0.002
步骤5:使用步骤5中得到的评分系统对所有样本进行评分。
步骤6:使用训练集中样本得分中位数作为阈值,将所有样本分为高风险组(评 分高于阈值)和低风险组(评分低于阈值)。
步骤7:在Orange 3.25.0上使用生存分析,验证训练集和测试集中高风险组生存情况均差于低风险组(p<0.05),说明代谢预后评分系统可以有效对乳腺癌进行预后 预测,结果如附图4所示。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术 人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得 到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种乳腺癌血清代谢指纹模型的构建方法,其特征在于,包括以下步骤:
步骤1、预处理血清样本;
步骤2、预处理无机纳米颗粒;
步骤3、在质谱靶板上进行样品制备,每个稀释后的血清样本点样1μL,室温下干燥;
步骤4、在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;
步骤5、在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集;
步骤6、对血清代谢指纹进行机器学习。
2.如权利要求1所述的乳腺癌血清代谢指纹模型的构建方法,其特征在于,步骤1具体为将血清样本用去离子水稀释10倍。
3.如权利要求1所述的乳腺癌血清代谢指纹模型的构建方法,其特征在于,步骤2具体为将无机纳米颗粒用去离子水配成1mg/mL的基质溶液。
4.如权利要求1所述的乳腺癌血清代谢指纹模型的构建方法,其特征在于,步骤6具体包括:
步骤6.1、在MATLAB R2020a上对步骤5采集的血清代谢指纹进行预处理,得到m/z信号;
步骤6.2、将指纹图谱划分成训练集和测试集;
步骤6.3、在MATLAB R2020a上使用弹性网络算法在训练集上对m/z信号进行特征选择,并设置弹性网络算法中频率参数的阈值,得到m/z特征;
步骤6.4、在Orange 3.25.0上使用神经网络在训练集上进行模型训练,得到模型在训练集上的诊断性能;
步骤6.5、在Orange 3.25.0上使用步骤6.4中训练好的模型在测试集进行预测,得到神经网络在测试集上的诊断性能。
5.如权利要求4所述的乳腺癌血清代谢指纹模型的构建方法,其特征在于,步骤6.2所述训练集和测试集均包括乳腺癌病人组和对照组的血清代谢指纹图谱。
6.如权利要求4所述的乳腺癌血清代谢指纹模型的构建方法,其特征在于,步骤6.3所述阈值为95%。
7.如权利要求4所述的乳腺癌血清代谢指纹模型的构建方法在预后预测中的应用,其特征在于,在SPSS上使用比例风险回归模型进行多因素回归分析。
8.如权利要求7所述的应用,其特征在于,具体包括以下步骤:
步骤1:采集具有完整随访信息的血清样本的血清代谢指纹;
步骤2:在MATLAB R2020a上对血清代谢指纹进行预处理,得到m/z信号;
步骤3:将步骤1中的血清样本划分成训练集和测试集;
步骤4:在SPSS上使用比例风险回归模型在训练集上对m/z信号进行多因素回归分析,并设置参数p value的阈值,得到m/z特征及其对应系数,由该特征和系数线性加和构成代谢预后评分系统;
步骤5:使用步骤4中得到的评分系统对所有样本进行评分,将所有样本分为高风险组和低风险组;
步骤7:在Orange 3.25.0上使用生存分析,验证训练集和测试集中高风险组和低风险组生存情况。
9.如权利要求8所述的应用,其特征在于,所述阈值为0.05。
10.一种乳腺癌血清代谢生物标志物组合,其特征在于,包括甘油酸、烟酰胺、组胺、尿嘧啶、胸腺嘧啶、3,4-二碘吡唑和脱氢苯丙氨酸。
CN202210129411.5A 2022-02-11 2022-02-11 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用 Pending CN114813908A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210129411.5A CN114813908A (zh) 2022-02-11 2022-02-11 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210129411.5A CN114813908A (zh) 2022-02-11 2022-02-11 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用

Publications (1)

Publication Number Publication Date
CN114813908A true CN114813908A (zh) 2022-07-29

Family

ID=82527309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210129411.5A Pending CN114813908A (zh) 2022-02-11 2022-02-11 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用

Country Status (1)

Country Link
CN (1) CN114813908A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116106535A (zh) * 2023-04-11 2023-05-12 南京品生医学检验实验室有限公司 生物标志物组合在制备乳腺癌预测产品中的应用
CN116386716A (zh) * 2023-06-06 2023-07-04 浙江省肿瘤医院 用于胃癌诊断的代谢物组学及方法
CN117147845A (zh) * 2023-09-25 2023-12-01 西安交通大学医学院第一附属医院 代谢标志物3-壬炔的检测试剂在制备乳腺癌筛查和预后产品中的应用
CN117368477A (zh) * 2023-09-25 2024-01-09 西安交通大学医学院第一附属医院 一种代谢标志物的检测试剂在制备乳腺癌筛查和预后产品中的应用

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116106535A (zh) * 2023-04-11 2023-05-12 南京品生医学检验实验室有限公司 生物标志物组合在制备乳腺癌预测产品中的应用
CN116106535B (zh) * 2023-04-11 2023-08-11 南京品生医学检验实验室有限公司 生物标志物组合在制备乳腺癌预测产品中的应用
CN116386716A (zh) * 2023-06-06 2023-07-04 浙江省肿瘤医院 用于胃癌诊断的代谢物组学及方法
CN116386716B (zh) * 2023-06-06 2024-03-15 浙江省肿瘤医院 用于胃癌诊断的代谢物组学及方法
CN117147845A (zh) * 2023-09-25 2023-12-01 西安交通大学医学院第一附属医院 代谢标志物3-壬炔的检测试剂在制备乳腺癌筛查和预后产品中的应用
CN117368477A (zh) * 2023-09-25 2024-01-09 西安交通大学医学院第一附属医院 一种代谢标志物的检测试剂在制备乳腺癌筛查和预后产品中的应用
CN117147845B (zh) * 2023-09-25 2024-03-01 西安交通大学医学院第一附属医院 代谢标志物3-壬炔的检测试剂在制备乳腺癌筛查和预后产品中的应用
CN117368477B (zh) * 2023-09-25 2024-03-01 西安交通大学医学院第一附属医院 一种代谢标志物的检测试剂在制备乳腺癌筛查和预后产品中的应用

Similar Documents

Publication Publication Date Title
CN114813908A (zh) 一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用
CN109884302B (zh) 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
AU2002241535C1 (en) Method for analyzing mass spectra
Zhang et al. Review of peak detection algorithms in liquid-chromatography-mass spectrometry
US8478534B2 (en) Method for detecting discriminatory data patterns in multiple sets of data and diagnosing disease
US20040153249A1 (en) System, software and methods for biomarker identification
US20050048547A1 (en) Classification of disease states using mass spectrometry data
Horgan et al. An overview of proteomic and metabolomic technologies and their application to pregnancy research
CN110057954B (zh) 血浆代谢标志物在诊断或监测hbv的应用
CN113588847B (zh) 一种生物代谢组学数据处理方法、分析方法及装置和应用
Zhou et al. Combination of continuous wavelet transform and genetic algorithm-based Otsu for efficient mass spectrometry peak detection
CN113514530A (zh) 一种基于敞开式离子源的甲状腺恶性肿瘤诊断系统
CN1707258A (zh) 一种从血清中早期检测胃癌的方法
Pyatnitskiy et al. Identification of differential signs of squamous cell lung carcinoma by means of the mass spectrometry profiling of blood plasma
CN114414656A (zh) 一种基于血清代谢指纹自体免疫疾病模型的构建方法
CN109190713A (zh) 基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术
Conrads et al. The utility of proteomic patterns for the diagnosis of cancer
CN117782739A (zh) 一种用于子宫内膜癌鉴别诊断的生物标志物组合及其获得方法
CN117805215A (zh) 一种由多体液代谢指纹图谱提取的综合代谢生物标志物组
CN116359323A (zh) 一种卵泡液代谢指纹谱图、生物标志物组合物及其应用
CN117805303A (zh) 一种用于子宫内膜癌鉴别诊断的代谢生物标志物及其筛选方法
CN114137137A (zh) 一种视网膜母细胞瘤分期模型构建方法及标志物
CN107895159A (zh) 临床蛋白质质谱数据的分类方法
CN117191927A (zh) 一种用于食管鳞癌诊断的生物标志物组合及其筛选方法
CN116660361A (zh) 基于唾液代谢指纹谱图筛选代谢生物标志物的方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination