CN112183616A - 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法 - Google Patents

一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法 Download PDF

Info

Publication number
CN112183616A
CN112183616A CN202011024473.7A CN202011024473A CN112183616A CN 112183616 A CN112183616 A CN 112183616A CN 202011024473 A CN202011024473 A CN 202011024473A CN 112183616 A CN112183616 A CN 112183616A
Authority
CN
China
Prior art keywords
phosphatidylcholine
brain glioma
triglyceride
plasma
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011024473.7A
Other languages
English (en)
Other versions
CN112183616B (zh
Inventor
尹玉新
周骏拓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202011024473.7A priority Critical patent/CN112183616B/zh
Publication of CN112183616A publication Critical patent/CN112183616A/zh
Application granted granted Critical
Publication of CN112183616B publication Critical patent/CN112183616B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Abstract

本发明涉及一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法,属于临床检验诊断技术领域。本发明所述诊断标志物包括25种血浆脂质代谢标志物中的任意一种或多种。本发明所述诊断标志物对于脑胶质瘤具有较好的灵敏性和特异性,可用于脑胶质瘤无创诊断,对于改善预后,提高患者的生存率具有重要意义。

Description

一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶 质瘤诊断模型的构建方法
技术领域
本发明涉及临床检验诊断技术领域,具体涉及一种基于代谢组学和人工智能分析技术筛选鉴定的脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法。
背景技术
脑胶质瘤是成人颅内最常见的恶性肿瘤,且其中一半以上是胶质母细胞瘤,其预后差,中位生存期约为15个月。因此,准确诊断和及时的病情进展监测,对提高胶质瘤患者的生存率至关重要。目前,脑胶质瘤的诊断通常采用计算机断层扫描(CT)和磁共振成像(MRI),但这些检查在术后进行组织学检查之前不能提供肿瘤的确切病理信息。其他策略,如细针穿刺活检标本的基因分析和脑脊液(CSF)的ctDNA测序,也依然面临着技术上的挑战,效果不尽如人意。而且上述几种有创诊断方式可能导致更高的副作用和诊断成本。与组织活检相比,液体活检作为一种无创性的肿瘤诊断方法,已经显示出许多优点。Nickolas及其同事的研究通过分析16个循环肿瘤细胞/血液中的DNA(ctDNA)和8种蛋白质,成功地将血液检测应用于8至10种类型癌症的诊断。他们的研究已经证明了液体活检在癌症诊断中的适用性和潜力,但是靶向ctDNA和蛋白质仍然导致检测的敏感性不足,特别是对于早期癌症。因此,获得一些创新性且灵敏度高,准确性好的生物标志物,进而开发成一种准确、灵敏的无创脑恶性肿瘤诊断方法,将具有重大的临床意义和社会经济意义。
发明内容
针对脑胶质瘤现有诊断方法较少,缺少有效液体诊断方法这一现状,本发明的目的在于提供一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法。本发明所述诊断标志物对于脑胶质瘤具有较好的灵敏性和特异性,可用于脑胶质瘤无创诊断,对于改善预后,提高患者的生存率具有重要意义。
本发明提供了一种脑胶质瘤诊断的诊断标志物,所述诊断标志物包括以下25种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC16:0、溶血磷脂酰胆碱LPC18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG 16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3和甘油三酯TAG16:1-18:2-20:4。
优选的是,所述诊断标志物包括以下15种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC16:0-20:4、磷脂酰胆碱PC16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1和磷脂酰胆碱PC 18:2-18:2。
优选的是,所述诊断标志物包括以下11种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC16:0-22:6、磷脂酰胆碱PC18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3。
优选的是,所述诊断标志物包括以下4种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、磷脂酰胆碱PC 16:0-18:1和甘油三酯TAG 18:1-18:2-18:3。
本发明还提供了一种脑胶质瘤诊断标志物的筛选方法,包括以下步骤:
(1)分别收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
(2)采用液相色谱质谱联用技术分别对每个分析样本进行非靶向代谢组学分析,得到各血浆样本的原始代谢指纹图谱;
(3)使用MS-Dial软件对脑胶质瘤患者的血浆样本和健康人群的血浆样本的原始代谢指纹图谱分别进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分,用于进一步的机器学习;
(4)使用机器学习支持向量机算法学习步骤(3)的二维矩阵数据,随机将上述脑胶质瘤及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对脑胶质瘤患者与健康人群的代谢组数据进行分类;
(5)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;
(6)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS-Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;
(7)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,并且与化学标准品进行比对,从而对代谢物进行鉴定,得到适合于脑胶质瘤诊断的血浆脂质代谢标志物。
本发明还提供了一种基于上述技术方案所述诊断标志物的脑胶质瘤诊断模型的构建方法,包含以下步骤:
1)收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
2)采用液相色谱质谱联用技术对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;
3)使用MS-Dial软件对脑胶质瘤血浆样本和健康血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;
4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到脑胶质瘤诊断模型。
本发明还提供了基于上述技术方案所述诊断标志物在制备脑胶质瘤诊断试剂盒中的应用。
本发明还提供了基于上述技术方案所述构建方法构建得到的脑胶质瘤诊断模型。
本发明还提供了一种脑胶质瘤诊断试剂盒,包括上述技术方案所述诊断标志物。
本发明提供了一种脑胶质瘤诊断的诊断标志物。本发明采用血浆代谢组学技术以及人工智能数据分析技术得到适合于脑胶质瘤诊断的诊断标志物和脑胶质瘤诊断模型。本发明诊断标志物筛选方法可操作性强,模型构建方法简单,所得诊断模型效果良好,灵敏度高,特异性好,适合于脑胶质瘤的诊断。本发明仅通过取血检测就能实现诊断,无需额外采集组织样本,也不需要CT影像学数据辅助判断,大大减少了创伤和辐射风险,能够很好地替代现有组织活检及影像学诊断模式,并且本发明诊断简单快速,有利于脑胶质瘤的早诊早治,具有很好的临床使用和推广价值。
附图说明
图1为本发明提供的原始代谢指纹图谱的总离子色谱图(TICs),其中A为脑胶质瘤患者正离子模式的结果,B为脑胶质瘤患者负离子模式的结果,C为正常人对照正离子模式的结果,D为正常人对照负离子模式的结果。横轴为保留时间,纵轴为代谢物相对浓度;
图2为本发明提供的机器学习支持向量机(SVM)分类模型图,其中A为正离子模式测试集的分类模型,B为负离子模式测试集的分类模型,sensitivity为灵敏度,specificity为特异度,accuracy为准确度,mean为平均值;
图3为本发明提供的SVM模型的特征选择得分图,其中A为正离子模式模型的准确度得分图,B为负离子模式模型的准确度得分图;
图4为本发明提供的靶向代谢组图谱的典型选择离子色谱图(EIC),其中LPC为溶血磷脂酰胆碱类血浆代谢标志物色谱峰,PC为磷脂酰胆碱类血浆代谢标志物色谱峰,TG为甘油三酯类血浆代谢标志物色谱峰;
图5为使用11个血浆代谢标志物构建的脑胶质瘤诊断模型的ROC曲线图,其中A为训练集结果,B为测试集结果。
具体实施方式
本发明提供了一种脑胶质瘤诊断的诊断标志物,所述诊断标志物包括以下25种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC16:0、溶血磷脂酰胆碱LPC18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG 16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3和甘油三酯TAG16:1-18:2-20:4。
在本发明中,所述诊断标志物优选包括以下15种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1和磷脂酰胆碱PC 18:2-18:2。本发明所述组合可以通过使用较少数量的标志物(15种)实现较为准确的脑胶质瘤诊断,提升了该方法的易用性。
在本发明中,所述诊断标志物优选包括以下11种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC18:0-20:4、甘油三酯TAG 18:1-18:2-18:3。本发明所述组合可以通过使用较少数量的标志物(11种)实现较为准确的脑胶质瘤诊断,提升了该方法的易用性。
在本发明中,所述诊断标志物优选包括以下4种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、磷脂酰胆碱PC 16:0-18:1和甘油三酯TAG 18:1-18:2-18:3。本发明所述组合可以通过使用较少数量的标志物(4种)实现较为准确的脑胶质瘤诊断,提升了该方法的易用性。
本发明还提供了一种脑胶质瘤诊断标志物的筛选方法,包括以下步骤:
(1)分别收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
(2)采用液相色谱质谱联用技术分别对每个分析样本进行非靶向代谢组学分析,得到各血浆样本的原始代谢指纹图谱;
(3)使用MS-Dial软件对脑胶质瘤患者的血浆样本和健康人群的血浆样本的原始代谢指纹图谱分别进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分,用于进一步的机器学习;
(4)使用机器学习支持向量机算法学习步骤(3)的二维矩阵数据,随机将上述脑胶质瘤及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对脑胶质瘤患者与健康人群的代谢组数据进行分类;
(5)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;
(6)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS-Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;
(7)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,并且与化学标准品进行比对,从而对代谢物进行鉴定,得到适合于脑胶质瘤诊断的血浆脂质代谢标志物。
通过本发明所述筛选方法得到的诊断标志物对于脑胶质瘤具有很好的灵敏性和特异性,尤其适合于脑胶质瘤的无创诊断,对于脑胶质瘤的治疗具有重要意义。
本发明分别收集脑胶质瘤患者和健康人群的血浆样本作为分析样本。在本发明中,所述筛选方法中的所述脑胶质瘤患者为经影像学检查和组织活检确认存在脑胶质瘤的病人。在本发明中,所述健康人群为经体检无病变的健康人群。在本发明中,具体的,筛选时所用的脑胶质瘤患者优选为72人,健康人群35人。
得到分析样本后,本发明采用液相色谱质谱联用技术(LC-MS)分别对每个分析样本进行非靶向代谢组学分析,得到各血浆样本的原始代谢指纹图谱。在本发明中,所述非靶向代谢组学技术分析时,每10个分析样本中加入一个质量控制样品,用于实时监测分析样本从进样预处理到分析过程中的质量控制情况,所述质量控制样品为72份脑胶质瘤血浆样本和35份健康血浆样本的混合样品。在本发明中,所述分析样本和质量控制样品在进样前优选进行以下预处理:
A.用移液器吸取50μl分析样本或质量控制样品,置于2.0ml EP(eppendorf)管中;
B.加入150μl甲醇提取,振摇5分钟以沉淀蛋白;
C.然后在高速离心机中于4℃下以12000转/分离心10分钟;
D.将步骤(C)的上清液转移入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测。
在本发明中,对每个分析样本采用LC-MS血清非靶向代谢组学技术分别进行分析时,液相色谱使用的色谱柱优选为Waters XSelect CSH C18色谱柱,规格优选为100×4.6mm,3.5μm;进样温度优选为4℃,进样体积优选为10μL;色谱流动相包含两种溶剂A和B,A为含体积百分含量为0.1%的甲酸的乙腈水溶液,所述乙腈水溶液含体积百分含量为60%的乙腈和体积百分含量为40%的水;B为含体积百分含量为0.1%的甲酸的乙腈异丙醇溶液,所述乙腈异丙醇溶液含体积百分含量为10%的乙腈和体积百分含量为90%的异丙醇;色谱梯度洗脱条件优选为:0~l分钟为40%B,1~5分钟为40%B~50%B逐渐递增,5~15分钟为50%B至100%B逐渐递增,15~18分钟为保持100%B,18~19分钟为100%B至40%B逐渐递减,然后40%B持续5分钟;流速为0.5ml/min。在本发明中,对每个分析样本采用LC-MS血清非靶向代谢组学技术进行分析时,质谱检测优选使用四极杆-静电场轨道阱质谱仪Q-Exactive,并采用电喷雾离子源的正离子模式ESI+和负离子模式ESI-,离子源温度优选为320℃,脱溶剂气温优选为300℃,鞘气和辅气分别设置为40和10;在正离子和负离子模式下毛细管电压分别为+3.3kV和-3kV,锥孔电压均为0V;图谱数据采集的质荷比范围为200~1200m/z,采集的模式为数据依赖模式(DDA)。
得到各血浆样本的原始代谢指纹图谱后,本发明使用MS-Dial软件对脑胶质瘤患者的血浆样本和健康人群的血浆样本的原始代谢指纹图谱分别进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分,用于进一步的机器学习。在本发明中,对原始代谢指纹图谱进行图谱处理是指:用MS-Dial软件读取原始代谢指纹图谱,进行包括保留时间校正、峰识别、峰匹配和峰对齐的处理操作,得到二维矩阵。
得到二维矩阵数据后,本发明使用机器学习支持向量机(support vectormachine,SVM)算法学习二维矩阵数据,随机将上述脑胶质瘤及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对脑胶质瘤患者与健康人群的代谢组数据进行分类。在本发明中,构建SVM分类模型时,建模参数C=5。本发明筛选过程中SVM建模随机循环迭代2000次,最终模型准确度的平均值大于0.95,说明本发明模型能准确区分脑胶质瘤病人和正常人。
本发明根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升。本发明此步骤可以筛选出对该支持向量机模型中最为重要的代谢物来作为标志物,提高了标志物筛选过程的效率和效果。
本发明将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS-Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物。本发明所述优化筛选条件为:代谢物实测的一级和二级质谱图与谱图数据库中相应的信息能够完全对应。
本发明根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,并且与化学标准品进行比对,从而对代谢物进行鉴定,得到适合于脑胶质瘤诊断的血浆脂质代谢标志物。不同血浆脂质代谢标志物的组合即可作为适合于脑胶质瘤诊断的诊断标志物。在本发明中,所述代谢物谱图数据库优选为LipidBlast。
本发明还提供了一种基于上述技术方案所述诊断标志物的脑胶质瘤诊断模型的构建方法,包含以下步骤:
1)收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
2)采用液相色谱质谱联用技术对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;
3)使用MS-Dial软件对脑胶质瘤血浆样本和健康血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;
4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到脑胶质瘤诊断模型。
本发明收集脑胶质瘤患者和健康人群的血浆样本作为分析样本。在本发明中,所述脑胶质瘤患者是指经影像学检查和组织活检确认存在脑胶质瘤的患者。
本发明采用液相色谱质谱联用技术对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱。在本发明中,所述的靶向代谢组学分析是指对按照本发明诊断标志物的筛选方法筛选得到的能够作为诊断标志物的代谢物进行靶向检测。本发明对每个分析样本采用LC-MS血清靶向代谢组学技术进行分析时,液相色谱使用的色谱柱优选为Waters XSelect CSH C18色谱柱,规格优选为100×4.6mm,3.5μm;进样温度优选为4℃,进样体积优选为10μL;色谱流动相包含两种溶剂A和B,A为含体积百分含量为0.1%甲酸的乙腈水溶液,所述乙腈水溶液含体积百分含量为60%的乙腈和体积百分含量为40%的水溶液(含0.1%甲酸的60%乙腈、40%水溶液);B为含体积百分含量为0.1%甲酸的乙腈异丙醇溶液,所述乙腈异丙醇溶液含体积百分含量为10%的乙腈和体积百分含量为90%的异丙醇(含0.1%甲酸的10%乙腈、90%异丙醇溶液);色谱梯度洗脱条件优选为:0~l分钟为40%B,1~5分钟为40%B~50%B逐渐递增,5~15分钟为50%B~100%B逐渐递增,15~18分钟为保持100%B,18~19分钟为100%B至40%B逐渐递减,然后40%B持续5分钟;流速为0.5ml/min。在本发明中,对每个分析样本采用LC-MS血清靶向代谢组学技术进行分析时,质谱检测使用四极杆-静电场轨道阱质谱仪Q-Exactive,并采用电喷雾离子源的正离子模式ESI+,离子源温度为320℃,反吹气设置为2,脱溶剂气温为300℃,鞘气和辅气分别设置为40和10;毛细管电压为+3kV,锥孔电压为0V;采集模式为平行反应监测模式(PRM)。
得到各血浆样本的靶向代谢组图谱后,本发明使用MS-Dial软件对脑胶质瘤血浆样本和健康血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习。
得到二维矩阵后,本发明根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到脑胶质瘤诊断模型。在本发明中,所述模型的构建时,优选基于以下的样本数目进行构建:所用的脑胶质瘤患者736人,健康人群934人。在本发明中,使用机器学习SVM构建诊断模型时,所用的样本数目及来源优选如下:用于训练集的385例脑胶质瘤患者及365例健康对照与特征筛选样本(107例)同一来源,用于测试集的351例脑胶质瘤患者及569例健康对照来源于独立的两家第三方医院。在本发明中,构建SVM分类模型时,建模参数C=5。
当适合于脑胶质瘤诊断的诊断标志物为11种血浆代谢标志物的组合(包含溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3)时,所得的诊断模型的ROC曲线下面积AUC值为0.9866。说明该模型具有很好的诊断效果,准确性高,特异性好。
本发明所述脑胶质瘤诊断模型的构建方法简单,对于脑胶质瘤具有较高的灵敏度和特异性,为脑胶质瘤早诊早治提供了有效的技术支持。
利用本发明脑胶质瘤诊断模型诊断脑胶质瘤时,型仅通过取血就能进行诊断,方便快捷无内创,对于脑胶质瘤灵敏度高、特异性好,具有很好的临床应用价值。
本发明还提供了基于上述技术方案所述构建方法构建得到的脑胶质瘤诊断模型。在本发明优选方案中,当诊断模型所用的诊断标志物为11种血浆代谢标志物的组合(包含溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3)时,诊断模型的ROC曲线下面积AUC值为0.9866。
本发明还提供了基于上述技术方案所述诊断标志物在制备脑胶质瘤诊断试剂盒中的应用。
本发明还提供了一种脑胶质瘤诊断试剂盒,包括上述技术方案所述诊断标志物。本发明所述试剂盒可用于脑胶质瘤诊断。
具体的,本发明对72例脑胶质瘤患者的血浆样本,与35例健康对照血浆样本进行分析,使用高效液相色谱质谱联用仪(LC-MS)分别获得了正负离子模式下1304个及758个小分子代谢物的指纹图谱,经过对脑胶质瘤患者及健康正常对照的小分子代谢物的指纹图谱进行基于机器学习支持向量机的分析与特征筛选,并结合基于质谱的优化筛选,得到适合于脑胶质瘤诊断的诊断标志物,针对这些诊断标志物进行靶向代谢组方法的建立,并利用机器学习对检测数据构建模型,得到脑胶质瘤诊断模型,利用该模型可以快速的诊断出是否为脑胶质瘤,具有准确、高灵敏度、普适性强,具有临床使用和推广价值。
本发明中,所述脑胶质瘤患者血浆是指,2015-2019年间,经CT发现脑部肿瘤并进行手术,脑部肿瘤经术后病理确诊患者的术前血浆。排除有其他系统恶性肿瘤,术前接受过抗肿瘤治疗的患者。
本发明的诊断标志物和诊断模型可以通过测定血浆将脑胶质瘤诊断出来,方法简便快捷并且没有内创,可以减轻受测者的痛苦及辐射暴露,对于脑胶质瘤的早诊早治以及改善患者预后、提高患者生存率具有十分重要的意义。
下面结合具体实施例对本发明所述的一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法做进一步详细的介绍,本发明的技术方案包括但不限于以下实施例。
实施例1
脑胶质瘤诊断标志物的筛选
1.研究对象
本研究共包含72例脑胶质瘤患者血浆样本以及35例体检正常的健康对照血浆样本。其中脑胶质瘤的诊断标准是经影像学检查和组织活检确认存在脑胶质瘤。这些研究对象的基本信息见表1。
表1.脑胶质瘤诊断非靶向代谢组学研究的基线
发现集(人数107人)
Figure BDA0002701723920000131
2.应用液相色谱质谱联用技术的血浆非靶向代谢组学分析
所有血浆样本离心后置于-80℃冰箱内保存。研究时取出血浆样本,经样品预处理后,使用高效液相色谱质谱联用仪进行代谢组学分析,获得包含色谱和质谱信息的样本原始代谢指纹图谱。具体操作如下:
2.1仪器和试剂
实验仪器包括:高效液相色谱质谱联用仪(U3000/QEaxctive,Thermo Fisher)、高速低温离心机(Beckman)、振动涡旋仪、离心浓缩仪、4℃冷藏冰箱、纯水仪(Millipore)。
实验耗材包括:Waters Xselect CSH C18色谱柱(规格为100×4.6mm,3.5μm)、2mlEP管、1.5ml进样瓶、300μl内插管、移液器、1000μl枪头、200μl枪头、记号笔、乳胶手套、口罩。
实验试剂包括:甲醇(Thermo Fisher,质谱级纯)、乙腈(Thermo Fisher,质谱级纯)、异丙醇(Thermo Fisher,质谱级纯)、甲酸(Sigma)、纯水(TOC<10ppb)。
2.2血浆样本预处理
进行血浆样本预处理之前,制备20份质量控制样品(QC)(自每份脑胶质瘤血浆样本和健康血浆样本中分别取出10μl进行混合然后分装)。将所有脑胶质瘤血浆样本和健康血浆样本与质量控制样品一起进行样品预处理,具体操作如下:
A.用移液器吸取50μl分析样本或质量控制样品,置于2.0ml EP(eppendorf)管中;
B.加入150μl甲醇提取,振摇5分钟以沉淀蛋白;
C.然后在高速离心机中于4℃下以12000rpm离心10分钟;
D.将步骤(C)的上清液转移入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测。
2.3血浆非靶向代谢组学检测
将处理后的所有脑胶质瘤血浆样本和健康血浆样本作为分析样本,打乱顺序后随机化排序进样,以排除进样顺序带来的偏倚。每隔10个分析样本加入一个质量控制样品。所用液相色谱、质谱方法如下:
流动相:A为0.1%甲酸、乙腈60%、水40%溶液,B为0.1%甲酸、乙腈10%、异丙醇90%溶液;
流速:0.5ml/min;柱温:30℃;进样体积:10μl;
色谱梯度洗脱条件:0-l分钟为40%B,1-5分钟为40%B-50%B逐渐递增,5-15分钟为50%B至100%B逐渐递增,15-18分钟为保持100%B,18-19分钟为100%B至40%B逐渐递减,然后40%B持续5分钟。
质谱方法:采用电喷雾离子源的正离子模式ESI+和负离子模式ESI-,离子源温度为320℃,反吹气设置为2,脱溶剂气温为300℃,鞘气和辅气分别设置为40和10;在正离子和负离子模式下毛细管电压分别为+3kV和-3kV,锥孔电压均为0V;采集的模式为数据依赖模式(DDA);一级质谱图谱数据采集的质荷比范围为200~1200m/z,采集分辨率为35000,目标离子数目为1x106,最大离子注入时间为80ms;二级质谱采集分辨率为17500,目标离子数目为1x105,最大离子注入时间为50ms,循环次数为5次,隔离窗口为4.0m/z,碰撞能量为10、20、30。
3.血浆代谢标志物筛选
按照上述色谱质谱条件对样本进行分析,获得所有样本的原始代谢指纹图谱,其中各组样本的典型总离子流色谱图(TICs)见图1,图1为本发明提供的原始代谢指纹图谱的总离子色谱图(TICs),其中A为脑胶质瘤患者正离子模式的结果,B为脑胶质瘤患者负离子模式的结果,C为正常人对照正离子模式的结果,D为正常人对照负离子模式的结果。横轴为保留时间,纵轴为代谢物相对浓度。
随后采用人工智能分析技术对原始代谢指纹图谱进行学习,以筛选能够区分脑胶质瘤患者与健康人群的生物标志物,具体操作如下:
3.1图谱数据预处理
使用高效液相色谱质谱联用仪在正离子ESI+和负离子ESI-下分别检测获得血浆样本的原始代谢指纹图谱后,使用Reifycs file converter软件将图谱转换为ABF格式文件,然后使用MSDIAL软件进行包括保留时间校正、峰识别、峰匹配、峰对齐、过滤噪声、数据标准化等在内的预处理。参数设置为:一级质谱质量偏差设置为0.01Da,二级质谱质量偏差设置为0.05Da,其他参数为默认值。处理后得到每行为代谢物,每列为分析样本,中值为相应代谢物浓度的二维矩阵。其中每个代谢物峰使用保留时间和质荷比进行定性,对其进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分。图谱预处理后,共得到正离子模式下1478个和负离子模式下708个小分子代谢物峰,可用于进一步的机器学习。
3.2LC-MS实验质量控制
进行LC-MS血浆非靶向代谢组学分析时,将制备的QC样品按每10个分析样本安排一个QC样品的顺序均匀地插入分析样本中,用于实时监测分析样本从进样预处理到分析检测过程中的质量控制情况,所得原始代谢指纹图谱经MSDIAL软件预处理后,计算每个代谢物在QC样本中的变异系数(%RSD),绝大多数代谢物的变异系数控制在20%以下,说明样本在进样预处理到分析检测过程中的质量控制情况良好,所获得的代谢组学数据真实可信。
3.3机器学习SVM建模
使用机器学习支持向量机(support vector machine,SVM)算法学习图谱预处理得到的二维矩阵数据,随机将上述脑胶质瘤及健康对照血浆样本数据的3/4作为训练集train set,1/4作为测试集test set进行学习,并随机循环迭代2000次,获得的模型见图2(图2为本发明提供的机器学习支持向量机分类模型图,其中A为正离子模式测试集的分类模型,B为负离子模式测试集的分类模型,sensitivity为灵敏度,specificity为特异度,accuracy为准确度,mean为平均值),灵敏度(sensitivity)、特异度(specificity)和准确度(accuracy)的平均值(mean)和中位数(median)均在0.96以上,表明该SVM模型对脑胶质瘤患者与健康人群的代谢组数据分类很好,可准确区分脑胶质瘤患者与健康人群。
3.4血浆代谢标志物筛选及鉴定
根据上述得到的SVM模型,通过基于机器学习的特征筛序,借助SVM建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式的筛选,筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升。见图3(图3为本发明提供的SVM模型的特征选择得分图,其中A为正离子模式模型的准确度得分图,B为负离子模式模型的准确度得分图),本发明选择正离子模式下15个特征及负离子模式下10个特征作为差异代谢物,可以看出使用这25个特征单独进行模型分类即可获得50%以上的准确度,随着特征数量增加,准确度大幅上升。
随后根据这些潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库(LipidBlast)中的谱图信息进行比对,从而对代谢物进行鉴定。
根据上述鉴定方法,本发明成功鉴定出25个血浆代谢标志物作为适合于脑胶质瘤诊断的诊断标志物。见表2,这些标志物是溶血磷脂酰胆碱LPC16:0、溶血磷脂酰胆碱LPC18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG 16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3、甘油三酯TAG16:1-18:2-20:4。经查阅已发表文献,这25个血浆代谢标志物均为首次在脑胶质瘤诊断中发现,对于脑胶质瘤的诊断与治疗具有十分重要的意义。在使用这些血浆代谢标志物作为诊断标志物构建诊断模型和进行诊断应用时,可以将其单独使用或是组合使用。
表2.25种血浆代谢标志物
Figure BDA0002701723920000171
Figure BDA0002701723920000181
实施例2
使用15个血浆代谢标志物进行的脑胶质瘤诊断模型的构建
1.研究对象
本研究共包含736例脑胶质瘤患者血浆样本以及934例体检正常的健康对照血浆样本。其中用于训练集的385例脑胶质瘤患者及365例健康对照与特征筛选样本(107例)同一来源,用于测试集的351例脑胶质瘤患者及569例健康对照来源于独立的两家第三方医院。其中脑胶质瘤的诊断标准是经影像学检查和组织活检确认存在脑胶质瘤。这些研究对象的基本信息见表3和表4。
表3.脑胶质瘤诊断靶向代谢组学研究中训练集研究对象的基线
训练集(人数750人)
Figure BDA0002701723920000182
Figure BDA0002701723920000191
表4.脑胶质瘤诊断靶向代谢组学研究中测试集研究对象的基线
验证集(人数920人)
Figure BDA0002701723920000192
2.应用液相色谱质谱联用技术的血浆靶向代谢组学分析
所有血浆样本离心后置于-80℃冰箱内保存。研究时取出血浆样本,经样品预处理后,使用高效液相色谱质谱联用仪进行靶向代谢组学分析,获得包含色谱和质谱信息的样本靶向代谢组图谱。具体操作如下:
2.1仪器和试剂
实验仪器包括:高效液相色谱质谱联用仪(U3000/QEaxctive,Thermo Fisher)、高速低温离心机(Beckman)、振动涡旋仪、离心浓缩仪、4℃冷藏冰箱、纯水仪(Millipore)。
实验耗材包括:Waters Xselect CSH C18色谱柱(规格为100×4.6mm,3.5μm)、2mlEP管、1.5ml进样瓶、300μl内插管、移液器、1000μl枪头、200μl枪头、记号笔、乳胶手套、口罩。
实验试剂包括:甲醇(Thermo Fisher,质谱级纯)、乙腈(Thermo Fisher,质谱级纯)、异丙醇(Thermo Fisher,质谱级纯)、甲酸(Sigma)、纯水(TOC<10ppb)。
2.2血浆样本预处理
进行血浆样本预处理之前,制备50份质量控制样品(QC)(自每份脑胶质瘤血浆样本和健康血浆样本中分别取出10μl进行混合然后分装)。将所有脑胶质瘤血浆样本和健康血浆样本与质量控制样品一起进行样品预处理,具体操作如下:
A.用移液器吸取50μl分析样本或质量控制样品,置于2.0ml EP(eppendorf)管中;
B.加入150μl甲醇提取,振摇5分钟以沉淀蛋白;
C.然后在高速离心机中于4℃下以12000rpm离心10分钟;
D.将步骤(C)的上清液转移入LC-MS进样瓶中,保存在-80℃下以备LC-MS检测。
2.3血浆靶向代谢组学检测
将处理后的所有脑胶质瘤血浆样本和健康血浆样本作为分析样本,打乱顺序后随机化排序进样,以排除进样顺序带来的偏倚。每隔10个分析样本加入一个质量控制样品。所用液相色谱、质谱方法如下:
流动相:A为0.1%甲酸、乙腈60%、水40%溶液,B为0.1%甲酸、乙腈10%、异丙醇90%溶液;
流速:0.5ml/min;柱温:30℃;进样体积:10μl;
色谱梯度洗脱条件:0-l分钟为40%B,1-5分钟为40%B-50%B逐渐递增,5-15分钟为50%B至100%B逐渐递增,15-18分钟为保持100%B,18-19分钟为100%B至40%B逐渐递减,然后40%B持续5分钟。
质谱方法:采用电喷雾离子源的正离子模式ESI+,离子源温度为320℃,反吹气设置为2,脱溶剂气温为300℃,鞘气和辅气分别设置为40和10;在正离子和负离子模式下毛细管电压分别为+3kV,锥孔电压均为0V;采集模式为平行反应监测模式(PRM);采集的质荷比为表2中所列25种血浆代谢标志物的质荷比,采集分辨率为17500,目标离子数目为1x105,最大离子注入时间为50ms,隔离窗口为4.0m/z,碰撞能量为30。
3.诊断模型构建
按照上述色谱质谱条件对样本进行分析,获得所有样本的靶向代谢组图谱,典型选择离子色谱图(EIC)见图4。随后使用机器学习SVM学习靶向代谢组图谱数据,构建能够区分脑胶质瘤患者与健康人群的脑胶质瘤诊断模型,具体操作如下:
3.1图谱数据预处理
使用高效液相色谱质谱联用仪在正离子ESI+下检测获得血浆样本的靶向代谢组图谱后,使用Reifycs file converter软件将图谱转换为ABF格式文件,然后使用MSDIAL软件根据2.3步骤的质谱方法中采集的质荷比列表提取所有血浆代谢标志物的峰面积信息,得到每行为代谢物,每列为分析样本,中值为相应代谢物浓度的二维矩阵,以用于进一步的机器学习。
3.2 LC-MS实验质量控制
进行LC-MS血浆靶向代谢组学分析时,将制备的QC样品按每10个分析样本安排一个QC样品的顺序均匀地插入分析样本中,用于实时监测分析样本从进样预处理到分析检测过程中的质量控制情况,所得靶向代谢组图谱数据经MSDIAL软件预处理后,计算每个血浆代谢标志物在QC样本中的变异系数(%RSD),所有血浆代谢标志物的变异系数控制在12%以下,说明样本在进样预处理到分析检测过程中的质量控制情况良好,所获得的代谢组学数据真实可信。
3.3机器学习SVM建模与诊断性能测试
使用机器学习支持向量机(support vector machine,SVM)算法学习图谱预处理得到的二维矩阵数据,将385例脑胶质瘤患者及365例健康对照作为训练集training set学习以构建模型,建模参数C=5,将351例脑胶质瘤患者及569例健康对照作为测试集testset进行外部验证。当学习的二维矩阵数据为15个血浆代谢标志物(包含溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC18:0-18:2、磷脂酰胆碱PC18:0-20:4、甘油三酯TAG 18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2)的数据时,所获模型的灵敏度(sensitivity)、特异度(specificity)和准确度(accuracy)以及ROC曲线分析结果见图5(图5为使用11个血浆代谢标志物构建的脑胶质瘤诊断模型的ROC曲线图,其中A为训练集结果,B为测试集结果)和表5,可以看出构建的诊断模型对脑胶质瘤具有很高的灵敏度、特异度、准确度和ROC曲线下面积AUC值。
表5.使用15个血浆代谢标志物构建的脑胶质瘤诊断模型的分类性能
Figure BDA0002701723920000221
实施例3
使用11个血浆代谢标志物进行的脑胶质瘤诊断模型的构建
本实施例与实施例2的研究对象、检测分析方法相同,仅在步骤3.3机器学习SVM建模时,使用11种血浆代谢标志物(包含包含溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3)的二维矩阵数据进行机器学习和建模,所获模型的灵敏度(sensitivity)、特异度(specificity)和准确度(accuracy)以及AUC值见表6,可以看出构建的诊断模型对脑胶质瘤具有很高的灵敏度、特异度、准确度和ROC曲线下面积AUC值。
表6.使用11个血浆代谢标志物构建的脑胶质瘤诊断模型的分类性能
Figure BDA0002701723920000222
实施例4
使用4个血浆代谢标志物进行的脑胶质瘤诊断模型的构建
本实施例与实施例2的研究对象、检测分析方法相同,仅在步骤3.3机器学习SVM建模时,使用4个血浆代谢标志物(包含溶血磷脂酰胆碱LPC16:0、溶血磷脂酰胆碱LPC 18:0、磷脂酰胆碱PC 16:0-18:1、甘油三酯TAG18:1-18:2-18:3)的二维矩阵数据进行机器学习和建模,所获模型的灵敏度(sensitivity)、特异度(specificity)和准确度(accuracy)以及AUC值见表7,可以看出构建的诊断模型对脑胶质瘤具有很高的灵敏度、特异度准确度和ROC曲线下面积AUC值。
表7.使用4个血浆代谢标志物构建的脑胶质瘤诊断模型的分类性能
Figure BDA0002701723920000231
目前普遍认为当诊断方法特异度>0.9、AUC>0.7时,该方法即具有较好的诊断效果,本发明构建的诊断模型的各项指标均大于0.85,AUC值更是达到0.98以上,远高于现有诊断方法。因此,本发明的诊断模型可以有效地诊断出脑胶质瘤,降低脑胶质瘤漏检率,非常有利于脑胶质瘤的早诊早治,对于改善脑胶质瘤预后,降低脑胶质瘤的死亡率有很大帮助,具有良好的临床使用和推广价值。
在实际应用中,可以按照本发明建模方法选取更多的样本进行建模,增加模型的准确度。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种脑胶质瘤诊断的诊断标志物,其特征在于,所述诊断标志物包括以下25种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG 16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG 16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3和甘油三酯TAG 16:1-18:2-20:4。
2.根据权利要求1所述的诊断标志物,其特征在于,所述诊断标志物包括以下15种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1和磷脂酰胆碱PC 18:2-18:2。
3.根据权利要求1所述的诊断标志物,其特征在于,所述诊断标志物包括以下11种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 18:2、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 16:0-20:4、磷脂酰胆碱PC 16:0-22:6、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC18:0-18:2、磷脂酰胆碱PC 18:0-20:4、甘油三酯TAG 18:1-18:2-18:3。
4.根据权利要求1所述的诊断标志物,其特征在于,所述诊断标志物包括以下4种血浆脂质代谢标志物中的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、磷脂酰胆碱PC 16:0-18:1和甘油三酯TAG 18:1-18:2-18:3。
5.一种脑胶质瘤诊断标志物的筛选方法,包括以下步骤:
(1)分别收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
(2)采用液相色谱质谱联用技术分别对每个分析样本进行非靶向代谢组学分析,得到各血浆样本的原始代谢指纹图谱;
(3)使用MS-Dial软件对脑胶质瘤患者的血浆样本和健康人群的血浆样本的原始代谢指纹图谱分别进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分,用于进一步的机器学习;
(4)使用机器学习支持向量机算法学习步骤(3)的二维矩阵数据,随机将上述脑胶质瘤及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终支持向量机模型准确度的平均值,确定该支持向量机模型可有效对脑胶质瘤患者与健康人群的代谢组数据进行分类;
(5)根据上述得到的支持向量机模型,通过基于机器学习的特征筛序,借助支持向量机建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式;所述筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升;
(6)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS-Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物;
(7)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,并且与化学标准品进行比对,从而对代谢物进行鉴定,得到适合于脑胶质瘤诊断的血浆脂质代谢标志物。
6.一种基于权利要求1~4任一项所述诊断标志物的脑胶质瘤诊断模型的构建方法,包含以下步骤:
1)收集脑胶质瘤患者和健康人群的血浆样本作为分析样本;
2)采用液相色谱质谱联用技术对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱;
3)使用MS-Dial软件对脑胶质瘤血浆样本和健康血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习;
4)根据所述诊断标志物的二维矩阵,使用机器学习支持向量机构建分类模型,得到脑胶质瘤诊断模型。
7.基于权利要求6所述构建方法构建得到的脑胶质瘤诊断模型。
8.基于权利要求1~4任一项所述诊断标志物在制备脑胶质瘤诊断试剂盒中的应用。
9.一种脑胶质瘤诊断试剂盒,其特征在于,包括权利要求1~3任一项所述诊断标志物。
CN202011024473.7A 2020-09-25 2020-09-25 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法 Active CN112183616B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024473.7A CN112183616B (zh) 2020-09-25 2020-09-25 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024473.7A CN112183616B (zh) 2020-09-25 2020-09-25 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法

Publications (2)

Publication Number Publication Date
CN112183616A true CN112183616A (zh) 2021-01-05
CN112183616B CN112183616B (zh) 2023-09-05

Family

ID=73943970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024473.7A Active CN112183616B (zh) 2020-09-25 2020-09-25 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法

Country Status (1)

Country Link
CN (1) CN112183616B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113533728A (zh) * 2021-06-03 2021-10-22 中国科学院生物物理研究所 一种脑胶质瘤的生物标志物及其应用
CN113960130A (zh) * 2021-09-27 2022-01-21 岛津企业管理(中国)有限公司 一种采用开放式离子源诊断甲状腺癌的机器学习方法
CN113960309A (zh) * 2021-10-21 2022-01-21 重庆点检生物科技有限公司 一种基于循环肿瘤细胞的脑胶质瘤检测试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109884302A (zh) * 2019-03-14 2019-06-14 北京博远精准医疗科技有限公司 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
WO2019238022A1 (en) * 2018-06-11 2019-12-19 Chineo Medical Technology Co., Ltd. Modified immune cells and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019238022A1 (en) * 2018-06-11 2019-12-19 Chineo Medical Technology Co., Ltd. Modified immune cells and uses thereof
CN109884302A (zh) * 2019-03-14 2019-06-14 北京博远精准医疗科技有限公司 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘建, 吴敏良, 董琦, 余捷凯, 胡跃, 徐文莉, 沈宏, 郑树: "生物信息技术分析脑胶质瘤血清蛋白指纹图诊断模型的临床意义", 中华检验医学杂志, no. 01 *
刘建, 郑树, 余捷凯, 俞学斌, 刘伟国, 张建民, 胡汛: "胶质瘤脑脊液蛋白质指纹图诊断模型的建立及其在临床诊断中的应用", 浙江大学学报(医学版), no. 02 *
左莉华;丁大领;沈燕;师莹莹;孙志;李卓伦;周霖;徐昙烨;刘丽伟;张晓坚;: "基于超高效液相色谱-质谱的胶质瘤患者血浆代谢组学研究", 分析测试学报, no. 12 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113533728A (zh) * 2021-06-03 2021-10-22 中国科学院生物物理研究所 一种脑胶质瘤的生物标志物及其应用
CN113960130A (zh) * 2021-09-27 2022-01-21 岛津企业管理(中国)有限公司 一种采用开放式离子源诊断甲状腺癌的机器学习方法
CN113960309A (zh) * 2021-10-21 2022-01-21 重庆点检生物科技有限公司 一种基于循环肿瘤细胞的脑胶质瘤检测试剂盒

Also Published As

Publication number Publication date
CN112183616B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN109884302B (zh) 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
CN110646554B (zh) 基于代谢组学的胰腺癌诊断标志物及其筛选方法和应用
CN112183616B (zh) 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法
CN111289736A (zh) 基于代谢组学的慢阻肺早期诊断标志物及其应用
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
CN112151121B (zh) 一种食管癌诊断的诊断标志物、试剂盒及筛选方法和食管癌诊断模型的构建方法
CN109307764B (zh) 一组代谢标志物在制备胶质瘤诊断试剂盒方面的应用
CN111562338A (zh) 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用
CN112305121B (zh) 代谢标志物在动脉粥样硬化性脑梗死中的应用
CN105738526A (zh) 筛选三阴性乳腺癌特异性血清代谢标志物的方法
CN112083111A (zh) 一种慢性药物性肝损伤相关肝硬化非侵入性诊断标志物及其应用
CN113567585A (zh) 一种基于外周血的食管鳞癌筛查标志物及试剂盒
CN116413432A (zh) 基于肠道菌群代谢组学的胰腺癌诊断标志物及其筛选方法和应用
CN109946467B (zh) 一种用于胸椎黄韧带骨化诊断的生物标记物
CN105203683B (zh) 人类非小细胞肺癌相关的血浆代谢小分子标志物及其应用
CN115575553A (zh) 血清代谢标志物作为检测egfr突变的应用以及检测系统
CN109444277B (zh) 代谢标志物在制备胶质瘤诊断试剂盒方面的应用
CN113960130A (zh) 一种采用开放式离子源诊断甲状腺癌的机器学习方法
CN110794054A (zh) 尿液中髓母细胞瘤的代谢标志物及其用途
CN113933434B (zh) 系统性红斑狼疮的代谢标志物
CN117388495B (zh) 用于诊断肺癌分期的代谢标志物的应用及试剂盒
CN113341044B (zh) 一种基于代谢组学标志物鉴定溺死的方法及其应用
CN116500168B (zh) β-丙氨酸和哌啶酸的组合作为巨大儿预测标志物的应用
CN117517532B (zh) 基于代谢组学和人工智能技术的肺腺癌早期诊断标志物及其应用
US20230080918A1 (en) Biomarkers and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant