CN114839305A - 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法 - Google Patents

小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法 Download PDF

Info

Publication number
CN114839305A
CN114839305A CN202210543318.9A CN202210543318A CN114839305A CN 114839305 A CN114839305 A CN 114839305A CN 202210543318 A CN202210543318 A CN 202210543318A CN 114839305 A CN114839305 A CN 114839305A
Authority
CN
China
Prior art keywords
lung cancer
cell lung
small cell
sample
metabolite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210543318.9A
Other languages
English (en)
Inventor
王海永
尚晓玲
张晨月
林家茂
李慧娟
李振祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital of Shandong First Medical University
Original Assignee
Cancer Hospital of Shandong First Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital of Shandong First Medical University filed Critical Cancer Hospital of Shandong First Medical University
Priority to CN202210543318.9A priority Critical patent/CN114839305A/zh
Publication of CN114839305A publication Critical patent/CN114839305A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/24Automatic injection systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明属于医药学技术领域,公开了一种小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法,获取小细胞肺癌患者的血液样本,并对所述血液样本进行离心处理,得到血清样品于‑80℃保存;将血清样品于4℃下缓慢解冻,并对解冻后的血清样品进行代谢物提取;同时将代谢物提取样本利用超高效液相色谱HILIC柱分离,并进行进样分析;通过统计检验对分析数据进行预筛选,采用集成学习方法计算每种代谢物的权重值,并根据权重值选择候选生物标志物;对筛选得到的标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。本发明成功构建了基于代谢物的小细胞肺癌诊断模型。

Description

小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法
技术领域
本发明属于医药学技术领域,尤其涉及一种小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法、终端、介质及应用。
背景技术
目前,小细胞肺癌(SCLC)是一种侵袭性高级别的神经内分泌恶性肿瘤,约占所有肺癌的15%,其特点是倍增时间快、早期易广泛转移、生存率极低。大多数患者在最初诊断时发生远处转移,这使患者的中位生存期不到1年。如果不进行治疗,中位生存期只有3-4个月。因此,早期有效地发现小细胞肺癌,及时给予治疗,对预后有重要的积极影响。
神经元特异性烯醇化酶(NSE)和胃泌素前体释放肽(ProGRP)是目前常规用于小细胞肺癌诊断的肿瘤标志物。然而,NSE和ProGRP预测小细胞肺癌的敏感性和特异性较差。近年来,越来越多的研究表明,血液肿瘤成分如循环肿瘤DNA(ctDNA)、循环肿瘤细胞(CTCs)、外泌体和细胞外囊泡(EVs)具有作为小细胞肺癌诊断标志物的潜能。然而,大多数肿瘤标志物单独应用时不适合用于筛查和组织学诊断,每种标志物都有其自身的局限性。
代谢增强是包括小细胞肺癌在内的癌症的重要表型之一。代谢组学是能够为样本基因组和蛋白质组图谱提供补充信息的组学技术。更重要的是,代谢产物在体液中是稳定和可定量的,这为建立一种非侵入性的疾病诊断方法提供了机会。
许多研究表明,代谢物作为生物标志物在癌症诊断中表现出良好的诊断性能。然而,研究尚未系统地探讨血清代谢物在诊断小细胞肺癌患者中的潜在作用。
通过上述分析,现有技术存在的问题及缺陷为:现有技术没有基于代谢物的小细胞肺癌诊断模型的构建方法或技术。
解决以上问题及缺陷的难度为:小细胞肺癌恶性程度高,目前缺乏敏感性和特异性理想的生物标志物用于小细胞肺癌的诊断及协助临床决策。
解决以上问题及缺陷的意义为:基于代谢物的小细胞肺诊断模型可以提高小细胞肺癌的诊断能力,具有重要的临床意义。
发明内容
针对现有技术存在的问题,本发明提供了一种基于代谢物的小细胞肺癌诊断模型构建方法、终端、介质及应用。
本发明是这样实现的,一种小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,包括:
将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的权重值,根据权重值选择候选生物标志物,权重值越大表明该代谢物对模型的贡献越大;并利用ROC分析评价各代谢物对模型的AUC值的影响强度,AUC值越高,表明模型的分类效果越好;从而有效的筛选出候选标志物;
对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
进一步,所述分析进样数据包括:将样品以4℃/min的速度放置在自动取样器中采用随机序列对样品进行连续分析;
还包括:
将质控样本插入样本队列,利用质谱仪采集样品的一次和二次光谱;利用ProteoWizard将Wiff格式的原始数据转换为mzXML格式,并利用XCMS软件进行峰对齐、保留时间校正和峰面积提取;
对XCMS提取的数据进行代谢物结构鉴定和数据预处理,并对实验数据进行质量评价以及分析数据。
进一步,所述选择候选生物标志物包括:
采用ROC分析评价各物质对模型AUC值的影响程度进行候选生物标志物的筛选。
进一步,所述对筛选得到的候选标志物进行验证包括:
使用Logistic回归、随机森林和支持向量机三种机器学习方法对候选生物标志物进行验证。
进一步,利用随机森林算法构建的分类模型,计算候选生物标记物的重要系数,比较各生物标记物对模型的贡献;
利用逻辑回归算法构建生物标志物诊断的面板模型,计算每个候选标志物的逻辑回归系数和截距;
生物标志物逻辑回归模型公式为:
Figure BDA0003651005730000031
其中,z=intercept+coefficient(B1)+coefficient(B2)+coefficient(B3)+···+coefficient(Bn);通过Z得分换算,将生物标志物的表达水平纳入面板模型公式的计算中;
所述生物标志物诊断的面板模型利用约登指数确定最佳分界值。
进一步,所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法进一步包括:
获取小细胞肺癌患者的血液样本,并对所述血液样本进行离心处理,得到血清样品,并于-80℃下进行保存;
将血清样品于4℃下缓慢解冻,并对解冻后的血清样品进行代谢物提取。
进一步,所述血清样本离心处理包括:3000xg离心10min;
所述对解冻后的血清样品进行代谢物提取包括:将解冻后的血清样本添加至预冷过混合溶液中,旋涡混合,过滤,收集上清液;将所述上清液于-20℃下放置10min,于4℃下14000xg离心20min;过滤,取上清液;并将所述上清液在真空中干燥;用100μL由乙腈与水按照1:1的比例配制得到的乙腈溶液将干燥后的上清液溶解15min,取上清于4℃下14000xg离心15min;
所述混合溶液由甲醇、乙腈、水按照2:2:1组成。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,包括:将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的权重值,并根据权重值选择候选生物标志物;
对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的权重值,并根据权重值选择候选生物标志物;
对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型
本发明的另一目的在于提供一种所述构建方法在筛选用于小细胞肺癌诊断、检测的肺癌药物中的应用。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
本发明采用液相色谱-串联质谱法(LC-MS/MS)对416例小细胞肺癌(SCLC)、非小细胞肺癌(NSCLC)和健康体检者的血清标本进行代谢组学分析,构建了基于代谢物的小细胞肺癌检测模型,能够提高对小细胞肺癌的诊断能力。
附图说明
图1是本发明实施例提供的小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法流程图。
图2是本发明实施例提供的小细胞肺癌患者的代谢物与对照组的差异示意图。
图3是本发明实施例提供的机器学习方法筛选代谢相关生物标志物示意图。
图4是本发明实施例提供的筛选出的代谢标志物构建的小细胞肺癌诊断模型示意图。
图5是本发明实施例提供的构建的代谢相关的诊断模型在不同分期中的诊断效能示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于代谢物的小细胞肺癌诊断模型构建方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法包括:
S101,获取小细胞肺癌患者的血液样本,并对所述血清样本3000xg离心10min,得到血清样品,并于-80℃下进行保存;
S102,将血清样品于4℃下缓慢解冻,并对解冻后的血清样品进行代谢物提取;同时将代谢物提取样本利用超高效液相色谱HILIC柱分离,并进行进样分析;
S103,通过统计检验对分析数据进行预筛选,采用集成学习方法计算每种代谢物的权重值,并根据权重值选择候选生物标志物,包括水杨酸、3-磷酸丝氨酸、DL-乳酸、三聚氰胺、硫酸胆固醇和亮氨酸-苯丙氨酸;
S104,对筛选得到的标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
本发明实施例提供的对解冻后的血清样品进行代谢物提取包括:将解冻后的血清样本添加至预冷过混合溶液中,旋涡混合,过滤,收集上清液;将所述上清液于-20℃下放置10min,于4℃下14000xg离心20min;过滤,取上清液;并将所述上清液在真空中干燥;用100μL由乙腈与水按照1:1的比例配制得到的乙腈溶液将干燥后的上清液溶解15min,取上清于4℃下14000xg离心15min。
本发明实施例提供的混合溶液由甲醇、乙腈、水按照2:2:1组成。
本发明实施例提供的进样分析包括:
将样品以4℃/min的速度放置在自动取样器中采用随机序列对样品进行连续分析;
具体包括以下步骤:
将质控样本插入样本队列,利用质谱仪采集样品的一次和二次光谱;利用ProteoWizard将Wiff格式的原始数据转换为mzXML格式,并利用XCMS软件进行峰对齐、保留时间校正和峰面积提取;
对XCMS提取的数据进行代谢物结构鉴定和数据预处理,并对实验数据进行质量评价以及分析数据。
本发明实施例提供的对筛选得到的标志物进行验证包括:
采用ROC分析评价各物质对模型AUC值的影响程度进行候选生物标志物的筛选;使用Logistic回归、随机森林和支持向量机三种机器学习方法对候选生物标志物进行验证。
本发明实施例提供的使用Logistic回归、随机森林和支持向量机三种机器学习方法对候选生物标志物进行验证包括:
利用随机森林算法构建的分类模型,计算候选生物标记物的重要系数,比较各生物标记物对模型的贡献;
利用逻辑回归算法构建生物标志物诊断的面板模型,计算每个候选标志物的逻辑回归系数和截距;
生物标志物逻辑回归模型公式为:
Figure BDA0003651005730000071
其中,z=intercept+coefficient(B1)+coefficient(B2)+coefficient(B3)+···+coefficient(Bn);通过Z得分换算,将生物标志物的表达水平纳入面板模型公式的计算中。
本发明实施例提供的基于代谢物的小细胞肺癌诊断模型构建方法还包括:利用约登指数确定诊断决策的最佳分界值。
下面结合具体实施例对本发明的技术方案做进一步说明。
实施例1:
样本收集。
于2020年3月至11月在山东省肿瘤医院采集血液标本501例。排除用药信息不明确、血清质量不达标的样本,共461例,包括小细胞肺癌191例、非小细胞肺癌173例和97例健康对照。所有癌症患者均需经组织病理学证实,并在血液标本收集前未接受任何抗肿瘤治疗。所有血样在6h内以3000xg离心10min获得血清样品,血清样品在-80℃下保存至使用。所有患者在采集血样前都签署了知情同意书。本发明由山东省肿瘤医院伦理委员会批准。
代谢物的提取。
样品在4℃下缓慢解冻后,加入适量样品于预冷的甲醇/乙腈/水(2:2:1)溶液中,与旋涡混合,上清液在-20℃下放置10min,在4℃下放置14000×g,20min。上清液在真空中干燥,再用100μL乙腈溶液(乙腈:水=1:1)溶解15min。取上清经14000×g、4℃离心15min后进行进样分析。
质谱分析。
样品经Agilent 1290Infinity LC超高效液相色谱(UHPLC)HILIC柱分离。在整个分析过程中,样品以4℃/min的速度放置在自动取样器中。为避免仪器检测信号波动带来的影响,采用随机序列对样品进行连续分析。将质控样本插入样本队列,对系统的稳定性和实验数据的可靠性进行监测和评估。用AB Triple TOF6600质谱仪采集样品的一次和二次光谱。利用ProteoWizard将Wiff格式的原始数据转换为mzXML格式,然后利用XCMS软件进行峰对齐、保留时间校正和峰面积提取。首先对XCMS提取的数据进行代谢物结构鉴定和数据预处理,然后对实验数据进行质量评价,最后对数据进行分析。
诊断模型的构建。
所有的血清样本都被用来提取代谢物。经质谱分析后,对数据质量进行评价。通过统计检验对所有数据进行预筛选,采用集成学习方法计算每种物质的权重值,并根据权重值选择候选生物标志物。此外,为了有效地筛选候选生物标志物,采用ROC分析评价了各物质对模型AUC值的影响程度。使用Logistic回归、随机森林和支持向量机三种机器学习方法对候选生物标志物进行验证。通过ROC曲线分析确定不同群体候选标记。利用随机森林算法构建的分类模型,计算候选生物标记物的重要系数,比较各生物标记物对模型的贡献。利用逻辑回归算法构建了生物标志物诊断的面板模型。计算每个候选标记的逻辑回归系数和截距。生物标志物逻辑回归模型公式为:
Figure BDA0003651005730000081
z=intercept+coefficient(B1)+coefficient(B2)+coefficient(B3)+···+coefficient(Bn)。通过Z得分换算,将生物标志物的表达水平纳入上述面板模型公式的计算中。本发明利用约登指数来定义诊断决策的最佳分界值。用约登指数确定诊断决策的最佳分界值。样本随机抽取为训练队列(2/3)和测试队列(1/3)。基于候选生物标志物的表达,对构建的诊断模型进行ROC分析。如果计算出的诊断模型得分超过分界值,则判断为诊断阳性。
统计分析。
所有的统计分析都是双面的,p值小于0.05被认为具有统计学意义。对处理后的数据进行R软件包分析,并进行多元数据分析。
结果
代谢物的差异分析。
三维PCA得分图显示,小细胞肺癌患者的代谢物与对照组(非小细胞肺癌+健康人)相比有很大的差异(图2中的A)。其次,使用P值<0.05和FC>1.5或<0.67对代谢物火山图可视化差异分析,可见小细胞肺癌患者与对照组相比具有明显的代谢物差异(图2中的B)。
用机器学习方法筛选代谢相关生物标志物。
为有效筛选候选生物标志物,采用ROC分析评价各物质对模型AUC值的影响程度。结果表明,排在前六位的物质可以提高样品的分类能力,包括水杨酸、3-磷酸丝氨酸、DL-乳酸、三聚氰胺、硫酸胆固醇和亮氨酸-苯丙氨酸(图3中的A)。随后,使用Logistic回归、随机森林和支持向量机三种机器学习方法对筛选结果进行了验证,并利用ROC曲线分析了6种候选代谢物在小细胞肺癌组和对照组样本分类中的性能(图3中的B)。结果表明,Logistic回归和支持向量机的AUC为0.92,随机森林的AUC为0.91(图3中的C)。此外,利用Logistic回归算法构建的分类模型计算了6种代谢物的重要系数,比较了各代谢物对模型的贡献。
结果表明,亮氨酸-苯丙氨酸对模型的贡献最大,而硫酸胆固醇对模型的贡献最小(图3中的D)。并对小细胞肺癌组和对照组6种代谢物的表达水平进行了分析。结果表明,3-磷酸丝氨酸(P<0.0001)、三聚氰胺(P<0.0001)、硫酸胆固醇(P=0.0002)、DL-乳酸(P<0.0001)、亮氨酸-苯丙氨酸(P<0.0001)和水杨酸(P<0.0001)在两组间差异显著(图3中的E)。
诊断模型的构建。
本发明随机选取2/3的样本作为训练队列,另外1/3的样本作为测试队列,对构建的诊断模型进行ROC分析。结果表明,模型在训练队列中的AUC值为0.932(图4中的A)。对训练队列中六种代谢物的聚类分析表明,在热图上两组之间有明显的分离(图4中的B)。同样,测试队列中模型的AUC值为0.924(图4中的C)。对测试队列中的六种代谢物的聚类分析显示,两组之间有明显的分离(图4中的D)。
诊断模型可以提高小细胞肺癌的诊断性能。
本发明发现,与非小细胞肺癌(P<0.0001)和健康对照组(P<0.0001)相比,小细胞肺癌表现出较高的诊断模型评分(图5中的A)。此外,本发明还分析了NSE和ProGRP在本发明中的诊断效果。结果表明,NSE和ProGRP检测小细胞肺癌的AUC值分别为0.873和0.894,低于本发明的代谢物诊断模型AUC值(图5中的B)。此外,本发明还证实了诊断模型在不同分期的小细胞肺癌中的诊断性能。局限期和广泛期癌症患者的AUC分别为0.925和0.933(图5中的C和图5中的D)。综述结果表明,本发明构建的基于代谢物的诊断模型具有较强的对小细胞肺癌的诊断能力。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法包括:
将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的综合权重值,根据权重值选择候选生物标志物,权重值越大表明该代谢物对模型的贡献越大;并利用ROC分析评价各代谢物对模型AUC值的影响强度,AUC值越高,模型的分类效果越好;筛选出候选标志物;
通过逻辑回归、随机森林、支持向量机三种机器学习模型分别对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
2.如权利要求1所述的小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述分析进样数据包括:将样品以4℃/min的速度放置在自动取样器中采用随机序列对样品进行连续分析;
还包括:
将质控样本插入样本队列,利用质谱仪采集样品的一次和二次光谱;利用ProteoWizard将Wiff格式的原始数据转换为mzXML格式,并利用XCMS软件进行峰对齐、保留时间校正和峰面积提取;
对XCMS提取的数据进行代谢物结构鉴定和数据预处理,并对实验数据进行质量评价以及分析。
3.如权利要求1所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述选择候选生物标志物包括:
采用ROC分析评价各物质对模型AUC值的影响程度进行候选生物标志物的筛选。
4.如权利要求1所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述对筛选得到的候选标志物进行验证包括:
使用Logistic回归、随机森林和支持向量机三种机器学习方法对候选生物标志物进行验证。
5.如权利要求4所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,利用随机森林算法构建的分类模型,计算候选生物标志物的重要系数,比较各生物标志物对模型的贡献;
利用逻辑回归算法构建生物标志物诊断的面板模型,计算每个候选标志物的逻辑回归系数和截距;
生物标志物逻辑回归模型公式为:
Figure FDA0003651005720000021
其中,z=intercept+coefficient(B1)+coefficient(B2)+coefficient(B3)+···+coefficient(Bn);通过Z得分换算,将生物标志物的表达水平纳入面板模型公式的计算中;
所述生物标志物诊断的面板模型利用约登指数确定最佳分界值。
6.如权利要求1所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法进一步包括:
获取小细胞肺癌患者的血液样本,并对所述血液样本进行离心处理,得到血清样品,并于-80℃下进行保存;
将血清样品于4℃下缓慢解冻,并对解冻后的血清样品进行代谢物提取。
7.如权利要求6所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,其特征在于,所述血液样本离心处理包括:3000xg离心10min;
所述对解冻后的血清样品进行代谢物提取包括:将解冻后的血清样本添加至预冷过混合溶液中,旋涡混合,过滤,收集上清液;将所述上清液于-20℃下放置10min,于4℃下14000xg离心20min;过滤,取上清液;并将所述上清液在真空中干燥;用100μL由乙腈与水按照1:1的比例配制得到的乙腈溶液将干燥后的上清液溶解15min,取上清于4℃下14000xg离心15min;
所述混合溶液由甲醇、乙腈、水按照2:2:1组成。
8.一种信息数据处理终端,其特征在于,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1所述小细胞肺癌数据信息检测中基于代谢物的小细胞肺癌诊断模型构建方法,包括:将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的权重值,并根据权重值选择候选生物标志物;
对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
将代谢物提取样本利用超高效液相色谱HILIC柱分离,并分析进样数据;
通过统计检验对进样分析数据进行预筛选,采用集成学习方法计算每种代谢物提取样本的权重值,并根据权重值选择候选生物标志物;
对筛选得到的候选标志物进行验证,并结合代谢物表达水平分析结果,确定诊断生物标志物;得到基于代谢物的小细胞肺癌诊断模型。
10.一种如权利要求1-7任意一项所述构建方法在筛选用于小细胞肺癌诊断、检测的肺癌药物中的应用。
CN202210543318.9A 2022-05-19 2022-05-19 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法 Withdrawn CN114839305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210543318.9A CN114839305A (zh) 2022-05-19 2022-05-19 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210543318.9A CN114839305A (zh) 2022-05-19 2022-05-19 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法

Publications (1)

Publication Number Publication Date
CN114839305A true CN114839305A (zh) 2022-08-02

Family

ID=82571198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210543318.9A Withdrawn CN114839305A (zh) 2022-05-19 2022-05-19 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法

Country Status (1)

Country Link
CN (1) CN114839305A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115575636A (zh) * 2022-11-22 2023-01-06 杭州广科安德生物科技有限公司 一种用于肺癌检测的生物标志物及其系统
CN117352064A (zh) * 2023-12-05 2024-01-05 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115575636A (zh) * 2022-11-22 2023-01-06 杭州广科安德生物科技有限公司 一种用于肺癌检测的生物标志物及其系统
CN115575636B (zh) * 2022-11-22 2023-04-04 杭州广科安德生物科技有限公司 一种用于肺癌检测的生物标志物及其系统
CN117352064A (zh) * 2023-12-05 2024-01-05 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用
CN117352064B (zh) * 2023-12-05 2024-02-09 成都泰莱生物科技有限公司 一种肺癌代谢标志物组合及其筛选方法和应用

Similar Documents

Publication Publication Date Title
US20240019417A1 (en) Methods and Systems for Determining Autism Spectrum Disorder Risk
Brown et al. Cancer detection and biopsy classification using concurrent histopathological and metabolomic analysis of core biopsies
CN114839305A (zh) 小细胞肺癌数据信息检测中小细胞肺癌诊断模型构建方法
US20240230622A9 (en) Methods and Systems for Determining Autism Spectrum Disorder Risk
CN105277718A (zh) 用于恶性肿瘤相关筛查及评估的产品、应用及方法
CN113156018B (zh) 一种肝胆疾病诊断模型的建立方法及诊断系统
US20160363560A9 (en) Metabolite Biomarkers for the Detection of Esophageal Cancer Using NMR
US20170023575A1 (en) Identification of blood based metabolite biomarkers of pancreatic cancer
CN111983083B (zh) 检测代谢物标志物在制备多发性骨髓瘤诊断工具中的应用
Liang et al. Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma
CN111748624B (zh) 用于预测肝癌是否复发的生物标志物
CN113567585A (zh) 一种基于外周血的食管鳞癌筛查标志物及试剂盒
Song et al. MALDI‐TOF‐MS analysis in low molecular weight serum peptidome biomarkers for NSCLC
EP4206330A1 (en) Identification system and kit for detection of circulating biomarkers of cancer
CN118518886A (zh) 一种用于结直肠癌早期筛查的蛋白质标志物组合、试剂盒及应用
CN111748623B (zh) 肝癌患者是否复发的预测标志物及试剂盒
CN114428169A (zh) 代谢标志物及在制备慢性肾病的风险预测试剂盒中的应用和试剂盒
CN113252899A (zh) 标志物在制备结直肠癌检测试剂盒中的用途
CN113466370A (zh) 一种用于食管鳞癌早期筛查的标志物及检测试剂盒
CN112986588B (zh) 脂质标志物在制备结直肠癌检测试剂盒中的用途
US20240255511A1 (en) Device for diagnosing liver cancer
CN110568115B (zh) 尿液中的代谢标志物及其在胶质瘤早期诊断中的用途
Zoppis et al. Analysis of Correlation Structures in Renal Cell Carcinoma Patient Data.
CN118425375A (zh) 用于区分非结直肠癌疾病与结直肠癌的代谢标志物组合物
CN113433239A (zh) 一种用于贲门癌诊断的标志物及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220802

WW01 Invention patent application withdrawn after publication