CN118230955A - 抑郁症检测用模型训练方法、检测系统、程序及存储介质 - Google Patents

抑郁症检测用模型训练方法、检测系统、程序及存储介质 Download PDF

Info

Publication number
CN118230955A
CN118230955A CN202410430169.4A CN202410430169A CN118230955A CN 118230955 A CN118230955 A CN 118230955A CN 202410430169 A CN202410430169 A CN 202410430169A CN 118230955 A CN118230955 A CN 118230955A
Authority
CN
China
Prior art keywords
model
artificial intelligence
acid
intelligence model
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410430169.4A
Other languages
English (en)
Inventor
彭军
袁勇贵
朱娟
孙太鹏
曹珊珊
盛丕杰
周玥
王正阳
李思佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Mass Spectrometry Medical Technology Co ltd
Hefei Xinzhi Medical Instrument Co ltd
Original Assignee
Nanjing Mass Spectrometry Medical Technology Co ltd
Hefei Xinzhi Medical Instrument Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Mass Spectrometry Medical Technology Co ltd, Hefei Xinzhi Medical Instrument Co ltd filed Critical Nanjing Mass Spectrometry Medical Technology Co ltd
Priority to CN202410430169.4A priority Critical patent/CN118230955A/zh
Publication of CN118230955A publication Critical patent/CN118230955A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种抑郁症检测用算法模型、检测系统、程序及存储介质。所述人工智能模型的训练方法包括:构建人工智能模型,其输入包括选自5‑羟基邻氨基苯甲酸、甲硫氨酸、γ‑氨基丁酸、3,4‑二羟基苯乙酸、2‑吡啶甲酸、喹啉酸、犬尿氨酸、5‑羟色氨酸、3‑羟基犬尿氨酸、3‑羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸中的3‑4种待检测化合物的浓度,输出为患重度抑郁症风险指数;采用大样本数据对人工智能模型进行训练。本发明的检测模型AUC大于等于0.95,甚至0.99;准确率达90%以上;灵敏度高;算法简单,迭代收敛快,便于移植,可以内嵌到检测系统,也可作为单独数据处理单元,采用加密密钥或外置U盘方式工作。

Description

抑郁症检测用模型训练方法、检测系统、程序及存储介质
技术领域
本发明涉及智能检测技术领域,具体涉及一种抑郁症检测用模型训练方法、采用其的检测系统、可执行程序及存储介质。
背景技术
近年来,随着基因组学、转录组学、蛋白质组学和多肽组学等技术的不断发展与交叉融合,与抑郁症发生发展密切相关的特异性的生物标志物也不断地被筛选发现。这些在抑郁症发生发展过程中以及抗抑郁药物治疗过程中可以标记系统、器官、组织、细胞及亚细胞结构或功能改变或可能发生改变的生化物质,将其定义为抑郁症标志物(Depressionmarkers,DM)。然而,目前鲜有将抑郁症标志物作为临床抑郁症的诊断指标,而与抑郁症密切相关的生物标志及其检测方法的研究大部分停留于基础研究阶段。
人工智能技术的发展,给各行各业带来全新的变化。人工智能技术也应用到了疾病的诊断,例如抑郁症的诊断。CN113052113B公开了一种基于紧凑型卷积神经网络的抑郁症识别方法及系统,所述方法包括:获取若干个受测者的脑电信号数据;其中,所述受测者包括抑郁症受测者和正常受测者;对所述脑电信号数据进行数据预处理,并按照预设的比例将预处理后的脑电信号数据划分为训练数据集和测试数据集;将所述训练数据集输入至预先构建的紧凑型卷积神经网络,以对所述紧凑型卷积神经网络进行训练,在所述紧凑型卷积神经网络达到预设的收敛状态时,生成抑郁症识别模型;将所述测试数据集输入至所述抑郁症识别模型进行识别并分别输出抑郁症识别结果以及正常识别结果。通过实施本发明能够有效降低识别模型对数据质量的依赖性,并提高识别的准确性。
CN112232191B公开了一种基于微表情分析的抑郁症识别系统。属于计算机视觉领域;具体步骤:1、训练深度多任务识别网络;2、对人脸的重要的局部区域进行划分,剔除与微表情无关的区域;3、训练自适应的双流神经网络,对微表情运动的开始帧、Apex帧、结束帧进行定位;4、根据在不同背景下对微表情的分析判断该人是否患有抑郁症。本发明以深度多任务神经网络为基础,对图像进行预处理,从而进行人脸重要局部区域划分,提高双流神经网络的识别速度,满足实时性的要求;并通过基于注意力机制的BLSTM-CNN神经网络提取重要的帧图片特征以及自适应融合双流神经网络提取到的双流特征提高微表情运动帧的定位,进而提高微表情识别的速度和准确性。
US20220341945A1公开了用于诊断重度抑郁症的标志物组合物,其包含作为标志物的ZA2G和凝血酶原,使用该标志物组合物提供确定重度抑郁症发生所必需的信息的方法,用于确定重度抑郁症发生的组合物包括用于测量标志物表达水平的试剂,和用于确定重度抑郁症发生的试剂盒,包括用于测量标志物表达水平的装置。其中,所述组合是使用选自线性或非线性回归分析方法的分析方法、方差分析、神经网络分析方法、遗传分析方法、支持向量机分析方法、层次聚类分析或聚类分析方法、使用决策树的分层算法、内核主成分分析方法、马尔可夫毯分析方法、递归特征消除或基于熵的递归特征消除分析方法、前向浮动搜索或后向浮动搜索分析方法及其组合来实现的。所述组合是使用计算机算法来执行的。
由此可见,随着技术的发展,目前已经出现不少人工智能辅助抑郁症诊断的技术,但这些技术或者输入信号繁琐、不好采集,或者诊断准确率差强人意,还没有能够真正应用于临床的成熟技术。
发明内容
有鉴于此,本发明的主要目的在于提供一种抑郁症检测用模型训练方法、检测系统、程序及存储介质,以期至少部分地解决上述技术问题。
为了实现上述目的,作为本发明的第一个方面,提出了一种检测抑郁症的人工智能模型的训练方法,包括如下步骤:
构建人工智能模型,所述人工智能模型的输入包括选自5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸中的3-4种的待检测化合物在待检测样品中的浓度,所述人工智能模型的输出为待检测样品的主人患重度抑郁症的风险评估指数;
采用大样本数据对所述人工智能模型进行训练,其中健康人员为正样本,患重度抑郁症人员为负样本。
作为本发明的第二个方面,还提出了一种重度抑郁症检测系统,包括:
数据处理单元,用于基于检测设备的检测结果,以及如权利要求1-4任一项所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断待测试样品采集自的被测试者的重度抑郁症患病风险;
提取试剂组合,所述提取试剂组合包括与预先训练的人工智能模型输入匹配的作为生物标记物的待检测化合物的校准品、质控品和提取液;
检测设备,用于对经过上述提取试剂组合处理的被测试者的样品进行检测,得到所述待检测化合物的浓度。
作为本发明的第三个方面,还提出了一种可执行程序,所述可执行程序能够被计算装置所执行,实现如下方法:
输入或获取样品中待检测化合物的浓度;其中,所述待检测化合物是与预先训练的人工智能模型输入匹配的生物标记物;
基于所述待检测化合物的浓度,以及如上所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断所述样品采集自的被测试者患重度抑郁症的风险。
作为本发明的第四个方面,还提出了一种存储介质,所述存储介质上存储有如上所述的可执行程序。
基于上述技术方案可知,本发明的抑郁症检测用模型训练方法、检测系统、程序及存储介质相对于现有技术至少具备如下有益效果之一:
(1)精度问题,准确度高,灵敏度高,AUC大于等于0.95,甚至0.99;准确率达90%以上。
(2)算法简单,迭代收敛快,便于移植,可以内嵌到检测系统,也可以作为单独的数据处理单元,采用加密密钥或外置U盘的方式工作。
附图说明
下面结合附图和实施例对本发明的方法和装置作进一步说明:
图1是本发明的人工智能模型的训练方法的流程图;
图2-14是本发明的十三种生物标志物在不同组别的血浆样本中的相对含量分布(含量对比);
图15-34是本发明十三种优选生物标志物的各种组合用于诊断重度抑郁症和健康对照的ROC曲线图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明中部分术语含义如下:
抑郁症,是一种常见的精神障碍,涉及长时间情绪低落、失去快乐或对活动的兴趣,常常影响个体的工作、学习和社交功能。
标准品,即标准物品,为含量测定中的标准含量。标准品包括化学计量标准品和药检标准品。
质控品,是一种用于检查分析仪器或方法性能的稳定物质。质控品包括标准品和与实际样本基质相同或相似的物质。
提取液,化学试剂或含有用于定量标准品的化学试剂;用于分离目标分析物和生物基质,降低生物基质对目标分析物定量的干扰。
生物标志物,一般是指可供客观测定和评价的一个普通生理或病理或治疗过程中的某种特征性的生化指标,通过对它的测定可以获知机体当前所处的生物学过程中的进程。在本发明中,优选为与具有生物学表型的受试者相比,在具有第一表型(例如,患有疾病)的受试者或一组受试者的生物学样品中差异存在(即增加或减少)的化合物,更优选为代谢物。生物标志物优选以统计学上显著的水平有差异地存在(即,p值小于0.05,使用Welch's T检验或Wilcoxon秩和检验确定)。
“代谢物”或“小分子”是指细胞中存在的有机和无机分子。该术语不包括大分子,例如大蛋白质、大核酸或大多糖。通常在细胞质或其他细胞器(例如线粒体)的溶液中发现细胞中的小分子,在那里它们形成了一个中间体库,这些中间体可以被进一步代谢或用于生成大分子。术语“小分子”包括信号传导分子和化学反应中的中间体,这些化学反应会将食物中的能量转化为可用形式。小分子的例子包括糖、脂肪酸、氨基酸、核苷酸、细胞过程中形成的中间体以及细胞内发现的其它小分子。
特异性,在诊断疾病的医学测试中是指正确识别未患病者的能力。
敏感性,在诊断疾病的医学测试中是指正确识别疾病患者的能力。
试剂盒,用于盛放检测化学成分、药物残留、病毒种类等化学试剂的盒子,部分试剂盒还包括方便滴取样品和呈现结果的样品板。试剂盒的产生是为了使实验人员能够摆脱繁重的试剂配制及优化过程,所以试剂盒中一般配备有相应的使用说明书,用户按照说明书不需或只需少量的优化即可得到满意的结果。
本发明人在抑郁症诊断方面进行了大量的研究,且经检索发现,目前研究涉及抑郁症的代谢路线就有若干条,涉及的小分子化合物有三四千种,虽然涉及抑郁症检测诊断方法的文章、报告、专利成果很多,但是真正在临床上应用的方案却很少,目前市面上较少见到用于检测抑郁症的小分子生物标志物的试剂盒产品,且公开报道的现有技术都处于临床有待提高,无法进入实用的状态。此外,人工智能技术高速发展,与各学科的结合也取得丰硕成果,但在抑郁症检测方面,虽然存在不少利用人工智能技术进行检测的现有技术,但这些方案仍然存在诊断结果难以用于临床,难以推广使用的缺陷。在深入研究检测方法,反复优选算法模型,多方进行临床验证之后,本发明人提出了几种抑郁症检测用模型训练方法、检测系统、程序及存储介质,可以通过标准化检测手段,快捷准确的通过机器学习确诊被测试对象是否患有抑郁症,且随着数据样本的增多,特异性和准确率也逐步提高。
具体地,如图1所示,本发明公开了一种检测抑郁症的人工智能模型的训练方法,包括如下步骤:
构建人工智能模型,所述人工智能模型的输入包括预设的待检测化合物在待检测样品中的浓度,所述预设的待检测化合物选自5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸中的3-4种;所述人工智能模型的输出为待检测样品采集自的被测试者患重度抑郁症的风险指数;
采用大样本数据对所述人工智能模型进行训练,其中健康人员为正样本,重度抑郁症患者为负样本。
图2-14分别是这13种生物标志物在不同组别的血浆样本中的相对含量分布(含量对比),从图上可以看出,这些生物标志物非常有助于作为标志物来对患有重度抑郁症的患者和健康人群进行区分和检测。
其中,所述人工智能模型为向量机模型、K均值聚类模型、决策树模型、主成分分析模型或神经网络模型。作为优选,所述人工智能模型/神经网络模型例如为支持向量机分析方法、层次聚类分析或聚类分析方法(K均值聚类模型)、决策树分层算法、主成分分析方法(PCA)等,优选为神经网络模型,例如卷积神经网络模型(CNN),更优选为多层感知器(MLP)。
在一个优选实施方式中,所述人工智能模型的输入例如设定为六个参数,分别为作为一般参数的待检测样品采集自的被测试者的年龄、性别,以及作为特别参数的待检测样品中犬尿氨酸、2-吡啶甲酸、3-羟基邻氨基苯甲酸和3-羟基犬尿氨酸的浓度。
其中,所述人工智能模型的激活函数例如为Relu函数。
其中,所述人工智能模型例如采用adam机遇梯度下降法进行权重调整,以快速收敛。
本发明还公开了一种重度抑郁症检测系统,也是一种重度抑郁症的诊断系统或数据处理系统,包括:
数据处理单元,用于基于下述检测设备的检测结果,以及如上所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断待检测样品采集自的被测试者的重度抑郁症患病风险;
提取试剂组合,所述提取试剂组合包括与预先训练的人工智能模型输入匹配的作为生物标记物的待检测化合物的校准品、质控品和提取液等试剂;
检测设备,用于对经过上述提取试剂组合处理的被测试者的血浆样品进行检测,得到所述待检测化合物的浓度。
其中,所述检测设备例如是色谱、高效液相(HPLC)等手段或其组合,可以精确检测待检测化合物的含量(浓度),然后通过预先训练的人工智能模型,来判断被检测人员的重度抑郁症患病风险。
其中,所述提取试剂组合中还可以包括同位素内标,以用于质谱检测,从而可以通过质谱或色质联用来精确的检测待检测化合物的含量。
其中,上述试剂组合例如为一种试剂盒,通过套件(Kit)的方式提供给医疗诊断人员,方便其准确快捷的操作和诊断。
本发明还公开了一种可执行程序,所述可执行程序能够被计算装置所执行,实现如下方法:
输入或获取样品中待检测化合物的浓度;其中,所述待检测化合物是与预先训练的人工智能模型输入匹配的生物标记物;
基于所述待检测化合物的浓度,以及如上所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断待检测样品采集自的被测试者患重度抑郁症的风险。
其中,所述计算装置例如选自单片机、单板机、台式计算机、笔记本电脑、服务器、可编程控制器(PLC)和现场可编程门阵列(FPGA)等。该计算装置可以是检测设备的一部分,通过专门的对外接口和/或平台进行计算功能扩展;也可以是独立于检测设备,通过有线、无线、网络或存储介质等手段获取或输入检测设备的检测结果,再利用其存储的预先训练得到的人工智能模型,来计算风险指数。
本发明还公开了一种存储介质,所述存储介质上存储有如上所述的可执行程序。所述存储介质例如是软盘、固态硬盘、机械硬盘、U盘、移动硬盘、可擦写存储介质、光盘、缓存、EPPRAM,等等。
下文将通过具体实施例来对本发明作进一步阐述说明。需要注意的是,下述的实施例仅是举例说明,而不是用于限定本发明。
为了试验的方便,实施例部分将同时检测血液中5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸素等待检测化合物的含量,然后再在各个实施例中分别通过统计学分析或算法构建对应模型或拟合公式。
一、各实施例中以试剂盒作为实验药品的示例,该试剂盒包括:
(1)仪器测试用:极性封端的C18色谱柱,作为流动相添加剂A的1%甲酸(体积分数)和0.03%三氟乙酸(体积分数)的混合水溶液;作为流动相添加剂B的1%甲酸(体积分数)和90%乙腈水(体积分数)的混合溶液(1%(v/v)甲酸溶液)。
(2)样本检测用:检测血浆中5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸的试剂。
①校准品:含有5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸的混合溶液;
②质控品:含有5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸的血浆溶液;
③内标液:包含5-羟基邻氨基苯甲酸-D5、甲硫氨酸-D3、γ-氨基丁酸-D3、3,4-二羟基苯乙酸-D3、2-吡啶甲酸-D4、喹啉酸-13C315N、犬尿氨酸-13C6、5-羟色氨酸-D4、3-羟基犬尿氨酸-13C6、3-羟基邻氨基苯甲酸-D3、多巴胺-D4、去甲肾上腺素-D5、同型半胱氨酸-D4的5%甲醇水溶液;
④提取液:含质量数为2%二硫苏糖醇(DTT)、体积分数为15~30%的5-磺基水杨酸水溶液;
⑤稀释液:0.2%甲酸(体积分数)和0.006%三氟乙酸(体积分数)的混合溶液。
当然,也可以不采用试剂盒的形式,而是用自己单独购买或配制的试剂,只要能够实现本发明的目的。
二、检测流程
(1)实验对象
通过与江苏某两个有一定地理间距的市级医院合作,收集整理了如下实验数据。其中共400名受试者,年龄范围在18-66岁,其中抑郁症患者(MDD)150例,健康对照(HC)120人,受试者的详细信息见表1:
表1受试者详细信息
a:卡方检验;b:K-W检验
其中需要说明的是,由于抑郁症还是依照量表等手段进行确诊,目前没有其它仪器检测的金标准,因此对于上述抑郁症患者,只选择有明确表征的重度患者,以保证结果的准确性。在今后的研究中,再逐步进行轻度和中度患者的研究,探讨更科学、客观,能够成为金标准的检测手段。
此外,上述检测已告知采集样本的被测试者,并获得了其同意。
(2)样本收集
采集静脉血至含抗凝剂的真空采血管中。缓慢颠倒混匀,置于2~8℃,30min内完成离心分离出血浆,将血浆转移至EP管中,-80℃保存备用。
(3)样本前处理
准确吸取50μL血浆于1.5mL EP管中,加入20μL内标品,再加入8μL含2%(质量分数)DTT的30%(体积分数)的5-磺基水杨酸溶液,高频振荡5min,进行蛋白沉淀;4℃,11000rpm条件下离心10min;取50uL上清液置于96孔板中,再向各空位加入50μL 0.2%甲酸水(体积分数)和0.015%三氟乙酸(体积分数)的混合溶液,低频振荡2min,上机检测。
(4)超高效液相色谱-质谱联用检测参数设置
采用Thermofisher aQ色谱柱进行分离,柱温为35℃,进样量:5uL,;流动相A:0.0075%三氟乙酸-0.1%甲酸水;流动相B:0.1%甲酸水90%乙腈水;流动相梯度设定如下表2所示:
表2流动相梯度设置
质谱设备参数设置如表3所示:
表3质谱设备参数设置
毛细管电压 1.0kv 离子源温度 150℃
去溶剂温度 450℃ 去溶剂流量 650L/h
(5)数据分析与诊断
A.基于液相色谱串联质谱仪自带软件(如MassLynx软件),建立校准曲线,并将上机液中各化合物的相应因子代入线性方程中,输出血浆中各化合物的含量;
B.针对联合指标,将单一化合物的含量导入自建系统,根据事先构建的数据模型进行联合指标计算;
(6)实测数据
试剂用于区分健康对照组与重度抑郁;检测120例健康人群和150例重度抑郁人群血液中的生物标志物含量,进行单因素方差分析,对选定生物标志物在健康人群和重度抑郁症患者中的含量差异性进行评估;多元逻辑回归建立诊断模型,进一步进行ROC分析,以量化包含多个选定生物标志物(代谢物)的组合的诊断性能。
实施例1
本实施例公开了一种用于检测抑郁症的试剂组合,其中包括3-羟基邻氨基苯甲酸、犬尿氨酸和喹啉酸的校准品、质控品、提取液、稀释液、含有3-羟基邻氨基苯甲酸-D3犬尿氨酸-13C6、喹啉酸-13C315N的内标品、流动相添加剂。
检测人员利用上述提取试剂组合对被测试人员的血液样本进行检测,提取血液样本中的血浆,通过液相色谱串联质谱检测其中的3-羟基邻氨基苯甲酸、犬尿氨酸和喹啉酸的含量,实验结果及对于抑郁症的检测准确率、差异性等数据参见表5。
实施例2-19
实施例2-19的具体试剂组成种类、测试仪器、测试流程等同实施例1,区别仅在于其中选取的生物标志物分别如下表4中所示。
实验结果及对于抑郁症的检测准确率、差异性等数据参见表5。
表4各试验例中选定的生物标志物
表5各试验例的实验检测结果
其中:*p<0.05**p<0.01
图15-34是本发明十三种优选生物标志物的各种组合用于诊断重度抑郁症和健康对照的ROC曲线图。如图15-34及表5所示,上述实施例1-19用于说明从本发明所优选的若干生物标志物中任意选取3-4种,可获得良好特异性和敏感度,且数据是收敛的,并可通过多元一次、二次、指数等拟合公式进行很好的拟合,同样也适用通过人工智能模型来聚类/分类。
为了进一步证明本发明的优点,本发明选取上述实施例7的四种生物标志物犬尿氨酸、2-吡啶甲酸、3-羟基邻氨基苯甲酸、3-羟基犬尿氨酸,进行了人工智能模型参数的优化试验。
实施例20
1、采集患者的静脉血,并收集其年龄、性别等信息,定义为一般参数;
2、检测者对患者的血样进行处理,并通过集成化设备进行数据采集,得到4个特定指标的结果,定义为特定参数;特定指标为犬尿氨酸、2-吡啶甲酸、3-羟基邻氨基苯甲酸、3-羟基犬尿氨酸。
3、将一般参数、特定参数的数据集进行预处理,并映射到低维的隐空间向量。数据预处理包括缺失值处理和标准化处理。
(1)缺失值处理
对于缺失值,采取删除策略,保证数据的完整性;
(2)标准化(归一化)处理
对上述六个指标的数据进行标准化,将其调整至相同的尺度。
4、选择多层感知器(MLP)数据模型,参数说明和设置如下:
表6多层感知器(MLP)数据模型的参数说明和参数设置
5、对数据模型进行效果评估,计算ROC曲线AUC指标。
实施例21-25
不同实施例的区别仅在于采用的人工智能算法的不同。实施例21-25中人工智能模型的具体检测性能如下表7所示。
表7实施例21-25中人工智能模型具体检测性能
由此可见,通过选取合适的输入输出,本发明的人工智能模型可以采用多种算法类型,例如多层感知器MLP、支持向量机分析、KNN、朴素贝叶斯、logistic回归等,均能获得满意的AUC值,有望进一步用于临床检测,通过更大量的大样本数据进行训练优化。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种检测抑郁症的人工智能模型的训练方法,其特征在于,包括如下步骤:
构建人工智能模型,所述人工智能模型的输入包括选自5-羟基邻氨基苯甲酸、甲硫氨酸、γ-氨基丁酸、3,4-二羟基苯乙酸、2-吡啶甲酸、喹啉酸、犬尿氨酸、5-羟色氨酸、3-羟基犬尿氨酸、3-羟基邻氨基苯甲酸、多巴胺、去甲肾上腺素、同型半胱氨酸中的3-4种的待检测化合物在待检测样品中的浓度,所述人工智能模型的输出为待检测样品采集自的被测试者患重度抑郁症的风险评估指数;
采用大样本数据对所述人工智能模型进行训练,其中健康人员为正样本,患重度抑郁症人员为负样本。
2.根据权利要求1所述的训练方法,其特征在于,所述人工智能模型为向量机模型、K均值聚类模型、决策树模型、主成分分析模型或神经网络模型。
3.根据权利要求2所述的训练方法,其特征在于,所述人工智能模型为卷积神经网络模型或多层感知器模型。
4.根据权利要求3所述的训练方法,其特征在于,所述所述人工智能模型的输入为待检测样品采集自的被测试者的年龄、性别,以及待检测样品中犬尿氨酸、2-吡啶甲酸、3-羟基邻氨基苯甲酸和3-羟基犬尿氨酸的浓度;和/或
所述人工智能模型的激活函数为Relu函数;和/或
所述人工智能模型采用adam机遇梯度下降法进行权重调整。
5.一种重度抑郁症检测系统,其特征在于,包括:
数据处理单元,用于基于检测设备的检测结果,以及如权利要求1-4任一项所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断待测试样品采集自的被测试者的重度抑郁症患病风险;
提取试剂组合,所述提取试剂组合包括与预先训练的人工智能模型输入匹配的作为生物标记物的待检测化合物的校准品、质控品和提取液;
检测设备,用于对经过上述提取试剂组合处理的被测试者的样品进行检测,得到所述待检测化合物的浓度。
6.根据权利要求5所述的重度抑郁症检测系统,其特征在于,所述提取试剂组合中还包括同位素内标,以用于质谱检测;和/或
所述提取试剂组合为试剂盒。
7.根据权利要求5所述的重度抑郁症检测系统,其特征在于,所述检测设备为色谱、高效液相、质谱或色质联用检测设备。
8.一种可执行程序,其特征在于,所述可执行程序能够被计算装置所执行,实现如下方法:
输入或获取样品中待检测化合物的浓度;其中,所述待检测化合物是与预先训练的人工智能模型输入匹配的生物标记物;
基于所述待检测化合物的浓度,以及如权利要求1-4任一项所述的检测抑郁症的人工智能模型的训练方法训练得到的人工智能模型,判断所述样品采集自的被测试者患重度抑郁症的风险。
9.根据权利要求8所述的可执行程序,其特征在于,所述计算装置选自单片机、单板机、台式计算机、笔记本电脑、服务器、可编程控制器和现场可编程门阵列。
10.一种存储介质,其特征在于,所述存储介质上存储有如权利要求8或9所述的可执行程序。
CN202410430169.4A 2024-04-10 2024-04-10 抑郁症检测用模型训练方法、检测系统、程序及存储介质 Pending CN118230955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410430169.4A CN118230955A (zh) 2024-04-10 2024-04-10 抑郁症检测用模型训练方法、检测系统、程序及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410430169.4A CN118230955A (zh) 2024-04-10 2024-04-10 抑郁症检测用模型训练方法、检测系统、程序及存储介质

Publications (1)

Publication Number Publication Date
CN118230955A true CN118230955A (zh) 2024-06-21

Family

ID=91512618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410430169.4A Pending CN118230955A (zh) 2024-04-10 2024-04-10 抑郁症检测用模型训练方法、检测系统、程序及存储介质

Country Status (1)

Country Link
CN (1) CN118230955A (zh)

Similar Documents

Publication Publication Date Title
Ahmed et al. Exhaled volatile organic compounds of infection: a systematic review
CN105209909B (zh) 与肾功能相关的生物标记及其使用方法
Snowden et al. Application of metabolomics approaches to the study of respiratory diseases
JP2009505231A (ja) 複数のサンプルから得られる代謝物のデータを、コンピュータシステムのデータベースを用いて比較および編集するためのシステム、方法、ならびにコンピュータプログラム
EP3786305A1 (en) Biomarker for depression and use thereof
CN112183616A (zh) 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法
AU2020100617A4 (en) Non-invasive biomarkers for identification/prewarning of dairy cows with fatty liver disease
CN111983098B (zh) 一种肠道微生物代谢物在制备自闭症诊断试剂盒中的用途
CN116559343A (zh) 一种肺结核尿液代谢标志物的筛选及应用
CN118230955A (zh) 抑郁症检测用模型训练方法、检测系统、程序及存储介质
CN115440375A (zh) 一种结直肠癌预测系统及其应用
CN111537629B (zh) 用于检测活动性肺结核的粪便中脂质及其检测系统
KR101552011B1 (ko) 리소포스파티딜콜린 및 호모시스테인산을 포함하는 난소암 진단용 조성물 및 이를 사용하여 난소암을 진단하는 방법
CN118226044A (zh) 能够判断类型的抑郁症检测试剂组合、检测系统及应用
Xu et al. A prospective study on peptide mapping of human fatigue saliva markers based on magnetic beads
CN118566488A (zh) 抑郁症检测用试剂组合、制造方法、检测系统及其应用
CN118294676A (zh) 基于关键标志物的抑郁症检测试剂、检测系统及其应用
KR102519775B1 (ko) 류마티스 관절염의 질병활성도 평가용 바이오마커
US20230402131A1 (en) Biomarker and diagnosis system for colorectal cancer detection
CN111650287B (zh) 用于检测活动性肺结核的粪便中小肽及其检测系统
EP2730922B1 (en) Method and system for detecting lymphosarcoma in cats using biomarkers
Lawson et al. Breath biopsy OMNI: Advanced global breath VOC Analysis
CN118243819A (zh) 与妊娠期糖尿病辅助早期诊断相关的血清/血浆代谢分子标志物及其应用
CN114252608A (zh) 尿液δ-氨基乙酰丙酸脱水酶及其多肽片段在过敏性疾病中的应用
CN114252626A (zh) 尿液粘连蛋白-1及其多肽片段在过敏性疾病中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination