CN117831756A - 一种认知障碍的辅助分析方法、装置、设备及存储介质 - Google Patents

一种认知障碍的辅助分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117831756A
CN117831756A CN202410245623.9A CN202410245623A CN117831756A CN 117831756 A CN117831756 A CN 117831756A CN 202410245623 A CN202410245623 A CN 202410245623A CN 117831756 A CN117831756 A CN 117831756A
Authority
CN
China
Prior art keywords
compound
signal
spectrogram
peak
expiratory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410245623.9A
Other languages
English (en)
Other versions
CN117831756B (zh
Inventor
张晗
陈思彤
耿茜
王俊奇
林雨航
樊鹏南
刘付春维
宋梦昀
陈蕾
赖婉琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingzhi Future Guangzhou Intelligent Technology Co ltd
Original Assignee
Jingzhi Future Guangzhou Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingzhi Future Guangzhou Intelligent Technology Co ltd filed Critical Jingzhi Future Guangzhou Intelligent Technology Co ltd
Priority to CN202410245623.9A priority Critical patent/CN117831756B/zh
Priority claimed from CN202410245623.9A external-priority patent/CN117831756B/zh
Publication of CN117831756A publication Critical patent/CN117831756A/zh
Application granted granted Critical
Publication of CN117831756B publication Critical patent/CN117831756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本申请公开了一种认知障碍的辅助分析方法、装置、设备及存储介质,方法通过获取认知障碍对象以及健康对象的呼气数据,以此作为训练样本,在对模型训练的过程中,以目标标志物集合中的所有化合物作为模型预测分析的因素,训练得到认知障碍预测模型。其中,目标标志物集合中的每种标志物与认知障碍具有强相关性,当获取到目标对象的呼气时,将呼气输入认知障碍预测模型,输出目标对象是否为认知障碍。可见,通过采集呼气的方式进行认知障碍分析,能够快速获取目标对象的认知障碍分析结果,由于具体进行分析的每种标志物与认知障碍具有强相关性,保证了认知障碍分析结果的准确性和可靠性,从而高效辅助医生判断待分析对象是否具有认知障碍。

Description

一种认知障碍的辅助分析方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,更具体地说,是涉及一种认知障碍的辅助分析方法、装置、设备及存储介质。
背景技术
认知是机体认识和获取知识的智能加工过程,涉及学习、记忆、语言、思维、精神、情感等一系列随意、心理和社会行为。认知障碍指与上述学习记忆以及思维判断有关的大脑高级智能加工过程出现异常,从而引起加重学习、记忆障碍,同时伴有失语或失用或失认或失行等改变的病理过程。
目前的认知障碍诊断方法存在诸多缺点和挑战,严重限制了认知障碍的筛查的准确性和可靠性,主要表现在医生主观性判断的不够准确可靠,早期认知障碍不明显的诊断困难,临床测试无法全面评估认知功能的复杂性,以及长期随访需要花费大量时间和资源。
呼气诊断是一种通过分析呼气气体中的化学成分来诊断疾病的方法。呼出气体不仅容易获取且无创,呼出气体中的挥发性有机化合物VOC(volatile organic compound)是一种新型生物标志物,能用作疾病预测和辅助分析。
如何对测试对象的呼气中的化合物成分进行分析,给出测试对象关于认知障碍的分析结果,以辅助医生判断,是需要关注的问题。
发明内容
鉴于上述问题,本申请提供了一种认知障碍的辅助分析方法、装置、设备及存储介质,以对测试对象的呼气中的化合物成分进行分析,给出测试对象关于认知障碍的分析结果,从而辅助医生判断。
为了实现上述目的,现提出具体方案如下:
一种认知障碍的辅助分析方法,包括:
获取目标对象的呼气;
将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
所述认知障碍预测模型的建立过程,包括:
获取认知障碍对象呼气数据以及健康对象呼气数据;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可选的,以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型,包括:
在基础模型以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素进行训练的过程中,通过网格搜索结合交叉验证,确定所述基础模型的最佳参数组合;
通过支持向量机SVM算法结合网格搜索,确定所述最佳参数组合中的最佳模型参数;
在所述最佳模型参数下对所述基础模型进行训练,得到认知障碍预测模型。
可选的,该方法还包括:
基于所述认知障碍对象呼气数据以及所述健康对象呼气数据,构建训练测试样本集,所述训练测试样本集包括第一预设比例的训练样本集,以及第二预设比例的测试样本集,所述第一预设比例大于所述第二预设比例;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型,包括:
在所述训练样本集下以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型;
该方法还包括:
利用所述测试样本集对所述认知障碍预测模型进行性能评估。
可选的,所述目标标志物集合为包括有预设数量的化合物的组合,所述组合中的每种化合物均从预先构建的差异标志物集合中选取;
所述差异标志物集合包括2-甲基戊烷、乙酸乙酯、1,2-二氯丙烷、甲基丙基硫醚、2,4,4-三甲基-2-戊烯、3-乙基己烷、Z-1-甲硫基-1-丙烯、甲苯、对二甲苯、顺-2-壬烯、壬烷、丙基苯、苯甲醛、苯甲腈、己酸乙酯、1,4-桉叶素、邻异丙基甲苯、对异丙基甲苯、4,5-二甲基壬烷、4-甲基癸烷、4-异丙烯基甲苯、2,3-二甲基癸烷、十一烷、2,4,6-三甲基癸烷以及1,2,4,5-四甲苯。
可选的,所述差异标志物集合的构建过程,包括:
获取健康对象的呼气和认知障碍对象的呼气;
通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图;
针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图;
计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,将标准化后的呼气化合物谱图中FDR值小于预设FDR阈值且VIP值大于预设VIP阈值的化合物峰对应的化合物确定为差异标志物,并组合各个差异标志物得到差异标志物集合。
可选的,计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,包括:
针对所述标准化后的呼气化合物谱图中的每个化合物峰,通过将所述化合物峰在标准化后的第一呼气化合物谱图中的峰值,与所述化合物峰在标准化后的第二呼气化合物谱图中的峰值进行对比,确定所述化合物峰的p值以及VIP值,并对该p值转换得到所述化合物峰的FDR值。
可选的,所述通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图,包括:
通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一化合物谱图信号,以及所述认知障碍对象的第二化合物谱图信号;
去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号;
对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号;
基于所述基线校准后的第一化合物谱图信号,绘制所述健康对象的第一呼气化合物谱图,并基于所述基线校准后的第二化合物谱图信号,绘制所述认知障碍对象的第二呼气化合物谱图。
可选的,去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号,包括:
针对所述第一化合物谱图信号和所述第二化合物谱图信号中的每个化合物谱图信号,若所述化合物谱图信号中存在目标信号点,将所述目标信号点的两个相邻信号点的信号均值代替所述目标信号点的信号值,以获得噪声去除后的化合物谱图信号,所述目标信号点的信号值大于所述目标信号点的任意相邻信号点的信号值的预设信号比率。
可选的,所述对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号,包括:
针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,选择所述化合物谱图信号中的非峰位置的信号,并基于所述非峰位置的信号点,利用下式构建所述化合物谱图信号的基线校准曲线:
其中,为所述化合物谱图信号的基线值随时间t变化的基线校准曲线,/>为所述基线校准曲线的多项式最高阶数,/>为第n系数,/>为通过最小二乘法对所述化合物谱图信号拟合得出;
针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,将所述化合物谱图信号减去其基线校准曲线,得到基线校准后的化合物谱图信号。
可选的,所述针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图,包括:
针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理和峰剔除处理,得到峰剔除处理后的呼气化合物谱图;
针对所述峰剔除处理后的第一呼气化合物谱图和所述峰剔除处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图的各个样本缺失化合物峰进行填充,得到峰填充处理后的呼气化合物谱图,每个样本缺失化合物峰在至少一个样本中的峰面积值为0;
针对所述峰填充处理后的第一呼气化合物谱图和所述峰填充处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行Z-score处理,得到标准化的呼气化合物谱图。
一种认知障碍的辅助分析装置,包括:
呼气获取单元,用于获取目标对象的呼气;
认知障碍测评单元,用于将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
呼气数据获取单元,用于获取认知障碍对象呼气数据以及健康对象呼气数据;
模型训练单元,用于以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可选的,所述模型训练单元,包括:
最佳参数组合确定单元,用于在基础模型以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素进行训练的过程中,通过网格搜索结合交叉验证,确定所述基础模型的最佳参数组合;
最佳模型参数确定单元,用于通过支持向量机SVM算法结合网格搜索,确定所述最佳参数组合中的最佳模型参数;
训练单元,用于在所述最佳模型参数下对所述基础模型进行训练,得到认知障碍预测模型。
可选的,该装置还包括:
训练测试样本集构建单元,用于基于所述认知障碍对象呼气数据以及所述健康对象呼气数据,构建训练测试样本集,所述训练测试样本集包括第一预设比例的训练样本集,以及第二预设比例的测试样本集,所述第一预设比例大于所述第二预设比例;
所述模型训练单元,包括:
训练样本集训练单元,用于在所述训练样本集下以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型;
该装置还包括:
评估单元,用于利用所述测试样本集对所述认知障碍预测模型进行性能评估。
可选的,所述目标标志物集合为包括有预设数量的化合物的组合,所述组合中的每种化合物均从预先构建的差异标志物集合中选取;
所述差异标志物集合包括2-甲基戊烷、乙酸乙酯、1,2-二氯丙烷、甲基丙基硫醚、2,4,4-三甲基-2-戊烯、3-乙基己烷、Z-1-甲硫基-1-丙烯、甲苯、对二甲苯、顺-2-壬烯、壬烷、丙基苯、苯甲醛、苯甲腈、己酸乙酯、1,4-桉叶素、邻异丙基甲苯、对异丙基甲苯、4,5-二甲基壬烷、4-甲基癸烷、4-异丙烯基甲苯、2,3-二甲基癸烷、十一烷、2,4,6-三甲基癸烷以及1,2,4,5-四甲苯。
可选的,该装置还包括:
呼气采集单元,用于获取健康对象的呼气和认知障碍对象的呼气;
谱图获取单元,用于通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图;
谱图处理单元,用于针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图;
统计分析值计算单元,用于计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,将标准化后的呼气化合物谱图中FDR值小于预设FDR阈值且VIP值大于预设VIP阈值的化合物峰对应的化合物确定为差异标志物,并组合各个差异标志物得到差异标志物集合。
可选的,所述统计分析值计算单元,包括:
统计分析值计算子单元,用于针对所述标准化后的呼气化合物谱图中的每个化合物峰,通过将所述化合物峰在标准化后的第一呼气化合物谱图中的峰值,与所述化合物峰在标准化后的第二呼气化合物谱图中的峰值进行对比,确定所述化合物峰的p值以及VIP值,并对该p值转换得到所述化合物峰的FDR值。
可选的,所述谱图获取单元,包括:
谱图信号获取单元,用于通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一化合物谱图信号,以及所述认知障碍对象的第二化合物谱图信号;
谱图信号去噪单元,用于去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号;
谱图信号基线校准单元,用于对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号;
谱图绘制单元,用于基于所述基线校准后的第一化合物谱图信号,绘制所述健康对象的第一呼气化合物谱图,并基于所述基线校准后的第二化合物谱图信号,绘制所述认知障碍对象的第二呼气化合物谱图。
可选的,所述谱图信号去噪单元,包括:
谱图信号去噪子单元,用于针对所述第一化合物谱图信号和所述第二化合物谱图信号中的每个化合物谱图信号,若所述化合物谱图信号中存在目标信号点,将所述目标信号点的两个相邻信号点的信号均值代替所述目标信号点的信号值,以获得噪声去除后的化合物谱图信号,所述目标信号点的信号值大于所述目标信号点的任意相邻信号点的信号值的预设信号比率。
可选的,所述谱图信号基线校准单元,包括:
基线校准曲线构建单元,用于针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,选择所述化合物谱图信号中的非峰位置的信号,并基于所述非峰位置的信号点,利用下式构建所述化合物谱图信号的基线校准曲线:
其中,为所述化合物谱图信号的基线值随时间t变化的基线校准曲线,/>为所述基线校准曲线的多项式最高阶数,/>为第n系数,/>为通过最小二乘法对所述化合物谱图信号拟合得出;
校准单元,用于针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,将所述化合物谱图信号减去其基线校准曲线,得到基线校准后的化合物谱图信号。
可选的,所述谱图处理单元,包括:
第一谱图处理子单元,用于针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理和峰剔除处理,得到峰剔除处理后的呼气化合物谱图;
第二谱图处理子单元,用于针对所述峰剔除处理后的第一呼气化合物谱图和所述峰剔除处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图的各个样本缺失化合物峰进行填充,得到峰填充处理后的呼气化合物谱图,每个样本缺失化合物峰在至少一个样本中的峰面积值为0;
第三谱图处理子单元,用于针对所述峰填充处理后的第一呼气化合物谱图和所述峰填充处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行Z-score处理,得到标准化的呼气化合物谱图。
一种认知障碍的辅助分析设备,其包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上所述的认知障碍的辅助分析方法的各个步骤。
一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的认知障碍的辅助分析方法的各个步骤。
借由上述技术方案,本申请通过获取认知障碍对象以及健康对象的呼气数据,以此作为训练样本,在对模型训练的过程中,以目标标志物集合中的所有化合物作为模型预测分析的因素,从而训练得到认知障碍预测模型,其中,目标标志物集合中的每种标志物与认知障碍具有强相关性,当获取到目标对象的呼气时,将呼气输入至认知障碍预测模型,输出目标对象是否为认知障碍。由此可见,通过采集呼气的方式进行认知障碍分析,能够快速获取目标对象的认知障碍分析结果,由于具体进行分析的每种标志物与认知障碍具有强相关性,保证了认知障碍分析结果的准确性和可靠性,从而高效辅助医生判断待分析对象是否具有认知障碍。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的实现认知障碍辅助分析的一种流程示意图;
图2为本申请实施例提供的实现建立认知障碍预测模型的一种流程示意图;
图3为本申请实施例提供的实现构建差异标志物集合的一种流程示意图;
图4为本申请实施例提供的一种OPLS-DA的分散点图;
图5为本申请实施例提供的一种AUC排序前9个的VOC差异箱型图;
图6为本申请实施例提供的一种最佳性能的认知障碍预测模型的ROC曲线图;
图7为本申请实施例提供的一种谱图数据被校正后的示意图;
图8为本申请实施例提供的一种实现认知障碍辅助分析的装置结构示意图;
图9为本申请实施例提供的一种实现认知障碍辅助分析的设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请方案可以基于具备数据处理能力的终端实现,该终端可以是认知障碍辅助分析系统,认知障碍辅助分析系统可以配备有呼气采集装置。
接下来,结合图1所示,本申请的认知障碍的辅助分析方法可以包括以下步骤:
步骤S110、获取目标对象的呼气。
具体的,认知障碍辅助分析系统可以通过呼气采集装置采集目标对象的呼气。目标对象可以对准呼气采集装置呼气,使得呼气被认知障碍辅助分析系统所采集。
步骤S120、将呼气输入至预先建立的认知障碍预测模型,输出目标对象的认知障碍测评结果。
具体的,预先建立的认知障碍预测模型是预先配置在认知障碍辅助分析系统内,认知障碍预测模型能够根据呼气中的若干个挥发性有机化合物VOC(volatile organiccompound)综合分析,输出是否具备认知障碍的测评结果。
其中,所进行综合分析的各个VOC均与认知障碍具有强相关性,因此可以综合分析各个VOC的指标值,来评估目标对象是否患有认知障碍。
进一步的,如图2所示,认知障碍预测模型的建立过程可以包括以下步骤:
步骤S210、获取认知障碍对象呼气数据以及健康对象呼气数据。
可以理解的是,预测模型需要利用认知障碍患者和健康人之间的差异VOC分子作为特征,通过分析呼气样本中这些差异的存在与程度,来预测个体是否患有认知障碍,因此需要获取认知障碍对象呼气数据以及健康对象呼气数据作为模型训练的样本。
步骤S220、以认知障碍对象呼气数据和健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
其中,基础模型可以是能够用于机器学习的智能模型。
具体的,目标标志物集合可以是包括有预设数量的化合物的组合,预设数量可以自定义,如5、10、15、20、25等。其中组合中的每种化合物均从预先构建的差异标志物集合中选取。
更具体的,差异标志物集合可以包括2-甲基戊烷、乙酸乙酯、1,2-二氯丙烷、甲基丙基硫醚、2,4,4-三甲基-2-戊烯、3-乙基己烷、Z-1-甲硫基-1-丙烯、甲苯、对二甲苯、顺-2-壬烯、壬烷、丙基苯、苯甲醛、苯甲腈、己酸乙酯、1,4-桉叶素、邻异丙基甲苯、对异丙基甲苯、4,5-二甲基壬烷、4-甲基癸烷、4-异丙烯基甲苯、2,3-二甲基癸烷、十一烷、2,4,6-三甲基癸烷以及1,2,4,5-四甲苯。
可以理解的是,差异标志物集合中的每种化合物均与认知障碍具有强相关性,而目标标志物集合为差异标志物集合的子集,那么目标标志物集合的每种化合物也均与认知障碍具有强相关性,因此认知障碍预测模型基于目标标志物集合进行认知障碍预测分析,所得到的结果更具备准确性和可靠性。
本实施例提供的认知障碍的辅助分析方法,通过获取认知障碍对象以及健康对象的呼气数据,以此作为训练样本,在对模型训练的过程中,以目标标志物集合中的所有化合物作为模型预测分析的因素,从而训练得到认知障碍预测模型,其中,目标标志物集合中的每种标志物与认知障碍具有强相关性,当获取到目标对象的呼气时,将呼气输入至认知障碍预测模型,输出目标对象是否为认知障碍。由此可见,通过采集呼气的方式进行认知障碍分析,能够快速获取目标对象的认知障碍分析结果,由于具体进行分析的每种标志物与认知障碍具有强相关性,保证了认知障碍分析结果的准确性和可靠性,从而高效辅助医生判断待分析对象是否具有认知障碍。
本申请的一些实施例中,对上述步骤S220、以认知障碍对象呼气数据和健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型的过程进行介绍,该过程可以包括:
S1、在基础模型以认知障碍对象呼气数据和健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素进行训练的过程中,通过网格搜索结合交叉验证,确定基础模型的最佳参数组合。
可以理解的是,基础模型在机器学习的过程中,模型性能往往受到不同参数的影响,在此基础上可以使用网格搜索结合交叉验证,从而可以更系统地搜索参数空间,以找到最佳的参数组合,从而提高模型的性能。
S2、通过支持向量机SVM算法结合网格搜索,确定最佳参数组合中的最佳模型参数。
S3、在最佳模型参数下对基础模型进行训练,得到认知障碍预测模型。
本实施例提供的认知障碍的辅助分析方法,通过网格搜索结合交叉验证搜索参数空间,以找到最佳参数组合,并进一步搜索得到最佳模型参数,能够使基础模型进行更好的训练,训练所得到的认知障碍预测模型的预测功能更准确。
考虑到对训练好的认知障碍预测模型进行评估验证,以便进一步优化认知障碍预测模型,本申请的一些实施例中,可以将认知障碍对象呼气数据和健康对象呼气数据划分为训练集和测试集,通过训练集进行模型训练并利用测试集对模型进行指标评价,具体过程可以包括:
基于认知障碍对象呼气数据以及健康对象呼气数据,构建训练测试样本集。
其中,训练测试样本集包括第一预设比例的训练样本集,以及第二预设比例的测试样本集,第一预设比例大于第二预设比例。如训练样本集与测试样本集的比例为7:3。
进一步的,对上述实施例的步骤S220、以认知障碍对象呼气数据和健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型进行进一步介绍,该步骤可以包括:
在训练样本集下以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可以理解的是,由于认知障碍对象呼气数据和健康对象呼气数据中部分作为训练集,部分作为测试集,因此在训练过程中认知障碍对象呼气数据和健康对象呼气数据可以不全为训练样本。
更进一步地,可以利用测试样本集对认知障碍预测模型进行性能评估。
具体的,可以将受试者工作特征ROC(Receiver Operating Characteristic)曲线的曲线下方面积AUC(Area Under Curve)作为指标进行性能评估,也可以将准确度、敏感性和特异性作为指标进行性能评估。
本实施例提供的认知障碍的辅助分析方法,通过将认知障碍对象呼气数据以及健康对象呼气数据划分为样本集和测试集,能够通过测试集对认知障碍预测模型进行评估验证,以便进一步优化认知障碍预测模型。
本申请的一些实施例中,对前述实施例提到的差异标志物集合的构建过程进行介绍,如图3所示,该构建过程可以包括:
步骤S310、获取健康对象的呼气和认知障碍对象的呼气。
具体的,健康对象可以表示未患有认知障碍的对象。可以通过呼气采集装置对预先确定为健康状态的对象采集呼气,以及对预先确定为患有认知障碍的对象采集呼气。
步骤S320、通过气相色谱仪联用质谱对健康对象的呼气以及认知障碍对象的呼气进行检测,获得健康对象的第一呼气化合物谱图以及认知障碍对象的第二呼气化合物谱图。
步骤S330、针对第一呼气化合物谱图和第二呼气化合物谱图中的每个呼气化合物谱图,对呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图。
具体地,在对所述呼气化合物谱图进行归一化处理和峰剔除处理的过程中,对呼气化合物谱图进行归一化处理的过程可以为:
通过分析呼气化合物谱图中的峰形状、峰高度、峰面积等特征,确定样品中存在的化合物及其相对含量。其中,峰处理可以包括识别、拟合、提取。
以样本为维度,对各个VOC进行峰面积归一化处理,将峰面积转为相对含量值,从而得到归一化处理后的呼气化合物谱图。归一化公式为:
其中,可以表示第i个VOC的峰面积,/>可以表示第i个VOC的峰面积占总峰面积的比例,/>为所有VOC的数量。
进一步的,可以使用质谱信息对照表查找保留时间的对应代谢物信息,完成VOC的定性分析,定性完成后,使用KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库查询这些代谢物的常见数据库名称、分类信息、参与通路等注释信息。
对归一化处理后的呼气化合物谱图进行峰剔除处理的过程可以为:
将呼气化合物谱图中,化合物峰面积在大部分样本中缺失的化合物峰剔除,得到峰剔除处理后的呼气化合物谱图。
具体的,可以设置预设阈值缺失比例,将化合物峰面积在大于总样本的预设阈值缺失比例的化合物峰剔除。
可以理解的是,由于受试者和采样环境的差异,导致每个样本检出的代谢物峰也存在差异,部分化合物/代谢物会因为其浓度过低或受背景噪声干扰严重而未能被算法识别,最终导致其峰面积为零。这类峰只在少部分样本中有面积数值,大部分样本数值缺失。当该峰的值在大部分样本缺失时,会导致数据分析方法有误差或失效,因此需要将此类峰剔除。
对峰剔除处理后的呼气化合物谱图进行峰填充处理的过程可以为:
对呼气化合物谱图的各个样本缺失化合物峰进行填充,得到峰填充处理后的呼气化合物谱图。
其中,每个样本缺失化合物峰在至少一个样本中的峰面积值为0,但缺失数量不超过总样本的预设阈值缺失比例。
可以理解的是,尽管剔除了缺失值较多的峰,保留的峰仍然会存在部分缺失值,需要对缺失值进行填充,否则会影响到后续分析结果的准确性。具体可以使用组内非0最小值的1/2对缺失值进行填充,保证组间的差异。
对峰填充处理后的呼气化合物谱图进行Z-score处理的过程可以为:
在峰维度上对数据进行Z-score处理,使数据映射到标准正态分布上,即均值为0,标准差为1,目的是在后续建模过程中,使每个峰的权重一致,消除数值量级带来的偏差。
其中,Z-score公式为:
其中,表示数据均值,/>表示数据标准差,/>在峰填充处理后的第i个VOC的峰面积,/>表示在特征维度进行Z-score后的VOC的峰面积。
步骤S340、计算标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,将标准化后的呼气化合物谱图中FDR值小于预设FDR阈值且VIP值大于预设VIP阈值的化合物峰对应的化合物确定为差异标志物,并组合各个差异标志物得到差异标志物集合。
具体的,针对标准化后的呼气化合物谱图中的每个化合物峰,通过将化合物峰在标准化后的第一呼气化合物谱图中的峰值,与化合物峰在标准化后的第二呼气化合物谱图中的峰值进行对比,确定所述化合物峰的p值以及VIP值,并对该p值转换得到化合物峰的FDR值。
可以理解的是,VOC矩阵数据是连续数值型,数据分布随机。通过混合使用独立T检验(Independent T-Test)和秩和检验(Rank Sum Test)进行单变量分析,具体为若代谢物的数据满足正态分布,则使用独立T检验计算p值(P value),反之则使用秩和检验。进一步的,通过使用BH(Benjamini-Hochberg)法将P值转换成FDR,利用FDR来降低假阳性差异代谢物。
其中,BH法的FDR计算方式如下式表示:
其中,为检验的次数,/>为当前次检验的p值在所有检验中的排名。
在计算VIP值的过程中,可以使用OPLS-DA(Orthogonal Projections to LatentStructures Discriminant Analysis)对数据进行多变量分析,并使用OPLS-DA得分散点图直观展示两组的区分度,OPLS-DA得分散点图如图4所示。
使用OPLS建立一个回归模型,将X和Y之间的线性关系建模,X表示VOC特征矩阵,矩阵的行代表样本,矩阵的列代表VOC,Y代表分类结果。在OPLS模型中,使用特征提取的方式,将X和Y投影到主成分和残差空间。OPLS的目标是从X中提取主要的相关性信息,并将其与不相关的信息进行分离。使用正交分解,将OPLS模型扩展到分类问题,通过引入类别信息,将模型转化为判别模型。
其中,X的矩阵分解为:
其中,X为预测变量,T为X的得分矩阵,为X的载荷矩阵,F为X的残差矩阵。
Y的矩阵分解为:
其中,Y为预测变量,T为X的得分矩阵,为Y的载荷矩阵,G为Y的残差矩阵。
正交化处理提取主要相关信息:
其中,为X的正交化得分矩阵,/>为Y的正交化得分矩阵。
OPLS-DA的判别模型为:
其中,为Y的正交化得分矩阵,X为输入变量矩阵,B为回归系数,表示预测模型的权重系数矩阵,E为残差矩阵。
进一步的,使用单变量分析产生的FDR和多变量分析产生的VIP值进行差异代谢物筛选。
其中,VIP值的计算公式为:
其中,表示第j个预测变量的VIP值,/>为化合物的数量,/>为第i个化合物的权重,权重/>来自于权重系数矩阵B,/>表示第i个化合物中第j个预测变量的系数。
更进一步地,在计算每个化合物峰的FDR值和VIP之后,可以通过设置FDR阈值和VIP阈值进行差异标志物的确定。
具体的,预设FDR阈值与预设VIP阈值均可以自定义,如预设FDR阈值为0.05,预设VIP阈值为1,那么FDR值小于0.05且VIP值大于1的所有化合物可以确定为差异标志物。
筛选所得到基于认知障碍的呼气中的差异标志物如下表所示:
由上表可见,基于认知障碍对象和健康对象的呼气,成功得到25个潜在的差异标志物,统计分析发现这些VOCs在认知障碍对象和健康对象之间存在显著差异(FDR<0.05),差异化水平可以是增加水平、减少水平,或与对照相比缺乏VOC,部分VOC的差异水平如图5所示。
这些VOC主要可以分为几大类,包括烷烃类、芳香烃类、有机硫化物、酮类和醛类等。其中烷烃类占比最高,包含2-甲基戊烷、3-乙基己烷等。芳香烃类占比其次,包含甲苯、对二甲苯、丙基苯、邻异丙基甲苯、对异丙基甲苯等。此外还有少量的酮类1,4-桉叶素、醛类苯甲醛、有机硫类甲基丙基硫醚和Z-1-甲硫基-1-丙烯和其他类型的化合物,如1,2-二氯丙烷、苯甲腈和乙酸乙酯等。
值得注意的是,一组VOC分子在认知障碍对象中的浓度明显高于健康对象,这些VOC分子包括对二甲苯、顺-2-壬烯、苯甲腈和对异丙基甲苯等,该结果表明认知障碍对象中某些代谢通路改变导致这些VOC分子在人体内的浓度升高。与此同时,另一组VOC分子,在认知障碍对象中的浓度明显低于健康人群,这些VOC分子包括Z-1-甲硫基-1-丙烯、壬烷、4-异丙烯基甲苯等,该结果表明认知障碍对象中某些代谢通路改变导致这些VOC分子在人体内的浓度降低。
进一步的数据分析显示,这些VOC分子的浓度与认知障碍的严重程度之间存在相关性。特别是,对二甲苯和苯甲腈的浓度与认知障碍的严重程度呈正相关,而Z-1-甲硫基-1-丙烯和壬烷的浓度与认知障碍的严重程度呈负相关。
以上研究结果表明,呼气中的VOC分子在认知障碍的发生和发展中能作为生物标志物去预测认知障碍的发生和严重程度。
本实施例提供的认知障碍的辅助分析方法,在认知障碍对象和健康对象中,以统计分析的方式筛选出与认知障碍存在强相关性的各种差异标志物,并组合得到差异标志物集合,以便于认知障碍预测模型的构建。
本申请的一些实施例中,对前述实施例提到的目标标志物集合中每种化合物的选取方式进行介绍,具体的可以结合前述实施例给到的25种差异标志物的表格,可以对25种差异标志物按照FDR值从小到大进行排序,选择前5种差异标志物构建目标标志物集合,或选择前10种差异标志物构建目标标志物集合,或选择前15种差异标志物构建目标标志物集合,或选择前20种差异标志物构建目标标志物集合,或选择前25种差异标志物构建目标标志物集合。
进一步的,针对由不同差异标志物所构成的目标标志物集合,利用测试样本集对各自构建的认知障碍预测模型进行性能评估。其中性能最优的认知障碍预测模型的ROC曲线如图6所示,AUC达到了85%,敏感性为82%,特异性为69%。各个目标标志物集合对应训练得到的认知障碍预测模型的各个性能指标如下表所示:
本申请的一些实施例中,对上述步骤S320、通过气相色谱仪联用质谱对健康对象的呼气以及认知障碍对象的呼气进行检测,获得健康对象的第一呼气化合物谱图以及认知障碍对象的第二呼气化合物谱图的过程进行介绍,该过程可以包括:
S1、通过气相色谱仪联用质谱对健康对象的呼气以及认知障碍对象的呼气进行检测,获得健康对象的第一化合物谱图信号,以及认知障碍对象的第二化合物谱图信号。
S2、去除第一化合物谱图信号和第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号。
可以理解的是,为了降低仪器检测波动、环境干扰和人为误差对谱图的影响,提高数据分析结果的稳定性与有效性,在开始数据分析之前可以对谱图数据进行预处理,预处理的过程可以包括噪声去除和基线校正。
具体的,针对第一化合物谱图信号和第二化合物谱图信号中的每个化合物谱图信号,若化合物谱图信号中存在目标信号点,将目标信号点的两个相邻信号点的信号均值代替所述目标信号点的信号值,以获得噪声去除后的化合物谱图信号。
其中,目标信号点的信号值大于目标信号点的任意相邻信号点的信号值的预设信号比率。
可以理解的是,化合物谱图信号中存在Spike,Spike表示噪声引起的突出尖峰,在谱图信号上表现为连续三个点形成一个形如三角的尖峰,因此可以设定一个阈值ratio,作为预设信号比率,当检测到某个点的信号值大于相邻两点信号值的ratio倍时,则认为该点是采样噪声,使用相邻两点信号的均值替代该异常点,即可消除Spike。
S3、对噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号。
可以理解的是,受仪器本身影响,谱图数据中的基线值通常会逐渐偏离0,使峰的检测及定量过程被影响,那么基线漂移可以进行拟合,并用拟合得到的曲线进行校准。
具体的,化合物谱图信号的基线校准过程可以包括:
S31、针对噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,选择化合物谱图信号中的非峰位置的信号,并基于非峰位置的信号点,利用下式构建化合物谱图信号的基线校准曲线:
其中,为化合物谱图信号的基线值随时间t变化的基线校准曲线,为基线校准曲线的多项式最高阶数,/>为第n系数,/>可以通过最小二乘法对化合物谱图信号拟合得出。
S32、针对噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,将化合物谱图信号减去其基线校准曲线,得到基线校准后的化合物谱图信号。
S4、基于基线校准后的第一化合物谱图信号,绘制健康对象的第一呼气化合物谱图,并基于基线校准后的第二化合物谱图信号,绘制认知障碍对象的第二呼气化合物谱图。
具体的,对校正后的谱图数据进行绘制如图7所示,所绘制的谱图能够方便检查数据是否还存在问题,是否按预期完成数据校正,能否达到后续数据处理的要求。
本实施例提供的认知障碍的辅助分析方法,在谱图绘制之前,对谱图数据进行噪声去除和基线校准,使得谱图数据精准度更高,由谱图数据所绘制的谱图更利于分析处理。
下面对本申请实施例提供的实现认知障碍的辅助分析的装置进行描述,下文描述的实现认知障碍的辅助分析的装置与上文描述的实现认知障碍的辅助分析方法可相互对应参照。
参见图8,图8为本申请实施例公开的一种实现认知障碍的辅助分析的装置结构示意图。
如图8所示,该装置可以包括:
呼气获取单元11,用于获取目标对象的呼气;
认知障碍测评单元12,用于将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
呼气数据获取单元13,用于获取认知障碍对象呼气数据以及健康对象呼气数据;
模型训练单元14,用于以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可选的,所述模型训练单元,包括:
最佳参数组合确定单元,用于在基础模型以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素进行训练的过程中,通过网格搜索结合交叉验证,确定所述基础模型的最佳参数组合;
最佳模型参数确定单元,用于通过支持向量机SVM算法结合网格搜索,确定所述最佳参数组合中的最佳模型参数;
训练单元,用于在所述最佳模型参数下对所述基础模型进行训练,得到认知障碍预测模型。
可选的,该装置还包括:
训练测试样本集构建单元,用于基于所述认知障碍对象呼气数据以及所述健康对象呼气数据,构建训练测试样本集,所述训练测试样本集包括第一预设比例的训练样本集,以及第二预设比例的测试样本集,所述第一预设比例大于所述第二预设比例;
所述模型训练单元,包括:
训练样本集训练单元,用于在所述训练样本集下以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型;
该装置还包括:
评估单元,用于利用所述测试样本集对所述认知障碍预测模型进行性能评估。
可选的,所述目标标志物集合为包括有预设数量的化合物的组合,所述组合中的每种化合物均从预先构建的差异标志物集合中选取;
所述差异标志物集合包括2-甲基戊烷、乙酸乙酯、1,2-二氯丙烷、甲基丙基硫醚、2,4,4-三甲基-2-戊烯、3-乙基己烷、Z-1-甲硫基-1-丙烯、甲苯、对二甲苯、顺-2-壬烯、壬烷、丙基苯、苯甲醛、苯甲腈、己酸乙酯、1,4-桉叶素、邻异丙基甲苯、对异丙基甲苯、4,5-二甲基壬烷、4-甲基癸烷、4-异丙烯基甲苯、2,3-二甲基癸烷、十一烷、2,4,6-三甲基癸烷以及1,2,4,5-四甲苯。
可选的,该装置还包括:
呼气采集单元,用于获取健康对象的呼气和认知障碍对象的呼气;
谱图获取单元,用于通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图;
谱图处理单元,用于针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图;
统计分析值计算单元,用于计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,将标准化后的呼气化合物谱图中FDR值小于预设FDR阈值且VIP值大于预设VIP阈值的化合物峰对应的化合物确定为差异标志物,并组合各个差异标志物得到差异标志物集合。
可选的,所述统计分析值计算单元,包括:
统计分析值计算子单元,用于针对所述标准化后的呼气化合物谱图中的每个化合物峰,通过将所述化合物峰在标准化后的第一呼气化合物谱图中的峰值,与所述化合物峰在标准化后的第二呼气化合物谱图中的峰值进行对比,确定所述化合物峰的p值以及VIP值,并对该p值转换得到所述化合物峰的FDR值。
可选的,所述谱图获取单元,包括:
谱图信号获取单元,用于通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一化合物谱图信号,以及所述认知障碍对象的第二化合物谱图信号;
谱图信号去噪单元,用于去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号;
谱图信号基线校准单元,用于对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号;
谱图绘制单元,用于基于所述基线校准后的第一化合物谱图信号,绘制所述健康对象的第一呼气化合物谱图,并基于所述基线校准后的第二化合物谱图信号,绘制所述认知障碍对象的第二呼气化合物谱图。
可选的,所述谱图信号去噪单元,包括:
谱图信号去噪子单元,用于针对所述第一化合物谱图信号和所述第二化合物谱图信号中的每个化合物谱图信号,若所述化合物谱图信号中存在目标信号点,将所述目标信号点的两个相邻信号点的信号均值代替所述目标信号点的信号值,以获得噪声去除后的化合物谱图信号,所述目标信号点的信号值大于所述目标信号点的任意相邻信号点的信号值的预设信号比率。
可选的,所述谱图信号基线校准单元,包括:
基线校准曲线构建单元,用于针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,选择所述化合物谱图信号中的非峰位置的信号,并基于所述非峰位置的信号点,利用下式构建所述化合物谱图信号的基线校准曲线:
其中,为所述化合物谱图信号的基线值随时间t变化的基线校准曲线,/>为所述基线校准曲线的多项式最高阶数,/>为第n系数,/>为通过最小二乘法对所述化合物谱图信号拟合得出;
校准单元,用于针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,将所述化合物谱图信号减去其基线校准曲线,得到基线校准后的化合物谱图信号。
可选的,所述谱图处理单元,包括:
第一谱图处理子单元,用于针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理和峰剔除处理,得到峰剔除处理后的呼气化合物谱图;
第二谱图处理子单元,用于针对所述峰剔除处理后的第一呼气化合物谱图和所述峰剔除处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图的各个样本缺失化合物峰进行填充,得到峰填充处理后的呼气化合物谱图,每个样本缺失化合物峰在至少一个样本中的峰面积值为0;
第三谱图处理子单元,用于针对所述峰填充处理后的第一呼气化合物谱图和所述峰填充处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行Z-score处理,得到标准化的呼气化合物谱图。
本申请实施例提供的认知障碍的辅助分析的装置可应用于认知障碍的辅助分析的设备,如认知障碍辅助分析系统。可选的,图9展示出了认知障碍的辅助分析的设备的硬件结构框图,参照图9,认知障碍的辅助分析的设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标对象的呼气;
将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
获取认知障碍对象呼气数据以及健康对象呼气数据;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标对象的呼气;
将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
获取认知障碍对象呼气数据以及健康对象呼气数据;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者还是包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (13)

1.一种认知障碍的辅助分析方法,其特征在于,包括:
获取目标对象的呼气;
将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
所述认知障碍预测模型的建立过程,包括:
获取认知障碍对象呼气数据以及健康对象呼气数据;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
2.根据权利要求1所述的方法,其特征在于,以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型,包括:
在基础模型以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素进行训练的过程中,通过网格搜索结合交叉验证,确定所述基础模型的最佳参数组合;
通过支持向量机SVM算法结合网格搜索,确定所述最佳参数组合中的最佳模型参数;
在所述最佳模型参数下对所述基础模型进行训练,得到认知障碍预测模型。
3.根据权利要求1所述的方法,其特征在于,还包括:
基于所述认知障碍对象呼气数据以及所述健康对象呼气数据,构建训练测试样本集,所述训练测试样本集包括第一预设比例的训练样本集,以及第二预设比例的测试样本集,所述第一预设比例大于所述第二预设比例;
以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型,包括:
在所述训练样本集下以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型;
该方法还包括:
利用所述测试样本集对所述认知障碍预测模型进行性能评估。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述目标标志物集合为包括有预设数量的化合物的组合,所述组合中的每种化合物均从预先构建的差异标志物集合中选取;
所述差异标志物集合包括2-甲基戊烷、乙酸乙酯、1,2-二氯丙烷、甲基丙基硫醚、2,4,4-三甲基-2-戊烯、3-乙基己烷、Z-1-甲硫基-1-丙烯、甲苯、对二甲苯、顺-2-壬烯、壬烷、丙基苯、苯甲醛、苯甲腈、己酸乙酯、1,4-桉叶素、邻异丙基甲苯、对异丙基甲苯、4,5-二甲基壬烷、4-甲基癸烷、4-异丙烯基甲苯、2,3-二甲基癸烷、十一烷、2,4,6-三甲基癸烷以及1,2,4,5-四甲苯。
5.根据权利要求4所述的方法,其特征在于,所述差异标志物集合的构建过程,包括:
获取健康对象的呼气和认知障碍对象的呼气;
通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图;
针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图;
计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,将标准化后的呼气化合物谱图中FDR值小于预设FDR阈值且VIP值大于预设VIP阈值的化合物峰对应的化合物确定为差异标志物,并组合各个差异标志物得到差异标志物集合。
6.根据权利要求5所述的方法,其特征在于,计算所述标准化后的呼气化合物谱图中的每个化合物峰的假阳发现率FDR值和变量投影重要性指标VIP值,包括:
针对所述标准化后的呼气化合物谱图中的每个化合物峰,通过将所述化合物峰在标准化后的第一呼气化合物谱图中的峰值,与所述化合物峰在标准化后的第二呼气化合物谱图中的峰值进行对比,确定所述化合物峰的p值以及VIP值,并对该p值转换得到所述化合物峰的FDR值。
7.根据权利要求5所述的方法,其特征在于,所述通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一呼气化合物谱图以及所述认知障碍对象的第二呼气化合物谱图,包括:
通过气相色谱仪联用质谱对所述健康对象的呼气以及所述认知障碍对象的呼气进行检测,获得所述健康对象的第一化合物谱图信号,以及所述认知障碍对象的第二化合物谱图信号;
去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号;
对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号;
基于所述基线校准后的第一化合物谱图信号,绘制所述健康对象的第一呼气化合物谱图,并基于所述基线校准后的第二化合物谱图信号,绘制所述认知障碍对象的第二呼气化合物谱图。
8.根据权利要求7所述的方法,其特征在于,去除所述第一化合物谱图信号和所述第二化合物谱图信号的噪声,得到噪声去除后的第一化合物谱图信号和噪声去除后的第二化合物谱图信号,包括:
针对所述第一化合物谱图信号和所述第二化合物谱图信号中的每个化合物谱图信号,若所述化合物谱图信号中存在目标信号点,将所述目标信号点的两个相邻信号点的信号均值代替所述目标信号点的信号值,以获得噪声去除后的化合物谱图信号,所述目标信号点的信号值大于所述目标信号点的任意相邻信号点的信号值的预设信号比率。
9.根据权利要求7所述的方法,其特征在于,所述对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号进行基线校准,得到基线校准后的第一化合物谱图信号和基线校准后的第二化合物谱图信号,包括:
针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,选择所述化合物谱图信号中的非峰位置的信号,并基于所述非峰位置的信号点,利用下式构建所述化合物谱图信号的基线校准曲线:
其中,为所述化合物谱图信号的基线值随时间t变化的基线校准曲线,/>为所述基线校准曲线的多项式最高阶数,/>为第n系数,/>为通过最小二乘法对所述化合物谱图信号拟合得出;
针对所述噪声去除后的第一化合物谱图信号和所述噪声去除后的第二化合物谱图信号中的每个化合物谱图信号,将所述化合物谱图信号减去其基线校准曲线,得到基线校准后的化合物谱图信号。
10.根据权利要求5所述的方法,其特征在于,所述针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理、峰剔除处理、峰填充处理以及Z-score处理,得到标准化的呼气化合物谱图,包括:
针对所述第一呼气化合物谱图和所述第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行归一化处理和峰剔除处理,得到峰剔除处理后的呼气化合物谱图;
针对所述峰剔除处理后的第一呼气化合物谱图和所述峰剔除处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图的各个样本缺失化合物峰进行填充,得到峰填充处理后的呼气化合物谱图,每个样本缺失化合物峰在至少一个样本中的峰面积值为0;
针对所述峰填充处理后的第一呼气化合物谱图和所述峰填充处理后的第二呼气化合物谱图中的每个呼气化合物谱图,对所述呼气化合物谱图进行Z-score处理,得到标准化的呼气化合物谱图。
11.一种认知障碍的辅助分析装置,其特征在于,包括:
呼气获取单元,用于获取目标对象的呼气;
认知障碍测评单元,用于将所述呼气输入至预先建立的认知障碍预测模型,输出所述目标对象的认知障碍测评结果;
呼气数据获取单元,用于获取认知障碍对象呼气数据以及健康对象呼气数据;
模型训练单元,用于以所述认知障碍对象呼气数据和所述健康对象呼气数据作为训练样本,以目标标志物集合作为模型预测分析因素,对基础模型进行训练,得到认知障碍预测模型。
12.一种认知障碍的辅助分析设备,其特征在于,包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1-10任一项所述的认知障碍的辅助分析方法的各个步骤。
13.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-10任一项所述的认知障碍的辅助分析方法的各个步骤。
CN202410245623.9A 2024-03-05 一种认知障碍的辅助分析方法、装置、设备及存储介质 Active CN117831756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410245623.9A CN117831756B (zh) 2024-03-05 一种认知障碍的辅助分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410245623.9A CN117831756B (zh) 2024-03-05 一种认知障碍的辅助分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117831756A true CN117831756A (zh) 2024-04-05
CN117831756B CN117831756B (zh) 2024-06-28

Family

ID=

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080070995A1 (en) * 2004-09-29 2008-03-20 Jules Westbrook Methods and Compositions Relating to Alzheimer's Disease
US20210212597A1 (en) * 2017-05-18 2021-07-15 Owlstone Medical Limited Multiple breath sampling method
CN114324549A (zh) * 2022-01-04 2022-04-12 深圳市步锐生物科技有限公司 基于呼出气质谱检测的肺结核风险评估方法及系统
CN115297768A (zh) * 2019-10-30 2022-11-04 华威大学 确定认知障碍的方法
EP4086622A1 (en) * 2021-05-04 2022-11-09 Koninklijke Philips N.V. Using chromatogram features to identify biological changes in volatile organic compound patterns
CN116844730A (zh) * 2023-05-24 2023-10-03 北京智精灵科技有限公司 认知障碍识别模型的建模方法及系统
US20230324418A1 (en) * 2020-08-14 2023-10-12 Bao Feng Biotech (Beijing) Co., Ltd Method for diagnosing and treating cognitive impairment and use thereof
CN117092347A (zh) * 2023-08-16 2023-11-21 昆明医科大学第一附属医院 一种帕金森病认知障碍的生物标志物及应用

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080070995A1 (en) * 2004-09-29 2008-03-20 Jules Westbrook Methods and Compositions Relating to Alzheimer's Disease
US20210212597A1 (en) * 2017-05-18 2021-07-15 Owlstone Medical Limited Multiple breath sampling method
CN115297768A (zh) * 2019-10-30 2022-11-04 华威大学 确定认知障碍的方法
US20220386952A1 (en) * 2019-10-30 2022-12-08 The University Of Warwick Method to determine cognitive impairment
US20230324418A1 (en) * 2020-08-14 2023-10-12 Bao Feng Biotech (Beijing) Co., Ltd Method for diagnosing and treating cognitive impairment and use thereof
EP4086622A1 (en) * 2021-05-04 2022-11-09 Koninklijke Philips N.V. Using chromatogram features to identify biological changes in volatile organic compound patterns
CN114324549A (zh) * 2022-01-04 2022-04-12 深圳市步锐生物科技有限公司 基于呼出气质谱检测的肺结核风险评估方法及系统
CN116844730A (zh) * 2023-05-24 2023-10-03 北京智精灵科技有限公司 认知障碍识别模型的建模方法及系统
CN117092347A (zh) * 2023-08-16 2023-11-21 昆明医科大学第一附属医院 一种帕金森病认知障碍的生物标志物及应用

Similar Documents

Publication Publication Date Title
Neto et al. Regularized linear discriminant analysis of EEG features in dementia patients
Van Berkel et al. Development of accurate classification method based on the analysis of volatile organic compounds from human exhaled air
JP4814530B2 (ja) 匂いの強度の測定
Lowell et al. Predictive value and discriminant capacity of cepstral-and spectral-based measures during continuous speech
JP2017224283A (ja) ビッグデータ解析方法及び該解析方法を利用した質量分析システム
US20150335266A1 (en) Method and apparatus for non-invasive detection of conditions such as lung cancer
de Castro et al. The analytical process to search for metabolomics biomarkers
CN109187614B (zh) 基于核磁共振和质谱的代谢组学数据融合方法及其应用
JP2016200435A (ja) マススペクトル解析システム,方法およびプログラム
CN111521722A (zh) 一种馥郁香型成品白酒瓶贮年份的鉴定方法
EP2729801A2 (de) Vorrichtung und verfahren zur analyse von flüchtigen organischen verbindungen in gasförmigen proben
CN108470194B (zh) 一种特征筛选方法及装置
CN114624316A (zh) 基于代谢组学的生理预测方法、装置、计算机设备和介质
JP2016180599A (ja) データ解析装置
JP2015512520A (ja) Nmrスペクトルから物質を同定するための方法
CN117831756B (zh) 一种认知障碍的辅助分析方法、装置、设备及存储介质
Abdelmaseeh et al. Feature selection for motor unit potential train characterization
CN117831756A (zh) 一种认知障碍的辅助分析方法、装置、设备及存储介质
Basant et al. A three-tier QSAR modeling strategy for estimating eye irritation potential of diverse chemicals in rabbit for regulatory purposes
Tsiouris et al. Predicting rapid progression of Parkinson's disease at baseline patients evaluation
Romana et al. Classification of manifest Huntington disease using vowel distortion measures
CN115274100B (zh) 基于血浆光谱的疾病筛查模型构建方法及疾病筛查装置
CN114184599B (zh) 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置
Ji et al. Pure ion chromatogram extraction via optimal k-means clustering
JP2017227542A (ja) 質量分析データ処理装置、質量分析装置、質量分析データ処理方法、及び質量分析データ処理用プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant