CN114755357A - 一种色谱质谱自动积分方法、系统、设备、介质 - Google Patents
一种色谱质谱自动积分方法、系统、设备、介质 Download PDFInfo
- Publication number
- CN114755357A CN114755357A CN202210387940.5A CN202210387940A CN114755357A CN 114755357 A CN114755357 A CN 114755357A CN 202210387940 A CN202210387940 A CN 202210387940A CN 114755357 A CN114755357 A CN 114755357A
- Authority
- CN
- China
- Prior art keywords
- spectrogram
- peak
- result
- standardized
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010354 integration Effects 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004949 mass spectrometry Methods 0.000 title claims description 18
- 238000001819 mass spectrum Methods 0.000 claims abstract description 51
- 238000013136 deep learning model Methods 0.000 claims abstract description 45
- 238000012216 screening Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 37
- 230000000694 effects Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004587 chromatography analysis Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 239000007788 liquid Substances 0.000 claims description 6
- 238000005173 quadrupole mass spectroscopy Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 230000001537 neural effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001457 gas chromatography time-of-flight mass spectrometry Methods 0.000 claims description 2
- 238000001269 time-of-flight mass spectrometry Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims 1
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
- G01N30/8637—Peak shape
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明涉及一种色谱质谱自动积分方法、系统、设备、介质,属于蛋白质组学及代谢组学分析技术领域。先对色谱质谱原始谱图进行转换,得到标准化谱图图片,再利用峰识别算法对标准化谱图图片进行初步峰识别,得到候选峰结果,同时利用训练好的深度学习模型对标准化谱图图片进行预测,得到谱图分类结果,最后基于谱图分类结果对候选峰结果进行筛选,去除候选峰结果中预测结果为噪音的峰结果,得到自动积分结果,通过对获取的色谱质谱图像进行深度学习模型预测,可以替代人工对色谱质谱的峰形进行判别,该方法准确率高,特异性高,有效的降低了常规自动积分方法的假阳性,完全能够高效的实现对人工积分的自动化替换。
Description
技术领域
本发明涉及蛋白质组学及代谢组学分析技术领域,特别是涉及一种基于深度学习模型的色谱质谱自动积分方法、系统、设备、介质。
背景技术
蛋白质组学和代谢组学是系统生物学领域内继基因组学后新发展出来的两门学科。蛋白质组学是从蛋白整体水平上对细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用进行研究,而代谢组学通过检测生物体在受到外源刺激或基因修饰后其体内代谢物质的变化,从而探索整个生物体的代谢机制。
色谱-串联质谱技术作为一种联用技术,结合了色谱的高效分离能力和质谱采集的待检测分子的精确分子量及强度信息,该技术具有灵敏度高、选择性强、通量高的优势,可以获得丰富的蛋白质和代谢物的定性和定量信息,因而在蛋白质组学和代谢组学分析领域具有显著的优势。
但由于色谱质谱峰结果的多样性,仪器软件自带的积分结果往往存在假阳性高,峰形判断不准的缺点,需要人工进行核查,不仅耗时费力,还存在不同人对峰结果判断存在差异的情况,对于代谢组学和蛋白质组学的结果一致性造成不利的影响。
基于此,亟需一种能够自动进行峰形判别的色谱质谱自动积分方法、系统、设备、介质。
发明内容
本发明的目的是提供一种色谱质谱自动积分方法、系统、设备、介质,利用深度学习模型自动对色谱质谱的峰形进行判别,能够高准确度、高效率的得到色谱质谱峰的定量结果。
为实现上述目的,本发明提供了如下方案:
一种色谱质谱自动积分方法,所述自动积分方法包括:
对色谱质谱原始谱图进行转换,得到标准化谱图图片;
利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
一种色谱质谱自动积分系统,所述自动积分系统包括:
转换模块,用于对色谱质谱原始谱图进行转换,得到标准化谱图图片;
初步识别模块,用于利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
预测模块,用于利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
筛选模块,用于基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
一种色谱质谱自动积分设备,包括:
处理器;以及
存储器,其中存储计算机可读程序指令,
其中,在所述计算机可读程序指令被所述处理器运行时执行上述的自动积分方法。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述自动积分方法的步骤。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明用于提供一种色谱质谱自动积分方法、系统、设备、介质,先对色谱质谱原始谱图进行转换,得到标准化谱图图片,再利用峰识别算法对标准化谱图图片进行初步峰识别,得到候选峰结果,同时利用训练好的深度学习模型对标准化谱图图片进行预测,得到谱图分类结果,最后基于谱图分类结果对候选峰结果进行筛选,去除候选峰结果中预测结果为噪音的峰结果,得到自动积分结果,通过对获取的色谱质谱图像进行深度学习模型预测,可以替代人工对色谱质谱的峰形进行判别,该方法准确率高,特异性高,有效的降低了常规自动积分方法的假阳性,完全能够高效的实现对人工积分的自动化替换。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的自动积分方法的方法流程图;
图2为本发明实施例1所提供的自动积分方法的方法原理图;
图3为本发明实施例1所提供的深度学习模型的网络结构示意图;
图4为本发明实施例2所提供的自动积分系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种色谱质谱自动积分方法、系统、设备、介质,利用深度学习模型自动对色谱质谱的峰形进行判别,能够高准确度、高效率的得到色谱质谱峰的定量结果。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
本实施例用于提供一种基于深度学习模型的色谱质谱自动积分方法,如图1和图2所示,所述自动积分方法包括:
S1:对色谱质谱原始谱图进行转换,得到标准化谱图图片;
具体的,色谱质谱原始谱图可以包括:气相色谱-单四极杆质谱、气相色谱-三重四极杆质谱、气相色谱-飞行时间质谱、液相色谱-三重四极杆质谱、液相色谱-飞行时间质谱和液相色谱-轨道阱质谱。
S1可以包括:对于色谱质谱原始谱图的每一质谱通道,以时间为横坐标,以质谱信号强度为纵坐标,绘制得到谱图,所有质谱通道的谱图组成标准化谱图图片。即本实施例将色谱质谱原始谱图转换成标准化谱图图片后,所得到的标准化谱图图片包括多张谱图,每一张谱图对应一个质谱通道的数据,其横坐标为时间,纵坐标为质谱信号强度。
作为一种可选的实施方式,在S1之前,本实施例还可以通过仪器自带软件或者MSConvert(版本可为V3.0.19243)将色谱质谱原始谱图的数据格式转换为通用的质谱数据格式,如mzML,mzXML,mgf等,并以转换后的具有通用的质谱数据格式的谱图作为色谱质谱原始谱图,执行S1。通过对色谱质谱原始谱图的数据格式进行格式转换,能够使本实施例的方法适用于不同仪器厂商提供的不同数据格式的色谱质谱原始谱图,适用范围广。
在S1之前,本实施例还可以读取色谱质谱原始谱图,并提取其中的谱图信息,谱图信息可以包括母离子质量数,子离子质量数,保留时间,信号强度等,基于该谱图信息执行S1。
S2:利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
峰识别算法可为多参数、多方法的积分方法,该多参数、多方法的积分方法包括xcms的centwave(小波过滤算法)和matchfilter(匹配过滤算法),使用多个计算参数进行峰识别以防止部分峰缺失,如峰宽参数在3-20s之间的多个峰宽。利用峰识别算法所得到的候选峰结果中存在大量假阳性峰,需要使用后续的训练好的深度学习模型进行过滤去除。
作为一种可选的实施方式,在利用训练好的深度学习模型对候选峰结果进行筛选之前,本实施例的自动积分方法还包括:根据峰高、信噪比和峰宽等参数对利用多参数、多方法的积分方法所得到的初始的候选峰结果进行去重和筛选,得到初步筛选后峰结果,并以初步筛选后峰结果作为新的候选峰结果,能够先对候选峰结果进行初步筛选,可以提高筛选效率。
S3:利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
在利用训练好的深度学习模型对标准化谱图图片进行预测,得到谱图分类结果之前,本实施例的自动积分方法还包括对深度学习模型进行训练,得到训练好的深度学习模型的步骤,该步骤可以包括:
(1)获取数据集;所述数据集包括多张训练用标准化谱图图片和每一训练用标准化谱图图片对应的标签;该标签为训练用标准化谱图图片中所有峰形的类型;
本实施例中采用人工标注的方式,对每一张训练用标准化谱图图片进行峰形标注分类,得到该训练用标准化谱图图片的标签,所有训练用标准化谱图图片和每一训练用标准化谱图图片的标签即组成数据集。具体的,训练过程中使用的数据集可为人工标注的实际项目标准化谱图图片,数目为130万。
(2)构建深度学习模型;
本实施例的深度学习模型可以由以下深度学习基本框架组合而成:卷积神经层(CNN),长短记忆层(LSTM)和注意力机制(Transformer),注意力机制是指Transformer模型,其包括由多头注意力(Multi-Head Attention)构造的encoder和decoder两部分。
具体的,如图3所示,本实施例的深度学习模型可以包括依次连接的输入层、多个卷积神经层、长短记忆层、全连接层以及输出层,各个中间层的激活函数为线性整流函数ReLU,输出层的激活函数为SoftMax。为了降低过拟合的风险,各层之间增加正则归一化层BatchNorm和dropout层。即每一卷积神经层、长短记忆层和全连接层均包括ReLU激活函数、正则归一化层和dropout层,输出层包括SoftMax激活函数。
(3)将数据集划分为训练集和验证集;
可取数据集中70%的数据组成训练集,剩余30%的数据组成测试集。
(4)以训练集作为输入,对深度学习模型进行训练,得到训练后模型;
对于训练用标准化谱图图片,其本质为一个二维矩阵,所有训练用标准化谱图图片都通过线性插值方法转化为相同的维度,并进行归一化和标准化后,作为深度学习模型的输入矩阵。输入矩阵通过连续的N(如图3所示,N为3)个一维卷积神经层CNN,每层节点可分别为8,64,512,以将维度从开始的64*1,提升到64*512,随后通过一个长短记忆层LSTM层提取长短特征并将维度降低到64层,通过全连接层输出最终的预测结果。上述节点数和维度的具体数值仅是一个示例,在实际应用中可以根据用户需求进行更改。
训练过程中,模型的损失函数为交叉熵CrossEntropyLoss,训练Epoch次数为200次,初始训练学习速率0.005,并随着训练次数增加而减小。
(5)调整训练后模型的超参数,得到优化后模型;
本实施例中,可调整的模型超参数主要有学习速率,训练次数,模型层数,中间层节点数等。通过优化训练次数,节点数目,每批次大小等超参数进行模型优化,得到优化后模型。
(6)判断是否达到预设迭代次数;
(7)若是,则以测试集为输入,计算所有优化后模型的预测效果,并选取预测效果最好的优化后模型作为训练好的深度学习模型;
使用测试集进行评估后得到最终的模型,具体选取对测试集效果最佳的模型作为训练好的深度学习模型。在实验过程中,模型最终的准确率为93%,特异性为90%。
(8)若否,则以优化后模型作为下一迭代中的深度学习模型,返回“以训练集作为输入,对深度学习模型进行训练,得到训练后模型”的步骤。
S4:基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
经人工核验,本实施例的自动积分方法的结果与人工方法重合率在98%以上,可以满足各种后续分析方法的需求。
本实施例所提供的自动积分方法可分为三个部分,第一部分:将色谱质谱原始谱图转换成标准化谱图图片,并使用多参数、多方法的积分方法得到候选峰结果。第二部分:深度学习模型的构建及训练部分,训练部分包括人工对标准化谱图图片进行峰形标注分类,并将其分为训练集和测试集,先用训练集的数据对深度学习模型进行训练,并对模型超参数进行调整,再使用测试集数据对模型调整结果进行评估,并选取对测试集效果最佳的模型作为训练好的深度学习模型。第三部分:基于训练好的深度学习模型对候选峰结果进行筛选,具体利用训练好的深度学习模型对标准化谱图图片进行预测,得到谱图分类结果,再使用谱图分类结果对候选峰结果进行筛选,过滤去除预测结果为噪音的峰结果,得到最终的自动积分结果。通过该方法,替代人工实现对峰形的精确判断,能有效解决常规色谱质谱自动积分假阳性高,峰形判断不准等缺点,从而高准确度、高效率的得到色谱质谱峰的定量结果。
本实施例创造性的提供了一种基于深度学习模型的色谱质谱自动积分方法,通过对获取的色谱质谱图像进行深度学习模型预测,可以替代人工对色谱质谱的峰形进行判别,该方法准确率高,特异性高,有效的降低了常规自动积分方法的假阳性,完全能够高效的实现对人工积分的自动化替换。
实施例2:
本实施例用于提供一种色谱质谱自动积分系统,如图4所示,所述自动积分系统包括:
转换模块M1,用于对色谱质谱原始谱图进行转换,得到标准化谱图图片;
初步识别模块M2,用于利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
预测模块M3,用于利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
筛选模块M4,用于基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
实施例3:
本实施例用于提供一种色谱质谱自动积分设备,包括:
处理器;以及
存储器,其中存储计算机可读程序指令,
其中,在所述计算机可读程序指令被所述处理器运行时执行如实施例1所述的自动积分方法。
实施例4:
本实施例用于提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现实施例1所述自动积分方法的步骤。
尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种色谱质谱自动积分方法,其特征在于,所述自动积分方法包括:
对色谱质谱原始谱图进行转换,得到标准化谱图图片;
利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
2.根据权利要求1所述的自动积分方法,其特征在于,所述色谱质谱原始谱图包括:气相色谱-单四极杆质谱、气相色谱-三重四极杆质谱、气相色谱-飞行时间质谱、液相色谱-三重四极杆质谱、液相色谱-飞行时间质谱和液相色谱-轨道阱质谱。
3.根据权利要求1所述的自动积分方法,其特征在于,所述对色谱质谱原始谱图进行转换,得到标准化谱图图片具体包括:
对于色谱质谱原始谱图的每一质谱通道,以时间为横坐标,以质谱信号强度为纵坐标,绘制得到谱图,所有所述质谱通道的谱图组成标准化谱图图片。
4.根据权利要求1所述的自动积分方法,其特征在于,所述峰识别算法为多参数、多方法的积分方法,所述多参数、多方法的积分方法包括centwave和matchfilter。
5.根据权利要求1所述的自动积分方法,其特征在于,在基于所述谱图分类结果对所述候选峰结果进行筛选之前,所述自动积分方法还包括:
根据峰高、信噪比和峰宽对所述候选峰结果进行去重和筛选,得到初步筛选后峰结果,并以所述初步筛选后峰结果作为新的候选峰结果。
6.根据权利要求1所述的自动积分方法,其特征在于,在利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果之前,所述自动积分方法还包括对深度学习模型进行训练,得到训练好的深度学习模型,具体包括:
获取数据集;所述数据集包括多张训练用标准化谱图图片和每一所述训练用标准化谱图图片对应的标签;所述标签为所述训练用标准化谱图图片中所有峰形的类型;
构建深度学习模型;
将所述数据集划分为训练集和验证集;
以所述训练集作为输入,对所述深度学习模型进行训练,得到训练后模型;
调整所述训练后模型的超参数,得到优化后模型;
判断是否达到预设迭代次数;
若是,则以所述测试集为输入,计算所有所述优化后模型的预测效果,并选取预测效果最好的优化后模型作为所述训练好的深度学习模型;
若否,则以所述优化后模型作为下一迭代中的深度学习模型,返回“以所述训练集作为输入,对所述深度学习模型进行训练,得到训练后模型”的步骤。
7.根据权利要求6所述的自动积分方法,其特征在于,所述深度学习模型包括依次连接的输入层、多个卷积神经层、长短记忆层、全连接层以及输出层;每一所述卷积神经层、所述长短记忆层和所述全连接层均包括ReLU激活函数、正则归一化层和dropout层,所述输出层包括SoftMax激活函数。
8.一种色谱质谱自动积分系统,其特征在于,所述自动积分系统包括:
转换模块,用于对色谱质谱原始谱图进行转换,得到标准化谱图图片;
初步识别模块,用于利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
预测模块,用于利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
筛选模块,用于基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
9.一种色谱质谱自动积分设备,其特征在于,包括:
处理器;以及
存储器,其中存储计算机可读程序指令,
其中,在所述计算机可读程序指令被所述处理器运行时执行如权利要求1-7任一项所述的自动积分方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述自动积分方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210387940.5A CN114755357A (zh) | 2022-04-14 | 2022-04-14 | 一种色谱质谱自动积分方法、系统、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210387940.5A CN114755357A (zh) | 2022-04-14 | 2022-04-14 | 一种色谱质谱自动积分方法、系统、设备、介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114755357A true CN114755357A (zh) | 2022-07-15 |
Family
ID=82330554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210387940.5A Pending CN114755357A (zh) | 2022-04-14 | 2022-04-14 | 一种色谱质谱自动积分方法、系统、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114755357A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115684606A (zh) * | 2022-10-21 | 2023-02-03 | 南方医科大学珠江医院 | 一种m蛋白检测的方法 |
CN116046968A (zh) * | 2023-03-02 | 2023-05-02 | 北京澳诺科技有限公司 | 一种液相色谱工作站数据处理方法、系统及可存储介质 |
CN116359420A (zh) * | 2023-04-11 | 2023-06-30 | 烟台国工智能科技有限公司 | 一种基于聚类算法的色谱数据杂质定性分析方法及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111781292A (zh) * | 2020-07-15 | 2020-10-16 | 四川大学华西医院 | 一种基于深度学习模型的尿液蛋白质组学谱图数据分析系统 |
US20200372973A1 (en) * | 2019-03-29 | 2020-11-26 | Venn Biosciences Corporation | Automated detection of boundaries in mass spectrometry data |
US20210103855A1 (en) * | 2019-10-08 | 2021-04-08 | Coretronic Corporation | Automated model training device and automated model training method for spectrometer |
WO2021191421A1 (en) * | 2020-03-27 | 2021-09-30 | Ventana Medical Systems, Inc. | Computer implemented method for identifying at least one peak in a mass spectrometry response curve |
CN114283338A (zh) * | 2021-12-28 | 2022-04-05 | 广州广电计量检测股份有限公司 | 一种基于图像识别的色谱图自动分析方法 |
-
2022
- 2022-04-14 CN CN202210387940.5A patent/CN114755357A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200372973A1 (en) * | 2019-03-29 | 2020-11-26 | Venn Biosciences Corporation | Automated detection of boundaries in mass spectrometry data |
CN113785362A (zh) * | 2019-03-29 | 2021-12-10 | 韦恩生物科技股份公司 | 质谱数据中边界的自动检测 |
US20210103855A1 (en) * | 2019-10-08 | 2021-04-08 | Coretronic Corporation | Automated model training device and automated model training method for spectrometer |
WO2021191421A1 (en) * | 2020-03-27 | 2021-09-30 | Ventana Medical Systems, Inc. | Computer implemented method for identifying at least one peak in a mass spectrometry response curve |
CN111781292A (zh) * | 2020-07-15 | 2020-10-16 | 四川大学华西医院 | 一种基于深度学习模型的尿液蛋白质组学谱图数据分析系统 |
CN114283338A (zh) * | 2021-12-28 | 2022-04-05 | 广州广电计量检测股份有限公司 | 一种基于图像识别的色谱图自动分析方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115684606A (zh) * | 2022-10-21 | 2023-02-03 | 南方医科大学珠江医院 | 一种m蛋白检测的方法 |
CN115684606B (zh) * | 2022-10-21 | 2023-11-28 | 南方医科大学珠江医院 | 一种m蛋白检测的方法 |
CN116046968A (zh) * | 2023-03-02 | 2023-05-02 | 北京澳诺科技有限公司 | 一种液相色谱工作站数据处理方法、系统及可存储介质 |
CN116359420A (zh) * | 2023-04-11 | 2023-06-30 | 烟台国工智能科技有限公司 | 一种基于聚类算法的色谱数据杂质定性分析方法及应用 |
CN116359420B (zh) * | 2023-04-11 | 2023-08-18 | 烟台国工智能科技有限公司 | 一种基于聚类算法的色谱数据杂质定性分析方法及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114755357A (zh) | 一种色谱质谱自动积分方法、系统、设备、介质 | |
EP3588381A1 (en) | Method and apparatus for training classification model, method and apparatus for classifying | |
Lee et al. | Megavariate data analysis of mass spectrometric proteomics data using latent variable projection method | |
US20240046644A1 (en) | Video classification method, device and system | |
CN107729721B (zh) | 一种代谢物鉴定及紊乱通路分析方法 | |
CN111370067B (zh) | 一种面向lc/gc-ms的代谢组学数据质量控制方法及系统 | |
CN112597038B (zh) | 软件缺陷预测方法及系统 | |
CN112700325A (zh) | 一种基于Stacking集成学习的网贷回头客预测的方法 | |
CN111781292A (zh) | 一种基于深度学习模型的尿液蛋白质组学谱图数据分析系统 | |
CN114140398A (zh) | 一种利用无缺陷图像的少样本缺陷检测方法 | |
CN113298780A (zh) | 一种基于深度学习的儿童骨龄评估方法及系统 | |
CN113567605A (zh) | 质量色谱图的自动化解释模型构建方法、装置和电子设备 | |
CN111863135B (zh) | 一种假阳性结构变异过滤方法、存储介质及计算设备 | |
CN111612260B (zh) | 基于集成学习模型的轨道交通车载数据预测方法 | |
CN117557941A (zh) | 基于多模态数据融合的视频智能分析系统及方法 | |
CN114858958B (zh) | 质谱数据在质量评估中的分析方法、装置和存储介质 | |
CN115171790A (zh) | 质谱的数据序列在质量评估中的分析方法、装置和存储介质 | |
US9857377B2 (en) | Method for quantification of proteome | |
CN113903394A (zh) | 基于卷积神经网络的代谢分析中不同队列的校准方法及系统 | |
CN114139643A (zh) | 一种基于机器视觉的单甘酯质量检测方法及系统 | |
CN111626508A (zh) | 基于xgboost模型的轨道交通车载数据预测方法 | |
CN114694771A (zh) | 样品分类方法、分类器的训练方法、设备和介质 | |
CN111883214A (zh) | 构建诱饵库、构建目标-诱饵库、代谢组fdr鉴定的方法及装置 | |
CN116106464B (zh) | 质谱数据质量程度或概率的控制系统、评估系统及方法 | |
CN115375954B (zh) | 一种化学实验溶液识别方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |