CN117007724B - 一种基于云计算的高效液相串联质谱分析系统 - Google Patents
一种基于云计算的高效液相串联质谱分析系统 Download PDFInfo
- Publication number
- CN117007724B CN117007724B CN202311283375.9A CN202311283375A CN117007724B CN 117007724 B CN117007724 B CN 117007724B CN 202311283375 A CN202311283375 A CN 202311283375A CN 117007724 B CN117007724 B CN 117007724B
- Authority
- CN
- China
- Prior art keywords
- analysis
- cloud computing
- detection data
- request
- mass spectrometry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000007788 liquid Substances 0.000 title claims abstract description 20
- 238000004885 tandem mass spectrometry Methods 0.000 title claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 109
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000004811 liquid chromatography Methods 0.000 claims abstract description 38
- 239000000945 filler Substances 0.000 claims abstract description 9
- 238000000926 separation method Methods 0.000 claims abstract description 6
- 238000004949 mass spectrometry Methods 0.000 claims description 35
- 125000000524 functional group Chemical group 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 8
- 238000004807 desolvation Methods 0.000 claims description 4
- 230000009257 reactivity Effects 0.000 claims description 4
- 238000013375 chromatographic separation Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 239000012530 fluid Substances 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 239000012491 analyte Substances 0.000 claims description 2
- 238000001819 mass spectrum Methods 0.000 abstract description 9
- 150000001875 compounds Chemical class 0.000 description 30
- 238000000034 method Methods 0.000 description 18
- 239000012071 phase Substances 0.000 description 15
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 8
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000000065 atmospheric pressure chemical ionisation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000000451 chemical ionisation Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 238000000752 ionisation method Methods 0.000 description 1
- 238000000050 ionisation spectroscopy Methods 0.000 description 1
- 150000002576 ketones Chemical group 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- -1 solubility Chemical class 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000010846 tandem mass spectrometry analysis Methods 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/34—Control of physical parameters of the fluid carrier of fluid composition, e.g. gradient
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
- G01N30/7233—Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8603—Signal analysis with integration or differentiation
- G01N30/8606—Integration
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种基于云计算的高效液相串联质谱分析系统,所述分析系统包括检测部以及处理部。所述检测部包括液相色谱单元、质谱单元和控制单元;通过所述检测部通过调整液相色谱单元的流动相和填充物,以及质谱单元的多组工作参数,实现样品中不同成分的分离和检测,以向所述处理部输出已检测数据;处理部通过对已检测数据进行分析需要的复杂程度和所需的计算量的预测,选择合适的云计算节点进行并行计算处理,有效提高分析效率和并行处理能力。
Description
技术领域
本发明涉及医疗检测设备领域。具体而言,涉及一种基于云计算的高效液相串联质谱分析系统。
背景技术
高效液相色液检测(high performance liquid chromatography,HPLC)一直是分离、分析和纯化有机化合物,分离大部分可溶解的混合物的首选工具。HPLC利用样品组分根据两相之间的分配系数进行分离,将载有流过整个系统样品的液体作为流动相,固定不动的一相作为固定相,通过高压输液系统,将极性不同的溶剂、缓冲液等流动相泵入含有固定相的色谱柱中,通过色谱柱分离出各个成分,分离的组分顺序流入检测器以获得色谱图,从而实现样品的分离和分析;而采用质谱仪能够提供化合物的分子结构和碎片离子信息,这对于未知化合物的鉴定和结构分析非常重要。
通过将质谱仪与液相色谱仪串联,可以在分离和定量的同时获取化合物的结构信息,进一步增强分析的能力。并且,质谱仪具有较高的灵敏度,可以检测低浓度的分析物。当液相色谱仪的灵敏度不足以检测到所需的化合物时,通过将质谱仪与液相色谱仪串联,可以提高分析的灵敏度,使得低浓度的目标化合物也能被准确检测。
根据已公开的技术方案,公开号为CN114945824(A)的技术方案提出一种提高液相串联质谱分析灵敏度的方法,其通过涂覆色谱系统的金属流路后,将样品注入色谱系统,使样品流过色谱系统,并且分离样品,使用质谱分析分离的样品;从而有效提高了色谱峰的面积表达程度;公开号为US2023003696(A1)的技术方案提出一种用于识别和/或验证来自液相色谱质谱仪装置的样品的色谱图中的至少一个分析信号峰的方法,其通过任选地随着时间的推移采集内标定量信号强度和/或内标定性信号强度的多个数据点,从而将实测值与理论值进行比较后,进一步分析信号峰值;公开号为EP3911959 (A1)的技术方案提出一种针对HBA1C测量的高速样品工作流程,通过应用一种快速试剂盒,并且提出应用该快速试剂盒执行该方法的临床诊断系统。
以上技术方案均提出若干技术,用于提高液相串联质谱分析方法和分析系统的效率的,然而在目前云计算系统以及网络的大量应用下,还可以进一步提高这类型分析方法的并行处理效率。
背景技术的前述论述仅意图便于理解本发明。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。
发明内容
本发明的目的在于,提供了一种基于云计算的高效液相串联质谱分析系统,所述分析系统包括检测部以及处理部。所述检测部包括液相色谱单元、质谱单元和控制单元;通过所述检测部通过调整液相色谱单元的流动相和填充物,以及质谱单元的多组工作参数,实现样品中不同成分的分离和检测,以向所述处理部输出已检测数据;处理部通过对已检测数据进行分析需要的复杂程度和所需的计算量的预测,选择合适的云计算节点进行并行计算处理,有效提高分析效率和并行处理能力。
本发明采用如下技术方案:一种基于云计算的高效液相串联质谱分析系统,所述分析系统包括检测部、处理部;
其中,所述检测部包括:
液相色谱单元,一个或以上所述液相色谱单元被配置为对样品进行液相色谱检测;以及与所述液相色谱单元流体连通的质谱单元,一个或以上所述质谱单元被配置为对所述液相包谱单元检测处理后的分离物进行质谱检测;以及控制单元,被配置为
(1)通讯连接到所述液相色谱单元和所述质谱单元中的每一个,并控制每一个液相色谱单元和质谱单元进行工作;
(2)接收每一个所述液相色谱单元和质谱单元的基于一个样本的原始检测数据;
(3)对所述原始检测数据进行数据处理流程,获得已处理检测数据,并将所述已处理检测数据传送到所述处理部;
所述处理部包括一个或以上的处理器,被配置为
(1)接收、分析、处理所述已处理检测数据,计算所述已处理检测数据的分析复杂程度,预测对所述已处理检测数据的分析所需的分析运算量;
(2)生成分析请求;
(3)将所述分析请求发送到云计算系统内指定的计算节点;
优选地,所述控制单元配置有控制处理器以及控制存储器,所述控制存储器上存储有包括分析方案的计算机可执行指令;当所述控制存储器上的计算机可执行指令被所述控制处理器执行时,所述控制单元根据所述分析方案控制所述液相色谱单元以及质谱单元进行检测工作;
其中,所述分析方案包括:
用于对分析物进行色谱分离时采用的流动相和/或填充物的不同成分和成分比例;
用于对分析物进行质谱分析时所述质谱单元的工作参数,至少包括以下其中一项或一项以上的组合:自由电离电压、去溶剂化温度、电极电压、碰撞气体温度、碰撞气体压力、碰撞能量;
优选地,所述分析请求包括:
已处理检测数据;
分析请求描述,用于描述对所述已处理检测数据的分析需求;
样本标签,用于标记所述已处理检测数据所归属的样本;
以及获取所述已处理检测数据所采用的分析方案;
优选地,所述处理部还包括第二存储器;所述第二存储器用于存储有分配策略以及云计算系统中包括的计算节点信息;所述处理部的处理器执行所述分配策略,基于所述分析请求进行计算,根据分配策略以及云端的一个或以上云计算系统的计算资源的当前利用率,将每个所述分析请求分配到云计算系统的一个或以上计算节点进行分析运算,并等待被分配到一个或以上计算节点的分析结果反馈;
优选地,所述数据处理流程包括以下步骤:
S100:检测感兴趣区域;
S200:检测色谱峰,然后对所述色谱峰进行积分;
优选地,计算所述已处理检测数据的分析复杂程度包括通过分析样品的至少一项以下信息预测已处理检测数据的复杂程度:化学结构、分子量、分子环数量、功能基团、分子描述符、样品反应活性;
优选地,所述分析系统包括根据以下计算式,计算所述已处理检测数据的分析复杂程度Q:
;
上式中,W为分离物的分子量,C为分离物的分子环数量,G为分离物的官能团的数量,以上三个数值均为通过对分离物的直接检测可获得的分子特征;λ为修正系数,k1、k2、k3分别为因素权重系数,以上系数由相关技术人员根据云计算系统的计算能力特点进行设定,并且其中λ<-0.1,k3<-1;
优选地,所述分析请求描述还设置请求类型;所述请求类型包括同步请求、异步请求;
其中,当所述请求类型是同步请求时,选择分配给云计算系统内具有最大量的可用计算资源的计算节点;
当所述请求类型是异步请求时,选择分配给云计算系统内具有最小量的可用计算资源的计算节点;
优选地,所述处理部还包括配置有通讯模块,用于与所述检测部通讯连接以接收从所述检测部传输的已处理检测数据;还包括用于与所述一个或以上云计算系统通讯连接,以至少用于传输所述分析请求,所述分析请求对应的已处理检测数据,以及云计算系统所反馈的分析结果。
本发明所取得的有益效果是:
1、本发明的分析系统可以组合使用多个通过串联连接高效液相色谱仪和质谱仪,并且为设定多个液相色谱单元中不同的流动相和填充物获得不同的分离物,再通过设定质谱单元中不同的工作参数,同时并行地完成多个检测条件的检测,并且产生大量可供分析的检测数据;
2、本发明的分析系统通过采用云计算系统进行并发多点的计算支持,能够高效地完成大量检测数据的分析,明显地提升了分析效率;
3、本发明的分析系统通过设置处理部对检测数据进行复杂程度以及所需运算量的预测,从而可以根据分配策略将检测数据分配到适合的云计算节点中,进一步优化了本系统的分析效率;
4、本发明的分析系统中各软、硬件部分采用了模块化设计,方便今后的升级或者更换相关的软、硬件环境,降低了使用的成本。
附图说明
从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在不同的视图中,相同的附图标记指定对应的部分。
附图标记说明:10-检测部;12-液相色谱单元;14-质谱单元;16-控制单元;20-处理部;30-云计算系统;40-网络;100-处理电路;102-处理器;104-存储器;106-数据库;
图1为本发明所述分析系统的架构示意图;
图2为本发明实施例中所分析系统的样本处理流程示意图;
图3为本发明实施例中所述分析请求的构成示意图;
图4为本发明实施例中所述处理电路的示意图。
具体实施方式
为了使得本发明的目的技术方案及优点更加清楚明白,以下结合其实施例,对本发明进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统、方法和/或特征将变得显而易见。旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内。包括在本发明的范围内,并且受所附权利要求书的保护。在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下将详细描述将是显而易见的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位。以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
实施例一:示例性地,提出一种基于云计算的高效液相串联质谱分析系统,
如附图1所示,所述分析系统包括检测部10、处理部20;
其中,所述检测部10包括:
液相色谱单元12,一个或以上所述液相色谱单元12被配置为对样本进行液相色谱检测;
以及与所述液相色谱单元12流体连通的质谱单元14,一个或以上所述质谱单元14被配置为对所述液相色谱单元12检测处理后的分离物进行质谱检测;
以及控制单元16,被配置为
(1)通讯连接到所述液相色谱单元12和所述质谱单元14中的每一个,并控制每一个液相色谱单元12和质谱单元14进行工作;
(2)接收每一个所述液相色谱单元12和质谱单元14的基于一个样本的原始检测数据;
(3)对所述原始检测数据进行数据处理流程,获得已处理检测数据,并将所述已处理检测数据传送到所述处理部20;
所述处理部20包括一个或以上的处理器,被配置为
(1)接收、分析、处理所述已处理检测数据,计算所述已处理检测数据的分析复杂程度,预测对所述已处理检测数据的分析所需的分析运算量;
(2)生成分析请求;
(3)将所述分析请求发送到云计算系统30内指定的计算节点;
所述分析系统从接收样本到实施分析请求向云计算系统的计算节点的分配,可以由附图2所示流程示例性地示出;
优选地,所述控制单元16配置有控制处理器以及控制存储器,所述控制存储器上存储有包括分析方案的计算机可执行指令;当所述控制存储器上的计算机可执行指令被所述控制处理器执行时,所述控制单元16根据所述分析方案控制所述液相色谱单元12以及质谱单元14进行检测工作;
其中,所述分析方案包括:
用于对分析物进行色谱分离时采用的流动相和/或填充物的不同成分和成分比例;
用于对分析物进行质谱分析时所述质谱单元14的工作参数,至少包括以下其中一项或一项以上的组合:自由电离电压、去溶剂化温度、电极电压、碰撞气体温度、碰撞气体压力、碰撞能量;
优选地,如附图3所示,所述分析请求包括:
已处理检测数据;
分析请求描述,用于描述对所述已处理检测数据的分析需求;
样本标签,用于标记所述已处理检测数据所归属的样本;
以及获取所述已处理检测数据所采用的分析方案;
优选地,所述处理部20还包括第二存储器;所述第二存储器用于存储有分配策略以及云计算系统30中包括的计算节点信息;所述处理部20的处理器执行所述分配策略,基于所述分析请求进行计算,根据分配策略以及云端的一个或以上云计算系统30内的计算节点的计算资源的当前利用率,将每个所述分析请求分配到云计算系统30的一个或以上计算节点进行分析运算,并等待被分配到一个或以上计算节点的分析结果反馈;
优选地,所述数据处理流程包括以下步骤:
S100:检测感兴趣区域;
S200:检测色谱峰,然后对所述色谱峰进行积分;
优选地,计算所述已处理检测数据的分析复杂程度包括通过分析样本的至少一项以下信息预测已处理检测数据的复杂程度:化学结构、分子量、分子环数量、功能基团、分子描述符、样本反应活性;
优选地,所述分析请求描述还设置请求类型;所述请求类型包括同步请求、异步请求;
其中,当所述请求类型是同步请求时,选择分配给云计算系统30内具有最大量的可用计算资源的计算节点;
当所述请求类型是异步请求时,选择分配给云计算系统30内具有最小量的可用计算资源的计算节点;
优选地,所述处理部20还包括配置有通讯模块,用于与所述检测部10通讯连接以接收从所述检测部10传输的已处理检测数据;还包括用于与所述一个或以上云计算系统30通讯连接,以至少用于传输所述分析请求,所述分析请求对应的已处理检测数据,以及云计算系统30所反馈的分析结果;
在本发明中,所述液相色谱单元优选地为高效液相色谱仪(High-PerformanceLiquid Chromatography,HPLC);液相色谱检测技术是一种常用的分离和分析技术,广泛应用于化学、生物化学、制药、环境科学等领域,其基本的工作原理包括:
(1)色谱柱选择:即根据分析目标和样本性质选择合适的色谱柱,常见的包括反相色谱柱、离子交换柱、凝胶过滤柱等;色谱柱通常由填充物填充,使所述色谱柱具有对特定的化学性质的吸附和分离能力;
(2)样本进样:即将待分析的样本注入高效液相色谱仪的进样器;样本可以通过自动进样器进行连续进样,或手动注入小体积样本;
(3)流动相选择:根据样本的性质和分析目标,选择合适的流动相;流动相通常是溶液,由溶剂和缓冲液组成,其组成和浓度可以根据需要进行调整;
(4)进样和分离:样本进入色谱柱后,通过压力或重力作用,流动相将样本推动通过色谱柱;样本在色谱柱中与填充物发生相互作用,不同成分在填充物上的亲和性、极性等特性不同,导致样本内物质的有效分离;
(5)检测器检测:分离后的样本成分通过色谱柱逐个进入检测器进行检测;常见的检测器包括紫外-可见光检测器(UV-Vis Detector)、荧光检测器、质谱检测器等;检测器测量样本的吸光度、荧光强度或质谱图谱等,生成相应的信号;
(6)数据处理和结果分析:检测器产生的信号经过放大、滤波和转换等处理,转化为数字信号;数字信号通过数据采集系统记录和存储,并可以进一步生成色谱图谱;色谱图谱可以通过色谱软件进行数据分析、峰识别和定量计算,得到分析结果;
进一步的,实施例中所采用的质谱单元优选地为质谱仪;质谱仪基于质谱原理,通过将样本中的分子离子化并进行质量分析,从而确定样本中化合物的结构和组成;质谱仪的主要原理是将样本中的分子转化为离子,并根据离子的质量-电荷比(m/z)进行分析和检测;质谱仪通常包括以下几个主要组件:
离子化源:离子化源用于将样本中的分子转化为离子形式;常见的离子化方法包括电子轰击离子化、化学电离、电喷雾离子化和大气压化学电离,等;
质量分析器:质量分析器用于分离和筛选离子根据其质量-电荷比(m/z);常见的质量分析器包括飞行时间质谱仪、四极杆质谱仪、离子阱质谱仪和磁扇质谱仪等;
检测器:检测器用于测量和记录离子的信号强度;常见的检测器包括离子倍增器、电子倍增器和光电离探测器等;
通过质谱分析,所述质谱单元可以确定样本中化合物的质量和相对丰度,从而提供关于样本组成、结构和特性的信息;通过质谱仪的分析结果,可以识别未知化合物、定量分析目标化合物的含量、研究反应机理和代谢途径等;
进一步的,可以将液相色谱单元和质谱单元通过串联连接来实现联通和协同工作;这种串联连接即液相色谱-质谱联用系统(LC-MS系统);在LC-MS系统中,液相色谱仪和质谱仪通过接口连接在一起;接口的作用是将液相色谱柱的输出引导到质谱仪中进行离子化和质谱分析;通过液相色谱-质谱联用系统,可以充分发挥液相色谱和质谱的优势;液相色谱能够有效地进行化合物的分离,而质谱仪则能提供化合物的结构信息和鉴定未知化合物;此外,质谱仪还具有较高的灵敏度,可以检测低浓度的目标化合物;
然而一次LC-MS的串联检测,其产生的数据文件容量可达10 GB;而在需要更为精密的分析需求中,需要反复调整所述液相色谱检测中的多个测试条件,例如流动相或者填充物等,或者需要调整质谱单元的多个工作条件,例如自由电离电压、去溶剂化温度、电极电压、碰撞气体温度、碰撞气体压力、碰撞能量;则每改变一次测试中的任何条件,则被视为一次独立的串联检测;若进行100次检测实验将产生 1 TB 数据;这些数据需要大量处理器和内存密集型图像处理和统计方法进行处理,以检测作为潜在生物标志物的感兴趣峰;并且,若在需要快速获取结果的检测需求是,LC-MS系统精度和效率的提高将增加挑战,即有可能提供在更短的时间跨度内生成更大量质谱数据的能力;
因此在优选的实施方式中,则LC-MS系统与云计算系统通过网络连接,即可以通过使用在第二地域中的运算资源,解决LC-MS系统中大量出现的分析需求;
云计算系统是一种基于互联网的计算模式,通过将计算资源、存储资源和应用程序等服务提供给用户,实现灵活、可扩展和按需使用的计算能力;它将计算任务分配给一个或多个远程的服务器集群,这些服务器通过互联网连接,并根据用户的需求提供计算和存储资源;
回到附图1,在云计算系统30中,计算节点是云计算基础设施中的一部分,用于执行计算任务和处理用户请求;计算节点可以是物理服务器、虚拟机或容器等,它们通过网络连接在一起,组成一个分布式的计算集群;一种云计算系统中优选的组成架构包括:
计算节点:计算节点是云计算系统中的计算资源提供者,计算节点可以是物理服务器,也可以是虚拟机或容器;计算节点负责执行计算任务,运行应用程序,并提供计算能力给用户;
网络40:网络是连接计算节点的基础设施,其可以是局域网(LAN)、广域网(WAN)或互联网;网络40提供所述分析系统与云计算系统之间,以及包括云计算系统内部的计算节点之间的通信和数据传输,确保计算节点能够相互连结和协同工作;网络可以遵守一种或多种网络协议,包括电气和电子工程师协会(IEEE)协议、第三代合作伙伴计划(3GPP)协议、第四代无线协议(4G)(例如,长期演进(LTE)标准、LTE Advanced、LTE Advanced Pro)、第五代无线协议(5G)和/或类似的有线和/或无线协议,并且可以包括用于在云计算系统和所述分析系统之间路由数据的一个或多个中间设备;
存储:存储是云计算系统中的数据存储设备,其可以是本地硬盘、网络存储(如网络附加存储)或分布式存储系统;存储用于保存应用程序、数据和用户文件,提供可靠的数据存储和访问服务;
示例性地,所述控制单元16中以及所述处理部20可以具有类似的计算架构;例如采用如附图4所示的一种处理电路100;处理电路100包括处理器102和存储器104;处理器102可以是通用或专用处理器、专用集成电路(ASIC)、一个或多个现场可编程门阵列(FPGA)、一组处理组件或其他合适的处理组件;处理器102被配置为执行存储在存储器104中的计算机代码或指令;存储器104可以包括用于存储数据和/或计算机代码的一个或多个设备(例如,存储器单元、存储器设备、存储设备等),以完成和/或促进本公开中描述的各种检测结果的输出;存储器104可以包括为随机存取存储器(RAM)、只读存储器(ROM)、机械式存储器、临时存储体、闪存或者其他形式的存储器;并且存储器104可以包括数据库组件、目标代码组件、脚本组件或用于支持本公开中描述的各种活动和信息结构的任何其他类型的信息结构;存储器104可通信地连接到处理器102并且可以包括用于执行本发明检测系统在对粪便的检测所需要的一个或多个检测过程的计算机代码;当处理器102执行存储在存储器104中的指令时,处理器102可以控制所述检测系统的检测部10以完成指定的分析程序动作并输出检测结果。
实施例二:本实施例应当理解为至少包含前述任意一个实施例的全部特征,并在其基础上进一步改进;
其中,示例性的一种实施方式中,为在云计算系统中选择合适的计算节点,以均衡云计算系统中各节点的负载,并且提高所述分析系统的有效分析速度,可以通过预测一组已处理检测数据的复杂程度和所需的计算量,以达成以上目标;
其中,一组所述已处理检测数据的复杂程度的预测,可以根据样本的特性和预期的分析结果复杂程度,使用机器学习算法或经验规则进行复杂程度的预测;例如,可以通过历史大量分析样本的化学结构、分子量、功能基团等信息,并结合过往的分析记录所花费的运算量消耗,建立训练集、验证集、测试集,用于建立基于机器学习的预测模型,用于预测样本的复杂程度,根据预设的指标将一组所述已处理检测数据进行复杂程度的分类,如低、中、高复杂程度;建模的算法可以选择适合样本特征和标签类型的算法,如支持向量机(SVM)、随机森林(Random Forest)、神经网络等;可以使用训练集中的样本进行模型训练,并使用验证集进行模型的评估和调优;使用测试集对复杂程度预测模型进行评估;可以使用常见的评估指标,如准确度、精确度、召回率、F1值等,来评估模型的性能;可以使用交叉验证等方法来进一步验证模型的稳定性和泛化能力;
而优选地,在一些实施方式中,可以配合采用以下计算式计算一组所述已处理检测数据的分析复杂程度Q:
;
上式中,W为从所述液相色谱单元中分离出的分离物的分子量,C为分离物的分子环数量,G为分离物的官能团的数量,以上三个数值均为通过对分离物的直接检测可获得的分子特征;λ为修正系数,k1、k2、k3分别为因素权重系数,以上系数由相关技术人员根据云计算系统30的计算能力特点进行设定,并且其中λ<-0.1,k3<-1;
上述计算式中涉及的三个分离物的特性,即分子量、分子环数量以及官能团数量,均可以有效表达分析分离物的复杂程度;
计算量估算:根据预测的复杂程度和所需的计算任务,估算所需的计算量;计算量可以通过样本的大小、分析方法的复杂度、数据处理的算法等因素来确定;可以使用经验公式或模拟实验结果来估算计算量;
其中,官能团多样性是指化合物中不同官能团的数量和种类的多样性程度;官能团是指化合物中具有特定化学性质和功能的基团,如羟基、羧基、氨基等;官能团多样性可以反映化合物的结构复杂度和化学多样性;化合物中官能团的种类和数量越多,官能团多样性就越高;例如,一个化合物中同时存在羟基、酮基和酯基等多个不同的官能团,它的官能团多样性就较高;官能团多样性在化学和药物领域中具有重要意义;不同官能团的存在可以影响化合物的性质和功能,例如溶解性、反应活性和生物活性等;因此,通过评估化合物的官能团多样性,可以对其性质和活性进行初步的预测和判断;
而分子量、分子环数量均可以直观地代表化合物的分子构造的复杂程度;并且分子量、分子环数量以及官能团数量均是可以直接从样品中检测出来的分子特征;这些特征可以用于初步评估化合物的复杂程度,亦即可以在所述已处理检测数据中由所述控制单元或所述处理部进行初步检测所得;
而其他较为复杂的项目,则安排发送到云计算系统进行分析;这些项目可能包括:
质谱数据分析:质谱仪可以提供详细的质谱数据,包括质谱图、碎片图等;这些数据可以用于确定化合物的结构、鉴定未知化合物、检测杂质等;云计算系统可以使用专业的质谱数据处理软件对这些数据进行分析和解释;
数据库搜索:云计算系统可以将质谱数据与已知化合物的数据库进行比对和搜索,以确定化合物的身份;通过与数据库中的化合物进行匹配,可以快速鉴定样品中的化合物;
结构预测和预测性分析:云计算系统可以使用机器学习和模型预测方法,根据已有的化合物数据和结构信息,预测未知化合物的性质、活性等;这对于药物发现、毒理学评估等领域非常有用;
数据可视化和报告生成:云计算系统可以将分析结果以图表、图像等形式进行可视化展示,并生成详细的分析报告;这有助于研究人员更好地理解和解释分析结果;
进一步的,可以由相关的网络技术人员制定所述分配策略;所述分配策略优选地可以通过对以下因素进行考虑后作出具体的策略考虑,包括:
云计算节点选择:根据预测的复杂程度和计算量,选择合适的云计算节点进行计算处理;云计算节点可以根据计算能力、存储容量、网络带宽等指标进行评估和选择。
虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。也就是说上面讨论的方法,系统和设备是示例。各种配置可以适当地省略,替换或添加各种过程或组件。例如,在替代配置中,可以以与所描述的顺序不同的顺序执行方法,和/或可以添加,省略和/或组合各种部件。而且,关于某些配置描述的特征可以以各种其他配置组合,如可以以类似的方式组合配置的不同方面和元素。此外,随着技术发展其中的元素可以更新,即许多元素是示例,并不限制本公开或权利要求的范围。
在说明书中给出了具体细节以提供对包括实现的示例性配置的透彻理解。然而,可以在没有这些具体细节的情况下实践配置例如,已经示出了众所周知的电路,过程,算法,结构和技术而没有不必要的细节,以避免模糊配置。该描述仅提供示例配置,并且不限制权利要求的范围,适用性或配置。相反,前面对配置的描述将为本领域技术人员提供用于实现所描述的技术的使能描述。在不脱离本公开的精神或范围的情况下,可以对元件的功能和布置进行各种改变。
综上,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (4)
1.一种基于云计算的高效液相串联质谱分析系统,其特征在于,所述分析系统包括检测部、处理部;
其中,所述检测部包括:
液相色谱单元,一个以上所述液相色谱单元被配置为对样品进行液相色谱检测;以及与所述液相色谱单元流体连通的质谱单元,一个以上所述质谱单元被配置为对所述液相色谱单元检测处理后的分离物进行质谱检测;以及
控制单元,被配置为:
通讯连接到所述液相色谱单元和所述质谱单元中的每一个,并控制每一个液相色谱单元和质谱单元进行工作;
接收每一个所述液相色谱单元和质谱单元的基于一个样本的原始检测数据;
对所述原始检测数据进行数据处理流程,获得已处理检测数据,并将所述已处理检测数据传送到所述处理部;
所述处理部包括一个以上的处理器,被配置为:
接收、分析、处理所述已处理检测数据,计算所述已处理检测数据的分析复杂程度,预测对所述已处理检测数据的分析所需的分析运算量;
生成分析请求;
将所述分析请求发送到云计算系统内指定的计算节点;
所述控制单元配置有控制处理器以及控制存储器,所述控制存储器上存储有包括
分析方案的计算机可执行指令;当所述控制存储器上的计算机可执行指令被所述控制处理器执行时,所述控制单元根据所述分析方案控制所述液相色谱单元以及质谱单元进行检测工作;
其中,所述分析方案包括:
用于对分析物进行色谱分离时采用的流动相和/或填充物的不同成分和成分比例;
用于对分析物进行质谱分析时所述质谱单元的工作参数,至少包括以下其中一项以上的组合:自由电离电压、去溶剂化温度、电极电压、碰撞气体温度、碰撞气体压力、碰撞能量;
所述分析请求包括:
已处理检测数据;
分析请求描述,用于描述对所述已处理检测数据的分析需求;
样本标签,用于标记所述已处理检测数据所归属的样本;
以及获取所述已处理检测数据所采用的分析方案;
所述处理部还包括第二存储器;所述第二存储器存储有分配策略以及云计算系统
中包括的计算节点信息;所述处理部的处理器执行所述分配策略,基于所述分析请求进行计算,根据分配策略以及云端的一个以上云计算系统的计算资源的当前利用率,将每个所述分析请求分配到云计算系统的一个以上计算节点进行分析运算,并等待被分配到一个以上计算节点的分析结果反馈;
计算所述已处理检测数据的分析复杂程度包括通过分析样品的至少一项以下信息
预测已处理检测数据的复杂程度:化学结构、分子量、分子环数量、功能基团、分子描述符、样品反应活性;
所述分析系统包括根据以下计算式,计算所述已处理检测数据的分析复杂程度
Q:
;
上式中,W为分离物的分子量,C为分离物的分子环数量,G为分离物的官能团的数量,以上三个数值均为通过对分离物的直接检测可获得的分子特征;λ为修正系数,k1、k2、k3分别为因素权重系数,以上系数由相关技术人员根据云计算系统的计算能力特点进行设定,并且其中λ<-0.1,k3<-1。
2.如权利要求1所述分析系统,其特征在于,所述数据处理流程包括以下步骤:
S100:检测感兴趣区域;
S200:检测色谱峰,然后对所述色谱峰进行积分。
3.如权利要求2所述分析系统,其特征在于,所述分析请求描述还设置请求类型;所述请求类型包括同步请求、异步请求;
其中,当所述请求类型是同步请求时,选择分配给云计算系统内具有最大量的可用计算资源的计算节点;
当所述请求类型是异步请求时,选择分配给云计算系统内具有最小量的可用计算资源的计算节点。
4.如权利要求3所述分析系统,其特征在于,所述处理部还包括配置有通讯模块,用于与所述检测部通讯连接以接收从所述检测部传输的已处理检测数据;还包括用于与所述一个以上云计算系统通讯连接,以至少用于传输所述分析请求,所述分析请求对应的已处理检测数据,以及云计算系统所反馈的分析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311283375.9A CN117007724B (zh) | 2023-10-07 | 2023-10-07 | 一种基于云计算的高效液相串联质谱分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311283375.9A CN117007724B (zh) | 2023-10-07 | 2023-10-07 | 一种基于云计算的高效液相串联质谱分析系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117007724A CN117007724A (zh) | 2023-11-07 |
CN117007724B true CN117007724B (zh) | 2023-12-22 |
Family
ID=88567620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311283375.9A Active CN117007724B (zh) | 2023-10-07 | 2023-10-07 | 一种基于云计算的高效液相串联质谱分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117007724B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109983333A (zh) * | 2016-11-09 | 2019-07-05 | 株式会社岛津制作所 | 色谱质谱分析用数据解析装置 |
WO2020018902A1 (en) * | 2018-07-20 | 2020-01-23 | Waters Technologies Corporation | Liquid chromatography thermal system with thermal status detection |
CN111258767A (zh) * | 2020-01-22 | 2020-06-09 | 中国人民解放军国防科技大学 | 复杂系统仿真应用的云计算资源智能分配方法与装置 |
EP3839546A1 (en) * | 2019-12-20 | 2021-06-23 | Bruker Switzerland AG | System and method for providing training data to enable a neural network to identify signals in nmr measurements |
CN116339986A (zh) * | 2023-03-16 | 2023-06-27 | 重庆邮电大学 | 一种面向核磁谱图特征峰相似度分析算法的并行计算方法 |
-
2023
- 2023-10-07 CN CN202311283375.9A patent/CN117007724B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109983333A (zh) * | 2016-11-09 | 2019-07-05 | 株式会社岛津制作所 | 色谱质谱分析用数据解析装置 |
WO2020018902A1 (en) * | 2018-07-20 | 2020-01-23 | Waters Technologies Corporation | Liquid chromatography thermal system with thermal status detection |
EP3839546A1 (en) * | 2019-12-20 | 2021-06-23 | Bruker Switzerland AG | System and method for providing training data to enable a neural network to identify signals in nmr measurements |
CN111258767A (zh) * | 2020-01-22 | 2020-06-09 | 中国人民解放军国防科技大学 | 复杂系统仿真应用的云计算资源智能分配方法与装置 |
CN116339986A (zh) * | 2023-03-16 | 2023-06-27 | 重庆邮电大学 | 一种面向核磁谱图特征峰相似度分析算法的并行计算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117007724A (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Domingo-Almenara et al. | Metabolomics data processing using XCMS | |
Rosenberger et al. | Statistical control of peptide and protein error rates in large-scale targeted data-independent acquisition analyses | |
Tiwary et al. | High-quality MS/MS spectrum prediction for data-dependent and data-independent acquisition data analysis | |
Domingo-Almenara et al. | Annotation: a computational solution for streamlining metabolomics analysis | |
Wichmann et al. | MaxQuant. Live enables global targeting of more than 25,000 peptides | |
Moruz et al. | Peptide retention time prediction | |
Distler et al. | Drift time-specific collision energies enable deep-coverage data-independent acquisition proteomics | |
Domon et al. | Mass spectrometry and protein analysis | |
Stancliffe et al. | DecoID improves identification rates in metabolomics through database-assisted MS/MS deconvolution | |
Bowen et al. | Dealing with the unknown: metabolomics and metabolite atlases | |
Sugimoto et al. | Prediction of metabolite identity from accurate mass, migration time prediction and isotopic pattern information in CE‐TOFMS data | |
Cuyckens | Mass spectrometry in drug metabolism and pharmacokinetics: Current trends and future perspectives | |
Shahaf et al. | Constructing a mass measurement error surface to improve automatic annotations in liquid chromatography/mass spectrometry based metabolomics | |
Leitner et al. | SnapShot: mass spectrometry for protein and proteome analyses | |
Weissinger et al. | Online coupling of capillary electrophoresis with mass spectrometry for the identification of biomarkers for clinical diagnosis | |
Xu et al. | Deconvolution in mass spectrometry based proteomics | |
Tuli et al. | Using a spike-in experiment to evaluate analysis of LC-MS data | |
Takahashi et al. | AMDORAP: Non-targeted metabolic profiling based on high-resolution LC-MS | |
Sun et al. | BPDA-a Bayesian peptide detection algorithm for mass spectrometry | |
Jeong et al. | FLASHIda enables intelligent data acquisition for top–down proteomics to boost proteoform identification counts | |
JP5636614B2 (ja) | Lc−maldiで得られたデータの比較解析方法 | |
Barnes | Overview of experimental methods and study design in metabolomics, and statistical and pathway considerations | |
CN117007724B (zh) | 一种基于云计算的高效液相串联质谱分析系统 | |
EP3523818B1 (en) | System and method for real-time isotope identification | |
Meng et al. | LipidMiner: a software for automated identification and quantification of lipids from multiple liquid chromatography-mass spectrometry data files |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |