CN115841845A - 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统 - Google Patents

一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统 Download PDF

Info

Publication number
CN115841845A
CN115841845A CN202111102088.4A CN202111102088A CN115841845A CN 115841845 A CN115841845 A CN 115841845A CN 202111102088 A CN202111102088 A CN 202111102088A CN 115841845 A CN115841845 A CN 115841845A
Authority
CN
China
Prior art keywords
lcms
data
module
atlas
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111102088.4A
Other languages
English (en)
Inventor
李进
高森
邓磊
张丽芳
程学敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitgen Inc
Original Assignee
Hitgen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitgen Inc filed Critical Hitgen Inc
Priority to CN202111102088.4A priority Critical patent/CN115841845A/zh
Publication of CN115841845A publication Critical patent/CN115841845A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种LCMS图谱质量检测系统及LCMS数据自动化处理解析收集系统,属于检测分析以及数据处理处理技术领域。本发明的LCMS图谱质量检测系统对LCMS图谱质量的判断准确率高达95%以上,该系统将LCMS图谱数据的质量判断由人工判断转为系统判断,在极大的提高检测速度的同时,实现了判断标准统一,去除了研究人员间的主观差异,避免了人为错判漏判。本发明的LCMS数据自动化处理解析收集系统包括前述LCMS图谱质量检测系统,该LCMS数据自动化处理解析收集系统在快速为研发人员提供LCMS图谱质量筛选的同时,高效并精确建立检测过程中原始数据、相关物料信息以及反应信息的对应关系,使用户可以方便快捷地访问数据库,同时保证数据传输的快速、稳定与安全。

Description

一种LCMS图谱质量检测系统及LCMS数据自动化处理解析收集 系统
技术领域
本发明涉及检测分析以及数据处理处理技术领域,具体是一种LCMS图谱质量检测系统及LCMS数据自动化处理解析收集系统。
背景技术
近年来出现的DNA编码化合物库技术(WO2005058479、WO2018166532、CN103882532),结合了组合化学和分子生物学技术,在分子水平上将每个化合物加上一个DNA标签,并能在极短的时间内合成高达亿级的化合物库,成为下一代化合物库筛选技术的趋势,并开始在制药行业广泛应用,产生了诸多积极的效果(Accounts of ChemicalResearch,2014,47,1247-1255)。
在DNA编码化合物库技术运行过程中,会通过LCMS产生数以百万计的反应数据,各种厂商的LCMS及检测器会产生具有不同参数的图谱,所产生的数据需要通过大量人工进行解析并分析得到最终结果,后通过人工进行汇总及归档。通过人工进行的数据分析工作,人与人之间难以形成高度统一的执行标准,不同仪器间参数的差异也进一步造成难以数据统一化。在进行数据汇总及归档中,也需要人工对大量的数据进行整理、编号,形成对应关系以确保数据的完整性与可追溯性。
实验室的LCMS仪器型号繁杂,检测方法多样,数据格式多样,在读取上存在难度。检测样品种类繁多,需求信息多样,反应类型丰富,相同样品于不同型号LCMS一起进行检测,所产生的图谱形貌及参数不尽相同,统一数据评价方式存在难度。数据经手人员多,数据量大,实现实验室检测、数据解析、数据传递、数据汇总的自动化流程存在很大难度。数据量大,存在异常实验结果,人工对LCMS图谱进行甄选工作量巨大,且不同人员判断标准不统一。进行人工数据解析、处理、分析时存在若干缺点:数据人工传递、人工解析的工作量大、工作繁琐,效率低下且出错性高;数据检测未结构化,无法进行大数据分析;数据人工储存,可追溯性低,易丢失,且查阅麻烦。
另外,在实际工作中,一个工作批次便可能产生上万个样品的LCMS图谱数据,需要进行LCMS检测,检测人员难以对每个数据进行逐一判断,而且在进行人工判断时会出现人与人之间判断标准不一致的风险。同时在这上万个数据当中,很可能有较大比例的数据本身存在质量问题(数据本身存在质量问题包括:(1)MS状态不稳定导致图谱异常而不可信;(2)送检样品前处理不合格导致图谱数据异常而不可信;(3)LCMS色谱柱中杂质残留导致图谱结果相互干扰而不可信等等),如果数据本身存在质量问题,会进一步误导研发人员对数据进行准确判断(例如:(1)无法有效判断低产率数据是由反应本身造成的,还是由数据不可信造成的;(2)无法根据数据判断是真的反应成功了,还是数据质量存在问题而产生了假阳性结果等等),从而产生得出错误结论的风险。
因此,开发出一种LCMS数据自动化处理解析收集的系统,将LCMS图谱质量进行自动、高效、准确的判断,对提升数据质量判断结果的准确性,帮助研发人员快速、准确判断数据结果,得出可靠结论具有重要意义。
发明内容
为了解决上述问题,本发明的目的在于提供一种LCMS图谱质量检测系统及LCMS数据自动化处理解析收集系统。
本发明提供了一种LCMS图谱质量检测系统,所述LCMS图谱质量检测系统包括以下四个模块:
一、输入模块
输入一个批次的LCMS图谱数据;
二、分因素判断模块
分别利用以下4个模块对每一个LCMS图谱数据进行分因素判断:
模块a:判断TIC/PDA图谱保留时间的开始与结尾处是否有明显的高峰;
模块b:进行TIC/PDA图谱差异性识别,判断TIC/PDA图谱中出现的峰的保留时间、峰的大小是否一致;
模块c:判断目标主峰内质谱图是否杂乱;
模块d:识别TIC/PDA图谱的最高峰强度,判断单个图谱数据是否有效,以及单个图谱数据的最高峰强度在整批图谱数据中是否表现异常;
三、LCMS图谱质量判断模块
根据模块二中的分因素判断结果,分别将每一个LCMS图谱数据判断为合格、风险或不合格;
四、结果输入模块
根据模块三的判断结果,统计批次中所有LCMS图谱数据的合格率、风险率和不合格率,输出统计结果。
进一步地,分因素判断模块中,模块a的判断标准为:如果TIC、PDA图谱中的任一图谱保留时间的开始0.7min之内或结尾0.7min之内有峰出现且峰的强度超过该图谱最高强度的70%,则视为有明显的高峰,该分因素判断为不合格;如果TIC和PDA图谱保留时间的开始0.7min之内和结尾0.7min之内无峰出现,或者有峰出现且峰的强度低于该图谱最高峰强度的40%,则视为无明显的高峰,该分因素判断为合格;其余情况该分因素判断为风险;
模块b的判断标准为:若TIC、PDA两个图谱在同一保留时间的峰相对高度相差大于70%,该分因素判断为不合格;若相对高度相差小于40%,该分因素判断为合格;介于两者之间,该分因素判断为风险;
进一步地,模块b中,TIC、PDA图谱保留时间差小于10s的峰认作是同一保留时间的峰;
模块c的判断标准为:取出目标主峰数据,判断质谱图中是否存在大量的毛刺峰,若毛刺峰超过15个,该分因素判断为不合格;若毛刺峰小于10个,该分因素判断为合格;介于两者之间,该分因素判断为风险;
其中目标主峰指为在TIC图谱中峰面积大于30%的峰;
模块d中,判断单个图谱数据是否有效的标准为:如果某一图谱数据的最高峰强度低于LCMS通常检测到的强度的20%,则该图谱视为无效,该分因素判断为不合格;否则判断为合格;
模块d中,判断单个图谱数据的最高峰强度在整批图谱数据中是否表现异常的标准为:如果某一图谱数据的最高峰强度低于该批次图谱数据平均最高峰强度的20%,则视为表现异常,该分因素判断为不合格;如果该图谱数据的最高峰强度高于该批次图谱数据平均最高峰强度的50%,则视为无异常,该分因素判断为合格;介于两者之间,该分因素判断为风险。
进一步地,LCMS图谱质量判断模块中,合格的判断标准为:当模块a~d中的所有分因素均判断为“合格”时,该LCMS图谱数据判断为合格;
风险的判断标准为:当模块a~d中有≥1个分因素判断为“风险”,且无分因素判断为“不合格”时,该LCMS图谱数据判断为风险;
不合格的判断标准为:当模块a~d中有≥1个分因素判断为“不合格”时,该LCMS图谱数据判断为不合格。
本发明还提供了上述LCMS图谱质量检测系统在制备用于判断LCMS图谱质量的设备中的用途。
本发明还提供了一种用于判断LCMS图谱质量的计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序为上述的LCMS图谱质量检测系统。
本发明还提供了一种LCMS数据自动化处理解析收集系统,所述系统包括以下模块:
(一)、LCMS图谱质量检测模块
LCMS图谱质量检测模块由权利要求1~3任一项所述的LCMS图谱质量检测系统组成;
(二)、产率计算模块
根据LCMS仪器输出数据,结合目标分子的分子量,计算出目标分子在所有分子中的比例,得到目标分子的产率。
进一步地,所述系统还包括数据传输模块、数据库模块、结果输出模块。
进一步地,所述数据传输模块由以下3个模块组成:
1)LMCS仪器输出数据模块:该模块定时从多个LCMS仪器端同步原始输出数据至LCMS数据储存数据库,同时建立样品ID与数据文件间的对应关系;
2)研发人员提供的样品信息传递模块:研发人员可通过LCMS仪器端提交该样品信息,也可通过网络服务器提交样品信息,数据传输模块自动对样品ID与原始数据进行匹配;
3)原始数据访问模块:该模块提供web服务,可通过网址链接访问原始数据,通过在结果输出模块中添加超链接方式,相关人员可通过超链接快速访问原始数据及图片;
和/或,所述数据库模块用于储存原始数据、样品原始信息、LCMS图谱质量检测结果、反应产率计算结果等信息;所述数据库模块由以下3个模块组成:
模块1:储存通过LCMS检测仪器端产生的原始数据信息,建立样品ID与数据文件存放路径以及文件名的对应关系;
模块1:储存研发人员提供的样品信息,所述样品信息包括但不限于样品ID、试剂信息、反应信息、结构信息、项目信息、仪器信息、自定义信息等个性化需求信息;
模块3:储存LCMS图谱检测模块的检测结果以及产率计算模块计算的样品产物及副产物产率信息;
和/或,所述结果输出模块输出的结果包含样品ID、样品文件名、反应试剂、反应类型、产物LCMS检测结果、LCMS检测原因及后续操作建议、分子量及产率、原料分子量及产率、位置分子量及产率等详细信息以及LCMS合格率统计信息、产率分布统计信息、原始数据链接。
进一步地,结果输出模块的结果输出方式为通过邮件系统实时发送或通过网页向查询人员提供查询结果。
本发明还提供了上述LCMS数据自动化处理解析收集系统在制备用于LCMS数据自动化处理解析收集的设备中的用途。
本发明中,一个批次的LCMS图谱数据可以是≥1的任意数量。
本发明系统中的阈值可根据实际需要进行调整。
与现有技术相比,本发明取得的有益效果是:
1.本发明的LCMS图谱质量检测系统将对LCMS图谱数据的质量判断由人工判断转为系统判断,在极大的提高检测速度的同时,实现了判断标准统一,去除了研究人员间的主观差异,避免了人为错判漏判。
本发明通过LCMS图谱质量检测系统进行判断,提升了数据质量判断结果的准确性,能够在极大程度上帮助研发人员快速、准确判断数据结果,得出可靠结论,也有助于研发人员对问题数据进行重新准备与重新送样,确保数据质量。
2.本发明的LCMS图谱质量检测系统利用“分因素判断模块”中4个特定的判断因素对LCMS图谱质量进行检测,判断准确率高达95%以上。本发明的LCMS图谱质量检测系统能够一站式地实现异常数据与正常数据的区分及定位,为数据的使用、维护与补充提供了直接依据,无需人工核查。
3.本发明的LCMS图谱质量检测系统的判断结果除了“合格”项和“不合格”项外,还包含“风险”项。由于本实施例的检测系统判断时严格根据设定阈值给定检测结果,对于阈值的判断可能跟实验人员人工检测有关,存在误差,所以本实施例的检测系统在检测结果中设置了缓冲区,即“风险”项,判断为“风险”项的数据表现较差,但总体上也能用于后续实验,风险项也为可接受数据。
4.本发明的LCMS图谱质量检测系统不仅能够输输出批次LCMS图谱数据判断的合格率、风险率和不合格率,还能同时根据分因素判断的结果给出LCMS图谱质量风险类型,输出导致LCMS图谱数据风险或无效的具体原因,为产生该类风险的后续操作提供建议。
5.本发明的LCMS数据自动化处理解析收集系统能够自动化计算反应产率,可批量计算已知分子的产率,同时提供若干未知分子量的产率结果,方便研究人员快速分析,提高工作效率。
6.将多台LCMS的仪器储存由人工自由保存转为系统自动同步保存,可以确保数据的完整性、可追溯性,避免原始数据丢失的风险。
7.LCMS原始数据由系统进行自动管理,提供网络服务对原始数据进行访问,实现一站式送样、解样、分析样流程,人员工作流程大幅缩短。
总之,本发明的LCMS数据自动化处理解析收集系统能够对LCMS图谱质量进行自动、高效、准确的判断,能够进行化学反应产率计算,数据关联、传输、储存,便于查询、追溯、审核数据。该系统同时具有提供数据采集、数据解析处理、数据储存、数据检索的平台,减少了人工环节,在快速为研发人员提供LCMS图谱质量筛选的同时,高效并精确建立检测过程中原始数据、相关物料信息以及反应信息的对应关系,使用户可以方便快捷地访问数据库,同时保证数据传输的快速、稳定与安全。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
附图说明
图1为LCMS数据自动化处理解析收集系统结构示意图。包括:数据传输模块2,用于同步原始数据以及用户提供的样品信息到数据库;数据库模块3,用于储存原始数据、样品原始信息、LCMS图谱质量检测结果、反应产率计算结果等信息,包括LCMS原始数据信息301、样品信息302、LCMS图谱检测结果303、产率计算结果304,4部分信息通过样品ID建立相互关联关系;图谱质量检测模块5,通过图谱前后峰识别、非DNA占比、成簇识别、强度识别对图谱质量进行检测,并将检测结果储存于数据库3;产率计算模块6,通过读取原始数据,以及用户给定的已知分子质量,计算目标分子以及未知分子的产率,并将结果储存于数据库;结果输出模块7,从数据库模块3提取相应的数据,并进行整合,统计数据合格率、产率分布,将结果实时发送给用户。
图2为LCMS图谱质量检测系统示意图。本系统主题通过以下三类图谱进行检测:a)TIC图谱,b)PDA图谱,c)目标峰质谱。主要检测因素包括:1)在TIC/PDA图谱保留时间的开始及结尾是否出现明显的高峰;2)TIC/PDA图谱差异性识别,即TIC/PDA图谱中出现的峰大小、数量、保留时间是否一致;3)目标主峰内质谱峰(即以m/z为横坐标的图谱)是否杂乱;4)识别TIC/PDA图谱的最高峰强度,并从以下两方面进行检测:根据已有经验判断该最高强度是否明显低于一般值;该样品的最高强度在本批次样品中是否明显偏低。
图3为LCMS数据自动化处理解析收集系统的上机检测流程示意图,通过LCMS仪器检测端1录入单一或批量样品信息、检测信息、项目信息、样品码,LCMS仪器检测端可实时完成检测信息批次的建立,并同时建立批量序列、样品码及送样信息的对应关系,检测产生的原始图谱及数据自动通过数据传输模块2传输并储存于数据库3。
图4为部分LCMS图谱。其中第(1)幅为TIC,第(2)幅为PDA,第(3)幅为目标峰展开的质谱图(横坐标为m/z),第(4)幅为高峰重叠合法处理的质谱图(横坐标为分子量),第(5)幅为第(4)幅图的局部放大图。
具体实施方式
以下实施例采用的液相色谱-质谱(LCMS)图谱数据来自于成都先导药物开发股份有限公司DNA编码化合物库研发过程中产生的各类化学反应的LCMS检测数据。部分图谱如图4所示。
实施例1:LCMS图谱质量检测系统
本实施例的LCMS图谱质量检测系统由以下四个模块组成:
一、输入模块
输入一个批次的LCMS图谱数据,共50000个LCMS图谱数据。
二、分因素判断模块
分别利用以下4个模块对每一个LCMS图谱数据进行分因素判断:
模块a:判断TIC/PDA图谱保留时间的开始与结尾是否有明显的高峰。
TIC为Total Ions Chromatograph的缩写,指LCMS图谱中的总离子色谱图;PDA为Photodiode Array Detector的缩写,指LCMS图谱中的二极管阵列检测器图谱。TIC/PDA图谱是LCMS两个检测器所出的图谱,正常情况下,两个图谱的峰是相对一致的。
TIC/PDA图谱同时检测,如果任一图谱保留时间的开始0.7min之内或结尾0.7min之内有峰出现且峰的强度超过该图谱最高强度的70%则视为有明显的高峰,该分因素判断为不合格;如果两个图谱保留时间的开始0.7min之内和结尾0.7min之内无峰出现,或者有峰出现且峰的强度低于最高峰强度40%,则视为无明显的高峰,该分因素判断为合格;其余情况该分因素判断为风险。
模块b:进行TIC/PDA图谱差异性识别,即判断TIC/PDA图谱中出现的峰的保留时间、峰的大小是否一致。
将TIC、PDA图谱中,保留时间差小于10s的峰认作是同一保留时间的峰。在同一保留时间,当TIC、PDA其中一个图谱有峰出现,另一图谱没有峰出现,对比该保留时间的峰时,没有峰的图谱以基线强度作为该点峰强度。若两个图谱在同一保留时间的峰相对高度相差大于70%,该分因素判断为不合格;若相对高度相差小于40%,该分因素判断为合格;介于两者之间为风险。
模块c:判断目标主峰内质谱图是否杂乱。
目标主峰定义为在TIC图谱中峰面积大于30%的峰,质谱图以m/z作为横坐标,峰强度作为纵坐标。判断是否杂乱的方法为取出目标主峰数据,判断质谱图是否存在大量的毛刺峰(图2c),若毛刺峰超过15个,该分因素判断为不合格;若毛刺峰小于10个,该分因素判断为合格;介于两者之间判断为风险。
模块d:识别TIC/PDA图谱的最高峰强度,具体从以下两个方面进行判断:
(1)判断单个样品的图谱数据是否有效。
如果某个样品的图谱最高峰强度远低于LCMS通常检测到的强度的20%,则该图谱视为无效,该分因素判断为不合格;否则判断为合格。
在本实施例中,LCMS通常检测到的强度是由本申请人实验人员根据以往经验确定的,TIC、PDA分别设置为1e7、1e6。具体可根据需要进行调整。
(2)判断单个样品图谱数据的最高峰强度在整批样品图谱数据中是否表现异常。
如果某个样品的图谱最高峰强度低于该批次样品图谱平均最高峰强度的20%,则视为表现异常,该分因素判断为不合格;如果该样品的图谱最高峰强度高于该批次样品图谱平均最高峰强度的50%,则视为无异常,该分因素判断为合格;介于两者之间为风险。
三、LCMS图谱质量判断模块
根据模块二中的分因素判断结果,分别将每一个LCMS图谱数据判断为合格、风险或不合格。
其中,当模块a~d中的所有分因素均判断为“合格”时,该LCMS图谱数据判断为合格;当模块a~d中有≥1个分因素判断为“风险”,且无分因素判断为“不合格”时,该LCMS图谱数据判断为风险;当模块a~d中有≥1个分因素判断为“不合格”时,该LCMS图谱数据判断为不合格。
四、结果输入模块
根据模块三的LCMS图谱数据判断结果,统计批次中所有LCMS图谱数据的合格率、风险率和不合格率,输出统计结果。统计结果显示,该批次LCMS图谱数据的合格率为65%,风险率为15%,不合格率为20%。
同时根据分因素判断的结果给出LCMS图谱质量风险类型,输出导致LCMS图谱数据风险或无效的具体原因,为产生该类风险的后续操作提供建议。
验证本实施例LCMS图谱质量检测系统的判断结果:
以人工判断的结果为标准,验证本实施例LCMS图谱质量检测系统的判断结果。发现该批次LCMS图谱数据的判断准确率高达95%以上,其中,“合格”部分LCMS图谱数据的判断准确率为99%,“不合格”部分LCMS图谱数据的判断准确率为99%,“风险”部分LCMS图谱数据的判断准确率为80%。
由于本实施例的检测系统判断时严格根据设定阈值给定检测结果,对于阈值的判断可能跟实验人员人工检测有关,存在误差,所以本实施例的检测系统在检测结果中设置了缓冲区,即“风险”项,判断为“风险”项的数据表现较差,但总体上也能用于后续实验,风险项也为可接受数据。
实施例2:LCMS数据自动化处理解析收集系统
本实施例的LCMS数据自动化处理解析收集系统由以下五个模块组成:
(一)、LCMS图谱质量检测模块
LCMS图谱质量检测模块由实施例1的LCMS图谱质量检测系统组成。
(二)、产率计算模块
产率计算模块,根据LCMS仪器输出数据,结合仪器本身参数,计算给定的目标分子的产率。同时按产率从高到低的顺序输出若干未给定分子量的未知分子的产率,方便研究人员判断反应副产物。
LCMS仪器会给出检测到的分子的分子量以及相对比例,结合目标分子的的分子量可以计算出目标分子在所有分子中的比例,即目标分子的产率。
(三)、数据传输模块
数据传输模块由以下3个模块组成:
1):LMCS仪器输出数据模块。该模块定时从多个LCMS仪器端同步原始输出数据至LCMS数据储存数据库,同时建立样品ID与数据文件间的对应关系。
2):研发人员提供的样品信息传递模块。研发人员可通过LCMS仪器端提交该样品信息,也可通过网络服务器提交样品信息,数据传输模块自动对样品ID与原始数据进行匹配。
3):原始数据访问模块。该模块提供web服务,可通过网址链接访问原始数据,通过在结果输出模块中添加超链接方式,相关人员可通过超链接快速访问原始数据及图片。
(四)、数据库模块
数据库模块用于储存原始数据、样品原始信息、LCMS图谱质量检测结果、反应产率计算结果等信息。所述数据库模块由以下3个模块组成:
模块1:储存通过LCMS检测仪器端产生的原始数据信息,建立样品ID与数据文件存放路径以及文件名的对应关系。
模块1:储存研发人员提供的样品信息,所述样品信息包括但不限于样品ID、试剂信息、反应信息、结构信息、项目信息、仪器信息、自定义信息等个性化需求信息。
模块3:储存LCMS图谱检测模块的检测结果以及产率计算模块计算的样品产物及副产物产率信息。
(五)、结果输出模块
结果输出模块输出的结果包含样品ID、样品文件名、反应试剂、反应类型、产物LCMS检测结果、LCMS检测原因及后续操作建议、分子量及产率、原料分子量及产率、位置分子量及产率等详细信息以及LCMS合格率统计信息、产率分布统计信息、原始数据链接。结果输出方式主要包含两类:
1)系统收集完成图谱质量检测以及产率计算、整合上述详细信息之后,通过邮件系统实时向相关研究人员发送结果;
2)网页接口,供相关人员随时查询所需结果。
本实施例LCMS数据自动化处理解析收集系统的使用方法包括以下步骤:
S1.通过数据传输模块,将LCMS原始数据结合所述样品ID,仪器信息建立关联并储存于数据库;
S2.通过数据传输模块,获取研发人员提供的样品信息,建立样品ID与样品信息的关联关系;
S3.通过LCMS图谱质量检测模块对原始图谱进行检测,判断样品图谱是否合格并将结果保存于数据库;
S4.通过产率计算模块,计算每个样品反应产物的产率,将结果保存于数据库;
S5.通过结果输出模块从数据库抓取相应信息并根据相互关联信息进行汇总,根据LCMS图谱检测与产率计算模块的结果判定数据质量,数据可信度,统计数据合格率、产率分布,并将结果发送给相关人员。
综上,本发明提供了一种LCMS图谱质量检测系统及LCMS数据自动化处理解析收集系统。本发明的LCMS图谱质量检测系统对LCMS图谱质量的判断准确率高达95%以上,该系统将LCMS图谱数据的质量判断由人工判断转为系统判断,在极大的提高检测速度的同时,实现了判断标准统一,去除了研究人员间的主观差异,避免了人为错判漏判。本发明的LCMS数据自动化处理解析收集系统包括前述LCMS图谱质量检测系统,该LCMS数据自动化处理解析收集系统在快速为研发人员提供LCMS图谱质量筛选的同时,高效并精确建立检测过程中原始数据、相关物料信息以及反应信息的对应关系,使用户可以方便快捷地访问数据库,同时保证数据传输的快速、稳定与安全。

Claims (10)

1.一种LCMS图谱质量检测系统,其特征在于:所述LCMS图谱质量检测系统包括以下四个模块:
一、输入模块
输入一个批次的LCMS图谱数据;
二、分因素判断模块
分别利用以下4个模块对每一个LCMS图谱数据进行分因素判断:
模块a:判断TIC/PDA图谱保留时间的开始与结尾处是否有明显的高峰;
模块b:进行TIC/PDA图谱差异性识别,判断TIC/PDA图谱中出现的峰的保留时间、峰的大小是否一致;
模块c:判断目标主峰内质谱图是否杂乱;
模块d:识别TIC/PDA图谱的最高峰强度,判断单个图谱数据是否有效,以及单个图谱数据的最高峰强度在整批图谱数据中是否表现异常;
三、LCMS图谱质量判断模块
根据模块二中的分因素判断结果,分别将每一个LCMS图谱数据判断为合格、风险或不合格;
四、结果输入模块
根据模块三的判断结果,统计批次中所有LCMS图谱数据的合格率、风险率和不合格率,输出统计结果。
2.根据权利要求1所述的LCMS图谱质量检测系统,其特征在于:分因素判断模块中,模块a的判断标准为:如果TIC、PDA图谱中的任一图谱保留时间的开始0.7min之内或结尾0.7min之内有峰出现且峰的强度超过该图谱最高强度的70%,则视为有明显的高峰,该分因素判断为不合格;如果TIC和PDA图谱保留时间的开始0.7min之内和结尾0.7min之内无峰出现,或者有峰出现且峰的强度低于该图谱最高峰强度的40%,则视为无明显的高峰,该分因素判断为合格;其余情况该分因素判断为风险;
模块b的判断标准为:若TIC、PDA两个图谱在同一保留时间的峰相对高度相差大于70%,该分因素判断为不合格;若相对高度相差小于40%,该分因素判断为合格;介于两者之间,该分因素判断为风险;
模块c的判断标准为:取出目标主峰数据,判断质谱图中是否存在大量的毛刺峰,若毛刺峰超过15个,该分因素判断为不合格;若毛刺峰小于10个,该分因素判断为合格;介于两者之间,该分因素判断为风险;
其中目标主峰指为在TIC图谱中峰面积大于30%的峰;
模块d中,判断单个图谱数据是否有效的标准为:如果某一图谱数据的最高峰强度远低于LCMS通常检测到的强度的20%,则该图谱视为无效,该分因素判断为不合格;否则判断为合格;
模块d中,判断单个图谱数据的最高峰强度在整批图谱数据中是否表现异常的标准为:如果某一图谱数据的最高峰强度低于该批次图谱数据平均最高峰强度的20%,则视为表现异常,该分因素判断为不合格;如果该图谱数据的最高峰强度高于该批次图谱数据平均最高峰强度的50%,则视为无异常,该分因素判断为合格;介于两者之间,该分因素判断为风险。
3.根据权利要求2所述的LCMS图谱质量检测系统,其特征在于:LCMS图谱质量判断模块中,合格的判断标准为:当模块a~d中的所有分因素均判断为“合格”时,该LCMS图谱数据判断为合格;
风险的判断标准为:当模块a~d中有≥1个分因素判断为“风险”,且无分因素判断为“不合格”时,该LCMS图谱数据判断为风险;
不合格的判断标准为:当模块a~d中有≥1个分因素判断为“不合格”时,该LCMS图谱数据判断为不合格。
4.权利要求1~3任一项所述系统在制备用于判断LCMS图谱质量的设备中的用途。
5.一种用于判断LCMS图谱质量的计算机设备,其特征在于:所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序为权利要求1~3任一项所述的LCMS图谱质量检测系统。
6.一种LCMS数据自动化处理解析收集系统,其特征在于:所述系统包括以下模块:
(一)、LCMS图谱质量检测模块
LCMS图谱质量检测模块由权利要求1~3任一项所述的LCMS图谱质量检测系统组成;
(二)、产率计算模块
根据LCMS仪器输出数据,结合目标分子的分子量,计算出目标分子在所有分子中的比例,得到目标分子的产率。
7.根据权利要求6所述的LCMS数据自动化处理解析收集系统,其特征在于:所述系统还包括数据传输模块、数据库模块、结果输出模块。
8.根据权利要求7所述的LCMS数据自动化处理解析收集系统,其特征在于:所述数据传输模块由以下3个模块组成:
1)LMCS仪器输出数据模块:该模块定时从多个LCMS仪器端同步原始输出数据至LCMS数据储存数据库,同时建立样品ID与数据文件间的对应关系;
2)研发人员提供的样品信息传递模块:研发人员可通过LCMS仪器端提交该样品信息,也可通过网络服务器提交样品信息,数据传输模块自动对样品ID与原始数据进行匹配;
3)原始数据访问模块:该模块提供web服务,可通过网址链接访问原始数据,通过在结果输出模块中添加超链接方式,相关人员可通过超链接快速访问原始数据及图片;
和/或,所述数据库模块用于储存原始数据、样品原始信息、LCMS图谱质量检测结果、反应产率计算结果等信息;所述数据库模块由以下3个模块组成:
模块1:储存通过LCMS检测仪器端产生的原始数据信息,建立样品ID与数据文件存放路径以及文件名的对应关系;
模块1:储存研发人员提供的样品信息,所述样品信息包括但不限于样品ID、试剂信息、反应信息、结构信息、项目信息、仪器信息、自定义信息等个性化需求信息;
模块3:储存LCMS图谱检测模块的检测结果以及产率计算模块计算的样品产物及副产物产率信息;
和/或,所述结果输出模块输出的结果包含样品ID、样品文件名、反应试剂、反应类型、产物LCMS检测结果、LCMS检测原因及后续操作建议、分子量及产率、原料分子量及产率、位置分子量及产率等详细信息以及LCMS合格率统计信息、产率分布统计信息、原始数据链接。
9.根据权利要求8所述的LCMS数据自动化处理解析收集系统,其特征在于:结果输出模块的结果输出方式为通过邮件系统实时发送或通过网页向查询人员提供查询结果。
10.权利要求6~9任一项所述系统在制备用于LCMS数据自动化处理解析收集的设备中的用途。
CN202111102088.4A 2021-09-18 2021-09-18 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统 Pending CN115841845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111102088.4A CN115841845A (zh) 2021-09-18 2021-09-18 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111102088.4A CN115841845A (zh) 2021-09-18 2021-09-18 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统

Publications (1)

Publication Number Publication Date
CN115841845A true CN115841845A (zh) 2023-03-24

Family

ID=85575220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111102088.4A Pending CN115841845A (zh) 2021-09-18 2021-09-18 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统

Country Status (1)

Country Link
CN (1) CN115841845A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680337A (zh) * 2023-07-10 2023-09-01 天津云检医学检验所有限公司 一种qPCR检测数据可视化处理方法、系统和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680337A (zh) * 2023-07-10 2023-09-01 天津云检医学检验所有限公司 一种qPCR检测数据可视化处理方法、系统和存储介质

Similar Documents

Publication Publication Date Title
US8538983B2 (en) Systems, methods, and apparatus for facilitating chemical analyses
US20130277542A1 (en) Mass analyzing apparatus, analyzing method and calibration sample
US20130018618A1 (en) Method and system for automated quality control platform
US10598639B2 (en) Three-dimensional spectral data processing device and processing method
CN106574914B (zh) 全二维色谱用数据处理装置
CN115841845A (zh) 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统
CN109801677A (zh) 测序数据自动化分析方法、装置和电子设备
CN111551644A (zh) 基于离子迁移谱技术对进口香米原产地溯源的方法
WO2013012798A1 (en) Method and system for automated quality control platform
CN109507348B (zh) 聚合物型药用辅料组成成分的计算机辅助分析系统及方法
US20190056361A1 (en) Analysis information management system
Ara et al. MassBase: A large-scaled depository of mass spectrometry datasets for metabolome analysis
CN112634997A (zh) 一种甾醇数据库建立及甾醇分析方法
CN112148591A (zh) 一种办公软件兼容性测试系统及方法
CN114295766A (zh) 基于稳定同位素标记的代谢组学数据的处理方法和装置
Hu et al. The Bridge between Screening and Assessment: Establishment and Application of Online Screening Platform for Food Risk Substances
CN113506011A (zh) 一种基于质量验证与推广的终端系统
CN111474287A (zh) 一种计算机辅助药物分析组成成份的系统及方法
CN115130624A (zh) 分析作业管理装置以及分析作业管理方法
WO2018158801A1 (ja) スペクトルデータの特徴抽出装置および方法
CN113744814B (zh) 基于贝叶斯后验概率模型的质谱数据搜库方法及系统
CN117907512B (zh) 基于固相萃取流速与内标物选型关系构建的污水检测方法
CN117213631B (zh) 一种光谱仪运行监测方法及系统
CN117577210A (zh) 一种低聚物识别方法、装置、计算机系统及存储介质
CN117373586B (zh) 血糖数据比对方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination