CN109507348B - 聚合物型药用辅料组成成分的计算机辅助分析系统及方法 - Google Patents

聚合物型药用辅料组成成分的计算机辅助分析系统及方法 Download PDF

Info

Publication number
CN109507348B
CN109507348B CN201811240919.2A CN201811240919A CN109507348B CN 109507348 B CN109507348 B CN 109507348B CN 201811240919 A CN201811240919 A CN 201811240919A CN 109507348 B CN109507348 B CN 109507348B
Authority
CN
China
Prior art keywords
sample
mass spectrum
database
matching
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811240919.2A
Other languages
English (en)
Other versions
CN109507348A (zh
Inventor
田润涛
张金兰
高佳敏
王喆
李浩锋
铁偲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chemmind Technologies Co ltd
Institute of Materia Medica of CAMS
Original Assignee
Chemmind Technologies Co ltd
Institute of Materia Medica of CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chemmind Technologies Co ltd, Institute of Materia Medica of CAMS filed Critical Chemmind Technologies Co ltd
Priority to CN201811240919.2A priority Critical patent/CN109507348B/zh
Publication of CN109507348A publication Critical patent/CN109507348A/zh
Application granted granted Critical
Publication of CN109507348B publication Critical patent/CN109507348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了聚合物型药用辅料组成成分的计算机辅助分析系统及方法,包括以下步骤:创建聚合物样本数据库;采集待测样本数据;数据导入;识别待测样本的一级质谱数据的一级质谱离子峰,并与样本一级质谱数据库匹配;识别符合匹配条件的一级质谱离子峰,并将其保留时间与样本一级质谱数据库匹配;提取符合匹配条件的一级质谱离子峰数据,计算实测同位素丰度分布,并将其与样本同位素理论丰度分布数据库匹配及打分;识别待测样本的二级质谱数据的二级质谱离子峰,并与样本二级质谱数据库匹配;输出待测样本组成成分分析结果。该分析系统及方法能够实现聚合物型药用辅料组成组分的全面、快速、准确分析,能够有效避免人工分析中耗时、误判等问题。

Description

聚合物型药用辅料组成成分的计算机辅助分析系统及方法
技术领域
本发明涉及化学分析领域,具体来说,涉及聚合物型药用辅料组成成分的计算机辅助分析系统及方法。
背景技术
药用辅料系指生产药品和调配处方时使用的赋形剂和附加剂,是除活性成分或前体以外,在安全性方面已经进行了合理的评估,并且包含在药物制剂中的物质(中华人民共和国药典,2015年版,四部,32)。
在作为非活性物质时,药用辅料除了赋形、充当载体、提高稳定性外,还具有增溶、助溶、调节释放等重要功能,是可能会影响到制剂的质量、安全性和有效性的重要成分。例如,聚合物型药用辅料常被用作药品的缓释材料(乙交酯丙交酯共聚物)、包衣材料(聚丙烯酸树脂、聚甲丙烯酸铵酯等)、乳化剂(司盘、吐温等)、润滑剂(聚乙二醇1000、聚乙二醇1500)等。这些药用辅料被广泛用于片剂、胶囊以及注射剂等药物的制备中,其本身的安全性以及药物-辅料相互作用及其安全性得到了药物研究者的广泛关注。
由于很多药辅材料都是组成复杂的混合物,通过对其组成成分的深入研究,可分析鉴别并定量药辅材料中的每种成分,有助于评价药辅材料的质量和安全性。目前,高分辨液质联用法因具备分离效率高、灵敏度高、定性定量能力强等优点而成为分析复杂样本的有力手段之一。然而,高分辨液质联用法的实验数据量较大,分析过程复杂,分析人员手动人工分析数据会耗费大量时间和精力,易产生主观判断误差,不能保证分析结果的准确性,更不利于分析方法的可复制性推广。
发明内容
针对相关技术中的上述技术问题,本发明提出聚合物型药用辅料组成成分的计算机辅助分析系统及方法,能够实现聚合物药用辅料组成组分的全面、快速、准确分析。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种聚合物型药用辅料组成成分的计算机辅助分析系统,包括:
样本数据库,所述样本数据库包括样本一级质谱数据库、样本同位素理论丰度分布数据库和样本二级质谱数据库,用于与待测样本数据进行匹配;
数据采集模块:用于采集待测样本高分辨液质联用仪数据,所述高分辨液质联用仪数据包括一级质谱数据、二级质谱数据及保留时间;
数据导入模块:用于将采集的待测样本高分辨液质联用仪数据导入系统;
识别与匹配模块:用于识别待测样本的高分辨液质联用仪数据,并将其与样本数据库匹配;
数据输出模块:用于将待测样本组成成分分析结果输出。
进一步地,所述识别与匹配模块具体包括一级质谱质荷比识别与匹配模块、一级质谱离子峰保留时间识别与匹配模块、一级质谱离子峰同位素丰度分布计算与匹配模块和二级质谱离子峰质荷比识别与匹配模块。
一种聚合物型药用辅料组成成分的计算机辅助分析方法,该方法包括以下步骤:
S1创建聚合物样本数据库,所述样本数据库包括样本一级质谱数据库、样本同位素理论丰度分布数据库和样本二级质谱数据库;
S2采集待测样本高分辨液质联用仪数据,所述高分辨液质联用仪数据包括一级质谱数据、二级质谱数据及保留时间;
S3数据导入;
S4识别待测样本的一级质谱数据的一级质谱离子峰,并与样本一级质谱数据库匹配;
S5识别符合步骤S4匹配条件的一级质谱离子峰,并将其保留时间与样本一级质谱数据库匹配;
S6提取符合步骤S5匹配条件的一级质谱离子峰数据,计算实测同位素丰度分布,并将其与样本同位素理论丰度分布数据库匹配及打分;
S7识别待测样本的二级质谱数据的二级质谱离子峰,并与样本二级质谱数据库匹配;
S8输出待测样本组成成分分析结果。
进一步地,步骤S1所述的样本一级质谱数据库的创建方法为:利用高分辨液质联用仪、核磁共振仪数据,鉴别样本一级质谱离子峰对应的化合物结构,创建样本一级质谱质荷比、保留时间与化合物结构对应的一级质谱数据库;所述样本同位素理论丰度分布数据库的创建方法为:是利用同位素的天然丰度计算出每个样本组成成分的天然同位素分布概率,创建样本同位素丰度分布数据库;样本二级质谱数据库的创建方法为:结合样本化合物结构及高分辨液质联用仪二级质谱数据,分析每个样本组成成分的特征碎片离子,创建样本二级质谱离子峰质荷比与化合物结构对应的二级质谱数据库。
进一步地,计算每个样本组成成分的天然同位素分布概率的方法为:根据分析出的化合物结构,通过公式计算出每个化合物的同位素理论丰度分布,并将理论丰度分布值以单同位素峰为基准进行归一化处理,最终得到每个化合物的同位素理论丰度分布数据库,所述公式为p=Πpi,其中pi为每个原子的丰度。
进一步地,步骤S2所述采集待测样本高分辨液质联用仪数据的方法为:采用反相或者正相高效液相色谱柱作为液相色谱分析柱,高分辨串联质谱仪作为质量分析器,正离子检测模式,获取待测样本的实验分析数据。
进一步地,将步骤S4所述的一级质谱离子峰与样本一级质谱数据库的一级质谱质荷比匹配;将步骤S5所述的保留时间与样本一级质谱数据库的保留时间匹配;将步骤S7所述的二级质谱离子峰与二级质谱数据库的二级质谱离子峰质荷比匹配。
进一步地,步骤S4、S5、S7所述的识别与匹配方法为:利用特定阈值自动识别待测样本的高分辨质谱数据,输出识别结果,然后利用预先的设定阈值将识别结果与样本数据库进行匹配,最后输出匹配结果,匹配的算法为:
Figure BDA0001839275440000041
Figure BDA0001839275440000042
Figure BDA0001839275440000043
Figure BDA0001839275440000044
其中,y为质荷比或保留时间的理论值,
Figure BDA0001839275440000045
为质荷比或保留时间的测量值,err为y和
Figure BDA0001839275440000046
的绝对误差,errrel为相对误差,threshold为匹配阈值;
Figure BDA0001839275440000047
表示:当err小于或等于匹配阈值,则
Figure BDA0001839275440000048
和y匹配,
Figure BDA0001839275440000049
表示,当相对误差errrel小于或等于某匹配阈值,则
Figure BDA00018392754400000410
和y匹配。
进一步地,步骤S6所述打分由如下公式计算,所述公式为:
s=(1-wT|x-y|)*100
Figure BDA00018392754400000411
其中,其中x为离子的理论同位素丰度分布,y为离子的实测同位素丰度分布,s为匹配得分。
进一步地,步骤S8所述的待测样本组成成分分析结果包括:样本组分分布图、提取离子流色谱图、结果列表中的一种或多种。
本发明的有益效果:首先建立样本数据库,通过实测数据与样本数据库的匹配来鉴别待测样本的组成成分,匹配算法及过程全部由软件程序完成,能够实现聚合物型药用辅料组成组分的全面、快速、准确分析,能够有效避免人工分析中耗时、误判等问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的同位素理论丰度分布数据库创建方法流程图;
图2是根据本发明实施例所述的C64H124O26的同位素分布图;
图3是根据本发明实施例所述的一种聚合物型药用辅料组成成分的计算机辅助分析方法流程图;
图4是根据本发明实施例所述的吐温80样本总离子流色谱图;
图5是根据本发明实施例所述的吐温80样本组分分布图;
图6是根据本发明实施例所述的吐温80样本匹配结果叠加EIC图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明实施例所述的一种聚合物型药用辅料组成成分的计算机辅助分析系统,包括:
样本数据库,所述样本数据库包括样本一级质谱数据库、样本同位素理论丰度分布数据库和样本二级质谱数据库,用于与待测样本数据进行匹配;
数据采集模块:用于采集待测样本高分辨液质联用仪数据,所述高分辨液质联用仪数据包括一级质谱数据、二级质谱数据及保留时间;
数据导入模块:用于将采集的待测样本高分辨液质联用仪数据导入系统;
识别与匹配模块:用于识别待测样本的高分辨液质联用仪数据,并将其与样本数据库匹配;
数据输出模块:用于将待测样本组成成分分析结果输出。
所述识别与匹配模块具体包括一级质谱质荷比识别与匹配模块、一级质谱离子峰保留时间识别与匹配模块、一级质谱离子峰同位素丰度分布计算与匹配模块和二级质谱离子峰质荷比识别与匹配模块。
如图3所示,根据本发明实施例所述的一种聚合物型药用辅料组成成分的计算机辅助分析方法,该方法包括以下步骤:
S1创建聚合物样本数据库:
S1-1创建样本一级质谱数据库:采集样本的高分辨液质联用一级、二级质谱数据、保留时间数据和核磁数据等,准确分析鉴别每个一级质谱离子峰对应的化合物结构,创建样本一级质谱质荷比、聚合度、保留时间与样本化合物结构对应的一级质谱数据库。
S1-2创建样本同位素理论丰度分布数据库:根据步骤S1-1分析出的化合物结构及分子式,通过算法计算出每个化合物的同位素理论丰度分布,并将理论丰度分布值以单同位素峰为基准进行归一化处理,最终得到每个化合物的同位素理论丰度分布数据库(由于质谱分辨能力的限制,只取化合物M、M+1、M+2、M+3、M+4的同位素分布值),样本同位素理论丰度分布数据库创建方法流程如图1所示。以C64H124O26为例,其元素组成为{C:64,H:124,O:26},由元素的天然同位素丰度分布库(www.nist.gov)可获得C、H、O的同位素分布,如表1所示(不包括痕量元素)。
表1C、H、O的天然同位素丰度分布
名称 相对原子质量 丰度
C[12] 12.0000000(00) 0.9893
C[13] 13.00335483507(23) 0.0107
H[1] 1.007 825 032 23(9) 0.999885
H[2] 2.014 101 778 12(12) 0.000115
O[16] 15.994 914 619 57(17) 0.99757
O[17] 16.999 131 756 50(69) 0.00038
O[18] 17.999 159 612 86(76) 0.00205
因此,C64H124O26存在多种同位素分子组合。每个组合的分布概率可由下式计算:
p=Πpi
其中pi为每个原子的丰度。例如C[12]64H[1]124O[16]26的丰度为(0.9893)64*(0.999885)124*(0.99757)26=0.46486523431。计算每个组合的丰度可得出C64H124O26的同位素分布,图2是以单同位素峰为基准进行归一化处理后C64H124O26的同位素丰度分布图。
S1-3建立样本二级质谱数据库:根据步骤S1-1分析出的化合物结构及分子式,结合样本的高分辨二级质谱数据,分析每个样本组成成分的特征碎片离子,创建样本二级质谱离子峰质荷比与化合物结构对应的二级质谱数据库。
S2采集待测样本的高分辨液质联用数据。
S3数据导入。
S4一级质谱质荷比识别与匹配:分析待测样本的高分辨液质联用一级质谱数据,提取一级质谱离子峰,利用阈值匹配算法进行实测数据与样本一级质谱质荷比的匹配,符合匹配条件的离子峰保存并进行下一步骤。
S5一级质谱离子峰保留时间识别与匹配:根据步骤S4匹配结果,提取各成分EIC图的保留时间,利用阈值匹配算法进行实测数据与样本一级质谱数据库保留时间的匹配,输出符合匹配条件的离子峰列表。
S6一级质谱离子峰同位素丰度分布匹配及打分。根据步骤S5匹配结果,提取各离子峰的实测同位素丰度分布值(M、M+1、M+2、M+3、M+4),利用软件程序算法进行实测数据与数据库的匹配及打分,软件在分析结果列表中输出匹配打分。所涉及的同位素匹配得分s可由下式计算:
s=(1-wT|x-y|)*100
Figure BDA0001839275440000081
其中x为离子的理论同位素丰度分布,y为离子的实测同位素丰度分布。例如:某离子的理论同位素丰度分布为x=[1.0,0.7571,0.2825,0.0693,0.0411]T,实测同位素丰度分布y=[1.0,0.7793,0.3077,0.0783,0.3974]T,则:
∑x=1.0+0.7571+0.2825+0.0693+0.0411=2.150
w=[1.0,0.7571,0.2825,0.0693,0.0411]T/∑x=[0.46511628,0.35213953,0.13139535,0.03223256,0.01911628]
s=(1–wT[0.,0.0222,0.0252,0.009,0.3563]T)*100=98.18
S7二级质谱离子峰质荷比匹配。分析待测样本的高分辨液质联用二级质谱数据,提取二级质谱离子峰,利用阈值匹配算法进行实测数据与数据库的质荷比匹配,软件在分析结果列表中输出匹配率数据。
S8将步骤S5、S6、S7的匹配结果以样本组分分布图、提取离子流色谱图(叠加EIC图)、分析结果列表中的一种或多种形式输出展示。
上述步骤中,阈值匹配算法即利用特定阈值自动识别待测样本的高分辨质谱数据,输出识别结果,然后利用预先的设定阈值将识别结果与样本数据库进行匹配,最后输出匹配结果,匹配的算法为:
Figure BDA0001839275440000091
Figure BDA0001839275440000092
Figure BDA0001839275440000093
Figure BDA0001839275440000094
其中,y为质荷比或保留时间的理论值,
Figure BDA0001839275440000095
为质荷比或保留时间的测量值,err为y和
Figure BDA0001839275440000096
的绝对误差,errrel为相对误差,threshold为匹配阈值;
Figure BDA0001839275440000097
表示:当err小于或等于匹配阈值,则
Figure BDA0001839275440000098
和y匹配,
Figure BDA0001839275440000099
表示,当相对误差errrel小于或等于某匹配阈值,则
Figure BDA00018392754400000910
和y匹配。
下面以药用辅料吐温80为例,利用本发明的计算机辅助分析方法来分析其组成成分。
分析方法包括如下步骤:
1.创建吐温80样本数据库:
(1)创建样本一级质谱数据库。采集吐温80样本的高分辨液质联用数据、核磁共振氢谱数据,结合文献,准确分析鉴别每个一级质谱离子峰对应的化合物结构,创建样本一级质谱质荷比、聚合度、保留时间与样本结构及名称对应的样本一级质谱数据库如表2所示,其中,母体结构相同但聚合度不同的组分为一组,并用大写字母表示组别。
表2样本一级质谱数据库
Figure BDA0001839275440000101
Figure BDA0001839275440000111
由于数据量大,本实施例只展示数据库中母体结构为“聚氧乙烯山梨糖醇酐单油酸酯”的一级质谱质荷比,如表3所示。
表3一级质谱质荷比
Figure BDA0001839275440000112
Figure BDA0001839275440000121
Figure BDA0001839275440000131
(2)创建样本同位素理论丰度分布数据库。根据上述步骤(1)分析出的吐温80样本组分结构及分子式,通过算法计算出每个化合物的同位素理论丰度分布,并将理论丰度分布值以单同位素峰为基准进行归一化处理,最终得到每个化合物的同位素理论丰度分布数据库(由于质谱分辨能力的限制,只取化合物M、M+1、M+2、M+3、M+4的同位素分布值)。
(3)创建样本二级质谱数据库。根据上述步骤(1)分析出的化合物结构及分子式,结合吐温80样本的高分辨液质联用二级质谱数据,创建样本二级质谱质荷比与样本化合物结构对应的样本二级质谱数据库。
2.采集吐温80样本高分辨液质联用数据,图4是吐温80样本的总离子流色谱图。
3.将吐温80样本的高分辨液质联用数据导入计算机软件程序。
4.一级质谱质荷比识别与匹配。计算机程序自动识别吐温80样本一级质谱数据,按照程序预先设定的阈值参数范围进行一级质谱质荷比的匹配。符合匹配条件的离子峰保存并进行下一步骤。
5.一级质谱离子峰保留时间识别与匹配。计算机程序识别步骤4所得的离子峰数据,按照程序预先设定的阈值参数范围进行一级质谱离子峰保留时间的匹配,输出符合匹配条件的离子峰列表。
6.一级质谱离子峰同位素丰度分布计算与匹配。计算机程序识别步骤5所得的离子峰数据,按照程序预先设定的算法计算这些离子峰的实测同位素分布,并按照程序预先设定的匹配算法进行同位素丰度分布匹配,输出匹配相似性打分。
7.二级质谱特征碎片离子质荷比识别与匹配。计算机程序识别步骤5所得的离子峰数据,按照程序预先设定的阈值参数范围进行二级质谱离子峰质荷比的匹配,输出匹配率数据。
8.输出吐温80样本组成成分分析结果。(1)如图5所示,是本发明实施例吐温80样本步骤5的匹配离子峰散点图,即吐温80样本组分分布图,图中横坐标为组分保留时间,纵坐标为组分质荷比,不同的点形状代表不同的组别,各点代表不同的组成成分,同一形状的点大小不同代表含量的多少,图形越大代表含量越多。以A132S(0.6%)和D19D(10.5%)为例,其注释含义为:A1和D分别代表组分组别;下标32和19分别代表组分对应的聚合度;S代表组分以单电荷形式被检测到;D代表组分以双电荷形式被检测到;括号内百分数为该组分的归一化含量或相对百分含量,其中组分含量用每个组分的EIC图峰面积表示,本实施例中括号内百分数为归一化含量。(2)如图6所示,是本发明实施例吐温80样本步骤5的匹配离子峰的叠加EIC图,图中横坐标为组分保留时间,纵坐标为组分强度,该图能够反映每个组分的强度随保留时间的变化规律,曲线顶点图标形状代表不同的组别,不同的曲线代表不同的组成成分。以A125S(1287.7132)为例,其括号内注释含义为该组分的质荷比,其余注释含义与图5相同。(3)如表4所示,是本发明实施例吐温80样本的分析结果汇总表,由于数据量较大,只展示吐温80样本A1和D两个组别的分析结果。该表给出了吐温80样本组成成分的分析结果:包括组分组别、名称、聚合度、质荷比、保留时间、归一化含量、一级质谱同位素丰度匹配打分及其二级质谱碎片离子匹配率。其中,同位素丰度匹配打分小于60的组分,被认定为假阳性组分,即该“组分”虽然质荷比及保留时间与数据库匹配,但同位素丰度分布情况与数据库相似性较差,所以判定该组分为假阳性组分。同时,二级质谱匹配率数据能够辅助证明分析结果的准确性,即匹配率大于0说明该组分存在与数据库吻合的二级质谱碎片离子,进一步说明该组分为与数据库匹配的真实组分。
表4吐温80样本的分析结果汇总表
Figure BDA0001839275440000151
通过该分析结果,分析人员可以快速了解吐温80样本中包含哪些组分及各组分的相对含量,利于样本质量的快速、准确评价。
综上所述,借助于本发明的上述技术方案,通过同位素分布匹配打分,能够排除假阳性组分,同时,二级质谱匹配率数据能够辅助证明分析结果的准确性,使分析人员可以快速、准确分析出聚合物型药用辅料组成成分。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种聚合物型药用辅料组成成分的计算机辅助分析系统,其特征在于,包括:
样本数据库,所述样本数据库包括样本一级质谱数据库、样本同位素理论丰度分布数据库和样本二级质谱数据库,所述样本数据库用于与待测样本数据进行匹配,其中:
所述样本一级质谱数据库为采集样本的高分辨液质联用一级、二级质谱数据、保留时间数据和核磁数据,准确分析鉴别每个一级质谱离子峰对应的化合物结构,创建样本一级质谱质荷比、聚合度、保留时间与样本化合物结构对应的一级质谱数据库;
所述样本同位素理论丰度分布数据库为通过同位素的天然丰度计算出每个化合物的同位素理论丰度分布概率,并将理论丰度分布值以单同位素峰为基准进行归一化处理,最后创建本同位素丰度分布数据库,所述样本二级质谱数据库为结合样本的化合物结构及高分辨液质联用二级质谱数据,分析每个样本组成成分的特征碎片离子,创建样本二级质谱离子峰质荷比与化合物结构对应的二级质谱数据库;
数据采集模块:用于采集待测样本高分辨液质联用仪数据,所述高分辨液质联用仪数据包括一级质谱数据、二级质谱数据及保留时间;
数据导入模块:用于将采集的待测样本高分辨液质联用仪数据导入系统;
识别与匹配模块:用于识别待测样本的高分辨液质联用仪数据,并将其与样本数据库匹配,其中,所述识别与匹配模块具体包括一级质谱质荷比识别与匹配模块、一级质谱离子峰保留时间识别与匹配模块、一级质谱离子峰同位素丰度分布计算与匹配模块和二级质谱离子峰质荷比识别与匹配模块;
数据输出模块:用于将待测样本组成成分分析结果输出。
2.一种聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,该方法包括以下步骤:
S1 创建聚合物样本数据库,所述样本数据库包括样本一级质谱数据库、样本同位素理论丰度分布数据库和样本二级质谱数据库,进一步包含:
S1.1所述的样本一级质谱数据库的创建方法为:利用高分辨液质联用仪、核磁共振仪数据,鉴别样本一级质谱离子峰对应的化合物结构,创建样本一级质谱质荷比、聚合度、保留时间与化合物结构对应的一级质谱数据库;
S1.2所述样本同位素理论丰度分布数据库的创建方法为:是利用同位素的天然丰度计算出每个样本组成成分的天然同位素分布概率,创建样本同位素丰度分布数据库;
S1.3样本二级质谱数据库的创建方法为:结合样本化合物结构及高分辨液质联用仪二级质谱数据,分析每个样本组成成分的特征碎片离子,创建样本二级质谱离子峰质荷比与化合物结构对应的二级质谱数据库;
S2 采集待测样本高分辨液质联用仪数据,所述高分辨液质联用仪数据包括一级质谱数据、二级质谱数据及保留时间;
S3 数据导入;
S4 识别待测样本的一级质谱数据的一级质谱离子峰,并与样本一级质谱数据库匹配;
S5 识别符合步骤S4匹配条件的一级质谱离子峰,并将其保留时间与样本一级质谱数据库匹配;
S6 提取符合步骤S5匹配条件的一级质谱离子峰数据,计算实测同位素丰度分布,并将其与样本同位素理论丰度分布数据库匹配及打分;
S7识别待测样本的二级质谱数据的二级质谱离子峰,并与样本二级质谱数据库匹配;
S8 输出待测样本组成成分分析结果,所述的待测样本组成成分分析结果包括:样本组分分布图、提取离子流色谱图、结果列表中的一种或多种。
3.根据权利要求2所述的聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,计算每个样本组成成分的天然同位素分布概率的方法为:根据分析出的化合物结构,通过公式计算出每个化合物的同位素理论丰度分布,并将理论丰度分布值以单同位素峰为基准进行归一化处理,最终得到每个化合物的同位素理论丰度分布数据库,所述公式为
p =Ⅱ𝑝𝑖 ,其中pi为每个原子的丰度。
4.根据权利要求2所述的聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,步骤S2所述采集待测样本高分辨液质联用仪数据的方法为:采用反相或者正相高效液相色谱柱作为液相色谱分析柱,高分辨串联质谱仪作为质量分析器,正离子检测模式,获取待测样本的实验分析数据。
5.根据权利要求2所述的聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,将步骤S4所述的一级质谱离子峰与样本一级质谱数据库的一级质谱质荷比匹配;将步骤S5 所述的保留时间与样本一级质谱数据库的保留时间匹配;将步骤S7所述的二级质谱离子峰与二级质谱数据库的二级质谱离子峰质荷比匹配。
6.根据权利要求 5 所述的聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,步骤S4、S5、S7所述的识别与匹配方法为:利用特定阈值自动识别待测样本的高分辨质谱数据,输出识别结果,然后利用预先的设定阈值将识别结果与样本数据库进行匹配,最后输出匹配结果,匹配的算法为:
Figure 95375DEST_PATH_IMAGE001
其中,𝑦为质荷比或保留时间的理论值,
Figure 397175DEST_PATH_IMAGE002
为质荷比或保留时间的测量值,err为𝑦和
Figure 196503DEST_PATH_IMAGE002
的绝对误差,errrel为相对误差,threshold为匹配阈值;match(
Figure 516626DEST_PATH_IMAGE003
)表示:当err小于或等 于匹配阈值,则
Figure 493941DEST_PATH_IMAGE002
和𝑦匹配,matchrel(
Figure 797883DEST_PATH_IMAGE003
)表示,当相对误差errrel小于或等于某匹配阈 值,则
Figure 620477DEST_PATH_IMAGE002
和𝑦匹配。
7.根据权利要求 2 所述的聚合物型药用辅料组成成分的计算机辅助分析方法,其特征在于,步骤 S6 所述打分由如下公式计算,所述公式为:
Figure 326265DEST_PATH_IMAGE004
其中,其中𝒙为离子的理论同位素丰度分布,𝒚为离子的实测同位素丰度分布,s为匹配得分。
CN201811240919.2A 2018-10-24 2018-10-24 聚合物型药用辅料组成成分的计算机辅助分析系统及方法 Active CN109507348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811240919.2A CN109507348B (zh) 2018-10-24 2018-10-24 聚合物型药用辅料组成成分的计算机辅助分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811240919.2A CN109507348B (zh) 2018-10-24 2018-10-24 聚合物型药用辅料组成成分的计算机辅助分析系统及方法

Publications (2)

Publication Number Publication Date
CN109507348A CN109507348A (zh) 2019-03-22
CN109507348B true CN109507348B (zh) 2021-05-18

Family

ID=65746079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811240919.2A Active CN109507348B (zh) 2018-10-24 2018-10-24 聚合物型药用辅料组成成分的计算机辅助分析系统及方法

Country Status (1)

Country Link
CN (1) CN109507348B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111474287A (zh) * 2020-03-19 2020-07-31 杭州憶盛医疗科技有限公司 一种计算机辅助药物分析组成成份的系统及方法
CN112289386A (zh) * 2020-10-23 2021-01-29 中国农业大学 确定化合物分子量的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389335A (zh) * 2012-05-11 2013-11-13 中国科学院大连化学物理研究所 一种鉴定生物大分子的分析装置和方法
CN103308642B (zh) * 2013-06-28 2014-07-09 南京大学 一种同时快速筛查鉴定水样中抗组胺类药物的高效液相色谱-飞行时间质谱联用方法
CN104765984B (zh) * 2015-03-20 2017-07-11 同济大学 一种生物质谱数据库快速建立与搜索的方法
CN105891316A (zh) * 2016-04-26 2016-08-24 山东出入境检验检疫局检验检疫技术中心 一种同时筛查分析纺织品中禁限用染料的方法
CN107543875B (zh) * 2017-03-29 2020-02-18 中国检验检疫科学研究院 一种洗护用品中硝基呋喃类抗生素化学风险物质的筛查方法
CN108287200B (zh) * 2017-04-24 2020-12-18 麦特绘谱生物科技(上海)有限公司 质谱参照数据库的建立方法及基于其的物质分析方法
CN107328842B (zh) * 2017-06-05 2019-10-01 华东师范大学 基于质谱谱图的无标蛋白质定量方法
CN108663455B (zh) * 2018-06-14 2019-11-12 南京大学 一种基于统计策略的沉积物中有机污染物非靶向分析方法及应用

Also Published As

Publication number Publication date
CN109507348A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
Aceña et al. Advances in liquid chromatography–high-resolution mass spectrometry for quantitative and qualitative environmental analysis
US8615369B2 (en) Method of improving the resolution of compounds eluted from a chromatography device
Chan et al. Ultra‐performance liquid chromatography/time‐of‐flight mass spectrometry based metabolomics of raw and steamed Panax notoginseng
CN103563043B (zh) 用于样品定量化学分析的具有对仪器响应的校准的特别是医学领域的系统及其对应方法
US20060151688A1 (en) System and method for metabonomics directed processing of LC-MS or LC-MS/MS data
US10018602B2 (en) Multicomponent quantitative analysis method using chromatography
CN105574474A (zh) 一种基于质谱信息的生物特征图像识别方法
CN109661574B (zh) 质谱分析数据处理装置
US11817185B2 (en) Stable label isotope tracing for untargeted data
CN109507348B (zh) 聚合物型药用辅料组成成分的计算机辅助分析系统及方法
CN107003284A (zh) 多维质谱分析数据处理装置
EP2590206B1 (en) Method and device for estimating the elemental composition of a molecule from an isotopic distribution
JP2007256126A (ja) 質量分析システム
Liu et al. Mass spectrometry-based structure elucidation of small molecule impurities and degradation products in pharmaceutical development
JP2009257961A (ja) 測定物質定量方法及びそれを用いるガスクロマトグラフ質量分析装置
CN111551626A (zh) 基于分子组成和结构指纹识别的串级质谱解析方法
US10041915B2 (en) Mass spectrometry (MS) identification algorithm
Wang et al. Fast pure ion chromatograms extraction method for LC-MS
Wen et al. Direct infusion electrospray ionization-ion mobility-mass spectrometry for rapid metabolite marker discovery of medicinal Phellodendron Bark
CN104359967B (zh) 一种生物质谱重叠同位素轮廓的解析方法
CN111220750A (zh) 一种中药识别平台和利用该平台的中药识别方法
CN114295766A (zh) 基于稳定同位素标记的代谢组学数据的处理方法和装置
Erny et al. Algorithm for comprehensive analysis of datasets from hyphenated high resolution mass spectrometric techniques using single ion profiles and cluster analysis
CN111474287A (zh) 一种计算机辅助药物分析组成成份的系统及方法
CN115004307A (zh) 用于在复杂生物学或环境样品中鉴定化合物的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant