CN114026650A - 用于生成化合物的编码表示的技术 - Google Patents

用于生成化合物的编码表示的技术 Download PDF

Info

Publication number
CN114026650A
CN114026650A CN202080033258.5A CN202080033258A CN114026650A CN 114026650 A CN114026650 A CN 114026650A CN 202080033258 A CN202080033258 A CN 202080033258A CN 114026650 A CN114026650 A CN 114026650A
Authority
CN
China
Prior art keywords
compound
mass
computer
fragment
implemented method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080033258.5A
Other languages
English (en)
Inventor
S·J·恰瓦里尼
C·德芙琳
P·布洛菲
S·J·格罗马诺斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Watson Technology Ireland Ltd
Original Assignee
Watson Technology Ireland Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Watson Technology Ireland Ltd filed Critical Watson Technology Ireland Ltd
Publication of CN114026650A publication Critical patent/CN114026650A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明描述了用于生成化合物的编码表示的技术和装置。在一个实施方案中,例如,装置可包括至少一个存储器和联接到该至少一个存储器的逻辑。该逻辑可被配置成:接收与至少一种化合物相关联的解析信息;生成该至少一种化合物的至少一个编码表示,该编码表示包括使用多个符号表示该至少一种化合物的至少一个属性的至少一个片段。本发明描述了其他实施方案。

Description

用于生成化合物的编码表示的技术
相关申请的交叉引用
本申请要求于2019年5月3日提交的美国临时专利申请号62/842,694的权益和优先权,该临时专利申请的全部内容以引用方式并入。
技术领域
本文的实施方案总体涉及样品的质量分析,并且更具体地,涉及生成和使用编码表示来识别样品中的化合物。
背景技术
质量分析技术(诸如质谱(MS)或液相色谱质谱(LC-MS))用于识别和/或量化样品中的分子种类。在分析期间,来自样品的分子被离子化以获取电荷,然后作为离子被引入质量分析器中。该质量分析器基于这些离子的特性(诸如它们的质荷比(m/z))确定与这些离子相关联的解析信息。检测器产生与这些离子在其特定m/z下的强度相关的信号。常规质量分析实验中对样品组分的识别涉及将解析信息与已知化合物的模型、文库等(例如“化合物文库”)匹配。用于MS分析的化合物文库的非限制性示例可包括NIST数据库和METLIN数据库。该解析信息和这些化合物文库通常是复杂且高分辨率的数据。因此,用于确定样品(尤其是复杂样品)中感兴趣的化合物的常规技术是低效且耗时的过程。因此,使用当前方法无法对复杂样品进行实时或接近实时的分析。
附图说明
图1示出了第一操作环境的实施方案。
图2A和图2B描绘了根据一些实施方案的例示性编码表示。
图3示出了根据一些实施方案的产物离子m/z值的自然分布。
图4描绘了根据一些实施方案的质量亏损相对于产物离子的整数m/z值的图。
图5描绘了根据一些实施方案的与保留时间和漂移时间的时间百分比相关联的信息。
图6描绘了用于生成区段向量的例示性图和表。
图7描绘了一组离子的m/z相对于质量亏损的图和对应区段向量的表。
图8描绘了一组离子的m/z相对于质量亏损的图和对应区段向量的表。
图9描绘了m/z相对于分数m/z的图以及对应数据表。
图10示出了计算架构的实施方案。
具体实施方式
各种实施方案可总体涉及用于生成化合物的编码表示的系统、方法和/或装置。一般来讲,化合物可为或可包括分子、分子片段、前体分子、产物分子等。在一些实施方案中,编码表示可包括由被配置成表示化合物的属性的符号形成的信息元素。在各种实施方案中,编码表示可包括含有字母和数字字符的字符串。在示例性实施方案中,编码表示可包括二进制字符(例如,1和0),诸如二进制字符的字符串,其中这些二进制字符的至少一部分被设定为特定二进制值。在一些实施方案中,编码表示中表示的属性可包括但不限于质量(m)、电荷(z)、质荷比(m/z)、保留时间、漂移时间、碰撞横截面积(CCS A2)等。在示例性实施方案中,编码表示可包括离散的字符片段,其中这些字符片段中的一个或多个字符片段与特定属性相关联。
这样,可使用高分辨率过程(例如,MS、串联MS等)来创建样品中分子种类的编码表示。这些编码表示可为或可包括对应高分辨率文库信息的低分辨率版本。根据一些实施方案生成的编码表示可用作使用高分辨率或低分辨率仪器来识别和/或量化样品中的分子种类的靶标。这样,与常规方法相比,根据一些实施方案使用低分辨率仪器进行质量分析可更有效并且需要更少的处理资源来识别和/或量化样品组分。
在此描述中,可能阐述许多具体细节,例如部件和系统配置,以便提供对所描述的实施方案的更透彻理解。然而,本领域的技术人员将理解,可以在没有这种具体细节的情况下实践所描述的实施方案。另外,未详细示出一些众所周知的结构、元件和其它特征,以避免不必要地使所描述的实施方案模糊。
在以下描述中,对“一个实施方案”、“实施方案”、“示例性实施方案”、“各种实施方案”等的引用指示所描述的技术的实施方案可包括特定特征、结构或特性,但是一个以上的实施方案可能包括该特定特征、结构或特性且并非每个实施方案都必须包括该特定特征、结构或特性。此外,一些实施方案可以具有针对其他实施方案描述的特征中的一些、全部或没有这些特征。
如本说明书和权利要求书中所使用的,除非另有说明,否则使用序数形容词“第一”、“第二”、“第三”等来描述元件仅表示引用元件的特定实例或相似元件的不同实例,而并不意味着暗示如此描述的元件必须在时间、空间、排序或任何其他方式上处于特定顺序。
图1示出了可表示一些实施方案的操作环境100的示例。如图1所示,操作环境100可包括可操作以管理与解析仪器115相关联的解析信息的分析系统105。在一些实施方案中,解析仪器115可为或可包括色谱系统、液相色谱(LC)系统、气相色谱(GC)系统、质量分析器系统、质量检测器系统、质谱仪(MS)系统、离子迁移谱仪(IMS)系统、高效液相色谱(HPLC)系统、超效液相色谱
Figure BDA0003335399250000031
系统、超高效液相色谱(UHPLC)系统、固相萃取系统、样品制备系统、毛细管电泳仪器、它们的组合、它们的部件、它们的变化等。尽管在此详细描述中的示例中使用了LC、MS和LC-MS,但实施方案不限于此,因为在本文中设想了能够根据一些实施方案进行操作的其他解析仪器。
在一些实施方案中,解析仪器115可操作以执行分析。例如,对于LC-MS系统,解析仪器115可分离样品并对分离的样品执行质量分析以生成解析信息136。解析信息136可为或可包括与样品组分的属性相关联的信息,诸如前体分子信息或离子信息、产物分子信息或离子信息、保留时间、漂移时间、电荷、质量、m/z等。在示例性实施方案中,解析信息136可为或可包括作为由解析仪器115执行的分析的结果而生成的信息,诸如值、图、图像、计算、信号等。
在各种实施方案中,分析系统105可包括计算设备110,该计算设备通信地联接到解析仪器115或以其他方式被配置成接收和存储与解析仪器115相关联的解析信息136。例如,解析仪器115可操作以向计算设备110可访问的网络150上的位置提供解析信息,例如,云计算环境和/或节点152a-n。在一些实施方案中,计算设备110可操作以控制、监测、管理或以其他方式处理解析仪器11的各种操作功能。在一些实施方案中,计算设备110可为或可包括独立计算设备,诸如个人计算机(PC)、服务器、平板电脑计算设备、云计算设备等。
如图1所示,计算设备110可包括处理电路120、存储器单元130和收发器140。处理电路120可通信地耦接到存储器单元130和/或收发器140。
处理电路120可包括和/或可访问根据一些实施方案的用于执行处理的各种逻辑。例如,处理电路120可包括和/或可访问化合物编码逻辑122。一般来讲,化合物编码逻辑122可以是被布置成执行与处理分布式账本相关的特定操作(诸如编码、解码、加密、解密、验证等)的电路。处理电路和/或化合物编码逻辑122或其部分可在硬件、软件或它们的组合中实现。如在本申请中所用,术语“逻辑”、“部件”、“层”、“系统”、“电路”、“解码器”、“编码器”和/或“模块”旨在指计算机相关的实体,可能是硬件、硬件和软件的组合、软件或执行中的软件,它们的示例由示例性计算架构1000提供。例如,逻辑、电路等可为和/或可包括但不限于在处理器上运行的进程、处理器、硬盘驱动器、多个存储驱动器(光学和/或磁性存储介质)、对象、可执行程序、执行线程、程序、计算机、硬件电路、集成电路、专用集成电路(ASIC)、可编程逻辑设备(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、片上系统(SoC)、存储器单元、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组、软件部件、程序、应用程序、固件、软件模块、计算机代码、前述项的任何组合等。
尽管图1中将化合物编码逻辑122描绘为在处理电路120内,但实施方案不限于此。例如,化合物编码逻辑122可位于加速器、处理器内核、接口、单独的处理器管芯内,完全实现为软件应用程序(例如,化合物编码应用程序132)等。
存储器单元130可包括呈一个或多个较高速存储器单元形式的各种类型的计算机可读存储介质和/或系统,诸如只读存储器(ROM)、随机存取存储器(RAM)、动态RAM(DRAM)、双数据速率DRAM(DDRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存存储器、聚合物存储器(诸如铁电聚合物存储器、双向存储器、相变或铁电存储器)、硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、磁卡或光卡、设备阵列(诸如独立磁盘冗余阵列(RAID)驱动器)、固态存储器设备(例如USB存储器、固态驱动器(SSD)以及适于存储信息的任何其它类型的存储介质。另外,存储器单元130可包括呈一个或多个较低速存储器单元形式的各种类型的计算机可读存储介质,包括内部(或外部)硬盘驱动器(HDD)、磁性软盘驱动器(FDD)以及用于读取或写入可移动光盘的光盘驱动器(例如CD-ROM或DVD)、固态驱动器(SSD)等。
根据一些实施方案,存储器单元130可存储化合物编码应用程序132,该化合物编码应用程序可单独操作或与化合物编码逻辑122组合操作,以执行各种化合物编码功能。例如,化合物编码应用程序132可在存储器单元130、网络150的节点152a-n、数据存储库等中生成和/或维护编码分子文库134。在各种实施方案中,化合物编码应用程序132可(单独或与其他信息组合的方式)处理解析信息136,以生成用于编码分子文库134的编码表示。
现在参见图2A和图2B,其中描绘了根据一些实施方案的编码表示。如图2A所示,编码表示205可由具有至少一个符号212a-n的至少一个片段210a-n形成。每个片段210a-n的至少一部分可用于编码化合物的一个或多个属性。例如,在一些实施方案中,片段210a-n的一部分可包括未指定或以其他方式未使用的符号,这些符号(例如,前导或尾随0或其他符号)不包括用于表示化合物的信息。在一些实施方案中,至少一个片段210a-n和/或其一部分可用于包括用于识别除化合物的特性之外的其他方面的信息,诸如设备标识符、样品标识符、样品类型(例如,毒理学、食品和环境、配药物、生物医学等)、时间戳信息、操作员信息、实验信息(例如,持续时间、热度、湿度、样品制备信息、分析信息(例如MS、串联MS)、设施信息等。
在一些实施方案中,至少一个片段210a-n和/或其一部分(例如,片段210a-n、符号212a-n等)可包括主键,例如,与样品相关的单独编码、在生成编码表示205和/或其一部分中使用的数据标识符(例如,谱ID)。在各种实施方案中,除了别的之外,主键可提供在解析信息136(例如,谱元数据)和对应编码表示205之间保持监管链。
例如,编码表示205可包括标头或其他片段210a-n,该其他片段包括与样品、化合物、置信度指示标识、库指示标识和/或与编码表示相关联的其他方面相关联的元数据。
如图2B所示,编码表示220可用于使用具有二进制符号的片段210a-f来编码关于化合物的特定信息。在一些实施方案中,图2B的特定编码表示220可被称为高熵数字分子离子签名(HE-DMIS或DMIS)。例如,编码表示220可包括前体z片段210a、前体m/z片段210b、保留时间片段210c、漂移时间片段210d、产物z片段和/或产物离子片段210f。在一些实施方案,可使用一个或多个符号212a-n来表示片段210a-n的特性,诸如用于样品、分析、化合物等的数据的相关性。例如,如果漂移时间片段210d的第一符号为“1”,则这可表示该信息与该样品不相关(或反之亦然)。
编码表示220可包括更多或更少的片段,因为编码表示220仅为了进行示意性的说明。在一些实施方案中,编码表示可以包括1个片段、2个片段、3个片段、5个片段、10个片段、20个片段、50个片段、100个片段、1000个片段和这些值中的任一个值之间的任何值或范围(包括端值)。在各种实施方案中,编码表示205可包括可用于识别化合物和/或与之相关的化合物的任何类型的片段,包括m、z、m/z、前体z、前体m/z、产物z、产物离子、保留时间、漂移时间等。在示例性实施方案中,编码表示可包括可用于编码信息的任何类型的字符,包括但不限于含有字母和数字的字符、二进制符号等。在各种实施方案中,编码表示可包括128位。在一些实施方案中,编码表示205可包括8位、16位、32位、64位、128位、256位、512位、1KB、1MB、1TB和这些值中的任两个值之间的任何值或范围。实施方案不限于此上下文。
在图2B的编码表示220中,前体z和/或产物z可由23位表示,前体m/z可由211位表示,时间(保留和/或漂移(例如,IMS漂移时间)可由210位表示。在各种实施方案中,编码表示205可提供3+11+10+10=34位的前体编码。
在各种实施方案中,包括z、m/z、相对保留时间、相对漂移时间(例如,用于IMS)和/或用于每种前体离子和其相关联的产物离子的碰撞横截面积(CCS A2)的数据或元数据可被编码为HE-DMIS,诸如128位的HE-DMIS。在一些实施方案中,128位中的34位可用于编码前体离子元数据,而剩余94位保留用于产物离子元数据。
例如,编码表示220可描绘三维产物离子谱的编码,包括m/z维度、保留时间维度和漂移时间维度。在三维实验中,对于前体离子,编码可包括z(3位)、整数m/z(11位)、归一化保留时间(10位)、归一化漂移时间(10位)。对于产物离子,z(3位)和产物离子m/z(91位)可被编码。在各种实施方案中,对于二维数据(例如,不包括色谱分离或离子迁移分离的二维数据),可将用于编码归一化值的10位添加到产物离子编码中。
从多个样品中实验生成的HE-DMIS可通过这些多个样品的前体离子编码进行初始匹配。然后可关联匹配的前体的产物离子编码(包括产物离子z)。例如,仅可保留示出具有统计显著性的匹配率(P<0.01)的那些位,用于创建推定或潜在的DMIS。在一些实施方案中,来自多个集合的潜在的DMIS可能会被匹配和关联,直到无论添加多少更多数据集,匹配的区段都不会改变。正是在这一点上,根据一些实施方案,例如该潜在的DMIS可变成或被指定为HE-DMIS,并且被添加到编码分子文库134中作为用于自动化高通量筛选的靶标。在各种实施方案中,每个HE-DMIS可包括主键,例如,与每个HE-DMIS创建中使用的所有样品和谱ID相关的单独编码。除了别的之外,主键可提供在谱或其他元数据和其HE-DMIS之间保持监管链。
图3示出了产物离子m/z值的自然分布。例如,图3描绘了经由7,500个随机选择的人类蛋白(例如,胰蛋白酶)的计算机内胰蛋白酶消化生成的产物离子m/z值的自然分布的图305。所示的分布可能已经根据从任何类别的化学化合物(包括但不限于脂质、代谢物和其他天然产物、食物、杀虫剂、化妆品和其他化学材料,如烃和聚乙二醇)中的计算机内产物离子生成而生成。计算机内产物离子m/z值的分布可以通过前体离子z和产物离子z两者过滤。在一些实施方案中,每个位的产物离子区段宽度(m/z)可基于这些分布而变化。例如,在一些实施方案中,编码过程可设定每个位的区段宽度,使得每个区段的可能产物离子的数量类似或基本上类似(例如,尽可能接近相同)。通过z限制最大m/z并通过整数m/z的自然分布改变每个位的区段宽度,相对于将固定m/z标度除以可用位的数量的简单除法,z增加了DMIS的熵。
在各种实施方案中,保留时间和/或漂移时间的归一化可包括跨被关联的数据集的集合的DMIS和计算出的每个数据集的匹配率。如果前体离子编码和产物离子编码的匹配率相对于集合中的数据集的总数量被认为具有统计显著性(例如,p<0.01),则可创建复合DMSI,仅保留匹配率被认为具有统计显著性的匹配的产物离子位。对于所识别的化合物(例如,来自数据库搜索的肽)的DMIS,可计算每种匹配的产物离子的归一化强度。例如,在各种实施方案中,归一化强度可为或可包括每个单独匹配的产物离子的强度与总和的强度比。在验证位数量不成比例(例如,大于7)的DMIS中,归一化强度在限制要使用哪些位方面起作用。可存在HE-DMIS所要求的位的最小数量和最大数量。最大值和最小值可基于前体离子整数m/z和/或前体离子整数z以及产物离子z以及跨质量标度的哪些位是活动的来预测。当通过整数前体m/z和z检查对应直方图(例如,计数相对于位)时,一些位可能以比其他位高得多的频率被匹配。因此,在示例性实施方案中,通过针对DMIS选择高复制较低频率位,可以增加熵。
图4描绘了质量亏损(分数m/z)相对于产物离子的整数m/z值的关系。如图4所示,散点图405包括表示分子离子的分数部分(质量亏损)的x轴,并且y轴表示整数值。分子离子的电荷与其整数m/z和分数m/z之间的关系的非限制性描述以及采用IMS情况下的漂移时间包括在美国专利9,734,996中,该专利以引用方式并入本文。散点图405的数据带可表示产物离子m/z的电荷态。前体离子的分布可以是相同的。
图5描绘了保留时间和漂移时间的时间百分比的表示510以及超过匹配的产物离子位的最小数量的DMIS的表510,该表按匹配率降序和保留时间升序排序。时间零被指定为最早洗脱编码前体的最高匹配率,时间100被指定为最后洗脱编码前体的最高匹配率。测量绝对时间差值,并且将每个单独的时间归一化为该差值,从而将时间转换为时间%。鉴于疏水性是化学化合物的一种不可变的属性,因此应保持洗脱顺序,从而提供类似的缓冲系统和柱基质。
在一些实施方案中,前体离子谱和/或产物离子谱可根据各种方法来创建。知道每个前体离子的m/z允许编码过程为产物离子编码中的最后一个m/z区段设定最大m/z值。在一些实施方案中,可以通过将最大m/z除以产物离子编码中使用的位的数量来设定每个区段的宽度(m/z)。每个前体生成的HE-DMSI的数量可以为该前体电荷态的直接函数。例如,当碎片化机构是碰撞室时,产物离子的最大电荷态不应高于前体离子的电荷减一,而前体离子的电荷态大于一。单电荷离子在碎片化时产生了相同电荷态的产物离子。因此,当在碰撞室中进行碎片化时,1+前体离子和2+前体离子产生了单电荷产物离子。电荷态大于二的前体离子可以产生从1+到前体离子的z减一的产物离子。
对于特定的质量分析器,可存在可以被隔离和/或传输的最大可测量m/z值。因此,可存在可以被编码为给定m/z和z的前体离子的最高产物离子m/z值。图5的表510示出了可如何通过前体Mr和产物离子m/z和z两者进行产物离子编码。在一些实施方案中,该两者可与对应组产物离子相关联。在各种实施方案中,经由碰撞解离(碰撞室)生成的产物的最大电荷态可等于前体离子的电荷态减1。在示例性实施方案中,用于编码的最大产物离子m/z可与用于产物离子编码的位的数量直接相关,该位的数量可随所采用的实验可用的预离子检测分离技术(例如,色谱技术、离子迁移技术等)的数量而变化。例如,一维分离可能仅需要10位,而二维分离可能需要20位。实施方案不限于此上下文。
如本文所详述的HE-DMIS文库数据的生成可随后用于使用低分辨率仪器的高通量筛选应用程序中。例如,可通过考虑HE-DMIS文库数据和实验推导数据(例如灵敏度、分辨率、动态范围)之间的相对检测差值,将该HE-DMIS文库数据与此类实验推导数据进行比较。例如,可使用简单混合物和复杂混合物中的分子离子的高分辨率MS生成HE-DMIS数据。然后,这些HE-DMIS可用作识别和量化低分辨率仪器中的这些分子离子及其替代物的靶标。
在常规系统中,在MS数据已由MS系统生成并处理之后,使用已知文库(即,NIST、METLIN等)可搜索到该MS数据。常规系统需要大量的MS数据以有利于离子处理(例如,离子识别和/或量化),通常需要TB级的数据。然而,HE-DMIS数据可以紧凑形式替换这些大量的MS数据,而不牺牲离子处理准确性。因此,HE-DMIS数据可允许在数据生成位点处(例如,在解析仪器处)进行实时离子处理。例如,因为操作者可能已经具有HE-DMIS数据,所以如果操作者试图检测杀虫剂,例如,操作者可从云(或其他远程存储系统)提取HE-DMIS数据,当在仪器中生成MS数据时,可在采集点处使用非常少量的信息。因此,在一些实施方案中,HE-DMIS数据可用作过滤器以执行对在仪器中检测到的离子的实时识别。这样,通过使用HE-DMIS数据减少或甚至消除了存储或使用所有MS数据的需要,具体地讲,所需的全部是HE-DMIS表示的一个或多个符号串或位串。
图6描绘了用于生成区段向量的例示性图605和表610。在一些实施方案中,区段向量可包括对应于m/z值的符号串。在各种实施方案中,如果在m/z值处确定离子,则区段向量符号可能为1,否则为0。例如,一旦产物离子m/z区段已被归一化(例如,对于范围在1000至1050的前体Mr),所计算的区段宽度就可用于生成用于各种谱或其他解析数据的区段向量(例如,128个区段向量)。在一些实施方案中,这些谱可包括模拟谱、验证谱和/或实验复合产物离子谱。图7描绘了一组离子的m/z相对于质量亏损的图705和范围在600-1030m/z的对应区段向量的表710。图8描绘了一组离子的m/z相对于质量亏损的图805和对应区段向量的表810。图9描绘了声纳分析的m/z相对于分数m/z的图905和对应数据的表910,以及QE分析的m/z相对于分数m/z的图915和对应数据的表920。
图10示出了适于实现如前所述的各种实施方案的示例性计算架构1000的实施方案。在各种实施方案中,计算架构1000可包括或被实现为电子设备的一部分。在一些实施方案中,计算架构1000可表示例如计算设备110。实施方案不限于此上下文。
如在本申请中所用,术语“系统”和“部件”和“模块”旨在是指与计算机相关的实体,可能是硬件、硬件和软件的组合、软件或执行中的软件,它们的示例由示例性计算架构1000提供。例如,部件可以是但不限于是在处理器上运行的进程、处理器、硬盘驱动器、多个存储驱动器(光学和/或磁性存储介质)、对象、可执行文件、执行线程、程序和/或计算机。举例来说,在服务器上运行的应用程序和服务器两者都可以是部件。一个或多个部件可以驻留在进程和/或执行线程内,并且部件可以位于一台计算机上和/或分布在两台或更多台计算机之间。此外,部件可以通过各种类型的通信介质彼此通信地耦接以协调操作。协调可以涉及单向或双向信息交换。例如,部件可以以通过通信介质传达的信号的形式传达信息。该信息可以实现为分配给各种信号线的信号。在此类分配中,每条消息都是信号。然而,另外实施方案可以替代地采用数据消息。可以通过各种连接发送此类数据消息。示例性连接包括并行接口、串行接口和总线接口。
计算架构1000包括各种通用计算元件,诸如一个或多个处理器、多核处理器,协同处理器、存储器单元、芯片组、控制器、外围设备、接口、振荡器、定时设备、视频卡、音频卡、多媒体输入/输出(I/O)部件、电源等。然而,实施方案不限于计算架构1000的实施方式。
如图10所示,计算架构1000包括处理单元1004、系统存储器1006和系统总线10010。处理单元1004可以是各种可商购获得的处理器中的任一种,包括但不限于:
Figure BDA0003335399250000111
Figure BDA0003335399250000112
处理器;
Figure BDA0003335399250000113
应用程序、嵌入式和安全处理器;
Figure BDA0003335399250000114
Figure BDA0003335399250000115
Figure BDA0003335399250000116
处理器;IBM和
Figure BDA0003335399250000117
Cell处理器;
Figure BDA0003335399250000118
Core(2)
Figure BDA0003335399250000119
Figure BDA00033353992500001110
处理器;以及类似的处理器。双微处理器、多核处理器和其他多处理器架构也可以用作处理单元1004。
系统总线10010为系统部件提供了接口,包括但不限于将系统存储器1006连接到处理单元1004的接口。系统总线10010可以是若干类型的总线结构中的任一种,其可使用各种可商购获得的总线架构中的任一种进一步互连到存储器总线(具有或不具有存储器控制器)、外围总线和本地总线。接口适配器可经由插槽架构连接到系统总线10010。示例性插槽架构可以包括但不限于加速图形端口(AGP)、卡总线、(扩展)工业标准架构((E)ISA)、微通道架构(MCA)、NuBus、外围部件互连(扩展)(PCI(X))、PCI Express、个人计算机存储卡国际协会(PCMCIA)等。
系统存储器1006可包括呈一个或多个较高速存储器单元形式的各种类型的计算机可读存储介质,诸如只读存储器(ROM)、随机存取存储器(RAM)、动态RAM(DRAM)、双数据速率DRAM(DDRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、闪存存储器、聚合物存储器(诸如铁电聚合物存储器、双向存储器、相变或铁电存储器)、硅-氧化物-氮化物-氧化物-硅(SONOS)存储器、磁卡或光卡、设备阵列(诸如独立磁盘冗余阵列(RAID)驱动器)、固态存储器设备(例如USB存储器、固态驱动器(SSD)以及适于存储信息的任何其他类型的存储介质。在图10所示的例示实施方案中,系统存储器1006可包括非易失性存储器1010和/或易失性存储器1012。基本输入/输出系统(BIOS)可以存储在非易失性存储器1010中。
计算机1002可包括呈一个或多个较低速存储器单元形式的各种类型的计算机可读存储介质,包括内部(或外部)硬盘驱动器(HDD)1014、用于读取或写入可移动磁盘10110的磁性软盘驱动器(FDD)1016以及用于读取或写入可移动光盘1022的光盘驱动器1020(例如CD-ROM或DVD)。HDD 1014、FDD 1016和光盘驱动器1020可以分别通过HDD接口1024、FDD接口1026和光盘驱动器接口10210连接到系统总线10010。用于外部驱动器实施方式的HDD接口1024可包括通用串行总线(USB)和IEEE 13104接口技术中的至少一者或两者。
驱动器和相关联的计算机可读介质提供数据、数据结构、计算机可执行指令等的易失性和/或非易失性存储。例如,多个程序模块可以存储在驱动器和存储器单元1010、1012中,包括操作系统1030、一个或多个应用程序1032、其他程序模块1034和程序数据1036。在一个实施方案中,一个或多个应用程序1032、其他程序模块1034和程序数据1036可以包括例如装置105、205、305和/或405的各种应用程序和/或部件。
用户可以通过一个或多个有线/无线输入设备(例如,键盘10310和点击设备诸如鼠标1040)将命令和信息输入到计算机1002中。其他输入设备可以包括麦克风、红外(IR)遥控器、射频(RF)遥控器、游戏手柄、手写笔、读卡器、加密狗、指纹读卡器、手套、图形输入板、操纵杆、键盘、视网膜读取器、触摸屏(例如,电容式、电阻式等)、轨迹球、触控板、传感器、触控笔等。这些和其他输入设备通常通过耦接到系统总线1010的输入设备接口1042连接到处理单元1004,但是可以通过其他接口诸如并行端口、IEEE 13104串行端口、游戏端口、USB端口、IR接口等进行连接。
监视器1044或其他类型的显示设备也经由接口诸如视频适配器1046连接到系统总线10010。监视器1044可以在计算机802的内部或外部。除了监视器1044之外,计算机通常包括其他外围输出设备,诸如扬声器、打印机等。
计算机1002可以经由到一个或多个远程计算机诸如远程计算机10410的有线和/或无线通信使用逻辑连接在联网环境中操作。远程计算机10410可以是工作站、服务器计算机、路由器、个人计算机、便携式计算机、基于微处理器的娱乐设施、对等设备或其他公共网络节点,并且通常包括相对于计算机1002描述的元件中的许多或所有元件,但是为了简洁起见,仅示出了存储器/存储设备1050。所描绘的逻辑连接包括到局域网(LAN)1052和/或更大网络例如广域网(WAN)1054的有线/无线连接。此类LAN和WAN网络环境在办公室和公司中是常见的,并且促成企业范围的计算机网络,诸如内联网,它们全都可以连接到全球通信网络,例如互联网。
当在LAN网络环境中使用时,计算机1002通过有线和/或无线通信网络接口或适配器1056连接到LAN 1052。适配器1056可以促成到LAN1052的有线和/或无线通信,该LAN还可以包括设置在其上的无线接入点,以用于与适配器1056的无线功能性通信。
当在WAN联网环境中使用时,计算机1002可以包括调制解调器10510,或连接到WAN1054上的通信服务器,或具有用于通过WAN 1054诸如通过互联网建立通信的其他方式。调制解调器10510可以是内部的或外部的以及有线和/或无线设备,其经由输入设备接口1042连接到系统总线10010。在联网环境中,相对于计算机1002描绘的程序模块或其部分可以存储在远程存储器/存储设备1050中。应当理解,所示的网络连接是示例性的,并且可以使用在计算机之间建立通信链路的其他手段。
计算机1002可操作为使用IEEE 802系列标准与有线和无线设备或实体(诸如可操作地设置在无线通信中的无线设备(例如IEEE 802.16空中调制技术))通信。这至少包括Wi-Fi(或无线保真)、WiMax和BluetoothTM无线技术等。因此,通信可以是与常规网络一样的预定义的结构,或仅是至少两个设备之间的自组织通信。Wi-Fi网络使用称为IEEE 802.11x(a、b、g、n等)的无线电技术来提供安全、可靠、快速的无线连接性。Wi-Fi网络可以用于将计算机彼此连接,连接到互联网,以及连接到有线网络(使用IEEE 802.3相关媒体和功能)。
本文中已经阐述了许多具体细节以提供对实施方案的透彻理解。然而,本领域技术人员将理解,可在没有这些具体细节的情况下实践实施方案。在其它情况下,没有详细描述众所周知的操作、部件和电路,以免混淆实施方案。可理解的是,本文中公开的具体结构和功能细节可为代表性的,并且不一定限制实施方案的范围。
可使用表述“耦接”和“连接”以及其派生词来描述一些实施方案。这些术语并非旨在互为同义词。例如,可使用术语“连接”和/或“耦接”来描述一些实施方案,以指示两个或更多个元件彼此直接物理或电接触。然而,术语“耦接”还可表示两个或更多个元件不彼此直接接触,但是仍然彼此协作或相互作用。
除非另有明确说明,否则可理解,诸如“处理”、“计算”、“运算”、“确定”等术语是指计算机或计算系统或类似电子计算设备的操作和/或过程,其将计算系统的寄存器和/或存储器内表示为物理量(例如电子)的数据处理和/或转换成类似地表示为计算系统的存储器、寄存器或其他此类信息存储装置、传输或显示装置内的物理量。实施方案不限于该上下文。
应当指出的是,本文所述的方法不必以所描述的次序或以任何特定的次序执行。此外,关于本文标识的方法描述的各种活动可以以串联或并行方式执行。
虽然在本文中已经绘示和描述了具体的实施方案,但是应当理解,预计实现相同的目的的任何布置可以替代所示出的具体的实施方案。本公开旨在涵盖各种实施方案的任何和所有改编或变化。应当理解,以上描述是以例示性方式进行,而不是限制性的。在阅读以上描述后,上述实施方案的组合以及本文未具体地描述的其他实施方案对于本领域的技术人员来说将是显而易见的。因此,各种实施方案的范围包括其中使用上述组合物、结构和方法的任何其他应用。
虽然已经用特定于结构特征和/或方法动作的语言描述了本主题,但是应当理解,所附权利要求中限定的主题不一定限于以上描述的具体的特征或动作。相反,具体的特征和动作被公开为实施权利要求的示例形式。

Claims (20)

1.一种装置,所述装置包括:
至少一个存储器;和
逻辑,所述逻辑耦接到所述至少一个存储器,所述逻辑用于:
接收与至少一种化合物相关联的解析信息,以及
生成所述至少一种化合物的至少一个编码表示,所述编码表示包括使用多个符号表示所述至少一种化合物的至少一个属性的至少一个片段。
2.根据权利要求1所述的装置,所述解析信息在经由至少一个解析仪器对样品进行质量分析期间生成,所述至少一个解析仪器包括液相色谱(LC)系统、气相色谱(GC)系统、质量分析器系统、质谱仪(MS)系统、离子迁移谱仪(IMS)系统、高效液相色谱(HPLC)系统、超效液相色谱
Figure FDA0003335399240000011
系统、超高效液相色谱(UHPLC)系统中的至少一者。
3.根据权利要求1所述的装置,所述多个符号包括二进制符号。
4.根据权利要求1所述的装置,所述至少一个属性包括电荷、质量、质荷比、保留时间或漂移时间中的至少一者。
5.根据权利要求1所述的装置,所述至少一种化合物包括产物离子并且所述至少一个属性包括前体电荷或前体质荷比。
6.根据权利要求1所述的装置,所述至少一个编码表示包括128位字符串。
7.根据权利要求1所述的装置,所述至少一个编码表示包括主键和解析信息,所述主键被配置成使多个样品与所述编码表示相关,所述解析信息包括分析信息或操作信息中的至少一者。
8.根据权利要求1所述的装置,所述至少一个片段包括多个片段,其中至少一个第一片段编码与所述化合物的前体离子相关联的信息并且至少一个第二片段编码与所述化合物的产物离子相关联的信息。
9.根据权利要求1所述的装置,所述至少一个片段包括三位片段中与所述至少一种化合物相关联的电荷、十位片段中与所述至少一种化合物相关联的相对时间或十一位片段中与所述化合物相关联的质荷比中的至少一者。
10.根据权利要求1所述的装置,所述逻辑用于:
接收与样品相关联的第二解析信息,以及
经由对所述第二解析信息和所述至少一个编码表示的比较确定存在于所述样品中的至少一个离子。
11.一种计算机实现的方法,所述计算机实现的方法包括由处理器:
接收与至少一种化合物相关联的解析信息,
生成所述至少一种化合物的至少一个编码表示,所述编码表示包括使用多个符号表示所述至少一种化合物的至少一个属性的至少一个片段。
12.根据权利要求11所述的计算机实现的方法,所述解析信息在经由至少一个解析仪器对样品进行质量分析期间生成,所述至少一个解析仪器包括液相色谱(LC)系统、气相色谱(GC)系统、质量分析器系统、质谱仪(MS)系统、离子迁移谱仪(IMS)系统、高效液相色谱(HPLC)系统、超效液相色谱
Figure FDA0003335399240000021
系统、超高效液相色谱(UHPLC)系统中的至少一者。
13.根据权利要求11所述的计算机实现的方法,所述多个符号包括二进制符号。
14.根据权利要求11所述的计算机实现的方法,所述至少一个属性包括电荷、质量、质荷比、保留时间或漂移时间中的至少一者。
15.根据权利要求11所述的计算机实现的方法,所述至少一种化合物包括产物离子并且所述至少一个属性包括前体电荷或前体质荷比。
16.根据权利要求11所述的计算机实现的方法,所述至少一个编码表示包括128位字符串。
17.根据权利要求11所述的计算机实现的方法,所述至少一个编码表示包括被配置成使多个样品与所述编码表示相关的主键。
18.根据权利要求11所述的计算机实现的方法,所述至少一个片段包括多个片段,其中至少一个第一片段编码与所述化合物的前体离子相关联的信息并且至少一个第二片段编码与所述化合物的产物离子相关联的信息。
19.根据权利要求11所述的计算机实现的方法,所述至少一个片段包括三位片段中与所述至少一种化合物相关联的电荷、十位片段中与所述至少一种化合物相关联的相对时间或十一位片段中与所述化合物相关联的质荷比中的至少一者。
20.根据权利要求11所述的计算机实现的方法,所述方法包括:
接收与样品相关联的第二解析信息,以及
经由对所述第二解析信息和所述至少一个编码表示的比较确定存在于所述样品中的至少一个离子。
CN202080033258.5A 2019-05-03 2020-05-04 用于生成化合物的编码表示的技术 Pending CN114026650A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962842694P 2019-05-03 2019-05-03
US62/842694 2019-05-03
PCT/IB2020/054224 WO2020225715A1 (en) 2019-05-03 2020-05-04 Techniques for generating encoded representations of compounds

Publications (1)

Publication Number Publication Date
CN114026650A true CN114026650A (zh) 2022-02-08

Family

ID=70617177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080033258.5A Pending CN114026650A (zh) 2019-05-03 2020-05-04 用于生成化合物的编码表示的技术

Country Status (4)

Country Link
US (1) US11887700B2 (zh)
EP (1) EP3963591A1 (zh)
CN (1) CN114026650A (zh)
WO (1) WO2020225715A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140316718A1 (en) * 2013-04-19 2014-10-23 Battelle Memorial Institute Methods of resolving artifacts in hadamard-transformed data
US20150090872A1 (en) * 2012-03-30 2015-04-02 Micromass Uk Limited Mass Spectrometer
US20150269356A1 (en) * 2012-09-22 2015-09-24 Bioblocks, Inc. Libraries of compounds having desired properties and methods for making and using them
CN109561064A (zh) * 2017-09-26 2019-04-02 英特尔公司 用于流控制分组处理的技术

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089780B2 (en) * 1999-03-03 2006-08-15 Smiths Detection Inc. Apparatus, systems and methods for detecting and transmitting sensory data over a computer network
CA2451844A1 (en) * 2001-06-27 2003-01-09 Unigen Pharmaceuticals, Inc. Method for generating, screening and dereplicating natural product libraries for the discovery of therapeutic agents
US8462392B2 (en) * 2009-08-13 2013-06-11 Telcordia Technologies, Inc. System and method for multi-resolution information filtering
JP2012084299A (ja) * 2010-10-08 2012-04-26 Jeol Ltd タンデム型飛行時間型質量分析計
US8935101B2 (en) * 2010-12-16 2015-01-13 Thermo Finnigan Llc Method and apparatus for correlating precursor and product ions in all-ions fragmentation experiments
EP2741224A1 (en) * 2012-11-20 2014-06-11 Thermo Finnigan LLC Methods for generating local mass spectral libraries for interpreting multiplexed mass spectra
EP2821940A1 (en) * 2013-07-03 2015-01-07 Lumiprobe GmbH Binary labeling
EP3155639B1 (en) 2014-06-13 2021-08-25 Waters Technologies Corporation System and method for enhancing charge-state determination in electrospray mass spectrometry
EP3304382A4 (en) * 2015-05-29 2019-07-17 Waters Technologies Corporation TECHNIQUES FOR PROCESSING SPECTRAL MASS DATA
US20200265925A1 (en) * 2017-10-18 2020-08-20 The Regents Of The University Of California Source identification for unknown molecules using mass spectral matching
US10838998B2 (en) * 2018-03-31 2020-11-17 Insight Services, Inc. System and methods for evaluating material samples

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150090872A1 (en) * 2012-03-30 2015-04-02 Micromass Uk Limited Mass Spectrometer
US20150269356A1 (en) * 2012-09-22 2015-09-24 Bioblocks, Inc. Libraries of compounds having desired properties and methods for making and using them
US20140316718A1 (en) * 2013-04-19 2014-10-23 Battelle Memorial Institute Methods of resolving artifacts in hadamard-transformed data
CN109561064A (zh) * 2017-09-26 2019-04-02 英特尔公司 用于流控制分组处理的技术

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CHARLES. MERRITT ET AL: "Combined gas chromatography- mass spectrometry-computer system for the analysis of volatile components of foods", 《JOURNAL OF AGRICULTURAL AND FOOD CHEMISTRY》, vol. 22, 1 May 1974 (1974-05-01), pages 750 - 755, XP055727449, DOI: 10.1021/jf60195a011 *
ERIC W. DEUTSCH: "File Formats Commonly Used in Mass Spectrometry Proteomics", 《MOLECULAR & CELLULAR PROTEOMICS》, vol. 11, 6 September 2012 (2012-09-06), pages 1612 - 1621, XP055727467, DOI: 10.1074/mcp.R112.019695 *
KATJA DETTMER ET AL.: "MASS SPECTROMETRY-BASED METABOLOMICS", 《MASS SPECTROMETRY REVIEWS》, vol. 26, 18 August 2006 (2006-08-18), pages 51 - 78 *
LAURA BORLAND ET AL.: "Review of chemical signature databases", 《ANAL BIOANAL CHEM》, vol. 397, 13 March 2010 (2010-03-13), pages 1019 - 1028, XP019839151 *
STEFFEN NEUMANN ET AL: "Computational mass spectrometry for metabolomics: Identification of metabolites and smal molecule", 《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》, vol. 398, 9 October 2010 (2010-10-09), pages 2779 - 2788 *

Also Published As

Publication number Publication date
US20200350039A1 (en) 2020-11-05
WO2020225715A1 (en) 2020-11-12
US11887700B2 (en) 2024-01-30
EP3963591A1 (en) 2022-03-09

Similar Documents

Publication Publication Date Title
Sinitcyn et al. MaxDIA enables library-based and library-free data-independent acquisition proteomics
Webb‐Robertson et al. A statistical selection strategy for normalization procedures in LC‐MS proteomics experiments through dataset‐dependent ranking of normalization scaling factors
López-Fernández et al. Mass-Up: an all-in-one open software application for MALDI-TOF mass spectrometry knowledge discovery
Stancliffe et al. DecoID improves identification rates in metabolomics through database-assisted MS/MS deconvolution
Tsou et al. Untargeted, spectral library‐free analysis of data‐independent acquisition proteomics data generated using Orbitrap mass spectrometers
Zhu et al. Mass spectrometry‐based label‐free quantitative proteomics
Yang et al. MSBooster: improving peptide identification rates using deep learning-based features
Hernandez et al. Why have so few proteomic biomarkers “survived” validation?(Sample size and independent validation considerations)
Wei et al. MetPP: a computational platform for comprehensive two-dimensional gas chromatography time-of-flight mass spectrometry-based metabolomics
Robotti et al. Biomarkers discovery through multivariate statistical methods: a review of recently developed methods and applications in proteomics
Lin et al. A combinatorial approach to the peptide feature matching problem for label-free quantification
Samokhin et al. Evaluation of mass spectral library search algorithms implemented in commercial software
Taylor et al. Accounting for undetected compounds in statistical analyses of mass spectrometry ‘omic studies
Li et al. Interpreting raw biological mass spectra using isotopic mass‐to‐charge ratio and envelope fingerprinting
Aggio et al. Identifying and quantifying metabolites by scoring peaks of GC-MS data
CN114207429A (zh) 用于预测离子迁移谱中的碰撞截面值的技术
CN115004306A (zh) 使用产物离子碰撞截面信息进行样品分析的技术
Tully Toffee–a highly efficient, lossless file format for DIA-MS
Zhang et al. Chromatographic fingerprinting and chemometric techniques for quality control of herb medicines
EP3803381B1 (en) Techniques for sample analysis using consensus libraries
Eckel-Passow et al. An insight into high-resolution mass-spectrometry data
US11887700B2 (en) Techniques for generating encoded representations of compounds
Sun et al. BPDA2d—a 2D global optimization-based Bayesian peptide detection algorithm for liquid chromatograph–mass spectrometry
Edwards Protein identification from tandem mass spectra by database searching
Permiakova et al. CHICKN: extraction of peptide chromatographic elution profiles from large scale mass spectrometry data by means of Wasserstein compressive hierarchical cluster analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination