WO2012126451A2 - Method for identifying in particular unknown substances using mass spectrometry - Google Patents

Method for identifying in particular unknown substances using mass spectrometry Download PDF

Info

Publication number
WO2012126451A2
WO2012126451A2 PCT/DE2012/000177 DE2012000177W WO2012126451A2 WO 2012126451 A2 WO2012126451 A2 WO 2012126451A2 DE 2012000177 W DE2012000177 W DE 2012000177W WO 2012126451 A2 WO2012126451 A2 WO 2012126451A2
Authority
WO
WIPO (PCT)
Prior art keywords
fragmentation
substance
graph
spectrum
mass
Prior art date
Application number
PCT/DE2012/000177
Other languages
German (de)
French (fr)
Other versions
WO2012126451A3 (en
Inventor
Sebastian BÖCKER
Kerstin Scheubert
Florian Rasche
Franziska Hufsky
Original Assignee
Boecker Sebastian
Kerstin Scheubert
Florian Rasche
Franziska Hufsky
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boecker Sebastian, Kerstin Scheubert, Florian Rasche, Franziska Hufsky filed Critical Boecker Sebastian
Publication of WO2012126451A2 publication Critical patent/WO2012126451A2/en
Publication of WO2012126451A3 publication Critical patent/WO2012126451A3/en

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/004Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
    • H01J49/0045Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn characterised by the fragmentation or other specific reaction

Definitions

  • the invention relates to a method for identifying preferably unknown substances by mass spectrometry in order to determine their structure and / or substance classes and / or their chemical properties.
  • Mass spectrometry is one of the currently most common methods for the analysis of preferably unknown substances (for example, J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004).
  • the molecular mass of the examined substance can be determined exactly. Furthermore, it is possible to fragment a substance in the mass spectrometer one or more times, i. H. to break their chemical bonds. The masses of the resulting fragments are then measured again. This results in one or more fragmentation spectra (also called daughter ion spectra).
  • the method presented here can significantly simplify the systematic search for potential drugs by z.
  • B the classes of all occurring in a biological sample small substances (lighter than 1500 daltons) identified. After that only have to even those compounds are examined in more detail, which belong to relevant for the field of application substance classes.
  • Natural substances are all substances that are found in the living and inanimate nature, so especially in plants and animals, but z. B. also found in fossil deposits. This includes, for example, all metabolic products resulting from chemical or enzymatic reactions, as well as the degradation products of artificially added to nature substances such. For example, drugs or environmental toxins. Although natural products are likely to be the main field of application, the process presented is not limited to these. An application is also possible in other areas of chemistry, for example in materials science.
  • mass spectrometry is often preceded by a separation process in order to separate the substances to be identified for mass spectrometry analysis.
  • This separation method is usually gas or liquid chromatography or capillary electrophoresis (for example U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato by gas chromatography-mass spectrometry , Plant J, 2000, 23, 131-142).
  • biopolymers such as, for example, peptides and glycans
  • methods to identify them by means of a fragmentation spectrum (for example A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal , 2005, 15, 964-973 and D, Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-Glycan Structure from Fragmentation Spectra, J Proteome Res., 2006, 5, 1429-1434).
  • this approach requires that the substance class of the substance to be identified (eg recordable peptide or glycan) is known.
  • This method can contribute to the partial identification even if the fragmentation spectrum of a daughter is stored in the database.
  • the application of the method remains limited to such exact matches of daughter ion spectra in the database. Therefore, the method requires very many daughter ion spectra already analyzed for a large number of molecules. Measuring them and analyzing them manually is an enormous effort. The method does not provide information that goes beyond the existence of an exact hit of a daughter ion spectrum.
  • fragmentation graphs for the identification of unknown substances (DE 10 2009 0058 45 AI).
  • this method is highly dependent on the quality of the underlying graphs of fragmentation patterns.
  • a good quality of Fragment réellegraphen is not given in particular for pesticides and alcohols so far, and thus a reliable identification of the unknown substances, especially of pesticides and alcohols, is not possible.
  • aliquoting of trees per se for comparison of RNA structures is known (T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137-148).
  • the labeled nodes of the trees to be compared are superimposed so that the labels differ as little as possible.
  • the trees must be the same, only so-called gap nodes may be inserted into the branches of the tree representation, if necessary.
  • the invention is based on the object to provide an evaluation, which allows for all classes, especially for pesticides and alcohols, an identification of the substance to be evaluated with high reliability and reliability, even if the class of the substance is unknown.
  • the method can be applied in particular to metabolic intermediates, antibiotics, toxins, insecticides, messengers, flavonoids, phenols, xanthones, propanoids, stilbenes, terpenes, steroids, carotenoids, lipids and alkaloids, but is not limited to these substance classes.
  • Fig. 1 Fragmentation spectra of phenylalanine, consisting of an MS 2 spectrum (166 Da) and an MS 3 spectrum (120 Da), and specific MS 3 evaluation of the peaks
  • Fig. 7 Fragmentation graph of phenylalanine, representation again by nodes (fragments) and by edges (neutral losses) a) Creation of a spectral graph with direct and indirect lineage relationships:
  • Phenylalanine was studied by multiple mass spectrometry.
  • the fragmentation was carried out with known collision induced dissociation (CID).
  • CID collision induced dissociation
  • it is also possible to use other fragmentation methods for example, in-source fragmentation, post-source decay, ETD, ECD, HCD or PQD. If the substance to be determined is part of a mixture, it would be useful to perform a separation using gas or liquid chromatography.
  • An edge-weighted, knot-stained graph is constructed in which there is a knot for each possible molecular formula.
  • Two nodes are joined together by a directed edge if the sum formula of the child node is a sub-formula of that of the parent node.
  • Edges represent neutral losses due to fragmentation. They point to direct lineage relationships. All sum formulas that belong to the same peak have the same color.
  • the weights w (u, v) of the edges are determined as a function of peak intensities, mass deviations between predicted molecules and actual peak masses, chemical properties, collision energies of fragmentation and neutral losses (see also S. Böcker & F.
  • Fig. 4 shows the corresponding spectrum graph with indirect lineage relationships (for clarity, the direct lineages of Fig. 3 were neglected and only the indirect lineages were drawn).
  • Fig. 5 shows a more complex case: Assuming that a third fragmentation spectrum shows that the peaks at 103.1 Da can not have originated from the peak at 120.1 Da (evaluation with ⁇ 2 or ⁇ 3 ). Then one possible explanation is that the peaks at 103.1 Da are due to two different fragments of equal mass. This situation is modeled by copying all the structures belonging to the peak 103, 1 Da and coloring the copies in a free color (Fig. 6). This allows the subsequently calculated fragmentation graph to contain the peak twice.
  • the evaluation of a sub-tree is formed by the sum of its direct edge weights (edges from Fig. 2) and the sum of its indirect edge weights (edges from Fig. 4). Indirect edge weights are counted if and only if the child node is either a direct descendant or an indirect descendant of the father node.
  • the Fragmentienmgsgraph- compared stored reference fragmentation graphs is done in a known per se. From this comparison, the substance or substance class (see DE 10 2009 0058 45 Al) are determined.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

It was the object to provide an analysis method, which enables, for all substance classes, in particular also for pesticides and alcohols, identification of the substance to be evaluated with a high safety and reliability. According to the invention, a plurality of mass-spectrometric fragmentation spectra of the substance to be identified are recorded and on this basis a fragmentation graph is determined by calculating the possible molecular formulas for the measured masses, determining direct derivation relationships between said molecular formulas, assessing both the direct and the indirect derivation relationships on the basis of the mass intensities of the peaks in the spectrum and ascertaining from said assessments the best possible fragmentation graph for comparison with reference data. The invention is used in particular in biology, pharmacology and chemistry to determine the structure and/or substance class and/or the chemical properties of unknown substances found.

Description

Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie  Method for identifying in particular unknown substances by mass spectrometry
Die Erfindung betrifft ein Verfahren zur Identifizierung vorzugsweise unbekannter Substanzen durch Massenspektrometrie, um deren Struktur und/oder Stoffklassen und/oder ihre chemischen Eigenschaften zu ermitteln. The invention relates to a method for identifying preferably unknown substances by mass spectrometry in order to determine their structure and / or substance classes and / or their chemical properties.
Massenspektrometrie ist eines der derzeit gebräuchlichsten Verfahren zur Analyse von vorzugsweise unbekannten Substanzen (beispielsweise J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004). Mass spectrometry is one of the currently most common methods for the analysis of preferably unknown substances (for example, J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004).
Durch die Massenspektrometrie lässt sich die Molekülmasse der untersuchten Substanz genau bestimmen. Des Weiteren ist es möglich, eine Substanz im Massenspektrometer einmal oder mehrmals zu fragmentieren, d. h. ihre chemischen Bindungen aufzubrechen. Die Massen der so entstandenen Fragmente werden dann wiederum gemessen. So entstehen ein oder mehrere Fragmentierungsspektren (auch Tochterionenspektren genannt). By mass spectrometry, the molecular mass of the examined substance can be determined exactly. Furthermore, it is possible to fragment a substance in the mass spectrometer one or more times, i. H. to break their chemical bonds. The masses of the resulting fragments are then measured again. This results in one or more fragmentation spectra (also called daughter ion spectra).
Es ist allerdings problematisch, insbesondere für unbekannte chemische Verbindungen, die Struktur und/oder die Stoffklassen und/oder chemischen Eigenschaften dieser Verbindung zu identifizieren, da durch die Massenspektrometrie ausschließlich Massen bestimmt werden können.  However, it is problematic, in particular for unknown chemical compounds, to identify the structure and / or the substance classes and / or chemical properties of this compound, since only masses can be determined by mass spectrometry.
Viele Arzneimittel sowie andere in Industrie und Forschung eingesetzte chemische Stoffe werden in ihrer ursprünglichen Form von Lebewesen produziert und wurden bei diesen durch Zufall oder eine sehr aufwändige Suche entdeckt. Die meisten von Lebewesen produzierten Substanzen sind der Forschung noch völlig unbekannt. Many drugs, as well as other chemicals used in industry and research, are produced in their original form by animals and have been discovered by chance or through a very elaborate search. Most substances produced by living things are still completely unknown to research.
Das hier vorgestellte Verfahren kann die systematische Suche nach potentiellen Wirkstoffen deutlich vereinfachen, indem es z. B. die Stoffklassen aller in einer biologischen Probe vorkommenden kleinen Substanzen (leichter als 1500 Dalton) identifiziert. Danach müssen nur noch diejenigen Verbindungen genauer untersucht werden, die zu für das Anwendungsgebiet relevanten Stoffklassen gehören. The method presented here can significantly simplify the systematic search for potential drugs by z. B. the classes of all occurring in a biological sample small substances (lighter than 1500 daltons) identified. After that only have to even those compounds are examined in more detail, which belong to relevant for the field of application substance classes.
Die Substanzidentifikation von Pharmazeutika und Naturstoffen ist also aufgrund der großen Relevanz dieser Stoffe für die Medizin sowie die pharmazeutische und biologische Forschung besonders interessant. Naturstoffe sind alle Substanzen, die sich in der belebten und unbelebten Natur, also vor allem in Pflanzen und Tieren, aber z. B. auch in fossilen Lagerstätten finden. Hierunter fallen zum Beispiel alle durch chemische oder enzymatische Reaktionen entstandene Stoffwechselprodukte, aber auch die Abbauprodukte von künstlich der Natur zugefügten Stoffen, wie z. B. Arzneimitteln oder Umweltgiften. Auch wenn Naturstoffe wahrscheinlich das Hauptanwendungsgebiet darstellen, ist das vorgestellte Verfahren nicht auf diese beschränkt. Eine Anwendung ist auch in anderen Bereichen der Chemie möglich, beispielsweise in der Materi al wi ssenschaft. The substance identification of pharmaceuticals and natural products is therefore particularly interesting because of the great relevance of these substances for medicine and pharmaceutical and biological research. Natural substances are all substances that are found in the living and inanimate nature, so especially in plants and animals, but z. B. also found in fossil deposits. This includes, for example, all metabolic products resulting from chemical or enzymatic reactions, as well as the degradation products of artificially added to nature substances such. For example, drugs or environmental toxins. Although natural products are likely to be the main field of application, the process presented is not limited to these. An application is also possible in other areas of chemistry, for example in materials science.
Da Naturstoffe meist als Gemische vorliegen (z. B. Zellextrakt, Umweltprobe) wird der Massenspektrometrie oft ein Trennverfahren vorgeschaltet, um die zu identifizierenden Substanzen für die massenspektrom einsehe Analyse zu separieren. Dieses Trennverfahren ist üblicherweise die Gas- oder Flüssigchromatographie oder die Kapillarelektrophorese (beispielsweise U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry, Plant J, 2000, 23, 131-142). Since natural substances are usually present as mixtures (eg cell extract, environmental sample), mass spectrometry is often preceded by a separation process in order to separate the substances to be identified for mass spectrometry analysis. This separation method is usually gas or liquid chromatography or capillary electrophoresis (for example U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato by gas chromatography-mass spectrometry , Plant J, 2000, 23, 131-142).
Für bestimmte Stoffklassen, insbesondere Biopolymere (wie z. B, Peptide und Glykane) gibt es Verfahren, diese mithilfe eines Fragmentierungsspektrums zu identifizieren (beispielsweise A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal. Chem., 2005, 15, 964-973 und D, Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-glycan strueture from fragmentation spectra, J Proteome Res., 2006, 5, 1429- 1434). Dieser Ansatz setzt jedoch voraus, dass die Stoffklasse der zu identifizierenden Substanz (also bespielsweise Peptid oder Glykan) bekannt ist. Eine Anwendung dieser Verfahren auf Stoffklassen, die keine Polymere sind, ist nicht möglich. Es ist bekannt (beispielsweise R. Mistrik: XCalibur HighChem: Mass Frontier Software. HighChem/ThermoFinnigan, Manual 2001) Fragmentierungsmuster, die mit der massenspektrometrischen Analyse ermittelt werden, mit manuell aus Referenzdaten gewonnenen idealisierten Mustern, sogenannten Regeln, zu vergleichen. Eine solche Gegenüberstellung wäre vom Grundsatz automatisierbar, setzt allerdings voraus, dass die entsprechenden Regeln für den untersuchten Stoff erstellt wurden, ist deshalb für nicht bekannte Substanzen in keiner Weise anwendbar. Darüber hinaus können diese regelbasierten Ansätze fehlerbehaftete Daten nicht verarbeiten, was sie für die Praxis unbrauchbar macht (K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & GJ. Langley: Approaches towards the automated Interpretation and prediction of electrospray tandem mass spectra of non- peptidic combinatorial Compounds, Rapid Commun Mass Spectrom, 2003, 17, 1 163- 1 168). For certain classes of substances, in particular biopolymers (such as, for example, peptides and glycans), there are methods to identify them by means of a fragmentation spectrum (for example A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal , 2005, 15, 964-973 and D, Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-Glycan Structure from Fragmentation Spectra, J Proteome Res., 2006, 5, 1429-1434). , However, this approach requires that the substance class of the substance to be identified (eg recordable peptide or glycan) is known. An application of these methods to classes of substances that are not polymers is not possible. It is known (for example, R. Mistrik: XCalibur High Chem: Mass Frontier Software, High Chem / Thermo Finninn, Manual 2001) to compare fragmentation patterns, which are determined by mass spectrometric analysis, with idealized patterns, so-called rules, obtained manually from reference data. Such a comparison would, of course, be automatable, but assuming that the corresponding rules were established for the substance under investigation, it is therefore in no way applicable to unknown substances. Moreover, these rule-based approaches can not handle erroneous data, rendering them unusable in practice (K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & GJ Langley: Approaches to Automated Interpretation and Prediction of electrospray tandem mass spectra of non-peptidic combinatorial compounds, Rapid Commun Mass Spectrom, 2003, 17, 163-1668).
Für den speziellen Fall, dass ein unter gleichen Messbedingungen erstelltes Fragmentierungsspektrum bereits identisch in einer Referenzdatenbank vorhanden ist, wäre es möglich, die untersuchte Substanz mittels rechentechnischen Vergleichs durch Suche des Spektrums in der Referenzdatenbank aufzufinden und auf diese Weise zu identifizieren (L. Vogt, T. Gröger & R. Zimmermann: Automated Compound Classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1 150, 2-12; DE 103 58 366 B4, US 6,624,408 B l , US 2003 023 66 36 A I , US 6,747,272 B2). For the special case that a fragmentation spectrum created under identical measurement conditions already exists identically in a reference database, it would be possible to find the examined substance by means of computational comparison by searching the spectrum in the reference database and to identify in this way (L. Vogt, T Gröger & R. Zimmermann: Automated Compound Classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1 150, 2-12, DE 103 58 366 B4, US Pat. No. 6,624,408 B1, US 2003 023 66 36 A1, US Pat. No. 6,747,272 B2).
Dieses Verfahren funktioniert nicht bei gänzlich unbekannten Substanzen, da ein Referenzspektrum der Substanz vorhanden sein muss. Zusätzlich sind Fragmentierungsspektren zum Teil stark von äußeren Parametern abhängig und unterscheiden sich daher von Labor zu Labor. Direkte Vergleiche zwischen Spektren sind in diesem Fall nicht aussagekräftig, daher ist eine Suche nach einem unter vergleichbaren Bedingungen vorliegenden identischen Referenzspektrum in den wenigsten Anwendungsfällen möglich. Um diesen letztgenannten Nachteil zu umgehen, ist es auch bekannt, in einer Datenbank nach Fragment-Ionen zu suchen, die dort zu definierten Fragmentierungsmustern gespeichert sind (US 7,197,402 B2). Diese Ionen müssen dann entweder eine bekannte, eindeutige Struktur besitzen, oder es müssen mit zusätzlicher massenspektrometrischer Untersuchung Fragmentierungsspektren dieser Ionen gemessen werden. Diese durch mehrfache Fragmentierung entstandenen Spektren (MSn) sollen, wie angegeben, vergleichbarer, als die vorgenannten 'einfachen1 Fragmentierungsspektren sein. This method does not work for completely unknown substances, as a reference spectrum of the substance must be present. In addition, fragmentation spectra depend in part strongly on external parameters and therefore differ from laboratory to laboratory. Direct comparisons between spectra are not meaningful in this case, therefore a search for an identical reference spectrum present under comparable conditions is possible in only a few applications. In order to circumvent this latter disadvantage, it is also known to search in a database for fragment ions which are stored there to defined fragmentation patterns (US Pat. No. 7,197,402 B2). These ions must then either have a known, unambiguous structure or fragmentation spectra of these ions must be measured with additional mass spectrometric analysis. These spectra (MS n ) resulting from multiple fragmentation should, as stated, be more comparable than the abovementioned simple 1 fragmentation spectra.
Dieses Verfahren kann schon dann zur teilweisen Identifizierung beitragen, wenn das Fragmentierungsspektrum eines Tochterions in der Datenbank gespeichert ist. Allerdings bleibt die Anwendung des Verfahrens auf solche exakten Treffer von Tochterionenspektren in der Datenbank beschränkt. Daher benötigt das Verfahren sehr viele bereits analysierte Tochterionen- Spektren einer großen Anzahl von Molekülen. Diese zu messen und manuell zu analysieren stellt einen enormen Aufwand dar. Das Verfahren liefert keine Informationen, die über das Vorliegen eines exakten Treffers eines Tochterionenspektrums hinaus gehen.  This method can contribute to the partial identification even if the fragmentation spectrum of a daughter is stored in the database. However, the application of the method remains limited to such exact matches of daughter ion spectra in the database. Therefore, the method requires very many daughter ion spectra already analyzed for a large number of molecules. Measuring them and analyzing them manually is an enormous effort. The method does not provide information that goes beyond the existence of an exact hit of a daughter ion spectrum.
Sind Substanzen zu identifizieren, für die Referenzdaten oder Vergleichs- bzw. Identifizierungsregeln nicht oder nicht vollständig vorliegen, müssen nach wie vor zumindest im Einzelfall kleinere Moleküle anhand ihrer Fragmentierungsmuster beurteilt werden, d. h. es muss aufwendig untersucht werden, inwieweit vergleichbare Ähnlichkeiten zu bekannten Strukturen gefunden werden können, die eine Bestimmung der Stoffklasse, der chemischen Eigenschaften oder vielleicht sogar der Molekülstruktur erlauben oder wenigstens unterstützen könnten (P. Shi, Q. He, Y. Song, H. Qu und Y. Cheng: Characterization and identification of isomeric flavonoid O-diglycosides from genus Citrus in negative electrospray ionization by ion trap mass spectrometry and time-of-flight mass spectrometry, Anal, Chim. Acta, 2007, 598, 1 10-118). Diese Beurteilung ist allerdings subjektiv, langwierig und basiert auf menschlicher Intuition. Sie stellt deshalb keine objektive und schnelle Substanzidentifikation dar und setzt vielmehr hohes Wissen sowie umfangreiche Erfahrung von Experten auf diesem Gebiet voraus. Dennoch ist die Trefferquote in der Praxis selbst für kleinere Moleküle nicht sehr hoch. Das Verfahren ist aus den vorgenannten Gründen auch nicht automatisierbar. Für größere Moleküle wäre diese Methode insbesondere wegen der hohen Anforderungen an den Gutachtenden und der zu erwartenden niedrigen Trefferquote praktisch nicht verwendbar. If substances are to be identified for which reference data or comparison or identification rules are not or not completely available, smaller molecules must still be assessed on the basis of their fragmentation patterns, ie, it must be investigated in an extensive manner to what extent comparable similarities to known structures are found which could or could at least support a determination of class of substance, chemical properties, or perhaps even molecular structure (Shi P., Q. He, Y. Song, H. Qu, and Y. Cheng: Characterization and identification of isomeric flavonoid O-. Actly, Cly. in negative electrospray ionization by ion trap mass spectrometry and time-of-flight mass spectrometry, Anal, Chim. Acta, 2007, 598, 1 10-118). However, this assessment is subjective, lengthy and based on human intuition. It therefore does not represent an objective and rapid substance identification and rather builds on high knowledge and extensive experience of experts ahead of this area. Nevertheless, the hit rate in practice is not very high, even for smaller molecules. The method can not be automated for the aforementioned reasons. For larger molecules, this method would be virtually unusable, in particular because of the high demands on the reviewer and the expected low hit rate.
Im Jahr 2008 haben Böcker und Rasche (S. Böcker & F. Rasche: Towards de novo Identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 149-155) eine mathematische Formalisierung des Konzeptes von Fragmentierungsmustern eingeführt. Sie nutzen dabei Graphen, um das Fragmentierungsmuster einer Substanz darzustellen. Als Graph soll dabei eine Menge von Objekten, üblicherweise als Knoten bezeichnet, und eine Menge von Paaren aus den Elementen dieser Menge, üblicherweise als Kanten bezeichnet, gelten. Diese Menge von Paaren repräsentiert die Beziehungen der Objekte untereinander. In diesem Fall werden die Fragmente der Substanz als Knoten und die Fragmentierungsreaktionen als Kanten dargestellt. Da die Struktur der untersuchten Substanz nicht bekannt ist, werden die Knoten mit den Summenformeln der Fragmente, und die Kanten mit den Summenformeln der Neutralverluste beschriftet. Diese Fragmentierungsgraphen werden dazu verwendet, um die Summenformel einer unbekannten Substanz zu bestimmen. Summenformeln an sich sind jedoch nicht ausreichend, um einen Stoff zu identifizieren und lassen auch keine Schlüsse auf die Stoffklasse der untersuchten Substanz zu. In 2008 Böcker and Rasche (S. Böcker & F. Rasche: Towards de novo Identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 149-155) introduced a mathematical formalization of the concept of fragmentation patterns. They use graphene to represent the fragmentation pattern of a substance. A graph is to be understood to mean a set of objects, usually referred to as nodes, and a set of pairs of the elements of this set, usually referred to as edges. This set of pairs represents the relationships between the objects. In this case, the fragments of the substance are represented as nodes and the fragmentation reactions as edges. Since the structure of the examined substance is not known, the nodes are labeled with the sum formulas of the fragments, and the edges with the sum formulas of the neutral losses. These fragmentation graphs are used to determine the molecular formula of an unknown substance. However, molecular formulas themselves are not sufficient to identify a substance and also do not allow any conclusions about the substance class of the substance being investigated.
Es ist weiter bekannt, Fragmentierungsgraphen zur Identifizierung unbekannter Stoffe zu nutzen (DE 10 2009 0058 45 AI). Dieses Verfahren ist allerdings stark abhängig von der Qualität der zugrundeliegenden Graphen der Fragmentierungsmuster. Eine gute Qualität der Fragmentierungsgraphen ist insbesondere für Pestizide und Alkohole bisher nicht gegeben, und somit ist eine zuverlässige Identifizierung der unbekannten Substanzen, insbesondere von Pestiziden und Alkoholen, nicht möglich. Ferner ist auf einem speziellen biologischen bzw. medizinischem Aufgabengebiet das Alignieren von Bäumen an sich zum Vergleich von RNA- Strukturen bekannt (T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sei., Elsevier Science Publishers Ltd., 1995, 143, 137-148). Hierbei werden die beschrifteten Knoten der zu vergleichenden Bäume so übereinander gelegt, dass sich die Beschriftungen möglichst gering unterscheiden. Strukturell müssen sich die Bäume gleichen, es dürfen nur sogenannte Gap-Knoten in die Äste der Baumdarstellung eingefügt werden, falls erforderlich. Über Anwendungen dieser Methode, um insbesondere bei massenspektro- metrischen Untersuchungen von Substanzen diese zu identifizieren bzw. deren Stoffklasse und/oder chemischen Eigenschaften zu bestimmen, ist nichts bekannt geworden. It is also known to use fragmentation graphs for the identification of unknown substances (DE 10 2009 0058 45 AI). However, this method is highly dependent on the quality of the underlying graphs of fragmentation patterns. A good quality of Fragmentierunggraphen is not given in particular for pesticides and alcohols so far, and thus a reliable identification of the unknown substances, especially of pesticides and alcohols, is not possible. Further, in a particular biological or medical field, aliquoting of trees per se for comparison of RNA structures is known (T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137-148). Here, the labeled nodes of the trees to be compared are superimposed so that the labels differ as little as possible. Structurally, the trees must be the same, only so-called gap nodes may be inserted into the branches of the tree representation, if necessary. About applications of this method, especially in mass spectrometric investigations of substances to identify them or to determine their class and / or chemical properties, nothing has become known.
Der Erfindung liegt die Aufgabe zu Grunde, ein Auswerteverfahren zu schaffen, welches für alle Stoffklassen, insbesondere auch für Pestizide und Alkohole, eine Identifikation der auszuwertenden Substanz mit hoher Sicherheit und Zuverlässigkeit ermöglicht, auch wenn die Klasse des Stoffes unbekannt ist. The invention is based on the object to provide an evaluation, which allows for all classes, especially for pesticides and alcohols, an identification of the substance to be evaluated with high reliability and reliability, even if the class of the substance is unknown.
Diese Aufgabe wird durch ein Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie gelöst, welches aus folgenden Schritten besteht: This object is achieved by a method for identifying in particular unknown substances by mass spectrometry, which consists of the following steps:
a) Aufnahme zumindest zweier massenspektrometri scher Fragmentierungsspektren (Tochterionenspektren) der zu identifizierenden Substanz, a) recording at least two mass spectrometric fragmentation spectra (daughter ion spectra) of the substance to be identified,
b) Bestimmen eines Spektrumgraphen dieser Substanz aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren, indem für die gemessenen Massen die möglichen Summenformeln berechnet, direkte Abstammungsbeziehungen zwischen diesen Summenformeln bestimmt, sowohl die direkten also auch die indirekten Abstammungsbeziehungen anhand der Massenintensitäten der Peaks im Spektrum bewertet werden, b) determining a spectrum graph of this substance from the at least two mass spectrometric fragmentation spectra, by calculating the possible sum formulas for the measured masses, determining direct lineage relationships between these sum formulas, and evaluating both the direct and indirect lineage relationships on the basis of the mass intensities of the peaks in the spectrum,
c) Bestimmen des bestmöglichen Fragmentierungsgraphen der Substanz, indem aus den im Spektrumgraphen vorhandenen Beziehungen die unter Einbeziehung der Bewertungen wahrscheinlichsten Beziehungen ausgewählt werden, und c) Determine the best possible fragmentation graph of the substance by taking the ones available in the spectrum graph Relationships that are selected with the inclusion of the most probable relationships, and
d) Vergleich der Daten des vollständigen oder teilweisen Fragmentierungsgraphen mit Referenzdaten, um die Substanz anhand ihrer Struktur und/oder der Stoffklasse und/oder ihrer chemischen Eigenschaften zu identifizieren. d) comparing the data of the complete or partial fragmentation graph with reference data to identify the substance by its structure and / or class and / or chemical properties.
Überraschend hat sich gezeigt, dass mit diesem Verfahren, mit dem der Fragmentierungsgraph aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren unter Berücksichtigung von nicht nur direkten sondern auch von indirekten Abstammungsbeziehungen zwischen den besagten Summenformeln ermittelt wird, nicht nur Substanzen mit hoher Zuverlässigkeit bestimmbar sind, die bislang, sofern überhaupt, nur schwer bzw. nur mit geringer Zuverlässigkeit zu ermitteln waren, beispielsweise Pestizide und Alkohole, sondern dass die Sicherheit und Zuverlässigkeit des Fragmentierungsgraphen bei der Bestimmung aller untersuchten Stoffklassen generell erhöht ist, was die Auswertung und damit die Substanzbestimmung wesentlich verbessert. Dabei ist es nicht nötig von jedem Peak aus dem MS2- Spektrum ein MS -Spektrum und aus jedem Peak der MS3-Spektra ein MS4-Spektrum zu messen, sondern zwei MS-Spektren sind ausreichend für das vorgeschlagene Verfahren. Ein gewaltiger Vorteil der Erfindung ist dabei, dass eine zuverlässige Identifikation der auszuwertenden Substanzen ermöglicht wird, selbst wenn die Klasse des Stoffes unbekannt ist. Surprisingly, it has been found that not only substances with high reliability can be determined with this method, with which the fragmentation graph from the at least two mass spectrometric fragmentation spectra is determined taking into account not only direct but also indirect ancestral relationships between said sum formulas. if at all, were difficult or only with low reliability to determine, for example, pesticides and alcohols, but that the safety and reliability of the fragmentation graph in the determination of all examined substance classes is generally increased, which significantly improves the evaluation and thus the substance determination. It is not necessary to measure an MS spectrum from each peak of the MS 2 spectrum and an MS 4 spectrum from each peak of the MS 3 spectra, but two MS spectra are sufficient for the proposed method. A huge advantage of the invention is that a reliable identification of the substances to be evaluated is made possible, even if the class of the substance is unknown.
Die Methode kann insbesondere angewendet werden auf Stoffwechselzwischenprodukte, Antibiotika, Toxine, Insektizide, Botenstoffe, Flavonoide, Phenole, Xanthone, Propanoide, Stilbene, Terpene, Steroide, Carotinoide, Lipide und Alkaloide, ist aber nicht auf diese Stoffklassen beschränkt.  The method can be applied in particular to metabolic intermediates, antibiotics, toxins, insecticides, messengers, flavonoids, phenols, xanthones, propanoids, stilbenes, terpenes, steroids, carotenoids, lipids and alkaloids, but is not limited to these substance classes.
Die Erfindung soll nachstehend anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher erläutert werden. Es zeigen: The invention will be explained in more detail below with reference to an embodiment shown in the drawing. Show it:
Abb. 1 : Fragmentierungsspektren von Phenylalanin, bestehend aus einem MS2-Spektrum (166 Da) und einem MS3-Spektrum (120 Da), und spezielle MS3-Bewertung der Peaks Fig. 1: Fragmentation spectra of phenylalanine, consisting of an MS 2 spectrum (166 Da) and an MS 3 spectrum (120 Da), and specific MS 3 evaluation of the peaks
Abb. 2: Bewertung der direkten Abstammungsbeziehungen im  Fig. 2: Evaluation of the direct lineage relationships in the
Spektrumgraph von Phenylalanin, wobei die Knoten den bei der Massenspektrometrie gemessenen Fragmenten, die Kästchen den Peaks und die Kanten den Neutralverlusten entsprechen Spectral graph of phenylalanine, where the nodes correspond to the fragments measured in mass spectrometry, the boxes to the peaks and the edges to the neutral losses
Abb. 3: Möglichkeiten der Bewertung der indirekten Fig. 3: Options for the evaluation of indirect
Abstammungsbeziehungen, wobei gestrichelte Peaks nicht im Spektrum vorhandene Peaks darstellen  Lineage relationships, where dashed peaks represent non-spectrum peaks
Abb. 4: Bewertung der indirekten Abstammungsbeziehungen im  Fig. 4: Evaluation of the indirect lineage relationships in the
Spektrumgraph von Phenylalanin, wobei die Knoten den bei der Massenspektrometrie gemessenen Fragmenten, die Kästchen den Peaks und die Kanten dem zur Bewertung maßgeblichen Parameter (G \ , C2 oder 03) entsprechen  Spectral graph of phenylalanine, where the nodes correspond to the fragments measured in mass spectrometry, the boxes to the peaks, and the edges to the parameters relevant for the evaluation (G \, C2 or 03)
Abb. 5: Bewertung der indirekten Abstammungsbeziehungen im  Fig. 5: Evaluation of the indirect lineage relationships in the
Spektrumgraph von Phenylalanin (Ausschnitt), mit zusätzlicher widersprüchlicher Bewertungskante  Spectrum graph of phenylalanine (detail), with additional contradictory rating edge
Abb. 6: Bewertung der indirekten Abstammungsbeziehungen im  Fig. 6: Evaluation of the indirect lineage relationships in the
Spektrumgraph von Phenylalanin (Ausschnitt), Auflösen des Widerspruchs durch Kopieren und Umfärben der widersprüchlichen Teile  Spectral graph of phenylalanine (detail), resolving the contradiction by copying and redrawing the contradictory parts
Abb. 7: Fragmentierungsgraph von Phenylalanin, Darstellung wiederum durch Knoten (Fragmente) sowie durch Kanten (Neutralverluste) a) Erstellen eines Spektrumgraphen mit direkten und indirekten Abstammungsbeziehungen:  Fig. 7: Fragmentation graph of phenylalanine, representation again by nodes (fragments) and by edges (neutral losses) a) Creation of a spectral graph with direct and indirect lineage relationships:
Die Bestimmung eines Spektrumgraphen mit direkten und indirekten Abstammungsbeziehungen wird im Folgenden beispielhaft an dem Stoff Phenylalanin beschrieben. In der typischen Anwendung handelt es sich um einen unbekannten Stoff mit unbekannter Struktur und Funktion. Dann können mit Hilfe des Verfahrens Annahmen über die Struktur gemacht werden. The determination of a spectrum graph with direct and indirect lineage relationships is described below by way of example with the substance phenylalanine. The typical application is an unknown substance of unknown structure and function. Then, with the help of the method, assumptions can be made about the structure.
Phenylalanin wurde mit Hilfe von multipler Massenspektrometrie untersucht. Die Fragmentierung erfolgte dabei mit an sich bekannter collision induced dissociation (CID). Es ist jedoch auch möglich, andere Fragmentierungsmethoden (zum Beispiel in-source fragmentation, post source decay, ETD, ECD, HCD oder PQD) zu verwenden. Falls die zu bestimmende Substanz Teil eines Gemisch ist, wäre es sinnvoll, eine Trennung mithilfe von Gas- oder Flüssigchromatographie durchzuführen. Phenylalanine was studied by multiple mass spectrometry. The fragmentation was carried out with known collision induced dissociation (CID). However, it is also possible to use other fragmentation methods (for example, in-source fragmentation, post-source decay, ETD, ECD, HCD or PQD). If the substance to be determined is part of a mixture, it would be useful to perform a separation using gas or liquid chromatography.
Nachdem die Masse-Ladungs-Verhältnisse und zugehörigen Intensitäten aller Peaks im Spektrum (peak picking) bestimmt wurden (vgl. Abb. 1), werden für jedes Masse-Ladungs-Verhältnis alle möglichen Summenformeln, die im Bereich der Massentoleranz liegen, ermittelt, (vgl. auch S. Böcker & Z. Liptäk, A Fast and Simple Algorithm for the Money Changing Problem, Algorithmica, 2007, 48, 413-432). After determining the mass-to-charge ratios and associated peak peaking intensities (see Figure 1), for each mass-to-charge ratio, all possible sum formulas within the range of mass tolerance are determined ( See also S. Böcker & Z. Liptäk, A Fast and Simple Algorithm for the Money Changing Problem, Algorithmica, 2007, 48, 413-432).
Diese Summenformeln werden zur Konstruktion des Fragmentierungsgraphen verwendet (vgl. Abb. 2): Es wird ein kanten- gewichteter, knoten-gefärbter Graph konstruiert, in dem es für jede mögliche Summenformel einen Knoten gibt. Zwei Knoten sind durch eine gerichtete Kante miteinander verbunden, wenn die Summenformel des Kind-Knotens eine Teilformel von der des Elternknoten ist. Kanten repräsentieren Neutral Verluste, die durch die Fragmentierung entstehen. Sie deuten auf direkte Abstammungsbeziehungen hin. Alle Summenformeln, die zu dem gleichen Peak gehören, haben die gleiche Farbe. Die Gewichte w(u,v) der Kanten werden in Abhängigkeit von Peakintensitäten, Massenabweichungen zwischen vorhergesagten Molekülen und tatsächlichen Peakmassen, chemischen Eigenschaften, Kollisionsenergien der Fragmentierung und Neutralverlusten bestimmt (vgl. auch S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 149-155). Durch die mindestens zwei Massenspektren kann man zusätzlich indirekte Abstammungsbeziehungen definieren. Drei Beispiele dafür sind in Abb, 3 dargestellt: These sum formulas are used to construct the fragmentation graph (see Fig. 2): An edge-weighted, knot-stained graph is constructed in which there is a knot for each possible molecular formula. Two nodes are joined together by a directed edge if the sum formula of the child node is a sub-formula of that of the parent node. Edges represent neutral losses due to fragmentation. They point to direct lineage relationships. All sum formulas that belong to the same peak have the same color. The weights w (u, v) of the edges are determined as a function of peak intensities, mass deviations between predicted molecules and actual peak masses, chemical properties, collision energies of fragmentation and neutral losses (see also S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 149-155). Due to the at least two mass spectra, one can additionally define indirect lineage relationships. Three examples are shown in Fig. 3:
1 . Kommt in einem Spektrum mit Vorhänger-Ionen-Peak pk auch ein Peak i vor, so deutet das darauf hin, dass das Fragment, das zu i gehört, direkt oder indirekt von dem Fragment, das zu pk gehört, abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine positive Bewertung mit dem Parameter σι>0. 1 . If a peak i also appears in a spectrum with a tracer ion peak p k , this indicates that the fragment belonging to i is derived directly or indirectly from the fragment belonging to p k . Therefore, such direct or indirect lineage relationships in the fragmentation graph get a positive score with the parameter σι> 0.
2. Kommt in einem Spektrum ein Peak Pk vor, ein anderer Peak pi aber nicht, so deutet das darauf hin, dass das Fragment das zu i gehört weder direkt noch indirekt von dem Fragment was zu pk gehört abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine negative Bewertung mit dem Parameter σ2<0,2. If one peak P k occurs in one spectrum, but not another peak pi, this indicates that the fragment belonging to i does not derive either directly or indirectly from the fragment which belongs to p k . Therefore, such direct or indirect lineage relationships in the fragmentation graph get a negative rating with the parameter σ 2 <0,
. Seien zwei Spektren mit verschiedenen Kollisionsenergien und zwei Peaks pk und pi mit Masse(pi)<Mass pk) gegeben. Wenn das Spektrum mit höherer Kollisionsenergie nur pi enthält, das Spektrum mit niedrigerer Kollisionsenergie aber beide Peaks aufweist, so deutet das darauf hin, dass das Fragment, welches zu pi gehört weder direkt noch indirekt von dem Fragment, welches zu pk gehört, abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine negative Bewertung mit dem Parameter σ3<0. , Given two spectra with different collision energies and two peaks p k and pi with mass (pi) <mass pk). If the higher collision energy spectrum contains only pi, but the lower collision energy spectrum has both peaks, this indicates that the fragment belonging to pi is neither directly nor indirectly derived from the fragment belonging to p k . Therefore, such direct or indirect lineage relationships in the fragmentation graph get a negative score with the parameter σ3 <0.
Diese indirekten Abstammungsbeziehungen werden durch zusätzliche indirekte Kanten mit Gewichten w+(c(u),c(v)) zusätzlich zu den direkten Kanten mit Gewichten w(u,v) in den Spektrumgraph eingezeichnet. Alle oben genannten indirekten Abstammungsbeziehungen von Phenylalanin sind in Abb. 1 visualisiert. These indirect lineages are plotted by additional indirect edges with weights w + (c (u), c (v)) in addition to the direct edges with weights w (u, v) in the spectrum graph. All the above-mentioned indirect lineage relationships of phenylalanine are visualized in Fig. 1.
Abb. 4 zeigt den zugehörigen Spektrumgraph mit indirekten Abstammungsbeziehungen (der Übersicht halber wurden die direkten Abstammungsbeziehungen aus Abb. 3 vernachlässigt und nur die indirekten Abstammungsbeziehungen eingezeichnet). Abb. 5 zeigt einen komplexeren Fall: Angenommen, ein drittes Fragmentierungsspektrum zeigt, dass die Peaks bei 103.1 Da nicht aus dem Peak bei 120.1 Da entstanden sein können (Bewertung mit σ2 oder σ3). Dann ist eine mögliche Erklärung, dass die Peaks bei 103.1 Da durch zwei verschiedene Fragmente gleicher Masse entstanden sind. Dieser Sachverhalt wird modelliert, indem alle zum Peak 103, 1 Da gehörenden Strukturen kopiert, und die Kopien in einer freien Farbe gefärbt werden (Abb, 6). Dadurch kann der nachfolgend berechnete Fragmentierungsgraph den Peak zweimal enthalten. b) Berechnung des optimalen Fragmentierungsgraphen aus einem Spektrumgraph mit direkten und indirekten Abstammungsbeziehungen Eine Möglichkeit, den optimalen Fragmentierungsgraphen unter Berücksichtigung nicht nur direkter sondern auch indirekter Abstammungsbeziehungen zu bestimmen, ist die Bestimmung des Teilbaumes aus dem Fragmentierungsspektrum mit maximaler Bewertung, bei dem jede Farbe maximal einmal benutzt wird. So wird verhindert, dass ein Peak durch mehr als ein Fragment erklärt wird. Fig. 4 shows the corresponding spectrum graph with indirect lineage relationships (for clarity, the direct lineages of Fig. 3 were neglected and only the indirect lineages were drawn). Fig. 5 shows a more complex case: Assuming that a third fragmentation spectrum shows that the peaks at 103.1 Da can not have originated from the peak at 120.1 Da (evaluation with σ2 or σ 3 ). Then one possible explanation is that the peaks at 103.1 Da are due to two different fragments of equal mass. This situation is modeled by copying all the structures belonging to the peak 103, 1 Da and coloring the copies in a free color (Fig. 6). This allows the subsequently calculated fragmentation graph to contain the peak twice. b) Calculation of the optimal fragmentation graph from a spectrum graph with direct and indirect lineage relationships One way to determine the optimal fragmentation graph considering not only direct but also indirect lineage relationships is to determine the subtree from the fragmentation spectrum with maximum scoring, where each color is maximal once is used. This prevents a peak from being explained by more than one fragment.
Es handelt sich also um ein Optimierungs verfahren, im Gegensatz zur Methode nach US 7,197,402 B2, welche regelbasiert arbeitet. So it is an optimization method, in contrast to the method according to US 7,197,402 B2, which operates rule-based.
Die Bewertung eines Teilbaumes wird durch die Summe seiner direkten Kantengewichte (Kanten aus Abb. 2) und der Summe seiner indirekten Kantengewichte (Kanten aus Abb. 4) gebildet. Dabei werden indirekte Kantengewichte genau dann gezählt, wenn der Kind-Knoten entweder ein direkter oder ein indirekter Nachfahre des Vater-Knotens ist. The evaluation of a sub-tree is formed by the sum of its direct edge weights (edges from Fig. 2) and the sum of its indirect edge weights (edges from Fig. 4). Indirect edge weights are counted if and only if the child node is either a direct descendant or an indirect descendant of the father node.
Eine Möglichkeit, einen optimalen Teilbaum möglichst schnell zu berechnen, ist ein FPT-Algorithmus: One way to get an optimal subtree as fast as possible is using an FPT algorithm:
W* v,S) =W * v, S) =
Figure imgf000012_0001
Dabei ist W*(v,S) der maximale Score eines Baumes mit Wurzelknoten v und benutzt nur Farben aus SQC. Im unteren Maximum werden dabei die trivialen Fälle Sl - {v} und S2 = {v} ausgeschlossen.
Figure imgf000012_0001
Where W * (v, S) is the maximum score of a tree with root node v and uses only colors from SQC. In the lower maximum, the trivial cases Sl - {v} and S2 = {v} are excluded.
Die Initialisierung erfolgt mit W*(v,c(v)) = 0. The initialization takes place with W * (v, c (v)) = 0.
In Abb. 7 ist der optimale Fragmentierungsgraph von Phenylalanin bei Belegung der Parameter mit σι=3, σ2=-0.5 und σ3=-0,5 dargestellt. Fig. 7 shows the optimal fragmentation graph of phenylalanine when the parameters are given with σι = 3, σ 2 = -0.5 and σ3 = -0.5.
Der Fragmentienmgsgraphvergleich gegenüber gespeicherten Referenz- Fragmentierungsgraphen erfolgt auf an sich bekannte Weise. Aus diesem Vergleich werden die Substanz oder Substanzklasse (vgl. DE 10 2009 0058 45 AI) bestimmt. The Fragmentienmgsgraphvergleich compared stored reference fragmentation graphs is done in a known per se. From this comparison, the substance or substance class (see DE 10 2009 0058 45 Al) are determined.
Sowohl die Ermittlung des Fragmentierungsgraphen als auch der anschließende Datenvergleich werden rechentechnisch durchgeführt.  Both the determination of the fragmentation graph and the subsequent data comparison are performed computationally.

Claims

Patentansprüche claims
1. Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie, bestehend aus folgenden Schritten: 1. A method for identifying in particular unknown substances by mass spectrometry, comprising the following steps:
a) Aufnahme zumindest zweier massenspektrometrischer Fragmentierungsspektren (Tochterionenspektren) der zu identifizierenden Substanz,  a) recording at least two mass spectrometric fragmentation spectra (daughter ion spectra) of the substance to be identified,
b) Bestimmen eines Spektrumgraphen dieser Substanz aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren, indem für die gemessenen Massen die möglichen Summenformeln berechnet, direkte Abstammungsbeziehungen zwischen diesen Summenformeln bestimmt, sowohl die direkten also auch die indirekten Abstammungsbeziehungen anhand der Massenintensitäten der Peaks im Spektrum bewertet werden, c) Bestimmen des bestmöglichen Fragmentierungsgraphen der Substanz, indem aus den im Spektrum graphen vorhandenen Beziehungen die unter Einbeziehung der Bewertungen wahrscheinlichsten Beziehungen ausgewählt werden, und d) Vergleich der Daten des vollständigen oder teilweisen Fragmentierungsgraphen mit Referenzdaten, um die Substanz anhand ihrer Struktur und/oder der Stoffklasse und/oder ihrer chemischen Eigenschaften zu identifizieren.  b) determining a spectrum graph of this substance from the at least two mass spectrometric fragmentation spectra, by calculating the possible sum formulas for the measured masses, determining direct lineage relationships between these sum formulas, and evaluating both direct and indirect lineage relationships on the basis of the mass intensities of the peaks in the spectrum; c Determining the best possible fragmentation graph of the substance by selecting from the relationships present in the spectrum graphs the most probable relationships involving the scores, and d) comparing the data of the complete or partial fragmentation graph with reference data to determine the substance by its structure and / or structure Substance class and / or their chemical properties.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Bestimmung des Fragmentierungsgraphen und der anschließende Datenvergleich rechentechnisch durchgeführt werden. 2. The method according to claim 1, characterized in that the determination of the fragmentation graph and the subsequent data comparison are performed computationally.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Fall einer sowohl positiven als auch negativen Bewertung einer direkten oder indirekten Abstammungsbeziehung 3. The method according to claim 1, characterized in that in the case of a both positive and negative evaluation of a direct or indirect lineage relationship
- die Teile des Spektrumgraphen, auf welche sich die widersprüchliche Bewertung bezieht, verdoppelt werden,  - the parts of the spectrum graph to which the contradictory assessment relates are doubled,
- einer Kopie dieser Teile eine noch nicht vorhandene Farbe zugewiesen wird und - aus dem so veränderten Spektrumgraphen der bestmögliche Fragmentierungsgraph ermittelt wird. - a copy of these parts is assigned a color not yet available and - the best possible fragmentation graph is determined from the spectrum graph modified in this way.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph typischerweise durch Knoten als Fragmente der Substanz und Kanten als Fragmentierungsreaktionen (Verknüpfung) repräsentiert wird. A method according to claim 1, characterized in that the fragmentation graph is typically represented by nodes as fragments of the substance and edges as fragmentation reactions (linkage).
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph mit Hilfe einer von der typischen Darstellung mit Knoten und Kanten verschiedenen mathematischen Darstellung, wie z. B. einer partiellen Ordnung, einer Relation, oder einer Hierarchie, repräsentiert wird. A method according to claim 1, characterized in that the Fragmentierungsgraph using a different from the typical presentation with nodes and edges mathematical representation, such. A partial order, a relation, or a hierarchy.
PCT/DE2012/000177 2011-03-18 2012-02-15 Method for identifying in particular unknown substances using mass spectrometry WO2012126451A2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102011014805.1 2011-03-18
DE102011014805A DE102011014805A1 (en) 2011-03-18 2011-03-18 Method for identifying in particular unknown substances by mass spectrometry

Publications (2)

Publication Number Publication Date
WO2012126451A2 true WO2012126451A2 (en) 2012-09-27
WO2012126451A3 WO2012126451A3 (en) 2013-03-07

Family

ID=46756887

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2012/000177 WO2012126451A2 (en) 2011-03-18 2012-02-15 Method for identifying in particular unknown substances using mass spectrometry

Country Status (2)

Country Link
DE (1) DE102011014805A1 (en)
WO (1) WO2012126451A2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2929339A4 (en) * 2012-11-15 2016-06-01 Dh Technologies Dev Pte Ltd Systems and methods for identifying compounds from ms/ms data without precursor ion information
CN113758989A (en) * 2021-08-26 2021-12-07 清华大学深圳国际研究生院 Fragment tree-based on-site mass spectrum target identification and derivative prediction method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6624408B1 (en) 1998-10-05 2003-09-23 Bruker Daltonik Gmbh Method for library searches and extraction of structural information from daughter ion spectra in ion trap mass spectrometry
US20030236636A1 (en) 2002-06-25 2003-12-25 Kiyomi Yoshinari Mass spectrometric data analyzing method, mass spectrometric data analyzing apparatus, mass spectrometric data analyzing program, and solution offering system
US6747272B2 (en) 2002-04-01 2004-06-08 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US7197402B2 (en) 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
DE10358366B4 (en) 2003-12-10 2008-04-03 Bruker Daltonik Gmbh Mass spectrometric substance identification
DE102009005845A1 (en) 2009-01-21 2010-07-22 Friedrich-Schiller-Universität Jena Method for identifying in particular unknown substances by mass spectrometry

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999062930A2 (en) * 1998-06-03 1999-12-09 Millennium Pharmaceuticals, Inc. Protein sequencing using tandem mass spectroscopy
JP2005532565A (en) * 2002-07-10 2005-10-27 アンスティテュ スイス ドゥ ブオインフォルマティク Methods for identifying peptides and proteins
US8457900B2 (en) * 2006-03-23 2013-06-04 The Regents Of The University Of California Method for identification and sequencing of proteins

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6624408B1 (en) 1998-10-05 2003-09-23 Bruker Daltonik Gmbh Method for library searches and extraction of structural information from daughter ion spectra in ion trap mass spectrometry
US6747272B2 (en) 2002-04-01 2004-06-08 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US20030236636A1 (en) 2002-06-25 2003-12-25 Kiyomi Yoshinari Mass spectrometric data analyzing method, mass spectrometric data analyzing apparatus, mass spectrometric data analyzing program, and solution offering system
DE10358366B4 (en) 2003-12-10 2008-04-03 Bruker Daltonik Gmbh Mass spectrometric substance identification
US7197402B2 (en) 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
DE102009005845A1 (en) 2009-01-21 2010-07-22 Friedrich-Schiller-Universität Jena Method for identifying in particular unknown substances by mass spectrometry

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
A. FRANK; P. PEVZNER: "PepNovo: de novo peptide sequencing via probabilistic network modeling", ANAL. CHEM., vol. 15, 2005, pages 964 - 973
ANAL. CHIM. ACTA, vol. 598, 2007, pages 110 - 118
D. GOLDBERG; M. BERN; B. LI; C. LEBRILLA: "Automatic Determination of 0-glycan structure from fragmentation spectra", J PROTEOME RES, vol. 5, 2006, pages 1429 - 1434
J. H. GROSS: "Mass Spectrometry: A Textbook", 2004, SPRINGER VERLAG
K. KLAGKOU; F. PULLEN; M. HARRISON; A. ORGAN; A. FIRTH; G.J. LANGLEY: "Approaches towards the automated interpretation and prediction of electrospray tandem mass spectra of nonpeptidic combinatorial compounds", RAPID COMMUN MASS SPECTROM, vol. 17, 2003, pages 1163 - 1168
L. VOGT; T. GRÖGER; R. ZIMMERMANN: "Automated compound classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry", J CHROMATOGR A, vol. 1150, 2007, pages 2 - 12
S. BÖCKER; F. RASCHE: "Towards de novo identification of metabolites by analyzing tandem mass spectra", BIOINFORMATICS, vol. 24, 2008, pages 149 - 155
S. BÖCKER; Z. LIPTÄK: "A Fast and Simple Algorithm for the Money Changing Problem", ALGORITHMICA, vol. 48, 2007, pages 413 - 432
T. JIANG; L. WANG; K. ZHANG: "Theor. Comput. Sci.", vol. 143, 1995, ELSEVIER SCIENCE PUBLISHERS LTD., article "Alignment of trees: an alternative to tree edit", pages: 137 - 148
U. ROESSNER; C. WAGNER; J. KOPKA; R. TRETHEWAY; L. WILLMITZER: "Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry", PLANT J, vol. 23, 2000, pages 131 - 142

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2929339A4 (en) * 2012-11-15 2016-06-01 Dh Technologies Dev Pte Ltd Systems and methods for identifying compounds from ms/ms data without precursor ion information
CN113758989A (en) * 2021-08-26 2021-12-07 清华大学深圳国际研究生院 Fragment tree-based on-site mass spectrum target identification and derivative prediction method
CN113758989B (en) * 2021-08-26 2023-11-28 清华大学深圳国际研究生院 Method for identifying on-site mass spectrum target object and predicting derivative based on fragment tree

Also Published As

Publication number Publication date
DE102011014805A1 (en) 2012-09-20
WO2012126451A3 (en) 2013-03-07

Similar Documents

Publication Publication Date Title
DE112005001143B4 (en) System and method for grouping precursor and fragment ions using chromatograms of selected ions
DE102014008264B4 (en) Isotope pattern recognition
DE112005001166B4 (en) Method and device for identifying proteins in mixtures
EP1846757B1 (en) Method and system for mass spectrometry analysis
DE112005000598B4 (en) Method of identifying a sugar chain structure and device for analyzing the same
DE102009032649B4 (en) Mass spectrometric identification of microbes by subspecies
DE102004015018B4 (en) A method for identifying ions from chromatography-mass spectral data sets containing overlapping components
DE102010019590B4 (en) Data-dependent acquisition system for mass spectrometry and method for its application
DE112004000746B4 (en) Method and apparatus for processing LC-MS or LC-MS / MS data in metabolic studies
DE10392707B4 (en) Method of using data binning in the analysis of chromatography / spectrometry data
WO2010083811A1 (en) Method for identifying in particular unknown substances by mass spectrometry
DE112015006900T5 (en) Method for determining online NIR sample sizes
DE102004037512A1 (en) Mass spectrometric tissue state differentiation
DE102010013548B4 (en) Mobility spectrometric substance identification
WO2012126451A2 (en) Method for identifying in particular unknown substances using mass spectrometry
EP2289090B1 (en) Method and arrangement for the control of measuring systems, corresponding computer programme and corresponding computer-readable storage medium
DE102017129891A1 (en) Mass spectrometric determination of special tissue conditions
DE102020101408A1 (en) METHOD FOR THE MASS SPECTROMETRIC DETERMINATION OF THE PRESENCE OR MISSING OF A CHEMICAL ELEMENT IN AN ANALYT
DE10393475B4 (en) Method and device for identifying compounds in a sample
DE112015004216T5 (en) Techniques for the representation and processing of mass spectral data
DE102016000124A1 (en) Mass spectrometry data processing apparatus and mass spectrometry data processing methods
EP0993609B1 (en) Process for determining the number of components in peaks, bands and signals of chromatograms, electrograms and spectrograms of all types
DE112004000338B4 (en) System and method for processing identified metabolites
DE102004016667B4 (en) Identifying polymers in mixes e.g. for protein research by mass-spectroscopy, involves obtaining at least one part-sequence of polymer combinations
EP1412079B1 (en) Method and device for finding substance mixtures for substance libraries

Legal Events

Date Code Title Description
122 Ep: pct application non-entry in european phase

Ref document number: 12756644

Country of ref document: EP

Kind code of ref document: A2