EP2389588A1 - Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie - Google Patents

Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie

Info

Publication number
EP2389588A1
EP2389588A1 EP10707432A EP10707432A EP2389588A1 EP 2389588 A1 EP2389588 A1 EP 2389588A1 EP 10707432 A EP10707432 A EP 10707432A EP 10707432 A EP10707432 A EP 10707432A EP 2389588 A1 EP2389588 A1 EP 2389588A1
Authority
EP
European Patent Office
Prior art keywords
fragmentation
substance
comparison
substances
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP10707432A
Other languages
English (en)
French (fr)
Inventor
Sebastian BÖCKER
Florian Rasche
Thomas Zichner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of EP2389588A1 publication Critical patent/EP2389588A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/24Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry

Definitions

  • the invention relates to a method for identifying preferably unknown substances by mass spectrometry in order to determine their structure and / or substance classes and / or their chemical properties.
  • Mass spectrometry is one of the currently most common methods for the analysis of preferably unknown substances (for example, J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004).
  • the molecular mass of the examined substance can be determined exactly. Furthermore, it is possible to fragment a substance in the mass spectrometer one or more times, i. H. to break their chemical bonds.
  • Masses of the resulting fragments are then measured again. This results in one or more fragmentation spectra (also called daughter ion spectra).
  • mass spectrometry is often preceded by a separation process in order to separate the substances to be identified for mass spectrometric analysis.
  • This separation method is usually gas or liquid chromatography or capillary electrophoresis (for example U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato by gas chromatography-mass spectrometry , Plant J, 2000, 23, 131-142).
  • the invention is based on the object, simultaneously with the mass spectrometric analysis in particular of unknown chemical compounds for their identification free of subjective judgment, in a very short time, automatable and with the highest possible hit rate their structure and / or classes and / or their chemical Properties without having to have identical fragmentation patterns and / or defined comparison or indentification rules.
  • this object is achieved by the mass spectrometric analysis of a substance to be examined from this at least one mass spectrometric fragmentation spectrum (daughter ion spectrum) is recorded, from which a (hypothetical for unknown substances) Fragment istsgraph is generated, which is hitherto exclusively known, the empirical formula to determine a substance.
  • the fragmentation graph is represented by objects and links of the at least one mass spectrometric fragmentation spectrum, for example by nodes as objects (fragments of the substance) and by edges (fragmentation reactions as linkage).
  • the representation of the fragmentation graph may also be characterized by a mathematical representation deviating from the typical expression by nodes and edges, such as a partial order, a relation, a hierarchy, in order to realize said objects and links.
  • the data of this fragmentation graph are compared with existing reference data of fragmentation graphs of known substances, this comparison preferably being computationally in that the apparatus for mass spectrometric examination is in communication with a computer accessing an electronic database in which said reference data of the known fragmentation graphs for the comparison will be provided.
  • this data comparison of the fragmentation graphs can take place simultaneously and automatically in parallel with the mass spectrometric evaluation of the substance to be investigated or identified.
  • identical or at least similar subgraphs, ie a subset of the nodes and edges are searched for the mass spectrometrically examined substance according to these known fragmentation graphs or subgraphs on the basis of the substance structure and / or the substance class and / or the chemical substance properties.
  • the computational data comparison allows in a very short time an automatic substance identification against a variety of known fragmentation graphs without necessarily complete fragmentation graphs of the substance to be identified and / or defined comparison or indentification rules for the comparison must be present as a reference, since the comparison is not the entire Fragment michsspektrum , but also includes substructures of the said fragmentation graph.
  • this method allows automatic identification of completely unknown substances. This was previously only possible manually. In contrast to the time-consuming manual analysis, the spectra can be performed without subjective requirements in real time, ie as fast as the measurement itself (and thus simultaneously). This allows the timely analysis of typical mass spectrometric series of hundreds of substances. In addition, in this high hit rate method, the identification is based on objective criteria, rather than on human intuition. In combination with other methods for automating the measurement and analysis of fragment spectra (eg DE 10 2005 025 499 B4 and DE 103 58 366 B4), even the complete automatic execution and analysis of such a series of measurements entirely without user intervention possible. In the subclaims advantageous execution steps of the method are mentioned.
  • the fragmentation graph of the substance to be analyzed can be generated manually or automatically.
  • the data comparison of the fragmentation graphs can be done locally or globally, for example by pairwise or multiple aligning.
  • fragmentation spectra may be used to generate the fragmentation graphs z. B. with a tandem mass spectrometer or by multiple fragmentation (MS n ) record.
  • Fragmentation may be by collision induced dissociation (CID), electron transfer dissociation (ETD), electron capture dissociation (ECD), infrared multiphoton dissociation (IRMPD), blackbody infrared radiative dissociation (BIRD), higher-energy C-trap dissociation (HCD ), in-source fragmentation or post-source decay (PSD).
  • CID collision induced dissociation
  • ETD electron transfer dissociation
  • ECD electron capture dissociation
  • IRMPD infrared multiphoton dissociation
  • BIRD blackbody infrared radiative dissociation
  • HCD blackbody infrared radiative dissociation
  • HCD in-source fragmentation or post-source decay
  • a special application of the method according to the invention consists in the clustering of substances to be analyzed.
  • fragmentation spectra are measured for three or more, but generally a larger number of substances and fragmentation graphs are calculated, for example using the method of Böcker and Rasche (S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 159-155).
  • These may be unknown or known substances or, as a rule, both known and unknown substances.
  • pairwise similarities are calculated using the method described here, resulting in a matrix of pairwise similarities.
  • cluster analysis can then be applied to such a similarity matrix: in this case, all objects in a cluster should be similar to each other, but have little similarity to objects outside the cluster.
  • the cluster analysis is usually done by automated procedures, but can also be done manually.
  • any graph-theoretic, hierarchical, partitioning, optimizing or other methods may be used, for example agglomerative clusters (for example UPGMA), aer-means or / t-nearest neighbors. It is now possible to draw conclusions about the investigated substances from the calculated clusters, if, for example, an unknown substance is clustered together with one or more known substances.
  • Another possible application of the method according to the invention is to combine the similarity determined by the comparison of the fragmentation graphs with other substance properties (measured or predicted). This can be done for clustering, but also for all other applications and applications described below.
  • Further known substance properties are, for example, mass of the two substances, mass difference between the substances, possible explanations of the mass difference by empirical formulas, number of peaks in the measured mass spectra, sum formulas of the substances (hypothetical or validated), retention time, electrophoretic transit time, UV absorption spectra, or the CE 50 - Value of the substance (Kertesz, TM, Hall, LH, Hill, DW & Grant, DF CE50: quantifying collision induced dissociation energy for small molecule characterization and identification J. Am. Soc. Mass Spectrom., 2009, 20, 1759 -1767).
  • the combination may be with one, several or even all of these other substantive properties.
  • Another application is to use the similarity of fragmentation graphs to predict the structural similarity of substances.
  • the structural similarity of substances can be measured, for example, by a Tanimoto coefficient or Jaccard index. Prediction of this structural similarity can be made, inter alia, by supervised machine learning techniques (eg Support Vector Machines SVM, neural networks, decision trees, decision-making forests, naive Bayes).
  • the substances may be classified as having a structural similarity of, for example, 90% or more (alternatively 80%, 95%, or another value) due to the similarity of the fragmentation graphs and other known substance properties.
  • fragmentation similarity can be used for direct prediction of substance similarity (eg, Tanimoto coefficient or Jaccard index).
  • substance similarity eg, Tanimoto coefficient or Jaccard index
  • machine learning techniques such as linear regression, SVM for regression (SVR), v-support Vector Regression (v-SVR), or Local Linear Maps are used.
  • the invention can be used advantageously to completely or partially elucidate the structure of unknown substances by comparison of fragmentation graphs. These can be the
  • Fragmentation graphs are used of reference substances of known structure, which have a high local or global similarity with the fragmentation graph of the substance to be identified. Thus, hypotheses can be made about the structure of the substance to be identified, which can then be determined, for example, by the use of further experimental techniques (multilevel
  • Fragmentation mass spectrometry or NMR spectroscopy On the other hand, hypotheses about the structure of be identified and verified by comparing fragmentation graphs.
  • a field of application of the invention is also the screening of unknown substances for potential biological agents (bio-prospecting).
  • bio-prospecting it is possible for a known active substance to be searched for substances which have a similar or identical action (for example generics).
  • substances which have an improved action or do not have one or more undesired side effects of the active substance This can also be done for drugs that are not approved or suitable for the medication of humans, because, for example, the severity of side effects outweigh the desired effect of the drug.
  • the secondary metabolites of organisms, in particular of plants, fungi and bacteria can be investigated for the screening.
  • the screening can be carried out under different external conditions, different stages of development and on different types of tissue, for example seeds, roots and leaves of a plant.
  • the fragmentation mass spectra can be created in an automatic run, whereby the substances to be fragmented are determined, for example, automatically and without knowledge of the substances present in the sample.
  • the application is not limited to medications or drugs intended for humans.
  • Another field of application of the method according to the invention is the identification of unknown drugs.
  • the unknown substance is analyzed by mass spectrometry and its fragmentation graph as described above compared with the fragmentation graphs of known legal or illegal drugs. This information about a possible effectiveness of the unknown substance can be obtained as a drug.
  • messenger substances may occur intracellularly, between different tissues, or between organisms of one or more species. Such messenger substances regulate the interaction of the cells in an organism. In plants, for example, such messenger substances serve to attract predators of plant pests that have attacked the plant. Such messengers can also cause damage to a plant pest (Allomone).
  • the identification of such messengers can be used for example in the development of plant protection products or the cultivation of new plant species. In addition, the identification of substances in drinking water, river water or other waters is possible. In order to ensure a high water quality, substances contained in the water must be identified in order to exclude, for example, a hazard to humans, animals and plants. It may be z. As to degradation products of substances that are introduced by humans (for example, hormones, pesticides) or act of microorganisms or metabolized substances.
  • the field of application of the method according to the invention is generally the identification of (unknown) metabolites for scientific or commercial purposes.
  • Fig. 1 Structural formula of dopamine
  • Fig. 2 Hypothetical fragmentation graph of dopamine, where the nodes correspond to the fragments measured in tandem mass spectrometry and the edges to the neutral losses
  • Fig. 3 Fragmentation graph of dopamine, shown as a partial order
  • Fig. 5 Hypothetical fragmentation graph of tyramine, again by nodes (fragments) and by edges (neutral losses).
  • Fig. 6 Optimal local alignment of the fragmentation graphs of
  • Fig. 8 Overview of the evaluation of the alignments with the hypothetical fragmentation graph of histidine
  • Fig. 9 Overview of the evaluation of the alignments with the hypothetical fragmentation graph of 4-
  • Both dopamine and tyramine were analyzed by tandem mass spectrometry.
  • the fragmentation was carried out by means of known collision induced dissociation (CID).
  • CID collision induced dissociation
  • fragmentation spectra were measured for the two substances and hypothetical fragmentation patterns calculated therefrom.
  • manually generated fragmentation patterns can also be used as the basis for further analysis.
  • the fragmentation graphs with the hypothetical course of the two fragmentations are shown in Fig. 2 (dopamine) and Fig. 5 (tyramine) by means of knots as fragments of the substance and edges as fragmentation reactions (neutral losses).
  • Other possible representations are e.g. Eg partial orders (see Fig. 3), relations and hierarchies.
  • the two fragmentation graphs were prepared for comparison.
  • the information relevant to this example is the neutral losses that result from fragmentation (indicated respectively at the edges of the graphs). This information has been transferred to the respective nodes below, as an algorithm for aligning the nodes of two graphs has been applied below. If, on the other hand, both the fragments and the neutral losses or only the fragments are taken into account for the comparison, or if algorithms for aligning edges are used, this step can be dispensed with, but otherwise it is expedient or necessary to process the fragmentation graphs differently.
  • the two prepared fragmentation graphs of dopamine and tyramine were then aligned locally. Thus, the regions of both graphs were determined which have the greatest local similarity. Since the fragmentation graphs in this example are trees, the tree alignment algorithm according to T. Jiang, L. Wang & K. Zhang (Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137-148).
  • node pairs were chosen as follows: Same nodes (ie nodes with the same sum formula) were rated very positively, whereby the size of the neutral loss was also included in the evaluation; Node pairs where the difference in the molecular formula is chemically explainable were rated slightly positive; and pairs of different nodes as well as pairs consisting of a node and a gap were rated negative. The overall rating of an alignment was finally calculated from the sum of all individual ratings of the node pairs.
  • Fig. 7 shows the evaluation of the aligned nodes of the prepared fragmentation graphs of dopamine and tyramine. In square brackets, the sum formulas of the aligned neutral losses are given. Below is the rating of each node Alignments indicated. The sum of these gives the overall rating. It can be seen that the structural similarity of both substances is reflected in the result of the alignment, since large areas of both graphs correspond to each other.
  • the additional node "CO" in dopamine which is aligned with a gap, also shows that dopamine has an additional hydroxyl group, resulting in shifts in the removal of carbon atoms, hence the additional loss of CO and not an oxygen atom alone.
  • fragmentation spectra were again measured by both substances and hypothetical fragmentation graphs were calculated and prepared.
  • histidine 8 of the top 10 are amino acids and the other two are amines.
  • histidine 8 of the top 10 are amino acids and the other two are amines.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Aufgabe war es, gleichzeitig mit der massenspektrometrischen Analyse frei von subjektiver Beurteilung, in kürzester Zeit, automatisierbar und mit hoher Trefferquote deren Struktur und/oder Stoffklassen und/oder ihre chemischen Eigenschaften ermitteln zu können, ohne dass identische Fragmentierungsmuster und/oder definierte Vergleichs- bzw. Indentifizierungsregeln vorliegen müssen. Erfindungsgemäß wird aus einem oder mehreren massenspektrometrischen Fragmentierungsspektren der Substanz ein Fragmentierungsgraph gebildet, dessen Daten mit vorzugsweise in einer elektronischen Datenbank gespeicherten Referenzdaten verglichen werden. Die Erfindung wird insbesondere in der Biologie, Pharmazie und Chemie zur Bestimmung der Struktur und/oder der Stoffklasse und/oder der chemischen Eigenschaften von gefundenen unbekannten Substanzen angewendet.

Description

Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
Die Erfindung betrifft ein Verfahren zur Identifizierung vorzugsweise unbekannter Substanzen durch Massenspektrometrie, um deren Struktur und/oder Stoffklassen und/oder ihre chemischen Eigenschaften zu ermitteln.
Massenspektrometrie ist eines der derzeit gebräuchlichsten Verfahren zur Analyse von vorzugsweise unbekannten Substanzen (beispielsweise J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004).
Durch die Massenspektrometrie lässt sich die Molekülmasse der untersuchten Substanz genau bestimmen. Des Weiteren ist es möglich, eine Substanz im Massenspektrometer einmal oder mehrmals zu fragmentieren, d. h. ihre chemischen Bindungen aufzubrechen. Die
Massen der so entstandenen Fragmente werden dann wiederum gemessen. So entstehen ein oder mehrere Fragmentierungsspektren (auch Tochterionenspektren genannt).
Es ist allerdings problematisch, insbesondere für unbekannte chemische Verbindungen, die Struktur und/oder die Stoffklassen und/oder chemischen Eigenschaften dieser Verbindung zu identifizieren, da durch die Massenspektrometrie ausschließlich Massen bestimmt werden können.
Viele Arzneimittel sowie andere in Industrie und Forschung eingesetzte chemische Stoffe werden in ihrer ursprünglichen Form von Lebewesen produziert und wurden bei diesen durch Zufall oder eine sehr aufwändige Suche entdeckt. Die meisten von Lebewesen produzierten Substanzen sind der Forschung noch völlig unbekannt. Das hier vorgestellte Verfahren kann die systematische Suche nach potentiellen Wirkstoffen deutlich vereinfachen, indem es z. B. die Stoffklassen aller in einer biologischen Probe vorkommenden kleinen Substanzen (leichter als 1500 Dalton) identifiziert. Danach müssen nur noch diejenigen Verbindungen genauer untersucht werden, die zu für das Anwendungsgebiet relevanten Stoffklassen gehören. Die Substanzidentifikation von Pharmazeutika und Naturstoffen ist also aufgrund der großen Relevanz dieser Stoffe für die Medizin sowie die pharmazeutische und biologische Forschung besonders interessant. Naturstoffe sind alle Substanzen, die sich in der belebten und unbelebten Natur, also vor allem in Pflanzen und Tieren, aber z. B. auch in fossilen Lagerstätten finden. Hierunter fallen zum Beispiel alle durch chemische oder enzymatische Reaktionen entstandene Stoffwechselprodukte, aber auch die Abbauprodukte von künstlich der Natur zugefügten Stoffen, wie z. B. Arzneimitteln oder Umweltgiften. Auch wenn Naturstoffe wahrscheinlich das Hauptanwendungsgebiet darstellen, ist das vorgestellte Verfahren nicht auf diese beschränkt. Eine Anwendung ist auch in anderen Bereichen der Chemie möglich, beispielsweise in der Material Wissenschaft.
Da Naturstoffe meist als Gemische vorliegen (z. B. Zellextrakt, Umweltprobe) wird der Massenspektrometrie oft ein Trennverfahren vorgeschaltet, um die zu identifizierenden Substanzen für die massenspektrometrische Analyse zu separieren. Dieses Trennverfahren ist üblicherweise die Gas- oder Flüssigchromatographie oder die Kapillarelektrophorese (beispielsweise U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry, Plant J, 2000, 23, 131-142).
Es ist bekannt (beispielsweise R. Mistrik: XCalibur HighChem: Mass Frontier Software. HighChem/ThermoFinnigan, Manual 2001) Fragmentierungsmuster, die mit der massenspektrometrischen Analyse ermittelt werden, mit manuell aus Referenzdaten gewonnenen idealisierten Mustern, sogenannten Regeln, zu vergleichen. Eine solche Gegenüberstellung wäre vom Grundsatz automatisierbar, setzt allerdings voraus, dass die entsprechenden Regeln für den untersuchten Stoff erstellt wurden, ist deshalb für nicht bekannte Substanzen in keiner Weise anwendbar. Darüber hinaus können diese regelbasierten Ansätze fehlerbehaftete Daten nicht verarbeiten, was sie für die Praxis unbrauchbar macht (K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & GJ. Langley: Approaches towards the automated Interpretation and prediction of electrospray tandem mass spectra of non- peptidic combinatorial Compounds, Rapid Commun Mass Spectrom, 2003, 17, 1163-1168).
Für den speziellen Fall, dass ein unter gleichen Messbedingungen erstelltes Fragmentierungsspektrum bereits identisch in einer Referenzdatenbank vorhanden ist, wäre es möglich, die untersuchte Substanz mittels rechentechnischen Vergleichs durch Suche des Spektrums in der Referenzdatenbank aufzufinden und auf diese Weise zu identifizieren (L. Vogt, T. Gröger & R. Zimmermann: Automated Compound Classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1150, 2-12; DE 103 58 366 B4, US 6,624,408 Bl, US 2003 023 66 36 Al, US 6,747,272 B2).
Dieses Verfahren funktioniert nicht bei gänzlich unbekannten Substanzen, da ein Referenzspektrum der Substanz vorhanden sein muss. Zusätzlich sind Fragmentierungsspektren zum Teil stark von äußeren Parametern abhängig und unterscheiden sich daher von Labor zu Labor. Direkte Vergleiche zwischen Spektren sind in diesem Fall nicht aussagekräftig, daher ist eine Suche nach einem unter vergleichbaren Bedingungen vorliegenden identischen Referenzspektrum in den wenigsten Anwendungsfällen möglich.
Um diesen letztgenannten Nachteil zu umgehen, ist es auch bekannt, in einer Datenbank nach Fragment-Ionen zu suchen, die dort zu definierten Fragmentierungsmustern gespeichert sind (US 7,197,402 B2). Diese Ionen müssen dann entweder eine bekannte, eindeutige Struktur besitzen, oder es müssen mit zusätzlicher massenspektrometrischer Untersuchung Fragmentierungsspektren dieser Ionen gemessen werden. Diese durch mehrfache Fragmentierung entstandenen Spektren (MSn) sollen, wie angegeben, vergleichbarer, als die vorgenannten 'einfachen' Fragmentierungsspektren sein. Dieses Verfahren bleibt jedoch ebenfalls auf die Identifizierung von bekannten (und datentechnisch erfassten) Substanzen beschränkt. Außerdem ist die mehrfache Fragmentierung nur mit sehr speziellen Typen von Massenspektrometern möglich, was den Zusatzaufwand weiter erhöht.
Sind Substanzen zu identifizieren, für die Referenzdaten oder Vergleichs- bzw. Indentifizierungsregeln nicht oder nicht vollständig vorliegen, müssen nach wie vor zumindest im Einzelfall kleinere Moleküle anhand ihrer Fragmentierungsmuster beurteilt werden, d. h. es muss aufwendig untersucht werden, inwieweit vergleichbare Ähnlichkeiten zu bekannten Strukturen gefunden werden können, die eine Bestimmung der Stoffklasse, der chemischen Eigenschaften oder vielleicht sogar der Molekülstruktur erlauben oder wenigstens unterstützen könnten (P. Shi, Q. He, Y. Song, H. Qu und Y. Cheng: Characterization and identification of isomeric flavonoid O-diglycosides from genus Citrus in negative electrospray ionization by ion trap mass spectrometry and time-of-flight mass spectrometry, Anal. Chim. Acta, 2007, 598, 110-118). Diese Beurteilung ist allerdings subjektiv, langwierig und basiert auf menschlicher Intuition. Sie stellt deshalb keine objektive und schnelle Substanzidentifikation dar und setzt vielmehr hohes Wissen sowie umfangreiche Erfahrung von Experten auf diesem Gebiet voraus. Dennoch ist die Trefferquote in der Praxis selbst für kleinere Moleküle nicht sehr hoch. Das Verfahren ist aus den vorgenannten Gründen auch nicht automatisierbar. Für größere Moleküle wäre diese Methode insbesondere wegen der hohen Anforderungen an den Gutachtenden und der zu erwartenden niedrigen Trefferquote praktisch nicht verwendbar.
Im Jahr 2008 haben Böcker und Rasche (S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 149-155) eine mathematische Formalisierung des Konzeptes von Fragmentierungsmustern eingeführt. Sie nutzen dabei Graphen, um das Fragmentierungsmuster einer Substanz darzustellen. Als Graph soll dabei eine Menge von Objekten, üblicherweise als Knoten bezeichnet, und eine Menge von Paaren aus den Elementen dieser Menge, üblicherweise als Kanten bezeichnet, gelten. Diese Menge von Paaren repräsentiert die Beziehungen der Objekte untereinander. In diesem Fall werden die Fragmente der Substanz als Knoten und die Fragmentierungsreaktionen als Kanten dargestellt. Da die Struktur der untersuchten Substanz nicht bekannt ist, werden die Knoten mit den Summenformeln der Fragmente, und die Kanten mit den Summenformeln der Neutralverluste beschriftet. Diese Fragmentierungsgraphen werden dazu verwendet, um die Summenformel einer unbekannten Substanz zu bestimmen. Summenformeln an sich sind jedoch nicht ausreichend, um einen Stoff zu identifizieren und lassen auch keine Schlüsse auf die Stoffklasse der untersuchten Substanz zu. Eine Verwendung der vorgeschlagenen Graphen von Fragmentierungsmustern zur Identifikation insbesondere unbekannter Substanzen bzw. zur Bestimmung deren Stoffklasse und/oder chemischen Eigenschaften ist auch der Fachwelt nicht bekannt geworden.
Ferner ist auf einem speziellen biologischen bzw. medizinischem Aufgabengebiet das Alignieren von Bäumen an sich zum Vergleich von RNA-Strukturen bekannt (T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sei., Elsevier Science Publishers Ltd., 1995, 143, 137-148). Hierbei werden die beschrifteten Knoten der zu vergleichenden Bäume so übereinander gelegt, dass sich die Beschriftungen möglichst gering unterscheiden. Strukturell müssen sich die Bäume gleichen, es dürfen nur sogenannte Gap-Knoten in die Äste der Baumdarstellung eingefügt werden, falls erforderlich. Über Anwendungen dieser Methode, um insbesondere bei massenspektro- metrischen Untersuchungen von Substanzen diese zu identifizieren bzw. deren Stoffklasse und/oder chemischen Eigenschaften zu bestimmen, ist ebenfalls nichts bekannt geworden.
Der Erfindung liegt die Aufgabe zu Grunde, gleichzeitig mit der massenspektrometrischen Analyse insbesondere unbekannter chemischer Verbindungen zu deren Identifizierung frei von subjektiver Beurteilung, in kürzester Zeit, automatisierbar und mit möglichst hoher Trefferquote deren Struktur und/oder Stoffklassen und/oder ihre chemischen Eigenschaften ermitteln zu können, ohne dass identische Fragmentierungsmuster und/oder definierte Vergleichs- bzw. Indentifϊ- zierungsregeln vorliegen müssen.
Erfindungsgemäß wird diese Aufgabe gelöst, indem bei der massenspektrometrischen Analyse einer zu untersuchenden Substanz von dieser zumindest ein massenspektrometrisches Fragmentierungsspektrum (Tochterionenspektrum) aufgenommen wird, aus welchem ein (für nicht bekannte Substanzen hypothetischer) Fragmentierungsgraph generiert wird, der bisher ausschließlich dazu bekannt ist, die Summenformel einer Substanz zu bestimmen. Der Fragmentierungsgraph wird durch Objekte und Verknüpfungen des zumindest einen massenspektrometrischen Fragmentierungsspektrums, beispielsweise durch Knoten als Objekte (Fragmente der Substanz) sowie durch Kanten (Fragmentierangsreaktionen als Verknüpfung), repräsentiert. Die Darstellung des Fragmentierungsgraphen kann zur Realisierung der besagten Objekte und Verknüpfungen allerdings auch durch eine vom typischen Ausdruck durch Knoten und Kanten abweichenden mathematischen Darstellung, wie beispielsweise einer partiellen Ordnung, einer Relation, einer Hierarchie, geprägt sein.
Die Daten dieses Fragmentierungsgraphen werden mit vorliegenden Referenzdaten von Fragmentierungsgraphen bekannter Substanzen verglichen, wobei dieser Vergleich vorzugsweise rechentechnisch erfolgt, indem die Vorrichtung zur massenspektrometrischen Untersuchung mit einem Rechner in Verbindung steht, der auf eine elektronische Datenbank zugreift, in welcher die besagten Referenzdaten der bekannten Fragmentierungsgraphen für den Vergleich bereitgestellt werden. Auf diese Weise kann dieser Datenvergleich der Fragmentierungsgraphen zeitgleich und automatisch parallel zur massenspektrometrischen Auswertung der zu untersuchenden bzw. zu identifizierenden Substanz erfolgen. Beim Datenvergleich der Fragmentierungsgraphen werden identische oder zumindest ähnliche Teilgraphen, d. h. eine Teilmenge der Knoten und Kanten, gesucht, um die massenspektrometrisch untersuchte Substanz nach diesen bekannten Fragmentierungsgraphen bzw. Teilgraphen anhand der Substanzstruktur und/oder der Stoffklasse und/oder der chemischen Substanz- eigenschaften zu bestimmen.
Der rechentechnische Datenvergleich ermöglicht in kürzester Zeit eine automatische Substanzidentifizierung gegenüber einer Vielzahl bekannter Fragmentierungsgraphen, ohne dass zwingend vollständige Fragmentierungsgraphen der zu identifizierenden Substanz und/oder definierte Vergleichs- bzw. Indentifizierungsregeln für die Gegenüberstellung als Referenz vorhanden sein müssen, da der Vergleich nicht das gesamte Fragmentierungsspektrum, sondern auch Teilstrukturen des besagten Fragmentierungsgraphen einschließt.
Alle bisherigen automatisierbaren und praktikablen Verfahren setzen voraus, dass die zu untersuchende Substanz bereits bekannt ist, schon einmal massenspektrometrisch untersucht wurde und als vollständiges Fragmentierungsmuster referenzmäßig präsent ist. Im Gegensatz zu diesen (eingangs genannten) bekannten Methoden muss sich bei dem hier vorgestellten Verfahren die zu identifizierende Substanz selbst nicht in den Referenzdaten befinden, sondern es genügt, wenn die zum Vergleich herangezogenen Daten zumindest in Teilbereichen Ähnlichkeiten des vollständigen oder teilweisen Fragmen- tierungsgraphen gegenüber dem Fragmentierungsgraph der zu identifizierenden Substanz aufweisen.
Das Verfahren ermöglicht also erstmals eine automatische Identifizierung gänzlich unbekannter Stoffe. Dies war bisher nur manuell möglich. Im Gegensatz zur zeitaufwändigen manuellen Analyse können mit dem vorgestellten Verfahren die Spektren ohne subjektive Erfordernisse in Echtzeit, also ähnlich schnell wie die Messung selbst, (und damit gleichzeitig) durchgeführt werden. Dadurch wird die zeitnahe Analyse von typischen massenspektrometrischen Messreihen mit hunderten von Substanzen möglich. Außerdem basiert die Identifizierung bei diesem Verfahren mit hoher Trefferquote auf objektiven Kriterien, anstatt auf menschlicher Intuition. In Kombination mit anderen Verfahren zur Automatisierung der Messung und Analyse von Fragmentspektren (z. B. DE 10 2005 025 499 B4 und DE 103 58 366 B4) wäre sogar die vollständige automatische Durchführung und Analyse einer solchen Messreihe gänzlich ohne Benutzereingriff möglich. In den Unteransprüchen sind vorteilhafte Ausführungsschritte des Verfahrens genannt.
So kann der Fragmentierungsgraph der zu analysierenden Substanz manuell oder automatisch generiert werden.
Der Datenvergleich der Fragmentierangsgraphen kann lokal oder global, beispielsweise durch paarweises oder multiples Alignieren, erfolgen.
Es ist möglich, Fragmentierungsspektren zur Generierung der Fragmentierungsgraphen z. B. mit einem Tandem-Massenspektrometer oder durch mehrfache Fragmentierung (MSn) aufzunehmen. Dabei kann die Fragmentierung durch collision induced dissociation (CID), electron transfer dissociation (ETD), electron capture dissociation (ECD), infrared multiphoton dissociation (IRMPD), blackbody infrared radiative dissociation (BIRD), higher-energy C-trap dissociation (HCD), in-source fragmentation oder post-source decay (PSD) erfolgen.
Vor der Aufnahme der Fragmentierungsspektren kann vorteilhaft eine Substanzseparation durch Flüssigkeitschromatographie,
Gaschromatographie oder Kapillarelektrophorese vorgenommen werden.
Darüber hinaus kann es zweckmäßig sein, zusätzlich zu dem erfindungsgemäßen Datenvergleich der Fragmentierungsgraphen weitere Kriterien, wie insbesondere die chromatographische Retentionszeit und/oder die elektrophoretische Durchlaufzeit und/oder UV- Absorptionsspektren, zur Substanzidentifizierung heranzuziehen.
Eine spezielle Anwendungsmöglichkeit des erfindungsgemäßen Verfahrens besteht im Clustern von zu analysierenden Substanzen. Dazu werden für drei oder mehr, in der Regel aber eine größere Zahl von Substanzen Fragmentierungsspektren gemessen und Fragmentierungs- graphen berechnet, beispielsweise mit der Methode von Böcker und Rasche (S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, 159-155). Dabei kann es sich um unbekannte oder bekannte Substanzen handeln, oder in der Regel um sowohl bekannte als auch unbekannte Substanzen. Für diese Fragmentierungsgraphen werden mit Hilfe der hier beschriebenen Methode paarweise Ähnlichkeiten berechnet, was in einer Matrix von paarweisen Ähnlichkeiten resultiert. Auf eine solche Ähnlichkeitsmatrix können dann Verfahren der Clusteranalyse angewendet werden: Dabei sollen alle Objekte in einem Cluster ähnlich zueinander sein, aber nur geringe Ähnlichkeit mit Objekten außerhalb des Clusters aufweisen. Die Clusteranalyse wird in der Regel durch automatisierte Verfahren erfolgen, kann aber auch manuell durchgeführt werden. Für die Clusteranalyse können beliebige graphentheoretische, hierarchische, partitionierende, optimierende oder andere Verfahren zum Einsatz kommen, beispielsweise agglomeratives Clustern (bspw. UPGMA), Är-Means oder /t-Nearest Neighbors. Aus den berechneten Clustern können jetzt Rückschlüsse auf die untersuchten Substanzen gezogen werden, wenn beispielsweise eine unbekannte Substanz mit einer oder mehreren bekannten Substanzen zusammen geclustert wird.
Eine weitere Anwendungsmöglichkeit des erfindungsgemäßen Verfahrens besteht darin, die durch den Vergleich der Fragmentierungsgraphen bestimmte Ähnlichkeit mit weiteren Substanzeigenschaften (gemessenen oder vorhergesagten) zu kombinieren. Dies kann für das Clustering, aber auch für alle anderen im Folgenden beschriebenen Anwendungsmöglichkeiten und Einsatzgebiete erfolgen. Weitere bekannte Substanzeigenschaften sind beispielsweise Masse der beiden Substanzen, Massendifferenz zwischen den Substanzen, mögliche Erklärungen der Massendifferenz durch Summenformeln, Anzahl Peaks in den gemessenen Massenspektren, Summenformeln der Substanzen (hypothetisch oder validiert), Retentionszeit, elektrophoretische Durchlaufzeit, UV-Absorptionsspektren, oder der CE50- Wert der Substanz (Kertesz, T. M., Hall, L. H., Hill, D. W. & Grant, D. F. CE50: quantifying collision induced dissociation energy for small molecule characterization and identification. J. Am. Soc. Mass Spectrom., 2009, 20, 1759-1767). Die Kombination kann mit einer, mehreren oder sogar allen diesen weiteren Substanzeigenschaften erfolgen.
Eine weitere Anwendungsmöglichkeit besteht darin, die Ähnlichkeit von Fragmentierungsgraphen zur Vorhersage der strukturellen Ähnlichkeit von Substanzen zu verwenden. Die strukturelle Ähnlichkeit von Substanzen kann beispielsweise durch einen Tanimoto-Koeffizient oder Jaccard-Index gemessen werden. Eine Vorhersage dieser Strukturähnlichkeit kann unter anderem durch Methoden des überwachten Maschinellen Lernens (beispielsweise Support Vector Machines SVM, Neuronale Netze, Entscheidungsbäume, Entscheidungswälder, naiver Bayes) erfolgen. Dabei können die Substanzen dahingehend klassifiziert werden, dass eine strukturelle Ähnlichkeit von beispielsweise 90% oder mehr (alternativ 80%, 95%, oder ein anderer Wert) auf Grund der Ähnlichkeit der Fragmentierungsgraphen sowie anderer bekannter Substanzeigenschaften besteht.
Außerdem kann die Fragmentierungsähnlichkeit, zusammen mit anderen Substanzeigenschaften, für eine direkte Vorhersage der Substanzähnlichkeit (beispielsweise Tanimoto-Koeffizient oder Jaccard- Index) verwendet werden: Dazu können Verfahren des Maschinellen Lernens wie beispielsweise Lineare Regression, SVM for Regression (SVR), v-Support Vector Regression (v-SVR), oder Local Linear Maps verwendet werden.
Die Erfindung kann vorteilhaft angewendet werden, um die Struktur unbekannter Substanzen durch Vergleich von Fragmentierungsgraphen ganz oder teilweise aufzuklären. Dazu können die
Fragmentierungsgraphen von Referenzsubstanzen mit bekannter Struktur verwendet werden, die eine hohe lokale oder globale Ähnlichkeit mit dem Fragmentierungsgraphen der zu identifizierenden Substanz aufweisen. So können Hypothesen über die Struktur der zu identifizierenden Substanz aufgestellt werden, die dann beispielsweise durch den Einsatz weiterer experimenteller Techniken (mehrstufige
Fragmentierungs-Massenspektrometrie oder NMR-Spektroskopie) evaluiert werden. Andererseits können durch andere experimentelle Techniken gewonnene Hypothesen über die Struktur der zu identifizierenden Substanz durch den Vergleich von Fragmentierungsgraphen evaluiert und verifiziert werden.
Ein Einsatzgebiet der Erfindung ist auch das Screening unbekannter Stoffe nach potentiellen biologischen Wirkstoffen (bio-prospecting). Dabei kann für einen bekannten Wirkstoff nach Substanzen gesucht werden, die eine ähnliche oder identische Wirkung aufweisen (beispielsweise Generika). Außerdem kann nach Substanzen gesucht werden, die eine verbesserte Wirkung aufweisen, oder eine oder mehrere unerwünschte Nebenwirkungen des Wirkstoffes nicht aufweisen. Dies kann auch für Wirkstoffe geschehen, die nicht für die Medikation von Menschen zugelassen oder geeignet sind, weil beispielsweise die Schwere der Nebenwirkungen den erwünschten Effekt des Wirkstoffes überwiegt. Für das Screening können beispielsweise die Sekundärmetaboliten von Organismen untersucht werden, insbesondere von Pflanzen, Pilzen und Bakterien. Das Screening kann unter unterschiedlichen äußeren Bedingungen, unterschiedlichen Entwicklungsstadien und an unterschiedlichen Gewebetypen erfolgen, beispielsweise Samen, Wurzeln und Blätter einer Pflanze. Die Fragmentierungs-Massenspektren können in einem automatischen Durchlauf erstellt werden, wobei die zu fragmentierenden Substanzen beispielsweise automatisch und ohne Wissen über die in der Probe befindlichen Substanzen bestimmt werden. Die Anwendung ist nicht auf für den Menschen bestimmte Medikamente oder Wirkstoffe beschränkt.
Vorteilhaft ist auch die Untersuchung von Abbauprodukten von Medikamenten. Im menschlichen Stoffwechsel werden Wirk- und andere Stoffe dabei schrittweise abgebaut oder umgewandelt. Auf ähnliche Weise können Medikamente durch äußere Einflüsse (beispielsweise unsachgemäße Lagerung, beispielsweise unter zu großer Hitze) abgebaut oder umgewandelt werden. Hier lautet eine mögliche Fragestellung, welche Substanzen im Rahmen des Abbauvorgangs entstehen, und welche Wirkungen und Nebenwirkungen von diesen Substanzen ausgehen können. Eine Anwendung des erfindungsgemäßen Verfahrens ist auch zur Identifizierung von Nachweissubstanzen, wie z. B. Biomarkern, möglich. Durch Umwelteinflüsse oder Fremdstoffe kann der Metabolismus eines biologischen Systems geändert werden. Beispielsweise können Substanzen identifiziert werden, die im Rahmen einer Infektion gebildet werden. Im Labor kann durch Blutuntersuchung festgestellt werden, ob solche Substanzen im Blut des Patienten vorkommen und Rückschlüsse auf eventuelle Entzündungsfaktoren gezogen werden.
Ein weiteres Einsatzgebiet des erfindungsgemäßen Verfahrens ist die Identifizierung unbekannter Drogen. Hierbei wird die unbekannte Substanz massenspektrometrisch untersucht, und ihr Fragmentierungsgraph wie oben beschrieben mit den Fragmentierungsgraphen bekannter legaler oder illegaler Drogen verglichen. Dadurch können Informationen über eine eventuelle Wirksamkeit der unbekannten Substanz als Droge gewonnen werden.
Ebenfalls ist die Identifizierung von leistungssteigernden Substanzen (Doping) möglich. Es findet eine ständige Entwicklung neuer oder Weiterentwicklung bekannter leistungssteigernder Substanzen statt, und solche neuen oder weiterentwickelten Substanzen können durch Vergleich der Fragmentierungsgraphen bekannter leistungssteigernder Substanzen identifiziert werden.
Möglich ist auch die Identifizierung von Botenstoffen (signaling molecules). Solche Botenstoffe können intrazellulär, zwischen verschiedenen Geweben oder zwischen Organismen einer oder mehrere Spezies auftreten. Durch solche Botenstoffe wird das Zusammenspiel der Zellen in einem Organismus geregelt. Bei Pflanzen dienen solche Botenstoffe beispielsweise dazu, Fressfeinde von Pflanzenschädlingen anzulocken, die die Pflanze befallen haben. Solche Botenstoffe können auch eine Schädigung eines Pflanzenschädlings bewirken (Allomone). Die Identifizierung solcher Botenstoffe kann beispielsweise bei der Entwicklung von Pflanzenschutzmitteln oder der Züchtung neuer Pflanzenarten Verwendung finden. Darüber hinaus ist die Identifizierung von Substanzen im Trinkwasser, Flusswasser oder anderen Wässern möglich. Um eine hohe Wasserqualität zu gewährleisten, müssen im Wasser enthaltene Substanzen identifiziert werden, um so beispielsweise eine Gefährdung von Mensch, Tier und Pflanze auszuschließen. Dabei kann es sich z. B. um Abbauprodukte von Substanzen, die vom Menschen eingebracht werden (beispielsweise Hormone, Pflanzenschutzmittel) oder um von Mikroorganismen erzeugte oder verstoffwechselte Substanzen handeln.
Ferner sei als Einsatzgebiet des erfindungsgemäßen Verfahrens allgemein die Identifizierung von (unbekannten) Metaboliten zu wissenschaftlichen oder kommerziellen Zwecken genannt.
Die Erfindung soll nachstehend anhand von in der Zeichnung dargestellten Ausfuhrungsbeispielen zur Bestimmung struktureller Ähnlichkeiten sowie zur Klassifikation von Stoffen näher erläutert werden. Es zeigen:
Abb. 1 : Strukturformel von Dopamin Abb. 2: Hypothetischer Fragmentierungsgraph von Dopamin, wobei die Knoten den bei der Tandem-Massenspektrometrie gemessenen Fragmenten und die Kanten den Neutralverlusten entsprechen
Abb. 3: Fragmentierungsgraph von Dopamin, dargestellt als partielle Ordnung
Abb. 4: Strukturformel von Tyramin
Abb. 5: Hypothetischer Fragmentierungsgraph von Tyramin, Darstellung wiederum durch Knoten (Fragmente) sowie durch Kanten (Neutralverluste) Abb. 6: Optimales lokales Alignment der Fragmentierungsgraphen von
Dopamin (links) und Tyramin (rechts) Abb. 7: Übersicht über die Bewertung des Alignments der
Fragmentierungsgraphen von Dopamin und Tyramin Abb. 8: Übersicht über die Bewertung der Alignments mit dem hypothetischen Fragmentierungsgraph von Histidin Abb. 9: Übersicht über die Bewertung der Alignments mit dem hypothetischen Fragmentierungsgraph von 4-
Hexosyloxybenzoyl Cholin
a) Bestimmung struktureller Ähnlichkeiten:
Die Bestimmung der strukturellen Ähnlichkeiten von zwei oder mehr Stoffen wird im Folgenden beispielhaft an den Stoffen Dopamin und Tyramin beschrieben. Beide gehören zu den biogenen Aminen und besitzen eine sehr ähnliche Struktur (vgl. Abb. 1 und 4).
In der typischen Anwendung wird eine der beiden Strukturen unbekannt sein. Dann können anhand des Verfahrens Annahmen über diese Struktur gemacht werden. Das hier vorgestellte Beispiel soll einen diesbezüglichen Ansatz verdeutlichen.
Sowohl Dopamin als auch Tyramin wurden mit Hilfe von Tandem- Massenspektrometrie untersucht. Die Fragmentierung erfolgte dabei mittels an sich bekannter collision induced dissociation (CID). Es ist jedoch auch möglich, andere Massenspektrometrieverfahren, wie z. B. MSn, bzw. andere Fragmentierungsmethoden zu verwenden.
Für die beiden Stoffe wurden jeweils mehrere Fragmentierungsspektren (Tochterionenspektren) gemessen und daraus hypothetische Fragmentierungsmuster berechnet. Als Grundlage für die weitere Analyse können natürlich auch manuell erzeugte Fragmentierungsmuster verwendet werden. Die Fragmentierangsgraphen mit dem hypothetischen Verlauf der beiden Fragmentierungen sind in Abb. 2 (Dopamin) und Abb. 5 (Tyramin) mit Hilfe von Knoten als Fragmente der Substanz und Kanten als Fragmentierungsreaktionen (Neutralverlusten) dargestellt. Andere mögliche Repräsentationen sind z. B. partielle Ordnungen (vgl. Abb. 3), Relationen und Hierarchien.
Im weiteren Verlauf wurden die beiden Fragmentierungsgraphen für den Vergleich aufbereitet. Die für dieses Beispiel relevanten Informationen sind die Neutralverluste, welche bei der Fragmentierung entstehen (jeweils an den Kanten der Graphen angegeben). Diese Informationen wurden auf die jeweils darunter liegenden Knoten übertragen, da im Folgenden ein Algorithmus zum Alignieren der Knoten zweier Graphen angewendet wurde. Werden hingegen sowohl die Fragmente als auch die Neutralverluste bzw. nur die Fragmente für den Vergleich berücksichtigt oder werden Algorithmen zum Alignieren von Kanten verwendet, kann dieser Schritt entfallen, ggf. ist jedoch eine anderweitige Aufbereitung der Fragmentierungsgraphen zweckmäßig bzw. erforderlich.
Die beiden aufbereiteten Fragmentierungsgraphen von Dopamin und Tyramin wurden anschließend lokal aligniert. Es wurden also die Bereiche beider Graphen ermittelt, welche die größte lokale Ähnlichkeit besitzen. Da es sich bei den Fragmentierungsgraphen in diesem Beispiel um Bäume handelt, wurde für das Alignieren der Baum-Alignment- Algorithmus nach T. Jiang, L. Wang & K. Zhang (Alignment of trees: an alternative to tree edit, Theor. Comput. Sei., Elsevier Science Publishers Ltd., 1995, 143, 137-148) angewandt. Die Bewertung von Knotenpaaren wurde dabei wie folgt gewählt: Gleiche Knoten (d. h. Knoten mit gleicher Summenformel) wurden sehr positiv bewertet, wobei auch die Größe des Neutralverlustes in die Bewertung einging; Knotenpaare, bei denen der Unterschied in der Summenformel chemisch erklärbar ist, wurden leicht positiv bewertet; und Paare von unterschiedlichen Knoten sowie Paare bestehend aus einem Knoten und einer Lücke wurden negativ bewertet. Die Gesamtbewertung eines Alignments berechnete sich schließlich aus der Summe aller Einzelbewertungen der Knotenpaare.
Für die Bewertung von Knotenpaaren gibt es außer dem in diesem Beispiel gewählten Ansatz auch zahlreiche andere Möglichkeiten, so z. B. die Berechnung von „log odds" (logarithmierte „Chancen") bzw. „log likelihoods" (logarithmierte Wahrscheinlichkeiten). Des Weiteren ist es möglich die optimale Bewertungsfünktion mit Hilfe von Maschinellem Lernen oder evolutionären Algorithmen zu ermitteln. Ein Alignment kann sowohl lokal (wie in diesem Beispiel) als auch global erfolgen, außerdem können auch mehrere Graphen gleichzeitig miteinander verglichen werden (multiples Alignment). Das Ergebnis des lokalen Alignments ist in Abb. 6 dargestellt (links: Dopamin und rechts: Tyramin). Die Knotenbezeichnung setzt sich aus einem Index, der Summenformel des Neutralverlustes sowie aus einem Buchstaben, welcher die paarweise Entsprechung im Alignment angibt, zusammen. Die Grautöne visualisieren diese Zusammengehörigkeit. Knoten 3 im linken Baum ist nicht gefärbt, da er keine Entsprechung im rechten Baum hat, er wurde mit einer Lücke aligniert. Die dünnumrahmten Knoten sind nicht Bestandteil des optimalen lokalen Alignments.
Abb. 7 zeigt die Bewertung der alignierten Knoten der aufbereiteten Fragmentierungsgraphen von Dopamin und Tyramin. In eckigen Klammern sind jeweils die Summenformeln der alignierten Neutral Verluste angegeben. Darunter ist die Bewertung der jeweiligen Knotenalignments angegeben. Die Summe dieser ergibt die Gesamtbewertung. Man kann sehen, dass sich die strukturelle Ähnlichkeit beider Stoffe im Ergebnis des Alignments widerspiegelt, da große Bereiche beider Graphen einander entsprechen. Außerdem wird aus dem zusätzlichen Knoten „CO" bei Dopamin, der mit einer Lücke aligniert wird, auch ersichtlich, dass Dopamin eine zusätzliche Hydroxylgruppe besitzt. Es ergeben sich dadurch auch Verschiebungen in der Abspaltung der Kohlenstoff-Atome, daher der zusätzliche Verlust von CO und nicht eines Sauerstoffatoms allein.
Bezogen auf die typische Anwendung bei der eine der beiden Strukturen unbekannt ist, ließe sich aus dem berechneten Alignment schließen, sowohl dass der untersuchte Stoff dem Referenzstoff strukturell sehr ähnlich ist als auch dass es einen Unterschied von einer sauerstoffhaltigen Gruppe gibt. b) Klassifikation von Stoffen:
Im Folgenden wird die Klassifikation von Stoffen beispielhaft an Histidin sowie 4-Hexosyloxybenzoyl Cholin beschrieben. Als Referenz wurden hypothetische Fragmentierangsgraphen von 35 weiteren Stoffen verwendet.
Wie beim ersten Anwendungsbeispiel (Bestimmung struktureller Ähnlichkeiten) wurden wiederum von beiden Stoffen Fragmentierungsspektren gemessen und hypothetische Fragmentierungsgraphen berechnet und aufbereitet.
Anschließend wurden die beiden Fragmentierungsgraphen jeweils mit allen Referenzgraphen lokal aligniert und die Alignments bewertet (je höher die Bewertung desto größer die ermittelte Ähnlichkeit). Der Vergleich zweier Fragmentierungsgraphen lief dabei wie in Beispiel 1 beschrieben ab.
Die Anwendung des lokalen Alignments ist dabei nur eine Möglichkeit, es können auch andere Methoden, sowohl lokale als auch globale Verfahren, verwendet werden, um Fragmentierungsgraphen zu vergleichen.
Die Ergebnisse der Vergleiche sind tabellarisch in Abb. 8 (Histidin) und Abb. 9 (4-Hexosyloxybenzoyl Cholin) dargestellt. Man kann erkennen, dass der Fragmentierungsgraph von 4- Hexosyloxybenzoyl Choline eine sehr hohe lokale Ähnlichkeit mit anderen Cholinen hat (die ersten 13 Treffer sind Choline).
Das gleiche gilt für Histidin, 8 der besten 10 Treffer sind Aminosäuren und die anderen beiden sind Amine. Dies zeigt beispielhaft, dass der vorgestellte Ansatz erfolgreich genutzt werden kann, um die beiden hier untersuchten Stoffe in die Klassen Aminosäuren und Choline einzuteilen.
Des weiteren ist anzumerken, dass die jeweils besten Treffer in diesem Beispiel auch die größte strukturelle Ähnlichkeit mit den untersuchten Stoffen haben.

Claims

Patentansprüche
1. Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie, bestehend aus folgenden Schritten: a) Aufnahme zumindest eines massenspektrometrischen
Fragmentierungsspektrums (Tochterionenspektrums) der zu identifizierenden Substanz, b) Bestimmen eines Fragmentierungsgraphen dieser Substanz aus dem zumindest einen massenspektrometrischen Fragmentierungsspektrum, wobei in dem Fragmentierungsgraph die in dem zumindest einem Fragmentierungsspektrum gemessenen Fragmente der Substanz durch Objekte und die Fragmentierungsreaktionen durch Verknüpfungen repräsentiert werden, c) Vergleich der Daten des vollständigen oder teilweisen
Fragmentierungsgraphen mit Referenzdaten, um die Substanz anhand ihrer Struktur und/oder der Stoffklasse und/oder ihrer chemischen Eigenschaften zu identifizieren.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph typischerweise durch Knoten als Fragmente der Substanz und Kanten als Fragmentierungsreaktionen (Verknüpfung) repräsentiert wird.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph mit Hilfe einer von der typischen Darstellung mit Knoten und Kanten verschiedenen mathematischen Darstellung, wie z. B. einer partiellen Ordnung, einer Relation, oder einer Hierarchie, repräsentiert wird.
4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass der Fragmentierungsgraph automatisch erzeugt wird.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Vergleich des Fragmentierungsgraphen mit den Referenzdaten lokal erfolgt, wobei nicht alle Objekte und Verknüpfungen des Fragmentierungsgraphen, sondern nur ein vom Vergleichsverfahren automatisch zweckmäßig gewählter Teil derselben zum Vergleich herangezogen werden.
6. Verfahren nach Ansprüchen 1 und 5, dadurch gekennzeichnet, dass der Vergleich durch paarweises Alignieren erfolgt.
7. Verfahren nach Ansprüchen 1 und 5, dadurch gekennzeichnet, dass der Vergleich durch multiples Alignieren erfolgt.
8. Verfahren nach einem oder mehreren der Ansprüche 1 sowie 5 bis 7, dadurch gekennzeichnet, dass der Vergleich rechentechnisch durchgeführt wird.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Daten des Fragmentierungsgraphen mit in einer elektronischen Datenbank gespeicherten Referenzdaten verglichen werden.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass der Vergleich erfolgt, indem eine Vorrichtung zur massenspektrometrischen Analyse, durch welche die Daten des
Fragmentierungsgraphen generiert werden, mit einer die elektronische Datenbank enthaltenden rechentechnischen Einheit gekoppelt wird.
11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das zumindest eine massenspektrometrische Fragmentierungsspektrum mit einem Tandem-Massenspektrometer erstellt wird.
12. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das zumindest eine massenspektrometrische Fragmentierungsspektrum durch mehrfache Fragmentierung (MSn) erstellt wird.
13. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Fragmentierung durch collision induced dissociation (CID) erfolgt.
14. Verfahren nach Anspruch I5 dadurch gekennzeichnet, dass vor der Aufnahme des zumindest einen massenspektrometrischen Fragmentierungsspektrums eine Substanztrennung, beispielsweise durch Flüssigkeitschromatographie, Gaschromatographie oder Kapillarelektrophorese, durchgeführt wird.
15. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass zusätzlich zum Vergleich der Daten des Fragmentierungsgraphen mit den Referenzdaten die chromatographische Retentionszeit und/oder die elektrophoretische Durchlaufzeit und/oder UV-
Absorptionsspektren der untersuchten Substanz als weitere Vergleichskriterien zur Identifizierung der Substanz herangezogen werden.
EP10707432A 2009-01-21 2010-01-15 Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie Ceased EP2389588A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102009005845A DE102009005845A1 (de) 2009-01-21 2009-01-21 Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
PCT/DE2010/000054 WO2010083811A1 (de) 2009-01-21 2010-01-15 Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie

Publications (1)

Publication Number Publication Date
EP2389588A1 true EP2389588A1 (de) 2011-11-30

Family

ID=42184445

Family Applications (1)

Application Number Title Priority Date Filing Date
EP10707432A Ceased EP2389588A1 (de) 2009-01-21 2010-01-15 Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie

Country Status (6)

Country Link
US (1) US8263931B2 (de)
EP (1) EP2389588A1 (de)
JP (1) JP5559816B2 (de)
CA (1) CA2750231A1 (de)
DE (1) DE102009005845A1 (de)
WO (1) WO2010083811A1 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5664667B2 (ja) * 2011-01-11 2015-02-04 株式会社島津製作所 質量分析データ解析方法、質量分析データ解析装置、及び質量分析データ解析用プログラム
DE102011014805A1 (de) 2011-03-18 2012-09-20 Friedrich-Schiller-Universität Jena Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
JP2015512523A (ja) * 2012-04-05 2015-04-27 マイクロマス ユーケー リミテッド Ecdまたはetdフラグメンテーションを用いるms/ms分析
US10840073B2 (en) * 2012-05-18 2020-11-17 Thermo Fisher Scientific (Bremen) Gmbh Methods and apparatus for obtaining enhanced mass spectrometric data
EP3335236B1 (de) * 2015-08-13 2020-05-06 DH Technologies Development PTE. Ltd. Isotoptolerante bibliothekssuche
CN105136925A (zh) * 2015-08-26 2015-12-09 中南大学 一种中药所含系列成分检测鉴定的分析系统
JP7096174B2 (ja) * 2019-01-23 2022-07-05 日本電子株式会社 組成推定装置及び方法
JP2022173863A (ja) * 2021-05-10 2022-11-22 株式会社東芝 モジュラー型時系列データ予測装置、モジュラー型時系列データ予測方法、および、プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6624408B1 (en) 1998-10-05 2003-09-23 Bruker Daltonik Gmbh Method for library searches and extraction of structural information from daughter ion spectra in ion trap mass spectrometry
US20030200032A1 (en) * 2002-03-01 2003-10-23 Applera Corporation Determination of compatibility of a set chemical modifications with an amino-acid chain
JP4163534B2 (ja) 2002-04-01 2008-10-08 日本電子株式会社 質量スペクトルの解析方法および装置
JP3743717B2 (ja) 2002-06-25 2006-02-08 株式会社日立製作所 質量分析データの解析方法および質量分析データの解析装置および質量分析データの解析プログラムならびにソリューション提供システム
US7820378B2 (en) * 2002-11-27 2010-10-26 Sequenom, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
DE10358366B4 (de) * 2003-12-10 2008-04-03 Bruker Daltonik Gmbh Massenspektrometrische Substanzidentifizierung
US20050192755A1 (en) * 2004-02-27 2005-09-01 Srinivasa Nagalla Methods and systems for identification of macromolecules
US7197402B2 (en) 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
DE102005025499B4 (de) 2005-06-03 2007-09-27 Bruker Daltonik Gmbh Massenspektrometrische Gemischanalyse
DE102007027377B4 (de) 2006-06-28 2010-08-12 Scansonic Mi Gmbh Vorrichtung und Verfahren zur Bearbeitung eines Werkstücks mittels eines Laserstrahls
US8639447B2 (en) * 2007-05-31 2014-01-28 The Regents Of The University Of California Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2010083811A1 *

Also Published As

Publication number Publication date
WO2010083811A1 (de) 2010-07-29
JP5559816B2 (ja) 2014-07-23
DE102009005845A1 (de) 2010-07-22
US8263931B2 (en) 2012-09-11
CA2750231A1 (en) 2010-07-29
US20110278449A1 (en) 2011-11-17
JP2012515902A (ja) 2012-07-12

Similar Documents

Publication Publication Date Title
EP2389588A1 (de) Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie
DE102009032649B4 (de) Massenspektrometrische Identifizierung von Mikroben nach Unterarten
DE102010006450B4 (de) Gestufte Suche nach Mikrobenspektren in Referenzbibiliotheken
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
DE112005000598B4 (de) Verfahren zur Identifizierung einer Zuckerkettenstruktur und Vorrichtung zur Analyse derselben
DE112004000746B4 (de) Verfahren und Vorrichtung zum Verarbeiten von LC-MS- oder LC-MS-/MS-Daten bei Stoffwechseluntersuchungen
DE112015006900T5 (de) Verfahren zum Bestimmen der Online-NIR-Stichprobenumfänge
DE102004037512B4 (de) Massenspektrometrische Gewebezustandsdifferenzierung
JP2012515902A5 (de)
DE10143712A1 (de) Verfahren, Computersystem und Computerprogrammprodukt zur Datenauswertung
DE112015000402B4 (de) Näherungsalgorithmus zum Lösen eines Impulsübertragungsquerschnitts
DE102012205686B3 (de) Verfahren zur Substanzidentifizierung und zugehöriges Computerprogrammprodukt
DE102019114829A1 (de) Massenspektrometrische Bestimmung von Gewebezuständen
DE102020101408A1 (de) Verfahren für die massenspektrometrische bestimmung der anwesenheit oder des fehlens eines chemischen elements in einem analyten
DE102011014805A1 (de) Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
DE10393475T5 (de) Verfahren und Vorrichtung zur Identifizierung von Verbindungen in einer Probe
DE102007059461A1 (de) Verfahren zur Auswertung analytbezogener Signale aus einem mittels der Ionenbeweglichkeitsspektrometrie aufgenommenen IMS-Chromatogramm
DE102014224916A1 (de) Verfahren zur rechnergestützten Analyse eines oder mehrerer Gewebeschnitte des menschlichen oder tierischen Körpers
EP1451750B1 (de) Verfahren zur identifikation von pharmakophoren
DE102004016667B4 (de) Verfahren zur Identifizierung von Polymeren in Gemischen
perioperativer Mortalität TUM School of Medicine and Health
DE102015206444B3 (de) Verfahren zum Erkennen von Mikroorganismen
EP2954326B1 (de) Verfahren und vorrichtung zum untersuchen einer zellprobe
EP1682917B1 (de) Verfahren zur verifikation der korrekten räumlichen struktur von molekülen mittels nmr-spektroskopie
DE10108590A1 (de) Verfahren zum Ermitteln pharmazeutisch wirksamer Substanzen

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20110811

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK SM TR

DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20140217

REG Reference to a national code

Ref country code: DE

Ref legal event code: R003

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20160317