DE102011014805A1 - Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie - Google Patents

Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie Download PDF

Info

Publication number
DE102011014805A1
DE102011014805A1 DE102011014805A DE102011014805A DE102011014805A1 DE 102011014805 A1 DE102011014805 A1 DE 102011014805A1 DE 102011014805 A DE102011014805 A DE 102011014805A DE 102011014805 A DE102011014805 A DE 102011014805A DE 102011014805 A1 DE102011014805 A1 DE 102011014805A1
Authority
DE
Germany
Prior art keywords
fragmentation
graph
substance
spectrum
spectra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102011014805A
Other languages
English (en)
Inventor
Prof. Dr. Böcker Sebastian
Kerstin Scheubert
Florian Rasche
Franziska Hufsky
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Friedrich Schiller Universtaet Jena FSU
Original Assignee
Friedrich Schiller Universtaet Jena FSU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Friedrich Schiller Universtaet Jena FSU filed Critical Friedrich Schiller Universtaet Jena FSU
Priority to DE102011014805A priority Critical patent/DE102011014805A1/de
Priority to PCT/DE2012/000177 priority patent/WO2012126451A2/de
Publication of DE102011014805A1 publication Critical patent/DE102011014805A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/004Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
    • H01J49/0045Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn characterised by the fragmentation or other specific reaction

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Aufgabe war es, ein Analyseverfahren zu schaffen, welches für alle Stoffklassen, insbesondere auch für Pestizide und Alkohole, eine Identifikation der auszuwertenden Substanz mit hoher Sicherheit und Zuverlässigkeit ermöglicht. Erfindungsgemäß werden mehrere massenspektrometrische Fragmentierungsspektren der zu identifizierenden Substanz aufgenommen und daraus ein Fragmentierungsgraph bestimmt, indem für die gemessenen Massen die möglichen Summenformeln berechnet, direkte Abstammungsbeziehungen zwischen diesen Summenformeln bestimmt, sowohl die direkten also auch die indirekten Abstammungsbeziehungen anhand der Massenintensitäten der Peaks im Spektrum bewertet und aus dieser Bewertungen der bestmögliche Fragmentierungsgraph zum Vergleich mit Referenzdaten ermittelt. Die Erfindung wird insbesondere in der Biologie, Pharmazie und Chemie zur Bestimmung der Struktur und/oder der Stoffklasse und/oder der chemischen Eigenschaften von gefundenen unbekannten Substanzen angewendet.

Description

  • Die Erfindung betrifft ein Verfahren zur Identifizierung vorzugsweise unbekannter Substanzen durch Massenspektrometrie, um deren Struktur und/oder Stoffklassen und/oder ihre chemischen Eigenschaften zu ermitteln.
  • Massenspektrometrie ist eines der derzeit gebräuchlichsten Verfahren zur Analyse von vorzugsweise unbekannten Substanzen (beispielsweise J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004).
  • Durch die Massenspektrometrie lässt sich die Molekülmasse der untersuchten Substanz genau bestimmen. Des Weiteren ist es möglich, eine Substanz im Massenspektrometer einmal oder mehrmals zu fragmentieren, d. h. ihre chemischen Bindungen aufzubrechen. Die Massen der so entstandenen Fragmente werden dann wiederum gemessen. So entstehen ein oder mehrere Fragmentierungsspektren (auch Tochterionenspektren genannt).
  • Es ist allerdings problematisch, insbesondere für unbekannte chemische Verbindungen, die Struktur und/oder die Stoffklassen und/oder chemischen Eigenschaften dieser Verbindung zu identifizieren, da durch die Massenspektrometrie ausschließlich Massen bestimmt werden können.
  • Viele Arzneimittel sowie andere in Industrie und Forschung eingesetzte chemische Stoffe werden in ihrer ursprünglichen Form von Lebewesen produziert und wurden bei diesen durch Zufall oder eine sehr aufwändige Suche entdeckt. Die meisten von Lebewesen produzierten Substanzen sind der Forschung noch völlig unbekannt.
  • Das hier vorgestellte Verfahren kann die systematische Suche nach potentiellen Wirkstoffen deutlich vereinfachen, indem es z. B. die Stoffklassen aller in einer biologischen Probe vorkommenden kleinen Substanzen (leichter als 1500 Dalton) identifiziert. Danach müssen nur noch diejenigen Verbindungen genauer untersucht werden, die zu für das Anwendungsgebiet relevanten Stoffklassen gehören.
  • Die Substanzidentifikation von Pharmazeutika und Naturstoffen ist also aufgrund der großen Relevanz dieser Stoffe für die Medizin sowie die pharmazeutische und biologische Forschung besonders interessant. Naturstoffe sind alle Substanzen, die sich in der belebten und unbelebten Natur, also vor allem in Pflanzen und Tieren, aber z. B. auch in fossilen Lagerstätten finden. Hierunter fallen zum Beispiel alle durch chemische oder enzymatische Reaktionen entstandene Stoffwechselprodukte, aber auch die Abbauprodukte von künstlich der Natur zugefügten Stoffen, wie z. B. Arzneimitteln oder Umweltgiften. Auch wenn Naturstoffe wahrscheinlich das Hauptanwendungsgebiet darstellen, ist das vorgestellte Verfahren nicht auf diese beschränkt. Eine Anwendung ist auch in anderen Bereichen der Chemie möglich, beispielsweise in der Materialwissenschaft.
  • Da Naturstoffe meist als Gemische vorliegen (z. B. Zellextrakt, Umweltprobe) wird der Massenspektrometrie oft ein Trennverfahren vorgeschaltet, um die zu identifizierenden Substanzen für die massenspektrometrische Analyse zu separieren. Dieses Trennverfahren ist üblicherweise die Gas- oder Flüssigchromatographie oder die Kapillarelektrophorese (beispielsweise U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry, Plant J, 2000, 23, 131–142).
  • Für bestimmte Stoffklassen, insbesondere Biopolymere (wie z. B. Peptide und Glykane) gibt es Verfahren, diese mithilfe eines Fragmentierungsspektrums zu identifizieren (beispielsweise A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal. Chem., 2005, 15, 964–973 und D. Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-glycan structure from fragmentation spectra, J Proteome Res., 2006, 5, 1429–1434). Dieser Ansatz setzt jedoch voraus, dass die Stoffklasse der zu identifizierenden Substanz (also bespielsweise Peptid oder Glykan) bekannt ist. Eine Anwendung dieser Verfahren auf Stoffklassen, die keine Polymere sind, ist nicht möglich.
  • Es ist bekannt (beispielsweise R. Mistrik: XCalibur HighChem: Mass Frontier Software. HighChem/ThermoFinnigan, Manual 2001) Fragmentierungsmuster, die mit der massenspektrometrischen Analyse ermittelt werden, mit manuell aus Referenzdaten gewonnenen idealisierten Mustern, sogenannten Regeln, zu vergleichen. Eine solche Gegenüberstellung wäre vom Grundsatz automatisierbar, setzt allerdings voraus, dass die entsprechenden Regeln für den untersuchten Stoff erstellt wurden, ist deshalb für nicht bekannte Substanzen in keiner Weise anwendbar. Darüber hinaus können diese regelbasierten Ansätze fehlerbehaftete Daten nicht verarbeiten, was sie für die Praxis unbrauchbar macht (K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & G. J. Langley: Approaches towards the automated interpretation and prediction of electrospray tandem mass spectra of non-peptidic combinatorial compounds, Rapid Commun Mass Spectrom, 2003, 17, 1163–1168).
  • Für den speziellen Fall, dass ein unter gleichen Messbedingungen erstelltes Fragmentierungsspektrum bereits identisch in einer Referenzdatenbank vorhanden ist, wäre es möglich, die untersuchte Substanz mittels rechentechnischen Vergleichs durch Suche des Spektrums in der Referenzdatenbank aufzufinden und auf diese Weise zu identifizieren (L. Vogt, T. Gröger & R. Zimmermann: Automated compound classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1150, 2–12; DE 103 58 366 B4 , US 6,624,408 B1 , US 2003 023 66 36 A1 , US 6,747,272 B2 ).
  • Dieses Verfahren funktioniert nicht bei gänzlich unbekannten Substanzen, da ein Referenzspektrum der Substanz vorhanden sein muss. Zusätzlich sind Fragmentierungsspektren zum Teil stark von äußeren Parameter abhängig und unterscheiden sich daher von Labor zu Labor. Direkte Vergleiche zwischen Spektren sind in diesem Fall nicht aussagekräftig, daher ist eine Suche nach einem unter vergleichbaren Bedingungen vorliegenden identischen Referenzspektrum in den wenigsten Anwendungsfällen möglich.
  • Um diesen letztgenannten Nachteil zu umgehen, ist es auch bekannt, in einer Datenbank nach Fragment-Ionen zu suchen, die dort zu definierten Fragmentierungsmustern gespeichert sind ( US 7,197,402 B2 ). Diese Ionen müssen dann entweder eine bekannte, eindeutige Struktur besitzen, oder es müssen mit zusätzlicher massenspektrometrischer Untersuchung Fragmentierungsspektren dieser Ionen gemessen werden. Diese durch mehrfache Fragmentierung entstandenen Spektren (MSn) sollen, wie angegeben, vergleichbarer, als die vorgenannten 'einfachen' Fragmentierungsspektren sein.
  • Dieses Verfahren kann schon dann zur teilweisen Identifizierung beitragen, wenn das Fragmentierungsspektrum eines Tochterions in der Datenbank gespeichert ist. Allerdings bleibt die Anwendung des Verfahrens auf solche exakten Treffer von Tochterionenspektren in der Datenbank beschränkt. Daher benötigt das Verfahren sehr viele bereits analysierte Tochterionen-Spektren einer großen Anzahl von Molekülen. Diese zu messen und manuell zu analysieren stellt einen enormen Aufwand dar. Das Verfahren liefert keine Informationen, die über das Vorliegen eines exakten Treffers eines Tochterionenspektrums hinaus gehen.
  • Sind Substanzen zu identifizieren, für die Referenzdaten oder Vergleichs- bzw. Identifizierungsregeln nicht oder nicht vollständig vorliegen, müssen nach wie vor zumindest im Einzelfall kleinere Moleküle anhand ihrer Fragmentierungsmuster beurteilt werden, d. h. es muss aufwendig untersucht werden, inwieweit vergleichbare Ähnlichkeiten zu bekannten Strukturen gefunden werden können, die eine Bestimmung der Stoffklasse, der chemischen Eigenschaften oder vielleicht sogar der Molekülstruktur erlauben oder wenigstens unterstützen könnten (P. Shi, Q. He, Y. Song, H. Qu und Y. Cheng: Characterization and identification of isomeric flavonoid O-diglycosides from genus Citrus in negative electrospray ionization by ion trap mass spectrometry and time-offlight mass spectrometry, Anal. Chim. Acta, 2007, 598, 110–118). Diese Beurteilung ist allerdings subjektiv, langwierig und basiert auf menschlicher Intuition. Sie stellt deshalb keine objektive und schnelle Substanzidentifikation dar und setzt vielmehr hohes Wissen sowie umfangreiche Erfahrung von Experten auf diesem Gebiet voraus. Dennoch ist die Trefferquote in der Praxis selbst für kleinere Moleküle nicht sehr hoch. Das Verfahren ist aus den vorgenannten Gründen auch nicht automatisierbar. Für größere Moleküle wäre diese Methode insbesondere wegen der hohen Anforderungen an den Gutachtenden und der zu erwartenden niedrigen Trefferquote praktisch nicht verwendbar.
  • Im Jahr 2008 haben Bäcker und Rasche (S. Bäcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55) eine mathematische Formalisierung des Konzeptes von Fragmentierungsmustern eingeführt. Sie nutzen dabei Graphen, um das Fragmentierungsmuster einer Substanz darzustellen. Als Graph soll dabei eine Menge von Objekten, üblicherweise als Knoten bezeichnet, und eine Menge von Paaren aus den Elementen dieser Menge, üblicherweise als Kanten bezeichnet, gelten. Diese Menge von Paaren repräsentiert die Beziehungen der Objekte untereinander. In diesem Fall werden die Fragmente der Substanz als Knoten und die Fragmentierungsreaktionen als Kanten dargestellt. Da die Struktur der untersuchten Substanz nicht bekannt ist, werden die Knoten mit den Summenformeln der Fragmente, und die Kanten mit den Summenformeln der Neutralverluste beschriftet. Diese Fragmentierungsgraphen werden dazu verwendet, um die Summenformel einer unbekannten Substanz zu bestimmen. Summenformeln an sich sind jedoch nicht ausreichend, um einen Stoff zu identifizieren und lassen auch keine Schlüsse auf die Stoffklasse der untersuchten Substanz zu.
  • Es ist weiter bekannt, Fragmentierungsgraphen zur Identifizierung unbekannter Stoffe zu nutzen ( DE 10 2009 0058 45 A1 ). Dieses Verfahren ist allerdings stark abhängig von der Qualität der zugrundeliegenden Graphen der Fragmentierungsmuster. Eine gute Qualität der Fragmentierungsgraphen ist insbesondere für Pestizide und Alkohole bisher nicht gegeben, und somit ist eine zuverlässige Identifizierung der unbekannten Substanzen, insbesondere von Pestiziden und Alkoholen, nicht möglich.
  • Ferner ist auf einem speziellen biologischen bzw. medizinischem Aufgabengebiet das Alignieren von Bäumen an sich zum Vergleich von RNA-Strukturen bekannt (T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137–148). Hierbei werden die beschrifteten Knoten der zu vergleichenden Bäume so übereinander gelegt, dass sich die Beschriftungen möglichst gering unterscheiden. Strukturell müssen sich die Bäume gleichen, es dürfen nur sogenannte Gap-Knoten in die Äste der Baumdarstellung eingefügt werden, falls erforderlich. Über Anwendungen dieser Methode, um insbesondere bei massenspektrometrischen Untersuchungen von Substanzen diese zu identifizieren bzw. deren Stoffklasse und/oder chemischen Eigenschaften zu bestimmen, ist nichts bekannt geworden.
  • Der Erfindung liegt die Aufgabe zu Grunde, ein Auswerteverfahren zu schaffen, welches für alle Stoffklassen, insbesondere auch für Pestizide und Alkohole, eine Identifikation der auszuwertenden Substanz mit hoher Sicherheit und Zuverlässigkeit ermöglicht, auch wenn die Klasse des Stoffes unbekannt ist.
  • Diese Aufgabe wird durch ein Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie gelöst, welches aus folgenden Schritten besteht:
    • a) Aufnahme zumindest zweier massenspektrometrischer Fragmentierungsspektren (Tochterionenspektren) der zu identifizierenden Substanz,
    • b) Bestimmen eines Spektrumgraphen dieser Substanz aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren, indem für die gemessenen Massen die möglichen Summenformeln berechnet, direkte Abstammungsbeziehungen zwischen diesen Summenformeln bestimmt, sowohl die direkten also auch die indirekten Abstammungsbeziehungen anhand der Massenintensitäten der Peaks im Spektrum bewertet werden,
    • c) Bestimmen des bestmöglichen Fragmentierungsgraphen der Substanz, indem aus den im Spektrumgraphen vorhandenen Beziehungen die unter Einbeziehung der Bewertungen wahrscheinlichsten Beziehungen ausgewählt werden, und
    • d) Vergleich der Daten des vollständigen oder teilweisen Fragmentierungsgraphen mit Referenzdaten, um die Substanz anhand ihrer Struktur und/oder der Stoffklasse und/oder ihrer chemischen Eigenschaften zu identifizieren.
  • Überraschend hat sich gezeigt, dass mit diesem Verfahren, mit dem der Fragmentierungsgraph aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren unter Berücksichtigung von nicht nur direkten sondern auch von indirekten Abstammungsbeziehungen zwischen den besagten Summenformeln ermittelt wird, nicht nur Substanzen mit hoher Zuverlässigkeit bestimmbar sind, die bislang, sofern überhaupt, nur schwer bzw. nur mit geringer Zuverlässigkeit zu ermitteln waren, beispielsweise Pestizide und Alkohole, sondern dass die Sicherheit und Zuverlässigkeit des Fragmentierungsgraphen bei der Bestimmung aller untersuchten Stoffklassen generell erhöht ist, was die Auswertung und damit die Substanzbestimmung wesentlich verbessert. Dabei ist es nicht nötig von jedem Peak aus dem MS2-Spektrum ein MS3-Spektrum und aus jedem Peak der MS3-Spektra ein MS4-Spektrum zu messen, sondern zwei MS-Spektren sind ausreichend für das vorgeschlagene Verfahren.
  • Ein gewaltiger Vorteil der Erfindung ist dabei, dass eine zuverlässige Identifikation der auszuwertenden Substanzen ermöglicht wird, selbst wenn die Klasse des Stoffes unbekannt ist.
  • Die Methode kann insbesondere angewendet werden auf Stoffwechselzwischenprodukte, Antibiotika, Toxine, Insektizide, Botenstoffe, Flavonoide, Phenole, Xanthone, Propanoide, Stilbene, Terpene, Steroide, Carotinoide, Lipide und Alkaloide, ist aber nicht auf diese Stoffklassen beschränkt.
  • Die Erfindung soll nachstehend anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher erläutert werden.
  • Es zeigen:
  • : Fragmentierungsspektren von Phenylalanin, bestehend aus einem MS2-Spektrum (166 Da) und einem MS3-Spektrum (120 Da), und spezielle MS3-Bewertung der Peaks
  • : Bewertung der direkten Abstammungsbeziehungen im Spektrumgraph von Phenylalanin, wobei die Knoten den bei der Massenspektrometrie gemessenen Fragmenten, die Kästchen den Peaks und die Kanten den Neutralverlusten entsprechen
  • : Möglichkeiten der Bewertung der indirekten Abstammungsbeziehungen, wobei gestrichelte Peaks nicht im Spektrum vorhandene Peaks darstellen
  • : Bewertung der indirekten Abstammungsbeziehungen im Spektrumgraph von Phenylalanin, wobei die Knoten den bei der Massenspektrometrie gemessenen Fragmenten, die Kästchen den Peaks und die Kanten dem zur Bewertung maßgeblichen Parameter (σ1, σ2 oder σ3) entsprechen
  • : Bewertung der indirekten Abstammungsbeziehungen im Spektrumgraph von Phenylalanin (Ausschnitt), mit zusätzlicher widersprüchlicher Bewertungskante
  • : Bewertung der indirekten Abstammungsbeziehungen im Spektrumgraph von Phenylalanin (Ausschnitt), Auflösen des Widerspruchs durch Kopieren und Umfärben der widersprüchlichen Teile
  • : Fragmentierungsgraph von Phenylalanin, Darstellung wiederum durch Knoten (Fragmente) sowie durch Kanten (Neutralverluste)
  • a) Erstellen eines Spektrumgraphen mit direkten und indirekten Abstammungsbeziehungen:
  • Die Bestimmung eines Spektrumgraphen mit direkten und indirekten Abstammungsbeziehungen wird im Folgenden beispielhaft an dem Stoff Phenylalanin beschrieben. In der typischen Anwendung handelt es sich um einen unbekannten Stoff mit unbekannter Struktur und Funktion. Dann können mit Hilfe des Verfahrens Annahmen über die Struktur gemacht werden.
  • Phenylalanin wurde mit Hilfe von multipler Massenspektrometrie untersucht. Die Fragmentierung erfolgte dabei mit an sich bekannter collision induced dissociation (CID). Es ist jedoch auch möglich, andere Fragmentierungsmethoden (zum Beispiel in-source fragmentation, post source decay, ETD, ECD, HCD oder PQD) zu verwenden. Falls die zu bestimmende Substanz Teil eines Gemisch ist, wäre es sinnvoll, eine Trennung mithilfe von Gas- oder Flüssigchromatographie durchzuführen.
  • Nachdem die Masse-Ladungs-Verhältnisse und zugehörigen Intensitäten aller Peaks im Spektrum (peak picking) bestimmt wurden (vgl. ), werden für jedes Masse-Ladungs-Verhältnis alle möglichen Summenformeln, die im Bereich der Massentoleranz liegen, ermittelt. (vgl. auch S. Böcker & Z. Lipták, A Fast and Simple Algorithm for the Money Changing Problem, Algorithmica, 2007, 48, 413–432). Diese Summenformeln werden zur Konstruktion des Fragmentierungsgraphen verwendet (vgl. ): Es wird ein kanten-gewichteter, knoten-gefärbter Graph konstruiert, in dem es für jede mögliche Summenformel einen Knoten gibt. Zwei Knoten sind durch eine gerichtete Kante miteinander verbunden, wenn die Summenformel des Kind-Knotens eine Teilformel von der des Elternknoten ist. Kanten repräsentieren Neutralverluste, die durch die Fragmentierung entstehen. Sie deuten auf direkte Abstammungsbeziehungen hin. Alle Summenformeln, die zu dem gleichen Peak gehören, haben die gleiche Farbe. Die Gewichte w(u, v) der Kanten werden in Abhängigkeit von Peakintensitäten, Massenabweichungen zwischen vorhergesagten Molekülen und tatsächlichen Peakmassen, chemischen Eigenschaften, Kollisionsenergien der Fragmentierung und Neutralverlusten bestimmt (vgl. auch S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55).
  • Durch die mindestens zwei Massenspektren kann man zusätzlich indirekte Abstammungsbeziehungen definieren. Drei Beispiele dafür sind in dargestellt:
    • 1. Kommt in einem Spektrum mit Vorhänger-Ionen-Peak pk auch ein Peak pl vor, so deutet das darauf hin, dass das Fragment, das zu pl gehört, direkt oder indirekt von dem Fragment, das zu pk gehört, abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine positive Bewertung mit dem Parameter σ1 > 0.
    • 2. Kommt in einem Spektrum ein Peak pk vor, ein anderer Peak pl aber nicht, so deutet das darauf hin, dass das Fragment das zu pl gehört weder direkt noch indirekt von dem Fragment was zu pk gehört abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine negative Bewertung mit dem Parameter σ2 < 0.
    • 3. Seien zwei Spektren mit verschiedenen Kollisionsenergien und zwei Peaks pk und pl mit Masse(pl) < Mass(pk) gegeben. Wenn das Spektrum mit höherer Kollisionsenergie nur pl enthält, das Spektrum mit niedrigerer Kollisionsenergie aber beide Peaks aufweist, so deutet das darauf hin, dass das Fragment, welches zu pl gehört weder direkt noch indirekt von dem Fragment, welches zu pk gehört, abstammt. Deshalb bekommen solche direkten oder indirekten Abstammungsbeziehungen im Fragmentierungsgraphen eine negative Bewertung mit dem Parameter σ3 < 0.
  • Diese indirekten Abstammungsbeziehungen werden durch zusätzliche indirekte Kanten mit Gewichten w+(c(u), c(v)) zusätzlich zu den direkten Kanten mit Gewichten w(u, v) in den Spektrumgraph eingezeichnet. Alle oben genannten indirekten Abstammungsbeziehungen von Phenylalanin sind in visualisiert.
  • zeigt den zugehörigen Spektrumgraph mit indirekten Abstammungsbeziehungen (der Übersicht halber wurden die direkten Abstammungsbeziehungen aus vernachlässigt und nur die indirekten Abstammungsbeziehungen eingezeichnet).
  • zeigt einen komplexeren Fall: Angenommen, ein drittes Fragmentierungsspektrum zeigt, dass die Peaks bei 103.1 Da nicht aus dem Peak bei 120.1 Da entstanden sein können (Bewertung mit σ2 oder σ3). Dann ist eine mögliche Erklärung, dass die Peaks bei 103.1 Da durch zwei verschiedene Fragmente gleicher Masse entstanden sind. Dieser Sachverhalt wird modelliert, indem alle zum Peak 103.1 Da gehörenden Strukturen kopiert, und die Kopien in einer freien Farbe gefärbt werden ( ). Dadurch kann der nachfolgend berechnete Fragmentierungsgraph den Peak zweimal enthalten.
  • b) Berechnung des optimalen Fragmentierungsgraphen aus einem Spektrumgraph mit direkten und indirekten Abstammungsbeziehungen
  • Eine Möglichkeit, den optimalen Fragmentierungsgraphen unter Berücksichtigung nicht nur direkter sondern auch indirekter Abstammungsbeziehungen zu bestimmen, ist die Bestimmung des Teilbaumes aus dem Fragmentierungsspektrum mit maximaler Bewertung, bei dem jede Farbe maximal einmal benutzt wird. So wird verhindert, dass ein Peak durch mehr als ein Fragment erklärt wird.
  • Es handelt sich also um ein Optimierungsverfahren, im Gegensatz zur Methode nach US 7,197,402 B2 , welche regelbasiert arbeitet.
  • Die Bewertung eines Teilbaumes wird durch die Summe seiner direkten Kantengewichte (Kanten aus ) und der Summe seiner indirekten Kantengewichte (Kanten aus ) gebildet. Dabei werden indirekte Kantengewichte genau dann gezählt, wenn der Kind-Knoten entweder ein direkter oder ein indirekter Nachfahre des Vater-Knotens ist.
  • Eine Möglichkeit, einen optimalen Teilbaum möglichst schnell zu berechnen, ist ein FPT-Algorithmus:
    Figure 00100001
  • Dabei ist W*(v, S) der maximale Score eines Baumes mit Wurzelknoten v und benutzt nur Farben aus S ⊂ C. Im unteren Maximum werden dabei die trivialen Fälle S1 = {v} und S2 = {v} ausgeschlossen. Die Initialisierung erfolgt mit W*(v, c(v)) = 0.
  • In ist der optimale Fragmentierungsgraph von Phenylalanin bei Belegung der Parameter mit σ1 = 3, σ2 = –0.5 und σ3 = –0.5 dargestellt.
  • Der Fragmentierungsgraphvergleich gegenüber gespeicherten Referenz-Fragmentierungsgraphen erfolgt auf an sich bekannte Weise. Aus diesem Vergleich werden die Substanz oder Substanzklasse (vgl. DE 10 2009 0058 45 A1 ) bestimmt.
  • Sowohl die Ermittlung des Fragmentierungsgraphen als auch der anschließende Datenvergleich werden rechentechnisch durchgeführt.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 10358366 B4 [0011]
    • US 6624408 B1 [0011]
    • US 20030236636 A1 [0011]
    • US 6747272 B2 [0011]
    • US 7197402 B2 [0013, 0041]
    • DE 102009005845 A1 [0017, 0046]
  • Zitierte Nicht-Patentliteratur
    • J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004 [0002]
    • U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry, Plant J, 2000, 23, 131–142 [0008]
    • A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal. Chem., 2005, 15, 964–973 [0009]
    • D. Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-glycan structure from fragmentation spectra, J Proteome Res., 2006, 5, 1429–1434 [0009]
    • R. Mistrik: XCalibur HighChem: Mass Frontier Software. HighChem/ThermoFinnigan, Manual 2001 [0010]
    • K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & G. J. Langley: Approaches towards the automated interpretation and prediction of electrospray tandem mass spectra of non-peptidic combinatorial compounds, Rapid Commun Mass Spectrom, 2003, 17, 1163–1168 [0010]
    • L. Vogt, T. Gröger & R. Zimmermann: Automated compound classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1150, 2–12 [0011]
    • P. Shi, Q. He, Y. Song, H. Qu und Y. Cheng: Characterization and identification of isomeric flavonoid O-diglycosides from genus Citrus in negative electrospray ionization by ion trap mass spectrometry and time-offlight mass spectrometry, Anal. Chim. Acta, 2007, 598, 110–118 [0015]
    • S. Bäcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55 [0016]
    • T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137–148 [0018]
    • S. Böcker & Z. Lipták, A Fast and Simple Algorithm for the Money Changing Problem, Algorithmica, 2007, 48, 413–432 [0035]
    • S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55 [0035]

Claims (5)

  1. Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie, bestehend aus folgenden Schritten: a) Aufnahme zumindest zweier massenspektrometrischer Fragmentierungsspektren (Tochterionenspektren) der zu identifizierenden Substanz, b) Bestimmen eines Spektrumgraphen dieser Substanz aus den zumindest zwei massenspektrometrischen Fragmentierungsspektren, indem für die gemessenen Massen die möglichen Summenformeln berechnet, direkte Abstammungsbeziehungen zwischen diesen Summenformeln bestimmt, sowohl die direkten also auch die indirekten Abstammungsbeziehungen anhand der Massenintensitäten der Peaks im Spektrum bewertet werden, c) Bestimmen des bestmöglichen Fragmentierungsgraphen der Substanz, indem aus den im Spektrumgraphen vorhandenen Beziehungen die unter Einbeziehung der Bewertungen wahrscheinlichsten Beziehungen ausgewählt werden, und d) Vergleich der Daten des vollständigen oder teilweisen Fragmentierungsgraphen mit Referenzdaten, um die Substanz anhand ihrer Struktur und/oder der Stoffklasse und/oder ihrer chemischen Eigenschaften zu identifizieren.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Bestimmung des Fragmentierungsgraphen und der anschließende Datenvergleich rechentechnisch durchgeführt werden.
  3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass im Fall einer sowohl positiven als auch negativen Bewertung einer direkten oder indirekten Abstammungsbeziehung – die Teile des Spektrumgraphen, auf welche sich die widersprüchliche Bewertung bezieht, verdoppelt werden, – einer Kopie dieser Teile eine noch nicht vorhandene Farbe zugewiesen wird und – aus dem so veränderten Spektrumgraphen der bestmögliche Fragmentierungsgraph ermittelt wird.
  4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph typischerweise durch Knoten als Fragmente der Substanz und Kanten als Fragmentierungsreaktionen (Verknüpfung) repräsentiert wird.
  5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass der Fragmentierungsgraph mit Hilfe einer von der typischen Darstellung mit Knoten und Kanten verschiedenen mathematischen Darstellung, wie z. B. einer partiellen Ordnung, einer Relation, oder einer Hierarchie, repräsentiert wird.
DE102011014805A 2011-03-18 2011-03-18 Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie Withdrawn DE102011014805A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102011014805A DE102011014805A1 (de) 2011-03-18 2011-03-18 Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
PCT/DE2012/000177 WO2012126451A2 (de) 2011-03-18 2012-02-15 Verfahren zur identifizierung insbesondere unbekannter substanzen durch massenspektrometrie

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102011014805A DE102011014805A1 (de) 2011-03-18 2011-03-18 Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie

Publications (1)

Publication Number Publication Date
DE102011014805A1 true DE102011014805A1 (de) 2012-09-20

Family

ID=46756887

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102011014805A Withdrawn DE102011014805A1 (de) 2011-03-18 2011-03-18 Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie

Country Status (2)

Country Link
DE (1) DE102011014805A1 (de)
WO (1) WO2012126451A2 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6362611B2 (ja) * 2012-11-15 2018-07-25 ディーエイチ テクノロジーズ デベロップメント プライベート リミテッド 前駆体イオン情報を使用することなくms/msデータから化合物を同定するシステムおよび方法
CN113758989B (zh) * 2021-08-26 2023-11-28 清华大学深圳国际研究生院 基于碎片树的现场质谱目标物识别以及衍生物预测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999062930A2 (en) * 1998-06-03 1999-12-09 Millennium Pharmaceuticals, Inc. Protein sequencing using tandem mass spectroscopy
US6624408B1 (en) 1998-10-05 2003-09-23 Bruker Daltonik Gmbh Method for library searches and extraction of structural information from daughter ion spectra in ion trap mass spectrometry
US20030236636A1 (en) 2002-06-25 2003-12-25 Kiyomi Yoshinari Mass spectrometric data analyzing method, mass spectrometric data analyzing apparatus, mass spectrometric data analyzing program, and solution offering system
WO2004008371A1 (en) * 2002-07-10 2004-01-22 Institut Suisse De Bioinformatique Peptide and protein identification method
US6747272B2 (en) 2002-04-01 2004-06-08 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US7197402B2 (en) 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
WO2007112289A2 (en) * 2006-03-23 2007-10-04 The Regents Of The University Of California Method for identification and sequencing of proteins
DE10358366B4 (de) 2003-12-10 2008-04-03 Bruker Daltonik Gmbh Massenspektrometrische Substanzidentifizierung
DE102009005845A1 (de) 2009-01-21 2010-07-22 Friedrich-Schiller-Universität Jena Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999062930A2 (en) * 1998-06-03 1999-12-09 Millennium Pharmaceuticals, Inc. Protein sequencing using tandem mass spectroscopy
US6624408B1 (en) 1998-10-05 2003-09-23 Bruker Daltonik Gmbh Method for library searches and extraction of structural information from daughter ion spectra in ion trap mass spectrometry
US6747272B2 (en) 2002-04-01 2004-06-08 Jeol Ltd. Method and apparatus for analyzing mass spectrum
US20030236636A1 (en) 2002-06-25 2003-12-25 Kiyomi Yoshinari Mass spectrometric data analyzing method, mass spectrometric data analyzing apparatus, mass spectrometric data analyzing program, and solution offering system
WO2004008371A1 (en) * 2002-07-10 2004-01-22 Institut Suisse De Bioinformatique Peptide and protein identification method
DE10358366B4 (de) 2003-12-10 2008-04-03 Bruker Daltonik Gmbh Massenspektrometrische Substanzidentifizierung
US7197402B2 (en) 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
WO2007112289A2 (en) * 2006-03-23 2007-10-04 The Regents Of The University Of California Method for identification and sequencing of proteins
DE102009005845A1 (de) 2009-01-21 2010-07-22 Friedrich-Schiller-Universität Jena Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie

Non-Patent Citations (16)

* Cited by examiner, † Cited by third party
Title
A. Frank, P. Pevzner: PepNovo: de novo peptide sequencing via probabilistic network modeling, Anal. Chem., 2005, 15, 964-973
Alignment of trees - an alternative to tree edit *
Automatic Determination of O-Glycan Structure from Fragmentation Spectra *
D. Goldberg, M. Bern, B. Li, C. Lebrilla: Automatic Determination of O-glycan structure from fragmentation spectra, J Proteome Res., 2006, 5, 1429-1434
J. H. Gross: Mass Spectrometry: A Textbook, Springer Verlag Berlin, 2004
K. Klagkou, F. Pullen, M. Harrison, A. Organ, A. Firth & G. J. Langley: Approaches towards the automated interpretation and prediction of electrospray tandem mass spectra of non-peptidic combinatorial compounds, Rapid Commun Mass Spectrom, 2003, 17, 1163-1168
L. Vogt, T. Gröger & R. Zimmermann: Automated compound classification for ambient aerosol sample separations using comprehensive two-dimensional gas chromatography-time-of-flight mass spectrometry, J Chromatogr A, 2007, 1150, 2-12
P. Shi, Q. He, Y. Song, H. Qu und Y. Cheng: Characterization and identification of isomeric flavonoid O-diglycosides from genus Citrus in negative electrospray ionization by ion trap mass spectrometry and time-offlight mass spectrometry, Anal. Chim. Acta, 2007, 598, 110-118
PepNovo: De Novo Peptide Sequencing via Probabilistic Network Modeling *
R. Mistrik: XCalibur HighChem: Mass Frontier Software. HighChem/ThermoFinnigan, Manual 2001
S. Bäcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55
S. Böcker & F. Rasche: Towards de novo identification of metabolites by analyzing tandem mass spectra, Bioinformatics, 2008, 24, I49-I55
S. Böcker & Z. Lipták, A Fast and Simple Algorithm for the Money Changing Problem, Algorithmica, 2007, 48, 413-432
T. Jiang, L. Wang & K. Zhang: Alignment of trees: an alternative to tree edit, Theor. Comput. Sci., Elsevier Science Publishers Ltd., 1995, 143, 137-148
Towards de novo identification of metabolites by analyzing tandem mass spectra *
U. Roessner, C. Wagner, J. Kopka, R. Tretheway, L. Willmitzer: Technical advance: simultaneous analysis of metabolites in potato tuber by gas chromatography-mass spectrometry, Plant J, 2000, 23, 131-142

Also Published As

Publication number Publication date
WO2012126451A3 (de) 2013-03-07
WO2012126451A2 (de) 2012-09-27

Similar Documents

Publication Publication Date Title
DE112005001143B4 (de) System und Verfahren zum Gruppieren von Vorläufer- und Fragmentionen unter Verwendung von Chromatogrammen ausgewählter Ionen
DE102014008264B4 (de) Isotopenmustererkennung
DE102009032649B4 (de) Massenspektrometrische Identifizierung von Mikroben nach Unterarten
DE102004015018B4 (de) Verfahren zum Identifizieren von Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
DE60026452T2 (de) Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie
DE112005000598B4 (de) Verfahren zur Identifizierung einer Zuckerkettenstruktur und Vorrichtung zur Analyse derselben
DE102010019590B4 (de) Datenabhängiges Erfassungssystem für die Massenspektrometrie und Verfahren für dessen Anwendung
DE10392707B4 (de) Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten
DE102009005845A1 (de) Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
DE102013224310A1 (de) Verfahren und System zum Erhöhen eines dynamischen Nutzbereichs einer Spektrometrievorrichtung
DE112015006900T5 (de) Verfahren zum Bestimmen der Online-NIR-Stichprobenumfänge
DE102015014754A1 (de) Verfahren zum zeitlichen Abgleichen von Chromatographie-Massenspektrometrie-Datensätzen
DE102004037512A1 (de) Massenspektrometrische Gewebezustandsdifferenzierung
DE112015000402B4 (de) Näherungsalgorithmus zum Lösen eines Impulsübertragungsquerschnitts
DE102011014805A1 (de) Verfahren zur Identifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
DE102017129891A1 (de) Massenspektrometrische Bestimmung besonderer Gewebezustände
DE102020101408A1 (de) Verfahren für die massenspektrometrische bestimmung der anwesenheit oder des fehlens eines chemischen elements in einem analyten
DE102010013548A1 (de) Mobilitätsspektrometrische Substanz-Identifizierung
DE10393475B4 (de) Verfahren und Vorrichtung zur Identifizierung von Verbindungen in einer Probe
DE102016011348A1 (de) Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt
DE112015004216T5 (de) Techniken für die Darstellung und Verarbeitung von Massenspektraldaten
EP0993609B1 (de) Verfahren zur bestimmung der anzahl von komponenten in peaks, banden und signalen von chromatogrammen, elektrogrammen und spektrogrammen aller art
DE112004000338B4 (de) System und Verfahren zum Verarbeiten identifizierter Metaboliten
DE102004016667B4 (de) Verfahren zur Identifizierung von Polymeren in Gemischen

Legal Events

Date Code Title Description
R163 Identified publications notified
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee