DE102004012524B4 - Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben - Google Patents

Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben Download PDF

Info

Publication number
DE102004012524B4
DE102004012524B4 DE102004012524A DE102004012524A DE102004012524B4 DE 102004012524 B4 DE102004012524 B4 DE 102004012524B4 DE 102004012524 A DE102004012524 A DE 102004012524A DE 102004012524 A DE102004012524 A DE 102004012524A DE 102004012524 B4 DE102004012524 B4 DE 102004012524B4
Authority
DE
Germany
Prior art keywords
molecules
mass
signatures
molecular
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102004012524A
Other languages
English (en)
Other versions
DE102004012524A1 (de
Inventor
Sebastian Bartel
Ronald Krebs
Harald Prof. Mischak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mosaiques Diagnostics and Therapeutics AG
Original Assignee
Mosaiques Diagnostics and Therapeutics AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mosaiques Diagnostics and Therapeutics AG filed Critical Mosaiques Diagnostics and Therapeutics AG
Priority to DE102004012524A priority Critical patent/DE102004012524B4/de
Priority to PCT/EP2005/051127 priority patent/WO2005091200A2/de
Publication of DE102004012524A1 publication Critical patent/DE102004012524A1/de
Application granted granted Critical
Publication of DE102004012524B4 publication Critical patent/DE102004012524B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Signal Processing (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Verfahren zur computergestützten automatisierten Bestimmung wahrer Molekülmassen sämtlicher Konstituenten biologischer Proben oder Teilmengen daraus aus chromatographisch getrennten massenspektrometrischen Daten biologischer Proben mit den nachfolgenden Verfahrensschritten:
a) Detektion von Molekülsignalen in einzelnen, getrennten Massenspektren durch Matched-Filtering des Massenspektrums mit idealisierten Signalverteilungen der im Spektrum gesuchten Molekülsignaturen anhand von Filterfunktionen,
b) Zusammenfassen von Molekülsignaturen in sukzessiven Massenspektren hinsichtlich Amplitude und zweier Dimensionen eindeutig lokalisierter Molekülsignaturen und
c) Identifizierung potentiell ladungskonjugierter Molekülsignaturen durch Probabilistische Clustering Algorithmen.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf die Bestimmung von wahren Molekülmassen sämtlicher Konstituenten biologischer Proben oder Teilmengen daraus, insbesondere die computergestützte Bestimmung der wahren Molekülmassen aus chromatographisch getrennten massenspektrometrischen Daten von biologischen Proben.
  • Die Massenspektroskopie stellt ein Standardverfahren zur qualitativen und quantitativen Aufklärung der Zusammensetzung von biologischem Probenmaterial dar. Mit Hilfe der Massenspektroskopie können einzelne Konstituenten der Probe hinsichtlich ihrer Molekularmasse charakterisiert werden. Die massenspektrometrische Untersuchung biologischer Proben unterliegt verschiedenen Beschränkungen, die einerseits prinzipieller Natur sind, demnach dem Verfahren innewohnen und andererseits zu einem erheblichen Maße in der Komplexität der Probenzusammensetzung begründet sind.
  • Zu den prinzipiellen Einschränkungen ist die Tatsache zu zählen, dass stets nur das Verhältnis Masse/Ladung der konstituierenden Moleküle bestimmt werden kann. Ohne weitergehende, zusätzliche Informationen muss die Masse der detektierbaren Moleküle daher stets bis auf einen ganzzahligen Faktor, welcher der Ladung entspricht, unbestimmt bleiben.
  • Ein weiteres Problem stellt die oben bereits erwähnte Komplexität biologischer Proben wie Serum oder Urin dar. Im Masse/Ladungs-Intervall bis 2500 Da/c von Humanserum finden sich typischerweise ungefähr 1000 Proteine und Peptide. Aufgrund der nur begrenzten Geräteauflösung und der endlichen Ausdehnung von Proteinsignaturen im Massenspektrum überlappen diese Proteine zum Teil sehr stark und sind innerhalb des Massenspektrums nicht mehr separierbar.
  • Eine Möglichkeit zur Entfaltung und weiteren Aufschlüsselung dieser komplexen Spektren stellt die chromatographische Trennung der Probe über Gaschromatographie (GC), Hochdruck-Flüssig-Chromatographie (HPLC) oder die Kapillarelektrophorese (CE) dar. Derart getrennte Proben lassen sich mittels eines nachgeschalteten Massenspektrometers zeitlich aufgelöst untersuchen. Unter idealen Bedingungen werden die etwa 1000 Konstituenten gleichmäßig auf sequentiell aufgenommene Massenspektren verteilt und dadurch auflösbar. Die Auswertung eines Massenspektrums unter Ausnutzung der oben erläuterten Zusammenhänge bedarf speziell geschulten Personals und benötigt je nach Informationsgehalt des Massenspektrums bis zu mehreren Stunden konzentrierter Arbeit. Im Verlauf einer kombinierten CE-MS-Auswertung, um ein Beispiel zu nennen, fallen typischerweise 500 bis 1000 Massenspektren an, deren manuelle Auswertung Tage in Anspruch nimmt. Aufgrund der auftretenden, weiter unten erläuterten Uneindeutigkeiten ergeben sich darüber hinaus widersprüchliche und einander wechselseitig ausschließende Interpretationsmöglichkeiten in der Auswertung.
  • Weitergehende Auflösung von Massenspektren kann anhand der Detektion von Signalen im Rauschbereich, anhand der Entfaltung der Massenspektren in Hinblick auf die wahren Massen, ferner anhand von Isotopen oder von Konjugationen vorgenommen werden. Eine weitere Auswertungsmöglichkeit von Massenspektren besteht darin, Massenspektren zusammenzusetzen und die zusammengesetzten und daher feiner aufgelösten Massenspektren, die weniger überlappende Proteine zeigen, auszuwerten.
  • DE 697 22 510 T2 beschreibt ein Verfahren zur Bestimmung der Elementarzusammensetzung einer Probe durch Massenspektrometrie, bei der Wahrscheinlichkeitsverteilungen eingesetzt werden. Dies dient zur Reduzierung von Interferenzen in der Elementarmassenspektrometrie.
  • US 6,147,344 A betrifft ein Verfahren zur automatischen Analyse von massenspektrometrischen Daten. Hierbei werden gegebenenfalls dreidimensionale Darstellungen eingesetzt, die Retentionszeiten und m/z-Werte enthalten.
  • EP 1 047 107 A2 beschreibt ein Verfahren zur Identifizierung einer wahrscheinlichen Aminosäuresequenz einer Probe in einem Massenspektrometer bei der ein Fragmentationsmodell eingesetzt wird.
  • Zur Bestimmung wahrer Molekülmassen m aus dem aus der Massenspektroskopie hervorgehenden beobachtbaren Masse/Ladungs-Verhältnis x = m/z bieten sich zwei Vorgehensweisen an, bei denen der Ladungszustand z eines auftretenden Konstituenten ermittelt und damit direkt auf die Masse m des Moleküls geschlossen werden kann.
  • Das Auftreten von Isotopen im Konstituenten erlaubt eine direkte Bestimmung seines Ladungszustands, sofern die resultierenden Massenverschiebungen im Spektrum aufgelöst werden können. Die Häufigkeit von isotopen Nukleinen in großen Molekülen (> 500 Da) folgt einer Poisson-Verteilung. Daher werden neben dem isotopenreinen Molekül der Masse m stets auch Moleküle der Masse m + 1, m + 2, ... beobachtet. Näherungsweise kann die Massenverschiebung isotoper Nukleine mit Δm = 1u angenähert werden. Bei großen Molekülen (> 500 Da) treten charakteristische Isotopenkämme auf, wobei die einzelnen Peaks des Kamms gerade den isotopen Massenverschiebungen um Δm = 1, 2, ... entsprechen.
  • Für einfach geladene Moleküle (Ladungszustand z = 1) liegen diese Peaks im Abstand Δx = Δm = 1, im Falle mehrfach geladener Moleküle (Ladungszustand z > 1) liegen die Peaks im Abstand Δx = Δm/z. Damit lässt sich aus dem Isotopenabstand Δx unmittelbar auf den Ladungszustand z schließen. Dieses Verfahren ist solange zweckmäßig, wie der Abstand benachbarter Isotopenzustände die Geräteauflösung des eingesetzten Massenspektrometers nicht übersteigt. Das Verfahren eignet sich demnach für Konstituenten in niedrigen Ladungszuständen (Ladungszustand z < 7 bzw. m < 8000).
  • Bei größeren Konstituenten reicht die Geräteauflösung üblicherweise nicht mehr aus, um den Ladungszustand z aus Isotopenpeaks zu ermitteln. In diesem Falle kann man sich das simultane Auftreten eines Moleküls in verschiedenen Ladungszuständen z zu Nutze machen, um aus den Abständen im Massenspektrum auf die absolute Masse zu schließen. Man spricht in diesem Falle üblicherweise von konjugierten Peaks.
  • Tritt ein Molekül in zwei benachbarten Ladungszuständen z und z + 1 auf, so beobachtet man es im Massenspektrum an den Positionen x1 = m/z + 1 und x2 = m/(z + 1) + 1. Aufgrund der Protonmasse von mp = 1.0079 u sollten diese Positionen bei x1 = m/z + 1.0079,
    Figure 00030001
    liegen. Hier und im Folgenden wird die Näherung von mp = 1 verwendet. Für den Ladungszustand z des Moleküls an Position x1 im Spektrum muss daher gelten: z = (x2 – 1)/(x1 – x2)mit z ganzzahlig.
  • Beobachtet man zwei Molekülsignaturen, für welche der Ladungszustand z = (x2 – 1)/(x1 – x2) ganzzahlig ist, so deutet dies auf ein Molekül der Masse m = (x1 – 1)·z = (x1 – 1) (x2 – 1)/(x1 – x2) hin. Es ist allerdings zu beachten, dass das Auftreten zweier Molekülsignaturen an den Positionen x1 und x2 lediglich ein notwendiges, jedoch kein hinreichendes Kriterium für die Zuweisung des Ladungszustands z ist. Treten beispielsweise Ladungszustände z, z + 1, z + 2, an den Positionen x1, x2 und x3 auf, so ist sowohl z = (x2 – 1)/(x1 – x2), als auch z' = (x3 – 1)/(x1 – x3) ganzzahlig, wobei gilt: z = 2·z'.
  • Der Ladungszustand z bleibt in diesem Falle um den Faktor 2 unbestimmt. Ganz allgemein sind solche Ladungszustände z mit n beteiligten Molekülen nicht von ihren ganzzahligen Teilern z' zu unterscheiden, wenn z/z' ≤ n ist. Neben dieser systematischen Mehrfachdeutigkeit der Ladungszuordnung können Molekülsignaturen rein zufällig in Abständen auftreten, für die z = (x2 – 1)/(x1 – x2) ganzzahlig ist. Solche Koinzidenzen lassen sich ohne zusätzliche Informationen nicht von wahren Korrelationen unterscheiden. Über konjugierte Signale im Massenspektrum ist eine Aufklärung von Ladungszuständen z demnach nicht eindeutig realisierbar. Es ergeben sich systemimmanent einerseits ambivalente Ladungszuordnungen zu verschiedenen Molekülmassen andererseits zufällige Koinzidenzen innerhalb des Massenspektrums.
  • Es ist die Aufgabe der Erfindung, das aufgezeigte technische Problem zu lösen. Diese Aufgabe wird durch ein Verfahren nach Anspruch 1 gelöst.
  • Darstellung der Erfindung
  • Eine Abhilfemöglichkeit des aufgezeigten technischen Problems liegt darin, probabilistische Algorithmen einzusetzen und bei der Bestimmung wahrer Molekülmassen die nachfolgend dargestellten Auswertungsschritte zu durchlaufen. Durch Einsatz eines Matched-Filtering-Algorithmus kann eine Identifizierung von Molekülsignaturen im Massenspektrum vorgenommen werden. Dies kann z.B. durch ein Matched-Filtering des Massenspektrums mit idealisierten Isotopenverteilungen beliebiger durch das Massenspektrometer auflösbarer und nicht-auflösbarer Ladungszustände erfolgen. Mittels eines Savitzki-Golay Ableitungsfilters kann eine beliebige Polynom- und Ableitungsordnung zur Entfaltung und Identifizierung von überlappenden und nicht überlappenden Molekülsignaturen in Massenspektren vorgenommen werden, insbesondere durch die Identifizierung überlappender und nicht überlappender Isotopenpeaks in Isotopenkämmen. Daneben ist auch die Identifizierung ganzer Isotopenkämme möglich; andererseits können dadurch auch Artefakte von echten Signalen unterschieden werden. Aus der Isotopenstruktur können die Ladungszustände der identifizierten Molekülsignaturen mittels der Ergebnisse der oben genannten Filter bestimmt werden. Mittels eines iterativen Algorithmus zur Identifizierung und m/z-Lokalisierung von Molekülsignaturen in sukzessiven, chromatographischen und getrennten Massenspektren können Baseline und Rauschlevel eines jeden Massenspektrums bestimmt werden. Durch die erfindungsgemäß vorgeschlagene, automatisierte und gegebenenfalls nicht-überwachte Auswertung von Massenspektren kann eine Auswertung innerhalb kürzester Zeit (typischerweise 1 Minute) erreicht werden, welche eine Verarbeitungsmöglichkeit großer Datenmengen realisiert. Das erfindungsgemäß vorgeschlagene automatisierte und nicht überwachte Auswertungsverfahren chromatographisch getrennter Massenspektren erlaubt die Ermittlung wahrer Molekülmassen (so z.B. Proteine, Kohlehydrate und Lipide etc.), denen zwar noch ein statistischer Fehler anhaftet, wobei jedoch die erhaltenen Ergebnisse wesentlich aussagekräftiger als diejenigen sind, die mittels konventioneller Auswertungsverfahren erhalten werden. Durch den Einsatz probabilistischer Clustering-Algorithmen/EM-Algorithmen zur Identifizierung wahrer Molekülmassen aus uneindeutigen m/z-Messungen ist die Basis dafür gelegt, die anhand der gefundenen Daten wahrscheinlichste Zusammensetzung der jeweils untersuchten Probe anzugeben. Mit dem vorgeschlagenen Verfahren lässt sich eine für Zwecke geeignete wohl definierte Wahrscheinlichkeit für die hypothetisch wahrscheinlichste Probenzusammensetzung gewinnen.
  • Anschließend erfolgt die Zusammenfassung von Molekülsignaturen in sukzessiven Massenspektren zu zweidimensionalen Signaturen, die eindeutig hinsichtlich ihrer Amplitude und zweier Dimensionen lokalisiert sind. Eine Dimension ist durch die m/z-Position im Massenspektrum und die andere Dimension durch den charakteristischen Trennparameter des chromatographischen Verfahrens gegeben. Bei dem charakteristischen Trennparameter kann es sich z.B. um die Retentionszeit (Tret) handeln.
  • Die Identifizierung potentiell ladungskonjugierter Moleküle erfolgt durch ihre jeweilige Lage in den oben genannten beiden Dimensionen sowie ihrer Amplitude. Moleküle, die eindeutig hinsichtlich ihrer Amplitude Molekülmasse und chromatographischer Lage im Massenspektrometer definiert sind, können vorhergesagt werden. Die Vorhersage dieser Moleküle wird aus den oben gewonnenen Informationen zur Isotopenstruktur der zugrunde liegenden Molekülsignaturen und potentiellen Ladungskonjugationen gewonnen. Dies kann anhand Probabilistischer Clustering Algorithmen gegebenenfalls unter Hinzunahme unscharfer Clustering Algorithmen (Fuzzy Clustering) oder anhand der Bestimmung der paarweisen Abständen hinsichtlich der m/z-Position im Massenspektrum oder hinsichtlich der Retentionszeit (Tret) jeweils zweier Molekülsignaturen erfolgen.
  • Anhand der chromatographischen Position, definiert z.B. durch die Dimension Retentionszeit (Tret) der identifizierten Moleküle können diese anhand einer Liste von Referenzmolekülen, deren chromatographische Lage als bekannt angenommen wird, kalibriert werden. Bei den Referenzmolekülen kann es sich z.B. um Moleküle handeln, die im Rahmen von Auswertungen chromatographisch getrennter massenspektroskopischer Daten identifiziert wurden. Ferner kann es sich um Moleküle, die gemäß den weiter oben beschriebenen Verfahrensschritten im chromatographisch getrennten massenspektrometrischen Daten identifiziert wurden, handeln. Auch eine manuelle Auswertung der massenspektroskopischen Daten liefert die Referenzmoleküle, anhand der die chromatographische Kalibrierung der identifizierten Proteine vorgenommen werden kann. Anhand mathematisch idealisierter Modelle von Molekülen, deren Laufgeschwindigkeit abhängig vom chromatographischen Trennverfahren ermittelt oder geschätzt wurde, kann eine Kalibrierung identifizierter Proteine durch Referenzmoleküle gewonnen werden.
  • Eine Kalibrierung der Amplitude des identifizierten Moleküles kann außer mittels der oben genannten Referenzmoleküle und deren Gewinnungsverfahren aus dem Gesamtsignal einzelner Massenspektren ausgewertet werden oder aus dem Gesamtsignal aller im Verlauf einer kombinierten chromatographisch/massenspektrometrischen Messung gewonnenen Daten
  • Zeichnung
  • Anhand der Zeichnung wird die Erfindung nachstehend eingehender beschrieben.
  • Es zeigt:
  • 1 die Darstellung idealisierter Isotopenkämme dreier Proteine mit (m1/z = 406, z = 2), (m2/z = 409, z = 3) und (m3/z = 412, z = 4),
  • 2 die Darstellung idealisierter Isotopenkämme dreier Proteine für (m1/z = 1006, z = 2), (m2/z = 1009, z = 3) und (m3/z = 1012, z = 4),
  • 3 ein Flussdiagramm mit der Darstellung des Ablaufes einer CE-Kalibrierung und
  • 4 die Darstellung eines Flussdiagramms mit Ablauf der Molekülerkennung.
  • Ausführungsvarianten
  • Eine computergestützte Berechnung wahrer Molekülmassen sämtlicher Konstituenten biologischer Proben oder Teilmengen daraus, erfolgt aus chromatographisch getrennten massenspektrometrischen Daten biologischer Proben. Zur Bestimmung der wahren Molekülmassen werden nachfolgende Auswertungsschritte durchlaufen:
    Aus nacheinander ermittelten, chromatographisch voneinander getrennten Massenspektren lassen sich Masse-/Ladungsverhältnisse (m/z) ermitteln. Dies kann einerseits über einen iterativen Algorithmus zur Bestimmung von „Baseline" und „Rauschlevel" im Massenspektrum erfolgen. Eine weitere Möglichkeit zur Identifizierung von Molekülsignaturen in einem Massenspektrum stellt die Anwendung eines Matched-Filtering-Algorithmus's dar so z.B. durch das Matched-Filtering des Massenspektrums anhand idealisierter Isotopenverteilungen, beliebiger durch das eingesetzte Massenspektrometer auflösbarer und nicht „auflösbarer Ladungszustände". Im Wege des Matched-Filtering-Verfahrens wird eine Faltung eines von Rauschen überlagerten Signals mit der theoretischen Signalform des zu detektierenden Signals durchgeführt. Über einen Matched-Filter lässt sich das Signal-Rausch-Verhältnis (SNR) maximieren. Im Rahmen des vorliegenden Verfahrens werden Massenspektren mit Proteinsignaturen der Ladungszustände C = 1...7 gefiltert. Das jeweils im Rahmen des Matched-Filtering ermittelte höchste Filterergebnis wird von der am besten passenden Signalform geliefert, so dass der zugehörigen Ladung diesem Protein-Peak zugeordnet werden kann. Durch Einsatz eines Ableitungsfilters, wie etwa eines Savitzki-Golay-Abteilungsfilters können beliebige Polynom- oder Ableitungsordnungen zur Entfaltung und Identifizierung überlappender oder nicht überlappender Molekülsignaturen in Massenspektren vorgenommen werden. Eine Identifizierung einander überlappender oder einander gerade nicht überlappender Molekülsignaturen in getrennten Massenspektren kann z.B. durch die Identifizierung von entsprechend überlappenden oder gerade nicht überlappenden Isotopen-Peaks in Isotopenkämmen erfolgen. Als Isotopenkamm wird das Auftreten ein und desselben Moleküls in Massenzuständen m, m + 1, m + 2, usw. bezeichnet, wobei m die isotopenbereinigte Molekülmasse und m + 1, m + 2, ... die Masse im Falle von ein oder mehreren Isotopen im Molekül darstellt (typischerweise 13C, 15N, 18O, 34S) in Molekülen. Die Wahrscheinlichkeit bzw. Häufigkeit von isotopen Atomen eines Elementes folgt einer Poissonverteilung, gemäß der nachfolgenden Gleichung:
    Figure 00070001
    wobei N die Anzahl der Atome eines Elementes des Moleküls ist und piso die Isotopenwahrscheinlichkeit dieses Elementes darstellt (z.B. 0.013 für 13C). Die Wahrscheinlichkeit, ein Molekül der Masse m in den Massenzuständen m + 1, m + 2, ... zu beobachten, ergibt sich damit aus der Überlagerung der Poisson-Verteilungen aller darin enthaltenen Elemente.
  • Die Summen-Isotopen-Verteilung, die selbst keine strenge Poisson-Verteilung darstellt, lässt sich auf kombinatorischem Wege aus den oben genannten Einzel-Verteilungen errechnen.
  • Mit Hilfe der oben angeführten Gleichung lässt sich die Form der Molekülsignatur eindeutig als Funktion der Molekülmasse beschreiben. In Massenspektren können die oben genannten Wahrscheinlichkeitsverteilungen als Intensitätsverteilungen beobachtet werden und werden auch als Isotopensignatur bzw. Isotopenkamm bezeichnet.
  • Diese lassen sich den Darstellungen gemäß 1 und 2 entnehmen, wobei in der Darstellung gemäß 1 idealisierte Isotopenkämme dreier Proteine dargestellt sind. Dabei handelt es sich von links nach rechts gemäß der Darstellung in 1 um (m1/z = 406, z = 2), (m2/z = 409, z = 3) und (m3/z = 412, z = 4). Gemäß der Darstellung in 2 sind idealisierte Isotopenkämme dreier Proteine dargestellt, die durch nachfolgende Parameter charakterisiert sind: (m1/z = 1006, z = 2), (m2/z = 1009, z = 3) und (m3/z = 1012, z = 4). Während in 1 Beispiele für Proteinsignaturen bei m/z ≈ 400 dargestellt sind, sind der Darstellung gemäß 2 Proteinsignaturen für m/z ≈ 1000 zu entnehmen.
  • Je nach gewählter Bestimmung der Ladungszustände, die beispielsweise aus der jeweiligen Isotopenstruktur erfolgen kann, lassen sich die Molekülsignaturen aus den Molekülen identifizieren. Zur Bestimmung der Ladungszustände der identifizierten Molekülsignaturen können sowohl der oben genannten iterative Algorithmus, ein Matched-Filtering-Algorithmus unter Anwendung idealisierter Isotopenverteilung oder der obenstehend erwähnte Savitzki-Golay-Ableitungsfilter eingesetzt werden, mittels dessen eine Entfaltung und Identifizierung hinsichtlich überlappender und nicht überlappender Molekülsignaturen in Massenspektren vorgenommen werden kann, eingesetzt werden. Die Molekülsignaturen werden in aufeinander folgenden Massenspektren zu zwei-dimensionalen Molekülsignaturen zusammengefasst. Die zusammengefassten Molekülsignaturen sind eindeutig hinsichtlich ihrer Amplitude und in zwei Dimensionen lokalisiert. Eine Dimension ist durch die m/z-Position im Massenspektrum gegeben, wobei die andere Dimension durch einen charakteristischen Trennparameter des jeweils eingesetzten chromatographischen Verfahrens gegeben ist, wie z.B. die Retentionszeit Tret. Zu den zwei-dimensionalen Molekülsignaturen, die eindeutig hinsichtlich ihrer Amplitude und ihren beiden Dimensionen lokalisiert sind, können potentiell ladungskonjugierte Moleküle aufgrund ihrer jeweiligen Lage in den oben genannten Dimensionen sowie ihrer Amplitude identifiziert werden. Konjugierte Moleküle stellen das simultane Auftreten ein und desselben Moleküls in verschiedenen Ladungszuständen dar. Peaks treten stets in mehreren, sukzessive aufeinanderfolgenden, chromatographisch getrennten Massenspektren auf. Zusammengehörige Peaks müssen daher aufintegriert werden, um die Signalamplitude und die genaue Retentionszeit (Tret) zu bestimmen. Es erfolgt eine Zusammenfassung von Peaks in sukzessive aufeinanderfolgenden Massenspektren, wenn ihre m/z-Positionen weniger als ein voreingestelltes Intervall dX voneinander abweichen.
  • Verschiedene Ladungszustände ein und desselben Moleküls bedingen Abstände im erhaltenen Massenspektrum. Potentiell ladungskonjugierte Moleküle lassen sich aufgrund ihrer Lage in den oben genannten beiden Dimensionen, d.h. hinsichtlich ihres Masse-/Ladungsverhältnisses und hinsichtlich ihrer chromatographischen Lage (charakteristischer Trennparameter z.B. Tret) identifizieren. Da auf massenspektrokopischem Wege stets nur das Verhältnis m/z (Masse/Ladung) beobachtet werden kann, bleibt die wahre Masse m eines Moleküls bis auf den Ladungszustand z unbestimmt. Als konjugierte Peaks bezeichnet man das Auftreten ein und desselben Moleküls in verschiedenen Ladungszuständen z, z + 1, z + 2, ... Mittels der Software wird ein Algorithmus implementiert, ein Expectation-Maximization (EM)-Algorithmus, welcher iterativ die Beziehung zwischen den gefundenen Peaks und möglichen Molekülmassen herstellt. Die aufzufindenden wahren Molekülmassen bilden dabei das Modell dieses EM-Algorithmus, d.h. sind Abbild der Annahme über den zugrunde liegenden Mechanismus der Signalerzeugung. Die im Massenspektrum gefundenen Molekül-Peaks werden entsprechend als Observables bezeichnet, d.h. stellen die Wahrnehmung (wenn auch eingeschränkt) der Moleküle im Spektrum dar. Der erwähnte EM-Algorithmus stellt einen Ansatz dar, genau das Modell zu finden, welches den beobachteten Observablen mit größter Wahrscheinlichkeit zugrunde liegt. Die EM-Algorithmen beantworten somit die Frage, welche Moleküle die beobachteten Peaks im Spektrum liefern würden. Die Vorhersage der Position von Molekülen im Massenspektrum kann z.B. aus der Isotopenstruktur angesichts der Identifizierung überlappender und nicht überlappender Isotopen-Peaks in Isotopenkämmen sowie aufgrund der Identifikation ganzer Isotopenkämme durch den iterativen Algorithmus, den Matched-Filtering-Algorithmus oder auch über den Savitzki-Golay-Ableitungsfilter erfolgen. Durch Anwendung probabilistischer Clustering Algorithmen sowie unter Anwendung von unscharfen Clustering-Algorithmen (Fuzzy Clustering) kann das Auftreten potentiell ladungskonjugierter Moleküle vorhergesagt werden. Tritt das Molekül im Massenspektrum simultan in verschiedenen Ladungszuständen auf, kann eine Stimmung der paarweisen Abstände hinsichtlich der beiden Dimensionen m/z (Masse zu Ladungsverhältnis) und charakteristische Trennparameter wie z.B. der Retentionszeit (Tret) durch die jeweils zwei Molekülsignaturen durchgeführt werden.
  • Eine Kalibrierung der chromatographischen Position (z.B. Tret) der identifizierten Proteine oder Proteinbausteine wird z.B. an einer Liste von sogenannten Referenzmolekülen durchgeführt. Als Referenzmoleküle werden solche Moleküle herangezogen, deren chromatographische Lage als bekannt angenommen wird. Bei dem zur Kalibrierung der chromatographischen Position der identifizierten Moleküle eingesetzten Referenzmoleküle, kann es sich um solche handeln, die im Rahmen von Auswertungen chromatographisch getrennter massenspektroskopischer Daten identifiziert wurden. Als Referenzmoleküle können ferner solche Moleküle eingesetzt werden, die durch das oben beschriebene Verfahren in chromatographisch getrennten massenspektrometrischen Daten identifiziert wurden. Ferner können als Referenzmöleküle mathematisch idealisierte Modelle von Molekülen eingesetzt werden. Für die mathematisch idealisierten Modelle der Moleküle werden die Laufgeschwindigkeit anhand theoretischer Überlegungen zum physikalischen Prozess des jeweils gewählten chromatographischen Trennverfahrens ermittelt oder geschätzt. Die Kalibrierung der Amplituden der identifizierten Moleküle kann anhand einer Liste von Referenzmolekülen, d.h. deren Amplituden erfolgen. Die Kalibrierung der Amplituden der jeweils identifizierten Moleküle über Referenzmoleküle oder aus Spikes kann allerdings auch mittels des Gesamtsignales aller im Verlaufe einer Messung gefundenen Moleküle erfolgen. Dazu werden die Molekülamplituden auf die Summe aller gefundenen Amplituden normiert und somit in einem relativen Anteil an dem Gesamtmolekülgehalt der gemessenen Probe überführt.
  • Durch das erfindungsgemäß vorgeschlagene Verfahren kann aus dem Auftreten von Isotopen, sei es in Isotopen-Peaks oder in Isotopenkämmen, im Konstituenten eine direkte Bestimmung seines Ladungszustandes erfolgen, sofern die aus der Isotopenverteilung herrührenden Massenverschiebungen im Massenspektrum mit einer entsprechenden Genauigkeit auflösbar sind. Neben den Isotopen reinen Molekülen der Masse m werden stets auch Moleküle der Masse m + 1, m + 2 beobachtet. Großen Molekülen lassen sich charakteristische Isotopenkämme zuordnen, wobei die einzelnen Peaks (Maxima) eines jeden Kammes gerade den Isotopen Massenverschiebungen Δm = 1, 2, .... entsprechen. Bei einfach geladenen Molekülen (z = 1) liegen die Isotopen-Peaks im Abstand von Δx = Δm = 1 im Falle mehrfach geladener Moleküle (z > 1) liegen sie in einem Abstand von Δx = Δm/z. Somit lässt sich aus dem Isotopen Abstand Δx unmittelbar auf den Ladungszustand z zurück schließen. Mit Hilfe der Bestimmung des Isotopen-Abstandes, d. h. einer Dimension im Massenspektrometer zweier Molekülsignaturen, kann daher insbesondere der Ladungszustand von Konstituenten mit Ladungszuständen z ≤ 7 bzw. m ≤ 8000 bestimmt werden. Voraussetzung für diese direkte Bestimmung des Ladungszustandes anhand benachbarter Isotopenzustände ist jedoch die Geräteauflösung des Massenspektrometers.
  • Bei größeren Konstituenten stößt das oben geschilderte Vorgehen der Messung des Abstandes benachbarter Isotopenzustände jedoch an seine Grenzen. In diesem Falle kann das simultane Auftreten einer Molekülsignatur in verschiedenen Ladungszuständen ausgenutzt werden, um aus den Abständen im Massenspektrum auf die absolute Masse m zu schließen. Unter simultanem Auftreten eines Moleküles ist das Auftreten ein und desselben Moleküls in verschiedenen Ladungszuständen zu verstehen. Dieses mehrfach in verschiedenen Ladungszuständen im Massenspektrum auftretenden Molekül kann am Massenspektrum an den Positionen x1 = m/z + 1 und x2 = m/(z + 1) + 1 beobachtet werden. Für die Ladung des Moleküles bei x1 gilt: z = (x2 – 1)/(x1 – x2), wobei z ganzzahlig ist. Werden zwei Molekülsignaturen, für die z = (x2 – 1)/x1 – x2) ganzzahlig ist, beobachtet, so deutet dies auf ein Molekül der Masse m = (x1 – 1)·z = (x1 – 1)·(x2 – 1)/(x1 – x2) hin. Treten nun Ladungszustände z, z + 1, z + 2 an Positionen x1, x2 sowie an x3 im Massenspektrometer auf, so ist sowohl z = (x2 – 1)/(x1 – x2) als auch z' =(x3 – 1)/(x1 – x3) ganzzahlig mit z = 2·z'. Die Ladung bliebe in diesem Falle um den Faktor 2 unbestimmt. Eine ambivalente Zuordnung der Ladung im skizzierten Falle um den ganzzahligen Teiler 2 hinsichtlich potentieller Ladungskonjugationen kann durch die vorgeschlagenen Probabilistischen Clusturing Algorithmen oder durch Einsatz eines unscharfen Clustering Algorithmus (Fuzzy-Clustering) eliminiert werden.
  • Eine weitere, verfeinerte Möglichkeit der Kalibrierung der chromatographischen Position zur Unterscheidung von Ladungszuständen z mit m-beteiligten Molekülen hinsichtlich der Unterscheidung ganzzahliger Teiler, besteht in der Kalibrierung der chromatographischen Position so z.B. hinsichtlich der Retentionszeit Tret der identifizierten Moleküle anhand einer Liste der Referenzmoleküle, wie weiter oben beschrieben. Deren chromatographische Lage im Massenspektrum wird als bekannt angenommen. Bei den Referenzmolekülen kann es sich um Moleküle handeln, die im Rahmen von Auswertungen chromatographisch getrennter massenspektroskopischer Daten identifiziert wurden sowie um solche Moleküle, deren Laufgeschwindigkeit je nach dem dem chromatographischen Trennverfahren zugrunde liegenden physikalischen Prozess ermittelt oder geschätzt wurde. Die Laufgeschwindigkeit solcher Moleküle wird in der Regel anhand mathematisch idealisierter Modelle ermittelt.
  • Der Darstellung gemäß 3 ist ein Flussdiagramm für eine CE-Kalibrierung zu entnehmen.
  • Da die CE-Trennung für erhebliche Varianz hinsichtlich der Retentionszeit Tret einzelner Moleküle sorgt, ist eine Rekalibrierung erforderlich, um die Auswertung verschiedener Spektren miteinander vergleichen zu können. Dies bedeutet, dass ein und dasselbe Molekül bei verschiedenen Messungen zu verschiedenen Zeitpunkten detektiert werden kann. Daher ist das zeitliche Auftreten von groben Molekülen auf einen Standard zu kalibrieren, um die Identifikation und Eindeutigkeit von Molekülen zu gewährleisten.
  • Die Kalibrierung erfolgt anhand einer Liste von Referenzmolekülen, der sogenannten Masterliste, in der 50 bis 100 regelmäßige auftretende Moleküle mit ihrer Masse und CE-Zeit gespeichert sind. Das Ziel des folgenden Verfahrens ist es, eine lineare Regression zwischen der Retentionszeit tret von Probenmolekülen und Referenzmolekülen im möglichst hohem Konfidenzmaß zu berechnen. Dabei wird angenommen, dass es einen linearen Zusammenhang zwischen der Retentionszeit tret der Probenmoleküle und der Referenzmoleküle gibt.
  • Molekül-Korrelationen, die dieser Annahme nicht folgen, können mit dem sogenannten „modifizierten Z-Score-Algorithmus" entfernt werden. Dieser Algorithmus bewertet die einzelnen Korrelationen so, dass schlechte Korrelationen, d.h. starke Abweichungen (von der Regressionsgeraden) einen hohen Z-Score erhalten. Durch sukzessives Entfernen der Korrelationen mit dem höchsten Z-Score und erneutes Bestimmen der linearen Regression werden Ausreißer entfernt und so die Konfidenz der Regression optimiert.
  • Die Kalibrierung erfolgt, nach dem die Molekülerkennung abgeschlossen ist. Als erstes werden durch Vergleich mit den Molekülmassen der Masterliste übereinstimmende Moleküle identifiziert und in einer Korrelationsliste gespeichert. Anschließend werden uneindeutige Korrelationen entfernt. Als Beispiel für eine uneindeutige Korrelation seien zwei gefundene Moleküle genannt, die hinsichtlich ihrer Masse mit einem Referenzmolekül korrespondieren.
  • Die nun folgenden Schritte werden iterativ solange durchgeführt, bis ein vorher definiertes Konfidenzmaß erreicht ist (vergleiche Darstellung für das Diagramm gemäß 4):
    • 1. Im ersten Schritt wird eine lineare Regressionsgerade an die verbliebenen Korrelationen berechnet (Probenmolekül CE-Zeit versus Referenzmolekül CE-Zeit).
    • 2. Statistische Ausreißer werden anhand eines modifizierten Z-Score-Algorithmus aussortiert (siehe Veröffentlichungen Barnett, V. and Lewis, T.: 1984, Outliers in Statistical Date, Johne Wiley & Sons, New York oder Iglewicz, B. and Hoaglin, D.C.: 1993, How to Detect and Handle Outliers, American Society for Quality Control, Milwaukee, WI, http:\\www.cee.vt.edu/program_areas/enviremental/teach/smprimer/outlyer/outlyer.html). Hierbei werden für alle Korrelationen die entsprechenden modifizierten Z-Scores zur Regressionsgraden berechnet und die Korrelation mit dem höchsten Z-Score verworfen.
  • Anhand der so gefundenen Regressionsarten ist es nun möglich, die Proben zeitlich auf die Mastermoleküle zu kalibrieren.
  • In der Darstellung gemäß 4 ist ein Flussdiagramm dargestellt, dem die zur Durchführung der Molekülerkennung erforderlichen Ablaufschritte zu entnehmen sind. Nach einem erfolgten Datenimport erfolgt in einem ersten Massenspektrum i die Peak-Detektion mittels der oben stehend skizzierten Berechnung von Molekülsignaturen und des Matched-Filtering. Peak-Detektion wird in allen Massenspektren i bis i + 1 durchgeführt, bis alle vorliegenden Massenspektren bearbeitet sind. Danach erfolgt eine Zusammenfassung zeitlich sukzessiver Massenspektren-Peaks. Die Molekülbestimmung erfolgt nunmehr mittels der probabilistischen Clustering-Verfahren bzw. des Expectation-Maximization (EM)-Algorithmus.
  • Die in Zusammenhang mit 3 bereits angesprochene Kalibrierung der Retentionszeit Tret erfolgt durch die Bestimmung einer linearen Regression. Nach Eliminierung aller ungünstigen und uneindeutigen Korrelationen zwischen Probenmolekülen und Referenzmolekülen mittels des beschriebenen z-Score Algorithmus, verbleiben die korrekten Zuordnungen zwischen Proben- und Referenzmolekülen in der Regression. Diese Moleküle können zur Kalibrierung der Amplituden der Probenmoleküle verwandt werden. Alternativ können die Amplituden der Probenmoleküle auf die Gesamtamplitude aller gefundenen Moleküle normiert werden.

Claims (18)

  1. Verfahren zur computergestützten automatisierten Bestimmung wahrer Molekülmassen sämtlicher Konstituenten biologischer Proben oder Teilmengen daraus aus chromatographisch getrennten massenspektrometrischen Daten biologischer Proben mit den nachfolgenden Verfahrensschritten: a) Detektion von Molekülsignalen in einzelnen, getrennten Massenspektren durch Matched-Filtering des Massenspektrums mit idealisierten Signalverteilungen der im Spektrum gesuchten Molekülsignaturen anhand von Filterfunktionen, b) Zusammenfassen von Molekülsignaturen in sukzessiven Massenspektren hinsichtlich Amplitude und zweier Dimensionen eindeutig lokalisierter Molekülsignaturen und c) Identifizierung potentiell ladungskonjugierter Molekülsignaturen durch Probabilistische Clustering Algorithmen.
  2. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass gemäß Verfahrensschritt a) ein idealisierter Isotopenkamm berechnet wird und innerhalb des Matched-Filtering des Massenspektrums als Filterfunktion verwendet wird zur Filterung von Isotopenkämmen, deren Struktur mit dem Ladungszustand eines Moleküls zusammenhängen.
  3. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass gemäß Verfahrensschritt a) eine Entfaltung und Identifizierung von überlappenden und nicht-überlappenden Molekülsignaturen in Massenspektrometern mittels eines Savitzki-Golay-Ableitungsfilters für beliebige Polynom- und Ableitungsordnungen erfolgt.
  4. Verfahren gemäß Anspruch 3, dadurch gekennzeichnet, dass die Identifizierung überlappender und nicht-überlappender Isotopen-Peaks in Isotopenkämmen erfolgt.
  5. Verfahren gemäß Anspruch 3, dadurch gekennzeichnet, dass die Identifizierung von Isotopenkämmen zur Zustandsbestimmung von Molekülen herangezogen wird.
  6. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass die identifizierten Molekülsignaturen in sukzessiven Massenspektrometern zu zwei-dimensionalen Molekülsignaturen zusammengefasst werden, die eindeutig hinsichtlich Amplitude und zweier Dimensionen identifiziert sind, wobei eine Dimension durch die m/z-Position im Massenspektrum und die andere Dimension durch einen charakteristischen Trennparameter des chromatographischen Verfahrens gegeben ist.
  7. Verfahren gemäß Anspruch 6, dadurch gekennzeichnet, dass als charakteristischer Trennparameter des chromatographischen Verfahrens die Retentionszeit Tret herangezogen wird.
  8. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass gemäß Verfahrensschritt c) die Identifizierung potentiell ladungskonjugierter Molekülsignaturen aus der Isotopenstruktur zugrunde liegender Molekülsignaturen oder aus der Bestimmung paarweiser Abstände zweier Molekülsignaturen hinsichtlich des Masse-Ladungs-Verhältnisses m/z und des charakteristischen Trennparameters erfolgt, wobei durch probabilistische Clustering-Algorithmen ladungskonjugierte Peaks zu gemeinsamen Molekülen geclustert werden.
  9. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass gemäß Verfahrensschritt c) eine Kalibrierung der chromatographischen Position hinsichtlich des charakteristischen Trennparameters der identifizierten Molekülsignaturen anhand einer Liste von Referenzmolekülen, deren chromatographische Lage als bekannt gilt, vorgenommen wird.
  10. Verfahren gemäß Anspruch 9, dadurch gekennzeichnet, dass die Referenzmoleküle solche Moleküle sind, die im Rahmen von Auswertungen chromatographisch getrennter massenspektroskopischer Daten identifiziert wurden.
  11. Verfahren gemäß Anspruch 9, dadurch gekennzeichnet, dass die Referenzmoleküle solche Moleküle sind, die durch manuelle Auswertung massenspektrometrischer Daten identifiziert wurden.
  12. Verfahren gemäß Anspruch 9, dadurch gekennzeichnet, dass die Referenzmoleküle durch mathematisch idealisierte Modelle von Molekülen dargestellt werden, deren Laufgeschwindigkeit durch abhängig vom physikalischen Prozess des chromatographischen Trennverfahrens ermittelt oder geschätzt wurde.
  13. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass gemäß Verfahrensschritt c) eine Kalibrierung der Amplitude der identifizierten Proteinsignaturen mittels einer Liste von Referenzmolekülen, deren chromatographische Lage als bekannt gilt, vorgenommen wird.
  14. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass eine Kalibrierung der Amplitude der identifizierten Molekülsignaturen anhand des Gesamtsignales einzelner Massenspektren vorgenommen wird.
  15. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass eine Kalibrierung der Amplitude der identifizierten Molekülsignaturen anhand des Gesamtsignales von im Verlauf einer kombinierten chromatographisch/massenspektrometrischen Messung akquirierten Daten durchgeführt wird.
  16. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass die Gesamtheit aller im Massenspektrum gefundenen Moleküle hinsichtlich ihrer Signalamplituden mittels Probenstandards oder durch Vergleich mit Signalamplituden anderer Proben oder durch Normierung des Probengesamtsignals auf 100 % renormiert werden.
  17. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass die Gesamtheit der im Massenspektrum gefundenen Moleküle hinsichtlich ihrer Retentionszeit Tret anhand von Probenstandards mit bekannter Retentionszeit Tret oder durch Vergleich mit den Retentionszeiten Tret von Molekülen anderer Proben renormiert werden.
  18. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass als Moleküle Kohlehydrate, Lipide und/oder Proteine detektiert und ausgewertet werden.
DE102004012524A 2004-03-15 2004-03-15 Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben Expired - Fee Related DE102004012524B4 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102004012524A DE102004012524B4 (de) 2004-03-15 2004-03-15 Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben
PCT/EP2005/051127 WO2005091200A2 (de) 2004-03-15 2005-03-14 Verfahren zur bestimmung wahrer molekülmassen von konstituenten biologischer proben

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102004012524A DE102004012524B4 (de) 2004-03-15 2004-03-15 Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben

Publications (2)

Publication Number Publication Date
DE102004012524A1 DE102004012524A1 (de) 2005-10-27
DE102004012524B4 true DE102004012524B4 (de) 2006-11-16

Family

ID=34961220

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102004012524A Expired - Fee Related DE102004012524B4 (de) 2004-03-15 2004-03-15 Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben

Country Status (2)

Country Link
DE (1) DE102004012524B4 (de)
WO (1) WO2005091200A2 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021211272A1 (de) 2021-10-06 2023-04-06 Ruhr-Universität Bochum, Körperschaft des öffentlichen Rechts Zusammensetzung enthaltend künstliche Sauerstoffträger zur Verhinderung von Organschäden in Transplantationsorganen

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1047107A2 (de) * 1999-04-06 2000-10-25 Micromass Limited Verfahren zur Identifizierung von Peptiden und Proteinen mittels Massenspektromterie
US6147344A (en) * 1998-10-15 2000-11-14 Neogenesis, Inc Method for identifying compounds in a chemical mixture
DE69722510T2 (de) * 1996-01-05 2003-12-11 Maxent Solutions Ltd., Little Eversden Reduzierung von interferenzen in der elementarmassenspektrometrie

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2349265A1 (en) * 2001-05-30 2002-11-30 Andrew Emili Protein expression profile database

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69722510T2 (de) * 1996-01-05 2003-12-11 Maxent Solutions Ltd., Little Eversden Reduzierung von interferenzen in der elementarmassenspektrometrie
US6147344A (en) * 1998-10-15 2000-11-14 Neogenesis, Inc Method for identifying compounds in a chemical mixture
EP1047107A2 (de) * 1999-04-06 2000-10-25 Micromass Limited Verfahren zur Identifizierung von Peptiden und Proteinen mittels Massenspektromterie

Also Published As

Publication number Publication date
WO2005091200A3 (de) 2006-03-30
DE102004012524A1 (de) 2005-10-27
WO2005091200A2 (de) 2005-09-29

Similar Documents

Publication Publication Date Title
DE102014008264B4 (de) Isotopenmustererkennung
DE102010019590B4 (de) Datenabhängiges Erfassungssystem für die Massenspektrometrie und Verfahren für dessen Anwendung
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
DE69722510T2 (de) Reduzierung von interferenzen in der elementarmassenspektrometrie
DE112004000746B4 (de) Verfahren und Vorrichtung zum Verarbeiten von LC-MS- oder LC-MS-/MS-Daten bei Stoffwechseluntersuchungen
DE112005001166B4 (de) Verfahren und Vorrichtung zum Identifizieren von Proteinen in Gemischen
DE60026452T2 (de) Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie
DE102013224310B4 (de) Verfahren und System zum Erhöhen eines dynamischen Nutzbereichs einer Spektrometrievorrichtung
DE102016012302B4 (de) Verfahren zum Auswerten von Daten einer Massenspektrometrie und massenspektrometrisches Verfahren
DE112005001143T5 (de) System und Verfahren zum Gruppieren von Vorläufer- und Fragmentionen unter Verwendung von Chromatogrammen ausgewählter Ionen
DE10392707B4 (de) Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten
DE602004002856T2 (de) Dynamische signalauswahl in einem chromatographie-/massenspektometrie-/massenspektrometriesystem
DE112012005677T5 (de) Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.
DE102015014754B4 (de) Verfahren zum zeitlichen Abgleichen von Chromatographie-Massenspektrometrie-Datensätzen
DE112015001668B4 (de) Verfahren zur Optimierung von Spektraldaten
DE602004009091T2 (de) Kalibration von Peak-Pattern
EP3159681B1 (de) Verfahren und vorrichtung zur automatisierbaren ermittlung der bestimmungsgrenze und des relativen fehlers bei der quantifizierung der konzentration einer zu untersuchenden substanz in einer messprobe
DE60308864T2 (de) Verfahren der Resonanz-Spektroskopie für die Analyse von statistischen Eigenschaften von Proben
DE102007039970B4 (de) Mehrkanalschnellabtastung von chromatographischen Spitzen durch ein Tandem-Massenspektrometer
DE102004012524B4 (de) Verfahren zur Bestimmung wahrer Molekülmassen von Konstituenten biologischer Proben
DE10026195A1 (de) Verfahren und Vorrichtung zum Identifizieren chemischer Substanzen
DE102019114771B4 (de) Vorläuferionen-auswahl für eine datenabhängige tandem-massenspektrometrie
DE102008046139A1 (de) Verfahren zur quantitativen Bestimmung einer Substanz durch Massenspektrometrie
CN107209156A (zh) 经由曲线减法检测基于质谱的相似性
DE112015002105B4 (de) Chromatograph-Massenspektrometer und Verfahren zu dessen Steuerung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee