DE10392707T5 - Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten - Google Patents

Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten Download PDF

Info

Publication number
DE10392707T5
DE10392707T5 DE10392707T DE10392707T DE10392707T5 DE 10392707 T5 DE10392707 T5 DE 10392707T5 DE 10392707 T DE10392707 T DE 10392707T DE 10392707 T DE10392707 T DE 10392707T DE 10392707 T5 DE10392707 T5 DE 10392707T5
Authority
DE
Germany
Prior art keywords
bin
data
analysis
parameter
data points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10392707T
Other languages
English (en)
Other versions
DE10392707B4 (de
Inventor
Robert Stephen Milford Plumb
Chris Lee Mildford Stumpf
Marc V. Needham Gorenstein
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waters Technologies Corp
Original Assignee
Waters Investments Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waters Investments Ltd filed Critical Waters Investments Ltd
Publication of DE10392707T5 publication Critical patent/DE10392707T5/de
Application granted granted Critical
Publication of DE10392707B4 publication Critical patent/DE10392707B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Verfahren zur Analyse dreidimensionaler Daten, die von einer Probe erhalten worden sind, unter Verwendung einer zweidimensionalen Analysetechnik, umfassend:
(a) Sammeln von Daten für die Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter mit der Zeit korreliert ist,
(b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe auf der Basis eines Zeitparameters ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen durch die Verwendung von zwei der verbleibenden Parameter gekennzeichnet sind,
(c) Transformieren jedes Bin-Datensatzes in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem zweiten Nullparameter zu dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze dieselbe Anzahl von Datenpunkten aufweisen und für jeden ersten Parameter in dem ausgerichteten Datensatz wenigstens ein Bin-Datensatz einen zweiten Parameter ungleich Null aufweist,
(d) Ausbilden eines zweidimensionalen Arrays, indem die ausgerichteten Bin-Datensätze mit dem ersten Parameter auf...

Description

  • Verwandte Anmeldungen
  • Diese Anmeldung nimmt die Priorität der US Provisional Application Nr. 60/384 712 in Anspruch, die am 31. Mai 2002 angemeldet worden ist und auf die hiermit Bezug genommen wird.
  • Gebiet der Erfindung
  • Die Erfindung betrifft ein Verfahren zur Analyse mehrdimensionaler Daten mittels eines Analyseverfahrens, das durch Anwendung von Datenbinning auf die Daten auf weniger Dimensionen angewendet werden kann. Insbesondere betrifft die Erfindung ein Verfahren zur Analyse von Chromatographie-/Spektrometriedaten unter Verwendung von Datenbinning. Die Erfindung findet insbesondere Anwendung bei Verfahren zur Durchführung der Flüssigkeitschromatographie/Massenspektrometrie-Datenanalyse (LC/MS) [liquid chromatography/mass spectrometry (LC/MS) data analysis] unter Verwendung von Datenbinning in Verbindung mit der Hauptkomponentenanalyse (principal component analysis; PCA).
  • Hintergrund der Erfindung
  • Der Begriff Metabonomics bezeichnet ein rasch wachsendes Gebiet naturwissenschaftlicher Forschung. Es handelt sich dabei um einen Systemansatz, um metabolische Profile in vivo zu untersuchen, der Informationen über bestimmte Krankheiten, Toxiziditäten und Genfunktionen bereitstellen kann. Auf dem Gebiet Metabonomics wird die Auswirkung eines pharmazeutischen Kandidatens auf ein gesamtes Tier oder einen Organismus untersucht, indem Veränderungen des Metabolismus bzw. Stoffwechsels über einen Zeitraum nach der Verabreichung einer Verbindung untersucht werden. Die in diesen Untersuchungen generierten analytischen Daten werden mittels multivariabler mathematischer Techniken, wie beispielsweise der Hauptkomponentenanalyse (principal component analysis; PCA) untersucht. Dieses mathematische Verfahren wird verwendet, um sowohl geringfügige als auch größere Unterschiede in den untersuchten Proben zu verdeutlichen.
  • Bis zum heutigen Tag haben die meisten Arbeiten auf diesem Gebiet die magnetische Proton-Kernresonanz (proton-nuclear magnetic resonance; NMR) als Analyseverfahren verwen det. Obwohl das NMR-Verfahren sehr effektiv ist, weist dieses mehrere Nachteile auf, und zwar eine schlechte Empfindlichkeit, eine zeitaufwendige Analyse und die Nicht-Detektion einiger chemischer Klassen, wie z. B. der Sulfate. Ein weiterer Nachteil des NMR-Verfahrens besteht darin, dass, da alle Signale in einem Spektrum enthalten sind, es für eine große Verbindung einfach ist, geringfügige jedoch wichtige Änderungen eines Analyten mit geringer Konzentration zu verdecken. Ferner entfernt die notwendige Entfernung von mit Xenobiotika in Verbindung stehenden Verbindungen aus dem NMR-Spektrum ebenso die Signale von interessanten endogenen Verbindungen, wodurch der Datensatz, der für die anschließende PCA-Analyse verwendet wird, reduziert wird.
  • Die Chromatographie, sowohl mit gasförmigen Phasen als auch mit flüssigen Phasen, hat sich in Kombination mit spektrometrischer Analyse, wie beispielsweise der Ultraviolett-Spektroskopie, der Infrarot-Spektroskopie, der magnetischen Kernresonanzspektroskopie oder der Massenspektrometrie, in den letzten Jahren als nützliche Technik erwiesen. Die Elektrospray-Massenspektrometrie in Kombination mit Flüssigkeitschromatographie (LC/MS) ist in der Bioanalyse, sowohl quantitativ als auch qualitativ, die beliebteste Analysetechnik. Die Technik ist robust, empfindlich und selektiv, wobei ohne weiteres Empfindlichkeiten bis in den pg/mL Bereich erreicht werden. Die Verwendung kurzer Säulen und rascher Gradienten hat es ferner ermöglicht, dass LC/MS-Verfahren analytische Zykluszeiten im Bereich von einer Probe pro Minute mit guter chromatographischer Auflösung und Empfindlichkeit erreichen können. Somit ist die Anwendung von LC/MS-Verfahren auf dem Gebiet Metabonomics ein logischer Schritt. Während das Massenspektrometer sowohl eine hochempfindliche Quantifizierung als auch strukturelle Informationen bereitstellt, behandelt der Chromatographieschritt die Frage überlappender Signale, indem ein Analyt mit einer gegebenen Zeitauflösung abgetrennt wird. Die Verwendung von LC/MS-Verfahren wird gegenüber einer Massenspektrometrieinfusion bevorzugt, da der Chromatographieschritt die Ionenunterdrückung vermindert, indem die Anzahl der miteinander konkurrierenden Ionen vermindert wird, die zu einer gegebenen Zeit in das Massenspektrometer eintreten. Ein weiterer Vorteil des LC/MS-Verfahrens gegenüber dem NMR-Verfahren ergibt sich bei der Datenanalyse. Wenn mit Xenobiotika in Verbindung stehendes Material entfernt wird, dann wird lediglich eine schmale Zeitscheibe bei einer oder zwei bestimmten Massen aus dem Datensatz entfernt. Daher verbleiben die übrigen LC/MS-Daten ungeändert und stehen für eine mathematischen Analyse, beispielsweise mittels PCA, zur Verfügung.
  • Die Hauptkomponentenanalyse ist ein sehr effektives mathematisches Verfahren, um die mittels MS erhaltenen Daten zu analysieren. Die PCA ist jedoch eine zweidimensionale Technik, wohingegen die aus einem LC/MS-Experiment erhaltenen Daten dreidimensional sind. Es besteht somit zur Zeit ein Bedarf, es der PCA zu ermöglichen, die chromatographische Trenninformation beizubehalten, die normalerweise bei der herkömmlichen PCA-Analyse verloren geht.
  • Im allgemeinen gibt es zahlreiche experimentelle Bedingungen, bei denen die Information über die Ergebnisse in Daten enthalten ist, die durch zahlreiche Parameter gekennzeichnet sind. Wenn das Analysewerkzeug diese Parameter nicht verarbeiten kann, dann geht Information verloren. Ein Verfahren, dass die Auflösung der Analyse von LC/MS-Daten verbessert, die mittels des PCA-Verfahrens analysiert werden, kann auf andere Datensätze angewandt werden.
  • Zusammenfassung der Erfindung
  • Die Erfindung betrifft ein Analyseverfahren mehrdimensionaler Daten unter Verwendung eines Tools, das weniger Dimensionen verarbeitet. In einer besonderen Ausführungsform betrifft die Erfindung ein Verfahren zur Analyse von dreidimensionalen Daten, die mittels eines Chromatographie/Spektrometrie-Experiments gewonnen werden, wie beispielsweise ein LC/MS-Experiment unter Verwendung einer zweidimensionalen multivariablen statistischen Analysetechnik, wie beispielsweise der PCA. Üblicherweise wird eine PCA-Analyse unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Gemäß der vorliegenden Erfindung wird die Analyse unter Verwendung dreidimensionaler Daten durchgeführt.
  • Daten, die mittels einer Chromatographievorrichtung gewonnen werden, werden durch eine Anzahl von Parametern gekennzeichnet. Insbesondere trennt die Chromatographie die Probe als eine Funktion der Zeit. Die Retentionszeit, d.h. die Zeitdauer, die eine Komponente der Probe auf der festen Phase zurückgehalten wird, ist besonders informativ. Unterschiedliche Komponenten der Probe werden aus der festen Phase je nach den Bedingungen zu unterschiedlichen Zeiten eluiert. Diese zeitabhängige Eigenschaft ist dazu nützlich, bestimmte Komponenten der Probe zu unterscheiden.
  • Weitere Parameter können von der nach der Chromatographietrennung verwendeten Detektionsmethode abhängen. Bei der Fluoreszenzdetektion zum Beispiel sind die interessierenden Parameter die Lichtwellenlänge und die Lichtintensität, während bei der Ultraviolettdetektion die Menge des absorbierten Lichts ein interessierender Parameter ist. In vielen Fällen ist das Ergebnis um so aussagekräftiger, je größer die Anzahl der von dem Analyseverfahren verarbeitbaren Parameter ist. Wenn ein Parameter vollständig ignoriert werden muss, dann geht die Möglichkeit verloren, Datenpunkte, die sich lediglich bezüglich dieses Parameters unterscheiden, auseinander zu halten.
  • Daten, die mittels eines LC/MS-Experiments erhalten werden, bestehen aus drei Parametern. Der erste dieser Parameter hängt von dem LC-Abschnitt des Systems ab. Die Flüssigkeitschromatographie trennt Analyten als Funktion der Zeit. Daher sind die von dem LG-Abschnitt gewonnen Daten zeitbasiert, d. h. Retentionszeit (Rt). Unterschiedliche Analyten werden aus der festen Phase des LC-Systems (der Säule) je nach dem Eluenten und dergleichen zu unterschiedlichen Zeiten eluiert. Diese differentielle Trennung ermöglicht ein Rt, das für jeden Analyten charakteristisch ist. Diese Information kann bei der Bestimmung beispielsweise der Identität eines bestimmten Analyten nützlich sein.
  • Der zweite und der dritte Parameter hängen von dem MS-Abschnitt des LC/MS-Systems ab. Sobald eine Probe mittels LC getrennt worden ist, werden individuelle Analyten in den MS-Abschnitt des Systems eingebracht. Je nach den Bedingungen der MS, wird der Analyt innerhalb eines gegebenen Volumens ionisiert und sodann auf einen molekularen Massendetektor beschleunigt. Das Masse-Ladungs-Verhältnis (mass-to-charge ration; m/z) und die Intensität können nach der Massendetektion bestimmt werden. Diese Information wird verwendet, um Unterschiede zwischen zwei oder mehr Proben zu bestimmen.
  • Üblicherweise wird die PCA-Analyse verwendet, um diese Bestimmung lediglich unter Verwendung der m/z- und der Intensitätsparameter durchzuführen. Somit tragen die Rt-Daten nicht zu der Gesamtanalyse bei. Dieser Kompromiss wird aufgrund der großen Anzahl von Daten in Kauf genommen, die mit ungefähr 5 bis 10 AMU-Punkten pro Ionenpeak von dem Massenspektrometer geliefert werden. Die vorliegende Erfindung beseitigt diesen Nachteil durch die Verwendung von Datenbinning. Mit Datenbinning geht die Rt-Information in der PCA-Analyse nicht verloren, wodurch die dreidimensionale Datenanalyse erleichtert wird. Der Vergleich zwischen Proben enthält nun Rt-, m/z- und Intensitätsdaten. Diese Technik ist insbesondere dabei nützlich, die Ergebnisse einer komplexen Probe zu untersuchen, wo die Antwort auf eine einfache Frage in Unmengen von komplexen Daten gefunden werden muss. Somit können geringfügige Änderungen zwischen Proben, die bisher nicht detektiert werden konnten, nunmehr herausgefunden werden.
  • In einer Ausführungsform werden individuelle LC/MS-Chromatogramme in vorbestimmte Fraktionen (oder Bins) getrennt. Diese Bins spiegeln den Rt-Parameter wieder. Die Größe des Bins wird vom Benutzer bestimmt. Beispielsweise kann die Bingröße eine Minute betragen, was Intervallen von einer Minute entlang des Chromatogramms entspricht. Innerhalb jedes Bins werden die Intensitätsinformationen für alle Scans, die während der Binzeit durchgeführt worden sind, für jede Sorte (m/z) summiert, die während des entsprechenden Rt vorhanden ist. Der Bin oder genauer die darin enthaltenen Daten werden sodann transformiert und an eine Datenmatrix, wie beispielsweise eine herkömmliche Tabellenkalkulation, wie beispielsweise Excel, exportiert. Somit werden die ursprünglich graphischen Daten in eine tabellarische Form der Daten transformiert. Die Informationen innerhalb jedes Bins, der transformiert wird, betreffen die chromatographische Zeit, m/z und die Intensität. Mehr als ein Bin kann dieser Transformation unterzogen werden. Beispielsweise können sechzig Bins vorhanden sein, die für einen sechzigminütigen LC-Lauf einen Bin pro Minute darstellen. Alternativ können Bins auf eine überlappende Art und Weise angeordnet sein, so dass beispielsweise neunzig einminütige Bins, die einmal alle 40 Sekunden entstehen, verwendet werden, um eine sechzigminütige LC-Prozedur zu analysieren. Sobald die Transformation vollständig durchgeführt worden ist, werden die Datensätze (Daten innerhalb der Tabelle) mit Nullen ausgerichtet bzw. aufgefüllt. Die Ausrichtung der Datensätze meint lediglich eine Lückenfüllprozedur. Wenn beispielsweise in Bin 3 bei m/z = 100 ein Intensitätswert von 102 und in Bin 4 bei m/z = 100 kein Intensitätswert vorhanden ist, dann wird in Bin 4 bei der Intensitätsposition, die m/z = 100 entspricht, eine Null angeordnet. Mit anderen Worten: die Null dient als Platzhalter, um somit eine korrekte Ausrichtung der Daten zu ermöglichen. Somit weist jeder Datensatz einen Intensitätswert (einschließlich einer Null) für jedes m/z auf. Zusätzlich kann die Isotopenhäufigkeit kombiniert werden, indem beispielsweise Werte für C12 und dessen Isotop C13 kombiniert werden. Schließlich werden die Tabellenkalkulationsdateien an ein herkömmliches PCA-System für eine PCA-Analyse übertragen, wie beispielsweise MatLab.
  • Kurze Beschreibung der Zeichnungen
  • 1 zeigt eine schematisch Darstellung der in einer Ausführungsform der vorliegenden Erfindung enthalten Schritte.
  • 2 zeigt einen Vergleich von LC/MS-Chromatogrammen (BPI mit negativen Ionen) für Kontroll- und Dosierungsratten.
  • 3 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung A verabreicht worden ist.
  • 4 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung B verabreicht worden ist.
  • 5 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung C verabreicht worden ist.
  • 6(a) zeigt ein extrahiertes Ionen-Chromatogramm und 6(b) zeigt ein MS-Spektrum für Peaks 338 m/z.
  • 7 zeigt einen PCA-Plot eines gesamten Datensatzes, der aus den Rattenurinproben 1 bis 24 besteht.
  • 8(a) zeigt ein kombiniertes und ein überlagertes Massenspektrum und 8(b) zeigt einen PCA-Plot der Fraktion von 5 Minuten bis 6 Minuten.
  • 9(a) zeigt ein kombiniertes und ein überlagertes Massenspektrum und 8(b) zeigt einen PCA-Plot der Fraktion von 3 Minuten bis 4 Minuten.
  • Detaillierte Beschreibung
  • Die Erfindung betrifft ein Verfahren zur Analyse mehrdimensionaler Daten unter Verwendung eines Tools, das weniger Dimensionen verarbeitet. Diese Erfindung findet insbesondere Anwendung bei der Analyse von Daten, die mittels eines Chromatographievorgangs gewonnen werden, dem ein spektrometrischer Vorgang folgt wird. Der Datensatz weist in diesen Fällen sowohl eine Zeitkomponente als auch typischerweise einen Intensitätswert einer physikalischen oder chemischen Eigenschaft der Probe auf. In einer besonderen Ausführungsform betrifft die Erfindung ein Verfahren zur Analyse von Daten, die mittels einer Flüssigkeitschromatographie-/Massenspektrometrie-Prozedur (LC/MS) unter Verwendung der Hauptkomponentenanalyse (PCA) gewonnen werden. Üblicherweise wird die PCA-Analyse unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Gemäß der vorliegenden Erfindung wir die Analyse unter Verwendung dreidimensionaler Daten durchgeführt. Die detaillierte Beschreibung der LC/MS- und der PCA-Analyse illustrieren die Vorgehensweise sowohl beim allgemeinen Fall als auch bei dieser besonderen Ausführungsform.
  • Der Chromatographieabschnitt des Systems erlaubt die Trennung von Analyten innerhalb einer Probenmatrix. Die Information, die mittels einer solchen Prozedur erhalten wird, wird üblicherweise als Retentionszeit (Rt) ausgegeben. Wenn sich die Analyten durch das System vorwärts bewegen, dann treten diese in den MS-Bereich des LC/MS-Systems ein. Dort werden diese ionisiert und ein Massendetektor erfasst sodann diese ionisierten Spezien, wodurch m/z- und Intensitätsinformation bereitgestellt wird. Daher kann ein LC/MS-System wenigstens drei Arten von Information bereitstellen. Obgleich zahlreiche multivariable statistische Analysetechniken verwendet werden können, handelt es sich bei der Hauptkomponentenanalyse (principal component analysis; PCA) um ein robustes Verfahren zur Analyse von Daten, und diese ist ferner recht nützlich, wenn Vergleiche zwischen verschiedenen Proben angestellt werden. Die PCA-Analyse wird üblicherweise jedoch unter Verwendung lediglich eines zweidimensionalen Datensatzes durchgeführt. Daher ist zu erwarten, dass wenigstens ein Datenparameter, der mittels eines LC/MS-Experiments gewonnen wird, verloren geht. Gemäß der vorliegenden Erfindung wird die Analyse unter Verwendung dreidimensionaler Datensätze zusammen mit der PCA-Analyse durchgeführt.
  • Die Chromatographie und insbesondere die Flüssigkeitschromatographie (liquid chromatography; LC) sind ein herkömmlicherweise verwendetes Verfahren, um Analyten in einer Probenmatrix zu trennen. Für gasförmige Proben liefert die Gaschromatographie (GC) vergleichbare Daten. Die Hochleistungsflüssigkeitschromatographie (high performance liquid chromatography; HPLC) erlaubt die rasche und effiziente Trennung und Charakterisierung von Analyten innerhalb einer gegebenen Probe. Die Komponenten eines HPLC-Systems umfassen Hockdruckpumpen, die die Bewegung einer wässrigen und/oder einer organischen Phase durch das System erleichtern. Diese wässrige Phase (oder mobile Phase) umfasst ein Lösungsmittel, das verwendet wird, um anfänglich das HPLC-System abzugleichen. Das Lösungsmittel stellt ferner ein wässriges Milieu für die Analyten bereit, um sich durch das gesamte HPLC-System zu bewegen. Schließlich umfasst die mobile Phase Lösungsmittel, das Analyten aus einer HPLC-Säule eluiert.
  • Eine weitere Komponente eines HPLC-Systems ist die chromatographische Trennsäule. Die Säule umfasst eine feste Phase. Die feste Phase bewirkt zusammen mit der mobilen Phase eine differentielle Trennung von Analyten, die innerhalb einer Probenmatrix enthalten sind. Die feste Phase besteht im Allgemeinen aus chemischen Polymeren, die mit einer bestimmten Klasse von Analyten wechselwirken. Beispielsweise weist eine Umkehr-Phase-HPLC-Säule (reverse phase HPLC column) eine Festphasenchemie auf (z. B. eine Kohlenwasserstoffkette, die aus achtzehn Kohlenstoffatomen besteht, die an ein Silicakügelchen angebracht ist), die mit Analyten mittels hydrophober Kräfte in Wechselwirkung tritt.
  • Sobald die Analyten aus der Säule eluiert sind, treten diese in einen Detektor ein und durch diesen durch. Es gibt eine Vielzahl von Detektionssystemen, die in einem HPLC-System verwendet werden können. Beispielsweise gibt es Ultraviolett("UV")-Detektoren, die Analyten innerhalb des UV-Bereichs detektieren, Infrarot(IR)-Detektoren, die Analyten innerhalb des IR-Bereichs detektieren, elektrochemische Detektoren, die Analyten unter Verwendung voltametrischer Techniken detektieren, Kernspinresonanzdetektoren (nuclear magnetic resonance detectors), die Analyten auf der Basis von deren Antwort auf ein magnetisches Feld detektieren, sowie Massenspektrometerdetektoren, die Analyten auf der Basis des Masse-zu-Ladungs-Verhältnis detektieren.
  • In einem LC/MS-System wird die Probenmatrix zunächst einer LC-Trennung unterzogen, um somit die Trennung von Analyten in der Probe zu bewirken. Diese Information, die oftmals in dem Rt eines Analyten enthalten ist, kann dazu verwendet werden, den Analyten zu charakterisieren und zu identifizieren. Weitere Informationen können jedoch insbesondere für Vergleiche gewonnen werden, die zwischen verschiedenen Proben gemacht werden, indem die Analyten einer MS-Detektion unterzogen werden. Im Allgemeinen ionisieren Massenspektrometer Moleküle innerhalb eines gegebenen Volumens und beschleunigen die ionisierten Moleküle sodann in Richtung eines molekularen Massendetektors. Die Ionisierung eines Moleküls kann mittels Elektronenionisierung, chemischer Ionisierung, Elektrosprayionisierung (electrospray ionization) oder Photoionisation erreicht werden. Der Ionisierungsprozess kann unter zahlreichen Druckbedingungen einschließlich Atmosphärendruck stattfinden. Informationen, die mittels MS gewonnen werden, umfassen die Intensität der Antwort für einen bestimmten m/z-Wert. Es ist diese Intensitätsinformation (als auch die m/z-Information), die beim Vergleich von zwei oder mehr Proben wichtig ist.
  • Die MS-Information kann für eine vergleichende Analyse genutzt werden. Nimmt man beispielsweise an, dass man mit einer humanen Zelllinie experimentiert. Das Ziel der Untersuchung besteht darin, zu bestimmen, ob und wenn ja welchen Einfluss die Verbindung X auf einen bestimmten Metaboliten hat. Um fortzufahren, nehme an, dass der Benutzer zwei Proben erhalten hat, und zwar Probe 1, eine Kontrollprobe, d. h. ein Zellenextrakt aus einer Zellenkultur, zu der die Verbindung X nicht hinzugegeben worden ist, sowie Probe 2, ein Zellenextrakt, der einem Zellkultursystem entnommen worden ist, zu dem die Verbindung X hinzugegeben worden ist. Diese zwei Proben können einer LC/MS unterzogen werden. Lasst uns weiter annehmen, dass der uns interessierende Metabolit für eine chromatographische Isolierung unter Verwendung einer Umkehr-Phase-Säule geeignet ist. Sobald die Proben mittels LC getrennt worden sind, können die Probe 1 und die Probe 2 unabhängig voneinander einer MS-Analyse unterzogen werden. Die MS-Signale, die mittels der zwei Proben erzeugt werden, können sodann verglichen werden, insbesondere für den interessierenden Metaboliten, um zu bestimmen, ob dessen Intensität mit der Hinzufügung der Verbindung X ansteigt, absinkt oder nicht beeinflusst wird.
  • 1 zeigt ein Fließdiagram, das die verschiedenen Schritte der Erfindung zeigt, wie diese auf ein LC/MS-Experiment angewendet wird. 1a zeigt in einer graphischen Darstellung Daten, die mittels einer LC/MS-Prozedur einer gedachten Probe gewonnen worden sind. Wie dargestellt, definiert der Graph drei Parameter. Die x-Achse definiert den m/z-Parameter. Die x-Achse kann sich beispielsweise in Schritten von 0,1 m/z von 100 bis 800 m/z erstrecken. Die y-Achse von 1a repräsentiert den Intensitäts- oder Antwortparameter. Die Intensität kann als ein Prozentsatz eines bestimmten Ions, z. B. der Grundpeak, gesetzt werden. Schließlich gibt es eine z-Achse, die den Zeitparameter darstellt. In 1a sind Ionensorten dargestellt, die sich wenigstens in einem der drei Parameter unterscheiden. Jede Ionensorte ist jedoch eindeutig durch die Parameter in 1a definiert.
  • Bestehende PCA-Analysen erfordern, dass die in 1a dargestellten Daten vor der Analyse in einen zweidimensionalen Datensatz umgewandelt werden. Beispielsweise kann die herkömmliche PCA-Analyse unter Verwendung des m/z-Parameters und des Intensitätsparameters durchgeführt werden. Dies würde jedoch den Zeitparameter eliminieren. Eine gründlichere Analyse würde alle relevanten Informationen enthalten, die erhältlich sind, einschließlich der Zeitdimension. 1b zeigt einen Prozess, mit dem alle drei Parameter erhalten und einer Analyse unterzogen werden können. Das "Binnen" von Daten bzw. das Datenbinning ist ein Prozess zum Trennen eines Datensatzes, der mehrere Messpunkte darstellt, in mehrere Datensätze, die Messpunkte zusammenfassen. Ein "Bin" entspricht einem Bereich eines Parameters, d. h. dem Bin-Parameter. Die Änderung des Bin-Parameters innerhalb jedes Bins wird eliminiert, indem alle Datenpunkte innerhalb des Bins bei dem Bin-Wert zusammengefasst werden. Ein Bin, der den gesamten Datensatz umfasst, hat denselben Effekt, wie ein Ignorieren des Bin-Parameters. Obgleich üblicherweise nicht überlappende Bins verwendet werden, können überlappende Bins für bestimmte Analysen verwendet werden. Beim Übergang von 1a zu 1b findet ein Prozess des Datenbinnings statt, wobei eine vorbestimmte Bin-Größe ausgewählt ist. Die Bin-Größe ist eine Funktion der Zeitdimension. Die Bin-Größe kann beispielsweise zwei Minuten betragen. Mehrere Bins sind in 1 b dargestellt. Jeder Bin enthält sowohl m/z-Information als auch Intensitäts-Information für Ionensorten, die in allen Scans gefunden worden sind, die in diesen Bin fallen. Die Bin-Größen (oder Bereichsgrößen) werden von einem Praktiker auf der Basis seiner Erfahrung und der untersuchten Probe ausgewählt. Auswahlverfahren sind dem Fachmann wohlbekannt. Beispielsweise kann die MassLynx-Software verwendet werden.
  • Bei Verwendung dieser Software wird ein Bin folgendermaßen erzeugt: (1) Öffnen des gesamten Ionenchromatogramms, (2) Auswählen eines Bin-Bereichs, indem dieser mit der Maus angeklickt wird und über die Bin-Fläche gezogen wird, so dass ein kombiniertes Massenspektrum erscheint (der Bin), (3) in dem Fenster des kombinierten Massenspektrum (Bin) erscheint eine "List Spectrum" Option und diese wird aktiviert, (4) wenn die "List Spectrum"-Option ausgewählt wird, dann zeigt ein Fenster m/z mit den entsprechenden Häufigkeiten in einem Zweispaltenformat an, (5) Kopieren der in den zwei Spalten enthaltenen Daten und (6) Einfügen in eine Tabellenkalkulation wie beispielsweise Excel.
  • Nach dem Prozess des Datenbinnings erfolgt ein Transformationsschritt (siehe 1 b und 1c). Die Transformation konvertiert die separaten Listen, die mittels des graphischen Datenformats abgeleitet worden sind, in eine Datenmatrixdarstellung. Der Benutzer kann diese Transformation einfach einleiten, indem er lediglich eine "Cut & Paste"-Prozedur verwendet, wodurch die zweispaltige Datensatzinformation einer herkömmlichen Tabellenkalkulation wie beispielsweise Excel übergeben wird. Sobald dieser Teil der Transformation abgeschlossen ist, muss der Datensatz mit Nullen ausgerichtet bzw. aufgefüllt werden. Jeder Bin muss einen Wert für alle zu analysierenden Ionen aufweisen. Um die Genauigkeit der Analyse sicher zu stellen, werden Nullen als Intensitätswerte eingesetzt, wo kein Ionensignal für diesen Bin beobachtet worden ist, wodurch bewirkt wird, dass jeder Datensatz einen Intensitätswert für jeden m/z-Parameter aufweist. Sodann können die m/z-Parameter Spalten in eine Spalte zusammengefasst werden, die als eine Achse der Matrix wirkt. Alternativ kann ein Softwareprogramm verwendet werden, um diese Transformation zu automatisieren. Eine Darstellung der tabellarischen Darstellung ist in 1 c dargestellt. In 1 c sind eine m/z-Spalte und eine Bin-Reihe gezeigt. Die m/z-Spalte enthält die zu analysierenden m/z-Ionen. Die Bin-Reihe enthält die gewünschten zu analysierenden Bins. Der Matrix-Schnittpunkt enthält Intensitätswerte, die dem entsprechenden m/z-Parameter und Bin-Parameter entsprechen. Weitere Datenverarbeitung auf der Basis von bekannten Transformationen in m/z und Intensität, die durch den Test verursacht werden, können durch den Benutzer durchgeführt werden, bevor die Daten einer Analyse unterzogen werden. Beispielsweise kann die Isotopenhäufigkeit kombiniert werden, so dass die Werte für beispielsweise C12 und dessen Isotop C13 kombiniert werden.
  • Die Matrix oder die Tabellenkalkulation wird sodann zu einem herkömmlichen PCA-Programm übertragen und von diesem verarbeitet, wodurch Vergleiche zwischen verschiedenen Proben durchgeführt werden können. Ein derartiges herkömmliches PCA-Programm heißt MatLab, das von der Firma MathWorks, Natick, MA vertrieben wird. Ein weiteres PCA-Pro gramm mit dem Namen Pirouette kann von der Firma InfoMetrix, Woodinville, WA erhalten werden.
  • Indem einige der dem Massenspektrometer inhärenten hochauflösenden Daten verschmiert werden, indem die Daten, die von mehreren Scans stammen, mittels Binnen kombiniert werden, kann die zweidimensionale Analyse die resultierenden dreidimensionale Daten bearbeiten. Dies erlaubt, dass der Großteil der Daten dort analysiert werden kann, wo ein Wechsel zwischen Sorten erwartet wird, jedoch der Ort des Wechsels in den verschiedenen Scans nicht bekannt ist. Nachdem der Ort der Variation bekannt ist, kann eine anschließende Analyse die den Rohdaten inhärente hohe Auflösung verwenden, um die Unterschiede weiter zu charakterisieren. Die Binning-Technik kann angewendet werden, um die Datensätze an zahlreiche Typen von multivariablen statistischen Analysen anzupassen.
  • Beispiel
  • Rattenurinproben:
    Insgesamt 20 Rattenproben sind in diesem Experiment verwendet worden. Die Ratten wurden in vier (4) Gruppen unterteilt. Die Gruppe I erhielt lediglich die Dosierungsmatrix und die Gruppen II, III und IV sind oral mit den Verbindungen A, B bzw. C dosiert worden. Proben von Rattenurin sind zu zwei Zeitpunkten, 0–8 und 8–24 Stunden nach der Dosierung, gesammelt worden. Der Rattenurin wurde vor der Analyse bei –20° C gefroren aufbewahrt.
  • Chromatographie:
    Die Chromatographie wurde unter Verwendung eines Waters Alliance 2795 HT Systems durchgeführt, das mit einem Säulenofen und einem Waters 2996 PDA Detektor ausgestattet ist. Eine Injektion von Rattenurin (mit 1 : 4 destilliertem Wasser verdünnt) mit 20 μL/min wurde auf eine Säule aufgegeben (10 cm × 2.1 mm Waters Symmetry C18 3.5 μm). Die Säule ist bei 40°C gehalten worden und unter Gradientenbedinungen bei einer Flussrate von 600 μL/min eluiert werden, wobei der Eluent "A" 0.1 % wässrige Ameisensäure war und der Eluent "B" Acetonitril war. Die Säule wurde für eine Minute bei 100% A gehalten und sodann wurde die mobile Phase während der folgenden sieben Minuten rasch auf 30% B erhöht. Die mobile Phase wurde sodann während 0.1 Minuten rasch auf 95% B gesteigert. Diese mobile Phase wurde für 0.5 Minuten gehalten, um die Säule zu waschen, und sodann während der folgenden 0.1 Minuten auf die Anfangsbedingungen zurückgeführt. Die nächste Einspritzung wurde 10 Minuten nach der ersten Einspritzung gemacht.
  • Massenspektrometrie:
    Die massenspektrometrische Anaylse wurde auf der Vorrichtung "Quattro Micro" der Firma "MicroMass" durchgeführt, die mit einem Elektrospray-Interface ("ESI") ausgestattet war. Das Instrument wurde in einem negativen Ionenmodus mit einer Kapillarspannung von 3 kV betrieben, wobei die Kegelspannung auf 25 Volt eingestellt war, das Zerstäubungsgas bei 600 L/Stunde mit einer Desolvatisierungstemperatur von 150°C eingestellt war und die Quellentemperatur 70°C betragen hat. Der Säulenabfluss wurde in einem Verhältnis von 5 : 1 geteilt, so dass 100 μL/min in die Massenspektrometerquelle eingetreten sind. Das Instrument ist im vollständigen Scanmodus (full scan mode) betrieben worden, wobei von 100 bis 800 m/z mit einer Scanzeit von 200 Millisekunden und einer Verzögerung zwischen Scans von 50 Millisekunden gescannt worden ist. Daten wurden in dem Zeitraum von 0 bis 10 Minuten erfasst. Der anfängliche Abschnitt des Chromatogramms ist nicht dem Abfall zugeführt worden.
  • Datenanalyse:
    Die LC/MS-Chromatogramme wurden bezüglich des Vorhandenseins irgendwelcher medikament-zugehöriger Produkte, wie beispielsweise Metaboliten der Phase I und der Phase II, untersucht. Jedes einzelne LC/MS-Chromatogramm wurde sodann in 10 Fraktionen zu je 100 Scans geteilt. Das MS-Signal ist für jede einzelne Chromatogrammfraktion zu 100 Scans kombiniert worden. Die Peakliste und die Ionenhäufigkeiten wurden sodann in eine Exceldatei exportiert. Die Datensätze sind sodann aufgefüllt bzw. ausgerichtet worden, wobei Nullen dort als Intensitätswerte eingesetzt worden sind, wo kein Ionensignal erfasst worden ist, so dass jeder Datensatz für jeden ganzzahligen m/z-Wert zwischen 100 und 800 einen Intensitätswert aufwies. Die Exceldateien wurden sodann zu der MatLab Software für eine PCA-Analyse übertragen.
  • Diskussion:
    Rattenurin enthält möglicherweise mehrere Tausend Komponenten, von denen die meisten noch unbekannt sind. Die große Mehrzahl dieser Komponenten weisen eine mittlere oder große Polarität auf, und somit war es lediglich notwendig, einen Gradienten von 0–30% organischer Anteil zu verwenden, um eine vollständige Elution aller Komponenten in den Urinproben zu bewirken. ESI MS mit negativen Ionen wurde als MS-Detektionsmodus gewählt, da dieser einen Datensatz lieferte, der reicher an Information war, als ESI mit positiven Ionen. Die Länge der Chromatographiesäule, die Gradientenzeit und die Abflussrate, die in dieser Untersuchung verwendet worden sind, sind so gewählt worden, die beste Balance zwischen Probendurchsatz und chromatographischer Auflösung zu liefern. Ein Probendurchsatz von 6 Proben pro Stunde und eine Peakkapazität (peak capacity) von 78 ist er reicht worden. Obgleich diese Peakkapazität nicht sonderlich groß ist, stellt die Verwendung eines massenspektrometrischen Scannens von 100 bis 800 m/z einer weitaus größere effektive Peakkapazität bereit. In dieser Untersuchung ist ein einfaches Umkehr-Phasen-Chromatographiesystem verwendet worden. Man erkennt, dass zahlreiche hochgradig polare Verbindungen, wie beispielsweise Aminosäuren oder Zucker, nicht zurückgehalten werden. Eine Modifizierung des Systems ermöglicht eine Untersuchung dieser Verbindungen.
  • Ein vorläufiger Vergleich der Grundpeakintensitätschromatogramme (base peak intensity chromatograms; BPI chromatograms) des Kontrollrattenurins und der Urinproben von den dosierten Tieren zum Zeitpunkt 1 offenbart einen qualitativen Unterschied (siehe 2). Wie sich diesen Chromatogrammen entnehmen lässt, gibt es mehrere Peaks in den Chromatogrammen der dosierten Probengruppe, die erhöhte Niveaus im Vergleich zu denen in der Kontrollgruppe zeigen. Diese Peaks eluieren in dem Zeitbereich zwischen 5 und 9 Minuten des Chromatogramms. Eine gründliche Untersuchung dieser Peaks hat bestätigt, dass es sich bei keinem von diesen um einen Metaboliten gehandelt hat, der von den dosierten Verbindungen stammte. Daher müssen diese Peaks eine Folge eines Wechsels des metabolischen Zustands der Tiere sein.
  • Die BPI-Chromatogramme, die von den Proben zum Zeitpunkt 2 für Verbindung "A" erhalten worden, zeigen einige geringfügige Änderungen in einigen Peakintensitäten, wenn diese mit den Proben von Zeitpunkt 1 verglichen werden (siehe 3). Bei der Probe zu Zeitpunkt 2 scheinen die Analyten, die zwischen 5 und 7 Minuten eluieren, eine verminderte relative Konzentration im Vergleich zu den gleichen Probenanalyten zu Zeitpunkt 1 aufzuweisen. Die Proben für die Verbindungen "B" und "C" zeigen weniger Variation zwischen den Zeitpunkten 1 und 2 (siehe 4 und 5). Da es sich bei diesen Proben zu Zeitpunkt 1 und 2 um Tages- und Nachtproben handelt, würde man erwarten, eine signifikante Variation zwischen den zwei Probentypen zu entdecken, und zwar sogar ohne die Dosierung eines Xenobiotikums. Daraus kann man folgern, dass die Verbindungen, die mit den Änderungen des Tierstoffwechsels zwischen Tag und Nacht zusammenhängen, entweder nicht zurückgehalten oder nicht detektiert worden sind.
  • Die Peaks, die man dahingehend identifiziert hat, dass diese sich in den dosierten Proben im Vergleich zu den Kontrollproben verändert haben sind in Tabelle 1 aufgeführt (ein extrahiertes Ionenchromatogramm eines dieser Ionen bei m/z = 338 sowie das MS-Spektrum dieses Peaks sind in 6 dargestellt).
  • Figure 00140001
    Tabelle 1
  • Die Daten in Tabelle 1 zeigen die Veränderungen der Peakintensität, die für die Peaks in den Kontrollproben und den dosierten Proben beobachtet werden. Wie sich diesen Daten entnehmen lässt, sind die Änderungen der Peakkonzentrationen sehr signifikant. Die Tatsache, dass diese Verbindungen ebenso in den Kontrollproben beobachtet worden sind, bestätigt, dass diese Peaks keine metabolischen Produkte der dosierten Verbindungen waren.
  • Die PCA-Analyse des gesamten Datensatzes ist in 7 dargestellt. In dieser Figur sind die Daten, die die Kontrollproben betreffen, in den eingekreisten Bereichen enthalten. Die Kontrollproben sind deutlich von den dosierten Tierproben getrennt. Diese PCA-Analyse wurde unter Verwendung des gesamten Datensatzes der Retentionszeiten und der m/z-Werte durchgeführt. Das Fraktionieren des Chromatogramms in 10 Zeitbereiche ermöglichte ebenso, dass die PCA-Analyse von bestimmten Zeitbereichen des Chromatogramms durchgeführt werden konnte.
  • Die PCA-Analyse der Daten zwischen 5 und 6 Minuten ist in 8 dargestellt. Hier ist es möglich, die Kontrollproben, die in dem eingekreisten Bereich enthalten sind, von den dosierten Proben zu trennen. Das kombinierte MS-Spektrum zeigt, dass die MS-Peaks, die für das Abbilden der dosierten Proben und der Kontrollproben in verschiedene Bereiche des PCA-Plots verantwortlich waren, die m/z-Werte m/z = 283 und m/z = 261 aufweisen. Das Ion mit m/z = 283 weist eine erhöhte Intensität in den dosierten Proben auf, wohingegen das Ion mit m/z = 261 in den dosierten Proben eine verminderte Intensität aufweist. Dieses Ergebnis bestätigt die Ergebnisse, die mittels der Analyse der LC/MS-Daten gewonnen worden sind.
  • 9 zeigt eine PCA-Analyse der LC/MS-Daten zwischen 3 und 4 Minuten. In diesen Daten gibt es keine Trennung zwischen den Kontrollproben und den dosierten Proben. Diese Daten zeigen an, dass in diesem Bereich des Chromatogramms kein signifikanter Unterschied zwischen den dosierten Proben und den Kontrollproben bestand.
  • Die Anwendung von LC/MS in Verbindung mit der PCA-Datenanalyse ist erfolgreich auf das Durchmustern von Rattenurin nach der Verabreichung von drei potentiellen Pharmazeutika angewendet worden. Mit dieser Vorgehensweise ist es möglich gewesen, die Kontrollproben von den dosierten Proben zu trennen. Es war ferner möglich unter Verwendung der PCA-Analyse, die Komponenten des MS-Spektrums zu identifizieren, die für die Trennung verantwortlich sind. Diese Daten zeigen eindeutig, dass LC/MS eine geeignete Alternative zu Proton-NMR für metabonomische Anwendungen bei der Medikamentauffindung und Medikamententwicklung ist.
  • Während diese Erfindung insbesondere unter Bezugnahme auf bestimmte Ausführungsformen gezeigt und beschrieben worden ist, erkennt der Fachmann, dass zahlreiche Änderungen in der Form und im Detail gemacht werden können, ohne den Schutzumfang der Erfindung zu verlassen, wie dieser in den folgenden Ansprüchen definiert wird.
  • ZUSAMMENFASSUNG
  • Es wird ein Verfahren zur Analyse dreidimensionaler Daten beschrieben, die mittels eines Chromatographie-/Massenspektromtrie-Verfahrens und insbesondere eines LC/MS-Verfahrens gewonnen werden, unter Verwendung einer zweidimensionalen multivariablen statistischen Analyse. Der LC-Abschnitt erlaubt die Trennung von Analyten innerhalb einer Probe. Die aus einer solchen Prozedur gewonnen Informationen hängen typischerweise von der Retentionszeit (R) ab. Wenn sich die Analyten durch das System fortbewegen, treten diese in des MS-Bereich des LC/MS-Systems ein. Dort werden sie ionisiert und ein Massendetektor detektiert sodann diese ionisierten Spezies. Die aus dieser Prozedur gewonnenen Informationen wird im allgemeinen als Intensität für einen entsprechenden m/z-Wert ausgegeben. Daher stellt ein LC/MS-System wenigstens drei Informationsteile zur Verfügung. Die Hauptkomponentenanalyse (PCA) ist ein robustes Verfahren der multivariablen Analyse dieses Datentyps zwischen unterschiedlichen Proben. Üblicherweise wird die PCA-Analyse jedoch unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Daher ist zu erwarten, dass wenigstens ein Datenparameter, der aus einem LC/MS gewonnen wird, verloren geht. Die hierein beschriebenen Verfahren erhalten jedoch alle drei mathematischen Dimensionen.

Claims (22)

  1. Verfahren zur Analyse dreidimensionaler Daten, die von einer Probe erhalten worden sind, unter Verwendung einer zweidimensionalen Analysetechnik, umfassend: (a) Sammeln von Daten für die Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter mit der Zeit korreliert ist, (b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe auf der Basis eines Zeitparameters ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen durch die Verwendung von zwei der verbleibenden Parameter gekennzeichnet sind, (c) Transformieren jedes Bin-Datensatzes in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem zweiten Nullparameter zu dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze dieselbe Anzahl von Datenpunkten aufweisen und für jeden ersten Parameter in dem ausgerichteten Datensatz wenigstens ein Bin-Datensatz einen zweiten Parameter ungleich Null aufweist, (d) Ausbilden eines zweidimensionalen Arrays, indem die ausgerichteten Bin-Datensätze mit dem ersten Parameter auf einer Achse und einer Bin-Zahl auf einer zweiten Achse angeordnet werden, und wobei der zweite Parameter der Datenpunkte an den Überschneidungen aufgezeichnet wird, und (e) Unterziehen der Daten von (d) einer zweidimensionalen multivariablen, statistischen Analyse.
  2. Verfahren nach Anspruch 1, wobei die Bins nicht überlappen.
  3. Verfahren nach Anspruch 1, wobei die Bins sich teilweise überlappen.
  4. Verfahren nach Anspruch 1, wobei die Bin-Größe in einem Bereich liegt von einem Bin, der einen gesamten Bereich des Zeitparameters umfasst, bis zu einem Bin, der nicht mehr als zwei der kleinsten, identifizierbaren Inkremente des Zeitparameters umfasst.
  5. Verfahren nach Anspruch 1, wobei die zweidimensionale multivariable statistische Analyse ausgewählt ist aus der Gruppe bestehend aus der klassischen Analyse der kleinsten Quadrate (classical least square analysis; CSL), der Hauptkomponentenanalyse (principal component analysis; PCA), der Analyse der teilweise kleinsten Quadrate (partial least square analysis; PLS) und der Analyse der teilweise kleinsten Quadratdiskriminanten (partial least squares discriminant analysis; PLS-DA).
  6. Verfahren nach Anspruch 5, wobei die zweidimensionale multivariable statistische Analyse die Hauptkomponentenanalyse (principal component analysis; PCA) ist.
  7. Verfahren nach Anspruch 1, wobei die Transformation von Schritt (c) ferner das Verbinden von Datenpunkten umfasst, wenn die Werte des ersten Parameters anzeigen, dass die Datenpunkte in Beziehung stehen, wobei das Verbinden durch Hinzufügen der jeweiligen Werte der zweiten Parameter durchgeführt wird.
  8. Verfahren nach Anspruch 1, wobei die dreidimensionalen Daten von einem chromatographischen Prozess in Kombination mit einem spektrometrischen Prozess abgeleitet sind.
  9. Verfahren nach Anspruch 8, wobei der chromatographische Prozess ein Flüssigkeitschromatographieprozess ist.
  10. Verfahren nach Anspruch 8, wobei der spektrometrische Prozess ausgewählt ist aus der Gruppe bestehend aus Ultraviolettspektroskopie, Infrarotspektroskopie, Massenspektrometrie und Kernresonanzspektroskopie.
  11. Verfahren nach Anspruch 10, wobei der spektrometrische Prozess Massenspektrometrie ist.
  12. Verfahren nach Anspruch 8, wobei die nicht zeitbasierten Parameter eine physikalisch zugängliche Variable sind, die einer physikalischen/chemischen Eigenschaft der Probe entsprechen, wobei eine Intensität der Variable für jede Spezies einer Variable innerhalb jedes Bins enthalten ist, und wobei der Zeitparameter eine Dauer von Rt ist.
  13. Verfahren nach Anspruch 12, wobei die physikalisch zugängliche Variable, die einer physikalischen/chemischen Eigenschaft der Probe entspricht, m/z ist.
  14. Verfahren nach Anspruch 13, wobei die Transformation bei Schritt (c) ferner das Verbinden von Datenpunkten umfasst, die einen m/z-Parameter aufweisen, der anzeigt, dass die Datenpunkte Isotope desselben Ions darstellen, wobei das Verbinden durch Hinzufügen jeweiliger Intensitätswerte stattfindet.
  15. Verfahren nach Anspruch 8, wobei die dreidimensionalen Daten aus einem Flüssigkeitschromatographie-/Massenspektrometrie-Prozess gewonnen werden.
  16. Verfahren zur Analyse dreidimensionaler Daten unter Verwendung der Hauptkomponentenanalyse (PCA), umfassend: (a) Sammeln von Chromatographie-/Massenspektrometrie-Daten für eine Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter ausgewählt ist aus der Gruppe bestehend aus Rt, m/z und Intensität, (b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe basierend auf Rt ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen unter Verwendung eines oder mehrerer der m/z-Werte oder der Intensitätswerte für jede Ionenspezies gekennzeichnet werden, die innerhalb jedes Bins enthalten ist, (c) Transformieren jedes der Bin-Datensätze in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem Nullintensitätsparameter dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze die gleiche Anzahl von Datenpunkten aufweisen und für jeden m/z-Wert in den ausgerichteten Datensätzen wenigstens ein ausgerichteter Bin-Datensatz einen Intensitätswert ungleich Null aufweist, der dem m/z-Wert entspricht, (d) Ausbilden eines zweidimensionalen Arrays durch Anordnen der ausgerichteten Bin-Datensätze mit m/z auf einer Achse, einer Bin-Zahl auf einer zweiten Achse und einem Intensitätswert, der an den Überschneidungen aufgezeichnet ist, und (e) Anwenden einer PCA-Analyse auf die Daten von (d).
  17. Verfahren nach Anspruch 16, wobei die Chromatographie-/Massenspektrometrie-Daten von einem Flüssigkeitschromatographie-/Massenspektrometrie-Vorgang gewonnen werden.
  18. Verfahren nach Anspruch 16, wobei die Transformation bei Schritt c ferner das Verschmelzen von Datenpunkten einschließt, wo m/z-Parameter anzeigen, dass diese Datenpunkte Isotope desselben Ions darstellen, wobei das Verschmelzen durch Hinzufügen jeweiliger Intensitätswerte erfolgt.
  19. Verfahren nach Anspruch 16, wobei das zweidimensionale Array in einer Tabellenkalkulation ausgebildet ist.
  20. Verfahren nach Anspruch 16, wobei die Bins nicht überlappen.
  21. Verfahren nach Anspruch 16, wobei die Bins teilweise überlappen.
  22. Verfahren nach Anspruch 16, wobei die Bin-Größe in einem Bereich liegt von einem Bin, der einen gesamten Bereich des Zeitparameters umfasst, bis zu einem Bin, der nicht mehr als zwei der kleinsten, identifizierbaren Inkremente des Zeitparameters umfasst.
DE10392707T 2002-05-31 2003-05-30 Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten Expired - Lifetime DE10392707B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38471202P 2002-05-31 2002-05-31
US60/384,712 2002-05-31
PCT/US2003/017190 WO2003102543A2 (en) 2002-05-31 2003-05-30 A method of using data binning in the analysis of chromatograhpy/spectrometry data

Publications (2)

Publication Number Publication Date
DE10392707T5 true DE10392707T5 (de) 2005-11-03
DE10392707B4 DE10392707B4 (de) 2012-08-16

Family

ID=29712079

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10392707T Expired - Lifetime DE10392707B4 (de) 2002-05-31 2003-05-30 Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten

Country Status (6)

Country Link
US (2) US7072773B2 (de)
JP (1) JP4704034B2 (de)
AU (1) AU2003237306A1 (de)
DE (1) DE10392707B4 (de)
GB (2) GB2405972B (de)
WO (1) WO2003102543A2 (de)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4818116B2 (ja) * 2003-05-29 2011-11-16 ウオーターズ・テクノロジーズ・コーポレイシヨン メタボノミクスにおいてlc−msまたはlc−ms/msデータの処理を行うための方法およびデバイス
WO2005062844A2 (en) * 2003-12-19 2005-07-14 Icoria, Inc. System and methods for non-targeted processing of chromatographic data
US7645984B2 (en) 2004-02-13 2010-01-12 Waters Technologies Corporation Apparatus and method for identifying peaks in liquid chromatography/mass spectrometry data and for forming spectra and chromatograms
JP4719694B2 (ja) * 2004-02-13 2011-07-06 ウオーターズ・テクノロジーズ・コーポレイシヨン 化学物質を追跡し、定量化するためのシステムおよび方法
JP4950029B2 (ja) * 2004-04-30 2012-06-13 マイクロマス ユーケー リミテッド 質量分析計
US7462819B2 (en) * 2005-05-16 2008-12-09 The University Of Western Ontario Statistical methods applied to surface chemistry in minerals flotation
JP4932834B2 (ja) 2005-06-03 2012-05-16 ウオーターズ・テクノロジーズ・コーポレイシヨン 保持時間整合を行うための方法および装置
EP1904934A2 (de) * 2005-07-08 2008-04-02 Metanomics GmbH System und verfahren zur charakterisierung einer chemischen probe
WO2007012643A1 (en) 2005-07-25 2007-02-01 Metanomics Gmbh Means and methods for analyzing a sample by means of chromatography-mass spectrometry
CA2646890C (en) * 2006-03-21 2012-07-31 Metabolon, Inc. A system, method, and computer program product for analyzing spectrometry data to indentify and quantify individual components in a sample
KR100740582B1 (ko) * 2006-09-27 2007-07-19 한국과학기술연구원 가스크로마토그래피-질량분석기를 이용한 두 생체시료군 간대사체 차별성 분석 방법
US7608924B2 (en) * 2007-05-03 2009-10-27 Delphi Technologies, Inc. Liquid cooled power electronic circuit comprising stacked direct die cooled packages
JP4985153B2 (ja) * 2007-07-03 2012-07-25 株式会社島津製作所 クロマトグラフ質量分析装置
JP2011522257A (ja) 2008-05-29 2011-07-28 ウオーターズ・テクノロジーズ・コーポレイシヨン 前駆体および生成物イオンの保持時間一致を実行し、前駆体および生成物イオンスペクトルを構成する技術
US8761465B2 (en) * 2009-03-18 2014-06-24 Microsoft Corporation Centroid processing
CN102667789A (zh) * 2009-10-02 2012-09-12 梅塔博隆有限公司 用于分析复杂混合物中小分子成分的设备和相关方法
CN102478563B (zh) * 2010-11-25 2014-08-13 中国科学院大连化学物理研究所 一种用于研究转基因和非转基因水稻代谢差异的方法
CN103620401B (zh) * 2011-06-29 2017-04-12 株式会社岛津制作所 分析数据处理方法以及装置
CN108735571B (zh) * 2014-06-11 2020-07-17 英国质谱公司 二维ms/ms采集模式
CN104123451A (zh) * 2014-07-16 2014-10-29 河海大学常州校区 基于偏最小二乘回归的疏浚作业产量预测模型建立方法
CN106445772B (zh) * 2015-08-13 2020-04-24 北京恒安永通科技有限公司 一种多数据关联分析方法及系统
US11209406B2 (en) * 2016-05-02 2021-12-28 Shimadzu Corporation Data processing device
CN115436539B (zh) * 2022-09-20 2023-06-27 浙江工商大学 基于脂质组学分析方法的金枪鱼品种及部位鉴定方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4807148A (en) * 1987-05-29 1989-02-21 Hewlett-Packard Company Deconvolving chromatographic peaks
US4824446A (en) * 1988-05-23 1989-04-25 Applied Automation, Inc. Gas chromatography simulation
US5015848A (en) * 1989-10-13 1991-05-14 Southwest Sciences, Incorporated Mass spectroscopic apparatus and method
US5135549A (en) * 1991-01-30 1992-08-04 The Board Of Trustees Of Southern Illinois University Chromatographic technique and apparatus
US5175430A (en) * 1991-05-17 1992-12-29 Meridian Instruments, Inc. Time-compressed chromatography in mass spectrometry
JP2904061B2 (ja) * 1995-06-07 1999-06-14 株式会社島津製作所 液体クロマトグラフ質量分析装置
US6182016B1 (en) * 1997-08-22 2001-01-30 Jie Liang Molecular classification for property prediction
JPH11326304A (ja) * 1998-05-12 1999-11-26 Shimadzu Corp クロマトグラフ用データ処理装置
JP3683749B2 (ja) * 1999-07-14 2005-08-17 日本電子株式会社 質量分析方法
JP2002005890A (ja) * 2000-06-16 2002-01-09 Horiba Ltd 多成分混合スペクトルの解析方法
GB0016459D0 (en) * 2000-07-04 2000-08-23 Pattern Recognition Systems As Method
NL1016034C2 (nl) * 2000-08-03 2002-02-08 Tno Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen.
US6931325B2 (en) * 2001-02-07 2005-08-16 Regents Of The University Of Michigan Three dimensional protein mapping
AU2003211104B2 (en) * 2002-02-13 2009-01-29 Reify Corporation Method and apparatus for acquisition, compression, and characterization of spatiotemporal signals

Also Published As

Publication number Publication date
US20070083337A1 (en) 2007-04-12
JP4704034B2 (ja) 2011-06-15
US7418352B2 (en) 2008-08-26
WO2003102543A2 (en) 2003-12-11
JP2005528606A (ja) 2005-09-22
AU2003237306A1 (en) 2003-12-19
GB2405972B (en) 2007-08-15
GB0700810D0 (en) 2007-02-21
DE10392707B4 (de) 2012-08-16
US20050127287A1 (en) 2005-06-16
AU2003237306A8 (en) 2003-12-19
US7072773B2 (en) 2006-07-04
GB0426189D0 (en) 2004-12-29
WO2003102543A3 (en) 2004-04-29
GB2405972A (en) 2005-03-16

Similar Documents

Publication Publication Date Title
DE10392707B4 (de) Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten
DE102004015018B4 (de) Verfahren zum Identifizieren von Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
DE102014008264B4 (de) Isotopenmustererkennung
DE60126055T3 (de) Massenspektrometer und massenspektrometrisches Verfahren
DE102017111067B4 (de) Isomeren-Analyse in TIMS-Q-q-TOF Massenspektrometern
DE112004000746B4 (de) Verfahren und Vorrichtung zum Verarbeiten von LC-MS- oder LC-MS-/MS-Daten bei Stoffwechseluntersuchungen
DE112005001143B4 (de) System und Verfahren zum Gruppieren von Vorläufer- und Fragmentionen unter Verwendung von Chromatogrammen ausgewählter Ionen
DE60114245T2 (de) Verfahren und vorrichtung zur identifizierung und quantifizierung chemischer komponenten einer mischung
DE602004002856T2 (de) Dynamische signalauswahl in einem chromatographie-/massenspektometrie-/massenspektrometriesystem
DE20321731U1 (de) Massenspektrometer
EP2037262B1 (de) Erzeugung von gepulsten Stoffgemischen
DE112004001212B4 (de) Verfahren für die Analyse von Isotopensignaturen und die Massenanalyse
DE112020003212T5 (de) Verfahren und Vorrichtung für die Massenspektrometrie
DE102014118481A1 (de) Verfahren und Vorrichtung zum Analysieren einer komplexen Probe
EP3159681B1 (de) Verfahren und vorrichtung zur automatisierbaren ermittlung der bestimmungsgrenze und des relativen fehlers bei der quantifizierung der konzentration einer zu untersuchenden substanz in einer messprobe
DE602004010154T2 (de) Verfahren zur bestimmung der auswirkung eines aus mehreren komponenten bestehenden naturproduktgemischs auf das biologische profil einer krankheit in einer gruppe lebender systeme sowie entwicklung und qualitätskontrolle von medizin auf naturproduktbasis
DE102017011423B4 (de) Verfahren und Vorrichtung für lsotopenverhältnis-Massenspektrometrie
DE10393475B4 (de) Verfahren und Vorrichtung zur Identifizierung von Verbindungen in einer Probe
DE10292304B4 (de) Separation von Komponenten einer Analysenprobe in einem Ionenmobilitätsspektrometer durch Zuführung selektiv wechselwirkender gasförmiger Partikel
DE112015004216T5 (de) Techniken für die Darstellung und Verarbeitung von Massenspektraldaten
DE112004000338B4 (de) System und Verfahren zum Verarbeiten identifizierter Metaboliten
EP0993609B1 (de) Verfahren zur bestimmung der anzahl von komponenten in peaks, banden und signalen von chromatogrammen, elektrogrammen und spektrogrammen aller art
EP1682917B1 (de) Verfahren zur verifikation der korrekten räumlichen struktur von molekülen mittels nmr-spektroskopie
WO2003006152A2 (de) Verfahren und vorrichtung zum auffinden von stoffgemischen für substanzbibliotheken

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: WATERS TECHNOLOGIES CORP. (N.D.GES.D. STAATES , US

8128 New person/name/address of the agent

Representative=s name: DR. VOLKER VOSSIUS, CORINNA VOSSIUS, TILMAN VOSSIU

8110 Request for examination paragraph 44
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20121117

R082 Change of representative

Representative=s name: CORINNA VOSSIUS IP GROUP, DE

Representative=s name: WINKLER IP, DE

R082 Change of representative

Representative=s name: WINKLER IP, DE

R082 Change of representative

Representative=s name: FORRESTERS SKYGARDEN, DE

Representative=s name: FORRESTERS IP LLP, DE

Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE

Representative=s name: WINKLER IP, DE

R082 Change of representative

Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE

Representative=s name: FORRESTERS SKYGARDEN, DE

Representative=s name: FORRESTERS IP LLP, DE

Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE

R082 Change of representative

Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE

Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE

R082 Change of representative

Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE

R071 Expiry of right