DE10392707T5 - Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten - Google Patents
Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten Download PDFInfo
- Publication number
- DE10392707T5 DE10392707T5 DE10392707T DE10392707T DE10392707T5 DE 10392707 T5 DE10392707 T5 DE 10392707T5 DE 10392707 T DE10392707 T DE 10392707T DE 10392707 T DE10392707 T DE 10392707T DE 10392707 T5 DE10392707 T5 DE 10392707T5
- Authority
- DE
- Germany
- Prior art keywords
- bin
- data
- analysis
- parameter
- data points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
(a) Sammeln von Daten für die Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter mit der Zeit korreliert ist,
(b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe auf der Basis eines Zeitparameters ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen durch die Verwendung von zwei der verbleibenden Parameter gekennzeichnet sind,
(c) Transformieren jedes Bin-Datensatzes in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem zweiten Nullparameter zu dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze dieselbe Anzahl von Datenpunkten aufweisen und für jeden ersten Parameter in dem ausgerichteten Datensatz wenigstens ein Bin-Datensatz einen zweiten Parameter ungleich Null aufweist,
(d) Ausbilden eines zweidimensionalen Arrays, indem die ausgerichteten Bin-Datensätze mit dem ersten Parameter auf...
Description
- Verwandte Anmeldungen
- Diese Anmeldung nimmt die Priorität der US Provisional Application Nr.
60/384 712 - Gebiet der Erfindung
- Die Erfindung betrifft ein Verfahren zur Analyse mehrdimensionaler Daten mittels eines Analyseverfahrens, das durch Anwendung von Datenbinning auf die Daten auf weniger Dimensionen angewendet werden kann. Insbesondere betrifft die Erfindung ein Verfahren zur Analyse von Chromatographie-/Spektrometriedaten unter Verwendung von Datenbinning. Die Erfindung findet insbesondere Anwendung bei Verfahren zur Durchführung der Flüssigkeitschromatographie/Massenspektrometrie-Datenanalyse (LC/MS) [liquid chromatography/mass spectrometry (LC/MS) data analysis] unter Verwendung von Datenbinning in Verbindung mit der Hauptkomponentenanalyse (principal component analysis; PCA).
- Hintergrund der Erfindung
- Der Begriff Metabonomics bezeichnet ein rasch wachsendes Gebiet naturwissenschaftlicher Forschung. Es handelt sich dabei um einen Systemansatz, um metabolische Profile in vivo zu untersuchen, der Informationen über bestimmte Krankheiten, Toxiziditäten und Genfunktionen bereitstellen kann. Auf dem Gebiet Metabonomics wird die Auswirkung eines pharmazeutischen Kandidatens auf ein gesamtes Tier oder einen Organismus untersucht, indem Veränderungen des Metabolismus bzw. Stoffwechsels über einen Zeitraum nach der Verabreichung einer Verbindung untersucht werden. Die in diesen Untersuchungen generierten analytischen Daten werden mittels multivariabler mathematischer Techniken, wie beispielsweise der Hauptkomponentenanalyse (principal component analysis; PCA) untersucht. Dieses mathematische Verfahren wird verwendet, um sowohl geringfügige als auch größere Unterschiede in den untersuchten Proben zu verdeutlichen.
- Bis zum heutigen Tag haben die meisten Arbeiten auf diesem Gebiet die magnetische Proton-Kernresonanz (proton-nuclear magnetic resonance; NMR) als Analyseverfahren verwen det. Obwohl das NMR-Verfahren sehr effektiv ist, weist dieses mehrere Nachteile auf, und zwar eine schlechte Empfindlichkeit, eine zeitaufwendige Analyse und die Nicht-Detektion einiger chemischer Klassen, wie z. B. der Sulfate. Ein weiterer Nachteil des NMR-Verfahrens besteht darin, dass, da alle Signale in einem Spektrum enthalten sind, es für eine große Verbindung einfach ist, geringfügige jedoch wichtige Änderungen eines Analyten mit geringer Konzentration zu verdecken. Ferner entfernt die notwendige Entfernung von mit Xenobiotika in Verbindung stehenden Verbindungen aus dem NMR-Spektrum ebenso die Signale von interessanten endogenen Verbindungen, wodurch der Datensatz, der für die anschließende PCA-Analyse verwendet wird, reduziert wird.
- Die Chromatographie, sowohl mit gasförmigen Phasen als auch mit flüssigen Phasen, hat sich in Kombination mit spektrometrischer Analyse, wie beispielsweise der Ultraviolett-Spektroskopie, der Infrarot-Spektroskopie, der magnetischen Kernresonanzspektroskopie oder der Massenspektrometrie, in den letzten Jahren als nützliche Technik erwiesen. Die Elektrospray-Massenspektrometrie in Kombination mit Flüssigkeitschromatographie (LC/MS) ist in der Bioanalyse, sowohl quantitativ als auch qualitativ, die beliebteste Analysetechnik. Die Technik ist robust, empfindlich und selektiv, wobei ohne weiteres Empfindlichkeiten bis in den pg/mL Bereich erreicht werden. Die Verwendung kurzer Säulen und rascher Gradienten hat es ferner ermöglicht, dass LC/MS-Verfahren analytische Zykluszeiten im Bereich von einer Probe pro Minute mit guter chromatographischer Auflösung und Empfindlichkeit erreichen können. Somit ist die Anwendung von LC/MS-Verfahren auf dem Gebiet Metabonomics ein logischer Schritt. Während das Massenspektrometer sowohl eine hochempfindliche Quantifizierung als auch strukturelle Informationen bereitstellt, behandelt der Chromatographieschritt die Frage überlappender Signale, indem ein Analyt mit einer gegebenen Zeitauflösung abgetrennt wird. Die Verwendung von LC/MS-Verfahren wird gegenüber einer Massenspektrometrieinfusion bevorzugt, da der Chromatographieschritt die Ionenunterdrückung vermindert, indem die Anzahl der miteinander konkurrierenden Ionen vermindert wird, die zu einer gegebenen Zeit in das Massenspektrometer eintreten. Ein weiterer Vorteil des LC/MS-Verfahrens gegenüber dem NMR-Verfahren ergibt sich bei der Datenanalyse. Wenn mit Xenobiotika in Verbindung stehendes Material entfernt wird, dann wird lediglich eine schmale Zeitscheibe bei einer oder zwei bestimmten Massen aus dem Datensatz entfernt. Daher verbleiben die übrigen LC/MS-Daten ungeändert und stehen für eine mathematischen Analyse, beispielsweise mittels PCA, zur Verfügung.
- Die Hauptkomponentenanalyse ist ein sehr effektives mathematisches Verfahren, um die mittels MS erhaltenen Daten zu analysieren. Die PCA ist jedoch eine zweidimensionale Technik, wohingegen die aus einem LC/MS-Experiment erhaltenen Daten dreidimensional sind. Es besteht somit zur Zeit ein Bedarf, es der PCA zu ermöglichen, die chromatographische Trenninformation beizubehalten, die normalerweise bei der herkömmlichen PCA-Analyse verloren geht.
- Im allgemeinen gibt es zahlreiche experimentelle Bedingungen, bei denen die Information über die Ergebnisse in Daten enthalten ist, die durch zahlreiche Parameter gekennzeichnet sind. Wenn das Analysewerkzeug diese Parameter nicht verarbeiten kann, dann geht Information verloren. Ein Verfahren, dass die Auflösung der Analyse von LC/MS-Daten verbessert, die mittels des PCA-Verfahrens analysiert werden, kann auf andere Datensätze angewandt werden.
- Zusammenfassung der Erfindung
- Die Erfindung betrifft ein Analyseverfahren mehrdimensionaler Daten unter Verwendung eines Tools, das weniger Dimensionen verarbeitet. In einer besonderen Ausführungsform betrifft die Erfindung ein Verfahren zur Analyse von dreidimensionalen Daten, die mittels eines Chromatographie/Spektrometrie-Experiments gewonnen werden, wie beispielsweise ein LC/MS-Experiment unter Verwendung einer zweidimensionalen multivariablen statistischen Analysetechnik, wie beispielsweise der PCA. Üblicherweise wird eine PCA-Analyse unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Gemäß der vorliegenden Erfindung wird die Analyse unter Verwendung dreidimensionaler Daten durchgeführt.
- Daten, die mittels einer Chromatographievorrichtung gewonnen werden, werden durch eine Anzahl von Parametern gekennzeichnet. Insbesondere trennt die Chromatographie die Probe als eine Funktion der Zeit. Die Retentionszeit, d.h. die Zeitdauer, die eine Komponente der Probe auf der festen Phase zurückgehalten wird, ist besonders informativ. Unterschiedliche Komponenten der Probe werden aus der festen Phase je nach den Bedingungen zu unterschiedlichen Zeiten eluiert. Diese zeitabhängige Eigenschaft ist dazu nützlich, bestimmte Komponenten der Probe zu unterscheiden.
- Weitere Parameter können von der nach der Chromatographietrennung verwendeten Detektionsmethode abhängen. Bei der Fluoreszenzdetektion zum Beispiel sind die interessierenden Parameter die Lichtwellenlänge und die Lichtintensität, während bei der Ultraviolettdetektion die Menge des absorbierten Lichts ein interessierender Parameter ist. In vielen Fällen ist das Ergebnis um so aussagekräftiger, je größer die Anzahl der von dem Analyseverfahren verarbeitbaren Parameter ist. Wenn ein Parameter vollständig ignoriert werden muss, dann geht die Möglichkeit verloren, Datenpunkte, die sich lediglich bezüglich dieses Parameters unterscheiden, auseinander zu halten.
- Daten, die mittels eines LC/MS-Experiments erhalten werden, bestehen aus drei Parametern. Der erste dieser Parameter hängt von dem LC-Abschnitt des Systems ab. Die Flüssigkeitschromatographie trennt Analyten als Funktion der Zeit. Daher sind die von dem LG-Abschnitt gewonnen Daten zeitbasiert, d. h. Retentionszeit (Rt). Unterschiedliche Analyten werden aus der festen Phase des LC-Systems (der Säule) je nach dem Eluenten und dergleichen zu unterschiedlichen Zeiten eluiert. Diese differentielle Trennung ermöglicht ein Rt, das für jeden Analyten charakteristisch ist. Diese Information kann bei der Bestimmung beispielsweise der Identität eines bestimmten Analyten nützlich sein.
- Der zweite und der dritte Parameter hängen von dem MS-Abschnitt des LC/MS-Systems ab. Sobald eine Probe mittels LC getrennt worden ist, werden individuelle Analyten in den MS-Abschnitt des Systems eingebracht. Je nach den Bedingungen der MS, wird der Analyt innerhalb eines gegebenen Volumens ionisiert und sodann auf einen molekularen Massendetektor beschleunigt. Das Masse-Ladungs-Verhältnis (mass-to-charge ration; m/z) und die Intensität können nach der Massendetektion bestimmt werden. Diese Information wird verwendet, um Unterschiede zwischen zwei oder mehr Proben zu bestimmen.
- Üblicherweise wird die PCA-Analyse verwendet, um diese Bestimmung lediglich unter Verwendung der m/z- und der Intensitätsparameter durchzuführen. Somit tragen die Rt-Daten nicht zu der Gesamtanalyse bei. Dieser Kompromiss wird aufgrund der großen Anzahl von Daten in Kauf genommen, die mit ungefähr 5 bis 10 AMU-Punkten pro Ionenpeak von dem Massenspektrometer geliefert werden. Die vorliegende Erfindung beseitigt diesen Nachteil durch die Verwendung von Datenbinning. Mit Datenbinning geht die Rt-Information in der PCA-Analyse nicht verloren, wodurch die dreidimensionale Datenanalyse erleichtert wird. Der Vergleich zwischen Proben enthält nun Rt-, m/z- und Intensitätsdaten. Diese Technik ist insbesondere dabei nützlich, die Ergebnisse einer komplexen Probe zu untersuchen, wo die Antwort auf eine einfache Frage in Unmengen von komplexen Daten gefunden werden muss. Somit können geringfügige Änderungen zwischen Proben, die bisher nicht detektiert werden konnten, nunmehr herausgefunden werden.
- In einer Ausführungsform werden individuelle LC/MS-Chromatogramme in vorbestimmte Fraktionen (oder Bins) getrennt. Diese Bins spiegeln den Rt-Parameter wieder. Die Größe des Bins wird vom Benutzer bestimmt. Beispielsweise kann die Bingröße eine Minute betragen, was Intervallen von einer Minute entlang des Chromatogramms entspricht. Innerhalb jedes Bins werden die Intensitätsinformationen für alle Scans, die während der Binzeit durchgeführt worden sind, für jede Sorte (m/z) summiert, die während des entsprechenden Rt vorhanden ist. Der Bin oder genauer die darin enthaltenen Daten werden sodann transformiert und an eine Datenmatrix, wie beispielsweise eine herkömmliche Tabellenkalkulation, wie beispielsweise Excel, exportiert. Somit werden die ursprünglich graphischen Daten in eine tabellarische Form der Daten transformiert. Die Informationen innerhalb jedes Bins, der transformiert wird, betreffen die chromatographische Zeit, m/z und die Intensität. Mehr als ein Bin kann dieser Transformation unterzogen werden. Beispielsweise können sechzig Bins vorhanden sein, die für einen sechzigminütigen LC-Lauf einen Bin pro Minute darstellen. Alternativ können Bins auf eine überlappende Art und Weise angeordnet sein, so dass beispielsweise neunzig einminütige Bins, die einmal alle 40 Sekunden entstehen, verwendet werden, um eine sechzigminütige LC-Prozedur zu analysieren. Sobald die Transformation vollständig durchgeführt worden ist, werden die Datensätze (Daten innerhalb der Tabelle) mit Nullen ausgerichtet bzw. aufgefüllt. Die Ausrichtung der Datensätze meint lediglich eine Lückenfüllprozedur. Wenn beispielsweise in Bin 3 bei m/z = 100 ein Intensitätswert von 102 und in Bin 4 bei m/z = 100 kein Intensitätswert vorhanden ist, dann wird in Bin 4 bei der Intensitätsposition, die m/z = 100 entspricht, eine Null angeordnet. Mit anderen Worten: die Null dient als Platzhalter, um somit eine korrekte Ausrichtung der Daten zu ermöglichen. Somit weist jeder Datensatz einen Intensitätswert (einschließlich einer Null) für jedes m/z auf. Zusätzlich kann die Isotopenhäufigkeit kombiniert werden, indem beispielsweise Werte für C12 und dessen Isotop C13 kombiniert werden. Schließlich werden die Tabellenkalkulationsdateien an ein herkömmliches PCA-System für eine PCA-Analyse übertragen, wie beispielsweise MatLab.
- Kurze Beschreibung der Zeichnungen
-
1 zeigt eine schematisch Darstellung der in einer Ausführungsform der vorliegenden Erfindung enthalten Schritte. -
2 zeigt einen Vergleich von LC/MS-Chromatogrammen (BPI mit negativen Ionen) für Kontroll- und Dosierungsratten. -
3 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung A verabreicht worden ist. -
4 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung B verabreicht worden ist. -
5 zeigt einen Vergleich von LC/MS-Urinchromatogrammen (BPI mit negativen Ionen) von Ratten, denen zum Zeitpunkt 1 und zum Zeitpunkt 2 die Verbindung C verabreicht worden ist. -
6(a) zeigt ein extrahiertes Ionen-Chromatogramm und6(b) zeigt ein MS-Spektrum für Peaks 338 m/z. -
7 zeigt einen PCA-Plot eines gesamten Datensatzes, der aus den Rattenurinproben 1 bis 24 besteht. -
8(a) zeigt ein kombiniertes und ein überlagertes Massenspektrum und8(b) zeigt einen PCA-Plot der Fraktion von 5 Minuten bis 6 Minuten. -
9(a) zeigt ein kombiniertes und ein überlagertes Massenspektrum und8(b) zeigt einen PCA-Plot der Fraktion von 3 Minuten bis 4 Minuten. - Detaillierte Beschreibung
- Die Erfindung betrifft ein Verfahren zur Analyse mehrdimensionaler Daten unter Verwendung eines Tools, das weniger Dimensionen verarbeitet. Diese Erfindung findet insbesondere Anwendung bei der Analyse von Daten, die mittels eines Chromatographievorgangs gewonnen werden, dem ein spektrometrischer Vorgang folgt wird. Der Datensatz weist in diesen Fällen sowohl eine Zeitkomponente als auch typischerweise einen Intensitätswert einer physikalischen oder chemischen Eigenschaft der Probe auf. In einer besonderen Ausführungsform betrifft die Erfindung ein Verfahren zur Analyse von Daten, die mittels einer Flüssigkeitschromatographie-/Massenspektrometrie-Prozedur (LC/MS) unter Verwendung der Hauptkomponentenanalyse (PCA) gewonnen werden. Üblicherweise wird die PCA-Analyse unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Gemäß der vorliegenden Erfindung wir die Analyse unter Verwendung dreidimensionaler Daten durchgeführt. Die detaillierte Beschreibung der LC/MS- und der PCA-Analyse illustrieren die Vorgehensweise sowohl beim allgemeinen Fall als auch bei dieser besonderen Ausführungsform.
- Der Chromatographieabschnitt des Systems erlaubt die Trennung von Analyten innerhalb einer Probenmatrix. Die Information, die mittels einer solchen Prozedur erhalten wird, wird üblicherweise als Retentionszeit (Rt) ausgegeben. Wenn sich die Analyten durch das System vorwärts bewegen, dann treten diese in den MS-Bereich des LC/MS-Systems ein. Dort werden diese ionisiert und ein Massendetektor erfasst sodann diese ionisierten Spezien, wodurch m/z- und Intensitätsinformation bereitgestellt wird. Daher kann ein LC/MS-System wenigstens drei Arten von Information bereitstellen. Obgleich zahlreiche multivariable statistische Analysetechniken verwendet werden können, handelt es sich bei der Hauptkomponentenanalyse (principal component analysis; PCA) um ein robustes Verfahren zur Analyse von Daten, und diese ist ferner recht nützlich, wenn Vergleiche zwischen verschiedenen Proben angestellt werden. Die PCA-Analyse wird üblicherweise jedoch unter Verwendung lediglich eines zweidimensionalen Datensatzes durchgeführt. Daher ist zu erwarten, dass wenigstens ein Datenparameter, der mittels eines LC/MS-Experiments gewonnen wird, verloren geht. Gemäß der vorliegenden Erfindung wird die Analyse unter Verwendung dreidimensionaler Datensätze zusammen mit der PCA-Analyse durchgeführt.
- Die Chromatographie und insbesondere die Flüssigkeitschromatographie (liquid chromatography; LC) sind ein herkömmlicherweise verwendetes Verfahren, um Analyten in einer Probenmatrix zu trennen. Für gasförmige Proben liefert die Gaschromatographie (GC) vergleichbare Daten. Die Hochleistungsflüssigkeitschromatographie (high performance liquid chromatography; HPLC) erlaubt die rasche und effiziente Trennung und Charakterisierung von Analyten innerhalb einer gegebenen Probe. Die Komponenten eines HPLC-Systems umfassen Hockdruckpumpen, die die Bewegung einer wässrigen und/oder einer organischen Phase durch das System erleichtern. Diese wässrige Phase (oder mobile Phase) umfasst ein Lösungsmittel, das verwendet wird, um anfänglich das HPLC-System abzugleichen. Das Lösungsmittel stellt ferner ein wässriges Milieu für die Analyten bereit, um sich durch das gesamte HPLC-System zu bewegen. Schließlich umfasst die mobile Phase Lösungsmittel, das Analyten aus einer HPLC-Säule eluiert.
- Eine weitere Komponente eines HPLC-Systems ist die chromatographische Trennsäule. Die Säule umfasst eine feste Phase. Die feste Phase bewirkt zusammen mit der mobilen Phase eine differentielle Trennung von Analyten, die innerhalb einer Probenmatrix enthalten sind. Die feste Phase besteht im Allgemeinen aus chemischen Polymeren, die mit einer bestimmten Klasse von Analyten wechselwirken. Beispielsweise weist eine Umkehr-Phase-HPLC-Säule (reverse phase HPLC column) eine Festphasenchemie auf (z. B. eine Kohlenwasserstoffkette, die aus achtzehn Kohlenstoffatomen besteht, die an ein Silicakügelchen angebracht ist), die mit Analyten mittels hydrophober Kräfte in Wechselwirkung tritt.
- Sobald die Analyten aus der Säule eluiert sind, treten diese in einen Detektor ein und durch diesen durch. Es gibt eine Vielzahl von Detektionssystemen, die in einem HPLC-System verwendet werden können. Beispielsweise gibt es Ultraviolett("UV")-Detektoren, die Analyten innerhalb des UV-Bereichs detektieren, Infrarot(IR)-Detektoren, die Analyten innerhalb des IR-Bereichs detektieren, elektrochemische Detektoren, die Analyten unter Verwendung voltametrischer Techniken detektieren, Kernspinresonanzdetektoren (nuclear magnetic resonance detectors), die Analyten auf der Basis von deren Antwort auf ein magnetisches Feld detektieren, sowie Massenspektrometerdetektoren, die Analyten auf der Basis des Masse-zu-Ladungs-Verhältnis detektieren.
- In einem LC/MS-System wird die Probenmatrix zunächst einer LC-Trennung unterzogen, um somit die Trennung von Analyten in der Probe zu bewirken. Diese Information, die oftmals in dem Rt eines Analyten enthalten ist, kann dazu verwendet werden, den Analyten zu charakterisieren und zu identifizieren. Weitere Informationen können jedoch insbesondere für Vergleiche gewonnen werden, die zwischen verschiedenen Proben gemacht werden, indem die Analyten einer MS-Detektion unterzogen werden. Im Allgemeinen ionisieren Massenspektrometer Moleküle innerhalb eines gegebenen Volumens und beschleunigen die ionisierten Moleküle sodann in Richtung eines molekularen Massendetektors. Die Ionisierung eines Moleküls kann mittels Elektronenionisierung, chemischer Ionisierung, Elektrosprayionisierung (electrospray ionization) oder Photoionisation erreicht werden. Der Ionisierungsprozess kann unter zahlreichen Druckbedingungen einschließlich Atmosphärendruck stattfinden. Informationen, die mittels MS gewonnen werden, umfassen die Intensität der Antwort für einen bestimmten m/z-Wert. Es ist diese Intensitätsinformation (als auch die m/z-Information), die beim Vergleich von zwei oder mehr Proben wichtig ist.
- Die MS-Information kann für eine vergleichende Analyse genutzt werden. Nimmt man beispielsweise an, dass man mit einer humanen Zelllinie experimentiert. Das Ziel der Untersuchung besteht darin, zu bestimmen, ob und wenn ja welchen Einfluss die Verbindung X auf einen bestimmten Metaboliten hat. Um fortzufahren, nehme an, dass der Benutzer zwei Proben erhalten hat, und zwar Probe 1, eine Kontrollprobe, d. h. ein Zellenextrakt aus einer Zellenkultur, zu der die Verbindung X nicht hinzugegeben worden ist, sowie Probe 2, ein Zellenextrakt, der einem Zellkultursystem entnommen worden ist, zu dem die Verbindung X hinzugegeben worden ist. Diese zwei Proben können einer LC/MS unterzogen werden. Lasst uns weiter annehmen, dass der uns interessierende Metabolit für eine chromatographische Isolierung unter Verwendung einer Umkehr-Phase-Säule geeignet ist. Sobald die Proben mittels LC getrennt worden sind, können die Probe 1 und die Probe 2 unabhängig voneinander einer MS-Analyse unterzogen werden. Die MS-Signale, die mittels der zwei Proben erzeugt werden, können sodann verglichen werden, insbesondere für den interessierenden Metaboliten, um zu bestimmen, ob dessen Intensität mit der Hinzufügung der Verbindung X ansteigt, absinkt oder nicht beeinflusst wird.
-
1 zeigt ein Fließdiagram, das die verschiedenen Schritte der Erfindung zeigt, wie diese auf ein LC/MS-Experiment angewendet wird.1a zeigt in einer graphischen Darstellung Daten, die mittels einer LC/MS-Prozedur einer gedachten Probe gewonnen worden sind. Wie dargestellt, definiert der Graph drei Parameter. Die x-Achse definiert den m/z-Parameter. Die x-Achse kann sich beispielsweise in Schritten von 0,1 m/z von 100 bis 800 m/z erstrecken. Die y-Achse von1a repräsentiert den Intensitäts- oder Antwortparameter. Die Intensität kann als ein Prozentsatz eines bestimmten Ions, z. B. der Grundpeak, gesetzt werden. Schließlich gibt es eine z-Achse, die den Zeitparameter darstellt. In1a sind Ionensorten dargestellt, die sich wenigstens in einem der drei Parameter unterscheiden. Jede Ionensorte ist jedoch eindeutig durch die Parameter in1a definiert. - Bestehende PCA-Analysen erfordern, dass die in
1a dargestellten Daten vor der Analyse in einen zweidimensionalen Datensatz umgewandelt werden. Beispielsweise kann die herkömmliche PCA-Analyse unter Verwendung des m/z-Parameters und des Intensitätsparameters durchgeführt werden. Dies würde jedoch den Zeitparameter eliminieren. Eine gründlichere Analyse würde alle relevanten Informationen enthalten, die erhältlich sind, einschließlich der Zeitdimension.1b zeigt einen Prozess, mit dem alle drei Parameter erhalten und einer Analyse unterzogen werden können. Das "Binnen" von Daten bzw. das Datenbinning ist ein Prozess zum Trennen eines Datensatzes, der mehrere Messpunkte darstellt, in mehrere Datensätze, die Messpunkte zusammenfassen. Ein "Bin" entspricht einem Bereich eines Parameters, d. h. dem Bin-Parameter. Die Änderung des Bin-Parameters innerhalb jedes Bins wird eliminiert, indem alle Datenpunkte innerhalb des Bins bei dem Bin-Wert zusammengefasst werden. Ein Bin, der den gesamten Datensatz umfasst, hat denselben Effekt, wie ein Ignorieren des Bin-Parameters. Obgleich üblicherweise nicht überlappende Bins verwendet werden, können überlappende Bins für bestimmte Analysen verwendet werden. Beim Übergang von1a zu1b findet ein Prozess des Datenbinnings statt, wobei eine vorbestimmte Bin-Größe ausgewählt ist. Die Bin-Größe ist eine Funktion der Zeitdimension. Die Bin-Größe kann beispielsweise zwei Minuten betragen. Mehrere Bins sind in1 b dargestellt. Jeder Bin enthält sowohl m/z-Information als auch Intensitäts-Information für Ionensorten, die in allen Scans gefunden worden sind, die in diesen Bin fallen. Die Bin-Größen (oder Bereichsgrößen) werden von einem Praktiker auf der Basis seiner Erfahrung und der untersuchten Probe ausgewählt. Auswahlverfahren sind dem Fachmann wohlbekannt. Beispielsweise kann die MassLynx-Software verwendet werden. - Bei Verwendung dieser Software wird ein Bin folgendermaßen erzeugt: (1) Öffnen des gesamten Ionenchromatogramms, (2) Auswählen eines Bin-Bereichs, indem dieser mit der Maus angeklickt wird und über die Bin-Fläche gezogen wird, so dass ein kombiniertes Massenspektrum erscheint (der Bin), (3) in dem Fenster des kombinierten Massenspektrum (Bin) erscheint eine "List Spectrum" Option und diese wird aktiviert, (4) wenn die "List Spectrum"-Option ausgewählt wird, dann zeigt ein Fenster m/z mit den entsprechenden Häufigkeiten in einem Zweispaltenformat an, (5) Kopieren der in den zwei Spalten enthaltenen Daten und (6) Einfügen in eine Tabellenkalkulation wie beispielsweise Excel.
- Nach dem Prozess des Datenbinnings erfolgt ein Transformationsschritt (siehe
1 b und1c ). Die Transformation konvertiert die separaten Listen, die mittels des graphischen Datenformats abgeleitet worden sind, in eine Datenmatrixdarstellung. Der Benutzer kann diese Transformation einfach einleiten, indem er lediglich eine "Cut & Paste"-Prozedur verwendet, wodurch die zweispaltige Datensatzinformation einer herkömmlichen Tabellenkalkulation wie beispielsweise Excel übergeben wird. Sobald dieser Teil der Transformation abgeschlossen ist, muss der Datensatz mit Nullen ausgerichtet bzw. aufgefüllt werden. Jeder Bin muss einen Wert für alle zu analysierenden Ionen aufweisen. Um die Genauigkeit der Analyse sicher zu stellen, werden Nullen als Intensitätswerte eingesetzt, wo kein Ionensignal für diesen Bin beobachtet worden ist, wodurch bewirkt wird, dass jeder Datensatz einen Intensitätswert für jeden m/z-Parameter aufweist. Sodann können die m/z-Parameter Spalten in eine Spalte zusammengefasst werden, die als eine Achse der Matrix wirkt. Alternativ kann ein Softwareprogramm verwendet werden, um diese Transformation zu automatisieren. Eine Darstellung der tabellarischen Darstellung ist in1 c dargestellt. In1 c sind eine m/z-Spalte und eine Bin-Reihe gezeigt. Die m/z-Spalte enthält die zu analysierenden m/z-Ionen. Die Bin-Reihe enthält die gewünschten zu analysierenden Bins. Der Matrix-Schnittpunkt enthält Intensitätswerte, die dem entsprechenden m/z-Parameter und Bin-Parameter entsprechen. Weitere Datenverarbeitung auf der Basis von bekannten Transformationen in m/z und Intensität, die durch den Test verursacht werden, können durch den Benutzer durchgeführt werden, bevor die Daten einer Analyse unterzogen werden. Beispielsweise kann die Isotopenhäufigkeit kombiniert werden, so dass die Werte für beispielsweise C12 und dessen Isotop C13 kombiniert werden. - Die Matrix oder die Tabellenkalkulation wird sodann zu einem herkömmlichen PCA-Programm übertragen und von diesem verarbeitet, wodurch Vergleiche zwischen verschiedenen Proben durchgeführt werden können. Ein derartiges herkömmliches PCA-Programm heißt MatLab, das von der Firma MathWorks, Natick, MA vertrieben wird. Ein weiteres PCA-Pro gramm mit dem Namen Pirouette kann von der Firma InfoMetrix, Woodinville, WA erhalten werden.
- Indem einige der dem Massenspektrometer inhärenten hochauflösenden Daten verschmiert werden, indem die Daten, die von mehreren Scans stammen, mittels Binnen kombiniert werden, kann die zweidimensionale Analyse die resultierenden dreidimensionale Daten bearbeiten. Dies erlaubt, dass der Großteil der Daten dort analysiert werden kann, wo ein Wechsel zwischen Sorten erwartet wird, jedoch der Ort des Wechsels in den verschiedenen Scans nicht bekannt ist. Nachdem der Ort der Variation bekannt ist, kann eine anschließende Analyse die den Rohdaten inhärente hohe Auflösung verwenden, um die Unterschiede weiter zu charakterisieren. Die Binning-Technik kann angewendet werden, um die Datensätze an zahlreiche Typen von multivariablen statistischen Analysen anzupassen.
- Beispiel
- Rattenurinproben:
Insgesamt 20 Rattenproben sind in diesem Experiment verwendet worden. Die Ratten wurden in vier (4) Gruppen unterteilt. Die Gruppe I erhielt lediglich die Dosierungsmatrix und die Gruppen II, III und IV sind oral mit den Verbindungen A, B bzw. C dosiert worden. Proben von Rattenurin sind zu zwei Zeitpunkten, 0–8 und 8–24 Stunden nach der Dosierung, gesammelt worden. Der Rattenurin wurde vor der Analyse bei –20° C gefroren aufbewahrt. - Chromatographie:
Die Chromatographie wurde unter Verwendung eines Waters Alliance 2795 HT Systems durchgeführt, das mit einem Säulenofen und einem Waters 2996 PDA Detektor ausgestattet ist. Eine Injektion von Rattenurin (mit 1 : 4 destilliertem Wasser verdünnt) mit 20 μL/min wurde auf eine Säule aufgegeben (10 cm × 2.1 mm Waters Symmetry C18 3.5 μm). Die Säule ist bei 40°C gehalten worden und unter Gradientenbedinungen bei einer Flussrate von 600 μL/min eluiert werden, wobei der Eluent "A" 0.1 % wässrige Ameisensäure war und der Eluent "B" Acetonitril war. Die Säule wurde für eine Minute bei 100% A gehalten und sodann wurde die mobile Phase während der folgenden sieben Minuten rasch auf 30% B erhöht. Die mobile Phase wurde sodann während 0.1 Minuten rasch auf 95% B gesteigert. Diese mobile Phase wurde für 0.5 Minuten gehalten, um die Säule zu waschen, und sodann während der folgenden 0.1 Minuten auf die Anfangsbedingungen zurückgeführt. Die nächste Einspritzung wurde 10 Minuten nach der ersten Einspritzung gemacht. - Massenspektrometrie:
Die massenspektrometrische Anaylse wurde auf der Vorrichtung "Quattro Micro" der Firma "MicroMass" durchgeführt, die mit einem Elektrospray-Interface ("ESI") ausgestattet war. Das Instrument wurde in einem negativen Ionenmodus mit einer Kapillarspannung von 3 kV betrieben, wobei die Kegelspannung auf 25 Volt eingestellt war, das Zerstäubungsgas bei 600 L/Stunde mit einer Desolvatisierungstemperatur von 150°C eingestellt war und die Quellentemperatur 70°C betragen hat. Der Säulenabfluss wurde in einem Verhältnis von 5 : 1 geteilt, so dass 100 μL/min in die Massenspektrometerquelle eingetreten sind. Das Instrument ist im vollständigen Scanmodus (full scan mode) betrieben worden, wobei von 100 bis 800 m/z mit einer Scanzeit von 200 Millisekunden und einer Verzögerung zwischen Scans von 50 Millisekunden gescannt worden ist. Daten wurden in dem Zeitraum von 0 bis 10 Minuten erfasst. Der anfängliche Abschnitt des Chromatogramms ist nicht dem Abfall zugeführt worden. - Datenanalyse:
Die LC/MS-Chromatogramme wurden bezüglich des Vorhandenseins irgendwelcher medikament-zugehöriger Produkte, wie beispielsweise Metaboliten der Phase I und der Phase II, untersucht. Jedes einzelne LC/MS-Chromatogramm wurde sodann in 10 Fraktionen zu je 100 Scans geteilt. Das MS-Signal ist für jede einzelne Chromatogrammfraktion zu 100 Scans kombiniert worden. Die Peakliste und die Ionenhäufigkeiten wurden sodann in eine Exceldatei exportiert. Die Datensätze sind sodann aufgefüllt bzw. ausgerichtet worden, wobei Nullen dort als Intensitätswerte eingesetzt worden sind, wo kein Ionensignal erfasst worden ist, so dass jeder Datensatz für jeden ganzzahligen m/z-Wert zwischen 100 und 800 einen Intensitätswert aufwies. Die Exceldateien wurden sodann zu der MatLab Software für eine PCA-Analyse übertragen. - Diskussion:
Rattenurin enthält möglicherweise mehrere Tausend Komponenten, von denen die meisten noch unbekannt sind. Die große Mehrzahl dieser Komponenten weisen eine mittlere oder große Polarität auf, und somit war es lediglich notwendig, einen Gradienten von 0–30% organischer Anteil zu verwenden, um eine vollständige Elution aller Komponenten in den Urinproben zu bewirken. ESI MS mit negativen Ionen wurde als MS-Detektionsmodus gewählt, da dieser einen Datensatz lieferte, der reicher an Information war, als ESI mit positiven Ionen. Die Länge der Chromatographiesäule, die Gradientenzeit und die Abflussrate, die in dieser Untersuchung verwendet worden sind, sind so gewählt worden, die beste Balance zwischen Probendurchsatz und chromatographischer Auflösung zu liefern. Ein Probendurchsatz von 6 Proben pro Stunde und eine Peakkapazität (peak capacity) von 78 ist er reicht worden. Obgleich diese Peakkapazität nicht sonderlich groß ist, stellt die Verwendung eines massenspektrometrischen Scannens von 100 bis 800 m/z einer weitaus größere effektive Peakkapazität bereit. In dieser Untersuchung ist ein einfaches Umkehr-Phasen-Chromatographiesystem verwendet worden. Man erkennt, dass zahlreiche hochgradig polare Verbindungen, wie beispielsweise Aminosäuren oder Zucker, nicht zurückgehalten werden. Eine Modifizierung des Systems ermöglicht eine Untersuchung dieser Verbindungen. - Ein vorläufiger Vergleich der Grundpeakintensitätschromatogramme (base peak intensity chromatograms; BPI chromatograms) des Kontrollrattenurins und der Urinproben von den dosierten Tieren zum Zeitpunkt 1 offenbart einen qualitativen Unterschied (siehe
2 ). Wie sich diesen Chromatogrammen entnehmen lässt, gibt es mehrere Peaks in den Chromatogrammen der dosierten Probengruppe, die erhöhte Niveaus im Vergleich zu denen in der Kontrollgruppe zeigen. Diese Peaks eluieren in dem Zeitbereich zwischen 5 und 9 Minuten des Chromatogramms. Eine gründliche Untersuchung dieser Peaks hat bestätigt, dass es sich bei keinem von diesen um einen Metaboliten gehandelt hat, der von den dosierten Verbindungen stammte. Daher müssen diese Peaks eine Folge eines Wechsels des metabolischen Zustands der Tiere sein. - Die BPI-Chromatogramme, die von den Proben zum Zeitpunkt 2 für Verbindung "A" erhalten worden, zeigen einige geringfügige Änderungen in einigen Peakintensitäten, wenn diese mit den Proben von Zeitpunkt 1 verglichen werden (siehe
3 ). Bei der Probe zu Zeitpunkt 2 scheinen die Analyten, die zwischen 5 und 7 Minuten eluieren, eine verminderte relative Konzentration im Vergleich zu den gleichen Probenanalyten zu Zeitpunkt 1 aufzuweisen. Die Proben für die Verbindungen "B" und "C" zeigen weniger Variation zwischen den Zeitpunkten 1 und 2 (siehe4 und5 ). Da es sich bei diesen Proben zu Zeitpunkt 1 und 2 um Tages- und Nachtproben handelt, würde man erwarten, eine signifikante Variation zwischen den zwei Probentypen zu entdecken, und zwar sogar ohne die Dosierung eines Xenobiotikums. Daraus kann man folgern, dass die Verbindungen, die mit den Änderungen des Tierstoffwechsels zwischen Tag und Nacht zusammenhängen, entweder nicht zurückgehalten oder nicht detektiert worden sind. - Die Peaks, die man dahingehend identifiziert hat, dass diese sich in den dosierten Proben im Vergleich zu den Kontrollproben verändert haben sind in Tabelle 1 aufgeführt (ein extrahiertes Ionenchromatogramm eines dieser Ionen bei m/z = 338 sowie das MS-Spektrum dieses Peaks sind in
6 dargestellt). - Die Daten in Tabelle 1 zeigen die Veränderungen der Peakintensität, die für die Peaks in den Kontrollproben und den dosierten Proben beobachtet werden. Wie sich diesen Daten entnehmen lässt, sind die Änderungen der Peakkonzentrationen sehr signifikant. Die Tatsache, dass diese Verbindungen ebenso in den Kontrollproben beobachtet worden sind, bestätigt, dass diese Peaks keine metabolischen Produkte der dosierten Verbindungen waren.
- Die PCA-Analyse des gesamten Datensatzes ist in
7 dargestellt. In dieser Figur sind die Daten, die die Kontrollproben betreffen, in den eingekreisten Bereichen enthalten. Die Kontrollproben sind deutlich von den dosierten Tierproben getrennt. Diese PCA-Analyse wurde unter Verwendung des gesamten Datensatzes der Retentionszeiten und der m/z-Werte durchgeführt. Das Fraktionieren des Chromatogramms in 10 Zeitbereiche ermöglichte ebenso, dass die PCA-Analyse von bestimmten Zeitbereichen des Chromatogramms durchgeführt werden konnte. - Die PCA-Analyse der Daten zwischen 5 und 6 Minuten ist in
8 dargestellt. Hier ist es möglich, die Kontrollproben, die in dem eingekreisten Bereich enthalten sind, von den dosierten Proben zu trennen. Das kombinierte MS-Spektrum zeigt, dass die MS-Peaks, die für das Abbilden der dosierten Proben und der Kontrollproben in verschiedene Bereiche des PCA-Plots verantwortlich waren, die m/z-Werte m/z = 283 und m/z = 261 aufweisen. Das Ion mit m/z = 283 weist eine erhöhte Intensität in den dosierten Proben auf, wohingegen das Ion mit m/z = 261 in den dosierten Proben eine verminderte Intensität aufweist. Dieses Ergebnis bestätigt die Ergebnisse, die mittels der Analyse der LC/MS-Daten gewonnen worden sind. -
9 zeigt eine PCA-Analyse der LC/MS-Daten zwischen 3 und 4 Minuten. In diesen Daten gibt es keine Trennung zwischen den Kontrollproben und den dosierten Proben. Diese Daten zeigen an, dass in diesem Bereich des Chromatogramms kein signifikanter Unterschied zwischen den dosierten Proben und den Kontrollproben bestand. - Die Anwendung von LC/MS in Verbindung mit der PCA-Datenanalyse ist erfolgreich auf das Durchmustern von Rattenurin nach der Verabreichung von drei potentiellen Pharmazeutika angewendet worden. Mit dieser Vorgehensweise ist es möglich gewesen, die Kontrollproben von den dosierten Proben zu trennen. Es war ferner möglich unter Verwendung der PCA-Analyse, die Komponenten des MS-Spektrums zu identifizieren, die für die Trennung verantwortlich sind. Diese Daten zeigen eindeutig, dass LC/MS eine geeignete Alternative zu Proton-NMR für metabonomische Anwendungen bei der Medikamentauffindung und Medikamententwicklung ist.
- Während diese Erfindung insbesondere unter Bezugnahme auf bestimmte Ausführungsformen gezeigt und beschrieben worden ist, erkennt der Fachmann, dass zahlreiche Änderungen in der Form und im Detail gemacht werden können, ohne den Schutzumfang der Erfindung zu verlassen, wie dieser in den folgenden Ansprüchen definiert wird.
- ZUSAMMENFASSUNG
- Es wird ein Verfahren zur Analyse dreidimensionaler Daten beschrieben, die mittels eines Chromatographie-/Massenspektromtrie-Verfahrens und insbesondere eines LC/MS-Verfahrens gewonnen werden, unter Verwendung einer zweidimensionalen multivariablen statistischen Analyse. Der LC-Abschnitt erlaubt die Trennung von Analyten innerhalb einer Probe. Die aus einer solchen Prozedur gewonnen Informationen hängen typischerweise von der Retentionszeit (R) ab. Wenn sich die Analyten durch das System fortbewegen, treten diese in des MS-Bereich des LC/MS-Systems ein. Dort werden sie ionisiert und ein Massendetektor detektiert sodann diese ionisierten Spezies. Die aus dieser Prozedur gewonnenen Informationen wird im allgemeinen als Intensität für einen entsprechenden m/z-Wert ausgegeben. Daher stellt ein LC/MS-System wenigstens drei Informationsteile zur Verfügung. Die Hauptkomponentenanalyse (PCA) ist ein robustes Verfahren der multivariablen Analyse dieses Datentyps zwischen unterschiedlichen Proben. Üblicherweise wird die PCA-Analyse jedoch unter Verwendung von lediglich zweidimensionalen Daten durchgeführt. Daher ist zu erwarten, dass wenigstens ein Datenparameter, der aus einem LC/MS gewonnen wird, verloren geht. Die hierein beschriebenen Verfahren erhalten jedoch alle drei mathematischen Dimensionen.
Claims (22)
- Verfahren zur Analyse dreidimensionaler Daten, die von einer Probe erhalten worden sind, unter Verwendung einer zweidimensionalen Analysetechnik, umfassend: (a) Sammeln von Daten für die Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter mit der Zeit korreliert ist, (b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe auf der Basis eines Zeitparameters ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen durch die Verwendung von zwei der verbleibenden Parameter gekennzeichnet sind, (c) Transformieren jedes Bin-Datensatzes in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem zweiten Nullparameter zu dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze dieselbe Anzahl von Datenpunkten aufweisen und für jeden ersten Parameter in dem ausgerichteten Datensatz wenigstens ein Bin-Datensatz einen zweiten Parameter ungleich Null aufweist, (d) Ausbilden eines zweidimensionalen Arrays, indem die ausgerichteten Bin-Datensätze mit dem ersten Parameter auf einer Achse und einer Bin-Zahl auf einer zweiten Achse angeordnet werden, und wobei der zweite Parameter der Datenpunkte an den Überschneidungen aufgezeichnet wird, und (e) Unterziehen der Daten von (d) einer zweidimensionalen multivariablen, statistischen Analyse.
- Verfahren nach Anspruch 1, wobei die Bins nicht überlappen.
- Verfahren nach Anspruch 1, wobei die Bins sich teilweise überlappen.
- Verfahren nach Anspruch 1, wobei die Bin-Größe in einem Bereich liegt von einem Bin, der einen gesamten Bereich des Zeitparameters umfasst, bis zu einem Bin, der nicht mehr als zwei der kleinsten, identifizierbaren Inkremente des Zeitparameters umfasst.
- Verfahren nach Anspruch 1, wobei die zweidimensionale multivariable statistische Analyse ausgewählt ist aus der Gruppe bestehend aus der klassischen Analyse der kleinsten Quadrate (classical least square analysis; CSL), der Hauptkomponentenanalyse (principal component analysis; PCA), der Analyse der teilweise kleinsten Quadrate (partial least square analysis; PLS) und der Analyse der teilweise kleinsten Quadratdiskriminanten (partial least squares discriminant analysis; PLS-DA).
- Verfahren nach Anspruch 5, wobei die zweidimensionale multivariable statistische Analyse die Hauptkomponentenanalyse (principal component analysis; PCA) ist.
- Verfahren nach Anspruch 1, wobei die Transformation von Schritt (c) ferner das Verbinden von Datenpunkten umfasst, wenn die Werte des ersten Parameters anzeigen, dass die Datenpunkte in Beziehung stehen, wobei das Verbinden durch Hinzufügen der jeweiligen Werte der zweiten Parameter durchgeführt wird.
- Verfahren nach Anspruch 1, wobei die dreidimensionalen Daten von einem chromatographischen Prozess in Kombination mit einem spektrometrischen Prozess abgeleitet sind.
- Verfahren nach Anspruch 8, wobei der chromatographische Prozess ein Flüssigkeitschromatographieprozess ist.
- Verfahren nach Anspruch 8, wobei der spektrometrische Prozess ausgewählt ist aus der Gruppe bestehend aus Ultraviolettspektroskopie, Infrarotspektroskopie, Massenspektrometrie und Kernresonanzspektroskopie.
- Verfahren nach Anspruch 10, wobei der spektrometrische Prozess Massenspektrometrie ist.
- Verfahren nach Anspruch 8, wobei die nicht zeitbasierten Parameter eine physikalisch zugängliche Variable sind, die einer physikalischen/chemischen Eigenschaft der Probe entsprechen, wobei eine Intensität der Variable für jede Spezies einer Variable innerhalb jedes Bins enthalten ist, und wobei der Zeitparameter eine Dauer von Rt ist.
- Verfahren nach Anspruch 12, wobei die physikalisch zugängliche Variable, die einer physikalischen/chemischen Eigenschaft der Probe entspricht, m/z ist.
- Verfahren nach Anspruch 13, wobei die Transformation bei Schritt (c) ferner das Verbinden von Datenpunkten umfasst, die einen m/z-Parameter aufweisen, der anzeigt, dass die Datenpunkte Isotope desselben Ions darstellen, wobei das Verbinden durch Hinzufügen jeweiliger Intensitätswerte stattfindet.
- Verfahren nach Anspruch 8, wobei die dreidimensionalen Daten aus einem Flüssigkeitschromatographie-/Massenspektrometrie-Prozess gewonnen werden.
- Verfahren zur Analyse dreidimensionaler Daten unter Verwendung der Hauptkomponentenanalyse (PCA), umfassend: (a) Sammeln von Chromatographie-/Massenspektrometrie-Daten für eine Probe, wobei die Daten durch wenigstens drei Parameter gekennzeichnet sind, wobei wenigstens einer der Parameter ausgewählt ist aus der Gruppe bestehend aus Rt, m/z und Intensität, (b) Binnen der Daten von Schritt (a), wodurch eine Vielzahl von gebinnten Datensätzen ausgebildet wird, wobei eine Bin-Größe basierend auf Rt ausgewählt wird und wobei die Datenpunkte in den Bin-Datensätzen unter Verwendung eines oder mehrerer der m/z-Werte oder der Intensitätswerte für jede Ionenspezies gekennzeichnet werden, die innerhalb jedes Bins enthalten ist, (c) Transformieren jedes der Bin-Datensätze in einen ausgerichteten Bin-Datensatz, wobei Ausrichtungsdatenpunkte mit einem Nullintensitätsparameter dem Bin-Datensatz hinzugefügt werden, so dass alle Bin-Datensätze die gleiche Anzahl von Datenpunkten aufweisen und für jeden m/z-Wert in den ausgerichteten Datensätzen wenigstens ein ausgerichteter Bin-Datensatz einen Intensitätswert ungleich Null aufweist, der dem m/z-Wert entspricht, (d) Ausbilden eines zweidimensionalen Arrays durch Anordnen der ausgerichteten Bin-Datensätze mit m/z auf einer Achse, einer Bin-Zahl auf einer zweiten Achse und einem Intensitätswert, der an den Überschneidungen aufgezeichnet ist, und (e) Anwenden einer PCA-Analyse auf die Daten von (d).
- Verfahren nach Anspruch 16, wobei die Chromatographie-/Massenspektrometrie-Daten von einem Flüssigkeitschromatographie-/Massenspektrometrie-Vorgang gewonnen werden.
- Verfahren nach Anspruch 16, wobei die Transformation bei Schritt c ferner das Verschmelzen von Datenpunkten einschließt, wo m/z-Parameter anzeigen, dass diese Datenpunkte Isotope desselben Ions darstellen, wobei das Verschmelzen durch Hinzufügen jeweiliger Intensitätswerte erfolgt.
- Verfahren nach Anspruch 16, wobei das zweidimensionale Array in einer Tabellenkalkulation ausgebildet ist.
- Verfahren nach Anspruch 16, wobei die Bins nicht überlappen.
- Verfahren nach Anspruch 16, wobei die Bins teilweise überlappen.
- Verfahren nach Anspruch 16, wobei die Bin-Größe in einem Bereich liegt von einem Bin, der einen gesamten Bereich des Zeitparameters umfasst, bis zu einem Bin, der nicht mehr als zwei der kleinsten, identifizierbaren Inkremente des Zeitparameters umfasst.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38471202P | 2002-05-31 | 2002-05-31 | |
US60/384,712 | 2002-05-31 | ||
PCT/US2003/017190 WO2003102543A2 (en) | 2002-05-31 | 2003-05-30 | A method of using data binning in the analysis of chromatograhpy/spectrometry data |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10392707T5 true DE10392707T5 (de) | 2005-11-03 |
DE10392707B4 DE10392707B4 (de) | 2012-08-16 |
Family
ID=29712079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10392707T Expired - Lifetime DE10392707B4 (de) | 2002-05-31 | 2003-05-30 | Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten |
Country Status (6)
Country | Link |
---|---|
US (2) | US7072773B2 (de) |
JP (1) | JP4704034B2 (de) |
AU (1) | AU2003237306A1 (de) |
DE (1) | DE10392707B4 (de) |
GB (2) | GB2405972B (de) |
WO (1) | WO2003102543A2 (de) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4818116B2 (ja) * | 2003-05-29 | 2011-11-16 | ウオーターズ・テクノロジーズ・コーポレイシヨン | メタボノミクスにおいてlc−msまたはlc−ms/msデータの処理を行うための方法およびデバイス |
WO2005062844A2 (en) * | 2003-12-19 | 2005-07-14 | Icoria, Inc. | System and methods for non-targeted processing of chromatographic data |
US7645984B2 (en) | 2004-02-13 | 2010-01-12 | Waters Technologies Corporation | Apparatus and method for identifying peaks in liquid chromatography/mass spectrometry data and for forming spectra and chromatograms |
JP4719694B2 (ja) * | 2004-02-13 | 2011-07-06 | ウオーターズ・テクノロジーズ・コーポレイシヨン | 化学物質を追跡し、定量化するためのシステムおよび方法 |
JP4950029B2 (ja) * | 2004-04-30 | 2012-06-13 | マイクロマス ユーケー リミテッド | 質量分析計 |
US7462819B2 (en) * | 2005-05-16 | 2008-12-09 | The University Of Western Ontario | Statistical methods applied to surface chemistry in minerals flotation |
JP4932834B2 (ja) | 2005-06-03 | 2012-05-16 | ウオーターズ・テクノロジーズ・コーポレイシヨン | 保持時間整合を行うための方法および装置 |
EP1904934A2 (de) * | 2005-07-08 | 2008-04-02 | Metanomics GmbH | System und verfahren zur charakterisierung einer chemischen probe |
WO2007012643A1 (en) | 2005-07-25 | 2007-02-01 | Metanomics Gmbh | Means and methods for analyzing a sample by means of chromatography-mass spectrometry |
CA2646890C (en) * | 2006-03-21 | 2012-07-31 | Metabolon, Inc. | A system, method, and computer program product for analyzing spectrometry data to indentify and quantify individual components in a sample |
KR100740582B1 (ko) * | 2006-09-27 | 2007-07-19 | 한국과학기술연구원 | 가스크로마토그래피-질량분석기를 이용한 두 생체시료군 간대사체 차별성 분석 방법 |
US7608924B2 (en) * | 2007-05-03 | 2009-10-27 | Delphi Technologies, Inc. | Liquid cooled power electronic circuit comprising stacked direct die cooled packages |
JP4985153B2 (ja) * | 2007-07-03 | 2012-07-25 | 株式会社島津製作所 | クロマトグラフ質量分析装置 |
JP2011522257A (ja) | 2008-05-29 | 2011-07-28 | ウオーターズ・テクノロジーズ・コーポレイシヨン | 前駆体および生成物イオンの保持時間一致を実行し、前駆体および生成物イオンスペクトルを構成する技術 |
US8761465B2 (en) * | 2009-03-18 | 2014-06-24 | Microsoft Corporation | Centroid processing |
CN102667789A (zh) * | 2009-10-02 | 2012-09-12 | 梅塔博隆有限公司 | 用于分析复杂混合物中小分子成分的设备和相关方法 |
CN102478563B (zh) * | 2010-11-25 | 2014-08-13 | 中国科学院大连化学物理研究所 | 一种用于研究转基因和非转基因水稻代谢差异的方法 |
CN103620401B (zh) * | 2011-06-29 | 2017-04-12 | 株式会社岛津制作所 | 分析数据处理方法以及装置 |
CN108735571B (zh) * | 2014-06-11 | 2020-07-17 | 英国质谱公司 | 二维ms/ms采集模式 |
CN104123451A (zh) * | 2014-07-16 | 2014-10-29 | 河海大学常州校区 | 基于偏最小二乘回归的疏浚作业产量预测模型建立方法 |
CN106445772B (zh) * | 2015-08-13 | 2020-04-24 | 北京恒安永通科技有限公司 | 一种多数据关联分析方法及系统 |
US11209406B2 (en) * | 2016-05-02 | 2021-12-28 | Shimadzu Corporation | Data processing device |
CN115436539B (zh) * | 2022-09-20 | 2023-06-27 | 浙江工商大学 | 基于脂质组学分析方法的金枪鱼品种及部位鉴定方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4807148A (en) * | 1987-05-29 | 1989-02-21 | Hewlett-Packard Company | Deconvolving chromatographic peaks |
US4824446A (en) * | 1988-05-23 | 1989-04-25 | Applied Automation, Inc. | Gas chromatography simulation |
US5015848A (en) * | 1989-10-13 | 1991-05-14 | Southwest Sciences, Incorporated | Mass spectroscopic apparatus and method |
US5135549A (en) * | 1991-01-30 | 1992-08-04 | The Board Of Trustees Of Southern Illinois University | Chromatographic technique and apparatus |
US5175430A (en) * | 1991-05-17 | 1992-12-29 | Meridian Instruments, Inc. | Time-compressed chromatography in mass spectrometry |
JP2904061B2 (ja) * | 1995-06-07 | 1999-06-14 | 株式会社島津製作所 | 液体クロマトグラフ質量分析装置 |
US6182016B1 (en) * | 1997-08-22 | 2001-01-30 | Jie Liang | Molecular classification for property prediction |
JPH11326304A (ja) * | 1998-05-12 | 1999-11-26 | Shimadzu Corp | クロマトグラフ用データ処理装置 |
JP3683749B2 (ja) * | 1999-07-14 | 2005-08-17 | 日本電子株式会社 | 質量分析方法 |
JP2002005890A (ja) * | 2000-06-16 | 2002-01-09 | Horiba Ltd | 多成分混合スペクトルの解析方法 |
GB0016459D0 (en) * | 2000-07-04 | 2000-08-23 | Pattern Recognition Systems As | Method |
NL1016034C2 (nl) * | 2000-08-03 | 2002-02-08 | Tno | Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen. |
US6931325B2 (en) * | 2001-02-07 | 2005-08-16 | Regents Of The University Of Michigan | Three dimensional protein mapping |
AU2003211104B2 (en) * | 2002-02-13 | 2009-01-29 | Reify Corporation | Method and apparatus for acquisition, compression, and characterization of spatiotemporal signals |
-
2003
- 2003-05-30 DE DE10392707T patent/DE10392707B4/de not_active Expired - Lifetime
- 2003-05-30 AU AU2003237306A patent/AU2003237306A1/en not_active Abandoned
- 2003-05-30 JP JP2004509381A patent/JP4704034B2/ja not_active Expired - Fee Related
- 2003-05-30 GB GB0426189A patent/GB2405972B/en not_active Expired - Lifetime
- 2003-05-30 WO PCT/US2003/017190 patent/WO2003102543A2/en active Application Filing
-
2004
- 2004-11-16 US US10/989,533 patent/US7072773B2/en not_active Expired - Lifetime
-
2006
- 2006-06-30 US US11/480,254 patent/US7418352B2/en not_active Expired - Lifetime
-
2007
- 2007-01-16 GB GBGB0700810.5A patent/GB0700810D0/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
US20070083337A1 (en) | 2007-04-12 |
JP4704034B2 (ja) | 2011-06-15 |
US7418352B2 (en) | 2008-08-26 |
WO2003102543A2 (en) | 2003-12-11 |
JP2005528606A (ja) | 2005-09-22 |
AU2003237306A1 (en) | 2003-12-19 |
GB2405972B (en) | 2007-08-15 |
GB0700810D0 (en) | 2007-02-21 |
DE10392707B4 (de) | 2012-08-16 |
US20050127287A1 (en) | 2005-06-16 |
AU2003237306A8 (en) | 2003-12-19 |
US7072773B2 (en) | 2006-07-04 |
GB0426189D0 (en) | 2004-12-29 |
WO2003102543A3 (en) | 2004-04-29 |
GB2405972A (en) | 2005-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE10392707B4 (de) | Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten | |
DE102004015018B4 (de) | Verfahren zum Identifizieren von Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten | |
EP1846757B1 (de) | Verfahren und system zur massenspektrenanalyse | |
DE102014008264B4 (de) | Isotopenmustererkennung | |
DE60126055T3 (de) | Massenspektrometer und massenspektrometrisches Verfahren | |
DE102017111067B4 (de) | Isomeren-Analyse in TIMS-Q-q-TOF Massenspektrometern | |
DE112004000746B4 (de) | Verfahren und Vorrichtung zum Verarbeiten von LC-MS- oder LC-MS-/MS-Daten bei Stoffwechseluntersuchungen | |
DE112005001143B4 (de) | System und Verfahren zum Gruppieren von Vorläufer- und Fragmentionen unter Verwendung von Chromatogrammen ausgewählter Ionen | |
DE60114245T2 (de) | Verfahren und vorrichtung zur identifizierung und quantifizierung chemischer komponenten einer mischung | |
DE602004002856T2 (de) | Dynamische signalauswahl in einem chromatographie-/massenspektometrie-/massenspektrometriesystem | |
DE20321731U1 (de) | Massenspektrometer | |
EP2037262B1 (de) | Erzeugung von gepulsten Stoffgemischen | |
DE112004001212B4 (de) | Verfahren für die Analyse von Isotopensignaturen und die Massenanalyse | |
DE112020003212T5 (de) | Verfahren und Vorrichtung für die Massenspektrometrie | |
DE102014118481A1 (de) | Verfahren und Vorrichtung zum Analysieren einer komplexen Probe | |
EP3159681B1 (de) | Verfahren und vorrichtung zur automatisierbaren ermittlung der bestimmungsgrenze und des relativen fehlers bei der quantifizierung der konzentration einer zu untersuchenden substanz in einer messprobe | |
DE602004010154T2 (de) | Verfahren zur bestimmung der auswirkung eines aus mehreren komponenten bestehenden naturproduktgemischs auf das biologische profil einer krankheit in einer gruppe lebender systeme sowie entwicklung und qualitätskontrolle von medizin auf naturproduktbasis | |
DE102017011423B4 (de) | Verfahren und Vorrichtung für lsotopenverhältnis-Massenspektrometrie | |
DE10393475B4 (de) | Verfahren und Vorrichtung zur Identifizierung von Verbindungen in einer Probe | |
DE10292304B4 (de) | Separation von Komponenten einer Analysenprobe in einem Ionenmobilitätsspektrometer durch Zuführung selektiv wechselwirkender gasförmiger Partikel | |
DE112015004216T5 (de) | Techniken für die Darstellung und Verarbeitung von Massenspektraldaten | |
DE112004000338B4 (de) | System und Verfahren zum Verarbeiten identifizierter Metaboliten | |
EP0993609B1 (de) | Verfahren zur bestimmung der anzahl von komponenten in peaks, banden und signalen von chromatogrammen, elektrogrammen und spektrogrammen aller art | |
EP1682917B1 (de) | Verfahren zur verifikation der korrekten räumlichen struktur von molekülen mittels nmr-spektroskopie | |
WO2003006152A2 (de) | Verfahren und vorrichtung zum auffinden von stoffgemischen für substanzbibliotheken |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: WATERS TECHNOLOGIES CORP. (N.D.GES.D. STAATES , US |
|
8128 | New person/name/address of the agent |
Representative=s name: DR. VOLKER VOSSIUS, CORINNA VOSSIUS, TILMAN VOSSIU |
|
8110 | Request for examination paragraph 44 | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final |
Effective date: 20121117 |
|
R082 | Change of representative |
Representative=s name: CORINNA VOSSIUS IP GROUP, DE Representative=s name: WINKLER IP, DE |
|
R082 | Change of representative |
Representative=s name: WINKLER IP, DE |
|
R082 | Change of representative |
Representative=s name: FORRESTERS SKYGARDEN, DE Representative=s name: FORRESTERS IP LLP, DE Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE Representative=s name: WINKLER IP, DE |
|
R082 | Change of representative |
Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE Representative=s name: FORRESTERS SKYGARDEN, DE Representative=s name: FORRESTERS IP LLP, DE Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE |
|
R082 | Change of representative |
Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE Representative=s name: WEISS, ADILKA, DIPL.-BIOL., DE |
|
R082 | Change of representative |
Representative=s name: KUEHR, VERA, DIPL.-BIOL., DE |
|
R071 | Expiry of right |