DE112012001185T5 - Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen - Google Patents

Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen Download PDF

Info

Publication number
DE112012001185T5
DE112012001185T5 DE112012001185.6T DE112012001185T DE112012001185T5 DE 112012001185 T5 DE112012001185 T5 DE 112012001185T5 DE 112012001185 T DE112012001185 T DE 112012001185T DE 112012001185 T5 DE112012001185 T5 DE 112012001185T5
Authority
DE
Germany
Prior art keywords
data
factor
correlation
peak
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112012001185.6T
Other languages
English (en)
Other versions
DE112012001185B4 (de
Inventor
Jihong Wang
Peter Markel Willis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leco Corp
Original Assignee
Leco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leco Corp filed Critical Leco Corp
Publication of DE112012001185T5 publication Critical patent/DE112012001185T5/de
Application granted granted Critical
Publication of DE112012001185B4 publication Critical patent/DE112012001185B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Abstract

Es wird ein System und eine Methode zur Datenverarbeitung in chromatographischen Systemen beschrieben. In einem Ausführungsbeispiel umfasst das System und Verfahren das Verarbeiten von Daten, die von einem chromatographischen System erzeugt wurden, um verarbeitete Daten zu erzeugen, wobei die verarbeiteten Daten analysiert werden und auf Grundlage der verarbeiteten Daten Ergebnisse ausgearbeitet und bereitgestellt werden.

Description

  • TECHNISCHER BEREICH
  • Diese Offenbarung bezieht sich auf Datenverarbeitungstechniken für Daten, die man aus chromatischen Massenspektrometriesystem erhält.
  • HINTERGRUND
  • Es ist bekannt, dass chromatographische Massenspektrometer sehr große Datenmengen erzeugen und dass ein Großteil der Daten aus Rauschen oder unerwünschten Informationen besteht. Wünschenswert sind Systeme und Verfahren, die relevante Informationen von dem Rauschen effizient und genau differenzieren und diese dann effizient und mit hoher Auflösung weiterverarbeiten.
  • ZUSAMMENFASSUNG
  • Es wird ein System und ein Verfahren zur Datenverarbeitung in Chromatographiesystemen beschrieben. Bei einer Implementierung umfasst das System und das Verfahren die Datenverarbeitung durch ein Chromatographiesystem zur Erstellung von verarbeiteten Daten, die Analyse der verarbeiteten Daten und die Ausarbeitung und Bereitstellung von Ergebnissen in Abhängigkeit von den verarbeiteten Daten.
  • BESCHREIBUNG DER ZEICHNUNGEN
  • 1 zeigt ein allgemeines Verfahren in Bezug auf Faktoranalysetechniken zur Identifizierung und Entfaltung chromatographischer Peaks, gemäß einer Implementierung, die in dieser Offenbarung beschrieben wird;
  • 2 ist ein allgemeines Blockdiagramm eines Gaschromatographie-Massen-spektrometriesystems;
  • 3 zeigt ein Merkmal der Methode, gemäß einer Implementierung;
  • 4 stellt ein beispielhaftes Verfahren für die Vorverarbeitung von Daten aus einem Datenerfassungssystem dar, gemäß einer Implementierung;
  • 5 stellt ein beispielhaftes Verfahren einer Grundlinienkorrektur dar, gemäß einer Implementierung;
  • 6 bezeichnet eine beispielhafte Implementierung einer Filterung;
  • 7 zeigt ein repräsentatives Verfahren zur Identifizierung von wesentlich optimierten Koeffizienten, gemäß den in dieser Offenbarung diskutierten Prinzipien;
  • 8 zeigt ein repräsentatives Verfahren, das zum Klassifizieren der Peakformen von Subclustern verwendet werden kann, gemäß einer Ausführungsform;
  • 9 gibt ein Verfahren wieder, in dem allgemeine irrelevante Daten von Subclustern entfernt werden können, um die Daten zu präzisieren, gemäß einer Implementierung;
  • 10 zeigt ein Seeding-Verfahren entsprechend den Aspekten der hier beschriebenen Implementierungen;
  • 11 zeigt ein Verfahren zur Faktoridentifikation, in Übereinstimmung mit den beschriebenen Ausführungsformen;
  • 12 zeigt einen Vergleich von M gegenüber des Peakkorrelationsschwellenwerts in einem beispielhaften System;
  • 13 stellt M gegenüber dem Peakkorrelationsschwellenwert graphisch dar, in einer Implementierung; und
  • 14 stellt ein Verfahren zur Vermeidung von Faktoraufteilung/Faktorsplitting bereit.
  • Gleiche Bezugszeichen in den verschiedenen Zeichnungen weisen auf gleiche Elemente hin.
  • DETAILLIERTE BESCHREIBUNG
  • Mit Bezug auf 1 wird ein beispielhaftes Verfahren für Faktoranalysemethoden zur Identifizierung und Entfaltung von chromatographischen Peaks aus einem Chromatographie-Massenspektrometriesystem offenbart. Es sollte berücksichtigt werden, dass dieses Verfahren in allen Arten von Chromatographiesystemen verwendet werden kann, einschließlich für Flüssigkeiten und Gas. In einer Ausführungsform, und wie gezeigt, umfasst das Verfahren die Schritte des (i) Vorverarbeitens der empfangenen Daten durch ein Analysesystem (S200), (ii) Analysieren der vorverarbeiteten Daten (S300), (iii) Verarbeiten der Daten, die mit Isotopen oder Addukten assoziiert sind, von denen angenommen wird, dass sie in den Daten enthalten sind (S400); und (v) Ausarbeiten und Bereitstellen von zugehörigen Ergebnissen (S500).
  • Bei einer Implementierung werden die Daten für die Analyse von einem Datenerfassungssystem bereitgestellt, das mit einem Massenspektrometer verbunden ist. Im Rahmen dieser Offenbarung ist zu verstehen, dass die Datenerfassung ein System sein kann, wie in den Druckschriften U.S. 7,501,621 , U.S. 7,825,373 , U.S. 7,884,319 dargelegt.
  • Des Weiteren können vor der Durchführung einer solchen Analyse die Daten aus dem Datenerfassungssystem entsprechend angepasst werden, wie dies in der vorläufigen US-Patentanmeldung mit Seriennummer 61/445,674 dargelegt wird. Das vorgenannte und alle anderen Patente und Anmeldungen, auf die Bezug genommen wird, werden hierin unter Bezugnahme auf ihre Gesamtheit eingebunden. Wo eine Definition oder Verwendung eines Begriffs in einer eingebundenen Bezugnahme inkonsistent mit oder gegenteilig zu der Definition dieses hierin bereitgestellten Begriffs ist, gilt die hierin bereitgestellte Definition dieses Begriffs, und die Definition dieses Begriffs in der Bezugnahme gilt nicht.
  • Zusammenfassend gesagt, konvertiert das vorgenannte Datenerfassungssystem im Allgemeinen Rohdaten aus einem Massenspektrometriesystem in Schwerpunkt-Massenspektren, ”Sticks” genannt, von denen jeder einen Ionen-Peak darstellt und aus Intensität, einer genauen Masse und einem Wert für die Massenauflösung besteht. Während der Erstellung der Sticks wurden die Rohdaten aus dem Analog-Digital-Wandler einer Kompression in der Größenordnung von 104 oder 105:1 unterzogen und die überwiegende Mehrheit des Erfassungsrauschens und die redundanten Informationen wurden entfernt. Das Ergebnis sind sehr wenige zweidimensionale Daten, das chemische Hintergrundrauschen kann aber noch vorhanden sein, weil das Ziel dieses Datenerfassungssystems die Weitergabe aller Informationen über Ionen an die nachfolgenden Verarbeitungsstufen ist. Als nächstes werden die Sticks driftkorrigiert und in Cluster von statistisch ähnlichen Massen in angrenzenden Verweilzeitscans zusammengefasst.
  • Bei einer Implementierung, wird von Clustern mit ähnlichen Intensitätsprofilen angenommen, dass sie verschiedene Isotope, Addukte und Ionenfragmente aus molekularen Verbindungen darstellen, die aus der Chromatographiespalte eluieren. Darüber hinaus gibt es Cluster mit Hintergrundionen ohne chromatographische Struktur, die aus einer Vielzahl von Quellen stammen, wie zum Beispiel Säulenbluten (column bleed), Schadstoffen der mobilen Phase, atmosphärischen Schadstoffen und dergleichen. Um Cluster zu entfernen, die unter dem gewünschten Signal-Rausch-Niveau liegen, kann ein Cluster-Filter angewendet werden und die verbleibenden Cluster werden dann an ein Verarbeitungssystem geschickt, wo sie weiter analysiert werden.
  • Es versteht sich, dass abhängig vom Inhalt dieser Offenbarung, dass auf jeder Stufe der Datenverarbeitung die Beibehaltung guter Informationen normalerweise vorzuziehen ist, auch auf Kosten der Beibehaltung eines geringen Restrauschens wie in 3 dargestellt. Im Allgemeinen hat das beschriebene System die Rauschmenge optimiert, die für den Erhalt der Datenintegrität zurückbehalten wurde.
  • 4 stellt ein beispielhaftes Verfahren für die Vorverarbeitung der Daten dar, die vom Verarbeitungssystem aus dem Datenerfassungssystem empfangen werden. Bei einer Implementierung umfasst die Verarbeitung (S200) die Schritte des Trennens langer Cluster von kurzen Clustern und die Grundlinienkorrektur der langen Cluster (S210), Filtern der Daten zum Glätten der Daten (S220), Aufteilen der gefilterten Cluster in Subcluster (S230) und Klassifizieren der Subcluster (S240). In einer Ausführungsform kann das Klassifizieren der Subcluster mindestens ein Klassifizieren der Peakform und/oder ein Klassifizieren des Signal-Rausch-Verhältnisses umfassen, jeweils entsprechend der genaueren Diskussion im Folgenden.
  • Es wurde festgestellt, dass lange Cluster eine Dauer ähnlich der Länge der gesamten Analyse haben können und dass die meisten dieser langen Cluster Hintergrundionen sind, welche die Ergebnisse tatsächlich verzerren können, wenn sie nicht ordnungsgemäß behandelt werden. Lange Cluster sind oft auch relativ intensiv und normalerweise mit einem hohen Geräuschpegel behaftet. Weil einige dieser Daten jedoch aufgrund eines Eintrags aus einer gemeinsamen Masse einer eluierenden Verbindung auch gewünschte Chromatographiedaten umfassen können, wird es vorgezogen, eher eine ergänzende Analyse über die langen Cluster zu erstellen, als sie insgesamt herauszunehmen. Aufgrund ihrer erhöhten Intensität sollten diese langen Cluster bei einer Implementierung zuerst einer Grundlinienkorrektur unterzogen werden.
  • Ein Verfahren einer solchen Grundlinienkorrektur wird im Folgenden offenbart. Bei einer Implementierung und entsprechend der Darlegung in 5 können die Schritte für die Durchführung einer Grundlinienkorrektur der Daten das folgende Verfahren umfassen: Trennen der Daten in Blöcke, wobei die Länge jedes Blocks als Vielfaches der erwarteten Halbwertsbreiten-Chromatographiedaten festgelegt wird (S211), Schätzen der Intensität der Grundlinie in der Mitte eines Blocks abhängig von der Intensität der Grundlinie im unteren Quartil dieses Blocks (S212), lineares Interpolieren zwischen den vorangehenden äquivalenten Quartilpunkten, die eine Schätzung der Grundlinie ergeben (S213), Abtrennen (Clipping) der Daten oberhalb der Grundlinie auf das Niveau der Grundlinie und Beibehaltung der Daten unterhalb der Grundlinie (S214), Glätten der Kurve der abgeschnittenen Daten, um eine verbesserte Version der Grundlinie zu erhalten (S215), und Wiederholen der Schritte (S214) und (S215) bis alle, oder im Wesentlichen alle, Daten mit einer Mindesttoleranz über die geglättete Grundlinie fallen. Die vorangehende Grundlinienkorrektur kann für jeden gewünschten getrennten Block durchgeführt werden, der bei einer Implementierung alle, oder im Wesentlichen alle, separaten Blöcke umfasst. Dementsprechend kann die Korrektur auf jeden langen Cluster angewendet werden, der bei einer Implementierung alle, oder im Wesentlichen alle, langen Cluster umfasst.
  • Bei einer Implementierung wird die Länge des Blocks während Schritt (S211) als fünf (5) Mal die erwartete Halbwertsbreite der Chromatographiedaten geschätzt, obwohl berücksichtigt werden muss, dass, abhängig von dieser Offenbarung, die Länge mehr oder weniger als fünf (5) Mal betragen kann.
  • Wie besprochen, macht das Abtrennen der Daten (S214) ein Glätten der Kurve für die abgeschnittenen Daten erforderlich. Bei einer Implementierung wird ein Glättungsalgorithmus nach Savitzky-Golay implementiert, mit dem der Glättungsschritt bereitgestellt wird. Es können auch andere Glättungsalgorithmen angewendet werden, und die Erfindung sollte sich nicht auf diese beschränken.
  • Unter fortgesetzter Bezugnahme auf 4, können die Daten als nächstes gefiltert werden, um das Rauschen zu entfernen (S220). Eine Implementierung einer solchen Filterung wird in 6 gezeigt. Bei einer Implementierung, und wie besprochen, wird für die Durchführung dieses Schrittes ein Infinite-Impuls-Response-Filter (IIR-Filter) verwendet. Abhängig vom vorliegenden Inhalt muss jedoch berücksichtigt werden, dass auch andere Arten von Filtern stattdessen dafür eingesetzt werden können, wie zum Beispiel ein Finite-Impuls-Response-Filter (FIR-Filter). Unter fortgesetzter Bezugnahme auf 6 wird der höchste Peak innerhalb der Daten festgelegt und die Halbwertsbreite dieser Peaks wird geschätzt (S221). Dieser geschätzte Wert wird anschließend mit einer vorher festgelegten Referenztabelle abgeglichen, um einen Satz von Koeffizienten zweiter Ordnung des vorwärts und rückwärts wirkenden IR-Filters festzulegen, die für ein Glätten der chromatographischen Peaks abhängig von der Halbwertsbreite optimiert werden (S222). Mit den bestimmten, optimierten Koeffizienten, die in (S222) abgeleitet wurden, werden die Daten geglättet (S223). Anschließend werden die geglätteten Daten mit den Rohdaten verglichen, um eine Rauschzahl für jeden Cluster festzulegen (S224). Bei einer Implementierung wird die Rauschzahl für jeden Cluster als Standardabweichung des Residuums zwischen den geglätteten Daten und den Rohdaten berechnet. Für Zwecke, die abhängig von dieser Offenbarung hervortreten, wird die Rauschzahl zurückbehalten, da diese jedem der Subcluster zugeordnet wird, die in Übereinstimmung mit (S230) von einem Cluster abgeleitet werden. Mit diesem Verfahren wird eine Maximum-Likelihood-Schätzung der kleinsten Quadrate bereitgestellt, mit der eine Analyse ermöglicht wird, die nicht übermäßig von den Daten hoher Intensität beeinflusst wird und es ermöglicht, dass die Daten mit niedriger Intensität ausreichend gut vertreten sind.
  • Wie besprochen, werden in einer Ausführungsform die optimierten Koeffizienten durch die Verwendung einer Referenztabelle (Look-up-Tabelle) bei (S222) bestimmt. Bei einer Implementierung werden die optimierten Koeffizienten vorausberechnet und für mehrere Werte der Halbwertsbreite im System gespeichert, bevor es zu einer Verarbeitung kommt. 7 zeigt eine Möglichkeit, wie die Koeffizienten vorausberechnet werden können.
  • Bei jeder erwarteten Halbwertsbreite werden mehrere reine Gaußsche Peaks bei (S225) gebildet. Bei einer Implementierung können die Breiten dieser Peaks erheblich um die oder zwischen ca. einem Drittel (1/3) der Ziel-Halbwertsbreite und drei (3) Mal der Halbwertsbreite schwanken; diese werden dann als Referenzpeaks gespeichert. Als nächstes wird das Rauschen bei (S226) zu allen oder zu ausgewählten Referenzpeaks hinzugefügt. Bei einer Implementierung kann das Rauschen weißes Rauschen sein und gemäß der Gaußschen Verteilung zu jeder der Peaks hinzugefügt werden. Alle Peaks oder die ausgewählten Peaks werden dann zur Anpassung an die Filterkoeffizienten in einer Art und Weise optimiert, die die Residuen (residuals) zwischen den geglätteten Rauschpeaks und den Referenzpeaks bei (S227) erheblich minimiert. Die Optimierung (S227) kann mit einem nicht linearen Levenburg-Marquardt-Algorithmus erfolgen. Während der Optimierung sind die Koeffizienten eingeschränkt, damit man eine stabile Impulsantwort erhält. Dieses Verfahren wird für alle oder ausgewählte Referenz-Halbwertsbreiten (S228) wiederholt und die optimierten Koeffizientenwerte werden in einer Referenztabelle gespeichert (S229). Bei einer Implementierung sind die Impulsantworten des sich beispielhaft ergebenden Glättungsfilters ähnlich denjenigen eines Sinc-Filters, bei dem die Breite der Hauptkeule des Filters ungefähr die Hälfte derjenigen der Ziel-Halbwertsbreite ausmacht. Mit dieser Implementierung kann die Form und Struktur des Peaks im Wesentlichen erhalten bleiben und die Anzahl der erkannten falschen positiven Peaks kann erheblich minimiert werden.
  • Zurückverweisend auf 4, können die gefilterten Cluster in Subcluster unterteilt werden (S230). Bei einer Implementierung werden die gefilterten Cluster-Daten untersucht, um jedes Beispiel zu identifizieren, bei dem der Minimumpunkt in einem Tal (zwischen zwei Peaks oder Scheitelpunkten gelegen) kleiner ist als eine definierte Intensität der darauf folgenden Peaks. Zum Beispiel kann die Peaksintensität so ausgewählt werden, dass sie auf der Hälfte oder um die Hälfte (1/2) der Intensität einer oder beider darauf folgender Peaks liegt. Sobald die Täler identifiziert sind, werden sie als Cluster-Trennstellen erkannt und unterteilen den Cluster damit in einen oder mehrere Subcluster. Entsprechend der Berücksichtigung ist die Anzahl der unterteilten Subcluster abhängig von der Menge der Cluster-Trennstellen eines beliebigen Clusters.
  • 8 zeigt ein repräsentatives Verfahren, das zum Klassifizieren der Peakform von Subclustern verwendet werden kann (S240). Mit diesem Verfahren kann sichergestellt werden, dass das relevante Subcluster chromatographische Informationen umfasst. In der Praxis können einige der Subcluster Daten enthalten, die keine chromatographischen Informationen enthalten, diese werden im Nachfolgenden als Ausreißer bezeichnet. Es ist bevorzugt, so viele Ausreißer wie möglich von den Daten zu extrahieren und abzugeben, ohne relevante Daten zu entfernen. Bei einer Implementierung können eine oder mehrere der folgenden Methoden verwendet werden, um die gewünschten Subcluster von den Ausreißern zu trennen: (i) Auswählen von Subclustern, die ein Signal-Rausch-Verhältnis haben, das größer ist als das minimale Signal-Rausch-Verhältnis (S242), (ii) Auswählen von Subclustern, die eine Peakform haben, die größer als eine Mindestqualität ist (S244), und (iii) Auswählen von Subclustern, die eine minimale Clusterlänge haben (S246). Bei einer Implementierung wird die minimale Clusterlänge von oder zwischen 3–8 Sticks, von oder zwischen 4–7 Sticks, von oder zwischen 3–7 Sticks, von oder zwischen 4–8 Sticks, von oder zwischen 4–6 Sticks oder von 5 Sticks ausgewählt. Es können auch andere minimale Clusterlängen verwendet werden. Bei einer Implementierung kann jedes der Trennverfahren angewendet werden. Für eine einfache Offenbarung diskutiert diese Offenbarung eine Ausführungsform, in der alle Verfahren angewendet werden, wie in 8 gezeigt. Je nachdem, welche Trennverfahren angewendet werden, sollte diese Offenbarung des Weiteren nicht auf die Reihenfolge begrenzt werden, in der sie abgearbeitet werden.
  • Es wird ein beispielhaftes Verfahren bereitgestellt für die Auswahl der Subcluster, die ein Signal-Rausch-Verhältnis haben, das größer ist als ein Minimum- oder Schwellen-Signal-Rausch-Verhältnis (S241). Bei einer Implementierung kann das Schwellen-Verhältnis als das kleinere aus einem festprogrammierten Wert und einem benutzerdefinierten Wert ausgewählt werden. Die Schwelle kann, zum Beispiel, bei oder um zehn (10) liegen. Neben anderen Methoden kann das Rauschen als das vorher festgelegte Erfassungsrauschen eines Viertels (1/4) des Innenbereichs oder als Standardabweichung des Residuums zwischen den ursprünglichen Clusterdaten und den geglätteten Clusterdaten gemessen werden. Es versteht sich, dass Subcluster mit einem Verhältnis unterhalb der Schwelle immer noch für die Faktoranalyse verwendet werden können, wenn es sich dabei um Isotope oder Addukte der klassifizierenden Peaks handelt.
  • Möglicherweise wäre eine weitere Trimmung der Subcluster wünschenswert, die ein über dem Schwellenwert liegendes Signal-Rausch-Verhältnis haben, da sie noch immer redundante Daten oder Rauschen enthalten können. Ein Trimmungsverfahren umfasst die Trimmung der Grundlinie eines derartigen Subclusters sowohl von der linken als auch von der rechten Seite des Peaks. Bei einer Implementierung werden die Rohdaten im Subcluster von einem oder beiden Enden zur Mitte gescannt – die Stelle, an der die Intensitäten (links/rechts) eine Schwelle überschreiten, wird zu einem neuen Ende des Subclusters und die Grundliniendaten werden verworfen. Bei einer Implementierung beträgt die Schwellenintensität das Vierfache (4) der Standardabweichung des Subcluster-Rauschens.
  • Wie zuvor beschrieben, ist eine weitere Methode zur Identifizierung der gewünschten Subcluster und zur Eliminierung von Ausreißern, Subcluster auszuwählen, die eine Peakform haben, die größer ist als eine Mindest- oder Schwellenwertqualität (S244). Bei einer Implementierung kann die Schwellenwertqualität auf der Annahme beruhen, dass chromatographische Peaks eine allgemeine Form haben, die angemessen geformt werden kann, vorzugsweise unter Verwendung einer Bi-Gaußkurve – wobei die Erfindung dadurch nicht beschränkt ist. Eine Bi-Gaußkurve wird anderen Peakformen gegenüber bevorzugt, wie z. B. der Pearson-IV-Verteilung für Geschwindigkeit und Anpassungsstabilität. Bei einer Ausführungsform und wie in 9 abgebildet, wird entsprechend jeder Subcluster zunächst an einen Bi-Gaußschen Peak angepasst (S247). Eine Korrelation zwischen dem Subcluster und dem angepassten Peak wird identifiziert (S248). Peaks mit einer größeren Korrelation als oder im Wesentlichen an einer Schwellenwertkorrelation werden ausgewählt, und diejenigen, die weniger als die Schwellenwertkorrelation haben, werden als Ausreißer bezeichnet (S249). Bei einer Implementierung kann die Schwellenwertkorrelation 0,6, vorzugsweise 0,8, sein.
  • Auf Grundlage dieser Offenbarung ist zu beachten, dass jeder Subcluster als einen einzigen chromatographischen Peak enthaltend erachtet werden kann, obwohl geschätzt wird, dass ein solcher einen zusammengesetzten Peak mit geteilter Masse darstellen könnte aufgrund von kombinierten Informationen aus zwei oder mehreren koeluierenden Substanzen, eines Phänomens, das entfaltet werden kann, wie im Folgenden weiter diskutiert.
  • Unter erneuter Bezugnahme auf 1 werden die vorverarbeiteten Daten nun in Übereinstimmung mit Vorstehendem in (S300) der Analyse unterzogen. Bei diesem Schritt wird ein Verfahren zur Bestimmung der Anzahl an signifikanten Faktoren für die Faktoranalyse und zur Angabe erster Start-Schätzungen (Seed-Schätzungen) dieser Faktoren offenbart. Die Anwendung des hiermit diskutierten Faktorenseeding führt zu einem Verfahren, bei welchem verhindert wird, dass sich die Faktoranalyse übermäßig auf lokale Mindestmengen konzentriert. Infolgedessen können Ergebnisse schnell mit hoher Präzision und Auflösung erfasst werden.
  • Bei einer Ausführungsform und wie in 10 abgebildet, umfasst das offenbarte Impfverfahren (Seeding-Verfahren) die Bestimmung von einem oder mehreren Werten zur Verarbeitung oder anderweitigen Bestimmung der Anzahl an signifikanten Faktoren bei (S310) und zur Steuerung der Entfaltung. Bei einer Ausführungsform umfassen Werte, die benutzt werden können, unter anderem den Grad an chromatographischer Auflösung, die Peaküberlagerung oder Peakkorrelationsschwelle und die Mindestqualität der resultierenden Faktoren. Die Werte können auf Grundlage von analytischen Ergebnissen während eines Vorimpfverfahrens (Vorseedingsverfahrens) vom Benutzer ausgewählt, vordefiniert oder dynamisch erzeugt werden.
  • Bei einer Ausführungsform kann ein Mehrfach-Verfahren die Faktorenbestimmung erleichtern. Ein zweifaches Verfahren wird im Folgenden diskutiert, wobei allerdings zu beachten ist, dass auf Grundlage dieser Offenbarung variantenlagige Verfahren genutzt werden können und dass der Erfindung ihr voller Umfang zusteht. Weiter kann ein zweifaches Verfahren optional sein, sodass ein einfacher Durchgang nach einer Bestimmung genutzt werden kann und die Ergebnisse aus einem solchen Durchgang ausreichend sind. Zusammenfassend gesagt, erleichtert dieses Verfahren eine Eliminierung von Peaks von geringerer Qualität bei der Bestimmung von Faktoren, da diese Peaks die Ergebnisse trüben oder das Verfahren anderweitig verzögern können. Wie im Folgenden diskutiert, können jedoch einige oder alle eliminierten Peaks zu einem späteren Zeitpunkt im Verfahren verbunden werden, falls festgestellt wird, dass diese Peaks mit Isotopen oder Addukten zusammenhängen.
  • Bei einer Implementierung wird ein erster Durchgang zur Angabe einer ersten Schätzung der bestimmten Faktoren genutzt (S320). Wie in 11 abgebildet, kann dieser Durchgang durch die Auswahl eines Basispeaks oder eines Konzentrationsprofils für einen Faktor beginnen (S321). Der Basispeak kann manuell oder automatisch ausgewählt werden, wie durch eine Implementierung einer algorithmischen Funktion oder ähnliches. Bei einer Ausführungsform wird der intensivste Subclusterpeak in einem Datensatz als Basispeak ausgewählt, da angenommen werden kann, dass ein solcher Peak wahrscheinlich eine reine Chemikalie im Vergleich zu Subclusterpeaks, die vergleichsweise weniger intensiv sind, am besten repräsentiert. Bei einer Implementierung wird der ausgewählte Subclusterpeak als Basispeak oder als Konzentrationsprofil für einen Faktor ausgewählt.
  • Nach Auswahl des Basispeaks werden alle lokalen Daten (z. B. die Subcluster, die diesen Basispeak möglicherweise durchkreuzen) bewertet und mit dem Basispeak zur Bestimmung eines Korrelationswertes C mit dem Basispeak korreliert (S322). Bekannte Korrelationsverfahren können verwendet werden. Bei einer Ausführungsform werden lokale Daten mit einem vorbestimmten Mindestkorrelationswert mit dem Basisspeak zur Bildung eines Faktors kombiniert (S323). Eine erste Schätzung der Spektren S kann dann für den identifizierten Faktor angegeben werden (S324).
  • Als nächstes wird der intensivste Peak in den übrigen Daten als nächster Faktor ausgewählt und korrelierende Daten werden abermals in Übereinstimmung mit dem oben beschriebenen Verfahren kombiniert (S325). Dieses Verfahren dauert an, bis alle Subcluster zu den Faktoren anfänglich zugeordnet werden.
  • Ein zweiter Durchgang (S330) kann nun eingesetzt werden, wobei die Faktoren aus dem ersten Durchgang weiter analysiert werden und bestimmt wird, ob ein einzelner in den ersten Durchgang identifizierter Faktor weiter in individualisierte Faktoren aufgeteilt werden kann oder soll. Bei diesem Schritt können ein Korrelationsparameter und ein verbundenes Konfidenzintervall zur Aufteilung von Daten, die in dem ersten Durchgang versehentlich verbunden worden sind, verwendet werden. Bei einer Implementierung kann der Korrelationsparameter benutzeridentifiziert oder vorbestimmt sein.
  • 12 zeigt ein Beispiel einer Implementierung, die in einem solchen zweiten Durchgang verwendet werden kann (S330). Wie abgebildet, wird der intensivste Subcluster im Faktor ausgewählt (S331), der dann als Basispeak bezeichnet wird, obwohl auch andere Begriffe verwendet werden können. Eine Korrelation wird zwischen dem Basispeak und einem oder allen übrigen Subclustern im Faktor errechnet (S332). Ein Konfidenzintervall für die Stelle des Scheitelpunkts kann ebenfalls für jeden Subcluster, einschließlich des Basispeaks, errechnet werden (S333). Eine beispielhafte Bestimmung eines Konfidenzintervall könnte folgendermaßen aussehen:
    Figure DE112012001185T5_0002
  • In der vorstehenden Gleichung (i) bezeichnet M einen Sigmamultiplikator und bezieht sich auf die Anzahl an gewünschten Standardabweichungen, die mit einer Peakkorrelationsschwelle zusammenhängen können, wie im Folgenden diskutiert, (ii) ist Peak Width die Halbwertsbreite des Subclusterpeaks, deren Konfidenzintervall gewünscht wird, (iii) ist S/N des Signal-Rausch-Verhältnisses (signal-to-noise ratio) für den Subcluster, das als Verhältnis der Peakhöhe zum Rauschen von Peak zu Peak des Subclusters errechnet wird, und ApexLocation ist die Zeitposition des Scheitelpunkts des Peaks. Obwohl eine beispielhafte Konfidenzintervallbestimmung offenbart wird, können andere Rechnungswege verwendet werden, es sei denn, sie ist explizit ausgenommen und die Erfindung sollte nicht auf das offenbarte Beispiel beschränkt sein.
  • Falls bevorzugt und wie zuvor dargelegt, kann M bei einer Implementierung funktional mit der Peakkorrelationsschwelle zusammenhängen, wie 13 zeigt. 13 zeigt graphisch M gegenüber der Peakkorrelationsschwelle auf Grundlage von Messungen der Korrelation und der Konfidenzintervallüberlagerung zweier in unterschiedlichen Mengen zeitversetzter Gaußglocken. Das dargestellte Verhältnis kann verwendet werden, sodass, wenn entweder die Peakkorrelationsschwelle oder M identifiziert werden, der andere Wert automatisch auf Grundlage dieses gezeigten Zusammenhangs abgeleitet werden kann. Alternativ kann es bei einer Implementierung gewünscht sein, die unabhängige Peakkorrelationsschwelle und M anzugeben.
  • Bei einer Implementierung wird eine hohe Konfidenz dazu tendieren, einen großen Wert M (bei oder zwischen 2–4, oder bei oder um 3) und ein breites Konfidenzintervall zu haben. Und für sehr intensive Peaks (z. B. solche, die zu einem erhöhten Signal-Rausch-Verhältnis tendieren) kann das Konfidenzintervall dazu tendieren, schmal zu sein, da eine ausreichende Anzahl an Ionen existiert, die die Ungewissheit der Scheitelpunktstelle sehr gering hält. Wird beispielsweise ein Sigmamultiplikator von 3 für eine Basis (oder einen Subcluster) verwendet, deren Scheitelpunkt sich bei dem Zeitpunkt 20 befindet, hat der Peak eine Breite von 2, eine Höhe von 2560 und einen Peak zu Peak Residuum von 10, dann beträgt das Konfidenzintervall 20 ± 0,375 für die Scheitelpunktstelle des Basispeaks. Alle Subcluster, deren Konfidenzintervalle das Konfidenzintervall des Basispeaks überlagern und deren Korrelation zum Basispeak größer ist als die benutzerspezifizierte Peakkorrelationsschwelle, werden zusammen in einen Faktor gruppiert (S334). Falls wünschenswert, wenn es noch übriggebliebene Subcluster gibt, wird der intensivste der übriggebliebenen Subcluster als Basispeak für einen neuen Faktor ausgewählt und das Verfahren wird wiederholt, bis keine Subcluster mehr übrig sind (S335). Die Anzahl an neu durch dieses Verfahren gebildeten Faktoren hängt mit der Anzahl koelutierender Substanzen zusammen. Der zweite Durchgang bietet ein Verfahren, in welchem zwei Peaks mit im Wesentlichen gleichen Scheitelpunktstelle aber unterschiedlichen Formen entfaltet werden sollen.
  • Gleichzeitig mit Vorstehendem oder nach Abschluss einer, einiger oder aller Faktoridentifikationen, wie zuvor dargelegt, wird ein Durchschnittskonzentrationsprofil für jeden Faktor errechnet (S340), wie 10 zeigt. Es können beispielsweise Verfahren zu multivariaten Kurvenauflösungen (MCR) zur Bestimmung des Durchschnittskonzentrationsprofils für jeden Faktor angewendet werden. Bei einer Implementierung wird für einen oder alle Faktoren das berechnete Durchschnittskonzentrationsprofil als geschätzte Peakform für jeden Faktor verwendet. Wahlweise kann die Basispeakform als die geschätzte Peakform für einen oder alle Faktoren identifiziert werden, falls wünschenswert. Weiter können zwei geschätzte Peakformen so verwendet werden, dass das berechnete Durchschnittskonzentrationsprofil und die Basispeakform für einen oder alle Faktoren verwendet werden können.
  • Durch die Verwendung des Durchschnittskonzentrationsprofils können zusätzliche unerwünschte Faktoren durch Messung der Peakqualität (PQ) des Durchschnittskonzentrationsprofils von weiteren Berechnungen gestrichen werden (S350). Bei einer Implementierung kann die PQ durch Bestimmung der Abweichung des Residuums der Anpassung jedes Konzentrationsprofils berechnet werden. Unterschiedliche Abweichungsverfahren können angewendet werden, zum Beispiel kann vorzugweise eine Standardabweichung in einem Bi-Gauß-System verwendet werden. Bei einer Implementierung wird eine Peakqualität, die weniger beträgt als eine Schwellenpeakqualität (z. B. 0,5) von den Daten und weiteren Berechnungen gestrichen (S360). Es gilt jedoch zu beachten, dass die Auswahl der PQ-Schwelle und die Abweichungsberechnung und Verfahren dazu je nach erwünschten Ergebnissen variiert werden können und die Erfindung dadurch nicht beschränkt werden sollte.
  • Unter erneuter Bezugnahme auf 1 kann es wünschenswert sein, Daten wieder dem Faktor, der mit Isotopen und Addukten zusammenhängt, hinzuzufügen (S400). Bei einer Implementierung werden die Rohdaten überprüft und die Daten, die als mit Isotopen und Addukten zusammenhängend betrachtet werden, ausgewählt und dann gegen alle oder ausgewählte des Faktors klassifiziert. Klassifizierung (Qualifying) zu einem Faktor kann vorkommen, wenn die Daten eine größere Korrelation als eine Mindestkorrelation mit einer Fehlerrate von weniger als einer Schwellenfehlerrate aufweisen. Bei einer Implementierung beträgt die Mindestkorrelation 0,9 und die Fehlerrate zwanzig Prozent. Wenn die Daten klassifiziert sind, werden sie diesem Faktor zugeordnet.
  • Bei einer Implementierung können die Isotope/Addukte in den Rohdaten durch Prüfung typischer Isotop-m/z-Intervalle und Addukt-m/z-Intervalle gegen die Rohdaten und das Extrahieren von Isotop/Addukt-anzeigenden Daten auf Grundlage der Prüfung identifiziert werden. Beispielsweise haben einfach angereicherte kohlehaltige Substanzen Isotope verteilt auf ungefähr n·1,003 Masseneinheiten, wobei n = 1, 2, 3 ...; in chlorhaltigen Substanzen sind die Isotope normalerweise auf 1,997 Masseneinheiten verteilt. Bei Addukten, wenn ein Molekül unter der Verwendung eines einzelnen Natriumions ionisiert ist, hat es eine Massenverschiebung von 21,982 Masseneinheiten von dem selben Molekül, das durch ein einzelnes Wasserstoffion ionisiert wird.
  • Weiter können Isotope/Addukte von Substanzen falsch mit einem benachbarten koelutierenden Faktor gruppiert worden sein (z. B. kann Rauschen einen Isotopen-/Addukt-Peak dazu veranlasst haben, eine höhere Korrelation zu einem benachbarten Peak als zu seinem eigentlichen Basispeak aufzuweisen). Bei Identifikation kann es wünschenswert sein, solche Isotope/Addukte neu zuzuordnen. Ein Verfahren zur Bestimmung und Neuzuordnung solcher falschen Gruppierungen ist der Vergleich eines Faktoren zu seinem/n benachbarten Faktoren. Bei einer Implementierung beruht die Identität, was als benachbarter Faktor gilt, auf der Korrelation zwischen dem Konzentrationsprofil eines ersten Faktors und dem eines folgenden Faktors. Ist die Korrelation größer als eine Mindestkorrelation, wird der Faktor als benachbarter Faktor und als potenziell Isotope oder Addukte vom ersten Faktor enthaltend identifiziert. Bei einer Implementierung beträgt die Mindestkorrelation 0,9. Als nächstes wird der benachbarte Faktor gescannt, und wenn Isotope/Addukte als zum ersten Faktor gehörend klassifiziert sind, so werden sie dem ersten Faktor neu zugeordnet. Bei einer Implementierung kann dieses Verfahren für den nächsten folgenden Faktor wiederholt werden, bis die Korrelation weniger als die Mindestkorrelation beträgt. Klassifizierung zwischen einem Faktor und einem Isotop/Addukt kann vorkommen, wenn die Daten eine größere Korrelation als die Mindestkorrelation mit einer Fehlerrate von weniger als einer Schwellenfehlerrate aufweisen. Bei einer Implementierung beträgt die Mindestkorrelation 0,9 und die Fehlerrate zwanzig Prozent. Entnimmt dieses Verfahren einem Faktor alle Komponenten, wird dieser Faktor gestrichen. Dieses Verfahren kann für alle oder ausgewählte Anteile der Daten verwendet werden.
  • Zeitweise während des Verfahrens kann festgestellt werden, dass die Korrelationsschwelle zu hoch ist. Dies kann beispielsweise aufgrund eines Versuchs, nah beieinander koelutierende Substanzen zu entfalten, vorkommen. Hängen die Isotope und Addukte jedoch nicht so nah zusammen, kann Faktorteilung aufgrund einer übermäßig hohen Korrelationsschwelle folgen (d. h. einzelne elutierende Substanzen werden von mehr als einem Faktor abgebildet). Ein Verfahren zur Verhinderung dieser Faktorteilung ist in 14 dargestellt. Ein Durchschnitt der Korrelation zwischen einem Basis-Isotop-/Addukt-Subcluster innerhalb eines Faktors (d. h. im intensivsten) und den anderen Subclustern wird innerhalb dieses Faktors berechnet: die „lokale Korrelationsschwelle” (S610). Als nächstes wird eine Korrelation zwischen dem Konzentrationsprofil eines Faktors und einem zu diesem Faktor benachbarten Faktor bestimmt (S620). Ist die Korrelation zwischen diesen Faktoren größer als die lokale Korrelationsschwelle, werden die beiden Faktoren verbunden (S630). Dieses Verfahren kann über alle Faktoren für jeden identifizierten Basis-Isotop-/Addukt-Subcluster wiederholt werden.
  • Sobald ein Faktor identifiziert ist und ein angemessenes geschätztes Konzentrationsprofil für einen Faktor ausgewählt worden ist, wird die geschätzte Peakform mit den ausgewählten Kurven mit bekannten Parametern verglichen (S370). Bei einer Implementierung wird das geschätzte Konzentrationsprofil normalisiert und anschließend mit einer oder mehreren vorbestimmten, vorausberechneten Kurven verglichen. Normalisierung kann durch Strecken oder Schrumpfen durch ein erneutes Stichprobenverfahren und anschließend durch Zentrierung und damit Anpassung an die Breite und Mitte der vorausberechneten Kurve erreicht werden.
  • Die Korrelation zwischen den neuen Daten und dem Satz vordefinierter Kurven wird dann berechnet (S380) und die Schiefe- und Kurtosiswerte für das beste Gegenstück werden als Start für die Optimierung ausgewählt (S390).
  • Bei einer Implementierung wird eine Pearson-Funktion für die Zuordnung der vorausberechneten Kurven verwendet; vorzugsweise eine Pearson-IV-Kurve. Pearson-IV-Kurven können als fünf Parameter enthaltend bezeichnet werden: (i) Höhe; (ii) Mitte; (iii) Breite; (vi) Schiefe (3. Moment); und (v) Kurtosis (4. Moment). Bei einer Implementierung sind die vorausberechneten Kurven Permutationen von mindestens der Schiefe und/oder der Kurtosis, während die übrigen Parameter konstant gehalten werden, sodass die Peakformen anschließend für jede Permutation erfasst und gespeichert werden. Es ist zu beachten, dass andere Permutationen verwendet werden können und die Ansprüche nicht durch die hiermit offenbarte Beispielsimplementierung beschränkt sein sollten. Beispielsweise und unter anderem können Höhe und Schiefe variiert werden, während sie die Mitte halten, und Breite und Kurtosis können konstant bleiben.
  • Es muss klar sein, dass verschiedene Implementierungen der hier beschriebenen Systeme und Methoden in digitalen elektronischen Schaltkreisen, integrierten Schaltkreisen, speziell konstruierten ASICs (anwendungsspezifischen integrierten Schaltkreisen), Computerhardware, Firmware, Software, und/oder Kombinationen derer realisiert werden können. Diese verschiedenen Implementierungen können eine Implementierung in einem oder mehreren Computerprogrammen beinhalten, die auf einem programmierbaren System ausführbar und/oder interpretierbar sind, das mindestens einen programmierbaren Prozessor für einen besonderen oder allgemeinen Zweck enthält, der zum Empfang von Daten und Anweisungen und zur Übertragung von Daten und Anweisungen auf ein Speichersystem, mindestens ein Eingabegerät und mindestens ein Ausgabegerät gekoppelt ist.
  • Diese Computerprogramme (auch unter Programme, Software, Softwarenanwendungen oder Code bekannt) beinhalten Maschinenbefehle für einen programmierbaren Prozessor und können in einer höheren verfahrenstechnischen und/oder objektorientierten Programmiersprache und/oder in einer Assembler/Maschinensprache implementiert werden. Wie hier verwendet, bezeichnen die Begriffe „maschinenlesbares Medium” und „computerlesbares Medium” sämtliche Compterprogrammprodukte, Vorrichtungen und/oder Geräte (z. B. Magnetdisketten, optische Speicherplatten, Speicherkapazität, programmierbare logische Bauteile (PLDs)), die zur Bereitstellung von Maschinenbefehlen und/oder Daten an einen programmierbaren Prozessor mit einem maschinenlesbaren Medium, das Maschinenbefehle als maschinenlesbares Signal empfängt, verwendet werden. Der Begriff „maschinenlesbares Signal” bezeichnet sämtliche zur Bereitstellung von Maschinenbefehlen und/oder Daten an einen programmierbaren Prozessor verwendete Signale.
  • Um die Interaktion mit einem Benutzer sicherzustellen, können die hier beschriebenen Systeme und Verfahren an einem Computer mit einem Anzeigegerät (z. B. mit einem CRT-(Röhrenbildschirm) oder LCD-Monitor (Flüssigkristallbildschirm)) zur Anzeige von Informationen für den Benutzer sowie einer Tastatur und einem Zeigegerät (z. B. einer Maus oder einem Trackball), mit welchen der Benutzer Eingaben in den Computer tätigen kann, implementiert werden. Geräte anderer Art können ebenfalls zur Sicherstellung der Interaktion mit einem Benutzer verwendet werden; beispielsweise kann die dem Benutzer gebotene Rückmeldung jegliche Form von sensorischer Rückmeldung annehmen (z. B. visuelle Rückmeldung, auditive Rückmeldung oder taktile Rückmeldung); und die Eingabe durch den Benutzer kann auf jegliche Weise empfangen werden, einschließlich durch akustische, sprachliche oder taktile Eingabe.
  • Die hier beschriebenen Systeme und Methoden können in ein Rechnersystem implementiert werden, das eine Back-End-Komponente beinhaltet (z. B. als Datenserver) oder das eine Middleware-Komponente (z. B. einen Anwendungsserver) oder das eine Front-End-Komponente beinhaltet (z. B. einen Client-Computer mit graphischer Anwenderschnittstelle oder Web-Browser, durch den ein Anwender mit einer Implementierung des in dieser Patentschrift beschriebenen Erfindungsgegenstandes interagieren kann) oder mit einer Kombination von einer oder mehreren Back-End-, Middleware- oder Front-End-Komponenten. Die Komponenten des Systems können durch ein beliebiges Medium der digitalen Datenkommunikation (z. B. durch ein Kommunikationsnetzwerk) wechselseitig verbunden werden. Beispiele für Kommunikationsnetzwerke beinhalten ein Ortsbereichsnetzwerk (Local Area Network „LAN”) oder ein Großbereichsnetzwerk (Wide Area Network „WAN”) und das Internet.
  • Das Rechnersystem kann Clients und Server beinhalten. Client und Server sind in der Regel voneinander entfernt („remote”) und interagieren üblicherweise über ein Kommunikationsnetzwerk. Die Beziehung zwischen Client und Server ergibt sich durch Computerprogramme, die auf den jeweiligen Computern laufen und zueinander in einer Client-Server-Beziehung stehen.
  • Ausführungsbeispiele des Gegenstandes und der Funktionsabläufe, die in dieser Patentschrift beschrieben werden, können in digitale elektronische Schaltkreise oder in Computersoftware, Firmware oder Hardware implementiert werden, sowie in Strukturen, die in dieser Patentschrift offenbart werden, sowie in deren strukturelle Äquivalente oder auch in Kombinationen aus einem oder mehreren hieraus. Ausführungsbeispiele des in dieser Druckschrift beschriebenen Gegenstandes können als ein oder mehrere Computerprogrammprodukte implementiert werden, das heißt als ein oder mehrere Module von Computerprogrammanwendungen, die auf einem computerlesbaren Medium implementiert sind, um von einer Datenverarbeitungsvorrichtung ausgeführt zu werden oder den Betrieb hiervon zu steuern bzw. zu regeln. Das computerlesbare Medium kann ein maschinenlesbares Speichermedium, ein maschinenlesbares Speichersubstrat, eine Speichervorrichtung, ein Ensemble von Materie, das ein maschinenlesbares sich ausbreitendes Signal erzeugt, oder auch eine Kombination aus einem oder mehreren hiervon sein. Der Begriff „Datenverarbeitungsvorrichtung” umfasst sämtliche Vorrichtungen, Geräte und Maschinen zur Verarbeitung von Daten, darunter beispielsweise einen programmierbaren Prozessor, einen Computer, oder auch mehrere Prozessoren oder Computer. Die Vorrichtung kann zusätzlich zur Hardware auch einen Code beinhalten, der eine Ausführungsumgebung für das betreffende Computerprogramm erzeugt, so beispielsweise einen Code, der Prozessorfirmware bildet, einen Protokollstapel, ein Datenbankverwaltungssystem, ein Betriebssystem oder eine Kombination aus einem oder mehreren hieraus. Ein sich ausbreitendes Signal ist ein künstlich erzeugtes Signal, so beispielsweise ein maschinenerzeugtes elektrisches, optisches oder elektromagnetisches Signal, das zur Codierung von Information zur Übertragung an geeignete Empfängervorrichtungen erzeugt wird.
  • Ein Computerprogramm (auch als Programm, Software, Softwareanwendung, Skript oder Code bekannt) kann in einer Programmiersprache beliebiger Art geschrieben sein, darunter kompilierende oder interpretierende Sprachen, und kann in einer beliebigen Form eingesetzt werden, darunter als für sich stehendes Programm (stand-alone) oder auch als Modul, Komponente, Subroutine oder andere geeignete Einheit, die zur Verwendung in einer Rechenumgebung geeignet ist. Ein Computerprogramm entspricht nicht notwendigerweise einer Datei in einem Dateisystem. Ein Programm kann in einem Abschnitt einer Datei gespeichert sein, die andere Programme oder Daten (beispielsweise ein oder mehrere Skripte, die in einem Markup-Sprachendokument gespeichert sind) enthält, wie auch in einer Einzeldatei, die eigens für das betreffende Programm vorgehalten wird, oder in mehreren zusammenhängenden Dateien (beispielsweise Dateien, die ein oder mehrere Module, Unterprogramme oder Teile des Codes speichern). Es kann ein Computerprogramm verwendet werden, das auf einem Computer oder mehreren Computern läuft, die sich an einem Ort befinden oder auch über mehrere Orte verteilt und über ein Kommunikationsnetzwerk miteinander verbunden sind.
  • Die Prozesse und die logischen Abläufe, die in dieser Patentschrift beschrieben werden, können von einem oder von mehreren programmierbaren Prozessoren ausgeführt werden, die ein oder mehrere Computerprogramme ausführen, um Funktionen durch Verarbeiten von Eingabedaten und das Erzeugen einer Ausgabe wahrzunehmen. Die Prozesse und logischen Abläufe können auch als Spezialzwecklogikschaltungen implementiert sein, so beispielsweise als FPGA (Field Programmable Gate Array (feldprogrammierbares Gate-Array)) oder als ASIC (Application-Specific Integrated Circuit (anwendungsspezifische integrierte Schaltung)). Auch die Vorrichtungen können derart implementiert werden.
  • Prozessoren, die zur Ausführung eines Computerprogramms geeignet sind, beinhalten beispielsweise sowohl Allzweck- wie auch Spezialzweck-Mikroprozessoren, als auch einen beliebigen oder mehrere beliebige Prozessoren eines Digitalcomputers. Im Allgemeinen empfängt ein Prozessor Anweisungen und Daten aus einem Nurlesespeicher (ROM = Read Only Memory) oder einem Speicher mit wahlfreiem Zugriff oder beidem. Die wesentlichen Elemente eines Computers sind ein Prozessor zum Ausführen von Anweisungen und ein oder mehrere Speichervorrichtungen zum Speichern von Anweisungen und Daten. Im Allgemeinen beinhaltet ein Computer zudem eine oder mehrere Massenspeichervorrichtungen zum Speichern von Daten, so beispielsweise magnetische, magneto-optische Platten oder optische Platten, oder ist operativ derart angekoppelt, dass er Daten von diesen empfangen oder an diese übertragen kann. Ein Computer muss derartige Vorrichtungen jedoch nicht zwangsläufig aufweisen. Darüber hinaus kann ein Computer in eine andere Vorrichtung eingebettet sein, so beispielsweise in ein Mobiltelefon, einen persönlichen digitalen Assistenten (PDA), ein mobiles Audioabspielgerät oder einen GPS-Empfänger, um nur einige wenige Beispiele zu nennen. Computerlesbare Medien, die zum Speichern von Computerprogrammanweisungen und Daten geeignet sind, beinhalten alle Arten von nichtflüchtigem Speicher, Medium und Speichervorrichtung, darunter beispielsweise Halbleiterspeichervorrichtungen, so beispielsweise EPROM, EEPROM oder Flash-Speichervorrichtungen; magnetische Platten, so beispielsweise interne Festplatten oder herausnehmbare Platten; magneto-optische Platten; und CD-ROM- und DVD-ROM-Platten. Der Prozessor und der Speicher können durch Spezialzwecklogikschaltungen ergänzt oder in diese eingebaut sein.
  • Zur Bereitstellung einer Interaktion mit einem Anwender können Ausführungsbeispiele des in dieser Druckschrift beschriebenen Erfindungsgegenstandes auf einem Computer implementiert sein, der eine Anzeigevorrichtung aufweist, so beispielsweise eine Kathodenstrahlröhre (CRT) oder einen LCD-Monitor (Flüssigkristallanzeige), um Information für einen Anwender anzuzeigen, sowie eine Tastatur und eine Zeigevorrichtung, so beispielsweise eine Maus oder einen Trackball, durch den der Anwender eine Eingabe für den Computer bereitstellen kann. Andere Arten von Vorrichtungen können verwendet werden, um eine Interaktion mit einem Anwender möglich zu machen. So kann beispielsweise eine für den Anwender bereitgestellte Rückkoppelung in beliebiger Form einer sensorischen Rückkoppelung gegeben sein, so beispielsweise als optische Rückkopplung, akustische Rückkopplung, oder berührtechnische Rückkoppelung; und es kann die Eingabe von dem Anwender in beliebiger Form empfangen werden, darunter eine akustische, eine sprachliche oder eine berührtechnische Eingabe.
  • Obwohl die vorliegende Druckschrift viele Spezifika enthält, sollen diese nicht als Beschränkungen des Umfanges der Erfindung oder des beanspruchten Gegenstandes, sondern als Beschreibungen von Merkmalen verstanden werden, die für bestimmte Ausführungsbeispiele der Erfindung spezifisch sind. Bestimmte Merkmale, die in dieser Druckschrift im Kontext getrennter Ausführungsbeispiele beschrieben sind, können auch bei einem einzigen Ausführungsbeispiel in Kombination implementiert sein. Umgekehrt können verschiedene Merkmale, die hier im Kontext eines einzigen Ausführungsbeispiels beschrieben sind, auch in mehreren Ausführungsbeispielen getrennt oder in einer beliebigen geeigneten Unterkombination implementiert sein. Obwohl Merkmale als in verschiedenen Kombinationen zusammenwirkend beschrieben und auch als solche beansprucht sein können, können ein oder mehrere Merkmale aus einer beanspruchten Kombination in einigen Fällen auch aus der Kombination ausgeschlossen werden, und die beanspruchte Kombination kann auf eine Unterkombination oder Variation einer Unterkombination gerichtet sein.
  • Obwohl Abläufe in den Figuren in einer spezifischen Reihenfolge dargestellt sind, soll dies nicht derart verstanden werden, dass eine Ausführung der Abläufe in dieser bestimmten gezeigten Reihenfolge oder in einer sequenziellen Reihenfolge immer notwendig ist oder dass sämtliche dargestellten Abläufe ausgeführt werden müssen, um die erwünschten Ergebnisse zu erhalten.
  • Unter bestimmten Umständen kann ein Multitasking oder eine Parallelverarbeitung von Vorteil sein. Darüber hinaus soll die Trennung von verschiedenen Systemkomponenten bei den vorstehend beschriebenen Ausführungsbeispielen nicht derart verstanden werden, dass eine derartige Trennung bei sämtlichen Ausführungsbeispielen von Nöten ist. Zusätzlich sollte einsichtig sein, dass die beschriebenen Programmkomponenten und Systeme im Allgemeinen zu einem einzigen Softwareerzeugnis integriert werden oder auch in mehrere Softwareerzeugnisse gepackt sein können.
  • Es sind bestimmte Ausführungsbeispiele der Erfindung beschrieben worden. Es sollte jedoch einsichtig sein, dass verschiedene Änderungen an der beschriebenen Erfindung vorgenommen werden können, ohne vom Sinn und Umfang der Offenbarung abzuweichen. So können zum Beispiel verschiedene Formen der oben beschriebenen Abläufe verwendet werden. Die Schritte können beispielsweise in einer anderen Reihenfolge ausgeführt werden. Es können Schritte hinzukommen oder wegfallen. Obwohl einige Anwendungen der Systeme und Techniken beschrieben wurden, soll darauf hingewiesen werden, dass zahlreiche weitere Anwendungen betrachtet werden. Entsprechend sind weitere Ausführungsbeispiele im Umfang der nachfolgenden Ansprüche enthalten.

Claims (65)

  1. Ein Verfahren zur Verarbeitung von Daten, die sich auf ein Massenspektrum in einem Datenerfassungssystem für ein Chromatographie Massenspektrometriesystem beziehen; das Verfahren umfasst: Verarbeiten der Daten zur Generierung von verarbeiteten Daten; Analysieren der verarbeiteten Daten, um Rauschen zu extrahieren und um einen Bestandteil oder mehrere Bestandteile der Massenspektren zu einer oder zu mehreren eluierten Zusammensetzungen zusammen zu gruppieren, um die Bestimmung jeder einzelnen Zusammensetzung zu begünstigen, wobei der Bestandteil oder die Mehrzahlen von Bestandteilen Isotope, Addukte und Fragmente sind; und dem Ausarbeiten und Bereitstellen von Ergebnissen, die sich auf die verarbeiteten Daten beziehen.
  2. Verfahren gemäß Anspruch 1 ferner umfassend: Wiederaufnehmen von Informationen, die mit mindestens einem der Isotope und Addukte, die möglicherweise als Rauschen extrahiert wurden, assoziiert sind.
  3. Verfahren gemäß Anspruch 1, wobei die Daten lange und kurze Clustern umfassen und der Verarbeitungsschritt umfasst: Trennen der langen Cluster von den kurzen Clustern Filtern von Daten, um die Daten zu glätten, wodurch gefilterte Cluster entstehen; Unterteilen der gefilterten Cluster in Sub-Cluster; und Klassifizieren der Sub-Cluster, um ungewünschte Sub-Cluster zu extrahieren.
  4. Verfahren gemäß Anspruch 3, wobei der Trennschritt ferner umfasst: Trennen der Daten in Blöcke; Schätzen einer Intensität einer Grundlinie im Zentrum eines jeden Blocks; Lineares Interpolieren zwischen äquivalenten Quartilpunkten eines jeden Blocks, um eine Grundlinie-Schätzung zu erhalten; Abtrennen der Daten über der Grundlinie-Ebene und Erhalten der Daten unter der Grundlinie; und Glätten der abgetrennten Daten, um eine verbesserte Version der Grundlinie zu erhalten.
  5. Verfahren gemäß Anspruch 4, wobei eine Länge eines jeden Blocks ein Vielfaches einer erwarteten Halbwertsbreite der Daten ist.
  6. Verfahren gemäß Anspruch 4, wobei eine Länge von jedem Block als fünfmal so lang wie die erwartete Halbwertsbreite der Daten geschätzt wird.
  7. Verfahren gemäß Anspruch 4, wobei der Glättungsschritt die Anwendung eines Savitzky-Golay-Glättungsalgorithmus umfasst.
  8. Verfahren gemäß Anspruch 4, wobei die Schätzung der Intensität einer Grundlinie im Zentrum eines Blocks auf einer Intensität der Grundlinie im unteren Quartil des Blocks basiert.
  9. Verfahren gemäß Anspruch 3, wobei der Klassifizierungsschritt mindestens einen der nachfolgenden Schritte umfasst: Auswählen von Sub-Clustern, die ein Signal-Rausch-Verhältnis aufweisen, das größer als ein Schwellenwert-Signal-Rausch-Verhältnis ist; Auswählen von Sub-Clustern, die eine Peakform haben, die größer als eine Schwellenwert-Qualität ist, und Auswählen von Sub-Clustern, die eine Mindest-Cluster-Länge aufweisen.
  10. Verfahren gemäß Anspruch 9, wobei das Schwellenwert-Signal-Rausch-Verhältnis 10 beträgt.
  11. Verfahren gemäß Anspruch 9, wobei das Rauschen das vordefinierte Erfassungsrauschen von einem Viertel (1/4) der Ionenfläche ist.
  12. Verfahren gemäß Anspruch 9, wobei das Rauschen die Standardabweichung des Residuums zwischen den ursprünglichen Clusterdaten und den geglätteten Clusterdaten ist.
  13. Verfahren gemäß Anspruch 9, wobei Sub-Cluster mit einem Signal-Rausch-Verhältnis, das geringer ist als das Schwellenwert-Signal-Rausch-Verhältnis, immer noch in der Faktorenanalyse genutzt werden, sofern sie Isotope oder Addukte sind.
  14. Verfahren gemäß Anspruch 9, ferner umfassend den Schritt: Trimmen der Grundlinie eines Sub-Clusters von einer linken und einer rechten Seite eines Peaks.
  15. Verfahren gemäß Anspruch 14, wobei der Trimmschritt ferner umfasst: Abtasten von Rohdaten innerhalb des Sub-Cluster von den Enden zum Zentrum; Identifizieren, wo die Intensitäten über einen Schwellenwert an jedem Ende hinausgehen als einen neuen Endpunkt; Verwerfen der Daten außerhalb der neuen Endpunkte.
  16. Verfahren gemäß Anspruch 15, wobei der Schwellenwert ein Vierfaches der Standardabweichung des Sub-Clusters ist.
  17. Verfahren gemäß Anspruch 9, wobei die Schwellenwertqualität auf einer Korrelation zwischen einer Anpassung des Sub-Clusters und einer vordefinierten Kurve basiert.
  18. Verfahren gemäß Anspruch 17, wobei die vordefinierte Kurve eine Bi-Gauß-Kurve ist.
  19. Verfahren gemäß Anspruch 17, wobei die Schwellenwert-Korrelation 0,6 ist.
  20. Verfahren gemäß Anspruch 18, wobei die Schwellenwert-Korrelation 0,8 ist.
  21. Verfahren gemäß Anspruch 3, wobei der Filterungsschritt einen Infinite Impulse Response Filter verwendet.
  22. Verfahren gemäß Anspruch 3, wobei der Filterungsschritt umfasst: Identifizieren des größten Peaks in den Daten; Schätzen der Halbwertsbreite des identifizierten Peaks; Abgleichen der geschätzten Halbwertsbreite mit einer Look-up-Tabelle, um einen oder mehrere optimierte Filterkoeffizienten zu identifizieren; Glätten der Daten auf Grundlage der optimierten Filterkoeffizienten; und Identifizieren einer Rauschzahl für jedes Cluster.
  23. Verfahren gemäß Anspruch 22, wobei die optimierten Filterkoeffizienten eine Gruppe von Vorwärts- und Rückwärts-Infinite Impulse Response Filter-Koeffizienten zweiter Ordnung sind.
  24. Verfahren gemäß Anspruch 23, wobei die Rauschzahl die Standardabweichung des Residuums zwischen den geglätteten Daten und den Rohdaten ist.
  25. Verfahren gemäß Anspruch 24, worin die Rauschzahl zu jedem der Sub-Cluster, die von einem Cluster abgeleitet sind, zugeordnet wird.
  26. Verfahren gemäß Anspruch 23, wobei die Berechnung der optimierten Koeffizienten nach den folgenden Schritten erfolgt: Bilden von gaußförmigen Peaks bei jeder erwarteten Halbwertsbreite. Hinzufügen von Rauschen an die gaußförmigen Peaks, um so rauschende gaußförmige Peaks zu erhalten; und Optimieren der gaußförmigen Peaks, um die Filterkoeffizienten so anzupassen, dass das Residuum zwischen den rauschenden gaußförmigen Peaks und den gaußförmigen Peaks wesentlich verringert wird.
  27. Verfahren gemäß Anspruch 26, wobei der Optimierungsschritt einen nichtlinearen Levenburg-Marquardt-Prozess verwendet.
  28. Verfahren gemäß Anspruch 3, wobei die Cluster Peaks und Tiefpunkte aufweisen und der Unterteilungsschritt ferner umfasst: Identifizieren jeder Instanz innerhalb eines gefilterten Clusters, wobei ein Tiefpunkt zwischen zwei Peaks ein Minimum hat, das weniger als eine definierte Intensität der zwei Peaks aufweist; und Trennen der Cluster in Sub-Cluster auf der Grundlage von jeder ermittelten Instanz, falls vorhanden.
  29. Verfahren gemäß Anspruch 20, wobei die definierte Intensität bei der Hälfte der Intensität oder bei etwa der Hälfte der Intensität von einem Peak oder von beiden der zwei Peaks liegt.
  30. Verfahren gemäß Anspruch 3, wobei der Analyseschritt ferner umfasst: Bestimmen von signifikanten Faktoren für die Faktorenanalyse; und Bereitstellen von anfänglichen Seed-Schätzungen dieser Faktoren
  31. Verfahren gemäß Anspruch 30 ferner umfassten: Eliminieren von Peaks minderer Qualität.
  32. Verfahren gemäß Anspruch 3, wobei der Analyseschritt ferner umfasst: Auswählen eines Basis-Peaks unter den Daten; Auswerten und Korrelieren aller lokaler Daten mit dem Basis-Peak; Zusammensetzen von lokalen Daten, die einen vorbestimmten Minimum-Korrelationswert aufweisen mit dem Basis-Peak, um einen Faktor zu erzeugen; und Schätzen der Spektren für den Faktor.
  33. Verfahren gemäß Anspruch 32, wobei der Basis-Peak manuell ausgewählt wird.
  34. Verfahren gemäß Anspruch 32, wobei der intensivste Sub-Cluster-Peak im Datensatz als Basis-Peak ausgewählt wird.
  35. Verfahren gemäß Anspruch 32, wobei der Minimum-Korrelationswert 0,6 ist.
  36. Verfahren gemäß Anspruch 34 ferner umfassend: A) Wenn der Basis-Peak identifiziert ist, Auswählen des intensivsten Peaks in den restlichen Daten als nächsten Faktor; B) Nachdem Schritt (A) erfolgt ist, Auswählen des zweitstärksten Peaks in den restlichen Daten als nächsten Faktor; und C) Wiederholen von Schritt (B), bis alle Sub-Cluster mit Faktoren belegt sind.
  37. Verfahren gemäß Anspruch 32 ferner umfassend: Vergleichen von einer oder mehreren Korrelations-Schwellenwerten und einem zugehörigen Konfidenzintervall, um die lokalen Daten, die beim Zusammensetzungsschritt zusammengesetzt wurden, aber nicht hätten zusammengesetzt werden sollen, in getrennte Faktoren zu zerlegen.
  38. Verfahren gemäß Anspruch 37, wobei der Vergleichsschritt ferner umfasst: Auswählen des intensivsten Sub-Clusters im Faktor; Bestimmen einer Korrelation zwischen dem Basis-Sub-Cluster und mindestens einem der anderen Sub-Cluster im Faktor; Bestimmen eines Scheitelpunkt-Konfidenzintervalls für mindestens einen der Sub-Cluster; Gruppieren der Sub-Cluster, die Folgendes aufweisen: (i) überlappende Basis-Peaks, und (ii) eine Korrelation zum Basis-Peak, die größer ist als der definierte Korrelations-Schwellenwert, wobei jede der Gruppierungen Faktoren sind.
  39. Verfahren gemäß Anspruch 37 ferner umfassend: Berechnen eines durchschnittlichen Konzentrationsprofils für jeden Faktor
  40. Verfahren gemäß Anspruch 39, wobei der Berechnungsschritt Multivariate Kurven Resolution-Methoden anwendet, um das durchschnittliche Konzentrationsprofil für jeden Faktor zu bestimmen.
  41. Verfahren gemäß Anspruch 40, wobei das errechnete durchschnittliche Konzentrationsprofil als geschätzte Peakform für jeden Faktor genutzt wird.
  42. Verfahren gemäß Anspruch 39, ferner umfassend: Messen der Peak-Qualität des durchschnittlichen Konzentrationsprofils; und Entfernen von Daten, die eine Peak-Qualität von weniger als einer Schwellenwert-Peak-Qualität aufweisen.
  43. Verfahren gemäß Anspruch 42, wobei der Messschritt durch eine Bestimmung der Residuumabweichung von der Form eines jeden Konzentrationsprofils bestimmt wird.
  44. Verfahren gemäß Anspruch 43, wobei die Abweichung die Standard-Abweichung in einem Bi-Gaußschen System ist.
  45. Verfahren gemäß Anspruch 44, wobei die Schwellenwert-Peak-Qualität 0,5 ist.
  46. Verfahren gemäß Anspruch 45, wobei der Eingabe-Korrelationsparameter manuell eingegeben wird.
  47. Verfahren gemäß Anspruch 41, ferner umfassend: Vergleichen der geschätzten Peakform mit mindestens einer vorausgewählten Kurve.
  48. Verfahren gemäß Anspruch 47, ferner umfassend: Normieren der geschätzten Peakform vor dem Vergleichsschritt, um eine normierte geschätzte Peakform zu definieren.
  49. Verfahren gemäß Anspruch 48, wobei der Normierungsschritt mindestens ein Verkleinern und ein Vergrößern durch eine Re-Sampling Methode und ein nachfolgendes Zentrieren der geschätzten Peakform, um die Weite und die Mitte von mindestens einer der vorausgewählten Kurven abzugleichen, umfasst.
  50. Verfahren gemäß Anspruch 48, ferner umfassend: Berechnen der Korrelation zwischen der normierten Peakform und mindestens einer vorausgewählte Kurve.
  51. Verfahren gemäß Anspruch 50, wobei die Schiefwerte und die Kurtosiswerte für den optimalen Abgleich als Start für die Optimierung ausgewählt werden.
  52. Verfahren gemäß Anspruch 47, wobei die mindestens eine vorausgewählte Kurve durch eine Pearson Typ IV Funktion erzeugt wird.
  53. Verfahren gemäß Anspruch 52, wobei die mindestens eine vorausgewählte Kurve Permutationen von mindestens einer der Schief- und der Kurtosiswerte sind, während die übrigen Parameter so konstant gehalten werden, damit die Peakformen danach aufgezeichnet und für jede Permutation gespeichert werden.
  54. Verfahren gemäß Anspruch 1, ferner umfassend: Überprüfen der Daten nach Informationen, die mit entweder einem Isotop oder einem Addukt oder beiden assoziiert sind; Auswählen der assoziierten Daten; Klassifizieren der assoziierten Daten; und wenn die assoziierten Daten klassifiziert sind, diesen einen Faktor zuordnen.
  55. Verfahren gemäß Anspruch 54, wobei der Klassifizierungsschritt umfasst: Berechnen einer Korrelation der Daten gegen einen Faktor; und wenn die Korrelation größer als die Minimum-Korrelation ist, diesen einen Faktor zuordnen.
  56. Verfahren gemäß Anspruch 55, wobei die Minimum-Korrelation 0,9 ist.
  57. Verfahren gemäß Anspruch 37, ferner umfassend: Identifizieren von Isotopen/Addukten, die fälschlicherweise mit einem Faktor gruppiert sind; und diesen Isotopen/Addukten einen richtigen Faktor neu zuordnen.
  58. Verfahren gemäß Anspruch 57, wobei der Identifizierungsschritt umfasst: Vergleichen eines Konzentrationsprofils eines Faktors mit einem Konzentrationsprofil eines benachbarten Faktors, um eine Korrelation zu identifizieren; Wenn die Korrelation zwischen dem Konzentrationsprofil eines ersten Faktors und das eines benachbarten Faktors größer als eine Schwellenwert-Korrelation ist, Überprüfen des benachbarten Faktors nach dort befindlichen Isotopen/Addukten aus dem ersten Faktor; und Neuzuordnen der Isotope/Addukte zum ersten Faktor auf Grundlage des Überprüfungsschritts.
  59. Verfahren gemäß Anspruch 58, wobei die Schwellenwert-Korrelation 0,9 ist.
  60. Verfahren gemäß Anspruch 37, wobei der Korrelationsparameter benutzerdefiniert ist.
  61. Verfahren gemäß Anspruch 37, ferner umfassend: Vermeiden von Faktor-Splitting.
  62. Verfahren gemäß Anspruch 61, wobei der Vermeidungsschritt umfasst: Bestimmen eines lokalen Korrelations-Schwellenwerts, der auf einer durchschnittlichen Korrelation zwischen einem Basis-Isotop/Addukt Sub-Cluster innerhalb eines Faktors und den anderen Sub-Clustern im Faktor basiert; Korrelieren des Konzentrationsprofils des Faktors und des proximaten Faktors; und wenn die Korrelation größer als ein lokaler Korrelations-Schwellenwert ist, Zusammenführen des Faktors mit dem proximaten Faktor.
  63. Verfahren gemäß Anspruch 62, ferner umfassend: Wenn ein Faktor zusammengeführt ist, Korrelieren des Konzentrationsprofils des Faktors mit dem nächsten proximaten Faktor.
  64. Verfahren gemäß Anspruch 62, wobei die Schwellenwert-Korrelation 0,9 ist.
  65. Verfahren gemäß Anspruch 62, wobei die Mindest-Cluster-Länge 5 Sticks ist.
DE112012001185.6T 2011-03-11 2012-03-12 Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen Expired - Fee Related DE112012001185B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161451952P 2011-03-11 2011-03-11
USUS-61/451,952 2011-03-11
PCT/US2012/028754 WO2012125548A2 (en) 2011-03-11 2012-03-12 Systems and methods to process data in chromatographic systems

Publications (2)

Publication Number Publication Date
DE112012001185T5 true DE112012001185T5 (de) 2014-01-02
DE112012001185B4 DE112012001185B4 (de) 2014-08-28

Family

ID=45856043

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012001185.6T Expired - Fee Related DE112012001185B4 (de) 2011-03-11 2012-03-12 Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen

Country Status (5)

Country Link
US (1) US10488377B2 (de)
JP (1) JP5941073B2 (de)
CN (1) CN103718036B (de)
DE (1) DE112012001185B4 (de)
WO (1) WO2012125548A2 (de)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150046096A1 (en) * 2012-01-16 2015-02-12 Leco Corporation Systems and Methods to Process and Group Chromatographic Peaks
JP6077568B2 (ja) * 2012-01-16 2017-02-08 レコ コーポレイションLeco Corporation クロマトグラフィーシステムでのデータを処理するためのシステム及び方法
US10802000B2 (en) 2013-03-15 2020-10-13 Dionex Corporation Method of calibrating a chromatography system
JP6079511B2 (ja) * 2013-09-02 2017-02-15 株式会社島津製作所 ピーク抽出方法及びプログラム
US9754774B2 (en) 2014-02-14 2017-09-05 Perkinelmer Health Sciences, Inc. Systems and methods for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets
WO2016002047A1 (ja) * 2014-07-03 2016-01-07 株式会社島津製作所 質量分析データ処理装置
CN105334279B (zh) * 2014-08-14 2017-08-04 大连达硕信息技术有限公司 一种高分辨质谱数据的处理方法
US9804136B2 (en) 2014-09-18 2017-10-31 Dionex Corporation Automated method of calibrating a chromatography system and analysis of a sample
CN107209156B (zh) * 2015-02-05 2020-06-09 Dh科技发展私人贸易有限公司 经由曲线减法检测基于质谱的相似性
CN109507347B (zh) * 2017-09-14 2021-01-29 湖南中烟工业有限责任公司 一种色谱峰选择方法
US11244818B2 (en) 2018-02-19 2022-02-08 Agilent Technologies, Inc. Method for finding species peaks in mass spectrometry
CN108614064B (zh) * 2018-04-10 2019-07-16 华南理工大学 一种二维色谱峰的检测方法及其应用
CN108614284B (zh) * 2018-04-24 2022-04-05 北京邮电大学 一种定位信号处理方法、装置及设备
CN109001354B (zh) * 2018-05-30 2020-09-04 迈克医疗电子有限公司 波峰识别方法和装置、色谱分析仪及存储介质
JP6620189B2 (ja) * 2018-06-08 2019-12-11 パーキンエルマー・ヘルス・サイエンシーズ・インコーポレイテッドPerkinelmer Health Sciences, Inc. 単一粒子誘導結合プラズマ質量分析における出力および類似データセットの自動化された分析のためのシステムおよび方法
US10784093B1 (en) 2019-04-04 2020-09-22 Thermo Finnigan Llc Chunking algorithm for processing long scan data from a sequence of mass spectrometry ion images
GB201907792D0 (en) * 2019-05-31 2019-07-17 Thermo Fisher Scient Bremen Gmbh Deconvolution of mass spectromerty data
DE102021103389A1 (de) 2021-02-12 2022-08-18 Dionex Softron Gmbh Verfahren und Systeme zum Bestimmen einer Charakteristik eines von einer Pumpe zugeführten Fluids
JP7369279B2 (ja) * 2021-02-25 2023-10-25 華譜科儀(大連)科技有限公司 クロマトグラフィー分析システム、クロマトグラムの検出分析方法及び電子機器
CN113567603B (zh) * 2021-07-22 2022-09-30 华谱科仪(大连)科技有限公司 色谱谱图的检测分析方法及电子设备
CN116242954A (zh) * 2023-05-06 2023-06-09 精智未来(广州)智能科技有限公司 一种呼气分子分析气相色谱数据的自动化分析方法与系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3488518A (en) 1965-12-13 1970-01-06 Ibm Peak voltage storage and noise eliminating circuit
JP4865981B2 (ja) * 2000-09-08 2012-02-01 ウォーターズ・テクノロジーズ・コーポレーション 検出器応答プロフィールの境界を決定し、かつプロセスを制御するための方法および装置
US6787761B2 (en) 2000-11-27 2004-09-07 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
AU2003262188A1 (en) * 2002-04-12 2003-10-27 Northeastern University Matched filtration with experimental noise determination for denoising, peak picking and quantitation in lc-ms
US6983213B2 (en) * 2003-10-20 2006-01-03 Cerno Bioscience Llc Methods for operating mass spectrometry (MS) instrument systems
GB2404194A (en) * 2003-07-21 2005-01-26 Amersham Biosciences Ab Automated chromatography/mass spectrometry analysis
CA2501003C (en) * 2004-04-23 2009-05-19 F. Hoffmann-La Roche Ag Sample analysis to provide characterization data
FI20055252A (fi) 2005-05-26 2006-11-27 Valtion Teknillinen Analyysitekniikoita nestekromatografiaa/massaspektrometriaa varten
US7781729B2 (en) * 2006-05-26 2010-08-24 Cerno Bioscience Llc Analyzing mass spectral data
US7653496B2 (en) * 2006-02-02 2010-01-26 Agilent Technologies, Inc. Feature selection in mass spectral data
JP5542433B2 (ja) * 2006-05-26 2014-07-09 ウオーターズ・テクノロジーズ・コーポレイシヨン イオン検出およびn次元データのパラメータ推定
US7501621B2 (en) 2006-07-12 2009-03-10 Leco Corporation Data acquisition system for a spectrometer using an adaptive threshold
AU2008240143B2 (en) * 2007-04-13 2013-10-03 Agena Bioscience, Inc. Comparative sequence analysis processes and systems
JP2009008582A (ja) * 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
US8139833B2 (en) * 2008-04-09 2012-03-20 Boris Fain Analyzing large data sets using a computer system
US8631057B2 (en) 2009-08-25 2014-01-14 International Business Machines Corporation Alignment of multiple liquid chromatography-mass spectrometry runs
EP2322922B1 (de) * 2009-08-26 2015-02-25 Thermo Fisher Scientific (Bremen) GmbH Verfahren zur Verbesserung der Auflösung von Verbindungen, die von einer Chromatografievorrichtung abgegeben werden

Also Published As

Publication number Publication date
WO2012125548A2 (en) 2012-09-20
JP5941073B2 (ja) 2016-06-29
DE112012001185B4 (de) 2014-08-28
US10488377B2 (en) 2019-11-26
CN103718036B (zh) 2016-06-01
US20140088923A1 (en) 2014-03-27
CN103718036A (zh) 2014-04-09
WO2012125548A3 (en) 2012-12-20
JP2014507672A (ja) 2014-03-27

Similar Documents

Publication Publication Date Title
DE112012001185B4 (de) Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen
DE112012005677T5 (de) Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.
DE112011102013B4 (de) Verfahren für die lonenmobilitätsspektrometrie
DE112004001811B4 (de) Verfahren zum Bearbeiten und Speichern von Massenspektrometriedaten
DE102014012745B4 (de) Hintergrundkorrektur in Emissionsspektren
EP1846757B1 (de) Verfahren und system zur massenspektrenanalyse
WO2001086819A9 (de) Verfahren und vorrichtung zur kompression und/oder dekompression sowie zur analyse und darstellung von daten
EP3526704A1 (de) Verfahren zum auswerten von daten einer massenspektrometrie und massenspektrometrisches verfahren sowie ein maldi tof massenspektrometer
DE10392707B4 (de) Verfahren zur Verwendung von Datenbinning bei der Analyse von Chromatographie-/Spektrometriedaten
DE4317246A1 (de) Verfahren und Vorrichtung für die Dekonvolution von nicht aufgelösten Daten
DE102013224310A1 (de) Verfahren und System zum Erhöhen eines dynamischen Nutzbereichs einer Spektrometrievorrichtung
CN110503060B (zh) 一种光谱信号去噪方法及其系统
JP2015503763A5 (de)
DE102012205686B3 (de) Verfahren zur Substanzidentifizierung und zugehöriges Computerprogrammprodukt
EP2206075A2 (de) Detektor und verfahren zum erkennen einer fahrspurbegrenzung
EP3159681A1 (de) Verfahren und vorrichtung zur automatisierbaren ermittlung der bestimmungsgrenze und des relativen fehlers bei der quantifizierung der konzentration einer zu untersuchenden substanz in einer messprobe
DE102005009195B4 (de) Verfahren und Vorrichtung zum Korrigieren eines Spektrums
EP2460003B1 (de) Verfahren zur filterung eines chromatogramms
DE102019109771A1 (de) Auswertung komplexer Massenspektrometrie-Daten von biologischen Proben
DE102021117017A1 (de) Peakbreitenabschätzung in massenspektren
EP2446640B1 (de) Vorrichtung und verfahren zur bestimmung eines abtastratenunterschiedes
EP1273007A1 (de) Verfahren zur bestimmung eines charakteristischen datensatzes für ein datensignal
DE102014012367B3 (de) Verfahren zum Bestimmen der Konzentration von Glucoraphanin und/oder von Sulforaphan in einer Pflanze
DE102013207402A1 (de) Verfahren zum rechnergestützten Verarbeiten von räumlich aufgelösten Hyperspektraldaten, insbesondere von Massenspektrometriedaten
DE102007059461A1 (de) Verfahren zur Auswertung analytbezogener Signale aus einem mittels der Ionenbeweglichkeitsspektrometrie aufgenommenen IMS-Chromatogramm

Legal Events

Date Code Title Description
R082 Change of representative

Representative=s name: COHAUSZ & FLORACK PATENT- UND RECHTSANWAELTE P, DE

R012 Request for examination validly filed

Effective date: 20140107

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G01N0030860000

Ipc: C40B0020060000

Effective date: 20140313

R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: C40B0020060000

Ipc: G01N0030860000

R018 Grant decision by examination section/examining division
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G01N0030860000

Ipc: C40B0020060000

Effective date: 20140710

Free format text: PREVIOUS MAIN CLASS: C40B0020060000

Ipc: G01N0030860000

Effective date: 20140613

R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee