DE112012005677T5 - Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen. - Google Patents

Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen. Download PDF

Info

Publication number
DE112012005677T5
DE112012005677T5 DE112012005677.9T DE112012005677T DE112012005677T5 DE 112012005677 T5 DE112012005677 T5 DE 112012005677T5 DE 112012005677 T DE112012005677 T DE 112012005677T DE 112012005677 T5 DE112012005677 T5 DE 112012005677T5
Authority
DE
Germany
Prior art keywords
peak
data
factor
peaks
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112012005677.9T
Other languages
English (en)
Inventor
Jihong Wang
Peter Markel Willis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leco Corp
Original Assignee
Leco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2012/028754 external-priority patent/WO2012125548A2/en
Application filed by Leco Corp filed Critical Leco Corp
Publication of DE112012005677T5 publication Critical patent/DE112012005677T5/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

Es wird ein System und Verfahren für die Verarbeitung von Daten in chromatographischen Systemen beschrieben. In einer Ausführungsform umfasst das System und Verfahren das Verarbeiten von Daten, welche durch ein chromatographisches System erstellt werden, das Erzeugen von verarbeitenden Daten, das Analysieren der verarbeiteten Daten, und das Erstellen und Bereitstellen von Ergebnissen auf Grundlage der verarbeiteten Daten.

Description

  • PRIORITÄTSANSPRUCH
  • Diese Anmeldung beansprucht die Priorität der internationalen Anmeldung Nr. PCT/US2012/028754, eingereicht am 12. März 2012 und der U.S. Provisional Anmeldung mit der Seriennr. 61/587,041, eingereicht am 16. Januar 2012. Jede der obigen Anmeldungen wird hiermit vollständig durch Verweis eingeschlossen.
  • TECHNISCHES FELD
  • Diese Offenbarung bezieht sich auf Datenverarbeitungstechniken für Daten, welche in chromatographischen Massenspektrometriesystemen erhalten werden.
  • HINTERGRUND
  • Es ist bekannt, dass chromatographische Massenspektrometer große Mengen an Daten erzeugen und dass viele dieser Daten aus Rauschen und ungewollten Informationen bestehen. Es werden Systeme und Verfahren gewünscht, welche effizient und genau relevante Informationen von Rauschen unterscheiden und diese auf effiziente Weise mit hoher Auflösung verarbeiten.
  • ZUSAMMENFASSUNG
  • Ein System und ein Verfahren für die Verarbeitung von Daten in chromatographischen Systemen werden beschrieben. In einer Ausführungsform umfasst das System und das Verfahren das Verarbeiten von durch ein chromatographisches System erzeugten Daten zum Erzeugen verarbeiteter Daten, Analysieren der verarbeiteten Daten, und Erstellen und Bereitstellen von Ergebnissen auf Grundlage der verarbeiteten Daten.
  • BESCHREIBUNG DER ZEICHNUNGEN
  • 1 zeigt einen allgemeinen Prozess bezogen auf Faktoranalysetechniken zur Identifizierung und Entfaltung chromatographischer Peaks nach einer Ausführungsform, die in dieser Offenbarung beschrieben ist;
  • 2 ist ein allgemeines Blockdiagramm eines Gaschromatographie-, Massenspektrometriesystems;
  • 3 zeigt ein Merkmal der Technik gemäß einer Ausführungsform;
  • 4 zeigt ein beispielhaftes Verfahren für die Vorverarbeitung von Daten von einem Datenerfassungssystem gemäß einer Ausführungsform;
  • 5 zeigt ein beispielhaftes Verfahren der Baselinekorrektur (baseline correction) gemäß einer Ausführungsform dar;
  • 6 identifiziert eine beispielhafte Ausführungsform eines Filterprozesses;
  • 7 zeigt einen repräsentativen Prozess, um wesentlich optimierte Koeffizienten gemäß den Grundsätzen laut der obigen Offenlegung zu identifizieren;
  • 8 zeigt einen repräsentativen Prozess gemäß einer Ausführungsform, der verwendet werden kann, um Peakformen von Subclustern zu klassifizieren;
  • 9 zeigt ein Verfahren, in dem gemäß einer Ausführungsform allgemein überschüssige Daten aus Subclustern entfernt werden können, um die Daten zu verfeinern;
  • 10 zeigt einen repräsentativen Prozess zur Identifizierung geteilter Massen (shared masses);
  • 11 zeigt ein Seeding-Verfahren nach Aspekten der hierin beschriebenen Ausführungsformen;
  • 12 zeigt einen Prozess für die Faktoridentifizierung gemäß den beschriebenen Ausführungsformen;
  • 13 zeigt einen Vergleich von M versus der Peakkorrelationsgrenze in einem System;
  • 14 zeigt graphisch M versus die Peakkorrelationsgrenze, in einer Ausführungsform; und
  • 15 stellt ein Verfahren bereit, um Faktorsplitting zu vermeiden;
  • 16 zeigt einen allgemeinen Prozess gemäß einer Ausführungsform, die in dieser Offenbarung beschrieben wird, der sich auf die Peakgruppierung bezieht;
  • 17 zeigt ein beispielhaftes Verfahren zur Bestimmung von Peak-Mittelwerten und Peak-Standardabweichungen, gemäß einer Ausführungsform;
  • 18 zeigt ein Verfahren gemäß einer Ausführungsform, zur Bestimmung, ob die mittleren Retentionszeiten eines ersten Peaks und eines zweiten Peaks im Wesentlichen gleich sind; und
  • 19 zeigt ein beispielhaftes Verfahren für die Bestimmung gemäß einer Ausführungsform, ob die Varianz eines ersten Peaks und eines zweiten Peaks im Wesentlichen gleich sind;
  • Gleiche Bezugszeichen in den unterschiedlichen Zeichnungen zeigen gleiche Elemente an.
  • DETAILBESCHREIBUNG
  • Bezüglich 1 wird ein beispielhaftes Verfahren für Faktoranalysetechniken offenbart, welche chromatographische Peaks von einem Chromatographie-, Massenspektrometriesystem identifizieren und entfalten. Es versteht sich, dass dieses Verfahren in allen Arten von chromatographischen Systemen verwendet werden können, einschließlich Flüssigkeit und Gas. In einer Ausführungsform, und wie dargestellt, umfasst das Verfahren die Schritte von (i) Vorverarbeiten von Daten, die von einem Analysesystem empfangen wurden (S200), (ii) Analysieren der vorverarbeiteten Daten (S300), (iii) Verarbeiten der Daten assoziiert mit Isotopen oder Addukten, von denen angenommen wird, dass sie in den Daten vorhanden sind (S400); und (v) Erstellen und Bereitstellen entsprechender Ergebnisse (S500).
  • In einer Ausführungsform werden Daten für die Analyse durch ein Datenerfassungssystem bereitgestellt, welches mit einem Massenspektrometer verbunden ist. Zum Zweck dieser Offenbarung versteht es sich, dass die Datenerfassung ein System gemäß U.S. 7,501,621 , U.S. 7,825,373 , und U.S. 7,884,319 sein kann.
  • Weiterhin können vor dem Unterziehen einer solchen Analyse die Daten aus dem Datenerfassungssystem angepasst werden, wie in der vorläufigen U.S.-Patentanmeldung mit Seriennr. 61/445,674 beschrieben. Das Obige und alle Patente und Anmeldungen auf die verwiesen wird, werden hierin durch Verweis vollständig eingeschlossen. Wo eine Definition oder Verwendung eines Begriffs in einer eingeschlossenen Referenz einer hierin eingeschlossenen Definition des Begriffs entgegensteht, gilt die Definition dieses Begriffs in diesem Dokument, und die Definition dieses Begriffs in der Referenz hat keine Gültigkeit.
  • Zusammenfassend wandelt das obige Datenerfassungssystem allgemein Rohdaten von einem Massenspektrometriesystem in Schwerpunkt-Massenspektren, bezeichnet als ”Sticks” um, von denen jedes einen Ionenpeak darstellt, und aus einer Intensität, einem genauen Massewert und einem Masseauflösungswert besteht. Während des Aufbaus der Sticks wurden die Rohdaten aus dem Analog-Digital Konverter im Größenbereich von 104 oder 105:1 komprimiert und eine große Mehrzahl des Erfassungsrauschens und der redundanten Informationen wurden entfernt. Das Ergebnis sind sehr wenige zweidimensionale Daten, wobei jedoch noch immer chemisches Hintergrundrauschen verbleiben kann, weil das Ziel dieses Datenerfassungssystems ist, alle Ioneninformationen an die nachfolgenden Verarbeitungsstufen weiterzuleiten. Als Nächstes werden die Sticks für drift-korrigiert und in Clustern statistisch ähnlicher Massen in angrenzenden Retentionszeitscans gesammelt.
  • In einer Ausführungsform werden Cluster ähnlicher Intensitätsprofile als repräsentativ für verschiedene Isotope, Addukte und Fragmente der molekularen Verbindungen, welche aus der chromatographischen Säule eluiert werden, betrachtet. Weiterhin gibt es Cluster von Hintergrundionen ohne chromatographische Struktur, die aus einer Vielzahl von Quellen stammen, wie etwa Säulenbluten (column bleeding), mobilen Phasenverunreinigungen (mobile phase contamination), atmosphärischen Verunreinigungen, usw. Ein Clusterfilter kann angewandt werden, um Cluster mit weniger als einem gewünschten minimalen Signal-Rausch-Verhältnis (Rauschabstand) zu entfernen, und die verbleibenden Cluster werden dann zur weiteren Analyse an ein Verarbeitungssystem geschickt.
  • Es versteht sich basierend auf den Inhalten dieser Offenlegung, dass in jedem Stadium der Datenverarbeitung die Retention von guten Informationen üblicherweise auf Kosten der Retention von etwas verbleibendem Rauschen bevorzugt wird, wie in 3 dargestellt. Allgemein hat das beschriebene System die Rauschmenge optimiert, welche behalten wird, um die Datenintegrität zu erhalten.
  • 4 stellt ein beispielhaftes Verfahren für die Vorverarbeitung der Daten dar, welche das Verarbeitungssystem von dem Datenerfassungssystem empfangen hat. In einer Ausführungsform umfasst die Verarbeitung (S200) die Schritte Trennen langer Cluster von kurzen Clustern und eine Baselinekorrektur der langen Cluster (S210), Filtern der Daten zum Glätten der Daten (S220), Unterteilen der gefilterten Cluster in Subcluster (S230) und Klassifizieren (qualifying) der Subcluster (S240). In einer Ausführungsform kann die Klassifizierung der Subcluster mindestens entweder eine Klassifizierung der Peakform umfassen oder eine Klassifizierung des Rauschabstands umfassen, wie jeweils nachfolgend ausführlicher besprochen.
  • Es wurde festgestellt, dass lange Cluster eine Zeitdauer von annähernd der Länge der gesamten Analyse haben können, und dass die meisten dieser langen Cluster Hintergrundionen sind, die effektiv die Ergebnisse beeinträchtigen können, wenn sie nicht korrekt gehandhabt werden. Lange Cluster sind oft auch relativ intensiv und sind üblicherweise mit starker Rauschen verbunden. Da jedoch einige dieser Daten auch wünschenswerte chromatographische Daten aufgrund eines Beitrags einer geteilten Masse einer eluierenden Verbindung enthalten können, kann es vorzuziehen sein, eine weitere Analyse des langen Clusters durchzuführen, statt sie komplett zu extrahieren. Aufgrund der erhöhten Intensität können diese langen Cluster in einer Ausführungsform zunächst eine Baselinekorrektur durchlaufen.
  • Ein Verfahren für diese Baselinekorrektur wird nun offenbart. In einer Ausführungsform und wie in 5 dargestellt, können die Schritte für die Durchführung einer Baselinekorrektur der Daten folgende Prozedur umfassen: Trennen der Daten in Blöcke, wobei die Länge jedes Blocks als Vielfaches der erwarteten „vollen Breite und halben Höhe” (full-width half-height) der chromatographischen Daten (S211) ist, Schätzen der Intensität der Baseline in der Mitte eines Blocks basierend auf der Intensität der Baseline im unteren Quartil des Blocks (S212), lineares Interpolieren zwischen den obigen Quartilpunkten mit gleichem Abstand mit dem Ergebnis einer Baselineschätzung (S213), Abschneiden der Daten über der Baseline auf die Baselineebene und Erhalten der Daten unter der Baseline (S214), Glätten der Kurve der abgeschnittenen Daten zum Erhalt einer verbesserten Version der Baseline (S215) und Wiederholen der Schritte (S214) und (S215) bis alle oder im Wesentlichen alle Daten innerhalb einer Mindesttoleranz über die geglättete Baseline fallen. Die obige Baselinekorrektur kann an jedem gewünschten getrennten Block durchgeführt werden, der in einer Ausführungsform alle oder im Wesentlichen alle getrennte Blöcke umfassen kann. Gleichermaßen kann die Korrektur auf jeden langen Cluster angewandt werden, welcher in einer Ausführungsform alle oder im Wesentlichen alle langen Cluster umfassen kann.
  • In einer Ausführungsform wird die Länge des Blocks im Schritt (S211) als fünf (5) mal die erwartete „volle Breite und halbe Höhe” der chromatographischen Daten geschätzt wobei jedoch auf Grundlage dieser Offenlegung beachtet wird, dass die Länge auch mehr oder weniger als fünf (5) mal dieser Betrag sein kann.
  • Wie besprochen umfasst das Abschneiden der Daten (S214) das Glätten der Kurve der abgeschnittenen Daten. In einer Ausführungsform wird ein Savitzky-Golay-Glättungsalgorithmus eingesetzt, um den Glättungsschritt bereitzustellen. Andere Glättungsalgorithmen können eingesetzt werden, und die Erfindung sollte dadurch nicht eingeschränkt werden.
  • Mit weiterem Verweis auf 4 können die Daten als Nächstes gefiltert werden, um Rauschen (S220) zu entfernen. Eine Ausführungsform eines solchen Filterprozesses wird in 6 dargestellt. In einer Ausführungsform und wie besprochen, wird ein Infinite Impulse-Response-Filter zur Durchführung dieses Schritts verwendet, wobei jedoch auf Grundlage dieser Inhalte zu beachten ist, dass der Filter durch andere Filtertypen ersetzt werden kann, wie etwa durch einen Finite Impulse-Response-Filter. Unter weiterem Verweis auf 6 wird der größte Peak innerhalb der Daten identifiziert, und die ganze Breite, halbe Höhe dieses Peaks wird geschätzt (S221). Dieser geschätzte Wert wird mit einer vordefinierten Nachschlagetabelle verglichen, um einen Satz Eingangssignal-(forward) und Ausgangssignal-(reverse)Infinite Impulse-Response-Filter-Koeffizienten der zweiten Ordnung zu erkennen, welche auf die Glättung chromatographischer Peaks auf Grundlage der vollen Breite und halben Höhe hin optimiert sind (S222). Unter Verwendung der identifizierten, optimierten Koeffizienten, welche in (S222) abgeleitet wurden, werden die Daten geglättet (S223). Als Nächstes werden die geglätteten Daten mit den Rohdaten verglichen, um eine Rauschzahl für jeden Cluster (S224) zu identifizieren. In einer Ausführungsform wird die Rauschzahl für jeden Cluster als Standardabweichung des Residuums zwischen den geglätteten Daten und den Rohdaten berechnet. Zu Zwecken, welche auf Grundlage dieser Offenbarung noch ersichtlich werden, wird die so erhaltene Rauschzahl jedem der Subcluster zugeordnet, welche von einem Cluster (S230) entsprechend abgeleitet wurden. Dieses Verfahren stellt eine Maximum-Like Likelihood-Schätzung kleinster Quadrate bereit, was eine Analyse vereinfacht, die nicht unangemessen durch Daten hoher Intensität beeinflusst wird, und es Daten geringer Intensität ermöglicht ausreichend vertreten zu sein.
  • Wie erklärt, werden in einer Ausführungsform die optimierten Koeffizienten durch die Verwendung einer Nachschlagetabelle in (S222) identifiziert. In einer Ausführungsform werden die optimierten Koeffizienten vorberechnet und in dem System für einige erwartete Werte für „volle Breite und halbe Höhe” gespeichert, bevor es zu einer Verarbeitung kommt. 7 zeigt eine Möglichkeit, wie diese Koeffizienten vorberechnet werden können.
  • Bei jeder erwarteten „vollen Breite und halben Höhe”, bilden sich mehrere reine Gaußförmige Peaks bei (S225). In einer Ausführungsform kann die Breite dieser Peaks wesentlich bei oder zwischen ca. einem Drittel (1/3) des Zielwerts für „volle Breite und halbe Höhe” bis zum Drei(3)fachen der „vollen Breite und halben Höhe” schwanken. Sie werden als Referenzpeaks gespeichert. Als nächstes wird allen oder ausgewählten Referenzpeaks in (S226) Rauschen hinzugefügt. In einer Ausführungsform kann das Rauschen weißes Rauschen sein, das nach der Gaußschen Verteilung zu den einzelnen Peaks hinzugefügt wird. Alle oder ausgewählte Peaks werden dann optimiert, um die Filterkoeffizienten in einer Weise anzugleichen, die im Wesentlichen das verbleibende Rauschen zwischen den geglätteten Rauschpeaks und Referenzpeaks in (S227) minimiert. Die Optimierung (S227) kann durch ein nichtlineares Levenberg-Marquardt Verfahren erfolgen. Während der Optimierung werden die Koeffizienten beschränkt, um eine stabile Impulsantwort zu erzeugen. Dieser Prozess wird für alle oder für ausgewählte Referenz mit „voller Breite und halber Höhe” (S228) wiederholt, und die optimierten Koeffizientenwerte werden in einer Nachschlagetabelle (S229) gespeichert. In einer Ausführungsform stellten die Impulsantworten des beispielhaft entstehenden Glättungsfilters die eines Tiefpassfilters dar, wobei die Breite der Primärkeule des Filters ca. die Hälfte des Zielwerts für die „volle Breite und halbe Höhe” ist. Mit dieser Ausführungsform können die Peakform und -struktur im Wesentlichen erhalten bleiben und die Anzahl der erkannten falschen positiven Peaks kann wesentlich minimiert werden.
  • Mit Verweis zurück auf 4, können die gefilterten Cluster in Subcluster (S230) unterteilt werden. In einer Ausführungsform werden die gefilterten Clusterdaten untersucht, um jede Instanz zu identifizieren, in der der Minimalpunkt in einem Tal (zwischen zwei Peaks oder Scheitelpunkten) weniger als eine definierte Intensität der angrenzenden Peaks beträgt. Beispielsweise kann die Peakintensität auch bei oder um die Hälfte (1/2) der Intensität einer oder beider angrenzender Peaks gewählt werden. Nach der Identifizierung werden die Täler als Clusterschnittpunkte erkannt, sodass die Cluster in einen oder mehrere Subcluster unterteilt werden. Wie zu erkennen ist, hängt die Anzahl der unterteilten Subcluster von der Anzahl der Clusterschnittpunkte eines bestimmten Clusters ab.
  • 8 stellt einen repräsentativen Prozess dar, der verwendet werden kann, um die Peakform eines Subclusters (S240) zu klassifizieren. Dieser Prozess kann helfen, sicherzustellen, dass der jeweilige Subcluster chromatographische Informationen enthält. In der Praxis können einige der Subcluster Daten enthalten, die keine chromatographischen Informationen enthalten, welche nachfolgend als Ausreißer bezeichnet werden. Es ist bevorzugt, so viele Ausreißer wie möglich aus den Daten zu extrahieren und zu entfernen, ohne relevante Daten zu verlieren. In einer Ausführungsform können eine oder mehrere der folgenden Techniken verwendet werden, um die gewünschten Subcluster von den Ausreißern zu unterscheiden: (i) Auswählen von Subclustern mit einem Rauschabstand, der größer ist, als der minimale Rauschabstand (S242), (ii) Auswählen von Subclustern mit einer Peakform, die größer ist, als die minimale Güte (quality) (S244), und (iii) Auswahl von Subcluster mit einer minimalen Clusterlänge (S246). In einer Ausführungsform wird die minimale Clusterlänge bei oder zwischen 3–8 Sticks, bei oder zwischen 4–7 Sticks, bei oder zwischen 3–7 Sticks, bei oder zwischen 4–8 Sticks, bei oder zwischen 4–6 Sticks oder 5 Sticks gewählt. Andere minimale Clusterlängen können verwendet werden. In einer Ausführungsform kann jeder dieser Trennprozesse verwendet werden. Zur einfacheren Offenbarung behandelt diese Offenbarung eine Ausführungsform, in der alle Prozesse verwendet werden, wie in 8 dargestellt. Weiterhin sollte diese Offenbarung, unabhängig davon, welche Trennprozesse verwendet werden, nicht auf die Reihenfolge beschränkt sein, in der sie verarbeitet werden.
  • Ein Beispielprozess für die Auswahl von Subclustern, die einen Rauschabstand von mehr als einem Mindestmaß oder einem Grenz-Rauschabstand (S241) haben, wird bereitgestellt. In einer Ausführungsform kann der Grenzabstand als kleinerer Wert eines hartcodierten und eines benutzerdefinierten Werts gewählt werden. Als ein Beispiel kann der Abstand bei oder um zehn (10) liegen. Unter anderem kann die Technik eingesetzt werden, bei der Rauschen als vordefiniertes Erfassungsrauschen von einem Viertel-(1/4)Ionenfläche, oder der Standardabweichung des Residuums zwischen den ursprünglichen Clusterdaten und den geglätteten Clusterdaten gemessen wird. Es versteht sich jedoch, dass Subcluster mit einem Verhältnis unterhalb des Grenzwerts noch in der Faktoranalyse verwendet werden können, wenn sie Isotope oder Addukte der klassifizierenden Peaks sind.
  • Es kann wünschenswert sein, weiterhin die Subcluster abzuschneiden, welche einen Rauschabstand über dem Grenzwert haben, da diese noch redundante Daten oder Rauschen enthalten können. Ein Trimmverfahren umfasst das Trimmen der Baseline dieses Subclusters von links und rechts des Peaks. In einer Ausführungsform werden die Rohdaten innerhalb des Subclusters von einem oder beiden Enden her zur Mitte hin gescannt – der Ort, an dem die Intensitäten (links/rechts) über einen Grenzwert ansteigen wird das neuen Ende des Subclusters, und die Baselinedaten werden verworfen. In einer Ausführungsform beträgt die Grenzintensität vier (4) Mal die Standardabweichung des Subcluster-Rauschens.
  • Wie bereits beschrieben, ist eine weitere Technik zur Identifikation gewünschter Subcluster und zur Entfernung von Ausreißern die Auswahl von Subclustern mit einer Peakform, die größer ist, als ein Mindestwert, oder eine Grenzgüte (S244). In einer Ausführungsform kann die Grenzgüte auf der Annahme basieren, dass chromatographische Peaks eine allgemeine Form besitzen, welche angemessen modelliert werden kann, vorzugsweise unter Verwendung einer bi-Gaußschen Kurve – auch wenn die Erfindung nicht auf diese Weise eingeschränkt werden soll. Eine bi-Gaußsche Kurve wird anderen Peakformen, wie einer Pearson IV, aus Gründen der Geschwindigkeit und Stabilität der Passung vorgezogen. Entsprechend wird in einer Ausführungsform und wie in 9 dargestellt jeder Subcluster zuerst an einen bi-Gaußsche Peaks (S247) angepasst. Eine Korrelation zwischen dem Subcluster und des angepassten Peaks wird identifiziert (S248). Peaks mit einer Korrelation über oder im Wesentlichen an einer Grenzkorrelation werden gewählt. Solche unterhalb der Grenzkorrelation werden als Ausreißer (S249) identifiziert. In einer Ausführungsform kann die Grenzkorrelation 0,6, vorzugsweise 0,8, betragen.
  • Da von jedem Subcluster angenommen werden kann, dass er einen einzigen chromatographische Peak enthält, wird beachtet, dass dieser aufgrund der kombinierten Informationen aus zwei oder mehreren co-eluirenden Verbindungen einen geteilten Massenverbundpeak darstellen kann. Dementsprechend kann in einer Ausführungsform ein Entfaltungsverfahren und -system optional eingesetzt werden um sicherzustellen, dass die Peaks geteilte Massen enthalten und um weiterhin Gruppen von Peaks zu identifizieren, welche sich auf einzelne Verbindungen beziehen können. Zur Identifikation solcher Peakgruppen kann der Prozess der Entfaltung an einem, mehreren oder allen chromatographischen Peaks eingesetzt werden, um zu entziffern, zu welcher Gruppierung die einzelnen analysierten Peaks gehören.
  • Wie erkennbar ist, kann ein chromatographisches System in Verbindung mit einem Massenspektrometer Massepeaks und chromatographische Peaks hervorbringen. Die Massepeaks ähneln stark Gaußschen Formen und sind allgemein nicht wesentlich verzerrt oder enthalten Rauschen im Vergleich zu chromatographischen Peaks. Als Ergebnis werden Gaußsche Modelle oft in einem Entfaltungsprozess umgesetzt, der mit der Entfaltung von Massepeaks zusammenhängt. Beispielsweise ist es bekannt, dass der Expectation-Maximization-Algorithmus (EM) auf solche Massepeaks angewandt wird.
  • Chromatographische Peaks gleichen im Gegensatz zu Massepeaks oft nicht genau Gaußschen Formen und können wesentliche Verzerrungen beim Rauschen enthalten. Dementsprechend passen die Gaußschen und bi-Gaußschen Modelle oft nicht gut zu den chromatographischen Peaks und der EM-Algorithmus hat eine schlechte Konvergenz, was an der Verschiebung (skewing) der Peaks liegt. Nicht-lineare iterative Verfahren wurden ebenfalls eingeführt, um die Peakparameter zu schätzen, aber solche Verfahren können in einem System langsam und schleppend sein.
  • Die Erfinder hiervon haben eine neue Kurvenart entwickelt, um Peaks, wie etwa die chromatographischen Peaks wie oben besprochen, zu modellieren. Zum Zweck dieser Offenbarung wird der besprochene Modell- und Kurventyp hierin als bi-exponentielles Modell oder bi-exponentielle Kurve bezeichnet. Konventionell und wie oben besprochen, wurden Gaußsche, bi-Gaußsche oder allgemeine Exponentialkurven und -Modelle verwendet. Das neue bi-exponentielle Modell teilt einen Peak am Scheitelpunkt und modelliert jede Seite des Peaks mit unabhängigen exponentiellen Kurven.
  • In einer Ausführungsform, kann das bi-exponentielle Modell wie folgt dargestellt werden:
    Figure DE112012005677T5_0002
  • Wie auf Grundlage dieser Offenbarung erkennbar wird, ist das bi-exponentielle Modell dasselbe, wie das bi-Gaußsche Modell wenn a1 und a2 jeweils auf zwei (2) gesetzt sind. Im Vergleich zu dem generalisierten exponentiellen Modell, gestattet das bi-exponentielle Modell Variationen zwischen a1 und a2.
  • Mit dem obigen Modell kann eine Peakkurve daher in einer Summierung der bi-exponentiellen Kurven wie folgt dargestellt werden:
    Figure DE112012005677T5_0003
  • In einem hochauflösenden Flugzeit-Massenspektrometer unterscheidet sich die Peakform der geteilten Massen nur in Intensität und Ort, sodass dies alles oft typisch ist, dass alle P-Peaks allgemein σ1, σ2, a1 und a2 gemeinsam haben, was die Analyse wie nachfolgend beschrieben weiter vereinfacht.
  • In einer Ausführungsform und bezüglich 10, können an den Schritt der Analyse der vorverarbeiteten Daten optional die Schritte der Modellierung des Signals mit einem bi-exponentiellen Modell und die Identifizierung einer Residuumanpassung (residual fitting) bei (S285) folgen, und wenn die Residuumanpassung nicht erwünscht ist, kann das Signal Schritt für Schritt um einen weiteren Peak erhöht werden, um zu dem Chromatographen zu passen, bis das Passungsresiduum (fit residual) sich innerhalb eines vordefinierten Residuums bei (S290) befindet. Es ist zu bedenken, dass das vorgegebene Residuum dem gewünschten Ziel entsprechend Einschränkungen unterliegen kann.
  • In einer Ausführungsform wird das Signal optimiert und (S290) kann durch Verwendung des Levenberg-Marquardt (LM) Algorithmus erreicht werden. Traditionell hat der LM-Algorithmus dynamisch eine Jacobimatrix berechnet wie folgt:
    Figure DE112012005677T5_0004
  • Mit dem bi-exponentiellen Modell wie hierin beschrieben und unter den eingeschränkten Parametern, die in Kombination damit verwendet werden, haben die Erfinder entdeckt, dass auf die dynamische Berechnung verzichtet werden kann und die Jacobimatrix stattdessen mit den folgenden analytischen Ausdrücken bestimmt werden kann:
    Figure DE112012005677T5_0005
  • In einer Ausführungsform können wegen der Vielzahl der in den obigen Berechnungen verwendeten Berechnungen bestimmte Berechnungen für späteren Zugriff im Speicher abgelegt werden, z. B.: (t – m)a₂.
  • Nun zurück zu 1, die Daten, welche nach den obigen Vorgaben vorverarbeitet und dann optional entfaltet wurden, wie in 10 dargestellt, durchlaufen nun die Analyse in (S300). In diesem Schritt wird ein Verfahren offenbart, um die Anzahl wesentlicher Faktoren für die Faktoranalyse zu bestimmen, und anfängliche Seed-Schätzungen für diese Faktoren bereitzustellen. Die Anwendung des hierin besprochenen Faktor-Seedings führt zu einem Verfahren, in dem die Faktoranalyse daran gehindert ist, sich unangemessen auf die lokalen (local) Werte zu konzentrieren. Als Ergebnis davon können Ergebnisse schneller mit höherer Genauigkeit und Auflösung erreicht werden.
  • In einer Ausführungsform und wie in 11 dargestellt umfasst das offenbarte Seeding-Verfahren das Bereitstellen eines oder mehrerer Werte zum Verarbeiten oder anderweitig Bestimmen der Anzahl der wesentlichen Faktoren bei (S310) und die Steuerung der Entfaltung. In einer Ausführungsform umfassen die Werte, die verwendet werden können, unter anderem den Grad der chromatographischen Auflösung, die Peaküberlappung oder die Peakkorrelationsgrenze und die minimale Güte (quality) der daraus entstehenden Faktoren. Die Werte können vom Benutzer gewählt, vorgegeben oder dynamisch auf Grundlage des Analyseergebnisses während des Vor-Seeding-Prozesses erzeugt werden.
  • In einer Ausführungsform kann ein Multi-Pass Prozess die Faktorbestimmung vereinfachen. Ein Prozess mit zwei Durchgängen wird nun besprochen, aber es muss beachtet werden, dass auf Grundlage dieser Offenbarung, Prozesse mit unterschiedlichen Durchlaufen verwendet werden können und der Erfindung die gesamte Bandbreite zusteht. Weiterhin kann ein Prozess mit zwei Durchgängen optional sein, sodass ein einzelner Durchgang verwendet werden kann, wenn festgestellt wird, dass die Ergebnisse aus diesem einzelnen Durchgang ausreichend sind. Zusammenfassend erleichtert dieser Prozess die Eliminierung von Peaks niedrigerer Qualität bei Bestimmung von Faktoren, da solche Peaks die Ergebnisse unscharf machen oder anderweitig den Prozess abbremsen können. Wie später besprochen wird, kann jedoch ein Teil der oder aller Peaks zu einem späteren Zeitpunkt in den Prozess eintreten, wenn festgestellt wird, dass diese Peaks mit Isotopen oder Addukten zusammenhängen.
  • In einer Ausführungsform, wird ein erster Durchgang verwendet, um eine erste Schätzung der bestimmten Faktoren bereitzustellen (S320). Wie in 12 dargestellt, kann dieser Durchgang durch Auswahl eines Basispeaks oder eines Konzentrationsprofils für einen Faktor beginnen (S321). Der Basispeak kann manuell oder automatisch gewählt werden, etwa durch Implementierung einer Algorithmusfunktion oder etwas Ähnliches. In einer Ausführungsform wird der intensivste Subcluster-Peak in einem Datensatz als Basispeak gewählt, da angenommen werden kann, dass ein solcher Peak wahrscheinlich am besten eine reine Chemikalie darstellt, im Vergleich zu Subcluster-Peaks, die vergleichsweise weniger intensiv sind. In einer Ausführungsform wird der Subcluster-Peak als Basispeaks oder Konzentrationsprofil für einen Faktor gewählt.
  • Nach der Auswahl des Basispeaks werden alle lokalen Daten (z. B., der Subcluster, der diesen Basispeak möglicherweise schneidet) bewertet und mit dem Basispeak korreliert, um einen Korrelationswert, C, dem Basispeak (S322) zuzuweisen. Bekannte Korrelationsverfahren können verwendet werden. In einer Ausführungsform werden lokale Daten mit einem vorgegebenen Mindestkorrelationswert mit dem Basispeak kombiniert, um einen Faktor (S323) zu erstellen. Eine erste Schätzung der Spektren, S, kann dann für den identifizierten Faktor (S324) festgelegt werden.
  • Als nächstes wird der intensivste Peak in den verbleibenden Daten als nächster Faktor gewählt und erneut werden die korrelierten Daten in dem oben beschriebenen Prozess kombiniert (S325). Dieser Prozess wird fortgesetzt bis alle Subcluster zu Faktoren anfänglich zugewiesen worden sind.
  • Ein zweiter Durchgang (S330) kann nun durchgeführt werden, in dem die Faktoren aus dem ersten Durchgang weiter analysiert werden und bestimmt wird, ob ein einziger Faktor, der im ersten Durchgang identifiziert wurde, weiter in individualisierte Faktoren aufgetrennt werden kann oder sollte. Während dieses Schritts kann ein Korrelationsparameter und ein damit zusammenhängendes Konfidenzintervall verwendet werden, um Daten zu trennen, welche möglicherweise versehentlich im ersten Durchgang verbunden wurden. In einer Ausführungsform kann der Korrelationsparameter vom Benutzer identifiziert oder vorgegeben sein.
  • 13 zeigt ein Beispiel für eine Ausführungsform, welche in einem solchen zweiten Durchgang (S330) verwendet werden kann. Wie dargestellt, wird der intensivste Subcluster im Faktor gewählt (S331), welcher als Basispeak identifiziert wird, auch wenn andere Begriffe verwendet werden können. Eine Korrelation wird berechnet zwischen dem Basispeak und einem oder allen anderen Subclusters in dem Faktor (S332). Ein Scheitelpunktstellen-Konfidenzintervall kann auch für jeden der Subcluster berechnet werden, einschließlich für den Basispeak (S333). Eine beispielhafte Bestimmung des Konfidenzintervalls kann sein:
    Figure DE112012005677T5_0006
  • In der obigen Berechnung (i) bezeichnet M auf einen Sigma-Multiplikator und bezieht sich auf die Anzahl der gewünschten Standardabweichungen, welche sich auf die Peakkorrelationsgrenze wie unten behandelt beziehen, (ii) PeakWidth ist die „volle Breite und halbe Höhe” des Subclusterpeaks für welche ein Konfidenzintervall gewünscht wird, (iii) S/N ist der Rauschabstand für den Subcluster, welcher als Verhältnis der Peakhöhe zum Peak-Peak-Rauschen des Subclusters berechnet wird, und ApexLocation ist der Zeitort des Scheitelpunkts des Peaks. Während eine beispielhafte Bestimmung des Konfidenzintervalls offenbart wird, können auch andere Berechnungen verwendet werden und, wenn nicht ausdrücklich ausgeschlossen, sollte die Erfindung nicht auf das offenbarte Beispiel beschränkt werden.
  • Wenn bevorzugt und wie oben dargelegt, kann M gemäß einer Ausführungsform funktional mit der Peakkorrelationsgrenze zusammenhängen wie in 13 dargestellt. 14 zeigt graphisch M versus Peakkorrelationsgrenze auf Grundlage der Messungen der Korrelation und der Konfidenzintervall-Überlappung von zwei Gaußschen Kurven mit einer Zeitverschiebung unterschiedlicher Stärke an. Die dargestellten Beziehungen können so verwendet werden, dass bei Identifizierung der Peakkorrelationsgrenze oder von M der andere Wert automatisch auf Grundlage dieser demonstrativen Beziehung abgeleitet werden kann. Alternativ kann es in einer Ausführungsform gewünscht sein, dass Peakkorrelationsgrenze und M unabhängig voneinander zusammengestellt werden.
  • In einer Ausführungsform führt ein hoher Konfidenz häufig zu einem hohen M (bei oder zwischen 2–4, oder bei oder um 3) und einem breiten Konfidenzintervall. Und für sehr intensive Peaks (z. B. solchen, zu einem erhöhten Rauschabstand neigen), kann das Konfidenzintervall dazu neigen, schmal zu sein, da eine ausreichende Anzahl von Ionen die Unsicherheit des Scheitelpunktorts sehr klein machen. Wenn beispielsweise ein Sigma-Multiplikator von 3 für eine Basis (oder einen Subcluster) verwendet wird, deren/dessen Scheitelpunkt zum Zeitpunkt 20 liegt, so hat der Peak eine Breite von 2, eine Höhe von 2560 und ein Peak-Peak-Rauschen von 10, sodass das Konfidenzintervall 20 ± 0,375 für den Scheitelpunktort des Basispeaks beträgt. Alle Subcluster, deren Konfidenzintervalle das Konfidenzintervall des Basispeaks überlappen und deren Korrelation mit dem Basispeak größer ist, als die vom Benutzer vorgegebene Peakkorrelationsgrenze, werden zusammen in einem Faktor gruppiert (S334). Wenn gewünscht, und wenn verbleibende Subcluster vorhanden sind, wird der intensivste verbleibende Subcluster als Basispeak für einen neuen Faktor gewählt und der Prozess wird wiederholt, bis keine Subcluster übrig sind (S335). Die Anzahl neuer Faktoren, die durch diesen Prozess geschaffen werden, hängt mit der Menge der co-eluierenden Verbindungen zusammen. Der zweite Durchgang stellt ein Verfahren dar, bei dem zwei Peaks mit im wesentlichen gleichen Scheitelpunkt aber anderen Formen entfaltet werden.
  • Zusammen mit dem Obigen, oder nach Abschluss eines, einiger oder aller Faktoridentifizierungen wie oben dargelegt, wird ein Durchschnitts-Konzentrationsprofil für jeden Faktor (S340) berechnet, siehe 11. Beispielsweise kann 1 multivariante Kurvenauflösungs-(Multivariate-Curve-Resolution (MCR))Verfahren eingesetzt werden, um das Durchschnitts-Konzentrationsprofil für jeden Faktor zu bestimmen. In einer Ausführungsform, für einen oder alle der Faktoren, wird das berechnete Durchschnittskonzentrationsprofil als geschätzte Peakform für jeden Faktor verwendet. Optional kann die Basispeakform als die geschätzte Peakform identifiziert werden, wenn dies für einen oder für alle Faktoren gewünscht wird. Weiterhin können zwei geschätzte Peakformen verwendet werden, sodass das berechnete Durchschnittskonzentrationsprofil und die Basispeakform für eine oder alle Faktoren verwendet werden können.
  • Durch die Verwendung des Durchschnittskonzentrationsprofils können weitere unerwünschte Faktoren aus der weiteren Berechnung durch Messung der Peakgüte (Peak Quality; PQ) des Durchschnittskonzentrationsprofils (S350) entfernt werden. In einer Ausführungsform kann PQ durch Bestimmung der Abweichung von dem Residuum der Ausgleichungsregelung (residual fitting) jedes Konzentrationsprofils berechnet werden. Verschiedene Abweichungsverfahren können eingesetzt werden; so kann etwa eine Standardabweichung in einem bi-Gaußschen System vorzugsweise verändert werden. In einer Ausführungsform wird eine Peakgüte, die unter einer Grenzpeakgüte (z. B. 0,5) liegt, aus den Daten und den weiteren Berechnungen (S360) entfernt. Es ist jedoch zu beachten, dass die Auswahl der PQ-Grenze und die Abweichungsberechnung und Verfahren dafür dadurch nicht eingeschränkt werden sollen.
  • Unter Rückbezug auf 1, wird möglicherweise gewünscht, dass Daten, die in Zusammenhang mit Isotopen und Addukten stehen, wieder in den Faktor (S400) eingefügt werden. In einer Ausführungsform werden die Rohdaten überprüft und die Daten, bei welchen ein Zusammenhang mit den Isotopen und Addukten vermutet wird, werden gewählt und dann gegen alle oder einen Teil der Faktoren qualifiziert. Die Qualifizierung (qualification) auf einen Faktor kann erfolgen, wenn die Daten eine Korrelation anzeigen, welche eine Mindestkorrelation übersteigt, die eine Fehlerrate hat, welche unter einer Grenzfehlerrate liegt. In einer Ausführungsform beträgt die Mindestkorrelation 0,9 und die Fehlerrate beträgt zwanzig Prozent. Sind sie qualifiziert, werden die Daten dann dem Faktor zugeordnet.
  • In einer Ausführungsform können die Isotope/Addukte in den Rohdaten durch Überprüfung typischer Isotop m/z-Abstände, Addukt-m/z-Abstände im Vergleich mit den Rohdaten und Extrahieren der Daten, welche auf Grundlage der Überprüfung auf ein Isotop/Addukt hinweisen, identifiziert werden. Beispielsweise haben einfach geladene kohlenstoffhaltige Verbindungen Isotopabstände von ca. n·1,003 Masseeinheiten, wobei n = 1, 2, 3, ...; in chlorierten Verbindungen haben die Isotope üblicherweise einen Abstand von 1,997 Masseeinheiten. Für Addukte, wenn ein Molekül mit einem einzelnen Natriumion ionisiert wird, kommt es zu einer Masseverschiebung (mass shift) von 21,982 Masseeinheiten gegenüber demselben Molekül, das durch ein einziges Wasserstoffion ionisiert wird.
  • Weiterhin können Isotope/Addukte von Verbindungen falsch mit einem benachbarten co-eluierenden Faktor gruppiert worden sein (z. B., Rauschen kann ein Isotop/Addukt-Peak mit einer höheren Korrelation zu einem benachbarten Peak als zu ihrem tatsächlichen Basispeak verursacht haben.) Nach der Identifikation kann gewünscht werden, solche Isotope/Addukte neu zuzuweisen. Ein Verfahren zur Bestimmung und Neuzuweisung einer solchen falschen Gruppierung ist der Vergleich eines Faktors mit seinem/seinen benachbarten Faktoren. In einer Ausführungsform basiert die Identität dessen, was einen benachbarten Faktor ausmachen kann, auf der Korrelation zwischen dem Konzentrationsprofil des ersten Faktors und dem eines benachbarten Faktors. Wenn die Korrelation größer ist als eine Mindestkorrelation, so wird der Faktor als benachbarter Faktor identifiziert und kann möglicherweise Isotope oder Addukte aus dem ersten Faktor umfassen. In einer Ausführungsform beträgt die Mindestkorrelation 0,9. Als Nächstes wird der benachbarte Faktor gescannt. Wenn Isotope/Addukte als zum ersten Faktor gehörend klassifiziert werden, werden sie dem ersten Faktor zugewiesen. In einer Ausführungsform kann dieser Prozess für den nächsten benachbarten Faktor wiederholt werden, bis die Korrelation unter der Mindestkorrelation liegt. Die Klassifizierung zwischen einem Faktor und einem Isotop/Addukt kann auftreten, wenn die Daten eine Korrelation anzeigen, die höher ist, als eine Mindestkorrelation mit einer Fehlerrate unter einer Grenzfehlerrate. In einer Ausführungsform beträgt die Mindestkorrelation 0,9 und die Fehlerrate liegt bei zwanzig Prozent. Wenn dieser Prozess einen Faktor aus allen seinen Bestandteilen entfernt, wird dieser Faktor eliminiert. Dieser Prozess kann an allen oder ausgewählten Teilen der Daten wiederholt werden.
  • Hin und wieder kann es während des Prozesses auffallen, dass die Korrelationsgrenze zu hoch sein kann. Beispielsweise kann dies aufgrund eines Versuchs auftreten, nahe beieinander liegende co-eluierende Verbindungen zu entfalten. Wenn jedoch die Isotope und Addukte nicht so stark korrelieren, kann dies aufgrund der unangemessen hohen Korrelationsgrenze zu Faktor-Splitting führen (d. h., einzelne eluierende Verbindungen werden durch mehr als einen Faktor modelliert). Ein Verfahren, mit dem dieses Faktor-Splitting verhindert werden kann, wird in 15 dargestellt. Ein Durchschnitt der Korrelation zwischen einem Basis-Isotop/Addukt-Subcluster innerhalb eines Faktors (d. h., der intensivste) und den anderen Subclustern wird innerhalb dieses Faktors berechnet; dies ist die ”lokale Korrelationsgrenze” (S610). Als Nächstes wird eine Korrelation zwischen dem Konzentrationsprofil eines Faktors und eines benachbarten Faktors von diesem Faktor bestimmt (S620). Ist die Korrelation zwischen den Faktoren größer als die lokale Korrelationsgrenze, so sind die beiden Faktoren verschmolzen (S630). Dieser Prozess kann über alle Faktoren hinweg für jeden identifizierten Basis-Isotop/Addukt-Subcluster wiederholt werden.
  • Als Alternative, oder in Kombination mit der oben angesprochenen Korrelationsgrenze, kann ein Prozess verwendet werden, um die Peakgruppierung zu identifizieren. Mit Verweis auf 16 wird ein Beispielverfahren für die Peakgruppierung und Identifizierung offenbart, speziell die Identifizierung diskreter Peaks innerhalb eines Datensatzes, und die Identifizierung des Spektrums von jedem identifizierten diskreten Peak. Wie zu erkennen ist, kann die korrekte Identifizierung solcher Peaks effizientere Prozesse während späterer Datenanalyseschritte ermöglichen.
  • In einer Ausführungsform unter Verwendung des offenbarten Verfahrens und Prozesses, sind Ionenstatistiken die vorherrschende Varianzquelle des Signals. Die Erreichung von Ionenstatistiken als dominierende Quelle kann durch die Verwendung eines Massenspektrometers mit besonders hoher Auflösung erreicht werden, da allgemein elektrisches Rauschen aus dem Signal unterdrückt. Oft können die meisten Massenspektralstörungen innerhalb solcher Systeme auf Grundlage der Systeme automatisch durch die hohe Auflösungsqualität des Instrumentes beseitigt werden. Weiterhin führt dies zu einer wesentlichen Vermeidung von äußeren massenspektralen Störungen und, wenn geteilte Massen vorliegen, kann dieses System eine Entfaltung durchführen.
  • Um Ausführungsformen des hierin besprochenen Verfahrens zu nutzen, ist die Anzahl der Ionen in einem analysierten Signal bekannt und das Rauschen wurde allgemein aus dem Signal entfernt. Weiterhin werden zum Zweck der 1619, Zeichnungen mit einem ersten Peak (x) und einem zweiten Peak (y) besprochen, die jeweils eine Größe (m) mal 1 haben. Die Nomenklatur in diesen Beispielen weist dem ersten und zweiten Peak (x, y) die folgenden Variablen zu.
  • x:
    Spaltenvektor des chromatographischen Peaks des Basispeaks;
    xi:
    Skalar des i. Elements von x;
    y:
    Spaltenvektor des chromatographischen Peaks zur Untersuchung auf Verschmelzen (merge) mit x;
    yi:
    Skalar des u. Elements von y;
    ti:
    Skalar der Retentionszeit des i. Orts;
    m:
    Skalar der Länge von x und y;
    npx:
    Skalar der Anzahl der Ionen in Peak x;
    npy:
    Skalar der Anzahl der Ionen in Peak y;
    α:
    Skalar der Signifikanzebene;
    meanpx:
    Skalar des Mittelwerts von Peak x;
    meanpy:
    Skalar des Mittelwerts von Peak y;
    σpx:
    Skalar der Standardabweichung von Peak x;
    σPy:
    Skalar der Standardabweichung von Peak y;
    spx:
    Skalar der Schätzung der Standardabweichung von Peak x;
    Spy:
    Skalar der Schätzung der Standardabweichung von Peak y; und
    rxy:
    Skalar des Korrelations-Koeffizienten von Vektor x und y.
  • Mit Verweis auf 16, umfasst in einer Ausführungsform ein Verfahren zur Gruppierung und Identifikation von Peaks den Vergleich eines ersten Peaks (x) bei S710 mit einem zweiten Peak und die Bestimmung, ob der erste Peak und der zweite Peak (x, y) bei S720 zusammen gruppiert sein sollten.
  • Zum Zweck von 1619 ist zu beachten, dass die Peaks, auf die verwiesen wird, als Wahrscheinlichkeitsverteilungen der Ionen mit einem Mittelwert und eine Standardabweichung betrachtet werden, da die Ionenstatistik im Wesentlichen dominant ist, das Rauschen allgemein eliminiert wird und das Ionenvolumen bekannt ist. In einer Ausführungsform kann der Vergleichsschritt S710 den Vergleich einer mittleren Retentionszeit des ersten Peaks (x) mit einer mittleren Retentionszeit eines zweiten Peaks (y) bei 720 umfassen, wobei die Varianz des ersten Peaks (x) mit der Varianz des zweiten Peaks (y) bei S760 verglichen wird und die ersten und zweiten Peaks (x, y) als zusammenhängend oder nicht zusammenhängend klassifiziert werden, basierend auf Bedingungen der beiden Vergleichsschritte S780. Weiterhin werden in einer Ausführungsform die ersten und zweiten Peaks (x, y) als zusammenhängend eingestuft, wenn (a) die mittleren Retentionszeiten des ersten Peaks und des zweiten Peaks im Wesentlichen gleich sind und (b) die Varianz des ersten Peaks und des zweiten Peaks im Wesentlichen gleich sind.
  • 17 zeigt ein Beispielverfahren zur Bestimmung der Peakmittelwerte und der Peakstandardabweichungen, welche zu einem späteren Zeitpunkt verwendet werden können. Wie dargestellt, wird der Mittelwert des ersten Peaks (x) und der Mittelwert des zweiten Peaks (y) bei S810 bestimmt. In einer Ausführungsform werden die Mittelwerte mittels der folgenden Gleichungen bestimmt:
    Figure DE112012005677T5_0007
  • Unter weiterem Verweis auf 17, werden die Standardabweichung des ersten Peaks (x) und die Standardabweichung des zweiten Peaks (y) bei S820 bestimmt. Diese Peak-Standardabweichungen können wie in den folgenden Gleichungen dargestellt bestimmt werden:
    Figure DE112012005677T5_0008
  • Es ist zu beachten, dass neben den hierin dargelegten Beispielen auch andere Verfahren verwendet werden können, um den Peakmittelwert und die Peakstandardabweichung zu bestimmen. Beispielsweise, und unter anderem kann bei Peaks mit normalen (z. B. Gaußschen) Verteilungen, einer hohen Intensität und allgemein glatter Ionenwahrscheinlichkeitsdichtefunktion (PDF) der Peakmittelwert als Stelle des Scheitelpunkts bestimmt werden, und die Standardabweichung kann auf die Halbwertsbreite (FWHM) bezogen werden. Es ist jedoch weiter zu beachten, dass die Zusammenhänge zwischen Scheitelpunkt und FWHM bei Peaks mit geringer Intensität nicht immer gelten, da die Verzerrung (bias) zwischen dem Peakmittelwert und der Stelle des Scheitelpunkts stärker sein kann. Alternativ können verschiedene Glättungen auf die Peaks angewandt werden, um die Verzerrung zwischen dem Scheitelpunkt und dem Mittelwert sowie zwischen dem FWHM und der Standardabweichung zu minimieren.
  • In einer Ausführungsform und wie im Rest dieser Offenbarung durch Verweis eingeschlossen, wird der Vergleich einer mittleren Retentionszeit des ersten Peaks (x) mit einer mittleren Retentionszeit des zweiten Peaks (y) (S720) als t-Hypothese bezeichnet. Die t-Hypothese kann eingesetzt werden, um zu prüfen, ob die Mittelwerte der Retentionszeiten des ersten Peaks (x) und des zweiten Peaks (y) im Wesentlichen gleich sind, sodass das Konfidenzintervall dazwischen potenziell die Gruppierung des ersten Peaks (x) mit dem zweiten Peak (y) rechtfertigt.
  • Nun wird mit Verweis auf 18 eine Ausführungsform für den Vergleich der mittleren Retentionszeit des ersten Peaks (x) mit der mittleren Retentionszeit des zweiten Peaks (y) offenbart. Zuerst wird in Schritt S724 für ein gegebenes Konfidenzintervall eine t-Statistik unter Verwendung der folgenden Gleichung bestimmt:
    Figure DE112012005677T5_0009
  • In einer Ausführungsform kann ein Konfidenzintervall verwendet werden, um die t-Statistik in S728 zu erweitern, für welche die folgende Gleichung nur ein Beispiel der Beschreibung eines solchen Konfidenzintervalls ist:
    Figure DE112012005677T5_0010
  • Bei S732 ist der Mittelwert der Retentionszeiten des ersten Peaks (x) und des zweiten Peaks (y) im Wesentlichen gleich, sodass das Konfidenzintervall dazwischen potenziell die Gruppierung des ersten Peaks (x) mit des zweiten Peaks (y) rechtfertigt, wenn:
    Figure DE112012005677T5_0011
  • In einer Ausführungsform und wie im restlichen Teil dieser Offenbarung durch Verweis eingeschlossen, wird der Vergleich einer Varianz der Retentionszeit des ersten Peaks (x) mit einer Varianz der Retentionszeit des zweiten Peaks (y) (S760) als F-Hypothese bezeichnet. In einer Ausführungsform wird die F-Hypothese eingesetzt um zu prüfen, ob die Varianz der Retentionszeit des ersten Peaks (x) und des zweiten Peaks (y) im Wesentlichen gleich sind, sodass das Konfidenzintervall zwischen ihnen potenziell die Gruppierung des ersten Peaks (x) mit dem zweiten Peak (y) rechtfertigt.
  • Nun wird mit Verweis auf 19 eine Ausführungsform zum Vergleich der Varianz des ersten Peaks (x) mit der Varianz des zweiten Peaks (y) offenbart. Zuerst wird in Schritt S764 für eine bestimmte Signifikanz eine F-Statistik mit folgender Gleichung bestimmt:
    Figure DE112012005677T5_0012
  • In einer Ausführungsform kann ein Vertrauensintervall verwendet werden, um den Wert bei S168 zu verbreitern, für welchen die folgende Gleichung nur ein Beispiel für die Zuordnung eines solchen Konfidenzintervalls ist:
    Figure DE112012005677T5_0013
  • Bei S772 sind die Varianzen der Retentionszeiten des ersten Peaks (x) und des zweiten Peaks (y) im Wesentlichen gleich, sodass das Konfidenzintervall zwischen ihnen potenziell die Gruppierung des ersten Peaks (x) mit dem zweiten Peak (y) rechtfertigt, wenn:
    Figure DE112012005677T5_0014
  • In großen Datensätzen kann es aus Verarbeitungssicht zu langsam sein, jedes Mal eine F-Statistik zwischen den Peaks zu berechnen. In einer Ausführungsform umfasst ein alternatives Verfahren der Bestimmung der F-Statistik, das auch den Prozess beschleunigen kann, das Speichern vorgegebener F-Statistik-Werte im System. Vorgegebene F-Statistikwerte werden mit Singulärwertzerlegung vorberechnet und im Speicher des Systems gespeichert. In einer Ausführungsform kann die Tabelle, welche im Speicher abgelegt ist, die folgenden Informationen zur F-Statistik umfassen:
    Figure DE112012005677T5_0015
  • In einer Ausführungsform kann die Tabelle durch Einführung einer Singulärwertzerlegung in der vorberechneten F-Statistik wie folgt weiter zerlegt werden:
    Figure DE112012005677T5_0016
  • Dementsprechend speichert die zerlegte Tabelle sechstausend (6000) Werte statt einer Million (1.000.000), was die Speicheranforderungen verringert und die Berechnungsgeschwindigkeit erhöht, da nur FtableX und FtableY. Weiterhin lässt sich über die obige Gleichung Ftable(i, j) rekonstruieren.
  • Zwei Tabellen können verwendet werden, um zweiseitige Anhänge der F-Statistik, a/2 und 1 – a/2, zu berechnen. Für den Fall einer Freiheit (freedom) über 1000 wird der Wert 1000 verwendet, um die F-Statistik zu rekonstruieren:
    Figure DE112012005677T5_0017
  • Wenn ein Faktor identifiziert wurde und ein passendes geschätztes Konzentrationsprofil für einen Faktor gewählt wurde, wird die geschätzte Peakform mit ausgewählten Kurven mit bekannten Parametern (S370) verglichen. In einer Ausführungsform wird das geschätzte Konzentrationsprofil normalisiert und dann mit einer oder mehreren vergebenen, vorberechneten Kurven verglichen. Die Normalisierung kann durch Strecken oder Schrumpfen durch ein Resampling-Verfahren und dann Zentrierung zur Anpassung in der Breite und Mitte der vorberechneten Kurven erfolgen.
  • Die Korrelation zwischen den neuen Daten und dem Satz der vorgegebenen Kurven wird dann berechnet (S380) und die Schiefe (skew)- und Kurtosis-Werte für die beste Übereinstimmung werden als Seed für die Optimierung gewählt (S390).
  • In einer Ausführungsform wird eine Pearson-Funktion verwendet, um die vorberechneten Kurven zuzuweisen, vorzugsweise eine Pearson IV-Kurve. Auf Pearson IV-Kurven kann mit fünf Parametern verwiesen werden:
    • (i) Höhe; (ii) Mittelpunkt; (iii) Breite; (iv) Schiefe (3. Moment); und (v) Kurtosis (4. Moment). In einer Ausführungsform sind die vorberechneten Kurven Permutationen von mindestens einem der Schiefe- und Kurtosiswerte, während die verbleibenden Parameter konstant bleiben, sodass die Peakformen danach aufgezeichnet und für jede Permutation gespeichert werden. Es ist zu beachten, dass andere Permutationen verwendet werden können und die Ansprüche nicht so auf die hierin offenbarte Beispielausführungsform eingeschränkt werden sollten. Beispielsweise, und unter anderem, können die Höhe und Schiefheit variieren, während Mittelpunkt, Breite und Kurtosis konstant bleiben.
  • Es versteht sich, dass verschiedene Ausführungsformen der Systeme und Techniken, die hierin beschrieben sind, in digitalen Elektronik-Schaltkreisen, integrierten Schaltkreisen, besonders entworfenen ASICs (Application-specific integrated circuits), Computerhardware, Firmware, Software, und/oder Kombinationen davon umgesetzt werden können. Diese verschiedenen Umsetzungen können eine Ausführungsform in einem oder mehreren Computerprogrammen enthalten, welche auf einem programmierbaren System ausführbar und/oder interpretierbar sind, einschließlich mindestens eines programmierbaren Prozessors, welcher speziell gebaut werden oder allgemeinen Zwecken dienen kann, verbunden, um Daten und Informationen von einem Speichersystem zu erhalten und um Daten und Anweisungen an ein solches zu übermitteln, mindestens einem Eingangsgerät, und mindestens einem Ausgangsgerät.
  • Diese Computerprogramme (auch bekannt als Programme, Software, Softwareanwendungen oder Code) umfassen Maschinenanweisungen für einen programmierbaren Prozessor und können in einer High-Level prozeduralen und/oder objektorientierten Programmiersprache, und/oder in Assembly/Maschinensprache umgesetzt werden. Wie hierin verwendet, beziehen sich die Begriffe ”maschinenlesbares Medium”, ”computerlesbares Medium” auf jedes Computerprogrammprodukt, jeden solchen Apparat und/oder jedes solche Gerät (z. B. Magnetdisketten, optische Disketten, Speicher, programmierbare Logikgeräte (Programmable Logic Devices; PLDs)) welche zur Bereitstellung von Maschinenanweisungen und/oder Daten an einen programmierbaren Prozessor verwendet werden können, einschließlich eines maschinenlesbaren Mediums, welches Maschinenanweisungen als maschinenlesbare Signale erhält. Der Begriff ”maschinenlesbares Signal” bezieht sich auf jedes Signal, das zur Bereitstellung von Anweisungen und/oder Daten der Maschine an einen programmierbaren Prozessor dient.
  • Um die Interaktion mit dem Benutzer zu ermöglichen, können die hierin beschriebenen Systeme und Techniken auf einem Computer umgesetzt werden, der ein Anzeigegerät (z. B. einen CRT (Cathode Ray Tube) oder LCD (Liquid Crystal Display) Monitor), um Informationen für den Benutzer anzuzeigen, sowie eine Tastatur und ein Zeigegerät (z. B. eine Maus oder einen Trackball) besitzt, mit denen der Benutzer Eingaben in den Computer machen kann. Es können auch andere Arten von Geräten verwendet werden, um die Interaktion mit einem Benutzer zu ermöglichen; beispielsweise, kann der Benutzer Feedback in jeder Form von sensorischem Feedback erhalten (z. B. visuelles Feedback, Audio-Feedback, oder fühlbares Feedback); und Eingaben des Benutzers können in jeder Form erhalten werden, also auch akustisch, durch Sprach- oder Touch-eingabe.
  • Die Systeme und Techniken, die hier beschreiben werden, können in einem Computersystem umgesetzt werden, das eine Backend-Komponente umfasst (z. B. als Datenserver), oder das eine Middlewarekomponente umfasst (z. B. ein Anwendungsserver), oder das eine Frontendkomponente umfasst (z. B. einen Clientcomputer mit einer graphischen Benutzeroberfläche oder einen Webbrowser, durch den ein Benutzer mit einer Ausführungsform der Systeme und Techniken wie hier beschrieben interagieren kann), oder eine Kombination dieser Backend, Middleware, oder Frontendkomponenten. Die Komponenten des Systems können in jeder Form und mit jedem Mittel digitaler Datenkommunikation miteinander verbunden werden (z. B. ein Kommunikationsnetzwerk). Beispiele für Kommunikationsnetzwerke umfassen ein Local Area Network (”LAN”), ein Wide Area Network (”WAN”), und das Internet.
  • Das Computersystem kann Clients und Server umfassen. Ein Client und Server befinden sich üblicherweise an voneinander getrennten Standorten und intergieren übelicherweise durch ein Kommunikationsnetzwerk miteinander. Die Beziehung zwischen Client und Server entsteht aus dem Ausführen eines Computerprogramms auf den jeweiligen Computern und aus der Client-Server Beziehung zueinander.
  • Ausführungsformen des Inhalts und der funktionalen Funktionen, die in dieser Spezifikation beschrieben werden, können in digitalen elektronischen Schaltkreisen, oder in Computersoftware, Firmware oder Hardware umgesetzt werden, einschließlich den Strukturen, welche in dieser Spezifikation vorgegeben wurden, und ihren strukturellen Gegenstücken, oder in Kombinationen einer oder mehrerer davon. Umsetzungen der in dieser Spezifikation beschriebenen Inhalte können als ein oder mehrere Computerprogrammprodukte umgesetzt werden, d. h. ein oder mehrere Module von Computerprogrammabweichungen, die auf einem computerlesbaren Medium zur Ausführung durch oder Steuerung des Betriebs von Datenverarbeitungsgeräten codiert werden. Das computerlesbare Medium kann ein maschinenlesbares Datenspeichergerät, ein maschinenlesbares Speichergerät, eine Zusammensetzung aus Materie, welche ein maschinenlesbares weitergeleitetes Signal abgibt, oder eine Kombination von einem oder mehreren davon. Der Begriff ”Datenverarbeitungsgerät” umfasst alle Apparate, Geräte und Maschinen für die Verarbeitung von Daten, einschließlich des Beispiels eines programmierbaren Prozessors, eines Computers, oder mehrerer Prozessoren oder Computer. Der Apparat kann neben der Hardware Code enthalten, welcher eine Ausführungsumgebung für das jeweilige Computerprogramm erstellt, z. B. Code, der Prozessorfirmware, einen Protokollstapel, ein Datenbankmanagement-System, ein Betriebssystem oder eine Kombination von einem oder mehreren davon darstellt. Ein weitergeleitetes Signal ist ein künstlich erzeugtes Signal, z. B. ein maschinengeneriertes elektrisches, optisches oder elektromagnetisches Signal, welches generiert wird, um Informationen für die Übertragung an einen geeigneten Empfängerapparat zu codieren.
  • Ein Computerprogramm (auch bekannt als Programm, Software, Softwareanwendung, Script oder Code) kann in jeder Form von Programmiersprache geschrieben werden, einschließlich kompilierter oder interpretierter Sprachen, und kann in jeder Form eingesetzt werden, auch als Standalone-Programm oder als Modul, Bauteil, Subroutine oder andere Einheit, die sich zur Verwendung in einer Computerumgebung eignet. Ein Computerprogramm entspricht nicht unbedingt einer Datei in einem Dateisystem. Ein Programm kann in einem Teil einer Datei gespeichert werden, welcher auch andere Programme oder Daten enthält (z. B. ein oder mehrere Skripte, die in einem Dokument mit Markup-Sprache gespeichert werden), in einer einzelnen Datei, welche dem jeweiligen Programm zugeiwesen wurde oder in mehreren koordinierten Dateien (z. B. Dateien, welche ein oder mehrere Module, Unterprogramme oder Codeteile speichern). Ein Computerprogramm kann eingesetzt werden, um auf einem Computer oder mehreren Computern ausgeführt zu werden, welche sich an einem Standort befinden oder über mehrere Standorte verteilt und durch ein Kommunikationsnetzwerk verbunden sind.
  • Die Prozesse und Logikflüsse, die in dieser Spezifikation beschrieben wurden, können durch einen oder mehrere programmierbare Prozessoren ausgeführt werden, welche ein oder mehrere Computerprogramme ausführen um Funktionen durch Betrieb nach Eingabe der Daten oder Erzeugung von Ausgaben auszuführen. Die Prozesse und Logikflüsse können auch als Sonderzwecklogikschaltkreise ausgeführt werden und Apparate können in dieser Weise umgesetzt werden, z. B. mit einem FPGA (Field Programmable Gate Array) oder einem ASIC (Application Specific Integrated Circuit).
  • Prozessoren, die sich für die Ausführung eines Computerprogramms eignen umfassen beispielsweise sowohl Mikroprozessoren für allgemeine und besondere Zwecke, sowie jeden einzelnen oder mehrere Prozessoren jeder Art für digitale Computer. Allgemein erhält ein Prozessor Anweisungen und Daten von einem Read-Only Memory oder einem Random Access Memory oder beiden. Die wesentlichen Elemente eines Computers sind ein Prozessor für die Ausführung von Anweisungen und ein oder mehrere Speichergeräte zum Speichern der Anweisungen und Daten. Allgemein umfasst ein Computer auch Massespeichergeräte zum Speichern von Daten oder wird operativ mit diesen verbunden, um Daten von ihnen zu empfangen oder an diese zu übertragen, oder beides; dies können etwa z. B. magnetische, magneto-optische Platten oder optische Platten sein. Ein Computer muss nicht jedoch solche Geräte haben. Weiterhin kann ein Computer in ein anderes Gerät eingebettet sein, z. B. ein Handy, einen Personal Digital Assistant (PDA), einen mobilen Audioplayer, einen Global Positioning System(GPS)-Empfänger, um nur einige wenige Beispiele zu nennen. Computerlesbare Medien, die sich für das Speichern von Computerprogrammdaten eignen, umfassen alle Formen von nicht flüchtigen Speichern, Medien und Speichergärten, einschließlich beispielsweise Halbleiter-Speichergeräten, z. B. EPROM, EEPROM, und Flash-Speichergeräten; magnetischen Platten, z. B. internen Festplatten oder entfernbaren Disketten; magneto-optischen Platten; und CD ROMS und DVD-ROMs. Der Prozessor und der Speicher können durch Logikschaltkreise für besondere Zwecke ergänzt oder in diese eingebaut werden.
  • Um die Interaktion mit einem Benutzer zu ermöglichen, können die Ausführungsformen des in dieser Spezifikation beschriebenen Inhalts auf einem Computer mit einem Anzeigegerät, z. B. einem CRT (Cathode Ray Tube) oder LCD (Liquid Crystal Display) Bildschirm, um die Informationen dem Benutzer anzuzeigen, und einer Tastatur und einem Zeigegerät, z. B. einer Maus oder einem Trackball, durch welche der Benutzer Eingaben in den Computer machen kann, umgesetzt werden. Es können auch andere Arten von Geräten verwendet werden, um die Interaktion mit einem Benutzer zu ermöglichen; beispielsweise, kann der Benutzer Feedback in jeder Form von sensorischem Feedback erhalten, z. B. visuelles Feedback, Audio-Feedback, oder fühlbares Feedback; und Eingaben des Benutzers können in jeder Form erhalten werden, also auch akustisch, durch Sprach- oder Toucheingabe.
  • Während diese Spezifikation viele Einzelheiten umfasst, sollten sie nicht als Einschränkungen des Umfangs der Erfindung oder der beanspruchten Punkte betrachtet werden, sondern als eine Beschreibung von Funktionen, welche speziell auf bestimmte Ausführungsformen der Erfindung zutreffen. Bestimmten Funktionen, die in dieser Spezifikation im Zusammenhang mit einzelnen Ausführungsformen beschrieben werden, können auch in Kombination in einer einzigen Ausführungsform umgesetzt werden. Andersherum können verschiedene Funktionen, die in Zusammenhang mit einer einzigen Ausführungsform beschrieben werden, auch in mehreren Ausführungsformen getrennt oder in jeder geeigneten Unterkombination umgesetzt werden. Weiterhin können zwar die Funktionen oben als in bestimmten Kombinationen funktionierend beschrieben und auch anfangs in dieser Weise beansprucht worden sein, aber eine oder mehrere Funktionen aus beanspruchten Kombinationen können in einigen Fällen aus der Kombination entfernt werden und die beanspruchte Kombination kann auf eine Unterkombination oder eine Varianz einer Unterkombination verwiesen werden.
  • Ähnlich werden Schritte zwar in den Zeichnungen in einer bestimmten Reihenfolge dargestellt, dies sollte jedoch nicht so verstanden werden, dass diese in der speziell dargestellten Reihenfolge oder nacheinander ausgeführt werden müssen, oder dass alle dargestellten Schritte ausgeführt werden müssen, um die gewünschten Ergebnisse zu erhalten. Unter bestimmten Umständen kann Multitasking und parallele Verarbeitung von Vorteil sein. Weiterhin sollte die Trennung der verschiedenen Systemkomponenten in den oben beschriebenen Ausführungsformen nicht so verstanden werden, als wäre eine solche Trennung in allen Ausführungsformen notwendig, und es sollte verstanden werden, dass die beschriebenen Programmkomponenten und Systeme allgemein zusammen in ein einziges Softwareprodukt integriert oder in mehrere Softwareprodukte verpackt werden können.
  • Eine Reihe von Ausführungsformen wurden beschrieben. Dennoch versteht es sich, dass verschiedene Änderungen ohne Abweichung vom Geist und Umfang der Offenbarung möglich sind. Beispielsweise können verschiedene Formen der oben dargestellten Flüsse verwendet werden, wobei die Schritte in anderer Reihenfolge ausgeführt werden, Schritte hinzugefügt oder entfernt werden können. Auch wenn verschiedene Anwendungen der Systeme und Verfahren beschrieben wurden, sollte anerkannt werden, dass mehrere andere Anwendungen betrachtet werden. Weiterhin liegen andere Anwendungsformen im Umfang der folgenden Ansprüche.

Claims (81)

  1. Ein Verfahren zur Verarbeitung von Daten aus einem Datenerfassungssystem in einem chromatographischen Massenspektrometriesystem, umfassend aus: Verarbeiten der Daten zur Erzeugung verarbeiteter Daten; Analysieren der verarbeiteten Daten zum Extrahieren des Rauschens daraus; und Erstellen und Bereitstellen der Ergebnisse bezüglich der verarbeiteten Daten.
  2. Das Verfahren nach Anspruch 1, wobei die Daten lange Cluster und kurze Cluster umfassen, und der Verarbeitungsschritt umfasst: Trennen der langen Cluster von den kurzen Clustern; Filtern der Daten, um die Daten zu glätten und so einen gefilterten Cluster bereitzustellen; Unterteilen des gefilterten Clusters in Subcluster; und Klassifizieren des Subclusters zum Extrahieren unerwünschter Subcluster davon.
  3. Das Verfahren nach Anspruch 2, wobei der Trennungsschritt weiter umfasst: Trennen der Daten in Blöcke; Schätzen der Intensität einer Baseline im Mittelpunkt von jedem Block; Lineares Interpolieren zwischen Quartilpunkten gleichen Abstands von jedem Blocks für das Bereitstellen einer Baselineschätzung; Abschneiden der Daten über der Baselineebene und Erhalten der Daten unter der Baseline; und Glätten der abgeschnittenen Daten, um eine verbesserte Version der Baseline zu erhalten.
  4. Das Verfahren nach Anspruch 3, wobei eine Länge jedes Blocks ein Vielfaches einer erwarteten „vollen Breite bei halber Höhe” der Daten ist.
  5. Das Verfahren nach Anspruch 3, wobei eine Länge jedes Block als fünf Mal die erwartete „volle Breite und halbe Höhe” der Daten geschätzt wird.
  6. Das Verfahren nach Anspruch 3, wobei der Glättungsschritt die Anwendung eines Savitzky-Golay Glättungsalgorithmus umfasst.
  7. Das Verfahren nach Anspruch 3, wobei die Schätzung der Intensität einer Baseline im Mittelpunkt eines Blocks auf einer Intensität der Baseline im niedrigsten Quartil des Blocks basiert.
  8. Das Verfahren nach Anspruch 2, wobei der Klassifizierungsschritt mindestens einen der folgenden Punkte umfasst: Auswählen eines Subclusters mit einem Rauschabstand, der größer ist, als ein Grenz-Rauschabstand, Auswählen eines Subclusters mit einer Peakform, die größer ist als eine Grenzgüte, und Auswählen eines Subclusters mit einer Mindestclusterlänge.
  9. Das Verfahren nach Anspruch 8, wobei der Grenzrauschabstand 10 beträgt.
  10. Das Verfahren nach Anspruch 8, wobei das Rauschen vorgegebenes Erfassungsrauschen von einem Viertel (1/4) Innenfläche ist.
  11. Das Verfahren nach Anspruch 8, wobei das Rauschen die Standardabweichung des Residuums zwischen den ursprünglichen Clusterdaten und den geglätteten Clusterdaten ist.
  12. Das Verfahren nach Anspruch 8, wobei Subcluster mit einem Rauschabstand unter dem Grenzrauschabstand weiter in der Faktoranalyse verwendet werden, wenn es sich um Isotope oder Addukte handelt.
  13. Das Verfahren nach Anspruch 8, weiter umfassend den Schritt des: Zuschneidens der Baseline eines Subclusters von der linken und rechten Seite eines Peaks her.
  14. Das Verfahren nach Anspruch 13, wobei der Schritt des Zuschneidens weiter umfasst: Scannen der Rohdaten innerhalb des Subclusters von den Enden her zum Mittelpunkt hin; Identifizieren der Stelle wo die Intensitäten über einen Grenzwert an jedem Ende ansteigen, als neuen Endpunkt; Verwerten der Daten außerhalb der neuen Endpunkte.
  15. Das Verfahren nach Anspruch 14, wobei die Grenzwerte vier Mal die Standardabweichung des Subclusters ist.
  16. Das Verfahren nach Anspruch 8, wobei die Grenzgülte auf einer Korrelation zwischen einem Fitting des Subclusters und einer vorgegebenen Kurve basiert.
  17. Das Verfahren nach Anspruch 16, wobei die vorgegebene Kurve eine bi-Gaußsche Kurve ist.
  18. Das Verfahren nach Anspruch 16, wobei die Grenzkorrelation 0,6 beträgt.
  19. Das Verfahren nach Anspruch 17, wobei die Grenzkorrelation 0,8 beträgt.
  20. Das Verfahren nach Anspruch 2, wobei der Filterschritt einen Infinite-Impulse-Response-Filter nutzt.
  21. Das Verfahren nach Anspruch 2, wobei der Filterschritt folgendes umfasst: Identifizieren des größten Peaks innerhalb der Daten; Schätzung der „vollen Breite und halben Höhe” des identifizierten Peaks; Abgleichen der geschätzten „vollen Breite und halben Höhe” mit einer Nachschlagetabelle zur Identifizierung eines oder mehrerer optimierter Filterkoeffizienten; Glätten der Daten basierend auf den optimierten Filterkoeffizienten; und Identifizieren einer Rauschzahl jedes Clusters.
  22. Das Verfahren nach Anspruch 21, wobei die optimierten Filterkoeffizienten ein Satz von Eingangssignal-(forward) und Ausgangssignal-(reverse) Infinite Impulse-Response-Filter-Koeffizienten zweiter Ordnung sind.
  23. Das Verfahren nach Anspruch 22, wobei die Rauschzahl die Standardabweichung des Residuums zwischen den glatten Daten und den Rohdaten ist.
  24. Das Verfahren nach Anspruch 23, wobei die Rauschzahl jedem der Subcluster zugeordnet wird, welche aus einem Cluster abgeleitet werden.
  25. Das Verfahren nach Anspruch 22, wobei die optimierten Koeffizienten nach den folgenden Schritten berechnet werden: Bilden Gaußscher Peaks an jeder erwarteten „vollen Breite und halben Höhe”; Hinzufügen von Rauschen zu den Gaußschen Peaks, was zu Gaußschen Peaks mit Rauschen führt; und Optimieren der Gaußschen Peaks zur Anpassung der Filterkoeffizienten in einer Weise, welche im Wesentlichen des Residuums zwischen den Gaußschen Peaks mit Rauschen und den Gaußschen Peaks minimiert.
  26. Das Verfahren nach Anspruch 25, wobei der Optimierungsschritt einen nichtlinearen Levenberg-Marquardt Prozess verwendet.
  27. Das Verfahren nach Anspruch 2, wobei die Cluster Peaks und Täler haben und der Trennschritt weiter umfasst: Identifizierung jeder Instanz innerhalb eines gefilterten Clusters, wobei ein Tal, das sich zwischen zwei Peaks befindet, einen Tiefpunkt hat, der niedriger ist als eine definierte Intensität der zwei Peaks; und Trennen des Clusters in Subcluster auf Grundlage der einzelnen identifizierten Instanzen, wenn vorhanden.
  28. Das Verfahren nach Anspruch 19, wobei die definierte Intensität genau oder ca. die Hälfte der Intensität einer oder beider Peaks ist.
  29. Das Verfahren nach Anspruch 2, wobei der Analyseschritt weiter umfasst: Bestimmung wesentlicher Faktoren für die Faktoranalyse; und Bereitstellung der Anfangs-Seed-Schätzungen dieser Faktoren.
  30. Das Verfahren nach Anspruch 29, weiter umfassend aus: Eliminieren von Peaks mit niedrigerer Güte.
  31. Das Verfahren nach Anspruch 2, wobei der Analyseschritt weiter umfasst: Auswählen eines Basispeaks unter den Daten; Bewerten und Korrelieren aller lokaler Daten mit dem Basispeak; Kombinieren lokaler Daten mit einem vorgegebenen Mindestkorrelationswert mit dem Basispeak zur Bildung eines Faktors; und Schätzen der Spektren für den Faktor.
  32. Das Verfahren nach Anspruch 31, wobei der Basispeak manuell gewählt wird.
  33. Das Verfahren nach Anspruch 31, wobei der intensivste Subclusterpeak im Datensatz als der Basispeak gewählt wird.
  34. Das Verfahren nach Anspruch 31, wobei der Mindestkorrelationswert 0,6 beträgt.
  35. Das Verfahren nach Anspruch 34, weiter umfassend: A) Wenn der Basispeak identifiziert wurde, Auswählen des nächst-intensivsten Peaks in den verbleibenden Daten als nächsten Faktor; B) Nach Abschluss von Schritt (A), Auswählen des nächst-intensivsten Peaks in den verbleibenden Daten als nächsten Faktor; und C) Wiederholen von Schritt (B), bis alle Subcluster Faktoren zugeordnet wurden.
  36. Das Verfahren nach Anspruch 31, weiter umfassend: Vergleichen einer oder beider Werte für ein Korrelationsgrenze und ein damit zusammenhängendes Konfidenzintervall zur Trennung der lokalen Daten, die im Kombinationsschritt kombiniert wurden, aber nicht hätten kombiniert werden sollen, in getrennte Faktoren.
  37. Das Verfahren nach Anspruch 36, wobei der Vergleichsschritt weiter umfasst: Auswählen des intensivsten Subclusters im Faktor; Bestimmung einer Korrelation zwischen dem Basis-Subcluster und mindestens einem der anderen Subcluster im Faktor; Bestimmen eines Konfidenzintervalls des Scheitelpunktorts für mindestens einen der Subcluster; Gruppierung von Subclustern zusammen, die aufweisen: (i) überlappenden Basispeak, und (ii) eine Korrelation mit dem Basispeak, die höher ist als eine definierte Korrelationsgrenze, wobei alle der Gruppierungen Faktoren sind.
  38. Das Verfahren nach Anspruch 36, weiter umfassend: Berechnen eines Durchschnittskonzentrationsprofils für jeden Faktor.
  39. Das Verfahren nach Anspruch 38, wobei der Berechnungsschritt multivariate Kurvenauflösungsverfahren verwendet, um das Durchschnittskonzentrationsprofil für jeden Faktor zu bestimmen.
  40. Das Verfahren nach Anspruch 39, wobei das berechnete Durchschnittskonzentrationsprofil als geschätzte Peakform für jeden Faktor verwendet wird.
  41. Das Verfahren nach Anspruch 38, weiter umfassend: Messen der Peakgüte des Durchschnittskonzentrationsprofils; und Entfernen der Daten mit einer Peakgüte unter einer Grenzpeakgüte.
  42. Das Verfahren nach Anspruch 41, wobei der Messschritt durch eine Bestimmung der Abweichung des Residuums des Fitting jedes Konzentrationsprofils berechnet wird.
  43. Das Verfahren nach Anspruch 42, wobei die Abweichung die Standardabweichung in einem bi-Gaußschen System ist.
  44. Das Verfahren nach Anspruch 41, wobei die Grenzpeakgüte 0,5 beträgt.
  45. Das Verfahren nach Anspruch 44, wobei der Eingabekorrelationsparameter manuell eingegeben wird.
  46. Das Verfahren nach Anspruch 40, weiter umfassend: Vergleichen der geschätzten Peakform mit mindestens einer vorausgewählten Kurve.
  47. Das Verfahren nach Anspruch 46, weiter umfassend Normalisieren der geschätzten Peakform vor dem Vergleichsschritt zur Definition einer normalisierten geschätzten Peakform.
  48. Das Verfahren nach Anspruch 47, wobei der Normalisierungsschritt mindestens einen Schritt zum Strecken oder Schrumpfen durch Resampling umfasst, gefolgt von einer Zentrierung der geschätzten Peakform zur Anpassung an die Breite und den Mittelpunkt der mindestens einen vorgewählten Kurve.
  49. Das Verfahren nach Anspruch 47, weiter umfassend: Berechnen einer Korrelation zwischen der normalisierten Peakform und der mindestens einen vorgewählten Kurve.
  50. Das Verfahren nach Anspruch 49, wobei die Schiefe- und Kurtosis-Werte für den besten Abgleich als Seed für die Optimierung gewählt werden.
  51. Das Verfahren nach Anspruch 46, wobei die mindestens eine vorgewählte Kurve aus einer Pearson IV-Funktion gewählt wird.
  52. Das Verfahren nach Anspruch 51, wobei die mindestens eine vorgewählte Kurve eine Permutation mindestens eines der Werte für Schiefe und Kurtosis ist, während die verbleibenden Parameter konstant bleiben, sodass die Peakformen danach für jede Permutation aufgezeichnet und gespeichert werden.
  53. Das Verfahren nach Anspruch 1 weiter umfassend: Überprüfen der Daten auf Informationen in Zusammenhang mit einem Isotop oder einem Addukt oder beiden; Auswählen der entsprechenden Daten; Klassifizieren der entsprechenden Daten; und Wenn die entsprechenden Daten klassifiziert sind, Zuweisen zu einem Faktor.
  54. Das Verfahren nach Anspruch 53, wobei der Klassifizierungsschritt umfasst: Berechnen einer Korrelation der Daten mit einem Faktor; und Wenn die Korrelation größer ist als die Mindestkorrelation, Zuordnen zu einem Faktor.
  55. Das Verfahren nach Anspruch 54, wobei die Mindestkorrelation 0,9 beträgt.
  56. Das Verfahren nach Anspruch 36, weiter umfassend: Identifizieren der Isotope/Addukte, welche falsch zu einem Faktor gruppiert wurden; und Neuzuordnen der so identifizierten Isotope/Addukte zu einem korrekten Faktor.
  57. Das Verfahren nach Anspruch 56, wobei der Identifizierungsschritt umfasst: Vergleichen eines Konzentrationsprofils eines Faktors mit einem Konzentrationsprofil eines angrenzenden Faktors zur Identifizierung einer Korrelation; Wenn die Korrelation zwischen dem Konzentrationsprofil eines ersten Faktors und eines angrenzenden Faktors größer ist als eine Grenzkorrelation, Überprüfen des benachbarten Faktors zu lokalisierten Isotopen/Addukten aus dem ersten Faktor; und Neuzuweisen des Isotops/Addukts zum ersten Faktor auf Grundlage des Überprüfungsschritts.
  58. Das Verfahren nach Anspruch 57, wobei die Grenzkorrelation 0,9 beträgt.
  59. Das Verfahren nach Anspruch 36, wobei die Korrelationsparameter benutzerdefiniert sind.
  60. Das Verfahren nach Anspruch 36, weiter umfassend: Verhindern von Faktorsplitting.
  61. Das Verfahren nach Anspruch 60, wobei der Verhinderungsschritt umfasst: Bestimmen einer lokalen Korrelationsgrenze, die auf einer durchschnittlichen Korrelation zwischen einem Basis-Isotop/Addukt-Subcluster innerhalb eines Faktors und den anderen Subclustern innerhalb des Faktors basiert; Korrelieren des Konzentrationsprofils des Faktors und eines benachbarten Faktors; und Wenn die Korrelation größer als eine lokale Korrelationsgrenze ist, Verschmelzen des Faktors und des benachbarten Faktors.
  62. Das Verfahren nach Anspruch 61, weiter umfassend: Wenn ein Faktor verschmolzen wird, Korrelation des Konzentrationsprofils des Faktors mit dem nächsten benachbarten Faktor.
  63. Das Verfahren nach Anspruch 61, wobei die Grenzkorrelation 0,9 beträgt.
  64. Das Verfahren nach Anspruch 8, wobei die Mindestcluster-Länge 5 Sticks beträgt.
  65. Das Verfahren nach Anspruch 60, wobei der Verhinderungsschritt umfasst: Vergleichen eines ersten Peaks mit einem zweiten Peak auf Grundlage einer oder mehrerer Bedingungen zwischen ihnen; und Klassifizieren des ersten und des zweiten Peaks als nicht zusammenhängend oder nicht zusammenhängend auf Grundlage einer oder mehrere Bedingungen, wobei der Vergleichsschritt einen oder beide der folgenden Schritte vergleicht: (i) Vergleichen einer Varianz des ersten Peaks mit der Varianz des zweiten Peaks; und (ii) Vergleichen einer mittleren Retentionszeit des ersten Peaks mit der mittleren Retentionszeit des zweiten Peaks.
  66. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 65, wobei der Vergleichsschritt die Varianz des ersten Peaks mit der Varianz des zweiten Peaks und die mittlere Retentionszeit des ersten Peaks mit der mittleren Retentionszeit des zweiten Peaks vergleicht.
  67. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 66, wobei der Vergleichsschritt die Varianz des ersten Peaks mit der Varianz des zweiten Peaks die folgenden Unterschritte umfasst: Bestimmen einer F-Statistik zwischen dem ersten Peak und dem zweiten Peak; Zuweisen eines F-Statistik-Konfidenzintervalls welches mit der t-Statistik in Beziehung steht; Vergleichen des F-Statistik-Konfidenzintervalls mit einem vorgegeben t-Statistik-Parameter; Auf Grundlage des Schrittes des Vergleichs des F-Statistik-Konfidenzintervalls mit einem vorgegeben F-Statistik-Parameter, Charakterisieren des ersten Peaks und des zweiten Peaks als zusammenhängend oder nicht zusammenhängend.
  68. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 66, wobei der Vergleichsschritt der mittleren Retentionszeit des ersten Peaks mit der mittleren Retentionszeit des zweiten Peaks die folgenden Unterschritte umfasst: Bestimmen einer t-Statistik zwischen dem ersten Peak und dem zweiten Peak; Zuordnen eines t-Statistik-Konfidenzintervalls, welches mit der F-Statistik in Beziehung steht; Vergleichen des t-Statistik-Konfidenzintervalls mit einem vorgegeben F-Statistik-Parameter; Basierend auf dem Vergleichsschritt des t-Statistik Konfidenzintervalls mit einem vorgegeben t-Statistik-Parameter, Charakterisieren des ersten Peaks und des zweiten Peaks als zusammenhängend oder nicht zusammenhängend.
  69. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 66, wobei der Vergleichsschritt der mittleren Retentionszeit des ersten Peaks mit der mittleren Retentionszeit des zweiten Peaks die folgenden Unterschritte umfasst: Bestimmen einer t-Statistik zwischen dem ersten Peak und dem zweiten Peak; Zuordnen eines t-Statistik-Konfidenzintervalls, welches mit der F-Statistik in Beziehung steht; Vergleichen des t-Statistik-Konfidenzintervalls mit einem vorgegeben F-Statistik-Parameter; und wobei der Vergleichsschritt der Varianz des ersten Peaks mit der Varianz des zweiten Peaks die folgenden Unterschritte umfasst: Bestimmen einer F-Statistik zwischen dem ersten Peak und dem zweiten Peak; Zuordnen eines F-Statistik-Konfidenzintervalls, welches mit der t-Statistik in Beziehung steht; Vergleichen des F-Statistik-Konfidenzintervalls mit einem vorgegebenen t-Statistik-Parameter; Basierend auf (i) dem Vergleichsschritt des t-Statistik-Konfidenzintervalls mit einem vorgegebenen t-Statistik-Parameter und (ii) dem Vergleichsschritt des F-Statistik Konfidenzintervalls mit einem vorgegeben F-Statistik-Parameter; Charakterisieren des ersten Peaks und des zweiten Peaks als zusammenhängend oder nicht zusammenhängend.
  70. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 66, wobei das chromatographische System einen Speicher mit einer F-Statistik-Nachschlagetabelle umfasst, und wobei der Schritt des Bestimmens einer F-Statistik den Schritt des Nachschlagens der F-Statistik in der Nachschlagetabelle umfasst.
  71. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 70, wobei die F-Statistik-Nachschlagetabelle vorgegebene F-Statistik-Werte enthält, welche mit Singulärwertzerlegung berechnet und im Speicher des Systems gespeichert wurden.
  72. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 69, wobei das chromatographische System einen Speicher mit einer F-Statistik Nachschlagetabelle umfasst und wobei der Schritt des Bestimmens einer F-Statistik den Schritt des Nachschlagens der F-Statistik in der Nachschlagetabelle umfasst.
  73. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 72, wobei die F-Statistik Nachschlagetabelle vorgegebene F-Statistik-Werte enthält welche mit Singulärwertzerlegung berechnet und im Speicher des Systems gespeichert wurden.
  74. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 35, wobei die Faktoren einen oder mehrere Peaks beinhalten und a1, σ1, a2 und σ2 allgemein für jeden der mehrfachen Peaks eingeschränkt sind, wobei das Verfahren weiter umfasst: Modellieren der einen oder mehreren chromatographischen Peaks mit einem bi-exponentiellen Modell und Identifizieren eines Residuums zwischen dem einen oder den mehreren chromatographischen Peaks und dem bi-exponentiellen Modell; und wenn das Residuum-fitting nicht einer vorbestimmten Residuum-fitting Bedingung entspricht, schrittweises Erhöhen des Signals um einen weiteren Peak, bis ein interaktives Residuum eine interaktive Residuum-fitting Bedingung erreicht.
  75. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 74, wobei der Schritt des schrittweisen Erhöhens die Optimierung des Signals umfasst.
  76. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 75, wobei das Signal durch Anwenden eines Levenberg-Marquardt (LM) Algorithmus optimiert wird.
  77. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 76, wobei der LM Algorithmus mit analytischen Ausdrücken berechnet wird.
  78. Ein Verfahren zur Verarbeitung chromatographischer Peaks in chromatographischen Systemen gemäß Anspruch 36, wobei die Faktoren einen oder mehrere Peaks umfassen und a1, σ1, a2 und σ2 allgemein für jeden der mehrfachen Peaks eingeschränkt sind, wobei das Verfahren weiter umfasst: Modellieren des einen oder mehrerer chromatographischen Peaks mit einem bi-exponentiellen Modell und Identifizieren eines Residuum-fittings zwischen dem einen oder den mehreren chromatographischen Peaks und dem bi-exponentiellen Modell; und wenn das Residuum-fitting nicht einer vorbestimmten Residuum-fitting Bedingung entspricht, schrittweises Erhöhen des Signals um einen weiteren Peak, bis ein interaktives Residuum-fitting eine interaktive Residuum-fitting Bedingung erreicht.
  79. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 78, wobei der Schritt des schrittweisen Erhöhens die Optimierung des Signals umfasst.
  80. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 79, wobei das Signal durch Anwenden eines Levenberg-Marquardt (LM) Algorithmus optimiert wird.
  81. Ein Verfahren zur Verarbeitung von Daten gemäß Anspruch 80, wobei der LM Algorithmus mit analytischen Ausdrücken berechnet wird.
DE112012005677.9T 2012-01-16 2012-09-11 Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen. Withdrawn DE112012005677T5 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261587041P 2012-01-16 2012-01-16
US61/587,041 2012-01-16
PCT/US2012/028754 WO2012125548A2 (en) 2011-03-11 2012-03-12 Systems and methods to process data in chromatographic systems
USPCT/US2012/028754 2012-03-12
PCT/US2012/054589 WO2013109314A1 (en) 2012-01-16 2012-09-11 Systems and methods to process data in chromatographic systems

Publications (1)

Publication Number Publication Date
DE112012005677T5 true DE112012005677T5 (de) 2014-10-23

Family

ID=48799568

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012005677.9T Withdrawn DE112012005677T5 (de) 2012-01-16 2012-09-11 Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.

Country Status (5)

Country Link
US (1) US20150051843A1 (de)
JP (1) JP6077568B2 (de)
CN (1) CN104126119B (de)
DE (1) DE112012005677T5 (de)
WO (1) WO2013109314A1 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5933032B2 (ja) * 2012-01-16 2016-06-08 レコ コーポレイションLeco Corporation クロマトグラフィーピークを処理しグループ化するシステム及び方法
JP6772547B2 (ja) * 2016-05-20 2020-10-21 東ソー株式会社 ディジタルフィルタを備えた液体クロマトグラフ用データ処理装置
DE112016006822T5 (de) * 2016-06-30 2019-01-10 Intel Corporation Sensorbasiertes datensatzverfahren und einrichtung
EP4071469A3 (de) * 2016-10-25 2022-12-14 Regeneron Pharmaceuticals, Inc. Verfahren und systeme zur analyse von chromatografiedaten
CN106950315B (zh) * 2017-04-17 2019-03-26 宁夏医科大学 基于uplc-qtof快速表征样品中化学成分的方法
US11244818B2 (en) 2018-02-19 2022-02-08 Agilent Technologies, Inc. Method for finding species peaks in mass spectrometry
WO2019224968A1 (ja) * 2018-05-24 2019-11-28 株式会社島津製作所 分析システム
CN109100441B (zh) * 2018-08-23 2021-05-07 西南科技大学 一种液相色谱曲线去除脉冲干扰的方法
CN110441420B (zh) * 2019-08-02 2022-04-22 长园深瑞监测技术有限公司 一种在线监测油中溶解气体气相色谱峰自动识别方法
WO2021106356A1 (ja) * 2019-11-27 2021-06-03 アルプスアルパイン株式会社 クロマトグラムデータ処理装置、クロマトグラムデータ処理方法、クロマトグラムデータ処理プログラム及び記憶媒体
CN114076807B (zh) * 2022-01-19 2022-04-08 华谱科仪(北京)科技有限公司 一种色谱图异常处理方法、存储介质及电子设备
CN115932144B (zh) * 2023-02-22 2023-05-12 华谱科仪(北京)科技有限公司 色谱仪性能检测方法、装置、设备和计算机介质
CN116720067B (zh) * 2023-06-02 2024-05-24 广东省麦思科学仪器创新研究院 基于振荡信号的质谱图全局峰信息特征描述方法和装置
CN117907511B (zh) * 2024-03-20 2024-06-14 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3488518A (en) * 1965-12-13 1970-01-06 Ibm Peak voltage storage and noise eliminating circuit
JP2550805B2 (ja) * 1991-06-30 1996-11-06 株式会社島津製作所 クロマトグラフの吸光分析装置
US6787761B2 (en) * 2000-11-27 2004-09-07 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
US7488935B2 (en) * 2005-06-24 2009-02-10 Agilent Technologies, Inc. Apparatus and method for processing of mass spectrometry data
US7501621B2 (en) 2006-07-12 2009-03-10 Leco Corporation Data acquisition system for a spectrometer using an adaptive threshold
JP2009008582A (ja) * 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
EP2322922B1 (de) * 2009-08-26 2015-02-25 Thermo Fisher Scientific (Bremen) GmbH Verfahren zur Verbesserung der Auflösung von Verbindungen, die von einer Chromatografievorrichtung abgegeben werden
US10488377B2 (en) * 2011-03-11 2019-11-26 Leco Corporation Systems and methods to process data in chromatographic systems

Also Published As

Publication number Publication date
WO2013109314A1 (en) 2013-07-25
CN104126119B (zh) 2017-05-24
US20150051843A1 (en) 2015-02-19
JP6077568B2 (ja) 2017-02-08
JP2015503763A (ja) 2015-02-02
CN104126119A (zh) 2014-10-29

Similar Documents

Publication Publication Date Title
DE112012005677T5 (de) Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.
DE112012001185B4 (de) Systeme und Verfahren zur Datenverarbeitung in Chromatographiesystemen
EP3098581B1 (de) Verfahren zur korrektur von untergrundsignalen in einem spektrum
CN1690713B (zh) 对样本进行分析以提供表征数据的方法、系统
DE102004015018B4 (de) Verfahren zum Identifizieren von Ionen aus Chromatographie-Massenspektral-Datensätzen, die überlappende Komponenten enthalten
DE112004001811B4 (de) Verfahren zum Bearbeiten und Speichern von Massenspektrometriedaten
DE4317246A1 (de) Verfahren und Vorrichtung für die Dekonvolution von nicht aufgelösten Daten
DE102014012745B4 (de) Hintergrundkorrektur in Emissionsspektren
DE10313875B3 (de) Vorrichtung und Verfahren zum Analysieren eines Informationssignals
DE112011102013B4 (de) Verfahren für die lonenmobilitätsspektrometrie
DE4032491C2 (de) Massenspektroskopisches Verfahren und massenspektroskopische Vorrichtung
DE102017207125A1 (de) Verfahren zum Durchführen einer Materialzerlegung unter Verwendung einer Dual-Energie-Röntgen-CT und eines entsprechenden Dual-Energie-Röntgen-CT-Gerätes
DE102016012302B4 (de) Verfahren zum Auswerten von Daten einer Massenspektrometrie und massenspektrometrisches Verfahren
CN110503060B (zh) 一种光谱信号去噪方法及其系统
JP2015503763A5 (de)
DE102014226368A1 (de) Raman-Spektroskopie-Erfassungsverfahren zum Erfassen einer Probe in einem Gefäß
WO2001086819A9 (de) Verfahren und vorrichtung zur kompression und/oder dekompression sowie zur analyse und darstellung von daten
DE102012205686B3 (de) Verfahren zur Substanzidentifizierung und zugehöriges Computerprogrammprodukt
DE102009005845A1 (de) Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
Meng et al. Gaussian mixture models of ECoG signal features for improved detection of epileptic seizures
Visser et al. An information-theoretic methodology for the resolution of pure component spectra without prior information using spectroscopic measurements
EP3707496B1 (de) Identifizierung eines oder mehrerer spektraler merkmale in einem spektrum einer probe für eine inhaltsstoffanalyse
DE102017008885B4 (de) Massenspektrometrisches Verfahren und MALDI-TOF-Massenspektrometer
DE102021117017A1 (de) Peakbreitenabschätzung in massenspektren
DE102013207402A1 (de) Verfahren zum rechnergestützten Verarbeiten von räumlich aufgelösten Hyperspektraldaten, insbesondere von Massenspektrometriedaten

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: COHAUSZ & FLORACK PATENT- UND RECHTSANWAELTE P, DE

R016 Response to examination communication
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee