-
Gebiet der Erfindung
-
Die Erfindung betrifft ein Verfahren, das zur Qualitätskontrolle und Signalkorrektur von Massenspektrometrie-Daten biologischer Gewebeproben geeignet ist und auf der Analyse des in einem Spektrum beobachteten chemischen Hintergrundsignals beruht. Dabei wird ausgenutzt, dass das chemische Hintergrundsignal Anteile von einer Vielzahl von Polymermolekülen enthält, deren chemischer Aufbau starke Regelmäßigkeiten aufweist. Aufgrund dieser Regelmäßigkeiten unterliegen die beobachteten (ladungsbezogenen) Massen gewissen statistischen Verteilungen, die jeweils für die Molekülklasse charakteristisch sind. Durch die Analyse dieser statistischen Eigenschaften ist es beispielsweise möglich, eventuell vorliegende Massenverschiebungen zu erkennen und zu korrigieren.
-
Hintergrund der Erfindung
-
Der Stand der Technik wird im Folgenden mit Bezug auf einen speziellen Aspekt erläutert. Dies soll jedoch nicht als Einschränkung verstanden werden. Nützliche Fortentwicklungen und Änderungen vom aus dem Stand der Technik bekannten können auch über den vergleichsweise engen Rahmen dieser Einleitung hinaus anwendbar sein und werden sich geübten Praktikern auf diesem Gebiet nach der Lektüre der nachfolgenden Offenbarung umstandslos erschließen.
-
Bei der Akquisition von MALDI-TOF-Massenspektrometrie-Daten von biologischen Gewebeschnitten (Matrix-assisted laser desorption/ionization Time-of-flight = MALDI-TOF; Flugzeit-Massenspektrometrie mit Ionisierung durch matrix-unterstützte Laserdesorption) wird eine Vielzahl von Informationen über die molekulare Struktur der Gewebeproben gewonnen. Gleichzeitig wirken eine Reihe von potentiellen Störungen auf die Messung ein, die zu Verzerrungen und Verfälschungen der gewonnenen Information führen können.
-
Eine häufig auftretende Verzerrung der gemessenen Daten besteht in einem systematischen Fehler in den gemessenen Massen. Herkömmliche Methoden zur Korrektur solcher Massenverzerrungen sind in vielen Fällen entweder zu ungenau, zu zeitaufwändig, oder erfordern eine Benutzerinteraktion und sind daher nicht automatisierbar.
-
Die Masse eines Moleküls wird in Dalton (Da) als ein Vielfaches der atomaren Masseneinheit (1 Da = 1 amu, atomic mass unit) angegeben. Der relative Messfehler liegt bei MALDI-TOF-Messungen typischerweise in der Größenordnung von 50-100 ppm (ppm = parts per million). In dem für viele Fragestellungen relevanten Massenbereich bis 3000 Dalton liegt der Fehler daher häufig unterhalb von 0,5 Dalton, in Einzelfällen kann er diese Grenze jedoch auch übersteigen.
-
Die aus den Messfehlern resultierende Verzerrung der Massenachse wird üblicherweise durch eine Kalibrierung ausgeglichen, wofür eine Kalibrierungslösung neben oder auf der Gewebeprobe platziert wird. Die gemessenen Spektren werden nach der Messung mit den erwarteten Massen der bekannten Inhaltsstoffe der Lösung verglichen, woraus eine Kalibrierungskurve bestimmt wird (s. Christian, N. P., R. J. Arnold and J. P. Reilly (2000): „Improved calibration of time-of-flight mass spectra by simplex optimization of electrostatic ion calculations." Anal. Chem. 72(14): 3327-3337).
-
Aus praktischen Gründen kann eine Kalibrierungslösung nur eine geringe Anzahl bekannter Substanzen beinhalten. Dies limitiert die Anzahl der Stützstellen, aus denen die Kalibrierungskurve bestimmt wird, und damit die Genauigkeit der Kalibrierung. Darüber hinaus erfordert diese Form der Kalibrierung eine manuelle Benutzerinteraktion und es sind Fehlzuordnungen möglich.
-
-
Bei einer verwandten, vom Erfinder entwickelten Methode der Massenverschiebungsnormalisierung von Peptidspektren (s.
WO 2018/072862 A1 ; PCT/EP2017/001131) werden Ensembles von Spektren betrachtet und jeweils so modifiziert, dass relative Massenverschiebungen zwischen den Spektren minimiert werden. Hierzu werden statistische Eigenschaften der Hintergrundsignale ausgewertet und miteinander verglichen, woraus dann Korrekturtransformationen für jedes Einzelspektrum abgeleitet werden. Diese vollautomatische Methode ist effizient implementierbar und kommt ohne Peak Picking aus, ist aber nur für Peptiddaten gezeigt.
-
Bei der MALDI-TOF Massenspektrometrie wird eine biologische Gewebeprobe nach einer geeigneten Probenpräparation mit einer Matrixlösung überzogen und im Vakuum mit einem Laser beschossen (s. Caprioli, R. M., T. B. Farmer and J. Gile (1997): „Molecular imaging of biological samples: localization of peptides and proteins using MALDI-TOF MS." Anal. Chem. 69(23): 4751-4760). Dabei werden Moleküle aus dem Gewebe herausgelöst und ionisiert, typischerweise mit einer einfach positiven Ladung. Die Ionen werden anschließend in einem elektrischen Feld beschleunigt und von einem Detektor registriert. Aus der Flugzeit lässt sich der m/z-Wert, d.h. das Verhältnis zwischen Masse und Ladung des Moleküls bestimmen (ladungsbezogene Masse). Das gemessene Massenspektrum stellt die relative Zahl der registrierten Ionen (spektrale Intensität) als Funktion ihrer m/z-Werte dar. Unter der Annahme einer einfach positiven Ionisierung ist der m/z-Wert identisch mit der Masse des ionisierten Moleküls. Entsprechend wird im weiteren Verlauf der Beschreibung zwecks Vereinfachung häufig von Masse gesprochen, auch wenn damit eigentlich die ladungsbezogene Masse m/z gemeint ist.
-
Die beobachteten Moleküle können unterschiedlichen Molekülklassen angehören. Je nach Anwendung werden insbesondere Metabolite, Lipide, Peptide, Proteine und Kohlenhydrate (Glykane) untersucht (s. Spengler, B. (2015): „Mass spectrometry imaging of biomolecular information.“ Anal. Chem. 87(1): 64-82), häufig aus einem flächigen Gewebeschnitt in einem Bildgebungsverfahren (MSI = mass spectrometry imaging). Die jeweils verwendete Präparationsmethode sowie die verwendeten Messparameter haben dabei einen großen Einfluss darauf, welche Molekülklassen in welchen Massebereichen ionisiert werden und in den gemessenen Spektren erscheinen.
-
Näherungsweise entspricht die Masse m eines Moleküls in Dalton der Gesamtzahl der Protonen und Neutronen, aus denen die Atome des Moleküls zusammengesetzt sind. Die Differenz zwischen dieser ganzzahligen Nominalmasse mN und der tatsächlichen, exakten Masse m wird als Massendefekt bezeichnet. Der Massendefekt eines Moleküls ist die Summe der Massendefekte der einzelnen Atome, die wiederum für jedes chemische Element oder Isotop verschieden sind.
-
Der Massendefekt der leichteren Elemente bis Stickstoff ist positiv, und beim Kohlenstoff aufgrund der Definition der atomaren Masseneinheit identisch Null. Bei Sauerstoff und allen schwereren Elementen ist er negativ. Der Gesamtmassendefekt der meisten organischen Verbindungen in der Biochemie ist positiv.
-
Zur Visualisierung der in einem Spektrum beobachteten Massendefekte werden die m/z-Werte der in einem Spektrum gefundenen Massensignale in einem Diagramm aufgetragen, dessen horizontale Achse der Masse m (bzw. dem m/z-Wert) entspricht, während auf der vertikalen Achse deren Nachkommaanteil φ(m)=m-floor(m) abgetragen wird (s. ). Es ist zu beachten, dass bei größeren Molekülen der Massendefekt auch Werte größer als ein Dalton annehmen kann und somit der Nachkommaanteil einer Masse nicht mit dessen Massendefekt übereinstimmen muss.
-
Bei den sogenannten Kendrick-Diagrammen (s. Kendrick, E. (1963): „A Mass Scale Based on CH2 = 14.0000 for High Resolution Mass Spectrometry of Organic Compounds.“ Anal. Chem. 35(13): 2146-2154) handelt es sich um eine Variante dieser Darstellung, bei denen ein Skalierungsfaktor λ so gewählt wird, dass er dem Verhältnis zwischen exakter Masse und Nominalmasse einer bestimmten Atomgruppe entspricht. Typischerweise ist dies eine Atomgruppe, die in einer betrachteten Klasse von Polymeren als Wiederholeinheit auftritt. Auf der vertikalen Achse im Kendrick-Diagramm wird die Größe
abgetragen, die im Folgenden als Kendrick-Verschiebung bezeichnet wird. Wegen Δ
λ(m)=Δ
λ(m+λn) für ganzzahlige n nimmt Δ
λ für Moleküle, die sich nur um eine oder mehrere Wiederholungen der betrachteten Atomgruppe unterscheiden, identische Werte an. Die Kendrick-Verschiebung ist daher ein Maß dafür, um wieviel sich die Masse eines Moleküls von den Massen einer bestimmten Polymerfamilie unterscheidet. Sie kann Werte im Bereich [-1/2 ... +1/2] annehmen, wobei die beiden Enden dieses Bereiches als miteinander identifiziert angesehen werden müssen. Die Kendrick-Verschiebungs-Skala entspricht somit topologisch einer Kreislinie.
-
Peptide (und deren größere Vertreter: Proteine) sind Verkettungen von Aminosäuren, die aus den fünf Elementen Kohlenstoff, Wasserstoff, Sauerstoff, Stickstoff und Schwefel bestehen. Das relative Verhältnis dieser Elemente zueinander ist bei allen Peptiden unabhängig von ihrer Gesamtmasse sehr ähnlich. Man kann sich daher alle Peptide näherungsweise als Molekülketten bestehend aus einer hypothetischen „durchschnittlichen“ Aminosäure, dem „Averagine“ vorstellen (s. Senko, M. W., S. C. Beu and F. W. McLafferty (1995): „Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions.“ Journal of the American Society for Mass Spectrometry 6(4): 229-233). Nach diesem Modell ergibt sich ein nahezu linearer Zusammenhang zwischen der Masse m eines Peptids und seiner Nominalmasse m
N,
-
Aufgrund der großen Zahl von unterschiedlichen Proteinen und - bei geeigneter Probenpräparation, z.B. einem Verdau mit einem Enzym wie Trypsin - daraus resultierenden Peptiden in biologischem Gewebe weist ein typisches MALDI-Spektrum Signalanteile für Peptide in einem breiten Massenbereich auf. In einem Kendrick-Diagramm zum Skalierungsfaktor λP erscheinen die zugehörigen exakten Massen um die Nulllinie herum gestreut (s. ). Bei einer realen Messung zeigen sich dagegen die auftretenden Messfehler und die damit einhergehende Verzerrung der Massenachse in einer vertikalen Verschiebung (s. ).
-
Unter der Annahme, dass ein gemessenes Spektrum von Peptidsignalen dominiert ist und die Massenverschiebung innerhalb von ±0,5 Dalton liegt, lässt sich die Abweichung zwischen den mittleren gemessenen Peptidmassen in einem bestimmten Intervall der Massenachse und den wahren Peptidmassen über das erste zirkuläre Moment µ der Verteilung der Kendrick-Verschiebung in diesem Massenintervall abschätzen (s.
WO 2018/072862 A1 ). Mathematisch ist dies äquivalent mit der Berechnung eines Fourier-Integrals des Spektrums über das betrachtete Intervall zur Frequenz ω) = 2π/λ
P. Die beobachtete Massenverschiebung Δ ergibt sich näherungsweise aus dem komplexen Argument des Moments µ mittels Δ = arg(µ)/2π.
-
Zur Reduktion der relativen Massenverschiebungen innerhalb eines Ensembles von Spektren werden die zirkulären Momente für jedes Spektrum separat bestimmt. Das mittlere Moment über alle Spektren dient als Referenz, die Einzelspektren werden so transformiert, dass die jeweiligen Verschiebungen gegenüber dem Referenzwert verschwinden (s.
WO 2018/072862 A1 ).
-
Die Veröffentlichung Bajrami B. et al.: Journal of the American Society for Mass Spectrometry, Bd. 20, Nr. 11, 1. November 2009, Seiten 2124-2134, referiert über Effekte chemischer Modifikationen von Aminosäuren auf die Verteilung der Peptidmassendefekte relativ zum Averagine-Modell.
-
Die Veröffentlichung Melinda L. Toumi et al.: Journal of Proteome Research, Bd. 9, Nr. 10, 1. Oktober 2010, Seiten 5492-5495, erläutert einen Vergleich der Streuung von gemessenen Averagine-Peptidmassendefekten mit einer theoretischen Verteilung und leitet daraus einen angepassten Massendefektfilter zwecks einer genaueren Selektion von Peptiden ab.
-
Die Veröffentlichung Indranil Mitra et al., Anal. Chem., 20. März 2012, 20; 84(6): 3026-3032, befasst sich mit einer genaueren Beschreibung der theoretischen Averagine-Peptidmassendefekte in Abhängigkeit eines Massendefektfilters und leitet daraus ebenfalls einen angepassten Massendefektfilter zwecks einer genaueren Selektion von Peptiden ab.
-
Die Veröffentlichung
US 2012/0232805 A1 offenbart ein computerisiertes Verfahren und eine Vorrichtung zum Aufzählen einer oder mehrerer Aminosäurezusammensetzungen im Bereich der Aminosäureanalyse.
-
Unter Berücksichtigung der vorherigen Ausführungen besteht ein Bedarf, Verfahren bereitzustellen, mit dem die Massendefekte aus Proben mit komplexer Polymer-Zusammensetzung ausgewertet werden können. Weitere durch die Erfindung zu lösende Aufgaben werden sich dem Fachmann auf diesem Gebiet bei der Lektüre der nachfolgenden Offenbarung umstandslos erschließen.
-
Kurze Beschreibung der Erfindung
-
Das eingangs erläuterte Verfahren aus
WO 2018/072862 A1 ist lediglich für solche Daten geeignet, in denen das chemische Untergrundsignal überwiegend von einer einzelnen Substanzklasse herrührt, beispielsweise den in
WO 2018/072862 A1 genannten Peptiden. Die hier beschriebenen Erweiterungen ermöglichen die Anwendung auch auf Daten, die mit anderen Präparationsprotokollen und Untersuchungsmethoden gewonnen wurden und/oder in denen das Untergrundsignal eine komplexere Struktur aufweist. Häufig können zum Beispiel Anteile verschiedener Molekülklassen in Gewebeproben gemeinsam auftreten, wie z.B. Lipide, Glykane sowie Proteine und Peptide im niedrigen bis mittleren Massenbereich.
-
Die wesentlichen Gedanken, die diesen Erweiterungen zugrunde liegen, sind: Neben Proteinen und Peptiden lassen sich auch andere Molekülklassen, wie N-Glykane und Lipide, durch relativ einfache Massenmodelle beschreiben. Die ggfs. komplexere Struktur des Kendrick-Diagramms kann durch höhere zirkuläre Momente hinreichend genau erfasst werden. Es lassen sich durch direkten Vergleich aller betrachteten Momente relative Massenverschiebungen abschätzen. Eine entsprechend angepasste Hough-Transformation kann verwendet werden, um näherungsweise lineare Strukturen in der zirkulären Geometrie des Kendrick-Diagramms zu lokalisieren. Die Lokalisierung einer gesamten zusammenhängenden Struktur und deren Zuordnung zu einer einzelnen Molekülklasse erlauben unter einfachen Zusatzannahmen die Korrektur von Massenfehlern auch über ± 0.5 Dalton hinaus.
-
Die Erfindung betrifft insbesondere Verfahren zum Auswerten von massenspektrometrischen Messdaten zur Analyse von Gewebeproben, aufweisend die Schritte: (a) Bereitstellen einer Gewebeprobe, die Polymere mit variierenden Verkettungen von charakteristischen Molekülen enthält, z.B. Biopolymere in der Art von Proteinen, Peptiden, N-Glykanen und/oder Lipiden, (b) Bearbeiten der Gewebeprobe, um wenigstens zwei Arten von Polymeren und davon abgeleitete Moleküle für eine anschließende massenspektrometrische Messung aufzubereiten und zugänglich zu machen, (c) Aufnehmen von Massenspektren von der bearbeiteten Gewebeprobe, (d) Ermitteln der Massenverschiebungen der in den Massenspektren abgebildeten Polymer-Massensignale, wobei eine Massenverschiebung die Abweichung eines gemessenen Massensignals von dem auf einer Massenskala zu erwartenden nächstgelegenen Molekülmassensignal wiedergibt und die Gesamtheit der möglichen Molekülmassensignale über ein theoretisches Modell wenigstens einer Art von Polymeren berechnet wird, bei dem zur Bildung eines theoretischen Modells wenigstens einer Art von Polymeren die Masse sich als näherungsweise proportional zur Nominalmasse annehmen lässt und alle natürlichen Zahlen in einem geeignet gewählten Bereich als mögliche Nominalmassen für diese Art von Polymeren in Betracht gezogen werden können, (e) Auswerten der ermittelten Massenverschiebungen, z.B. umfassend (i) die Berechnung zirkulärer Momente größer als das erste zirkuläre Moment, um mehr als einen Häufungspunkt von Kendrick-Verschiebungen zu erfassen, und/oder (ii) eine Transformation des Hough-Typs zur Strukturerkennung, und (f) Bewerten einer Güte der Massenspektren in Abhängigkeit der Auswertung.
-
Bevorzugt umfasst das Ermitteln der Massenverschiebungen die Berechnung der Größe
(Kendrick-Verschiebung) für gemessene Massenwerte m, dabei einen Skalierungsfaktor λ so wählend, dass er dem mittleren Verhältnis zwischen exakter Masse und Nominalmasse der Polymere entspricht, beispielsweise für N-Glykane λ
G = 1 + 3,5 × 10
-4 und für Proteine/Peptide λ
P = 1 + 4,95 × 10
-4.
-
Zur Schätzung eines Kendrick-Profils zu einem Massenspektrum können (i) die Positionen der lokalen Maxima des Massenspektrums bestimmt, diese als Punktwolke im Kendrick-Diagramm dargestellt und über Standardmethoden der Dichteschätzung eine Verteilungsfunktion abgeschätzt werden, oder es kann (ii) ein zweidimensionales Histogramm aus den spektralen Intensitäten eines Massenspektrums in der Ebene des Kendrick-Diagramms gebildet werden, sodass in jeder Histogrammkachel die auf sie entfallenden Intensitäten aufsummiert werden, wobei nach Normalisierung in vertikaler Richtung jede Spalte einer numerischen Approximation des Kendrick-Profils für das entsprechende Massenintervall entspricht.
-
Das Auswerten und das Bewerten der Güte der Massenspektren können die Ermittlung einer Abweichung von der für die Aufnahme der Massenspektren verwendeten Massenskala zu einer aus den Massenverschiebungen abgeleiteten Massenskala umfassen, insbesondere derart, dass das Auswerten (i) eine absolute Massenkalibrierung einzelner Massenspektren, indem für ein einzelnes Massenspektrum eine dominante Komponente und deren Verlauf ermittelt werden und daraus eine Korrekturfunktion für eine Massenkalibrierung bestimmt wird, und/oder (ii) eine relative Korrektur der Massenskalen eines Ensembles von Massenspektren zueinander, so dass die relativen Verschiebungen zwischen den Massenspektren minimiert werden, beinhaltet.
-
In verschiedenen Ausführungsformen können die Schritte zur Berechnung der Kendrick-Verschiebungen und die Berechnung zirkulärer Momente zusammengesetzt und das n-te zirkuläre Moment gemäß der Formel
als Fourier-Integral des kontinuierlich interpolierten Spektrums S̃ über Teilintervalle I
k der Massenskala ausgedrückt werden. Dabei ist es möglich, die Abweichung im Bereich des Teilintervalls I
k der Massenskala aus mindestens zwei zirkulären Momenten zu verschiedenen n gemäß der Formel
zu berechnen, wobei die
µ k,n* die komplex Konjugierten der n-ten zirkulären Momente eines Referenz-Kendrick-Profils im Teilintervall I
k bezeichnen. Ferner lassen sich die
µ k,n aus einem Ensemble von N Spektren S
j (j=1 ... N) sowie den zugehörigen Momenten
gemäß der Formel
mit einem Exponent α ∈ ℕ
0 nachbilden, für den vorzugsweise einer der Werte
0,
1 oder
2 gewählt wird.
-
In verschiedenen Ausführungsformen kann die Transformation des Hough-Typs auf den aus einem aufgenommenen Spektrum ermittelten Massenwerten m
i, zugehörigen Kendrick-Verschiebungen Δ
i sowie geeignet gewählter Dichtewerte p
i, wobei die Dichtewerte p
i, den spektralen Intensitäten eines aufgenommenen Spektrums und die m
i den jeweils zugehörigen Massewerten entsprechen können, gemäß der Formel
ausgeführt werden, wobei r in einem geeignet gewählten Bereich diskretisiert wird, bevorzugt im Intervall [-10
-3 ... 10
-3], d im Interval [-1/2 ... 1/2] diskretisiert wird, und ε der Diskretisierungsbreite von d entspricht.
-
In besonderen Ausführungsformen können die mi den Massewerten zu lokalen Maxima eines aufgenommenen Spektrums entsprechen und die pi zu eins gewählt werden.
-
Die Abweichung lässt sich gemäß einer der Formeln
bestimmen, wobei (r̂,d̂) ein lokales Maximum einer Hough-Transformierten H(r,d) beschreibt, das dem globalen Maximum der Hough-Transformierten H(r,d) entsprechen kann.
-
In verschiedenen Ausführungsformen kann das Bearbeiten der Gewebeprobe die Einwirkung von Agenzien und/oder Reagenzien umfassen. Beispiele für Reagenzien sind insbesondere Enzyme zum Peptidverdau wie Trypsin oder Glykan-aufspaltende Enzyme wie eine Endoglykosidase (z.B. PNGase F). Alternativ kann ein Protein- bzw. Peptidverdau oder die Spaltung von Glykanen auch mittels saurer Hydrolyse unter Einsatz von Säuren als Reagenzien durchgeführt werden. Als Beispiele für Agenzien können Umgebungsbedingungen wie Wärme oder Feuchtigkeit genannt werden, z.B. während ein Reagenz auf die Gewebeprobe einwirkt. Weiterhin kann die Gewebeprobe einer Ultraschallbehandlung oder mehreren aufeinanderfolgenden Zyklen aus sich wiederholenden Einfrier- und Auftauschritten ausgesetzt sein. Diese Behandlungen ermöglichen zum Beispiel den erleichterten Zugang zu einzelnen Lipidmolekülen, da hierbei die geordnete Membranstruktur im Gewebe aufgebrochen wird. Bei MALDI-Analysen können zudem die Wahl der eingesetzten Matrixsubstanz sowie ihrer Menge während der Probenvorbereitung einen Einfluss auf die Qualität und Quantität der detektierten Biomolekülklassen haben. In verschiedenen Ausführungsformen kann die Gewebeprobe daher die Behandlung mit unterschiedlichen Matrixsubstanzen, die ebenfalls selbst als polymerisierte Massensignale in einem Massenspektrum aufscheinen können, in variierenden Mengen umfassen.
-
Kurze Beschreibung der Abbildungen
-
Zum besseren Verständnis der Erfindung wird auf die folgenden Abbildungen verwiesen. Die Elemente in den Abbildungen sind nicht unbedingt maßstabsgetreu dargestellt, sondern sollen in erster Linie die Prinzipien der Erfindung (größtenteils schematisch) veranschaulichen. In den Abbildungen sind einander entsprechende Elemente in den verschiedenen Ansichten durch gleiche Bezugszeichen gekennzeichnet.
- zeigt ein herkömmliches Massendefektdiagramm eines Mittelwertspektrums mit erkennbarem Peptidband (Stand der Technik).
- illustriert ein Kendrick-Diagramm des Spektrums aus , in dem das Peptidband um die Nulllinie herum lokalisiert ist (ähnlich zu WO 2018/072862 A1 ).
- stellt ein Kendrick-Diagramm eines Spektrums mit deutlicher Massendiskrepanz von bis zu ca. 0,35 Dalton dar (ähnlich zu WO 2018/072862 A1 ).
- zeigt ein komplexes Kendrick-Diagramm eines Peptidspektrums mit überlagertem Matrixsignal.
- illustriert ein komplexes Kendrick-Diagramm eines N-Glykan-Spektrums mit Glykanband (horizontal Mitte), Peptidsignal (oben links und rechts) und Matrixanteil (unten links).
- veranschaulicht den Zusammenhang zwischen Masse und Massendefekt bei N-Glykanen.
- gibt die Streuung der Massendefekte von N-Glykanen um den Erwartungswert wider.
- zeigt eine zweidimensionale Histogramm-Darstellung eines Kendrick-Profils zum Peptidspektrum aus .
- illustriert eine Punktwolken-Darstellung eines Kendrick-Profils zu Glykan-Spektren mit einer moderaten Massenverschiebung.
- illustriert eine Punktwolken-Darstellung eines Kendrick-Profils zu Glykan-Spektren mit einer starken Massenverschiebung.
- veranschaulicht das Kendrick-Profil aus einschließlich Kenntlichmachung einer dominanten Struktur (durchgezogene Doppellinie).
- zeigt eine zylindrische Hough-Transformierte zum Kendrick-Profil aus den und . Das Fadenkreuz markiert das absolute Maximum der Hough-Transformation und liefert die Position der dominanten Struktur im Kendrick-Profil.
- stellt eine aus der Hough-Transformation in gewonnene Korrekturfunktion für die Massenachse dar, die über 0,5 Dalton hinausreicht.
- illustriert ein Beispiel für eine erfolgreiche Massenachsenkorrektur, deren Funktion aus MALDI-TOF-Bildgebungs-Daten auf Grundlage der enthaltenen Glykan-Signale gewonnen wurden.
-
Detaillierte Beschreibung
-
Während die Erfindung anhand einer Anzahl von Ausführungsformen dargestellt und erläutert wurde, werden Fachleute auf dem Gebiet anerkennen, dass verschiedene Änderungen in Form und Detail daran vorgenommen werden können, ohne vom Umfang der in den beigefügten Patentansprüchen definierten technischen Lehre abzuweichen.
-
Das in der Einleitung skizzierte Verfahren setzt voraus, dass neben der untersuchten Molekülklasse keine wesentlichen Signalanteile von anderen Molekülklassen im Spektrum vorliegen. Wenn diese Voraussetzung nicht erfüllt ist, treten im Kendrick-Diagramm neben der eigentlich relevanten Struktur weitere Strukturen auf, die sich mit ersterer auch überlagern können. Diese Situation kann bereits bei von Proteinen und Peptiden gewonnenen MALDI Bildgebungs-Daten in Form von MALDI-Matrixsubstanz-Clusterionen auftreten (s.
), ist aber insbesondere auch bei Messungen gegeben, die auf andere Molekülklassen abzielen (s.
). Als Folge fällt das aus
WO 2018/072862 A1 bekannte erste zirkuläre Moment µ nicht mit dem Häufungspunkt der Kendrick-Verschiebungen zusammen und erlaubt somit keine verlässliche Aussage über eine eventuell vorliegende Massenverschiebung.
-
Im nachfolgenden wird eine Erweiterung des Verfahrens beschrieben, die auch dann anwendbar ist, wenn sich in den Spektren Signalanteile mehrerer Molekülklassen überlagern. Es werden verschiedene Varianten beschrieben, die sowohl eine absolute Kalibrierung einzelner Spektren als auch eine relative Korrektur eines Ensembles von Spektren ermöglichen.
-
Das Verfahren ist prinzipiell für Spektraldaten geeignet, in denen Signalanteile von einer oder mehreren Polymer-Molekülklassen vorliegen. Als Polymere werden hier solche Moleküle bezeichnet, die zu einem wesentlichen Teil aus einer Verbindung mehrerer identischer oder chemisch ähnlicher Atomgruppen bestehen. Auf dem Gebiet der Biopolymere beinhaltet dies neben den bereits erwähnten Proteinen und Peptiden insbesondere Glykane, die aus einer baumartigen Anordnung von Monosacchariden (Einfachzuckermolekülen) bestehen, oder Lipide, die als wesentliche Bestandteile eine oder mehrere Kohlenwasserstoffketten enthalten. Auch Matrixsubstanzen wie z.B. Sinapinsäure, 2,5-Dihydroxybenzoesäure, α-Cyanohydroxyzimtsäure oder 2,4,6-Trihydroxyacetophenon können zu Clustern polymerisieren und in Massenspektren als entsprechend regelmäßiges Hintergrundsignal aufscheinen.
-
Im Folgenden wird insbesondere die Molekülklasse der N-Glykane betrachtet, da diese eine hohe Bedeutung für biomedizinische Anwendungen haben und sich gleichzeitig - bei geeigneter Probenpräparation, z.B. einem Verdau mit Enzymen wie einer Endoglykosidase (z.B. Peptid N-Glykosidase F, PNGaseF) - mit hoher Signalqualität in MALDI Bildgebungs-Daten nachweisen lassen (s. Drake, R. R., T. W. Powers, E. E. Jones, E. Bruner, A. S. Mehta and P. M. Angel (2017): „MALDI Mass Spectrometry Imaging of N-Linked Glycans in Cancer Tissues.“ Advances in Cancer Research 134: 85-116).
-
Das Peptidmassenmodell beschreibt die statistische Verteilung der exakten Massen von Peptiden in Abhängigkeit von deren Nominalmassen. Durch die Umrechnung von exakten Massen m zu Kendrick-Verschiebungen Δ (bezüglich eines fest gewählten Skalierungsfaktors λ) erhält man ein theoretisches, probabilistisches Modell von Kendrick-Verschiebungen. Mathematisch lässt sich dies durch eine Schar von Verteilungsdichtefunktionen P = P(Δ; mN) beschreiben, die durch die Nominalmasse mN parametrisiert ist. Da der Wertebereich der Kendrick-Verschiebung, das Intervall [-1/2 ... +1/2], mit der Kreislinie identifiziert wird, handelt es sich dabei um zirkuläre Verteilungen. Das probabilistische Modell P wird als Kendrick-Profil zum Skalierungsfaktor λ bezeichnet.
-
Bei der Betrachtung von Peptiden besteht das theoretische Kendrick-Profil aus Normalverteilungen mit Mittelwert Null und einer Standardabweichung, die mit der Masse zunimmt (s. Wolski, W. E., M. Farrow, A. K. Emde, H. Lehrach, M. Lalowski and K. Reinert (2006): „Analytical model of peptide mass cluster centres with applications.“ Proteome Sci 4: 18). Generell ergibt sich ein solches Modell dann, wenn für eine Molekülklasse der erwartete Massendefekt näherungsweise proportional zur Nominalmasse ist. Dies ist für Peptide (s. Einleitung) als auch N-Glykane der Fall, der zugehörige Skalierungsfaktor beträgt für letztere λG = 1 + 3,5 × 10-4 (s. ).
-
Bei anderen Molekülklassen kann der Zusammenhang komplexer sein, beispielsweise eine lineare Abhängigkeit mit nicht-verschwindendem Achsenversatz (Offset). Es können auch multimodale Verteilungen auftreten, so dass die Verteilung der möglichen Massendefekte zu einer gegebenen Nominalmasse zwei oder mehr Häufungspunkte aufweist. Trotzdem können sich auch komplexere Zusammenhänge durch ein mathematisches Modell beschreiben lassen.
-
Das Kendrick-Profil ist ein abstraktes, mathematisches Modell für den Zusammenhang zwischen Nominalmasse und Kendrick-Verschiebung. Ein gemessenes Spektrum liefert jedoch nur eine Liste von Intensitäten und den dazugehörigen Massen. Die Darstellung eines Spektrums in einem Kendrick-Diagramm erlaubt zunächst eine visuelle, qualitative Einschätzung des besagten Zusammenhangs. Für eine weitergehende Analyse kann das zugrundeliegende Kendrick-Profil anhand der nachfolgend beschriebenen Methoden aus einem gemessenen Spektrum geschätzt werden. Aufgrund der im Spektrum vorliegenden Verzerrungen (Massenverschiebungen, Rauschen) wird das geschätzte Kendrick-Profil nicht mit dem theoretischen Kendrick-Profil für die betrachtete Molekülklasse übereinstimmen. Das geschätzte Kendrick-Profil wird daher im Folgenden als empirisches Kendrick-Profil bezeichnet.
-
Zur Schätzung eines empirischen Kendrick-Profils zu einem Spektrum können die Positionen der lokalen Maxima des Spektrums bestimmt, diese als Punktwolke im Kendrick-Diagramm dargestellt und über Standardmethoden der Dichteschätzung eine Verteilungsfunktion abgeschätzt werden. Dies setzt einen ausreichend hohen Rauschabstand im gemessenen Spektrum voraus, der bei Mittelwertspektren gegeben sein kann, bei Einzelspektren typischerweise jedoch nicht vorliegt.
-
Alternativ kann in der Ebene des Kendrick-Diagramms ein zweidimensionales Histogramm aus den spektralen Intensitäten eines Spektrums gebildet werden, sodass in jeder Histogrammkachel die auf sie entfallenden Intensitäten aufsummiert werden (s. ). Nach Normalisierung in vertikaler Richtung entspricht jede Spalte einer numerischen Approximation des Kendrick-Profils für das entsprechende Massenintervall. Diese Vorgehensweise ist auch bei stärker verrauschten Spektren möglich und ist daher bevorzugt.
-
Die in einem Kendrick-Profil enthaltenen Informationen lassen sich auf zweierlei Weise nutzen: Zum einen können bei einem Ensemble von gemessenen Spektren durch Vergleich der zugehörigen Profile jeweilige Korrekturen für die einzelnen Spektren bestimmt werden, so dass die relativen Verschiebungen zwischen den Spektren minimiert werden. Zum anderen kann für ein einzelnes Spektrum die dominante Komponente und deren Verlauf ermittelt werden und daraus wiederum eine Korrekturfunktion für eine Massenkalibrierung bestimmt werden. Beide Methoden werden im Folgenden dargestellt.
-
Bei unimodalen, symmetrischen Verteilungen kann das erste zirkuläre Moment dafür genutzt werden, die Position des Häufungspunktes der Verteilung zu bestimmen. Bei asymmetrischen oder multimodalen Verteilungen ist dies nicht mehr möglich. Durch den Vergleich zweier Momente zu zwei verschiedenen Kendrick-Profilen an derselben Massenposition lässt sich jedoch die relative Verschiebung ermitteln. Diese Methode wird allerdings numerisch instabil und verliert an Genauigkeit, falls die jeweiligen Momente dem Betrag nach nahe bei null liegen, was bei multimodalen Verteilungen häufig der Fall ist.
-
Zur Abhilfe wird nicht nur das erste zirkuläre Moment betrachtet, sondern weitere, höhere Momente, und es wird über eine gewichtete Mittelwertbildung die relative Verschiebung zwischen zwei Profilen bestimmt. Die Massenachse wird in Teilintervalle I
k zerlegt und es wird ein Spektrum S betrachtet, das durch eine kontinuierliche Funktion S̃(m) interpoliert wird. Das n-te zirkuläre Moment zum Kendrick-Profil im Intervall I
k berechnet sich mit
-
Zu einem Ensemble von N Spektren S
j (j= 1 ... N) mit gemeinsamer Massenachse werden so die zugehörigen Momente
gebildet, sowie die mittleren Momente
die das Referenzprofil beschreiben. Der Exponent α ∈ ℕ
0 gibt an, wie stark die Beträge der einzelnen Momente in die Gewichtung eingehen, typische Werte sind α ∈ {0,1,2}.
-
Für das j-te Spektrum wird nun die relative Massenverschiebung im Teilintervall I
k gegenüber dem Referenzprofil berechnet mit
wobei mit z* die komplex Konjugierte einer beliebigen komplex-wertigen Zahl z (hier µ) bezeichnet ist.
-
Die einzelnen Verschiebungen
werden den Mittelpunkten der Teilintervalle I
k zugeordnet und über die gesamte Massenachse interpoliert (typischerweise mittels linearer Interpolation). Man erhält so einen Verschiebungsvektor für die Transformation der Massenachse des j-ten Spektrums.
-
Für eine genauere Normalisierung oder auch eine Korrektur absoluter Massenverschiebungen ist es hilfreich, die zu einer gegebenen Molekülklasse gehörende Verteilungskomponente in einem Kendrick-Profil zu identifizieren. In vielen Fällen handelt es sich dabei um näherungsweise lineare Strukturen, die mithilfe der aus der Bildverarbeitung bekannten Hough-Transformation aufgefunden werden können, siehe
US 3,069,654 . Bekannte Einsätze von Transformationen des Hough-Typs auf dem Gebiet der Massenspektrometrie beschränken sich auf solche, die Morphologien oder Texturen in zweidimensionalen massenspektrometrischen Bildern auffinden, siehe beispielsweise die Veröffentlichung
US 2017/0221687 A1 . Da die Topologie des Kendrick-Profils aufgrund der Identifikation von oberem und unterem Rand der eines Zylinders entspricht, wird nachfolgend eine entsprechend angepasste Transformation verwendet.
-
Die klassische Hough-Transformation operiert auf Bildern, die in einem ebenen, zweidimensionalen Ortsraum definiert sind. Die Hough-Transformierte H zu einem solchen Bild stellt eine Abbildung dar, die zu jedem Punkt in einem wiederum zweidimensionalen Parameterraum angibt, mit welcher Intensität die durch den jeweiligen Punkt parametrisierte Gerade im ursprünglichen Bild zu finden ist. Varianten der Hough-Transformation sind bekannt für andere parametrisierbare geometrische Figuren, wie z.B. Kreise oder Ellipsen.
-
Im vorliegenden Fall tritt an die Stelle des Ausgangsbilds das empirische Kendrick-Profil, das nicht in einem ebenen, sondern in einem zylindrischen Raum definiert ist. Die gesuchten linearen Objekte in diesem Raum sind parametrisiert durch eine Steigung r und einen Offset d und sind beschrieben durch Gleichungen der Form
. Die zylindrische Hough-Transformation zum Auffinden linearer Strukturen in einem Kendrick-Profil ist nun wie folgt definiert:
-
Sei ein empirisches Kendrick-Profil wie zuvor beschrieben durch ein 2D-Histogramm gegeben. Für die i-te Histogrammkachel seien m
i und Δ
i die jeweiligen Stützstellen auf der Massen- bzw. der Kendrick-Verschiebungs-Achse, und p
i, der zugehörige Dichtewert des Kendrick-Profils. Die zylindrische Hough-Transformierte H ist dann gegeben durch
-
Hierin beschreiben die Steigung r die Abweichung vom Skalierungsfaktor λ und d den konstanten Offset der Massenverschiebung im Bereich [-1/2 ... +1/2]. Für beide Größen werden geeignete Diskretisierungen gewählt, ε entspricht der Diskretisierungsbreite zu d.
-
Falls das Kendrick-Profil über eine Punktwolke beschrieben ist, also als eine Folge von Kendrick-Verschiebungen Δi und zugehörigen Massen mi, wird die zylindrische Hough-Transformierte auf die gleiche Weise berechnet, indem die pi zu eins angenommen werden.
-
Lineare Strukturen im Kendrick-Profil können nun über lokale Maxima in der Hough-Transformation lokalisiert werden (s.
). Sei (r̂,d̂) die Position eines solchen lokalen Maximums, so entspricht dies einer linearen Struktur im Kendrick-Profil, deren Verlauf durch
beschrieben wird.
-
Das absolute Maximum der Hough-Transformierten kann auf diese Weise der dominanten Molekülklasse zugeordnet werden (s. ). Unter der Annahme, dass dies die für die jeweilige Untersuchung betrachtete Molekülklasse ist (z.B. N-Glykane), bzgl. der das Kendrick-Profil berechnet wurde, ergibt sich aus dem Verlauf Δ(m) wiederum ein Verschiebungsvektor für die Korrektur der Massenachse des betrachteten Spektrums. Unter der zusätzlichen Annahme, dass der absolute Massenfehler bei kleinen Massen innerhalb von ± 0.5 Dalton liegt und dass er mit größeren Maßen eher zu- als abnimmt, lässt sich auf diese Weise der Massenfehler eines gemessenen Spektrums über die gesamte Massenachse auch jenseits von ± 0.5 Dalton bestimmen. Hierzu wird anstelle der Kendrick-Verschiebung Δ(m) die „abgewickelte“ Verschiebung Δ(m) = r̂m + d̂ verwendet.
-
zeigt ein Beispiel von Messdaten eines Gewebeschnitts, der aus FFPE-Proben (FFPE = formalin-fixed paraffin-embedded) von humanem Gewebe des hepatozellulären Karzinoms (HCC) mit fünf Mikrometern Dicke geschnitten (Hoshida et.al., Cancer Res. 15. September 2009; 69(18): 7385-7392), nach einem Standard N-Glykan-Bildgebungsprotokoll (Powers et.al., Anal. Chem., 15. Oktober 2013; 85(20): 9799-9806) präpariert und mit einem Reflektormodus MALDI-TOF Massenspektrometer bei m/z 900-3200 und 50 Mikrometer Ortsauflösung analysiert wurde. Die mit den hier beschriebenen Verfahren ermittelte Massenverschiebung lag über mehrere Gewebeschnitte zwischen 266 mDa und 496 mDa und konnte durch die hier in der Offenbarung vorgeschlagene Korrektur der Massenachse auf Werte zwischen 18 mDa und 28 mDa verringert werden, wodurch die Massengenauigkeit bedeutend verbessert wurde. Gezeigt sind in die Daten und Korrektur für den Gewebeschnitt mit der größten Massenabweichung. Vergleichsmessungen mit einem ultrahochauflösenden Fourier-Transform Ionenzyklotronresonanz-Massenspektrometer (FT-ICR) bei einer Ortsauflösung von 200 Mikrometern, die von benachbarten Gewebeschnitten aus den oben genannten HCC-Proben erhalten wurden, zeigten eine maximale Massenabweichung von 25 ppm zwischen korrigierten MALDI-TOF und MALDI FT-ICR Daten und bestätigten so eine hohe absolute Massengenauigkeit der Massenskalen.
-
Die Erfindung ist vorstehend mit Bezug auf verschiedene besondere Ausführungsbeispiele beschrieben. Es versteht sich jedoch, dass diverse Aspekte oder Details der beschriebenen Ausführungen geändert werden können, ohne vom Umfang der Erfindung abzuweichen. Insbesondere können im Zusammenhang mit unterschiedlichen Ausführungsformen offenbarte Merkmale und Maßnahmen beliebig kombiniert werden, sofern dies einem Fachmann praktikabel erscheint. Überdies dient die vorstehende Beschreibung nur zur Veranschaulichung der Erfindung und nicht zur Einschränkung des Schutzbereichs, der ausschließlich durch die beigefügten Ansprüche unter Berücksichtigung etwaig vorhandener Äquivalente definiert wird.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- WO 2018/072862 A1 [0009, 0018, 0019, 0025, 0036, 0038]
- US 2012/0232805 A1 [0023]
- US 3069654 [0054]
- US 2017/0221687 A1 [0054]
-
Zitierte Nicht-Patentliteratur
-
- s. Christian, N. P., R. J. Arnold and J. P. Reilly (2000): „Improved calibration of time-of-flight mass spectra by simplex optimization of electrostatic ion calculations.“ Anal. Chem. 72(14): 3327-3337) [0006]
- s. Wool, A. and Z. Smilansky (2002): „Precalibration of matrix-assisted laser desorption/ionization-time of flight spectra for peptide mass fingerprinting.“ Proteomics 2(10): 1365-1373; und Wolski, W. E., M. Lalowski, P. Jungblut and K. Reinert (2005): „Calibration of mass spectrometric peptide mass fingerprint data without specific external or internal calibrants.“ BMC Bioinformatics 6: 203) [0008]
- s. Caprioli, R. M., T. B. Farmer and J. Gile (1997): „Molecular imaging of biological samples: localization of peptides and proteins using MALDI-TOF MS.“ Anal. Chem. 69(23): 4751-4760) [0010]
- Powers et.al., Anal. Chem., 15. Oktober 2013; 85(20): 9799-9806) [0062]