-
Die
Erfindung betrifft die massenspektrometrische Bestimmung der Massen
von Biopolymeren oder ihrer Fragmente ohne die Verwendung von internen
oder externen Referenzsubstanzen.
-
Die
Erfindung besteht darin, in solchen Massenspektrometern, die zwar
eine stabile Massenkalibrierung aufweisen, aber keine besonders
gute Massengenauigkeit erreichen, jede gemessene Masse durch die
nächstliegende,
für die
organische Substanz oder für
das Biopolymer wahrscheinlichste Masse zu ersetzen, wodurch im Massenbereich
bis etwa 3000 atomaren Masseneinheiten automatisch eine Genauigkeit
besser als etwa 0,1 Masseneinheiten erreicht wird. Für Proteine
führt diese
Genauigkeit zu überraschenden
Verbesserungen bei Suchen in Proteinsequenzdatenbanken.
-
In
Massenspektrometern werden die Massensignale in der Regel als Funktion
der Scan- oder Flugzeit gemessen. Die Zeiten des Erscheinens dieser
Signale werden dann über
eine so genannte Kalibrierkurve in Massen umgerechnet. Die Genauigkeit der
Massenbestimmung ist nicht immer zufriedenstellend; sie hängt von
der Art des Massenspektrometers und vom Ionisierungsverfahren ab. "Genauigkeit" ist hier als Fehlerstreubreite
definiert. "Fehler" ist die Abweichung
zwischen dem gemessenen und dem wahren Massenwert. Die Verteilung
der Fehler um den wahren Wert wird hier als Fehlerstreuung bezeichnet.
Ein Maß für die Fehlerstreuung
ist die "Standardabweichung", ein anschaulicheres
Maß ist die "Fehlerstreuungshalbwertsbreite", gemessen als volle
Breite der Fehlerstreuung in halber Maximalhöhe.
-
Massenspektrometer
können
immer nur die "Masse
pro Ladung" eines
Ions messen. Es sei daher vorausgesetzt, dass bei der hier diskutierten
Massenbestimmung die Ladung in bekannter Weise ermittelt und auskorrigiert
wurde.
-
Aus
dem Stand der Technik sind verschiedene Verfahren bekannt, in denen
ein gemessenes Massenspektrum mit virtuell erzeugten oder gemessenen
Massenspektren aus Datenbanken verglichen werden, z.B. bei der Bestimmung
der Elementzusammensetzung einer Probe (
GB 2 308 917 A ) oder bei
der Identifizierung von Mikroorganismen (WO 01/79523 A2) oder bei
der Bestimmung der Aminosäurensequenz
eines Proteins aus einem Fragmentionenspektrum (
EP 1 047 107 A2 ).
-
Durch
die Arbeiten von Mathias Mann ist bekannt, dass Peptide und Proteine
nicht alle möglichen
bruchteiligen Massenwerte annehmen können, sondern sich um Massenmittelwerte
konzentrieren, die jeweils um 1,00048 atomare Masseneinheiten auseinanderliegen
und eine Verteilungshalbwertsbreite von etwa 0,2 Masseneinheiten
haben (Mann, M.: Useful Tables of Possible and Probable Peptide Masses.
In: Proceedings of the 43. ASMS Conference on Mass Spectrometry
and Allied Topics, Atlanta, Georgia, USA, 1995, Seite 639). Aus
den Abständen
kann man leicht eine "Mittelwertsgerade" bilden, auf der
die Mittelwerte der Verteilungen liegen. Diese Mittelwerte bilden
die "wahrscheinlichsten" Massenwerte für Peptidionen.
-
Diese
Kenntnis kann in geeigneten Massenspektrometern zu einer Rekalibrierung
und damit zu einer Verbesserung der Massenbestimmung verwendet werden.
Voraussetzung ist, dass diese Massenspektrometer eine „glatte" Massenkalibrierkurve
besitzen, die sich gut durch eine mathematische Funktion, beispielsweise
ein Polynom niedriger Ordnung, angleichen lässt. Wenn nun systematische
Fehler der mit ihnen bestimmten Massen auftreten, die auf den Ionisierungsprozess
zurückzuführen sind
und alle Ionen gleichmäßig betreffen,
kann diese Rekalibrierung eingesetzt werden. Ein Beipiel sind MALDI-Flugzeitmassenspektrometer,
die eine sehr glatte Kalibrierkurve besitzen, in denen aber durch
den Ionisierungsprozess der matrixunterstützten Laserdesorption (MALDI)
Schwankungen der Anfangsenergie der Ionen auftreten, die in systematischer
Weise auf die Massenbestimmung durchschlagen.
-
Für diese
Rekalibrierung werden zunächst die
gemessenen Massen durch die wahrscheinlichsten Massen ersetzt, die
sich durch obige Abstände (also
durch die „Mittelwertsgerade") ergeben, und durch
diese wahrscheinlichsten Massen und die zuhörigen Scanzeiten wird, beispielsweise
nach dem Verfahren der minimalen quadratischen Abweichungen, eine
bestangeglichene mathematische Kurve hindurchgelegt. Die wahrscheinlichsten
Massenwerte werden also wie eine große Anzahl an Referenzmassen
behandelt. Diese Kurve stellt dann eine wahrscheinlichste Kalibrierkurve
dar, und die gemessenen Massen werden anhand dieser neuerstellten wahrscheinlichsten
Kalibrierkurve „rekalibriert". Die Rekalibrierung
beseitigt die im Massenspektrometer auftretenden systematischen
Fehler.
-
Neuere
Arbeiten haben die Massen der Peptide und ihre Verteilungen genauer
untersucht, als es durch die theoretische Vorrausberechnung von
M. Mann möglich
war. Durch einen virtuellen tryptischen Verdau aller Proteine einer
großen
Proteinsequenzdatenbank kann man die mittleren Massen aller durch
das Enzym Trypsin erzeugten Verdaupeptide und ihre Verteilungshalbwertsbreiten
bestimmen. Dabei kommt man auf mittlere Massen mit einem gemittelten
Massenabstand von jeweils 1,0045475 atomaren Masseneinheiten, mit
einer Verteilungshalbwertsbreite, die bei Masse 1000 bei nur etwa
0,1 Masseneinheiten liegt (S. Gay, P-A. Binz, D.F. Hochstrasser und
R. D. Appel, Electrophoresis 1999, 20, 3527-3534). 1 zeigt zwei typische Verteilungen. Die
hier gegebene „Mittelwertsgerade" hat eine geringfügig andere
Steigung als bei Mann angegeben.
-
Eine
genauere Betrachtung der individuellen mittleren Massen von Peptiden
und Proteinen ergibt charakteristische Abweichungen der einzelnen
Massenmittelwerte von der „Mittelwertsgeraden". Die Abweichungen
weisen im mittleren Teil des Massenbereichs von etwa 300 bis 1400
atomaren Masseneinheiten eine Periode von 14 Masseneinheiten auf;
die Abweichungsamplitude dieser Periode nimmt dabei von etwa 60
Millimasseneinheiten (Spitze-Spitze) zu höheren Massen hin ab und verschwindet
bei etwa 1400 Masseneinheiten. Jenseits von 3000 Masseneinheiten
gibt es statistische Schwankungen der individuellen Massenmittelwerte,
die zu höheren
Massen immer größer werden,
aber keine erkennbare Periodizität
besitzen.
-
Diese
individuellen Abweichungen der Peptidmassen können für eine genauere Rekalibrierung benutzt
werden, indem die individuellen Mittelwerte für die Massenzahlen, nicht die
Werte der „Mittelwertsgeraden", für das Rekalibrierungsverfahren
benutzt werden. („Massenzahl" ist hier die Nukleonenzahl,
also die Anzahl von Protonen und Neutronen zusammengezählt).
-
In ähnlicher
Weise kann man für
andere Klassen von Biopolymeren mittlere Werte für die Massen durch Kombinatorik
berechnen oder durch virtuellen Verdau ermitteln. Solche Klassen
können beispielsweise
die Glucoproteine, Lipoproteine, Saccharine oder DNA umfassen. Es
können
aber auch die Proteine von Säugetieren
und die Proteine von Bakterien als zwei verschiedene Klassen betrachtet werden,
da die Proteine von Bakterien andere prozentuale Anteile der verschiedenen
Aminosäuren und
damit ein anderes mittkeres Nukleonengewicht aufweisen. Die Biopolymere
ausgewählter
Klassen haben um die individuellen Massenmittelwerte herum zum Teil
Verteilungsbreiten, die noch schmaler als die der Proteine sind,
also noch genauer sind.
-
Die
angegebenen Verfahren der Rekalibrierung können jedoch nicht verwendet
werden, wenn das Massenspektrometer statistische oder pseudostatistische
Fehlerstreuungen der Massenbestimmung zeigt. Unter „pseudostatistischen
Fehlerstreuungen" sollen
hier solche Massenfehler verstanden werden, die zwar von Aufnahme
zu Aufnahme reproduzierbar sind, aber doch stets größere Differenzen zwischen
gemessenen und wahren Massen zeigen, die längs der Massenskala kurzabständig abwechselnd
positiv wie auch negativ sind, so dass sie nicht durch eine glatte
Kalibrierkurve dargestellt werden können.
-
Zu
den Massenspektrometern dieser Art gehören beispielsweise die Hochfrequenz-Ionenfallenmassenspektrometer,
bei denen die pseudostatistischen Abweichungen möglicherweise durch winzige Regelschwankungen
des Hochfrequenz-Scans verursacht werden. Andere Ursachen sind aber
auch Einflüsse
der Raumladung und der Ordnungsstruktur innerhalb der Ionenwolke
auf das Scanverhalten und damit auf die Massenbestimmung.
-
Es
gibt jedoch auch andere Massenspektrometer, die dieses Phänomen statistischer
oder pseudostatistischer Massenabweichungen aufweisen.
-
Aufgabe der
Erfindung
-
Es
ist die Aufgabe der Erfindung, für
Massenspektrometer mit Streuungshalbwertsbreiten der statistischen
Fehler von mehr als einem Zwanzigstel Masseneinheiten eine Genauigkeitsverbesserung
für die
Massenbestimmung in bestimmten Substanzklassen, vorzugsweise in
Klassen von Biopolymeren, zu erzielen. Es soll damit beispielsweise
erreicht werden, dass Suchen nach der Identität von Proteinen, die mit den
Massenwerten der Verdaupeptide oder deren Fragmenten in Proteinsequenz-
oder Genomdatenbanken durchgeführt
werden, schneller und mit höherer
Identifizierungssicherheit verlaufen.
-
Diese
Aufgabe wird gelöst
durch ein Verfahren nach Anspruch 1 und ein Massenspektrometer nach
Anspruch 15.
-
Kurze Beschreibung der
Erfindung
-
Die
Erfindung besteht darin, dass für
relativ ungenau messende, aber durchaus stabil arbeitende Massenspektrometer
die gemessenen Massenwerte einfach durch die wahrscheinlichsten
Massenwerte für
die untersuchte Substanzklasse ersetzt werden. Wenn die Fehlerstreubreite
der massenspektrometrischen Massenbestimmung größer ist als die etwa halbe
Verteilungshalbwertsbreite der möglichen
Massenwerte bei einer Massenzahl für ein bestimmte Klasse von
Biopolymeren, wird automatisch eine Verbesserung der Massengenauigkeit
erreicht. Die Fehlerstreubreite der Ergebnisse sinkt auf Werte unter
einem Zehntel Masseneinheit.
-
Es
können
dabei bereits die Massenwerte der „Mittelwertsgeraden" eine erhebliche
Verbesserung bringen. Die Berechnung der wahrscheinlichsten Masse
folgt hier einer sehr einfachen Geradengleichung, die mit hoher
Geschwindigkeit durchgeführt
werden kann. Es können
aber auch – wenn
bekannt – die
in einer Tabelle gespeicherten massenindividuellen Mittelwerte verwendet
werden, die durch Verfahren der mathematischen Kombinatorik, durch virtuellen
Verdau oder durch virtuelle Fragmentierung der Substanzen einer
Datenbank gewonnen werden können.
Diese massenindividuellen Mittelwerte bringen nochmals eine erhebliche
Verbesserung.
-
Beispielsweise
kann man für
Massenspektren von Verdaupeptiden der Proteine entweder einen virtuellen
Verdau der in einer Datenbank gespeicherten bekannten Proteine vornehmen,
oder auch die Kombinationen aus einer großen Zahl von Aminosäuren berechnen
und daraus die Mittelwerte und Verteilungen bei den einzelnen Massenzahlen
bestimmen. Für
die Kombinationen kann man die statistischen Häufigkeiten der Aminosäuren und
sogar die durch das Verdauenzyms bewirkten Eigenschaften der Peptide
berücksichtigen.
Für den
virtuellen Verdau kann man verschiedene Verdauenzyme verwenden,
die das Protein an verschiedenen Stellen schneiden.
-
Für die Aufnahme
von Tochterionenspektren fragmentierter Ionen kann man die Massenwerte durch
virtuelle Fragmentierung nach den bekannten Fragmentierungsregeln
oder auch wieder durch Kombinatorik ermitteln. Die Fragmentmassen
haben, besonders im unteren Massenbereich und besonders für die so
genannten b-Fragmente, etwas andere Mittelwerte als die Verdaupeptidionen.
-
Statt
eine Tabelle mit gespeicherten Mittelwerten für die Massen zu verwenden,
kann man auch die Periodizität
und ihre abnehmende Abweichungsamplitude (wie bei Proteinen) durch
eine mathematische Gleichung annähern
und diese Gleichung zur Berechnung der wahrscheinlichsten Massenmittelwerte
benutzten. Die Gleichung kann dabei auch nur einen Teil des Massenbereichs
umfassen.
-
Sind
die statistischen oder pseudostatistischen Fehlerstreuungen der
Massen, die durch das Massenspektrometer erzeugt werden, nur relativ klein
und machen nur einen Teil der Schwankungen aus, wobei ein Rest der
Schwankungen der wahren Massen auf die gemessenenen Schwankungen durchschlägt, so ist
auch eine Korrektur der gemessenenen Massen möglich. Es wird dabei zunächst die
gemessene Masse durch den wahrscheinlichsten Massenwert, also den
individuellen Mittelwert, ersetzt, dann aber mit einem vorher festgelegten Bruchteil
der Differenz zwischen diesem und dem gemessenen Wert wieder in
Richtung auf den gemessenenen Wert hin korrigiert. Dieser Bruchteil
kann auch massenabhängig
definiert werden. Dieses Verfahren stellt mathematisch die Verwendung
eines gewichteten Mittelwertes aus gemessenem Massenwerte und wahrscheinlichstem
Massenwert dar.
-
Neigt
das Massenspektrometer auch noch zu systematischen Fehlern, beispielsweise
durch Temperaturdriften, so können
diese systematischen Fehler vor Anwendung der Erfindung durch eine
Rekalibrierung, wie sie oben geschildert wurde, ausgemerzt werden.
-
Bei
Proteinen führen
die mit dieser Erfindung erreichten Verbesserungen der Massengenauigkeit zu überraschenden
Verbesserungen der Identitätssuche
durch die herkömmlichen
Suchmaschinen in Proteinsequenz-, EST- oder Genomdatenbanken. Die
Suche ist häufig
außerordentlich
viel schneller, führt
aber auch zu wesentlich sichereren Ergebnissen durch größere Gütezahlenabstände zu den nächstbesten
Ergebnissen für
andersartige Proteine. Die von diesen Suchmaschinen erreichten Resultate reagieren
anscheinend besonders scharf auf eine Verbesserung der Suchtoleranz
von Werten größer als
eine halbe Masseneinheit zu Werten von etwa 0,2 bis 0,3 Masseneinheiten,
vermutlich weil damit das fälschliche
Einfangen von Peptiden mit Nachbarmassen verhindert wird.
-
Kurze Beschreibung
der Abbildungen
-
1 zeigt
eine Häufigkeitsverteilung
aller Peptidmassen des Massenbereichs von 902 bis 904 atomaren Masseneinheiten,
die durch einen vituellen tryptischen Verdau der SwissProt-Proteinsequenzdatenbank
erhalten werden (S. Gray et al., oben zitiert). Aus diesen Werten
lässt sich
ein Mittelwert und eine Verteilungsbreite bilden. Man sieht, dass
die Verteilungshalbwertsbreite nur etwa 0,1 atomare Masseneinheiten
breit ist und dass gut ¾ des Massenbereiches
leer ist, das heißt,
hier können überhaupt
keine Peptidmassen vorkommen. Für
jede Massenzahl, das heißt,
für jede
ganzzahlige Nukleonenanzahl, gibt es eine solche Verteilung, die
die mittlere Massen der Nukleonen und die Streung der Nukleonenmassen
wiedergibt. Die Streuung der Nukleonenmassen rührt von den verschiedenen Kernbindungsenergien
der Elemente und ihrer Isotope und der daraus resultierenden Molekulargewichte
her. Nur näherungsweise
haben alle Nukleonen eine Masse von je einer atomaren Masseneinheit.
(Nukleonen sind Protonen oder Neutronen, deren Massen aber beim
Zusammenschluss im Kern der Elemente einen Massenschwund erleiden,
der der Bindungsenergie im Kern des Atoms entspricht. Diese Bindungsenergien bewirken
die verschiedenen von der Ganzzahligkeit abweichenden Isotopengewichte
der Elemente.)
-
2 zeigt
die Massenabweichungen von Verdaupeptiden, die durch virtuellen
tryptschen Verdau der SwissProt-Datenbank gewonnen wurden, im Ausschnitt
von Masse 600 bis 1200 atomaren Masseneinheiten (eigene Arbeiten).
Die Massenabweichungen sind Abweichungen von der Massenmittelwertsgeraden
nach M. Mann. Es ist die Periode über jeweils 14 Masseneinheiten
sichtbar, die zu höheren Massen
hin verebbt. Die Abbildung ist ein Ausschnitt aus 3.
-
3 zeigt
die Massenabweichungen gegenüber
der Massenmittelwertsgeraden im Massenbereich von 1 bis 7500 atomaren
Masseneinheiten. Im unteren Massenbereich unterhalb von Masse 1400
atomaren Masseneinheiten (siehe 2) herrscht
eine Periodizität über jeweils
14 Masseneinheiten, im Massenbereich oberhalb von 3000 Masseneinheiten
herrschen nichtperiodische, statistische Abweichungen vor. Für die Messung
an Verdaupeptiden ist in der Regel nur der Massenbereich bis 3000 Masseneinheiten
interessant, Messungen oberhalb dieses Bereichs finden eher selten
statt. Aber auch hier können
mit dem erfindungsgemäßen Verfahren Verbesserungen
der Massengenauigkeit erzielt werden.
-
Die
in den Abbildungen verwendete Masseneinheit Da (Dalton) ist eine
veraltete Einheit, die aber in der Molekularbiologie eine lebhafte
Wiederkehr erlebt. Obwohl ursprünglich
anders definiert, wird sie inzwischen wie die in Deutschland als „nichtkohärente SI-Einheit" gesetzlich vorgegebene „vereinheitlichte
atomare Masseneinheit" (Abkürzung u)
verwendet.
-
Bevorzugte
Ausführungsformen
-
Es
werde hier zunächst
von Hochfrequenz-Ionenfallenmassenspektrometern für die Proteinanalytik
ausgegangen. Diese Geräte
sind besonders gut geeignet für
Proteinanalysen, da sie sich über
Elektrosprüh-Ionenquellen
mit flüssigchromatographischen
Trennverfahren für
die Verdaupeptide aus Proteingemischen koppeln lassen und weil sie
in der Lage sind, über
ein so genanntes Tandem-in-Zeit-Verfahren auch Spektren der durch Stoßfragmentierung
in der Falle erzeugten Tochter- oder sogar Enkelionen zu messen.
Die Tochterionen werden auch Fragmentionen genannt. Die in der Ionenfalle
durch niederenergetische Stöße erzeugten Fragmente
sind besonders gut für
Protein-Identifizierungen durch Suchen in Proteinsequenzdatenbanken
geeignet.
-
Die
handelsüblichen
so genannten Suchmaschinen (Programmsysteme) für diese Suchen arbeiten umso
besser, je enger die Massentoleranz gewählt werden kann, je enger also
die wahre Masse des Peptids oder Peptidfragments durch die gemessene
Masse und eine vorgegebene Toleranz vorgegeben werden kann. „Besseres
Arbeiten" wird hier zum
einen durch die Güteziffern
der Suchmaschine für
die gefundenen Proteine angezeigt, andererseits durch die Zeitdauer,
die die Suche benötigt.
Besonders bei Suchen im Genom, bei dem ja in allen drei Leserahmen
gesucht werden muss, ist die Zeitdauer ausschlaggebend.
-
Nun
sind leider die in Ionenfallenmassenspektrometern erzielbaren Massengenauigkeiten nicht überwältigend
gut. Die Gründe
dafür sind
nicht im Einzelnen bekannt, mögen
aber darin liegen, dass während
des Scannens der Hochfrequenzspannung, die bis zu einigen Zehn Kilovolt
Spannung führt,
winzige Regelschwingungen auftreten können, die zwar von Scan zu
Scan reproduzierbar sind, aber eben winzige positive und negative
Abweichungen in der Größenordnung
von 0,01 % von der gewünschten
linearen Scankurve ergeben können.
Und 0,01 % sind bei Masse 1000 bereits 0,1 atomare Masseneinheiten,
bei Masse 3000 bereits 0,3 Masseneinheiten. Diese Abweichungen der
Hochfrequenzspannung vom Sollwert entsprechen direkt den Abweichungen der
gemessenen Massen. Die Regelschwingungen lassen sich auch nicht
durch eine mathematisch angefittete Funktion ausgleichen, man müsste dazu
ein Polynom so hoher Ordnung verwenden, dass die Fehler durch den
mathematischen Ausgleich größer würden als
die schon jetzt vorhandenen Fehler.
-
Weitere
Ursachen für
die statistischen Fehler in der Massenbestimmung mit Ionenfallen
sind aber auch Einflüsse
der Raumladung und der Ordnungsstruktur innerhalb der Ionenwolke
auf das Scanverhalten und damit auf die Massenbestimmung. Es ist bekannt,
dass die Ionen innerhalb der Ionenwolke eine geordnete, quasikristalline
Anordnungsstruktur annehmen können,
die Ionen innerhalb der Wolke festhält, so dass ein Überschuss
an Energie aufzuwenden ist, um die Ionen auszuwerfen. Die Ornungstrukturen
treten auf, wenn im Spektrum freie Bereiche sind, also über eine
gewisse Zeit keine Ionen während
des Scanvorgangs ausgeworfen werden. Die Wolke wird dann nicht durch
die schwingenden Ionen „umgerührt" und kann so auskristallisieren.
-
Die
durch Elektrosprühen
erzeugten Peptidionen sind vorwiegend ein-, zwei- und dreifach geladen.
Es ist zwar mit einigen Suchmaschinen möglich, mit diesen Spektren
direkt zu suchen; um die Suche aber erträglich schnell zu machen, sind
die Spektren zunächst
durch eine so genannte Dekonvolution auf einfach geladene Ionenmassen
umzurechnen. Diese Umrechnung mittelt zwar in der Regel zwischen
den verschiedenen Massenberechnungen, kann aber auch nochmals zu
einer leichten Verschlechterung der Genauigkeit beitragen.
-
Ionenfallenmassenspektrometer
zeigen zwar statistische Massenabweichungen mit einer Fehlerstreubreite
in einer störenden
Größenordnung, ergeben
aber andererseits sehr stabile Ergebnisse. Man kann sich im Rahmen
eines Massenfehlers von etwa 0,3 Masseneinheiten sehr gut auf die
Ergebnisse verlassen.
-
Für eine Verbesserung
der Massengenauigkeit kommt die hier vorgestellte Erfindung zum
Zuge. Die aus den gemessenen Ionensignalen gewonnenen Massenwerte
für die
Ionenmassen werden jetzt einfach durch die wahrscheinlichsten Massenwerte für diese
Substanzklasse ersetzt. Da für
Biopolymere die Streuung aller möglichen
Einzelmassen um den Mittelwert herum eine sehr kleine Halbwertsbreite von
unter einem Zehntel einer Masseneinheit besitzt, verbessert sich
die hohe Fehlerstreubreite des Massenspektrometers auf diese von
der Natur vorgegebene Verteilungsbreite (siehe 1).
Die Verbesserung rührt
also daher, dass die Substanzklasse der vermessenen Substanzen bekannt
ist und dass in dieser Substanzklasse andere Massenwerte nicht vorkommen
können.
-
Wenn
man durch Kenntnis der Baupläne weiß, dass
in einer Siedlung drei Typen von Häusern mit genau 7,80 Metern,
genau 9,00 Metern und genau 10,20 Metern Breite gebaut worden sind
und ein Abschreiten einer Hausfront etwa 8 Meter ergibt, dann weiß man sicher,
dass es sich hier um ein Haus mit 7,80 Metern Breite handelt. Das
Wissen rührt
von der Kenntnis her, dass die Bauleute mit Sicherheit genauer gebaut
haben, als es der Messmethode des Abschreitens entspricht, aber
dass das Abschreiten auch wiederum nicht so unsicher ist, dass ein
Fehler größer als
0,3 Meter auftreten sollte.
-
Da
jetzt die Massentoleranzwerte für
die Suchmaschinen, die für
diese Massenspektrometer bisher eine volle Masseneinheit betragen
mussten, auf etwa 0,3 Masseneinheiten zurückgenommen werden können, springen
die von den Suchmaschinen für
ihre Fundsachen ausgegebenen Güteziffern (Scores)
um Faktoren von 2 bis 3 in die Höhe.
Insbesondere wird der Abstand der Güteziffern zu den nächsten,
nichtverwandten Proteinen deutlich größer, das heißt, es ist
die Gefahr vermindert, falsche Positividentifizierungen zu erhalten.
Die Identifizierung wird sicherer.
-
In
der Praxis ergibt sich bereits eine große Verbesserung der Genauigkeit
der Massenbestimmung, wenn man die gemessenen Massen im Falle der
Proteine durch die Massenwerte der Mittelwertsgeraden nach M. Mann
ersetzt. Die Mittelwertsgerade für
Proteine ist nach M. Mann durch einen Abstand der Einzelmassenmittelwerte
von 1,00048 atomare Massen charakterisiert. Für andere Klassen von Biopolymeren
kann man andere Mittelwertsgeraden angeben. Die Abstände der
Mittelwertsgeraden ergeben sich sehr einfach durch die gemittelte
Zusammensetzung der Biopolymerklasse aus den Elementen, multipliziert
mit den präzisen
Molekulargewichten der Elemente, geteilt durch die gemittelte Anzahl
der Nukleonen in der gemittelten Zusammensetzung. Die Abstände entsprechen
dem gemittelten Nukleonengewicht für diese Klasse von Biopolymeren.
(Nukleonen sind die Protonen und Neutronen zusammengezählt).
-
Die
Massenbestimmung der Biomoleküle kann
demgegenüber
noch genauer werden, wenn man die individuellen Mittelwerte der
einzelnen Massen einsetzt, die sich durch Untersuchungen an geeigneten
Datenbanken – beispielsweise
durch einen virtuellen tryptischen Verdau mit anschließender statistischer
Auswertung aller Verdaumassen – ergeben.
Diese individuellen Massenmittelwerte können beispielsweise in einer
Speichertabelle abgelegt sein. Diese weisen für Proteine im unteren Massenbereich
die Periodizität
von 14 Masseneinheiten für Abweichungen
von der Mittelwertsgeraden auf, wie in 2 gezeigt.
-
Individuelle
Massenmittelwerte können
auch durch mathematische Kombinatorik erhalten werden. Für Proteine
und Peptide und besonders auch für Peptidfragmentionen,
die für
die Aufnahme von Tochterionenspektren durch Stoßfragmentierung oder andere
Fragmentierungsarten erzeugt werden, können die individuellen Massenmittelwerte
durch große
Anzahlen von Kombinationen aus den möglichen 20 Aminosäuren erhalten
werden. Dabei können
insbesonders die relativen Häufigkeiten
der Aminosäuren in
der Natur, im Grenzfall in der untersuchten Spezies, verwendet werden.
Für andere
Arten von Biopolymeren werden deren Bausteine für die Kombinatorik verwendet.
-
Für Tochterionenspektren
sind nicht die Verdaupeptidmassen, sondern die Massen der aus ihnen
gewonnenen Fragmentionen maßgebend.
Die Fragmentierung der Peptide gehorcht relativ einfachen Regeln.
Diese Regeln und die heute verwendete Nomenklatur der Peptidfragmente
als a-, b-, c-, x-, y-, z-, i-, d-, und w-Fragmente sind in der
Arbeit Fohlmann et al. (1988) Int. J. Mass Spectrom. a. Ion Proc. 86,
137, zu finden. In Ionenfallenmassenspektrometern kommen dabei praktisch
nur b- und y-Fragmente vor, in sehr seltenen Fällen auch a-Fragmente.
-
Die
mittleren Massenwerte der Fragmentionen können nun wiederum durch virtuelle
Fragmentierung einer großen
Anzahl von virtuell erzeugten Verdaupeptiden einer Proteinsequenzdatenbank
ermittelt werden, aber auch durch mathematische Kombinatorik der
Aminosäuren
mit Berücksichtigung der
Fragmentierungregeln. So haben b-Fragmentionen ein leicht anderes
mittleres Nukleonengewicht als y-Fragmentionen. Bei der mathematischen
Kombinatorik ist auch zu berücksichtigen,
dass einige Aminosäuren
auch in veränderter
Form vorkommen können,
beispielsweise Methionin im Oxidationszustand. Es zeigt sich, dass
die Massenmittelwerte im Massenbereich oberhalb von etwa 400 atomaren Masseneinheiten
mit denen der Verdaupeptide praktisch übereinstimmen. Im unteren Massenbereich
ergeben sich Besonderheiten:
- a) unterhalb der
Masse 68 atomare Masseneinheiten gibt es keine Peptid- oder Fragmentmassen;
- b) im Bereich von 68 bis etwa 130 atomaren Masseneinheiten gibt
es nur die so genannten Immonium-Ionen (i-Fragmente), die jeweils
nur von der C-terminalen Aminosäure
gebildet werden und nur bei relativ wenigen Massenzahlen vorkommen
können;
- c) bis in den Massenbereich von etwa 400 Masseneinheit hinauf
ergeben sich immer wieder Lücken,
das heißt,
es gibt Massen, bei denen überhaupt
keine Fragmentmasse vorkommen kann; die Lücken werden geringer in ihrer
Anzahl, wenn man auch seltenere Veränderungen der Aminosäuren wie
Methylierung oder Amidierung mit einbezieht;
- d) bis in diesen Massenbereich hinein gibt es immer wieder Massen,
bei denen nur eine einzige Peptid- oder Peptidfragmentmasse vorkommt;
- e) nur wenn zwei oder mehrere Massenwerte vorkommen, wird ein
Mittelwert gebildet.
-
Für den erfindungsgemäßen Ersatz
der gemessenen Massenwerte durch die wahrscheinlichsten Massenwerte
bedeutet das, dass für
solche Massen, bei denen nur ein einziger Massenwert vorkommt, der
präzise
Massenwert statt des normalerweise verwendeten Mittelwerts eingesetzt
wird. Das ergibt eine Erhöhung
der Massengenauigkeit in diesem Bereich. Für die Lücken wird zweckmäßigerweise
der Wert der Mittelwertsgeraden (oder ein Wert, der die Periodizität berücksichtigt)
eingesetzt, da man seltene Modifizierungen der Aminosäuren, die diese
Masse ergeben, nicht ausschließen
kann und dieser Wert nach wie vor der wahrscheinlichste ist.
-
Für solche
Massen, an denen nur zwei Massenwerte existieren, die relativ weit
auseinanderliegen, kann man auch beide Werte in einer Tabelle speichern
und von einem gemessenenen Wert ausgehend den nächstliegenden Massenwert als
Ersatzwert benutzen. Ähnlich
kann man vorgehen, wenn es deutlich zwei Schwerpunkte für die Massenverteilung gibt.
-
Die
für Proteine
im Bereich bis 1400 Masseneinheiten gefundene Periodizität von 14
Massen ist bei allen Substanzklassen organischer Verbindungen zu
finden. Sie beruht auf der Periodizität der stets vorwiegend vorhandenen
Kohlenwasserstoffanteile, die nur alle 14 Massenein heiten volle
Sättigung
mit Wasserstoff erreichen, wobei die Massen dazwischen nur von ungesättigten
Kohlenwasserstoffen gebildet werden können. Es schwankt also der
mittlere Wasserstoffanteil. Die gesättigten Kohlenwasserstoffe
haben die Formel CnH2n+2,
den ungesättigten fehlen
einige Paare Wassertoff H2. Da der Wasserstoff
mit 1,008 atomaren Masseneinheiten pro Nukleon relativ schwerer
ist als der Kohlenstoff (12, 0000 atomare Masseneinheiten mit 12
Nukleonen für
das Isotop 12C), sind die gesättigten
Kohlenwasserstoffe relativ am schwersten, die ungesättigten
dagegen relativ deutlich leichter. Fehlen einem ungesättigten Kohlenwasserstoff
beispielsweise 7 Paare Wasserstoff (14 Masseneinheiten), so ist
dieser gesättigte Kohlenwasserstoff
um 14·0,008
= 0,112 Masseneinheiten leichter als der gesättigte Kohlenwasserstoff gleicher
Massenzahl, der eine Methylgruppe CH2 (ebenfalls
14 Masseneinheiten) weniger besitzt. Insbesondere sind Leucin und
Isoleucin die wasserstoffreichsten Aminosäuren.
-
Die
Periodizität
der Massenabweichungen in solchen Biopolymerklassen, die in unterschiedlichen Verhältnissen
auch Stickstoff, Sauerstoff, Phosphor und Schwefel enthalten, verschwindet
zunehmend zu höheren
Massen hin, weil ein zunehmender Gehalt dieser Elemente zu höheren Massen
hin das Massenmaximum der Periodizität verschiebt. Statistisch schwankende
Anteile dieser Elemente in verschiedenen Substanzen dieser Klasse
führen
zu Interferenzen der periodischen Verteilungen und lassen die Periodizität zu hohen
Massen hin verebben. Dabei müssen
in diesen Substanzklassen nicht immer Anteile an ungesättigten
Kohlenwasserstoffen vorhanden sein, der Wasserstoffschwund kann
auch durch Ringbildungen (besonders aromatische Ringe) oder durch
die Art des Einbaus der anderen Elemente, beispielsweise als Carboxylgruppen,
verursacht werden.
-
Es
ist möglich,
diese periodischen Schwankungen der Massenmittelwerte gegenüber der
Massenmittelwertsgeraden näherungsweise
in eine Gleichung zu fassen, und diese Gleichung für die Berechnung
des mittleren Massenwertes zu verwenden, der einen gemessenen Wert
ersetzen soll.
-
Das
erfindungsgemäße Verfahren
unterscheidet sich ganz wesentlich von der eingangs geschilderten
Rekalibrierung. Gemeinsam ist beiden Verfahren eine Verbesserung
der Massengenauigkeit durch die Kenntnis der gemessenen Biopolymerklasse.
Bei der Rekalibrierung wird eine neue, wahrscheinlichste Kalibrierkurve
erstellt, mit der dann die gemessenen Massenwerte neu kalibriert
werden. Damit erreicht man Genauigkeiten der Massenbestimmung, die
wesentlich besser sind als mit der hier vorgestellten erfindungsgemäßen Methode
des reinen Werte-Ersatzes. Die Rekalibrierung kann aber nur für Messungen
mit dazu geigneten Arten von Massenspektrometern eingesetzt werden.
-
Das
erfindungsgemäße Verfahren
ist dagegen sehr viel einfacher, kann aber nur bei anderen, ungenauer
messenden Klassen von Massenspektrometern mit relativ hoher Fehlerstreubreite
für die Massenbestimmung
mit Erfolg eingesetzt werden. Es ist ein bloßer Ersatz der gemessenen Massenwerte durch
die für
die Substanzklasse wahrscheinlichsten Werte.
-
Statt
des Ersatzes der gemessenen Massenwerte durch die wahrscheinlichsten
kann auch eine etwas abweichende Methode verwendet werden: es kann
ein Ersatz durch gewichtete Mittelwerte vorgenommen werden, wobei
die gewichteten Mittelwerte sich aus den gemessenen Massenwerten
und den wahrscheinlichsten Massenwerten zusammensetzen. Dieser Ersatz
kommt immer dann in Frage, wenn die Streuung der Massenwerte, die
vom Massenspektrometer ermittelt wurden, nicht nur statistische
Abweichungen aufweisen, sondern wenn die Streuung der wahren Massen
noch durchschlägt. Tragen
die wahren Massen nur einen kleinen Teil bei, kann beispielsweise
ein Mittelwert benutzt werden, der aus ¾ wahrscheinlicher Masse und ¼ gemessener
Masse zusammengesetzt ist. Ist der Einfluss der wahren Massen stärker, so
kann auch ein hälftiger Mittelwert
gebildet werden. Die Gewichtswahl für die Mittelwertsbildung hängt also
davon ab, wie stark die wahre Masse die Streuung der Massenwerte
beeinflusst. Die Gewichtswahl kann sogar massenabhängig gewählt werden.
Zum Beispiel kann im unteren Massenbereich ein großer Anteil
der gemessenen Masse, im oberen Massenbereich zunehmend ein kleinerer
Teil der gemessenen Massen in die Mittelwertsbildung einfließen.
-
Der
Einsatz des erfindungsgemäßen Verfahrens
ist aber nicht nur auf Ionenfallenmassenspektrometer beschränkt. Es
kann bei allen Massenspektrometern eingesetzt werden, die statistisch
streuende Werte der Massenbestimmung liefern. Beispielsweise liefert
das PSD-Verfahren zur Messung von Fragmentionenspektren in Flugzeitmassenspektrometern ähnliche
Fehlerstreubreiten wie ein Ionenfallenmassenspektrometer. PSD (Post
Source Decay) benutzt den Zerfall metastabiler Ionen zur Erzeugung
der Fragmentionen. Die Fehlerstreubreiten rühren aber hier nicht vom Ionisierungsprozess,
sondern eher von anderen Ursachen her, die hier nicht genauer untersucht
zu werden brauchen. Es ist aber interessant, dass sich auch hier
das erfindungsgemäße Verfahren
mit großem
Erfolg einsetzten läßt.
-
Für dieses
massenspektrometrische PSD-Verfahren, wie auch für die modernen Tandem-Flugzeitspektrometer
(„TOF/TOF"), ist das erfindungsgemäße Verfahren
insofern besonders interessant, weil es auch die Ionen im unteren
Massenbereich misst, die bei Ionenfallenmassenspektrometern für gewöhnlich fehlen,
da sie unterhalb der Speichergrenze für Ionen liegen. Im unteren
Massenbereich kommen die Immoniumionen und weitere Massen vor, bei
denen nur jeweils eine Fragmentmasse eines Peptids vorkommen kann.
Es steigt daher hier die Massengenauigkeit durch das erfindungsgemäße Verfahren
stark an.
-
Das
Verfahren kann in geeignete Massenspektrometer fest eingebaut werden.
Das Massenspektrometer ist dabei entweder fest auf die Messung von
bestimmten Substanzklassen ausgelegt, oder es enthält eine
Auswahlmöglichkeit
für die
Substanzklasse. Es kann eine Wahlmöglichkeit für einen Betriebsmodus geben,
der den automatischen Ersatz der gemessenen Massenwerte durch die
wahrscheinlichsten Massenwerte für
diese Substanzklasse bewirkt; es kann aber auch ein solcher Betrieb
fest vorgegeben sein.