-
Die Erfindung betrifft ein Verfahren
zur Identifizierung von Mikroorganismen mittels Massenspektrometrie,
insbesondere mittels Matrix-assisted-Laser-Desorption-Ionisation
Time-of-Flight Massenspektrometrie (MALDI-TOF-MS) mit den in Anspruch 1
genannten Merkmalen sowie eine für
die Durchführung
des Verfahrens geeignete und für
das Verfahren verwendbare Datenbank" nach den Ansprüchen 21 und 25.
-
Eine schnelle und zuverlässige Identifizierung
von Mikroorganismen ist in verschiedenen Bereichen des Gesundheitswesens,
beispielsweise der Diagnostik von Infektionen, sowie der Lebensmittelindustrie
von entscheidender Bedeutung. Die traditionelle Identifizierung
mittels des direkten Bakteriennachweises erfordert zunächst die
Anzüchtung
der zu identifizierenden Mikroorganismen aus einer Materialprobe.
Anschließende
mikroskopische und visuelle Untersuchungsverfahren dienen hauptsächlich der
vorläufigen
Orientierung über
den Bakteriengehalt sowie der Mikromorphologie beziehungsweise Färbeeigenschaften
der klinischen Untersuchungsprobe. Die Identifizierung von Isolaten
bis zur Speziesebene erfordert nicht selten eine Subkultivierung zwecks
der Gewinnung einer Rein kultur. Nach einem klassischen Identifizierungsverfahren
der medizinischen Mikrobiologie, der so genannten "Bunten Reihe", werden unter Verwendung
einer geeigneten Kombination von Differentialmedien spezifische Stoffwechselleistungen
des zu identifizierenden Mikroorganismus erfasst. Hauptnachteil
des mikrobiellen Verfahrens ist sein sehr hoher Zeitbedarf, insbesondere
für die
Kultivierung.
-
Modernere molekularbiologische Ansätze, wie
die PCR-Methode
(Polymerase-Kettenreaktion) und die 16S-rRNA-Methode, involvieren die genetische
Analyse des zuvor isolierten Genoms beziehungsweise bestimmter Ribonukleinsäuren. Diese Verfahren
haben wegen ihrer hohen Empfindlichkeit stark an Bedeutung gewonnen.
Sie sind jedoch ebenso wie die mikrobiologische Charakterisierung
mit einem erheblichen personellen und instrumentellen Aufwand belastet.
-
Ferner sind infrarotspektroskopische
Verfahren bekannt, bei denen Schwingungsspektren intakter Zellen
("Fingerprintspektren") in FTIR-Spektrometern
aufgezeichnet und mit einer Datenbank mit Schwingungsspektren bekannter
Mikroorganismen abgeglichen wird. Diese noch junge Technik befindet sich
noch in der Entwicklung und kann derzeit nur von speziell geschultem
und erfahrenem Personal durchgeführt
werden, so dass sich dieser Ansatz noch nicht in der Praxis durchsetzen
konnte.
-
Mit der so genannten MALDI-TOF-Massenspektrometrie
ist in den letzten Jahren ein Verfahren entwickelt worden, das im
Gegensatz zu herkömmlichen
massenspektrometrischen Verfahren auch der Analyse biologischer
Makromoleküle
zugänglich
ist. Bei der MALDI-TOF-MS-Technik
wird die zu untersuchende Probe mit einer meist kristallinen organischen
Verbindung, der so genannten Matrix, auf eine Probenplatte gegeben,
wobei die Probe in die Matrixkristalle eingebaut wird, und mit einem
Laserstrahl in Wechselwirkung gebracht. Dabei werden einzelne Moleküle der Probe
von dem Probenträger
desorbiert und ionisiert. Anschließend werden die so erzeugten Ionen
in einem elektrischen Feld beschleunigt und ihre Flugzeit (Time-of-Flight)
bis zum Erreichen eines Detektors registriert. Da die Beschleunigung
von der Masse eines ionisierten Moleküls abhängt, spiegeln die Flugzeiten
die in der Probe vorhandenen Molekülmassen wider. Die MALDI-TOF-MS-Technik
findet heutzutage hauptsächlich
auf dem Gebiet der Proteinanalytik ("Proteomics") und bei der RNA- und DNA-Analytik
Anwendung.
-
Es wurde zum Beispiel in der WO 98/09314 vorgeschlagen,
die MALDI-TOF-Massenspekrometrie zur Identifizierung von Mikroorganismen
in Analogie zu der oben beschriebenen infrarotspektroskopischen
Fingerprintmethode einzusetzen. Dafür wird das MALDI-TOF-Massenspektrum
eines Zellextraktes oder intakter Zellen des unbekannten Mikroorganismus
mit den Spektren bekannter Organismen verglichen. Der Vergleich
des Probenspektrums mit den Referenzspektren der Datenbank erfolgt
in der Regel computergestützt
mittels statistisch-mathematischer Algorithmen, die in so ge nannten
Mustererkennungsverfahren entwickelt wurden. Die Massenspektren weisen
mit wachsender verwandtschaftlicher Nähe der Mikroorganismen zunehmende Ähnlichkeit
miteinander auf und die Wahrscheinlichkeit einer Wiederholung bestimmter
Signale in den Massenspektren nimmt zu. Dies hat zur Folge, dass
das Verfahren bereits bei übergeordneten
Klassifizierungsniveaus, etwa bei Gattungen oder Familien, mit einer
erhöhten Unsicherheit
verbunden ist, wenn eine Zuordnung auf einem untergeordneten Niveau
(zum Beispiel Stammniveau) fehlschlägt, beispielsweise weil kein Referenzspektrum
des Stammes in der Datenbank vorhanden ist. Das Verfahren ist daher
auf sehr umfangreiche Datenbanken mit einer Vielzahl repräsentativer
Referenzspektren von bekannten Stämmen angewiesen. Hinzu kommt
die Schwierigkeit, ein spektrales Grundrauschen von echten Signalen
zu diskriminieren.
-
Aus den
DE 100 38 694 A und
EP 1 253 622 A ist
ein Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS
bekannt, bei dem das Probenspektrum des unbekannten Mikroorganismus
nicht mit Originalmassenspektren ("natürlichen Massenspektren") abgeglichen wird,
sondern mit so genannten synthetischen Referenzspektren. Dabei handelt
es sich um Massenspektren, die aus einer reduzierten Anzahl von
für den
jeweiligen Mikroorganismus charakteristischen Signalen zusammengefasst
sind. Diese charakteristischen Signale umfassen vorzugsweise solche,
die bestimmten molekularen Bestandteilen der Zelle zugeordnet werden
konnten und/oder die durch visuelle oder rechnergestützte Analyse
als spezifisch selektiert wurden. Obwohl dieses Verfahren aufgrund
der Sektion der Signale und Beschränkung des Spektrenvergleichs
auf die selektierten Signale eine deutlich verbesserte Zuverlässigkeit
gegenüber
dem herkömmlichen
Abgleich mit Originalspektren aufweist, hat sich die Unterscheidung sehr ähnlicher
Organismen in Einzelfällen
als schwierig erwiesen. Dies gilt insbesondere für eng verwandte Organismen.
-
Aufgabe der vorliegenden Erfindung
ist es daher, das massenspektroskopische Verfahren zur Identifizierung
von Mikroorganismen in Hinblick auf eine noch weiter erhöhte Zuverlässigkeit
weiterzuentwickeln. Es soll ferner eine für das Verfahren geeignete Datenbank
zur Verfügung
gestellt werden.
-
Diese Aufgabe wird durch ein Verfahren
mit den Merkmalen des Anspruchs 1 sowie durch eine Datenbank und
ihre Verwendung nach den Ansprüchen
21 und 25 gelöst.
-
Das- erfindungsgemäße Verfahren
zur Identifizierung von Mikroorganismen mittels Massenspektrometrie,
sieht vor, dass
- (a) eine Datenbank verwendet
wird, umfassend
– synthetische
Referenzspektren bekannter Mikroorganismen, welche durch Zusammenfassung einer
gegenüber
natürlichen
Massenspektren reduzierten Anzahl von für den jeweiligen Mikroorganismus
spezifischen Signalen gebildet werden, sowie
– Differenzspektren,
welche. durch Verrechnung jeweils zweier synthetischer Referenzspektren der
bekannten Mikroorganismen gebildet werden,
- (b) in einem ersten Analyseschritt eine Ähnlichkeitsanalyse eines Probenmassenspektrums
eines zu identifizierenden Mikroorganismus mit den in der Datenbank
enthaltenen synthetischen Referenzspektren durchgeführt wird
und
- (c) in einem zweiten Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums
mit wenigstens einem Teil der in der Datenbank enthaltenen Differenzspektren
durchgeführt
wird.
-
Das erfindungsgemäße Verfahren unterscheidet
sich demnach von dem bekannten Verfahren im Wesentlichen durch einen
zweiten Analyseschritt, bei dem das Probenspektrum mit Differenzspektren,
die in noch näher
zu beschreibender weise aus den synthetischen Referenzspektren berechnet werden,
verglichen wird. Dieser zusätzliche
Schritt bewirkt eine signifikante Steigerung der Sicherheit des
Verfahrens und ermöglicht
insbesondere auch die Unterscheidung stark verwandter Organismen.
-
Die Differenzspektren werden vorzugsweise durch
Subtraktion zweier synthetischer Referenzspektren voneinander gebildet,
wobei Signale, die in beiden der miteinander verrechneten Referenzspektren
vorhanden sind, unabhängig
von ihren Intensitäten
vollständig eliminiert
werden. Es kann weiterhin vorgesehen sein, Signale, die nach der
Subtraktion in einem Differenzspektrum eines bekannten Mikroorganismus
verbleiben, noch weiter zu selektieren und/oder zu gewichten. Dies
kann etwa dadurch geschehen, dass ein Abgleich der verbleibenden
Signale mit den natürlichen
Massenspektren (Originalspektren) dieses Mikroorganismus und/oder
mit den natürlichen
Massenspektren des mit diesem verrechneten Mikroorganismus erfolgt.
Insbesondere kann hierfür
die Häufigkeit
und/oder Intensität
des Signals in den "eigenen" natürlichen
Massenspektren überprüft werden.
Darüber
hinaus ist es von Vorteil, auch die Spezifität des Signals, das heißt die Häufigkeit und/oder
Intensität
des Signals in den natürlichen Spektren
("Fremdspektren") desjenigen Mikroorganismus
zu analysieren, dessen synthetisches Referenzspektrum mit dem des
betreffenden Mikroorganismus verrechnet wurde.
-
Um beispielsweise ein Differenzspektrum
für Escherichia
coli zu generieren, das die Diskriminierung von den schwer unterscheidbaren
Shigellen erleichtert, wird das synthetische Referenzspektrum von
Shigella sonnei von dem von E. coli subtrahiert, wobei nur Signale übrig bleiben,
die im synthetischen Referenzspektrum von E. coli nicht aber in
dem von S. sonnei vorhanden sind. Anschließend wird jedes verbleibende
Signal hinsichtlich seiner Häufigkeit und/oder
Intensität
mit den Originalspektren von E. coli und hinsichtlich seiner Häufigkeit
und/oder Intensität
in den Originalspektren von S. sonnei untersucht. Ein Signal, das
zwar häufig
in den eigenen Original spektren ist, aber unspezifisch ist, weil
es auch in den Fremdspektren von Shigella auftaucht, wird entweder
ganz aus dem Differenzspektrum eliminiert oder für den zweiten Analyseschritt
mit einer relativ geringen Gewichtung versehen. Ruf diese Weise
entstehen Differenzspektren, die eine sehr sichere Unterscheidung
eines Mikroorganismus von einem bestimmten anderen erlauben.
-
Es ist weiterhin besonders bevorzugt
vorgesehen, als Ergebnis des ersten Analyseschrittes eine Anzahl
von mit dem Probenspektrum ähnlichen
synthetischen Referenzspektren zu ermitteln und die Ähnlichkeitsanalyse
des zweiten Schrittes nur mit denjenigen Differenzspektren durchzuführen, die
aus der Verrechnung der als ähnlich
ermittelten synthetischen Referenzspektren erhalten wurden. Somit
erfolgt in dem ersten Schritt eine Eingrenzung der in Frage kommenden
Mikroorganismen, so dass im anschließenden zweiten Schritt nur
noch ein Abgleich mit den Differenzspektren der als ähnlich ermittelten Organismen
erfolgt. Hierdurch wird nicht nur ein enormer Zeitvorteil erlangt,
sondern es werden auch Zufallstreffer reduziert, die aus nicht identischen
Proteinen mit zufällig übereinstimmenden
Massen resultieren. In diesem Zusammenhang kann es ferner sinnvoll
sein, eine Datenbank zu verwenden, die von vornherein nur Differenzspektren
von einander ähnlichen
Mikroorganismen enthält.
-
Es ist vorgesehen, dass als Referenzspektren
synthetische Massenspektren verwendet werden, die durch Zusammenfassung
einer gegenüber "natürlichen" (nicht reduzierten)
Massenspektren reduzierten Anzahl von für den jeweiligen Mikroorganismus
spezifischen Signalen erzeugt werden. Durch die Reduzierung der
Referenzspektren auf eine verhältnismäßig geringe
Anzahl charakteristischer Signale, wird eine erhebliche Daten- und
Informationsreduktion erreicht. Durch die Datenreduktion wird nicht nur
Speicherplatz eingespart, sondern auch ein zeitlicher Aufwand für Datenübertragungen,
so dass das Verfahren prinzipiell auch für eine Anwendung über vernetzte
Datenverarbeitungsanlagen (zum Beispiel Internet) geeignet ist.
Darüber
hinaus ermöglicht
die Informationsreduktion der Referenzspektren der Datenbank eine
deutliche Beschleunigung der Ähnlichkeitsanalyse
des Massenspektrums des zu identifizierenden Mikroorganismus mit
den Referenzspektren, da die Analyse sich nunmehr auf einen Vergleich der
in den Referenzspektren enthaltenen Signale beschränken kann.
-
Verglichen mit herkömmlichen
Verfahren, in denen ein Probenspektrum des zu identifizierenden Organismus
mit "natürlichen" Referenzspektren
abgeglichen wird, ist eine Zuverlässigkeit des erfindungsgemäßen Verfahrens,
das heißt
die Wahrscheinlichkeit, eine korrekte Zuordnung des unbekannten
Organismus zu treffen, deutlich erhöht. Hierin ist der bedeutendeste
Vorteil des Verfahrens zu sehen. Die erhöhte Zuverlässigkeit ist durch die hohe Konzentrierung
spezifischer Informationen in den synthetischen Referenzspektren
zu erklären,
die nicht durch Signale geringer Signifikanz oder Rauschen überdeckt
wird. Auch bei einem möglichen Versagen
bei einer Zuordnung auf Stammebene einer Probe, etwa weil kein Referenzspektrum
dieses Stammes in der Datenbank verfügbar ist, liefert das Verfahren
zuverlässige
Identifizierungen auf übergeordneten
Klassifizierungsebenen, beispielsweise auf Gattungs- oder Artenebene.
Die Empfindlichkeit der erfindungsgemäßen Vorgehensweise wird auch
nicht durch Unterschiede in verschiedenen Spektren beeinträchtigt,
welche beispielsweise durch unterschiedliche Kultivierungsbedingungen,
unterschiedliche Zellstadien oder abweichende Signal-Rauschverhältnisse
verursacht werden.
-
Ein weiterer Vorteil des Verfahrens
stellt die geringe erforderliche Probenmenge des zu identifizierenden
Mikroorganismus dar, die in kürzeren
Kultivierungszeiten erhältlich
ist. Ferner können
auch Mischkulturen analysiert werden, so dass auf die Anzucht von
Reinkulturen verzichtet werden kann.
-
Die in den synthetischen Referenzspektren enthaltenen
Signale können
in zwei Kategorien unterschieden werden. Eine besonders vorteilhafte Ausgestaltung
der Erfindung sieht vor, dass die Signale eines Referenzspektrums
mindestens ein identifiziertes Signal umfassen, welches einem charakterisierten
molekularen Zellbestandteil des jeweiligen Mikroorganismus eindeutig
zugeordnet wurde. Zur Identifizierung eines Mikroorganismus geeignete Zellbestandteile
sind beispielsweise bestimmte Peptide, Proteine, Ribonukleinsäuren und/oder
Lipide. Es hat sich insbesondere für Bakterien als vorteilhaft erwiesen,
eine Signalzuord nung eines ribosomalen Proteins, insbesondere eines
Proteins der großen
Ribosomenuntereinheit, vorzunehmen. Für Bakterien sind dies Proteine
der so genannten 50S-Untereinheit und bei Pilzen die 60S-Untereinheit.
Proteine stellen einen Hauptbestandteil mikrobieller Zellen dar.
Dies gilt insbesondere für
Ribosomenproteine, die unabhängig
von einem Entwicklungsstadium der Zelle, einem Nährstoffangebot oder sonstiger
Kultivierungsbedingungen ständig
präsent
sind und somit zuverlässige
Signale in den Massenspektren darstellen. Hinzu kommt, dass Aminosäuresequenzen
analoger Proteine unterschiedlicher Spezies oder sogar unterschiedlicher
Stämme
sich zumindest geringfügig
voneinander unterscheiden. Folglich weisen die analogen Proteine
unterschiedliche Massen auf und eignen sich für deren Unterscheidung. So
gelang den Erfindern beispielsweise erstmalig die Zuordnung von
vier Massensignalen in dem Massenspektrum von Escherichia coli (m/z
= 4365, 5381, 7276 und 5096) zu den Proteinen L36, L34 und L29 der
großen 50S-Ribosomenuntereinheit
beziehungsweise zu dem Protein 522 der kleinen 30S-Untereinheit.
Diese Signale sind ständige
Bestandteile in Massenspektren von E. coli, nicht jedoch vieler
anderer Mikroorganismen. Sie sind daher besonders zur Identifizierung von
Escherichia coli und zur Aufnahme in ein synthetisches Referenzspektrum
für E.
coli geeignet. Im Falle von Pilzen haben sich überdies ganz besonders Strukturproteine,
insbesondere Hydrophobine zur Identifizierung bewährt.
-
In einer weiteren Ausbildung der
vorliegenden Erfindung ist vorgesehen, dass die Signale eines synthetischen
Referenzspektrums als zweite Signalkategorie mindestens ein empirisches
Signal umfassen, welches durch Vergleich einer Vielzahl von Massenspektren
bekannter Mikroorganismen als spezifisch für einen Mikroorganismus ermittelt
wurde. Dabei handelt es sich um Signale, deren Ursprung, das heißt deren
verursachende molekulare Zellkomponente, zwar nicht bekannt ist,
die jedoch aufgrund bestimmter Kriterien als charakteristisch für einen
Mikroorganismus gewertet werden. Vorzugsweise umfassen diese Kriterien
eine vorgebbare Mindest-Häufigkeit
für das
Auftreten eines Signals in einer Anzahl von Massenspektren desselben
Mikroorganismus sowie eine vorgebbare durchschnittliche Mindest-Intensität des Signals.
Dabei sollte die Mindest-Häufigkeit
mindestens 50 %, insbesondere mindestens 70 %, vorzugsweise mindestens
90 %, betragen. Zusätzlich
wird die Spezifität
des Signals überprüft, das heißt die Häufigkeit,
mit der das Signal. in den natürlichen
Massenspektren anderer Mikroorganismen auftaucht, wobei das Auftreten
in den Fremdspektren möglichst
selten sein sollte. Die Ermittlung der empirischen Signale durch
Vergleich gemessener Massenspektren kann visuell, vorzugsweise jedoch
computergestützt,
durchgeführt
werden. Entsprechende Algorithmen (Mustererkennungsverfahren) sind
bekannt und sollen hier nicht näher
erläutert
werden. Darüber
hinaus ist es denkbar, auch die identifizierten Signale einer nachträglichen
Kontrolle durch Anwendung dieser Kriterien zu unterziehen.
-
Die Anzahl der Signale eines Referenzspektrums
kann in einem Rahmen von 1 bis 50 liegen und beträgt vorteilhafterweise
5 bis 30. In vielen Fällen hat
sich insbesondere eine Anzahl von 10 bis 15 als ausreichend erwiesen.
Es ist ferner bevorzugt vorgesehen, dass ein Signal eines synthetischen
Referenzspektrums durch lediglich ein Koordinatenpaar repräsentiert
wird. Dabei besteht das Koordinatenpaar aus einer Masse beziehungsweise
einem Masse-Ladungs-Verhältnis
als x-Koordinate einerseits und einer absoluten oder relativen Intensität als y-Koordinate
andererseits. Verglichen mit "natürlichen" Massenspektren,
die mehrere 1000 Datenpunkte enthalten, bedeutet dies eine erhebliche
Datenreduktion.
-
Für
den Abgleich eines Probespektrums mit den synthetischen Referenzspektren
der Datenbank können
vorteilhafterweise den einzelnen identifizierten und empirischen
Signalen der Referenzspektren Gewichtungen entsprechend ihrer Signifikanz
zugeordnet werden, wobei auf die oben genannten Kriterien, das heißt Häufigkeit/Intensität in den
eigenen Spektren und in denen der anderen Referenzorganismen, zurückgegriffen
werden kann. Wenn diese Gewichtung bereits auf Stufe der synthetischen
Referenzspektren vorgenommen wird, kann auf eine entsprechende Selektion
und/oder Gewichtung der Signale der Differenzspektren unter Umständen verzichtet
werden.
-
Die Erfindung umfasst ferner eine
Datenbank zur Durchführung
eines Verfahrens sowie ihre Verwendung für die Identifizierung von Mikroorganismen
mittels Massenspektrometrie. Die erfindungsgemäße Datenbank umfasst
- (a) synthetische Referenzspektren bekannter
Mikroorganismen, beinhaltend eine gegenüber natürlichen Massenspektren reduzierte
Anzahl von für
den jeweiligen Mikroorganismus spezifischen Signalen, sowie
- (b) Differenzspektren, resultierend aus einer Verrechnung jeweils
zweier synthetischer Referenzspektren der bekannten Mikroorganismen.
-
Darüber hinaus kann es von Vorteil
sein, auch die natürlichen
Referenzspektren (Originalspektren) in der Datenbank zu enthalten.
-
Das erfindungsgemäße Verfahren lässt sich besonders
vorteilhaft mit der MALDI-TOF-Massenspektrometrie durchführen. Entsprechend
sind alle verwendeten Massenspektren vorzugsweise MALDI-TOF-Massenspektren.
-
Die Erfindung wird nachfolgend in
Ausführungsbeispielen
anhand der zugehörigen
Zeichnungen näher
erläutert.
Es zeigen:
-
1 ein
Ablaufschema des Verfahrens zur Erzeugung einer erfindungsgemäßen Datenbank;
-
2 MALDI-TOF-Massenspektren
(Originalspektren) von Escherichia coli und von isolierten Ribosomen
aus Escherichia coli;
-
3 bis 8 synthetische Referenzspektren verschiedener
Bakterien, insbesondere für
zwei Escherichia coli-Stämme,
zwei Klebsiella-Spezies, Pseudomonas aeruginosa und Staphylococcus
aureus;
-
9 ein
synthetisches Referenzspektrum des Pilzes Trichoderma reesei;
-
10a–10d eine Erzeugung zweier
Differenzspektren;
-
11 eine
Struktur der erfindungsgemäßen Datenbank;
und
-
12 ein
Ablaufschema des Verfahrens zur Identifizierung eines Mikroorganismus.
-
1 zeigt
in einem Fließschema
einen typischen erfindungsgemäßen Verfahrensablauf.
In einem ersten Schritt S1 wird eine möglichst große Anzahl von natürlichen
Referenzspektren REFN, das heißt Originalspektren
bekannter Mikroorganismen, gemessen. In diesem Zusammenhang werden
im Folgenden einige Details zur Probenvorbereitung und zur Datenakquisition
gegeben.
-
Probenvorbereitung
und MALDI-TOF-Datenakquisition
-
Für
eine MALDI-TOF-Analyse werden zirka 5 bis 100 μg Nasszellen oder auch 5 bis
50 μg getrocknete
Zellen eines bekannten oder zu identifizierenden Bakteriums oder
Pilzes benötigt.
Eine Vorbehandlung der Zellen, beispielsweise ein Zellaufschluss,
ist nicht notwendig. Die Nasszellen können direkt von einer AGAR-Kultur mit einer
sterilen Impföse
auf eine auch Template genannte Probenplatte übertragen werden. Alternativ
können
auch abzentrifugierte Zellen einer Flüssigkultur verwendet werden. Anschließend werden
die Zellen auf der Probenplatte mit 0,2 bis 1 μl einer Matrixlösung vermischt.
In Abwandlung von dieser Prozedur können die Nasszellen auch vor
ihrer Übertragung
auf die Probenplatte mit der Matrixlösung vermischt und als Suspension übertragen
werden. Für
die folgenden Messungen wurde eine Matrixlösung aus 100 mg/ml 2,5-Dihydroxybenzoesäure in einer
Mischung aus 50 % Acetonitril und 50 % Wasser mit 3 % Trifluoressigsäure verwendet.
Andere bekannte Matrixlösungen
sind ebenfalls geeignet. Nach Trocknung der Probe, die mit einer
Kristallbildung einhergeht, kann die Probe direkt einer MALDI-TOF-massenspektrometischen
Analyse unterworfen werden. Für
die vorliegenden Messungen wurde jeder Probenpunkt einer Probenplatte
in einem herkömmlichen
Massenspektrometer mit zirka 50 bis 300 Laserpulsen eines Stickstoff-Lasers
mit einer Wellenlänge
von 337 nm angeregt. Die Akquisition positiver Ionenmassenspektren
erfolgte im Linearmessmodus in einem Massenbereich von 2000 bis 20000
m/z. Ein typisches Beispiel eines auf diese Weise erhaltenen positiven
MALDI-TOF-Massenspektrums REF von Escherichia coli ist im oberen
Teil der 2 im Massenbereich
von zirka m/z = 4000 bis 14000 dargestellt.
-
Im anschließenden Verfahrensschritt S2 (1) wird eine Zuordnung von
Signalen (Peaks) zu bestimmten molekularen Zellbestandteilen durchgeführt. Eine
mögliche
Vorgehensweise, die auf bekannte Methoden der Biochemie und Molekularbiologie
zurückgreift,
wird im Folgenden am Beispiel von Ribosomenproteinen der großen Ribosomenuntereinheit
kurz erläutert.
-
Identifizierung
unbekannter Signale
-
Ein Proteinextrakt einer Zellkultur
wird mittels einer 2D-Gelelektrophorese aufgetrennt. In Frage kommende
so genannte Proteinspots werden anschließend einem tryptischen Verdau,
bei dem das Protein enzymatisch in kleine Proteinbruchstücke gespaltet
wird, unterzogen. Sofern Antikörper
gegen Ribosomen vorhanden sind, können die relevanten Proteinspots
auch durch ein Immunoassay (zum Beispiel Western-Blot-Analyse) erkannt
werden. Die durch den tryptischen Verdau gewonnenen Proteinbruchstücke werden
dann mittels einer HPLC aufgetrennt und ansequenziert oder direkt
einer so genannten Peptidmassen-Fingerprint-Identifizierung mit
anschließender
PSD (post source decay) unterzogen. Mit den auf diese Weise ermittelten
Sequenzbruchstücken
kann dann versucht werden, die Ribosomengene in einer Datenbank
zu identifizieren. Sind entsprechende Gene in der Datenbank vorhanden,
kann aus der gesamten Gensequenz die korrespondierende Proteinmasse
ermittelt werden. Kann ein entsprechendes Gen in der Datenbank nicht
gefunden werden, so muss mit bekannten Mitteln der Molekular biologie,
die hier nicht näher
ausgeführt werden
sollen, das gesamte Gen, welches für das entsprechende ribosomale
Protein kodiert, isoliert und sequenziert werden. Ist die Gensequenz
bekannt, folgt die Übersetzung
in die Proteinsequenz und Ermittlung der theoretischen Proteinmasse.
Eine Überprüfung dieser
theoretischen Masse kann erfolgen, indem der entsprechende Proteinspot
der 2D-Gelelektrophorese einer MALDI-TOF-Massenspektrometrie unterworfen
wird. Bei Abweichungen von der theoretischen Proteinmasse können Modifikationen
des Proteins durch MALDI-TOF-Analyse des tryptischen Verdaus festgestellt
werden.
-
Zur Verdeutlichung ist in der 2 im unteren Teil ein Massenspektrum
des 70S-Ribosomens aus Escherichia coli, das mittels 2D-Gelelektrophorese
isoliert wurde, dargestellt. Mit 70S wird der gesamte Ribosomen
eines Proteins bezeichnet, der sich aus der großen SOS-Untereinheit und der
kleinen 30S-Untereinheit zusammensetzt. Beide Untereinheiten bestehen
ihrerseits aus einer Reihe von Proteinen, die mit dem Buchstaben
L (für
large) und dem Buchstaben S {für
small) bezeichnet werden. Es ist ohne weiteres ersichtlich, dass
eine Reihe der intensivsten Signale aus dem Spektrum von Escherichia coli
ATCC 25922(vergleiche 2 oberer
Teil) sich auf ribosomale Proteine zurückführen lässt. Entsprechende Signale
sind in der Abbildung mit Pfeilen gekennzeichnet. Den Erfindern
ist es erstmalig gelungen, drei dieser Signale bestimmten Proteinen
der großen
50S- und ein Signal einem Protein der kleinen 30S-Ribosomenuntereinheit
zuzuordnen. Dabei handelt es sich um die Proteine L29, L34, L36
und S22 mit den Massen m/z = 7274, 5381, 4365 beziehungsweise 5096.
Da insbesondere die Signale der großen Untereinheit mit einer
hohen Zuverlässigkeit
in den Massenspektren von Escherichia coli auftauchen, sind sie
besonders zur Identifizierung geeignet. Sie wurden als identifizierte
Signale Sid für das synthetische Referenzspektrum
REFS für
Escherichia coli verwendet.
-
In einem alternativen oder zusätzlichen Schritt
S3 (1) werden empirische
Signale Sem aus den gemessenen Referenzspektren
REFN der bekannten Mikroorganismen ermittelt.
Die Ermittlung der empirischen Signale Sem erfolgt
durch Vergleich einer Vielzahl von Massenspektren REFN,
die von demselben Stamm aufgezeichnet wurden, untereinander sowie
durch Vergleich mit denen von anderen Organismen. Dabei werden solche
Signale als charakteristisch für
einen Mikroorganismus ermittelt, die möglichst häufig in den Massenspektren
desselben Organismus auftauchen und möglichst selten in den Massenspektren
eines anderen. Für
die Häufigkeit eines
Auftretens eines geeigneten empirischen Signals Sem kann
dabei ein Mindest-Wert, beispielsweise > 70 % bezogen auf alle Spektren eines
Organismus, vorgegeben werden. Ebenso sollte ein solches Signal
eine vorgebbare Mindest-Intensität
besitzen, um seine Unterscheidung von dem Untergrundrauschen zu
erleichtern. Die Ermittlung der empirischen Signale Sem im
Schritt S3 kann zwar prinzipiell durch visuellen Spektrenvergleich
durch den Anwender erfolgen. Es ist jedoch bevorzugt vorgesehen,
diesen Schritt automatisiert mit Hilfe geeigneter Rechner programme
durchzuführen.
Hier kommt etwa ein Algorithmus in Frage, welcher die gemessenen
natürlichen
Referenzspektren REFN hinsichtlich der genannten
Kriterien untersucht. Es sind jedoch auch, beispielsweise aus der
Infrarotspektrometrie, computergestützte Verfahren bekannt, die
unter Anwendung statistischer Algorithmen in der Lage sind, wiederkehrende
Signale zu erkennen und herauszufiltern.
-
Die in den Schritten S2 und S3 ermittelten identifizierten
und empirischen Signale Sid, Sem werden
in einem anschließenden
Schritt S4 zu synthetischen Referenzspektren REFS zusammengefasst. Dabei
wird für
jeden bekannten Mikroorganismus ein Referenzspektrum REFS erzeugt.
-
In den 3 bis 9 sind beispielhaft derartige synthetische
Referenzspektren REFS für zwei Escherichia coli-Stämme (ATCC
25922 und ATCC 35218), zwei Klebsiella-Spezies – nämlich Klebsiella oxycoca und
Klebsiella pneumoniae –,
für Pseudomonas
aeruginosa, Staphylococcus aureus sowie für den Pilz Trichoderma reesei
dargestellt. Dabei ist jeweils im oberen Teil jeder der 3 bis 9 das synthetische Referenzspektrum REFS in Koordinatenform dargestellt (teilweise
unter Verzicht der y-Koordinaten), während im unteren Teil jeweils
die graphische Repräsentation
in der typischen Form von Massenspektren abgebildet ist. Die synthetischen
Referenzspektren REFS umfassen in den gezeigten
Beispielen zehn bis fünfzehn
Signale S, im Falle des Pilzes T. reesei fünf. In den Referenzspektren
REFS von Escherichia coli (3 und 4)
und von Pseudomonas aeruginosa (7)
sind die als Proteine der großen
50S-Ribosomenuntereinheit identifizierten Signale Sid markiert.
Dabei konnten für
E. coli und für
P. aeruginosa jeweils die den Proteinen L29, L34 und L36 der großen Untereinheit
zugehörigen
Signale identifiziert werden sowie für P. aeruginosa zusätzlich das
dem Protein L33 zugehörige
Signal. Im Falle von E. Coli ATCC 25922 (3) konnte ferner ein Signal dem Protein
S22 der kleinen 30S-Ribosomenuntereinheit zugeordnet werden.
-
Die Unterscheidung der beiden Escherichia coli-Stämme untereinander
(3 und 4) wird hauptsächlich durch solche empirische
Signale Sem ermöglicht, die nur bei einem von
beiden Stämmen
beobachtet werden. Ein Vergleich der in den 3 und 4 gezeigten
synthetischen Referenzspektren REFS zeigt,
dass das erfindungsgemäße Verfahren
empfindlich genug ist, um eine Unterscheidung von Mikroorganismen
sogar auf Stammniveau zu ermöglichen.
Daneben wird auch eine Unterscheidung zwischen Escherichia coli
einerseits und Klebsiella-Spezies (5 und 6) andererseits ermöglicht.
-
Das in 8 dargestellte
Beispiel von Staphylococcus aureus zeigt, dass auch andere als Ribosomenproteine
identifiziert und zur Bestimmung des Organismus herangezogen werden
können.
In diesem Fall konnte ein Signal einem formylierten Peptidfragment
des Delta-Toxins (Delta-Hemolysin) zugeordnet werden, das äußerst charakteristisch
für dieses
Bakterium ist.
-
Im Falle von Pilzen haben sich neben
ribosomalen Proteinen insbesondere auch die hydrophoben Strukturproteine
Hydrophobine als vorteilhaft zur Identifizierung des Mikroorganismus
erwiesen. So konnten für
den Pilz Trichoderma reesei (9)
drei Signale des Spektrums den Proteinen Hydrophobin I und II beziehungsweise
einem Fragment von Hydrophobin II zugeordnet werden. Diese identifizierten
Signale Sid können sowohl zur Abgrenzung
gegenüber Bakterien,
die keine Hydrophobine besitzen, als auch zur Differenzierung verschiedener
Pilze untereinander herangezogen werden.
-
Weiter in 1 werden anschließend an die Erzeugung der synthetischen
Referenzspektren REFS in dem Schritt S5
durch Verrechnung jeweils zweier Referenzspektren REFS Differenzspektren DIF
erzeugt. Dieser Schritt ist in den 10a bis 10d anhand von fiktiven synthetischen
Referenzspektren zweier eng verwandter Organismen, hier der Gattung 1
und der Gattung 2 (10a und 10b), verdeutlicht. Vorzugsweise
wird dieser Schritt nur für
einander sehr ähnliche
Organismen durchgeführt,
wobei die resultierenden Differenzspektren DIF die Unterscheidung
genau dieser Organismen erleichtern.
-
Die Verrechnung der Referenzspektren REFS erfolgt durch Subtraktion eines Referenzspektrums
REFS von dem jeweils anderen, wobei ein
Signal, welches in beiden Referenzspektren REFS vorhanden
ist, unabhängig
von den Intensitäten
eliminiert wird. Auf diese Weise verbleiben in dem Differenzspektrum
DIF1
–2 von Gattung 1 nur
Signale, die nicht im Referenzspektrum REFS
,2 von Gattung 2 vorhanden sind und umgekehrt. 10c zeigt das um Gattung
2 "bereinigte" Differenzspektrum
für Gattung 1
DIF1–2 und 10d das Differenzspektrum
für Gattung
2 DIF2–1 nach "Subtraktion" von Gattung 1. Selbstverständlich müssen bei
der Verrechnung zweier Signale etwaige geräte- und messspezifische Toleranzen
der Massen berücksichtigt
werden, so dass im Ergebnis auch Signale S entfernt werden, die sich
etwa um eine Massenzahl unterscheiden.
-
Signale, die nach der Subtraktion
in den jeweiligen Differenzspektren DIF1
–2,
DIF2–1 verbleiben, können einer
weiteren Selektion unterworfen werden. Beispielsweise kann für das Spektrum
DIF1–2 überprüft werden,
wie häufig
das Signal bei der Masse 5.500 in den natürlichen Originalspektren von
Gattung 1 (REFN
,1,
nicht dargestellt) auftaucht und wie häufig in den Originalspektren
von Gattung 2 (REFN
,2, nicht
dargestellt). Dabei wird ein Signal um so eher eliminiert, je seltener
es in den natürlichen
Eigenspektren und je häufiger
in den natürlichen
Fremdspektren auftaucht, wobei auch Intensitäten entsprechend berücksichtigt
werden können.
-
Die in Schritt S4 (1) erzeugten synthetischen Referenzspektren
REFS sowie die in Schritt S5 erzeugten Differenzspektren
DIF werden in einem anschlie ßenden
Schritt S6 zu einer Datenbank DB zusammengefasst. Innerhalb der
Datenbank DB können
die synthetischen Referenzspektren REFS in
logischer Weise, beispielsweise nach Familie, Gattung, Art und Stamm,
geordnet werden. Ferner kann die Datenbank DB eine Statistik umfassen,
die wiedergibt, wie sich ein Signal S bei der Erstellung der synthetischen
Referenzspektren REFS und/oder den Differenzspektren
DIF hinsichtlich Häufigkeit
und Spezifität
bewährt
hat. Diese Statistik kann beispielsweise der Gewichtung der Signale
S bei der Identifizierung unbekannter Organismen dienen.
-
Der Aufbau der erfindungsgemäßen Datenbank
DB ist in 11 dargestellt.
Die Datenbank umfasst (optional) natürliche Referenzspektren REFN, wobei für jeden Organismus i, j, k
und so weiter eine Vielzahl von Referenzspektren REFN vorhanden sind.
Die Datenbank DB beinhaltet ferner für jeden bekannten Organismus
aus den jeweiligen natürlichen
Referenzspektren REFN ermittelte synthetische Referenzspektren
REFS, die aus wenigen diskreten (identifizierten
und/oder empirischen) Signalen S bestehen. Schließlich umfasst
die Datenbank DB Differenzspektren DIF, die aus jeweils zwei synthetischen Referenzspektren
REFS zweier Mikroorganismen ermittelt wurden.
Dabei hat sich als ausreichend erwiesen, nur Differenzspektren DIF
von solchen Organismen zu erstellen, die einander stark ähneln und
daher erfahrungsgemäß schwer
massenspektrometrisch zu unterscheiden sind.
-
Der Verfahrensablauf von S1 bis S6
gemäß 1, das heißt die Erstellung
der Datenbank DB, muss prinzipiell nur einmal durchgeführt werden.
Auf diese Datenbank DB kann dann in dem erfindungsgemäßen Identifizierungsprozess
immer wieder zurückgegriffen
werden. Selbstverständlich
kann und sollte die Datenbank DB aber ständig durch Referenzspektren
REFS und/oder Differenzspektren DIF weiterer
Mikroorganismen erweitert und aktualisiert werden. So ist etwa denkbar,
Referenzspektren REFS von Mutanten, insbesondere
solchen mit verändertem
Resistenz- und/oder Virulenzverhalten, aufzunehmen, sofern diese
Stämme
charakteristische Signale liefern. Auch sollten auf Basis statistischer
Auswertung der analysierten Proben die vorhandenen Referenzspektren
REFS laufend optimiert werden, beispielsweise
durch die Aufnahme neuer Signale Sid, Sem und/oder durch Löschung von Signalen.
-
Der Ablauf des eigentlichen Identifizierungsverfahrens
unter Verwendung der beschriebenen Datenbank DB ist in 12 erläutert. In dem Schritt S7 erfolgt
die Akquisition eines Massenspektrums SAM eines zu identifizierenden
Mikroorganismus. Vorteilhafterweise wird dieses Probenspektrum SAM
unter möglichst
identischen Messbedingungen, insbesondere gleicher Matrix, wie die
natürlichen
Referenzspektren REFN gemessen.
-
Nachfolgend (Schritt S8) erfolgt
in einem ersten Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums
SAM mit den in der Datenbank DB enthaltenen synthetischen Referenzspektren
REFS, wobei das Pro benspektrum mit jedem
Referenzspektrum REFS verglichen wird. Dieser
Spektrenabgleich kann visuell nach bestimmten vorgegebenen Kriterien,
vorzugsweise jedoch computergestützt,
erfolgen. Dabei kann prinzipiell auf die gleichen oder ähnliche Algorithmen
zurückgegriffen
werden, die bereits in Schritt S3 zur Ermittlung der empirischen
Signale Sem Anwendung fanden. Durch die
Einfachheit der verwendeten Referenzspektren REFS kann
der Spektrenabgleich in Schritt S8 auch mit sehr einfachen Algorithmen
durchgeführt
werden, die sich lediglich auf einen Vergleich der Signale Sid, Sem der synthetischen
Referenzspektren REFS mit dem Probenspektrum
SAM beschränken.
Selbstverständlich
müssen hier
Toleranzkriterien vorgegeben werden, die festlegen, um wie viel
ein in Frage kommendes Signal Sid, Sem des Probenspektrums SAM hinsichtlich der
Masse und/oder der Intensität
abweichen darf, um als übereinstimmend
gewertet zu werden. Außerdem können an
dieser Stelle die in der Statistik enthaltenen Gewichtungen der
einzelnen Signale S einfließen,
wobei ein Signal S umso entscheidender für eine positive Identifizierung
ist je öfter
und intensiver es in den natürlichen
Eigenspektren und je seltener und schwächer es in den natürlichen
Fremdspektren vorhanden ist. Ferner kann eine Mindest-Anzahl übereinstimmender
Signale für
eine positive Identifizierung vorgegeben werden.
-
Im Schritt S9 erfolgt eine Ausgabe
eines ersten Resultats REST. Dieses kann entweder darin bestehen,
dass bereits eine eindeutige Übereinstimmung
des Probenspektrums SAM mit einem der Referenzspektren REFS erkannt wurde, mit der Folge, dass das
Verfahren an dieser Stelle bereits beendet ist. Weist das Probenspektrum
SAM hingegen Ähnlichkeit
mit mehr als einem synthetischen Referenzspektrum REFS auf,
so wird als Ergebnis REF1 eine Anzahl der in Frage kommenden Mikroorganismen ausgegeben.
In diesem Fall schließt
in Schritt S10 als zweiter Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums
SAM mit in der Datenbank DB enthaltenen Differenzspektren DIF an.
Wird in Schritt 58 beispielsweise eine hohe Ähnlichkeit mit den Referenzspektren
REFS der Organismen i und k festgestellt,
so erfolgt in Schritt S10 ein Abgleich des Probenspektrums SAM mit
den zwischen diesen Organismen erzeugten Differenzspektren DIFi–k und
DIFk–i (vergleiche 11) . Der erfindungsgemäße zweite Analyseschritt
erlaubt somit eine sichere Zuordnung eines unbekannten Organismus
zu einem Organismus aus einer Gruppe einander sehr ähnlicher
Organismen.
-
Als Endergebnis RES2 wird in Schritt
S11 der mit dem Probenspektrum SAM als übereinstimmend ermittelte Mikroorganismus
ausgegeben. Ferner kann auch eine Information über den Grad der Übereinstimmung
ausgegeben werden. Handelt es sich – wie häufig der Fall – bei der
Probe des unbekannten Organismus um eine Mischkultur, so ermöglicht das
Verfahren sogar die Identifizierung mehrerer, nebeneinander vorliegender
Mikroorganismen. In einem solchen Fall werden als Ergebnis mehrere Treffer
ausgegeben. Stimmt das Probenspektrum SAM mit keinem der synthetischen
Referenzspektren REFS innerhalb der zugelassenen
Toleran zen überein,
das heißt,
der unbekannte Mikroorganismus ist nicht in der Datenbank DB enthalten,
so ist auch dieses ein ausgebbares Resultat.
-
In bestimmten Fällen, in denen ein Mikroorganismus
nicht oder nicht eindeutig identifiziert werden kann, kann vorteilhaft
vorgesehen sein, dass im Anschluss an den Schritt S11 ein zusätzlicher
Direktvergleich mit den gemessenen "natürlichen" Referenzspektren
REFN durchgeführt wird. Dieses Vorgehen entspricht
der bekannten Vorgehensweise zur Identifizierung von Mikroorganismen
mittels MALDI-TOF-MS und erfordert eine Datenbank DB, die neben
den Synthetischen Referenzspektren REFS und den
Differenzspektren DIF auch die natürlichen Referenzspektren REFN umfasst.
-
Durch die Einfachheit und den konzentrierten
Informationsgehalt der synthetischen Referenzspektren REFS zeichnet sich das erfindungsgemäße gegenüber bekannten
Verfahren durch eine wesentlich höhere Zuverlässigkeit aus, die durch den
zweiten Analyseschritt noch weiter erhöht wird.
-
- S1
- Messung
von Referenzspektren
- S2
- Signalidentifizierung
- S3
- Ermittlung
empirischer Signale
- S4
- Erzeugung
eines synthetischen Referenzspektrums
- S5
- Erzeugung
von Differenzspektren
- S6
- Datenbankerstellung
- S7
- Erfassung
eines Probenspektrums
- S8
- Abgleicht
Probenspektrum/synthetische Referenz
-
- spektren
- S9
- Ergebnisausgabe
1
- S10
- Abgleicht
Probenspektrum/Differenzspektren
- S11
- Ergebnisausgabe
2
- DB
- Datenbank
- DIF
- Differenzspektrum
- REFN
- natürliches
Referenzspektrum
- REFS
- synthetisches
Referenzspektrum
- RES1
- Ergebnis
des ersten Analyseschrittes
- RES2
- Ergebnis
des zweiten Analyseschrittes
- SAM
- Probenspektrum
- Sid
- identifiziertes
Signal
- Sem
- empirisches
Signal