DE10300743A1

DE10300743A1 - Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie

Info

Publication number: DE10300743A1
Application number: DE10300743A
Authority: DE
Inventors: Wibke Dr. Kallow; Marcel Dr. Erhard; Ralf Dieckmann; Stefan Sauermann
Original assignee: ANAGNOSTEC GES fur ANALYTISCH; Anagnostec Gesellschaft fur Analytische Biochemie und Diagnostik Mbh
Current assignee: ANAGNOSTEC GES fur ANALYTISCH; Anagnostec Gesellschaft fur Analytische Biochemie und Diagnostik Mbh
Priority date: 2003-01-07
Filing date: 2003-01-07
Publication date: 2004-07-29
Also published as: EP1437673B1; ATE438150T1; DK1437673T3; DE50311753D1; EP1437673A1

Abstract

Die Erfindung betrifft ein Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie, insbesondere mittels MALDI-TOF-MS. Erfindungsgemäß wird eine Datenbank (DB) verwendet, die synthetische Referenzspektren (REF¶S¶) bekannter Mikroorganismen umfasst, welche durch Zusammenfassung einer gegenüber natürlichen Massenspektren (REF¶N¶) reduzierten Anzahl von für den jeweiligen Mikroorganismus spezifischen Signale (S) gebildet werden, sowie Differenzspektren (DIF), welche durch Verrechnung jeweils zweier synthetischer Referenzspektren (REF¶S¶) der bekannten Mikroorganismen gebildet werden. Das Verfahren umfasst ferner einen ersten Analyseschritt, bei dem eine Ähnlichkeitsanalyse eines Probenmassenspektrums (SAM) eines zu identifizierenden Mikroorganismus mit den in der Datenbank (DB) enthaltenen synthetischen Referenzspektren (REF¶S¶) durchgeführt wird, und einen zweiten Analyseschritt, bei dem eine Ähnlichkeitsanalyse des Probenspektrums (SAM) mit wenigstens einem Teil der in der Datenbank (DB) enthaltenen Differenzspektren (DIF) durchgeführt wird.

Description

Die Erfindung betrifft ein Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie, insbesondere mittels Matrix-assisted-Laser-Desorption-Ionisation Time-of-Flight Massenspektrometrie (MALDI-TOF-MS) mit den in Anspruch 1 genannten Merkmalen sowie eine für die Durchführung des Verfahrens geeignete und für das Verfahren verwendbare Datenbank" nach den Ansprüchen 21 und 25.
Eine schnelle und zuverlässige Identifizierung von Mikroorganismen ist in verschiedenen Bereichen des Gesundheitswesens, beispielsweise der Diagnostik von Infektionen, sowie der Lebensmittelindustrie von entscheidender Bedeutung. Die traditionelle Identifizierung mittels des direkten Bakteriennachweises erfordert zunächst die Anzüchtung der zu identifizierenden Mikroorganismen aus einer Materialprobe. Anschließende mikroskopische und visuelle Untersuchungsverfahren dienen hauptsächlich der vorläufigen Orientierung über den Bakteriengehalt sowie der Mikromorphologie beziehungsweise Färbeeigenschaften der klinischen Untersuchungsprobe. Die Identifizierung von Isolaten bis zur Speziesebene erfordert nicht selten eine Subkultivierung zwecks der Gewinnung einer Rein kultur. Nach einem klassischen Identifizierungsverfahren der medizinischen Mikrobiologie, der so genannten "Bunten Reihe", werden unter Verwendung einer geeigneten Kombination von Differentialmedien spezifische Stoffwechselleistungen des zu identifizierenden Mikroorganismus erfasst. Hauptnachteil des mikrobiellen Verfahrens ist sein sehr hoher Zeitbedarf, insbesondere für die Kultivierung.
Modernere molekularbiologische Ansätze, wie die PCR-Methode (Polymerase-Kettenreaktion) und die 16S-rRNA-Methode, involvieren die genetische Analyse des zuvor isolierten Genoms beziehungsweise bestimmter Ribonukleinsäuren. Diese Verfahren haben wegen ihrer hohen Empfindlichkeit stark an Bedeutung gewonnen. Sie sind jedoch ebenso wie die mikrobiologische Charakterisierung mit einem erheblichen personellen und instrumentellen Aufwand belastet.
Ferner sind infrarotspektroskopische Verfahren bekannt, bei denen Schwingungsspektren intakter Zellen ("Fingerprintspektren") in FTIR-Spektrometern aufgezeichnet und mit einer Datenbank mit Schwingungsspektren bekannter Mikroorganismen abgeglichen wird. Diese noch junge Technik befindet sich noch in der Entwicklung und kann derzeit nur von speziell geschultem und erfahrenem Personal durchgeführt werden, so dass sich dieser Ansatz noch nicht in der Praxis durchsetzen konnte.
Mit der so genannten MALDI-TOF-Massenspektrometrie ist in den letzten Jahren ein Verfahren entwickelt worden, das im Gegensatz zu herkömmlichen massenspektrometrischen Verfahren auch der Analyse biologischer Makromoleküle zugänglich ist. Bei der MALDI-TOF-MS-Technik wird die zu untersuchende Probe mit einer meist kristallinen organischen Verbindung, der so genannten Matrix, auf eine Probenplatte gegeben, wobei die Probe in die Matrixkristalle eingebaut wird, und mit einem Laserstrahl in Wechselwirkung gebracht. Dabei werden einzelne Moleküle der Probe von dem Probenträger desorbiert und ionisiert. Anschließend werden die so erzeugten Ionen in einem elektrischen Feld beschleunigt und ihre Flugzeit (Time-of-Flight) bis zum Erreichen eines Detektors registriert. Da die Beschleunigung von der Masse eines ionisierten Moleküls abhängt, spiegeln die Flugzeiten die in der Probe vorhandenen Molekülmassen wider. Die MALDI-TOF-MS-Technik findet heutzutage hauptsächlich auf dem Gebiet der Proteinanalytik ("Proteomics") und bei der RNA- und DNA-Analytik Anwendung.
Es wurde zum Beispiel in der WO 98/09314 vorgeschlagen, die MALDI-TOF-Massenspekrometrie zur Identifizierung von Mikroorganismen in Analogie zu der oben beschriebenen infrarotspektroskopischen Fingerprintmethode einzusetzen. Dafür wird das MALDI-TOF-Massenspektrum eines Zellextraktes oder intakter Zellen des unbekannten Mikroorganismus mit den Spektren bekannter Organismen verglichen. Der Vergleich des Probenspektrums mit den Referenzspektren der Datenbank erfolgt in der Regel computergestützt mittels statistisch-mathematischer Algorithmen, die in so ge nannten Mustererkennungsverfahren entwickelt wurden. Die Massenspektren weisen mit wachsender verwandtschaftlicher Nähe der Mikroorganismen zunehmende Ähnlichkeit miteinander auf und die Wahrscheinlichkeit einer Wiederholung bestimmter Signale in den Massenspektren nimmt zu. Dies hat zur Folge, dass das Verfahren bereits bei übergeordneten Klassifizierungsniveaus, etwa bei Gattungen oder Familien, mit einer erhöhten Unsicherheit verbunden ist, wenn eine Zuordnung auf einem untergeordneten Niveau (zum Beispiel Stammniveau) fehlschlägt, beispielsweise weil kein Referenzspektrum des Stammes in der Datenbank vorhanden ist. Das Verfahren ist daher auf sehr umfangreiche Datenbanken mit einer Vielzahl repräsentativer Referenzspektren von bekannten Stämmen angewiesen. Hinzu kommt die Schwierigkeit, ein spektrales Grundrauschen von echten Signalen zu diskriminieren.
Aus den DE 100 38 694 A und EP 1 253 622 A ist ein Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS bekannt, bei dem das Probenspektrum des unbekannten Mikroorganismus nicht mit Originalmassenspektren ("natürlichen Massenspektren") abgeglichen wird, sondern mit so genannten synthetischen Referenzspektren. Dabei handelt es sich um Massenspektren, die aus einer reduzierten Anzahl von für den jeweiligen Mikroorganismus charakteristischen Signalen zusammengefasst sind. Diese charakteristischen Signale umfassen vorzugsweise solche, die bestimmten molekularen Bestandteilen der Zelle zugeordnet werden konnten und/oder die durch visuelle oder rechnergestützte Analyse als spezifisch selektiert wurden. Obwohl dieses Verfahren aufgrund der Sektion der Signale und Beschränkung des Spektrenvergleichs auf die selektierten Signale eine deutlich verbesserte Zuverlässigkeit gegenüber dem herkömmlichen Abgleich mit Originalspektren aufweist, hat sich die Unterscheidung sehr ähnlicher Organismen in Einzelfällen als schwierig erwiesen. Dies gilt insbesondere für eng verwandte Organismen.
Aufgabe der vorliegenden Erfindung ist es daher, das massenspektroskopische Verfahren zur Identifizierung von Mikroorganismen in Hinblick auf eine noch weiter erhöhte Zuverlässigkeit weiterzuentwickeln. Es soll ferner eine für das Verfahren geeignete Datenbank zur Verfügung gestellt werden.
Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 sowie durch eine Datenbank und ihre Verwendung nach den Ansprüchen 21 und 25 gelöst.
Das- erfindungsgemäße Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie, sieht vor, dass

(a) eine Datenbank verwendet wird, umfassend – synthetische Referenzspektren bekannter Mikroorganismen, welche durch Zusammenfassung einer gegenüber natürlichen Massenspektren reduzierten Anzahl von für den jeweiligen Mikroorganismus spezifischen Signalen gebildet werden, sowie – Differenzspektren, welche. durch Verrechnung jeweils zweier synthetischer Referenzspektren der bekannten Mikroorganismen gebildet werden,
(b) in einem ersten Analyseschritt eine Ähnlichkeitsanalyse eines Probenmassenspektrums eines zu identifizierenden Mikroorganismus mit den in der Datenbank enthaltenen synthetischen Referenzspektren durchgeführt wird und
(c) in einem zweiten Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums mit wenigstens einem Teil der in der Datenbank enthaltenen Differenzspektren durchgeführt wird.

Das erfindungsgemäße Verfahren unterscheidet sich demnach von dem bekannten Verfahren im Wesentlichen durch einen zweiten Analyseschritt, bei dem das Probenspektrum mit Differenzspektren, die in noch näher zu beschreibender weise aus den synthetischen Referenzspektren berechnet werden, verglichen wird. Dieser zusätzliche Schritt bewirkt eine signifikante Steigerung der Sicherheit des Verfahrens und ermöglicht insbesondere auch die Unterscheidung stark verwandter Organismen.
Die Differenzspektren werden vorzugsweise durch Subtraktion zweier synthetischer Referenzspektren voneinander gebildet, wobei Signale, die in beiden der miteinander verrechneten Referenzspektren vorhanden sind, unabhängig von ihren Intensitäten vollständig eliminiert werden. Es kann weiterhin vorgesehen sein, Signale, die nach der Subtraktion in einem Differenzspektrum eines bekannten Mikroorganismus verbleiben, noch weiter zu selektieren und/oder zu gewichten. Dies kann etwa dadurch geschehen, dass ein Abgleich der verbleibenden Signale mit den natürlichen Massenspektren (Originalspektren) dieses Mikroorganismus und/oder mit den natürlichen Massenspektren des mit diesem verrechneten Mikroorganismus erfolgt. Insbesondere kann hierfür die Häufigkeit und/oder Intensität des Signals in den "eigenen" natürlichen Massenspektren überprüft werden. Darüber hinaus ist es von Vorteil, auch die Spezifität des Signals, das heißt die Häufigkeit und/oder Intensität des Signals in den natürlichen Spektren ("Fremdspektren") desjenigen Mikroorganismus zu analysieren, dessen synthetisches Referenzspektrum mit dem des betreffenden Mikroorganismus verrechnet wurde.
Um beispielsweise ein Differenzspektrum für Escherichia coli zu generieren, das die Diskriminierung von den schwer unterscheidbaren Shigellen erleichtert, wird das synthetische Referenzspektrum von Shigella sonnei von dem von E. coli subtrahiert, wobei nur Signale übrig bleiben, die im synthetischen Referenzspektrum von E. coli nicht aber in dem von S. sonnei vorhanden sind. Anschließend wird jedes verbleibende Signal hinsichtlich seiner Häufigkeit und/oder Intensität mit den Originalspektren von E. coli und hinsichtlich seiner Häufigkeit und/oder Intensität in den Originalspektren von S. sonnei untersucht. Ein Signal, das zwar häufig in den eigenen Original spektren ist, aber unspezifisch ist, weil es auch in den Fremdspektren von Shigella auftaucht, wird entweder ganz aus dem Differenzspektrum eliminiert oder für den zweiten Analyseschritt mit einer relativ geringen Gewichtung versehen. Ruf diese Weise entstehen Differenzspektren, die eine sehr sichere Unterscheidung eines Mikroorganismus von einem bestimmten anderen erlauben.
Es ist weiterhin besonders bevorzugt vorgesehen, als Ergebnis des ersten Analyseschrittes eine Anzahl von mit dem Probenspektrum ähnlichen synthetischen Referenzspektren zu ermitteln und die Ähnlichkeitsanalyse des zweiten Schrittes nur mit denjenigen Differenzspektren durchzuführen, die aus der Verrechnung der als ähnlich ermittelten synthetischen Referenzspektren erhalten wurden. Somit erfolgt in dem ersten Schritt eine Eingrenzung der in Frage kommenden Mikroorganismen, so dass im anschließenden zweiten Schritt nur noch ein Abgleich mit den Differenzspektren der als ähnlich ermittelten Organismen erfolgt. Hierdurch wird nicht nur ein enormer Zeitvorteil erlangt, sondern es werden auch Zufallstreffer reduziert, die aus nicht identischen Proteinen mit zufällig übereinstimmenden Massen resultieren. In diesem Zusammenhang kann es ferner sinnvoll sein, eine Datenbank zu verwenden, die von vornherein nur Differenzspektren von einander ähnlichen Mikroorganismen enthält.
Es ist vorgesehen, dass als Referenzspektren synthetische Massenspektren verwendet werden, die durch Zusammenfassung einer gegenüber "natürlichen" (nicht reduzierten) Massenspektren reduzierten Anzahl von für den jeweiligen Mikroorganismus spezifischen Signalen erzeugt werden. Durch die Reduzierung der Referenzspektren auf eine verhältnismäßig geringe Anzahl charakteristischer Signale, wird eine erhebliche Daten- und Informationsreduktion erreicht. Durch die Datenreduktion wird nicht nur Speicherplatz eingespart, sondern auch ein zeitlicher Aufwand für Datenübertragungen, so dass das Verfahren prinzipiell auch für eine Anwendung über vernetzte Datenverarbeitungsanlagen (zum Beispiel Internet) geeignet ist. Darüber hinaus ermöglicht die Informationsreduktion der Referenzspektren der Datenbank eine deutliche Beschleunigung der Ähnlichkeitsanalyse des Massenspektrums des zu identifizierenden Mikroorganismus mit den Referenzspektren, da die Analyse sich nunmehr auf einen Vergleich der in den Referenzspektren enthaltenen Signale beschränken kann.
Verglichen mit herkömmlichen Verfahren, in denen ein Probenspektrum des zu identifizierenden Organismus mit "natürlichen" Referenzspektren abgeglichen wird, ist eine Zuverlässigkeit des erfindungsgemäßen Verfahrens, das heißt die Wahrscheinlichkeit, eine korrekte Zuordnung des unbekannten Organismus zu treffen, deutlich erhöht. Hierin ist der bedeutendeste Vorteil des Verfahrens zu sehen. Die erhöhte Zuverlässigkeit ist durch die hohe Konzentrierung spezifischer Informationen in den synthetischen Referenzspektren zu erklären, die nicht durch Signale geringer Signifikanz oder Rauschen überdeckt wird. Auch bei einem möglichen Versagen bei einer Zuordnung auf Stammebene einer Probe, etwa weil kein Referenzspektrum dieses Stammes in der Datenbank verfügbar ist, liefert das Verfahren zuverlässige Identifizierungen auf übergeordneten Klassifizierungsebenen, beispielsweise auf Gattungs- oder Artenebene. Die Empfindlichkeit der erfindungsgemäßen Vorgehensweise wird auch nicht durch Unterschiede in verschiedenen Spektren beeinträchtigt, welche beispielsweise durch unterschiedliche Kultivierungsbedingungen, unterschiedliche Zellstadien oder abweichende Signal-Rauschverhältnisse verursacht werden.
Ein weiterer Vorteil des Verfahrens stellt die geringe erforderliche Probenmenge des zu identifizierenden Mikroorganismus dar, die in kürzeren Kultivierungszeiten erhältlich ist. Ferner können auch Mischkulturen analysiert werden, so dass auf die Anzucht von Reinkulturen verzichtet werden kann.
Die in den synthetischen Referenzspektren enthaltenen Signale können in zwei Kategorien unterschieden werden. Eine besonders vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Signale eines Referenzspektrums mindestens ein identifiziertes Signal umfassen, welches einem charakterisierten molekularen Zellbestandteil des jeweiligen Mikroorganismus eindeutig zugeordnet wurde. Zur Identifizierung eines Mikroorganismus geeignete Zellbestandteile sind beispielsweise bestimmte Peptide, Proteine, Ribonukleinsäuren und/oder Lipide. Es hat sich insbesondere für Bakterien als vorteilhaft erwiesen, eine Signalzuord nung eines ribosomalen Proteins, insbesondere eines Proteins der großen Ribosomenuntereinheit, vorzunehmen. Für Bakterien sind dies Proteine der so genannten 50S-Untereinheit und bei Pilzen die 60S-Untereinheit. Proteine stellen einen Hauptbestandteil mikrobieller Zellen dar. Dies gilt insbesondere für Ribosomenproteine, die unabhängig von einem Entwicklungsstadium der Zelle, einem Nährstoffangebot oder sonstiger Kultivierungsbedingungen ständig präsent sind und somit zuverlässige Signale in den Massenspektren darstellen. Hinzu kommt, dass Aminosäuresequenzen analoger Proteine unterschiedlicher Spezies oder sogar unterschiedlicher Stämme sich zumindest geringfügig voneinander unterscheiden. Folglich weisen die analogen Proteine unterschiedliche Massen auf und eignen sich für deren Unterscheidung. So gelang den Erfindern beispielsweise erstmalig die Zuordnung von vier Massensignalen in dem Massenspektrum von Escherichia coli (m/z = 4365, 5381, 7276 und 5096) zu den Proteinen L36, L34 und L29 der großen 50S-Ribosomenuntereinheit beziehungsweise zu dem Protein 522 der kleinen 30S-Untereinheit. Diese Signale sind ständige Bestandteile in Massenspektren von E. coli, nicht jedoch vieler anderer Mikroorganismen. Sie sind daher besonders zur Identifizierung von Escherichia coli und zur Aufnahme in ein synthetisches Referenzspektrum für E. coli geeignet. Im Falle von Pilzen haben sich überdies ganz besonders Strukturproteine, insbesondere Hydrophobine zur Identifizierung bewährt.
In einer weiteren Ausbildung der vorliegenden Erfindung ist vorgesehen, dass die Signale eines synthetischen Referenzspektrums als zweite Signalkategorie mindestens ein empirisches Signal umfassen, welches durch Vergleich einer Vielzahl von Massenspektren bekannter Mikroorganismen als spezifisch für einen Mikroorganismus ermittelt wurde. Dabei handelt es sich um Signale, deren Ursprung, das heißt deren verursachende molekulare Zellkomponente, zwar nicht bekannt ist, die jedoch aufgrund bestimmter Kriterien als charakteristisch für einen Mikroorganismus gewertet werden. Vorzugsweise umfassen diese Kriterien eine vorgebbare Mindest-Häufigkeit für das Auftreten eines Signals in einer Anzahl von Massenspektren desselben Mikroorganismus sowie eine vorgebbare durchschnittliche Mindest-Intensität des Signals. Dabei sollte die Mindest-Häufigkeit mindestens 50 %, insbesondere mindestens 70 %, vorzugsweise mindestens 90 %, betragen. Zusätzlich wird die Spezifität des Signals überprüft, das heißt die Häufigkeit, mit der das Signal. in den natürlichen Massenspektren anderer Mikroorganismen auftaucht, wobei das Auftreten in den Fremdspektren möglichst selten sein sollte. Die Ermittlung der empirischen Signale durch Vergleich gemessener Massenspektren kann visuell, vorzugsweise jedoch computergestützt, durchgeführt werden. Entsprechende Algorithmen (Mustererkennungsverfahren) sind bekannt und sollen hier nicht näher erläutert werden. Darüber hinaus ist es denkbar, auch die identifizierten Signale einer nachträglichen Kontrolle durch Anwendung dieser Kriterien zu unterziehen.
Die Anzahl der Signale eines Referenzspektrums kann in einem Rahmen von 1 bis 50 liegen und beträgt vorteilhafterweise 5 bis 30. In vielen Fällen hat sich insbesondere eine Anzahl von 10 bis 15 als ausreichend erwiesen. Es ist ferner bevorzugt vorgesehen, dass ein Signal eines synthetischen Referenzspektrums durch lediglich ein Koordinatenpaar repräsentiert wird. Dabei besteht das Koordinatenpaar aus einer Masse beziehungsweise einem Masse-Ladungs-Verhältnis als x-Koordinate einerseits und einer absoluten oder relativen Intensität als y-Koordinate andererseits. Verglichen mit "natürlichen" Massenspektren, die mehrere 1000 Datenpunkte enthalten, bedeutet dies eine erhebliche Datenreduktion.
Für den Abgleich eines Probespektrums mit den synthetischen Referenzspektren der Datenbank können vorteilhafterweise den einzelnen identifizierten und empirischen Signalen der Referenzspektren Gewichtungen entsprechend ihrer Signifikanz zugeordnet werden, wobei auf die oben genannten Kriterien, das heißt Häufigkeit/Intensität in den eigenen Spektren und in denen der anderen Referenzorganismen, zurückgegriffen werden kann. Wenn diese Gewichtung bereits auf Stufe der synthetischen Referenzspektren vorgenommen wird, kann auf eine entsprechende Selektion und/oder Gewichtung der Signale der Differenzspektren unter Umständen verzichtet werden.
Die Erfindung umfasst ferner eine Datenbank zur Durchführung eines Verfahrens sowie ihre Verwendung für die Identifizierung von Mikroorganismen mittels Massenspektrometrie. Die erfindungsgemäße Datenbank umfasst

(a) synthetische Referenzspektren bekannter Mikroorganismen, beinhaltend eine gegenüber natürlichen Massenspektren reduzierte Anzahl von für den jeweiligen Mikroorganismus spezifischen Signalen, sowie
(b) Differenzspektren, resultierend aus einer Verrechnung jeweils zweier synthetischer Referenzspektren der bekannten Mikroorganismen.

Darüber hinaus kann es von Vorteil sein, auch die natürlichen Referenzspektren (Originalspektren) in der Datenbank zu enthalten.
Das erfindungsgemäße Verfahren lässt sich besonders vorteilhaft mit der MALDI-TOF-Massenspektrometrie durchführen. Entsprechend sind alle verwendeten Massenspektren vorzugsweise MALDI-TOF-Massenspektren.
Die Erfindung wird nachfolgend in Ausführungsbeispielen anhand der zugehörigen Zeichnungen näher erläutert. Es zeigen:
1 ein Ablaufschema des Verfahrens zur Erzeugung einer erfindungsgemäßen Datenbank;
2 MALDI-TOF-Massenspektren (Originalspektren) von Escherichia coli und von isolierten Ribosomen aus Escherichia coli;
3 bis 8 synthetische Referenzspektren verschiedener Bakterien, insbesondere für zwei Escherichia coli-Stämme, zwei Klebsiella-Spezies, Pseudomonas aeruginosa und Staphylococcus aureus;
9 ein synthetisches Referenzspektrum des Pilzes Trichoderma reesei;
10a–10d eine Erzeugung zweier Differenzspektren;
11 eine Struktur der erfindungsgemäßen Datenbank; und
12 ein Ablaufschema des Verfahrens zur Identifizierung eines Mikroorganismus.
1 zeigt in einem Fließschema einen typischen erfindungsgemäßen Verfahrensablauf. In einem ersten Schritt S1 wird eine möglichst große Anzahl von natürlichen Referenzspektren REF_N, das heißt Originalspektren bekannter Mikroorganismen, gemessen. In diesem Zusammenhang werden im Folgenden einige Details zur Probenvorbereitung und zur Datenakquisition gegeben.
Probenvorbereitung und MALDI-TOF-Datenakquisition
Für eine MALDI-TOF-Analyse werden zirka 5 bis 100 μg Nasszellen oder auch 5 bis 50 μg getrocknete Zellen eines bekannten oder zu identifizierenden Bakteriums oder Pilzes benötigt. Eine Vorbehandlung der Zellen, beispielsweise ein Zellaufschluss, ist nicht notwendig. Die Nasszellen können direkt von einer AGAR-Kultur mit einer sterilen Impföse auf eine auch Template genannte Probenplatte übertragen werden. Alternativ können auch abzentrifugierte Zellen einer Flüssigkultur verwendet werden. Anschließend werden die Zellen auf der Probenplatte mit 0,2 bis 1 μl einer Matrixlösung vermischt. In Abwandlung von dieser Prozedur können die Nasszellen auch vor ihrer Übertragung auf die Probenplatte mit der Matrixlösung vermischt und als Suspension übertragen werden. Für die folgenden Messungen wurde eine Matrixlösung aus 100 mg/ml 2,5-Dihydroxybenzoesäure in einer Mischung aus 50 % Acetonitril und 50 % Wasser mit 3 % Trifluoressigsäure verwendet. Andere bekannte Matrixlösungen sind ebenfalls geeignet. Nach Trocknung der Probe, die mit einer Kristallbildung einhergeht, kann die Probe direkt einer MALDI-TOF-massenspektrometischen Analyse unterworfen werden. Für die vorliegenden Messungen wurde jeder Probenpunkt einer Probenplatte in einem herkömmlichen Massenspektrometer mit zirka 50 bis 300 Laserpulsen eines Stickstoff-Lasers mit einer Wellenlänge von 337 nm angeregt. Die Akquisition positiver Ionenmassenspektren erfolgte im Linearmessmodus in einem Massenbereich von 2000 bis 20000 m/z. Ein typisches Beispiel eines auf diese Weise erhaltenen positiven MALDI-TOF-Massenspektrums REF von Escherichia coli ist im oberen Teil der 2 im Massenbereich von zirka m/z = 4000 bis 14000 dargestellt.
Im anschließenden Verfahrensschritt S2 (1) wird eine Zuordnung von Signalen (Peaks) zu bestimmten molekularen Zellbestandteilen durchgeführt. Eine mögliche Vorgehensweise, die auf bekannte Methoden der Biochemie und Molekularbiologie zurückgreift, wird im Folgenden am Beispiel von Ribosomenproteinen der großen Ribosomenuntereinheit kurz erläutert.
Identifizierung unbekannter Signale
Ein Proteinextrakt einer Zellkultur wird mittels einer 2D-Gelelektrophorese aufgetrennt. In Frage kommende so genannte Proteinspots werden anschließend einem tryptischen Verdau, bei dem das Protein enzymatisch in kleine Proteinbruchstücke gespaltet wird, unterzogen. Sofern Antikörper gegen Ribosomen vorhanden sind, können die relevanten Proteinspots auch durch ein Immunoassay (zum Beispiel Western-Blot-Analyse) erkannt werden. Die durch den tryptischen Verdau gewonnenen Proteinbruchstücke werden dann mittels einer HPLC aufgetrennt und ansequenziert oder direkt einer so genannten Peptidmassen-Fingerprint-Identifizierung mit anschließender PSD (post source decay) unterzogen. Mit den auf diese Weise ermittelten Sequenzbruchstücken kann dann versucht werden, die Ribosomengene in einer Datenbank zu identifizieren. Sind entsprechende Gene in der Datenbank vorhanden, kann aus der gesamten Gensequenz die korrespondierende Proteinmasse ermittelt werden. Kann ein entsprechendes Gen in der Datenbank nicht gefunden werden, so muss mit bekannten Mitteln der Molekular biologie, die hier nicht näher ausgeführt werden sollen, das gesamte Gen, welches für das entsprechende ribosomale Protein kodiert, isoliert und sequenziert werden. Ist die Gensequenz bekannt, folgt die Übersetzung in die Proteinsequenz und Ermittlung der theoretischen Proteinmasse. Eine Überprüfung dieser theoretischen Masse kann erfolgen, indem der entsprechende Proteinspot der 2D-Gelelektrophorese einer MALDI-TOF-Massenspektrometrie unterworfen wird. Bei Abweichungen von der theoretischen Proteinmasse können Modifikationen des Proteins durch MALDI-TOF-Analyse des tryptischen Verdaus festgestellt werden.
Zur Verdeutlichung ist in der 2 im unteren Teil ein Massenspektrum des 70S-Ribosomens aus Escherichia coli, das mittels 2D-Gelelektrophorese isoliert wurde, dargestellt. Mit 70S wird der gesamte Ribosomen eines Proteins bezeichnet, der sich aus der großen SOS-Untereinheit und der kleinen 30S-Untereinheit zusammensetzt. Beide Untereinheiten bestehen ihrerseits aus einer Reihe von Proteinen, die mit dem Buchstaben L (für large) und dem Buchstaben S {für small) bezeichnet werden. Es ist ohne weiteres ersichtlich, dass eine Reihe der intensivsten Signale aus dem Spektrum von Escherichia coli ATCC 25922(vergleiche 2 oberer Teil) sich auf ribosomale Proteine zurückführen lässt. Entsprechende Signale sind in der Abbildung mit Pfeilen gekennzeichnet. Den Erfindern ist es erstmalig gelungen, drei dieser Signale bestimmten Proteinen der großen 50S- und ein Signal einem Protein der kleinen 30S-Ribosomenuntereinheit zuzuordnen. Dabei handelt es sich um die Proteine L29, L34, L36 und S22 mit den Massen m/z = 7274, 5381, 4365 beziehungsweise 5096. Da insbesondere die Signale der großen Untereinheit mit einer hohen Zuverlässigkeit in den Massenspektren von Escherichia coli auftauchen, sind sie besonders zur Identifizierung geeignet. Sie wurden als identifizierte Signale S_id für das synthetische Referenzspektrum REF_S für Escherichia coli verwendet.
In einem alternativen oder zusätzlichen Schritt S3 (1) werden empirische Signale S_em aus den gemessenen Referenzspektren REF_N der bekannten Mikroorganismen ermittelt. Die Ermittlung der empirischen Signale S_em erfolgt durch Vergleich einer Vielzahl von Massenspektren REF_N, die von demselben Stamm aufgezeichnet wurden, untereinander sowie durch Vergleich mit denen von anderen Organismen. Dabei werden solche Signale als charakteristisch für einen Mikroorganismus ermittelt, die möglichst häufig in den Massenspektren desselben Organismus auftauchen und möglichst selten in den Massenspektren eines anderen. Für die Häufigkeit eines Auftretens eines geeigneten empirischen Signals S_em kann dabei ein Mindest-Wert, beispielsweise > 70 % bezogen auf alle Spektren eines Organismus, vorgegeben werden. Ebenso sollte ein solches Signal eine vorgebbare Mindest-Intensität besitzen, um seine Unterscheidung von dem Untergrundrauschen zu erleichtern. Die Ermittlung der empirischen Signale S_em im Schritt S3 kann zwar prinzipiell durch visuellen Spektrenvergleich durch den Anwender erfolgen. Es ist jedoch bevorzugt vorgesehen, diesen Schritt automatisiert mit Hilfe geeigneter Rechner programme durchzuführen. Hier kommt etwa ein Algorithmus in Frage, welcher die gemessenen natürlichen Referenzspektren REF_N hinsichtlich der genannten Kriterien untersucht. Es sind jedoch auch, beispielsweise aus der Infrarotspektrometrie, computergestützte Verfahren bekannt, die unter Anwendung statistischer Algorithmen in der Lage sind, wiederkehrende Signale zu erkennen und herauszufiltern.
Die in den Schritten S2 und S3 ermittelten identifizierten und empirischen Signale S_id, S_em werden in einem anschließenden Schritt S4 zu synthetischen Referenzspektren REF_S zusammengefasst. Dabei wird für jeden bekannten Mikroorganismus ein Referenzspektrum REF_S erzeugt.
In den 3 bis 9 sind beispielhaft derartige synthetische Referenzspektren REF_S für zwei Escherichia coli-Stämme (ATCC 25922 und ATCC 35218), zwei Klebsiella-Spezies – nämlich Klebsiella oxycoca und Klebsiella pneumoniae –, für Pseudomonas aeruginosa, Staphylococcus aureus sowie für den Pilz Trichoderma reesei dargestellt. Dabei ist jeweils im oberen Teil jeder der 3 bis 9 das synthetische Referenzspektrum REF_S in Koordinatenform dargestellt (teilweise unter Verzicht der y-Koordinaten), während im unteren Teil jeweils die graphische Repräsentation in der typischen Form von Massenspektren abgebildet ist. Die synthetischen Referenzspektren REF_S umfassen in den gezeigten Beispielen zehn bis fünfzehn Signale S, im Falle des Pilzes T. reesei fünf. In den Referenzspektren REF_S von Escherichia coli (3 und 4) und von Pseudomonas aeruginosa (7) sind die als Proteine der großen 50S-Ribosomenuntereinheit identifizierten Signale S_id markiert. Dabei konnten für E. coli und für P. aeruginosa jeweils die den Proteinen L29, L34 und L36 der großen Untereinheit zugehörigen Signale identifiziert werden sowie für P. aeruginosa zusätzlich das dem Protein L33 zugehörige Signal. Im Falle von E. Coli ATCC 25922 (3) konnte ferner ein Signal dem Protein S22 der kleinen 30S-Ribosomenuntereinheit zugeordnet werden.
Die Unterscheidung der beiden Escherichia coli-Stämme untereinander (3 und 4) wird hauptsächlich durch solche empirische Signale S_em ermöglicht, die nur bei einem von beiden Stämmen beobachtet werden. Ein Vergleich der in den 3 und 4 gezeigten synthetischen Referenzspektren REF_S zeigt, dass das erfindungsgemäße Verfahren empfindlich genug ist, um eine Unterscheidung von Mikroorganismen sogar auf Stammniveau zu ermöglichen. Daneben wird auch eine Unterscheidung zwischen Escherichia coli einerseits und Klebsiella-Spezies (5 und 6) andererseits ermöglicht.
Das in 8 dargestellte Beispiel von Staphylococcus aureus zeigt, dass auch andere als Ribosomenproteine identifiziert und zur Bestimmung des Organismus herangezogen werden können. In diesem Fall konnte ein Signal einem formylierten Peptidfragment des Delta-Toxins (Delta-Hemolysin) zugeordnet werden, das äußerst charakteristisch für dieses Bakterium ist.
Im Falle von Pilzen haben sich neben ribosomalen Proteinen insbesondere auch die hydrophoben Strukturproteine Hydrophobine als vorteilhaft zur Identifizierung des Mikroorganismus erwiesen. So konnten für den Pilz Trichoderma reesei (9) drei Signale des Spektrums den Proteinen Hydrophobin I und II beziehungsweise einem Fragment von Hydrophobin II zugeordnet werden. Diese identifizierten Signale S_id können sowohl zur Abgrenzung gegenüber Bakterien, die keine Hydrophobine besitzen, als auch zur Differenzierung verschiedener Pilze untereinander herangezogen werden.
Weiter in 1 werden anschließend an die Erzeugung der synthetischen Referenzspektren REF_S in dem Schritt S5 durch Verrechnung jeweils zweier Referenzspektren REF_S Differenzspektren DIF erzeugt. Dieser Schritt ist in den 10a bis 10d anhand von fiktiven synthetischen Referenzspektren zweier eng verwandter Organismen, hier der Gattung 1 und der Gattung 2 (10a und 10b), verdeutlicht. Vorzugsweise wird dieser Schritt nur für einander sehr ähnliche Organismen durchgeführt, wobei die resultierenden Differenzspektren DIF die Unterscheidung genau dieser Organismen erleichtern.
Die Verrechnung der Referenzspektren REF_S erfolgt durch Subtraktion eines Referenzspektrums REF_S von dem jeweils anderen, wobei ein Signal, welches in beiden Referenzspektren REF_S vorhanden ist, unabhängig von den Intensitäten eliminiert wird. Auf diese Weise verbleiben in dem Differenzspektrum DIF₁ _–2 von Gattung 1 nur Signale, die nicht im Referenzspektrum REF_S _,2 von Gattung 2 vorhanden sind und umgekehrt. 10c zeigt das um Gattung 2 "bereinigte" Differenzspektrum für Gattung 1 DIF_1–2 und 10d das Differenzspektrum für Gattung 2 DIF_2–1 nach "Subtraktion" von Gattung 1. Selbstverständlich müssen bei der Verrechnung zweier Signale etwaige geräte- und messspezifische Toleranzen der Massen berücksichtigt werden, so dass im Ergebnis auch Signale S entfernt werden, die sich etwa um eine Massenzahl unterscheiden.
Signale, die nach der Subtraktion in den jeweiligen Differenzspektren DIF₁ _–2, DIF_2–1 verbleiben, können einer weiteren Selektion unterworfen werden. Beispielsweise kann für das Spektrum DIF_1–2 überprüft werden, wie häufig das Signal bei der Masse 5.500 in den natürlichen Originalspektren von Gattung 1 (REF_N _,1, nicht dargestellt) auftaucht und wie häufig in den Originalspektren von Gattung 2 (REF_N _,2, nicht dargestellt). Dabei wird ein Signal um so eher eliminiert, je seltener es in den natürlichen Eigenspektren und je häufiger in den natürlichen Fremdspektren auftaucht, wobei auch Intensitäten entsprechend berücksichtigt werden können.
Die in Schritt S4 (1) erzeugten synthetischen Referenzspektren REF_S sowie die in Schritt S5 erzeugten Differenzspektren DIF werden in einem anschlie ßenden Schritt S6 zu einer Datenbank DB zusammengefasst. Innerhalb der Datenbank DB können die synthetischen Referenzspektren REF_S in logischer Weise, beispielsweise nach Familie, Gattung, Art und Stamm, geordnet werden. Ferner kann die Datenbank DB eine Statistik umfassen, die wiedergibt, wie sich ein Signal S bei der Erstellung der synthetischen Referenzspektren REF_S und/oder den Differenzspektren DIF hinsichtlich Häufigkeit und Spezifität bewährt hat. Diese Statistik kann beispielsweise der Gewichtung der Signale S bei der Identifizierung unbekannter Organismen dienen.
Der Aufbau der erfindungsgemäßen Datenbank DB ist in 11 dargestellt. Die Datenbank umfasst (optional) natürliche Referenzspektren REF_N, wobei für jeden Organismus i, j, k und so weiter eine Vielzahl von Referenzspektren REF_N vorhanden sind. Die Datenbank DB beinhaltet ferner für jeden bekannten Organismus aus den jeweiligen natürlichen Referenzspektren REF_N ermittelte synthetische Referenzspektren REF_S, die aus wenigen diskreten (identifizierten und/oder empirischen) Signalen S bestehen. Schließlich umfasst die Datenbank DB Differenzspektren DIF, die aus jeweils zwei synthetischen Referenzspektren REF_S zweier Mikroorganismen ermittelt wurden. Dabei hat sich als ausreichend erwiesen, nur Differenzspektren DIF von solchen Organismen zu erstellen, die einander stark ähneln und daher erfahrungsgemäß schwer massenspektrometrisch zu unterscheiden sind.
Der Verfahrensablauf von S1 bis S6 gemäß 1, das heißt die Erstellung der Datenbank DB, muss prinzipiell nur einmal durchgeführt werden. Auf diese Datenbank DB kann dann in dem erfindungsgemäßen Identifizierungsprozess immer wieder zurückgegriffen werden. Selbstverständlich kann und sollte die Datenbank DB aber ständig durch Referenzspektren REF_S und/oder Differenzspektren DIF weiterer Mikroorganismen erweitert und aktualisiert werden. So ist etwa denkbar, Referenzspektren REF_S von Mutanten, insbesondere solchen mit verändertem Resistenz- und/oder Virulenzverhalten, aufzunehmen, sofern diese Stämme charakteristische Signale liefern. Auch sollten auf Basis statistischer Auswertung der analysierten Proben die vorhandenen Referenzspektren REF_S laufend optimiert werden, beispielsweise durch die Aufnahme neuer Signale S_id, S_em und/oder durch Löschung von Signalen.
Der Ablauf des eigentlichen Identifizierungsverfahrens unter Verwendung der beschriebenen Datenbank DB ist in 12 erläutert. In dem Schritt S7 erfolgt die Akquisition eines Massenspektrums SAM eines zu identifizierenden Mikroorganismus. Vorteilhafterweise wird dieses Probenspektrum SAM unter möglichst identischen Messbedingungen, insbesondere gleicher Matrix, wie die natürlichen Referenzspektren REF_N gemessen.
Nachfolgend (Schritt S8) erfolgt in einem ersten Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums SAM mit den in der Datenbank DB enthaltenen synthetischen Referenzspektren REF_S, wobei das Pro benspektrum mit jedem Referenzspektrum REF_S verglichen wird. Dieser Spektrenabgleich kann visuell nach bestimmten vorgegebenen Kriterien, vorzugsweise jedoch computergestützt, erfolgen. Dabei kann prinzipiell auf die gleichen oder ähnliche Algorithmen zurückgegriffen werden, die bereits in Schritt S3 zur Ermittlung der empirischen Signale S_em Anwendung fanden. Durch die Einfachheit der verwendeten Referenzspektren REF_S kann der Spektrenabgleich in Schritt S8 auch mit sehr einfachen Algorithmen durchgeführt werden, die sich lediglich auf einen Vergleich der Signale S_id, S_em der synthetischen Referenzspektren REF_S mit dem Probenspektrum SAM beschränken. Selbstverständlich müssen hier Toleranzkriterien vorgegeben werden, die festlegen, um wie viel ein in Frage kommendes Signal S_id, S_em des Probenspektrums SAM hinsichtlich der Masse und/oder der Intensität abweichen darf, um als übereinstimmend gewertet zu werden. Außerdem können an dieser Stelle die in der Statistik enthaltenen Gewichtungen der einzelnen Signale S einfließen, wobei ein Signal S umso entscheidender für eine positive Identifizierung ist je öfter und intensiver es in den natürlichen Eigenspektren und je seltener und schwächer es in den natürlichen Fremdspektren vorhanden ist. Ferner kann eine Mindest-Anzahl übereinstimmender Signale für eine positive Identifizierung vorgegeben werden.
Im Schritt S9 erfolgt eine Ausgabe eines ersten Resultats REST. Dieses kann entweder darin bestehen, dass bereits eine eindeutige Übereinstimmung des Probenspektrums SAM mit einem der Referenzspektren REF_S erkannt wurde, mit der Folge, dass das Verfahren an dieser Stelle bereits beendet ist. Weist das Probenspektrum SAM hingegen Ähnlichkeit mit mehr als einem synthetischen Referenzspektrum REF_S auf, so wird als Ergebnis REF1 eine Anzahl der in Frage kommenden Mikroorganismen ausgegeben. In diesem Fall schließt in Schritt S10 als zweiter Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums SAM mit in der Datenbank DB enthaltenen Differenzspektren DIF an. Wird in Schritt 58 beispielsweise eine hohe Ähnlichkeit mit den Referenzspektren REF_S der Organismen i und k festgestellt, so erfolgt in Schritt S10 ein Abgleich des Probenspektrums SAM mit den zwischen diesen Organismen erzeugten Differenzspektren DIF_i–k und DIF_k–i (vergleiche 11) . Der erfindungsgemäße zweite Analyseschritt erlaubt somit eine sichere Zuordnung eines unbekannten Organismus zu einem Organismus aus einer Gruppe einander sehr ähnlicher Organismen.
Als Endergebnis RES2 wird in Schritt S11 der mit dem Probenspektrum SAM als übereinstimmend ermittelte Mikroorganismus ausgegeben. Ferner kann auch eine Information über den Grad der Übereinstimmung ausgegeben werden. Handelt es sich – wie häufig der Fall – bei der Probe des unbekannten Organismus um eine Mischkultur, so ermöglicht das Verfahren sogar die Identifizierung mehrerer, nebeneinander vorliegender Mikroorganismen. In einem solchen Fall werden als Ergebnis mehrere Treffer ausgegeben. Stimmt das Probenspektrum SAM mit keinem der synthetischen Referenzspektren REF_S innerhalb der zugelassenen Toleran zen überein, das heißt, der unbekannte Mikroorganismus ist nicht in der Datenbank DB enthalten, so ist auch dieses ein ausgebbares Resultat.
In bestimmten Fällen, in denen ein Mikroorganismus nicht oder nicht eindeutig identifiziert werden kann, kann vorteilhaft vorgesehen sein, dass im Anschluss an den Schritt S11 ein zusätzlicher Direktvergleich mit den gemessenen "natürlichen" Referenzspektren REF_N durchgeführt wird. Dieses Vorgehen entspricht der bekannten Vorgehensweise zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS und erfordert eine Datenbank DB, die neben den Synthetischen Referenzspektren REF_S und den Differenzspektren DIF auch die natürlichen Referenzspektren REF_N umfasst.
Durch die Einfachheit und den konzentrierten Informationsgehalt der synthetischen Referenzspektren REF_S zeichnet sich das erfindungsgemäße gegenüber bekannten Verfahren durch eine wesentlich höhere Zuverlässigkeit aus, die durch den zweiten Analyseschritt noch weiter erhöht wird.

S1: Messung von Referenzspektren
S2: Signalidentifizierung
S3: Ermittlung empirischer Signale
S4: Erzeugung eines synthetischen Referenzspektrums
S5: Erzeugung von Differenzspektren
S6: Datenbankerstellung
S7: Erfassung eines Probenspektrums
S8: Abgleicht Probenspektrum/synthetische Referenz
: spektren
S9: Ergebnisausgabe 1
S10: Abgleicht Probenspektrum/Differenzspektren
S11: Ergebnisausgabe 2
DB: Datenbank
DIF: Differenzspektrum
REF_N: natürliches Referenzspektrum
REF_S: synthetisches Referenzspektrum
RES1: Ergebnis des ersten Analyseschrittes
RES2: Ergebnis des zweiten Analyseschrittes
SAM: Probenspektrum
S_id: identifiziertes Signal
S_em: empirisches Signal

Claims

Verfahren zur Identifizierung von Mikroorganismen mittels Massenspektrometrie, wobei (a) eine Datenbank (DB) verwendet wird, umfassend – synthetische Referenzspektren (REF_S) bekannter Mikroorganismen, welche durch Zusammenfassung einer gegenüber natürlichen Massenspektren (REF_N) reduzierten Anzahl von für den jeweiligen Mikroorganismus spezifischen Signalen (S) gebildet werden, sowie – Differenzspektren (DIF), welche durch Verrechnung jeweils zweier synthetischer Referenzspektren (REF_S) der bekannten Mikroorganismen gebildet werden, (b) in einem ersten Analyseschritt eine Ähnlichkeitsanalyse eines Probenmassenspektrums (SAM) eines zu identifizierenden Mikroorganismus mit den in der Datenbank (DB) enthaltenen synthetischen Referenzspektren (REF_S) durchgeführt wird und (c) in einem zweiten Analyseschritt eine Ähnlichkeitsanalyse des Probenspektrums (SAM) mit wenigstens einem Teil der in der Datenbank (DB) enthaltenen Differenzspektren (DIF) durchgeführt wird.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Differenzspektren (DIF) durch Subtraktion zweier synthetischer Referenzspektren (REF_S) gebildet werden derart, dass Signale (S), die in beiden der miteinander verrechneten Referenzspektren (REF_S) vorhanden sind, intensitätsunabhängig eliminiert werden.
Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass Signale (S), die nach der Subtraktion in einem Differenzspektrum (DIF) eines bekannten Mikroorganismus verbleiben, durch Abgleich mit den natürlichen Massenspektren (REF_N) dieses Mikroorganismus und/oder mit den natürlichen Massenspektren (REF_N) des mit diesem verrechneten Mikroorganismus selektiert und/oder gewichtet werden.
Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Selektion und/oder Gewichtung der Signale (S) des Differenzspektrums (DIF) in Abhängigkeit ihrer Häufigkeit und/oder Intensität in den natürlichen Massenspektren (REF_N) des betreffenden Mikroorganismus und/oder in Abhängigkeit ihrer Häufigkeit und/oder Intensität in den natürlichen Massenspektren (REF_N) des mit diesem Mikroorganismus verrechneten Mikroorganismus selektiert werden.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass als Ergebnis des ersten Analyseschrittes eine Anzahl von mit dem Probenspektrum (SAM) ähnlichen synthetischen Referenzspektren (REF_S) ermittelt wird und die Ähnlichkeitsanalyse des zweiten Schrittes nur mit denjenigen Differenzspektren (DIF) durchgeführt wird, die aus der Verrechnung der als ähnlich ermittelten synthetischen Referenzspektren (REF_S) erhalten wurden.
Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die Datenbank (DB) nur Differenzspektren (DIF) von Mikroorganismen umfasst, die einander ähnelnde synthetische Referenzspektren (REF_N) aufweisen.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Signale (S) eines synthetischen Referenzspektrums (REF_S) mindestens ein identifiziertes Signal (S_id) umfassen, welches einem bestimmten molekularen Zellbestandteil des jeweiligen Mikroorganismus zugeordnet wurde.
Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der Zellbestandteil ein Peptid, ein Protein, eine Ribonukleinsäure und/oder ein Lipid ist.
Verfahren nach einem der Ansprüche 7 oder 8 , dadurch gekennzeichnet, dass der Mikroorganismus ein Bakterium und der Zellbestandteil ein ribosomales Protein ist.
Verfahren nach einem der Ansprüche 7 oder 8, dadurch gekennzeichnet, dass der Mikroorganismus ein Pilz und der Zellbestandteil ein Strukturprotein, insbesondere ein Hydrophobin, und/oder ein ribosomales Protein ist.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Signale (S) eines synthetischen Referenzspektrums (REF_S) mindestens ein empirisches Signal (S_em) umfassen, welches durch Vergleich von Massenspektren bekannter Mikroorganismen als spezifisch für einen Mikroorganismus ermittelt wurde.
Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass der Vergleich visuell und/oder computergestützt durchgeführt wird.
Verfahren nach einem der Ansprüche 11 oder 12, dadurch gekennzeichnet, dass als Kriterien zur Ermittlung eines empirischen Signals (S_em) eine vorgebbare Mindest-Häufigkeit für ein Auftreten des Signals in einer Anzahl von Massenspektren desselben Mikroorganismus und eine vorgebbare Mindest-Intensität des Signals vorgegeben werden.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein Signal (S) durch ein Koordinatenpaar, bestehend aus einer Ma_sse (m) oder einem Masse-Ladungsverhältnis (m/z) als x-Koordinate und einer absoluten oder relativen Intensität als y-Koordinate, repräsentiert wird.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Anzahl der Signale (S) eines synthetischen Referenzspektrums (REF_S) 1 bis 50, insbesondere 5 bis 30, beträgt.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Aufnahme der Massenspektren von nicht vorbehandelten Zellen durchgeführt wird.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Ähnlichkeitsanalyse des Massenspektrums (SAM) des zu identifizierenden Mikroorganismus mit den in der Datenbank (DB) enthaltenen Referenzspektren (REF_S) sich auf einen Vergleich der in den Referenzspektren (REF) enthaltenen Signale (S) beschränkt.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Ähnlichkeitsanalyse des Massenspektrums (SAM) des zu identifizierenden Mikroorganismus mit den in der Datenbank (DB) enthaltenen Differenzspektren (DIF) sich auf einen Vergleich der in den Differenzspektren (DIF) enthaltenen Signale (S) beschränkt.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass für die Ähnlichkeitsanalyse den in den Referenzspektren (REF_S) enthaltenen Signalen (S) Gewichtungen zugeordnet werden.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass alle Massenspektren mit MALDI-TOF-MS aufgenommen werden.
Datenbank (DB), zur Durchführung eines Verfahrens nach einem der Ansprüche 1 bis 20, umfassend (a) synthetische Referenzspektren (REF_S) bekannter Mikroorganismen, beinhaltend eine gegenüber natürlichen Massenspektren (REF_N) reduzierte Anzahl von für den jeweiligen Mikroorganismus spezifischen Signalen (S), sowie (b) Differenzspektren (DIF), resultierend aus einer Verrechnung jeweils zweier synthetischer Referenzspektren (REF_S) der bekannten Mikroorganismen.
Datenbank (DB) nach Anspruch 21 ferner umfassend (c) für jeden bekannten Mikroorganismus eine Anzahl natürlicher Massenspektren (REF_N).
Datenbank (DB) nach Anspruch 22, dadurch gekennzeichnet, dass die Anzahl mindestens 10 beträgt.
Datenbank (DB) nach einem der Ansprüche 21 bis 23, dadurch gekennzeichnet, dass die natürlichen Massenspektren (REF_N) MALDI-TOF-Massenspektren sind.
Verwendung einer Datenbank nach einem der Ansprüche 21 bis 24 für die Identifizierung von Mikroorganismen mittels Massenspektrometrie, insbesondere mit MALDI-TOF-MS.