-
QUERVERWEIS AUF VERWANDTE ANMELDUNGEN
-
Die vorliegende Anmeldung beansprucht den Vorteil der provisorischen U.S.-Patentanmeldung Nr. 61/500,525, eingereicht am 23. Juni 2011, die durch Verweis hierin eingegliedert ist.
-
GEBIET DER ERFINDUNG
-
Die vorliegende Erfindung betrifft das Gebiet der Identifizierung von Proteinen und Peptiden, und spezifischer das Sequenzieren einzelner Peptide in einer Mischung verschiedener Peptide im großen Maßstab auf der Einzelmolekülebene.
-
HINTERGRUND DER ERFINDUNG
-
Die Entwicklung von Next-Generation-DNS-Sequenzierverfahren zur schnellen Gewinnung von Genom- und Genexpressionsinformation hat die Biologie umgewandelt. Die Grundlage von Next-Generation-DNS-Sequenzierung ist die parallele Gewinnung großer Zahlen (Millionen) von kurzen Auslesungen (typischerweise 35–450 Nukleotide). Während Nukleinsäuremutationen häufig die Grundlage von Krankheiten sind, werden diese Veränderungen am ehesten durch Proteine verkörpert, die in verschiedenen Körperkompartimenten (d. h. Speichel, Blut, Urin) exprimiert werden, die ohne invasive Prozeduren wie etwa Biopsien zugänglich sind. Leider bleibt ein ähnliches Hochdurchsatzverfahren für die Identifizierung und Quantifizierung von spezifischen Proteinen im großen Maßstab in komplexen Mischungen nach wie vor nicht verfügbar; dies stellt einen kritischen Engpass in vielen biochemischen, molekulardiagnostischen und Biomarker-Entdeckungs-Tests dar.
-
Das erste Verfahren zur Analyse der N-terminalen Aminosäure von Polypeptiden wurde von Frederick Sanger beschrieben, der zeigte, dass die freie nichtprotonierte α-Aminogruppe von Peptiden mit 2,4-Dinitrofluorbenzen (DNFB) reagiert, um gelbe 2,4-Dinitrophenylderivate zu bilden (1). Wenn ein solches Derivat eines Peptids, seiner Länge ungeachtet, einer Hydrolyse mit 6 N HCl unterworfen wird, werden alle Peptidbindungen hydrolysiert, aber die Bindung zwischen der 2,4-Dinitrophenylgruppe und dem α-Amino der N-terminalen Aminosäure ist relativ stabil gegen Säurehydrolyse. Daher enthält das Hydrolysat eines solchen Dinitrophenylpeptids alle Aminosäurereste der Peptidkette als freie Aminosäuren, außer der N-terminalen, die als das gelbe 2,4-Dinitrophenylderivat erscheint. Dieser markierte Rest kann leicht von den unsubstituierten Aminosäuren getrennt und durch chromatographischen Vergleich mit bekannten Dinitrophenylderivaten der verschiedenen Aminosäuren identifiziert werden.
-
Sangers Verfahren ist zum Großteil durch empfindlichere und effizientere Verfahren ersetzt worden. Ein Beispiel eines solchen Verfahrens verwendet das Markierungsreagens 1-Dimethylaminonaphthalen-5-sulfonylchlorid (Dansylchlorid) (2). Da die Dansylgruppe stark fluoreszierend ist, können Dansylderivate der N-terminalen Aminosäure durch fluorimetrische Verfahren in winzigen Mengen nachgewiesen und gemessen werden. Das Dansylverfahren ist 100 Mal empfindlicher als das Sanger-Verfahren.
-
Das verbreitetste Verfahren für die fortlaufende Analyse des N-terminalen Rests von Peptiden ist das Edman-Abbauverfahren (Edman et al. „Method for determination of the amino acid sequence in peptides”, Acta Chem. Scand. 4: 283–293 (1950) [1], (durch Verweis hierin eingegliedert). Edman-Abbau ist ein Verfahren zur Sequenzierung von Aminosäuren in einem Peptid, wobei der aminoterminale Rest markiert und vom Peptid abgespalten wird, ohne die Peptidbindungen zwischen den anderen Aminosäureresten zu zerbrechen (3). Im Edman-Verfahren reagiert Phenylisothiocyanat quantitativ mit der freien Aminogruppe eines Peptids, um das entsprechende Phenylthiocarbamoyl-Peptid zu liefern. Nach Behandlung mit wasserfreier Säure wird der N-terminale Rest als eine Phenylthiocarbamoyl-Aminosäure abgespalten, wobei der Rest der Peptidkette intakt bleibt. Die Phenylthiocarbamoyl-Aminosäure wird dann zum entsprechenden Phenylthiohydantin-Derivat zyklisiert, welches getrennt und identifiziert werden kann, gewöhnlich mittels Gas-Flüssig-Chromatographie. Alternativ kann der als Phenylthiocarbamoyl-Derivat entfernte N-terminale Rest einfach durch Bestimmung der Aminosäurezusammensetzung des Peptids vor und nach Entfernung des N-terminalen Rests bestimmt werden; subtraktives Edman-Verfahren genannt. Der Vorteil des Edman-Verfahrens ist, dass der Rest der Peptidkette nach Entfernung der N-terminalen Aminosäure für weitere Zyklen dieses Verfahrens intakt gelassen wird; daher kann das Edman-Verfahren in fortlaufender Weise verwendet werden, um vom N-terminalen Ende ausgehend mehrere oder sogar viele aufeinanderfolgende Aminosäurereste zu identifizieren. Edman und Begg haben diesen Vorteil weiter ausgenutzt durch die Verwendung eines automatisierten Aminosäure-„Sequenators” zur Durchführung des fortlaufenden Abbaus von Peptiden mittels des Phenylisothiocyanat-Verfahrens (Eur. J. Biochem. 1:80–91, (1967) [2], (durch Verweis hierin eingegliedert). In einer Ausführungsform erlauben solche automatisierten Aminosäueresequenzer das genaue Sequenzieren von bis zu 30 Aminosäuen mit über 99% Effizienz pro Aminosäure (Niall et al. „Automated Edman degradation: the Protein sequenator”. Meth. Enzymol. 27: 942–1010, (1973) [3], (durch Verweis hierin eingegliedert).
-
Ein Nachteil des Edman-Abbaus ist, dass die sequenzierten Peptide nicht mehr als 50 bis 60 (praktischer weniger als 30) Aminosäurereste haben können. Die sequenzierte Peptidlänge ist typischerweise beschränkt auf Grund des Anstiegs der Heterogenität der Produktpeptide mit jedem Edman-Zyklus, da die zyklische Derivatisierung und Spaltung nicht auf allen Peptidkopien bis zum Ende abläuft. Des Weiteren wird Edman-Abbau, da er vom N-Terminus des Proteins fortschreitet, nicht funktionieren, falls die N-terminale Aminosäure chemisch modifiziert worden ist oder wenn sie im Körper des Proteins verdeckt ist. In manchen nativen Proteinen ist der N-terminale Rest tief im eng gefalteten Molekül verborgen und ist unzugänglich. Edman-Abbau wird typischerweise nur an denaturierten Peptiden oder Proteinen durchgeführt. Intakte, gefaltete Proteine werden selten (wenn überhaupt) Edman-Sequenzierung unterworfen.
-
Insbesondere können die gegenwärtigen automatisierten Peptidsequenzer, die Edman-Abbau durchführen, keine individuellen Peptide innerhalb des Kontexts einer Mischung von Peptiden oder Proteinen sequenzieren und identifizieren. Was daher benötigt wird, ist ein schnelles Verfahren zur Identifizierung und Quantisierung individueller Peptid- und/oder Proteinmoleküle innerhalb einer gegebenen komplexen Probe.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Die vorliegende Erfindung betrifft das Gebiet der Identifizierung von Proteinen und Peptiden, und spezifischer das Sequenzieren (einschließlich aber nicht beschränkt auf teilweises Sequenzieren) einzelner intakter Peptide (nicht denaturiert) in einer Mischung verschiedener Peptide im großen Maßstab auf der Einzelmolekülebene durch selektive Markierung von Aminosäuren an immobilisierten Peptiden, gefolgt von aufeinanderfolgenden Zyklen von Markierung und Entfernung der aminoterminalen Aminosäuren der Peptide. Die Verfahren der vorliegenden Erfindung sind in der Lage, Muster zu produzieren, die die Peptidsequenzen ausreichend widerspiegeln, um eindeutige Identifizierung einer Mehrheit von Proteinen aus einer Spezies (z. B. den Hefe- und Menschenproteomen) zu erlauben. In einer Ausführungsform stellt die vorliegende Erfindung ein massiv paralleles und schnelles Verfahren zur Identifizierung und Quantisierung individueller Peptid- und/oder Proteinmoleküle innerhalb einer gegebenen komplexen Probe bereit.
-
In einer Ausführungsform betrifft die Erfindung ein Verfahren zur Behandlung von Peptiden, umfassend: a) Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist; b) Behandeln jener Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und c) Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene. In einer Ausführungsform ist jene zweite Markierung mittels eines aminoreaktiven Farbstoffs angehängt. In einer Ausführungsform ist jene zweite Markierung ausgewählt aus einer Gruppe bestehend aus Fluoresceinisothiocyanat, Rhodaminisothiocyanat oder anderem synthetisierten fluoreszierenden Isothiocyanatderivat. In einer Ausführungsform überlappen Bereiche des Emissionsspektrums jener ersten Markierung nicht mit dem Emissionsspektrum jener zweiten Markierung. In einer Ausführungsform wird die Entfernung jener N-terminalen Aminosäure in Schritt b) unter Bedingungen durchgeführt, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform umfasst das Verfahren weiter den Schritt d) Anbringen jener zweiten Markierung an jenen neuen N-terminalen Aminosäuren der verbleibenden Peptide. In einer Ausführungsform ist unter den verbleibenden Peptiden die neue N-terminale Aminosäure Lysin. In einer Ausführungsform umfasst das Verfahren weiter den Schritt e) Detektieren des nächsten Signals für jedes Peptid auf Einzelmolekülebene. In einer Ausführungsform werden der Schritt der Entfernung der N-terminalen Aminosäure, der Detektierschritt und der Schritt des Anbringens der Markierung an einer neuen N-terminalen Aminosäure aufeinanderfolgend 1 bis 20 Mal wiederholt. In einer Ausführung ergibt die repetitive Detektion von Signal für jedes Peptid auf der Einzelmolekülebene ein Muster. In einer Ausführungsform ist das Muster einzigartig für ein Einzelpeptid innerhalb der Vielzahl von immobilisierten Peptiden. In einer Ausführungsform wird das Einzelpeptidmuster mit dem Proteom eines Organismus verglichen, um das Peptid zu identifizieren. In einer Ausführungsform werden die Intensität jener ersten und zweiten Markierungen innerhalb jener Vielzahl von immobilisierten Peptiden gemessen. In einer Ausführungsform werden die N-terminalen Aminosäuren in Schritt b) durch eine Edman-Abbaureaktion entfernt. In einer Ausführungsform sind die Peptide mittels Cysteinresten immobilisiert. In einer Ausführungsform wird das Detektieren in Schritt c) mit einer Optik durchgeführt, die zur Einzelmolekülauflösung in der Lage ist. In einer Ausführungsform wird der Abbauschritt identifiziert, in dem Entfernung der zweiten Markierung mit Entfernung der ersten Markierung zusammenfällt. In einer Ausführungsform wird jene Entfernung der Aminosäure in Schritt b gemessen wird als eine verringerte Fluoreszenzintensität gemessen.
-
In einer Ausführungsform betrifft die Erfindung ein Verfahren zur Behandlung von Peptiden umfassend: a) Bereitstellen i) einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, und ii) einer optischen Vorrichtung, die in der Lage ist, jenes erste kollektive Signal für jedes Peptid auf der Einzelmolekülebene zu detektieren; b) Behandeln jener Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und c) Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene mit jener optischen Vorrichtung. In einer Ausführungsform ist jene zweite Markierung mittels eines aminoreaktiven Farbstoffs angehängt. In einer Ausführungsform ist jene zweite Markierung ausgewählt aus einer Gruppe bestehend aus Fluoresceinisothiocyanat, Rhodaminisothiocyanat oder anderem synthetisierten fluoreszierenden Isothiocyanatderivat. In einer Ausführungsform überlappen Bereiche des Emissionsspektrums jener ersten Markierung nicht mit dem Emissionsspektrum jener zweiten Markierung. In einer Ausführungsform wird die Entfernung jener N-terminalen Aminosäure in Schritt b) unter Bedingungen durchgeführt, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform umfasst das Verfahren weiter den Schritt d) Anbringen jener zweiten Markierung an jenen neuen N-terminalen Aminosäuren der verbleibenden Peptide. In einer Ausführungsform ist unter den verbleibenden Peptiden die neue N-terminale Aminosäure Lysin. In einer Ausführungsform umfasst das Verfahren weiter den Schritt e) Detektieren des nächsten Signals für jedes Peptid auf Einzelmolekülebene. In einer Ausführungsform werden der Schritt der Entfernung der N-terminalen Aminosäure, der Detektierschritt und der Schritt des Anbringens der Markierung an einer neuen N-terminalen Aminosäure aufeinanderfolgend 1 bis 20 Mal wiederholt. In einer Ausführung ergibt die repetitive Detektion von Signal für jedes Peptid auf der Einzelmolekülebene ein Muster. In einer Ausführungsform ist das Muster einzigartig für ein Einzelpeptid innerhalb der Vielzahl von immobilisierten Peptiden. In einer Ausführungsform wird das Einzelpeptidmuster mit dem Proteom eines Organismus verglichen, um das Peptid zu identifizieren. In einer Ausführungsform werden die Intensität jener ersten und zweiten Markierungen innerhalb jener Vielzahl von immobilisierten Peptiden gemessen. In einer Ausführungsform werden die N-terminalen Aminosäuren in Schritt b) durch eine Edman-Abbaureaktion entfernt. In einer Ausführungsform sind die Peptide mittels Cysteinresten immobilisiert. In einer Ausführungsform wird der Abbauschritt identifiziert, in dem Entfernung der zweiten Markierung mit Entfernung der ersten Markierung zusammenfällt. In einer Ausführungsform wird jene Entfernung der Aminosäure in Schritt b) gemessen wird als eine verringerte Fluoreszenzintensität gemessen.
-
In einer Ausführungsform betrifft die Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend: a) Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, wobei ein Teilsatz jener Vielzahl von Peptiden ein N-terminales Lysin umfassen, das sowohl jene erste als auch zweite Markierung hat; b) Behandeln jener Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und c) Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend ein N-terminales Lysin identifiziert wird. In einer Ausführungsform wird die Entfernung jener N-terminalen Aminosäure in Schritt b) unter Bedingungen durchgeführt, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform werden die N-terminalen Aminosäuren in Schritt b) durch eine Edman-Abbaureaktion entfernt. In einer Ausführungsform sind die Peptide mittels Cysteinresten immobilisiert.
-
In einer Ausführungsform betrifft die Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend: a) Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, wobei ein Teilsatz jener Vielzahl von Peptiden eine N-terminale Aminosäure umfassen, die nicht Lysin ist; b) Behandeln jener Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und c) Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend eine N-terminale Aminosäure, die nicht Lysin ist, identifiziert wird. In einer Ausführungsform wird die Entfernung jener N-terminalen Aminosäure in Schritt b) unter Bedingungen durchgeführt, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform werden die N-terminalen Aminosäuren in Schritt b) durch eine Edman-Abbaureaktion entfernt. In einer Ausführungsform sind die Peptide mittels Cysteinresten immobilisiert.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Behandlung von Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt (dessen Stärke teilweise von der Anzahl markierter Lysine jedes gegebenen Peptids abhängen wird), und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Behandlung von Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt (dessen Stärke teilweise von der Anzahl markierter Lysine jedes gegebenen Peptids abhängen wird), und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, und einer optischen Vorrichtung, die in der Lage ist, jenes erste kollektive Signal für jedes Peptid auf der Einzelmolekülebene zu detektieren; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene mit der optischen Vorrichtung.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt (dessen Stärke teilweise von der Anzahl markierter Lysine jedes gegebenen Peptids abhängen wird), und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, wobei ein Teilsatz jener Vielzahl von Peptiden ein N-terminales Lysin umfassen, das sowohl jene erste als auch zweite Markierung hat; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend ein N-terminales Lysin identifiziert wird.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal für jedes Peptid erzeugt (dessen Stärke teilweise von der Anzahl markierter Lysine jedes gegebenen Peptids abhängen wird), und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist, wobei ein Teilsatz jener Vielzahl von Peptiden eine N-terminale Aminosäure umfassen, die nicht Lysin ist; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend eine N-terminale Aminosäure, die nicht Lysin ist, identifiziert wird.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Behandlung von Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal (z. B. grün) für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist und jene zweite Markierung ein zweites Signal (z. B. rot) für jedes Peptid erzeugt, wobei die erste und zweite Markierung ein kollektives Signal (z. B. rot/grün) für jedes Peptid erzeugen; Detektieren des zweiten Signals (oder des kollektiven Signals) für jedes Peptid auf der Einzelmolekülebene; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Behandlung von Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal (z. B. grün) für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist und jene zweite Markierung ein zweites Signal (z. B. rot) für jedes Peptid erzeugt, wobei die erste und zweite Markierung ein kollektives Signal (z. B. rot/grün) für jedes Peptid erzeugen, und einer optischen Vorrichtung, die in der Lage ist, das erste und zweite Signal (d. h. entweder getrennt oder kollektiv) für jedes Peptid auf der Einzelmolekülebene zu detektieren; Detektieren des zweiten Signals (oder des kollektiven Signals) für jedes Peptid auf der Einzelmolekülebene mit der optischen Vorrichtung; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene mit der optischen Vorrichtung.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal (z. B. grün) für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist und jene zweite Markierung ein zweites Signal (z. B. rot) für jedes Peptid erzeugt, wobei die erste und zweite Markierung ein kollektives Signal (z. B. rot/grün) für jedes Peptid erzeugen, wobei ein Teilsatz jener Vielzahl von Peptiden ein N-terminales Lysin umfassen, das sowohl jene erste als auch zweite Markierung hat; Detektieren des zweiten Signals (oder des kollektiven Signals) für jedes Peptid auf der Einzelmolekülebene; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend ein N-terminales Lysin identifiziert wird.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Identifizierung von Aminosäuren in Peptiden umfassend Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer ersten Markierung, wobei jene erste Markierung ein erstes Signal (z. B. grün) für jedes Peptid erzeugt, und jene N-terminale Aminosäure jedes Peptids markiert mit einer zweiten Markierung, wobei jene zweite Markierung von jener ersten Markierung verschieden ist und jene zweite Markierung ein zweites Signal (z. B. rot) für jedes Peptid erzeugt, wobei die erste und zweite Markierung ein kollektives Signal (z. B. rot/grün) für jedes Peptid erzeugen, wobei ein Teilsatz jener Vielzahl von Peptiden eine N-terminale Aminosäure umfassen, die nicht Lysin ist; Detektieren des zweiten Signals (oder des kollektiven Signals) für jedes Peptid auf der Einzelmolekülebene; Behandeln der Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und Detektieren des ersten Signals für jedes Peptid auf der Einzelmolekülebene unter Bedingungen, so dass jener Teilsatz von Peptiden umfassend eine N-terminale Aminosäure, die nicht Lysin ist, identifiziert wird.
-
In einer Ausführungsform erwägt die vorliegende Erfindung ein Verfahren zur Sequenzierung von Peptiden umfassend Bereitstellen einer Probe umfassend eine Vielzahl von Peptiden, einer ersten Markierung (zum Beispiel eines ersten fluoreszierenden Moleküls), einer zweiten Markierung (zum Beispiel eines zweiten fluoreszierenden Moleküls); Immobilisieren der Vielzahl von Peptiden auf einem festen Träger; Markieren jedes Restes eines spezifischen Aminosäuretyps in der Vielzahl von immobilisierten Peptiden mit der ersten Markierung; Markieren der N-terminalen Aminosäuren der Vielzahl von immobilisierten Peptiden mit der zweiten Markierung; Entfernen der N-terminalen Aminosäuren der Vielzahl von immobilisierten Peptiden; und Detektieren der Markierung (zum Beispiel, Messen der Fluoreszenzintensität der ersten und zweiten fluoreszierenden Moleküle) für Einzelpeptide innerhalb der Vielzahl von immobilisierten Peptiden. In einer Ausführungsform werden die Markierungs- und Entfernungsschritte aufeinanderfolgend 1 bis 20 Mal wiederholt. In einer Ausführungsform werden die erste und zweite Markierung durch Messung an der Vielzahl von immobilisierten Peptiden detektiert. In einer anderen Ausführungsform werden die N-terminalen Aminosäuren durch eine Edman-Abbaureaktion entfernt. In einer anderen Ausführungsform markiert die Edman-Abbaureaktion die N-terminalen Aminosäuren der immobilisierten Peptide mit dem zweiten fluoreszierenden Molekül. In einer noch weiteren Ausführungsform werden die Peptide durch interne Cysteinreste immobilisiert. In einer Ausführungsform ist die mit der ersten Markierung markierte spezifische Aminosäure Lysin. In einer Ausführungsform werden die erste und zweite Markierung auf den Einzelpeptiden mit einer Optik gemessen, die zur Einzelmolekülauflösung fähig ist. In einer anderen Ausführungsform wird der Abbauschritt identifiziert, in dem ein Verlust von zweiter Markierung (zum Beispiel eine verringerte Fluoreszenzintensität) mit einem Verlust von erster Markierung (zum Beispiel einer verringerten Fluoreszenzintensität) zusammenfällt. In einer Ausführungsform ist das Muster von Abbauschritten, die mit einer Verringerung der ersten Markierung (zum Beispiel einem Verlust an Fluoreszenzintensität) zusammenfallen, einzigartig für ein Einzelpeptid innerhalb der Vielzahl von immobilisierten Peptiden. In einer Ausführungsform wird das Einzelpeptidmuster mit dem Proteom eines Organismus verglichen, um das Peptid zu identifizieren.
-
In einer Ausführungsform wird nur eine einzige Markierung verwendet. In dieser Ausführungsform betrifft die Erfindung ein Verfahren zur Behandlung von Peptiden umfassend a) Bereitstellen einer Vielzahl auf einem festen Träger immobilisierter Peptide, jedes Peptid umfassend eine N-terminale Aminosäure und interne Aminosäuren, jene internen Aminosäuren umfassend Lysin, jedes Lysin markiert mit einer Markierung, wobei jene Markierung ein Signal für jedes Peptid erzeugt; b) Behandeln jener Vielzahl immobilisierter Peptide unter Bedingungen, so dass jede N-terminale Aminosäure jedes Peptids entfernt wird; und c) Detektieren des Signals für jedes Peptid auf der Einzelmolekülebene. In einer Ausführungsform ist jene Markierung eine fluoreszierende Markierung. In einer Ausführungsform die Entfernung in Schritt b) jene N-terminale Aminosäure jedes Peptids zur Reaktion gebracht mit einem Phenylisothiocyanatderivat. In einer Ausführungsform wird die Entfernung jener N-terminalen Aminosäure in Schritt b) unter Bedingungen durchgeführt, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform umfasst das Verfahren weiter den Schritt d) Entfernen der nächsten N-terminalen Aminosäure, durchgeführt unter Bedingungen, so dass die verbleibenden Peptide jeweils eine neue N-terminale Aminosäure haben. In einer Ausführungsform umfasst das Verfahren weiter den Schritt e) Detektieren des nächsten Signals für jedes Peptid auf der Einzelmolekülebene. In einer Ausführungsform werden der Schritt der Entfernung der N-terminalen Aminosäure und der Detektierschritt aufeinanderfolgend 1 bis 20 Mal wiederholt. In einer Ausführung ergibt die repetitive Detektion von Signal für jedes Peptid auf der Einzelmolekülebene ein Muster. In einer Ausführungsform ist das Muster einzigartig für ein Einzelpeptid innerhalb der Vielzahl von immobilisierten Peptiden. In einer Ausführungsform wird das Einzelpeptidmuster mit dem Proteom eines Organismus verglichen, um das Peptid zu identifizieren. In einer Ausführungsform werden die Intensität jener Markierungen innerhalb jener Vielzahl von immobilisierten Peptiden gemessen. In einer Ausführungsform werden die N-terminalen Aminosäuren in Schritt b) durch eine Edman-Abbaureaktion entfernt. In einer Ausführungsform sind die Peptide mittels Cysteinresten immobilisiert. In einer Ausführungsform wird das Detektieren in Schritt c) mit einer Optik durchgeführt, die zur Einzelmolekülauflösung in der Lage ist. In einer Ausführungsform wird der Abbauschritt identifiziert, in dem Entfernung der N-terminalen Aminosäure mit Entfernung der ersten Markierung zusammenfällt. In einer Ausführungsform wird jene Entfernung der Aminosäure in Schritt b) gemessen wird als eine verringerte Fluoreszenzintensität gemessen.
-
DEFINITIONEN
-
Um das Verständnis dieser Erfindung zu erleichtern, wird eine Anzahl von Begriffen nachstehend definiert. Hierin definierte Begriffe (falls nicht anders bestimmt) haben Bedeutungen, wie sie gewöhnlich von einem durchschnittlichen Fachmann auf den für die vorliegende Erfindung relevanten Gebieten verstanden werden. Begriffe wie „ein”, „eine” und „der”, „die”, „das” sollen sich nicht nur auf eine einzelne Einheit beziehen, sondern die allgemeine Klasse umfassen, von der ein spezifisches Beispiel zur Veranschaulichung verwendet werden kann. Die Terminologie hierin wird verwendet, um spezifische Ausführungsformen der Erfindung zu beschreiben, aber ihre Verwendung beschränkt die Erfindung nicht, außer wie in den Ansprüchen umschrieben.
-
Wie hierin verwendet, sollen im Singular definierte Begriffe jene Begriffe im Plural definiert umfassen, und umgekehrt.
-
Wie hierin verwendet werden die Begriffe „Aminosäuresequenz”, „Peptid”, „Peptidsequenz”, „Polypeptid” und „Polypeptidsequenz” austauschbar hierin verwendet, um sich auf mindestens zwei Aminosäuren oder Aminosäureanaloga zu beziehen, die kovalent durch eine Peptidbindung oder ein Analog einer Peptidbindung verknüpft sind. Der Begriff Peptid umfasst Oligomere und Polymere von Aminosäuren und Aminosäureanaloga. Der Begriff Peptid umfasst auch Moleküle, die gewöhnlich als Peptide bezeichnet werden, die im Allgemeinen von etwa zwei (2) bis etwa zwanzig (20) Aminosäuren enthalten. Der Begriff Peptid umfasst auch Moleküle, die gewöhnlich als Polypeptide bezeichnet werden, die im Allgemeinen von etwa zwanzig (20) bis etwa fünfzig (50) Aminosäuren enthalten. Der Begriff Peptid umfasst auch Moleküle, die gewöhnlich als Proteine bezeichnet werden, die im Allgemeinen von etwa fünfzig (50) bis etwa dreitausend (3000) Aminosäuren enthalten. Die Aminosäuren des Peptids können L-Aminosäuren oder D-Aminosäuren sein. Ein Peptid, Polypeptid oder Protein kann synthetisch, rekombinant oder natürlich vorkommend sein. Ein synthetisches Peptid ist ein Peptid, das durch künstliche Mittel in vitro hergestellt wird.
-
Wie hierin verwendet bezieht sich der Begriff „Fluoreszenz” auf die Emission von sichtbarem Licht durch eine Substanz, die Licht einer anderen Wellenlänge absorbiert hat. In manchen Ausführungsformen bietet Fluoreszenz ein nichtdestruktives Mittel, um biologische Moleküle basierend auf der Fluoreszenzemission bei einer spezifischen Wellenlänge zu verfolgen und/oder zu analysieren. Proteine (einschließlich Antikörper), Peptide, Nukleinsäuren, Oligonukleotide (einschließlich einzelsträngiger und doppelsträngiger Primer) können mit einer Vielfalt extrinsischer fluoreszierender Moleküle „markiert” werden, die als Fluorophore bezeichnet werden. Isothiocyanatderivate von Fluorescein, wie etwa Carboxyfluorescein, sind ein Beispiel für Fluorophore, die an Proteine (wie etwa Antikörper für Immunhistochemie) oder Nukleinsäuren konjugiert werden können. In manchen Ausführungsformen kann Fluorescein an Nukleosidtriphosphate konjugiert und in Nukleinsäuresonden (wie etwa „fluoreszenzkonjugierte Primer”) für in-situ-Hybridisierung eingebaut werden. In manchen Ausführungsformen wird ein Molekül, das an Carboxyfluorescein konjugiert ist, als „FAM-markiert” bezeichnet.
-
Wie hierin verwendet bezieht sich Sequenzieren von Peptiden „auf der Einzelmoleküllebene” auf Aminosäuresequenzinformation, die von individuellen (d. h. einzelnen) Peptidmolekülen in einer Mischung verschiedener Peptidmoleküle erhalten wird. Es ist nicht notwendig, dass die vorliegende Erfindung auf Verfahren beschränkt wird, wo die von einem individuellen Peptidmolekül erhaltene Aminosäuresequenzinformation die vollständige oder zusammenhängende Aminosäuresequenz eines individuellen Peptidmoleküls ist. In mancher Ausführungsform ist es ausreichend, dass nur eine partielle Aminosäuresequenzinformation erhalten wird, die die Identifizierung des Peptids oder Proteins erlaubt. Partielle Aminosäuresequenzinformation, umfassend z. B. das Muster eines bestimmten Aminosäurerestes (d. h. Lysin) innerhalb individueller Peptidmoleküle, kann ausreichend sein, um ein individuelles Peptidmolekül eindeutig zu identifizieren. Zum Beispiel kann ein Muster von Aminosäuren wie etwa X-X-X-Lys-X-X-X-X-Lys-X-Lys, welches die Verteilung von Lysinmolekülen innerhalb eines individuellen Peptidmoleküls anzeigt, in einem bekannten Proteom eines gegebenen Organismus gesucht werden, um das individuelle Peptidmolekül zu identifizieren. Sequenzierung von Peptiden auf der Einzelmolekülebene soll nicht auf die Identifizierung des Musters von Lysinresten in einem gegebenen Peptidmolekül beschränkt werden; Sequenzinformation für jeglichen Aminosäurerest (einschließlich multipler Aminosäurereste) kann verwendet werden, um individuelle Peptidmoleküle in einer Mischung verschiedener Peptidmoleküle zu identifizieren.
-
Wie hierin verwendet bezieht sich „Einzelmolekülauflösung” auf die Fähigkeit, Daten (einschließlich, zum Beispiel, Aminosäuresequenzinformation) von individuellen Peptidmolekülen in einer Mischung verschiedener Peptidmoleküle zu erlangen. In einem nicht beschränkenden Beispiel kann die Mischung verschiedener Peptidmoleküle auf einer festen Oberfläche (einschließlich, zum Beispiel, eines Glasplättchens oder eines Glasplättchens, dessen Oberfläche chemisch modifiziert worden ist) immobilisiert sein. In einer Ausführungsform kann das die Fähigkeit umfassen, gleichzeitig die Fluoreszenzintensität mehrerer individueller (d. h. einzelner) über die Glasoberfläche verteilter Peptidmoleküle aufzuzeichnen. Optische Vorrichtungen sind kommerziell erhältlich, die auf diese Weise angewendet werden können. Zum Beispiel ist ein konventionelles Mikroskop, ausgestattet mit vollständiger interner Reflexionsbeleuchtung und einem verstärkten Ladungskopplungsvorrichtungs-(CCD)-Detektor, erhältlich (siehe Braslavsky et al., PNAS, 100(7):3960-4 (2003) [4]. Aufnahme mit einer hochempfindlichen CCD-Kamera erlaubt dem Instrument, die Fluoreszenzintensität multipler individueller (d. h. einzelner) über eine Oberfläche verteilter Peptidmoleküle aufzuzeichnen. In einer Ausführungsform kann Bildkollation durchgeführt werden, unter Verwendung eines Bildteilers, der Licht durch einen Zweibandpassfilter (je eines geeignet für jedes Fluoreszenzmolekül) leitet, das als zwei nebeneinanderliegende Bilder auf der CCD-Oberfläche aufgezeichnet wird. Die Verwendung eines motorisierten Mikroskoptisches mit automatisierter Fokussteuerung, um multiple Tischpositionen in der Durchflusszelle aufzunehmen, kann die Sequenzierung von Millionen individueller einzelner Peptide (oder mehr) in einem Experiment erlauben.
-
Wie hierin verwendet bezieht sich der Begriff „kollektives Signal” auf das kombinierte Signal, das sich aus der ersten und zweiten an einem individuellen Peptidmolekül angebrachten Markierung ergibt.
-
Wie hierin verwendet bezieht sich der Begriff „Teilsatz” auf den N-terminalen Aminosäurerest eines individuellen Peptidmoleküls. Ein „Teilsatz” von individuellen Peptidmolekülen mit einem N-terminalen Lysinrest ist verschieden von einem „Teilsatz” von individuellen Peptidmolekülen mit einem N-terminalen Rest, der nicht Lysin ist.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Für ein vollständigeres Verständnis der Merkmale und Vorteile der vorliegenden Erfindung wird nun auf die ausführliche Beschreibung der Erfindung zusammen mit den begleitenden Figuren Bezug genommen.
-
1 stellt die Identifizierung des N-terminalen Aminosäurerestes eines Tetrapeptids mittels der Sanger-Reaktion dar.
-
2 stellt die Identifizierung des N-terminalen Restes eines Tetrapeptids als Dansylderivat dar.
-
3 stellt die Identifizierung des N-terminalen Aminosäurerestes durch Edman-Abbau dar.
-
4 stellt eine Ausführungsform eines Einzelmolekül-Peptidsequenzierungsschemas der vorliegenden Erfindung dar.
-
5 stellt die selektive Markierung von immobilisierten Peptiden dar, gefolgt von aufeinanderfolgenden Zyklen von Markierung und Entfernung der N-terminalen Aminosäure, um einzigartige Muster herzustellen, die individuelle Peptide identifizieren.
-
6 stellt eine Simulation dar, die demonstriert, dass aufeinanderfolgende Abspaltung von N-terminalen Aminosäureresten Muster ergibt, die in der Lage sind, mindestens ein Peptid aus einem wesentlichen Bruchteil von Proteinen, die das menschliche und Hefeproteom umfassen, zu identifizieren.
-
7 stellt eine Simulation dar, die demonstriert, dass die Beschränkung von Sequenzen auf Peptide mit nicht mehr als acht Lysinen fast die Abdeckung des vollen Satzes von Peptiden im Hefeproteom bietet.
-
8 stellt die Strukturen der Cyaninfarbstoffe Cy3 und Cy5 dar.
-
9 stellt das Syntheseschema zur Herstellung der Isothiocyanatderivate der Cyaninfarbstoffe Cy3 und Cy5 dar.
-
10 zeigt ein Diagramm eines Aufbaus (1) für vollständige interne Reflexionsfluoreszenz-(TIRF)-Mikroskopie, der in einer Ausführungsform von Sequenzanalyse verwendet werden kann. In solch einem Aufbau ist eine Mikroskopdurchflusszelle (2), in der die Fluoreszenz der markierten Proteine durch das Sichtfeld (3) beobachtet werden kann. Der Laser (4) wird durch die Objektivlinse (7) mit hoher numerischer Apertur durch das Sichtfeld (3) gegen den dichroitischen Spiegel (6) gerichtet. Eine verstärkte Ladungskopplungsvorrichtung (ICCD) (5) beobachtet das fluoreszierende Signal von den markierten Peptiden.
-
11 zeigt eine Querschnittsansicht einer Ausführungsform einer Durchflusszelle mit geschlossener Perfusionskammer. Modifizierungen dieser kommerziellen Durchflusszelle betreffen die für die untere Dichtung verwendeten Materialien, für die viele Materialien getestet wurden und derzeit Teflon verwenden, um gegenüber den im Edman-Verfahren verwendeten Lösungsmitteln resistent zu sein, und die Oberfläche des Glasplättchens, die wir chemisch modifizieren, um die Peptide zu immobilisieren.
-
12 zeigt eine Explosionsansicht einer Ausführungsform einer geschlossenen Aufnahmekammer. In dieser Ausführungsform umfasst die geschlossene Aufnahmekammer: Elektrische Abdeckung (9), die abgenommen werden kann, um die Perfusionsschläuche zu sterilisieren, und Temperatursensor und Heizerkontakte enthält; Durchflusszellenkammerdeckel (10) – Entworfen, um parallelen gleichförmigen Abschluss sicherzustellen, Lecks und gebrochene Deckgläser zu eliminieren, und enthält die Perfusionsschläuche; Perfusionsschläuche (11) Für Flüssigkeitsfluss; Obere Dichtung (12); Durchflusskontroll-/Mikroaquädukt-Plättchen (13) – Eine optische Oberfläche, die Perfusions- und Temperaturkontrolle, Hochvolumen-Laminarstrom, Koehler-Beleuchtung und elektronisch leitende Beschichtung zur Temperaturkontrolle integriert.; Untere Dichtung (14) – Stellt eine Abdichtung zwischen Durchflusszellendeckglas und dem Durchflusskontrollplättchen bereit. Diese Dichtung kann jede interne Geometrie haben, die gewünscht wird. Standarddicken von 0,1 mm bis 1,0 mm werden erwogen. Dies erlaubt es einem, die Volumen- und Durchflusscharakteristika der Kammer zu definieren. Modifizierungen dieser kommerziellen Durchflusszelle betreffen die für die untere Dichtung (14) verwendeten Materialien, für die viele Materialien getestet wurden und derzeit Teflon verwenden, um gegenüber den im Edman-Verfahren verwendeten Lösungsmitteln resistent zu sein, und die Oberfläche des Glasplättchens, die wir chemisch modifizieren, um die Peptide zu immobilisieren.; Deckglas (15); und Durchflusszellentisch-Adaptorbasis (16) – Temperaturkontrolliert und enthält einen Schwalbenschwanz, um zur Stabilität in Tischadapter einzurasten. In einer nicht beschränkenden Ausführung wird eine untere Dichtung aus Teflon vorzugsweise verwendet (14), um die Verwendung von organischen Lösungsmitteln in der Durchflusszelle zu erlauben.
-
13 zeigt eine Ausführungsform von Peptiden mit markierten Lysinen (d. h. markiert mit dem aminoreaktiven Farbstoff HiLyte 647), jene Peptide mittels Cysteinen an Maleimid-PEG-Quartsoberfläche angebracht. Das verschiedene Muster von Fluoreszenzintensität mit dem verschiedenen Gehalt an markiertem Lysin. HiLyte FluorTM 647 Succidinimylester ist ein aminoreaktiver fluoreszierender Markierungsfarbstoff, der die Konjugate erzeugt, die verglichen mit denen von Cy5-Farbstoffen leicht rotverschoben sind, was eine optimale Anpassung an für Cy5-Farbstoff entworfene Filter ergibt. Sein Konjugat kann für Fluoreszenzpolarisation-basierte Tests bessere Leistung aufweisen als Cy5.
-
14 zeigt einen Vergleich von einzelnen fluoreszierend markierten Peptiden und Alternativkanal und lässt niedrige Hintergrundfluoreszenz erkennen.
-
15 zeigt den Unterschied im Edman-Abbau der markierten einzelnen Peptidmoleküle zwischen einem Peptid, das ein gegenüber zwei markierten Lysinen enthält. Das Fluoreszenzsignal fällt ab, wenn das markierte Lysin entfernt wird. Nur Fluoreszenzsignal wird mit markierten Lysinen gefunden.
-
16 zeigt Scannen des Mikroskoptisches und Kacheln von Bildern, um große Zahlen von Peptiden zu analysieren, wobei Quantendots als Orientierung dienen können.
-
Tabelle 1 stellt Polypeptid-Schnittstellen für eine Anzahl von Proteasen dar.
-
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
-
Die vorliegende Erfindung betrifft das Gebiet der Sequenzierung von Proteinen und Peptiden, und spezifischer das Sequenzieren einzelner Peptide in einer Mischung verschiedener Peptide im großen Maßstab auf der Einzelmolekülebene. In einer Ausführungsform betrifft die vorliegende Erfindung ein Verfahren zur Bestimmung von Proteinsequenzen (einschließlich, aber nicht beschränkt auf partielle Sequenzen) in massiv paralleler Weise (potentiell Tausende, und sogar Millionen, gleichzeitig), wobei Proteine iterativ markiert und gespalten werden, um Muster zu produzieren, die ihre Sequenzen widerspiegeln. Die Spaltungsmuster (sogar von nur einem Teil des Proteins) liefern genügend Informationen, um einen bedeutenden Bruchteil von Proteinen innerhalb eines bekannten Proteoms zu identifizieren, d. h. wo die Sequenzen von Proteinen im Voraus bekannt sind.
-
I. Proteinsequenzierung
-
Während Veränderungen von Nukleinsäuren oft die Grundlage von Krankheiten sind, werden diese Veränderungen verstärkt und am ehesten gefunden in Proteinen, die wiederum in Kompartimenten vorliegen (d. h. Speichel, Blut und Urin), die ohne invasive Prozeduren wie etwa Biopsien zugänglich sind. Leider bleiben, trotz Fortschritten in der Hochdurchsatz-DNS-Sequenzierung, Verfahren für die Identifizierung und Quantifizierung von spezifischen Proteinen in komplexen Mischungen nach wie vor nicht verfügbar. Zum Beispiel sind eine Vielfalt an Techniken für die Identifizierung einzigartiger Tumorbiomarker in Serum untersucht worden, einschließlich Massenspektrometrie und Antikörperarrays. Jedoch sind diese Verfahren erschwert durch einen Mangel an Empfindlichkeit und durch die Unmöglichkeit, quantitative Auslesungen zu liefern, die mit statistischer Signifikanz durch Musteranalyse ausgewertet werden können. Dieser Mangel betrifft viele biochemische Tests und molekulare Diagnostiken und stellt einen kritischen Flaschenhals in der Biomarkerentdeckung dar.
-
In einer Ausführungsform erlauben die Einzelmolekültechnologien der vorliegenden Erfindung die Identifizierung und absolute Quantifizierung eines gegebenen Peptids oder Proteins in einer biologischen Probe. Dieser Fortschritt ist mehr als fünf Größenordnungen empfindlicher als Massenspektrometrie (die einzige wichtige konkurrierende Technologie für die Identifizierung von Proteinen in komplexen Mischungen), die Proteine wegen unterschiedlicher Ionisation und Desorption in die Gasphase nicht immer akkurat quantifizieren kann. Nicht beschränkende Beispielanwendungen könnten daher Einzelmoleküldetektion von zirkulierenden Proteinen in Menschen oder Tieren umfassen, die zur Bestimmung von spezifischen zirkulierenden Biomarkern für z. B. Tumore, Infektionskrankheiten usw. führt.
-
Die aufeinanderfolgende Identifizierung von terminalen Aminosäureresten ist der kritische Schritt in der Bestimmung der Aminosäuresequenz eines Peptids. Wie oben bemerkt ist ein Nachteil des Edman-Abbaus, dass die sequenzierten Peptide nicht mehr als 50 bis 60 (praktischer weniger als 30) Aminosäurereste haben können. Die Peptidlänge ist besonders beschränkt, weil es mit jedem Edman-Zyklus eine unvollständige Spaltung der Peptide gibt, was dazu führt, dass die Reaktion Synchronie über die Population von anderweitig identischen Peptidkopien einbüßt, was zur Beobachtung verschiedener Aminosäuren innerhalb eines einzigen Sequenzierzyklus führt. Diese Beschränkung wäre jedoch für Einzelmolekül-Edman-Sequenzierung, wie in dem vorgeschlagenen Verfahren, nicht maßgeblich, weil der Edman-Zyklus auf jedem Peptid unabhängig beobachtet wird.
-
Im Proteinkern verborgene Aminosäuren können für die fluoreszierende(n) Markierung(en) unzugänglich sein, was zur Entstehung eines irreführenden Musters von Aminosäuren führen kann. In einer Ausführungsform der vorliegenden Erfindung können solche Derivatisierungsprobleme durch die Denaturierung großer Proteine oder die Spaltung großer Proteine oder großer Peptide in kleinere Peptide vor dem Fortfahren mit der Reaktion gelöst werden.
-
Es wurde oben auch bemerkt, dass, da Edman-Abbau von dem N-Terminus des Proteins fortschreitet, er nicht funktionieren wird, wenn die N-terminale Aminosäure chemisch modifiziert worden ist oder wenn sie im Körper des Proteins verdeckt ist. In manchen nativen Proteinen ist der N-terminale Rest tief im eng gefalteten Molekül verborgen und ist unzugänglich für das Markierungsreagens. In einer Ausführungsform der vorliegenden Erfindung wird das Protein oder Peptid vor dem Fortfahren mit der Edman-Reaktion denaturiert; in solchen Fällen kann Denaturierung des Proteins es zugänglich machen.
-
Es wurde auch bemerkt, dass, während Standard-Edman-Abbauprotokolle die in jedem Zyklus freigesetzte N-terminale Aminosäure beobachten, die vorliegende Erfindung in einer Ausführungsform das vom verbleibenden Peptid erhaltene Signal überwacht.
-
Es wurde auch bemerkt, dass im Gegensatz zur Edman-Sequenzierung, die traditionell durch automatisierte Sequenatoren oder Sequenzer durchgeführt wird, in denen komplexe Mischungen von Peptiden nicht analysiert werden können, die vorliegende Erfindung in der Lage ist, individuelle Peptide innerhalb einer Mischung zu identifizieren.
-
II. Fluoreszenz
-
In einer Ausführungsform ist die in den oben beschriebenen Verfahren verwendeten ersten Markierungen eine fluoreszierende Markierung. In einer anderen Ausführungsform sind die in den oben beschriebenen Verfahren verwendeten ersten und zweiten Markierungen beide fluoreszierende Markierungen. In den Lebenswissenschaften wird Fluoreszenz allgemein als ein nichtdestruktives Mittel eingesetzt, um biologische Moleküle zu verfolgen und/oder zu analysieren, da relativ wenige zelluläre Bestandteile natürlich fluoreszierend sind (d. h. intrinsische oder Autofluoreszenz aufweisen). Wichtige Charakteristika von fluoreszierenden Peptiden sind hohe Empfindlichkeit und nichtradioaktive Detektierung. Fluoreszierende Peptide sind in Fluoreszenzfluorimetrie, Fluoreszenzmikroskopie, Fluoreszenzpolarisierungsspektroskopie, zeitaufgelöster Fluoreszenz und Fluoreszenzresonanzenergietransfer (FRET) breit genutzt worden. Im Allgemeinen sollten die bevorzugten fluoreszierenden Markierungen hohe Fluoreszenzquantenausbeuten haben und die biologischen Aktivitäten der nicht markierten Biomoleküle erhalten. In einer Ausführungsform kann das Protein mit einem extrinsischen Fluorophor (d. h. fluoreszierenden Farbstoff) „markiert” werden, der ein kleines Molekül, Protein oder Quantendot sein kann (siehe 16). Der fluoreszierende Farbstoff kann an einem bestimmten Punkt durch eine kovalente Bindung an einem Peptid angebracht werden, die unter den meisten physiologischen Bedingungen stabil und nichtdestruktiv ist. In manchen Ausführungsformen wird ein funktionaler Linker zwischen den Farbstoff und das Peptid eingeführt, um die Veränderung der biologischen Aktivität des Peptids zu minimieren. Peptidmarkierung erfordert Anbringen des Farbstoffs an einer definierten Position im Peptid (d. h. N-Terminus, C-Terminus oder inmitten der Sequenz).
-
a) N-terminale Markierung
-
Aminoreaktive fluoreszierende Sonden sind weit verbreitet, um Peptide am N-terminalen oder Lysinrest zu modifizieren. Eine Anzahl an fluoreszierenden aminoreaktiven Farbstoffen sind entwickelt worden, um verschiedene Peptide zu markieren, und die resultierenden Konjugate sind in biologischen Anwendungen weit verbreitet. Drei Hauptklassen von aminoreaktiven fluoreszierenden Reagenzien werden derzeit verwendet, um Peptide zu markieren: Succinimidylester (SE), Isothiocyanate und Sulfonylchloride. Fluoresceinisothiocyanat (FITC) ist einer der beliebtesten fluoreszierenden Markierungsfarbstoffe und wird zur Herstellung einer Vielfalt an fluoreszierenden Biokonjugaten vorherrschend verwendet; jedoch bleiben seine geringe Konjugationseffizienz und die kurze Lagerlebensdauer von FITC-Konjugaten problematisch für manche biologischen Anwendungen.
-
i) Fluoreszenzfarbstoff-Carboxylräuren
-
Succinimidylester (SE) sind für Aminmodifizierungen extrem verlässlich, weil die Amidbindungen, die gebildet werden, zu den natürlichen Peptidbindungen im Wesentlichen identisch und ebenso stabil sind. Diese Reagenzien sind im Allgemeinen stabil und zeigen eine gute Reaktivität und Selektivität mit aliphatischen Aminen. Größtenteils sind reaktive Farbstoffe hydrophobe Moleküle und sollten in wasserfreiem Dimethylformamid (DMF) oder Dimethylsulfoxid (DMSO) aufgelöst werden. Die Markierungsreaktionen von Aminen mit Succinimidylestern sind stark pH-abhängig. Aminoreaktive Reagenzien reagieren mit nichtprotonierten aliphatischen Amingruppen, einschließlich der terminalen Amine von Proteinen und der e-Aminogruppen von Lysinen. Daher werden Aminacylierungsreaktionen gewöhnlich über pH 7,5 durchgeführt. Proteinmodifizierungen durch Succinimidylester können typischerweise bei pH 7,5–8,5 gemacht werden, wohingegen Isothiocyanate einen pH 9,0–10,0 für optimale Konjugationen erfordern können. Puffer, die freie Amine, wie etwa Tris und Glycin, und Thiolverbindungen enthalten, müssen vermieden werden, wenn ein aminoreaktives Reagens verwendet wird. Ammoniumsalze (wie etwa Ammoniumsulfat und Ammoniumacetat), die fit Proteinfällung weit verbreitet sind, müssen auch entfernt werden (wie etwa durch Dialyse), bevor die Farbstoffkonjugationen durchgeführt werden. Die meisten Konjugationen werden bei Raumtemperatur gemacht. Jedoch kann entweder erhöhte oder verringerte Temperatur fit eine bestimmte Markierungsreaktion erforderlich sein.
-
ii) Fluoreszenzfarbstoff-Sulfonylchloride
-
Sulfonylchloride sind hochreaktiv und sind in Wasser instabil, besonders bei dem höheren pH, der für die Reaktion mit aliphatischen Aminen erforderlich ist. Molekulare Modifizierungen durch Sulfonylchloride sollten bei niedriger Temperatur durchgeführt werden. Sulfonylchloride können auch mit Phenolen (einschließlich Tyrosin), aliphatischen Alkoholen (einschließlich Polysacchariden), Thiolen (wie Cystein) und Imidazolen (wie Histidin) reagieren, aber diese Reaktionen sind in Proteinen oder in wässriger Lösung nicht häufig. SC-Farbstoffe sind im Allgemeinen hydrophobe Moleküle und sollten in wasserfreiem Dimethylformamid (DMF) oder Dimethylsulfoxid (DMSO) aufgelöst werden. Die Markierungsreaktionen von Aminen mit SC-Reagenzien sind stark pH-abhängig. SC-Reagenzien reagieren mit nichtprotonierten Amingruppen. Auf der anderen Seite neigen die Sulfonylierungsreagezien dazu, in der Gegenwart von Wasser zu hydrolysieren, wobei die Rate mit steigendem pH ansteigt. Daher können Sulfonylierung-basierte Konjugationen einen pH 9,0–10,0 für optimale Konjugationen erfordern. Im Allgemeinen haben Sulfonylierung-basierte Konjugationen viel niedrigere Ausbeuten als die Succinimidylester-basierten Konjugationen. Puffer, die freie Amine wie etwa Tris und Glycin enthalten, müssen vermieden werden, wenn ein aminoreaktives Reagens verwendet wird. Ammoniumsulfat und Ammonium müssen auch entfernt werden, bevor die Farbstoffkonjugationen durchgeführt werden. Hohe Konzentrationen von nukleophilen Thiolverbindungen sollten auch vermieden werden, weil sie mit dem Markierungsreagens reagieren können, um instabile Zwischenprodukte zu bilden, die den reaktiven Farbstoff zerstören könnten. Die meisten SC-Konjugationen werden bei Raumtemperatur gemacht, jedoch kann verringerte Temperatur für eine bestimmte SC-Markierungsreaktion erforderlich sein.
-
iii) Fluoreszenzfarbstoff-Isothiolcyanate
-
Isothiocyanate bilden nach Reaktion mit Aminen Thioharnstoffe. Manche Thioharnstoffprodukte (insbesondere die Konjugate von α-Aminosäuren/Peptiden/Proteinen) sind viel weniger stabil als die aus den entsprechenden Succinimidylestern hergestellten Konjugate. Es ist berichtet worden, dass aus Fluoresceinisothiocyanaten hergestellte Antikörperkonjugate mit der Zeit verderben. Größtenteils sind reaktive Farbstoffe hydrophobe Moleküle und sollten in wasserfreiem Dimethylformamid (DMF) oder Dimethylsulfoxid (DMSO) aufgelöst werden. 2). Die Markierungsreaktionen von Aminen mit Isothiocyanaten sind stark pH-abhängig. Isothiocyanat-Reagenzien reagieren mit nichtprotonierten aliphatischen Amingruppen, einschließlich der terminalen Amine von Proteinen und der e-Aminogruppen von Lysinen. Proteinmodifizierungen durch Isothiocyanate können einen pH 9,0–10,0 für optimale Konjugationen erfordern. Puffer, die freie Amine wie etwa Tris und Glycin enthalten, müssen vermieden werden, wenn ein aminoreaktives Reagens verwendet wird. Ammoniumsalze (wie etwa Ammoniumsulfat und Ammoniumacetat), die für Proteinfällung weit verbreitet sind, müssen auch entfernt werden (wie etwa durch Dialyse), bevor die Farbstoffkonjugationen durchgeführt werden. Hohe Konzentrationen von nukleophilen Thiolverbindungen sollten auch vermieden werden, weil sie mit dem Markierungsreagens reagieren können, um instabile Zwischenprodukte zu bilden, die den reaktiven Farbstoff zerstören könnten. Isothiocyanat-Konjugationen werden gewöhnlich bei Raumtemperatur gemacht; jedoch kann entweder erhöhte oder verringerte Temperatur für eine bestimmte Markierungsreaktion erforderlich sein.
-
b) Cyaninfarbstoffe
-
Cyaninfarbstoffe weisen hohe molare Absorptivitäten (~150.000–250.000M-1 cm–1) und mäßige Quantenausbeuten auf, was zu extrem hellen Fluoreszenzsignalen führt. Abhängig von der Struktur decken sie das Spektrum von infrarot (IR) bis ultraviolett (UV) ab. Cyanine haben viele Anwendungen als Fluoreszenzfarbstoffe, insbesondere in biomediizinischer Bildgebung, Lasertechnologie und analytischer Chemie. Cy3 und Cy5 sind reaktive wasserlösliche Fluoreszenzfarbstoffe der Cyaninfarbstofffamilie. Cy3-Farbstoffe fluoreszieren im grün-gelben Spektrum (~550 nm Anregung, ~570 nm Emission), während Cy5-Farbstoffe im tiefroten Spektrum (~650 nm Anregung, ~670 nm Emission) fluoreszieren, aber im orangenen Spektrum (~649 nm) absorbieren. Die chemische Struktur von sowohl Cy3 als auch Cy5 wird in 8 gegeben. Ein ausführliches Syntheseschema zur Herstellung von Isothiocyanatderivaten dieser Farbstoffe ist auch bereitgestellt (9). In einer Ausführungsform werden Cy3 und Cy5 mit reaktiven Gruppen an entweder einer oder beiden ihrer Stickstoffseitenketten synthetisiert, so dass sie entweder mit Nukleinsäuren oder Proteinmolekülen verknüpft werden können. In einer Ausführungsform erleichtert dies die Visualisierung und/oder Quantifizierung des/r markierten Moleküls/e. Eine breite Vielfalt an biologischen Anwendungen verwenden Cy3- und Cy5-Farbstoffe, einschließlich zum Beispiel vergleichender genomischer Hybridisierung und in Genchips, markieren Proteine und Nukleinsäure für verschiedene Studien einschließlich Proteomik und RNS-Lokalisierung.
-
Um Kontamination auf Grund von Hintergrundfluoreszenz zu vermeiden, verwenden Fluoreszenzscanner typischerweise verschiedene Laseremissionswellenlängen (typischerweise 532 nm und 635 nm) und Filterwellenlängen (550–600 nm und 655–695 nm) und bieten dadurch die Möglichkeit, zwischen zwei Proben zu unterscheiden, wenn eine Probe mit Cy3 markiert und die andere mit Cy5 markiert worden ist. Scanner sind auch in der Lage, die Menge an Cy3- und Cy5-Markierung in jeder der beiden Proben zu bestimmen. In manchen Ausführungsformen werden Cy3 und Cy5 in Proteomikexperimenten verwendet, so dass Proben aus zwei Quellen gemischt und gemeinsam durch den Trennprozess laufen gelassen werden können. Das eliminiert Abweichungen auf Grund unterschiedlicher experimenteller Bedingungen, die unvermeidlich sind, wenn die Proben getrennt laufen gelassen würden.
-
III. Einzelmolekül-Peptididentifizierung und -quantifizierung
-
In einer Ausführungsform betrifft die vorliegende Anmeldung ein Verfahren, um Proteinsequenzen (typischerweise Sequenzinformation für einen Teil des Proteins) in einer massiv parallelen Weise (Tausende, und optimal Millionen gleichzeitig) zu bestimmen, wobei Proteine (oder Fragmente/Teile davon) iterativ markiert und gespalten werden, um Muster zu produzieren, die ihre Sequenzen widerspiegeln. Die vorliegende Erfindung soll nicht auf die genaue Reihenfolge bestimmter Schritte beschränkt werden. In einer Ausführungsform werden die Proteine (oder Peptidfragmente davon) zuerst markiert und dann immobilisiert und anschließend unter Bedingungen behandelt, so dass Aminosäuren abgespalten/entfernt werden. In einer anderen Ausführungsform schließt das Erlangen von Informationen über die Sequenzen von Einzelproteinen zwei verwandte Verfahren ein (8). Peptide oder Proteine werden zuerst auf einer Oberfläche immobilisiert (z. B. über interne Cysteinreste) und dann nacheinander markiert, Stücke der Peptide werden dann unter Verwendung chemischen, photochemischen oder enzymatischen Abbaus abgespalten. In beiden Fällen liefern die Spaltungsmuster ausreichende Informationen, um einen bedeutenden Bruchteil der Proteine innerhalb eines bekannten Proteoms zu identifizieren. In Anbetracht der außerordentlichen Menge an DNS-Information, die bereits durch NextGen-DNS-Sequenzierung angesammelt worden ist, sind die Sequenzen vieler Proteome im Voraus bekannt.
-
a) Immobilisierung und Markierung
-
In einer Ausführungsform werden Peptide oder Proteine zuerst auf einer Oberfläche immobilisiert (über interne Cysteinreste) und nacheinander markiert und abgespalten Stücke der Peptide auf Grund von entweder chemischen oder enzymatischen Abbaus (zwei Variationen des gemeinsamen Themas). Die vorliegende Erfindung soll nicht darauf beschränkt werden, welche Aminosäuren markiert werden. Jedoch beinhaltet in einer bevorzugten Ausführungsform die chemische Methodologie Markierung der Lysylreste eines Peptids oder Proteins mit einem einzelnen Farbstoff („grün” in 8). Das Edman-Abbauverfahren wird dann verwendet, um nacheinander Aminosäurereste vom Aminoterminus des immobilisierten Peptids abzuspalten. In einer bevorzugten Ausführungsform erwägt die vorliegende Erfindung die Verwendung eines modifizierten fluoreszierenden Derivats des Edman-Reagens, um nacheinander jeden neu exponierten Rest auf dem Protein zu markieren („rot” in 9). Diese aufeinanderfolgende Markierung erlaubt es, die Effizienz der Reaktion zu bestimmen und „zählt” auch die Anzahl an Reaktionszyklen, die ein gegebenes Peptid durchlaufen hat. Die Bestimmung, wann sich in der „rot”-Zählung ein zusammenfallender Verlust an „grünen” Resten von einem einzelnen Peptidmolekül ereignet, liefert Sequenzinformation über jenes spezifische Peptid. Sich aus solcher Analyse ergebende Sequenzinformation kann die Form X-X-X-Lys-X-X-X-X-Lys-X-Lys haben (zum Beispiel). In einer anderen Ausführungsform wird statt der Verwendung einer fluoreszierenden zweiten Markierung („rot” in 5) stattdessen ein nichtfluoreszierendes Edman-Reagens wie etwa PITC verwendet; in diesem Fall werden die Runden von Edman-Zyklen einfach gezählt, wie sie angewendet werden, statt jede optisch unter Verwendung der zweiten Markierung zu beobachten.
-
In einer bevorzugten Ausführungsform können die Carboxylatseitenketten von Glutamyl/Aspartyl-Resten mit einem dritten fluoreszierenden Molekül (d. h. einer dritten Farbe) markiert werden, um die von jeder Reaktion abgeleitete Menge an Sequenzinformation zu erhöhen. Informatische Analysen deuten an, dass die Durchführung von 20 Runden Edman-Abbau in diesem Verfahren ausreichend ist, um mindestens ein Peptid von jedem der Vielzahl von Proteinen von innerhalb des menschlichen Proteoms eindeutig zu identifizieren.
-
b) Spaltung
-
In einer anderen Ausführungsform erwägt die vorliegende Anmeldung das Markieren von Proteinen vor der Immobilisierung, gefolgt durch die Zugabe einer Reihe von Proteasen, die sehr spezifisch zwischen bestimmten Aminosäuredimeren spalten, um die Markierungen freizusetzen. Die mit diesem Verfahren erhaltene Sequenzinformation kann die Form von Mustern wie etwa Lys-[Proteasestelle 1]-Lys-[Proteasestelle 2]-Lys haben (zum Beispiel). Während es möglich ist, dass multiple (oder null) Proteasestellen zwischen zwei gegebenen Markierungen liegen können, ist das Vorliegen von multiplen (oder null) Proteasestellen auch Information, die verwendet werden kann, ein gegebenes Peptid zu identifizieren. Wie bei der oben diskutierten Edman-Abbaureaktion zeigen informatische Analysen, dass Proteasen mit ungefähr 20 verschiedenen Dimerspezifitäten ausreichend sind, um mindestens ein Peptid aus einem wesentlichen Bruchteil von Proteinen von innerhalb des menschlichen Proteoms zu identifizieren. In einer Ausführungsform können Proteasen mit definierten Spezifitäten unter Verwendung von gesteuerten Evolutionsverfahren erzeugt werden.
-
c) Identifizierung
-
Ein Einzelmolekülmikroskop, das in der Lage ist, die Position von individuellen, immobilisierten Peptiden zu identifizieren, wird verwendet, um die Anzahl von fluoreszierenden Molekülen (d. h. Farbstoffen) auf einem individuellen Peptid in Stufen von einem Farbstoff zu „lesen”. Das Empfindlichkeitsniveau ist vergleichbar zu dem auf kommerziellen Plattformen verfügbaren und sollte ermöglichen, dass diese subtraktiven Ansätze über mehrere Iterationen erfolgreich sind. Wie vorher angedeutet liefern die resultierenden Daten keine vollständige Peptidsequenz, sondern stattdessen ein Muster von Aminosäuren (z. B. X-X-X-Lys-X-X-X-X-Lys-X-Lys...), das in den bekannten Proteomsequenzen gesucht werden kann, um das immobilisierte Peptid zu identifizieren. Die Muster passen manchmal zu mehreren Peptidsequenzen im Proteom und sind daher nicht immer ausreichend informationsreich, um ein Peptid eindeutig zu identifizieren, jedoch könnte durch die Kombination von Information von multiplen Peptiden, die zum selben Protein gehören, die eindeutige Identifizierung von Proteinen wesentlich höher sein. Das vorliegende Verfahren beruht auf der Tatsache, dass potentiell Millionen oder Milliarden von immobilisierten Peptiden in einer Analyse sequenziert werden können (zum Vergleich kann derzeitige Einzelmolekül-Next-Gen-DNS-Sequenzierung ungefähr 1 Milliarde Auslesungen pro Lauf sequenzieren), und dass daher ein sehr großer Anteil von diesen nicht informativ sein kann, während immer noch ausreichend Information von der interpretierbaren Fraktion von Peptidmustern geliefert wird, um Proteine eindeutig zu identifizieren und quantifizieren.
-
d) Quantifizierung
-
Die Fähigkeit, Einzelmolekül-, Hochdurchsatz-Identifizierung von Peptiden aus komplexen Proteinmischungen durchzuführen, stellt einen tiefgreifenden Fortschritt in der Proteomik dar. Zusätzlich zur Identifizierung eines gegebenen Peptids oder Proteins erlauben die vorliegenden Verfahren in einer Ausführungsform auch die absolute Quantifizierung der Anzahl individueller Peptide aus einer Mischung (d. h. Probe) auf der Einzelmolekülebene. Das stellt eine Verbesserung gegenüber Massenspektrometrie dar, die um mehr als 5 Größenordnungen weniger empfindlich ist und die wegen unterschiedlicher Ionisation und Desorption in die Gasphase Proteine nicht immer akkurat quantifizieren kann.
-
e) Biomarker
-
Während andere Techniken verwendet worden sind, um einzigartige Tumorbiomarker in Serum zu identifizieren, einschließlich Massenspektrometrie und Antikörperarrays, sind diese Techniken stark behindert worden durch einen Mangel an Empfindlichkeit und durch eine Unfähigkeit, quantitative Auslesungen zu liefern, die durch Musteranalyse mit statistischer Signifikanz interpretiert werden können. In einer Ausführungsform erwägt die vorliegende Anmeldung die Identifizierung von für Krebs und Infektionskrankheiten relevanten Biomarkern. Während Veränderungen von Nukleinsäuren oft die Grundlage von Krankheiten sind, werden diese Veränderungen verstärkt und am ehesten in Proteinen gefunden. Diese aberranten Proteine liegen oft an diskreten Orten über den Körper hinweg vor, die ohne invasive Prozeduren wie etwa Biopsien zugänglich sind, einschließlich zum Beispiel Speichel, Blut und Urin. In einer Ausführungsform kann ein Einzelmolekül-Detektionstest für zirkulierende Proteine in einem bestimmten Tiermodell einer Krankheit (z. B. menschliche Proteine aus Xenotransplantationen implantiert in Mäuse) durchgeführt werden, um einzigartige Biomarker zu identifizieren. In einer bevorzugten Ausführungsform können solche Tests die Grundlage für die Identifizierung von Proteinmustern in Menschen liefern, die bezeichnend für eine Krankheit sind. Zum Beispiel Vergleichen des Proteinmusters in Serumproben von Krebspatienten gegenüber normalen Individuen.
-
Daher sind spezifische Zusammensetzungen und Verfahren der Identifizierung von Peptiden auf der Einzelmolekülebene offenbart worden. Es sollte jedoch für Fachleute offensichtlich sein, dass viele weitere Modifikationen neben den bereits beschriebenen möglich sind, ohne von den erfinderischen Konzepten hierin abzuweichen. Zudem sollten bei der Interpretation der Offenbarung alle Begriffe in der breitest möglichen Weise, die mit dem Kontext konsistent ist, interpretiert werden. Insbesondere sollten die Begriffe „umfasst” und „umfassend” interpretiert werden als sich in einer nicht ausschließlichen Weise auf Elemente, Bestandteile oder Schritte beziehend, wobei sie anzeigen, dass die referenzierten Elemente, Bestandteile oder Schritte mit anderen nicht ausdrücklich referenzierten Elementen, Bestandteilen oder Schritten vorliegen, verwendet werden oder kombiniert werden können.
-
Alle hierin erwähnten Veröffentlichungen sind durch Verweis hierin eingegliedert, um die Verfahren und/oder Materialien zu offenbaren und zu beschreiben, in Zusammenhang mit welchen die Veröffentlichungen zitiert sind. Die hierin diskutierten Veröffentlichungen werden nur wegen ihrer Offenbarung vor dem Anmeldetag der vorliegenden Veröffentlichung bereitgestellt. Nichts hierin soll als ein Eingeständnis ausgelegt werden, dass die vorliegende Erfindung einer solchen Veröffentlichung nicht auf Grund von früherer Erfindung vorausgeht. Des Weiteren können die angegebenen Veröffentlichungsdaten von den tatsächlichen Veröffentlichungsdaten verschieden sein, die möglicherweise unabhängig bestätigt werden müssen.
-
EXPERIMENTELL
-
Das Folgende sind Beispiele, die von der vorliegenden Erfindung erwogene Ausführungsformen weiter veranschaulichen. Diese Beispiele sollen keinerlei Beschränkungen für die vorliegende Erfindung bieten.
-
In der folgenden experimentellen Offenbarung gelten die folgenden Abkürzungen: eq. oder eqs. (Äquivalente); M (Molar); μM (mikromolar); N (Normal); mol (Mole); mmol (Millimole); μmol (Mikromole); nmol (Nanomole); pmol (Pikomole); g (Gramm); mg (Milligramm); μg (Mikrogramm); ng (Nanogramm); vol (Volumen); w/v (Gewicht pro Volumen); v/v (Volumen pro Volumen); L (Liter); ml (Milliliter); μL (Mikroliter); cm (Zentimeter); mm (Millimeter); um (Mikrometer); nm (Nanometer); C (Grad Celsius); rpm (Umdrehungen pro Minute); DNS (Desoxyribonukleinsäure); kDal (Kilodaltons).
-
I. Einzelmolekülsequenzierung
-
4 stellt eine Ausführungsform des Einzelmolekül-Peptidsequenzierungsverfahrens dar. Kurz gesagt ist selektive Markierung von Aminosäuren auf immobilisierten Peptiden, gefolgt von aufeinanderfolgenden Zyklen von Markierung und Entfernung der aminoterminalen Aminosäuren der Peptide, in der Lage, Muster zu produzieren, die ihre Sequenzen ausreichend widerspiegeln, um eindeutige Identifizierung einer Mehrzahl von Proteinen in den Hefe- und menschlichen Proteomen zu erlauben. 5 zeigt das einfachste Schema mit 2 fluoreszierenden Farben (d. h. „Fluoren” oder „Markierungen”), in welchem Fluor 2 (roter Stern) die Peptidaminotermini (N-Termini) über aufeinanderfolgende Zyklen von Entfernung der N-terminalen Aminosäuren und Neumarkierung der entstehenden neuen N-Termini markiert und Fluor 1 (grüner Stern) Lysin-(K)-Reste markiert. Die Immobilisierung von Fluor 2 auf einem Peptid dient als ein Indikator, dass der Edman-Abbau erfolgreich begonnen hat; seine Entfernung nach einem Lösungsmittelwechsel zeigt an, dass die Reaktion erfolgreich geendet hat. Fluor 2 dient daher als eine interne Fehlerkontrolle – d. h. zeigt für jedes Peptid an, welche Edman-Zyklen erfolgreich begonnen und geendet haben – und gibt eine Zählung von Aminosäuren, die von jedem Peptid entfernt wurden, sowie berichtet die Positionen aller sequenzierten Peptide. Fluor 1 dient dazu, anzuzeigen, wann Lysine entfernt werden, was, in Kombination mit dem Bericht über jeden Edman-Zyklus durch Fluor 2, das resultierende Sequenzprofil (z. B. ...XKX... unten) ergibt, das zur Identifizierung des Peptids durch Vergleich mit einer Datenbank von möglichen Proteinsequenzen aus dem sequenzierten Organismus verwendet werden wird. In einer anderen Ausführungsform wird eine zweite fluoreszierende Markierung nicht verwendet; stattdessen wird eine nicht fluoreszierende Version des Reagens verwendet, das die Aminotermini in aufeinanderfolgenden Zyklen markiert und entfernt; in dieser Ausführungsform werden die Zyklen einfach gezählt, was zu denselben Sequenzmustern (z. B. ...XKX...) wie in der obigen Ausführungsform führt, aber ohne eine interne Fehlerkontrolle für die erfolgreiche Einleitung/Vollendung jedes Edman-Reaktionszyklus bereitzustellen.
-
a) Identifizierung von Proteinen in Hefe- und menschlichen Proteomen
-
6 demonstriert, dass die selektive Markierung von Aminosäuren auf immobilisierten Peptiden, gefolgt von aufeinanderfolgenden Zyklen von Markierung und Entfernung ihrer aminoterminalen Aminosäuren, in der Lage ist, Muster zu produzieren, die ihre Sequenzen ausreichend widerspiegeln, um eindeutige Identifizierung einer Mehrzahl von Proteinen in den Hefe- und menschlichen Proteomen zu erlauben. Die aufgetragenen Kurven zeigen Ergebnisse von Computersimulation von aufeinanderfolgender Abspaltung von einzelnen N-terminalen Aminosäuren von allen proteolytischen Peptiden, die vom vollständigen menschlichen oder Hefeproteom abgeleitet sind, oberes bzw. unteres Diagramm. Die Figur stellt die Ergebnisse verschiedener Schneide-(„Cut”)- und Markierungs-(„Label”)-Szenarien dar. Zum Beispiel zeigt „Cut E” an, dass alle menschlichen Proteine mit der Peptidase GluC proteolysiert wurden, um jedes Protein nach Glutamat-(„E”)-Resten zu schneiden. Ähnlich simuliert „Label” die Ergebnisse von anfänglicher Markierung verschiedener Teilsätze von Aminosäureresten. Zum Beispiel zeigt „Label K” an, dass nur Lysin-(„K”)-Aminosäurereste eine detektierbare Markierung tragen (d. h. ein durch Einzelmolekül-Fluoreszenzmikroskopie beobachtbares fluoreszierendes Molekül). Der Sequenzierreaktion wird nicht gestattet, jenseits des Cystein-(„C”)-Restes fortzuschreiten, da sie verwendet werden, um die Peptidsequenz zu verankern. 5 demonstriert, dass Markierungsschemata, die nur zwei oder drei aminosäurespezifische fluoreszierende Markierungen einsetzen, Muster liefern können, die in der Lage sind, mindestens ein Peptid aus einem wesentlichen Bruchteil der menschlichen oder Hefeproteine zu identifizieren. In Anbetracht dessen, dass nur ein Peptid erforderlich ist, um das Vorliegen eines individuellen Proteins in einer Proteinmischung zu identifizieren, und weiter dass das Peptid wiederholt beobachtet werden und die Anzahl der Beobachtungen gezählt werden kann, demonstriert 6, dass dieser Ansatz einen großen Teil von Proteinen in hochkomplexen Proteinmischungen sowohl identifizieren als auch quantifizieren kann. Diese Fähigkeit erfordert, dass die genomische Sequenz des analysierten Organismus verfügbar ist, um als eine Referenz für die beobachteten Aminosäuremuster zu dienen. Wie oben angedeutet sind die vollständigen menschlichen und Hefegenome verfügbar, um mit Mustern von Aminosäuremarkierungen (z. B. „XXXKXXXKKXXXTX...C...E”) verglichen zu werden.
-
b) Lysingehalt
-
7 demonstriert, dass die Anzahlen von Lysinen pro Peptid ausreichend niedrig sind, um ihre Zahl auf Grund von Fluoreszenzintensität zu beobachten. Das vorliegende Verfahren erfordert die Fähigkeit, verschiedene Anzahlen von fluoreszierenden Molekülen auf Grund von Fluoreszenzintensität zu unterscheiden (d. h. aufzulösen); jedoch nimmt die Auflösung naturgemäß ab, wenn die Anzahl von Lysinen in einem Einzelpeptid ansteigen. Während zum Beispiel das Unterscheiden von 3 Lysinen von 2 Lysinen nur das Detektieren einer 33%igen Abnahme in der Fluoreszenzintensität erfordert, würden hohe Lysinzahlen das Detektieren von proportional kleineren Änderungen in der Fluoreszenzintensität erfordern (z. B. nur 5% für den Fall von 21 Lysinen gegenüber 20 Lysinen). Glücklicherweise pflegt die natürliche Verteilung von Lysinresten in Peptiden klein zu sein (oberes Diagramm, gezeigt für das Hefeproteom) und daher innerhalb der Kapazität von gegenwärtigen Fluoreszenzmikroskopen zu liegen. Die in 7 dargestellten Simulationen demonstrieren, dass das Beschränken der Sequenzierung auf Peptide mit nicht mehr als acht Lysinen fast den gesamten Satz von Peptiden im Hefeproteom abdeckt (unteres Diagramm, gezeigt für den Fall von Markierung von K, Schneiden an E mit GluC, Verankern durch C).
-
II. Zweifarben-Einzelmolekül-Peptidsequenzierungsreaktion
-
Proteine können aus natürlichen oder synthetischen Quellen analysiert werden, die mittels Standardprotokollen gesammelt wurden. Zum Beispiel können Proteine aus menschlichen Zellen isoliert werden, die aus Blutproben, Tumorbiopsien oder in vitro-Zellkulturen gewonnen wurden. In einer Ausführungsform erwägt die vorliegende Erfindung eine Zweifarben-Einzelmolekül-Peptidsequenzierungsreaktion. In anderen Ausführungsformen können Proteinsequenzierungsprotokolle mehr als zwei fluoreszierende Moleküle umfassen (z. B. kovalente Markierung eines dritten fluoreszierenden Moleküls mit einem zusätzlichen Typ Aminosäure), um höhere Proteinsequenz- und/oder Proteinprofilinformation zu liefern.
-
a) Zellprobenpräparation
-
Isolierte Zellen werden in einem Standard-Lysepuffer resuspendiert, der ein reduzierendes Agens wie Dithiothreitol (DTT), um Proteine zu denaturieren und Disulfidverknüpfungen aufzubrechen, und einen Proteaseinhibitorcocktail, um weiteren Proteinabbau zu verhindern, umfasst. Zellen werden durch Homogenisierung oder andere Lysetechnik lysiert und das Lysat zentrifugiert, um lösliche zytosolische Proteine (Überstand) und unlösliche membrangebundene Proteine (Niederschlag) zu erhalten. Proben können weiter fraktioniert werden, z. B. durch Chromatographie, Gelelektrophorese oder andere Verfahren, um spezifische Proteinfraktionen von Interesse zu isolieren. Die Proteinmischungen werden in einer Lösung, die zum Beispiel Harnstoff oder Trifluorethanol (TFE) enthält, denaturiert und die Disulfidbindungen werden durch die Zugabe von reduzierenden Agenzien wie Tris(2-carboxyethyl)phosphin (TCEP) oder DTT zu freier Thiolgruppe reduziert.
-
b) Proteinverdau, Markierung und Verankerung
-
Proteinpräparate werden dann mit verschiedenen Endopeptidasen (z. B. GluC) verdaut, welche selektiv die zu Glutaminsäurerest C-terminalen Peptidbindungen spalten. Die entstehenden Peptide werden mit einem fluoreszierenden Edman-Reagens (Markierung 1) wie Fluoresceinisothiocyanat (FITC), Rhodaminisothiocyanat oder anderen synthetisierten fluoreszierenden Isothiocyanatderivaten (z. B. Cy3-ITC, Cy5-ITC) markiert. Erwägungen bei der Wahl des ersten fluoreszierenden Edman-Reagens (Markierung 1) umfassen 1) gute Reaktivität gegenüber verfügbaren Amingruppen an Lysinresten und dem N-Terminus, 2) hohe Quantenausbeute des Fluoreszenzsignals, 3) verringerte Tendenz für Fluoreszenzquenching und 4) Stabilität des fluoreszierenden Moleküls über den erforderlichen pH-Bereich.
-
Markierte Peptide werden dann auf einem aktivierten Glas- oder Quartzsubstrat für Aufnahme und Analyse verankert. In einer Ausführungsform ist das Substrat mit einer geringen Dichte von Maleimid beschichtetes Glas, welches gegenüber verfügbaren Sulfydrylgruppen (SH–) an den Cysteinresten in einem Teilsatz der Peptidmoleküle chemisch reaktiv ist. In einer bevorzugten Ausführungsform ist das Substrat Glas, das mit einer Schicht von N-(2-Aminoethyl)-3-aminopropyltrimethoxysilan beschichtet und dann mit einer Schicht von Methoxy-poly(ethylenglykol) dotiert mit 2–5% Maleimid-poly(ethylenglykol) passiviert ist, wovon Letzteres gegenüber verfügbaren Sulfhydrylgruppen (SH–) an den Cysteinresten in einem Teilsatz der Peptidmoleküle chemisch reaktiv ist. In dieser Ausführungsform werden nur Peptide, die Cysteinreste enthalten, an der festen Oberfläche verankert; Peptide, die keine Cysteinreste enthalten, werden in nachfolgenden Schritten weggewaschen. In einer bevorzugten Ausführungsform werden Peptide vorzugsweise in einer Oberflächendichte verankert, die niedrig genug ist, um die Auflösung von einzelnen Molekülen während nachfolgender Mikroskopieschritte zu ermöglichen. In einer Ausführungsform kann die Reihenfolge der Markierungs- und Verankerungsschritte vertauscht sein, zum Beispiel wenn durch die Kopplungs-Entkopplungs-Rate des Edman-Reagens und seine Fähigkeit, Thioazolinonderivate von N-terminalen Aminosäuren zu bilden, erforderlich.
-
c) Edman-Sequenzierung in einer Mikroskop-Durchflusszelle
-
Nach der Markierung und Verankerung der Peptide wird das Substrat (z. B. Glasplättchen) in eine Durchflusszelle in einem mit vollständiger interner Reflexionsbeleuchtung, die Hintergrundfluoreszenz verringert, ausgestatteten Fluoreszenzmikroskop eingeführt. Die Durchflusszelle wird mit gereinigtem Wasser gewaschen, um die Oberfläche zu säubern. Schritte 2 und 3 entsprechen den Edman-Kopplungsschritten, die wiederholt durchgeführt werden, wobei Fluoreszenzmikroskopiebilder zweimal in jedem Zyklus aufgenommen werden – einmal nach Abspaltung und einmal nach Neumarkierung. 10 ist ein Diagramm, das eine Ausführungsform des Arbeitsprinzips eines Aufbaus für vollständige interne Reflexionsfluoreszenz-(TIRF)-Mikroskopie zeigt, der in der Sequenzanalyse verwendet werden kann. Andere Ausführungsformen des Mikroskopieaufbaus umfassen die Verwendung eines Rasterkonfokalmikroskops zur Visualisierung der einzelnen Moleküle oder eines Dove-Prismas zur Durchführung von TIRF. Die Verwendung eines motorisierten Mikroskoptisches mit automatisierter Fokussteuerung, um multiple Tischpositionen in der Durchflusszelle aufzunehmen, kann die Sequenzierung von Millionen individueller einzelner Peptide (oder mehr) in einem Experiment erlauben (siehe 10, 11 und 12).
-
In dem Abspaltungsschritt wird Trifluoressigsäure (TFA) in die Durchflusszelle eingeführt und inkubiert, um die Abspaltungsreaktion abzuschließen. Das freigesetzte Thiazolinonderivat der N-terminalen Aminosäure und restliches TFA werden mit einem organischen Lösungsmittel wie -Ethylacetat weggewaschen. In einer bevorzugten Ausführungsform können andere Lösungsmittel verwendet werden um sicherzustellen, dass erzeugte Nebenprodukte wirksam entfernt werden. In dem Neumarkierungsschritt wird der N-Terminus der verankerten Peptide mit einem zweiten Edman-Fluoreszenzreagens (Markierung 2) unter milden basischen Bedingungen neu markiert. Erwägungen bei der Wahl des zweiten Edman-Fluoreszenzreagens (Markierung 2) umfassen Beschränken des Fluoreszenz-Durchstrahlens (spektrale Überkreuzung) mit Markierung 1 durch Auswahl von Fluorophoren mit gut getrennten Absorptions- und Emissionsspektra, so dass die Fluore durch Mikroskopie unabhängig beobachtet werden können, und Vorliegen einer effizienten Entkopplungsrate von der markierten N-terminalen Aminosäure. In einer Ausführungsform überlappen Bereiche des Emissionsspektrums jener ersten Markierung nicht mit dem Emissionsspektrum jener zweiten Markierung. Die Abspaltungs- und Neumarkierungsschritte (Schritte 2 bzw. 3) werden dann in Zyklen wiederholt (d. h. Behandeln der Peptide mit aufeinanderfolgenden Runden von Edman-Chemie, einschließlich TFA-Waschen, Vakuumtrocknen, usw.), mit Fluoreszenzmikroskopieaufnahme bei jedem Schritt, wie unten beschrieben, bis ausreichend Daten gesammelt sind (z. B. 20 oder 30 Zyklen).
-
d) Einzelmolekül-Fluoreszenzmikroskopie
-
In einer Ausführungsform kann ein konventionelles Mikroskop ausgestattet mit vollständiger interner Reflexionsbeleuchtung und einem verstärkten Ladungskopplungsvorrichtungs-(CCD)-Detektor zur Aufnahme verwendet werden. (Für ein Beispiel eines solchen Mikroskops, das für Einzelmolekülaufnahme geeignet ist, siehe Braslavsky et al., PNAS, 100(7):3960-4 (2003) [4], (durch Verweis hierin eingegliedert). Abhängig von den Absorptions- und Emissionsspektra der zwei eingesetzten fluoreszierenden Edman-Markierungen werden geeignete Filter (zum Beispiel eine zentrale Wellenlänge von 515 nm für FITC und 630 nm für ein Rhodamin-ITC-Derivat) verwendet, um die Emissionsintensität der zwei Markierungen aufzuzeichnen. Aufnahme mit einer hochempfindlichen CCD-Kamera erlaubt es dem Instrument, gleichzeitig die Fluoreszenzintensität von multiplen über eine Glasoberfläche verteilten Einzelpeptidmolekülen aufzuzeichnen. In einer Ausführungsform wird Bilderfassung unter Verwendung eines Bildsplitters durchgeführt, der Licht durch einen Zweibandpassfilter (je eines geeignet für jedes Fluoreszenzmolekül) leitet, das als zwei nebeneinanderliegende Bilder auf der CCD-Oberfläche aufgezeichnet wird. 10 ist ein Diagramm, das eine Ausführungsform eines Aufbaus für vollständige interne Reflexionsfluoreszenz-(TIRF)-Mikroskopie zeigt, der in einer Ausführungsform von Sequenzanalyse verwendet werden kann. Die Verwendung eines motorisierten Mikroskoptisches mit automatisierter Fokussteuerung, um multiple Tischpositionen in der Durchflusszelle aufzunehmen, kann die Sequenzierung von Millionen individueller einzelner Peptide (oder mehr) in einem Experiment erlauben (siehe 10, 11 und 12). Zum Vergleich können Einzelmolekül-DNS-Sequenzer der derzeitigen Generation (z. B. erhältlich von Helicos) ungefähr 1 Milliarde einzelne DNS-Moleküle pro Experiment sequenzieren.
-
Wie oben beschrieben, wird für jeden Edman-Zyklus die Fluoreszenzintensität von Markierung 1 nach jedem Abspaltungsschritt aufgezeichnet. Nach der allerersten Runde von Entfernung von Markierung 1 (was dem Entfernen der markierten N-terminalen Aminosäure entspricht) wird diese Markierung ausschließlich Lysinreste in den immobilisierten Peptiden markieren, mit einer Fluoreszenzintensität proportional zu der Zahl von Lysinen in einem gegebenen Peptid. Der Verlust und die Aufnahme von Markierung 2, gemessen nach jedem Abspaltungs- bzw. Kopplungsschritt, dient als 1) ein Zähler für die Anzahl der entfernten Aminosäurereste und 2) eine interne Fehlerkontrolle, die den erfolgreichen Abschluss jeder Runde von Edman-Abbau für jedes immobilisierte Peptid anzeigt.
-
e) Bioinformatische Analyse
-
Nach Bildverarbeitung, um Rauschen herauszufiltern und die Position von Peptiden zu identifizieren, sowie die Positionen derselben Peptide über den Satz von gesammelten Bildern zu orten, werden Intensitätsprofile für Markierung 1 und Markierung 2 mit jedem Peptid als eine Funktion des Edman-Zyklus assoziiert. Das Intensitätsprofil von Markierung 1 für jede fehlerfreie Peptidsequenzierungsreaktion (bestimmt durch den Durchlauf von Markierung 2) wird in eine Binärsequenz umgewandelt (z. B. 00010001100), in der eine „1” einem Abfallen von Fluoreszenzintensität von Markierung 1 vorausgeht und ihre Position (d. h. Position innerhalb der Binärsequenz) die Anzahl von durchgeführten Edman-Zyklen identifiziert. Diese Sequenz, als das binäre Intensitätsprofil bezeichnet, stellt eine vereinfachte Version der experimentell abgeleiteten Peptidsequenz dar.
-
Das Verfahren besitzt die Fähigkeit, die Position von Peptiden zu identifizieren, sowie die Fähigkeit, diese Peptide nach einer Anzahl von Schritten zu verfolgen. 13 zeigt eine Ausführungsform von markierten Lysinen (aminoreaktiver Farbstoff HiLyte 647), die über Cysteine an Maleimid-PEG-Quartz-Oberfläche angebracht ist. Die verschiedenen Muster von Fluoreszenzintensität mit dem verschiedenen Gehalt an markiertem Lysin ist dargelegt. Der verwendete Farbstoff, HiLyte FluorTM 647 Succidinimylester, ist ein aminoreaktiver fluoreszierender Markierungsfarbstoff, der die Konjugate erzeugt, die leicht rotverschoben sind im Vergleich mit denen von Cy5-Farbstoffen, was eine optimale Anpassung an für Cy5-Fabstoff entworfene Filter ergibt. Sein Konjugat kann für Fluoreszenzpolarisation-basierte Tests bessere Leistung aufweisen als Cy5. 14 zeigt einen Vergleich von einzelnen fluoreszierend markierten Peptiden und Alternativkanal und lässt niedrige Hintergrundfluoreszenz erkennen. Bei der Analyse der Peptide kann man den Unterschied im Edman-Abbau der markierten einzelnen Peptidmoleküle beobachten zwischen einem Peptid, das ein gegenüber zwei markierten Lysinen enthält (siehe 15). Das Fluoreszenzsignal fällt ab, wenn das markierte Lysin entfernt wird. Nur Fluoreszenzsignal wird mit markierten Lysinen gefunden. Man kann auch Quantendots als Orientierung in der Analyse von großen Zahlen von Peptiden verwenden von durch Scannen des Mikroskops und Kacheln von Bildern (siehe 16).
-
Eine Datenbank von vorhergesagten potentiellen Proteinen für den untersuchten Organismus wird als Referenzdatenbank verwendet. Zum Beispiel kann in einer Ausführungsform die menschliche Proteindatenbank, zusammengestellt aus der UniProt Proteinsequenzdatenbank und 20.252 translatierte Proteinsequenzen umfassend, als der Referenzdatensatz verwendet werden. Eine Liste von potentiellen Peptiden wird durch die Simulation des im Experiment verwendeten Proteolyse-, Markierungs- und Verankerungsansatzes hergestellt. In dem oben gegebenen Beispiel entspricht dies Schneiden mit GluC, Markieren von Lysinen und Verankerung von Peptiden über Cysteine. Jedes in dieser Simulation erzeugte einzigartige Peptid kann in seine entsprechende Binärsequenz umgewandelt werden (z. B. 0001000110), wobei es seine Zuordnung zu der Proteinsequenz und ID, von der es gebildet wurde, behält. Das erzeugt eine Nachschlagdatenbank, die von dem Proteom jenes Organismus abgeleitete potentielle Binärsequenzen einzigartigen Protein-IDs zuweist.
-
Das binäre Intensitätsprofil für jedes Peptid, wie in der Einzelmolekülmikroskopie erzeugt, wird dann mit den Einträgen in der simulierten Peptiddatenbank verglichen (Schritt 3). Das ergibt die Protein-ID, falls verfügbar, von der das Peptid eindeutig abgeleitet ist. Durchführung dieses Nachschlagens für alle gemessenen Profile führt zur Identifizierung des Satzes von Proteinen, die die komplexe Proteinmischung ausmachen. Es kann sein, dass viele binäre Intensitätsprofile keinen eindeutigen Treffer in der Datenbank haben. In einer Ausführungsform könnten fortgeschrittene bioinformatische Analysen die Multiplizität von Treffern berücksichtigen und die am wahrscheinlichsten vorliegenden Proteine ableiten. In einer anderen Ausführungsform ist ein einfacher Ansatz, alle diese Fälle einfach zu ignorieren und sich nur auf eindeutig passende Fälle zu verlassen, um Beweise für vorliegende Proteine zu sammeln. Quantifizierung wird dann durch das Zählen der von jedem beobachteten Protein abgeleiteten Peptide erreicht. Da dieser Ansatz intrinsisch digital ist, sollte die Zählung von Peptiden aus jedem Protein proportional zur Häufigkeit des Proteins in der Mischung sein. In einer anderen Ausführungsform können die Effizienzen der Reaktionsschritte, einschließlich der Markierungs-, Edman-Reagenskopplungs- und Edman-Reagensabspaltungsreaktionen gemessen oder geschätzt werden und dann in die computergestützte Durchsuchung der Proteomsequenzen einbezogen werden, um eine probabilistische Abschätzung der Identifizierung eines bestimmten Peptids oder Proteins in der Datenbank zu liefern.
-
f) Abwandlungen
-
Varianten des obigen Protokolls werden erwogen. In einer Ausführungsform werden, um Signal-zu-Geräusch während der Einzelmolekülaufnahme zu verbessern, Bestandteile zum Scavenging von Sauerstoff und freien Radikalen und Tripelquenching in die Lösung aufgenommen (siehe z. B. Harris et al., Science 320, 106 (2008) [5], (durch Verweis hierin eingegliedert). In einer anderen Ausführungsform kann die Oberfläche des festen Trägers chemisch modifiziert werden, wie etwa durch Beschichtung mit Polyethylenglykol, um unspezifische Adsorption an die Oberfläche zu unterdrücken und so das Signal-zu-Geräusch-Verhältnis für die Fluoreszenzdetektion von Peptiden zu erhöhen. In einer anderen Ausführungsform können mehr als zwei fluoreszierende Moleküle verwendet werden, um zusätzliche Aminosäuren zu markieren. Solch ein Ansatz kann zum Beispiel die kovalente Markierung von Lysinen mit einem fluoreszierenden Edman-Reagens vor der Sequenzierung (wie oben beschrieben) und auch kovalente Markierung von Aminosäuren mit Carboxylatseitenketten (z. B. Glutamat, Aspartat) mit einem zweiten fluoreszierenden Molekül (ausgewählt nach spektraler Kompatibilität) und dann Fortfahren mit Edman-Abbauzyklen unter Verwendung eines mit einem dritten fluoreszierenden Molekül markierten Edman-Reagens beinhalten. Dieses Verfahren böte informationsreichere Sequenzprofile zur Identifizierung von vielen weiteren Peptiden. In einer anderen Ausführungsform beinhaltet eine alternative Aufnahmestrategie die Verwendung von Rasterkonfokalmikroskopie. In einer noch weiteren Ausführungsform werden die Abspaltungs-/Neumarkierungsschritte der Edman-Reaktion durch ein Protokoll ersetzt, in dem die Neumarkierung mittels der Edman-Markierung 2 (wie oben) durchgeführt wird, aber der Abspaltungsschritt dann mittels eines Aminopeptidaseenzyms durchgeführt wird, um die markierte aminoterminale Aminosäure zu entfernen. Das würde die Durchführung aller Reaktionen in wässriger Lösung erlauben und die Apparatur durch Verringerung des Bedarfs an organischen Lösungsmitteln vereinfachen. In dieser Ausführungsform würde die Aminopeptidase so ausgewählt, dass sie das Vorliegen von Markierung 2 auf der aminoterminalen Aminosäure erfordert und toleriert, daher würde sie wahrscheinlich mittels in-vitro-Evolutionstechniken optimiert werden müssen, um für Verwendung in der Sequenzierung geeignet zu sein.
-
In einer noch weiteren Ausführungsform erfolgt die erfolgreiche Entfernung von Aminosäuren vom Carboxyterminus des Peptids, wobei C-terminale Sequenzen statt N-terminalen Sequenzen erschlossen werden. In einer bevorzugten Ausführungsform setzt dieser Ansatz zum Beispiel konstruierte Carboxypeptidasen oder Kleinmolekül-Reagenzien ein, die analog zu der N-terminalen Edman-Chemie reagieren, aber vom C-Terminus des Peptids her operieren.
-
REFERENZEN:
-
- 1. Edman et al. (1950) Method for determination of the amino acid sequence in peptides, Acta Chem. Scand. 4, 283–293.
- 2. Edman, P. und Begg, G. (1967) A Protein Sequenator, Eur. J. Biochem. 1(1), 80–91.
- 3. Niall, H. D. (1973) Automated Edman degradation: the protin sequenator, Methods Enzymol. 27, 942–1010.
- 4. Braslavsky, I. et al. (2003) Sequence information can be obtained from single DNA molecules, Proc. Natl. Acad. Sci. U. S. A. 100(7), 3960–3964.
- 5. Harris, T. D. et al. (2008) Single-Molecule DNA Sequencing of a Viral Genome, Science 320(5872), 106–109.
-