-
Die vorliegende Erfindung betrifft ein Verfahren zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers. Die Erfindung betrifft zudem die Verwendung einer Nanopore zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers. Die Erfindung betrifft zudem ein computerimplementiertes Verfahren, einen Computerprogrammcode und ein Datenverarbeitungssystem zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers.
-
In den letzten Jahrzehnten wurden beträchtliche Fortschritte bei den Technologien zur Extraktion genetischer Information aus Zellen und Geweben erzielt, einschließlich der Einzelmolekül-Nukleinsäuresequenzierungstechniken der nächsten Generation. Eine ähnliche Entwicklung für die direkte Identifizierung, Unterscheidung und Sequenzierung von Proteinen aus zellulären oder azellulären Proben steht dagegen noch aus. Während DNA- und RNA-Sequenzen eine gewisse Vorhersage über die in einer Zelle oder einem Gewebe exprimierten Proteine ermöglichen, ist die direkte Bestimmung des Proteoms, z.B. aus Tumorzellen relevanter für die Aufklärung der biologischen Eigenschaften. In der Tat ist in Situationen, in denen das Vorhandensein bestimmter Proteine oder Protein-Isoformen erwünscht oder gegebenenfalls unerwünscht ist, wie z.B. bei der in-vitro-Proteinsynthese für Biologicals oder Biosimilars, per se der Nachweis und die Identifizierung von Proteinen erforderlich.
-
Die Identifizierung von Proteinen in komplexen Gemischen beruht derzeit auf der Massenspektrometrie ionisierter Moleküle in der Gasphase, einer leistungsfähigen, aber kostspieligen Technologie, die große Geräte erfordert. Die vorliegende Erfindung besteht in einem neuartigen Ansatz, der eine hochgradig kontrollierte und automatisierte, vorzugsweise enzymatische, Fragmentierung, unter Verwendung sowohl sequenzspezifischer Endopeptidasen als auch Exopeptidasen mit einem neu entwickelten Prinzip der „Peptidspektrometrie durch Nanoporen“ zu Zwecken der markierungsfreien Charakterisierung von Proteingemischen, einschließlich Identifizierung, Unterscheidung und schlussendlich Proteinsequenzierung kombiniert.
-
Die Nanoporengrößenspektroskopie wurde zuerst für synthetische Polymere demonstriert, aber vor kurzem wurde gezeigt, dass sie auf Peptide anwendbar ist und deren hochempfindliche, markierungsfreie Unterscheidung ermöglicht (Piguet et al. 2018; Ouldali et al. 2020). Wichtig ist, dass diese Technik in der Lage ist, Unterschiede in einzelnen Aminosäureresten zu erkennen und - im Gegensatz zur Massenspektrometrie - zwischen Peptiden gleicher Masse zu unterscheiden, z.B. Peptide, die entweder die Stereoisomere Leucin oder Isoleucin enthalten (Ouldali et al. 2020), oder durch Sequenzisomerie gekennzeichnet sind.
-
Die derzeitige Standardmethode zur Identifizierung von Proteinen aus Gemischen umfasst eine Reihe von Trennschritten, wie z.B. Flüssigkeitschromatographie oder (2D)-Gelelektrophorese, gefolgt von tryptischem Verdau zu Peptidfragmenten und Massenspektrometrie, z.B. Elektrospray-Ionisation (ESI), oder Matrix-unterstützte Laserdesorption/Ionisation (MALDI), gefolgt von einer Auftrennung gemäß der Laufzeit (TOF), oder in einem Quadru- (Q)/ Multipolfeld und anschließender Korrelation mit bekannten Proteinen in Datenbanken. Die Massenspektrometrie ist zwar ein leistungsfähiges Verfahren, erfordert jedoch kostspielige und sperrige Apparaturen und weist erhebliche Mängel hinsichtlich der Nachweisgrenzen und des dynamischen Empfindlichkeitsbereichs auf. Ein grundlegenderer Nachteil ist, dass Peptide gleicher Masse, aber unterschiedlicher Zusammensetzung (z.B. Leucin- oder Isoleucin enthaltend) nicht derivatisierungsfrei unterschieden werden können. Aus diesen Gründen sind neuartige Lösungen erforderlich, um Proteine mit Einzelmolekülempfindlichkeit zu identifizieren, zu unterscheiden und schließlich zu sequenzieren.
-
Im Gegensatz zu der nanoporenvermittelten Einzelmolekül-DNA-Sequenzierung, bei der lediglich 4 Nukleobasen gleicher Ladung unterschieden werden müssen, liegt im Fall der Proteinstrukturaufklärung wegen der 20 proteinogenen Aminosäuren (aa) eine im Vergleich ungleich komplexere Problemstellung vor. Bis heute steckt dieses Gebiet noch in den Kinderschuhen, aber es wurden bereits einige Fortschritte erzielt, die im Folgenden zusammengefasst werden.
-
Die Einzelmoleküldetektion durch Nanoporen basiert auf der Analyse der Verringerung der elektrischen Leitfähigkeit, die auftritt, wenn ein Analyt, z.B. ein DNA-Strang oder ein Peptid, in einen molekular dimensionierten, in einem Isolator befindlichen, wassergefüllten Kanal, also in eine Nanopore, diffundiert oder migriert. Das Prinzip der elektrischen Detektion des Transports von Molekülen durch eine Nanopore, bei der es sich um einen Proteinkanal oder einen künstlichen Kanal, z.B. eine nanoskalige Apertur in einer Festkörpermembran oder um eine Nanoröhre (Nanotube) oder eine DNA-Origamistruktur die in eine Lipidmembran oder ein in eine feste Membran eingebrachtes, nanoskaliges Loch eingeführt wird, handeln kann, ist bekannt. Die Membran ist einer Potentialdifferenz ausgesetzt, die in Gegenwart einer Elektrolytlösung oder eines anderen ionisch leitfähigen Mediums (z.B. eine ionische Flüssigkeit) einen Ionenstrom durch die Nanopore induziert. Die Interaktion eines Moleküls mit dem Kanal einer Nanopore, insbesondere der Eintritt des Moleküls in den Kanal, die Anwesenheit des Moleküls im Kanal bzw. der Durchgang des Moleküls durch den Kanal, induziert dabei eine messbare Verkleinerung des Stroms, sofern das leitfähige Medium im Kanal eine höhere elektrische Leitfähigkeit als der Analyt aufweist und vice versa.
-
Biologische (Protein-) Nanoporen, die solche Kanäle durch isolierende Lipid-Doppelschichten bilden, waren die ersten Nanoporen, die nachweislich in der Lage waren, einzelne Moleküle zu detektieren, und sie ermöglichen aktuelle DNA-Sequenzierungstechniken auf der Basis von Nanoporen. Alternativ können nanoskopische Poren durch verschiedene Bohr- oder Ätzverfahren in Festkörpermaterialien wie z.B. dünne SiN-Membranen hergestellt werden. Diese Festkörper-Nanoporen sind vielversprechend, wenn auch die Herstellung von möglichst identischen Festkörper-Nanoporen eine technische Herausforderung ist. Im Gegensatz dazu sind porenbildende Proteine mit atomarer Präzision aufgebaut und haben sich über Jahrmillionen entwickelt, um den Transport gelöster Stoffe über Membranen zu ermöglichen.
-
In 1 ist eine Skizze des Prinzips der Einzelmolekülerfassung durch Nanoporen gezeigt. Eine konstante Potentialdifferenz ΔE über einen Isolator treibt einen ionischen Strom durch die Pore. Ein einzelnes Analytmolekül in der Pore blockiert den Strom teilweise (Widerstandsimpuls). Sowohl die Tiefe der Blockade bzw. der Reststrom als auch die Dauer und zeitliche Variationen dieses Stromsignals tragen Informationen über den Analyten.
-
In beiden Fällen (biologische und nichtbiologische Nanoporen) wird die Verringerung der Leitfähigkeit als eine Änderung des Ionenstroms gemessen, die durch eine konstante Spannung über dem Isolator, in dem die Pore die einzige (oder die dominante) elektrisch leitende Verbindung bildet, hervorgerufen wird. Diese Signale, die als Widerstandsimpulse bezeichnet werden, entsprechen einzelnen Analytmolekülen, die in die Pore eintreten und mit der Innenwand der Pore interagieren - und möglicherweise, aber nicht notwendigerweise, die Pore durchmessen, also durch die Pore von einer auf die andere Seite des Isolators translozieren.
-
Wenn es sich bei dem Analyten um ein Polymer handelt (z.B. ein Peptid, Polynukleotid oder ein synthetisches Polymer wie Poly(ethylenglykol)), müssen zwei Regime unterschieden werden, wie in 2 gezeigt ist: im Durchfädelregime (Threading-Modus) ist das Polymer gestreckt und wenige seiner Monomere tragen zur Widerstandsänderung bei. In diesem Regime ist das Stromsignal empfindlich für die Identität der Monomere im engsten Teil der Pore und kann daher für die Sequenzierung verwendet werden, wenn das Polymer in regelmäßiger Weise, also mit möglichst gleichmäßiger Geschwindigkeit durch die Pore gefädelt wird. Im kollabierten Regime hingegen sind alle Monomere gleichzeitig in der Pore vorhanden, so dass der Stromabfall ungefähr proportional zum molekularen Volumen ist, obwohl auch andere, subtilere Faktoren mitwirken können. Das kollabierte Regime wurde für die Nanoporen-vermittelte Bestimmung der Molekulargrössenverteilung von neutralen synthetischen Polymeren verwendet (Baaken et al. 2015). Es wird davon ausgegangen, dass es in diesem Regime zu einer unspezifischen Bindung des kollabierten Polymers an die Porenwand kommt (Bindungs-Regime; Talarimoghari, M., G. Baaken, R. Hanselmann, and J.C. Behrends. 2018. Size-dependent interaction of a 3-arm star poly(ethylene glycol) with two biological nanopores. Eur. Phys. J. E. 41:6288-8. doi:10.1140/epje/i2018-11687-6). In 2 sind die beiden Regime der Polymer-Nanopore-Wechselwirkung gezeigt. Das Durchfädel-/Translokationsregime wird begünstigt, wenn im Verhältnis zur Porenlänge lange Polyelektrolytketten in niedriger bis mittlerer Salzkonzentration (0,1 bis 0,3 M KCI) mit der Pore wechselwirken, wobei relativ hohe elektrische Spannungen (>50 bis >100 mV) zum Einsatz kommen um das Polymer im elektrischen Feld durch die Pore zu bewegen. Das kollabierte/Bindungs-Regime (auch: trapping-Regime, da hier die Pore als Molekülfalle wirkt) tritt typischerweise unter Bedingungen mit hoher Salzkonzentration (z.B. 4 M KCI) auf, erfordert keine zwingende Eigenladung des Analyten und erfordert bei geladenen Analyten wie Proteinen, Peptiden und Polynukleotiden eher niedrigere Spannungen (bis zu 50 mV), während höhere Spannungen das Translokationsregime begünstigen. Das kollabierte/Bindungs-Regime kann nur für Polymere genutzt werden, die kurz genug oder und/oder ausreichend kollabiert sind, um vollständig in der Pore Platz zu finden. Bindung und Trapping eines Polymers in der Pore ist auch für geladene Polymere und auch für Polymere im nicht oder nicht vollständig kollabierten Zustand möglich, sofern diese nicht zu lang für die Pore sind. Aus den dieser Erfindung zugrunde liegenden Untersuchungen ergab sich, dass die Durchführung des Strommessverfahrens (Schritt b) im Anspruch 1) im Kollaps-Regime (auch: kollabiertes, Bindungs- bzw. trapping Regime) besonders vorteilhaft ist.
-
Während die DNA-Sequenzierung durch biologische Nanoporen im Translokations/Durchfädel-Regime gut etabliert ist und kommerziell angeboten wird (siehe https://nanoporetech.com), ist die Peptiderkennung und -Differenzierung mit Hilfe von Nanoporen eine im Entstehen begriffene Technik, wobei die Proteinsequenzierung mit Hilfe von Nanoporen ein langfristiges Ziel ist, das bislang noch nicht erreicht ist.
-
Peptide wurden relativ früh durch biologische Protein-Nanoporen wie die bakteriellen Toxine Aerolysin und alpha-Hämolysin gefädelt, aber die Interaktionszeiten waren zu kurz und das Signal-Rausch-Verhältnis zu gering, um zwischen verschiedenen Peptiden zu unterscheiden, geschweige denn Sequenzinformationen zu erhalten. Zwischenzeitlich wurden biologische Nanoporen verwendet, um Peptide und Proteine auch im nativen oder gefalteten Zustand nachzuweisen und zu differenzieren. Bekannt ist die Fähigkeit der Frageatoxin (FraC)-Poren, zwischen zwei Formen von Endothelin zu unterscheiden, die sich nur in zwei Aminosäure-Positionen unterscheiden. (Huang, G., A. Voet, and G. Maglia. 2019. FraC nanopores with adjustable diameter identify the mass of oppositecharge peptides with 44 dalton resolution. Nat Comms. 10:347-10. doi:10.1038/s41467-019-08761-6.)
-
Die gut dokumentierte Überlegenheit der Empfindlichkeit der Aerolysin-Pore im Trapping-/Kollapsregime, ursprünglich für Poly(ethylenglykol) gezeigt (Baaken et al. 2015), führte zu erneutem Interesse an der Verwendung dieser Pore für die Peptidgrößenbestimmung. Es wurde gezeigt, dass die Länge von Homoarginin-Peptiden mit dieser Pore mit einer Genauigkeit von einer Aminosäure leicht bestimmt werden kann (Piguet et al. 2018). Ferner wurde ermittelt, dass die Substitution eines einzelnen terminalen Restes in einem Octa-Argininpeptid durch eine der 20 proteinogenen Aminosäuren nachgewiesen und dabei zwischen diesen differenziert werden kann, und zwar mit hinreichend guter Unterscheidung von Peptiden selbst gleicher Masse (siehe 3, Ouldali et al. 2020). Die 3 zeigt die Rekognoszierung der zwanzig proteinogenen Aminosäuren mit Hilfe der Aerolysin-Nanopore. A: 1: Peptid-Design 2: Peptid-Poren-Wechselwirkung. Stromspur in Gegenwart einer Mischung aus R7+D,K,R,E,H. B: Plot der relativen Stromstärken vs. Volumen der Aminosäure. C:>95 % Unterscheidung zwischen den Strukturisomeren R7-L und R7-I durch hochauflösende Messung auf der MECA Plattform (Ouldali et al. 2020). Die hier genannten Literaturstellen sind: Baaken et al., 2015 „High-Resolution Size-Discrimination of Single Nonionic Synthetic Polymers with a Highly Charged Biological Nanopore“, ACS nano, VOL. 9, NO. 6, 6443-6449. Piguet et al., 2018, „Identification of single amino acid differences in uniformly charged homopolymeric peptides with aerolysin nanopore“, Nature Communications; 9, 966. Ouldali et al., 2020, „Electrical recognition of the twenty proteinogenic amino acids using an aerolysin nanopore“, Nature Biotechnology, VOL 38, 176-181.
-
Im Dokument
US 2019/0317006 A1 wurde vorgeschlagen, mittels der Nanoporengrößenspektroskopie und unter Verwendung einer Aerolysin-Nanopore verschiedene Peptide eines Gemischs voneinander zu unterscheiden.
-
Es ist Aufgabe der vorliegenden Erfindung, eine technische Lösung zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers, insbesondere eines Peptids oder Proteins anzugeben.
-
Diese Aufgabe wird erfindungsgemäß gelöst durch das Verfahren gemäß Anspruch 1, die Verwendung einer Nanopore gemäß Anspruch 12, das computerimplementierte Verfahren nach Anspruch 13, den auf einem Datenträger gespeicherten Programmcode gemäß Anspruch 14, und das Datenverarbeitungssystem gemäß Anspruch 15. Bevorzugte Ausgestaltungen der Erfindung sind Gegenstände der Unteransprüche.
-
Das erfindungsgemäße Verfahren dient der Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers, und weist die folgenden Schritte auf:
- a) Durchführen eines Fragmentierungsverfahrens, bei dem das Heteropolymer insbesondere enzymatisch, chemisch und/oder physikalisch fragmentiert wird, und dadurch ein Fragmentgemisch erhalten wird, dessen Fragmente Moleküle mit unterschiedlichen Sequenzabschnitten des Heteropolymers sind;
- b) Durchführen eines Strommessverfahrens, bei dem Stromsignale eines Stroms durch den Kanal einer einzelnen Nanopore, bzw. eines Stroms, der parallel durch eine Mehrzahl oder Vielzahl von Kanälen einer Mehrzahl oder Vielzahl von Nanoporen tritt, erfasst werden, wobei jedes Stromsignal auf der Interaktion eines Fragments mit dem Kanal der Nanopore basiert, wobei die Stromsignale für die unterschiedlichen Fragmente charakteristisch sind, wobei eine Repräsentanzmenge von charakteristischen Stromsignalen ermittelbar ist, die das Fragmentgemisch repräsentiert;
- c) Durchführen eines Auswertungsverfahrens, bei dem eine Sequenz von Monomerbausteinen des Heteropolymers aus der Repräsentanzmenge der charakteristischen Stromsignale bestimmt wird.
-
In einer bevorzugten Ausgestaltung des erfindungsgemäßen Verfahrens werden die Fragmente des Fragmentgemisches durch sukzessiven Abbau des Heteropolymers erhalten. Vorzugsweise sieht der sukzessive Abbau des Heteropolymers vor, dass das Heteropolymer kettenförmig ist und die Positionen 1 (Kettenanfang) bis n (Kettenende) der Kette aufweist, und dass die Kette ausgehend von einem Ende stufenweise um einen Monomerbaustein verkürzt wird, um Längenfragmente, insbesondere im Wesentlichen alle Längenfragmente n-(n-i) (i ist hierbei ein Zähler, der gemäß i=i+1 iterativ durchzählt gemäß i=1, 2, 3 .... n-2, n-1, n, so dass die Längenfragmente eine Gesamtlänge von n-(n-1), n-(n-2)....bis n-(n-n) Monomerbausteinen aufweisen), eines aus n Monomerbausteinen bestehenden Heteropolymers zu erhalten, wobei jedes Längenfragment die zum Heteropolymer identische Abfolge von Monomerbausteinen ausgehend von Position 1 (Kettenanfang) bis Position n-(n-i) aufweist. Ein solches Fragmentgemisch wird hier auch als „Leiter“ bzw. als Heteropolymer-Leiter bezeichnet, also eine „Peptid-Leiter“, falls das Heteropolymer ein Peptid ist/aufweist.
-
Die Monomerbausteine können dabei einer Menge m von möglichen Monomerbausteinarten zugehören, z.B. kann im Fall von eukaryotischen Proteinen eine Anzahl n von Aminosäuren (Monomerbausteine) das Protein (Heteropolymer) (oder eine Sequenz davon) bilden, die auf die Menge m=21 der menschlichen proteinogenen Aminosäuren (d.h. Monomerbausteinarten) beschränkt sein kann.
-
Anstelle des sukzessiven Abbaus kann auch ein anderes Abbauverfahren verwendet werden, das die oben genannten Längenfragmente des Heteropolymers liefert.
-
Die in Schritt c) ermittelte Sequenz von Monomerbausteinen des Heteropolymers kann ein Teil der Gesamtsequenz (Teilsequenz) von Monomerbausteinen des Heteropolymers sein, oder, vorzugsweise, die Gesamtsequenz von Monomerbausteinen des Heteropolymers sein.
-
Vorzugsweise ist das Heteropolymer ein Peptid. Vorzugsweise ist das Fragmentierungsverfahren ein Edman-Abbau oder beinhaltet einen Edman-Abbau. Ferner kann das Fragmentierungsverfahren so gestaltet sein, dass es die Spaltung des Proteins durch Endopeptidasen zu Peptiden, und insbesondere die Behandlung der Peptide durch Exopeptidasen vorsieht, um die Peptidleiter zu erhalten.
Vorzugsweise weist das erfindungsgemäße Verfahren folgende Schritte auf:
- insbesondere jeweils vorzugsweise im Schritt b):
- * Ermitteln von Reststromwerten (der Stromsignale) aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt;
- * Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz -vorzugsweise eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, - beschreibt;
- insbesondere jeweils vorzugsweise im Schritt c):
- * Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; und
- * Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (=Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers).
-
Ein charakteristischer Reststromwert bezeichnet die Messergebnisse der Stromwertmessung, die sich aus der Interaktion eines bestimmten Fragmentes, das durch den charakteristischen Reststromwert charakterisiert wird, mit der Nanopore ergibt. Der charakteristische Reststromwert beinhaltet insbesondere den Reststromwertbetrag, der dem entsprechenden Stromsignal zuordenbar ist. Der charakteristische Reststromwert kann auch eine vektorwertige Größe sein, die außer dem Reststromwertbetrag weitere Komponenten beinhaltet, deren Anzahl die Dimension der vektorwertigen Größe bestimmt. Solche Komponenten können eine Zeitdauer des Stromsignals oder eine andere den Zeitverlauf dieses Stromsignals beschreibende Größe sein, oder können Parameter sein, die eine Interpolationskurve beschreiben, die zur Beschreibung des Stromsignals herangezogen wird.
-
Ein charakteristischer Reststromwert beschreibt jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs. Beispiel: ein als Peptidleiter gebildetes Fragmentgemisch enthält ausgehend von einem Peptid mit n Aminosäuren als Monomerbausteinen insgesamt n Fragmentarten. Die das Fragmentgemisch enthaltende Peptidlösung enthält in der Regel eine Vielzahl von Fragmenten jeder Fragmentart (Peptidart). Im Idealfall enthält ein Fragmentgemisch, das durch 100 % effizientes Fragmentieren einer aus einer Ausgangsmenge mit Gesamtzahl M des zu sequenzierenden Peptids gewonnen wird, jeweils auch eine Anzahl M von Fragmenten zu jedem der n Fragmentarten des Peptids. Wird in dieser Anmeldung von „Fragment“ gesprochen, kann, abhängig vom Kontext, insbesondere die Fragmentart gemeint sein.
-
Eine „Repräsentanzmenge von charakteristischen Reststromwerten“, die insbesondere aus der Gesamtzahl der gemessenen Reststromwerte abgeleitet werden kann, beschreibt eine Mehrzahl oder Vielzahl, vorzugsweise die Gesamtheit, der charakteristischen Reststromwerte, die mittels des in Schritt b) genannten Stromwertverfahrens für das Fragmentgemisch ermittelt werden.
-
Vorzugsweise wird das erfindungsgemäße Verfahren als erweitertes Verfahren definiert, das zur Ermittlung einer Sequenz eines Proteins dient, aufweisend die Schritte
- i) Spaltung des Proteins, insbesondere durch enzymatische und/oder chemische und/oder physikalische Spaltung, um Peptide als Spaltungsprodukte des Proteins zu gewinnen; optional: Gewinnen der Peptide durch chromatographische oder elektrophoretische Trennung eines durch die Spaltung erhaltenen Peptidgemischs;
- ii) Anwendung des erfindungsgemäßen Verfahrens zur Ermittlung der Sequenzfolge von Aminosäuren (Monomerbausteine) mindestens eines, insbesondere jedes, der Peptide (Heteropolymer);
- iii) Durchführen eines Erkennungsverfahrens zur Erkennung der Sequenz des Proteins, bei dem die Sequenz des Proteins aus der Sequenzfolge von Aminosäuren des mindestens einen Peptids ermittelt wird.
-
Das erfindungsgemäße Verfahren bzw. die voranstehend genannte Ausgestaltung des erfindungsgemäßen Verfahrens kann vorteilhaft zur Aufklärung der, insbesondere vollständigen, Primärstruktur eines Makromoleküls, insbesondere biologischen Makromoleküls, insbesondere eines Proteins verwendet werden, wobei das biologische Makromolekül verschiedene Heteropolymeren beinhaltet, insbesondere aus verschiedenen aneinander gebundenen Heteropolymeren gebildet ist:
-
Vorzugsweise wird das erfindungsgemäße Verfahren als erweitertes Verfahren definiert, das zur Ermittlung der Primärstruktur eines Makromoleküls, insbesondere eines Proteins, dient, aufweisend die Schritte
-
- i) Spaltung des Makromoleküls, insbesondere Proteins, insbesondere durch enzymatische und/oder chemische und/oder physikalische Spaltung, um Heteropolymere, insbesondere Peptide, als Spaltungsprodukte des Makromoleküls zu gewinnen; optional: Gewinnen Heteropolymere, insbesondere der Peptide, durch Trennung, insbesondere chromatographische oder elektrophoretische Trennung, eines durch die Spaltung erhaltenen Heteropolymergemischs, insbesondere Peptidgemischs;
- ii) Anwendung des erfindungsgemäßen Verfahrens zur Ermittlung einer Sequenzfolge von Monomerbausteinen, insbesondere Aminosäuren, mindestens eines, insbesondere jedes, der Heteropolymere, insbesondere Peptide;
- iii) Durchführen eines Makromolekülerkennungsverfahrens, insbesondere Proteinerkennungsverfahrens, bei dem die Primärstruktur des Makromoleküls, insbesondere Proteins, aus der Sequenzfolge des mindestens einen Heteropolymers, insbesondere Peptids, ermittelt ist, wobei das Makromolekül vorzugsweise das DNA, RNA, Protein, Peptid oder ein beliebiges synthetisches Polymer ist.
-
Das erfindungsgemäße Verfahren kann dazu ausgestaltet sein, die vollständige Sequenz der Monomerbausteine zu bestimmten, aus denen das Heteropolymer bzw. das Makromolekül aufgebaut ist, oder eine oder mehrere Teilsequenzen davon.
-
Das erfindungsgemäße Verfahren kann dazu ausgestaltet sein, einen Teil der vollständigen Sequenz von Monomerbausteinen zu bestimmten, aus der das Heteropolymer aufgebaut ist. Wird nur ein Teil der vollständigen Sequenz von Monomerbausteinen eines Heteropolymers bestimmt, kann mit dem erfindungsgemäßen Verfahren insbesondere ein Ermittlungsverfahren realisiert werden, bei dem die mit dem erfindungsgemäßen Verfahren ermittelte Teilsequenz von Monomerbausteinen eines Heteropolymers dazu verwendet wird, zu ermitteln, welches vorbekannte Heteropolymer aus einer Menge T (1 bis T) von vorbekannten unterschiedlichen (nämlich bezüglich ihrer Sequenz unterschiedlichen) Heteropolymeren ermittelt wurde. „Vorbekannt“ meint hier, dass die nahezu vollständige, oder vollständige Sequenz von Monomerbausteinen eines jeden vorbekannten Heteropolymers bekannt ist. Die mit dem erfindungsgemäßen Verfahren ermittelte Teilsequenz stellt einen „Fingerabdruck“ des aus der vorbekannten Menge von Heteropolymeren zu ermittelnden Heteropolymers dar, also ein Merkmal, das das gesuchte Heteropolymer gegenüber den anderen Heteropolymeren der Menge 1 bis T eindeutig identifizierbar macht. Die Schritte eines solchen Ermittlungsverfahrens lassen sich wie folgt beschreiben:
- i) Bereitstellen der Informationen über die vorbekannte Sequenz jedes Heteropolymers einer Menge von 1 bis T unterschiedlichen Heteropolymeren;
- ii) Heranziehen eines zu ermittelnden Heteropolymers, das mit genau einem Heteropolymer dieser Menge von 1 bis T unterschiedlichen Heteropolymeren identisch ist, wobei insbesondere nicht bekannt ist, mit welchem Heteropolymer dieser Menge das zu ermittelnde Heteropolymer identisch ist;
- iii) Durchführen des erfindungsgemäßen Verfahrens zur Bestimmung einer Teilsequenz des zu ermittelnden Heteropolymers;
- iv) Vergleichen der in iii) bestimmten Teilsequenz mit den vorbekannten Sequenzen aller Heteropolymere der Menge von 1 bis T unterschiedlichen Heteropolymeren und Ermitteln des gesuchten Heteropolymers aus der Menge der vorbekannten Heteropolymere anhand der Teilsequenz, die das gesuchte Heteropolymer gegenüber den anderen Heteropolymeren der Menge 1 bis T eindeutig identifizierbar macht.
-
Das genannte Ermittlungsverfahren erlaubt die Ermittlung der vollständigen Sequenz eines gesuchten Heteropolymers, ohne dass mittels des erfindungsgemäßen Verfahrens die vollständige Sequenz des gesuchten Heteropolmyers aufgeklärt werden muss, wenn das gesuchte Heteropolymer einer Menge T von vorbekannten Heteropolymeren mit jeweils vorbekannter Sequenz entstammt, wobei eine Teilsequenz -nach Art eines Fingerabdrucks- das gesuchte Heteropolymer gegenüber den verbleibenden Heteropolymeren dieser Menge eindeutig identifiziert. In diesem Szenario ist das Ermittlungsverfahren der effizientere Weg zur Ermittlung der vollständigen Sequenz des gesuchten Heteropolymers, verglichen mit der Alternative, anstelle der Teilsequenz des gesuchten Heteropolymers die vollständige Sequenz des gesuchten Heteropolymers mittels des erfindungsgemäßen Verfahrens aufzuklären.
-
Vorzugsweise ist die Nanopore eine biologische Nanopore, also ein porenbildendes Toxin oder ein Porin.
-
Vorzugsweise ist die Nanopore eine Festkörpernanopore oder ein Hybrid aus Festkörper und biologischen und/oder chemischen Komponenten. Ein Festkörper, insbesondere ein Substrat, kann mindestens eines der folgenden Materialien aufweisen oder daraus gebildet sein: SiNx, SiO2, HfO2, MoS2, CNT, Graphen, Nanopipetten. Biologische bzw. chemische Komponenten können, jeweils vorzugsweise, mindestens eines der folgenden beinhalten oder daraus bestehen: Porenformende Toxine, Porine, □eta-Fassproteine, alpha-helikale Membranproteine, DNA-Origami-Strukturen. Hybride, also Kombinationen aus allen oben genannten Komponenten sind möglich.
-
Vorzugsweise erfolgt die Fragmentierung des Heteropolymers durch Enzyme. Vorzugsweise sind das für Proteine/Peptide Endo/Exo-Peptidasen und für DNA gängige Restriktionsenzyme (Nukleasen). Der Fachmann wird in Abhängigkeit davon, welche Sequenz er schneiden will, ein dafür eingerichtetes Enzym wählen. Mögliche Peptidasen sind beispielsweise genannt in: https://www.ebi.ac.uk/merops/ Mögliche Nukleasen sind beispielsweise genannt in:
- https://wikivisually.com/wiki/List_of_restriction_enzyme_cutting_sites%3A_Bst%E2%80 %93Bv#Whole_list_navigation
-
Vorzugsweise erfolgt die Fragmentierung des Heteropolymers auf chemischem Wege und nicht-enzymatisch. Bei Proteinen/Peptiden kann man den Schlack-Kumpf- und Edman Abbau verwenden. Für DNA verwendet man dazu meist Enzyme.
-
Vorzugsweise erfolgt die die Fragmentierung des Heteropolymers auf physikalischem Wege, z.B. durch Einwirkung von Hitze, Kälte, Schallwellen, elektromagnetischer Strahlung, insbesondere Infrarot, ultravioletter oder Röntgenstrahlung, Mikrowellen oder sichtbarem Licht. Beispiele dafür sind dokumentiert in https://doi.org/10.1073/pnas.0901422106 oder https://doi.org/10.1007/s13361-017-1794-9 und https://doi.org/10.1002/mas.20214.
-
Vorzugsweise ist die Nanopore ausgewählt aus der Gruppe bevorzugter Nanoporen-Proteine enthaltend Aerolysin, alpha-Hämolysin, MspA, CsgG, VDAC oder ein anderes Protein aus der Familie der beta-Fass-Proteine, sowie gentechnisch optimierte Varianten dieser Porenproteine.
-
Die Porenproteine und die übrigen Messbedingungen werden dabei vorzugsweise für eine Interaktion des Analyten (des Fragmentes) mit der Pore optimiert, die in einer möglichst langen Interaktion zwischen Analyt und Pore resultiert. Eine bevorzugte Ausgestaltung der Nanopore ist dabei wie folgt: die Nanopore ist vorzugsweise eine Aerolysinpore, insbesondere eine Mutante der Aerolysinpore. Hierzu kann z.B. die Einzelmolekülfalle der Aerolysinpore durch Einzelpunktmutation in ihrer Dimension und Tiefe des Potentialtopfes dem Analyten angepasst und optimiert werden. Insbesondere geschieht dies durch die Aerolysin Varianten R220-S/A/C/K/H/E/D/Q/N, R288-S/A/C/K/H/E/D/Q/N, R282-S/A/C/K/H/E/D/Q/N, D222-S/A/C/F/R/K/H/E/Q/N, D216-S/A/C/F/R/K/H/E/Q/N, D209-S/A/C/F/R/K/H/E/Q/N, K238-S/A/C/F/R/D/H/E/Q/N, K242-S/A/C/F/R/D/H/E/Q/N, K244-S/A/C/F/R/D/H/E/Q/N, K246-S/A/C/F/R/D/H/E/Q/N, E237-S/A/C/F/R/D/H/K/Q/N E258-S/A/C/F/R/D/H/K/Q/N E254-S/A/C/F/R/D/H/K/Q/N, E252-S/A/C/F/R/D/H/K/Q/N und beliebige Kombinationen daraus.
-
Eine Translokation oder ein Durchgang des Analyten durch die Pore ist dabei nicht notwendig, wenn auch grundsätzlich erlaubt. Es ist vielmehr besonders vorteilhaft, wenn derselbe Analyt seine Bindungsstelle in der Pore möglichst lange besucht, oder mehrfach erneut aufsucht und dort bindet, nachdem er zwischenzeitlich die Molekülfalle in Richtung der Eintrittsöffnung wieder verlassen hat. Vorzugsweise bedeutet demnach „Interaktion“ des Fragments (Analyt, Molekül) mit dem Kanal der Nanopore, dass das Fragment in den Kanal eintritt, aber nicht durch den Kanal durchtritt, was letztlich in einer non-destruktiven Mehrfachbestimmung desselben Moleküls resultiert.
-
Durch möglichst langanhaltendes oder wiederholtes Einfangen (trapping) desselben Analyten in der Pore wird insbesondere eine besonders präzise Ermittlung der charakteristischen Reststromwerte im Wege der zeitlichen Signalmittelung sowie eine repräsentative Ermittlung der Parameter des Zeitverlaufs des Stromsignals (Varianz, Rauschanalyse) ermöglicht.
-
Aus den dieser Erfindung zugrunde liegenden Untersuchungen ergab sich, dass die Durchführung des Strommessverfahrens (Schritt b) im Anspruch 1) im Kollaps-Regime (auch: kollabiertes, Bindungs- bzw. trapping Regime) besonders vorteilhaft ist. Das in Schritt b) durchgeführte Strommessverfahren wird vorzugsweise so durchgeführt, dass das Fragmentgemisch in einer Elektrolytlösung vorliegt, welche insbesondere gelöste Salze der Form AX, A2X und AX2 usw. aufweist, wobei Substanz A (z.B. ausgewählt aus den Alkali- und Erdalkalimetallen Na, K, Cs, Rb, Li) das Kation und Substanz X (z.B. ausgewählt aus den Halogenen F, Cl, Br) das Anion liefert. Die Substanzgruppen A und X können weitere Bestandteile im Sinne anorganischer oder organischer Derivate solcher Salze umfassen (wobei z.B. Substanz A ein quaternäres Ammonium-, Imidazolium-, Phosphonium-, Pyridinium- und Pyrrolidiniumion wie z.B. Tetramethylammonium und Substanz X ein Nitrat, ein Sulfat, eine Aminosäure wie z.B. Glutamat, oder eine Carbonsäure wie z.B. Glukonat, Citrat, oder ein (Bi)carbonat, oder ein einfaches Hydroxid sein kann). Vorzugsweise kann die Elektrolytlösung auch Mischungen von verschiedenen Kombinationen aus verschiedenen Salzen aufweisen.
-
Die Gesamtsalzkonzentration der Elektrolytlösung in der das Fragmentgemisch während der Durchführung des Strommessverfahrens vorliegt, liegt zwischen 0.5 M und 20 M, vorzugsweise zwischen 2 M und 10 M und besonders vorzugsweise zwischen 3 M und 5 M. Das Fragmentgemisch kann alternativ zu einer Elektrolytlösung auch in einer ionischen Flüssigkeit vorliegen. Durch solche Konfigurationen des Elektrolyten wird bewirkt, dass Bedingungen wie Ladungsabschirmung und Löslichkeit des Analyten in der Elektrolytlösung für das kollabierte-/ Bindungsregime und das möglichst lange Verweilen des Analyten in der Molekülfalle der Pore optimal eingestellt werden und gleichzeitig ein möglichst hohes Signal-zu Rausch-Verhältnis der Strommessung erzielt wird.
-
Die Erfindung betrifft auch die Verwendung einer Nanopore zur Durchführung des erfindungsgemäßen Verfahrens zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers.
-
Die Erfindung betrifft auch ein computerimplementiertes Verfahren zur Bestimmung einer Sequenz von Monomerbausteinen eines Heteropolymers (Heteropolymersequenz) aus den Messdaten eines Strommessverfahrens, die Informationen über Stromsignale enthalten, die bei der Interaktion von aus dem Heteropolymer gebildeten unterschiedlichen Fragmenten mit einer Nanopore ermittelt werden, aufweisend die Schritte:
- A) Ermitteln von Reststromwerten aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt;
- B) Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, beschreibt;
- C) Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; und
- D) Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers).
-
Die Erfindung betrifft auch einen Computerprogrammcode, der auf einem Datenträger gespeichert ist und der eine Sequenz von Monomerbausteinen eines Heteropolymers (Heteropolymersequenz) aus den Messdaten eines Strommessverfahrens ermittelt, wenn er vom Zentralprozessors eines Computers ausgeführt wird, wobei die Messdaten Informationen über Stromsignale enthalten, die bei der Interaktion von aus dem Heteropolymer gebildeten unterschiedlichen Fragmenten mit einer Nanopore ermittelt werden, aufweisend die jeweils durch den Programmcode umgesetzten Schritte:
- A) Ermitteln von Reststromwerten (der Stromsignale) aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt;
- B) Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, beschreibt;
- C) Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; und
- D) Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers).
-
Die Erfindung betrifft auch ein Datenverarbeitungssystem zur Bestimmung einer Sequenz von Monomerbausteinen eines Heteropolymers (Heteropolymersequenz) aus den Messdaten eines Strommessverfahrens, die Informationen über Stromsignale enthalten, die bei der Interaktion von aus dem Heteropolymer gebildeten unterschiedlichen Fragmenten mit einer Nanopore ermittelt werden, aufweisend einen Computer mit einem Zentralprozessor, und einen Programmcode, insbesondere dem erfindungsgemäßen Programmcode, wobei der Computer dazu programmiert ist, die folgenden computerimplementierten Schritte auszuführen:
- A) Ermitteln von Reststromwerten (Stromsignalen) aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt;
- B) Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, beschreibt;
- C) Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; und
- D) Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers).
-
Das Auswertungsverfahren, bei dem die Sequenz der Monomerbausteine des Heteropolymers aus der Repräsentanzmenge der charakteristischen Stromsignale bestimmt wird, sieht vorzugsweise die computerimplementierten Schritte vor:
- A) Ermitteln von Reststromwerten (Stromsignalen) aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt;
- B) Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz vorzugsweise eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, beschreibt;
- C) Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; und
- D) Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers, vorzugsweise anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers).
-
In den Schritten A) bis D) ist es möglich, dass die Repräsentanzmenge von charakteristischen Reststromwerten das Heteropolymer nicht eindeutig beschreiben kann, da z.B. nur ein Teil des Heteropolymers fragmentiert wurde oder da nicht alle charakteristischen Reststromwerte eindeutig bestimmt werden konnten. Insbesondere in diesem Fall kann ein Vorhersagealgorithmus verwendet werden, um aus den unvollständigen Daten, insbesondere aus einer unvollständigen Repräsentanzmenge von charakteristischen Reststromwerten, eine Wahrscheinlichkeit oder einen Bewertungsfaktor zur Bewertung der Zuverlässigkeit einer durch Schätzen ermittelten Primärstruktur des Heteropolymers anzugeben. Der Vorhersagealgorithmus kann dabei durch maschinelles Lernen anhand von insbesondere gelabelten Trainingsdaten bestimmt worden sein. Die gelabelten Daten können Variationen von unvollständigen Repräsentanzmengen der charakteristischen Reststromwerte vorbekannter Heteropolymere enthalten. Der Vorhersagealgorithmus kann ein künstliches neuronales Netz, insbesondere ein Convolutional Neural Network (CNN) enthalten, das durch die gelabelten Trainingsdaten trainiert sein kann. Der Vorhersagealgorithmus kann auch ein nicht-überwachtes maschinelles Lernen (unsupervised learning) implementieren.
-
Weitere bevorzugte Ausgestaltungen der erfindungsgemäßen Gegenstände ergeben sich aus der nachfolgenden Beschreibung der Ausführungsbeispiele in Zusammenhang mit den Figuren. Gleiche Bezugszeichen bezeichnen im Wesentlichen gleiche Bauteile oder Verfahrensschritte.
- 1 zeigt eine Skizze des Prinzips der Einzelmolekülerfassung durch Nanoporen gezeigt, das beim erfindungsgemäßen Verfahren 100 verwendet werden kann.
- 2 zeigt die beiden möglichen Regime einer Polymer-Nanopore-Wechselwirkung.
- 3A, 3B und 3C zeigen die Detektion der zwanzig proteinogenen Aminosäuren (aa) mit Hilfe der Aerolysin-Nanopore, insbesondere gemäß Stand der Technik.
- 4A, 4B, 4C und 4D zeigen Messnachweise zu einem beispielhaften erfindungsgemäß gestalteten Verfahren.
- 5a, 5b und 5c zeigen jeweils Ausführungsbeispiele des erfindungsgemäßen Verfahrens und von dessen Bestandteilen.
- 6a zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: Sequenzen der sechs Heterodeca-Peptide, die das Startpeptid der Leiter darstellen.
- 6b zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: eine schematische Darstellung des experimentellen Aufbaus.
- 6c zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: eine Kontrollmesskurve in 4 M KCl
- 6d zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: eine beispielhafte Messkurve nach Zugabe der Peptidleiter L1 mit allen Peptiden in äquimolarer Konzentration.
- 6e zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: ein schematisches, über das Hauptniveau gemitteltes Pegelhistogramm für ein Peptidleiter-Sequenzierungsexperiment.
- 7a bis 7l zeigen in Bezug auf ein Ausführungsbeispiel der Erfindung:
- Verweilzeit-Streudiagramme über dem Restporenstrom I/Io (rot) mit überlagerten, über das Hauptniveau gemittelten Pegelhistogrammen (schwarz) für alle sechs Peptidleitern.
- 8a bis 8f zeigen in Bezug auf ein Ausführungsbeispiel der Erfindung: Datenkorrelationsplots für alle sechs Peptidleitern.
- 9a zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung:
- Reproduzierbarkeit von I/Io der Homo-Arginin-Peptide R3, R4, R5, R7 (blau) im Vergleich zu R3-R7 von Piguet et al. 2018 (rot), und Leitern L1 (grün, volle Linie, Kreis), L3 (grün, gestrichelt, aufzeigendes Dreieck), L4 (grün, gepunktet, abzeigendes Dreieck), L2 (pink, volle Linie, Kreis), L5 (pink, gestrichelt, aufzeigendes Dreieck), L6 (pink, gepunktet, abzeigendes Dreieck).
- 9b zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: ΔI/Io-Boxplot für jeden gespaltenen Aminosäure-Typ mit Median (blau) und Mittelwert (weiß).
- 9c zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: ΔI/Io-Werte für die Arginin-Spaltung klassifiziert nach der nächsten Nachbar-aa des Arginins als C-terminaler aa (Alanin blau, Arginin rot, Serin grün, Tyrosin gelb) von Homo- (Punkte) und Hetero-Peptiden (Kreise); Daten für Homo-Peptide wurden entnommen aus Piguet et al. 2018.
- 9d zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: Verweilzeit-Streudiagramme über den Restporenstrom I/Io mit überlagerten Hauptpegelgemittelten Pegelhistogrammen für die Deka-Peptide von Leiter1 (rot), Leiter2 (blau), Leiter3 (grün), Leiter4 (gelb), Leiter5 (rosa), Leiter6 (schwarz).
- 10 zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: Verweilzeit-Streudiagramme über dem Porenreststrom I/Io (rot) mit überlagerten pegelgemittelten Histogrammen (schwarz) Probe A (links) und B (rechts). Unterhalb jeder Grafik sind die, unter Verwendung der ersten Lesehilfe, vorgeschlagenen Sequenzen (prop) sowie die korrekten Sequenzen (corr) dargestellt. Der grüne Kasten zeigt das korrekte Leseraster an.
- 11 zeigt in Bezug auf ein Ausführungsbeispiel der Erfindung: Datentabelle für Doppelblindstudie.
-
1a zeigt eine Darstellung des Prinzips der Einzelmolekülerfassung durch Nanoporen, das zur Umsetzung der Erfindung verwendet werden kann. Eine konstante Spannung ΔU über einen Isolator zieht ionischen Strom durch die Nanopore. Ein einzelnes Analytpartikel, z.B. ein Fragment, in der Nanopore blockiert den Strom teilweise (Widerstandsimpuls bzw. Stromsignal, oder Reststromwert). Sowohl die Tiefe der Blockade als auch die Dauer tragen Informationen über den Analyten.
-
2 zeigt die beiden möglichen Regime einer Polymer-Nanopore-Wechselwirkung. Das Durchfädel-/Translokationsregime wird begünstigt, wenn lange Polyelektrolytketten in niedriger bis mittlerer Salzkonzentration (0,1 bis 1,0 M KCI) mit der Pore wechselwirken. Das Bindungs- Trapping-, oder kollabierte Regime tritt typischerweise unter Bedingungen mit hoher Salzkonzentration (z.B. 4 M KCI) auf und erfordert keine Ladung des Analyten. Bei der Erfindung kommt vorzugsweise das kollabierte Regime zum Einsatz. In einer Messanordnung 1 für Nanoporengrößenspektroskopie, die auch beim erfindungsgemäßen Verfahren zum Einsatz kommen kann, ist ein elektrolytgefülltes erstes Kompartiment 11 von einem elektrolytgefüllten zweiten Kompartiment 12 durch eine, insbesondere mittels einer Lipiddoppelschicht 2 gebildeten, Membran elektrisch isoliert; ein Stromfluss ist im Wesentlichen nur durch die in die Lipiddoppelschicht eingebaute Nanopore 3 möglich, die die Kompartimente 11 und 12 elektrisch verbindet. Die Lipiddoppelschicht kann über der Mikroapertur bzw. über einer Mikrokavität einer Mikrostrukturvorrichtung (in
2 nicht gezeigt) gespannt sein, wie diese z.B. im Dokument
WO 2013/083270 beschrieben wird. Im Durchfädel-/Translokationsregime ist der Analyt 4a langgestreckt, im kollabierten bzw. Bindungs-Regime ist der Analyt 4b kollabiert und kompakt.
-
3 zeigt die Detektion der zwanzig proteinogenen Aminosäuren (aa) mit Hilfe der Aerolysin-Nanopore.
A: 1: Peptid-Design 2: Peptid-Poren-Wechselwirkung. 3: Stromspur in Gegenwart einer Mischung aus 7-R+D,K,R,E,H.
B: Plot der relativen Stromstärken vs. aa-Volumen. C:>95 % Unterscheidung zwischen den Strukturisomeren 7R+L und 7R+I durch hochauflösende Aufzeichnung auf der MECA (gemäß Ouldali et al. 2020).
-
Ausgehend vom Stand der Technik in Ouldali et al. 2020 stellte sich für die Erfinder die Frage, wie die hohe Empfindlichkeit der Nanopore für Peptidgröße oder -volumen für die eigentliche Sequenzidentifizierung bei Heteropolymeren bzw. zur Proteinidentifizierung und -sequenzierung genutzt werden kann.
-
Um dieses Problem zu lösen, erforschten die Erfinder einen Ansatz, auch „Nanopore-Leiter-Sequenzierung“ genannt, bei dem Peptide (oder andere Heteropolymere), die zunächst vorzugsweise durch enzymatische bzw. chemische bzw. physikalische Spaltung von Proteinen erzeugt werden können, vorzugsweise mit bekannten chromatographischen oder elektrophoretischen Methoden getrennt werden, oder bei dem Peptide oder andere Heteropolymere bereits isoliert vorliegen, und, vorzugsweise in einem zweiten Schritt, entweder der Wirkung von Exopeptidasen, die einzelne N- oder C-terminale Aminosäuren von einem Peptid abspalten, oder chemischen Methoden wie der Edman-Reaktion unterworfen werden, um eine Mischung von Peptiden bzw. Heteropolymeren, also ein Fragmentgemisch, zu erzeugen, bei der mehrere Spezies bzw. charakteristische Fragmentarten in einer Repräsentanzmenge vorhanden sind, die vorzugsweise alle oder die meisten möglichen Fragmente darstellen, die durch die Entfernung der Aminosäuren (bzw. Monomerbausteine) nacheinander erzeugt werden, so dass für ein Peptid (bzw. ein Heteropolymer) des Polymerisationsgrades (d. p.) n, alle oder die meisten Spezies von d.p. n-(n-1), n-(n-2)....bis n(n-n) vorhanden sind. Jede dieser Spezies wird bei der Wechselwirkung mit der Nanopore ein charakteristisches Maximum im Histogramm der relativen Restströme (charakteristischer Reststromwert bzw. -betrag) ergeben.
-
Die Messnachweise zeigen die Fähigkeit der Erfindung, hier beispielsweise kurze, bekannte Peptidsequenzen auf diese Weise mit den Daten der Nanoporen zu korrelieren (siehe 4). 4 zeigt:
- A, B: Streudiagramme mit Ereignis-Histogramm, erhalten aus der Interaktion von Aerolysin mit zwei Peptidleitern, die einen Triarginin-Griff enthalten. Die Entfernung von aa führt zu einer artspezifischen Verschiebung des Reststroms, die für einen Monomerbausteinart (hier aa) charakteristisch ist.
- C,D: Plot der Änderung des Peptidvolumens und des relativen Reststroms für die beiden oben gezeigten Leitern. Eine klare Korrelation zwischen den beiden Parametern sowie die Sequenzabhängigkeit ist offensichtlich.
-
5a zeigt ein beispielhaftes erfindungsgemäßes Verfahren 100 zur Identifikation einer Sequenz von Monomerbausteinen eines biologischen oder synthetischen Heteropolymers, aufweisend die Schritte:
- a) Durchführen eines Fragmentierungsverfahrens, bei dem das Heteropolymer insbesondere enzymatisch, chemisch und/oder physikalisch fragmentiert wird, und dadurch ein Fragmentgemisch erhalten wird, dessen Fragmente Moleküle mit unterschiedlichen Sequenzabschnitten des Heteropolymers sind; (101)
- b) Durchführen eines Strommessverfahrens, bei dem Stromsignale eines Stroms durch eine Nanopore erfasst werden, wobei jedes Stromsignal auf der Interaktion eines Fragments mit der Nanopore basiert, wobei die Stromsignale für die unterschiedlichen Fragmente charakteristisch sind, so dass eine Repräsentanzmenge von charakteristischen Stromsignalen ermittelbar ist, die das Fragmentgemisch repräsentiert; (102)
- c) Durchführen eines Auswertungsverfahrens, bei dem die Sequenz der Monomerbausteine des Heteropolymers aus der Repräsentanzmenge der charakteristischen Stromsignale bestimmt wird. (103)
-
Das Verfahren 100 kann insbesondere verwendet werden bei einem Verfahren (200) zur Ermittlung der Primärstruktur eines Proteins, aufweisend die Schritte (siehe 5b)
- i) Spaltung des Proteins, insbesondere durch enzymatische und/oder chemische und/oder physikalische Spaltung, um Peptide als Spaltungsprodukte des Proteins zu gewinnen; optional: Gewinnen der Peptide durch chromatographische oder elektrophoretische Trennung eines durch die Spaltung erhaltenen Peptidgemischs; (201)
- ii) Anwendung des erfindungsgemäßen Verfahrens zur Ermittlung der Sequenzfolge von Aminosäuren (Monomerbausteine) mindestens eines, insbesondere jedes, der Peptide (Heteropolymer); (202 bzw. 100)
- iii) Durchführen eines Proteinerkennungsverfahrens, bei dem die Primärstruktur des Proteins aus der Sequenzfolge des mindestens einen Peptids ermittelt wird. (203) Hierzu kann insbesondere das Verfahren 100 für alle durch Spaltung des Proteins erhaltenen Peptide durchgeführt werden.
-
Das Auswertungsverfahren (103 bzw. 300), bei dem die Sequenz der Monomerbausteine des Heteropolymers aus der Repräsentanzmenge der charakteristischen Stromsignale bestimmt wird, kann insbesondere folgende Schritte (siehe 5c) aufweisen:
- A) Ermitteln von Reststromwerten aus den Messdaten, wobei ein Reststrom die Interaktion eines der unterschiedlichen Fragmente des Heteropolymers mit einer Nanopore beschreibt; (301)
- B) Statistisches Ermitteln einer Repräsentanzmenge von charakteristischen Reststromwerten aus den Reststromwerten, wobei ein charakteristischer Reststromwert jeweils eine Fragmentart, insbesondere Fragmentgröße, der Anzahl n von Fragmentarten eines aus dem Heteropolymer gebildeten Fragmentgemischs beschreibt, wobei die Repräsentanzmenge die Heteropolymersequenz eindeutig, jedenfalls aber ausreichend für eine gewünschte Strukturaufklärung oder Strukturvorhersage, beschreibt; (302)
- C) Sortieren der charakteristischen Reststromwerte nach deren Betrag zu einer Reststromwertabfolge und Ermitteln der Stromwertdifferenzen aufeinanderfolgender Stromwerte der Reststromwertabfolge; (303) und
- D) Zuordnen der Stromwertdifferenzen zu Monomerbausteinarten des Heteropolymers anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten welche Monomerbausteinart durch welchen Stromwertbetrag repräsentiert wird, um die Bestimmung der Abfolge von Monomerbausteinarten vorzunehmen (Bestimmung der Sequenz von Monomerbausteinen des Heteropolymers). (304)
-
Experimentelle Daten und Ausführungsbeispiel
-
Nachfolgend wird ein Ausführungsbeispiel der Erfindung beschrieben, bei dem die vollständige Sequenz von synthetischen Peptiden aufgeklärt wird, unter anderem auch in einem Doppelblind-Versuch:
- Im vorliegenden Ausführungsbeispiel wird das erfindungsgemäße Verfahren beschrieben als „Verfahren zur Peptidsequenzerkennung im Hinblick auf Peptidsequenzierung in einem derivatisierungsfreien Einzelmolekülexperiment unter Verwendung der wt-Aerolysin (wt-AeL) Nanopore durch eine Bottom-up-Peptidleiterstrategie“. In diesem Forschungsexperiment wurden sechs Peptid-Leiter-artige Probenpools entworfen. Jeder Pool bestand aus demselben Deka-Peptid, aber mit einer verwürfelten Sequenz und der jeweiligen Leiter (englisch: ladder) bis hinunter zum polykationischen Tri-Arginin-Träger.
- Durch Einzelmolekül-Widerstandspulsexperimente (Nanoporengrößenspektroskopie) wurde der Nachweis von speziesabhängigen charakteristischen Unterschieden in den Reststromstärken für jedes Peptid mit Identifikation der jedem Schritt der Leiterbildung entsprechenden, einzelnen Aminosäure (aa) gezeigt, was die Grundlage für die Peptidsequenzierung gemäß der Erfindung legt. Darüber hinaus wird das Potenzial dieses einfachen Ansatzes als Benchmark-Technik im Laboralltag durch eine Doppelblindstudie in einem anderen Labor beschrieben, in der zwei blind ausgewählte Peptide aus dem Probenpool anhand ihrer aa-Sequenz identifiziert und unterschieden wurden.
-
Design von Peptidleitern und Messung
-
Das Ausführungsbeispiel verwendet die wt-AeL-Nanopore. Es wurde ein Deka-Peptid entworfen, das aus einem polykationischen C-terminalen Träger, R3, besteht, dem eine heterogener Abschnitt von sieben aa vorangestellt sind die sich aus den fünf unterschiedlichen aa SRAKY rekrutieren (z.B. SRASKYR). In einem zweiten Schritt wurde die Sequenz des aa-Teils verwürfelt, um sechs verschiedene Hetero-Deka-Peptide zu erhalten, die die exakt gleiche Masse von 1335,65 Da besitzen (6a). Als nächstes wurden Peptid-Leitern (Fragmentgemische) für jedes Deka-Peptid bis hinunter zu R3 (aa7R3, As6R3, ..., aa1R3, R3) gebildet, was zu einer Gesamtheit von 42 Proben führte. Durch das sukzessive Hinzufügen der Peptide einer Leiter zur Messkammer mit der Nanopore wurde ein schrittweiser Abbau eines Peptids in einem Leitergenerierungsprozess simuliert (z.B. Edmann-Abbau). Der Schritt entspricht somit dem Schritt a) des erfindungsgemäßen Verfahrens.
-
Schritt b) des erfindungsgemäßen Verfahrens, bzw. Schritte A) und B), wurde ausgeführt wie folgt: In einem typischen Experiment wurde ein einzelner wt-AeL-Kanal in eine DPhPC-Lipiddoppelschicht eingefügt, die eine einzelne 50 µm große Öffnung des verwendeten Mikroelektroden-Cavity-Arrays (MECA16) überspannt. Eine trans-negative Vorspannung von 40 mV wurde verwendet, um einen Ionenstrom (lo) durch den Proteinkanal zu treiben, der zwei ansonsten durch die Lipiddoppelschicht voneinander elektrisch isolierte, mit Elektrolytlösung (4 M KCI) gefüllte Reservoirs verbindet. Einzelne Peptide, die in den durch das Protein definierten Kanal eindringen und dadurch den Ionenstrom (I) verändern, werden über die resultierenden Widerstandsimpulse detektiert, 6b. Leiter-Experimente wurden durchgeführt, indem alle Peptide einer Leiter nacheinander in äquimolaren Mengen zugegeben wurden, beginnend mit aa1R3 bis aa7R3-Figur 6e zeigt schematisch ein Ergebnis eines auf Nanoporen basierenden Peptid-Leiter-Experiments. Die Peptidleiter eines aa7R3-Peptids würde aus acht Peptiden bestehen, von denen jedes zu einem einzelnen Maximum im Histogramm der ereignisgemittelten Reststromwerte führt. Die Abfolge der Maxima des Reststromhistogramms repräsentiert die Sortierung der gemessenen Stromsignalwerte I als Bruchteile des Stroms durch die unblockierte Pore lo (auch bezeichnet als relative Reststromwerte (I/Io) oder relative Restleitfähigkeiten mit möglichen Werten zwischen 0 und 1) in eine Abfolge charakteristischer Reststromwerte (Schritt C)). Es definiert somit eine Repräsentanzmenge von 8 unterschiedlichen, charakteristischen Reststromwerten mit einer ebenfalls charakteristischen Streuung, die jeweils ein Fragment der Peptidleiter repräsentieren. Es ist zu erwarten, dass das längste Peptid, aa7R3, zur tiefsten Blockade führt, während das kürzeste Peptid, R3, mit dem höchsten I/Io vertreten wäre. Dann ist auch die Abfolge der Maxima den Stufen der Leiter klar zuzuordnen und es entspricht der Unterschied in I/Io von zwei benachbarten Maxima dem Unterschied, den die Abspaltung einer einzelnen aa im Leitergenerierungsprozess erzeugen würde (genutzt in Schritt D). Die Grösse des Abstandes ΔI/Io ist dabei empfindlich für die Identität der abgespaltenen aa, was die Identifizierung der Sequenz des Peptids erleichtert.
-
Ein Auswertungsverfahren, bei dem die Sequenz der Monomerbausteine (hier: aa) des Heteropolymers (hier: Peptid) aus der Repräsentanzmenge der charakteristischen Stromsignale bestimmt wird, ergibt sich aus der Verwendung der Differenzen ΔI/Io der Reststromwerte benachbarter Maxima in der Repräsentanzmenge charakteristischer Reststromwerte. Schritt D, das Ermitteln der oben genannten aa, erfolgt durch Zuordnen der Reststromwertdifferenzen ΔI/Io zu aa des Peptids anhand von vorbekannten Korrelationsdaten, die Informationen darüber enthalten, welche aa durch welchen Stromwertdifferenzbetrag ΔI/Io repräsentiert wird, um die Bestimmung der Abfolge von aa vorzunehmen (Bestimmung der Sequenz von As des Peptids).
-
6c und 6d zeigen beispielhafte Rohdaten (Stromspuren) für die Messung der Leiter L1. Nach Zugabe von Peptiden (d) wurden Widerstandsimpulse unterschiedlicher Tiefe und Dauer detektiert. Es war zu sehen, dass einzelne Widerstandspulse stark moduliert waren, aber um eine Verfälschung der I/Io-Werte zu verhindern, wurden diese Modulationen ausgeschlossen und nur der Hauptpegel eines Impulses in der Datenanalyse berücksichtigt. Solche Modulationen werden durch die Bewegung des Polymers selbst innerhalb der AeL-Nanopore induziert.
-
6a: Sequenzen der sechs Heterodeca-Peptide, die jeweils das Startpeptid einer Leiter darstellen. Schwarze gestrichelte Kästen symbolisieren Verschiebungen von aa-Kassetten, schwarze (und graue) Linien symbolisieren Inversion, während farbige Linien Identität von aa in den unterschiedlichen Sequenzen symbolisieren; b: Schematische Darstellung des experimentellen Aufbaus. Eine externe trans-negative Spannung wird angelegt, um einen Ionenstrom lo durch die offene Nanopore zu treiben. Peptide, die in die Nanopore eindringen, verändern den Strom, was zu einem Widerstandsimpuls führt (rote Kurve); c: Kontrollmesskurve in 4 M KCI unter einer trans-negativen Spannungsklemme von 40 mV, digitalisiert mit 1 MHz Abtastrate, gefiltert mit einem 8-Pol Bessel-Filter bei einer Eckfrequenz von 50 kHz und digital nachgefiltert mit 25 kHz; d: Beispielhafte Messkurve nach Zugabe der Peptidleiter L1 mit allen Peptiden in äquimolarer Konzentration (H-SRASKYR-R3-OH, H-RASKYR-R3-OH, H-ASKYR-R3-OH, H-SKYR-R3-OH, H-KYR-R3-OH, H-YR-R3-OH, H-R-R3-OH); e: Schematisches, über das Hauptniveau gemitteltes Pegelhistogramm für ein Peptidleiter-Sequenzierungsexperiment. Das längste Peptid (aa7R3) erzeugt den tiefsten, das kürzeste Peptid (aa1R3) den flachsten Block. Die Unterschiede in den I/Io-Werten (blaue Linien) können mit der Identität des verlorenen aa korreliert werden. Die letzte aa kann gegen das polykationischen C-terminalen Trägerpeptid, R3 (schwarz), bestimmt werden.
-
Um eine korrekte Zuordnung der Maxima zu den Peptiden zu gewährleisten, wurden die Leitern nacheinander gemessen, beginnend mit dem kleinsten Peptid. Die oben ausgesprochene Erwartung einer monotonen Beziehung zwischen Peptidlänge und Tiefe des Blocks bestätigte sich. Auf dieser Grundlage konnte, diesem experimentellen Weg folgend, jedes der 42 Peptide innerhalb aller sechs Leitern identifiziert werden (7). Unterschiede im Abstand zweier benachbarter Maxima in den Histogrammen sind deutlich sichtbar und deuten bereits auf einen vermuteten Zusammenhang zwischen ΔI/Io und der Identität des gespaltenen aa hin. (Suppl. 1 - Suppl. 6)
-
7: Verweilzeit-Streudiagramme gegen dem Restporenstrom I/Io (rot) mit überlagerten Histogrammen der über das Hauptstromniveau der resistiven Pulse gemittelten relativen Reststromwerte (schwarz) für alle sechs Peptidleitern. Die Peptide wurden sequentiell hinzugefügt, beginnend mit dem kleinsten Peptid aa1R3 und endend mit dem größten Peptid aa7R3. Alle Messungen einer Leiter wurden unter Verwendung derselben AeL-Nanopore durchgeführt. Zusätzlich zeigt die grüne Linie die Lage des separat bestimmten polykationischen C-terminalen Trägerpeptids, R3, an.
-
Es wurden alle aufgezeichneten Widerstandsimpulse in den Datensätzen hinsichtlich der Ereignisdauer (Verweilzeit) und der Amplitude (I/Io) sowie der Anzahl der Modulationen analysiert. Die berechneten Differentiale, d.h. Änderungen dieser Werte von einem Maximum zum nächsten, wurden dann zusammen mit den Differentialen für das Volumen und die Hydrophobizität des Peptids gegen die jeweilige Position im Peptid aufgetragen, 8. Um einen direkten Vergleich aller Experimente zu ermöglichen, wurden alle Differentialwerte mit ihrem Maximum und Minimum innerhalb des Intervalls [0,1] doppelt normiert. Es ergab sich, dass ΔI/Io mit dem ΔVolumen (vol) korreliert, was darauf hinweist, dass der größte Beitrag zur Blockade durch das Volumen des Analyten verursacht wird. So wurde das größte ΔI/Io immer für Arginin, die größte aa, gefunden. Unerwarteter weise wies Serin, abgesehen von einer Ausnahme in L2, immer die kleinste Blockade auf, obwohl die kleinste Volumenänderung für Alanin zu erwarten war. Bemerkenswert ist, dass das ΔI/Io für ungeladene und hydrophile aa, Tyrosin und Serin, im Vergleich zu ihrem ΔVol immer untergewichtet war, während das hydrophobe Alanin als übergewichtet gefunden wurde. Auf der anderen Seite zeigten geladene aa, Arginin und Lysin, ein anderes Verhalten. Während Arginin in langen Peptiden leicht übergewichtet war, ergab sich, dass es in kurzen Peptiden untergewichtet war. Der umgekehrte Befund fand sich für Lysin.
-
8: Datenkorrelationsplots für alle sechs Peptidleitern. Verweilzeit-Streudiagramme und über den Hauptpegel gemittelte Pegelhistogramme wurden hinsichtlich ihrer Unterschiede in Verweilzeit (rot), Reststrom (blau) und Anzahl der Modulationen (schwarz, gepunktet) analysiert. Die entsprechenden Peptidvolumina (grün) und die Hydrophobizität (schwarz, gestrichelt) wurden ebenfalls aufgetragen. Alle Werte wurden doppelt normiert, um eine direkte Vergleichbarkeit zu ermöglichen.
-
Doppelblindversuch
-
Um die Reproduzierbarkeit und Zuverlässigkeit der oben beschriebenen Ergebnisse zu untersuchen, wurde ein Doppelblind-Experiment durchgeführt. Sechs Peptid-Leiterproben wurden vorbereitet, die jeweils aus aa1R3 bis aa7R3 in äquimolaren Mengen bestanden. Ein als Notar fungierender unabhängiger Dritter wählte zufällig zwei der sechs Leiterproben aus, beschriftete sie mit A & B und schickte sie zusammen mit einer R3-Homo-Peptidprobe an ein fremdes Vergleichslabor (Arbeitsgruppe Abdelghani Oukhaled, Universite Cergy Pontoise, Frankreich). Zusätzlich zu den Leitern wurde zunächst nur 9b als Lesehilfe für die Leitern übermittelt, und zwar zusammen mit der Information, dass alle Leitern aus einem Triarginin (R3) C-Terminus und der stöchiometrischen Summenformel A1K1R2S2Y1, in jeder möglichen Kombination bestehen. Im Vergleichslabor wurden die Proben unter identischen Bedingungen, jedoch mit abweichender Apparatur untersucht. Die Auswertung der Daten, insbesondere die Bestimmung der I/Io-Werte erfolgte darüberhinaus mit eigenen, von der des Erfinderlabors signifikant verschiedenen Algorithmen und Software-Routinen.
-
Aufgrund alleiniger Verwendung von 9b wurde die Sequenz von Probe A im Vergleichslabor korrekt bestimmt (KSRASRY, L3), für Probe B (10) wurde die Teilsequenz xxSRASx (also über die Hälfte der variablen Sequenzanteile) auch hier richtig erkannt und positioniert.
-
10: Verweilzeit-Streudiagramme über dem Porenreststrom I/Io (rot) mit überlagerten pegelgemittelten Histogrammen (schwarz) Probe A (links) und B (rechts). Unterhalb jeder Grafik sind die, unter Verwendung der ersten Lesehilfe, vorgeschlagenen Sequenzen (prop) sowie die korrekten Sequenzen (corr) dargestellt. Der grüne Kasten zeigt das korrekte Leseraster an.
-
Resümee
-
Das Ausführungsbeispiel zeigt das erfindungsgemäße Verfahren zur Peptid-Identifizierung mittels Ladder-Fingerprinting, das insbesondere unter Verwendung der hochempfindlichen wt-AeL-Nanopore als primäre Plattform für eine Weiterentwicklung in Richtung Peptidsequenzierung dienen kann. Es wurde eine zuverlässige Detektion von Hetero-Peptiden, die aus einem c-terminalen polykationischen R3-Träger und bis zu sieben n-terminalen alternierenden heterogenen aa bestehen, erreicht.. Durch die Verwendung von Peptidleiter-ähnlichen Probenpools, die von aa1R3 bis aa7R3 reichen, wurde der positionssensitive Beitrag einer spezifischen aa-Spezies zur Gesamt-Blocktiefe eines Peptids untersucht und basierend auf diesen Erkenntnissen wurde eine Sequenzierungs- sowie Fingerprinting-Lesehilfe postuliert. Mit deren Hilfe wurde die Robustheit und Zuverlässigkeit dieser Strategie in einer Doppelblindstudie bewiesen, indem die Sequenzierung eines zufällig ausgewählten Peptids und die Identifizierung eines zweiten Peptids durch Fingerprinting demonstriert wurden.
-
In diesem Ausführungsbeispiel wurden Peptide verwendet, die bedarfsgerecht synthetisiert wurden. Dies ist ein Modellfall, der sich für den Fall unbekannter Protein- oder Peptidproben einfach adaptieren lässt. Die umfassendere Analyse größerer Heteropolymere gelingt durch einen initialen Schritt der Spaltung des Heteropolymers mittels Fragmentierungsverfahren in weiter fragmentierbare Unterbestandteile, aus denen dann Leitern gebildet werden Beispielsweise können Proteine in einem standardisierten Probenvorbereitungsprozess verfügbar gemacht werden. Ähnlich wie bei standardmäßigen Bottom-up-MS-Proteinsequenzierungs-experimenten kann z.B. eine Endo-Peptidase verwendet werden, um Proteine in kleinere Peptide zu zerlegen. Weiterhin kann eine Exo-Peptidase verwendet werden, um aus diesen Peptiden dynamisch Leitern zu erzeugen. Einzelne Peptide, die von der Protease produziert werden, könnten sequenziell der Nanopore präsentiert werden und in einem dynamischen Exopeptidase-gekoppelten Experiment analysiert werden. Es ergibt sich ein großer Wert des erfindungsgemäßen Verfahrens im Hinblick auf alltägliche Laboranwendungen.
-
Material und Methoden
-
Reagenzien
-
Alle Messungen wurden in AgCl (Carl Roth GmbH, Karlsruhe, Deutschland) gesättigtem 4 M KCl (Carl Roth GmbH, Karlsruhe, Deutschland), gepuffert mit 25 mM TRIS (Merck KGaA, Darmstadt, Deutschland) bei pH 7,5 durchgeführt. Alle Lösungen wurden mit 18,2 MΩ·cm-1 Milli-Q-Wasser hergestellt. Nach der Äquilibrierung wurden die Elektrolytlösungen filtriert (0,22 µm) und lichtgeschützt gelagert. Die Peptide wurden nach den gewünschten Anforderungen von der Intavis Peptide Services GmbH & Co. KG (Tübingen, Deutschland) synthetisiert. Von allen Peptiden wurden Stammlösungen (750 µM) in 10 mM HEPES, pH 7,5 hergestellt und bis zur Verwendung bei -20 °C gelagert. Die Reagenzien wurden in einer Endkonzentration von 5 µM verwendet.
-
Protein- und Lipidpräparation
-
Wildtyp-Proaerolysin (pAeL) wurde intern über Standardprotokolle aus E.coli BL21 (DE3)-pLysS-kompetenten Zellen unter Verwendung des pET22b (+)-Vektors hergestellt. pAeL wurde aus Zelllysaten über His-Tag-Chromatographie gereinigt. Stöcke von pAeL wurden mit 1 µg·µL-1 hergestellt, mit Stickstoff eingefroren und bei -80 °C gelagert. Aufgetautes pAeL wurde mit Trypsin (Promega GmbH, Walldorf, Deutschland) aktiviert und in einer pAeL-Endkonzentration von 20 pmol·L-1 (bzw. 3 pmol·L-1 AeL) verwendet. Das Präproteinkonstrukt wurde dabei so gewählt, dass der zur Aufreinigung verwendete Affinitätstag bei der Trypsinaktivierung vom Protein abgetrennt und natives Protein erhalten wird.
-
Alle Membranen wurden aus 1,2-Diphytanoyl-sn-glycero-3-phosphocholin (DPhPC) aus Oktan hergestellt. DPhPC wurde von Avanti Polar Lipids Inc. (Alabaster, AL, USA) in Chloroform gelöst. Die Lipide wurden aliquotiert, unter Argon getrocknet und als Trockenfilm bei -20 °C gelagert, bis sie in einer Konzentration von 1 mg·mL-1 verwendet wurden.
-
Nanoporen-Messungen Erfinderlabor
-
Alle Aufnahmen wurden mit einem Axopatch 200B (Molecular Devices, San Jose, CA, USA) im kapazitiven Rückkopplungsmodus durchgeführt, dessen 4-polige Bessel-Filtereckfrequenz auf 100 kHz bei einer Digitalisierungsrate von 1 MHz eingestellt war. Zwischen Verstärkerausgang und Eingang des Analog/Digitalwandlers war ein 8-Pol-Besselfilter mit einer Eckfrequenz von 50 kHz geschaltet (Model 9002, Frequency Devices, Ottawa, II, USA). Die Digitalisierung erfolgte mit einem National Instruments AD-Wandler (PCI-6251, National Instruments, Austin, TX, USA). Die GePulse-Software (Michael Pusch, Universität Genua, Italien) wurde für die Haltepotentialsteuerung und Datenaufzeichnung verwendet. Einzelmolekül-Widerstandspulse wurden unter 40 mV transnegativer Spannung gesammelt. Um möglichst viele parasitäre Kapazitäten zu eliminieren, wurden MECA16 Cavity Arrays der lonera GmbH (Freiburg, Deutschland) mit Kavitäten von 50 µm Durchmesser verwendet. Die weitere digitale Filterung (25 kHz Bessel) und Ereignisdetektion erfolgte mit selbstgeschriebener LabView (National Instruments) -basierter Software; die anschließende Auswertung mit Igor Pro 8 (Wavemetrics, Lake Oswego, OR, USA).
-
Nanoporen-Messungen Veraleichslabor:
-
Alle Aufnahmen wurden mit einem Axopatch 200B (Molecular Devices, San Jose, CA, USA) im resistiven Rückkopplungsmodus durchgeführt, dessen 4-polige Bessel-Filtereckfrequenz bei einer Digitalisierungsrate von 100 kHz auf 5 kHz eingestellt war. Für die Messungen wurde ein klassisches, vertikales Kammersystem der Fa. Warner Instruments (Hamden, CT, USA) mit Aperturen von 150 µm Durchmesser verwendet. Die Digitalisierung erfolgte dem DigiDatat 1440A AD-Wandler und der Software Clampex10 (Molecular Devices). Die Auswertung erfolgte mit hauseigenen Routinen, die in IgorPro 8 realisiert wurden. Suppl. 1 (Ergänzung 1): ermittelte Werte aus Peptidleiter L1
Ladder L1 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Io | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
SRASK YR-R3 | | 0.3686 | - | - | 9.073 | - | - | 3.35 | - | - |
RASK YR-R3 | S | 0.3922 | 0.0235 | 0.0000 | 10.419 | -1.346 | 0.000 | 3.07 | 0.29 | 0.35 |
ASK YR-R3 | R | 0.4965 | 0.1044 | 1.0000 | 3.909 | 6.510 | 1.000 | 2.55 | 0.52 | 0.645 |
SK YR-R3 | A | 0.5360 | 0.0395 | 0.1975 | 2.412 | 1.497 | 0.361 | 1.75 | 0.80 | 1.00 |
K YR-R3 | S | 0.5622 | 0.0262 | 0.0329 | 2.034 | 0.379 | 0.220 | 1.59 | 0.16 | 0.19 |
YR-R3 | K | 0.6487 | 0.0865 | 0.7782 | 0.690 | 1.344 | 0.342 | 1.14 | 0.46 | 0.57 |
R-R3 | Y | 0.7259 | 0.0772 | 0.6642 | 0.167 | 0.523 | 0.238 | 1.01 | 0.13 | 0.15 |
R3 | R | 0.8067 | 0.0809 | 0.7089 | 0.021 | 0.146 | 0.190 | 1.00 | 0.01 | 0.00 |
Suppl. 2 (Ergänzung 2): ermittelte Werte aus Peptidleiter L2
Ladder L2 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Iο | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
KSRYA RS-R3 | | 0.3792 | - | - | 4.952 | - | - | 4.03 | - | - |
SRYA RS-R3 | K | 0.4418 | 0.0625 | 0.4837 | 2.120 | 2.832 | 1.000 | 1.90 | 2.14 | 1.00 |
RYA RS-R3 | S | 0.4837 | 0.0419 | 0.0993 | 1.891 | 0.229 | 0.076 | 1.68 | 0.22 | 0.10 |
YA RS-R3 | R | 0.5739 | 0.0902 | 1.0000 | 0.694 | 1.198 | 0.420 | 1.22 | 0.46 | 0.22 |
A RS-R3 | Y | 0.6481 | 0.0742 | 0.7003 | 0.233 | 0.460 | 0.158 | 1.03 | 0.19 | 0.09 |
RS-R3 | A | 0.6846 | 0.0366 | 0.0000 | 0.164 | 0.070 | 0.020 | 1.02 | 0.01 | 0.00 |
S-R3 | R | 0.7603 | 0.0756 | 0.7279 | 0.035 | 0.128 | 0.040 | 1.00 | 0.02 | 0.01 |
R3 | S | 0.8067 | 0.0465 | 0.1848 | 0.021 | 0.014 | 0.000 | 1.00 | 0.00 | 0.00 |
Suppl. 3 (Ergänzung 3): ermittelte Werte aus Peptidleiter L3
Ladder L3 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Iο | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
KSRAS RY-R3 | | 0.3869 | - | - | 4.082 | - | - | 3.05 | - | - |
SRAS RY-R3 | K | 0.4444 | 0.0575 | 0.3533 | 2.695 | 1.387 | 0.72128 | 1.99 | 1.06 | 1.00 |
RAS RY-R3 | S | 0.4749 | 0.0305 | 0.0000 | 2.847 | -0.152 | 0.000 | 1.98 | 0.01 | 0.00 |
AS RY-R3 | R | 0.5819 | 0.1069 | 1.0000 | 0.865 | 1.982 | 1.000 | 1.39 | 0.60 | 0.56 |
S RY-R3 | A | 0.6233 | 0.0414 | 0.1424 | 0.479 | 0.385 | 0.252 | 1.13 | 0.25 | 0.23 |
RY-R3 | S | 0.6564 | 0.0331 | 0.0331 | 0.417 | 0.063 | 0.101 | 1.09 | 0.04 | 0.03 |
Y-R3 | R | 0.7442 | 0.0878 | 0.7497 | 0.105 | 0.312 | 0.218 | 1.01 | 0.08 | 0.07 |
R3 | Y | 0.8067 | 0.0626 | 0.4191 | 0.021 | 0.084 | 0.111 | 1.00 | 0.01 | 0.00 |
Suppl. 4 (Ergänzung 4): ermittelte Werte aus Peptidleiter L4
Ladder L4 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Iο | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
RYSRA SK-R3 | | 0.3627 | - | - | 4.173 | - | - | 1.72 | - | - |
YSRA SK-R3 | R | 0.4372 | 0.0745 | 0.7394 | 2.608 | 1.565 | 1.000 | 1.52 | 0.20 | 0.59 |
SRA SK-R3 | Y | 0.5226 | 0.0854 | 0.9493 | 1.482 | 1.126 | 0.717 | 1.18 | 0.34 | 1.00 |
RA SK-R3 | S | 0.5585 | 0.0359 | 0.0000 | 1.052 | 0.430 | 0.269 | 1.08 | 0.09 | 0.27 |
A SK-R3 | R | 0.6465 | 0.0880 | 1.0000 | 0.270 | 0.782 | 0.496 | 1.01 | 0.07 | 0.21 |
SK-R3 | A | 0.6863 | 0.0398 | 0.0745 | 0.142 | 0.128 | 0.074 | 1.01 | 0.00 | 0.01 |
K-R3 | S | 0.7307 | 0.0444 | 0.1629 | 0.130 | 0.012 | 0.000 | 1.00 | 0.01 | 0.02 |
R3 | K | 0.8067 | 0.0760 | 0.7695 | 0.021 | 0.109 | 0.062 | 1.00 | 0.00 | 0.00 |
Suppl. 5 (Ergänzung 5): ermittelte Werte aus Peptidleiter L5
Ladder L5 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Iο | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
KRSSR AY-R3 | | 0.3793 | - | - | 3.514 | - | - | 2.35 | - | - |
RSSR AY-R3 | K | 0.4404 | 0.0611 | 0.3874 | 2.353 | 1.161 | 0.732 | 1.86 | 0.48 | 0.95 |
SSR AY-R3 | R | 0.5352 | 0.0948 | 1.0000 | 0.783 | 1.570 | 1.000 | 1.36 | 0.51 | 1.00 |
SR AY-R3 | S | 0.5780 | 0.0428 | 0.0548 | 0.666 | 0.116 | 0.046 | 1.24 | 0.12 | 0.23 |
R AY-R3 | S | 0.6178 | 0.0398 | 0.0000 | 0.616 | 0.051 | 0.003 | 1.14 | 0.10 | 0.19 |
AY-R3 | R | 0.6968 | 0.0790 | 0.7127 | 0.147 | 0.468 | 0.277 | 1.02 | 0.13 | 0.24 |
Y-R3 | A | 0.7435 | 0.0468 | 0.1263 | 0.101 | 0.046 | 0.000 | 1.00 | 0.01 | 0.02 |
R3 | Y | 0.8067 | 0.0632 | 0.4262 | 0.021 | 0.080 | 0.023 | 1.00 | 0.00 | 0.00 |
Suppl. 6 (Ergänzung 6): ermittelte Werte aus Peptidleiter L6
Ladder L6 |
sequence | loss of | I/Io | ΔI/Iο | norm ΔI/Iο | dwell-time /ms | Δ dwell-time /ms | norm Δ dwell-time | n_m2 | Δ dn_m2 | norm Δ dn_m2 |
SKRYS RA-R3 | | 0.3937 | - | - | 4.738 | - | - | 2.28 | - | - |
KRYS RA-R3 | S | 0.4179 | 0.0242 | 0.0000 | 4.811 | -0.073 | 0.000 | 2.11 | 0.17 | 0.32 |
RYS RA-R3 | K | 0.4901 | 0.0722 | 0.7117 | 2.087 | 2.723 | 1.000 | 1.58 | 0.53 | 1.00 |
YS RA-R3 | R | 0.5817 | 0.0916 | 1.0000 | 0.712 | 1.376 | 0.518 | 1.24 | 0.34 | 0.65 |
S RA-R3 | Y | 0.6601 | 0.0784 | 0.8047 | 0.268 | 0.443 | 0.185 | 1.02 | 0.22 | 0.42 |
RA-R3 | 5 | 0.6919 | 0.0318 | 0.1129 | 0.218 | 0.051 | 0.044 | 1.01 | 0.01 | 0.02 |
A-R3 | R | 0.7627 | 0.0708 | 0.6917 | 0.050 | 0.167 | 0.086 | 1.00 | 0.01 | 0.01 |
R3 | A | 0.8067 | 0.0441 | 0.2950 | 0.021 | 0.029 | 0.037 | 1.00 | 0.00 | 0.00 |
Suppl. 7 (Ergänzung 7): ermittelte Werte für I/Io und Verweilzeit von Homo-Arginin-Peptiden. Ensslen et al. Bezeichnet das erfindungsgemäße Ausführungsbeispiel.
| Piguet et al. (-50 mV) | Ensslen et al. (-40 mV) |
Rx | I/Io | ΔI/Iο | dwell-time /ms | Δdwell-time /ms | I/Io | dwell-time /ms |
10 | 0.234 | - | 72.0 | - | - | - |
9 | 0.286 | 0.052 | 31.0 | 41.0 | - | - |
8 | 0.353 | 0.067 | 14.2 | 16.8 | - | - |
7 | 0.435 | 0.082 | 6.2 | 8.0 | 0.4371 | 7.23 |
6 | 0.530 | 0.095 | 2.3 | 3.9 | - | - |
5 | 0.631 | 0.101 | 0.9 | 1.4 | 0.6309 | 0.86 |
4 | 0.731 | 0.1 | - | - | 0.7259 | 0.167 |
3 | - | - | - | - | 0.8067 | 0.02 |
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 2019/0317006 A1 [0015]
- WO 2013/083270 [0052]