-
Die Erfindung betrifft Mittel und Verfahren zur Modifizierung der 5’-Kappe von RNA.
-
Durch Untersuchung des Erbguts einer Zelle können wichtige Informationen über deren Zustand gewonnen werden, beispielsweise darüber, ob zelleigene regulatorische Prozesse korrekt ablaufen oder ob hier Veränderungen im Vergleich zum Normalzustand vorliegen. Diese Informationen können dann zum Beispiel für die Feststellung genutzt werden, ob eine Zelle entartet ist, durch Viren infiziert wurde oder sich in einem irregulären bzw. krankhaften Zustand befindet. Auf diese Weise können beispielsweise Rückschlüsse auf etwaige vorliegende Krankheiten gezogen werden.
-
Hierzu ist es beispielsweise bekannt, die Expression von Genen mittels Isolation und Analyse der in den Zellen vorhandenen mRNA-Moleküle zu untersuchen. Um verlässliche Informationen zu erhalten, ist die Qualität der mRNA-Präparation hierbei von besonderer Bedeutung. Da in der Zelle neben mRNAs jedoch zahlreiche weitere Moleküle sowie weitere RNA-Spezies, insbesondere nicht-kodierende RNAs (z.B. sRNAs, tRNA, rRNA, ncRNA, miRNA etc.) vorliegen, muss eine selektive Anreicherung aufgrund spezifischer Merkmale erfolgen. Zur spezifischen Isolierung von mRNA aus Eukaryoten nutzt man deren charakteristischen Merkmale, nämlich den sogenannten Poly(A)-Schwanz am 3’-Ende und die Kappenstruktur am 5’-Ende (J. Pease, R. Sooknanan, Nat Meth 2012, 9; J. S. Marcus, W. F. Anderson, S. R. Quake, Analytical Chemistry 2006, 78, 3084–3089; Z. Y. Yang, H. J. Edenberg, R. L. Davis, Nucleic Acids Res 2005, 33; M. E. Folkers, D. A. Delker, C. I. Maxwell, C. A. Nelson, J. J. Schwartz, D. A. Nix, C. H. Hagedorn, Plos One 2011, 6; Z. Gao, Q. Zhang, Y. Cao, P. Pan, F. Bai, G. Bai, Journal of Chromatography A 2009, 1216, 7670–7676; U. Schibler, D. Rifat, D. J. Lavery, Methods 2001, 24, 3–14; E. Z. Bajak, C. H. Hagedorn, Methods in molecular biology (Clifton, N.J.) 2008, 419, 147–160; A. K. Shukla, A. K. Shasany, S. P. S. Khanuja, Indian journal of experimental biology 2005, 43, 197–201). Über diese Merkmale wird die mRNA normalerweise nicht-kovalent an andere Moleküle gebunden, die beispielsweise an entsprechenden Säulenmaterialien immobilisiert sind (z.B. Bindung über den Poly(A)-Schwanz an Oligo-dT-Säulen oder über die 5’-Kappe an das Protein eIF4E).
-
Zur Isolierung von mRNAs wird derzeit hauptsächlich der enthaltene Poly(A)-Schwanz genutzt. Dieser ist, wie auch die Kappe, eine charakteristische Struktur von reifen mRNA-Molekülen und miRNA-Vorläufern (pri-miRNA). Über diesen Bereich können die Moleküle an immobilisierte, komplementäre Desoxynukleotid(Oligo-dT)-Sonden hybridisieren und somit aus komplexen Proben isoliert werden. Die hierzu benötigten Säulenmaterialien („beads“) sind im Stand der Technik bekannt und werden standardmäßig eingesetzt.
-
Bajak und Hagedorn (
E. Z. Bajak, C. H. Hagedorn, Methods in molecular biology (Clifton, N. J.) 2008, 419, 147–160) haben eine Methode etabliert, bei der eine Variante des Translationsinititaionsfaktors eIF4E zur Isolierung von RNA über deren Kappenstruktur verwendet wird (s. auch
US 6841363 B2 ,
Gowda, Nucleic Acids Research, 2010, 38, 21, 7558–7569). Ein Vorteil hierbei ist, dass RNA-Moleküle unabhängig von der Länge ihres Poly(A)-Schwanzes, lediglich aufgrund der enthaltenen Kappenstruktur identifiziert und angereichert werden, wodurch auch RNAs mit kurzem Poly(A)-Schwanz (sowohl mRNAs als auch Vorläufer von miRNAs) für nachfolgende Analysen zugänglich werden. Zur Durchführung des Assays wird eine eIF4E-Variante, die eine bis zu 10fach höhere Affinität gegenüber den Zielmolekülen als das Wildtyp-Protein aufweist, über einen Protein-Affinitätstag (insbes. Glutathion-S-Transferase, GST) auf Glutathion-Beads immobilisiert und mit der Probe inkubiert. Die RNA mit einer Kappenstruktur bindet nicht-kovalent an das immobilisierte Protein und kann so mit Hilfe der Beads aus der komplexen Probe isoliert werden. Auf diese Weise konnten, unabhängig vom variierenden Motiv des Poly(A)-Schwanzes, RNA-Moleküle Hepatitis-C-infizierter Zellen isoliert werden. Nach Durchführung eines „Next-generation-sequencing“-Experimentes konnten neue Aussagen bezüglich der Änderungen der Genregulation innerhalb der Wirtszelle nach Infektion durch das Virus gemacht werden (
M. Folkers, PLOS one, 2011, 6, 2, e14697, Papic, 2012, Viruses, 2012, 4, 581.612).
-
Ein Nachteil dieser Verfahren ist die fehlende Möglichkeit, RNA-Moleküle direkt kovalent an einen Träger zu binden, wodurch die Auswahl von Waschbedingungen bei der Abtrennung von Verunreinigungen eingeschränkt ist. Darüber hinaus beschränkt auch die häufig vorliegende 1:1-Beziehung zwischen Bindemolekül und RNA-Molekül den Einsatz dieser Verfahren.
-
Dalhoff et al. (Dalhoff C, Lukinavicius G, Klimasăuskas S, Weinhold E., 2006, Nat Chem Biol. 2(1): 31–32) beschreiben den direkten Transfer einer Ethyl-, Propyl-, Propenyl- und 2-Butinylgruppe auf 2’-Desoxycytidin und 2’-Desoxyadenosin durch drei S-Adenosyl-L-methionin(AdoMet)-abhängige DNA-Methyltransferasen über den Einsatz entsprechender Analoga dieses Kofaktors. Dabei trägt das AdoMet-Analogon die entsprechende Gruppe statt einer Methylgruppe am Schwefelatom. Lukinavičius et al. (G. Lukinavičius, V. Lapienė, Z. Staševskij, C. Dalhoff, E. Weinhold, S. Klimašauskas, J. Am. Chem. Soc. 2007, 129, 2758–2759) verwendeten ein weiteres, eine NH2-Gruppe enthaltendes, AdoMet-Analogon zur Übertragung dieser Gruppe mittels geeigneter DNA-Methyltransferasen auf DNA-Nucleoside. Einen ähnlichen Ansatz haben auch Motorin et al. gewählt, die den Einsatz einer Kombination aus enzymatischem Transfer und Click-Chemie zur ortsspezifischen Markierung von tRNA-Molekülen für biophysikalische Studien beschreiben (Y. Motorin, J. Burhenne, R. Teimer, K. Koynov, S. Willnow, E. Weinhold, M. Helm, Nucleic Acids Research, 2010, 1–10, doi:10.1093/nar/gkq825). Dabei wurde AdoEnYn, ebenfalls ein Analogon des Kosubstrats S-adenosyl-L-methionin, verwendet, um den Penteninrest CH≡C-CH=CH-CH2- mittels tRNA:Methyltransferase Trm1 enzymatisch auf das exocyclische N2-Atom des Guanosins an Position 26 einer tRNAPhe zu übertragen. Anschließend wurde ein Fluorophor mittels Cu(I)-katalysierter Azid-Alkin-1,3-dipolarer Cycloaddition (CuAAC) an die modifizierte tRNAPhe gebunden. Ebenfalls wurde sequenspezifisches Click-Labeling von RNA erreicht, indem Box C/D RNP Methyltransferasen verwendet wurden (M. Tomkuvienė, B. Clouet-d’Orval, I. Černiauskas, E. Weinhold, S. Klimašauskas, Nucleic Acids Res 2012).
-
Es besteht jedoch nach wie vor ein Bedürfnis für weitere Möglichkeiten, bestimmte RNA-Moleküle, insbesondere mRNA-Moleküle, aus Zellen zu isolieren und einer Analyse zuzuführen.
-
Die vorliegende Erfindung macht es sich daher zur Aufgabe, solch eine weitere Möglichkeit zur Verfügung zu stellen.
-
Gelöst wird diese Aufgabe durch die Gegenstände der nebengeordneten Ansprüche. Zweckmäßige Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben.
-
Es hat sich überraschend herausgestellt, dass ein an mindestes einer bestimmten Position verändertes Enzym, nämlich die Trimethylguanosinsynthase 2 aus Giardia lamblia (im Folgenden mit „GlaTgs2“ abgekürzt), deren Wildtyp-Sequenz in SEQ ID NO: 1 wiedergegeben ist, neue Möglichkeiten zur Markierung und/oder Isolierung von RNA-Spezies eröffnet, die über eine 5’- m
7GpppN-Kappe verfügen. Bei dieser m
7GpppN-Kappe (engl. „m
7GpppN cap“) handelt es sich um einen an Position N7 methylierten Guanosinrest, der an Position 5’ über eine Triphosphorsäureesterbrücke an das 5’-Ende eines RNA-Moleküls gebunden ist (5’-5’-Verknüpfung), wie aus folgender Formel (II) ersichtlich:
-
1R ist dabei OH oder OCH3. Das B in der obigen Formel steht für eine beliebige Nucleobase. Das N in dem Ausdruck m7GpppN steht für Nucleosid, Nucleotid, Nucleosid- oder Nucleotidanalogon, ppp für die Triphosphatbrücke, G für Guanosin und m7 für die Methylgruppe an N7.
-
Eine solche Kappe weisen beispielsweise eukaryotische mRNA-Moleküle auf, aber auch bestimmte nicht-kodierende RNA-Spezies, z.B. snRNAs, snoRNAs und Telomerase-RNAs.
-
Wildtyp GlaTgs2 (s. SEQ ID NO: 1) weist 258 Aminosäuren auf und katalysiert die weitere Methylierung (Hypermethylierung) des Kappen-Guanosins an Position N2 mit S-adenosyl-L-methionin (AdoMet) als Kofaktor (S. Hausmann et al., J. Biol. Chem. 2008, 283, 31706–31718). Anders als die menschliche Trimethylguanosinsynthase hTgs, die die Übertragung von zwei Methylresten auf N2 katalysieren kann, scheint das Enzym aus Giardia lamblia keine dimethylierten Nukleotide als Substrat zu akzeptieren, so dass durch das Enzym lediglich die Übertragung eines einzelnen Methylrestes auf das N2 erfolgt. Somit dürfte es sich hier eigentlich um eine Dimethylguanosinsynthase und nicht um eine Trimethylguanosinsynthase handeln. Zur Vermeidung von Missverständnissen wird hier jedoch trotzdem der Begriff Trimethylguanosinsynthase oder abgekürzt Tgs für dieses Enzym verwendet.
-
AdoMet wird auch mit „SAM“ abgekürzt und dient diversen Enzymen als Kofaktor zur Übertragung der am Schwefelatom befindlichen Methylgruppe. Nach Abspaltung der CH3-Gruppe bleibt S-adenosyl-L-homocystein zurück, das auch mit „AdoHcy“ oder „SAH“ abgekürzt wird.
-
Es wurde nun überraschend gefunden, dass ein Aminosäureaustausch an Position 34 der Wildtyp-GlaTgs2 gemäß SEQ ID NO: 1, der dazu führt, dass die an dieser Position befindliche Aminosäure Valin gegen eine andere Aminosäure ausgetauscht wird, vorzugsweise gegen eine unpolare/hydrophobe oder polare/neutrale Aminosäure, und besonders bevorzugt gegen Alanin, Glycin oder Methionin, die enzymatische Aktivität des resultierenden Enzyms dahingehend ändert, dass es AdoMet-Analoga als Kofaktoren nutzen kann bzw. im Vergleich zum Wildtypenzym besser nutzen kann. Vorzugsweise handelt es sich bei der anstelle von Valin eingeführten Aminosäure nicht um Tryptophan oder Leucin. Damit eröffnet sich die Möglichkeit einer gezielten Modifikation des 5’-Endes von RNA-Spezies, die eine m7GpppN-Kappe tragen, um dort gegebenenfalls in nachfolgenden Schritten Reportergruppen anzubringen und/oder eine spezifische Immobilisierung dieser RNA-Spezies zu erreichen.
-
Beispiele für unpolare/hydrophobe Aminosäuren sind Alanin, Valin, Methionin, Leucin, Isoleucin, Prolin, Tryptophan und Phenylalanin. Beispiele für polare/neutrale Aminosäuren sind Tyrosin, Threonin, Glutamin, Glycin, Serin, Cystein und Asparagin.
-
Unter dem Begriff „AdoMet-Analogon“ wird hier eine Verbindung der folgenden Formel (I)
verstanden, die am Schwefelatom einen Rest R trägt, der keine Methylgruppe ist. Es handelt sich somit um eine Verbindung mit demselben Grundgerüst wie AdoMet (S-adenosyl-L-methionin), wobei am Schwefelatom anstelle der Methylgruppe ein anderer Rest gebunden ist.
-
Ein Beispiel für einen solchen Rest ist Propenyl CH
2=CH-CH
2-. Das entsprechende AdoMet-Analogon (5’-[(S)-[(3S)-3-Amino-3-carboxypropyl]prop-2-enylsulfonio]-5’-desoxyadenosin) mit diesem Rest anstelle von Methyl wird als „AdoPropen“ bezeichnet und weist folgende Formel (Ia) auf:
-
Weitere Beispiele für Reste R sind Propinyl CH≡C-CH2-, Butinyl CH≡C-CH2-CH2-, Pent-2-en-4-inyl CH≡C-CH=CH-CH2-, Benzyl Ph-CH2-(Ph = C6H5) und Azidobutenyl N3-CH2-CH=CH-CH2-. Im Falle des Propinylrestes CH≡C-CH2- wird das AdoMet-Analogon hier als „AdoPropin“ bezeichnet, im Falle des Butinylrestes CH≡C-CH2-CH2- als „AdoButin“, im Falle des Pent-2-en-4-inyl-Restes CH≡C-CH=CH-CH2- als „AdoEnYn“, im Falle des Benzylrestes „AdoBenzyl“ und im Falle des Azidobutenylrestes N3-CH2-CH=CH-CH2- als „AdoAzid“. Für den Pent-2-en-4-inyl-Rest wird hier auch der Begriff „Penteninylrest“ verwendet.
-
In einem ersten Aspekt stellt die Erfindung daher ein isoliertes oder synthetisches Protein bereit, das
- a. eine Aminosäuresequenz gemäß SEQ ID NO: 2 aufweist oder umfasst, oder
- b. eine Aminosäuresequenz aufweist oder umfasst, die zu der Aminosäuresequenz gemäß SEQ ID NO: 2 homolog ist, mit der Maßgabe, dass in der homologen Aminosäuresequenz an der Position, die der Position 34 gemäß SEQ ID NO: 2 entspricht, nicht Valin steht, oder
- c. eine zusammenhängende Teilsequenz von mindestens 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 65, 70, 80, 90 oder mindestens 100 Aminosäuren, bevorzugt mindestens 110, 120, 130, 140, 150, 160, 170, 180, 190 oder mindestens 200 Aminosäuren, besonders bevorzugt mindestens 210, 220, 230, 240 oder mindestens 250 Aminsoäuren der Aminosäuresequenz gemäß a oder b aufweist oder umfasst, mit der Maßgabe, dass die Teilsequenz die Aminosäure an Position 34 gemäß SEQ ID NO: 2 oder die entsprechende homologe Aminosäure umfasst.
-
Der hier verwendete Begriff „Protein“ bezeichnet Polymere aus einer beliebigen Anzahl von Aminosäuren, die durch Peptidbindung untereinander verknüpft sind und umfasst die Begriffe „Peptid“ und „Polypeptid“. Die lineare Abfolge von Aminosäuren in einem Protein wird als „Aminosäuresequenz“ bezeichnet.
-
Der Begriff „synthetisch“ bedeutet hier „künstlich hergestellt“ und umfasst Proteine, die so, d.h. mit der jeweiligen Aminosäuresequenz, nicht in der Natur vorkommen. „Isoliert“ bedeutet hier, dass ein Protein aus seiner ursprünglichen bzw. natürlichen Umgebung, z.B. aus einer Eukaryoten- oder Prokaryotenzelle, herausgelöst worden ist.
-
Der Begrifft „homolog“ in Bezug auf ein Protein bedeutet, dass ein Protein in seiner Aminosäuresequenz weitgehend mit einem damit verglichenen anderen Protein übereinstimmt, ohne vollständig damit identisch zu sein. Homolog kann hier zum Beispiel bedeuten, dass ein Protein mit Ausnahme von einer Aminosäure eine mit der Trimethylguanosinsynthase von Giardia lamblia identische Aminosäuresequenz aufweist. Das Vorhandensein einer Homologie zwischen zwei Proteinen kann festgestellt werden, indem man jeweils eine Position in der einen Sequenz mit der entsprechenden Position in der anderen Sequenz vergleicht und ermittelt, ob hier identische oder ähnliche Reste vorhanden sind. Zwei miteinander verglichene Sequenzen sind homolog, wenn ein bestimmter Mindestanteil identischer oder ähnlicher Aminosäuren vorliegt. Identität heißt, dass beim Vergleich zweier Sequenzen an äquivalenten Stellen jeweils dieselbe Aminosäure steht. Dabei kann es gegebenenfalls erforderlich sein, Sequenzlücken zu berücksichtigen, um eine möglichst gute Alinierung der Vergleichssequenzen herzustellen. Ähnliche Aminosäuren sind dabei Aminosäuren mit gleichen oder äquivalenten chemisch-physikalischen Eigenschaften. Beim Austausch einer Aminosäure durch eine andere Aminosäure mit gleichen oder äquivalenten chemisch-physikalischen Eigenschaften spricht man von einem „konservativen Austausch“. Beispiele für physikalisch-chemische Eigenschaften einer Aminosäure sind beispielsweise die Hydrophobie oder die Ladung. Als ähnliche Aminosäuren werden insbesondere solche nichtidentischen Aminosäuren angesehen, die anhand der von dem Computerprogramm „Basic Local Alignment Search Tool“, abgekürzt BLAST, (S. F. Altschul et al. (1990), Basic Local Alignment search tool, J. Mol. Biol. 215: 403–410; s. z.B. http://www.ncbi.nlm.nih.gov/BLAST/) verwendeten BLOSUM62-Substitutionsmatrix (Henikoff, S., und Henikoff, J., Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. USA. 89: 10915–10919, 1992) als „positiv“ ausgegeben werden, d.h. in der BLOSUM62-Substitutionsmatrix eine positive Punktzahl aufweisen. Für die Zwecke der vorliegenden Erfindung wird davon ausgegangen, dass eine Homologie zwischen zwei Sequenzen vorhanden ist, wenn mindestens 45%, vorzugsweise mindestens 50%, mindestens 55%, mindestens 60%, mindestens 65%, mindestens 70%, mindestens 75%, mindestens 80%, mindestens 85%, mindestens 90%, mindestens 95%, mindestens 97%, mindestens 98%, oder mindestens 99% der Aminosäuren identisch oder ähnlich, vorzugsweise identisch, sind. Insbesondere wird vom Vorhandensein einer Homologie zwischen zwei Sequenzen ausgegangen, wenn bei Verwendung des Computerprogramms BLAST (S. F. Altschul et al. (1990), Basic Local Alignment search tool, J. Mol. Biol. 215: 403–410; s. z.B. http://www.ncbi.nlm.nih.gov/BLAST/) unter Verwendung von Standardparametern und der BLOSUM62-Substitutionsmatrix (Henikoff, S., und Henikoff, J., Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. USA. 89: 10915–10919, 1992) eine Identität oder Ähnlichkeit („Positives“), vorzugsweise Identität, von mindestens 45%, vorzugsweise mindestens 55%, mindestens 60%, mindestens 65%, mindestens 70%, mindestens 75%, mindestens 80%, mindestens 85%, mindestens 90%, mindestens 95%, mindestens 97%, mindestens 98%, oder mindestens 99% erhalten wird. Vorzugsweise wird dabei von einer Mindestlänge von 20, bevorzugt einer Mindestlänge von 25, 30, 35, 40, 45, 50, 60, 80 oder 100, weiter bevorzugt einer Mindestlänge von 120, 140, 160, 180 oder 200 Aminosäuren, oder von einer Mindestlänge von 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90% oder 95% der Aminosäuren der jeweiligen Aminosäuresequenzen ausgegangen. Besonders bevorzugt wird von der vollen Länge des jeweiligen Proteins ausgegangen. Dem Fachmann ist anhand seines Fachwissens ohne Weiteres ersichtlich, welches der verfügbaren BLAST-Programme, z.B. BLASTp, für die Ermittlung der Homologie in Frage kommt. Darüber hinaus existieren noch weitere Programme, die der Fachmann kennt, und die er im Bedarfsfall bei der Beurteilung der Homologie zweier oder mehrerer zu vergleichender Sequenzen heranziehen kann. Solche Programme sind beispielsweise auf den Internetseiten des European Bioinformatics Institute (EMBL) verfügbar (s. z.B. http://www.ebi.ac.uk/Tools/similarity.html).
-
Insbesondere bedeutet „homolog“ in der vorliegenden Anmeldung eine Übereinstimmung, d.h. Identität in der Aminosäuresequenz, von mindestens 60%, bevorzugt mindestens 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% oder mindestens 99%, besonders bevorzugt mindestens 99,5%. „Homolog“ kann insbesondere auch bedeuten, dass eine Trimethylguanosinsynthase im Vergleich zu einem anderen Protein an nicht mehr als 60, bevorzugt nicht mehr als 50, 40, 30, 25, 20, 19, 18, 17, 16, 15, 14, 13, 12 oder 11, besonders bevorzugt nicht mehr als 9, 8, 7, 6, 5, 4, 3, 2 oder 1 Position(en) eine andere, fehlende oder zusätzliche Aminosäure aufweist.
-
Der Begriff „Alkyl“ beinhaltet gesättigte aliphatische (nicht-aromatische) Gruppen, einschließlich geradkettiger Alkylgruppen (z.B. Methyl, Ethyl, Propyl, Butyl, Pentyl, Hexyl, Heptyl und Octyl) und verzweigtkettiger Alkylgruppen (z.B. Isopropyl, tert-Butyl, Isobutyl). Der Begriff umfasst auch O-, N-, S- oder P-Alkylgruppen (z.B. -O-Methyl), d.h. Alkylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind.
-
Der Ausdruck „Cn-Cm“, wobei n und m jeweils positive ganze Zahlen sind und m größer als n ist, bedeutet einen Bereich, der die Anzahl an C-Atomen einer Verbindung oder eines Restes angibt. Der Ausdruck soll hier ausdrücklich sämtliche ganzzahlige Zwischenwerte zwischen den Bereichsgrenzen n und m einschließen, und zwar jeweils unabhängig voneinander. Der Ausdruck „C1-C10“ (n = 1, m = 10) bedeutet daher beispielsweise eine Verbindung, eine Gruppe oder einen Rest mit 1-10, d.h. 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10 C-Atomen. „C1-C10“ umfasst daher gleichzeitig auch beispielsweise „C2-C6“, d.h. 2, 3, 4, 5 oder 6 C-Atome, oder „C1-C4“, d.h. 1, 2, 3 oder 4 C-Atome, oder „C4-C9“, d.h. 4, 5, 6, 7, 8 oder 9 C-Atome. Entsprechend bedeutet der Begriff „C2-C10-Alkyl“ beispielsweise eine Alkylgruppe mit 2, 3, 4, 5, 6, 7, 8, 9 oder 10 C-Atomen und umfasst sämtliche Kombinationen aus den Werten von n und m, die in dem Bereich von n = 2 bis m = 10 liegen, z.B. „C5-C7-Alkyl“, d.h. ein Alkyl mit 5, 6 oder 7 C-Atomen.
-
Der Begriff „Alkenyl“ beinhaltet ungesättigte aliphatische (nicht-aromatische) Gruppen mit mindestens einer C-C-Doppelbindung, einschließlich geradkettiger und verzweigtkettiger Alkenylgruppen. Der Begriff umfasst auch O-, N-, S- oder P-Alkenylgruppen (z.B. -O-Propenyl), d.h. Alkenylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind. Der Begriff „C2-C10-Alkenyl“ bedeutet eine Alkenylgruppe mit 2, 3, 4, 5, 6, 7, 8, 9 oder 10 C-Atomen.
-
Der Begriff „Alkinyl“ beinhaltet ungesättigte aliphatische (nicht-aromatische) Gruppen mit mindestens einer C-C-Dreifachbindung, einschließlich geradkettiger und verzweigtkettiger Alkenylgruppen. Der Begriff umfasst auch O-, N-, S- oder P-Alkinylgruppen (z.B. -O-Butinyl), d.h. Alkinylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind. Der Begriff „C2-C10-Alkinyl“ bedeutet eine Alkinylgruppe mit 2, 3, 4, 5, 6, 7, 8, 9 oder 10 C-Atomen.
-
Der Begriff „Alkeninyl“ beinhaltet ungesättigte aliphatische (nicht-aromatische) Gruppen mit mindestens einer C-C-Doppelbindung und mindestens einer C-C-Dreifachbindung, einschließlich geradkettiger und verzweigtkettiger Alkeninylgruppen. Der Begriff umfasst auch O-, N-, S- oder P-Alkeninylgruppen, d.h. Alkeninylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind. Der Begriff „C4-10-Alkeninyl“ bedeutet eine Alkeninylgruppe mit 4, 5, 6, 7, 8, 9 oder 10 C-Atomen.
-
Der Begriff „Cycloalkyl“ beinhaltet alizyklische Gruppen, d.h. ringförmige gesättigte aliphatische (nicht-aromatische) Gruppen, z.B. Cyclopropyl, Cyclopentyl, Cyclohexyl, Cycloheptyl, Cyclooctyl. Der Begriff umfasst auch O-, N-, S- oder P-Cycloalkylgruppen, d.h. Cycloalkylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind. Die Begriffe „Cycloalkenyl“, „Cycloalkinyl“ und „Cycloalkeninyl“ bedeuten entsprechend ringförmige aliphatische (nicht-aromatische) Alkenyle, Alkinyle oder Alkeninyle gemäß der obigen Definition, wobei die Doppel- und/oder Dreifachbindung(en) innerhalb oder außerhalb des Rings bzw. Ringsystems vorhanden sein kann (können).
-
Der Begriff „Heteroalkyl“ bezeichnet Alkylgruppen, bei denen ein oder mehrere Kohlenstoffatome des Kohlenwasserstoffgerüsts durch andere Atome (Heteroatome), z.B. Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratome, ersetzt sind. Der Begriff umfasst auch O-, N-, S- oder P-Heteroalkylgruppen, d.h. Heteroalkylgruppen, die über ein Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratom an eine Verbindung gebunden sind. Der Begriff „Heteroalkyl“ umfasst auch Cykcloalkyle, bei denen ein oder mehrere Kohlenstoffatome des Kohlenwasserstoffgerüsts durch andere Atome, z.B. Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratome, ersetzt sind. Unter den Begriffen „Heteroalkenyl“, „Heteroalkinyl“, „Heteroalkeninyl“ werden entsprechend Alkenyle, Alkinyle und Alkeninyle sowie Cycloalkenyle, Cycloalkinyle und Cycloalkeninyle verstanden, bei denen ein oder mehrere Kohlenstoffatome des Kohlenwasserstoffgerüsts durch andere Atome (Heteroatome), z.B. Sauerstoff-, Stickstoff-, Schwefel- oder Phosphoratome, ersetzt sind. Der Begriff „C1-C10-Heteroalkyl“ bedeutet eine Alkylgruppe mit 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10 C-Atomen und mindestens einem Heteroatom. Entsprechendes gilt auch für Heteroalkenyle, Heteroalkinyle und Heteroalkeninyle.
-
Unter „Azidoalkyl“ wird hier ein Alkyl mit einer Azidogruppe -N3 verstanden. Der Begriff umfasst auch cyclische Alkyle und Heteroalkyle mit einer Azidogruppe. Unter „Azidoalkenyl“, „Azidoalkinyl“ und „Azidoalkeninyl“ werden entsprechend Alkenyle, Alkinyle und Alkeninyle, cyclische Alkenyle, Alkinyle und Alkeninyle sowie Heteroalkenyle, -alkinyle und -alkeninyle verstanden.
-
Der Begriff „substituiert“ bedeutet, dass ein oder mehrere Substituenten vorhanden sind, die ein Wasserstoffatom an einem oder mehreren Kohlenstoffatomen des Kohlenwasserstoffgerüsts ersetzen. Beispiele für solche Substituenten sind Oxo-, Hydroxyl-, Phosphat-, Cyano- und Aminogruppen, aber auch z.B. Halogene (z.B. F, Cl, Br, I), Alkyl, Cycloalkyl, Aryl und Heteroaryl.
-
Unter einer „Nukleinsäure“ wird ein Polymer verstanden, dessen Monomere Nucleotide sind. Ein Nucleotid ist eine Verbindung aus einem Zuckerrest, einer stickstoffhaltigen heterozyklischen organischen Base (Nucleotid- oder Nucleobase) und einer Phosphatgruppe. Der Zuckerrest ist in der Regel eine Pentose, im Falle von DNA Desoxyribose, im Falle von RNA Ribose. Die Verknüpfung der Nucleotide erfolgt über die Phosphatgruppe mittels einer Phosphodiesterbrücke in der Regel zwischen dem 3'-C-Atom der Zuckerkomponente eines Nucleosids (Verbindung aus Nucleobase und Zucker) und dem 5'-C-Atom der Zuckerkomponente des nächsten Nucleosids. Der hier verwendete Begriff „Nukleinsäure“ umfasst beispielsweise DNA, RNA und DNA/RNA-Mischsequenzen.
-
Unter einer „Nucleobase“ werden organische Basen verstanden, die in RNA oder DNA vorkommen. Bei den Nucleobasen handelt es sich häufig um Purine (R) und Pyrimidine (Y). Beispiele für Purine sind Guanin (G) und Adenin (A), Beispiele für Pyrimidine sind Cytosin (C), Thymin (T) und Uracil (U). Phosphorylierte Nucleoside, beispielsweise Nucleosidmonophosphate (NMP), Nucleosiddiphosphate (NDP) und Nucleosidtriphosphate (NTP), werden auch als Nucleotide bezeichnet. Die Phosphat-, Diphosphat-(Pyrophosphat-) bzw. Triphosphatgruppe ist in der Regel mit dem 5'-C-Atom der Zuckerkomponente des Nucleosids verknüpft, kann aber beispielsweise auch mit dem 3'-C-Atom verknüpft sein.
-
Unter einem „Nucleosid“ werden hier organische Moleküle verstanden, die aus einem Zuckerrest (Zuckerkomponente) und einer organischen Base (Basenkomponente), z.B. einer heterocyclischen organischen Base, insbesondere einer stickstoffhaltigen heterocyclischen organischen Base, bestehen, die über eine glykosidische Bindung verbunden sind. Der Zuckerrest ist häufig eine Pentose, z.B. Desoxyribose oder Ribose, kann aber auch ein anderer Zucker sein, z.B. ein C
3-, C
4- oder C
6-Zucker. Insbesondere wird unter einem Nucleosid daher eine Verbindung der allgemeinen Formel (III)
verstanden, wobei B eine stickstoffhaltige heterocyclische organische Base, z.B. eine Nucleo base, ist, und R
3 und R
4 unabhängig voneinander H oder OH sind.
-
Unter einem „Nucleosidanalogon“ wird hier eine Verbindung verstanden, die im menschlichen Körper natürlicherweise nicht vorkommt, einem natürlicherweise im menschlichen Körper vorkommenden Nucleosid aber strukturell ähnlich ist, so dass es beispielsweise von der Zelle und/oder von viralen Enzymen im Wesentlichen entsprechend dem natürlichen Nucleosid verarbeitet, beispielsweise phosphoryliert und in einen RNA- oder DNA-Strang eingebaut werden kann. Ein Nucleosidanalogon kann selbst ein Nucleosid sein. Es kann aber beispielsweise auch eine andere Verbindung mit den obigen Eigenschaften sein, beispielsweise eine Verbindung aus einer heterocyclischen Base und einem acyclischen Rest und/oder einem Rest, der kein Zucker ist, oder eine Verbindung aus einer carbocyclischen Verbindung und einem Zuckerrest. Nucleosidanaloga sind entweder selbst Nucleoside im obigen Sinne oder Nucleosiden strukturell und/oder funktionell analog. Da Nucleosidanaloga nicht notwendig eine Zucker- bzw. Basenkomponente im engeren Sinne enthalten müssen, wird hier auch von einer zur Basenkomponente analogen Komponente (Basenanalogon) bzw. einer zur Zuckerkomponente analogen Komponente (Zuckeranalogon) gesprochen. Sofern hier von einer Zuckerkomponente oder Basenkomponente gesprochen wird, sollen die entsprechenden analogen Komponenten von Nucleosidanaloga mit erfasst sein, sofern sich aus dem Zusammenhang nicht eindeutig etwas anderes ergibt. Beispiele für Nucleosidanaloga sind beispielsweise AZT (3'-Azido-2',3'-didesoxythimidin, Azidothymidin), 2',3'-Didesoxyinosin (Didanosin), 2',3'-Didesoxycytidin (Zalticabin) und 2-Amino-9-((2-hydroxyethoxy)methyl)-1H-purin-6(9H)-on(Acyclovir). Auch Nucleosidphosphonate können Nucleosidanaloga sein.
-
Unter einem „Nucleotid“ werden hier phosphorylierte Nucleoside, beispielsweise Nucleosidmonophosphate (NMP), Nucleosiddiphosphate (NDP) und Nucleosidtriphosphate (NTP), verstanden. Die Phosphat-, Diphosphat-(Pyrophosphat-) bzw. Triphosphatgruppe ist in der Regel mit dem 5'-C-Atom der Zuckerkomponente des Nucleosids verknüpft, kann aber beispielsweise auch mit dem 3'-C-Atom verknüpft sein. Unter einem „Nucleotidanalogon“ wird entsprechend ein phosphoryliertes Nucleosidanalogon verstanden.
-
Unter der „Gesamtumsatzzahl“ (engl. Total Turnover Number, TTN) wird die Anzahl Mole Produkt verstanden, die pro Mol Kofaktor oder Enzym über die gesamte Reaktionszeit gebildet werden.
-
Das erfindungsgemäße Protein katalysiert vorzugsweise enzymatisch die Übertragung des Restes R der Verbindung gemäß folgender Formel (I)
auf das N2 des Guanosins von m
7GTP, m
7GpppN oder einer Verbindung der folgenden Formel (II)
wobei RNA Ribonukleinsäure bedeutet, R
1OH oder OCH
3 bedeutet, N Nucleosid, Nucleotid, Nucleosid- oder Nucleotidanalogon bedeutet, B für Nucleobase steht, und R ausgewählt ist aus der Gruppe bestehend aus substituiertem oder unsubstituiertem C
2-10-Alkyl, substituiertem oder unsubstituiertem C
2-10-Alkenyl, substituiertem oder unsubstituiertem C
2-10-Alkinyl, substituiertem oder unsubstituiertem C
4-10-Alkeninyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkenyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkinyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkeninyl, substituiertem oder unsubstituiertem C
1-10-Heteroalkyl, substituiertem oder unsubstituiertem C
2-10-Heterolkenyl, substituiertem oder unsubstituiertem C
2-10-Heteroalkinyl, substituiertem oder unsubstituiertem C
4-10-Heteroalkeninyl, substituiertem oder unsubstituiertem C
1-10-Azidoalkyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkenyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkinyl, substituiertem oder unsubstituiertem C
4-10-Azidoalkeninyl, substituiertem oder unsubstituiertem Benzyl, Propenyl CH
2=CH-CH
2-, Propinyl CH≡C-CH
2-, Butinyl CH≡C-CH
2-CH
2-, Penteninyl CH≡C-CH=CH-CH
2- und Azidobutenyl N
3-CH
2-CH=CH-CH
2-. Im Falle von Benzyl ist eine Substitution in para-Stellung bevorzugt, besonders bevorzgt eine Subsitution durch ein Alken, Alkin oder Azid.
-
Dass das erfindungsgemäße Protein die Übertragung des Restes R des AdoMet-Analogons gemäß Formel (I) katalysiert, bedeutet nicht, dass es AdoMet nicht auch als Kofaktor nutzen und eine Methylgruppe auf das N2 der m7GpppN-Kappe übertragen kann. Vielmehr bedeutet es, dass die Reaktion mit dem AdoMet-Analogon unter physiologischen Bedingungen von dem erfindungsgemäßen Protein zumindest auch katalysiert wird, vorzugsweise im Vergleich zum Wildtypenzym mit höherer Rate, mit größerer Affinität zum Kofaktor, größerem Ertrag und/oder größer Gesamtumsatzzahl (Total Turnover Number, TTN).
-
Die von dem erfindungsgemäßen Protein katalysierte Übertragung eines Restes R eines S-Adenosyl-L-Methionin-Analogons auf eine mRNA ist in dem nachstehend wiedergegebenen Schema dargestellt:
-
Für den Fall, dass das erfindungsgemäße Protein nur eine Teilsequenz der SEQ ID NO: 2 aufweist oder umfasst, ist es besonders bevorzugt, dass das Protein mindestens eine der obigen Übertragungsreaktionen katalysiert.
-
Bevorzugt ist es, wenn das erfindungsgemäße Protein
- a. eine Aminosäuresequenz gemäß SEQ ID NO: 3, 4, 5, 6, 7, 8, 9 oder 10 aufweist oder umfasst, oder
- b. eine Aminosäuresequenz aufweist oder umfasst, die zu der Aminosäuresequenz gemäß SEQ ID NO: 3, 4, 5, 6, 7, 8, 9 oder 10 homolog ist, mit der Maßgabe, dass in der homologen Aminosäuresequenz an der Position, die der Position 34 gemäß SEQ ID NO: 3, 4, 5, 6, 7, 8, 9 oder 10 entspricht, nicht Valin steht, oder
- c. eine zusammenhängende Teilsequenz von mindestens 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 65, 70, 80, 90 oder mindestens 100 Aminosäuren, bevorzugt mindestens 110, 120, 130, 140, 150, 160, 170, 180, 190 oder mindestens 200 Aminosäuren, besonders bevorzugt mindestens 210, 220, 230, 240 oder mindestens 250 Aminsoäuren der Aminosäuresequenz gemäß a oder b aufweist oder umfasst, mit der Maßgabe, dass die Teilsequenz die Aminosäure an Position 34 gemäß SEQ ID NO: 3, 4, 5, 6, 7, 8, 9 oder 10 oder oder die entsprechende homologe Aminosäure umfasst.
-
Bevorzugt steht an Position 34 der Aminosäuresequenz gemäß SEQ ID NO: 2 Alanin, Glycin oder Methionin, bevorzugt Alanin. An Position 76 der Aminosäuresequenz gemäß SEQ ID NO: 2 steht bevorzugt Asparaginsäure, Threonin, Leucin oder Valin, besonders bevorzugt Asparaginsäure, und/oder an Position 92 der Aminosäuresequenz gemäß SEQ ID NO: 2 steht vorzugsweise Arginin oder Alanin. Besonders bevorzugt steht an Position 34 gemäß SEQ ID NO: 2 Alanin, an Position 76 gemäß SEQ ID NO: 2 Asparaginsäure und an Position 92 der Aminosäuresequenz gemäß SEQ ID NO: 2 Arginin oder Alanin.
-
Der Rest R ist vorzugsweise Propenyl CH2=CH-CH2-, Propinyl CH≡C-CH2-, Butinyl CH≡C-CH2-CH2-, Penteninyl CH≡C-CH=CH-CH2-, Benzyl Ph-CH2- oder Azidobutenyl N3-CH2-CH=CH-CH2-, besonders bevorzugt Propenyl CH2=CH-CH2-, Benzyl Ph-CH2- oder Penteninyl CH≡C-CH=CH-CH2-.
-
In einem weiteren Aspekt betrifft die vorliegende Erfindung auch eine Nukleinsäure, die für ein erfindungsgemäßes Protein kodiert.
-
In noch einem weiteren Aspekt betrifft die vorliegende Erfindung ein Verfahren zur Modifizierung der m
7GpppN-Kappe eines RNA-Moleküls, insbesondere mRNA-Moleküls, umfassend den Schritt des Inkontaktbringens eines mit einer m
7GpppN-Kappe versehenen RNA-Moleküls mit einem Protein nach dem ersten Aspekt der Erfindung in Gegenwart eines AdoMet-Analogons gemäß der folgenden Formel (I)
wobei R ausgewählt ist aus der Gruppe bestehend aus substituiertem oder unsubstituiertem C
2-10-Alkyl, substituiertem oder unsubstituiertem C
2-10-Alkenyl, substituiertem oder unsubstituiertem C
2-10-Alkinyl, substituiertem oder unsubstituiertem C
4-10-Alkeninyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkenyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkinyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkeninyl, substituiertem oder unsubstituiertem C
1-10-Heteroalkyl, substituiertem oder unsubstituiertem C
2-10-Heterolkenyl, substituiertem oder unsubstituiertem C
2-10-Heteroalkinyl, substituiertem oder unsubstituiertem C
4-10-Heteroalkeninyl, substituiertem oder unsubstituiertem C
1-10-Azidoalkyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkenyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkinyl, substituiertem oder unsubstituiertem C
4-10-Azidoalkeninyl, substituiertem oder unsubstituiertem Benzyl Ph-CH
2-, Propenyl CH
2=CH-CH
2-, Propinyl CH≡C-CH
2-, Butinyl CH≡C-CH
2-CH
2-, Penteninyl CH≡C-CH=CH-CH
2- und Azidobutenyl N
3-CH
2-CH=CH-CH
2-, unter Bedingungen, bei denen eine Übertragung des Restes R auf das N2 des Guanosins der m
7GpppN-Kappe erfolgt.
-
Der Rest R ist vorzugsweise Propenyl CH2=CH-CH2-, Propinyl CH≡C-CH2-, Butinyl CH≡C-CH2-CH2-, Penteninyl CH≡C-CH=CH-CH2-, Benzyl Ph-CH2- oder Azidobutenyl N3-CH2-CH=CH-CH2-, besonders bevorzugt Propenyl CH2=CH-CH2-, Benzyl Ph-CH2- oder Penteninyl CH≡C-CH=CH-CH2-.
-
Besonders bevorzugt ist es, wenn bei diesem Verfahren ein erfindungsgemäßes Protein zum Einsatz kommt, das die Aminosäuresequenz gemäß SEQ ID NO: 2 aufweist und bei dem an Position 34 der Aminosäuresequenz gemäß SEQ ID NO: 2 Alanin, Glycin oder Methionin, bevorzugt Alanin, an Position 76 der Aminosäuresequenz gemäß SEQ ID NO: 2 Asparaginsäure, Threonin, Leucin oder Valin, bevorzugt Asparaginsäure, und an Position 92 der Aminosäuresequenz gemäß SEQ ID NO: 2 Arginin oder Alanin steht, und als AdoMet-Analogon AdoPropen, AdoEnYn oder AdoBenzyl eingesetzt wird. Weiter bevorzugt wird ein Protein, bei dem an Position 34 gemäß SEQ ID NO: 2 Alanin steht, an Position 76 gemäß SEQ ID NO: 2 Asparaginsäure steht und an Position 92 der Aminosäuresequenz gemäß SEQ ID NO: 2 Arginin oder Alanin steht, in Gegenwart von AdoPropen, AdoEnYn oder AdoBenzyl unter geeigneten Bedingungen mit der RNA, vorzugsweise mRNA, in Kontakt gebracht, um die enzymatische Reaktion ablaufen zu lassen.
-
Im Anschluss an die enzymatische Modifizierung der m7GpppN-Kappe kann der auf das N2 des Guanosins der übertragenen Restes R weiter modifiziert werden, beispielsweise auf einem enzymatischem oder auf nicht-enzymatischem chemischem Weg.
-
Eine bevorzugte Möglichkeit besteht darin, eine chemische Modifikation des Restes R mittels einer bioorthogonalen chemischen Reaktion, vorzugsweise einer bioorthogonalen Click-Reaktion, vorzunehmen. Solche Reaktionen sind dem Fachmann bekannt und umfassen beispielsweise Photoclick-Verfahren, Thiol-Ene-Click-Verfahren und Cycloadditionsreaktionen, z.B. die Cu(I)-katalysierte Huisgencycloaddition (s. z.B. H. C. Kolb, M. G. Finn, K. B. Sharpless, 2001, Angew. Chem. 113, 11, 2056–2075; H. C. Kolb, M. G. Finn, K. B. Sharpless, 2001, Angew. Chem. Int. Ed. 40, 11, 2004–2021; C. N. Bowman und C. E. Hoyle, Angew. Chem. Int. Ed. 2010, 49, 1540–1573; S. S. van Berkel, et al., Angew. Chem. 2011, 123, 8968–8989; E. Lallana et al., Angew. Chem. 2011, 123, 8956–8966; A. H. El-Sagheerab, T. Brown, Chem. Soc. Rev. 2010, 39, 1388–1405; C. S. McKay, et al., Chem. Commun. 2010, 46, 931–933; W. Song, et al., J. Am. Chem. Soc. 2008, 130, 9654–9655; P. M. E. Gramlich, et al., Angew. Chem. Int. Ed. 2008, 47, 8350–8358; C. R. Becer, et al., Angew. Chem. Int. Ed. 2009, 48, 4900–4908; T. R. Chan, et al., Org. Lett. 2004, 6, 2853–2855; C. Uttamapinant, et al., Angew. Chem. Int. Ed. 2012, 51, 5852–5856; Y. Wang, et al., Angew. Chem. Int. Ed. 2009, 48, 5330–5333).
-
Mit Hilfe dieser bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens kann die Kappenstruktur am 5‘-Ende von RNAs, die eine solche Kappenstruktur aufweisen oder mit einer solchen Kappenstruktur versehen werden können, in einem zweistufigen oder gegebenenfalls auch mehrstufigen Verfahren auf chemo-enzymatischem Wege spezifisch modifiziert werden. Im ersten Schritt wird die Kappenstruktur mit Hilfe eines erfindungsgemäßen Proteins enzymatisch modifiziert, indem anstelle eines Methylrestes ein Rest R auf das N2 der m7GpppN-Kappe übertragen wird. In einem zweiten, chemischen Schritt, kann die mit diesem Rest modifizierte RNA dann mit geeigneten Molekülen, beispielsweise mit einem geeigneten Biomarker (z.B. Biotin), beispielsweise mittels bekannter Verfahren der Click-Chemie umgesetzt und weiter modifiziert werden. Zu diesen Molekülen zählen auch Säulenmaterialien, die eine Immobilisierung der RNAs über die Kappenstruktur ermöglichen. Diese Immobilisierung kann beispielsweise direkt oder indirekt über nicht-kovalente Wechselwirkungen mit einer entsprechenden Matrix erfolgen. Sie kann aber auch über eine kovalente Bindung erfolgen, wodurch die Wechselwirkung z.B. mit der Matrix stabiler wird, was beispielsweise stringentere Waschschritte erlaubt, die es ermöglichen, andere Komponenten effizienter abzutrennen. Damit kann z.B. mRNA spezifisch aus komplexen Zelllysaten isoliert werden.
-
In noch einem weiteren Aspekt betrifft die vorliegende Erfindung ein Testkit, umfassend ein Protein nach dem ersten Aspekt der Erfindung und ein AdoMet-Analogon gemäß der folgenden Formel
wobei R ausgewählt ist aus der Gruppe bestehend aus substituiertem oder unsubstituiertem C
2-10-Alkyl, substituiertem oder unsubstituiertem C
2-10-Alkenyl, substituiertem oder unsubstituiertem C
2-10-Alkinyl, substituiertem oder unsubstituiertem C
4-10-Alkeninyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkyl, substituiertem oder unsubstituiertem C
3-12-Cycloalkenyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkinyl, substituiertem oder unsubstituiertem C
5-12-Cycloalkeninyl, substituiertem oder unsubstituiertem C
1-10-Heteroalkyl, substituiertem oder unsubstituiertem C
2-10-Heterolkenyl, substituiertem oder unsubstituiertem C
2-10-Heteroalkinyl, substituiertem oder unsubstituiertem C
4-10-Heteroalkeninyl, substituiertem oder unsubstituiertem C
1-10-Azidoalkyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkenyl, substituiertem oder unsubstituiertem C
2-10-Azidoalkinyl, substituiertem oder unsubstituiertem C
4-10-Azidoalkeninyl, substituiertem oder unsubstituiertem Benzyl Ph-CH
2- Propenyl CH
2=CH-CH
2-, Propinyl CH≡C-CH
2-, Butinyl CH≡C-CH
2-CH
2-, Penteninyl CH≡C-CH=CH-CH
2- und Azidobutenyl N
3-CH
2-CH=CH-CH
2-.
-
In einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Testkits ist das AdoMet-Analogon AdoPropen, AdoEnYn oder AdoBenzyl, weist das Protein eine Aminosäuresequenz gemäß SEQ ID NO: 2 auf und weist an Position 34 gemäß SEQ ID NO: 2 Alanin, an Position 76 gemäß SEQ ID NO: 2 Asparaginsäure und an Position 92 der Aminosäuresequenz gemäß SEQ ID NO: 2 Arginin oder Alanin auf.
-
Die Erfindung wird im Folgenden anhand von Ausführungsbeispielen allein zu Veranschaulichungszwecken näher erläutert.
-
1. Synthese von S-Adenosyl-L-methionin-Analoga
-
1.1 Synthese von 5’-[(S)-[(3S)-3-Amino-3-carboxypropyl]prop-2-enylsulfonio]-5’-desoxyadenosin (AdoPropen)
-
Das AdoMet-Analogon AdoPropen wurde nach einer Methode von Dalhoff et al. (C. Dalhoff, et al., Nat. Chem. Biol. 2006, 2, 31–32) hergestellt. Für die Synthese von AdoPropen wurden 20 mg S-Adenosyl-L-homocystein (52 µmol) unter Rühren in 3 mL Ameisensäure:Essigsäure 1:1 gelöst. Die Lösung wurde durch 10 minütiges Rühren im Eisbad gekühlt, bevor 264 µL (3.12 mmol) 3-Brompropen zugegeben wurde. Anschließend wurde die Reaktionslösung 4 Tage bei Raumtemperatur gerührt und durch Zugabe von 30 mL kaltem, didemineralisertem Wasser gestoppt. Die wässrige Phase wurde 3 Mal mit je 5 mL Diethylether extrahiert und anschließend das Wasser unter vermindertem Druck entfernt. Der erhaltene Feststoff wurde in 5 mL didemineralisirtem Wasser + 0.01 % TFA gelöst und mittels RP-HPLC gereinigt.
-
1.2 Synthese von 5’-[(S)-[(3S)-3-Amino-3-carboxypropyl]pent-2-en-4-inylsulfonio]-5’-desoxyadenosin (AdoEnYn)
-
Das AdoMet-Analogon AdoEnYn wurde nach Peters et al. (W. Peters, S. Willnow, M. Duisken, H. Kleine, T. Macherey, K. E. Duncan, D. W. Litchfield, B. Luscher, E. Weinhold, Angew Chem Int Ed Engl 2010, 49, 5170) hergestellt.
-
Für die Synthese des AdoMet-Analogons AdoEnYn wurde Pent-2-en-4-in-1-ol in einem ersten Schritt zum Methansulfonsäureester umgesetzt. Dazu wurden 240 mg (6.00 mmol) Natriumhydroxid in 6 mL Dichlormethan resuspendiert, 426 µL (5.50 mmol) Methansulfonylchlorid hinzugefügt und die Suspension im Eisbad gekühlt. Anschließend wurde ein Gemisch aus (E)- und (Z)-Pent-2-en-4-in-1-ol (472 µL, 6.02 mmol) hinzugegeben und das Reaktionsgemisch 16 Stunden bei Raumtemperatur gerührt. Es erfolgte eine Extraktion mit 50 mL gesättigter Natriumhydrogencarbonat-Lösung. Das Lösungsmittel wurde im Vakuum entfernt und der aktivierte Alkohol direkt in 1 mL einer Lösung aus Methansäure und Ethansäure (1:1) gelöst. Diese Lösung wurde zu 7.2 mg (19 µmol) S-Adenosyl-L-homocystein hinzugegeben und bei Raumtemperatur für 14 Stunden gerührt. Anschließend wurde diese in 30 mL ddH2O gegeben und dreimal mit 50 mL Diethylether extrahiert. Die wässrige Phase wurde eingefroren und gefriergetrocknet. Der Rückstand wurde in 2.5 mL ddH2O mit 0.01 % TFA aufgenommen und mittels HR-ESI-MS analysiert. Anschließend erfolgte eine Reinigung mittels präparativer HPLC.
-
1.3 Synthese von 5’-[(S)-[(3S)-3-Amino-3-carboxypropyl]benzyl]-5’-desoxyadenosin (Ado-Benzyl)
-
Das AdoMet-Analogon AdoBenzyl wurde analog der Vorschrift von Dalhoff et al. (C. Dalhoff, et al., Nat. Chem. Biol. 2006, 2, 31–32) hergestellt. Für die Synthese von AdoBenzyl wurden 9,2 mg S-Adenosyl-L-homocystein (24 µmol) unter Rühren in 1.38 mL Ameisensäure:Essigsäure 1:1 gelöst. Die Lösung wurde durch 10 minütiges Rühren im Eisbad gekühlt, bevor 171,2 µL (1.44 mmol) Benzylbromid zugegeben wurde. Anschließend wurde die Reaktionslösung 4 Tage bei Raumtemperatur gerührt und durch Zugabe von 15 mL kaltem, didemineralisertem Wasser gestoppt. Die wässrige Phase wurde 3 Mal mit je 2,5 mL Diethylether extrahiert und anschließend das Wasser unter vermindertem Druck entfernt. Der erhaltene Feststoff wurde in 2,5 mL didemineralisirtem Wasser + 0.01 % TFA gelöst und mittels RP-HPLC gereinigt.
-
2. HPLC-gekoppelter Aktivitätsassay
-
Mit Hilfe eines HPLC-gekoppelten Aktivitätsassays wurde die durch die WT-GlaTgs2 (SEQ ID NO: 1) und die erfindungsgemäßen Proteine gemäß SEQ ID NO: 4–10 enzymatisch katalysierte Übertragung der von synthetisch hergestellten AdoMet-Analoga getragenen Reste Propenyl (AdoPropen), Penteninyl (AdoEnYn) und Benzyl (AdoBenzyl) auf das N2-Atom des Guanosins von m
7GpppA (A = Adenin) untersucht. Ein typischer Ansatz mit einem Volumen von 8 µL ist in Tabelle 1 zusammengefasst. Tabelle 1: Eingesetzte Komponenten für den Aktivitätsassay unter Verwendung von m
7GpppA.
Komponente | Volumen | Endkonzentration |
GlaTgs2 oder GlaTgs2-Variante | 5.6 µL | 15–50 µM |
MTAN/LuxS (1:1) | 0.16 µL | 4.1 µM bzw. 3.0 µM |
m7GpppA [10 mM] | 0.22 µL | 275 µM |
AdoMet-Analogon | 0.33–0.6 µL | 365–740 µM |
Reaktionspuffer 2 | Ad 8 µL |
Reaktionspuffer 2: 50 mM Tris; 10 mM MgCl
2; 100 mM NH
4OAc; pH 8.4
-
MTAN steht für 5’-Methylthioadenosin/S-Adenosylhomocystein Nukleosidase. LuxS steht für S-Ribosylhomocystein Lyase.
-
Bei größeren Ansätzen von 10 oder 20 µL erfolgte eine verhältnismäßige Anpassung. Die eingesetzte Menge des AdoMet-Analogons wurde so angepasst, dass die Fläche des im Chromatogramm auftretenden Peaks eines Diastereomers des AdoMet-Analogons der Fläche des vom m7GpppA verursachten Signals entsprach. Die Reaktion wurde in der Regel direkt nach Ansetzen der Reaktion (t0) und nach drei Stunden bei 37 °C (t180) gestoppt und mittels analytischer HPLC sowie MALDI-TOF untersucht.
-
Die folgende Tabelle 2 gibt die Aktivität der GlaTgs2-WT im Vergleich mit untersuchten GlaTgs2-Varianten wieder, wobei AdoPropen als AdoMet-Analogon eingesetzt wurde. Tabelle 2: Aktivität von GlaTgs2-WT und GlaTgs2-Varianten auf AdoPropen
Enzym | SEQ ID NO: | Aktivität | TTN[–] |
GlaTgs2-WT | 1 | + | 1 |
GlaTgs2-V34A | 4 | +++ | 9 |
GlaTgs2-V34G | 5 | ++ | 5 |
GlaTgs2-V34M | 6 | ++ | 6 |
GlaTgs2-V34A,D76L | 7 | + | 1 |
GlaTgs2-V34A,D76T | 8 | + | 2 |
GlaTgs2-V34A,D76V | 9 | + | 1 |
GlaTgs2-V34A,R92A | 10 | +++ | 8 |
-
TTN = Total Turnover Number (Gesamtumsatzzahl). Aminosäureaustausche sind in der dem Fachmann bekannten Weise (Ursprüngliche Aminosäure – Position – neue Aminosäure) angegeben, wobei der Einbuchstabencode für Aminosäuren verwendet wird. V34A bedeutet beispielsweise, dass die ursprüngliche Aminosäure Valin an Position 34 durch Alanin ersetzt wurde.
-
Es zeigt sich, dass die erfindungsgemäßen Proteine zumindest eine mit dem Wildtypenzym vergleichbare oder höhere Aktivität aufwiesen.
-
Bei gleicher Enzymmenge wurden beispielsweise von der Variante GlaTgs2-V34A im Falle von AdoPropen 95% des m7GpppA umgesetzt, im Falle des AdoEnYn 10%. Beispielsweise mit der Variante GlaTgs2-V34A konnte auch eine Übertragung von Benzyl festgestellt werden.
-
Enzymatische Parameter für die GlaTgs2-Variante gemäß SEQ ID NO: 4 in Bezug auf AdoPropen sind in Tabelle 3 wiedergegeben:
-
Tabelle 3: Enzymatische Parameter für GlaTgs2-WT und GlaTgs2-VV34A in Bezug auf AdoPropen
Protein | KM | kcat | kcat/KM | TTN | T50 (15min) |
GlaTgs2-WT | 157 μM | 0,03 min–1 | 3 s–1·M–1 | ~1,2 | 39,9 ± 0,2 °C |
GlaTgs2-V34A | 36–78 μM | 0,15 min–1 | 18–43 3 s–1·M–1 | ~9 | 40,4 ± 0,2 °C |
n. b. = nicht bestimmt
-
Die GlaTgs2-Variante GlaTgs2-V34A (SEQ ID NO: 4) weist im Vergleich zum Wildtypenzym GlaTgs2-WT eine höhere Affinität für AdoPropen und eine höhere Aktivität mit AdoPropen auf. Die Thermostabilität entspricht der des Wildtypenzyms. Die kinetischen Parameter hinsichtlich AdoMet entsprachen denen des Wildtypenzyms (S. Hausmann, S. Shuman, J Biol Chem 2005, 280, 32101–32106.).
-
3. Thermostabilität
-
Die Stabilität eines Proteins kennzeichnet seine Fähigkeit denaturierende Einflüsse, wie eine Erhöhung der Umgebungstemperatur, innerhalb gewisser Grenzen zu tolerieren und die native Konformation aufrechtzuerhalten. Als Maß für die Thermostabilität kann der T50-Wert verwendet werden. T 15 / 50 ist die Temperatur, bei der ein Enzym nach 15-minütiger Inkubation 50% seiner Aktivität verliert. Zur Bestimmung von T50 wurden die zu analysierenden Proteine für 15 Minuten bei unterschiedlichen Temperaturen im Thermocycler erhitzt, während eine Probe des Proteins auf Eis inkubiert wurde. Im Folgenden wurden Aktivitätstests mit den zuvor erhitzten Proteinen durchgeführt. Dabei wurde die auf Eis inkubierte Probe als Referenz genutzt, die 100 % Aktivität aufwies. Nach erfolgter Normierung der Werte konnte T 15 / 50 unter Anwendung eines Boltzmann-Fits mit der Software Origin bestimmt werden.
-
Wie aus Tabelle 4 ersichtlich, wiesen die GlaTgs2-Varianten GlaTgs2-V34A (SEQ ID NO: 4), GlaTgs2-V34G (SEQ ID NO: 5) und GlaTgs2-V34M (SEQ ID NO: 6) eine ähnliche Thermostabilität auf oder zeigten sogar eine größere Thermostabilität, d.h. größere Stabilität gegenüber höheren Temperaturen.
-
Tabelle 4: Thermostabilität der GlaTgs2-Varianten GlaTgs2-V34A, -V34M und -V34G im Vergleich zum Wildtyp.
Variante S | EQ ID NO: | Thermostabilität, T15/50 [°C] |
WT | 1 | 39.9 ± 0.2 |
Val34Ala | 4 | 40.4 ± 0.2 |
Val34Gly | 5 | 44.8 |
Val34Met | 6 | 49.0 |
-
4. Chemische Modifikation von enzymatisch modifizierten RNA-Kappen mittels Click-Chemie
-
4.1 Biotinylierung mittels Thiol-Ene-Click(TEC)
-
Es wurden 800 µM m7GpppA enzymatisch zu Propenyl2m7GpppA 1(a2m7GpppA; Propenyl an N2 von m7GpppA) alkenyliert und die Reaktion wurde durch Zugabe 1/10 Volumen 1 M Perchlorsäure oder 5-minütige Inkubation bei 68 °C gestoppt.
-
Die Ansätze wurden zentrifugiert und für die Umsetzung mit Biotin-Thiol 2 eingesetzt. Hierfür wurden sie etwa 30 Sekunden mit Argon entgast und unter Luftausschluss mit 1 mM Radikalstarter VA-044 sowie Biotin-Thiol 2 (ca. 50-facher, molarer Überschuss) versetzt. Die Ansätze wurden für 8 h bei 44 °C inkubiert und mittels HPLC und MALDI-TOF-MS analysiert.
VA044 = 2,2'-Azobis[2-(2-imidazolin-2-yl)propan]dihydrochlorid
-
4.2 Fluoreszenzmarkierung mittels Cu-Click-Reaktion
-
Die Cu-Click Reaktion wurde nach Tomkuviene et al. (M. Tomkuviene, B. Clouet-d'Orval, I. Cerniauskas, E. Weinhold, S. Klimasauskas, Programmable sequence-specific click-labeling of RNA using archaeal box C/D RNP methyltransferases, Nucleic Acids Research, 2012, 40, 14, 6765) durchgeführt. Hierzu wurden zunächst etwa 100 µM Pent-2-en-4-inyl2m7GpppA (p2m7GpppA oder EnYn2m7GpppA) 4 enzymatisch hergestellt und die Reaktion durch Zugabe 1/10 Volumen 1 M Perchlorsäure gestoppt.
-
Für die Cu-Click-Reaktion wurde eine 300 mM CuBr-Lösung (in DMSO/tBuOH 3:1) frisch angesetzt und 1:10 mit 111 mM TBTA-Lösung (in DMSO/tBuOH 3:1) verdünnt.
-
Zu 10 µL der enzymkatalysierten Reaktion wurden dann 8 µL DMSO/tBuOH, 3 µL der 30 mM CuBr-Lösung (in TBTA) sowie 2,5 µL Eterneon 5 (2,5 mM in DMSO/tBuOH) gegeben. Die Reaktion wurde unter gelegentlichem Vortexen eine Stunde bei 37 °C inkubiert und gelektrophoretisch analysiert. TBTA = Tris[(1-benzyl-1H-1,2,3-triazol-4-yl)methyl]amin), DMSO = Dimethylsulfoxid
-
Sequenzprotokoll – freier Text und Übersetzung englischer Ausdrücke
-
- Artificial Sequence = Künstliche Sequenz
- misc_feature = sonstiges Merkmal
- any amino acid except valine (Val); preferably Ala, Gly, Met = beliebige Aminosäure mit Ausnahme von Valin (Val); vorzugsweise Ala, Gly, Met
- any amino acid, preferably Asp, Thr, Leu or Val = beliebige Aminosäure, vorzugsweise Asp, Thr, Leu oder Val
- any amino acid, preferably Arg or Ala = beliebige Aminosäure, vorzugsweise Arg or Ala
-
Es folgt ein Sequenzprotokoll nach WIPO St. 25.
Dieses kann von der amtlichen Veröffentlichungsplattform des DPMA heruntergeladen werden.
-
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
-
Zitierte Nicht-Patentliteratur
-
- J. Pease, R. Sooknanan, Nat Meth 2012, 9 [0003]
- J. S. Marcus, W. F. Anderson, S. R. Quake, Analytical Chemistry 2006, 78, 3084–3089 [0003]
- Z. Y. Yang, H. J. Edenberg, R. L. Davis, Nucleic Acids Res 2005, 33 [0003]
- M. E. Folkers, D. A. Delker, C. I. Maxwell, C. A. Nelson, J. J. Schwartz, D. A. Nix, C. H. Hagedorn, Plos One 2011, 6 [0003]
- Z. Gao, Q. Zhang, Y. Cao, P. Pan, F. Bai, G. Bai, Journal of Chromatography A 2009, 1216, 7670–7676 [0003]
- U. Schibler, D. Rifat, D. J. Lavery, Methods 2001, 24, 3–14 [0003]
- E. Z. Bajak, C. H. Hagedorn, Methods in molecular biology (Clifton, N.J.) 2008, 419, 147–160 [0003]
- A. K. Shukla, A. K. Shasany, S. P. S. Khanuja, Indian journal of experimental biology 2005, 43, 197–201 [0003]
- E. Z. Bajak, C. H. Hagedorn, Methods in molecular biology (Clifton, N. J.) 2008, 419, 147–160 [0005]
- Gowda, Nucleic Acids Research, 2010, 38, 21, 7558–7569 [0005]
- M. Folkers, PLOS one, 2011, 6, 2, e14697, Papic, 2012, Viruses, 2012, 4, 581.612 [0005]
- Dalhoff C, Lukinavicius G, Klimasăuskas S, Weinhold E., 2006, Nat Chem Biol. 2(1): 31–32 [0007]
- G. Lukinavičius, V. Lapienė, Z. Staševskij, C. Dalhoff, E. Weinhold, S. Klimašauskas, J. Am. Chem. Soc. 2007, 129, 2758–2759 [0007]
- Y. Motorin, J. Burhenne, R. Teimer, K. Koynov, S. Willnow, E. Weinhold, M. Helm, Nucleic Acids Research, 2010, 1–10, doi:10.1093/nar/gkq825 [0007]
- M. Tomkuvienė, B. Clouet-d’Orval, I. Černiauskas, E. Weinhold, S. Klimašauskas, Nucleic Acids Res 2012 [0007]
- S. Hausmann et al., J. Biol. Chem. 2008, 283, 31706–31718 [0014]
- S. F. Altschul et al. (1990), Basic Local Alignment search tool, J. Mol. Biol. 215: 403–410 [0024]
- http://www.ncbi.nlm.nih.gov/BLAST/ [0024]
- Henikoff, S., und Henikoff, J., Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. USA. 89: 10915–10919, 1992 [0024]
- S. F. Altschul et al. (1990), Basic Local Alignment search tool, J. Mol. Biol. 215: 403–410 [0024]
- http://www.ncbi.nlm.nih.gov/BLAST/ [0024]
- Henikoff, S., und Henikoff, J., Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. USA. 89: 10915–10919, 1992 [0024]
- http://www.ebi.ac.uk/Tools/similarity.html [0024]
- H. C. Kolb, M. G. Finn, K. B. Sharpless, 2001, Angew. Chem. 113, 11, 2056–2075 [0053]
- H. C. Kolb, M. G. Finn, K. B. Sharpless, 2001, Angew. Chem. Int. Ed. 40, 11, 2004–2021 [0053]
- C. N. Bowman und C. E. Hoyle, Angew. Chem. Int. Ed. 2010, 49, 1540–1573 [0053]
- S. S. van Berkel, et al., Angew. Chem. 2011, 123, 8968–8989 [0053]
- E. Lallana et al., Angew. Chem. 2011, 123, 8956–8966 [0053]
- A. H. El-Sagheerab, T. Brown, Chem. Soc. Rev. 2010, 39, 1388–1405 [0053]
- C. S. McKay, et al., Chem. Commun. 2010, 46, 931–933 [0053]
- W. Song, et al., J. Am. Chem. Soc. 2008, 130, 9654–9655 [0053]
- P. M. E. Gramlich, et al., Angew. Chem. Int. Ed. 2008, 47, 8350–8358 [0053]
- C. R. Becer, et al., Angew. Chem. Int. Ed. 2009, 48, 4900–4908 [0053]
- T. R. Chan, et al., Org. Lett. 2004, 6, 2853–2855 [0053]
- C. Uttamapinant, et al., Angew. Chem. Int. Ed. 2012, 51, 5852–5856 [0053]
- Y. Wang, et al., Angew. Chem. Int. Ed. 2009, 48, 5330–5333 [0053]
- C. Dalhoff, et al., Nat. Chem. Biol. 2006, 2, 31–32 [0058]
- W. Peters, S. Willnow, M. Duisken, H. Kleine, T. Macherey, K. E. Duncan, D. W. Litchfield, B. Luscher, E. Weinhold, Angew Chem Int Ed Engl 2010, 49, 5170 [0059]
- C. Dalhoff, et al., Nat. Chem. Biol. 2006, 2, 31–32 [0061]
- S. Hausmann, S. Shuman, J Biol Chem 2005, 280, 32101–32106 [0071]
- M. Tomkuviene, B. Clouet-d'Orval, I. Cerniauskas, E. Weinhold, S. Klimasauskas, Programmable sequence-specific click-labeling of RNA using archaeal box C/D RNP methyltransferases, Nucleic Acids Research, 2012, 40, 14, 6765 [0077]