Fluoreszierendes Protein Fluorescent protein
Hintergrund der ErfindungBackground of the Invention
Die Erfindung betrifft ein künstlich hergestelltes autofluoreszentes Protein, sowie ein Verfahren zu seiner Herstellung.The invention relates to an artificially produced autofluorescent protein and a method for its production.
Stand der TechnikState of the art
Fluoreszierende Proteine sind hervorragende Marker für die Genexpression und die Proteinlokalisation in verschiedenen biologischen Systemen (Kendall et al. (1998), Trends Biotechnol. 16, 216 - 224). Seit der Veröffentlichung des grünfluoreszierenden Proteins (GFP = green fluorescent protein) aus der biolumineszenten Qualle Aequorea victoria (Prasher et al. (1992) Gene 111 , 229 - 233) wurden zahlreiche Versuche unternommen, dieses Protein vorteilhaft zu verändern. So konnte beispielsweise die Löslichkeit des Proteins und seine Darstellbarkeit bei der Fluoreszenz-aktivierten Zellsortierung (FACS = fluorescence activated cell sorting) verbessert werden (Cormack et al. (1996), Gene 173, 33 - 38). Es wurden ferner verschiedene Farbmutanten des GFP erzeugt oder isoliert, die beispielsweise gelb, blau oder rot fluoreszieren (z.B. Sawano et al. (2000) NAR 28 (16), E 78; Yang et al. (1998), J. Biol. Chem. 273 (14), 8212; Heim et al. (1996), Curr. Biol. 6 (2), 178 - 182; Lewis et al. (1999) Anal. Chem. 71 (19), 4321 ; Patterson et al. (2001), J. Cell. Sei. 114, 837 - 838; Matz et al. (1999), Nature Biotechnol. 17, 969 - 973). Darüber hinaus wurden zahlreiche Versuche unternommen, bei dem GFP aus Aequorea durch Mutation eine hellere Fluoreszenz zu erzeugen (Sacchetti (2001) FEBS 492 (1 - 2), 151 ; Battistutta (2000), Proteins 41 (4), 429; Ito (1999) Biochem. Biophys. Res. Com. 264 (2), 556; Kim et al. (1998) Brain Res. Bull. 47 (1), 35; US 5,491 ,084 bzw. Nature Biotechnol. (1996) 14, 315 - 319). Diese zahlreichen Anstrengungen zur Veränderung und Verbesserung der bekannten fluoreszierenden Proteine zeigen, dass ein großer Bedarf an , solchen autofluoreszenten Proteinen mit unterschiedlichen
Eigenschaften besteht. Einen Überblick über die vielfältigen Anwendungsmöglichkeiten fluoreszierender Proteine gibt der Artikel von van Roessel et al. (Nature Cell Biology (2002) Vol. 4, E 15 - E 20).Fluorescent proteins are excellent markers for gene expression and protein localization in various biological systems (Kendall et al. (1998), Trends Biotechnol. 16, 216-224). Since the publication of the green fluorescent protein (GFP = green fluorescent protein) from the bioluminescent jellyfish Aequorea victoria (Prasher et al. (1992) Gene 111, 229-233), numerous attempts have been made to change this protein advantageously. For example, the solubility of the protein and its representability in fluorescence-activated cell sorting (FACS = fluorescence activated cell sorting) could be improved (Cormack et al. (1996), Gene 173, 33 - 38). Various GFP color mutants were also generated or isolated, which fluoresce, for example, yellow, blue or red (eg Sawano et al. (2000) NAR 28 (16), E 78; Yang et al. (1998), J. Biol. Chem . 273 (14), 8212; Heim et al. (1996), Curr. Biol. 6 (2), 178-182; Lewis et al. (1999) Anal. Chem. 71 (19), 4321; Patterson et al . (2001), J. Cell. Sci. 114, 837-838; Matz et al. (1999), Nature Biotechnol. 17, 969-973). In addition, numerous attempts have been made to generate a lighter fluorescence in the GFP from Aequorea by mutation (Sacchetti (2001) FEBS 492 (1 - 2), 151; Battistutta (2000), Proteins 41 (4), 429; Ito (1999 ) Biochem. Biophys. Res. Com. 264 (2), 556; Kim et al. (1998) Brain Res. Bull. 47 (1), 35; US 5,491, 084 and Nature Biotechnol. (1996) 14, 315 - 319). These numerous efforts to change and improve the known fluorescent proteins show that there is a great need for such autofluorescent proteins with different Properties. The article by van Roessel et al. Provides an overview of the various possible uses of fluorescent proteins. (Nature Cell Biology (2002) Vol. 4, E 15 - E 20).
Darüber hinaus wurden verstärkt neue fluoreszierende Proteine aus natürlichen Quellen, wie beispielsweise Anthozoen (Korallen), isoliert und charakterisiert (z.B. Matz et al. (1999), Nat. Biotechnol. 17, 969-973; Fradkov et al. (2000), FEBS Letters 479, 127-130). Eine solche Isolierung von neuen Proteinen aus natürlichen Quellen und deren anschließende Klonierung ist aber sehr aufwendig und kostenintensiv.In addition, new fluorescent proteins from natural sources, such as anthozoa (corals), have been increasingly isolated and characterized (e.g. Matz et al. (1999), Nat. Biotechnol. 17, 969-973; Fradkov et al. (2000), FEBS Letters 479, 127-130). Such isolation of new proteins from natural sources and their subsequent cloning is very complex and costly.
Die WO 99/49019 A2 offenbart beispielsweise grün-fluoreszierende Proteine aus Anthozoen der Gattungen Renilla und Ptilosarcus, sowie die isolierten Nukleinsäuren, die für diese Proteine kodieren.WO 99/49019 A2, for example, discloses green fluorescent proteins from anthozoa of the genera Renilla and Ptilosarcus, as well as the isolated nucleic acids which code for these proteins.
Die WO 00/46233 A1 offenbart ferner ein fluoreszierendes Protein aus Korallen, sowie die hierfür kodierenden Gene und mögliche Anwendungen für die Proteine.WO 00/46233 A1 also discloses a fluorescent protein from corals, as well as the genes coding therefor and possible uses for the proteins.
Die WO 01/32688 A1 offenbart die Aminosäuresequenzen von grünfluoreszierenden Proteinen aus Renilla reniformis (Anthozoa, Coelenterata), sowie die hieraus abgeleiteten Nukleotid-Sequenzen der Nukleinsäuren und eine Vielzahl von Anwendungsmöglichkeiten.WO 01/32688 A1 discloses the amino acid sequences of green fluorescent proteins from Renilla reniformis (Anthozoa, Coelenterata), as well as the nucleotide sequences of the nucleic acids derived therefrom and a multitude of possible uses.
Die WO 01/34824 A2 zeigt einen Sequenzvergleich („alignment") verschiedener fluoreszierender Proteine aus Aequorea victoria, Ptilosarcus gurneyi und Renilla mulleri. Dieser Sequenzvergleich dient der Feststellung von Homologien der Proteine, d.h. der Ermittlung der relativen Ähnlichkeiten zwischen diesen Proteinen, und führt nicht zur Herstellung neuer fluoreszierender Proteine.
Die Bestrebungen ständig neue autofluoreszente Proteine aus immer neuen Quellen zu isolieren zeigen, dass ein sehr großer Bedarf an neuen fluoreszierenden Proteinen mit vorteilhaften Eigenschaften besteht.WO 01/34824 A2 shows a sequence comparison (“alignment”) of different fluorescent proteins from Aequorea victoria, Ptilosarcus gurneyi and Renilla mulleri. This sequence comparison serves to determine homologies of the proteins, ie to determine the relative similarities between these proteins, and does not lead for the production of new fluorescent proteins. The efforts to isolate new autofluorescent proteins from ever new sources show that there is a very great need for new fluorescent proteins with advantageous properties.
Zusammenfassung der ErfindungSummary of the invention
Es ist daher Aufgabe der Erfindung, neue fluoreszierende Proteine bereitzustellen.It is therefore an object of the invention to provide new fluorescent proteins.
Die Aufgabe wird erfindungsgemäß durch ein fluoreszierendes Protein gelöst, das eine Aminosäuresequenz aufweist, welche mit einer der Aminosäuresequenzen gemäß Seq ID Nrn. 1 , 15, 17, 19 und 21 zumindest 80 % Homologie aufweist. Es werden also neue autofluoreszente Proteine bereitgestellt, die aufgrund ihrer Fluoreszenz in Zellen nachweisbar sind und daher als Marker für die Genexpression und die Proteinlokalisation beispielsweise in der Zeil-, Entwicklungs- und Molekularbiologie verwendet werden können. Dabei weisen die erfindungsgemäßen Proteine auch teilweise neue Eigenschaften auf, wie beispielsweise die Regenerierbarkeit der Fluoreszenz nach deren Ausbleichen mittels Bestrahlung mit Licht bestimmter Wellenlänge.The object is achieved according to the invention by a fluorescent protein which has an amino acid sequence which has at least 80% homology with one of the amino acid sequences according to Seq ID Nos. 1, 15, 17, 19 and 21. Thus, new autofluorescent proteins are made available which are detectable in cells due to their fluorescence and can therefore be used as markers for gene expression and protein localization, for example in cell, development and molecular biology. The proteins according to the invention also sometimes have new properties, such as, for example, the ability of the fluorescence to be regenerated after it has bleached out by irradiation with light of a specific wavelength.
Als fluoreszierende Proteine im Sinne der Erfindung sind dabei auch Fusionsproteine und Multimere zu verstehen, die zumindest ein erfindungsgemäßes fluoreszierendes Protein enthalten. Dies gilt besonders für Fusionsproteine, da die erfindungsgemäßen Proteine unter anderem als Expressionsmarker verwendet werden können und sich somit eine Fusion mit weiteren Proteinen anbietet.In the context of the invention, fluorescent proteins are also to be understood as fusion proteins and multimers which contain at least one fluorescent protein according to the invention. This applies in particular to fusion proteins, since the proteins according to the invention can be used, inter alia, as expression markers and thus a fusion with other proteins is appropriate.
Im Sinne der Erfindung ist unter dem Begriff Homologie der Grad der Übereinstimmung von zwei Proteinsequenzen, d.h. die Anzahl der in den Proteinen übereinstimmenden Aminosäure-Positionen in Prozent, zu verstehen. Dabei können in eine oder beide Proteinsequenzen eine oder mehrere Lücken eingefügt werden, damit die höchstmögliche Anzahl identischer Aminosäuren in
Bezug auf ihre jeweilige Position einander zugeordnet sind. Zur Bestimmung der Homologie kann aber beispielsweise auch ein herkömmliches Datenverarbeitungsprogramm verwendet werden.For the purposes of the invention, the term homology means the degree of agreement between two protein sequences, ie the number of amino acid positions in the proteins that match in percent. One or more gaps can be inserted into one or both protein sequences so that the highest possible number of identical amino acids in Are assigned to each other with respect to their respective position. A conventional data processing program can, for example, also be used to determine the homology.
In besonders vorteilhafter Ausgestaltung der Erfindung weist das erfindungsgemäße fluoreszierende Protein mit einer der Aminosäuresequenzen gemäß Seq ID Nrn. 1 , 15, 17, 19 und 21 zumindest 90 % Homologie auf.In a particularly advantageous embodiment of the invention, the fluorescent protein according to the invention has at least 90% homology with one of the amino acid sequences according to Seq ID Nos. 1, 15, 17, 19 and 21.
Durch gezielte oder ungerichtete Mutation lassen sich die Eigenschaften des erfindungsgemäßen Proteins vorteilhaft beeinflussen. Dabei hat sich als besonders vorteilhaft erwiesen, dass bezogen auf die Aminosäuresequenz gemäß Seq ID Nr. 1 die Aminosäure an Position 2 Valin oder Glutaminsäure ist, die Aminosäure an Position 3 Alanin oder Leucin, die Aminosäure an Position 4 Lysin oder Cystein, die Aminosäure an Position 6 Lysin oder Valin oder Glutaminsäure, die Aminosäure an Position 7 Asparagin oder Alanin, die Aminosäure an Position 10 Lysin oder Threonin, die Aminosäure an Position 44 Threonin oder Alanin, die Aminosäure an Position 98 Isoleucin oder Phenylalanin, die Aminosäure an Position 108 Isoleucin oder Aianin, die Aminosäure an Position 125 Leucin oder Phenylalanin, die Aminosäure an Position 128 Valin oder Alanin, die Aminosäure an Position 150 Lysin oder Glutaminsäure, die Aminosäure an Position 174 Tyrosin oder Histidin, die Aminosäure an Position 183 Lysin oder Glutaminsäure, die Aminosäure an Position 213 Valin oder Alanin, die Aminosäure an Position 223 Glycin oder Lysin, die Aminosäure an Position 224 Valin oder Isoleucin oder Serin, die Aminosäure an Position 225 Alanin oder Arginin oder Tryptophan, die Aminosäure an Position 226 Leucin oder Glycin oder Serin, die Aminosäure an Position 227 Prolin oder Threonin und/oder die Aminosäure an Position 228 Lysin oder Serin ist. Das Vorliegen dieser Aminosäuren an den jeweiligen Positionen wirkt sich beispielsweise vorteilhaft auf die Expression, Stabilität, Löslichkeit und Fluoreszenzintensität der erfindungsgemäßen Proteine aus.
Einige der erfindungsgemäßen fluoreszierenden Proteine weisen die vorteilhafte und überraschende Eigenschaft auf, dass die Fluoreszenz bei der Bestrahlung mit Licht für die Fluoreszenz geeigneter Wellenlänge nach kurzer Zeit abklingt und durch eine folgende Bestrahlung mit Licht anderer Wellenlänge wieder regenerierbar ist. Dabei kann die Bestrahlung zur Anregung der Fluoreszenz mit Licht einer Wellenlänge zwischen 375 und 580 nm und die Bestrahlung zur Regeneration der Fluoreszenz mit Licht kürzerer Wellenlänge, insbesondere einer Wellenlänge zwischen 320 und 400 nm, erfolgen. Erfindungsgemäß kann dieses fluoreszierende Protein in vorteilhafter Weise beispielsweise zum Nachweis von zeitabhängigen zellulären Prozessen, wie Proteindiffusion oder -transport, oder zur optischen Informationsspeicherung verwendet werden.The properties of the protein according to the invention can be advantageously influenced by targeted or undirected mutation. It has proven to be particularly advantageous that, based on the amino acid sequence according to Seq ID No. 1, the amino acid at position 2 is valine or glutamic acid, the amino acid at position 3 is alanine or leucine, the amino acid at position 4 is lysine or cysteine, the amino acid Position 6 lysine or valine or glutamic acid, the amino acid at position 7 asparagine or alanine, the amino acid at position 10 lysine or threonine, the amino acid at position 44 threonine or alanine, the amino acid at position 98 isoleucine or phenylalanine, the amino acid at position 108 isoleucine or aianin, the amino acid at position 125 leucine or phenylalanine, the amino acid at position 128 valine or alanine, the amino acid at position 150 lysine or glutamic acid, the amino acid at position 174 tyrosine or histidine, the amino acid at position 183 lysine or glutamic acid, the amino acid at position 213 valine or alanine, the amino acid at position 223 glycine or lysine, di e Amino acid at position 224 valine or isoleucine or serine, the amino acid at position 225 alanine or arginine or tryptophan, the amino acid at position 226 leucine or glycine or serine, the amino acid at position 227 proline or threonine and / or the amino acid at position 228 lysine or is serine. The presence of these amino acids at the respective positions has an advantageous effect, for example, on the expression, stability, solubility and fluorescence intensity of the proteins according to the invention. Some of the fluorescent proteins according to the invention have the advantageous and surprising property that the fluorescence decays after a short time when irradiated with light and is suitable for fluorescence and can be regenerated by subsequent irradiation with light of a different wavelength. The irradiation to excite the fluorescence with light of a wavelength between 375 and 580 nm and the irradiation to regenerate the fluorescence with light of shorter wavelength, in particular a wavelength between 320 and 400 nm, can take place. According to the invention, this fluorescent protein can advantageously be used, for example, for the detection of time-dependent cellular processes, such as protein diffusion or transport, or for optical information storage.
Die Erfindung betrifft ferner ein Nukleinsäuremolekül mit einer Nukleotidsequenz, die für ein fluoreszierendes Protein kodiert, wobei die Nukleotidsequenz ausgewählt ist aus der Gruppe bestehend aus a) einer isolierten oder künstlichen Nukleotidsequenz, welche für das erfindungsgemäße fluoreszierende Protein kodiert. b) einer Nukleotidsequenz gemäß Seq ID Nrn. 2, 16, 18, 20 oder 22, oder c) einer Nukleotidsequenz, welche sich von den Nukleotidsequenzen gemäß a) oder b) durch den Austausch zumindest eines Codons gegen ein synonymes Codon unterscheidet, d.h bei der zumindest eine stille Mutation vorliegt.The invention further relates to a nucleic acid molecule with a nucleotide sequence which codes for a fluorescent protein, the nucleotide sequence being selected from the group consisting of a) an isolated or artificial nucleotide sequence which codes for the fluorescent protein according to the invention. b) a nucleotide sequence according to Seq ID No. 2, 16, 18, 20 or 22, or c) a nucleotide sequence which differs from the nucleotide sequences according to a) or b) by the exchange of at least one codon for a synonymous codon, ie in that has at least one silent mutation.
Die Erfindung betrifft ferner einen Vektor zur Expression eines fluoreszierenden Proteins in einer geeigneten Zelle, wobei dieser das zuvor beschriebene Nukleinsäuremolekül in exprimierbarer Form enthält.The invention further relates to a vector for expressing a fluorescent protein in a suitable cell, which contains the previously described nucleic acid molecule in an expressible form.
Die Erfindung betrifft auch Zellen, welche das erfindungsgemäße Protein, das genannte Nukleinsäuremolekül und/oder den genannten Vektor enthalten, sowie einen Kit, der das erfindungsgemäße Protein, das beschriebene Nukleinsäuremolekül, den beschriebenen Vektor und/oder zumindest eine der genannten Zellen enthalten.
Es ist ferner eine pharmazeutische Zusammensetzung vorgesehen, welche das erfindungsgemäße Protein, das genannte Nukleinsäuremolekül und/oder den genannten Vektor, sowie vorzugsweise übliche Hilfs- und/oder Trägerstoffe, enthält.The invention also relates to cells which contain the protein according to the invention, the nucleic acid molecule and / or the vector mentioned, and a kit which contain the protein according to the invention, the nucleic acid molecule described, the vector described and / or at least one of the cells mentioned. A pharmaceutical composition is also provided which contains the protein according to the invention, the nucleic acid molecule and / or the vector mentioned, and preferably conventional auxiliaries and / or carriers.
Die Erfindung betrifft ferner ein Verfahren zur Herstellung eines erfindungsgemäßen fluoreszierenden Proteins. Bei diesem Verfahren werden die Aminosäuresequenzen von zumindest drei bekannten autofluoreszenten Proteinen dadurch verglichen, dass diese zunächst auf eine Weise nebeneinander angeordnet werden, dass sich gegebenenfalls unter Einführung von Lücken eine Übereinstimmung der Positionen von invarianten Aminosäuren oder ähnlichen Bereichen für alle Proteine ergibt. Dabei können die Aminosäuresequenzen beispielsweise derart zueinander ausgerichtet werden, dass die höchstmögliche Anzahl identischer Aminosäuren in Bezug auf ihre jeweilige Position einander zugeordnet sind, wobei dies vorzugsweise unter Beibehaltung der jeweiligen Reihenfolge der Aminosäuren erfolgt. Ähnliche Bereiche sind hierbei alle Sequenzabschnitte, vorzugsweise ein Abschnitt von zumindest drei aufeinanderfolgenden Aminosäuren, die eine im wesentlichen identische Primärstruktur aufweisen oder im gefalteten Protein eine Domäne bilden, deren Funktion bereits bekannt ist. Die ähnlichen Bereiche können bei unterschiedlichen Proteinen auch an unterschiedlichen Positionen liegen. In diesem Fall kann der Abgleich der ähnlichen Bereiche beispielsweise durch Einfügen von Lücken oder das Verschieben dieser Bereiche in der Sequenz erfolgen.The invention further relates to a method for producing a fluorescent protein according to the invention. In this method, the amino acid sequences of at least three known autofluorescent proteins are compared in that they are initially arranged next to one another in such a way that, with the introduction of gaps, the positions of invariant amino acids or similar regions for all proteins may match. The amino acid sequences can, for example, be aligned with one another in such a way that the highest possible number of identical amino acids are assigned to one another in relation to their respective positions, this preferably being done while maintaining the respective order of the amino acids. Similar areas are all sequence sections, preferably a section of at least three consecutive amino acids which have an essentially identical primary structure or which form a domain in the folded protein, the function of which is already known. The similar areas can also be in different positions for different proteins. In this case, the similar areas can be compared, for example, by inserting gaps or moving these areas in the sequence.
Mit Hilfe dieses Abgleiche der jeweiligen Positionen der ausgewählten Aminosäuresequenzen wird eine Durchschnitts-Sequenz über zumindest einen wesentlichen Teil der gesamten Länge der Aminosäuresequenz ermittelt. Dabei wird für jede gegebene Position diejenige Aminosäure ausgewählt, die in den zugrundeliegenden Aminosäuresequenzen an dieser Position am häufigsten auftritt, wobei eine Lücke wie eine Aminosäure behandelt wird. Hieraus ergibt sich eine Folge von Aminosäuren und Lücken mit dazwischen liegenden Positionen, an
denen keine Aminosäure am häufigsten auftritt bzw. an denen zwei oder mehr Aminosäuren mit der gleichen Häufigkeit auftreten. An diesen Stellen muss nun eine Aminosäure nach zuvor festgelegten, sinnvollen, reproduzierbaren und allgemein gültigen Kriterien ausgewählt werden. Hierzu stellt das erfindungsgemäße Verfahren mehrere Möglichkeiten zur Verfügung.With the aid of this comparison of the respective positions of the selected amino acid sequences, an average sequence over at least a substantial part of the total length of the amino acid sequence is determined. For each given position, the amino acid that occurs most frequently in the underlying amino acid sequences at this position is selected, with a gap being treated like an amino acid. This results in a sequence of amino acids and gaps with positions in between where no amino acid occurs most frequently or where two or more amino acids occur with the same frequency. At these points, an amino acid must now be selected according to previously defined, meaningful, reproducible and generally applicable criteria. The method according to the invention provides several options for this.
Gemäß einer bevorzugten Ausführungsform der Erfindung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass zunächst vor dem Vergleich der Aminosäuresequenzen eine Rangfolge der zugrundeliegenden Proteine festgelegt wird, d.h. den einzelnen Proteinen werden Rangnummern von 1 bis n zugeordnet. Ist an einer Position die häufigste Aminosäure nicht eindeutig feststellbar, so wird diejenige Aminosäure eingesetzt, die unter den häufigsten Aminosäuren zu der Proteinsequenz gehört, die die niedrigste Rangnummer besitzt.According to a preferred embodiment of the invention, an amino acid at such a position is determined by first establishing a ranking of the underlying proteins before comparing the amino acid sequences, i.e. Rank numbers from 1 to n are assigned to the individual proteins. If the most common amino acid cannot be clearly identified at a position, the amino acid that belongs to the protein sequence with the lowest rank number among the most common amino acids is used.
Gemäß einer weiteren bevorzugten Ausführungsform der Erfindung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass die Aminosäuren aufgrund funktioneller und/oder struktureller Kriterien in Gruppen eingeteilt werden und bei mehreren Aminosäuren mit gleicher Häufigkeit eine Aminosäure aus der Gruppe ausgewählt wird, die an der jeweiligen Position am häufigsten auftritt.According to a further preferred embodiment of the invention, an amino acid is determined at such a position in that the amino acids are divided into groups on the basis of functional and / or structural criteria and, in the case of several amino acids, an amino acid is selected with the same frequency from the group that is present on the respective Position occurs most frequently.
Gemäß einer weiteren bevorzugten Ausführungsform der Erfindung wird eine Aminosäure an einer solchen Position dadurch ermittelt, dass bei mehreren Aminosäuren mit gleicher Häufigkeit die Aminosäure aufgrund funktioneller und/oder struktureller Kriterien unter Berücksichtigung der Eigenschaften der bekannten Proteine ausgewählt wird.According to a further preferred embodiment of the invention, an amino acid at such a position is determined by selecting the amino acid in the case of several amino acids with the same frequency on the basis of functional and / or structural criteria, taking into account the properties of the known proteins.
Dabei kann beim Erstellen der Durchschnitts-Sequenz die Auswahl einer Aminosäure bei mehreren Aminosäuren mit gleicher Häufigkeit innerhalb einer Aminosäuresequenz auch aufgrund unterschiedlicher Kriterien erfolgen, d.h. die zuvor genannten Ausführungsformen können in vorteilhafter Weise miteinander kombiniert werden. Ferner können funktioneile und strukturelle Kriterien oder
sonstige Kenntnisse über die bekannten Proteine auch die genannte Festlegung der Rangfolge der Aminosäure-Sequenzen vor deren Vergleich bedingen oder zumindest beeinflussen.When creating the average sequence, the selection of an amino acid with several amino acids with the same frequency within an amino acid sequence can also take place on the basis of different criteria, ie the aforementioned embodiments can be combined with one another in an advantageous manner. Furthermore, functional and structural criteria or other knowledge of the known proteins also requires, or at least influences, the aforementioned determination of the ranking of the amino acid sequences before their comparison.
Das erfindungsgemäße Verfahren ermöglicht überraschender Weise die Herstellung neuer fluoreszierender Proteine, die sich in einem geigneten System exprimieren lassen. Die zuvor beschriebenen Verfahrensschritte führen zu einer vollständigen, künstlichen Aminosäuresequenz, die ein Protein repräsentiert, welches Autofluoreszenz zeigt und in einem geeigneten System exprimierbar ist.The method according to the invention surprisingly enables the production of new fluorescent proteins which can be expressed in a suitable system. The process steps described above lead to a complete, artificial amino acid sequence which represents a protein which shows autofluorescence and can be expressed in a suitable system.
Zur Expression des Proteins und zum Nachweis der Fluoreszenz wird zunächst eine künstliche Nukleinsäure-Sequenz, die für die ermittelte Durchschnitts- Sequenz kodiert, erstellt und zumindest ein entsprechendes Nukleinsäure-Molekül synthetisiert. Dieses Nukleinsäure-Molekül wird mit einem geeigneten Promotor verbunden und das Protein dann in einem geeigneten System exprimiert. Das erfindungsgemäße Verfahren führt also zu einem neuen, vollständig funktionsfähigen fluoreszierenden Protein. Das Verfahren kann dabei einfach und ohne grossen apparativen Aufwand durchgeführt werden. Ferner wird bei dem erfindungsgemäßen Verfahren nicht lediglich ein bekanntes Protein verändert, sondern dieses geht vielmehr von mehreren bekannten Proteinen aus, so dass die positiven Eigenschaften der verschiedenen Proteine in dem neuen Protein vereint werden können. Auf diese Weise können neue fluoreszierende Proteine hergestellt werden, ohne dass bisher unbekannte natürliche Proteine mit viel Aufwand isoliert und kloniert werden müssen.For the expression of the protein and for the detection of fluorescence, an artificial nucleic acid sequence, which codes for the determined average sequence, is first created and at least one corresponding nucleic acid molecule is synthesized. This nucleic acid molecule is linked to a suitable promoter and the protein is then expressed in a suitable system. The method according to the invention thus leads to a new, fully functional fluorescent protein. The method can be carried out easily and without great expenditure on equipment. Furthermore, in the method according to the invention, not only is a known protein changed, but rather it is based on several known proteins, so that the positive properties of the different proteins can be combined in the new protein. In this way, new fluorescent proteins can be produced without having to isolate and clone previously unknown natural proteins with great effort.
In einer bevorzugten Ausführungsform wird dabei die Durchschnitts-Sequenz vor dem Erstellen der künstlichen Nukleinsäure-Sequenz am N-Terminus und/oder C- Terminus durch Austausch zumindest einer Aminosäure modifiziert. Zum Erreichen einer optimalen Kozak-Region im Bereich des Start-Codons kann beispielsweise nach der Startaminosäure Methionin die zusätzliche Aminosäure Valin eingeführt werden. Am C-Terminus kann ferner beispielsweise die
zusätzliche hydrophile Aminosäure Serin angefügt werden, um die Löslichkeit des Proteins zu verbessern.In a preferred embodiment, the average sequence is modified before the creation of the artificial nucleic acid sequence at the N-terminus and / or C-terminus by exchanging at least one amino acid. To achieve an optimal Kozak region in the region of the start codon, the additional amino acid valine can be introduced, for example, after the start amino acid methionine. At the C-terminus, for example additional hydrophilic amino acid serine can be added to improve the solubility of the protein.
In besonders vorteilhafter Ausgestaltung des erfindungsgemäßen Verfahrens ist vorgesehen, dass anschließend, d.h. nach Erstellung und Expression der Durchschnitts-Sequenz, in dem künstlichen Nukleinsäure-Molekül zumindest ein Codon ausgetauscht und/oder durch Mutagenese verändert wird und hierdurch zumindest eine Aminosäure der Durchschnitts-Sequenz ausgetauscht wird. Durch den Austausch einer oder mehrerer Aminosäuren können bestimmte Eigenschaften des künstlichen Proteins, wie beispielsweise Stabilität, Löslichkeit, Kompatibilität oder Funktionalität, in vorteilhafter Weise verändert werden. Dabei kann insbesondere die Fluoreszenz, d.h. die gemeinsame Funktion der ursprünglichen bekannten Proteine, gezielt beeinflusst bzw. verbessert werden. Erfindungsgemäß konnten andere Mutanten des fluoreszierenden Durchschnitts- Proteins (Durchschnitts - FP) generiert werden, die in Bezug auf die Löslichkeit in der Zelle und die Helligkeit der Fluoreszenz deutlich verbessert sind. Dabei betragen die Abweichungen der Mutantenklone vom Durchschnitts - FP in Bezug auf die Aminosäure-Sequenz maximal 10%, d.h. die Homologie der erfindungsgemäßen Proteine untereinander beträgt mindestens 90%.In a particularly advantageous embodiment of the method according to the invention it is provided that subsequently, i.e. after creation and expression of the average sequence, at least one codon is exchanged and / or changed by mutagenesis in the artificial nucleic acid molecule and thereby at least one amino acid of the average sequence is exchanged. By exchanging one or more amino acids, certain properties of the artificial protein, such as stability, solubility, compatibility or functionality, can be changed in an advantageous manner. In particular, the fluorescence, i.e. the common function of the originally known proteins can be influenced or improved in a targeted manner. According to the invention, it was possible to generate other mutants of the fluorescent average protein (average - FP), which are significantly improved with regard to the solubility in the cell and the brightness of the fluorescence. The deviations of the mutant clones from the average FP with respect to the amino acid sequence are a maximum of 10%, i.e. the homology of the proteins according to the invention with one another is at least 90%.
In weiterer Ausgestaltung des erfindungsgemäßen Verfahrens ist vorgesehen, dass das Protein nach der Expression isoliert und/oder aufgereinigt wird, damit es der weiteren Verwendung in geeigneter Form zugeführt werden kann.In a further embodiment of the method according to the invention it is provided that the protein is isolated and / or purified after expression so that it can be used in a suitable form for further use.
Kurze Beschreibung der AbbildungenBrief description of the pictures
Die Erfindung wird im weiteren anhand der Figuren beispielhaft näher erläutert.The invention is explained in more detail below using the figures as an example.
Figur 1 zeigt einen Vergleich der Aminosäuresequenzen von 9 fluoreszierenden Proteinen (FPs), bei dem die Sequenzen derart untereinander angeordnet sind, dass sich unter Einführung von Lücken eine optimale Übereinstimmung von
invarianten Aminosäuren oder ähnlichen Bereichen für alle Proteine ergibt. Dabei wurden den einzelnen FPs jeweils Rangnummern zugeordnet:FIG. 1 shows a comparison of the amino acid sequences of 9 fluorescent proteins (FPs), in which the sequences are arranged with one another in such a way that an optimal match of results in invariant amino acids or similar regions for all proteins. Rank numbers were assigned to the individual FPs:
Rangnummer 1 : Aequorea victoria GFP (Gene (1992) 111 , 229) Rangnummer 2: Zoanthus sp. zFP506 (Nature Biotechnol. (1999) 17, 969) Rangnummer 3: Zoanthus sp. zFP538 (Nature Biotechnol. (1999) 17, 969) Rangnummer 4: Discosoma striata dsFP483 (Nature Biotechnol. (1999) 17, 969) Rangnummer 5: Discosoma sp. "red" dsFP583 (Nature Biotechnol. (1999) 17,969) Rangnummer 6: Anemonia majano amFP486 (Nature Biotechnol. (1999) 17, 969) Rangnummer 7: Clavularia sp. cFP484 (Nature Biotechnol. (1999) 17, 969) Rangnummer 8: Renilla mulleri GFP (WO 99/49019) Rangnummer 9: Ptilosarcus gurneyi GFP (WO 99/49019)Rank 1: Aequorea victoria GFP (Gene (1992) 111, 229) Rank 2: Zoanthus sp. zFP506 (Nature Biotechnol. (1999) 17, 969) Rank 3: Zoanthus sp. zFP538 (Nature Biotechnol. (1999) 17, 969) Rank 4: Discosoma striata dsFP483 (Nature Biotechnol. (1999) 17, 969) Rank 5: Discosoma sp. "red" dsFP583 (Nature Biotechnol. (1999) 17,969) Rank 6: Anemonia majano amFP486 (Nature Biotechnol. (1999) 17, 969) Rank 7: Clavularia sp. cFP484 (Nature Biotechnol. (1999) 17, 969) Rank 8: Renilla mulleri GFP (WO 99/49019) Rank 9: Ptilosarcus gurneyi GFP (WO 99/49019)
Hieraus wurde die Durchschnitts-Sequenz bzw. durch das Einfügen zusätzlicher Modifikationen das Durchschnitts-FP gemäß dem erfindungsgemäßen Verfahren ermittelt.From this, the average sequence or, by adding additional modifications, the average FP was determined in accordance with the method according to the invention.
a) Aminosäure-Positionen 1 bis 53 b) Aminosäure-Positionen 54 bis 109 c) Aminosäure-Positionen 110 bis 164 d) Aminosäure-Positionen 165 bis 222 e) Aminosäure-Positionen 223 bis 234a) Amino acid positions 1 to 53 b) Amino acid positions 54 to 109 c) Amino acid positions 110 to 164 d) Amino acid positions 165 to 222 e) Amino acid positions 223 to 234
Die Nummeherung der Positionen bezieht sich hier auf die ermittelte Durchschnitts-Sequenz. An den Stellen, an denen in der Durchschnitts-Sequenz eine Lücke vorliegt, werden die Positionen nicht fortlaufend nummeriert, sondern mit den Zusätzen „b" bzw. „c" versehen. Ausnahmen hiervon bilden lediglich die Positionen 1 b und 226b, an denen im Durchschnitts-FP gegenüber der ermittelten Durchschnitts-Sequenz zusätzliche Aminosäuren eingefügt sind.The numbering of the positions refers to the average sequence determined. At the points where there is a gap in the average sequence, the positions are not numbered consecutively, but are given the additions "b" or "c". Exceptions to this are only positions 1b and 226b, where additional amino acids are inserted in the average FP compared to the average sequence determined.
Figur 2 zeigt eine schematische Darstellung des Aufbaus der Plasmide, die zur Durchführung des beschriebenen Verfahrens und zur Expression der erfindungsgemäßen fluoreszierenden Proteine in Escherichia coli und Säugetierzellen verwendet werden.
Figur 3 zeigt fluoreszenzmikroskopische Bilder von NIH3T3-Zellen, die mit Expressionsplasmiden für verschiedene Mutageneseprodukte der erfindungsgemäßen Proteine transfiziert wurden. A: 9 Stunden nach Transfektion, B: 24 Stunden nach Transfektion.FIG. 2 shows a schematic representation of the structure of the plasmids which are used to carry out the described method and to express the fluorescent proteins according to the invention in Escherichia coli and mammalian cells. FIG. 3 shows fluorescence microscopic images of NIH3T3 cells which were transfected with expression plasmids for various mutagenesis products of the proteins according to the invention. A: 9 hours after transfection, B: 24 hours after transfection.
Figur 4 zeigt fluoreszenzmikroskopische Bilder von NIH3T3-Zellen (Fluoreszein- Filtersatz) nach Transfektion mit einem Expressionsplasmid für ein Mutageneseprodukt eines erfindungsgemäß hergestellten Proteins (p2A9-c15m3). A: Aufnahme 6 Stunden nach Transfektion bei Bestrahlung mit Fluoreszein- Anregungsfilter, B: Aufnahme nach 10 Sekunden Bestrahlung mit Fluoreszein- Anregungsfilter, C: Aufnahme nach 2 Sekunden Bestrahlung mit DAPI- Anregungsfilter zur Regeneration und anschließender Bestrahlung mit Fluoreszein-Anregungsfilter.FIG. 4 shows fluorescence microscopic images of NIH3T3 cells (fluorescein filter set) after transfection with an expression plasmid for a mutagenesis product of a protein produced according to the invention (p2A9-c15m3). A: Recording 6 hours after transfection when irradiated with fluorescein excitation filter, B: recording after 10 seconds irradiation with fluorescein excitation filter, C: recording after 2 seconds irradiation with DAPI excitation filter for regeneration and subsequent irradiation with fluorescein excitation filter.
Figur 5 zeigt fluoreszenzmikroskopische Bilder von Escherichia coli - Zellen (DH5), die mit je 7,1 μg eines Plasmids ohne fluoreszierendes Protein (pMCS5, Negativkontrolle; A) und eines Expressionplasmids (pExpAcFP; B), welches das Gen für das Durchschnitts-FP enthält, transformiert wurden. Von einer ÜN-Kultur der transformierten Zellen wurden jeweils 2 ml pelletiert, der Überstand dekantiert, das Pellet mit dem letzten Tropfen resuspendiert und von dieser Suspension jeweils 10 μl auf einen Objektträger mit Deckgläschen gegeben.FIG. 5 shows fluorescence microscopic images of Escherichia coli cells (DH5), each with 7.1 μg of a plasmid without fluorescent protein (pMCS5, negative control; A) and of an expression plasmid (pExpAcFP; B) which contains the gene for the average FP contains were transformed. 2 ml of a culture of the transformed cells were pelleted, the supernatant was decanted, the pellet was resuspended with the last drop and 10 μl of this suspension were placed on a slide with a cover slip.
Beschreibung der ErfindungDescription of the invention
Das nachfolgende Beispiel dient der näheren Erläuterung der Erfindung, ohne diese jedoch auf die beispielhaft offenbarten Stoffe und Verfahren zu beschränken.
Beispiel: Herstellung des künstlichen autofluoreszenten ProteinsThe following example serves to explain the invention in greater detail, but without restricting it to the substances and methods disclosed by way of example. Example: Production of the artificial autofluorescent protein
Für die Herstellung des künstlichen autofluoreszenten Proteins nach dem oben beschriebenen Verfahren wurden die Aminosäuresequenzen der folgenden natürlich vorkommenden Proteine, die als gemeinsame Funktion Autofluoreszenz aufweisen, unter Festlegung einer Rangfolge zugrundegelegt:For the production of the artificial autofluorescent protein by the method described above, the amino acid sequences of the following naturally occurring proteins, which have autofluorescence as a common function, were taken as a basis, with a ranking:
Rangnummer 1 : Aequorea victoria GFP Rangnummer 2: Zoanthus sp. zFP506 Rangnummer 3: Zoanthus sp. zFP538 Rangnummer 4: Discosoma striata dsFP483 Rangnummer 5: Discosoma sp. "red" dsFP583 Rangnummer 6: Anemonia majano amFP486 Rangnummer 7: Clavulaha sp. cFP484 Rangnummer 8: Renilla mulleri GFP Rangnummer 9: Ptilosarcus gurneyi GFPRank 1: Aequorea victoria GFP Rank 2: Zoanthus sp. zFP506 Rank 3: Zoanthus sp. zFP538 Rank 4: Discosoma striata dsFP483 Rank 5: Discosoma sp. "red" dsFP583 Rank 6: Anemonia majano amFP486 Rank 7: Clavulaha sp. cFP484 Rank 8: Renilla mulleri GFP Rank 9: Ptilosarcus gurneyi GFP
Die Anordnung der Aminosäuresequenzen erfolgte zunächst in Form eines „alignments", bei dem unter Einführung von Lücken eine Übereinstimmung der Positionen von invarianten Aminosäuren für alle Proteine erzielt wurde, wobei die Aminosäuresequenzen derart zueinander ausgerichtet wurden, dass unter Beibehaltung der jeweiligen Reihenfolge der Aminosäuren die höchstmögliche Anzahl identischer Aminosäuren in Bezug auf ihre jeweilige Position einander zugeordnet sind (vgl. Matz et al. (1999), Nat. Biotechnol. 17, 969-973). Die Aminosäuresequenzen von Renilla mulleri GFP und Ptilosarcus gurneyi GFP wurden dann hierzu ergänzend unter Berücksichtigung offensichtlich invarianter Aminosäuren angefügt (siehe Figur 1 a - e). Die sich aus dieser Anordnung ergebende Folge der jeweils eindeutig häufigsten Aminosäuren wurde an den übrigen Positionen durch diejeinige der häufigsten Aminosäuren ergänzt, die an dieser Position die höchste Rangnummer besitzt. Die daraus resultierende Durchschnitts-Sequenz wurde daraufhin sowohl am N-Terminus als auch am C-
Terminus modifiziert. Zum Erreichen einer optimalen Kozak-Region im Bereich des Start-Codons wurde nach der Startaminosäure Methionin die zusätzliche Aminosäure Valin eingeführt. Am C-Terminus wurde die zusätzliche hydrophile Aminosäure Serin angefügt, um die Löslichkeit des Proteins nicht durch einen hydrophoben C-Terminus zu erschweren. Für diese Proteinsequenz (Seq ID No. 1) wurde nun eine kodierende DNA-Sequenz (Seq ID No. 2) unter Berücksichtigung der Codons entworfen, die in Säugetierzellen besonders häufig auftreten. Für die Klonierung des gewünschten FP-Gens (FP = Fluoreszierendes Protein) in das Expressionsplasmid pExpA wurden 12 teilkomplementäre DNA-Oligonukleotide (Seq ID Nos. 3 - 14) verwendet, aus denen in zwei aufeinanderfolgenden PCR- Reaktionen das gesamte FP-Gen amplifiziert wurde. Durch anschließenden Restriktionsverdau mit den Restriktionsenzymen Xba I und Not I wurde ein DNA- Fragment erhalten, das nach Ligation mit dem Xba I / Not I Fragment von pExpA das Expressionplasmid pExpA-cFP ergab (siehe Figur 2A). Dieses führt nach Transformation von Escherichia coli - Zellen (DH5) zu Ampicillin-resistenten Bakterienkolonien, die im Fluoreszenzmikroskop unter Verwendung von Fluoreszenzfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), eine grüne Fluoreszenz zeigen (siehe Figur 5B), während bei der entsprechenden Negativkontrolle keine Fluoreszenz detektiert werden konnte (siehe Figur 5A). Bereits für das unmittelbar aus dem Verfahren hervorgegangene Durchschnitts-FP (Seq ID Nr. 1) konnte also Autofluoreszenz nachgewiesen werden, ohne das hierzu eine anschließende Mutagenese notwendig gewesen wäre.The amino acid sequences were initially arranged in the form of an "alignments", in which, with the introduction of gaps, the positions of invariant amino acids were matched for all proteins, the amino acid sequences being aligned with one another in such a way that the highest possible order was maintained while maintaining the respective amino acid sequence Number of identical amino acids are assigned to one another in relation to their respective position (cf. Matz et al. (1999), Nat. Biotechnol. 17, 969-973). The amino acid sequences of Renilla mulleri GFP and Ptilosarcus gurneyi GFP were then also taken into account obviously invariant amino acids added (see Figure 1 a - e). The sequence of the clearly most common amino acids resulting from this arrangement was supplemented at the other positions by that of the most common amino acids which has the highest ranking number at this position The average sequence was then both at the N-terminus and at the C- Modified term. To achieve an optimal Kozak region in the area of the start codon, the additional amino acid valine was introduced after the start amino acid methionine. The additional hydrophilic amino acid serine was added to the C-terminus in order not to complicate the solubility of the protein with a hydrophobic C-terminus. A coding DNA sequence (Seq ID No. 2) has now been designed for this protein sequence (Seq ID No. 1), taking into account the codons that occur particularly frequently in mammalian cells. For the cloning of the desired FP gene (FP = fluorescent protein) into the expression plasmid pExpA, 12 partially complementary DNA oligonucleotides (Seq ID Nos. 3-14) were used, from which the entire FP gene was amplified in two successive PCR reactions , Subsequent restriction digestion with the restriction enzymes Xba I and Not I gave a DNA fragment which, after ligation with the Xba I / Not I fragment from pExpA, gave the expression plasmid pExpA-cFP (see FIG. 2A). After transformation of Escherichia coli cells (DH5), this leads to ampicillin-resistant bacterial colonies, which in the fluorescence microscope using fluorescence filters excite the fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and emitted light in the green wavelength range from 510 nm to Allow 560 nm to pass (filter set for fluorescein), show green fluorescence (see FIG. 5B), while no fluorescence could be detected in the corresponding negative control (see FIG. 5A). It was therefore possible to detect autofluorescence for the average FP (Seq ID No. 1) that arose directly from the method, without the need for a subsequent mutagenesis.
Zur Funktionsoptimierung durch Mutagenese des so erhaltenen autofluoreszenten Gens wurden mehrere Strategien angewendet. Zunächst wurden ausgehend von pExpA-cFP mittels PCR Mutationen in das FP-Gen eingeführt. Dies geschah unter Verwendung von Primern, die so gewählt waren, dass sie mit pExPA-cFP in Bereichen außerhalb der kodierenden Sequenz hybridisierten, jedoch so, dass die
Erkennungssequenzen für die Restriktionsenzyme Xba I und Not I noch enthalten waren. Dies ermöglichte eine Zufallsmutagenese über den gesamten kodierenden Bereich. Die PCR wurde in Gegenwart von Mn2+-lonen durchgeführt, was zu einer erwünschten Erhöhung der Fehlerrate der verwendeten Taq-DNA Polymerase führt. Die so erhaltenen PCR-Produkte wurden mit Xba I und Not I verdaut und anschließend mit dem passenden Fragment von pExpA ligiert und in Escherichia co// Zeilen (DH5) transformiert. Von den Ampicillin-resistenten Kolonien wurden die bei Betrachtung im Fluoreszenzmikroskop deutlich helleren ausgewählt. Die Erhöhung der Fluoreszenzintensität wurde durch nochmalige Transformation in Escherichia coli - Zellen verifiziert, die Plasmid-DNA präpariert und die Sequenz des FP-Gens ermittelt.Several strategies were used to optimize the function by mutagenesis of the autofluorescent gene obtained in this way. Initially, mutations were introduced into the FP gene from PCR using pExpA-cFP. This was done using primers chosen to hybridize to pExPA-cFP in areas outside the coding sequence, but so that the Recognition sequences for the restriction enzymes Xba I and Not I were still included. This allowed for random mutagenesis across the entire coding area. The PCR was carried out in the presence of Mn 2+ ions, which leads to a desired increase in the error rate of the Taq DNA polymerase used. The PCR products obtained in this way were digested with Xba I and Not I and then ligated with the appropriate fragment of pExpA and transformed into Escherichia co // lines (DH5). Of the ampicillin-resistant colonies, those that were significantly lighter when viewed under a fluorescence microscope were selected. The increase in fluorescence intensity was verified by repeated transformation into Escherichia coli cells, the plasmid DNA was prepared and the sequence of the FP gene was determined.
In einer weiteren Mutagenese wurden die verbesserten pExpA-cFP Plasmide kombiniert und abermals in Gegenwart von Mn2+-lonen amplifiziert. Diesmal wurden die restriktionsverdauten PCR-Produkte jedoch mit dem Xba I und Not I geschnittenen p2A9-Fragment ligiert, um Plasmide zu erhalten, die sich für die Expression sowohl in Escherichia coli Zellen, als auch in Säugetierzellen eignen.In a further mutagenesis, the improved pExpA-cFP plasmids were combined and again amplified in the presence of Mn 2+ ions. This time, however, the restriction digested PCR products were ligated with the Xba I and Not I cut p2A9 fragment in order to obtain plasmids which are suitable for expression both in Escherichia coli cells and in mammalian cells.
Alternativ wurden PCR-Reaktionen durchgeführt, um speziell die N- und C- terminalen Bereiche zu verändern. Der δ'-Primer hybridisierte mit dem FP-Gen und enthielt anstelle der ersten 6 Codons an 18 Positionen eine Mischung aller 4 Basen, ebenso der 3'-Primer anstelle der letzten 6 Codons, sodass im translatierten Protein am N- und C- Terminus eine Zufallsfolge von 6 beliebigen Aminosäuren entstand. Diese PCR-Produkte wurden ebenfalls mit Xba I und Not I verdaut und mit dem entsprechenden Fragment von p2A9 ligiert.Alternatively, PCR reactions were carried out to specifically change the N- and C-terminal areas. The δ'-primer hybridized with the FP gene and contained a mixture of all 4 bases instead of the first 6 codons at 18 positions, as well as the 3'-primer instead of the last 6 codons, so that in the translated protein at the N- and C-terminus a random sequence of 6 arbitrary amino acids was created. These PCR products were also digested with Xba I and Not I and ligated to the corresponding fragment of p2A9.
In einem dritten Ansatz wurden ausgewählte Codons durch PCR mit teilhomologen Primern gezielt mutiert, um einzelne Aminosäurecodons auszutauschen. Auch hier wurden die erhaltenen PCR-Produkte mit Xba I und Not I verdaut und mit dem entsprechenden p2A9-Fragment ligiert. Aus allen drei Ansätzen wurden nach der Ligation und anschließender Transformation von Escherichia coli Zellen (DH5) 48
Kolonien ausgewählt, die eine hohe Helligkeit in der Fluoreszenz aufwiesen, und die Plasmid-DNA präpariert. Diese wurde daraufhin in einem Folgexperiment in NIH3T3-Zellen transformiert, um diejenigen Klone für eine Sequenzierung auszuwählen, die bei Transfektion dieser Zellen zu einer höheren Fluoreszenz führen.In a third approach, selected codons were specifically mutated by PCR with partially homologous primers in order to exchange individual amino acid codons. Here too, the PCR products obtained were digested with Xba I and Not I and ligated to the corresponding p2A9 fragment. All three approaches became 48 after the ligation and subsequent transformation of Escherichia coli cells (DH5) Colonies selected, which had a high brightness in fluorescence, and prepared the plasmid DNA. This was then transformed into NIH3T3 cells in a subsequent experiment in order to select those clones for sequencing which lead to a higher fluorescence when these cells are transfected.
Klonierung der ExpressionsplasmideCloning the expression plasmids
Für die Expression der oben genannten Proteine in geeigneten Escherichia coli - Zellen wurden Plasmide konstruiert, die eine kodierende Sequenz für FP (FP = Fluoreszierendes Protein) unter der Kontrolle des lac-Promoters enthalten (pExpA- cFP, siehe Figur 2A). Die Plasmide wurden durch Modifikation von pMCS5 (MoBiTec, Göttingen, Deutschland) hergestellt. pMCS5 ist ähnlich aufgebaut wie pBluescript SK(-) (Stratagene) und unterscheidet sich von diesem nur im 5'- Bereich der kodierenden Sequenz für das lacZα-Fragment. pMCS5 besitzt daher den lac-Promoter und nachgeschaltet den lac-Operator, wodurch die Expression einer eingefügten kodierenden Sequenz von der Abwesenheit von aktivem lac- Repressor abhängt. Um in jedem Fall in Escherichia coli - Zellen eine konstitutive Expression zu erreichen, wurde pMCS5 so modifiziert, dass der lac-Operator nicht mehr enthalten ist. An dessen Stelle wurde das frühe mRNA Polyadenylierungssignal aus SV40 eingesetzt, um ein Umkonstruieren dieses Expressionsplasmides für Escherichia coli in ein Expressionsplasmid für Säugetierzellen vorzubereiten (p2A9-cFP, siehe Figur 2B). Dieses geschah durch zusätzliches Einfügen von regulatorischen Promotersequenzen, die eine Expression des nachgeschalteten Gens in Säugetierzellen hervorrufen. Als besonders wirksam erwies sich eine Kombination aus dem vollständigen „unmittelbar-frühen" Promoter des Cytomegalovirus (CMV), gefolgt von einem 100 Basenpaaren langen Fragment des lac-Promoters aus Escherichia coli sowie dem 180 Basenpaar langen 3'-Ende des „unmittelbar-frühen" CMV-Promoters. Diese Fragmente wurden jeweils per PCR mit Primern hergestellt, die zusätzlich zu den homologen Bereichen Erkennungssequenzen für Restriktionsenzyme enthielten. Für das Einfügen der künstlichen FP Gene wurden zwischen dem kombinierten
Promoter und der Polyadenylierungssequenz Erkennungsstellen für die Restriktionsenzyme Xba I und Not I eingefügt.For the expression of the above-mentioned proteins in suitable Escherichia coli cells, plasmids were constructed which contain a coding sequence for FP (FP = fluorescent protein) under the control of the lac promoter (pExpA-cFP, see FIG. 2A). The plasmids were produced by modification of pMCS5 (MoBiTec, Göttingen, Germany). pMCS5 has a similar structure to pBluescript SK (-) (Stratagene) and differs from it only in the 5 'region of the coding sequence for the lacZα fragment. pMCS5 therefore has the lac promoter and, downstream, the lac operator, as a result of which the expression of an inserted coding sequence depends on the absence of an active lac repressor. In order to achieve constitutive expression in Escherichia coli cells in each case, pMCS5 was modified in such a way that the lac operator is no longer included. In its place, the early mRNA polyadenylation signal from SV40 was used to prepare a reconstruction of this expression plasmid for Escherichia coli into an expression plasmid for mammalian cells (p2A9-cFP, see FIG. 2B). This was done by additionally inserting regulatory promoter sequences which cause expression of the downstream gene in mammalian cells. A combination of the complete "immediately early" cytomegalovirus (CMV) promoter, followed by a 100 base pair fragment of the lac promoter from Escherichia coli and the 180 base pair 3 'end of the "immediate early" proved to be particularly effective "CMV promoters. These fragments were each prepared by PCR using primers which, in addition to the homologous regions, contained recognition sequences for restriction enzymes. For the insertion of the artificial FP genes were combined between the Promoter and the polyadenylation sequence recognition sites for the restriction enzymes Xba I and Not I inserted.
Versuchsbeschreibunq: Die Expression von FP in Säugetierzellen führt zu Autofluoreszenz der Zellen:Experiment description: The expression of FP in mammalian cells leads to autofluorescence of the cells:
NIH3T3-Zellen (adhärent, 2,5 x 105 Zellen pro Vertiefung in 12-Loch Schale, bis zur 70 - 80 %igen Konfluenz kultiviert) wurden mit 1 μg Vektor-DNA mit Exgene (MBI Fermentas) transfiziert. Die Plasmide p2A9-c15m2 (Seq ID No. 15), p2A9- c15m3 (Seq ID No. 17), p2A9-c15m12 (Seq ID No. 19) und p2A9-c15m48 (Seq ID No. 21) enthielten verschieden mutierte Gene, c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) und c15m48 (Seq ID No. 22), für das FP (FP = Fluoreszierendes Protein) unter der Kontrolle eines kombinierten Promoters, der zur konstitutiven Expression des nachgeschalteten Gens in Escherichia coli Zellen und Säugetierzellen führt. Nach 9 (siehe Figur 3A) bzw. 24 Stunden (siehe Figur 3B) wurden die Zellen im Fluoreszenzmikroskop analysiert. Unter Verwendung von Fluoreszenzfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), konnten bei allen Zellen, die mit FP oder mutierten FP enthaltenden Plasmiden transfiziert waren, eine grüne Fluoreszenz beobachtet werden.NIH3T3 cells (adherent, 2.5 x 10 5 cells per well in a 12-hole dish, cultivated to 70-80% confluence) were transfected with 1 μg vector DNA with Exgene (MBI Fermentas). The plasmids p2A9-c15m2 (Seq ID No. 15), p2A9-c15m3 (Seq ID No. 17), p2A9-c15m12 (Seq ID No. 19) and p2A9-c15m48 (Seq ID No. 21) contained differently mutated genes, c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) and c15m48 (Seq ID No. 22), for the FP (FP = fluorescent protein) under the control of a combined Promoter that leads to the constitutive expression of the downstream gene in Escherichia coli cells and mammalian cells. After 9 (see FIG. 3A) or 24 hours (see FIG. 3B), the cells were analyzed in a fluorescence microscope. Using fluorescence filters that excite fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and allow emitted light in the green wavelength range from 510 nm to 560 nm to pass (filter set for fluorescein), all cells with FP or mutated FP containing plasmids were transfected, green fluorescence can be observed.
Versuchsbeschreibunq: Die Autofluoreszenz von FP bleicht aus und läßt sich durch Bestrahlung mit ultraviolettem Licht regenerieren:Experiment description: The autofluorescence of FP fades and can be regenerated by irradiation with ultraviolet light:
NIH3T3-Zellen (adhärent, 2,5 x 105 Zellen pro Vertiefung in 12-Loch Schale, bis zur 70 - 80 %igen Konfluenz kultiviert) wurden mit 1 μg Vektor-DNA mit Exgene (MBI Fermentas) transfiziert. Das Plasmid p2A9-c15m3 enthielt ein mutiertes Gen c15m3 für FP (FP = Fluoreszierendes Protein) unter der Kontrolle eines kombinierten Promoters, der zur konstitutiven Expression des nachgeschalteten
Gens in Escherichia coli - Zellen und Säugetierzellen führt. Nach 6 Stunden wurden die Zellen im Fluoreszenzmikroskop analysiert. Unter Verwendung von Fluoreszenz-Anregungsfiltern, die Fluoreszenzmoleküle mit Licht im blauen Wellenlängenbereich von 460 nm bis 505 nm anregen und emittiertes Licht im grünen Wellenlängenbereich von 510 nm bis 560 nm passieren lassen (Filtersatz für Fluoreszein), konnten bei Zellen, die mit diesem mutierten FP enthaltenden Plasmid transfiziert waren, eine grüne Fluoreszenz beobachtet werden (siehe Figur 4A). Diese Fluoreszenz schwächte sich während der Betrachtung innerhalb weniger Sekunden bis zum fast völligen Verschwinden ab (siehe Figur 4B). Nach Bestrahlung des Sichtfeldes mit kurzwelligem Licht im sichtbaren blauen bis ultravioletten Bereich (320 nm bis 400 nm, DAPI - Anregungsfilter) läßt sich die Fluoreszenz mit dem Fluoreszein-Filtersatz wieder beobachten (siehe Figur 4C), d.h sie konnte mit dem kürzerwelligen Licht regeneriert werden. Dieses mutierte FP kann also beispielsweise zum Nachweis von zeitabhängigen zellulären Prozessen, wie Proteindiffusion oder -transport, oder zur optischen Informationsspeicherung verwendet werden.NIH3T3 cells (adherent, 2.5 x 10 5 cells per well in a 12-hole dish, cultivated to 70-80% confluence) were transfected with 1 μg vector DNA with Exgene (MBI Fermentas). The plasmid p2A9-c15m3 contained a mutated gene c15m3 for FP (FP = fluorescent protein) under the control of a combined promoter, which is responsible for the constitutive expression of the downstream Gene leads to Escherichia coli cells and mammalian cells. After 6 hours, the cells were analyzed in a fluorescence microscope. Using fluorescence excitation filters, which excite fluorescence molecules with light in the blue wavelength range from 460 nm to 505 nm and let emitted light in the green wavelength range from 510 nm to 560 nm pass (filter set for fluorescein), cells with this mutated FP containing plasmid were transfected, green fluorescence can be observed (see Figure 4A). This fluorescence weakened during the observation within a few seconds until it almost completely disappeared (see FIG. 4B). After irradiation of the field of view with short-wave light in the visible blue to ultraviolet range (320 nm to 400 nm, DAPI - excitation filter), the fluorescence can be observed again with the fluorescein filter set (see FIG. 4C), ie it could be regenerated with the shorter-wave light , This mutated FP can thus be used, for example, for the detection of time-dependent cellular processes, such as protein diffusion or transport, or for optical information storage.
Vergleich der Aminosäuresequenzen des Durchschnitts-FP und dessen Mutanten mit den bekannten fluoreszierenden Proteinen:Comparison of the amino acid sequences of the average FP and its mutants with the known fluorescent proteins:
Tabelle 1 zeigt die Unterschiede in der Aminosäure-Sequenz zwischen den einzelnen modifizierten Proteinen cFP2, cFP3, cFP12 und cFP48, die durch die mutierten Gene c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) und c15m48 (Seq ID No. 22) kodiert werden, im Vergleich mit dem Dur.chschnitts-FP (D-FP). Die Nummerierung der Aminosäure-Positionen ist dabei derjenigen der Durchschnitts-Sequenz gemäß Figur 1 entnommen. Hieraus ergeben sich Abweichungen der einzelnen Proteine in Bezug auf das Durchschnitts-FP zwischen 6 % und 8 %, d.h. relative Ähnlichkeiten zwischen 92 % und 94 % (Tabelle 2). Dagegen zeigt Tabelle 2, dass die Unterschiede der neuen erfindungsgemäßen fluoreszierenden Proteine zu den bekannten Proteinen, die Ausgangspunkt für die Ermittlung der Durchschnitts-Sequenz waren, relativ hoch sind. Es ergeben sich hier lediglich Sequenz-Homologien
zwischen 32 % und 69 %. Es konnte also eine völlig neue Gruppe von Aminosäure-Sequenzen bzw. Proteinen bereitgestellt werden, die deutliche Autofluoreszenz zeigen und vorteilhafte Anwendungsmöglichkeiten bieten. Darüber hinaus konnte eine zusätzliche Funktion bzw. vorteilhafte Eigenschaft in den erfindungsgemäßen Proteinen erzeugt werden.Table 1 shows the differences in the amino acid sequence between the individual modified proteins cFP2, cFP3, cFP12 and cFP48, which are caused by the mutated genes c15m2 (Seq ID No. 16), c15m3 (Seq ID No. 18), c15m12 (Seq ID No. 20) and c15m48 (Seq ID No. 22) are encoded, in comparison with the Dur.chnitt-FP (D-FP). The numbering of the amino acid positions is taken from that of the average sequence according to FIG. 1. This results in deviations of the individual proteins in relation to the average FP between 6% and 8%, ie relative similarities between 92% and 94% (Table 2). In contrast, Table 2 shows that the differences between the new fluorescent proteins according to the invention and the known proteins, which were the starting point for determining the average sequence, are relatively high. There are only sequence homologies here between 32% and 69%. It was therefore possible to provide a completely new group of amino acid sequences or proteins which show clear autofluorescence and offer advantageous possible uses. In addition, an additional function or advantageous property could be generated in the proteins according to the invention.
Liste der verwendeten Abkürzungen:List of abbreviations used:
CMV CytomegalovirusCMV cytomegalovirus
C-Terminus C-terminales Ende einer AminosäuresequenzC-terminus C-terminal end of an amino acid sequence
DNA DesoxyribonukleinsäureDNA deoxyribonucleic acid
FACS Fluoreszenz-aktivierte Zellsortierung (fluorescence activated cell sorting)FACS fluorescence activated cell sorting
FP fluoreszierendes ProteinFP fluorescent protein
GFP grün-fluoreszierendes Protein (green fluorescent protein) nm Nanometer (Einheit der Wellenlänge)GFP green fluorescent protein nm nanometer (unit of wavelength)
N-Terminus N-terminales Ende einer AminosäuresequenzN-terminus N-terminal end of an amino acid sequence
PCR Polymerase-Kettenreaktion (polymerase chain reaction)PCR polymerase chain reaction
Seq ID Nr. Sequenz-Identifikationsnummer (gemäß Sequenzprotokoll)Seq ID No. Sequence identification number (according to sequence listing)
SV40 Simian Virus 40 μg Mikrogramm
SV40 Simian Virus 40 μg microgram
Tabelle 1 : Unterschiede in den Aminosäure-Sequenzen zwischen dem Durchschnitts-FP (D-FP) und den einzelnen mutierten fluoreszierenden Proteinen (Klone cFP2/Seq. ID Nr. 15, cFP3/Seq ID Nr. 17, cFP12/Seq ID Nr. 19 und cFP48/Seq ID Nr. 21) bezogen auf die Positionen der Aminosäuren im Durchschnitts-FP gemäß Seq ID Nr. 1.
Table 1: Differences in the amino acid sequences between the average FP (D-FP) and the individual mutated fluorescent proteins (clones cFP2 / Seq. ID No. 15, cFP3 / Seq ID No. 17, cFP12 / Seq ID No. 19 and cFP48 / Seq ID No. 21) based on the positions of the amino acids in the average FP according to Seq ID No. 1.
Tabelle 2: Relative Ähnlichkeiten der fluoreszierenden Proteine in Prozent bezogen auf die jeweiligen Aminosäuresequenzen. (D-FP (Seq ID Nr. 1) = Durchschnitts-FP; cFP2 (Seq ID Nr. 15), cFP3 (Seq ID Nr. 17), cFP12 (Seq ID Nr. 19) und cFP48 (Seq ID Nr. 21) = Mutierte D-FP - Klone)
Table 2: Relative similarities of the fluorescent proteins in percent based on the respective amino acid sequences. (D-FP (Seq ID No. 1) = average FP; cFP2 (Seq ID No. 15), cFP3 (Seq ID No. 17), cFP12 (Seq ID No. 19) and cFP48 (Seq ID No. 21 ) = Mutated D-FP clones)