AT512453B1

AT512453B1 - Verbesserte Synthese eines biosynthetischen Produkts mit einer angeordneten Zusammensetzung der biosynthetischen Enzyme auf einem Nukleotidsequenzmotiv

Info

Publication number: AT512453B1
Application number: ATA9496/2010A
Authority: AT
Inventors: Tina Lebar; Jernej Turnsek; Tina Ilc; Nejc Tomsic; Roman Jerala; Monika Avbelj; Mojca Bencina; Jerneja Mori; Tjasa Stosicki; Matej Znidaric; Jure Bordon; Mattia Petroni; Rok Gaber; Tomaz Koprivnjak; Gregor Anderluh; Irena Vovk; Vesna Glavnik
Original assignee: Kemijski Inst
Priority date: 2010-10-22
Filing date: 2010-10-22
Publication date: 2015-05-15
Also published as: AT512453A2; WO2012053985A1; AT512453A5

Abstract

Die Erfindung bezieht sich auf eine Methode zur Synthese einer Verbindung mit Hilfe von biosynthetischen Wegen mit der Kultivierung von genetisch veränderten Wirtszellen, wobei die Zellen mit einer oder mehreren Nukleinsäuren verändert werden, wobei die Nukleinsäure die Nukleotidsequenzen für chimäre Proteine beinhalten, die aus Enzymen des biosynthetischen Wegs oder anderen funktionellen Polypeptiden sowie Faktoren, die sich an Nukleinsäure binden, zusammengesetzt sind, und die Programm-Nukleinsäuresequenz, die Zielelemente für Nukleinsäure enthalten, die von den genannten Faktoren des chimären Proteins erkannt werden, wobei sich die Faktoren an die Nukleinsäure binden und die genannte Programm-Nukleotisequenz zur Anordnung der Enzyme des biosynthetischen Wegs oder anderen funktionellen Polypeptiden entlang der Programm-Nukleinsäuresequenz dient und die genannte Kultivierung zur Synthese von genannten chimären Proteinen in genetisch veränderten Wirtszellen dient, was in der Produktion der genannten Verbindung resultiert. Die Erfindung bezieht sich auf Wirtszellen mit der Programm-Nukleinsäuresequenz, mit der Nukleinsäuresequenz, die die chimären Proteine exprimiert. Die Erfindung beschreibt die Methoden zu einer besseren Synthese der Verbindung.

Description

Beschreibung GEBIET DER ERFINDUNG: [0001] Die vorliegende Erfindung betrifft das Gebiet einer verbesserten Produktsynthese, diedurch die gerichtete Anordnung von Chimären Proteinen erreicht wird, wobei sich die ChimärenProteine aus Biosyntheseenzymen oder weiteren funktionellen Polypeptiden zusammensetzen,die an Nukleinsäure bindende Faktoren gebunden sind, wobei die gerichtete Anordnung derChimären Proteine auf der Bindung an Nukleinsäure-Erkennungsmotive auf der Programm-Nukleinsäuresequenz basiert. Bei der vorliegenden Erfindung handelt es sich um eine biotech¬nologische Erfindung. STAND DER TECHNIK: [0002] Für industrielle Anwendungen werden Biosynthesewege, die sich aus einer Vielzahl anEnzymen und weiteren Proteinen zusammensetzen, dahingehend manipuliert, dass hohe Aus¬beuten der gewünschten Biosyntheseprodukte erzielt werden können. Die Verbesserung derEffizienz von Biosynthesewegen, um in kürzerer Zeit höhere Ausbeuten an Reaktionsproduktenzu erzielen, ist derzeit von großem Interesse. Es wurden bereits etliche Strategien bezüglicheiner dahingehenden Optimierung umgesetzt. So wurde z. B. die Verbesserung der Ausbeutedes Endprodukts einer Biosynthesereaktion bereits erzielt durch: (i) eine Vergrößerung desPools an verfügbarem Substrat und/oder die Überexpression der Enzyme der limitierendenBiosyntheseschritte; (ii) das Einbringen von heterologen Enzymen mit bevorzugten kinetischenEigenschaften; (iii) das Blockieren von Verzweigungen des Biosynthesewegs; (iv) die Kompar-timentalisierung von Biosynthesewegen, indem Enzyme eines bestimmten Biosynthesewegs zuspezifischen Zellkompartimenten oder künstlich geschaffenen Kompartimenten (z. B. Metabo-lomen) dirigiert werden, oder; (v) die räumliche Annäherung von Enzymen durch die Anordnungvon metabolischen Synthesewegen auf einem Proteingerüst (WO 2009/108774). Zwar weisenproteinbasierte Gerüste zahlreiche Vorteile auf, jedoch ist dieser Ansatz durch die Anzahl anverfügbaren Kombinationen von Docking-Peptiden beschränkt und bietet keine Möglichkeit zurKontrolle der räumlichen Verteilung und Orientierung von Biosyntheseenzymen, um so denBiosyntheseweg in optimaler Weise zu unterstützen.

[0003] Keine der vorstehend genannten Lösungen kann eine optimale Anordnung der Enzymedes Biosynthesewegs gewährleisten, um so eine gewünschte Reihenfolge der Biosynthesere¬aktionen zur Verfügung zu stellen. In lebenden Zellen sind die Enzyme des Biosynthesewegsoder weitere funktionelle Polypeptide oftmals durch Multiproteinkomplexe oder Verankerungs¬mechanismen auf eine Stelle einer Größenordnung im Mikrometerbereich festgelegt, auf die imFolgenden als "Mikrobereich" Bezug genommen wird. Durch diese Art der Organisation kommtes zu einer Erhöhung der lokalen Konzentration von Enzymen sowie der Effizienz von Biosyn¬thesewegen. Zum Erreichen einer optimalen Konzentration an individuellen Enzymen sowie zurFörderung der Ausbildung von vollständigen Multiproteinkomplexen wurden bisher zwei Ansät¬ze angewandt: (i) das Dirigieren von Enzymen in Mikrobereiche, z. B. zu Zielorganellen; und (ii)das Ausbilden von Multiproteinkomplexen als Polypeptidgerüst (WO 2009/108774).

[0004] Das Proteingerüst weist jedoch zahlreichen Nachteile und Einschränkungen auf.

[0005] Zwar wäre es möglich, die Anzahl und Verteilung der Enzyme in einem Multiproteinkom¬plex anhand der Sequenz eines Polypeptidrückgrats zu programmieren, jedoch ist es aufgrundder Flexibilität der Dimerisierungsdomänen an sich sowie im Verhältnis zueinander nicht mög¬lich, die dreidimensionale Anordnung der Polypeptide zu prädizieren (Figuren 1 und 2). DesWeiteren kann sich die Konstruktion des Polypeptidrückgrats mit den an dem Gerüst orientier¬ten Proteindomänen aufgrund der begrenzten Anzahl an verfügbaren Proteindimerisierungsdo¬mänen als schwierig erweisen. Darüber hinaus gibt es für jede einzelne Proteindimerisierungs¬domäne unterschiedliche Bedingungen, unter denen sich diese faltet und die funktionelle Inter¬aktion ausbildet. ZUSAMMENFASSUNG DER ERFINDUNG: [0006] Das Problem der Organisation des Biosynthesewegs in eine geordnete Reihenfolge vonBiosyntheseenzymen, das durch die Proteindimerisierungsdomäne nicht gelöst werden kann,wird durch ein Nukleotidsequenzmotiv-Template gelöst, das hierin auch als Programm- Nukle¬insäuresequenz bezeichnet wird und das die Reihenfolge der Chimären Proteine, Biosynthe¬seenzyme und weiteren funktionellen Polypeptide bestimmt, die an Nukleinsäure bindendeFaktoren gebunden sind.

[0007] Im Rahmen der vorliegenden Erfindung wurde nun entdeckt, dass es möglich ist, diedreidimensionale Anordnung von Biosyntheseenzymen oder weiteren funktionellen Polypepti¬den durch eine so genannten Programm-Nukleinsäure zu manipulieren. Im Rahmen der vorlie¬genden Erfindung wurden Chimäre Polypeptide konstruiert, die sich aus einer Nukleinsäurebindenden Domäne eines Nukleinsäure bindenden Faktors sowie aus einem Biosyntheseenzymoder einem weiteren funktionellen Polypeptid zusammensetzen. Die Bindung dieser ChimärenProteine an das Zielnukleinsäuremotiv erfolgt über einen Nukleinsäure bindenden Faktor. DieProgramm-Nukleinsäuresequenz legt die Anordnung der Zielnukleinsäuremotive und somitauch die Reihenfolge und die räumliche Anordnung von Biosyntheseenzymen oder weiterenfunktionellen Polypeptiden fest. Durch einen auf diese Weise gerichteten Biosyntheseweg ausChimären Biosyntheseenzymen oder weiteren funktionellen Polypeptiden, gesteuert durch dieProgramm-Nukleinsäuresequenz, ist es möglich, eine erhöhte Ausbeute eines Biosynthesepro¬dukts eines solchen Synthesewegs im Vergleich zur Verwendung eines Proteingerüsts zu erzie¬len, in welchem die Biosyntheseenzyme lediglich ohne eine spezifische Anordnung angehäuftwerden.

[0008] Durch die Verwendung einer Programm-Nukleinsäuresequenz zur Immobilisierung undFestlegung der Reihenfolge der Enzyme des Biosynthesewegs oder weiterer funktioneller Po¬lypeptide werden ein oder mehrere Elemente der folgenden Auflistung zur Verfügung gestellt: i)eine Steigerung der Effizienz des Flusses des Synthesewegs; ii) eine Optimierung des metabo¬lischen Flusses durch den Syntheseweg; iii) eine Verringerung der metabolischen Belastung fürdie Wirtszelle; iv) die Möglichkeit einer alternativen Verzweigung von metabolischen Synthese¬wegen, die zum Erhalt von neuen Produkten des Biosyntheseprozesses führt; und v) die Mög¬lichkeit der Neuprogrammierung der Chimären Enzyme innerhalb des Organismus durch dasEinbringen von unterschiedlichen Programm-Nukleinsäuren.

[0009] Die Programm-Nukleinsäuresequenz trägt mehr als zwei Zielnukleinsäureelemente, beidenen es sich jeweils um spezifische Liganden für Nukleinsäure bindende Faktoren handelt.Liegt die Programm-Nukleinsäuresequenz in einer Lösung mit Chimären Proteinen vor, so bin¬den die Chimären Proteine an Zielelemente innerhalb der Programmsequenz, bilden einenNukleinsäure-Protein-Komplex und unterstützen die Bildung eines Multiproteinkomplexes. DieReihenfolge von Chimären Proteinen in einem derartigen Multiproteinkomplex kann auf Grund¬lage der folgenden Umstände prädiziert werden: i) die Positionierung der Zielnukleinsäuremoti¬ve ist aufgrund der bekannten dreidimensionalen Struktur der Nukleinsäuren auf Grundlage derNukleinsäuresequenz definiert; ii) durch den Umstand, dass die Reihenfolge der Nukleinsäure¬motive prädiziert werden kann, wird die gerichtete Positionierung von Chimären Proteinen unter¬stützt; iii) durch eine derart gerichtete Positionierung von Chimären Proteinen wird ermöglicht,dass die Reihenfolge der Biosynthesereaktionen durch die Programm-Nukleinsäuresequenzdefiniert werden kann und es kommt somit zu einer Verkürzung des Zeitintervalls, innerhalbdessen es zwischen den verschiedenen Schritten der Biosynthesereaktion zu einer Diffusionvon Zwischenprodukten der Reaktion kommen kann. Im Rahmen der vorliegenden Erfindungwurde daher zu dem Schluss gelangt, dass es von Vorteil ist, eine große Anzahl an unter¬schiedlichen Nukleotid bindenden Domänen zur Verfügung zu haben, um komplexe Reaktions¬wege aufzubauen. So gibt es z. B. 262.144 unterschiedliche Kombinationen von Nukleotidmoti¬ven, die aus neun Nukleotiden bestehen und durch unterschiedliche Nukleotid bindende Domä¬nen erkannt werden können, was eine extrem hohe Variabilität bei der Assemblierung unter¬schiedlicher Biosynthesewege gestattet.

[0010] Die vorliegende Erfindung weist im Vergleich zu der Verwendung von Proteingerüsteneine Reihe von Vorteilen auf. Bei der Programm-Nukleinsäuresequenz kommt es zu keinenSchwierigkeiten hinsichtlich der Reifung und das gerichtete Nukleotidbindungsmotiv kann belie¬big ausgewählt werden. Der Vorgang des so genannten Dockings des Anker-Nukleinsäure-Bindungsfaktors an das Zielnukleinsäureelement wurde bereits ausführlich beschrieben. Auf¬grund der großen räumlichen Nähe zwischen den Chimären Proteinen, die an die Programm-Nukleinsäuresequenz gebunden sind, werden weitere Polypeptide, die die Synthese unterUmständen umlenken könnten, in räumlicher Hinsicht von dem Multiproteinkomplex ausge¬schlossen. Die Bindung aller Komponenten des Biosynthesewegs erfolgt jeweils unter gleichar¬tigen Reaktionsbedingungen, da alle für die Konstruktion von Chimären Proteinen verwendetenNukleinsäure-Bindungsdomänen auf der gleichen Proteinfaltung beruhen und auf die gleicheWeise mit den Nukleotiden interagieren können. Im Gegensatz hierzu ist bei der Verwendungeines Proteingerüsts der Einsatz von unterschiedlichen Arten von Proteindomänen-Dimerenerforderlich, die unter jeweils unterschiedlichen Bedingungen zu einer korrekten Faltung undeiner optimalen Interaktion in der Lage sind. Die vorliegende Erfindung ist dahingehend vorteil¬haft, dass sie dazu in der Lage ist, die Produktion unterschiedlicher Reaktionsprodukte in Ab¬hängigkeit von der Sequenz der Programm-Nukleinsäure zu steuern, die jeweils in die produzie¬renden Zellen oder Reaktionsmedien eingebracht wird, wobei jede der unterschiedlichen Pro-gramm-DNAs die Enzyme des Biosynthesewegs jeweils unterschiedlich anordnet.

[0011] Die vorliegende Erfindung stellt ein Verfahren zur Herstellung einer Verbindung übereinen Biosyntheseweg bereit, wobei das Verfahren das Kultivieren einer genetisch modifiziertenWirtszelle, die dahingehend verändert ist, um Chimäre Proteine, Enzyme des Biosynthesewegsoder weitere funktionelle Polypeptide zu exprimieren, die an Nukleinsäure bindende Faktorengebunden sind, sowie eine Programm-Nukleinsäuresequenz einschließt, die die gerichteteAnordnung von Chimären Proteinen zur Ausbildung eines biosynthetischen Multiproteinkomple¬xes steuert.

[0012] Die vorliegende Erfindung betrifft Vorgänge, die von mindestens drei bis zu etwa 100biosynthetische Reaktionsschritte einschließen. Drei entspricht der Mindestanzahl an Schritten,wobei die Reihenfolge der Reaktionsvorgänge variieren kann und die im Rahmen der vorlie¬genden Erfindung beschriebene gerichtete Anordnung zur Wirkung kommt. Die drei Schrittekönnen z. B. der Reihenfolge der Reaktionsschritte 1, 2, 3 entsprechen, im Vergleich zu ande¬ren Reihenfolgen wie 1,3,2 oder 3,1,2.

[0013] In einer weiteren Ausführungsform der vorliegenden Erfindung schließt das Verfahrenein: das Mischen der produzierten Chimären Proteine, Enzyme des Biosynthesewegs oderweiteren funktionellen Polypeptide, die an Nukleinsäure bindende Faktoren gebunden sind, diein den Wirtszellen produziert und aus diesen isoliert werden, sowie eine Programm-Nukleinsäuresequenz, die die Reihenfolge von Chimären Proteinen zur Ausbildung eines bio¬synthetischen Multiproteinkomplexes steuert. Auf diese Weise wird der Biosyntheseweg in vitroassembliert, und zwar entweder in Lösung oder mit einer an einem weiteren Molekül oder derfesten Phase immobilisierten Programm-DNA. Zur Durchführung der Biosynthesereaktion mussder in vitro assemblierte Komplex unter Zugabe der für die Biosynthesereaktion erforderlichenSubstrate und Cofaktoren oder des Enzymsystem, das die erforderlichen Cofaktoren generiert,unter Bedingungen inkubiert werden, die die Biosynthese unterstützen.

[0014] Die vorliegende Erfindung stellt eine Beschreibung zur Konstruktion von Programm-Nukleinsäuren zur Verfügung, die sowohl in vivo als auch in vitro angewandt werden kann.Bereitgestellt werden genetisch modifizierte Wirtszellen, umfassend eine Programm- Nuklein¬säuresequenz sowie eine Nukleinsäuresequenz, die für Chimäre Proteine, Biosyntheseenzymeoder weitere funktionelle Polypeptide kodiert, die kovalent an einen Anker-Nukleinsäure-Bindungsfaktor gebunden sind und die an spezifische Zielnukleinsäureelemente binden, die inder Programm-Nukleinsäuresequenz kodiert sind.

[0015] Die vorliegende Erfindung stellt Nukleinsäuren, die eine Programm-Nukleinsäurese¬quenz umfassen, zur Verwendung in einem Verfahren zur Verbesserung der Ausbeute eines

Biosyntheseprodukts zur Verfügung.

[0016] Durch die vorliegende Erfindung wird ermöglicht, biologische Prozesse auf spezifischeEndprodukte auszurichten, indem aufgrund der großen räumlichen Nähe zwischen funktionellenGruppen der Chimären Proteine, die an die Programm-Nukleinsäure gebunden sind, weiterePolypeptide ausgeschlossen werden, welche die Synthese in Richtung von nicht erwünschtenProdukten umlenken könnten.

[0017] Die vorliegende Erfindung betrifft genetisch modifizierte Wirtszellen, die Chimäre Protei¬ne exprimieren und/oderdie Programm-Nukleinsäuresequenz replizieren.

[0018] Die vorliegende Erfindung betrifft des Weiteren ein Verfahren, das zur Herstellung einerVerbindung eines beliebigen Biosynthesewegs eingesetzt wird, bei dem zur Synthese der be¬treffenden Verbindung eine große räumliche Nähe zwischen Biosyntheseenzymen erforderlichist.

[0019] Die vorliegende Erfindung betrifft des Weiteren Prozesse wie z. B. Informations- bzw.Datenverarbeitung, chemischen Abbau, Signalgebung und Biosensorik. KURZBESCHREIBUNG DER ZEICHNUNGEN: [0020] Figur 1. Schematische Übersicht der Vorteile der Verwendung einer Programm-

Nukleinsäuresequenz.

[0021] Figur 2. Auswirkung der Anordnung einer Spacer-Sequenz zwischen Zielnukleinsäu¬ reelementen bzw. -motiven.

[0022] Figur 3. Bindung von Chimären Proteinen, an DNA bindende Faktoren gebundenen

Biosyntheseenzymen, an das Zielnukleinsäuremotiv. Spezifische Bindung ei¬nes jeden der getesteten DNA bindende Faktoren Znf_Zif268, ZnfBlues,Znf PBSII, Znf HivC und NicTAL (Tabelle 1) an das Zielnukleinsäuremotivsowie Unterdrückung der Expression eines Reporterproteins, der ß-Galacto-sidase. [A] Test von Znf_Zif268, Znf_Blues, Znf_PBSII, Znf HivC und NicTAL(Tabelle 1). [B] Spezifische Erkennung der Zielnukleinsäuremotive durch dieNukleinsäure bindende Faktoren. Das spezifische Zielnukleinsäuremotiv wur¬de durch ein Zielnukleinsäuremotiv ersetzt, das spezifisch für einen unter¬schiedlichen Nukleinsäure bindenden Faktor ist. Das Reporterprotein ß-Ga-lactosidase wurde nicht unterdrückt, wenn ein nicht geeignetes Zielnuklein¬säuremotiv verwendet wurde.

[0023] Figur 4. Bindung von Chimären Proteinen an die Programm-Nukleinsäure in vitro. [A]

Die Hybridisierung der Programm-Nukleinsäure erfolgte durch die Injektionvon zwischen 0,5 und 2 μΜ für bis zu 300 s, um die abschließende Reaktionvon 300 RU zu erhalten. Die Überwachung der Bindung von Chimären Protei¬nen erfolgte mittels der Injektion unterschiedlicher Konzentrationen von Chimä¬ren Proteinen für 1 min im Anschluss an einen 5-minütigen Dissoziations¬schritt. Die Regeneration erfolgte mittels zweier Injektionen von 50 mM NaOHüber 30 s sowie einer Injektion von 0,5 % SDS über 24 s. [B] Die ChimärenProteine, von oben nach unten: ZnfGlil, Znf_Zif268, Znf_Blues, Znf HivC,Znf PBSII, Znf Jazz. [C] Zu Beginn des Zyklus wurde DNA eingefangen unddie Chimären Proteine wurden für 1 Minute nacheinander in 2 unterschiedli¬chen Sequenzen injiziert: durchgezogene Linie: Znf_Jazz, Znf Blues,Znf_Zif268, Znf PBSII, ZnfJHivC und Znf Glil; gestrichelte Linie: Znf Glil,Znf PBSII, Znf HivC, Znf_Jazz, Znf Blues und Znf_Zif268. Die Bindung allerChimären Proteine in den Sequenzen zeigte, dass die Bindung der ChimärenProteinen schwächer war, wenn Znf Glil als erstes injiziert wurde.

[0024] Figur 5. Bindung von Nukleinsäure bindenden Faktoren auf einer Programm-Nuklein¬ säuresequenz in vitro. Die Bindung von einzelnen Nukleinsäure bindendenFaktoren, Znf Jazz, Znf Blues, Znf Zif268, Znf PBSII, Znf HivC und Znf_Glil wurde mittels eines Mobilitäts-S- hift-Assays auf Agarosegel bestimmt. DiePosition des Protein-DNA- Komplexes ist jeweils durch die Pfeile angezeigt.

[0025] Figur 6. In vivo Rekonstitution zweier nicht funktioneller gespaltener (Split) GFP-Pro- teine, die an Nukleinsäure bindende Faktoren gebunden sind, in der Gegen¬wart einer Programm-Nukleinsäuresequenz. [A] Schematische Darstellung derRekonstitution der gespaltenen GFP. [B] Es erfolgte eine Kotransfektion vonjeweils 75 ng an Plasmiden, die His_tag-Znf_Gli1-Peptidlinker-nCFP undcCFP-Peptidlinker-Znf_HIVC-His_tag trugen, mit 350 ng der Programm-Nukleinsäure (Programm-SPR, Split, FRET; Tabelle 1). Die Detektion derEmission von CFP bei 475 nm erfolgte im Anschluss an eine Anregung bei433 nm. [C] Es erfolgte eine Kotransfektion von jeweils 75 ng an Plasmiden,die chimäre gespaltene YFP (His_tag- Znf_PBSII_Peptidlinker-nYFP undcYFP-Peptidlinker-Znf_Zif268-Pep- tidlinker-His_tag) trugen, mit 350 ng anPlasmid, das für die Programm-Nukleinsäure kodierte (Programm-SPR, Split,FRET; Tabelle 1). Das Emissionssignal des YFP bei 529 nm wurde im An¬schluss an eine Anregung bei 513 nm unter einem konfokalen Mikroskop ge¬messen.

[0026] Figur 7. In vitro Rekonstitution zweier nicht funktioneller gespaltener (Split) GFP, die an Nukleinsäure bindende Faktoren gebunden sind, in der Gegenwart einerProgramm-Nukleinsäuresequenz. Lysate von HEK293-Zellen, die mit Plasmi¬den transfiziert waren, die entweder für His_tag-Znf_Glil-Peptidlinker-nCFPund cCFP-Pep- tidlinker-Znf_HIVC-His_tag oder für His_tag-Znf_PBSII-Pep-tidlinkernYFP und cYFP-Peptidlinker-Znf_Zif268-Peptidlinker-His_tag kodier¬ten, wurden mit 50 pg der Programm-Nukleinsäure (Programm-SPR, Split,FRET; Tabelle 1) vermischt. Im Anschluss an eine Inkubation für 18 h bei 4°Cwurden die Fluoreszenzspektren für CFP und YFP erhalten. Die Spitzenwerte(Peaks) der Emission sind durch die Pfeile angezeigt.

[0027] Figur 8. In vivo Rekonstitution von zwei Paaren an gespaltenen fluoreszierenden

Proteinen (Split-CFP und Split-YFP) wurden mittels einer FRET-Analyse be¬stimmt. Es erfolgte die Kotransfektion von HEK293-Zellen mit Plasmiden, diejeweils für His_tag-Znf_Glil- Peptidlinker-nCFP, cCFP-Peptidlinker-Znf_HIVC-His_tag, His_tag-Z- nf_PBSII_Peptidlinker-nYFP und cYFP-Peptidlinker-Znf_Zif268-Pep- tidIinker-His_tag kodieren, sowie mit einem Plasmid, das fürdie Programm-Nukleinsäure kodiert (Programm-SPR, Split, FRET; Tabelle 1).

[A. oben links] Darstellung eines aus gespaltenen CFP rekonstituiertenCFP. Anregung bei 453 nm, Emission zwischen 470 und 510. [A. oben rechts]Darstellung eines aus gespaltenen YFP rekonstituierten YFP. Anregung bei415 nm, Emission zwischen 525 und 560. [A. unten links] Überlagerung derobigen Darstellungen von CFP und YFP. [A. unten rechts] Die gleichen Zellen,gefärbt mit dem Farbstoff Hoechst 34580. Die Pfeile zeigen die FRET-positiven Zellen an, was die Kolokalisierung aller vier Fusionen von gespalte¬nen GFP innerhalb des Zellkerns belegt. [B. oben links] Darstellung des Do¬nors, rekonstituiertes CFP vor dem Photobleichen. [B. oben rechts] Darstel¬lung des Akzeptors, rekonstituiertes mCitrin nach dem Photobleichen. Die ge¬bleichte Region ist durch einen Pfeil kenntlich gemacht. [B. unten links] Dar¬stellung des Donors, rekonstituiertes CFP nach dem Photobleichen. Eine er¬höhte Fluoreszenz des Donors nach dem Photobleichen des Akzeptors istdurch einen Pfeil kenntlich gemacht.

[0028] Figur 9. Biosynthese von Violacein in der Gegenwart der Programm-Nukleinsäure. Über Nacht angesetzte Kulturen von E. coli, enthaltend Plasmide, die für dieChimären Proteine Znf_Blues-Peptidlinker-vioA, Znf_Zif268-Peptidlinker-vioB,Znf_PBSII-Peptidlin- ker-vioE, Znf_HivC-Peptidlinker-vioD, Znf_Gli1-Peptid-linker-vioC kodieren (siehe Tabelle 1), entweder mit dem oder ohne das

Plasmid, das für die Programm-Nukleinsäure kodiert (siehe Tabelle 1, Pro¬gramm-Biosynthese (123456) oder Programm-Biosynthese (341256)). DieQuantifizierung der Menge an Violacein erfolgte 17,5 h nach der Extraktionund Analyse mittels TLC. Die in der Gegenwart der Programm-Nukleinsäure(Programm-Biosynthese 123456) produzierte Menge an Violacein war wesent¬lich höher als in den Fällen, in denen die Programm-Nukleinsäure (Programm-Biosynthese 2341256) oder keine Programm-Nukleinsäure in E. coli vorlag. AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG: DEFINITIONEN: [0029] Der Begriff "Programm/Nukleinsäure/Sequenz", so wie hierin verwendet, bezieht sich aufeine Nukleinsäure, die eine beliebige Anzahl an Zielnukleinsäuresequenzen einer beliebigenLänge enthält, die durch Nukleinsäure bindende Faktoren erkannt werden. Diese Zielnuklein¬säuresequenzen werden durch Spacer-Nukleinsäuresequenzen einer beliebigen Länge vonei¬nander getrennt. Die Programm-Nukleinsäuresequenz kann entweder als solche verwendetwerden oder in einen geeigneten Vektor eingebracht werden, der dann in eine Wirtszelle einge¬bracht und durch diese amplifiziert werden soll.

[0030] Der Begriff "Ziel/Nukleinsäure/Sequenz" bzw. "Ziel/Nukleinsäure/Element/Motiv, so wiehierin verwendet, bezieht sich auf eine Nukleinsäuresequenz einer beliebigen Länge, die alsSubstrat für einen Bindungsfaktor dient.

[0031] Der Begriff "Nukleinsäure/bindender Faktor/Bindungsfaktor", so wie hierin verwendet,bezieht sich auf ein beliebiges Molekül, das zur Bindung eines Nukleinsäuremoleküls in derLage ist. Der Bindungsfaktor kann natürlichen Ursprungs sein oder es kann sich dabei um einkünstlich konstruiertes vollständiges Protein oder lediglich um ein Segment eines solchen han¬deln, das zur sequenzspezifischen Bindung an eine Nukleinsäure in der Lage ist. Im Rahmender vorliegenden Erfindung wird ein Nukleinsäure bindendes Element als Träger für ein Enzym,das an dem Biosyntheseweg beteiligt ist, oder für ein beliebiges weiteres funktionelles Polypep¬tid verwendet. Ein Nukleinsäure bindendes Molekül ist über eine chemische Bindung mit einemEnzymmolekül verbunden. Diese Verbindung wird mithilfe eines Peptidlinkers erreicht. EinNukleinsäure bindendes Element bindet an eine oder mehrere spezifische Stellen der Pro¬gramm-Nukleinsäuresequenz und gewährleistet so eine hohe lokale Konzentration sowie einegeeignete räumliche Positionierung von Enzymen, die an dem Biosyntheseweg beteiligt sind.

[0032] Der Begriff "Spacer/Nukleinsäure/Sequenz", so wie hierin verwendet, bezieht sich aufeine Nukleinsäuresequenz einer beliebigen Länge, die Zielnukleinsäuresequenzen voneinandertrennt.

[0033] Der Begriff "Nukleinsäuren", so wie hierin verwendet, bezieht sich auf eine polymereForm von Nukleotiden einer beliebigen Länge, und zwar entweder auf Ribonukleotide oderDesoxynukleotide, einschließend einzel-, doppel-, oder mehrsträngige DNA oder RNA, genomi-sche DNA, cDNA, DNA-RNA-Hybriden oder ein Polymer mit einem Phosphorthioat-Rückgrat,umfassend die Basen Purin und Pyrimidin oder weitere natürlich vorkommende, chemisch oderbiochemisch modifizierte, nicht natürlich vorkommende oder derivatisierte Nukleotid basen,jedoch nicht auf diese beschränkt.

[0034] Die Begriffe "Polypeptid", "Protein" und "Peptid", so wie hierin verwendet, beziehen sichauf eine polymere Form von Aminosäuren einer beliebigen Länge, die kodierte und nicht kodier¬te Aminosäuren, chemisch oder biochemisch modifizierte oder derivatisierte Aminosäuren undPolypeptide mit einem modifizierten Peptid- Rückgrat einschließen können. Der Begriff "funktio¬nelles Polypeptid", so wie hierin verwendet, bezieht sich auf eine polymere Form von Amino¬säuren einer beliebigen Länge, die eine beliebige Funktion exprimiert, so wie z. B. die Ausbil¬dung der Struktur, das Dirigieren an einen spezifischen Ort, die Zielausrichtung zu Organeilen,das Begünstigen oder Ausführen einer chemischen Reaktion oder die Bindung an weitere funk¬tioneile Polypeptide. Der Begriff "Enzym des Biosynthesewegs", so wie hierin verwendet, be- zieht sich auf eine polymere Form von Aminosäuren einer beliebigen Länge, die eine beliebigeFunktion exprimiert, so wie z. B. die Ausbildung neuer chemischer Bindungen.

[0035] Der Begriff "chimäres Protein", so wie hierin verwendet, ist von allgemeiner Bedeutungund bezieht sich im Rahmen der vorliegenden Beschreibung auf eine polymere Form von Ami¬nosäuren einer beliebigen Länge, die sich aus mehr als einem Protein/Segment bzw. aus mehrals einer Domäne zusammensetzen, die gegebenenfalls durch Linker einer beliebigen Längemiteinander verknüpft sind, die bevorzugt zwischen einer und 40 Aminosäuren enthalten, wobeies sich jeweils bei mindestens einem Protein/Segment bzw. einer Domäne um einen Nukleotidbindenden Faktor, eine vollständige oder eine Bindungsdomäne und bei dem bzw. der anderenum ein Enzym des Biosynthesewegs oder ein weiteres funktionelles Polypeptid, eine vollständi¬ge oder eine Aktivitätsdomäne handelt.

[0036] Der Begriff "heterolog", so wie hierin verwendet, bezieht sich im Zusammenhang miteiner genetisch modifizierten Wirtszelle auf ein Polypeptid, auf das mindestens eine der folgen¬den Aussagen zutrifft: (a) das Polypeptid ist ein Fremdpolypeptid ("exogen") für die Wirtszelle(d. h. es kommt in dieser nicht natürlich vor); (b) das Polypeptid kommt zwar natürlich in dembetreffenden Wirts-Mikroorganismus oder in der betreffenden Wirtszelle vor (ist z. B. "endo¬gen"), wird jedoch in der Zelle entweder in einer nicht natürlichen Menge produziert (z. B. ineiner Menge, die größer ist als erwartet oder größer als die natürlich produzierte Menge) oderunterscheidet sich hinsichtlich der Nukleotidsequenz derart von der endogenen Nukleotidse¬quenz, dass das gleiche kodierte Protein (mit der gleichen oder im Wesentlichen gleichen Ami¬nosäuresequenz), das endogen vorliegt, in der Zelle in einer nicht natürlichen Menge produziertwird (z. B. in einer Menge, die größer ist als erwartet oder größer als die natürlich produzierteMenge).

[0037] Der Begriff "homolog", so wie hierin verwendet, bezieht sich auf Proteine oder Nuklein¬säuren mit gut konservierten Aminosäureoder Nukleotidsequenzen, die bevorzugt zu mindes¬tens 50%, mindestens jedoch zu 20% konserviert sind, die mittels einer Technik des Protein¬oder Nukleinsäurevergleichs bestimmt werden, so wie es im Stand der Technik bekannt ist.Homologe Proteine sind dadurch gekennzeichnet, dass sie innerhalb einer Zelle identischeFunktionen erfüllen. Homologe Nukleinsäuren kodieren für homologe Proteine.

[0038] Der Begriff "rekombinant", so wie hierin verwendet, bedeutet, dass eine bestimmteNukleinsäure (DNA oder RNA) das Produkt unterschiedlicher Kombinationen aus Klonierung,Restriktion und/oder Ligationsschritten ist, wodurch ein Konstrukt erhalten wird, das eine struk¬turell kodierende oder nicht kodierende Sequenz aufweist, die von den endogenen Nukleinsäu¬ren unterschieden werden kann, die in natürlichen Systemen zu finden sind. Im Allgemeinenkönnen DNA-Sequenzen, die für die strukturell kodierende Sequenz kodieren, aus cDNA-Fragmenten und kurzen Oligonukleotidlinkern oder aus einer Reihe von synthetischen Oligo-nukleotiden zusammengesetzt sein, um so eine synthetische Nukleinsäure zur Verfügung zustellen, die dazu in der Lage ist, aus einer in einer Zelle enthaltenen rekombinanten Transkripti¬onseinheit oder in einem zellfreien Transkriptions- und Translationssystem exprimiert zu wer¬den. Solche Sequenzen können in Form eines offenen Leserahmens bereitgestellt werden, dernicht durch interne, nicht translatierte Sequenzen oder Introns unterbrochen ist, die typischer¬weise in eukaryotischen Genen vorliegen. Zur Ausbildung eines rekombinanten Gens odereiner Transkriptionseinheit kann ebenfalls genomische DNA verwendet werden, die die relevan¬ten Sequenzen umfasst. Es können ebenfalls Sequenzen nicht translatierter DNA in 5' - oder 3'-Richtung des offenen Leserahmens vorliegen, sofern diese Sequenzen die Manipulation oderExpression der kodierenden Regionen nicht beeinträchtigen, und die Sequenzen können danntatsächlich dahingehend wirken, dass sie die Produktion eines gewünschten Produkts überverschiedene Mechanismen modulieren (siehe "regulatorische DNA-Sequenzen", infra).

[0039] Der Begriff "Wirtszelle", so wie hierin verwendet, bezieht sich auf eine in vivo oder invitro vorliegende eukaryotische Zelle, eine prokaryotische Zelle oder eine Zelle aus einemmehrzelligen Organismus (z. B. eine Zelllinie), die als eine einzellige Einheit kultiviert wird,wobei die eukaryotischen oder prokaryotischen Zellen als Rezipienten für eine Nukleinsäure verwendet werden können oder bereits verwendet wurden (z. B. ein Expressionsvektor, dereine Nukleotidsequenz umfasst, die für ein oder mehrere Genprodukte des Biosynthesewegskodiert, wie z. B. für Genprodukte des Mevalonat-Synthesewegs), und schließt die Nachkom¬menschaft der ursprünglichen Zelle ein, die durch die Nukleinsäure genetisch modifiziert wurde.Es wird davon ausgegangen, dass die Nachkommenschaft einer einzelnen Zelle hinsichtlichihrer Morphologie oder des Komplements von genomischer oder Gesamt-DNA nicht notwendi¬gerweise zu 100% identisch mit der ursprünglichen Zelle sein muss, und zwar aufgrund vonnatürlicher, zufälliger oder gezielter Mutation. Bei einer "genetisch modifizierten Wirtszelle"(ebenfalls bezeichnet als eine "rekombinante Wirtszelle") handelt es sich um eine Wirtszelle, indie eine heterologe Nukleinsäure, z. B. ein Expressionsvektor, eingebracht wurde. So wird z. B.eine prokaryotische Wirtszelle (z. B. ein Bakterium) dadurch zu einer genetisch modifiziertenprokaryotischen Wirtszelle, dass in eine geeignete prokaryotische Wirtszelle eine heterologeNukleinsäure, z. B. eine exogene Nukleinsäure, die gegenüber der prokaryotischen Wirtszellefremd ist (d. h. in dieser nicht natürlich vorkommt), oder eine rekombinante Nukleinsäure, dienormalerweise nicht in der prokaryotischen Wirtszelle zu finden ist, eingebracht wird. Eineeukaryotische Wirtszelle wird dadurch zu einer genetisch modifizierten eukaryotischen Wirtszel¬le, dass in eine geeignete eukaryotische Wirtszelle eine heterologe Nukleinsäure, z. B. eineexogene Nukleinsäure, die gegenüber der eukaryotischen Wirtszelle fremd ist, oder eine re¬kombinante Nukleinsäure, die normalerweise nicht in der eukaryotischen Wirtszelle zu findenist, eingebracht wird.

[0040] Der Begriff "Biosyntheseweg", so wie hierin verwendet, bezieht sich auf eine Abfolge vonenzymatischen oder anderen Reaktionen, durch die eine Verbindung in eine andere Verbindungumgesetzt wird, und zwar durch die Ausbildung neuer kovalenter Bindungen in lebenden Orga¬nismen oder in vitro.

[0041] Der Begriff "in vitro", so wie hierin verwendet, bezieht sich auf einen Prozess, der nicht ineinem lebenden Organismus oder einer lebenden Zelle, sondern in einer kontrollierten Umge¬bung stattfindet.

[0042] Der Begriff "Peptidlinker" bezieht sich auf kürzere Aminosäuresequenzen, deren Rolleunter Umständen lediglich darin besteht, die einzelnen Domänen des Fusionsproteins vonei¬nander zu trennen. Die Rolle des Peptidlinkers in dem Fusionsprotein, in das er gegebenenfallseingeschlossen sein kann, kann ebenfalls darin bestehen, die Stelle für eine Spaltung oder fürposttranslationale Modifikationen einzubringen, einschließend die Einbringung von Stellen zurverbesserten Verarbeitung von Antigenen. Die Länge des Peptidlinkers ist nicht beschränkt,beträgt jedoch üblicherweise bis zu 30 Aminosäuren.

[0043] Im Allgemeinen wird die heterologe Nukleinsäure in einen Expressionsvektor einge¬bracht. Geeignete Vektoren schließen Plasmide, virale Vektoren und dergleichen ein, sindjedoch nicht auf diese beschränkt. Expressionsvektoren, die kompatibel mit den Zellen einesWirtsorganismus sind, sind im Stand der Technik hinreichend bekannt und enthalten geeigneteKontrollelemente für die Transkription und Translation von Nukleinsäuren. Typischerweiseschließt der Expressionsvektor eine Antibiotika-Resistenz-Kassette, eine Sequenz für ein chi-märes Protein unter der Kontrolle eines geeigneten Promotors zur Regulierung der Expressionin Wirtszellen, ein Polyadenylierungssignal sowie eine Transkriptionsterminationssequenz ein. VERFAHREN ZUR HERSTELLUNG EINES BIOSYNTHESEPRODUKTS BZW. EINES PRO¬DUKTVORLÄUFERS.

[0044] Die vorliegende Erfindung stellt ein Verfahren zur Herstellung eines Produkts oder einesProduktvorläufers eines Biosynthesewegs in einer genetisch modifizierten Wirtszelle oder invitro zur Verfügung. Das Verfahren umfasst allgemein das Kultivieren der genetisch modifizier¬ten Wirtszelle unter geeigneten Bedingungen, unter denen der genetisch modifizierte Wirt um¬fasst: a) Nukleinsäuren, die Nukleotidsequenzen umfassen, die für mindestens drei oder mehrBindungsfaktoren kodieren, die an Enzyme des Biosynthesewegs oder weitere funktionellePolypeptide gebunden sind, und b) eine Nukleinsäure, die eine oder mehrere Programm-

Nukleinsäuresequenzen umfasst.

[0045] In einer weiteren Ausführungsform der vorliegenden Erfindung umfasst das Verfahrenallgemein die Bildung eines Produkts in vitro. Das in vitro Verfahren umfasst: a) mindestens dreioder mehr Bindungsfaktoren, die an Chimäre Enzyme des Biosynthesewegs oder weitere funk¬tioneile Polypeptide gebunden sind, b) eine Nukleinsäure, die eine oder mehrere Programm-Nukleinsäuresequenzen umfasst, und c) das Bereitstellen eines Substrats für das erste Enzymsowie von Kofaktoren für die Enzyme in dem Gemisch.

[0046] Ein Bindungsfaktor bindet mit einer ausreichenden Assoziation an das Zielnukleinsäu¬reelement innerhalb der Programm-Nukleinsäuresequenz und stellt so eine Assoziation derChimären funktioneilen Polypeptide des Biosynthesewegs mit der Programm-Nukleinsäurese¬quenz zur Verfügung. Die Assoziation der Chimären funktionellen Polypeptide des Biosynthe¬sewegs mit der Programm-Nukleinsäuresequenz ist von einer ausreichenden Affinität, um dieChimären Enzyme des Biosynthesewegs oder weitere funktionelle Polypeptide auf einer Pro¬gramm-Nukleinsäuresequenz zu immobilisieren. Die Programm-Nukleinsäuresequenz legt dieReihenfolge der einander benachbarten Bindungsfaktoren fest und damit auch die Abfolge voneinander benachbarten Chimären Enzymen oder weiteren funktionellen Polypeptiden. Die Rei¬henfolge der Zielnukleinsäureelemente mit daran gebundenen funktionellen Polypeptiden kannentsprechend der Reihenfolge festgelegt werden, in der diese innerhalb einer bestimmten Bio¬synthesereaktion zum Einsatz kommen. Alternativ kann die Reihenfolge von einander benach¬barten Zielnukleinsäureelementen mit entsprechenden funktionellen Polypeptiden dadurchverändert werden, dass die Abfolge von einander benachbarten Zielsequenzen innerhalb derProgramm-Nukleinsäuresequenz verändert wird, wodurch eine alternative Reihenfolge voneinander benachbarten Biosyntheseenzymen oder weiteren funktionellen Polypeptiden zurVerfügung gestellt wird. Die Kultivierung der Wirtszelle erfolgt so, dass ein Substrat für daserste Enzym: a) in der Zelle vorliegt, oder b) der Zelle aus der extrazellulären Umgebung be¬reitgestellt wird. Die Enzyme des Biosynthesewegs werden in der Zelle synthetisiert und setzendas Substrat in ein Produkt um, oder b) die Biosyntheseenzyme werden in der Zelle syntheti¬siert, aus der Zelle freigesetzt und die Umwandlung des Substrats in ein Produkt erfolgt in derextrazellulären Umgebung.

[0047] Durch die Verwendung der Programm-Nukleinsäuresequenz zur Immobilisierung derfunktionellen Polypeptide des Biosynthesewegs werden eines oder mehrere der folgendenKriterien erfüllt: eine Steigerung der Effizienz des Synthesewegs, eine Optimierung des metabo¬lischen Flusses, eine Reduktion der metabolischen Belastung und der Konzentration von poten¬tiell toxischen freien Zwischenprodukten im Zytosol sowie die mögliche Ausbildung von alterna¬tiven Verzweigungen der metabolischen Synthesewege, wodurch in einem Biosyntheseprozessneue Produkte hergestellt werden können. Das Gleichgewicht zwischen den Aktivitätsniveausder Enzyme wird durch die Verwendung der Programm-Nukleinsäuresequenz erreicht. So kannz. B. die Sequenz des Nukleinsäureprogramms auf eine Weise verändert werden, dass mehrereKopien von Zielnukleinsäureelementen für Chimäre Polypeptide mit einer geringeren Aktivität inRichtung der Umsetzung des Substrats eingeschlossen sind, was zu einer Erhöhung der An¬zahl an Kopien der funktionellen Polypeptide mit einer geringeren Aktivität gegenüber der An¬zahl der Kopien von funktioneilen Polypeptiden mit einer höheren Aktivität führt. Dies kann vonVorteil sein, wenn das funktionelle Polypeptid mit der geringeren Aktivität einen den Durchsatzlimitierenden Schritt in dem betreffenden Biosyntheseweg katalysiert. Mit der Verwendung einerProgramm-Nukleinsäuresequenz wird durch die größere räumliche Nähe der an dem Biosyn¬theseweg beteiligten Enzyme zum einen die Effizienz gesteigert und zum anderen der Flussdes Synthesewegs optimiert. Aufgrund der gesteigerten Effizienz und des optimierten Flusseskönnen mit geringeren Mengen an Enzymen gleiche oder höhere Ausbeuten des Produktserzielt werden. Ein niedriges Niveau der Enyzmproduktion in einer Wirtszelle ist vorteilhaft, dahierdurch die metabolische Belastung für die Wirtszelle reduziert wird. Da die Umsetzung vonZwischenprodukten des Biosynthesewegs mit der Verwendung einer Programm-Nukleinsäuresequenz auf eine effizientere Weise abläuft, kommt es zu einer Reduktion derMenge bzw. Konzentration an Zwischenprodukten des Synthesewegs, die in freier Form im

Zytosol oder Zytoplasma vorliegen. Geringere Mengen an freien Zwischenprodukten des Syn¬thesewegs sind dann vorteilhaft, wenn diese Zwischenprodukte toxisch auf die Wirtszelle wir¬ken.

[0048] In einigen Ausführungsformen werden mindestens drei Chimäre Enzyme des Biosynthe¬sewegs oder weitere funktionelle Polypeptide auf dem Nukleinsäureprogramm immobilisiert.Das erste Chimäre funktionelle Enzym oder Polypeptid produziert ein erstes Produkt, das einSubstrat für das zweite Chimäre Enzym oder das weitere funktionelle Polypeptid darstellt. DieChimären Proteine, Enzyme des Biosynthesewegs oder weiteren funktionellen Polypeptide sindin großer räumlicher Nähe zueinander angeordnet. Auf diese Weise ist die effektive Konzentra¬tion des ersten Produkts hoch und das zweite Enzym des Biosynthesewegs kann in effizienterWeise auf das erste Produkt einwirken.

[0049] Es können drei oder mehr (z. B. drei, vier, fünf, sechs, sieben oder mehr) funktionellePolypeptide auf der Programm-Nukleinsäuresequenz immobilisiert werden. So schließt z.B. ineinigen Ausführungsformen die Programm-Nukleinsäuresequenz (vom 5'- zum 3'-Ende) ein: a)eine Kopie eines Zielnukleinsäureelements für das erste Chimäre Polypeptid des Enzyms desBiosynthesewegs oder das weitere funktionelle Polypeptid, b) eine Kopie eines Zielnukleinsäu¬reelements für das zweite Chimäre funktionelle Polypeptid des Biosynthesewegs und c) eineKopie eines Zielnukleinsäureelements für das dritte Chimäre funktionelle Polypeptid des Biosyn¬thesewegs. In weiteren Ausführungsformen schließt eine Programm-Nukleinsäuresequenz (vom5'- zum 3'-Ende) ein: a) eine Kopie einer Zielsequenz für das erste Chimäre funktionelle Po¬lypeptid des Biosynthesewegs und b) zwei oder mehr (z. B. zwei drei, vier, oder mehr) Kopieneines Zielnukleinsäureelements für das zweite Chimäre Enzym des Biosynthesewegs oder dasweitere funktionelle Polypeptid. Auf diese Weise kann das Verhältnis eines beliebigen Chimärenfunktionellen Polypeptids in einem Biosyntheseweg variiert werden. So kann z. B. das Verhält¬nis eines ersten Chimären funktionellen Polypeptids des Biosynthesewegs zu einem zweitenChimären funktioneilen Polypeptid des Biosynthesewegs zwischen etwa 0,1:10 und etwa 10:0,1und das Verhältnis von dem ersten zu dem dritten Chimären Protein zwischen etwa 0,1:10 undetwa 10:0,1 etc. variieren.

[0050] In einigen Ausführungsformen sind mindestens drei oder mehr (z. B. vier, fünf, sechs, sieben oder mehr) Chimäre Enzyme des Biosynthesewegs auf einem Nukleinsäureprogrammimmobilisiert. Das erste Chimäre Enzym des Biosynthesewegs produziert ein erstes Produkt,das als Substrat für das zweite Produkt dient, das wiederum als Substrat für das dritte Produktdes Enzyms des Biosynthesewegs dient: In diesen Ausführungsformen werden die Reihen¬ folge und die Anzahl an Kopien der Enzyme des Biosynthesewegs durch die Sequenz derZielnukleinsäuresequenz für ein bestimmtes chimäres Enzym des Biosynthesewegs in einemNukleinsäureprogramm vorgegeben. KONSTRUKTION EINER PROGRAMM-NUKLEINSÄURESEQUENZ.

[0051] Die Konstruktion einer Programm-Nukleinsäuresequenz erfolgt, um Enzyme eines Bio¬synthesewegs in einem funktionellen Komplex zu organisieren. Eine Programm-Nukleinsäu¬resequenz umfasst drei oder mehr Zielnukleinsäureelemente für die Bindung an Nukleinsäurebindende Faktoren. Durch die Bindung eines Nukleinsäure bindenden Faktors, der an ein chi¬märes Enzym des Biosynthesewegs gebunden ist, an das Zielnukleinsäureelement wird für dieImmobilisierung eines Enzyms auf der Programm-Nukleinsäuresequenz gesorgt. Jedes Zielnuk¬leinsäureelement verfügt über einen entsprechenden Nukleinsäure-Bindungspartner in einemChimären Enzym des Biosynthesewegs oder einem funktionellen Polypeptid. Ein Zielnuklein¬säureelement kann entweder unmittelbar zu einem weiteren Zielnukleinsäureelement benach¬bart sein oder es kann durch eine Spacer-Nukleinsäuresequenz von einem benachbarten Ziel¬nukleinsäureelement getrennt sein. In den in vivo Ausführungsformen kann die Programm-Nukleinsäuresequenz in jeweils unterschiedlichen Formen in eine Vielzahl von unterschiedli¬chen Arten von Wirtszellen eingebracht werden. Beispiele für unterschiedliche Formen derProgramm-Nukleinsäuresequenz schließen Baculovirus-Vektoren, Bakteriophagen-Vektoren,Plasmide, Phagemide, Cosmide, Fosmide, künstliche bakterielle Chromosomen, virale Vektoren (z. B. virale Vektoren, die auf dem Vacciniavirus, Poliovirus, Adenovirus, Adeno-assoziiertenVirus, SV40, Herpes-Simplex-Virus und dergleichen basieren, jedoch nicht auf diese be¬schränkt), P1-basierte künstliche Chromosomen, Hefeplasmide, künstliche Hefechromosomenund weitere Vektoren ein, sind jedoch nicht auf diese beschränkt. Die Programm-Nukleinsäuresequenz kann ebenfalls in Form eines linearen Nukleinsäuremoleküls in eineVielzahl an unterschiedlichen Wirtszellen eingebracht werden. Alle diese Formen der Pro¬gramm-Nukleinsäuresequenz können ebenfalls in den in vitro Ausführungsformen der vorlie¬genden Erfindung verwendet werden. Setzt sich die Programm-Nukleinsäuresequenz zumin¬dest zum Teil aus RNA zusammen, so kann sie als solche verwendet werden; die Verwendungvon DNA, die für die Programm-Nukleinsäuresequenz kodiert, ist allerdings ebenfalls möglich.DNA, die für die Programm-Nukleinsäuresequenz kodiert, die in den in vitro oder in vivo Ausfüh¬rungsformen der vorliegenden Erfindung verwendet wird, kommt in unterschiedlichen Formenvor, wie z. B. in einer beliebigen der vorstehend genannten Formen, jedoch nicht auf diesebeschränkt.

[0052] In einem Produktionssystem kann die Programm-Nukleinsäuresequenz in Form voneiner oder mehrerer Kopien vorliegen. Durch das Vorliegen von mehreren Kopien einer einzel¬nen Programm-Nukleinsäuresequenz kann eine größere Anzahl an funktionellen Biosynthese¬komplexen zur Verfügung gestellt werden, die aus immobilisierten Chimären Enzymen desBiosynthesewegs konstruiert sind. Einzelne Kopien der Programm-Nukleinsäuresequenzenkönnen in einem oder mehreren Nukleinsäuremolekülen vorliegen. Folglich wird durch dieAmplifikation der Anzahl an einzelnen Nukleinsäuremolekülen in dem Produktionssystem miteiner oder mehreren Kopien der Programm-Nukleinsäuresequenz ebenfalls eine größere Ge¬samtanzahl an Kopien der Programm-Nukleinsäuresequenzen in dem produzierenden Systemzur Verfügung gestellt.

[0053] Zum Beispiel, jedoch nicht hierauf beschränkt, kann eine bakterielle Wirtszelle mit einemselbstreplizierenden Plasmid oder einer beliebigen weiteren Art von Nukleinsäuremolekül, daseine Programm-Nukleinsäuresequenz in einer oder mehreren Kopien trägt, transformiert sein,wodurch eine höhere Gesamtanzahl an Programm- Nukleinsäuresequenzen in dem Produkti¬onssystem zur Verfügung gestellt wird. Ein Plasmid, das eine oder mehrere Kopien der Pro¬gramm-Nukleinsäuresequenzen trägt, kann in dem System ebenfalls in einer oder mehrerenKopien vorliegen (z. B., jedoch nicht hierauf beschränkt, kann ein Plasmid mit einer hohenKopienzahl zur Transformation einer bakteriellen Wirtszelle verwendet werden). Mit einer höhe¬ren Anzahl an Plasmiden mit jeweils einer oder mehreren Kopien der Programm-Nukleinsäuresequenzen wird in dem Produktionssystem ebenfalls eine höhere Gesamtanzahlan Programm-Nukleinsäuresequenzen zur Verfügung gestellt.

[0054] Zum Beispiel, jedoch nicht hierauf beschränkt, kann eine bakterielle Wirtszelle mit einerNukleinsäuresequenz transformiert sein, die für ein einzelsträngiges, doppelsträngiges, teilwei¬se doppelsträngiges, mehrsträngiges oder teilweise mehrsträngiges RNA-Molekül kodiert. DieProgramm-Nukleinsäuresequenz kann in einer oder mehreren Kopien auf einem einzelnenRNA-Molekül vorliegen. Durch das Vorliegen von mehreren Kopien von Programm-Nukleinsäuresequenzen auf einem einzelnen RNA-Molekül wird eine höhere Gesamtanzahl anProgramm-Nukleinsäuresequenzen in dem Produktionssystem zur Verfügung gestellt. Eine fürein RNA-Molekül kodierende Nukleinsäuresequenz kann ebenfalls in einer oder mehrerenKopien in dem Produktionssystem vorliegen. Mit einer höheren Anzahl an Kopien von für einRNA-Molekül kodierenden Nukleinsäuresequenzen wird in dem Produktionssystem eine höhereAnzahl von RNA-Molekülen und damit ebenfalls eine höhere Gesamtanzahl an Programm-Nukleinsäuresequenzen zur Verfügung gestellt. Die Gesamtanzahl an einzelnen RNA-Molekülen in dem Produktionssystem kann auch mithilfe von Promotoren reguliert werden, diezur Anregung der Transkription von kodierenden Nukleinsäuresequenzen in RNA-Moleküleverwendet werden, die aus einer oder mehreren Kopien der Programm-Nukleinsäuresequenzenbestehen. Durch stärkere Promotoren wird in dem Produktionssystem eine höhere Anzahl anRNA-Moleküle und damit auch eine höhere Gesamtanzahl an einzelnen Programm-Nuklein¬säuresequenzen zur Verfügung gestellt. Mit der höheren Gesamtanzahl an Programm-Nuklein- Säuremolekülen wird eine höhere Anzahl an funktionellen Biosynthesekomplexen zur Verfügunggestellt, die aus immobilisierten Chimären Enzymen des Biosynthesewegs konstruiert sind.

[0055] Eine Programm-Nukleinsäuresequenz umfasst mindestens drei Zielnukleinsäurese¬quenzen und folglich binden mindestens drei entsprechende Nukleinsäure bindende Elementein drei Chimären Enzymen des Biosynthesewegs an die Programm-Nukleinsäuresequenz. EineProgramm-Nukleinsäuresequenz weist eine, zwei oder mehr Kopien eines jeden Zielnukleinsäu¬reelements auf. Dem entsprechend kann jedes Zielnukleinsäureelement in einer oder mehrerenKopien vorliegen. Die Kopien können aneinander angrenzen oder durch eine Spacer-Nukleinsäuresequenz voneinander getrennt sein. Die Kopien des Zielnukleinsäureelementskönnen ebenfalls durch ein oder mehrere Zielnukleinsäureelemente voneinander getrennt sein,die wiederum ebenfalls in einer oder mehreren Kopien vorliegen können. Liegen auf einer Pro¬gramm-Nukleinsäuresequenz nur drei Zielnukleinsäureelemente vor, so können diese verschie¬den voneinander sein, wodurch eine geeignete räumliche Anordnung oder eine hohe lokaleKonzentration für die zwei unterschiedlichen Chimären Enzyme des Biosynthesewegs oder dieweiteren funktionellen Polypeptide zur Verfügung gestellt werden kann. Liegen auf einer Pro¬gramm-Nukleinsäuresequenz nur drei Zielnukleinsäureelemente vor, so können diese auch vonder gleichen Art sein, wodurch eine geeignete räumliche Anordnung oder eine hohe lokaleKonzentration für die drei Kopien der gleichen Chimären Enzyme des Biosynthesewegs zurVerfügung gestellt werden kann.

[0056] Ein spezifisches Zielnukleinsäureelement ist durch die Nukleotidsequenz vom 5'- zum 3'-Ende eines Nukleinsäuremoleküls definiert. Auf einer doppelsträngigen Programm-Nukleinsäu¬resequenz oder einem doppelsträngigen Segment einer Programm-Nukleinsäuresequenz kannes sich bei der Zielnukleinsäuresequenz auch um die revers komplementäre Sequenz derursprünglichen Zielnukleinsäuresequenz handeln. An das Zielnukleinsäureelement sowie an dierevers komplementäre Sequenz der Zielnukleinsäuresequenz bindet der gleiche Nukleinsäurebindende Faktor, jedoch in einer unterschiedlichen Orientierung und an einer unterschiedlichenStelle der Programm-Nukleinsäuresequenz. Dem entsprechend kann die Verwendung einerrevers komplementären Sequenz des Zielnukleinsäureelements anstelle des Zielnukleinsäu¬reelements zweckmäßig sein, wenn zwei Chimäre Enzyme des Biosynthesewegs oder weiterefunktionelle Polypeptide zu groß sind, um direkt aneinander anzugrenzen, oder zum Erreicheneiner unterschiedlichen räumlichen Anordnung von zwei Kopien des gleichen Chimären Enzymsdes Biosynthesewegs oder weiterer funktioneller Polypeptide auf einer Programm-Nukleinsäu¬resequenz.

[0057] E in Spacer-Nukleinsäureelement kann auf einer Programm-Nukleinsäuresequenz zwi¬schen zwei Zielnukleinsäureelementen angeordnet werden, um ausreichend Platz für großeChimäre Enzyme des Biosynthesewegs oder weitere funktionelle Polypeptide zu schaffen, dieihre Wirkung in dem Biosyntheseweg der Reihe nach ausüben. In einer doppelsträngigen Pro¬gramm-Nukleinsäuresequenz oder einem doppelsträngigen Segment einer Programm-Nuklein¬säuresequenz kann durch die Spacer-Nukleinsäuresequenz auch eine geeignete räumlicheAnordnung von zwei aneinander angrenzenden oder nahe beieinander liegenden ChimärenEnzymen des Biosynthesewegs oder weiteren funktioneilen Polypeptiden zur Verfügung gestelltwerden. So kann es sich z. B. in einigen Ausführungsformen bei der Programm-Nukleinsäu¬resequenz um eine doppelsträngige DNA-Sequenz handeln, die eine gedrehte Helixstrukturausbildet. Dem entsprechend führt eine Variation der Länge einer Spacer-Nukleinsäuresequenzzu einer unterschiedlichen räumlichen Position der immobilisierten Chimären Enzyme des Bio¬synthesewegs sowie zu einem größeren Abstand zwischen zwei einander benachbarten Chimä¬ren Enzymen des Biosynthesewegs (Figur 2).

[0058] Eine einzelne Programm-Nukleinsäuresequenz weist die allgemeine Formel [((X oderX')n Sp)]m auf, wobei Xn für eine Zielnukleinsäuresequenz steht, Xn' für eine zu der Zielnukle¬insäuresequenz revers komplementäre Sequenz steht, S für eine optionale Spacer- Nukleo¬tidsequenz einer beliebigen Länge steht, m einer ganzen Zahl von 3 aufwärts entspricht und füreine Reihe an Zielnukleinsäuresequenzen mit einer optionalen Spacer-Nukleinsäuresequenz inder Programm-Nukleinsäure steht, n einem Indikator für die Art des Zielnukleinsäureelements (z. B. X1, X2 und so weiter) entspricht und für unterschiedliche einzelne Zielnukleinsäureele¬mente steht, p einem Indikator für die Art des Spacer-Elements (z. B. S1, S2 und so weiter)entspricht und für unterschiedliche einzelne Spacer-Elemente steht. Eine einzelne Zielnuklein¬säuresequenz in der Programm-Nukleinsäuresequenz kann eine beliebige Länge aufweisenund ist abhängig von dem entsprechenden Nukleinsäure bindenden Element. So können z. B.in einigen Ausführungsformen der vorliegenden Erfindung dreigliedrige DNA bindende Zinkfin¬gerproteine verwendet werden. In diesen Fällen liegt die Länge der Zielnukleinsäuresequenzenüblicherweise, jedoch nicht immer, bei 9 oder 10 Nukleotiden.

[0059] So weist z. B. in einigen Ausführungsformen die Programm-Nukleinsäuresequenz dieFormel (X1)(S1)(X2)(S2)(X3)(S3)(X4) auf, wobei X1 für die erste Zielnukleinsäuresequenz zurBindung des ersten Chimären Enzyms des Biosynthesewegs steht; wobei X2 für die zweiteZielnukleinsäuresequenz zur Bindung des zweiten Chimären Enzyms des Biosynthesewegssteht; wobei X3 für die dritte Zielnukleinsäuresequenz zur Bindung des dritten Chimären Enzymsdes Biosynthesewegs steht; wobei X4 für die vierte Zielnukleinsäuresequenz zur Bindung desvierten Chimären Enzyms des Biosynthesewegs steht; wobei Sl, sofern vorhanden, für die ersteSpacer-Nukleotidsequenz steht, die eine geeignete räumliche Anordnung von einander be¬nachbarten Chimären Enzymen des Biosynthesewegs gewährleistet; wobei S2, sofern vorhan¬den, für die zweite Spacer-Nukleotidsequenz steht, die eine geeignete räumliche Anordnungvon einander benachbarten Chimären Enzymen des Biosynthesewegs gewährleistet; wobei S3,sofern vorhanden, für die dritte Spacer-Nukleotidsequenz steht, die eine geeignete räumlicheAnordnung von einander benachbarten Chimären Enzymen des Biosynthesewegs gewährleis¬tet.

[0060] Als weiteres Beispiel weist in einigen Ausführungsformen die Programm-Nukleinsäu¬resequenz die Formel (X1)(S1)(X2)(S1)(X2)(S1) (X3) auf, wobei X1 für die erste Zielnukleinsäu¬resequenz zur Bindung des ersten Chimären Enzyms des Biosynthesewegs steht; wobei X2 fürdie zweite Zielnukleinsäuresequenz zur Bindung des zweiten Chimären Enzyms des Biosynthe¬sewegs steht und zwei Mal direkt aufeinander folgend wiederholt wird; wobei X3 für die dritteZielnukleinsäuresequenz zur Bindung des dritten Chimären Enzyms des Biosynthesewegssteht; und wobei Sl, sofern vorhanden für die Spacer-Nukleotidsequenz der gleichen Art steht,die zwischen jedem Paar von Zielnukleinsäuresequenzen angeordnet ist. Durch in Folge wie¬derholte Zielnukleotidsequenzen (im vorliegenden Fall X2) kann eine höhere lokale Konzentra¬tion eines den Durchsatz limitierenden Chimären Enzyms des Biosynthesewegs zur Verfügunggestellt werden, was zu einer erhöhten Effizienz des Flusses des Synthesewegs führt. Durch inFolge wiederholte Zielnukleotidsequenzen (im vorliegenden Fall X2) kann ebenfalls eine erhöh¬te Dimerisierung (oder Multimerisierung, wenn eine spezifische Zielnukleinsäuresequenz mehrals zwei Mal in Folge wiederholt wird) eines dimeren (oder multimeren) Chimären Enzyms desBiosynthesewegs zur Verfügung gestellt werden. Durch in Folge wiederholte Zielnukleotidse-quenzen (im vorliegenden Fall X2) kann ebenfalls eine erhöhte Effizienz des Flusses des Syn¬thesewegs in Biosynthesewegen mit Chimären Enzymen zur Verfügung gestellt werden, indenen ein Enzym mehr als ein Mal in Folge auf ein Substrat einwirkt.

[0061] Als weiteres Beispiel weist in einigen Ausführungsformen die Programm-Nukleinsäu¬resequenz die Formel (X1)(S1)(X2)(S2)(X1)(S3) (X3) auf, wobei X1 für die erste Zielnukleinsäu¬resequenz zur Bindung des ersten Chimären Enzyms des Biosynthesewegs steht und in derProgramm-Nukleinsäuresequenz erneut wiederholt wird, jedoch nicht in direkter Aufeinanderfol¬ge; wobei X2 für die zweite Zielnukleinsäuresequenz zur Bindung des zweiten Chimären En¬zyms des Biosynthesewegs steht; wobei X3 für die dritte Zielnukleinsäuresequenz zur Bindungdes dritten Chimären Enzyms des Biosynthesewegs steht; wobei S1, sofern vorhanden, für dieerste Spacer-Nukleotidsequenz steht, die eine geeignete räumliche Anordnung von einanderbenachbarten Chimären Enzymen des Biosynthesewegs gewährleistet; wobei S2, sofern vor¬handen, für die zweite Spacer-Nukleotidsequenz steht, die eine geeignete räumliche Anordnungvon einander benachbarten Chimären Enzymen des Biosynthesewegs gewährleistet; wobei S3,sofern vorhanden, für die dritte Spacer-Nukleotidsequenz steht, die eine geeignete räumlicheAnordnung von einander benachbarten Chimären Enzymen des Biosynthesewegs gewährleis¬ tet. Diese Programm-Nukleinsäuresequenz kann zur Verbesserung der Effizienz von Biosyn¬thesewegen mit Chimären Enzymen verwendet werden, in denen ein chimäres Enzym desBiosynthesewegs (im vorliegenden Fall das Chimäre Enzym des Biosynthesewegs, das an dieZielnukleotidsequenz XI bindet) in einem Biosyntheseweg mit Chimären Enzymen mehr als einMal wirkt, jedoch nicht in unmittelbarer Aufeinanderfolge. KONSTRUKTION VON (NUKLEINSÄURE-) BINDUNGSFAKTOREN.

[0062] Die vorliegende Erfindung betrifft Chimäre Polypeptide, die sich aus einem Nukleinsäurebindenden Faktor (NSBF) und einem Enzym des Biosynthesewegs oder einem weiteren funkti¬oneilen Polypeptid zusammensetzen, die über einen Aminosäurelinker miteinander verbundensind. Ein NSBF ist entweder natürlichen Ursprungs oder künstlich hergestellt und kann im Prin¬zip aus einem beliebigen Organismus isoliert werden. Bei einem NSBF handelt es sich um einbeliebiges Polypeptid, Protein bzw. Proteinsegment oder eine beliebige Domäne, das bzw. diean eine Nukleinsäure bindet. Ein NSBF ist eine unabhängig gefaltete Proteindomäne, die min¬destens ein Motiv enthält, das eine Nukleinsäuresequenz erkennt. Die Interaktion zwischeneinem NSBF und Nukleotiden erfolgt auf eine sequenzspezifische Weise. Beispiele für Polypep¬tide mit einem NSBF schließen Helix-Turn-Helix, Zinkfinger, Leucin-Zipper, Winged-Helix, Win-ged-Helix-Turn-Helix, Helix-Loop-Helix und die HMG-Box ein, sind jedoch nicht auf diese be¬schränkt.

[0063] Polypeptide mit einem basischen Helix-Loop-Helix-Motiv werden in Leucin-Zipper-Faktoren, Helix-Loop-Helix-Faktoren, Helix-Loop- Helix-/Leucin-Zipper-Faktoren, NF-1, RP-Xund bHSH klassifiziert und sind gekennzeichnet durch zwei α-Helices, die durch eine Schleife(Loop) miteinander verbunden sind. Transkriptionsfaktoren, die diese Domäne einschließen,binden typischerweise als Dimere an eine als E-Box (palindromische Sequenz (CACGTG))bezeichnete Konsensussequenz. Die bHLH-Transkriptionsfaktoren binden an nicht palindromi¬sche Sequenzen, die der E-Box in vielen Fällen ähnlich sind.

[0064] Als weiteres Beispiel sind in einigen Ausführungsformen die NSBF aus der Überklassevon Zink koordinierenden DNA bindenden Domänen (Zinkfingerdomänen) ausgewählt, diewiederum in die folgenden Unterklassen unterteilt ist: Cys4-Zinkfinger des Typs nukleärer Re¬zeptor, diverse Cys4-Zinkfinger, Cys2His2-Zinkfingerdomänen, Cys6-Cystein-Zink-Cluster undZinkfinger mit abwechselnder Zusammensetzung. Einzelne Zinkfingerdomänen kommen typi¬scherweise in Form von aufeinander folgenden Wiederholungen (tandem repeats/arrays) vor,wobei zwei, drei oder mehr Finger die DNA bindende Domäne des Proteins umfassen. Dieseaufeinanderfolgenden Wiederholungen können in der großen Furche der DNA binden und sindtypischerweise um jeweils 3 bp voneinander beabstandet. Die α-Helix einer jeden Domäne(oftmals auch als die "Erkennungshelix" bezeichnet) kann die Nukleotide der Nukleinsäuren aufeine sequenzspezifische Weise kontaktieren; die Reste einer einzelnen Erkennungshelix kön¬nen 4 oder mehr Nukleotide kontaktieren und so ein überlappendes Muster an Kontakten mitbenachbarten Zinkfingern ausbilden.

[0065] Als weiteres Beispiel sind in einigen Ausführungsformen die NSBF ausgewählt aus derHelix-Turn-Helix-Überklasse an Nukleotid bindenden Polypeptiden, die wiederum in sechsKlassen unterteilt ist: die Homeodomäne, Forkhead/Winged-Helix, Hitzeschockfaktoren, Tryp¬tophan-Cluster und die Transkriptionsenhancer-Faktor (TEA)-Domäne. Bei Helix-Turn-Helixhandelt es sich um ein wichtiges Strukturmotiv, das zur Bindung von DNA in der Lage ist, wobeidie Erkennung der und Bindung an die DNA über die beiden α-Helices erfolgt, von denen sichdie eine am N-terminalen Ende des Motivs und die andere am C-Terminus befindet.

[0066] Bei den Beta-Gerüst-Faktoren mit Kontakten zur kleinen Furche der DNA handelt es sichum die vierte Überklasse, die wiederum in mehrere Klassen unterteilt ist: RHR (Rel-Homologie-Domäne), STAT, p53, die MADS-Box, beta-Barrel-alpha-Helix-Transkriptionsfaktoren, TATAbindende Proteine, heteromere CCAAT-Faktoren, Grainyhead, Faktoren der Kälteschock-Domäne und Runt.

[0067] Ebenfalls von Bedeutung sind weitere Transkriptionsfaktoren, die an eine spezifische

Nukleotidsequenz binden, wie z. B. mutierte Restriktionsenzyme, die zwar über keine Restrikti¬onsaktivität, jedoch über die Fähigkeit zur Sequenzerkennung verfügen.

[0068] Die vorliegende Erfindung betrifft, ist jedoch nicht beschränkt auf, Polypeptide mit einerZinkfingerdomäne, die eine kleine, unabhängig gefaltete, zinkhaltige Minidomäne bilden, dieeine spezifische Nukleinsäuresequenz erkennt. Die Zinkfingerdomänen treten typischerweiseals aufeinander folgende Wiederholungen mit mindestens zwei, drei, oder mehr Fingern auf,welche die DNA bindende Domäne des Proteins umfassen. Jeder Finger erkennt aus 3 Basen¬paaren bestehende Teilbindungsorte und bindet an diese. Die spezifische Bindung wird durchAminosäuren der Minidomäne der Zinkfingerdomäne an den Positionen 1, 2, 3 und 6 vom Be¬ginn der a- Helix vermittelt. In einem modularen oder kombinatorischen Ansatz ist es nun mög¬lich, die sich wiederholenden Minidomänen zu multiplizieren und so durch Variation in bestimm¬ten Schlüsselaminosäureresten eine chemische Unverwechselbarkeit zu erreichen. Dem ent¬sprechend werden Finger mit einer Spezifität für unterschiedliche Tripletts miteinander kombi¬niert, um so die spezifische Erkennung längerer Nukleinsäuresequenzen zu ermöglichen. Durchdie Kombination von mindestens zwei oder mehr Zinkfingerdomänen ist es möglich, die nichtspezifische Bindung an in Wirtsorganismen vorliegende Nukleinsäuren zu minimieren und dieSpezifität der Zinkfinger enthaltenden Polypeptide, die an die Programm-Nukleinsäure binden,zu erhöhen.

[0069] Zinkfinger bindende Motive sind stabile Strukturen, bei deren Bindung an ihr jeweiligesZiel es nur selten zu Konformationsänderungen kommt. Im Rahmen der vorliegenden Erfindungwurde nun eine funktionelle Polypeptiddomäne mit mindestens einer Linkersequenz verknüpft,die kovalent an das jeweils relevante Enzym des Biosynthesewegs gebunden ist. Die Linkerse¬quenz bestimmt die Position des Enzyms des Biosynthesewegs oder des weiteren funktionellenPolypeptids in Relation zu der Zinkfinger bindenden Domäne und dem jeweils benachbartenEnzym des Biosynthesewegs oder weiteren funktioneilen Polypeptid. Die Linkersequenz kannhinsichtlich ihrer Länge und Aminosäuresequenz variieren und stellt sicher, dass das kovalentgebundene Enzym eine geeignete tertiäre Struktur ausbilden und so seine biologische Funktionbeibehalten kann.

[0070] Die Anzahl an Chimären Enzymen des Biosynthesewegs oder weiteren funktionellenPolypeptiden, die an die NSBF gebunden sind, kann drei, vier, fünf oder mehr betragen, istjedoch nicht hierauf beschränkt, und kann sich des Weiteren von der Anzahl an einzelnen Ziel¬nukleinsäureelementen auf einer Programm-Nukleinsäuresequenz unterscheiden. Die Anzahlan Chimären Enzymen des Biosynthesewegs oder weiteren funktionellen Polypeptiden, die andie NSBF gebunden sind, ist abhängig von der Anzahl der Schritte in einem Biosyntheseweg.Erfordert der Biosyntheseweg drei, vier oder fünf unterschiedliche Enzyme oder weitere funktio¬neile Polypeptide, um das Substrat in das Produkt oder einen Produktvorläufer umzusetzen, sosind jeweils mindestens drei, vier oder fünf unterschiedliche Bindungselemente in einer festge¬legten Reihenfolge in der Programm-Nukleinsäuresequenz eingeschlossen. Das Nukleinsäure¬programm, das einige Wiederholungen der einzelnen Zielelemente enthält, ist ebenfalls in denUmfang der vorliegenden Erfindung eingeschlossen.

[0071] In einigen Ausführungsformen der vorliegenden Erfindung können RNA-Moleküle alsProgramm-Nukleinsäuresequenzen verwendet werden. In diesem Fall sollten Nukleinsäurebindende Faktoren verwendet werden, die anstelle von spezifischen DNA-Sequenzen spezifi¬sche RNA-Sequenzen erkennen. Ohne hierauf beschränkt zu sein, kann es sich bei diesenSequenzen um die folgenden handeln: das RNA-Erken- nungsmotiv (RRM (RNA recognitionmotif), auch bezeichnet als das RBD- oder das RNP-Motiv), die heterogene nukleäre RNP-K-Homologie- Domäne (KH-Domäne), Zinkfingerdomänen (die am besten charakterisierten RNAbindenden Zinkfingerdomänen sind die des Typs CCHH und CCCH, es können jedoch auchandere Arten verwendet werden) und Pumilio (Puf)-Domänen. Wenngleich RNA bindendeDomänen, die spezifische sekundäre Strukturen auf RNA-Molekülen erkennen, ebenfalls alsNukleinsäure bindende Faktoren verwendet werden können (z. B. S1-Domänen, jedoch nichtauf diese beschränkt), so sind sequenzspezifische RNA bindende Domänen am besten geeig¬net (z. B. die Zinkfinger RNA bindenden Domänen, jedoch nicht auf diese beschränkt). Im

Rahmen der vorliegenden Erfindung ist die Verwendung von RNA bindende Domänen, diespezifische doppelsträngige RNA-Sequenzen erkennen, bevorzugt, da mit diesen eine geeigne¬te räumliche Anordnung gewährleistet werden kann. Verfahren zur Konstruktion von sequenz¬spezifischen doppelsträngigen RNA bindenden Zinkfingern sind in der Literatur beschrieben. KONSTRUKTION VON SYNTHESEWEGEN.

[0072] Die vorliegende Erfindung betrifft ein Verfahren zur Steigerung der Ausbeute bei derHerstellung von Biosyntheseprodukten. Das Verfahren kombiniert: (i) eine Programm-Nukleinsäuresequenz; und (ii) chimäre Proteine von Enzymen des Biosynthesewegs oder wei¬tere funktionelle Polypeptide mit NSBF. Die erforderlichen Komponenten (i) und (ii) können (i) invitro in einer Lösung vermischt werden, in Gegenwart von Substraten und Kofaktoren für dieEnzyme des Biosynthesewegs, oder (ii) die Komponenten können in vivo in Wirtszellen einge¬bracht und dort exprimiert werden.

[0073] I m Rahmen der vorliegenden Erfindung bezieht sich der Begriff eines Biosynthesewegsauf eine beliebige Kaskade von Enzymen, die in der festgelegten Reihenfolge eine neue chemi¬sche Bindung an das Substrat ausbilden, z. B. natürlich vorkommend oder künstlich konstruiert.Der Begriff eines künstlichen Biosynthesewegs bezieht sich auf die Herstellung eines Produkts,das als solches in der Natur nicht vorkommt. Der Begriff des künstlichen Biosynthesewegsbezieht sich ebenfalls auf die Herstellung eines Produkts, das zwar als solches in der Naturvorkommt, wobei jedoch die Enzyme des Biosynthesewegs nicht von dem gleichen Organismusstammen oder mithilfe genetischer Modifikationen erhalten werden.

[0074] Die vorliegende Erfindung betrifft einen Biosyntheseweg, also eine beliebige gekoppelteenzymatische Reaktion, die sequentiell mit drei oder mehr Enzymen zu erfolgen hat. Der Bio¬syntheseweg (d. h. dessen Fluss, Effizienz) kann gemessen werden, indem die Konzentrationvon Produktvorläufern und Endprodukten mittels der im Stand der Technik bekannten geeigne¬ten Verfahren bestimmt wird.

[0075] Die vorliegende Erfindung betrifft einen beliebigen Biosyntheseweg, einschließend,jedoch nicht beschränkt auf: [0076] · katabolische oder anabolische Synthesewege, [0077] · primäre metabolische Synthesewege, wie z. B. die Synthese von Aminosäuren, Fett¬ säuren, Kohlenhydraten, Pyrimidinen und Purinen, jedoch nicht auf diese beschränkt, [0078] · sekundäre metabolische Synthesewege, wie z. B. die Synthese von sekundären

Metaboliten mit biologischen Aktivitäten und pharmakologischen Eigenschaften (Po-lyketiden), seltenen Peptiden, Hormonen, Terpenoiden (Carotenoiden,...), Pigmenten(Violacein, Melanin,...) und dergleichen, jedoch nicht auf diese beschränkt.

CAROTENOIDE ENZYME DES BIOSYNTHESEWEGS

[0079] Carotenoide gehören zur Kategorie der Tetraterpenoide. Astaxanthin, Zeaxanthin undCanthaxanthin sind von ß-Caroten abgeleitet und ihre Synthese wird durch die carotenoidenBiosyntheseenzyme crtE, crtB, crtl, crtY, crtO und crtZ vermittelt, wobei die Reihenfolge und dieBeteiligung der Enzyme jeweils ausschlaggebend für die Art des erhaltenen Produkts ist. Soführen z. B. Biosynthesewege, die crtE, crtB, crtl, crtY, crtO und crtZ einschließen, zur Synthesevon Astaxanthin, crtE, crtB, crtl, crtY und crtZ führen zur Synthese von Zeaxanthin und crtL-E,crtB, crtl, crtY und crtO zur Synthese von Cantaxanthin.

Violacein-Biosyntheseweg [0080] Die Gene für die Biosynthese des Pigments Violacein befinden sich in einem Operon,das sich aus vioE-, vioD-, vioC-, vioB- und vioA-Genen zusammensetzt. VioA ist eine von FADabhängige L-Trp- Oxidase, die IPA-Imin erzeugt. Letzteres ist das Substrat für VioB, eine Hä-moprotein-Oxidase, die das IPA-Imin in eine Verbindung mit einer bisher nicht bekannten che¬mischen Formel umsetzt (Verbindung X). Bei VioE handelt es sich um ein erst vor kurzem entdecktes einzigartiges Protein, für das bisher keine Homologa charakterisiert wurden und dasein Schlüsselenzym des Violacein- Biosynthesewegs darstellt - seine Wirkung besteht darin,dass es die Verbindung X in Zwischenprodukte umwandelt, die dann von VioD und VioC über¬nommen werden können, bei denen es sich wiederum um von FAD abhängige Monooxygena-sen handelt, die diese Verbindungen zum Erhalt von Violacein hydroxylieren.

Resveratrol-Biosyntheseweg [0081] Bei Resveratrol (3,5,4'-Transhydroxystilben) handelt es sich um ein in Pflanzen produ¬ziertes Polyphenol. Der Resveratrol-Biosyntheseweg besteht aus vier Enzymen: Phenylala-ninammoniumlyase (PAL) und Zimtsäure 4-Hydroxylase (C4H), die durch ein einziges Enzym,die Tyrosinammoniumlyase (TAL), ersetzt werden können, 4- Cumarat:CoA-Ligase (4CL) undStilbensynthase (STS). Die ersten beiden Enzyme, PAL und C4H, wandeln die AminosäurePhenylalanin in p-Cumarsäure (4-Cumarsäure) um. Das dritte Enzym, 4CL, bindet die p-Cumarsäure an die Pantetheingruppe des Coenzyms A (CoA), was zum Erhalte von 4-Cumaroyl-CoA führt. Das abschließende Enzym in diesem Biosyntheseweg, STS, katalysiertdie Kondensation von Resveratrol von einem Molekül 4-Cumaroyl-CoA und drei MolekülenMalonyl-CoA, die aus der Biosynthese von Fettsäuren stammen.

[0082] Im Rahmen der vorliegenden Erfindung werden Enzyme aus bestimmten Biosynthese¬wegen, such wie dem Violacein-, Resveratrol- und Carotenoid-Biosyntheseweg, an NSBF fusi¬oniert, um diese Chimären Proteine räumlich aneinander anzunähern. Durch die sequentielleBindung von Enzymen, so wie gesteuert durch die Programm-Nukleinsäuresequenz, ist eserfindungsgemäß nun möglich, eine spezifische Reihenfolge der enzymatischen Reaktionenfestzulegen. Dadurch werden schnellere und effizientere Reaktionen ermöglicht und es bestehtdes Weiteren die Möglichkeit zur Erzeugung eines neuen Produkts durch die Umordnung einerspezifischen Reihenfolge von Proteinreaktionen (so wird z. B. mit einer Reihenfolge 1-2-3 derEnzyme eine andere Verbindung synthetisiert als mit der Reihenfolge 1-3-2). Die vorliegendeErfindung ist dahingehend vorteilhaft, dass sie die Herstellung von künstlichen Verbindungenmit gewünschten Eigenschaften ermöglicht.

Rekombinante DNA

[0083] Im Rahmen der vorliegenden Erfindung werden molekularbiologische Standardverfahreneingesetzt, die im Stand der Technik allgemein bekannt sind.

[0084] Die erfindungsgemäßen Proteine aus dem Polypeptidmaterial können durch die Expres¬sion von für Proteine kodierender DNA in einem geeigneten Wirtsorganismus synthetisiertwerden. Die für die Proteine kodierende DNA wird in einen geeigneten Expressionsvektor ein¬gebracht. Geeignete Vektoren schließen Plasmide, virale Vektoren und dergleichen ein, sindjedoch nicht auf diese beschränkt. Expressionsvektoren, die mit den Zellen des Wirtsorganis¬mus kompatibel sind, sind im Stand der Technik hinreichend bekannt und schließen die jeweilsgeeigneten Kontrollelemente für die Transkription und Translation von Nukleinsäuresequenzenein.

[0085] Es können Expressionsvektoren zur Expression in prokaryotischen und eukaryotischenZellen konstruiert werden. Zu den prokaryotischen Zellen zählen z. B. Bakterien, insbesondereEscherichia coli. Gemäß der vorliegenden Erfindung werden prokaryotische Zellen zum Erhalteiner ausreichenden Menge an Nukleinsäure verwendet. Ein Expressionsvektor enthält imAllgemeinen die operativ assoziierten Kontrollelemente, die funktionell mit der für das Proteinkodierenden DNA gemäß der vorliegenden Erfindung verknüpft sind. Die Kontrollelemente sindso ausgewählt, dass sie eine effiziente und gewebespezifische Expression induzieren. DerPromotor kann konstitutiv oder induzierbar sein, je nach dem gewünschten Muster der Expres¬sion. Der Promotor kann nativ oder fremden Ursprungs (nicht natürlich in den Zellen vorkom¬mend, in denen er eingesetzt wird) sowie natürlich oder synthetisch sein. Die Auswahl desPromotors hat so zu erfolgen, dass dieser in den Zielzellen des Wirtsorganismus funktioniert.Des Weiteren sind Initiationssignale für die effiziente Translation eines Fusionsproteins einge¬schlossen, welche das Startcodon ATG und die entsprechenden Sequenzen umfassen.

Schließt der im Rahmen der vorliegenden Erfindung verwendete Vektor zwei oder mehr Leser¬ahmen ein, so sollten die Leserahmen jeweils unabhängig voneinander funktionell mit denKontrollelementen verknüpft sein und die Kontrollelemente sollten gleich oder voneinanderverschieden sein, je nach der gewünschten Art der Proteinherstellung.

[0086] Vor einer weiteren Beschreibung der vorliegenden Erfindung wird darauf hingewiesen,dass die vorliegende Erfindung nicht auf spezifische, hierin beschriebene Ausführungsformenbeschränkt ist, die selbstverständlich gegebenenfalls variiert werden können. Des Weiteren wirddarauf hingewiesen, dass die hierin verwendete Terminologie lediglich der Beschreibung be¬stimmter Ausführungsformen dient und nicht als einschränkend zu interpretieren ist, da derUmfang der vorliegenden Erfindung ausschließlich durch die beigefügten Patentansprücheabgegrenzt wird.

[0087] Ist ein Bereich von Werten angegeben, so wird davon ausgegangen, dass jeder zwi¬schen der oberen und der unteren Grenze des Bereichs liegende Wert sowie jeder weiterebeliebige angegebene oder dazwischen liegende Wert innerhalb des angegebenen Bereichs biszu einem Zehntel der Einheit der unteren Grenze in den Umfang der vorliegenden Erfindungeingeschlossen ist, sofern der entsprechende Kontext nicht ausdrücklich etwas anderes besagt.Die oberen und unteren Grenzen dieser kleineren Bereiche können unabhängig voneinander indie kleineren Bereiche eingeschlossen sein und sind ebenfalls von der vorliegenden Erfindungumfasst, unter Vorbehalt ausdrücklich ausgeschlossener Grenzen innerhalb des angegebenenBereichs. Schließt der angegebene Bereich eine oder beide der Grenzen ein, so sind Bereiche,die entweder eine oder beide dieser eingeschlossenen Grenzen ausschließen, ebenfalls in dervorliegenden Erfindung eingeschlossen.

[0088] Sofern nicht anderweitig definiert, haben alle hierin verwendeten technischen und wis¬senschaftlichen Begriffe die Bedeutung, in der sie von einem durchschnittlichen Fachmann aufdem Gebiet der vorliegenden Erfindung verstanden werden. Bei der praktischen Ausführungoder beim Testen der vorliegenden Erfindung können beliebige Verfahren oder Materialienverwendet werden, die den hierin beschriebenen ähnlich oder äquivalent sind, im Folgendenwerden jedoch die bevorzugten Verfahren und Materialien beschrieben. Alle hierin genanntenVeröffentlichungen sind durch Bezugnahme in die vorliegende Erfindung eingeschlossen undoffenbaren und beschreiben die Verfahren und/oder Materialien in dem Zusammenhang, in demdie Veröffentlichungen genannt werden.

[0089] Es sei ferner darauf hingewiesen, dass die hierin sowie in den beigefügten Patentan¬sprüchen im Singular verwendeten unbestimmten und bestimmten Artikel "ein" und"der/die/das", einschließlich aller ihrer grammatikalischen Formen, den jeweiligen Plural eben¬falls einschließen, sofern der jeweilige Kontext dies nicht ausdrücklich ausschließt. So schließtz. B. eine Bezugnahme auf "ein Enzym" eine Vielzahl derartiger Enzyme ein und eine Bezug¬nahme auf "das Gerüst-Polypeptid" schließt eine Bezugnahme auf ein oder mehrere Gerüst-Polypeptide sowie deren im Stand der Technik bekannte Äquivalente ein, und so weiter. DesWeiteren wird darauf hingewiesen, dass die Patentansprüche so verfasst sein können, dass einbeliebiges Element ausgeschlossen ist. Diese Aussage soll als Grundlage für die Verwendungvon ausschließenden Begriffen wie "ausschließlich", "alleinig", "nur" oder dergleichen in Verbin¬dung mit der Aufzählung von Elementen der Patentansprüche bzw. für die Anwendung einer"negativen" Einschränkung dienen.

[0090] Die hierin besprochenen Veröffentlichungen werden nur aufgrund der Tatsache genannt,dass sie bereits vor dem Anmeldetag der vorliegenden Anmeldung offenbart wurden. Nichtshierin ist als Eingeständnis dahingehend auszulegen, dass die vorliegende Erfindung nicht denAnspruch hätte, eine solche Veröffentlichung kraft einer früheren Erfindung vorwegzunehmen.

[0091] Des Weiteren können die genannten Veröffentlichungsdaten von den tatsächlichenVeröffentlichungsdaten abweichen, die gegebenenfalls unabhängig festzustellen sind. BEISPIELE:

KLONIERUNG UND AUFREINIGUNG VON POLYPEPTIDEN

[0092] Die Konstruktion von DNA-Sequenzen für wie vorstehend beschriebene Nukleinsäure bindende Faktoren und Enzyme des Biosynthesewegs oder weitere funktionelle Polypeptideerfolgte auf Grundlage der Aminosäuresequenzen der ausgewählten Proteindomänen unterVerwendung des Tools "Designer" von DNA2.0 Inc. Dieses Tool ermöglicht es dem Benutzer,DNA-Fragmente zu konstruieren und die Expression mittels einer für den betreffenden Orga¬nismus spezifischen Codon-Optimierung für den gewünschten Wirt (z. B. E. coli) zu optimieren.Die Gene wurden von GENEART AG (Im Gewerbepark B32, D-93059 Regensburg) bezogen,mit Restriktionsenzymen verdaut und gemäß der im Stand der Technik bekannten Vorgehens¬weise in einen geeigneten Vektor kloniert, der die geeigneten regulatorischen Sequenzen ent¬hielt. DNA-Sequenzen für gespaltene fluoreszierende Proteine wurden mittels PCR unter Ver¬wendung einer DNA-Sequenz von fluoreszierenden Proteinen als Matrize amplifiziert (Zu¬gangsnummer oder Referenz erforderlich). Die verwendeten Vektoren schließen ein: die kommerziell erhältlichen Vektoren pET, pBluescript, pCD-NA, pSBIA2 (pSBIA2http://partsregistry.Org/Part:pSB1A2) pSB1C3 (http://partsregistry.org/wiki/index.php?title=Part:pSB1C3), pS- B1AK3 (http://partsregistry.org/wiki/index.php?title=Part:PSB1AK3) sowiedie Plasmidvektoren mit niedriger Kopienzahl pSB4K5 (http://partsregistry.Org/Part:pSB4K5)oder pSB4C5 (http://partsregistry.Org/Part:pSB4C5), die alle erforderlichen Merkmale tragen,wie z. B. Antibiotikaresistenz, Replikationsursprung und multiple Klonierungsstelle.

[0093] Zur Herstellung von DNA-Konstrukten wurden molekularbiologische Verfahren ange¬wandt (DNA-Fragmentierung mit Restriktionsenzymen, DNA-Amplifikation unter Anwendungeiner PCR (Polymerase-Kettenreaktion), PCR-Ligation, Detektion der DNA-Konzentration, Aga-rosegelelektrophorese, Aufreinigung von DNA-Fragmenten aus Agarosegels, Ligation von DNA-Fragmenten in einen Vektor, Transformation der chemisch kompetenten Zellen E. coli DH5a,Isolation von Plasmid-DNA mit kommerziell erhältlichen Kits, Screening und Selektionierung).Alle Verfahren wurden unter sterilen Bedingungen durchgeführt (aseptische Technik). Die Cha¬rakterisierung von DNA- Segmenten erfolgte anhand von Restriktionsanalyse und Sequenzie¬rung.

[0094] Verfahren der molekularen Klonierung sind im Stand der Technik hinreichend bekanntsowie in zahlreichen Lehrbüchern der Molekularbiologie ausführlich beschrieben, die demFachmann ebenfalls bekannt sind.

[0095] Die DNA-Konstrukte und entsprechenden Chimären Proteine sind in Tabelle 1 beschrie¬ben. In allen DNA-Konstrukten ist das Startcodon (ATG) vor den Histidin-Tags oder kodieren¬den Regionen angeordnet. Die für die Chimären Proteine kodierenden Konstrukte wurden ent¬weder zur Expression großer Mengen in den Vektor pET19b oder zur Überwachung der Pro¬duktion von Carotenoiden und Violacein in vivo in die Vektoren pSB4K5 bzw. pSB4C5 kloniert.Die Expressionskassette schließt in Richtung vom 5'- zum 3-Ende den T7-Promo- tor, einemultiple Klonierungsstelle für Fusionsprotein und den T7-Terminator ein. Diese regulatorischenElemente ermöglichen die Proteinexpression in der prokaryotischen Zelllinie E. coli, die die T7-RNA-Polymerase trägt.

[0096] Die Herstellung der DNA-Konstrukte erfolgte unter Anwendung von molekularbiologi¬schen Verfahren, wie sie im Wesentlichen in zahlreichen Lehrbüchern der Molekularbiologiebeschrieben und dem Fachmann bekannt sind. Die Transformation von Plasmiden, Konstruktenund Zwischenkonstrukten erfolgte mittels einer chemischen Transformation in das Bakterium E.coli DH5 alpha oder BL21 (DE3) pLysS.

[0097] Es wurden mehrere Konstrukte hergestellt, um die Durchführbarkeit der Produktion derin Tabelle 1 aufgeführten Chimären Proteine zu demonstrieren.

[0098] Die Transformation von Plasmiden, die für offene Leserahmen der in Tabelle 1 aufge¬führten Fusionsproteine (SEQ ID NR: 52 bis SEQ ID NR: 57) kodieren, erfolgte mittels einer chemischen Transformation in kompetente E. coli BL21 (DE3) pLysS-Zellen. AusgewählteBakterienkolonien, die mit einem ausgewählten Antibiotikum (Ampicillin) auf LB-Platten kultiviertworden waren, wurden in 10 ml_ LB-Kulturbrühe inokuliert, die mit dem ausgewählten Antibioti¬kum ergänzt worden war. Im Anschluss an ein mehrstündiges Wachstum bei 37°C wurden 10bis 100 pl der Kultur in 100 ml eines ausgewählten Wachstumsmediums inokuliert und überNacht bei 37 °C unter Schütteln stehen gelassen. Die über Nacht angesetzte Kultur wurde 20bis 50 Mal verdünnt, bis eine OD600 der verdünnten Kultur von zwischen 0,1 und 0,2 erreichtwar. Kulturflaschen mit 500 ml der verdünnten Kultur wurden auf der Schüttelvorrichtung plat¬ziert und die Bakterien wurden bei 25°C oder 30°C oder 37°C so lange kultiviert, bis eine OD6oovon zwischen 0,6 und 0,8 erreicht war; dann wurde die Proteinexpression durch die Zugabe vonInduktor-IPTG (1 mM) eingeleitet. Vier Stunden nach der Induktion wurde die Kulturbrühe zentri¬fugiert und die Bakterienzellen wurden in Lysepuffer (10 mM Tris pH 8,0, 1 M NaCI, 0,1% Des-oxycholat, 0,1 mM Zinksulfat, 10 mM DTT, ergänzt mit einem Proteaseinhibitorcocktail) resus-pendiert und mindestens über Nacht bei -80°C eingefroren. Die aufgetaute Zellsuspensionwurde durch Beschallung lysiert und im Anschluss zentrifugiert. Das Präzipitat (Zellmembranen,Einschlusskörperchen) und der Überstand wurden unter Verwendung von SDS-PAGE undWestern-Blot hinsichtlich der Expression der erfindungsgemäß hergestellten Konstrukte unter¬sucht, nötigenfalls unter Verwendung von anti-His-Tag-Antikörpern als primäre Antikörper. Diekonstruierten Fusionsproteine waren vorwiegend im nicht löslichen Teil (Einschlusskörperchen)zu finden, der sich zu mehr als 80% aus dem ausgewählten Protein zusammensetzte. DieEinschlusskörperchen wurden zwei Mal mit Lysepuffer, zwei Mal mit 1 M Harnstoff in 10 mMTris pH 8,0 und zwei Mal mit 2 M Harnstoff in 10 mM Tris pH 8,0 gewaschen. Üblicherweiseführte diese Behandlung zu einer Proteinreinheit von mehr als 95%. Aufgereinigte Einschluss¬körperchen wurden in 8 M Harnstoff in 50 mM Tris pH 8,0 gelöst. Die Proteine wurden mit 8 MHarnstoff in 50 mM Tris pH 8,0 und 250 mM Imidazol eluiert. Die Proteinrückfaltung erfolgtemittels einer Dialyse gegen Puffer enthaltend 50 mM Tris pH 8,0, 500 mM NaF, 500 μΜ ZnSC>4,5 mM DTT, 0, 005 % Tween und 10 % Glycerin. Die Dialyse wurde mindestens zwei Mal für 12h bei 4°C ohne Mischen durchgeführt. Nach dem Abschluss des Prozesses wurde das Dialysatvorsichtig aus den Dialyseröhrchen entnommen und in Zentrifugenröhrchen überführt. Nichtrückgefaltetes Protein präzipitierte und wurde mittels Zentrifugation bei 10.000 rpm von demrückgefalteten Protein in der löslichen Phase getrennt. Die Bestimmung der Proteinkonzentrati¬on erfolgte unter Verwendung eines Spektrophotometers sowie des Bradford-Proteinassaysund die Größe der Proteine wurde mittels SDS-PAGE/Coomassie-Färbung und Western-Blot-Analyse unter Einsatz von anti-His-Antikörpern bestimmt.

[0099] Tabelle 1 : Zusammensetzung von Plasmiden, die zur Veranschaulichung der vorlie¬genden Erfindung hergestellt wurden.

BINDUNG EINES BINDUNGSFAKTORS AN EIN ZIELNUKLEINSÄUREELEMENTß-Galactosidase-Enzym-Assay [00100] Die Inkubation von Bakterienkulturen, die die in Tabelle 1 aufgeführten Plasmidkon¬strukte trugen, erfolgte in 10 ml LB-Kulturbrühe, ergänzt mit 5 μΙ IPTG (1 M) (Isopropyl-ß-D-thiogalactosid) und ansteigenden Konzentrationen von (0%, 0,0025%, 0,1% und 1%) L-Arabinose, auf einem Rotationsschüttler für 18 Stunden bei 37 °C und 180 rpm. Die Bakterien¬dichte wurde anhand der optischen Dichte (OD6oo ) bestimmt. Die Messungen der Aktivität derß-Galactosidase erfolgten in einem ELISA-Lesegerät, das auf 28°C vorgeheizt worden war. 5 gleiner jeden Kultur wurden in die Wells einer 96- Well-Mikrotiterplatte mit transparentem Bodenüberführt und es erfolgte die Zugabe von 100 gl Z-Puffer mit Chloroform (Z-Puffer: 0,06 MNa2HP04 x 7 H20, 0, 04 M NaH2P04 x H20, 0,1 M KCl, 0,001 M MgS04 x 7 H20, pH 7; Z-Puffermit Chloroform: Z-Puffer, 1% ß-Mercaptoethanol, 10% Chloroform). Die Lyse der Bakterienzel¬len erfolgte durch die Zugabe von 50 gl Z-Puffer mit SDS (Z-Puffer, 1,6% SDS), gefolgt voneiner Inkubation für 10 min bei 28°C. In jedes Well wurden 50 gl einer 0,4%-igen ONPG-Lösungin Z-Puffer zugegeben und die Veränderungen der OD405 wurden über einen Zeitraum von 20min in Intervallen von 30 sec gemessen.

ERGEBNISSE

[00101] Um zu testen, ob es in vivo zu einer Bindung von NSBF (Zinkfinger Zif268, Blues,PBSII, HivC) oder His-Nictal an ein entsprechendes spezifisches Nukleinsäureziel kommt,wurde im Rahmen der vorliegenden Erfindung ein Reportersystem konstruiert. Der Reporter enthält ein Plasmid, das sich aus a) lacZ unter einem synthetischen Promotor, der eine DNA-Bindungsstelle für das bestimmte untersuchte DNA bindende Protein enthält, und b) einementsprechenden DNA bindenden Protein unter der Kontrolle des Arabinose-Promotors zusam¬mensetzt. Die erfolgreiche Bindung des NSBF an den synthetischen Promotor würde die Tran¬skription von lacZ verhindern, was wiederum eine verringerte Aktivität der ß-Galactosidase zurFolge hätte. Es wurden E. coli-Kulturen, die Plasmide für verschiedene NSBF enthielten, überNacht in LB-Medium kultiviert, das mit ansteigenden Konzentrationen von Arabinose ergänztwurde. Die Aktivität der ß-Galactosidase wurde gemäß der Beschreibung im Text gemessen. Inallen getesteten Konstrukten nahm die Aktivität der ß-Galactosidase mit ansteigenden Konzent¬rationen von Arabinose ab, was darauf schließen lässt, dass die NSBF (Tabelle 1) in vivo andas Zielnukleinsäureelement innerhalb des synthetischen Promotors binden (Figur 3A). DesWeiteren kam es in der Gegenwart einer Fehlpaarung zwischen dem NSBF und der DNA-Zielsequenz (es wurden z. B. jeweils das Blues-Zielelement - blues_0 mit dem PBSII-Ziel-element PBSIl_0 und das HivC_0-Zielelement mit dem Gli_0-Zielelement vertauscht) zu keinerBeeinträchtigung der Aktivität der ß- Galactosidase, was die Spezifität des Testsystems gemäßder vorliegenden Erfindung bestätigt (Figur 3B).

Oberflächenplasmonresonanz (SPR) [00102] Die SPR-Analyse wurde auf dem Gerät Biacore T100 (GE Healthcare) durchgeführt.Ein Serie S Sensorchip SA (GE Healthcare) wurde mit einer biotinylierten einzelsträngigenDNA-Sonde bei einer Konzentration von 100 nM immobilisiert, bis eine abschließende Reaktionvon etwa 300 RU erreicht war. Die Hybridisierung von komplementärer DNA (Programm-DNA-Sequenz mit Bindungsstellen für die Zinkfinger HivC, Zif268, JAZZ, Blues, PBS, Gli1) erfolgtemittels einer Injektion von zwischen 0,5 und 2 μΜ in Laufpuffer (10 mM HE- PES, 150 mMNaCI, 0,1 mM EDTA, 0, 005% P20, pH 7,4) für bis zu 300 s, um die abschließende Reaktionvon etwa 300 RU zu erzielen. Die Bindung von Analyten wurde anhand der Injektion von unter¬schiedlichen Konzentrationen über 1 min im Anschluss an die Dissoziation detektiert, die übereinen Zeitraum von 5 min beobachtet wurde. Die Regeneration der Oberfläche wurde mittelszweier 30-sekündiger Injektionen von 50 mM NaOH und einer 24-sekündigen Injektion von0,5% SDS erreicht. Im Anschluss hieran wurde die neue DNA injiziert, um eine frische Bin¬dungsoberfläche zu erhalten.

[00103] Die Immobilisierung des Serie S Sensorchips CM5 (GE Healthcare) erfolgte gemäßden Anweisungen des Herstellers mit 3000 RU Avidin über eine Aminkopplung. Die carboxyme-thylierte Oberfläche des CM5 Chips wurde mittels einer 7-minütigen Pulsinjektion von NHS:EDCin einem Verhältnis von 1:1 aktiviert. Dann erfolgte die Injektion von Avidin in Na-Acetat pH 5,5in Form einiger kurzer Pulse, um eine Reaktion von 3000 RU zu erzielen. Das Avidin war nur andie zweite Durchflusszelle gekoppelt, während die erste Durchflusszelle als Referenzoberflächediente, um die nicht spezifische Bindung von Analyten an die Dextranmatrix auf einem Sen¬sorchip zu subtrahieren. Die Stellen auf der Sensoroberfläche, an denen keine Reaktion erfolgtwar, wurden mit einem 7-minütigen Injektionspuls von 1 M Ethanolamin (pH 8,5) blockiert. ERGEBNISSE: [00104] Die in vitro Bindung von Chimären Proteinen, Biosyntheseenzymen, die an NSBF aufder Programm-DNA gekoppelt sind (Figur 4). Figur 4A zeigt die Bindung von Programm-DNA,die Bindung von chimärem Protein enthaltend den GN1-NSBF und die Regeneration des Trä¬gers. Die Hybridisierung von DNA erfolgte mittels einer Injektion von zwischen 0,5 und 2 μΜ fürbis zu 300 s, um die abschließende Reaktion von 300 RU zu erzielen. Die Bindung von Analy¬ten wurde im Anschluss an eine 5-minütige Dissoziation anhand der Injektion von unterschiedli¬chen Konzentrationen über 1 min detektiert. Die Regeneration wurde mittels zweier 30-sekündiger Injektionen von 50 mM NaOH und einer 24-sekündigen Injektion von 0,5% SDSerreicht.

[00105] Figur 4B zeigt die Bindung von Analyten an Programm-DNA; frische DNA wurde fürjedes der Proteine eingefangen. Die Analyten von oben her sind: GN1, Zif268, BLUES, ZNFJHIVC, PBSII und JAZZ.

[00106] Die sequentielle Bindung von NSBF auf der Programm-DNA ist in Figur 4C gezeigt.DNA wurde jeweils zu Beginn des Zyklus eingefangen und die Injektion der Proteine erfolgteüber 1 Minute nacheinander in 2 unterschiedlichen Sequenzen: durchgezogene Linie: Znf_Jazz,Znf_Blues, Znf_Zif268, Znf_PBSII, Znf_HivC und Znf_Glil; gestrichelte Linie: Znf_Glil,Znf_PBSII, Znf_HivC, Znf_Jazz, Znf_Blues und Znf_Zif268. Anhand der Bindung aller Analytenin der Abfolge wurde gezeigt, dass die Bindung der Analyten schwächer war, wenn GIM alserstes Protein injiziert wurde. EMSA - elektrophoretischer Mobilitäts-Shift-Assay [00107] Die spezifische DNA-Bindung von synthetischen Zinkfingerdomänen an die Programm-Nukleinsäure wurde unter Anwendung eines elektrophoretischen Mobilitäts-Shift-Assays getes¬tet. 1 pg der aufgereinigten Proteine wurde für 3 Stunden mit ansteigenden Mengen an Pro¬gramm-Nukleinsäure inkubiert, d. h. mit 500 ng, 750 ng und 1000 ng. Die Proben wurden mitLaborwasser mit hohem Reinheitsgrad auf 20 pl verdünnt, auf ein 2,0% Agarosegel geladen,das zuvor mit Ethidiumbromid gefärbt worden war, und bei 7 0 V für 4 0 Minuten laufen gelas¬sen. Die Detektion von Nukleinsäure-Protein-Komplexen erfolgte unter UV-Licht. ERGEBNISSE: [00108] Die Migration von mit Ethidiumbromid gefärbter Programm-Nukleinsäure war abhängigvon der Gegenwart von NSBF (d. h. der DNA bindenden Zinkfingerdomäne), was zu einerlangsameren Migration führte als bei der alleinigen Verwendung von Programm-Nukleinsäure(Figur 5). Diese Daten belegen die Bindung von NSBF an eine spezifische Zielsequenz inner¬halb eines DNA-Programms (Figur 5).

Konfokalmikroskopie [00109] Zur Detektion von Chimären, gespaltenen, fluoreszierenden Proteinen (z. B. NSBFgekoppelt an nCFP, NSBF gekoppelt an cCFP) sowie zur FRET-Rekonstitution auf einem Nuk¬leinsäureprogramm in vivo wurde das konfokale Lasermikroskop Leica TCS SP5 verwendet.Transfizierte HEK293-Zellen, die über Nacht bei 37°C auf einem 8-Well- Mikroskopträger kulti¬viert worden waren, wurden auf einer Objektivlinse platziert, auf der sich ein Tropfen Immersi¬onsöl befand. Die Anregung der Zellen erfolgte bei 433 nm für das CFP und 515 nm für dasYFP. Die Detektion des FRET erfolgte gemäß der durch die Software des Herstellers zur Verfü¬gung gestellten Vorgehensweise (die Assistenten FRET AB und FRET SE der Leica LAS AFComputersoftware).

Split, FRET-Experimente [00110] HEK293-Zellen wurden unter Verwendung des jetPEI™ Transfektionsreagenzproto-kolls mit Säuger-Expressionsvektoren, die gespaltene fluoreszierende Fusionsproteine unterder Kontrolle des CM- V-Promotors trugen, transfiziert und abschließend mit 4% Paraformalde¬hyd fixiert. Die Rekonstitution von gespaltenen fluoreszierenden Proteinen ebenso wie derFRET-Effekt wurden unter einem konfokalen Mikroskop beobachtet (siehe den Abschnitt "Kon¬fokalmikroskopie", supra). Das CFP (Znf_Gli1-Peptidlinker-nCFP und cCFP- Peptidlinker-Znf_HivC) und das YFP (Znf_PBSII-Peptidlinker-nYFP und cYFP-Peptidlinker-Znf_Zif268)wurden nur in Gegenwart einer spezifischen, nicht jedoch einer zufällig zusammengesetzten,Programm-Nukleinsäure rekonstituiert. ERGEBNISSE: [00111] Gespaltene fluoreszierende Proteine binden an benachbarte Zielnukleotidsequenzen,wenn Plasmide, die gespaltene fluoreszierende Proteinfusionen tragen, mit einem Plasmidkotransfiziert sind, das eine Ziel-Programm-Nukleinsäure trägt. Da gespaltene fluoreszierendeProteine in vivo nicht zu der zufälligen Bildung eines voll ausgebildeten Chromophors in derLage sind, entsteht das Fluoreszenzsignal als Folge der Spaltung von Protein-Zinkfinger-Fusionen, die an eine DNA Programm-Nukleinsäuresequenz gebunden sind.

[00112] Rekonstitution von gespaltenem GFP. Figur 6 zeigt die in vivo Rekonstitution von zweinicht funktionellen Fluorophoren (gespaltenen GFP), die nur in der Gegenwart einer Programm-Nukleinsäuresequenz an NSBF gekoppelt werden (Figur 6A).

[00113] Es wurden jeweils 75 ng an Plasmiden, die Znf_Glil-Peptidlin- ker-nCFP und cCFP-Peptidlinker-Znf_HIVC trugen, mit 350 ng an Programm-DNA in HEK293-Zellen kotransfiziert.Die Detektion des Emissionssignals des Cyan fluoreszierenden Proteins erfolgte mittels einerAnregung der Zellen mit 433 nm Laserlicht (Figur 6B).

[00114] Es wurden jeweils 75 ng an Plasmiden, die Fusionen des gespaltenen gelb fluoreszie¬renden Proteins (YFP) trugen (Znf_PBSII_Pep- tidlinker-nYFP und cYFP-Peptidlinker-Znf_Zif268) mit 350 ng an Programm-DNA kotransfiziert. Das Emissionssignal des YFP miteinem Spitzenwert bei 529 nm wurde unter einem konfokalen Mikroskop detektiert (Figur 6C).

[00115] Rekonstitution von gespaltenem GFP in vitro. HEK293-Zellen wurden jeweils mitZnf_Glil-Peptidlinker-nCFP, cCFP-Peptidlin- ker-Znf_HivC und Znf_PBSII-Peptidlinker-nYFP,cYFP-Peptidlinker-Z- nf_Zif268 kotransfiziert. Die Lyse der Zellen erfolgte nach 72 Stunden in150 pl passivem Lysepuffer von Promega und im Anschluss wurden 50 pg der Programm-Nukleinsäure eingebracht. Unter Verwendung des Lumineszenzspektrometers LS55 von PerkinEimer wurde ein funktionelles Fluorophor detektiert, nachdem die Zelllysate für 18 h bei 4°C mitdem DNA-Programm inkubiert worden waren.

[00116] FRET-Effizienz. Die FRET-Effizienz von vier Chimären Proteinen, gespaltenen GFP inVerknüpfung mit NSBF in der Gegenwart von Programm-DNA, ist in Tabelle 2 gezeigt. DerFRET wurde unter Verwendung des Assistenten FRET AB der mit dem konfokalen Lasermikro¬skop TCS SP5 von Leica mitgelieferten LAS AF Software gemessen. Die Emissionssignale inden CFP- und YFP-Kanälen wurden angepasst. Der Akzeptor wurde bei 515 nm mit Laserphotogebleicht und es erfolgte daraus eine Berechnung der FRET-Effizienz innerhalb des pho¬togebleichten Bereichs. HEK293-Zellen wurden mit Programm-DNA und Znf_Glil-Peptidlinker-nCFP, cCFP-Peptidlinker-Znf_HIVC, Znf_PBSII-Peptidlinker-nYFP sowie Znf_cYFP-Peptidlin-ker-Znf_Zif2 68 transfiziert. Als negative Kontrolle wurden Zellen mit cytosolischem CFP undYFP ohne DNA bindende Faktoren transfiziert und als positive Kontrolle wurden Zellen mit CFPtransfiziert, das über einen Peptidlinker mit YFP verknüpft war.

[00117] Tabelle 2: Die FRET-Effizienz von vier gespaltenen GFP, die jeweils mit einem unter¬schiedlichen DNA bindenden Faktor verknüpft sind.

Synthese von Violacein [00118] Über Nacht angesetzte Kulturen von E. coli, die Plasmide enthielten, die für die Chimä¬ren Proteine kodierten (siehe Tabelle 1, Konstrukt-Kombination Znf_Blues-Peptidlinker-vioA,Znf_Zif268-Pep- tidlinker-vioB, Znf_PBSII-Peptidlinker-vioE, Znf_HivC-Peptidlinker-vioD,Znf_Glil-Peptidlinker-vioC), entweder mit oder ohne Plasmid, das für das Nukleinsäurepro¬gramm kodierte (siehe Tabelle 1, Programm-Biosynthese (123456) oder Programm-Biosynthe¬se (341256)), wurden in frischer Luria-Bertani-Brühe bis zu einer OD6oo von 0,05 verdünnt undbei 30°C in der Gegenwart geeigneter Antibiotika kultiviert. Zu verschiedenen Zeitpunkten wur¬den Proben entnommen (3 ml insgesamt). Der repräsentative Zeitpunkt (17,5 h) ist in Figur 9gezeigt. Die Lyse der Bakterien erfolgte durch die Zugabe eines identischen Volumens (1,5 ml)an 10% SDS und Violacein wurde mit Ethylacetat (1:1 vol/vol) extrahiert. Nach kurzem Vortexenwurde die organische Phase gesammelt und das Absorptionsspektrum bei 575 nm wurde ge¬messen. Die Proben wurden mittels TLC analysiert und es erfolgte die quantitative Bestimmungvon Violacein mittels Densitometrie bei 575 nm, nachdem die Spektren direkt auf den HPTLC-

Platten gescannt worden waren. Violacein wurde ebenfalls mittels Massenspektrometrie identi¬fiziert. Es erfolgte ein Vergleich der Mengen an Violacein, die jeweils mit dem Nukleinsäurepro¬gramm, ohne das Nukleinsäureprogramm oder in der Gegenwart eines nicht gerichteten Nukle¬insäureprogramms produziert wurden (Figur 9).

[00119] Wenngleich die vorliegende Erfindung unter Bezugnahme auf deren spezifische Aus¬führungsformen beschrieben wurde, so ist es für den Fachmann dennoch selbstverständlich,dass verschiedene Änderungen vorgenommen werden und Äquivalente eingesetzt werdenkönnen, ohne damit vom Grundgedanken und Umfang der vorliegenden Erfindung abzuwei¬chen. Darüber hinaus können zahlreiche Modifikationen vorgenommen werden, um eine be¬stimmte Situation, ein bestimmtes Material, eine bestimmte Stoffzusammensetzung, einenbestimmten Prozess sowie einen oder mehrere bestimmte Prozessschritte an den Gegenstand,Grundgedanken und Umfang der vorliegenden Erfindung anzupassen. Derartige Modifikationengelten als vom Schutzumfang der beigefügten Patentansprüche umfasst.

SEQUENZAUFLISTUNG

<110> KEMIJSKI INSTITUT

EN-FIST CENTER OOLICNOSTI <120> verbesserte Synthese eines biosynthetischen Produkts mit einerangeordneten Zusammensetzung der biosyntethisehen Enzyme aufeinem Nukleotidsequenzmotiv <130> R 63917 <160> 82 <170> Patentin version 3.4 <210> 1<211> 531

<212> DNA <213> künstliche Sequenz<220> <223> znf-Glil<220> <221> CDS<222> ¢1)..(531) <223> Znf-Glil <400> 1 atg aag egt gag cct gaa tet gtg tat gaa act gac tgc egt tgg gat 48

Met Lys Arg Glu pro Glu Ser val Tyr Glu Thr Asp Cys Arg Trp Asp 1 5 10 15 ggc tgt agc cag gaa ttt gac tcc caa gag cag ctg gtg cac cac atc 96

Gly Cys Ser Gin Glu Phe Asp 5er Gin Glu Gin Leu val His His Ile 20 25 30 aac agc gag cac atc cac ggg gag egg aag gag ttc gtg tgc cac tgg 144

Asn ser Glu His ile His Gly Glu Arg Lys Glu Phe val Cys His Trp 35 40 45 ggg ggc tgc tcc agg gag ctg agg ccc ttc aaa gcc cag tac atg ctg 192

Gly Gly Cys Ser Arg Glu Leu Arg Pro Phe Lys Ala Gin Tyr Met Leu 50 55 60 gtg gtt cac atg ege aga cac act ggc gag aag cca cac aag tgc aeg 240

Val Val His Met Arg Arg His Thr Gly Glu Lys Pro His Lys Cys Thr 65 70 75 80 ttt gaa ggg tgc egg aag tea tac tea ege ctc gaa aac ctg aag aeg 288

Phe Glu Gly Cys Arg Lys Ser Tyr Ser Arg Leu Glu Asn Leu Lys Thr 85 90 95 cac ctg egg tea cac aeg ggt gag aag cca tac atg tgt gag cac gag 336

His Leu Arg Ser His Thr Gly Glu Lys Pro Tyr Met Cys Glu His Glu 100 105 110 ggc tgt agt aaa gcc ttc agc aat gcc agt gac ega gcc aag cac cag 384

Gly cys Ser Lys Ala Phe Ser Asn Ala ser Asp Arg Ala Lys His Gin 115 120 125 aat egg acc cat tcc aat gag aag ccg tat gta tgt aag ctc cct ggc 432

Asn Arg Thr His ser Asn Glu Lys Pro Tyr val Cys Lys Leu Pro Gly 130 135 140 tgc acc aaa ege tat aca gat cct agc teg ctg ega aaa cat gtc aag 480

Cys Thr Lys Arg Tyr Thr Asp Pro ser Ser Leu Arg Lys His val Lys 145 150 155 160 aca gtg cat ggt cct gac gcc cat gtg acc aaa egg cac cgt gqg gat 528

Thr val His Gly Pro Asp Ala His Val Thr Lys Arg His Arg Gly Asp165 170 175 taa 531 <210> 2<211> 176

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 2

Met Lys Arg Glu Pro Glu Ser Val Tyr Glu Thr Asp Cys Arg Trp Asp15 10 15

Gly Cys Ser Gin Glu Phe Asp Ser Gin Glu Gin Leu val His His Ile20 25 30

Asn Ser Glu His Ile His Gly Glu Arg Lys Glu Phe Val cys His Trp35 40 45

Gly Gly Cys Ser Arg Glu Leu Arg Pro phe Lys Ala Gin Tyr Met Leu50 55 60 val Val His Met Arg Arg His Thr Gly Glu Lys Pro His Lys Cys Thr 65 70 75 80

Phe Glu Gly cys Arg Lys 5er Tyr Ser Arg Leu Glu Asn Leu Lys Thr 85 90 95

His Leu Arg Ser His Thr Gly Glu Lys Pro Tyr Met Cys Glu His Glu100 105 110

Gly Cys ser Lys Ala Phe Ser Asn Ala Ser Asp Arg Ala Lys His Gin115 120 125

Asn Arg Thr His Ser Asn Glu Lys Pro Tyr val Cys Lys Leu Pro Gly130 135 140

Cys Thr Lys Arg Tyr Thr Asp Pro Ser Ser Leu Arg Lys His Val Lys 145 150 155 160

Thr val His Gly Pro Asp Ala His val Thr Lys Arg His Arg Gly Asp 165 170 175 <210> 3 <211> 258

<212> DNA <213> künstliche Sequenz<220>

<223> znf-HivC <220> <221> CDS<222> CD--¢258)

<223> Znf-HivC <400> 3 atg ccc ttc cag tgt cgc att tgc atg egg aac ttt teg etc agg aeg 48

Met Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe Ser Leu Arg Thr 15 10 15 gac ett gac agg cat ace cgt act cat acc ggt gaa aaa ccg ttt cag 96

Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gin 20 25 30 tgt egg ate tgt atg ega aat ttc tcc etc age cag acc ttg cgc cgc 144

Cys Arg lie Cys Met Arg Asn phe Ser Leu Ser Gin Thr Leu Arg Arg 35 40 45 cat eta cgt aeg cac acc gqc gag aag cca ttc caa tgc ega ata tgc 192

His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin Cys Arg lie Cys 50 55 60 atg cgc aac ttc agt etc agg age aac ctg ggg egg cac eta aaa acc 240

Met Arg Asn Phe Ser Leu Arg Ser Asn Leu Gly Arg His Leu Lys Thr 65 70 75 80 cac aca gga gaa aaa taa 258

His Thr Gly Glu Lys85 <210> 4<211> 85

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt <400> 4

Met Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg Thr15 10 15

Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gin20 25 30

Cys Arg lie Cys Met Arg Asn Phe Ser Leu Ser Gin Thr Leu Arg Arg35 40 45

His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin Cys Arg Ile Cys50 55 60

Met Arg Asn Phe Ser Leu Arg Ser Asn Leu Gly Arg His Leu Lys Thr65 70 75 80

His Thr Gly Glu Lys85 <210> 5 <211> 270

<212> DNA <213> künstliche Sequenz<220> <2 2 3> 2nf-Zif268<220> <221> CDS<222> CD·· ¢270) <223> Znf-Zif268 <400> 5 atg ccg ggt gaa aaa ccg tat gca tgt ccg gtt gaa agc tgt gat egt 48

Met pro Gly Glu Lys pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg 15 10 15 egt ttt agc egt agt gat gaa ctg acc egt cat att egt att cat aca 96

Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr 20 25 30 ggt cag aaa ccg ttt cag tgt egt att tgc atg egt aat ttt agc egt 144

Gly Gin Lys Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe Ser Arg 35 40 45 tea gat cat ctg acc acc cat att egt acc cat act ggc gaa aaa ccg 192

Ser Asp His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro 50 55 60 ttt gcc tgt gat att tgt ggt egt aaa ttt gca egt tcc gat gaa egt 240

Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg 65 70 75 80 aaa ege cat acc aaa att cat aeg ggt taa 270

Lys Arg His Thr Lys Ile His Thr Gly85 <210> 6<211> 89

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 6

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Val Glu ser Cys Asp Arg15 10 15

Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr20 25 30

Gly Gin Lys Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Arg35 40 45

Ser Asp His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys pro50 55 60

Phe Ala cys Asp Ile Cys Gly Arg Lys Phe Ala Arg ser Asp Glu Arg65 70 75 80

Lys Arg His Thr Lys Ile His Thr Gly 85 <210> 7

<211> 288<212> DNA <213> künstliche Sequenz<220> <223> 2nf-3azz<220>

<221> CDS <222> (1)..(288) <223> Znf-Jazz <400> 7 atg gca agt gat gat cgt ccg tat gca tgt ccg gtt gaa age tgt gat 48

Met Ala ser Asp Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp 15 10 15 cgt cgt ttt age cgt agt gat gaa ctg acc cgt cat att cgt att cat 96

Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg lie His 20 25 30 aca gat cag aaa cct ttt cag tgt cgt att tgc atg cgt aat ttt age 144

Thr Gly Gin Lys Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser 35 40 45 tea aga gat gtt ctg cgt cgt cat aat cgt acc cat aeg ggt gaa aaa 192

Ser Arg Asp Val Leu Arg Arg His Asn Arg Thr His Thr Gly Glu Lys 50 55 60 ccg ttt gca tgt gat att tgc ggt cgt aaa ttt gca agt cgt gac gtg 240

Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala ser Arg Asp val 65 70 75 80 ctg cgt ege cat aac ege att cat ctg cgt cag aat gat ctg gaa taa 288

Leu Arg Arg His Asn Arg lie His Leu Arg Gin Asn Asp Leu Glu 85 90 95 <210> 8<211> 95

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 8

Met Ala Ser Asp Asp Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp15 10 15

Arg Arg Phe Ser Arg ser Asp Glu Leu Thr Arg His Ile Arg lie His20 25 30

Thr Gly Gin Lys Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe Ser35 40 45

Ser Arg Asp val Leu Arg Arg His Asn Arg Thr His Thr Gly Glu Lys50 55 60 pro Phe Ala Cys Asp He Cys Gly Arg Lys Phe Ala Ser Arg Asp val65 70 75 80

Leu Arg Arg His Asn Arg Ile His Leu Arg Gin Asn Asp Leu Glu85 90 <210> 9 <211> 264

<212> DNA <213> künstliche Sequenz<220> <223> Znf-PSBII<220> <221> CDS<222> (1)..¢264) <223> znf-PSBii <400> 9 ^ atg ccg ggt gaa aaa ccg tat gca tgt cct gaa tgt gat aaa age ttt 48

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Glu Cys Gly Lys ser Phe 15 10 15 age cag egt gca aat ctg cgt gca cat cag cgt acc cat aca ggt gaa 96

Ser Gin Arg Ala Asn Leu Arg Ala His Gin Arg Thr His Thr Gly Glu 20 25 30 aag cct tat aaa tgc cca gaa tgc gqc aaa age ttt tea cgt age gat 144

Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp 35 40 45 cat ctg acc acc cat cag ege aca cat act ggc gag aaa cct tac aaa 192

His Leu Thr Thr His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 50 55 60 tgt cca gag tgt ggt aaa tea ttt age cgt agt gat gtt ctg gtt cgt 240

Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Val Leu val Arg 65 70 75 80 cat cag aga acc cac aeg ggt taa 264

His Gin Arg Thr His Thr Gly85 <210> 10<2U> 87

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 10

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Glu Cys Gly Lys Ser Phe15 10 15 ser Gin Arg Ala Asn Leu Arg Ala His Gin Arg Thr His Thr Gly Glu20 25 30

Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp35 40 45

His Leu Thr Thr His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys50 55 60

Cys Pro Glu Cys Gly Lys Ser Phe ser Arg Ser Asp val Leu Val Arg65 70 75 80

His Gin Arg Thr His Thr Gly85

<210> 11<211> 288<212> DNA <213> künstliche Sequenz<220> <223> Znf-Blues<220>

<221> CDS <222> (1)..(288) <22 3> Znf-Blues <400> 11 atg gca agt gat gat cgt ccg tat gca tgt ccg gtt gaa age tgt gat 48

Met Ala ser Asp Asp Arg Pro Tyr Ala cys Pro val Glu ser cys Asp 15 10 15 cgt cgt ttt age cgt cgt gat gtt ctg atg aat cac att cgt att cac 96

Arg Arg Phe Ser Arg Arg Asp Val Leu Met Asn His Ile Arg Ile His 20 25 30 aca ggt cag aaa ccg ttt cag tgt cgt att tgc atg cgt aat ttt age 144

Thr Gly Gin Lys Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser 35 40 45 cgt age gat cat ctg acc acc cat att cgt acc cat aca ggt gaa aaa 192

Arg Ser Asp His Leu Thr Thr His lie Arg Thr His Thr Gly Glu Lys 50 55 60 ccg ttt gca tgt gat att tgc ggt ege aaa ttt gca aat cgt gat acc 240

Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg Asp Thr 65 70 75 80 ctg acc cgt cat age aaa att cat ctg cgt cag aat gat ctg gaa taa 288

Leu Thr Arg His Ser Lys lie His Leu Arg Gin Asn Asp Leu Glu 85 90 95

<210> 12<211> 95<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 12

Met Ala Ser Asp Asp Arg Pro Tyr Ala Cys Pro val Glu Ser Cys Asp15 10 15

Arg Arg Phe Ser Arg Arg Asp Val Leu Met Asn His Ile Arg lie His20 25 30

Thr Gly Gin Lys Pro Phe Gin Cys Arg Ile cys Met Arg Asn Phe ser 35 40 45

Arq ser Asp His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys50 55 60

Pro Phe Ala Cys Asp lie Cys Gly Arg Lys phe Ala Asn Arg Asp Thr65 70 75 80

Leu Thr Arg His Ser Lys lie His Leu Arg Gin Asn Asp Leu Glu85 90 95 <210> 13

<211> 288<212> DNA <213> künstliche Sequenz<220> <223> Znf-Tyr <220> <221> CDS<222> CD--C288) <223> znf_Tyr <400> 13 atg gaa aaa ccg tat aaa tgt cct gaa tgc ggc aaa age ttt age cag 48

Met Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gin 15 10 15 age age aat ctg gca cgt cat cag cgt acc cat aca ggt gaa aaa cct 96

Ser ser Asn Leu Ala Arg His Gin Arg Thr His Thr Gly Glu Lys Pro 20 25 30 tac aaa tgc cct gag tgt ggt aaa age ttt tea cgt age gat cat ctg 144

Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg ser Asp His Leu 35 40 45 acc aaa cat cag ege aca cat act ggc gag aaa cca ttt aaa tgc cca 192

Thr Lys His Gin Arg Thr His Thr Gly Glu Lys pro Phe Lys Cys pro 50 55 60 gaa tgt ggg aaa tea ttt age cag tea agt aat ctg get ege cat caa 240

Glu Cys Gly Lys Ser Phe Ser Gin ser ser Asn Leu Ala Arg His Gin 65 70 75 80 aga aeg cat aeg ggt ggt ggt age ggt ggt ggt tea ggt ggt agt taa 288

Arg Thr His Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 85 90 95 <210> 14

<211> 95<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 14

Met Glu Lys Pro Tyr Lys cys Pro Glu Cys Gly Lys ser Phe Ser Gin 15 10 15

Ser Ser Asn Leu Ala Arg His Gin Arg Thr His Thr Gly Glu Lys Pro20 25 30

Tyr Lys cys Pro Glu cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu35 40 45

Thr Lys His Gin Arg Thr His Thr Gly Glu Lys Pro Phe Lys cys Pro50 55 60

Glu Cys Gly Lys Ser Phe Ser Gin Ser Ser Asn Leu Ala Arg His Gin65 70 75 80

Arg Thr m's Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser85 90 95 <210> 15 <211> 1710

<212> DNA <213> künstliche Sequenz<220> <22 3> NicTAL<220> <221> CDS<222> ¢1)..(1710)

<223> Nie TAL <400> 15 atg ggt ccg cct ctg caa ctg gat aca ggt cag ctg ctg aaa att gca 48

Met Gly Pro Pro Leu Gin Leu Asp Thr Gly Gin Leu Leu Lys Ile Ala 15 10 15 aaa egt ggt ggt gtt acc gca gtt gaa gca gtt cat gca tgg egt aat 96

Lys Arg Gly Gly Val Thr Ala val Glu Ala val His Ala Trp Arg Asn 20 25 30 gca ctg aca ggt gca ccg ctg aat ctg aca ccg gaa cag gtt gtt gca 144

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gin Val val Ala 35 40 45 att gca age cat gat ggt ggt aaa cag gca ctg gaa acc gtt cag egt 192

Ile Ala Ser His Asp Gly Gly Lys Gin Ala Leu Glu Thr val Gin Arg 50 55 60 ctg ctg ccg gtt ctg tgt cag gca cat ggt ctg acc cct gaa cag gtg 240

Leu Leu Pro Val Leu cys Gin Ala His Gly Leu Thr Pro Glu Gin val 65 70 75 80 gtg gcc att gcc agt aat ggt ggt ggc aaa cag geg tta gaa aca gtg 288 val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gin Ala Leu Glu Thr Val 85 90 95 cag ege ctg ctg cct gtt tta tgc cag gcc cat ggc ctg aca cca gag 336

Gin Arg Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr Pro Glu 100 105 110 cag gta gtg geg att geg agc aat att ggc ggt aaa caa gcc ett gaa 384

Gin Val Val Ala Ile Ala 5er Asn Ile Gly Gly Lys Gin Ala Leu Glu 115 120 125 acc gtg cag gca tta ctg ccg gtg ctg tgc caa gcg cac ggc ctg acc 432

Thr val Gin Ala Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr 130 135 140 cca gaa caa gtt gtt gcg ate gca tea aat ggt ggc ggt aag cag get 480

Pro Glu Gin Val val Ala lie Ala ser Asn Gly Gly Gly Lys Gin Ala 145 150 155 160 ttg gaa aeg gtg cag cgt tta ctg cca gtg tta tgt cag gcg cat ggt 528

Leu Glu Thr val Gin Arg Leu Leu Pro Val Leu Cys Gin Ala His Gly 165 170 175 tta aca ccg gaa caa gtg gtg gca ate gec tea cat gat ggc gga aaa 576

Leu Thr Pro Glu Gin Val Val Ala lie Ala ser His Asp Gly Gly Lys 180 185 190 caa gca tta gag act gtt caa ege ctg ctg cca gtg ett tgc cag gca 624

Gin Ala Leu Glu Thr val Gin Arg Leu Leu Pro val Leu Cys Gin Ala 195 200 205 cac ggc tta aca cct gaa cag gtc gta gcg att gca tea aat att ggt 672

His Gly Leu Thr Pro Glu Gin Val val Ala lie Ala Ser Asn lie Gly 210 215 220 gga aaa cag gee ttg gag act gta cag gca ctg ctg cct gta ctg tgt 720

Gly Lys Gin Ala Leu Glu Thr Val Gin Ala Leu Leu Pro val Leu Cys 225 230 235 240 caa gee cac gga tta aeg cca gaa cag gtt gtg get ate gee age aat 768

Gin Ala His Gly Leu Thr Pro Glu Gin val val Ala lie Ala ser Asn 245 250 255 tea ggc ggt aaa cag gcg etc gag aca gtt cag gee ctg ctg ccg gtc 816

Ser Gly Gly Lys Gin Ala Leu Glu Thr Val Gin Ala Leu Leu Pro Val 260 265 270 tta tgt caa get cac gga ctg act ccc gag cag gtt gtc gee att gee 864

Leu Cys Gin Ala His Gly Leu Thr Pro Glu Gin val val Ala lie Ala 275 280 285 tea aat ggc ggt ggt aaa caa get etc gaa aeg gta cag aga ctg ctg 912 ser Asn Gly Gly Gly Lys Gin Ala Leu Glu Thr Val Gin Arg Leu Leu 290 295 300 ccc gtc ctg tgc cag gcg cat gga ett aeg cct gag caa gtt gtg gca 960

Pro val Leu cys Gin Ala His Gly Leu Thr Pro Glu Gin Val val Ala 305 310 315 320 att gca tet aat aat ggg ggt aag caa gcg ctg gaa aca gtt caa ege 1008 lie Ala Ser Asn Asn Gly Gly Lys Gin Ala Leu Glu Thr Val Gin Arg 325 330 335 tta ctg cct gtc ttg tgc caa gca cat ggt tta acc cca gag cag gtc 1056

Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr Pro Glu Gin val 340 345 350 gtt get att gee tet aac att gga ggc aaa cag get ett gaa act gtc 1104

Val Ala lie Ala Ser Asn He Gly Gly Lys Gin Ala Leu Glu Thr Val 355 360 365 cag gee ctg tta cct gtt ctg tgc cag get cac ggt ttg act cca gag 1152

Gin Ala Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr Pro Glu 370 375 380 caa gtg gtt gca ata gee age aac ggt ggg ggt aaa caa get tta gaa 1200

Gin Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gin Ala Leu Glu 385 390 395 400 acc gtc caa cgt ctg tta cca gtg ctg tgt caa get cat ggc ett aca 1248

Thr Val Gin Arg Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr 405 410 415 ccc gaa caa gta gtt gcc att geg agt aac att ggt ggg aag caa gca 1296

Pro Glu Gin Val Val Ala lie Ala 5er Asn lie Gly Gly Lys Gin Ala 420 425 430 ett gaa aeg gtt cag geg ctg ett cca gta tta tgc cag geg cac gga 1344

Leu Glu Thr Val Gin Ala Leu Leu Pro val Leu Cys Gin Ala His Gly 435 440 445 etc act cca gaa cag gta gta gca ate gca agt aat aac ggt ggg aaa 1392

Leu Thr Pro Glu Gin Val val Ala lie Ala Ser Asn Asn Gly Gly Lys 450 455 460 caa geg ttg gag aca gtc caa aga ctg ett ccg gtt ett tgc caa gcc 1440

Gin Ala Leu Glu Thr Val Gin Arg Leu Leu Pro Val Leu cys Gin Ala 465 470 475 480 cac got ett aca ccg cag cag gtt gta get att get agt aat att gga 1488

His Gly Leu Thr Pro Gin Gin Val val Ala lie Ala Ser Asn lie Gly 485 490 495 ggt cgt ccg gca ctg gaa age att gtt gca cag ctg age cgt cct gat 1536

Gly Arg pro Ala Leu Glu ser lie val Ala Gin Leu ser Arg pro Asp 500 505 510 ccg gca ctg gca gca ctg acc aat gat cat ctg gtt gca ctg gca tgt 1584

Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu val Ala Leu Ala Cys 515 520 525 ctg ggt ggt cgt cct gcc ctg gat gca gtt aaa aaa ggt ctg ccg cat 1632

Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His 530 535 540 gca ccg gca ctg att aaa cgt acc aat cgt cgt ate ccg gaa cgt acc 1680

Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr 545 550 555 560 age cat cgt gtt gca gat cat gca cag taa 1710 ser His Arg val Ala Asp His Ala Gin 565 <210> 16<211> 569

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 16

Met Gly Pro Pro Leu Gin Leu Asp Thr Gly Gin Leu Leu Lys lie Ala 1 5 10 15

Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn 20 25 30

Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gin Val Val Ala35 40 45 lie Ala Ser His Asp Gly Gly Lys Gin Ala Leu Glu Thr val Gin Arg50 55 60

Leu Leu Pro Val Leu Cys Gin Ala His Gly Leu Thr pro Glu Gin val 65 70 75 val Ala Ile Ala ser Asn Gly Gly Gly Lys Gin Ala Leu Glu Thr Val 85 90

Gin Arg Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr Pro Glu100 105 HO

Gin Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gin Ala Leu Glu115 120 125

Thr val Gin Ala Leu Leu Pro Val Leu cys Gin Ala His Gly Leu Thr130 135 140

Pro Glu Gin val val Ala Ile Ala 5er Asn Gly Gly Gly Lys Gin Ala 145 150 155 160

Leu Glu Thr val Gin Arg Leu Leu Pro val Leu Cys Gin Ala His Gly 165 170 I75

Leu Thr Pro Glu Gin val val Ala Ile Ala Ser His Asp Gly Gly Lys180 185 190

Gin Ala Leu Glu Thr val Gin Arg Leu Leu Pro Val Leu Cys Gin Ala195 200 205

His Gly Leu Thr Pro Glu Gin Val Val Ala Ile Ala Ser Asn Ile Gly210 215 220

Gly Lys Gin Ala Leu Glu Thr Val Gin Ala Leu Leu Pro val Leu Cys 225 230 235 240

Gin Ala His Gly Leu Thr Pro Glu Gin Val val Ala Ile Ala ser Asn 245 250 255 ser Gly Gly Lys Gin Ala Leu Glu Thr val Gin Ala Leu Leu Pro val260 265 270

Leu Cvs Gin Ala His Gly Leu Thr Pro Glu Gin Val Val Ala Ile Ala275 280 285

Ser Asn Glv Glv Gly Lys Gin Ala Leu Glu Thr val Gin Arg Leu Leu290 295 300

Pro Val Leu Cvs Gin Ala His Gly Leu Thr Pro Glu Gin val val Ala 305 310 315 320

Ile Ala Ser Asn Asn Gly Gly Lys Gin Ala Leu Glu Thr val Gin Arg 325 330 335

Leu Leu Pro Val Leu Cys Gin Ala His Gly Leu Thr Pro Glu Gin Val340 345 350

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gin Ala Leu Glu Thr val355 360 365

Gin Ala Leu Leu Pro val Leu Cys Gin Ala His Gly Leu Thr Pro Glu370 375 380

Gin val val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gin Ala Leu Glu 385 390 395 400

Thr val Gin Arg Leu Leu Pro Val Leu Cys Gin Ala His Gly Leu Thr 405 410 415

Pro Glu Gin Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gin Ala420 425 430

Leu Glu Thr val Gin Ala Leu Leu Pro Val Leu Cys Gin Ala His Gly435 440 445

Leu Thr Pro Glu Gin Val val Ala ile Ala Ser Asn Asn Gly Gly Lys450 455 460

Gin Ala Leu Glu Thr Val Gin Arg Leu Leu Pro val Leu Cys Gin Ala 465 470 475 480

His Gly Leu Thr Pro Gin Gin val val Ala Ile Ala Ser Asn Ile Gly 485 490 495

Gly Arg Pro Ala Leu Glu Ser ile val Ala Gin Leu Ser Arg pro Asp500 505 510

Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys515 520 525

Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His530 535 540

Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr 545 550 555 560

Ser His Arg val Ala Asp His Ala Gin565 <210> 17 <211> 1257

<212> DNA <213> künstliche Sequenz<220>

<223> VioA <220> <221> CDS<222> (1)..(1257)

<223> VioA <400> 17 atg aaa cat tct tcc gat ate tgc att gtt gat get gat att tet ggt 48

Met Lys His Ser Ser Asp lie Cys lie Val Gly Ala Giy lie Ser Gly 15 10 15 ttg aeg tgc gca age cat ctg ctg gac age ccg gca tgc egt ggt ctg 96

Leu Thr Cys Ala Ser His Leu Leu Asp Ser Pro Ala Cys Arg Gly Leu 20 25 30 age ctg cgt ate ttt gac atg cag caa gaa gee ggt gqc cgt ate ege 144

Ser Leu Arg lie Phe Asp Met Gin Gin Glu Ala Gly Gly Arg Ile Arg 35 40 45 age aaa atg ctg gat ggt aag gca age att gaa ctg ggc gca ggt ege 192

Ser Lys Met Leu Asp Gly Lys Ala Ser Ile Glu Leu Gly Ala Gly Arg 50 55 60 tac tec cct cag ttg cac ccg cat ttc caa age gca atg cag cac tat 240

Tyr Ser Pro Gin Leu His Pro His Phe Gin ser Ala Met Gin His Tyr 65 70 75 80 age caa aag age gaa gtc tat ccg ttc acc cag ttg aag ttc aaa tct 288

Ser Gin Lys Ser Glu val Tyr Pro Phe Thr Gin Leu Lys Phe Lys Ser 85 90 95 cac gtg cag caa aag ctg aag ege gee atg aat gaa ctg tec ccg cgt 336

His Val Gin Gin Lys Leu Lys Arg Ala Met Asn Glu Leu Ser Pro Arg 100 105 110 ctg aaa gag cat ggt aaa gag age ttt ttg cag ttt gtc age cgt tat 384

Leu Lys Glu His Gly Lys Glu Ser Phe Leu Gin Phe val Ser Arg Tyr 115 120 125 caa ggt cac gat age geg gtt ggt atg ate ege tct atg ggt tac gac 432

Gin Gly His Asp Ser Ala Val Gly Met Ile Arg Ser Met Gly Tyr Asp 130 135 140 gca ctg ttc ctg ccg gat ate age gca gaa atg gee tac gac att gtg 480

Ala Leu Phe Leu Pro Asp lie Ser Ala Glu Met Ala Tyr Asp lie Val 145 150 155 160 ggt aag cac ccg gag ate cag age gtg aeg gac aac gac geg aac caa 528

Gly Lys His Pro Glu lie Gin Ser val Thr Asp Asn Asp Ala Asn Gin 165 170 175 tgg ttt gca geg gaa aeg ggc ttt get ggt ctg att cag ggc ate aag 576

Trp Phe Ala Ala Glu Thr Gly Phe Ala Gly Leu lie Gin Gly lie Lys 180 185 190 get aag gtt aag geg gca ggt geg cgt ttt age ctg ggt tat cgt ctg 624

Ala Lys Val Lys Ala Ala Gly Ala Arg Phe Ser Leu Gly Tyr Arg Leu 195 200 205 ctg age gtc cgt acc gac ggt gac ggc tac ctg ctg caa ctg gca ggt 672

Leu Ser Val Arg Thr Asp Gly Asp Gly Tyr Leu Leu Gin Leu Ala Gly 210 215 220 gac gac ggc tgg aaa ctg gag cac cgt acc ege cat ctg att ctg geg 720

Asp Asp Gly Trp Lys Leu Glu His Arg Thr Arg His Leu lie Leu Ala 225 230 235 240 att ccg ccg age geg atg geg ggt ttg aat gtt gat ttt cca gaa gee 768 lie Pro Pro ser Ala Met Ala Gly Leu Asn val Asp Phe Pro Glu Ala 245 250 255 tgg tec ggt geg ege tat ggc age ctg ccg ctg ttt aag ggc ttt ctg 816

Trp Ser Gly Ala Arg Tyr Gly Ser Leu Pro Leu Phe Lys Gly Phe Leu 260 265 270 aeg tac ggt gag ccg tgg tgg ttg gac tac aaa ctg gac gat cag gtg 864

Thr Tyr Gly Glu Pro Trp Trp Leu Asp Tyr Lys Leu Asp Asp Gin val 275 280 285 ctg att gtt gac aac ccg ctg ege aaa ate tat ttc aaa ggc gat aag 912

Leu lie val Asp Asn Pro Leu Arg Lys lie Tyr Phe Lys Gly Asp Lys

290 295 BOO tac ctg ttc ttc tat acc gat age gag atg geg aat tac tgg ege ggt 960

Tyr Leu Phe Phe Tyr Thr Asp Ser Glu Met Ala Asn Tyr Trp Arg Gly 305 310 315 320 tgt gtc geg gag ggc gag gac ggt tac ctg gag caa att ege acc cat 1008

Cys Val Ala Glu Gly Glu Asp Gly Tyr Leu Glu Gin Tie Arg Thr His 325 330 335 ttg get age gca ctg ggt ate gtc cgt gaa cgt ate ccg caa ccg ctg 1056

Leu Ala Ser Ala Leu Gly Ile Val Arg Glu Arg Ile Pro Gin Pro Leu 340 345 350 gca cac gtt cac aag tat tgg geg cac ggc gtt gag ttt tgc cgt gat 1104

Ala His val His Lys Tyr Trp Ala His Gly val Glu Phe Cys Arg Asp 355 360 365 tet gat att gac cac ccg age gca ctg tet cat ege gac age ggt ate 1152

Ser Asp lie Asp His pro Ser Ala Leu Ser His Arg Asp ser Gly lie 370 375 380 ate geg tgc tee gat geg tac aeg gag cat tgt ggt tgg atg gag ggc 1200 lie Ala Cys Ser Asp Ala Tyr Thr Glu His Cys Gly Trp Met Glu Gly 385 390 395 400 ggt ctg ctg age gee cgt gag gca age cgt ctg ctg ttg cag cgt ate 1248

Gly Leu Leu Ser Ala Arg Glu Ala Ser Arg Leu Leu Leu Gin Arg Ile 405 410 415 gee geg tga 1257

Ala Ala

<210> 18<211> 418<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 18

Met Lys His Ser Ser Asp lie Cys lie val Gly Ala Gly lie ser Gly15 10 15

Leu Thr Cys Ala Ser His Leu Leu Asp Ser Pro Ala Cys Arg Gly Leu20 25 30

Ser Leu Arg Ile Phe Asp Met Gin Gin Glu Ala Gly Gly Arg Ile Arg35 40 45 ser Lvs Met Leu Asp Gly Lys Ala Ser Ile Glu Leu Gly Ala Gly Arg50 55 60

Tvr Ser Pro Gin Leu His pro His Phe Gin Ser Ala Met Gin His Tyr 65 70 75 80

Ser Gin Lys Ser Glu Val Tyr Pro Phe Thr Gin Leu Lys Phe Lys Ser 85 90 95

His Val Gin Gin Lys Leu Lys Arg Ala Met Asn Glu Leu Ser Pro Arg100 105 110

Leu Lys Glu His Gly Lys Glu Ser Phe Leu Gin phe Val Ser Arg Tyr115 120 125

Gin Gly His Asp Ser Ala val Gly Met Ile Arg Ser Met Gly Tyr Asp130 135 140

Ala Leu phe Leu Pro Asp lie Ser Ala Glu Met Ala Tyr Asp lie Val 145 150 155 160

Gly Lys His Pro Glu lie Gin Ser Val Thr Asp Asn Asp Ala Asn Gin 165 170 175

Trp Phe Ala Ala Glu Thr Gly Phe Ala Gly Leu lie Gin Gly lie Lys180 185 190

Ala Lys Val Lys Ala Ala Gly Ala Arg Phe Ser Leu Gly Tyr Arg Leu195 200 205

Leu ser val Arg Thr Asp Gly Asp Gly Tyr Leu Leu Gin Leu Ala Gly210 215 220

Asp Asp Gly Trp Lys Leu Glu His Arg Thr Arg His Leu lie Leu Ala 225 230 235 240 lie pro Pro Ser Ala Met Ala Gly Leu Asn Val Asp Phe Pro Glu Ala 245 250 255

Trp Ser Gly Ala Arg Tyr Gly Ser Leu Pro Leu phe Lys Gly Phe Leu260 265 270

Thr Tyr Gly Glu pro Trp Trp Leu Asp Tyr Lys Leu Asp Asp Gin Val275 280 285

Leu lie val Asp Asn pro Leu Arg Lys lie Tyr Phe Lys Gly Asp Lys290 295 300

Tyr Leu Phe Phe Tyr Thr Asp Ser Glu Met Ala Asn Tyr Trp Arg Gly 305 310 315 320

Cys Val Ala Glu Gly Glu Asp Gly Tyr Leu Glu Gin Ile Arg Thr His 17 325 330 335

Leu Ala Ser Ala Leu Gly Ile Val Arg Glu Arg Ile Pro Gin Pro Leu340 345 350

Ala His Val His Lys Tyr Trp Ala His Gly val Glu Phe Cys Arg Asp355 360 365

Ser Asp Ile Asp His Pro Ser Ala Leu ser His Arg Asp Ser Gly Ile370 375 380

Ile Ala Cys Ser Asp Ala Tyr Thr Glu His Cys Gly Trp Met Glu Gly 385 390 395 400

Gly Leu Leu Ser Ala Arg Glu Ala Ser Arg Leu Leu Leu Gin Arg Ile 405 410 415

Ala Ala <210> 19 <211> 2994

<212> DNA <213> künstliche Sequenz<220> <223> VioB<220> <221> CDS<222> ¢1)..(2994)

<223> VioB <400> 19 atg agc att ctg gat ttc ccg egt atc cac ttc egt ggc tgg gcc egt 48

Met ser Ile Leu Asp Phe Pro Arg Ile His Phe Arg Gly Trp Ala Arg 1 5 10 15 gtc aat geg ccg acc geg aac ege gat ccg cac ggc cac atc gat atg 96

Val Asn Ala Pro Thr Ala Asn Arg Asp Pro His Gly His Ile Asp Met 20 25 30 gcc age aat acc gtg geg atg geg ggt gag ccg ttc gac ctg gca ege 144

Ala Ser Asn Thr Val Ala Met Ala Gly Glu Pro Phe Asp Leu Ala Arg 35 40 45 cat cct aeg gag ttc cac egt cac ctg ege tcc ctg ggt ccg ege ttc 192

His Pro Thr Glu Phe His Arg His Leu Arg ser Leu Gly Pro Arg Phe 50 55 60 ggc ttg gat ggt egt get gac ccg gaa ggc ccg ttc agc ctg gcc gag 240

Gly Leu Asp Gly Arg Ala Asp Pro Glu Gly Pro Phe Ser Leu Ala Glu 65 70 75 80 ggc tac aac get gcc ggt aac aac cac ttt teg tgg gag agc gca acc 288

Gly Tyr Asn Ala Ala Gly Asn Asn His Phe Ser Trp Glu Ser Ala Thr 85 90 95 gtt agc cac gtg caa tgg gat ggc ggt gag geg gat egt ggt gac ggt 336 val ser His Val Gin Trp Asp Gly Gly Glu Ala Asp Arg cTy Asp Gly 100 105 110 ctg gtc ggt get egt ttg gca ctg tgg ggt cac tac aat gat tat ctg 384

Leu val Gly Ala Arg Leu Ala Leu Trp Giy His Tyr Asn Asp Tyr Leu 115 120 125 egt acc acc ttc aat egt get egt tgg gtc gac age gac ccg aeg ege 432

Arg Thr Thr Phe Asn Arg Ala Arg Trp val Asp Ser Asp Pro Thr Arg 130 135 140 egt gac get gca caa atc tat geg ggc caa ttc acc att age ccg get 480

Arq Asp Ala Ala Gin ile Tyr Ala Gly Gin Phe Thr lie Ser Pro Ala 145 150 155 160 ggt gcc ggt ccg ggt aeg ccg tgg ctg ttt aeg gca gac att gat gat 528

Gly Ala Gly Pro Gly Thr Pro Trp Leu Phe Thr Ala Asp Ile Asp Asp 165 170 175 age cat ggt gca egt tgg aeg egt ggc ggc cac att gca gag egt ggc 576

Ser His Gly Ala Arg Trp Thr Arg Gly Gly His Ile Ala Glu Arg Gly 180 185 190 aac cac ttc ttg gat gaa gag ttt ggt ctg gca ege ctg ttt cag ttc 624

Gly His Phe Leu Äsp Glu Glu Phe Gly Leu Ala Arg Leu Phe Gin Phe 195 200 205 tet gtg ccg aaa gat cac cca cat ttt ctg ttt cac ccg ggt ccg ttt 672

Ser Val Pro Lys Asp His Pro His Phe Leu Phe His Pro Gly pro Phe 210 215 220 gat tcc gag gcc tgg egt egt ctg caa ttg get ctg gag gat gac gac 720

Asp Ser Glu Ala Trp Arg Arg Leu Gin Leu Ala Leu Glu Asp Asp Asp 225 230 235 240 gtt ctg ggt ctg acc gtg caa tat geg ttg ttc aat atg age acc ccg 768 val Leu Gly Leu Thr val Gin Tyr Ala Leu Phe Asn Met Ser Thr Pro 245 250 255 cct cag ccg aac age ccg gtt ttt cac gat atg gtc ggt gtt gtc ggt 816

Pro Gin Pro Asn 5er Pro Val Phe His Asp Met Val Gly val Val Gly 260 265 270 ctg tgg egt egt ggt gaa ctg geg age tac ccg get ggt egt ctg ctg 864

Leu Trp Arg Arg Gly Glu Leu Ala Ser Tyr Pro Ala Gly Arg Leu Leu 275 280 285 egt ccg egt caa ccg ggt ctg ggt gac ctg acc ctg ege gtc aac ggt 912

Arg Pro Arg Gin Pro Gly Leu Gly Asp Leu Thr Leu Arg Val Asn Gly 290 295 300 ggt ege gtt geg ctg aat ttg geg tgt gee att ccg ttc age act egt 960

Gly Arg val Ala Leu Asn Leu Ala cys Ala Ile Pro Phe Ser Thr Arg 305 310 315 320 gee geg cag cca age gca ccg gac ege ega ccc egg acc tgg gtg cca 1008

Ala Ala Gin Pro Ser Ala Pro Asp Arg Arg Pro Arg Thr Trp val Pro 325 330 335 aac tgc ege tgg geg atc tgc tgc tgc gtg atg agg aeg geg cac tgt 1056

Asn Cys Arg Trp Ala Ile Cys Cys cys val Met Arg Thr Ala His Cys 340 345 350 tgg cac gtg tgc ege agg etc tgt acc aag act att gga ega atc aeg 1104

Trp His Val Cys Arg Arg Leu Cys Thr Lys Thr ile Gly Arg Ile Thr 355 360 365 gta ttg tgg acc tgc ege tgc tgc geg aac ege gtg gta get tga ccc 1152

Val Leu Trp Thr Cys Arg cys Cys Ala Asn Arg val val Ala Pro 370 375 380 tga gca gcg aac tgg egg agt ggc gtg age aag act ggg tea ccc aaa 1200

Ala Ala Asn Trp Arg ser Gly val ser Lys Thr Gly Ser Pro Lys 385 390 395 geg aeg cgt eta ace tgt acc tgg agg cac egg ate gee gtc aeg gtc 1248

Ala Thr Arg Leu Thr Cys Thr Trp Arg His Arg Ile Ala Val Thr Val 400 405 410 get ttt tee ctg aga gca teg ege tgc gca get act ttc gcg gtg aag 1296

Ala Phe Ser Leu Arg Ala Ser Arg Cys Ala Ala Thr Phe Ala val Lys 415 420 425 430 ege gtg ege gtc egg ata tee ege ate gta teg agg gca tgg gee tgg 1344

Arg Val Arg Val Arg Ile Ser Arg Ile val Ser Arg Ala Trp Ala Trp 435 440 445 teg gcg teg aat etc gtc agg atg gcg aeg ctg egg aat ggc gtc tga 1392

Ser Ala Ser Asn Leu val Arg Met Ala Thr Leu Arg Asn Gly Val 450 455 460 egg gtc tgc gtc egg gtc egg cac gca ttg ttc tgg aeg atg gtg ccg 1440

Arg Val Cys val Arg Val Arg His Ala Leu Phe Trp Thr Met Val Pro 465 470 475 agg ega tee etc tgc gtg ttc tgc ctg aeg att ggg ege tgg atg aeg 1488

Arg Arg ser Leu cys val Phe Cys Leu Thr lie Gly Arg Trp Met Thr 480 485 490 ega ccg teg aag aag tgg att aeg cct ttt tgt acc gee aeg tta tgg 1536

Arg Pro Ser Lys Lys Trp lie Thr Pro Phe Cys Thr Ala Thr Leu Trp 495 500 505 cgt att aeg age tgg tgt ate cat tea tga gcg aca agg tgt ttt ccc 1584

Arg lie Thr Ser Trp Cys lie His Ser Ala Thr Arg Cys Phe Pro 510 515 520 tgg ctg ate gtt gca aat gtg aaa cgt aeg cac gtc tga tgt ggc aga 1632

Trp Leu lie Val Ala Asn Val Lys Arg Thr His val Cys Gly Arg 525 530 535 tgt gtg ate ege aga acc gca aca agt cct att aca tgc ega gca ccc 1680

Cys Val Ile Arg Arg Thr Ala Thr ser Pro Ile Thr cys Arg Ala pro 540 545 550 555 gcg aac tgt egg cac ega aag etc gtt tgt tet tga agt ate tgg ccc 1728

Ala Asn Cys Arg His Arg Lys Leu Val Cys Ser ser lie Trp Pro 560 565 570 aeg tgg aag gee agg cac gee tgc aag cac etc ege cag egg gtc egg 1776

Thr Trp Lys Ala Arg His Ala Cys Lys His Leu Arg Gin Arg val Arg 575 580 585 cac gca ttg aat eta aag ccc agt tgg egg cag age tgc gta aag ccg 1824

His Ala Leu Asn Leu Lys Pro Ser Trp Arg Gin ser cys Val Lys pro 590 595 600 teg acc tgg age tgt ctg tga tgc tgc aat acc tgt aeg egg cgt ata 1872

Ser Thr Trp ser cys Leu Cys Cys Asn Thr Cys Thr Arg Arg lie 605 610 615 gca ttc ega act atg cac agg gee aac aac gtg ttc gtg aeg gtg cgt 1920

Ala Phe Arg Thr Met His Arg Ala Asn Asn Val Phe val Thr Val Arg 620 625 630 gga ccg ccg age age tgc aac tgg cgt gcg gta gcg gtg acc gtc gee 1968

Gly Pro Pro ser Ser Cys Asn Trp Arg Ala Val Ala val Thr Val Ala 635 640 645 gtg atg gcg gta ttc gtc age act get gga aat tgc tea tga aga aat 2016

Val Met Ala val Phe val Ser Thr Ala Gly Asn Cys Ser Arg Asn650 655 660 gat tea tta cct ggt cgt taa caa cct get gat ggc cct ggg ega gee 2064

Asp Ser Leu Pro Gly Arg Gin Pro Ala Asp Gly Pro Gly Arg Ala 665 670 675 gtt eta ege ggg tgt ccc get gat ggg ega age ggc aeg tea ggc gtt 2112 val Leu Arg Gly cys Pro Ala Asp Gly Arg Ser Gly Thr ser Gly val 680 685 690 695 tgg cct gga cac ega gtt ege tet gga ace gtt tag ega aag cac get 2160

Trp Pro Gly His Arg Val Arg Ser Gly Thr Val Arg Lys His Ala 700 705 710 ggc aeg ttt tgt teg tet gga atg gee gca ett tat ccc age acc ggg 2208

Gly Thr Phe Cys Ser Ser Gly Met Ala Ala Leu Tyr Pro Ser Thr Gly 715 720 725 caa ate cat ege gga ctg eta tgc ege cat teg tea ggc gtt ttt gga 2256

Gin lie His Arg Gly Leu Leu cys Arg His Ser Ser Gly Val Phe Gly 730 735 740 tet gee gga ett gtt tgg tgg ega ggc agg taa geg tgg egg tga aca 2304

Ser Ala Gly Leu Val Trp Trp Arg Gly Arg Ala Trp Arg Thr 745 750 755 cca cct gtt cct gaa tga get gac caa ccg tgc gca tee ggg tta tea 2352

Pro Pro val Pro Glu Ala Asp Gin Pro Cys Ala Ser Gly Leu Ser 760 765 770 act gga agt ttt ega teg ega etc ggc get gtt tgg tat tgc att tgt 2400

Thr Gly Ser Phe Arg Ser Arg Leu Gly Ala Val Trp Tyr Cys lie Cys 775 780 785 gac ega tea ggg ega agg tgg ege tet gga cag ccc gca eta ega aca 2448

Asp Arg Ser Gly Arg Arg Trp Arg Ser Gly Gin Pro Ala Leu Arg Thr 790 795 800 tag cca ttt tea aeg tet geg tga aat gag ege geg tat cat ggc tea 2496

Pro Phe Ser Thr Ser Ala Asn Glu Arg Ala Tyr His Gly Ser 805 810 815 aag ege acc gtt ega acc ggc get gee ggc gtt geg taa tee ggt tet 2544

Lys Arg Thr Val Arg Thr Gly Ala Ala Gly Val Ala Ser Gly Ser 820 825 830 gga tga gag ccc ggg ttg cca aeg tgt ege aga egg teg tgc geg tgc 2592

Gly Glu Pro Gly Leu Pro Thr cys Arg Arg Arg ser Cys Ala Cys 835 840 845 get gat ggc att gta cca agg cgt tta tga get gat gtt tgc gat gat 2640

Ala Asp Gly Ile val Pro Arg Arg Leu Ala Asp val cys Asp Asp 850 855 860 ggc gca gca ett ege cgt gaa acc get ggg tag ett geg teg cag ccg 2688

Gly Ala Ala Leu Arg Arg Glu Thr Ala Gly Leu Ala Ser Gin Pro 865 870 875 cct gat gaa ege age aat ega tet gat gac egg tet gtt geg tee get 2736

Pro Asp Glu Arg ser Asn Arg Ser Asp Asp Arg Ser Val Ala Ser Ala 880 885 890 gag ctg ege get gat gaa cct gee aag egg cat ege egg teg cac ggc 2784

Glu Leu Arg Ala Asp Glu Pro Ala Lys Arg His Arg Arg Ser His Gly 895 900 905 egg tee gee get gee ggg tee ggt tga cac ccg tag eta tga ega eta 2832

Arg Ser Ala Ala Ala Gly Ser Gly His Pro Leu Arg Leu 910 915 920 cgc get ggg ctg teg cat get ggc aeg ccg ttg ega geg tet get gga 2880

Arg Ala Gly Leu ser His Ala Gly Thr pro Leu Arg Ala Ser Ala Gly 925 930 935 gca ggc gag cat get gga acc ggg ttg get gee gga tgc gca gat gga 2928

Ala Gly Glu His Ala Gly Thr Gly Leu Ala Ala Gly cys Ala Asp Gly 940 945 950 get get gga ttt eta teg teg cca aat get gga ett ggc gtg egg caa 2976

Ala Ala Gly Phe Leu Ser Ser Pro Asn Ala Gly Leu Gly Val Arg Gin 955 960 965 970 act gag cgc gag gee taa 2994

Thr Glu Arg Glu Ala 975 <210> 20<211> 382

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 20

Met Ser Ile Leu Asp Phe Pro Arg Ile His Phe Arg Gly Trp Ala Arg15 10 15 val Asn Ala Pro Thr Ala Asn Arg Asp Pro His Gly His lie Asp Met20 25 30

Ala Ser Asn Thr Val Ala Met Ala Gly Glu Pro Phe Asp Leu Ala Arg35 40 45

His Pro Thr Glu Phe His Arg His Leu Arg Ser Leu Gly Pro Arg Phe50 55 60

Gly Leu Asp Gly Arg Ala Asp Pro Glu Gly Pro Phe Ser Leu Ala Glu 65 70 75 80

Gly Tyr Asn Ala Ala Gly Asn Asn His Phe Ser Trp Glu Ser Ala Thr 85 90 95

Val Ser His val Gin Trp Asp Gly Gly Glu Ala Asp Arg Gly Asp Gly100 105 110

Leu Val Gly Ala Arg Leu Ala Leu Trp Gly His Tyr Asn Asp Tyr Leu115 120 125

Arg Thr Thr Phe Asn Arg Ala Arg Trp val Asp Ser Asp Pro Thr Arg130 135 140

Arg Asp Ala Ala Gin lie Tyr Ala-Gly Gin Phe Thr lie Ser Pro Ala 145 150 155 160

Gly Ala Gly Pro Gly Thr Pro Trp Leu Phe Thr Ala Asp lie Asp Asp165 170 175

Ser His Gly Ala Arg Trp Thr Arg Gly Gly His Ile Ala Glu Arg Gly180 185 190

Gly His Phe Leu Asp Glu Glu Phe Gly Leu Ala Arg Leu Phe Gin Phe195 200 205 ser val Pro Lys Asp His Pro His Phe Leu Phe His Pro Gly Pro Phe210 215 220

Asp Ser Glu Ala Trp Arg Arg Leu Gin Leu Ala Leu Glu Asp Asp Asp 225 250 235 240

Val Leu Gly Leu Thr val Gin Tyr Ala Leu Phe Asn Met Ser Thr Pro 245 250 255 pro Gin Pro Asn Ser pro val Phe His Asp Met Val Gly Val Val Gly260 265 270

Leu Trp Arg Arg Gly Glu Leu Ala Ser Tyr Pro Ala Gly Arg Leu Leu275 280 285

Arg Pro Arg Gin pro Gly Leu Gly Asp Leu Thr Leu Arg Val Asn Gly290 295 300

Gly Arg val Ala Leu Asn Leu Ala Cys Ala lie Pro Phe Ser Thr Arg 305 310 315 320

Ala Ala Gin Pro Ser Ala Pro Asp Arg Arg Pro Arg Thr Trp Val Pro 325 330 335

Asn cys Arg Trp Ala lie cys Cys Cys Val Met Arg Thr Ala His Cys340 345 350

Trp His Val cys Arg Arg Leu Cys Thr Lys Thr Ile Gly Arg lie Thr355 360 365

Val Leu Trp Thr cys Arg Cys Cys Ala Asn Arg Val Val Ala370 375 380 <210> 21<211> 78

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 21

Ala Ala Asn Trp Arg Ser Gly Val Ser Lys Thr Gly Ser pro Lys Ala15 10 15

Thr Arg Leu Thr Cys Thr Trp Arg His Arg Ile Ala Val Thr Val Ala20 25 30

Phe ser Leu Arg Ala Ser Arg Cys Ala Ala Thr Phe Ala val Lys Arg35 40 45 val Arg Val Arg Ile Ser Arg Ile Val Ser Arg Ala Trp Ala Trp Ser50 55 60

Ala Ser Asn Leu Val Arg Met Ala Thr Leu Arg Asn Gly Val65 . 70 75 <210> 22<211> 57

<212> PRT <213> künstliche Sequenz <220> <223> synthetisches Konstrukt<400> 22

Arg val cys val Arg val Arg His Ala Leu Phe Trp Thr Met val pro 1 5 10 15

Arg Arg Ser Leu Cys Val Phe Cys Leu Thr Ile Gly Arg Trp Met Thr 20 25 30

Arg Pro Ser Lys Lys Trp Ile Thr Pro Phe cys Thr Ala Thr Leu Trp35 40 45

Arg Ile Thr Ser Trp cys Ile His ser50 55 <Z10> 23

<211> 18<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 23

Ala Thr Arg Cys Phe Pro Trp Leu ile Val Ala Asn Val Lys Arg Thr15 10 15

Hi s Val <210> 24 <211> 30

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt <400> 24

Cys Gly Arg Cys val Ile Arg Arg Thr Ala Thr ser Pro lie Thr cys 15 10 15

Arg Ala Pro Ala Asn Cys Arg His Arg Lys Leu val Cys Ser20 25 30 <210> 25

<211> 42<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 25

Ser Ile Trp Pro Thr Trp Lys Ala Arg His Ala Cys Lys His Leu Arg 15 10 15

Gin Arg Val Arg His Ala Leu Asn Leu Lys Pro ser Trp Arg Gin Ser20 25 30

Cys val Lys Pro Ser Thr Trp Ser Cys Leu35 40 <210> 26<211> 54

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 26

Cys Cys Asn Thr Cys Thr Arg Arg lie Ala Phe Arg Thr Met His Arg15 10 ±:>

Ala Asn Asn val Phe Val Thr Val Arg Gly Pro pr0 Ser f?r Cys Asn20 25 30

Trp Arg Ala Val Ala val Thr val Ala Val Met Ala val Phe Val ser35 40

Thr Ala Gly Asn cys Ser50 <210> 27

<211> 8<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 27

Arg Asn Asp Ser Leu Pro Gly Arg 1 5 <210> 28<211> 36

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 28

Gin Pro Ala Asp Gly Pro Gly Arg Ala val Leu Arg Gly Cys Pro Ala15 10 15

Asp Gly Arq ser Gly Thr ser Gly val Trp Pro Gly His Arg val Arg20 25 30

Ser Gly Thr Val 35 <210> 29

<211> 46<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 29

Arg Lys His Ala Gly Thr Phe cys Ser Ser Gly Met Ala Ala Leu Tyr15 10 15

Pro Ser Thr Gly Gin lie His Arg Gly Leu Leu Cys Arg His Ser Ser20 25 30

Gly val Phe Gly Ser Ala Gly Leu Val Trp Trp Arg Gly Arg35 40 45 <210> 30 <211> 6<212> prt <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 30

Thr Pro Pro Val Pro Glu1 5 <210> 31 <211> 42 <212> prt <213> künstliche Sequenz<220> <223> synthetisches Konstrukt <400> 31

Ala Asp Gin Pro Cys Ala Ser Gly Leu Ser Thr Gly Ser Phe Arg Ser15 10 15

Arg Leu Gly Ala Val Trp Tyr Cys lie Cys Asp Arg Ser Gly Arg Arg20 25 30

Trp Arg Ser Gly Gin Pro Ala Leu Arg Thr35 40 <210> 32

<211> 6<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 32 pro Phe ser Thr Ser Ala 1 5 <210> 33

<211> 20<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 33

Asn Glu Arg Ala Tyr His Gly Ser Lys Arg Thr val Arg Thr Gly Ala15 10 15

Ala Gly Val Ala20 <210> 34 <211> 4

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 34 ser Gly ser Gly 1 <210> 35 <211> 23

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 35

Glu Pro Gly Leu Pro Thr Cys Arg Arg Arg Ser Cys Ala Cys Ala Asp15 10 15

Gly Ile Val Pro Arg Arg Leu20 <210> 36

<211> 16<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 36

Ala Asp Val Cys Asp Asp Gly Ala Ala Leu Arg Arg Glu Thr Ala Gly 1 5 10 15 <210> 37 <211> 45 <212> prt <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 37

Leu Ala Ser Gin Pro Pro Asp Glu Arg Ser Asn Arg Ser Asp Asp Arg 15 10 15

Ser val Ala Ser Ala Glu Leu Arg Ala Asp Glu pro Ala Lys Arg His 20 25 30

Arg Arg Ser His Gly Arg Ser Ala Ala Ala Gly Ser Gly35 40 45 <210> 38 <211> 55

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 38

Arg Leu Arg Ala Gly Leu Ser His Ala Gly Thr Pro Leu Arg Ala Ser15 10 15

Ala Gly Ala Gly Glu His Ala Gly Thr Gly Leu Ala Ala Gly Cys Ala20 25 30

Asp Gly Ala Ala Gly Phe Leu Ser Ser Pro Asn Ala Gly Leu Gly Val35 40 45

Arg Gin Thr Glu Arg Glu Ala50 55 <210> 39 <211> 1290

<212> DNA <213> künstliche Sequenz<220> <223> vioc<220> <221> CDS<222> (1)..(1290)

<223> VioC <400> 39 atg aaa cgt gcg att ate gtt ggt ggc ggc ctg geg ggt ggc ctg acc 48

Met Lys Arg Ala lie lie Val Gly Gly Gly Leu Ala Gly Gly Leu Thr 15 10 15 gcg ate tac ctg gcg aag cgt ggc tac gaa gtg cac gtc gtg gag aag 96

Ala Ile Tyr Leu Ala Lys Arg Gly Tyr Glu Val His Val Val Glu Lys 20 25 30 cgt ggt gat cct ctg ege gat ctg age tet tac gtg gac gtt gtt age 144

Arg Gly Asp Pro Leu Arg Asp Leu ser Ser Tyr Val Asp val Val ser 35 40 45 age cgt gcg ate ggc gtg age atg acc gtt cgt ggt ate aag age gtt 192

Ser Arg Ala lie Gly Val Ser Met Thr val Arg Gly lie Lys ser Val 50 55 60 ttg get gcg ggc att ccg cgt gca gag ctg gat gcg tgt ggc gaa ccg 240

Leu Ala Ala Gly Ile Pro Arg Ala Glu Leu Asp Ala Cys Gly Glu Pro 65 70 75 80 ate gtg gca atg get ttc tee gtg ggt ggt cag tat ege atg ege gaa 288 lie Val Ala Met Ala Phe ser val Gly Gly Gin Tyr Arg Met Arg Glu 85 90 95 ctg aag ccg ttg gag gat ttc cgt ccg ctg age ttg aac cgt gcg gcg 336

Leu Lys Pro Leu Glu Asp Phe Arg Pro Leu Ser Leu Asn Arg Ala Ala 100 105 110 ttt caa aag ctg ctg aac aaa tac gcg aac ctg gca ggc gtt cgt tac 384

Phe Gin Lys Leu Leu Asn Lys Tyr Ala Asn Leu Ala Gly Val Arg Tyr 115 120 125 tac ttt gag cat aag tgc ctg gat gtt gac ctg gat ggt aag age gtg 432

Tyr Phe Glu His Lys Cys Leu Asp val Asp Leu Asp Gly Lys ser val 130 135 140 ttg att cag ggc aaa gat ggt cag ccg cag cgt ctg caa ggt gac atg 480

Leu lie Gin Gly Lys Asp Gly Gin Pro Gin Arg Leu Gin Gly Asp Met 145 150 155 160 att ate ggt gcg gat ggc gee cac age gee gtc cgt cag gcg atg cag 528 lie lie Gly Ala Asp Gly Ala His Ser Ala val Arg Gin Ala Met Gin 165 170 175 age ggc ctg cgt cgt ttc gag ttc cag caa aeg ttc ttc ege cat ggc 576

Ser Gly Leu Arg Arg Phe Glu Phe Gin Gin Thr Phe Phe Arg His Gly 180 185 190 tac aaa acc ctg gtt ttg ccg gac gcg caa gca ctg ggt tac cgt aaa 624

Tyr Lys Thr Leu val Leu Pro Asp Ala Gin Ala Leu Gly Tyr Arg Lys 195 200 205 gac acg ctg tac ttt ttc ggc atg gat tcc ggt ggc ctg ttc gcg got 672

Asp Thr Leu Tyr Phe Phe Gly Met Asp ser Gly Gly Leu Phe Ala Gly 210 215 220 cgt gcg get acg ate cca gat ggt age gtc age ate gee gtt tgc ctg 720

Arg Ala Ala Thr lie Pro Asp Gly Ser Val Ser Ile Ala Val Cys Leu 225 230 235 240 ccg tac teg ggt age cct tec ctg acg ace acc gac gaa ccg acg atg 768

Pro Tyr Ser Gly Ser Pro Ser Leu Thr Thr Thr Asp Glu Pro Thr Met 245 250 255 cgt gcg ttc ttc gat cgt tac ttc ggt ggc ctg ccg cgt gac gcg cgt 816

Arg Ala Phe Phe Asp Arg Tyr Phe Gly Gly Leu Pro Arg Asp Ala Arg 260 265 270 gac gaa atg ctg cgt cag ttt ctg gcg aag ccg age aac gac ctg att 864

Asp Glu Met Leu Arg Gin Phe Leu Ala Lys Pro ser Asn Asp Leu lie 275 280 285 aac gtg ege tet age acc ttt cac tat aag ggt aat gtg ctg ttg ctg 912

Asn Val Arg Ser Ser Thr Phe His Tyr Lys Gly Asn Val Leu Leu Leu 290 295 300 ggt gat get gcg cat gcg act gcg ccg ttc ctg ggt cag ggt atg aac 960

Gly Asp Ala Ala His Ala Thr Ala pro Phe Leu Gly Girt Gly Met Asn 305 310 315 320 atg gcg ctg gag gac gcc ege acg ttt gtc gag ctg ctg gac ege cac 1008

Met Ala Leu Glu Asp Ala Arg Thr Phe Val Glu Leu Leu Asp Arg His 325 330 335 cag ggc gac caa gac aaa gcc ttt ccg gag ttc acg gag ctg ege aaa 1056

Gin Gly Asp Gin Asp Lys Ala Phe Pro Glu Phe Thr Glu Leu Arg Lys 340 345 350 gtc cag gca gac gca atg caa gac atg get ege gcc aac tat gac gtt 1104

Val Gin Ala Asp Ala Met Gin Asp Met Ala Arg Ala Asn Tyr Asp val 355 360 365 ttg age tgc teg aac ccg ate ttt ttc atg cgt gcg cgt tac acg cgt 1152

Leu Ser Cys Ser Asn Pro lie Phe Phe Met Arg Ala Arg Tyr Thr Arg 370 375 380 tac atg cat tec aag ttt ccg ggc ctg tat ccg ccg gat atg gcc gag 1200

Tyr Met His ser Lys Phe Pro Gly Leu Tyr Pro pro Asp Met Ala Glu 385 390 395 400 aaa ctg tac ttt acg age gag ccg tac gat cgt ctg caa caa ate cag 1248

Lys Leu Tyr phe Thr Ser Glu Pro Tyr Asp Arg Leu Gin Gin lie Gin 405 410 415 cgt aaa cag aat gtt tgg tac aag att ggt ege gtg aat tga 1290

Arg Lys Gin Asn Val Trp Tyr Lys lie Gly Arg Val Asn 420 425 <210> 40 <211> 429

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 40

Met Lys Arg Ala Ile Ile val Gly Gly Gly Leu Ala Gly Gly Leu Thr1 5 10 15

Ala Ile Tyr Leu Ala Lys Arg Gly Tyr Glu Val His val Val Glu Lys20 25 30

Arg Gly Asp Pro Leu Arg Asp Leu Ser Ser Tyr val Asp val val Ser35 40 45

Ser Arg Ala Ile Gly Val Ser Met Thr val Ara Gly Ile Lys Ser val50 55 60

Leu Ala Ala Gly Ile Pro Arg Ala Glu Leu Asp Ala Cys Gly Glu Pro 65 70 75 80

Ile val Ala Met Ala Phe Ser val Gly Gly Gin Tyr Arg Met Arg Glu 85 90 95

Leu Lys Pro Leu Glu Asp Phe Arg Pro Leu Ser Leu Asn Arg Ala Ala100 105 110

Phe Gin Lys Leu Leu Asn Lys Tyr Ala Asn Leu Ala Gly Val Arg Tyr115 120 125

Tyr Phe Glu His Lys Cys Leu Asp val Asp Leu Asp Gly Lys ser val130 135 140

Leu ile Gin Gly Lys Asp Gly Gin Pro Gin Arg Leu Gin Gly Asp Met 145 150 155 160 ile ile Gly Ala Asp Gly Ala His Ser Ala val Arg Gin Ala Met Gin 165 170 175 ser Gly Leu Arg Arg Phe Glu Phe Gin Gin Thr Phe Phe Arg His Gly180 185 190

Tyr Lys Thr Leu Val Leu Pro Asp Ala Gin Ala Leu Gly Tyr Arg Lys195 200 205

Asp Thr Leu Tyr phe Phe Gly Met Asp Ser Gly Gly Leu Phe Ala Gly210 215 220

Arg Ala Ala. Thr ile Pro Asp Gly Ser val Ser lie Ala val cys Leu 225 230 235 240

Pro Tyr Ser Gly Ser pro ser Leu Thr Thr Thr Asp Glu Pro Thr Met 245 250 255

Arg Ala Phe Phe Asp Arg Tyr phe Gly Gly Leu Pro Arg Asp Ala Arg260 265 270

Asp Glu Met Leu Arg Gin Phe Leu Ala Lys Pro Ser Asn Asp Leu ile275 280 285

Asn val Arg Ser Ser Thr Phe His Tyr Lys Gly Asn Val Leu Leu Leu290 295 300

Gly Asp Ala Ala His Ala Thr Ala Pro Phe Leu Gly Gin Gly Met Asn 305 310 315 320

Met Ala Leu Glu Asp Ala Arg Thr Phe Val Glu Leu Leu Asp Arg His 325 330 335

Gin Gly Asp Gin Asp Lys Ala Phe Pro Glu Phe Thr Glu Leu Arg Lys340 345 350 val Gin Ala Asp Ala Met Gin Asp Met Ala Arg Ala Asn Tyr Asp val355 360 365

Leu Ser Cys Ser Asn Pro lie Phe Phe Met Arg Ala Arg Tyr Thr Arg370 375 380

Tyr Met His Ser Lys Phe Pro Gly Leu Tyr Pro Pro Asp Met Ala Glu 385 390 395 400

Lys Leu Tyr Phe Thr Ser Glu Pro Tyr Asp Arg Leu Gin Gin Ile Gin 405 410 415

Arg Lys Gin Asn val Trp Tyr Lys Ile Gly Arg val Asn420 425 <210> 41

<211> 1122<212> DNA <213> künstliche Sequenz<220> <223> VioD<220> <221> CDS<222> (1)..(1122)

<22 3> VioD <400> 41 atg aag att ctg gtc att ggt get got cca get ggt ctg gtt ttc gca 48

Met Lys Ile Leu val Ile Gly Ala Gly Pro Ala Gly Leu val Phe Ala 15 10 15 tcc caa ctg aag cag gca ege cct ttg tgg gcc att gac ate gtg gag 96

Ser Gin Leu Lys Gin Ala Arg Pro Leu Trp Ala Ile Asp ile Val Glu 20 25 30 aag aat gac gag caa gaa gtg ctg ggc tgg ggt gtc gtg ctg cct ggc 144

Lys Asn Asp Glu Gin Glu Val Leu Gly Trp Gly Val val Leu Pro Gly 35 40 45 egt ccg ggt cag cac ccg geg aac ccg ctg tcc tat ctg gat gca ccg 192

Arg pro Gly Gin His Pro Ala Asn Pro Leu Ser Tyr Leu Asp Ala Pro 50 55 60 gag egt ctg aat ccg caa ttt ctg gag gac ttc aaa ctg gtg cat cat 240

Glu Arg Leu Asn Pro Gin Phe Leu Glu Asp Phe Lys Leu val His His65 70 75 80 aat gag ccg tcc ttg atg tcc acg ggc gtt ttg ttg tgc ggc gtg gag 288

Asn Glu Pro ser Leu Met Ser Thr Gly Val Leu Leu Cys Gly val Glu 85 90 95 egt ege ggt ctg gtt cac geg ctg ege gat aag tgc ege age caa ggc 336

Arg Arg Gly Leu Val His Ala Leu Arg Asp Lys Cys Arg Ser Gin Gly 100 105 110 att get att egt ttc gaa age ccg ttg ctg gaa cac ggt gag ctg ccg 384

Ile Ala Ile Arg Phe Glu Ser Pro Leu Leu Glu His Gly Glu Leu Pro 115 120 125 ctg geg gac tat gat ctg gtg gtc ctg get aat ggt gtt aat cac aaa 432

Leu Ala Asp Tyr Asp Leu val Val Leu Ala Asn Gly Val Asn His Lys 130 135 140 acc geg cat ttc acc gag get ctg gtc ccg cag gtg gac tac ggc ege 480

Thr Ala His Phe Thr Glu Ala Leu val Pro Gin Val Asp Tyr Gly Arg 145 150 155 160 aat aag tac att tgg tat ggc act age cag ctg ttc gat cag atg aat 528

Asn Lys Tyr Ile Trp Tyr Gly Thr Ser Gin Leu Phe Asp Gin Met Asn 165 170 175 ctg gtt ttt egt acc cat ggt aaa gat ate ttt ate geg cat gee tat 576

Leu Val Phe Arg Thr His Gly Lys Asp Ile Phe Ile Ala His Ala Tyr 180 185 190 aag tat age gat acc atg age acg ttc att gtc gaa tgt age gaa gag 624

Lys Tyr Ser Asp Thr Met ser Thr Phe Ile Val Glu Cys Ser Glu Glu 195 200 205 act tac gca ege gca ege ctg ggc gaa atg tee gaa gag geg age gca 672

Thr Tyr Ala Arg Ala Arg Leu Gly Glu Met 5er Glu Glu Ala ser Ala 210 215 220 gaa tac gtt get aag gtg ttc cag gcc gag ctg ggt ggt cac ggc ctg 720

Glu Tyr Val Ala Lys val Phe Gin Ala Glu Leu Gly Gly His Gly Leu 225 230 235 240 gtg age cag ccg ggt ctg ggt tgg egt aac ttc atg acg ttg tet cat 768 val Ser Gin Pro Gly Leu Gly Trp Arg Asn Phe Met Thr Leu Ser His 245 250 255 gac egt tgt cat gat ggt aag ttg gtt ctg ctg ggt gac geg ctg caa 816

Asp Arg Cys His Asp Gly Lys Leu Val Leu Leu Gly Asp Ala Leu Gin 260 265 270 age ggt cac ttt age ate ggc cac ggc acc acg atg gcc gtg gtg gtg 864 ser Gly His Phe Ser Ile Gly His Gly Thr Thr Met Ala val val val 275 280 285 geg cag ctg ctg gtt aaa geg ctg tgt acc gaa gat ggt gtg ect gcc 912

Ala Gin Leu Leu val Lys Ala Leu Cys Thr Glu Asp Gly val Pro Ala 290 295 300 geg ctg aaa egt ttc gaa gag egt gcc ctg ccg ctg gtg cag ttg ttc 960

Ala Leu Lys Arg Phe Glu Glu Arg Ala Leu Pro Leu val Gin Leu Phe 305 310 315 320 egt ggc cac gca gac aac age ege gtt tgg ttc gaa acc gtc gaa gag 1008

Arg Gly His Ala Asp Asn Ser Arg val Trp Phe Glu Thr val Glu Glu 325 330 335 ege atg cac ctg tee teg geg gaa ttt gtg caa age ttc gac gca ege 1056

Arg Met His Leu Ser Ser Ala Glu Phe Val Gin ser Phe Asp Ala Arg 340 345 350 cgc aaa age ctg ccg ccg atg ccg gaa gca ctg geg cag aat ctg cgt 1104

Arg Lys Ser Leu Pro pro Met Pro Glu Ala Leu Ala Gin Asn Leu Arg355 360 365 tat get ttg cag cgc tga 1122

Tyr Ala Leu Gin Arg370 <210> 42<211> 373

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 42

Met Lys lie Leu val lie Gly Ala Gly Pro Ala Gly Leu Val Phe Ala15 10 15

Ser Gin Leu Lys Gin Ala Arg Pro Leu Trp Ala lie Asp lie Val Glu20 25 30

Lys Asn Asp Glu Gin Glu Val Leu Gly Trp Gly val val Leu Pro Gly35 40 45

Arg Pro Gly Gin His Pro Ala Asn Pro Leu Ser Tyr Leu Asp Ala Pro50 55 60

Glu Arg Leu Asn Pro Gin Phe Leu Glu Asp Phe Lys Leu val His His 65 70 75 80

Asn Glu Pro Ser Leu Met Ser Thr Gly val Leu Leu Cys Gly Val Glu 85 90 95

Arg Arg Gly Leu Val His Ala Leu Arg Asp Lys Cys Arg Ser Gin Gly100 105 110

Ile Ala Ile Arg Phe Glu Ser Pro Leu Leu Glu His Gly Glu Leu Pro 115 120 125

Leu Ala Asp Tyr Asp Leu Val Val Leu Ala Asn Gly val Asn His Lys130 135 140

Thr Ala His Phe Thr Glu Ala Leu val Pro Gin val Asp Tyr Gly Arg 145 150 155 160

Asn Lys Tyr Ile Trp Tyr Gly Thr Ser Gin Leu Phe Asp Gin Met Asn 165 170 175

Leu val Phe Arg Thr His Gly Lys Asp lie Phe lie Ala His Ala Tyr180 185 190

Lys Tyr Ser Asp Thr Met Ser Thr Phe Ile Val Glu Cys Ser Glu Glu195 200 205

Thr Tyr Ala Arg Ala Arg Leu Gly Glu Met Ser Glu Glu Ala Ser Ala210 215 220

Glu Tyr Val Ala Lys Val Phe Gin Ala Glu Leu Gly Gly His Gly Leu 225 230 235 240 val Ser Gin Pro Gly Leu Gly Trp Arg Asn Phe Met Thr Leu Ser His 245 250 255

Asp Arg Cys His Asp Gly Lys Leu val Leu Leu Gly Asp Ala Leu Gin260 265 270

Ser Gly His Phe Ser Ile Gly His Gly Thr Thr Met Ala Val Val Val275 280 285

Ala Gin Leu Leu Val Lys Ala Leu Cys Thr Glu Asp Gly val Pro Ala290 295 300

Ala Leu Lys Arg Phe Glu Glu Arg Ala Leu Pro Leu val Gin Leu Phe 305 310 315 320

Arg Gly His Ala Asp Asn Ser Arg val Trp Phe Glu Thr Val Glu Glu 325 330 335

Arg Met His Leu Ser Ser Ala Glu Phe Val Gin Ser Phe Asp Ala Arg340 345 350

Arg Lys Ser Leu Pro Pro Met Pro Glu Ala Leu Ala Gin Asn Leu Arg355 360 365

Tyr Ala Leu Gin Arg 370 <210> 43<211> 576

<212> DNA <213> künstliche Sequenz<220> <223> VioE<220> <221> CDS<222> (1)..(576)

<223> VioE <400> 43 atg gag aac egt gag cca cca ctg ttg cca gcc egt tgg age agc gcc 48

Met Glu Asn Arg Glu Pro Pro Leu Leu Pro Ala Arg Trp Ser Ser Ala 15 10 15 tat gtc tet tat tgg agc ccg atg ctg ccg gat gac cag ctg acc agc 96

Tyr val Ser Tyr Trp Ser Pro Met Leu Pro Asp Asp Gin Leu Thr Ser 20 25 30 ggc tat tgc tgg ttc gac tat gaa cgt gac ate tgt cgt att gac ggc 144

Gly Tyr cys Trp Phe Asp Tyr Glu Arg Asp Ile Cys Arg lie Asp Giy 35 40 45 ctg ttc aat ccg tgg age gag cgt gat act ggt tat egc ctg tgg atg 192

Leu Phe Asn Pro Trp 5er Glu Arg Asp Thr Gly Tyr Arg Leu Trp Met 50 55 60 teg gag gtt ggt aat geg gee age ggc cgt ace tgg aaa caa aaa gtc 240

Ser Glu Val Gly Asn Ala Ala Ser Gly Arg Thr Trp Lys Gin Lys val 65 70 75 80 gee tat ggt cgt gag cgt ace gee ctg ggt gaa cag ctg tgt gag cgt 288

Ala Tyr Gly Arg Glu Arg Thr Ala Leu Gly Glu Gin Leu Cys Glu Arg 85 90 95 ccg ctg gat gat gag act gge cct ttt gee gaa ttg ttc ctg cca ege 336

Pro Leu Asp Asp Glu Thr Gly Pro Phe Ala Glu Leu Phe Leu Pro Arg 100 105 110 gat gtc ctg ege cgt ctg ggt gee cgt cac att ggc cgt ege gtq gtt 384

Asp val Leu Arg Arg Leu Gly Ala Arg His Ile Gly Arg Arg Val Val 115 120 125 ctg ggt ege gaa geg gac gqt tgg egt tac cag ege cca ggt aaa ggt 432

Leu Gly Arg Glu Ala Asp Gly Trp Arg Tyr Gin Arg Pro Gly Lys Gly 130 135 140 ccg age acc ctg tac ctg gat geg geg age ggc act cca ctg ege atg 480

Pro Ser Thr Leu Tyr Leu Asp Ala Ala Ser Gly Thr Pro Leu Arg Met 145 150 155 160 gtc acc ggc gat gaa geg teg egt gca age ctg egt gat ttt ccg aat 528

Val Thr Gly Asp Glu Ala Ser Arg Ala Ser Leu Arg Asp Phe Pro Asn 165 170 175 gtg age gag geg gag ate ccg gac geg gtt ttc geg gec aag ege taa 576

Val Ser Glu Ala Glu Ile Pro Asp Ala val Phe Ala Ala Lys Arg 180 185 190 <210> 44 <211> 191

<212> PRT <213> künstliche Sequenz <220> <223> synthetisches Konstrukt<400> 44

Met Glu Asn Arg Glu Pro Pro Leu Leu Pro Ala Arg Trp Ser Ser Ala15 10 15

Tyr Val ser Tyr Trp Ser pro Met Leu Pro Asp Asp Gin Leu Thr Ser20 25 30

Gly Tyr Cys Trp Phe Asp Tyr Glu Arg Asp Ile Cys Arg ile Asp Gly35 40 45

Leu Phe Asn Pro Trp ser Glu Arg Asp Thr Gly Tyr Arg Leu Trp Met50 55 60

Ser Glu Val Gly Asn Ala Ala Ser Gly Arg Thr Trp Lys Gin Lys Val 65 70 75 80

Ala Tyr Gly Arg Glu Arg Thr Ala Leu Gly Glu Gin Leu Cys Glu Arg 85 90 95

Pro Leu Asp Asp Glu Thr Gly Pro Phe Ala Glu Leu Phe Leu Pro Arg100 105 110

Asp Val Leu Arg Arg Leu Gly Ala Arg His Ile Gly Arg Arg val val115 120 125

Leu Gly Arg Glu Ala Asp Gly Trp Arg Tyr Gin Arg Pro Gly Lys Gly130 135 140

Pro Ser Thr Leu Tyr Leu Asp Ala Ala Ser Gly Thr Pro Leu Arg Met 145 150 155 160

Val Thr Gly Asp Glu Ala Ser Arg Ala Ser Leu Arg Asp Phe Pro Asn 165 170 175

Val Ser Glu Ala Glu Ile Pro Asp Ala val Phe Ala Ala Lys Arg180 185 190 <21Q> 45 <211> 516

<212> DNA <213> künstliche Sequenz <220> <223> nCFP (N-terminal mcerulean) <220> <221> CDS<222> CI)..(516) <223> nCFP (N-terminal mCerulean) <400> 45 gtg age aag ggc gag gag ctg ttc acc ggg gtg gtg ccc atc ctg gtc 48

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly val val Pro Ile Leu Val 15 10 15 gag ctg gac ggc gac gta aac ggc cac aag ttc agc gtg tcc ggc gag 96

Glu Leu Asp Gly Asp val Asn Gly His Lys Phe Ser Val Ser Gly Glu 20 25 30 ggc gag ggc gat gcc acc tac ggc aag ctg acc ctg aag ttc atc tgc 144

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys 35 40 45 acc acc ggc aag ctg ccc gtg ccc tgg ccc acc ctc gtg acc acc ctg 192

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu 50 55 60 acc tgg ggc gtg cag tgc ttc gcc cgc tac ccc gac cac atg aag cag 240

Thr Trp Gly val Gin Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin 65 70 75 80 cac gac ttc ttc aag tcc gcc atg ccc gaa ggc tac gtc cag gag cgc 288

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gin Glu Arg 85 90 95 acc ate ttc ttc aag gac gac ggc aac tac aag ace ege gee gag gtg 336

Thr lie Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu val 100 105 110 aag ttc gag ggc gac acc ctg gtg aac ege ate gag ctg aag ggc ate 384

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg lie Glu Leu Lys Gly lie 115 120 125 gac ttc aag gag gac ggc aac ate ctg ggg cac aag ctg gag tac aac 432

Asp Phe Lys Glu Asp Gly Asn lie Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 gee ate age gac aac gtc tat ate acc gee gac aag cag aag aac ggc 480

Ala lie Ser Asp Asn Val Tyr lie Thr Ala Asp Lys Gin Lys Asn Gly 145 150 155 160 ate aag gee aac ttc aag ate ege cac aac ate taa 516 lie Lys Ala Asn Phe Lys lie Arg His Asn lie165 170 <210> 46<211> 171

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 46

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val val Pro Ile Leu Val15 10 15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe lie cys35 40 45

Thr Thr Gly Lys Leu Pro val Pro Trp Pro Thr Leu Val Thr Thr Leu50 55 60

Thr Trp Gly Val Gin Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin 65 70 75 80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gin Glu Arg 85 90 95

Thr lie Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val100 105 110

Lys Phe Glu Gly Asp Thr Leu val Asn Arg Ile Glu Leu Lys Gly ne115 120 125

Asp Phe Lys Glu Asp Gly Asn lie Leu Gly His Lys Leu Glu Tyr Asn130 135 140

Ala Ile Ser Asp Asn Val Tyr Ile Thr Ala Asp Lys Gin Lys Asr> Gly145 150 155 160

Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile165 170 <21D> 47 <211> 516

<212> DNA <213> künstliche Sequenz<220> <223> nYFP (N-terminal mCitrine) <220> <221> CDS<222> (1)..(516) <223> nYFP (N-terminal mCitrine) <400> 47 gtg agc aag ggc gag gag ctg ttc acc ggg gtg gtg ccc atc ctg gtc 48

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys 35 40 45 acc acc ggc aag ctg ccc gtg ccc tgg ccc acc ctc gtg acc acc ttc 192

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu val Thr Thr Phe 50 55 60 ggc tac ggc ctg atg tgc ttc gcc cgc tac ccc gac cac atg aag cag 240

Gly Tyr Gly Leu Met Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin 65 70 75 80 cac gac ttc ttc aag tcc gcc atg ccc gaa ggc tac gtc cag gag cgc 288

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr val Gin Glu Arg 85 90 95 acc atc ttc ttc aag gac gac ggc aac tac aag acc cgc gcc gag gtg 336

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu val

100 105 HO aag ttc gag ggc gac acc ctg gtg aac cgc atc gag ctg aag ggc atc 384

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile 115 120 125 gac ttc aag gag gac ggc aac atc ctg ggg cac aag ctg gag tac aac 432

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 tac aac agc cac aac gtc tat atc atg gcc gac aag cag aag aac ggc 480

Tyr Asn Ser His Asn val Tyr Ile Met Ala Asp Lys Gin Lys Asn Gly 145 150 155 160 atc aag gtg aac ttc aag atc cgc cac aac atc taa 516

Ile Lys val Asn Phe Lys Ile Arg His Asn Ile 165 170 <210> 48 <211> 171

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 48

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly val Val Pro Ile Leu Val15 10 15

Glu Leu Asp Gly Asp val Asn Gly His Lys Phe Ser Val Ser Gly Glu20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys35 40 45

Thr Thr Gly Lys Leu pro val Pro Trp pro Thr Leu val Thr Thr Phe50 55 60

Gly Tyr Gly Leu Met Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin 65 70 75 80

His Asp Phe Phe Lys ser Ala Met Pro Glu Gly Tyr val Gin Glu Arg 85 90 95

Thr ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu val100 105 110

Lys Phe Glu Gly Asp Thr Leu val Asn Arg ile Glu Leu Lys Gly Ile115 120 125

Asp Phe Lys Glu Asp Gly Asn ile Leu Gly His Lys Leu Glu Tyr Asn130 135 140

Tyr Asn Ser His Asn val Tyr Ile Met Ala Asp Lys Gin Lys Asn Gly 145 150 155 160

Ile Lys Val Asn Phe Lys Ile Arg His Asn ile 165 170

<210> 49<211> 288<212> DNA <213> künstliche Sequenz<220> <223> cCFP (C-terminal mCerulean) <220>

<221> CDS <222> ¢1)..(288) <223> cCFP (C-terminal mCerulean) <400> 49 atg gcc gac aag cag aag aac ggc atc aag gcc aac ttc aag atc cgc 48

Met Ala Asp Lys Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg15 10 15 cac aac ate gag gac ggc age gtg cag etc gee gac cac tae cag cag 96

His Asn lie Glu Asp Gly Ser val Gin Leu Ala Asp His Tyr Gin Gin 20 25 30 aac ace ccc ate ggc gac ggc ccc gtg ctg ctg ccc gac aac cac tac 144

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr 35 40 45 ctg age acc cag tcc aag ctg age aaa gac ccc aac gag aag ege gat 192

Leu Ser Thr Gin ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp 50 55 60 cac atg gtc ctg ctg gag ttc gtg acc gcc gcc ggg ate act etc ggc 240

His Met val Leu Leu Glu Phe Val Thr Ala Ala Gly lie Thr Leu Gly 65 70 75 80 atg gac gag ctg tac aag ggt ggc tet ggc ggt ggg agt gag gga age 288

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 85 90 95 <210> 50 <211> 96

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 50

Met Ala Asp Lys Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg15 10 15

His Asn lie Glu Asp Gly Ser Val Gin Leu Ala Asp His Tyr Gin Gin20 25 30

Asn Thr Pro lie Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr35 40 45

Leu Ser Thr Gin Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp50 55 60

His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly lie Thr Leu Gly 65 70 75 80

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 85 90 95 <210> 51

<211> 288<212> DNA <213> künstliche Sequenz<220> <223> cYFP (C-terminal mcitrine) <220>

<221> CDS <222> (1)..(288) <223> cyfp (c-terminal mcitrine) <400> 51 atg gcc gac aag cag aag aac ggc ate aag gtg aac ttc aag ate ege 48

Met Ala Asp Lys Gin Lys Asn Gly lie Lys Val Asn Phe Lys lie Arg 1 5 10 15 cac aac ate gag gac ggc age gtg cag etc gcc gac cac tac cag cag 96

His Asn lie Glu Asp Gly Ser Val Gin Leu Ala Asp His Tyr Gin Gin 20 25 30 aac acc ccc ate ggc gac ggc ccc gtg ctg ctg ccc gac aac cac tac 144

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr 35 40 45 ctg age tac cag tee gee ctg age aaa gac ccc aac gag aag ege gat 192

Leu ser Tyr Gin 5er Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp 50 55 60 cac atg gtc ctg ctg gag ttc gtg acc gcc gcc ggg ate act etc ggc 240

His Met Val Leu Leu Glu Phe val Thr Ala Ala Gly lie Thr Leu Gly 65 70 75 80 atg gac gag ctg tac aag got ggc tet ggc ggt ggg agt ggg gga age 288

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 85 90 95 <210> 52 <211> 96

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 52

Met Ala Asp Lys Gin Lys Asn Gly lie Lys val Asn phe Lys lie Arg15 10 15

His Asn lie Glu Asp Gly Ser val Gin Leu Ala Asp His Tyr Gin Gin20 25 30

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr35 40 45

Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp50 55 60

His Met val Leu Leu Glu Phe Val Thr Ala Ala Gly lie Thr Leu Gly 65 70 75 80

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 85 90 95 <210> 53 <211> 30

<212> DNA <213> künstliche Sequenz<220> <223> Linkerpeptid<220> <221> CDS<222> CD--(30) <223> Linkerpeptid <400> 53 ggt ggc tct gqc gat ggg agt ggg gga age 30

Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 1 5 10 <210> 54

<211> 10<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 54

Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 1 5 10 <210> 55

<211> 18<212> DNA <213> künstliche Sequenz<220> <223> His-tag<400> 55 caccaccacc accaccac 18 <210> 56

<211> 112<212> DNA <213> künstliche Sequenz<220> <223> Programm SPR, split, FRET<400> 56 gttactactc gageggaatt cgaaggggaa ttgctgctgc ggtgtttgga tggagcgtgg 60gcggggtgtg gaaattgatg ctgcattgac cacccaagac gactgcagta ca 112 <210> 57 <211> 35

<212> DNA <213> künstliche Sequenz<220> <223> Programm NICTAL<400> 57 gttactactc gagegtteta tcaatgatag ataca 35 <210> 58 <211> 90

<212> DNA <213> künstliche Sequenz<220> <223> Programm Biosynthese (123456) <400> 58 aattcgcggc cgctctagag ctgctgcggt gtttggatgg agcgtgggcg gggtgtggaa 60attgatgctg cattgaccac ccaagacgaa 90 <210> 59

<211> 79<212> DNA <213> künstliche Sequenz <220> <223> Programm Biosynthese (12346) <400> 59 aattcgcggc cgctctagag ctgctgcggt gtttggatgg agcgtgggcg gggtgtggaa 60 attgaccacc caagacgaa 79 <210> 60<211> 90

<212> DNA <213> künstliche Sequenz<220> <223> Programm Biosynthese (341256) <400> 60 aattcgcggc cgctctagag cgtgggcggg gtgtggaaat tgctgctgcg gtgtttggat 60 ggagatgctg cattgaccac ccaagacgaa 90

<210> 61<211> 1602<212> DNA <213> künstliche Sequenz<220> <223> Znf_Blues-Li nkerpepti d-vioA<220>

<221> CDS <222> (1),.(1602)

<223> Znf_Blues-Linkerpeptid-vioA <400> 61 aag agg aga aat act aga atg act aga gca agt gat gat egt ccg tat 48

Lys Arg Arg Asn Thr Arg Met Thr Arg Ala Ser Asp Asp Arg Pro Tyr 15 10 15 gca tgt ccg gtt gaa agc tgt gat egt egt ttt agc egt egt gat gtt 96

Ala Cys Pro val Glu Ser Cys Asp Arg Arg Phe Ser Arg Arg Asp Val 20 25 30 ctg atg aat cac att egt att cac aca gat cag aaa ccg ttt cag tgt 144

Leu Met Asn His Ile Arg Ile His Thr Gly Gin Lys Pro Phe Gin Cys 35 40 45 egt att tgc atg egt aat ttt age egt age gat cat ctg acc acc cat 192

Arg lie cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His 50 55 60 att cgt acc cat aca ggt gaa aaa ccg ttt gca tgt gat att tgc ggt 240 lie Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp lie Cys Gly 65 70 75 80 ege aaa ttt gca aat cgt gat acc ctg acc cgt cat age aaa att cat 288

Arg Lys Phe Ala Asn Arg A$p Thr Leu Thr Arg His Ser Lys lie His 85 90 95 ctg cgt cag aat gat ctg gaa ggt ggt age ggt ggt ggt tea ggt ggt 336

Leu Arg Gin Asn Asp Leu Glu Gly Gly Ser Gly Gly Gly Ser Gly Gly 100 105 110 agt act aga atg aaa cat tet tee gat ate tgc att gtt ggt get ggt 384

Ser Thr Arg Met Lys His Ser Ser Asp lie Cys lie val Gly Ala Gly 115 120 125 att tet ggt ttg aeg tgc gca age cat ctg ctg gac age ccg gca tgc 432 lie Ser Gly Leu Thr Cys Ala Ser His Leu Leu Asp Ser pro Ala Cys 130 135 140 cgt ggt ctg age ctg cgt ate ttt gac atg cag caa gaa gee ggt ggc 480

Arg Gly Leu Ser Leu Arg lie Phe Asp Met Gin Gin Glu Ala Gly Gly 145 150 155 160 cgt ate ege age aaa atg ctg gat ggt aag gca age att gaa ctg ggc 528

Arg lie Arg Ser Lys Met Leu Asp Gly Lys Ala ser lie Glu Leu Gly 165 170 175 gca ggt ege tac tee cct cag ttg cac ccg cat ttc caa age gca atg 576

Ala Gly Arg Tyr Ser pro Gin Leu His Pro His Phe Gin Ser Ala Met 180 185 190 cag cac tat age caa aag age gaa gtc tat ccg ttc acc cag ttg aag 624

Gin His Tyr Ser Gin Lys ser Glu val Tyr Pro Phe Thr Gin Leu Lys 195 200 205 ttc aaa tet cac gtg cag caa aag ctg aag ege gee atg aat gaa ctg 672

Phe Lys Ser His Val Gin Gin Lys Leu Lys Arg Ala Met Asn Glu Leu 210 215 220 tee ccg cgt ctg aaa gag cat ggt aaa gag age ttt ttg cag ttt gtc 720

Ser Pro Arg Leu Lys Glu His Gly Lys Glu Ser Phe Leu Gin Phe Val 225 230 235 240 age cgt tat caa ggt cac gat age geg gtt ggt atg ate ege tet atg 768

Ser Arg Tyr Gin Gly His Asp Ser Ala val Gly Met Ile Arg Ser Met 245 250 255 ggt tac gac gca ctg ttc ctg ccg gat ate age gca gaa atg gee tac 816

Gly Tyr Asp Ala Leu Phe Leu Pro Asp lie Ser Ala Glu Met Ala Tyr 260 265 270 gac att gtg ggt aag cac ccg gag ate cag age gtg aeg gac aac gac 864

Asp lie val Gly Lys His Pro Glu lie Gin ser val Thr Asp Asn Asp 275 280 285 geg aac caa tgg ttt gca geg gaa aeg ggc ttt get ggt ctg att cag 912

Ala Asn Gin Trp phe Ala Ala Glu Thr Gly Phe Ala Gly Leu lie Gin 290 295 300 ggc ate aag get aag gtt aag geg gca ggt geg cgt ttt age ctg ggt 960

Gly lie Lys Ala Lys val Lys Ala Ala Gly Ala Arg Phe ser Leu Gly 305 310 315 32Ö tat cgt ctg ctg age gtc cgt acc gac ggt gac ggc tac ctg ctg caa 1008

Tyr Arg Leu Leu Ser val Arg Thr Asp Gly Asp Gly Tyr Leu Leu Gin 325 330 335 ctg gca ggt gac gac ggc tgg aaa ctg gag cac egt acc ege cat ctg 1056

Leu Ala Gly Asp Asp Gly Trp Lys Leu Glu His Arg Thr Arg His Leu 340 345 350 att ctg geg att ccg ccg age geg atg geg ggt ttg aat gtt gat ttt 1104

Ile Leu Ala Ile Pro Pro Ser Ala Met Ala Gly Leu Asn Val Asp Phe 355 360 365 cca gaa gee tgg tcc ggt geg ege tat ggc age ctg ccg ctg ttt aag 1152

Pro Glu Ala Trp Ser Gly Ala Arg Tyr Gly Ser Leu Pro Leu Phe Lys 370 375 380 ggc ttt ctg aeg tac ggt gag ccg tgg tgg ttg gac tac aaa ctg gac 1200

Gly Phe Leu Thr Tyr Gly Glu Pro Trp Trp Leu Asp Tyr Lys Leu Asp 385 390 395 400 gat cag gtg ctg att gtt gac aac ccg ctg ege aaa atc tat ttc aaa 1248

Asp Gin Val Leu ile val Asp Asn Pro Leu Arg Lys Ile Tyr Phe Lys 405 410 415 ggc gat aag tac ctg ttc ttc tat acc gat age gag atg geg aat tac 1296

Gly Asp Lys Tyr Leu Phe Phe Tyr Thr Asp Ser Glu Met Ala Asn Tyr 420 425 430 tgg ege ggt tgt gtc geg gag ggc gag gac ggt tac ctg gag caa att 1344

Trp Arg Gly Cys val Ala Glu Gly Glu Asp Gly Tyr Leu Glu Gin ile 435 440 445 ege acc cat ttg get age gca ctg ggt atc gtc egt gaa egt atc ccg 1392

Arg Thr His Leu Ala Ser Ala Leu Gly Ile Val Arg Glu Arg Ile Pro 450 455 460 caa ccg ctg gca cac gtt cac aag tat tgg geg cac ggc gtt gag ttt 1440

Gin Pro Leu Ala His Val His Lys Tyr Trp Ala His Gly Val Glu Phe 465 470 475 480 tgc egt gat tet gat att gac cac ccg age gca ctg tet cat ege gac 1488 cys Arg Asp Ser Asp ile Asp His Pro Ser Ala Leu Ser His Arg Asp 485 490 495 age ggt ate ate geg tgc tee gat geg tac aeg gag cat tgt ggt tgg 1536

Ser Gly Ile Ile Ala Cys Ser Asp Ala Tyr Thr Glu His Cys Gly Trp 500 505 510 atg gag ggc ggt ctg ctg age gee egt gag gca age egt ctg ctg ttg 1584

Met Glu Gly Gly Leu Leu Ser Ala Arg Glu Ala Ser Arg Leu Leu Leu 515 520 525 cag egt ate gcc geg tga 1602

Gin Arg ile Ala Ala530 <210> 62<211> 533

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 62

Lys Arg Arg Asn Thr Arg Met Thr Arg Ala Ser Asp Asp Arg Pro Tyr15 10 15

Ala Cys Pro val Glu Ser cys Asp Arg Arg Phe ser Arg Arg Asp val20 25 30

Leu Met Asn His Ile Arg Ile His Thr Gly Gin Lys Pro Phe Gin Cys35 40 45

Arg Ile Cys Met Arg Asn Phe Ser Arg ser Asp His Leu Thr Thr His50 55 60

Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp ile cys Gly 65 70 75 80

Arg Lys Phe Ala Asn Arg Asp Thr Leu Thr Arg His Ser Lys Ile His 85 90 95

Leu Arg Gin Asn Asp Leu Glu Gly Gly Ser Gly Gly Gly Ser Gly Gly100 105 HO

Ser Thr Arg Met Lys His ser Ser Asp Ile Cys ile Val Gly Ala Gly115 120 125 ile Ser Gly Leu Thr cys Ala ser His Leu Leu Asp ser Pro Ala Cys130 135 140

Arg Gly Leu Ser Leu Arg Ile Phe Asp Met Gin Gin Glu Ala Gly Gly 145 150 155 160

Arg ile Arg ser Lys Met Leu Asp Gly Lys Ala Ser Ile Glu Leu Gly 165 170 175

Ala Gly Arg Tyr Ser Pro Gin Leu His Pro His Phe Gin Ser Ala Met180 185 190

Gin His Tyr ser Gin Lys Ser Glu val Tyr pro Phe Thr Gin Leu Lys195 200 205

Phe Lys ser His val Gin Gin Lys Leu Lys Arg Ala Met Asn Glu Leu210 215 220

Ser Pro Arg Leu Lys Glu His Gly Lys Glu ser Phe Leu Gin Phe val 225 230 235 240

Ser Arg Tyr Gin Gly His Asp Ser Ala val Gly Met ile Arg Ser Met 245 250 255

Gly Tyr Asp Ala Leu phe Leu Pro Asp Ile Ser Ala Glu Met Ala Tyr260 265 270

Asp ile val Gly Lys His Pro Glu Ile Gin Ser val Thr Asp Asn Asp275 280 285

Ala Asn Gin Trp Phe Ala Ala Glu Thr Gly phe Ala Gly Leu ile Gin290 295 300

Gly ile Lys Ala Lys val Lys Ala Ala Gly Ala Arg phe Ser Leu Gly 305 310 315 320

Tyr Arg Leu Leu Ser Val Arg Thr Asp Gly Asp Gly Tyr Leu Leu Gin 325 330 335

Leu Ala Gly Asp Asp Gly Trp Lys Leu Glu His Arg Thr Arg His Leu340 345 350

Ile Leu Ala ile pro pro Ser Ala Met Ala Gly Leu Asn val Asp Phe355 360 365

Pro Glu Ala Trp Ser Gly Ala Arg Tyr Gly Ser Leu Pro Leu Phe Lys370 375 380

Gly Phe Leu Thr Tyr Gly Glu Pro Trp Trp Leu Asp Tyr Lys Leu Asp 385 390 395 400

Asp Gin val Leu lie Val Asp Asn Pro Leu Arg Lys lie Tyr Phe Lys 405 410 415

Gly Asp Lys Tyr Leu Phe Phe Tyr Thr Asp Ser Glu Met Ala Asn Tyr420 425 430

Trp Arg Gly Cys val Ala Glu Gly Glu Asp Gly Tyr Leu Glu Gin Ile43 5 440 445

Arg Thr His Leu Ala Ser Ala Leu Gly lie Val Arg Glu Arg lie Pro450 455 460

Gin Pro Leu Ala His Val His Lys Tyr Trp Ala His Gly val Glu Phe 465 470 475 480

Cys Arg Asp Ser Asp lie Asp His Pro Ser Ala Leu ser His Arg Asp 485 490 495 ser Gly lie lie Ala Cys Ser Asp Ala Tyr Thr Glu His Cys Gly Trp500 505 510

Met Glu Gly Gly Leu Leu ser Ala Arg Glu Ala ser Arg Leu Leu Leu515 520 525

Gin Arg lie Ala Ala530 <210> 63 <211> 3300

<212> DNA <213> künstliche Sequenz<220>

<223> Znf_Zif268-Linkerpeptid-vioB <220> <221> CDS<222> ¢1)..(3300)

<223> znf_Zi f268-Li nkerpepti d-vi oB <400> 63 atg ccg ggt gaa aaa ccg tat gca tgt ccg gtt gaa age tgt gat cgt 48

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Val Glu ser cys Asp Arg 15 10 15 cgt ttt age cgt agt gat gaa ctg acc cgt cat att cgt att cat aca 96

Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg lie His Thr 20 25 30 ggt cag aaa ccg ttt cag tgt cgt att tgc atg cgt aat ttt age cgt 144

Gly Gin Lys Pro Phe Gin cys Arg lie cys Met Arg Asn Phe Ser Arg 35 40 45 tea gat cat ctg acc acc cat att cgt acc cat act ggc gaa aaa ccg 192 ser Asp His Leu Thr Thr His lie Arg Thr His Thr Gly Glu Lys Pro 50 55 60 ttt gcc tgt gat att tgt ggt cgt aaa ttt gca cgt tcc gat gaa cgt 240

Phe Ala Cys Asp lie Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg 65 70 75 80 aaa ege cat acc aaa att cat aeg ggt ggt ggt age ggt ggt ggt tea 288

Lys Arg His Thr Lys lie His Thr Gly Gly Gly Ser Gly Gly Gly Ser 85 90 95 ggt ggt agt act aga atg age att ctg gat ttc ccg cgt ate cac ttc 336

Gly Gly Ser Thr Arg Met ser lie Leu Asp Phe Pro Arg lie His Phe 100 105 110 cgt ggc tgg gcc cgt gtc aat geg ccg acc geg aac ege gat ccg cac 384

Arg Gly Trp Ala Arg val Asn Ala Pro Thr Ala Asn Arg Asp Pro His 115 120 125 ggc cac ate gat atg gcc age aat acc gtg geg atg geg ggt gag ccg 432

Gly His lie Asp Met Ala ser Asn Thr val Ala Met Ala Gly Glu Pro 130 135 140 ttc gac ctg gca ege cat cct aeg gag ttc cac cgt cac ctg ege tec 480

Phe Asp Leu Ala Arg His Pro Thr Glu Phe His Arg His Leu Arg Ser 145 150 155 160 ctg ggt ccg ege ttc ggc ttg gat ggt cgt get gac ccg gaa ggc ccg 528

Leu Gly Pro Arg Phe Gly Leu Asp Gly Arg Ala Asp Pro Glu Gly Pro 165 170 175 ttc age ctg gcc gag ggc tac aac get gcc ggt aac aac cac ttt teg 576

Phe Ser Leu Ala Glu Gly Tyr Asn Ala Ala Gly Asn Asn His Phe ser 180 185 190 tgg gag age gca acc gtt age cac gtg caa tgg gat ggc ggt gag geg 624

Trp Glu Ser Ala Thr val Ser His val Gin Trp Asp Gly Gly Glu Ala 195 200 205 gat cgt ggt gac ggt ctg gtc ggt get cgt ttg gca ctg tgg ggt cac 672

Asp Arg Gly Asp Gly Leu val Gly Ala Arg Leu Ala Leu Trp Gly His 210 215 220 tac aat gat tat ctg cgt acc acc ttc aat cgt get cgt tgg gtc gac 720

Tyr Asn Asp Tyr Leu Arg Thr Thr Phe Asn Arg Ala Arg Trp val Asp 225 230 235 240 age gac ccg aeg ege cgt gac get gca caa ate tat geg ggc caa ttc 768

Ser Asp Pro Thr Arg Arg Asp Ala Ala Gin lie Tyr Ala Gly Gin Phe 245 250 255 acc att age ccg get ggt gee ggt ccg ggt aeg ccg tgg ctg ttt aeg 816

Thr lie Ser Pro Ala Gly Ala Gly Pro Gly Thr pro Trp Leu Phe Thr 260 265 270 gca gac att gat gat age cat ggt gca cgt tgg aeg cgt ggc ggc cac 864

Ala Asp lie Asp Asp Ser His Gly Ala Arg Trp Thr Arg Gly Gly His 275 280 285 att gca gag cgt ggc ggc cac ttc ttg gat gaa gag ttt ggt ctg gca 912

Ile Ala Glu Arg Gly Gly His Phe Leu Asp Glu Glu Phe Gly Leu Ala 290 295 300 ege ctg ttt cag ttc tet gtg ccg aaa gat cac cca cat ttt ctg ttt 960

Arg Leu Phe Gin Phe ser val pro Lys Asp His Pro His Phe Leu Phe 305 310 315 320 cac ccg ggt ccg ttt gat tee gag gee tgg cgt cgt ctg caa ttg get 1008

His Pro Gly Pro Phe Asp Ser Glu Ala Trp Arg Arg Leu Gin Leu Ala 325 330 335 ctg gag gat gac gac gtt ctg ggt ctg acc gtg caa tat geg ttg ttc 1056

Leu Glu Asp Asp Asp Val Leu Gly Leu Thr Val Gin Tyr Ala Leu Phe 340 345 350 aat atg age acc ccg cct cag ccg aac age ccg gtt ttt cac gat atg 1104

Asn Met Ser Thr Pro Pro Gin Pro Asn Ser Pro val phe His Asp Met 355 360 365 gtc ggt gtt gtc ggt ctg tgg cgt cgt ggt gaa ctg geg age tac ccg 1152 val Gly Val val Gly Leu Trp Arg Arg Gly Glu Leu Ala Ser Tyr Pro 370 375 380 get ggt cgt ctg ctg cgt ccg cgt caa ccg ggt ctg ggt gac ctg acc 1200

Ala Gly Arg Leu Leu Arg Pro Arg Gin Pro Gly Leu Gly Asp Leu Thr 385 390 395 400 ctg ege gtc aac ggt ggt ege gtt geg ctg aat ttg geg tgt gee att 1248

Leu Arg val Asn Gly Gly Arg val Ala Leu Asn Leu Ala cys Ala lie 405 410 415 ccg ttc age act cgt gee geg cag cca age gca ccg gac ege ctg acc 1296 pro Phe Ser Thr Arg Ala Ala Gin Pro Ser Ala Pro Asp Arg Leu Thr 420 425 430 ccg gac ctg ggt gee aaa ctg ccg ctg ggc gat ctg ctg ctg cgt gat 1344

Pro Asp Leu Gly Ala Lys Leu Pro Leu Gly Asp Leu Leu Leu Arg Asp 435 440 445 gag gac ggc gca ctg ttg gca cgt gtg ccg cag get ctg tac caa gac 1392

Glu Asp Gly Ala Leu Leu Ala Arg val Pro Gin Ala Leu Tyr Gin Asp 450 455 460 tat tgg aeg aat cac gat att gtg gac ctg ccg ctg ctg ege gaa ccg 1440

Tyr Trp Thr Asn His Gly lie val Asp Leu Pro Leu Leu Arg Glu Pro 465 470 475 480 cgt ggt age ttg acc ctg age age gaa ctg geg gag tgg cgt gag caa 1488

Arg Gly Ser Leu Thr Leu ser Ser Glu Leu Ala Glu Trp Arg Glu Gin 485 490 495 gac tgg gtc acc caa age gac geg tet aac ctg tac ctg gag gca ccg 1536

Asp Trp Val Thr Gin ser Asp Ala Ser Asn Leu Tyr Leu Glu Ala Pro 500 505 510 gat ege cgt cac ggt ege ttt ttc cct gag age ate geg ctg ege age 1584

Asp Arg Arg His Gly Arg Phe Phe Pro Glu Ser lie Ala Leu Arg Ser 515 520 525 tac ttt cgc ggt gaa gcg cgt gcg cgt ccg gat ate ccg cat cgt ate 1632

Tyr Phe Arg Gly Glu Ala Arg Ala Arg Pro Asp lie Pro His Arg Ile 530 535 540 gag ggc atg ggc ctg gtc ggc gtc gaa tet cgt cag gat ggc gac get 1680

Glu Gly Met Gly Leu val Gly Val Glu Ser Arg Gin Asp Gly Asp Ala 545 550 555 560 gcg gaa tgg cgt ctg aeg ggt ctg cgt ccg ggt ccg gca cgc att gtt 1728

Ala Glu Trp Arg Leu Thr Gly Leu Arg Pro Gly Pro Ala Arg lie Val 565 570 575 ctg gac gat ggt gee gag gcg ate cct ctg cgt gtt ctg cct gac gat 1776

Leu Asp Asp Gly Ala Glu Ala lie Pro Leu Arg val Leu Pro Asp Asp 580 585 590 tgg gcg ctg gat gac gcg acc gtc gaa gaa gtg gat tac gee ttt ttg 1824

Trp Ala Leu Asp Asp Ala Thr val Glu Glu Val Asp Tyr Ala Phe Leu 595 600 605 tac cgc cac gtt atg gcg tat tac gag ctg gtg tat cca ttc atg age 1872

Tyr Arg His val Met Ala Tyr Tyr Glu Leu val Tyr Pro Phe Met Ser 610 615 620 gac aag gtg ttt tee ctg get gat cgt tgc aaa tgt gaa aeg tac gca 1920

Asp Lys Val Phe Ser Leu Ala Asp Arg Cys Lys Cys Glu Thr Tyr Ala 625 630 635 640 cgt ctg atg tgg cag atg tgt gat ccg cag aac cgc aac aag tee tat 1968

Arg Leu Met Trp Gin Met Cys Asp Pro Gin Asn Arg Asn Lys Ser Tyr 645 650 655 tac atg ccg age acc cgc gaa ctg teg gca ccg aaa get cgt ttg ttc 2016

Tyr Met Pro 5er Thr Arg Glu Leu Ser Ala Pro Lys Ala Arg Leu Phe 660 665 670 ttg aag tat ctg gee cac gtg gaa ggc cag gca cgc ctg caa gca cct 2064

Leu Lys Tyr Leu Ala His VaT Glu Gly Gin Ala Arg Leu Gin Ala Pro 675 680 685 ccg cca gcg ggt ccg gca cgc att gaa tet aaa gee cag ttg gcg gca 2112

Pro Pro Ala Gly Pro Ala Arg Ile Glu Ser Lys Ala Gin Leu Ala Ala 690 695 700 gag ctg cgt aaa gee gtc gac ctg gag ctg tet gtg atg ctg caa tac 2160

Glu Leu Arg Lys Ala val Asp Leu Glu Leu Ser Val Met Leu Gin Tyr 705 710 715 720 ctg tac gcg gcg tat age att ccg aac tat gca cag ggc caa caa cgt 2208

Leu Tyr Ala Ala Tyr Ser Ile Pro Asn Tyr Ala Gin Gly Gin Gin Arg 725 730 735 gtt cgt gac ggt gcg tgg acc gee gag cag ctg caa ctg gcg tgc ggt 2256 val Arg Asp Gly Ala Trp Thr Ala Glu Gin Leu Gin Leu Ala Cys Gly 740 745 750 age ggt gac cgt cgc cgt gat ggc ggt att cgt gca gca ctg ctg gaa 2304

Ser Gly Asp Arg Arg Arg Asp Gly Gly Ile Arg Ala Ala Leu Leu Glu 755 760 765 att get cat gaa gaa atg att cat tac ctg gtc gtt aac aac ctg ctg 2352 lie Ala His Glu Glu Met lie His Tyr Leu val val Asn Asn Leu Leu 770 775 780 atg gee ctg ggc gag ccg ttc tac gcg ggt gtc ccg ctg atg ggc gaa 2400

Met Ala Leu Gly Glu Pro Phe Tyr Ala Gly val Pro Leu Met Gly Glu 785 790 795 800 gcg gca cgt cag gcg ttt gac ctg gac acc gag ttc get ctg gaa ccg 2448

Ala Ala Arg Gin Ala Phe Gly Leu Asp Thr Glu Phe Ala Leu Glu Pro 805 810 815 ttt age gaa age aeg ctg gca cgt ttt gtt cgt ctg gaa tgg ccg cac 2496

Phe Ser Glu Ser Thr Leu Ala Arg Phe Val Arg Leu Glu Trp Pro His 820 825 830 ttt ate cca gca ccg ggc aaa tcc ate gcg gac tgc tat gcc gcc att 2544

Phe lie Pro Ala Pro Gly Lys Ser lie Ala Asp Cys Tyr Ala Ala lie 835 840 845 cgt cag gcg ttt ttg gat ctg ccg gac ttg ttt got ggc gag gca ggt 2592

Arg Gin Ala Phe Leu Asp Leu Pro Asp Leu Phe Gly Gly Glu Ala Gly 850 855 860 aag cgt ggc gat gaa cac cac ctg ttc ctg aat gag ctg acc aac cgt 2640

Lys Arg Gly Gly Glu His His Leu Phe Leu Asn Glu Leu Thr Asn Arg 865 870 875 880 gcg cat ccg ggt tat caa ctg gaa gtt ttc gat ege gac teg gcg ctg 2688

Ala His Pro Gly Tyr Gin Leu Glu Val Phe Asp Arg Asp Ser Ala Leu 885 890 895 ttt ggt att gca ttt gtg acc gat cag ggc gaa ggt ggc get ctg gac 2736

Phe Gly lie Ala Phe val Thr Asp Gin Gly Glu Gly Gly Ala Leu Asp 900 905 910 age ccg cac tac gaa cat age cat ttt caa cgt ctg cgt gaa atg age 2784

Ser Pro His Tyr Glu His Ser His Phe Gin Arg Leu Arg Glu Met Ser 915 920 925 gcg cgt ate atg get caa age gca ccg ttc gaa ccg gcg ctg ccg gcg 2832

Ala Arg lie Met Ala Gin ser Ala Pro Phe Glu Pro Ala Leu Pro Ala 930 935 940 ttg cgt aat ccg gtt ctg gat gag age ccg ggt tgc caa cgt gtc gca 2880

Leu Arg Asn Pro val Leu Asp Glu Ser Pro Gly Cys Gin Arg Val Ala 945 950 955 960 gac ggt cgt gcg cgt gcg ctg atg gca ttg tac caa ggc gtt tat gag 2928

Asp Gly Arg Ala Arg Ala Leu Met Ala Leu Tyr Gin Gly Val Tyr Glu 965 970 975 ctg atg ttt gcg atg atg gcg cag cac ttc gcc gtg aaa ccg ctg ggt 2976

Leu Met Phe Ala Met Met Ala Gin His Phe Ala val Lys Pro Leu Gly 980 985 990 age ttg cgt ege age ege ctg atg aac gca gca ate gat ctg atg acc 3024

Ser Leu Arg Arg Ser Arg Leu Met Asn Ala Ala lie Asp Leu Met Thr 995 1000 1005 ggt ctg ttg cgt ccg ctg age tgc gcg ctg atg aac ctg cca age 3069

Gly Leu Leu Arg Pro Leu Ser Cys Ala Leu Met Asn Leu Pro Ser 1010 1015 1020 ggc ate gcc ggt ege aeg gcc ggt ccg ccg ctg ccg ggt ccg gtt 3114

Gly lie Ala Gly Arg Thr Ala Gly pro Pro Leu Pro Gly Pro val 1025 1030 1035 gac acc cgt age tat gac gac tac gcg ctg ggc tgt ege atg ctg 3159

Asp Thr Arg Ser Tyr Asp Asp Tyr Ala Leu Gly Cys Arg Met Leu 1040 1045 1050 gca ege cgt tgc gag cgt ctg ctg gag cag gcg age atg ctg gaa 3204

Ala Arg Arg Cys Glu Arg Leu Leu Glu Gin Ala Ser Met Leu Glu 1055 1060 1065 ccg ggt tgg ctg ccg gat gcg cag atg gag ctg ctg gat ttc tat 3249

Pro Gly Trp Leu Pro Asp Ala Gin Met Glu Leu Leu Asp Phe Tyr 1070 107S 1080 egt cgc caa atg ctg gac ttg gcg tgc ggc aaa ctg age ege gag 3294

Arq Arg Gin Met Leu Asp Leu Ala Cys Gly Lys Leu Ser Arg Glu 1085 1090 1095 gcc taa 3300

Ala <210> 64

<211> 1099<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 64

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro val Glu Ser Cys Asp Arg15 10 15

Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg lie His Thr20 25 30

Glv Gin Lys Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe Ser Arg3 35 40 45

Ser Asp His Leu Thr Thr His lie Arg Thr His Thr Gly Glu Lys Pro 50 55 60

Phe Ala cys Asp Ile Cys Gly Arg Lys Phe Ala Arg ser Asp Glu Arg 65 70 75 80

Lys Arg His Thr Lys lie His Thr Gly Gly Gly Ser Gly Gly Gly SerM g5 90 95

Gly Gly Ser Thr Arg Met ser lie Leu Asp Phe pro Arg lie His Phe100 105

Arg Gly Trp Ala Arg Val Asn Ala Pro Thr Ala Asn Arg Asp Pro His115 120

Gly His lie Asp Met Ala Ser Asn Thr val Ala Met Ala Gly Glu Pro 130 13 5

Phe Asp Leu Ala Arg His Pro Thr Glu Phe His Arg His Leu Arg ser

Leu Gly Pro Arg Phe Gly Leu Asp Gly Arg Ala Asp Pro Glu Gly Pro

Phe ser Leu Ala Glu Gly Tyr Asn Ala Ala Gly Asn Asn His Phe Ser 180 185

Trp Glu Ser Ala Thr val ser His val Gin Trp Asp Gly Gly Glu Ala 195 200 205

Asp Arg Gly Asp Gly Leu Val Gly Ala Arg Leu Ala Leu Trp Gly His 210 215 220

Tyr Asn Asp Tyr Leu Arg Thr Thr Phe Asn Arg Ala Arg Trp val Asp 225 230 235 240

Ser Asp Pro Thr Arg Arg Asp Ala Ala Gin Ile Tyr Ala Gly Gin Phe 245 250 255

Thr Ile Ser Pro Ala Gly Ala Gly Pro Gly Thr Pro Trp Leu Phe Thr 260 265 270

Ala Asp Ile Asp Asp Ser His Gly Ala Arg Trp Thr Arg Gly Gly His 275 280 285

Ile Ala Glu Arg Gly Gly His Phe Leu Asp Glu Glu Phe Gly Leu Ala 290 295 300

Arg Leu Phe Gin Phe Ser Val Pro Lys Asp His Pro His Phe Leu Phe 305 310 315 320

His Pro Gly Pro phe Asp Ser Glu Ala Trp Arg Arg Leu Gin Leu Ala 325 330 335

Leu Glu Asp Asp Asp val Leu Gly Leu Thr val Gin Tyr Ala Leu Phe 340 345 350

Asn Met Ser Thr Pro Pro Gin Pro Asn Ser Pro Val Phe His Asp Met 355 360 365 val Gly val val Gly Leu Trp Arg Arg Gly Glu Leu Ala Ser Tyr Pro 370 375 380

Ala Gly Arg Leu Leu Arg Pro Arg Gin Pro Gly Leu Gly Asp Leu Thr 385 390 395 400

Leu Ara val Asn Gly Gly Arg val Ala Leu Asn Leu Ala cys Ala lie a 405 410 415

Pro Phe Ser Thr Arg Ala Ala Gin Pro Ser Ala Pro Asp Arg Leu Thr 420 425 430

Pro asd Leu Gly Ala Lys Leu Pro Leu Gly Asp Leu Leu Leu Arg Asp K 435 440 445

Glu asd Glv Ala Leu Leu Ala Arg val Pro Gin Ala Leu Tyr Gin Asp Υ 455 460

Tyr Trp Thr Asn His Gly Ile val Asp Leu Pro Leu Leu Arg Glu Pro 465 470 475 48Ο

Arg Gly Ser Leu Thr Leu Ser 5er Glu Leu Ala Glu Trp Arg Glu Gin 485 490 495

Asp Trp val Thr Gin Ser Asp Ala Ser Asn Leu Tyr Leu Glu Ala Pro 500 505 510

Asp Arg Arg His Gly Arg Phe Phe Pro Glu Ser ile Ala Leu Arg Ser 515 520 525

Tyr Phe Arg Gly Glu Ala Arg Ala Arg Pro Asp ile Pro His Arg Ile 530 535 540

Glu Gly Met Gly Leu val Gly val Glu Ser Arg Gin Asp Gly Asp Ala 545 550 555 560

Ala Glu Trp Arg Leu Thr Gly Leu Arg Pro Gly Pro Ala Arg ile Val 565 570 575

Leu Asp Asp Gly Ala Glu Ala ile Pro Leu Arg Val Leu Pro Asp Asp 580 585 590

Trp Ala Leu Asp Asp Ala Thr val Glu Glu val Asp Tyr Ala Phe Leu 595 600 605

Tyr Arq His Val Met Ala Tyr Tyr Glu Leu val Tyr Pro Phe Met ser 610 615 620

Asp Lys val Phe Ser Leu Ala Asp Arg Cys Lys Cys Glu Thr Tyr Ala 625 630 635 640

Arg Leu Met Trp Gin Met Cys Asp Pro Gin Asn Arg Asn Lys Ser Tyr 645 650 655

Tyr Met Pro ser Thr Arg Glu Leu Ser Ala Pro Lys Ala Arg Leu Phe 660 665 670

Leu Lys Tyr Leu Ala His Val Glu Gly Gin Ala Arg Leu Gin Ala Pro 675 680 685

Pro Pro Ala Gly Pro Ala Arg ile Glu Ser Lys Ala Gin Leu Ala Ala 690 695 700

Glu Leu Arg Lys Ala val Asp Leu Glu Leu 5er val Met Leu Gin Tyr 705 710 715 720

Leu Tvr Ala Ala Tyr Ser Ile Pro Asn Tyr Ala Gin Gly Gin Gin Arg 7 725 730 735

Val Arg Asp Gly Ala Trp Thr Ala Glu Gin Leu Gin Leu Ala Cys Gly 740 745 750

Ser Gly Asp Arg Arg Arg Asp Gly Gly Ile Arg Ala Ala Leu Leu Glu755 760 765

Ile Ala His Glu Glu Met Ile His Tyr Leu val val Asn Asn Leu Leu770 775 780

Met Ala Leu Gly Glu pro Phe Tyr Ala Gly val Pro Leu Met Gly Glu 785 790 795 800

Ala Ala Arg Gin Ala Phe Gly Leu Asp Thr Glu Phe Ala Leu Glu Pro 805 810 815

Phe ser Glu Ser Thr Leu Ala Arg Phe val Arg Leu Glu Trp pro His820 825 830

Phe Ile Pro Ala Pro Gly Lys Ser Ile Ala Asp cys Tyr Ala Ala Ile835 840 845

Arg Gin Ala Phe Leu Asp Leu Pro Asp Leu Phe Gly Gly Glu Ala Gly850 855 860

Lys Arg Gly Gly Glu His His Leu Phe Leu Asn Glu Leu Thr Asn Arg 865 870 875 880

Ala His Pro Gly Tyr Gin Leu Glu Val Phe Asp Arg Asp Ser Ala Leu 885 890 895

Phe Gly Ile Ala Phe Val Thr Asp Gin Gly Glu Gly Gly Ala Leu Asp900 905 910

Ser Pro His Tyr Glu His Ser His Phe Gin Arg Leu Arg Glu Met Ser915 920 925

Ala Arg Ile Met Ala Gin Ser Ala Pro Phe Glu Pro Ala Leu Pro Ala930 935 940

Leu Arg Asn Pro Val Leu Asp Glu Ser Pro Gly Cys Gin Arg val Ala 945 950 955 960

Asp Gly Arg Ala Arg Ala Leu Met Ala Leu Tyr Gin Gly val Tyr Glu 965 970 975

Leu Met Phe Ala Met Met Ala Gin His Phe Ala val Lys Pro Leu Gly980 985 990

Ser Leu Arg Arg Ser Arg Leu Met Asn Ala Ala Ile Asp Leu Met Thr995 1000 1005

Gly Leu Leu Arg Pro Leu Ser Cys Ala Leu Met Asn Leu Pro Ser1010 1015 1020

Gly Ile Ala Gly Arg Thr Ala Gly Pro Pro Leu Pro Gly Pro Val 1025 1030 1035

Asp Thr Arg Ser Tyr Asp Asp Tyr Ala Leu Gly Cys Arg Met Leu 1040 1045 1050

Ala Arg Arg Cys Glu Arg Leu Leu Glu Gin Ala Ser Met Leu Glu 1055 1060 1065

Pro Gly Trp Leu Pro Asp Ala Gin Met Glu Leu Leu Asp Phe Tyr 1070 1075 1080

Arg Arg Gin Met Leu Asp Leu Ala Cys Gly Lys Leu Ser Arg Glu 1085 1090 1095

Ala <210> 65<211> 873

<212> DNA <213> künstliche Sequenz<220> <223> znf_PBSII-Li nkerpepti d-vi oe<220> <221> CDS<222> CD . (873) <223> znf_PBSII-Linkerpeptid-viο <400> 65 atg ccg ggt gaa aaa ccg tat gca tgt cct gaa tgt ggt aaa agc ttt 48

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Glu Cys Gly Lys Ser Phe 1 5 10 15 agc cag egt gca aat ctg egt gca cat cag egt acc cat aca ggt gaa 96

Ser Gin Arg Ala Asn Leu Arg Ala His Gin Arg Thr His Thr Gly Glu 20 25 30 aag cct tat aaa tgc cca gaa tgc ggc aaa age ttt tea egt agc gat 144

His Leu Thr Thr His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 50 55 60 tgt cca gag tgt got aaa tea ttt agc egt agt gat gtt ctg gtt egt 240

Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg ser Asp val Leu val Arg 65 70 75 80 cat cag aga acc cac aeg got ggt ggt age ggt ggt ggt tea ggt ggt 288

His Gin Arg Thr His Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly 85 90 95 agt act aga atg gag aac egt gag cca cca ctg ttg cca gcc egt tgg 336

Ser Thr Arg Met Glu Asn Arg Glu Pro Pro Leu Leu Pro Ala Arg Trp

100 105 HO age age gee tat gtc tet tat tgg age ccg atg ctg ccg gat gac cag 384

Ser Ser Ala Tyr Val Ser Tyr Trp Ser Pro Met Leu Pro Asp Asp Gin 115 120 125 ctg acc age gac tat tgc tgg ttc gac tat gaa cgt gac ate tgt cgt 432

Leu Thr Ser Gly Tyr Cys Trp Phe Asp Tyr Glu Arg Asp Ile Cys Arg 130 135 140 att gac ggc ctg ttc aat ccg tgg age gag cgt gat act ggt tat ege 480 lie Asp Gly Leu Phe Asn Pro Trp ser Glu Arg Asp Thr Gly Tyr Arg 145 150 155 160 ctg tgg atg teg gag gtt gat aat geg gee age ggc cgt acc tgg aaa 528

Leu Trp Met Ser Glu Val Gly Asn Ala Ala Ser Gly Arg Thr Trp Lys 165 170 175 caa aaa gtc gee tat ggt cgt gag cgt acc gee etg ggt gaa cag ctg 576

Gin Lys Val Ala Tyr Gly Arg Glu Arg Thr Ala Leu Gly Glu Gin Leu 180 185 190 tgt gag cgt ccg ctg gat gat gag act ggc cct ttt gee gaa ttg ttc 624

Cys Glu Arg Pro Leu Asp Asp Glu Thr Gly Pro Phe Ala Glu Leu Phe 195 200 205 ctg cca ege gat gtc ctg ege cgt ctg ggt gee cgt cac att ggc cgt 672

Leu Pro Arg Asp Val Leu Arg Arg Leu Gly Ala Arg His Ile Gly Arg 210 215 220 ege gtg gtt ctg ggt ege gaa geg gac ggt tgg cgt tac cag ege cca 720

Arg Val Val Leu Gly Arg Glu Ala Asp Gly Trp Arg Tyr Gin Arg Pro 225 230 235 240 ggt aaa ggt ccg age acc ctg tac ctg gat geg geg age ggc act cca 768

Gly Lys Gly Pro Ser Thr Leu Tyr Leu Asp Ala Ala ser Gly Thr Pro 245 250 255 ctg ege atg gtc acc ggc gat gaa geg teg cgt gca age ctg cgt gat 816

Leu Arg Met val Thr Gly Asp Glu Ala Ser Arg Ala Ser Leu Arg Asp 260 265 270 ttt ccg aat gtg age gag geg gag ate ccg gac geg gtt ttc geg gee 864

Phe Pro Asn val Ser Glu Ala Glu lie Pro Asp Ala Val Phe Ala Ala 275 280 285 aag ege taa 873

Lys Arg290 <210> 66<211> 290

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 66

Met Pro Gly Glu Lys Pro Tyr Ala Cys Pro Glu Cys Gly Lys Ser Phe15 10 15

Ser Gin Arg Ala Asn Leu Arg Ala His Gin Arg Thr His Thr Gly Glu20 25 30

Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg ser Asp35 40 45

His Leu Thr Thr His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys50 55 60

Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp val Leu Val Arg 65 70 75 80

His Gin Arg Thr His Thr Gly Gly Gly ser Gly Gly Gly Ser Gly Gly 85 90 95

Ser Thr Arg Met Glu Asn Arg Glu Pro Pro Leu Leu Pro Ala Arg Trp100 105 HO

Ser Ser Ala Tyr Val Ser Tyr Trp Ser Pro Met Leu Pro Asp Asp Gin115 120 125

Leu Thr Ser Gly Tyr Cys Trp Phe Asp Tyr Glu Arg Asp Ile Cys Arg130 135 140 lie Asp Gly Leu Phe Asn Pro Trp Ser Glu Arg Asp Thr Gly Tyr Arg 145 150 155 160

Leu Trp Met 5er Glu Val Gly Asn Ala Ala Ser Gly Arg Thr Trp Lys 165 170 175

Gin Lys val Ala Tyr Gly Arg Glu Arg Thr Ala Leu Gly Glu Gin Leu180 185 190

Cys Glu Arg Pro Leu Asp Asp Glu Thr Gly Pro Phe Ala Glu Leu Phe195 200 205

Leu Pro Arg Asp val Leu Arg Arg Leu Gly Ala Arg His Ile Gly Arg210 215 220

Arg val val Leu Gly Arg Glu Ala Asp Gly Trp Arg Tyr Gin Arg Pro 225 230 235 240

Gly Lys Gly Pro Ser Thr Leu Tyr leu ASP A3a A^a Ser GV T^r Pro 245 250 255

Leu Arg Met Val Thr Gly Asp Glu Ala 5er Arg Ala Ser Leu Arg Asp260 265 270

Phe Pro Asn val Ser Glu Ala Glu lie Pro Asp Ala val Phe Ala Ala275 280 285

Lys Arg290 <210> 67 <211> 1419

<212> DNA <213> künstliche Sequenz<220> <223> 2nf_HivC-Linkerpeptid-vioD<220> <221> CDS<222> (1)..(1419)

<223> znf_Hi vC-Li nkerpepti d-vi oD <400> 67 atg ccc ttc cag tgt cgc att tgc atg egg aac ttt teg ctc agg aeg 48

Met Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg Thr 15 10 15 gac ett gac agg cat acc egt act cat acc ggt gaa aaa ccg ttt cag 96

Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys pro Phe Gin 20 25 30 tgt egg ate tgt atg ega aat ttc tcc etc agc cag acc ttg cgc cgc 144

Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Ser Gin Thr Leu Arg Arg 35 40 45 cat cta egt aeg cac acc ggc gag aag cca ttc caa tgc ega ata tgc 192

His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin Cys Arg ile Cys 50 55 60 atg cgc aac ttc agt ctc agg agc aac ctg ggg egg cac cta aaa acc 240

Met Arg Asn Phe Ser Leu Arg Ser Asn Leu Gly Arg His Leu Lys Thr 65 70 75 80 cac aca gga gaa aaa act aga ggc ggg tea ggc ggg ggc tea ggc ggg 288

His Thr Gly Glu Lys Thr Arg Gly Gly Ser Gly Gly Gly Ser Gly Gly 85 90 95 tea act aga atg aag att ctg gtc att ggt get ggt cca get ggt ctg 336

Ser Thr Arg Met Lys ile Leu Val Ile Gly Ala Gly Pro Ala Gly Leu 100 105 110 gtt ttc gca tcc caa ctg aag cag gca cgc cct ttg tgg gcc att gac 384 val Phe Ala Ser Gin Leu Lys Gin Ala Arg Pro Leu Trp Ala Ile Asp 115 120 125 atc gtg gag aag aat gac gag caa gaa gtg ctg ggc tgg ggt gtc gtg 432 ile val Glu Lys Asn Asp Glu Gin Glu VaT Leu Gly Trp Gly Val Val 130 135 140 ctg cct ggc egt ccg ggt cag cac ccg geg aac ccg ctg tcc tat ctg 480

Leu Pro Gly Arg Pro Gly Gin His Pro Ala Asn Pro Leu Ser Tyr Leu 145 150 155 160 gat gca ccg gag egt ctg aat ccg caa ttt ctg gag gac ttc aaa ctg 528

Asp Ala Pro Glu Arg Leu Asn Pro Gin Phe Leu Glu Asp Phe Lys Leu 165 170 175 gtg cat cat aat gag ccg tcc ttg atg tcc aeg ggc gtt ttg ttg tgc 576

Val His His Asn Glu Pro ser Leu Met Ser Thr Gly Val Leu Leu Cys 180 185 190 ggc gtg gag egt cgc ggt ctg gtt cac geg ctg cgc gat aag tgc cgc 624

Gly Val Glu Arg Arg Gly Leu Val His Ala Leu Arg Asp Lys Cys Arg 195 200 205 age caa ggc att get att egt ttc gaa agc ccg ttg ctg gaa cac ggt 672 ser Gin Gly ile Ala ile Arg Phe Glu Ser Pro Leu Leu Glu His Gly 210 215 220 gag ctg ccg ctg geg gac tat gat ctg gtg gtc ctg get aat ggt gtt 720

Glu Leu Pro Leu Ala Asp Tyr Asp Leu Val Val Leu Ala Asn Gly val225 230 235 240 aat cac aaa acc gcg cat ttc acc gag get ctg gtc ccg cag gtg gac 768

Asn His Lys Thr Ala His Phe Thr Glu Ala Leu Val Pro Gin Val Asp 245 250 255 tac ggc ege aat aag tac att tgg tat ggc act age cag ctg ttc gat 816

Tyr Gly Arg Asn Lys Tyr Ile Trp Tyr Gly Thr Ser Gin Leu Phe Asp 260 265 270 cag atg aat ctg gtt ttt egt acc cat ggt aaa gat ate ttt atc gcg 864

Gin Met Asn Leu Val Phe Arg Thr His Gly Lys Asp Ile Phe Ile Ala 275 280 285 cat gcc tat aag tat age gat acc atg agc aeg ttc att gtc gaa tgt 912

His Ala Tyr Lys Tyr ser Asp Thr Met Ser Thr Phe Ile val Glu cys 290 295 300 age gaa gag act tac gca ege gca ege ctg ggc gaa atg tee gaa gag 960

Ser Glu Glu Thr Tyr Ala Arg Ala Arg Leu Gly Glu Met Ser Glu Glu 305 310 315 320 gcg age gca gaa tac gtt get aag gtg ttc cag gcc gag ctg ggt ggt 1008

Ala ser Ala Glu Tyr val Ala Lys Val Phe Gin Ala Glu Leu Gly Gly 325 330 335 cac ggc ctg gtg agc cag ccg ggt ctg ggt tgg egt aac ttc atg aeg 1056

His Gly Leu Val ser Gin Pro Gly Leu Gly Trp Arg Asn Phe Met Thr 340 345 350 ttg tet cat gac egt tgt cat gat ggt aag ttg gtt ctg ctg ggt gac 1104

Leu Ser His Asp Arg Cys His Asp Gly Lys Leu val Leu Leu Gly Asp 355 360 365 gcg ctg caa agc ggt cac ttt agc atc ggc cac ggc acc aeg atg gcc 1152

Ala Leu Gin Ser Gly His Phe Ser lie Gly His Gly Thr Thr Met Ala 370 375 380 gtg gtg gtg gcg cag ctg ctg gtt aaa gcg ctg tgt acc gaa gat ggt 1200 val Val Val Ala Gin Leu Leu Val Lys Ala Leu Cys Thr Glu Asp Gly 385 390 395 400 gtg cct gcc gcg ctg aaa egt ttc gaa gag egt gcc ctg ccg ctg gtg 1248

Val Pro Ala Ala Leu Lys Arg Phe Glu Glu Arg Ala Leu Pro Leu Val 405 410 415 cag ttg ttc egt ggc cac gca gac aac agc ege gtt tgg ttc gaa acc 1296

Gin Leu Phe Arg Gly His Ala Asp Asn ser Arg Val Trp Phe Glu Thr 420 425 430 gtc gaa gag ege atg cac ctg tcc teg gcg gaa ttt gtg caa agc ttc 1344 val Glu Glu Arg Met His Leu ser Ser Ala Glu Phe Val Gin Ser Phe 435 440 445 gac gca ege ege aaa agc ctg ccg ccg atg ccg gaa gca ctg gcg cag 1392

Asp Ala Arg Arg Lys Ser Leu Pro Pro Met Pro Glu Ala Leu Ala Gin 450 455 460 aat ctg egt tat get ttg cag ege tga 1419

Asn Leu Arg Tyr Ala Leu Gin Arg465 470

<210> 68<211> 472<212> PRT <213> künstliche Sequenz <220> <223> synthetisches Konstrukt<400> 68

Met Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Ara Thr 1 5 10 15

Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gin 20 25 30

Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Ser Gin Thr Leu Ara Ara35 40 45

His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin Cys Arg lie Cys50 55 60

Met Arg Asn Phe Ser Leu Arg Ser Asn Leu Glv Arg His Leu Lvs Thr 65 70 75' ' 80

His Thr Gly Glu Lys Thr Arg Gly Gly Ser Gly Gly Gly ser Gly Gly 85 90 95

Ser Thr Arg Met Lys Ile Leu val Ile Gly Ala Gly Pro Ala Gly Leu100 105 110

Val Phe Ala Ser Gin Leu Lys Gin Ala Arg Pro Leu Trp Ala lie Asp115 120 125 lie val Glu Lys Asn Asp Glu Gin Glu Val Leu Gly Trp Gly Val Val130 135 140

Leu Pro Gly Arg Pro Gly Gin His Pro Ala Asn Pro Leu Ser Tyr Leu 145 150 155 160

Asp Ala Pro Glu Arg Leu Asn Pro Gin Phe Leu Glu Asp Phe Lys Leu 165 170 175 val His His Asn Glu Pro ser Leu Met ser Thr Gly val Leu Leu Cys180 185 190

Gly val Glu Arg Arg Gly Leu val His Ala Leu Arg Asp Lys Cys Arg195 200 205

Ser Gin Gly Ile Ala Ile Arg Phe Glu ser Pro Leu Leu Glu His Gly210 215 220

Glu Leu Pro Leu Ala Asp Tyr Asp Leu Val Val Leu Ala Asn Gly Val 225 230 235 240

Asn His Lys Thr Ala His Phe Thr Glu Ala Leu val Pro Gin val Asp 245 250 255

Tyr Gly Arg Asn Lys Tyr Ile Trp Tyr Gly Thr Ser Gin Leu Phe Asp260 265 270

Gin Met Asn Leu Val Phe Arg Thr His Gly Lys Asp Ile Phe Ile Ala275 280 285

His Ala Tyr Lys Tyr Ser Asp Thr Met Ser Thr Phe Ile Val Glu Cys290 295 300

Ser Glu Glu Thr Tyr Ala Arg Ala Arg Leu Gly Glu Met Ser Glu Glu305 310 315 320

Ala Ser Ala Glu Tyr Val Ala Lys Val Phe Gin Ala Glu Leu Gly Gly325 330 335

His Gly Leu Val Ser Gin Pro Gly Leu Gly Trp Arg Asn Phe Met Thr340 345 350

Leu Ser His Asp Arg Cys His Asp Gly Lys Leu Val Leu Leu Gly Asp355 360 365

Ala Leu Gin Ser Gly His Phe ser Ile Gly His Gly Thr Thr Met Ala370 375 380 val Val Val Ala Gin Leu Leu val Lys Ala Leu Cys Thr Glu Asp Gly 385 390 395 400 val Pro Ala Ala Leu Lys Arg Phe Glu Glu Arg Ala Leu Pro Leu Val 405 410 415

Gin Leu Phe Arg Gly His Ala Asp Asn Ser Arg val Trp Phe Glü Thr420 425 430 val Glu Glu Arg Met His Leu ser Ser Ala Glu Phe Val Gin Ser Phe435 440 445

Asp Ala Arg Arg Lys Ser Leu Pro Pro Met pro Glu Ala Leu Ala Gin450 455 460

Asn Leu Arg Tyr Ala Leu Gin Arg465 470 <210> 69<211> I860

<212> DNA <213> künstliche Sequenz<220> <223> Znf_Glil-Linkerpeptid-vioC<220>

<221> CDS <222> (1)..(1860)

<223> znf_Glil-Linkerpeptid-vioC <400> 69 atg aag cgt gag cct gaa tct gtg tat gaa act gac tgc cgt tgg gat 48

Met Lys Arg Glu Pro Glu Ser Val Tyr Glu Thr Asp cys Arg Trp Asp 1 5 10 15 ggc tgt age cag gaa ttt gac tcc caa gag cag ctg gtg cac cac atc 96

Gly Cys Ser Gin Glu Phe Asp Ser Gin Glu Gin Leu Val His His Ile 20 25 30 aac agc gag cac atc cac gag gag egg aag gag ttc gtg tgc cac tgg 144

VaT Val His Met Arg Arg His Thr Gly Glu Lys Pro His Lys cys Thr 65 70 75 80 ttt gaa ggg tgc egg aag tea tac tea ege etc gaa aac ctg aag aeg 288

His Leu Arg ser His Thr Gly Glu Lys Pro Tyr Met Cys Glu His Glu 100 105 110 ggc tgt agt aaa gee ttc agc aat gcc agt gac ega gcc aag cac cag 384

Gly Cys Ser Lys Ala Phe Ser Asn Ala Ser Asp Arg Ala Lys His Gin 115 120 125 aat egg acc cat tcc aat gag aag ccg tat gta tgt aag etc cct ggc 432

Cys Thr Lys Arg Tyr Thr Asp Pro Ser Ser Leu Arg Lys His Val Lys 145 150 155 160 aca gtg cat ggt cct gac gee cat gtg acc aaa egg cac egt ggg gat 528

Thr VaT His Gty Pro Asp Ala His VaT Thr Lys Arg His Arg GTy Asp 165 170 175 act aga ggc ggg tea ggc ggg ggc tea ggc ggg tea act aga atg aaa 576

Thr Arg GTy GTy Ser GTy GTy GTy Ser GTy GTy Ser Thr Arg Met Lys 180 185 190 egt geg att atc gtt ggt ggc ggc ctg geg ggt ggc ctg acc geg atc 624

Arg Ala Ile Ile val GTy GTy GTy Leu Ala GTy GTy Leu Thr Ala Ile 195 200 205 tac ctg geg aag egt ggc tac gaa gtg cac gtc gtg gag aag egt ggt 672

Tyr Leu Ala Lys Arg GTy Tyr Glu vaT His val VaT Glu Lys Arg GTy 210 215 220 gat cct ctg ege gat ctg age tct tac gtg gac gtt gtt age agc egt 720

Asp Pro Leu Arg Asp Leu Ser Ser Tyr vaT Asp Val Val Ser ser Arg 225 230 235 240 geg ate ggc gtg age atg acc gtt egt ggt ate aag age gtt ttg get 768

Ala Ile GTy VaT ser Met Thr val Arg GTy Ile Lys Ser val Leu Ala 245 250 255 geg ggc att ccg egt gca gag ctg gat geg tgt ggc gaa ccg atc gtg 816

Ala GTy Ile Pro Arg Ala Glu Leu Asp Ala Cys GTy Glu Pro Ile VaT 260 265 270 gca atg get ttc tee gtg ggt ggt cag tat ege atg ege gaa ctg aag 864

Ala Met Ala Phe Ser Val Gly Gly Gin Tyr Arg Met Arg Glu Leu Lys 275 280 285 ccg ttg gag gat ttc cgt ccg ctg age ttg aac cgt geg geg ttt caa 912

Pro Leu Glu Asp Phe Arg Pro Leu ser Leu Asn Arg Ala Ala Phe Gin 290 295 300 aag ctg ctg aac aaa tac geg aac ctg gca ggc gtt cgt tac tac ttt 960

Lys Leu Leu Asn Lys Tyr Ala Asn Leu Ala Gly val Arg Tyr Tyr Phe 305 310 315 320 gag cat aag tgc ctg gat gtt gac ctg gat ggt aag age gtg ttg att 1008

Glu His Lys Cys Leu Asp Val Asp Leu Asp Gly Lys ser val Leu lie 325 330 335 cag ggc aaa gat got cag ccg cag cgt ctg caa ggt gac atg att ate 1056

Gin Gly Lys Asp Gly Gin Pro Gin Arg Leu Gin Gly Asp Met lie lie 340 345 350 ggt geg gat ggc gee cac age gee gtc cgt cag geg atg cag age ggc 1104

Gly Ala Asp Gly Ala His Ser Ala Val Arg Gin Ala Met Gin Ser Gly 355 360 365 ctg cgt cgt ttc gag ttc cag caa aeg ttc ttc ege cat ggc tac aaa 1152

Leu Arg Arg Phe Glu Phe Gin Gin Thr Phe Phe Arg His Gly Tyr Lys 370 375 380 acc ctg gtt ttg ccg gac geg caa gca ctg ggt tac cgt aaa gac aeg 1200

Thr Leu val Leu Pro Asp Ala Gin Ala Leu Gly Tyr Arg Lys Asp Thr 385 390 395 400 ctg tac ttt ttc gac atg gat tee ggt ggc ctg ttc geg ggt cgt geg 1248

Leu Tyr Phe Phe Gly Met Asp Ser Gly Gly Leu Phe Ala Gly Arg Ala 405 410 415 get aeg ate cca gat ggt age gtc age ate gee gtt tgc ctg ccg tac 1296

Ala Thr lie Pro Asp Gly Ser Val ser Ile Ala Val cys Leu Pro Tyr 420 425 430 teg ggt age cct tee ctg aeg acc acc gac gaa ccg aeg atg cgt geg 1344

Ser Gly Ser Pro Ser Leu Thr Thr Thr Asp Glu Pro Thr Met Arg Ala 435 440 445 ttc ttc gat cgt tac ttc ggt ggc ctg ccg cgt gac geg cgt gac gaa 1392

Phe Phe Asp Arg Tyr Phe Gly Gly Leu Pro Arg Asp Ala Arg Asp Glu 450 455 460 atg ctg cgt cag ttt ctg geg aag ccg age aac gac ctg att aac gtg 1440

Met Leu Arg Gin Phe Leu Ala Lys Pro Ser Asn Asp Leu lie Asn Val 465 470 475 480 ege tet age acc ttt cac tat aag ggt aat gtg ctg ttg ctg ggt gat 1488

Arg Ser Ser Thr Phe His Tyr Lys Gly Asn val Leu Leu Leu Gly Asp 485 490 495 get geg cat geg act geg ccg ttc ctg ggt cag ggt atg aac atg geg 1536

Ala Ala His Ala Thr Ala Pro Phe Leu Gly Gin Gly Met Asn Met Ala 500 505 510 ctg gag gac gee ege aeg ttt gtc gag ctg ctg gac ege cac cag ggc 1584

Leu Glu Asp Ala Arg Thr Phe val Glu Leu Leu Asp Arg His Gin Gly 515 520 525 gac caa gac aaa gee ttt ccg gag ttc aeg gag ctg ege aaa gtc cag 1632

Asp Gin Asp Lys Ala phe Pro Glu Phe Thr Glu Leu Arg Lys Val Gin 530 535 540 gca gac gca atg caa gac atg get ege gee aac tat gac gtt ttg age 1680

Ala Asp Ala Met Gin Asp Met Ala Arg Ala Asn Tyr Asp Val Leu Ser 545 550 555 560 tgc teg aac ccg ate ttt ttc atg cgt geg cgt tac aeg cgt tac atg 1728

Cys Ser Asn Pro lie Phe Phe Met Arg Ala Arg Tyr Thr Arg Tyr Met 565 570 575 cat tee aag ttt ccg ggc ctg tat ccg ccg gat atg gee gag aaa ctg 1776

His Ser Lys Phe Pro Gly Leu Tyr Pro Pro Asp Met Ala Glu Lys Leu 580 585 590 tac ttt aeg age gag ccg tac gat cgt ctg caa caa ate cag cgt aaa 1824

Tyr Phe Thr Ser Glu Pro Tyr Asp Arg Leu Gin Gin Ile Gin Arg Lys 595 600 605 cag aat gtt tgg tac aag att ggt ege gtg aat tga 1860

Gin Asn val Trp Tyr Lys Ile Gly Arg Val Asn610 615 <210> 70 <211> 619

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 70

Met Lys Arg Glu Pro Glu Ser Val Tyr Glu Thr Asp Cys Arg Trp Asp15 10 15

Gly Cys Ser Gin Glu Phe Asp Ser Gin Glu Gin Leu Val His His lie20 25 30

Asn ser Glu His lie His Gly Glu Arg Lys Glu Phe val Cys His Trp35 40 45

Gly Gly cys ser Arg Glu Leu Arg Pro Phe Lys Ala Gin Tyr Met Leu50 55 60 val Val His Met Arg Arg His Thr Gly Glu Lys Pro His Lys Cys Thr 65 70 75 80 phe Glu Gly Cys Arg Lys ser Tyr Ser Arg Leu Glu Asn Leu Lys Thr 85 90 95

His Leu Arg Ser His Thr Gly Glu Lys Pro Tyr Met Cys Glu His Glu100 105 110

Gly Cys Ser Lys Ala Phe Ser Asn Ala Ser Asp Arg Ala Lys His Gin115 120 125

Asn Arg Thr His Ser Asn Glu Lys Pro Tyr Val Cys Lys Leu Pro Gly130 135 140

Cys Thr Lys Arg Tyr Thr Asp Pro Ser Ser Leu Arg Lys His val Lys 145 150 155 160

Thr val His Gly Pro Asp Ala His Val Thr Lys Arg His Arg Gly Asp165 170 175

Thr Arg Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Arg Met Lys180 185 190

Ara Ala Ile Ile val Gly Gly Gly Leu Ala Gly Gly Leu Thr Ala Ile195 200 205

Tyr Leu Ala Lys Arg Gly Tyr Glu val His val Val Glu Lys Arg Gly210 215 220

Asp Pro Leu Arg Asp Leu Ser Ser Tyr val Asp val val Ser Ser Arg 225 250 235 240

Ala Ile Gly Val Ser Met Thr val Arg Gly Ile Lys Ser Val Leu Ala 245 250 255

Ala Gly Ile Pro Arg Ala Glu Leu Asp Ala Cys Gly Glu Pro Ile Val260 265 270

Ala Met Ala Phe Ser Val Gly Gly Gin Tyr Arg Met Arg Glu Leu Lys275 280 285

Pro Leu Glu Asp Phe Arg Pro Leu ser Leu Asn Arg Ala Ala Phe Gin290 295 500

Lys Leu Leu Asn Lys Tyr Ala Asn Leu Ala Gly val Arg Tyr Tyr Phe 305 310 515 320

Glu His Lys Cys Leu Asp val Asp Leu Asp Gly Lys Ser val Leu ile 325 330 335

Gin Gly Lys Asp Gly Gin Pro Gin Arg Leu Gin Gly Asp Met Ile ile340 345 350

Gly Ala Asp Gly Ala His Ser Ala Val Arg Gin Ala Met Gin ser Gly355 360 365

Leu Arg Arg Phe Glu Phe Gin Gin Thr Phe Phe Arg His Gly Tyr Lys370 375 380

Thr Leu val Leu Pro Asp Ala Gin Ala Leu Gly Tyr Arg Lys Asp Thr 385 390 395 400

Leu Tyr Phe Phe Gly Met Asp Ser Gly Gly Leu Phe Ala Gly Arg Ala 405 410 415

Ala Thr ile pro Asp Gly Ser Val Ser ile Ala val Cys Leu Pro Tyr420 425 430

Ser Gly Ser Pro 5er Leu Thr Thr Thr Asp Glu Pro Thr Met Arg Ala 435 440 445

Phe Phe Asp Arg Tyr Phe Gly Gly Leu Pro Arg Asp Ala Arg Asp Glu 450 455 460

Met Leu Arg Gin Phe Leu Ala Lys Pro Ser Asn Asp Leu Ile Asn Val 465 470 475 480

Arg Ser Ser Thr Phe His Tyr Lys Gly Asn Val Leu Leu Leu Gly Asp 485 490 495

Ala Ala His Ala Thr Ala Pro Phe Leu Gly Gin Gly Met Asn Met Ala500 505 510

Leu Glu Asp Ala Arg Thr Phe Val Glu Leu Leu Asp Arg His Gin Gly 515 520 525

Asp Gin Asp Lys Ala Phe Pro Glu Phe Thr Glu Leu Arg Lys val Gin 530 535 540

Ala Asp Ala Met Gin Asp Met Ala Arg Ala Asn Tyr Asp Val Leu Ser 545 550 555 560

Cys Ser Asn Pro Ile Phe Phe Met Arg Ala Arg Tyr Thr Arg Tyr Met 565 570 575

His Ser Lys Phe Pro Gly Leu Tyr Pro Pro Asp Met Ala Glu Lys Leu580 585 590

Tyr Phe Thr ser Glu Pro Tyr Asp Arg Leu Gin Gin Ile Gin Arg Lys 595 600 605

Gin Asn val Trp Tyr Lys Ile Gly Arg val Asn 610 615

<210> 71<211> 1113<212> DNA <213> künstliche Sequenz<220>

<223> Hi s_tag-znf_Gli1-Li nkerpepti d-nCFP <220> <221> CDS<222> ¢1)..(1113)

<223> His_tag-Znf_Gli1-Linkerpeptid-nCFP <400> 71 atg tat cat cac cat cac cat cac act aga aag egt gag cct gaa tet 48

Met Tyr His His His His His His Thr Arg Lys Arg Glu Pro Glu Ser15 10 15 gtg tat gaa act gac tgc egt tgg gat ggc tgt agc cag gaa ttt gac 96

Val Tyr Glu Thr Asp Cys Arg Trp Asp Gly Cys Ser Gin Glu Phe Asp20 25 30 tcc caa gag cag ctg gtg cac cac ate aac age gag cac atc cac ggg 144

Ser Gin Glu Gin Leu Val His His Ile Asn Ser Glu His ile His Gly 35 40 45 gag egg aag gag ttc gtg tgc cac tgg ggg ggc tgc tcc agg gag ctg 192

Glu Arg Lys Glu Phe Val Cys His Trp Gly Gly Cys Ser Arg Glu Leu 50 55 60 agg ccc ttc aaa gcc cag tac atg ctg gtg gtt cac atg ege aga cac 240

Arg Pro Phe Lys Ala Gin Tyr Met Leu Val Val His Met Arg Arg His 65 70 75 80 act ggc gag aag cca cac aag tgc aeg ttt gaa ggg tgc egg aag tea 288

Thr Gly Glu Lys Pro His Lys Cys Thr Phe Glu Gly Cys Arg Lys Ser 85 90 95 tac tea ege etc gaa aac ctg aag aeg cac ctg egg tea cac aeg ggt 336

Tyr Ser Arg Leu Glu Asn Leu Lys Thr His Leu Arg Ser His Thr Gly

100 105 HO gag aag cca tac atg tgt gag cac gag ggc tgt agt aaa gee ttc age 384

Glu Lys Pro Tyr Met Cys Glu His Glu Gly Cys Ser Lys Ala Phe Ser 115 120 125 aat gee agt gac ega gee aag cac cag aat egg acc cat tcc aat gag 432

Asn Ala Ser Asp Arg Ala Lys His Gin Asn Arg Thr His Ser Asn Glu 130 135 140 aag ccg tat gta tgt aag etc cct ggc tgc acc aaa ege tat aca gat 480

Lys Pro Tyr val cys Lys Leu Pro Gly Cys Thr Lys Arg Tyr Thr Asp 145 150 155 160 cct age teg ctg ega aaa cat gtc aag aca gtg cat ggt cct gac gcc 528

Pro Ser Ser Leu Arg Lys His val Lys Thr val His Gly Pro Asp Ala 165 170 175 cat gtg acc aaa egg cac egt ggg gat act aga ggc ggg tea ggc ggg 576

His Val Thr Lys Arg His Arg Gly Asp Thr Arg Gly Gly Ser Gly Gly 180 185 190 ggc tea ggc ggg tea act aga gtg age aag ggc gag gag ctg ttc acc 624

Gly Ser Gly Gly Ser Thr Arg Val Ser Lys Gly Glu Glu Leu Phe Thr 195 200 205 ggg gtg gtg ccc atc ctg gtc gag ctg gac ggc gac gta aac ggc cac 672

Gly Val Val Pro Ile Leu val Glu Leu Asp Gly Asp Val Asn Gly His 210 215 220 aag ttc age gtg tcc ggc gag ggc gag ggc gat gcc acc tac ggc aag 720

Lys Phe Ser val ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys 225 230 235 240 ctg acc ctg aag ttc atc tgc acc acc ggc aag ctg ccc gtg ccc tgg 768

Leu Thr Leu Lys Phe ile cys Thr Thr Gly Lys Leu Pro val Pro Trp 245 250 255 ccc acc etc gtg acc acc ctg acc tgg ggc gtg cag tgc ttc gcc ege 816

Pro Thr Leu val Thr Thr Leu Thr Trp Gly Val Gin Cys Phe Ala Arg 260 265 270 tac ccc gac cac atg aag cag cac gac ttc ttc aag tcc gcc atg ccc 864

Tyr Pro Asp His Met Lys Gin His Asp Phe Phe Lys Ser Ala Met Pro 275 280 285 gaa ggc tac gtc cag gag ege acc atc ttc ttc aag gac gac ggc aac 912

Glu Gly Tyr val Gin Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn 290 295 300 tac aag acc cgc gcc gag gtg aag ttc gag ggc gac acc ctg gtg aac 960

Tyr Lys Thr Arg Ala Glu val Lys Phe Glu Gly Asp Thr Leu val Asn 305 310 315 320 cgc ate gag ctg aag ggc ate gac ttc aag gag gac ggc aac ate ctg 1008

Arg Ile Glu Leu Lys Gly lie Asp Phe Lys Glu Asp Gly Asn Ile Leu 325 330 335 ggg cac aag ctg gag tac aac gcc ate age gac aac gtc tat ate acc 1056

Gly His Lys Leu Glu Tyr Asn Ala lie Ser Asp Asn val Tyr lie Thr 340 345 350 gcc gac aag cag aag aac ggc ate aag gcc aac ttc aag ate cgc cac 1104

Ala Asp Lys Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His 355 360 365 aac ate taa 1113

Asn lie370 <210> 72 <211> 370

<212> PRT <213> künstliche Sequenz <22Q> <223> synthetisches Konstrukt<400> 72

Met Tyr His His His His His His Thr Arg Lys Arg Glu Pro Glu Ser15 10 15 val Tyr Glu Thr Asp Cys Arg Trp Asp Gly Cys Ser Gin Glu Phe Asp 20 25 30

Ser Gin Glu Gin Leu Val His His lie Asn Ser Glu His lie His Gly 35 40 45

Glu Arg Lys Glu Phe val cys His Trp Gly Gly Cys ser Arg Glu Leu50 55 60

Ara Pro Phe Lys Ala Gin Tyr Met Leu val val His Met Arg Arg His 65 70 75 80

Thr Gly Glu Lys Pro His Lys Cys Thr Phe Glu Gly Cys Arg Lys Ser 85 90 95

Tvr ser Arg Leu Glu Asn Leu Lys Thr His Leu Arg ser His Thr Gly y 100 105 110

Glu Lys Pro Tyr Met cys Glu His Glu Gly Cys Ser Lys Ala Phe Ser 115 120 125

Asn Ala ser Asp Arg Ala Lys His Gin Asn Arg Thr His Ser Asn Glu130 135 140

Lys Pro Tyr Val Cys Lys Leu Pro Gly Cys Thr Lys Arg Tyr Thr Asp 145 150 155 160

Pro Ser Ser Leu Arg Lys His val Lys Thr val His Gly Pro Asp Ala 165 170 175

His Val Thr Lys Arg His Arg Gly Asp Thr Arg Gly Gly Ser Gly Gly180 185 190

Gly ser Gly Gly Ser Thr Arg Val Ser Lys Gly Glu Glu Leu Phe Thr195 200 205

Gly val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His210 215 220

Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys 225 230 235 240

Leu Thr Leu Lys Phe lie cys Thr Thr Gly Lys Leu Pro Val Pro Trp 245 250 255

Pro Thr Leu val Thr Thr Leu Thr Trp Gly val Gin Cys Phe Ala Arg260 265 270

Tyr Pro Asp His Met Lys Gin His Asp Phe Phe Lys Ser Ala Met Pro275 280 285

Glu Gly Tyr Val Gin Glu Arg Thr lie Phe Phe Lys Asp Asp Gly Asn290 295 300

Tyr Lys Thr Arg Ala Glu val Lys Phe Glu Gly Asp Thr Leu val Asn 305 310 315 320

Arg lie Glu Leu Lys Gly lie Asp Phe Lys Glu Asp Gly Asn Ile Leu 325 330 335

Gly His Lys Leu Glu Tyr Asn Ala lie Ser Asp Asn Val Tyr lie Thr340 345 350

Ala Asp Lys Gin Lys Asn Gly lie Lys Ala Asn Phe Lys Ile Arg His355 360 365

Asn lie370 <210> 73 <211> 864

<212> DNA <213> künstliche Sequenz<22Q>

<223> His_tag-znf_BlueS“Linkerpeptid-nCFP <220> <221> CDS<222> (1)- .(864) <223> Hi s_tag-Znf_Blues-Li nkerpepti d-nCFP<400> 73 atg tat cat cac cat cac cat cac act aga gca agt gat gat cgt ccg 48

Met Tyr His His His His His His Thr Arg Ala Ser Asp Asp Arg Pro 15 10 15 tat gca tgt ccg gtt gaa age tgt gat cgt cgt ttt age cgt cgt gat 96

Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Arg Asp 20 25 30 gtt ctg atg aat cac att cgt att cac aca ggt cag aaa ccg ttt cag 144

Val Leu Met Asn His Ile Arg lie His Thr Gly Gin Lys Pro Phe Gin 35 40 45 tgt cgt att tgc atg cgt aat ttt age cgt age gat cat ctg acc acc 192

Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr 50 55 60 cat att cgt acc cat aca ggt gaa aaa ccg ttt gca tgt gat att tgc 240

His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp lie Cys 65 70 75 80 ggt ege aaa ttt gca aat cgt gat acc ctg acc cgt cat age aaa att 288

Gly Arg Lys Phe Ala Asn Arg Asp Thr Leu Thr Arg His Ser Lys lie 85 90 95 cat ctg cgt cag aat gat ctg gaa ggt ggt age ggt ggt ggt tea ggt 336

His Leu Arg Gin Asn Asp Leu Glu Gly Gly Ser Gly Gly Gly Ser Gly 100 105 110 ggt agt act aga gtg age aag ggc gag gag ctg ttc acc ggg gtg gtg 384

Gly Ser Thr Arg Val Ser Lys Gly Glu Glu Leu Phe Thr Gly val Val 115 120 125 ccc ate ctg gtc gag ctg gac ggc gac gta aac ggc cac aag ttc age 432

Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser 130 135 140 gtg tcc ggc gag ggc gag ggc gat gcc acc tac ggc aag ctg acc ctg 480

Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu 145 150 155 160 aag ttc ate tgc acc acc ggc aag ctg ccc gtg ccc tgg ccc acc etc 528

Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu 165 170 175 gtg acc acc ctg acc tgg ggc gtg cag tgc ttc gcc ege tac ccc gac 576

Val Thr Thr Leu Thr Trp Gly Val Gin Cys Phe Ala Arg Tyr Pro Asp 180 185 190 cac atg aag cag cac gac ttc ttc aag tcc gcc atg ccc gaa ggc tac 624

His Met Lys Gin His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr 195 200 205 gtc cag gag ege acc ate ttc ttc aag gac gac ggc aac tac aag acc 672

Val Gin Glu Arg Thr lie Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr 210 215 220 ege gcc gag gtg aag ttc gag ggc gac acc ctg gtg aac ege ate gag 720

Arg Ala Glu val Lys Phe Glu Gly Asp Thr Leu val Asn Arg lie Glu 225 230 235 240 ctg aag ggc ate gac ttc aag gag gac ggc aac ate ctg ggg cac aag 768

Leu Lys Gly lie Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys 245 250 255 ctg gag tac aac gcc ate agc gac aac gtc tat atc acc gcc gac aag 816

Leu Glu Tyr Asn Ala Ile Ser Asp Asn Val Tyr Ile Thr Ala Asp Lys 260 265 270 cag aag aac gac atc aag gcc aac ttc aag atc cgc cac aac atc taa 864

Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile 275 280 285 <210> 74 <211> 287

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 74

Met Tyr His His His His His His Thr Arg Ala Ser Asp Asp Arg Pro15 10 15

Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Arg Asp20 25 30 val Leu Met Asn His Ile Arg lie His Thr Gly Gin Lys Pro Phe Gin35 40 45

Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr50 55 60

His Ile Arg Thr His Thr Gly Glu Lys Pro phe Ala Cys Asp Ile Cys 65 70 75 80

Gly Arg Lys Phe Ala Asn Arg Asp Thr Leu Thr Arg His Ser Lys Ile 85 90 95

His Leu Arg Gin Asn Asp Leu Glu Gly Gly Ser Gly Gly Gly ser Gly100 105 110

Gly Ser Thr Arq val ser Lys Gly Glu Glu Leu Phe Thr Gly val val115 120 125

Pro ile Leu val Glu Leu Asp Gly Asp val Asn Gly His Lys Phe ser130 135 140

Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu 145 150 155 160

Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu 165 170 175

Val Thr Thr Leu Thr Trp Gly Val Gin cys Phe Ala Arg Tyr pro Asp180 185 190

His Met Lys Gin His Asp Phe Phe Lys Ser Ala Met pro Glu Gly Tyr 195 200 205

Val Gin Glu Arg Thr lie Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr210 215 220

Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu val Asn Arg Ile Glu 225 230 235 240

Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys 245 250 255

Leu Glu Tyr Asn Ala Ile Ser Asp Asn val Tyr Ile Thr Ala Asp Lys260 265 270

Gin Lys Asn Gly lie Lys Ala Asn Phe Lys ile Arg His Asn Ile275 280 285 <Z10> 75

<211> 840<212> DNA <213> künstliche Sequenz <220>

<223> Hi s_tag-Znf_PBSII_Li nkerpepti d-nYFP <220> <221> CDS<222> (1)..(840)

<223> Hi s_tag-Znf_PBSll_Li nkerpepti d-nYFP <400> 75 atg tat cat cac cat cac cat cac act aga ccg ggt gaa aaa ccg tat 48

Met Tyr His His His His His His Thr Arg Pro Gly Glu Lys Pro Tyr 15 10 15 gca tgt cct gaa tgt ggt aaa age ttt agc cag egt gca aat ctg egt 96

Ala Cys Pro Glu Cys Gly Lys Ser Phe Ser Gin Arg Ala Asn Leu Arg 20 25 30 gca cat cag egt acc cat aca ggt gaa aag cct tat aaa tgc cca gaa 144

Ala His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 35 40 45 tgc ggc aaa age ttt tea egt age gat cat ctg acc acc cat cag ege 192

Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gin Arg 50 55 60 aca cat act ggc gag aaa cct tac aaa tgt cca gag tgt ggt aaa tea 240

Thr His Thr Gly Glu Lys Pro Tyr Lys cys Pro Glu cys Gly Lys Ser 65 70 75 80 ttt agc egt agt gat gtt ctg gtt egt cat cag aga acc cac aeg ggt 288

Phe Ser Arg Ser Asp Val Leu val Arg His Gin Arg Thr His Thr Gly 85 90 95 ggt ggt age ggt ggt ggt tea ggt ggt agt act aga gtg agc aag ggc 336

Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Arg Val Ser Lys Gly 100 105 110 gag gag ctg ttc acc ggg gtg gtg ccc atc ctg gtc gag ctg gac ggc 384

Glu Glu Leu Phe Thr Gly val val Pro ile Leu Val Glu Leu Asp Gly 115 120 125 gac gta aac ggc cac aag ttc age gtg tec ggc gag ggc gag ggc gat 432

Asp Val Asn Gly His Lys Phe Ser val Ser Gly Glu Gly Glu Gly Asp 130 135 140 gee ace tac ggc aag ctg ace ctg aag ttc ate tgc ace ace ggc aag 480

Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe lie Cys Thr Thr Gly Lys 145 150 15 5 160 ctg ccc gtg ccc tgg ccc ace etc gtg ace ace ttc ggc tac ggc ctg 528

Leu Pro Val Pro Trp Pro Thr Leu val Thr Thr Phe Gly Tyr Gly Leu 165 170 175 atg tgc ttc gcc ege tac ccc gac cac atg aag cag cac gac ttc ttc 576

Met Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin His Asp Phe Phe 180 185 190 aag tcc gcc atg ccc gaa ggc tac gtc cag gag ege acc ate ttc ttc 624

Lys Ser Ala Met Pro Glu Gly Tyr val Gin Glu Arg Thr lie Phe Phe 195 200 205 aag gac gac ggc aac tac aag acc ege gcc gag gtg aag ttc gag ggc 672

Lys Asp Asp Giy Asn Tyr Lys Thr Arg Ala Glu vaT Lys Phe Glu Gly 210 215 220 gac acc ctg gtg aac ege ate gag ctg aag ggc ate gac ttc aag gag 720

Asp Thr Leu Val Asn Arg lie Glu Leu Lys Gly lie Asp Phe Lys Glu 225 230 235 240 gac ggc aac ate ctg ggg cac aag ctg gag tac aac tac aac age cac 768

Asp Gly Asn lie Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His 245 250 255 aac gtc tat ate atg gcc gac aag cag aag aac ggc ate aag gtg aac 816

Asn val Tyr lie Met Ala Asp Lys Gin Lys Asn Gly lie Lys val Asn 260 265 270 ttc aag ate ege cac aac ate taa 840

Phe Lys lie Arg His Asn lie 275 <210> 76 <211> 279

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 76

Met Tyr His His His His His His Thr Arg Pro Gly Glu Lys Pro Tyr15 10 15

Ala Cys Pro Glu Cys Gly Lys Ser Phe Ser Gin Arg Ala Asn Leu Arg20 25 30

Ala His Gin Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu35 40 45

Cys Gly Lys Ser Phe Ser Arg ser Asp His Leu Thr Thr His Gin Arg50 55 60

Thr His Thr Gly Glu Lys Pro Tyr Lys cys Pro Glu Cys Gly Lys Ser 65 70 75 80

Phe Ser Arg Ser Asp val Leu Val Arg His Gin Arg Thr His Thr Gly 85 00 95

Glv Glv Ser Gly Gly Gly Ser Gly Gly Ser Thr Arg Val Ser Lys Gly y 100 105 110

Glu Glu Leu Phe Thr Gly Val val Pro Ile Leu Val Glu Leu Asp Gly 115 120 125

Asp val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp130 135 140

Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile cys Thr Thr Gly Lys 145 150 155 160

Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly Leu 165 170 175

Met Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gin His Asp phe Phe 180 185 190

Lys Ser Ala Met Pro Glu Gly Tyr val Gin Glu Arg Thr Ile Phe Phe 195 200 205

Lys asp asp Gly Asn Tyr Lys Thr Arg Ala Glu val Lys Phe Glu Gly210 215 220

Asp Thr Leu val Asn Arg ile Glu Leu Lys Gly ile Asp Phe Lys Glu 225 230 235 240

Asp Gly Asn ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His 245 250 255

Asn Val Tyr Ile Met Ala Asp Lys Gin Lys Asn Gly Ile Lys val Asn 260 265 270

Phe Lys Ile Arg His Asn ile275 <210> 77 <211> 573

<212> DNA <213> künstliche Sequenz<220> <223> cCFP-Linkerpeptid-Znf_Hlvc-Hi s_tag <220> <221> CDS<222> ¢1)..(573) <223> cCFP-Li nkerpeptid-znf_Hivc-Hi s_tag <400> 77 atg gcc gac aag cag aag aac ggc ate aag gee aac ttc aag ate ege 48

Met Ala Asp Lys Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg 15 10 15 cac aac ate gag gac ggc age gtg cag etc gcc gac cac tac cag cag 96

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr 35 40 45 ctg age ace cag tee aag ctg age aaa gac ccc aac gag aag ege gat 192

His Met val Leu Leu Glu Phe val Thr Ala Ala Gly lie Thr Leu Gly 55 70 75 80 atg gac gag ctg tac aag ggt ggc tet ggc ggt ggg agt ggg gga age 288

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 85 90 95 act aga ccc ttc cag tgt ege att tgc atg egg aac ttt teg etc agg 336

Thr Arg Pro Phe Gin cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg 100 105 110 aeg gac ett gac agg cat acc cgt act cat acc ggt gaa aaa ccg ttt 384

Thr Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe 115 120 125 cag tgt egg ate tgt atg ega aat ttc tee etc age cag acc ttg ege 432

Gin Cys Arg He Cys Met Arg Asn Phe Ser Leu Ser Gin Thr Leu Arg 130 135 140 ege cat eta cgt aeg cac acc ggc gag aag cca ttc caa tgc ega ata 480

Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin cys Arg Ile 145 150 155 160 tgc atg ege aac ttc agt etc agg age aac ctg ggg egg cac eta aaa 528 cys Met Arg Asn phe Ser Leu Arg 5er Asn Leu Gly Arg His Leu Lys 165 170 175 acc cac aca gga gaa aaa act aga cat cac cat cac cat cac taa 573

Thr His Thr Gly Glu Lys Thr Arg His His His His His His 180 185 190 <210> 78 <211> 190

<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 78

Met Ala Asp Lys Gin Lys Asn Gly He Lys Ala Asn Phe Lys Ile Arg 1 5 10 15

His Asn lie Glu Asp Gly ser val Gin Leu Ala Asp His Tyr Gin Gin20 25 30

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr 35 40 45

Leu Ser Thr Gin Ser Lvs Leu Ser tys Asp pro Asn Glu Lys Arg Asp50 55 60

His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly 65 70 75 80

Met Asp Glu Leu Tyr Lys Gly Gly 5er Gly Gly Gly 5er Gly Gly Ser 85 90 95

Thr Arq Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg100 105 HO

Thr Asp Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe115 120 125

Gin Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Ser Gin Thr Leu Arg130 135 140

Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gin Cys Arg Ile 145 150 155 160

Cys Met Arg Asn Phe Ser Leu Arg 5er Asn Leu Gly Arg His Leu Lys 165 170 175

Thr His Thr Gly Glu Lys Thr Arg His His His His His His180 185 190 <210> 79 <211> 633

<212> DNA <213> künstliche Sequenz<220> <223> cCFP-Linkerpeptid-Znf_3azz-Linkerpeptid-His_tag<220>

<221> CDS <222> CI)..(633) ^ ^ . <223> cCFP-Li nkerpepti d-Znf_3azz-Linkerpeptid-His_tag <400> 79 atg gcc gac aag cag aag aac ggc atc aag gcc aac ttc aag atc cgc 48

Met Ala Asp Lys Gin Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg 15 10 15 cac aac atc gag gac ggc agc gtg cag ctc gcc gac cac tac cag cag 96

His Asn Ile Glu Asp Gly Ser VaT Gin Leu Ala Asp His Tyr Gin Gin 20 25 30 aac acc ccc atc ggc gac ggc ccc gtg ctg ctg ccc gac aac cac tac 144

Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr 35 40 45 ctg agc acc cag tcc aag ctg age aaa gac ccc aac gag aag cgc gat 192

His Met val Leu Leu Glu Phe val Thr Ala Ala Gly Ile Thr Leu Gly 65 70 75 80 atg gac gag ctg tac aag ggt ggc tet ggc ggt ggg agt ggg gga age 288

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 85 90 95 act aga gca agt gat gat cgt ccg tat gca tgt ccg gtt gaa age tgt 336

Thr Arg Ala Ser Asp Asp Arg Pro Tyr Ala Cys Pro val Glu Ser Cys 100 105 110 gat cgt cgt ttt age cgt agt gat gaa ctg acc cgt cat att cgt att 384

Asp Arg Arg Phe Ser Arg ser Asp Glu Leu Thr Arg His Ile Arg lie 115 120 125 cat aca ggt cag aaa cct ttt cag tgt cgt att tgc atg cgt aat ttt 432

His Thr Gly Gin Lys Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe 130 135 140 age tea aga gat gtt ctg cgt cgt cat aat cgt acc cat aeg ggt gaa 480

Ser Ser Arg Asp Val Leu Arg Arg His Asn Arg Thr His Thr Giy Glu 145 150 155 160 aaa ccg ttt gca tgt gat att tgc ggt cgt aaa ttt gca agt cgt gac 528

Lys Pro Phe Ala cys Asp Ile cys Gly Arg Lys Phe Ala Ser Arg Asp 165 170 175 gtg ctg cgt ege cat aac ege att cat ctg cgt cag aat gat ctg gaa 576

Val Leu Arg Arg His Asn Arg lie His Leu Arg Gin Asn Asp Leu Glu 180 185 190 ggt gat age gat ggt ggt tea ggt ggt agt act aga cac cac cac cac 624

Gly Gly Ser Gly Gly Gly ser Gly Gly ser Thr Arg His His His His 195 200 205 cac cac tag 633

His His 210

<210> 80<211> 210<212> PRT <213> künstliche Sequenz<220> <223> synthetisches Konstrukt<400> 80

Met Ala Asp Lys Gin Lys Asn Gly lie Lys Ala Asn Phe Lys Ile Arg15 10 15

His Asn lie Glu Asp Gly Ser Val Gin Leu Ala Asp His Tyr Gin Gin20 25 30

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr35 40 45

Leu Ser Thr Gin Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp50 55 60

His Met val Leu Leu Glu Phe val Thr Ala Ala Gly lie Thr Leu Gly 65 70 75 80

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 85 90 95

Thr Arg Ala ser Asp Asp Arg Pro Tyr Ala Cys Pro val Glu ser cys100 105 HO

Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile115 120 125

His Thr Gly Gin Lys Pro Phe Gin Cys Arg Ile Cys Met Arg Asn Phe130 135 140

Ser Ser Arg Asp Val Leu Arg Arg His Asn Arg Thr His Thr Gly Glu 145 150 155 160

Lys Pro Phe Ala cys Asp Ile cys Gly Arg Lys Phe Ala ser Arg Asp 165 170 175 val Leu Arg Arg His Asn Arg ile His Leu Arg Gin Asn Asp Leu Glu180 185 190

Gly Gly ser Gly Gly Gly Ser Gly Gly ser Thr Arg His His His His195 200 205

His His210

<210> 81<211> 615<212> DNA <213> künstliche Sequenz<220> <223> cYFP-Linkerpeptid-Znf_Zif268-Linkerpeptid -His_ tag <220> <221> CDS<222> CD . . C615) <22 3> cYFP-Linkerpeptid-znf_zif268-Linkerpeptid -His_ tag<400> 81 atg gcc gac aag cag aag aac ggc atc aag gtg aac ttc aag atc cgc 48

Met Ala Asp Lys Gin Lys Asn Gly lie Lys Val Asn Phe Lys Ile Arg 15 10 15 cac aac atc gag gac ggc agc gtg cag ctc gcc gac cac tac cag cag 96

His Asn Ile Glu Asp Gly Ser val Gin Leu Ala Asp His Tyr Gin Gin 20 25 30 aac acc ccc atc ggc gac gac ccc gtg ctg ctg ccc gac aac cac tac 144

Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr 35 40 45 ctg agc tac cag tcc gcc ctg age aaa gac ccc aac gag aag cgc gat 192

Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp 50 55 60 cac atg gtc ctg ctg gag ttc gtg acc gcc gcc ggg ate act etc ggc 240

His Met Val Leu Leu Glu Phe VaT Thr Ala Ala Gly Ile Thr Leu Gly 65 70 75 80 atg gac gag ctg tac aag gat ggc tet ggc ggt ggg agt ggg gga age 288

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 85 90 95 act aga ccg ggt gaa aaa ccg tat gca tgt ccg gtt gaa age tgt gat 336

Thr Arg Pro Gly Glu Lys Pro Tyr Ala Cys Pro val Glu Ser Cys Asp 100 105 110 cgt cgt ttt age cgt agt gat gaa ctg acc cgt cat att cgt att cat 384

Arg Arg Phe Ser Arg ser Asp Glu Leu Thr Arg His Ile Arg lie His 115 120 125 aca ggt cag aaa ccg ttt cag tgt cgt att tgc atg cgt aat ttt age 432

Thr Gly Gin Lys Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe ser 130 135 140 cgt tea gat cat ctg acc acc cat att cgt acc cat act ggc gaa aaa 480

Arg Ser Asp His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys 145 150 155 160 ccg ttt gcc tgt gat att tgt ggt cgt aaa ttt gca cgt tcc gat gaa 528 pro Phe Ala Cys Asp lie Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu 165 170 175 cgt aaa ege cat acc aaa att cat aeg ggt ggt ggt age ggt ggt ggt 576

Arg Lys Arg His Thr Lys lie His Thr Gly Gly Gly Ser Gly Gly Gly 180 185 190 tea ggt ggt agt act aga cac cac cac cac cac cac tag 615 ser Gly Gly Ser Thr Arg His His His His His His 195 200

<210> 82<211> 204<212> PRT <213> künstliche Sequenz<22 0> <223> synthetisches Konstrukt<400> 82

Met Ala Asp Lys Gin Lys Asn Gly lie Lys val Asn Phe Lys lie Arg 1 5 10 15

His Asn lie Glu Asp Gly ser val Gin Leu Ala Asp His Tyr Gin Gin 20 25 30

Asn Thr Pro lie Gly Asp Gly Pro val Leu Leu Pro Asp Asn His Tyr35 40 45

Leu Ser Tyr Gin Ser Ala Leu ser Lys Asp Pro Asn Glu Lys Arg Asp50 55 60

His Met val Leu Leu Glu Phe val Thr Ala Ala Gly Ile Thr Leu Gly

65 70 75 BU

Met Asp Glu Leu Tyr Lys Gly Gly Ser Gly Gly Gly Ser Gly Gly ser 85 90 95

Thr Arg Pro Gly Glu Lys Pro Tyr Ala Cys Pro val Glu Ser Cys Asp100 105 110

Arg Arg Phe Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg lie His115 120 125

Thr Gly Gin Lys Pro Phe Gin Cys Arg lie Cys Met Arg Asn Phe Ser130 135 140

Arg Ser Asp His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys 145 150 155 160 pro Phe Ala cys Asp lie Cys Gly Arg Lys Phe Ala Arg ser asp Glu 165 170 175

Arg Lys Arg His Thr Lys lie His Thr Gly Gly Gly Ser Gly Gly Gly180 185 190

Ser Gly Gly Ser Thr Arg His His His His His His195 200