DE60222857T2 - Concatemere unterschiedlich exprimierter multipler gene - Google Patents

Concatemere unterschiedlich exprimierter multipler gene Download PDF

Info

Publication number
DE60222857T2
DE60222857T2 DE60222857T DE60222857T DE60222857T2 DE 60222857 T2 DE60222857 T2 DE 60222857T2 DE 60222857 T DE60222857 T DE 60222857T DE 60222857 T DE60222857 T DE 60222857T DE 60222857 T2 DE60222857 T2 DE 60222857T2
Authority
DE
Germany
Prior art keywords
denotes
vector
cassette
cassettes
artificial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60222857T
Other languages
English (en)
Other versions
DE60222857D1 (de
Inventor
Neil Goldsmith
Alexandra M. Sorensen
Soren V. Nielsen
Michael Naesby
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evolva Holding SA
Original Assignee
Evolva AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evolva AG filed Critical Evolva AG
Application granted granted Critical
Publication of DE60222857D1 publication Critical patent/DE60222857D1/de
Publication of DE60222857T2 publication Critical patent/DE60222857T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/20Pseudochromosomes, minichrosomosomes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/20Pseudochromosomes, minichrosomosomes
    • C12N2800/206Pseudochromosomes, minichrosomosomes of yeast origin, e.g. YAC, 2u

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Description

  • Dies ist eine normale Anmeldung einer vorläufigen Anmeldung mit der Seriennr. US 60/301,022, die am 27. Juni 2001 eingereicht wurde, welche hierdurch Bezugnahme in deren Gesamtheit aufgenommen wird. Die Anmeldung beansprucht die Priorität von der Dänischen Patentanmeldung PA 2001 00127 , die am 25. Januar 2001 eingereicht wurde, welche hierdurch mit Bezugnahme in deren Gesamtheit aufgenommen wird. Alle in der Anmeldung zitierten Patent und Nicht-Patent-Bezugnahmen, oder in der vorliegenden Anmeldung, sind ebenfalls hier durch Bezugnahme in deren Gesamtheit aufgenommen.
  • In der vorliegenden Erfindung werden Konkatemere von konkatemerisierten Expressionskassetten und Vektoren offenbart, die die Synthese derartiger Konkatamere ermöglichen. Der Hauptzweck dieser Konkatamere besteht in der kontrollierbaren bzw. steuerbaren und koordinierten Expression großer Zahlen von heterologen Genen in einer einzelnen Wirtszelle. Weiterhin betrifft die Erfindung ein Konkatemer von Kassetten von Nukleotidsequenzen und ein Verfahren zur Herstellung der Konkatamere. In einer weiteren Ausführungsform, betrifft die Erfindung eine transgene Wirtszelle, die mindestens ein Konkatamer gemäß der Erfindung umfasst, als auch auf ein Verfahren zur Herstellung der transgenen Wirtszelle. Schließlich betrifft die Erfindung einen Vektor, der eine Kassette von Nukleotiden umfasst, ein Verfahren zur Herstellung des Vektors, eine Nukleotid-Bibliothek, die mindestens zwei primäre Vektoren umfasst, die jeweils eine Kassette von Nukleotiden umfassen, ein Verfahren zur Herstellung der Bibliothek.
  • Die Gestaltung von Expressionskonstrukte und Expressionsbibliotheken ist im Stand der Technik wohl bekannt.
  • Die WO 96/34112 offenbart kombinatorische Genexpressionsbibliothek mit einem Fundus von Expressionskonstrukten, wobei jedes Konstrukt eine cDNA oder ein genomisches DNA-Fragment von mehreren Spenderorganismen beinhaltet. Die DNA-Fragmente sind betriebsbereit mit regulatorischen Regionen assoziiert, die die Expression in einer Wirtszelle antreiben. Die Veröffentlichung offenbart ebenfalls eine kombinatorische Genexpressionsbibliothek, in der jede Zelle ein Konkatemer von cDNA-Fragmenten umfasst, die betriebsbereit mit regulatorischen Regionen assoziiert sind, um die Expression von den Genen anzutreiben, die durch die konkatemerisierte cDNA in einem Wirtsorganismus kodiert wird. Der Wirtsorganismus kann eine Hefezelle sein. Der Vektor, der zur Bildung der Bibliothek verwendet wurde, kann ein Plasmidvektor, ein Phage, ein viraler Vektor oder ein künstliches Chromosom (BAC oder YAC) sein. Geeignete Promotoren umfassen natürliche und synthetische Promotoren als auch konstitutive und induzierbare Promotoren.
  • Die für die Konkatemere verwendeten Gene werden in einem höchst geordneten Mehrschritt-Verfahren hergestellt, das eine Anzahl diskreter Reaktionsschritte umfasst. Zuerst werden unter Verwendung von PCR und methyliertem dCTP cDNA-Einsätze hergestellt, um interne Restriktionsstellen von NotI und BamHI vor späterem Verdau zu schützen. Die Promotor- und Terminatorfragmente werden unter Verwendung modifizierter BamHI-Adapter an die 5'-beziehungsweise 3'-Enden ligiert. Die Genkassetten weisen die Grundstruktur auf: Promotor -kodierende Sequenz- Terminator mit unterschiedlichen Restriktionsstellen in jedem Ende. Die in dem 3'-Ende befindliche Restriktionsstelle ist geschützt. Ähnliche Genkassetten können von genomischer DNA hergestellt werden, die unter Verwendung eines Restriktionsenzyms wahllos fragmentiert ist.
  • Die in der WO 96/34112 offenbarten Konkatemere werden in einem höchst geordneten Mehrschritt-Verfahren hergestellt, wobei die erste Genkassette an eine Adapternukleotidsequenz ligiert wurde, die mit einem Kügelchen verbunden ist, welche ein glattes bzw. stumpfes Ende aufweist, das dem stumpfen 5'-Ende der Genkassette entspricht. Nach Ligation ist die Restriktionsstelle nicht mehr funktionell, da sie unter Verwendung von zwei verträglichen, jedoch nicht identischen Restriktionsstellen angeordnet wurde. Nach dem Verbinden der ersten Genkassette an das Kügelchen wird die geschützte Restriktionsstelle in dem 3'-Ende "geöffnet" und die zweite Genkassette wird mit der ersten verbunden. Nach 5 bis 10 Runden einer Ligation von Genkassetten wird der Vektor an das 3'-Ende des Konkatemers ligiert, wobei das Konkatemer-Vektorkonstrukt von dem Kügelchen befreit wird, wobei das 5'-Ende an das andere Ende des Vektors ligiert wird. Es wird betont, dass die 3'- und 5'-Enden des Konkatemers nicht verträglich sein sollten, um eine Selbstanordnung während des Klonierens in den Vektor zu verhindern.
  • Aufgrund der Vielzahl diskreter Schritte in dem Herstellungsverfahren ist das Verfahren nicht zur Herstellung von Konkatemeren einer signifikant größeren bzw. umfangreicheren Größe geeignet. Sobald die Genkassetten in den Vektor kloniert wurden, besteht nicht mehr die Möglichkeit die Kassetten oder das gesamte Konkatemer unter Verwendung eines Restriktionsenzyms aus dem Vektor auszuschneiden.
  • Die US-6,057,103 (Diversa) offenbart ein Verfahren zur Identifikation von Klonen mit einer spezifischen Enzymaktivität durch Isolieren von DNA aus einem Mikroorganismus und Hybridisieren mit einer Sonden-DNA, die mindestens einen Teil einer Sequenz umfasst, der ein Enzym mit einer spezifischen Aktivität kodiert. Die identifizierten Sequenzen werden mit einer Promotorsequenz (beispielsweise eukaryotischen Promotoren; CMV sofort/früh, HSV Thymidinkinase, früh und spät SV40, LTRs vom Retrovirus und Metallothionein-I der Maus) verbunden und in einen Vektor eingefügt, der ein auf YAC oder ein auf P1 basierendes künstliches Chromosom sein kann. Die Wirtszellen, die zur Transformation mit den identifizierten Nukleotidsequenzen verwendet wurden, umfassen bakterielle Zellen, Hefe, Insektenzellen, Säugerzellen. Die offenbarten Vektoren sind nicht dazu angepasst, um eine große Anzahl exprimierbarer Nukleotidsequenzen zu klonieren, und die Referenz offenbart nicht die Konkatemere zum Klonieren mehrerer Gene in einer Wirtszelle. Insbesondere macht diese Referenz nicht die Kombination und Durchmusterung von Kombinationen von Genen unter Bedingungen möglich, die Genen gestatten auf neue Weisen kombiniert zu werden.
  • Die US-5,958,672 (Diversa) offenbart ein Verfahren zum Identifizieren einer Proteinaktivität von Interesse durch Kultivieren einer Genexpressionsbibliothek, die von nicht kultivierten Mikroorganismen (oder niedrigen eukaryotischen Spezies) erhalten wurden. Die Genexpressionsbibliothek kann von genomischer DNA oder von cDNA erhalten werden. Die DNA-Klone sind mit regulatorischen Sequenzen kontrollier- bzw. steuerbar assoziiert, die die Expression der Sequenzen in der Wirtszelle antreiben. Die Bibliotheken können gegenüber einer DNA-Sonde, wie in der US-6,054,267 durchmustert werden. Wie in den anderen, vorstehend zitierten Referenzen ist die Kombination von Genen, die von den nicht kultivierten Mikroorganismen isoliert wurden, eine statische Kombination. Sobald die isolierten Gene in die Wirtszelle eingefügt sind, sind keine weiteren Genkombinationen und keine weitere Optimierung von Genkombinationen vorgesehen.
  • Die WO 00/52180 beschreibt Kombinationsbibliotheken, die unter Verwendung von Genkassetten hergestellt werden, die jeweils einen Promotor und einen Terminator beinhalten. Die Genkassetten gemäß dieses Dokuments beinhalten jedoch eine Bgl II Restriktionsstelle und eine BamHI Restriktionsstelle an deren 5'-Ende beziehungsweise 3'-Ende. Da diese Restriktionsstellen überlappende Überhänge erzeugen, besteht die Möglichkeit Genkassetten zu legieren, um Konkatemere zu erzeugen. Eine Ligation jener Stellen erzeugt jedoch keine funktionellen Restriktionsstellen, wobei folglich die einzelne Kassette nicht von dem Konkatemer ausgeschnitten werden kann.
  • Eine Aufgabe der vorliegenden Erfindung besteht darin Verfahren und Vektoren zum Klonieren einer großen Anzahl von exprimierbaren Nukleotidsequenzen bereitzustellen, die besonders dazu angepasst sind später in Konkatamere wahllos legiert zu werden, die wiederum in einen Expressionswirt eingefügt werden können, um die Gene in dem Konkatemer oder einer Untergruppe der Gene oder unterschiedlichen Untergruppen der Gene in dem Konkatemer zu exprimieren. Dadurch wird ermöglicht die Kombinationen von exprimierbaren Nukleotidsequenzen für eine beliebig zu durchmusternde Eigenschaft zu optimieren.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht darin Verfahren und Vektoren bereitzustellen, die die Herstellung von Konkatameren ermöglichen, die flexibel sind. In diesem Zusammenhang soll flexibel bedeuten, dass die Genkassetten der Konkatemere unter Verwendung von molekularen Standardverfahren, wie beispielsweise Ausschneiden durch Verwendung von Restriktionsenzymen, einfach zerlegt und erneut zusammengesetzt werden können.
  • Gemäß einer ersten Ausführungsform betrifft die Erfindung ein Nukleotid-Konkatemer, das in der 5'→3' Richtung eine Kassette einer Nukleotidsequenz der allgemeinen Formel umfasst:
    Figure 00050001
    worin
    rs1 und rs2 zusammen eine Restriktionsstelle bezeichnen,
    SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet,
    PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann,
    X bezeichnet eine exprimierbare Nukleotidsequenz,
    TR bezeichnet einen Terminator, und
    SP bezeichnet einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen, und n ≥ 2, und
    worin mindestens eine erste Kassette von einer zweiten Kassette verschieden ist.
  • Die erfindungsgemäßen Konkatamere können eine Auswahl exprimierbarer Nukleotidsequenzen von gerade einem Expressionszustand umfassen und können folglich von einer Bibliothek angeordnet werden, die diesen Expressionszustand darstellt oder sie können Kassetten von einer Anzahl unterschiedlicher Expressionszustände umfassen, die in einem beliebig geeigneten Verhältnis gemischt sind. Die erfindungsgemäßen Konkatamere sind insbesondere zum Legieren in ein künstliches Chromosom geeignet, das zur kontrollierten Expression in eine Wirtszelle eingefügt wird. Zu diesem Zweck kann die Variation unter und zwischen den Kassetten derart sein, dass während die Wirtszelle eine Zellteilung durchführt die Wahrscheinlichkeit eines Crossover minimiert wird, indem der Grad bzw. die Höhe von in dem Konkatemer vorkommenden Wiederholungssequenzen minimiert werden, da es nicht Aufgabe dieser Ausführungsform der Erfindung ist eine Rekombination von Konkatemeren mit einem Segment in dem Wirtsgenom oder einem Epitop der Wirtszelle oder eine beliebige intrakonkatemere Rekombination zu erhalten.
  • Die Konkatamere können verwendet werden, um neue und nicht native Kombinationen von Genen für eine koordinierte Expression in einer Wirtszelle zu erzeugen. Dadurch können neue metabolische Wege erzeugt werden, die zu der Herstellung von neuen Metaboliten führen können, und/oder zu der Metabolisierung von Verbindungen, die andererseits nicht durch die Wirtszellen metabolisiert werden können. Die neuen Genkombinationen können ebenfalls zu metabolischen Wegen führen, die Metabolite in neuen Quantitäten oder in neuen Kompartimenten der Zelle oder außerhalb der Zelle erzeugt werden. Abhängig von dem Zweck kann der Auswahl der Gene, basierend auf der Beschaffung von exprimierbaren Nukleotidsequenzen über die unterschiedlichen Königreiche vollständig willkürlich erfolgen. Es kann jedoch ebenfalls vorteilhaft sein Gene von Quellen zu beschaffen, von denen bekannt ist, dass sie bestimmte metabolische Wege aufweisen, um zielgerichtete bzw. targettierte neue Genkombinationen zu erzeugen. Es kann ebenfalls vorteilhaft sein Gene von Organismen/Geweben zu beschaffen, von denen bekannt ist, dass sie relevante Eigenschaften, beispielsweise eine pharmazeutische Aktivität aufweisen.
  • Einer von mehreren Vorteilen der Konkatemere der vorliegenden Erfindung besteht darin, dass die Expressionskassetten zu beliebigen Punkten aus den Konkatameren ausgeschnitten werden können, um neue Kombinationen von Expressionskassetten zu erzeugen. Während der erneuten Anordnung können, falls erwünscht wird das Expressionsmuster zu modifizieren, weitere Gene, die in ähnlichen Expressionskassetten umfasst sind, hinzugefügt werden. Auf diese Weise stellen die erfindungsgemäßen Konkatamere ein leistungsfähiges Werkzeug bei der Erzeugung neuer Genkombinationen dar.
  • Ein Vorteil der Struktur des Konkatemers besteht darin, dass aus der Wirtszelle durch eine Nukleotidisolation und nachfolgenden Verdau mit einem Restriktionsenzym, das spezifisch für die rs1-rs2 Restriktionsstelle ist, Kassetten wiedergewonnen werden können. Die Bausteine der Konkatamere können folglich an einem beliebigen Punkt zerlegt und erneut zusammengesetzt werden.
  • Die Kassetten des Konkatemers können Kopf an Schwanz oder Kopf an Kopf oder Schwanz an Schwanz verbunden werden, was eine Expression der exprimierbaren Nukleotidsequenzen nicht beeinträchtigt, da jede exprimierbare Nukleotidsequenz unter der Kontrolle dessen eignen Promotors steht. Das liegt an der Tatsache, dass die meisten Restriktionsenzyme zwei identische Überhänge zurücklassen, die mit der gleichen Frequenz in jeder Orientierung kombinieren können.
  • Die Restriktionsstellen können ebenfalls so gewählt werden, dass eine Anordnung von Kopf an Schwanz gefördert wird, beispielsweise unter Verwendung von Restriktionsenzymen, die nicht palindromartige Überhänge erzeugen. Beispiele derartiger Enzyme sind in Beispiel 6c, wobei die meisten Enzyme in 6d aufgelistet sind. Nicht palindromartige Überhänge werden eine Ligation von Kopf an Kopf und von Schwanz an Schwanz verhindern. Bei Verwendung von zwei oder mehr verschiedenen Eintrittsvektoren kann die Sequenz der Schneideregion so gestaltet sein, dass nach dem Verdau mit einem einzelnen von jenen Enzymen unterschiedliche Überhänge gewonnen bzw. erhalten werden. Beispiele derartiger Enzyme sind die meisten der Enzyme in Beispiel 6c und eines in 6d, wobei sie unterschiedliche Nukleotide (N oder W) in dem Überhang aufweisen. Auf diese Weise kann eine Kassette mit einem Enzym ausgeschnitten werden, die keine identischen Überhänge aufweist. Dies wird eine intramolekulare erneute Ligation verhindern und verhindern, dass identische Kassetten aneinander legiert werden, wodurch das Risiko einer intramolekularen Rekombination verringert wird.
  • Die Erfindung betrifft in einer weiteren Ausführungsform ein Verfahren zur Konkatenation bzw. Verkettung, welches die Schritte umfasst von Verketten von mindestens zwei Kassetten von Nukleotidsequenzen, wobei jede Kassette ein erstes klebriges Ende, einen Abstandshalter, einen Promotor, eine exprimierbare Nukleotidsequenz, einen Terminator und ein zweites klebriges Ende umfasst.
  • Vorzugsweise umfasst das Verfahren Starten bzw. Ausgehen von primären Vektoren, die eine Kassette mit der folgenden Nukleotidsequenz
    Figure 00070001

    worin X eine exprimierbare Nukleotidsequenz bezeichnet,
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet,
    TR einen Terminator bezeichnet,
    i) Schneiden des primären Vektors mit der Hilfe von mindestens einem Restriktionsenzym, das für RS2 und RS2' spezifisch ist, wodurch Kassetten erhalten werden, die die allgemeine Formel aufweisen [rs2-SP-PR-X-TR-SP-rs1] worin rs1 und rs2 zusammen eine funktionelle Restriktionsstelle RS2 oder RS2' bezeichnen,
    ii) Anordnen der ausgeschnittenen Kassetten durch Interaktion zwischen rs1 und rs2.
  • Gemäß dieser Ausführungsform wird das Ausschneiden und die Verkettung in einer "Einschritt"-Reaktion ausgeführt, d. h. ausgehend von Vektoren, die die Expressionskassetten beinhalten ohne einen dazwischen geschalteten Reinigungsschritt. Die Expressionskassetten können unter Verwendung von zwei für RS1 und RS2 spezifischen Restriktionsenzymen ausgeschnitten werden. Vorzugsweise führt bei dieser Einschritt-Reaktion RS1 zu stumpfen Enden und RS2 führt zu klebrigen Enden. Auf Zugabe einer Ligase kann das Konkatemer in dem Gemisch ohne irgendwelche Notwendigkeit zur Reinigung angeordnet werden, da das Vektorrückgrat und die kleinen RS1-RS2-Fragmente nicht die Konkatenations-Reaktion beeinträchtigen.
  • Falls das Konkatemer in einen künstlichen Chromosomenvektor für eine spätere Transformation in eine Expressionswirtszelle eingefügt wird, können die AC-Vektorarme unmittelbar dem Gemisch der Konkatenations-Reaktion so zugegeben werden, dass der, das Konkatemer beinhaltende, vollständige künstliche Chromosomenvektor in einem Schritt angeordnet werden kann. Durch Kontrollieren des Verhältnisses von Vektorarmen zu Kassetten kann die Größe des Konkatemers gesteuert werden. Ebenfalls ist möglich, dass die Größe der Konkatemere durch Zugabe von Stopperfragmenten kontrolliert werden kann, wobei die Stopperfragmente jeweils ein RS2 oder RS2' in einem Ende und einen nicht komplementären Überhang oder ein stumpfes Ende in dem anderen Ende aufweisen. Vektorarme können ebenfalls später in einem getrennten Schritt zugegeben werden.
  • Vorteilhafter Weise umfasst das Verfahren eine Zugabe von Vektorarmen, die jeweils ein RS2 oder RS2' in einem Ende und einen nicht komplementären Überhang oder ein stumpfes Ende in dem anderen Ende aufweisen. Diese können zu dem Gemisch von Konkatemeren zugegeben werden, wobei selbst in diesem komplexen Gemisch Konkatemere mit einem Vektorarm in jedem Ende unter geeigneten Bedingungen erzeugt werden. Wirtszellen, die mit der wünschenswerten Konstruktion einschließlich der geeigneten Vektorarme transformiert wurden, können durch Verwendung von auf den Armen vorhandenen Markergenen ausgewählt werden.
  • In einer Ausführungsform betrifft die Erfindung eine Wirtszelle, die mindestens ein Konkatemer von individuellen Oligonukleotid-Kassetten umfasst, die jeweils Oligonukleotide der folgenden Formel in 5'→3' Richtung: [rs2-SP-PR-X-TR-SP-rs1]n umfassen, worin rs1 und rs2 zusammen eine Restriktionsstelle bezeichnen, SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, der in der Zelle funktionieren kann, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet und SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet, worin n ≥ 2, und worin mindestens zwei exprimierbare Nukleotidsequenzen von unterschiedlichen Expressionszuständen vorliegen.
  • In einer anderen Ausführungsform betrifft die Erfindung eine Zelle, die mindestens ein Konkatemer von individuellen Oligonukleotid-Kassetten umfasst, wobei jedes Konkatemer ein Oligonukleotid der folgenden Formel in 5'→3' Richtung umfasst:
    Figure 00090001
    worin
    rs1 und rs2 zusammen eine Restriktionsstelle bezeichnen
    SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet,
    PR einen Promotor bezeichnet, der in der Zelle funktionieren kann,
    X eine exprimierbare Nukleotidsequenz bezeichnet,
    TR einen Terminator bezeichnet, und
    SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet worin n ≥ 2 ist, und
    worin rs1-rs2 in mindestens zwei Kassetten durch das gleiche Restriktionsenzym erkannt wird.
  • Dadurch können nicht natürlich vorkommende Kombinationen von exprimierbaren Genen in einer Zelle auf derartige Weise kombiniert werden, dass eine koordinierte Expression einer Untergruppe von Genen möglich gemacht wird oder alle eingefügten Gene können gleichzeitig exprimiert werden. Durch die externe Regulation der Promotoren, die die exprimierbaren Nukleotidsequenzen kontrollieren, können neue und nicht natürlich vorkommende Kombinationen von exprimierten Genen erhalten werden. Da diese neuen und nicht natürlichen Kombinationen von Genprodukten in ein und derselben Zelle aufgefunden werden, können die heterogenen Genprodukte den Metabolismus der Wirtszelle auf neue Weise beeinflussen und folglich bewirken, dass neue und/oder nicht natürliche primäre oder sekundäre Metabolite und/oder bekannte Metabolite in neuen Mengen und/oder bekannte Metabolite in neuen Kompartimenten der Zelle oder außerhalb der Zellen hergestellt werden. Die neuen metabolischen Wege und/oder neuen oder modifizierten Metabolite können ohne wesentliches Rekombinieren der eingefügten Gene mit einem beliebigen Segment in dem Wirtsgenom oder einem beliebigen Episom oder Wirtszellen erhalten werden.
  • Die die Konkatemere beinhaltenden Zellen, vorzugsweise in der Form von künstlichen Chromosomen, können für eine gerichtete Evolution verwendet werden, indem Populationen von Zellen selektiven Bedingungen unterworfen werden. Ein Vorteil der Struktur der Konkatemere besteht darin, dass Expressionskassetten von verschiedenen Zellen oder verschiedenen Populationen von Zellen einfach in einigen Schritten kombiniert werden können, wodurch das Potential der Evolution erhöht wird. Werden die Konkatemere in Form von künstlichen Chromosomen eingefügt, kann die Evolution unter Verwendung traditioneller Züchtung und Selektion ausgeführt werden.
  • Es besteht die Möglichkeit, dass durch die Kombination einer hohen Anzahl von nicht natürlichen Genen in der Wirtszelle Kombinationen von Genen oder einzelne Gene eingefügt werden, die für die Wirtszelle tödlich bzw. lethal oder sublethal sind. Durch die koordinierte Expression der Gene in der Wirtszelle besteht nicht nur die Möglichkeit die Expression einer beliebigen Untergruppe von Genen zu induzieren, jedoch ebenfalls eine derartige Expression, beispielsweise von lethalen oder sublethalen Genen, zu unterdrücken.
  • Durch Herstellen von Zellen mit Kombinationen von Konkatemeren, die Kassetten mit exprimierbaren Nukleotidsequenzen von einer Anzahl unterschiedlicher Expressionszustände umfassen, die von einer beliebigen Anzahl von Expressionszuständen von den gleichen oder ausgewählten Spezies sein können, von nicht verwandten oder entfernt verwandten, oder von Spezies aus verschiedenen Königreichen, können neue und willkürliche Kombinationen von Genprodukten in einer einzelnen Zelle hergestellt werden. Indem weiterhin exprimierbare Nukleotidsequenzen unter der Kontrolle einer Anzahl unabhängiger induzierbarer oder unterdrückender Promotoren stehen, können eine große Anzahl unterschiedlicher Expressionszustände in einer einzelnen Zelle durch selektives An- und Abdrehen von Gruppen der eingefügten exprimierbaren Nukleotidsequenzen erzeugt werden. Die Anzahl von unabhängig induzierbaren und/oder unterdrückenden Promotoren in einer Zelle kann von 1 bis 100, 1 bis 50, 1 bis 10, oder beispielsweise bis zu 15, 20, 25 oder über 50 Promotoren variieren.
  • Durch das Einfügen neuer Gene in die Wirtszelle und insbesondere durch Einfügen einer hohen Anzahl neuer Gene von einer großen Auswahl von Spezies in eine Wirtszelle wird es sehr wahrscheinlich, dass die Genprodukte von dieser Anordnung neuer Gene mit dem Pool bzw. Fundus von Metaboliten der Wirtszelle wechselwirken bzw. interagieren werden und bekannte Metabolite und/oder Zwischenprodukte auf neue Weise modifizieren, um neue Verbindungen zu erzeugen. Da sich die Wechselwirkung auf dem Niveau der Enzyme abspielt ist es weiterhin wahrscheinlich, dass das Ergebnis neue Verbindungen mit chiralen Zentren sein werden, die besonders schwer durch eine chemische Synthese zu synthetisieren sind.
  • Es können ebenfalls neue metabolische Wege erzeugt werden, die aufgrund der Abwesenheit eines Substrats in der Wirtszelle nicht funktionieren können. Derartige metabolische Wege können durch Zugabe von für die Wirtszelle nicht spezifische Substrate aktiviert werden, die durch die neuen Wege metabolisiert werden können.
  • Ein spezieller Vorteil der erfindungsgemäßen Zellen besteht darin, dass Unverträg lichkeitsschranken zwischen Spezies die Kombination von Genen in einer einzelnen Zelle nicht beschränken.
  • Gemäß einer anderen Ausführungsform betrifft die Erfindung ein Verfahren zur Herstellung einer transgenen Zelle, welches umfasst, Einfügen eines Konkatemers in eine Wirtszelle, das eine heterologe Nukleotidsequenz umfasst, die mindestens zwei Gene einschließt, die jeweils durch einen Promotor kontrolliert werden, wobei die zwei Gene und/oder die zwei Promotoren verschieden sind.
  • Gemäß einer weiteren Ausführungsform betrifft die Erfindung einen primären Vektor, der eine Nukleotidsequenz-Kassette der allgemeinen Formel in 5'→3' Richtung umfasst:
    Figure 00120001
    worin
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet,
    CS eine Klonierungsstelle bezeichnet,
    TR einen Terminator bezeichnet.
  • Die Kassette in dem primären Vektor ist für das Klonieren und Speichern in einer Wirtszelle von willkürlich exprimierbaren Nukleotidsequenzen nützlich, die unter der Kontrolle des in der Kassette umfassten Promotors stehen. Die Kassette kann unter Verwendung von Restriktionsenzymen eingefügt und entfernt werden, die für eine der vier Restriktionsstellen spezifisch sind, von denen RS1 und RS1' vorzugsweise identisch und RS2 und RS2' ebenfalls vorzugsweise identisch sind. Ein besonderer Vorteil der Kassette besteht darin, dass eine Sammlung von Kassetten in ein Konkatemer von Kassetten gemäß der Erfindung angeordnet werden kann, indem die Kassetten von dem primären Vektor beispielsweise durch Verwendung des/der für RS2 und RS2' spezifischen Restriktionsenzyms/e ausgeschnitten werden, und einer Konkatenation bzw. Verkettung einer Population von willkürlichen Kassetten in einer Lösung. Die einfachste Verkettung wird dadurch erhalten, wenn RS1 und RS1' stumpfe Enden erzeugen und RS2 und RS2' klebrige Enden erzeugen. Auf diese Weise kann vermieden werden, dass der leere Vektor an der Verkettung teilnimmt. Weiterhin wurde festgestellt, dass die RS1-RS2 und RS1' und RS2' beinhaltenden kleinen Fragmente nicht entfernt werden müssen, da sie die Verkettung nicht beeinträchtigen. Falls erwünscht, können die kleinen Fragmente unter Verwendung, von beispielsweise einer Präzipitation oder Filtration, einfach entfernt werden.
  • Der erfindungsgemäße primäre Vektor ist insbesondere für eine Expression mit cDNA in ihm angepasst, da er mit einem Promotor ausgerüstet ist. Die Integration von genomischer DNA ist ebenfalls möglich, wobei jedoch dies eine Wechselwirkung zwischen den nativen Promotorsequenzen der eingefügten genomischen DNA und der externen Kontrolle bewirken kann, die durch den Promotor des Vektors erhalten werden kann.
  • Vorzugsweise ist PR in dem Wirt des primären Vektors nicht funktionell, wobei es jedoch lediglich in dem Expressionswirt funktionell ist, in den die Konkatemere für die Expression eingefügt werden. Das bedeutet, dass eine Selektion gegenüber Genen vermieden wird, die für den Bibliothekswirt, in dem der primäre Vektor gespeichert und/oder amplifiziert vorliegt, tödlich sind.
  • Die Abstandshaltersequenz wird in die Kassette eingefügt, um die Stabilität der Konkatemere nach der Verkettung zu erhöhen. Die Kassetten werden so gebaut, dass sie Kopf an Schwanz, Kopf an Kopf oder Schwanz an Schwanz nach der Verkettung verbunden vorliegen. Ein Konkatemer von zwei Kassetten kann folglich die folgende Struktur aufweisen:
    Figure 00130001
    (rs1 und rs2 zusammen bezeichnen eine Restriktionsstelle)
  • Die Anwesenheit des Abstandhalters verringert das Risiko einer Haarnadelstruktur zwischen zwei angrenzenden Terminator oder Promotorsequenzen, die identisch sein können. Folglich wird ebenfalls vorgesehen, dass die Anwesenheit des Abstandhalters die Stabilität der Konkatemere in dem Expressionswirt erhöht, in dem sie eingefügt vorliegen.
  • Unter Verwendung von Enzymen, die nicht palindromartige Überhänge erzeugen ist es möglich Konkatemere mit einer im Wesentlichen Orientierung von Kopf an Schwanz zu erzeugen.
  • In einer anderen Ausführungsform betrifft die Erfindung ein Verfahren zur Herstellung eines primären Vektors, welches umfasst:
    Einfügen eine exprimierbaren Nukleotidsequenz in eine Klonierungsstelle in einen primären Vektor, der eine Kassette umfasst, wobei die Kassette ein Nukleotidsequenz der allgemeinen Formel in 5'→3' Richtung:
    Figure 00140001
    worin
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet
    CS eine Klonierungsstelle bezeichnet, und
    TR einen Terminator bezeichnet.
  • In einer weiteren Ausführungsform betrifft die Erfindung eine Nukleotidbibliothek, die mindestens zwei primäre Vektoren umfasst, wobei jeder Vektor eine Nukleotidsequenz-Kassette der allgemeinen Formel in 5'→3' Richtung:
    Figure 00140002
    worin
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet
    X eine exprimierbare Nukleotidsequenz bezeichnet,
    TR einen Terminator bezeichnet,
    • – worin die exprimierbaren Nukleotidsequenzen aus einem Expressionszustand isoliert wurden, und
    • – worin mindestens zwei Kassetten verschieden sind.
  • Die Nukleotidbibliothek kann auch als eine Eintritts (=Anfangs)-bibliothek bezeichnet werden, wobei vorgesehen ist, dass die Nukleotidbibliothek als ein geeignetes Mittel zum Speichern und Amplifizieren einer großen Anzahl von Vektoren verwendet wird, die die erfindungsgemäßen Nukleotidkassetten umfassen. Ebenfalls ist vorgesehen, dass die Kassetten nach der Amplifikation ausgeschnitten werden, um die ausgeschnittenen Kassetten zur Verkettung zu verwenden. Zweckdienlicher Weise kann eine Nukleotidbibliothek exprimierbare Nukleotidsequenzen von/aus dem gleichen Quellenpool, wie beispielsweise dem gleichen Expressionszustand, abdecken bzw. umfassen. Folglich wird die Bibliothek zweckdienlicher Weise für das Einführen von cDNA verwendet, die von mRNA synthetisiert wurde, die von einem Expressionszustand isoliert wurde.
  • Vorzugsweise können die PR Sequenzen nicht in der Bibliothek von Wirtszellen funktionieren. Dies soll gewährleisten, dass keine der exprimierbaren Nukleotidsequenzen für die Bibliothek der Wirtszelle tödlich ist und folglich verloren gehen kann.
  • Die Nukleotidbibliothek stellt weiterhin geeignete Mittel für eine spätere Anordnung von Konkatemeren von Kassetten bereit, die in der Bibliothek gespeichert vorliegen. Gemäß einer besonders bevorzugten erfindungsgemäßen Ausführungsform sind im Wesentlichen alle Kassetten in der Bibliothek verschieden. Dieser Unterschied wird teilweise eingefügt, um unterschiedliche Untergruppen von Genen koordiniert exprimieren zu können und teilweise das Niveau von Wiederholungssequenzen, die in den Konkatemeren auftreten zu minimieren.
  • In noch einer weiteren Ausführungsform betrifft die Erfindung ein Verfahren zur Herstellung einer Nukleotidbibliothek, welches umfasst: Erhalten von exprimierbaren Nukleotidsequenzen, Klonieren der exprimierbaren Nukleotidsequenzen in die Klonierungsstellen eines Gemisches von primären Vektoren, wobei die primären Vektoren eine Kassette umfassen, wobei die Kassetten eine Nukleotidsequenz der allgemeinen Formel in 5'→3' Richtung:
    Figure 00160001
    worin
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet
    CS eine Klonierungsstelle bezeichnet, und
    TR einen Terminator bezeichnet,
    und Transformieren der primären Vektoren in eine Wirtszelle, die eine Bibliothek erhält.
  • Zweckdienlicher Weise kann das Verfahren umfassen, Aufbauen einer cDNA Bibliothek von mRNA, die von einem Expressionszustand isoliert wurde oder Ausgehen von einer cDNA Bibliothek und Klonieren der cDNA Sequenzen in ein Gemisch von erfindungsgemäßen primären Vektoren. Um die Bibliothek und Unterbibliothek in einer angemessenen Weise zu organisieren, umfasst jede Bibliothek exprimierbare Nukleotidsequenzen, die einen gegebenen Expressionszustand darstellen.
  • Für alle hier besprochenen Konkatemere und Bibliotheken können die Abstandshalter (SP, Promotoren (PR), und Terminatoren (TR) in allen Kassetten identisch sein, wobei jedoch in bevorzugten Ausführungsformen die Abstandshalter (SP), Promotoren (PR), und Terminatoren (TR) zumindest für einen Teil der Kassetten in einem Konkatemer und einer Bibliothek verschieden sind.
  • 1 zeigt ein Flussdiagramm der Schritte, die von einem Expressionszustand zu einem Einfügen der exprimierbaren Nukleotidsequenzen in eine Eintrittsbibliothek (eine erfindungsgemäße Nukleotidbibliothek) führen.
  • 2 zeigt ein Flussdiagramm der Schritte, die von einer Eintrittsbibliothek, die exprimierbare Nukleotidsequenzen umfasst, zu ableitbaren bzw. evolvierbaren künstlichen Chro mosomen (EVAC) führen, die in eine geeignete Wirtszelle transformiert werden. 2a zeigt einen Weg zur Herstellung der EVACs, der eine Verkettung, eine Größenselektion und ein Einfügen in einen künstlichen Chromosomenvektor einschließt. 2b zeigt ein Einschritt-Verfahren zur Verkettung und Ligation von Vektorenarmen, um EVACs zu erhalten.
  • 3 zeigt einen Model-Eintrittsvektor. MCS stellt eine Mehrfachklonierungsstelle zum Einfügen exprimierbarer Nukleotidsequenzen dar. AmpR ist das Gen für die Ampicillinresistenz. Col E ist der Ursprung der Replikation in E. coli. R1 und R2 stellen Erkennungsstellen für Restriktionsenzyme dar.
  • 4 zeigt ein Beispiel eines erfindungsgemäßen Eintrittsvektors, EVE4. MET25 ist ein Promotor, ADH1 ist ein Terminator, f1 ist ein Ursprung der Replikation für filamentöse Phagen, beispielsweise M13. Abstandshalter 1 und Abstandshalter 2 werden durch einige bzw. mehrere Nukleotide gebildet, die von der Mehrfachklonierungsstelle abgeleitet sind, MCS, Srf1 und Asc1 sind Erkennungsstellen für Restriktionsenzyme. Für andere Abkürzungen siehe 3. Die Sequenz des Vektors wird in SEQ ID NO: 1 dargelegt.
  • 5 zeigt ein Beispiel eines erfindungsgemäßen Eintrittsvektors, EVE5. CUP1 ist ein Promotor, ADH1 ist ein Terminator, f1 ist ein Ursprung der Replikation für filamentöse Phagen, beispielsweise M13. Abstandshalter 1 und Abstandshalter 2 werden durch einige bzw. mehrere Nukleotide gebildet, die von der Mehrfachklonierungsstelle abgeleitet sind, MCS, Srf1 und Asc1 sind Erkennungsstellen für Restriktionsenzyme. Für andere Abkürzungen siehe 3. Die Sequenz des Vektors wird in SEQ ID NO: 2 dargelegt.
  • 6 zeigt ein Beispiel eines erfindungsgemäßen Eintrittsvektors, EVE8. CUP1 ist ein Promotor, ADH1 ist ein Terminator, f1 ist ein Ursprung der Replikation für filamentöse Phagen, beispielsweise M13. Abstandshalter 3 ist ein 550 Bp Fragment eines DNA-Fragments des Lambda-Phagen. Der Abstandshalter 4 ist eine ARS1 Sequenz von Hefe. Srf1 und Asc1 sind Erkennungsstellen für Restriktionsenzyme. Für andere Abkürzungen siehe 3. Die Sequenz des Vektors wird in SEQ ID NO: 3 dargelegt.
  • 7 zeigt einen Vektor (pYAC4-Asc1) zum Bereitstellen von Armen für ein ableitbares künstliches Chromosom (EVAC), in das ein erfindungsgemäßes Konkatemer kloniert werden kann. TRP1, URA3 und HIS3 sind auxotrophe Markergene von Hefe, und AmpR ist ein Antibiotikum-Markergen von E. coli. CEN4 ist ein Zentromer und TEL sind Telomere.
  • ARS1 und PMB1 ermöglichen eine Replikation in Hefe beziehungsweise E. coli. BamHI und Asc1 sind Erkennungsstellen für Restriktionsenzyme. Die Nukleotidsequenz des Vektors wird in SEQ ID NO. 4 dargelegt.
  • 8 zeigt die allgemeine Verkettungsstrategie. Auf der linken Seite wird ein kreisförmiger Eintrittsvektor mit Restriktionsstellen, Abstandshaltern, Promotor, exprimierbarer Nukleotidsequenz und Terminator gezeigt. Diese werden ausgeschnitten und willkürlich legiert.
    Spur F/Y
    1 100/1
    2 50/1
    3 20/1
    4 10/1
    5 5/1
    6 2/1
    7 1/1
    8 ½
    9 1/5
    • Legende: Spur M: Molekulargewichtsmarker, λ-Phagen DNA mit Pst1 verdaut. Spuren 1–9, Verkettungsreaktionen. Verhältnis von Fragmenten gegenüber yac-Armen (F/Y) wie in der Table.
  • 9 und 9b stellen die Integration von einer Verkettung mit einer Synthese von ableitbaren künstlichen Chromosomen dar und wie die Konkatemergröße durch Steuern des Verhältnisses von Vektorarmen zu Expressionskassetten, wie in Beispiel 7 beschrieben, gesteuert bzw. kontrolliert werden kann.
  • 10. Bibliothek einer mit EVAC transformierten Population, die unter 4 verschiedenen Wachstumsbedingungen gezeigt wird. Gefärbte Phänotypen können auf Induktion der Met25- und/oder der Cap1-Promotoren einfach festgestellt werden.
  • 11. Legende von einem ECAC-Gel: PFGE von EVAC beinhaltenden Klonen: Spuren, a: Hefe DNA PFGE-Marker (Stamm YNN295), Lambda-Leiter, c: nicht transformierte Wirtshefe, 1–9: EVAC beinhaltende Klone. EVACs in einem Größenbereich 1400–1600 Kb. Spur 2 zeigt einen Klon, der 2 EVACs mit 1500 Kb beziehungsweise 550 Kb beinhaltet. Der 550 Kb EVAC wandert zusammen mit den 564 Kb Hefe-Chromosom und führt zu einer erhöhten Intensität der Bande bei 564 Kb relativ zu den anderen Banden in der Spur. Pfeile deuten auf die EVAC-Banden.
  • Definitionen
  • Oligonukleotide
  • Ein beliebiges Fragment einer Nukleinsäure, die ungefähr von 2 bis 10.000 Nukleinsäuren aufweist.
  • Restriktionsstelle
  • Für die Zwecke der vorliegenden Erfindung wird die Abkürzung RSn (n=1, 2, 3, etc) verwendet, um eine Nukleotidsequenz zu bezeichnen, die eine Restriktionsstelle umfasst. Eine Restriktionsstelle wird durch eine Erkennungssequenz und eine Spaltstelle festgelegt. Die Spaltstelle kann innerhalb oder außerhalb der Erkennungssequenz lokalisiert sein. Die Abkürzung "rs1" oder "rs2" wird verwendet, um die zwei Enden einer Restriktionsstelle nach der Spaltung zu bezeichnen. Die Sequenz "rs1-rs2" bezeichnet zusammen eine vollständige Restriktionsstelle.
  • Die Spaltstelle einer Restriktionsstelle kann eine doppelsträngige Polynukleotidsequenz mit sowohl stumpfen oder klebrigen Enden erzeugen. Folglich kann "rs1" oder "rs2" entweder ein stumpfes oder ein klebriges Ende bezeichnen.
  • Bei der Schreibweise, die durch die vorliegende Erfindung hindurch verwendet wird, wie Formeln:
    Figure 00190001
    sollten so interpretiert werden, dass die individuellen Sequenzen in der spezifizierten Anordnung folgen. Dies schließt jedoch nicht aus, das ein Teil der Erkennungssequenz von beispielsweise RS2 mit der Abstandshalter-Sequenz überlappt, wobei jedoch ein striktes Erfordernis darin besteht, dass alle Gegenstände, ausgenommen RS1 und RS1' funktionell sind und nach der Spaltung und Neuordnung funktionell bleiben. Weiterhin schließen die Formeln nicht die Möglichkeit aus, dass zusätzliche Sequenzen zwischen den aufgelisteten Gegenständen eingefügt sind. Beispielsweise können Introns, wie in der nachfolgend beschriebenen Erfindung eingefügt sein und weitere Abstandssequenzen können zwischen RS1 und RS2 und zwischen TR und RS2 eingefügt werden. Bedeutend ist, dass die Sequenzen funktionell bleiben.
  • Wird weiterhin auf die Größe der Restriktionsstelle und/oder auf spezifische Basen innerhalb dieser Bezug genommen, dann sind lediglich die Basen in der Erkennungssequenz betroffen.
  • Expressionszustand
  • Ein Expressionszustand stellt einen Zustand eines beliebigen spezifischen Gewebes von irgendeinem Organismus zu einem beliebigen Zeitpunkt dar. Eine Änderung in den Zuständen führt zu Änderungen in der Genexpression, was zu einem anderen Expressionszustand führt. Es werden unterschiedliche Expressionszustände in verschiedenen Individuen, in unterschiedlichen Arten aufgefunden, wobei sie jedoch ebenfalls in unterschiedlichen Organen der gleichen Arten oder Individuen, und in unterschiedlichen Gewebetypen der gleichen Arten oder Individuen aufgefunden werden. Es können ebenfalls unterschiedliche Expressionszustände in dem gleichen Organ oder Gewebe in einer beliebigen einen Art oder einem Individuum erhalten werden, indem die Gewebe oder Organe unterschiedlichen Umgebungsbedingungen ausgesetzt werden, die Änderungen im Alter, Erkrankung, Infektion, Trockenheit, Feuchtigkeit, Salzgehalt, Aussetzen gegenüber Xenobiotika, physiologischen Wirkstoffen, Temperatur, Druck, pH-Wert, Licht, gasförmige Umgebung, Chemikalien wie beispielsweise Toxine, umfassen, jedoch nicht darauf beschränkt sind.
  • Künstliche Chromosomen
  • Wie hier verwendet, ist ein künstliches Chromosom (AC) ein Stück DNA, das stabil vermehrt und zusammen mit endogenen Chromosomen segregiert bzw. getrennt bzw. gemendelt werden kann. Für Eukaryoten kann das künstliche Chromosom ebenfalls als eine Nukleotidsequenz einer umfangreichen Länge beschrieben werden, die ein funktionelles Zentromer, funktionelle Telomere und mindestens eine autonom sich vermehrende Sequenz umfasst. Sie weist die Fähigkeit auf darin eingefügte heterologe Gene aufzunehmen und zu exprimieren. Beinhaltet es ein aktives Zentromer eines Säugetiers, dann wird es als ein künstliches Säugetierchromosom (MAC) bezeichnet. Künstliche Pflanzenchromosomen und künstliche Insektenchromosomen (BUGAC) beziehen sich auf Chromosomen, die Pflanzenbeziehungsweise Insekten-Zentromere einschließen. Ein künstliches Chromosom des Mensches (HAC) bezieht sich auf ein Chromosom, das Zentromere vom Menschen einschließt, wobei AVACs sich auf künstliche Chromosomen von Vögeln beziehen. Ein künstliches Chromosom der Hefe (YAC) bezieht sich auf Chromosomen, die in Hefe funktionell sind, wie beispielsweise Chromosomen, die ein Hefe-Zentromer einschließen.
  • Wie hier verwendet tritt ein stabiles Aufrechterhalten von Chromosomen auf, wenn mindestens ungefähr 85%, vorzugsweise 90%, noch bevorzugter 95% der Zellen die Chromosomen beibehalten. Die Stabilität wird in der Anwesenheit eines Selektionsmittels erfasst. Vorzugsweise werden dieser Chromosomen ebenfalls in der Abwesenheit eines Selektionsmittels aufrechterhalten. Stabile Chromosomen behalten ebenfalls deren Struktur während der Zellkultur bei, wobei sie weder unter intrachromosomalen noch interchromosomalen Umordnungen leiden.
  • Ausführliche Beschreibung der Erfindung
  • Im Folgenden wird die Erfindung in der Ordnung beschrieben, in der die Schritte des Erhaltens einer transformierten Wirtszelle, die ein ableitbares künstliches Chromosom beinhaltet, ausgehend mit dem Eintrittsvektor ausgeführt werden kann.
  • Herkunft von exprimierbaren Nukleotidsequenzen
  • Die exprimierbaren Nukleotidsequenzen, die in die erfindungsgemäßen Vektoren, Konkatemere und Zellen eingefügt werden können, umfassen einen beliebigen Typ von Nukleotid, wie beispielsweise RNA, DNA. Eine derartige Nukleotidsequenz kann beispielsweise aus cDNA erhalten werden, die aufgrund deren Beschaffenheit exprimiert werden kann. Ebenfalls ist es möglich Sequenzen genomischer DNA zu verwenden, die spezifische Gene kodieren. Vorzugsweise entsprechen die exprimierbaren Nukleotidsequenzen Volllängen-Genen, wie beispielsweise einer im Wesentlichen Volllängen cDNA, wobei jedoch die Nukleotidsequenzen, die für kürzere Peptide kodieren als die ursprünglichen Volllängen mRNAs ebenfalls verwendet werden können. Kürzere Peptide können immer noch die katalytische Aktivität ähnlich zu der der nativen Proteine beibehalten.
  • Ein anderer Weg exprimierbare Nukleotidsequenzen zu erhalten, besteht in einer chemischen Synthese von Nukleotidsequenzen, die für bekannte Peptid- oder Proteinsequenzen kodieren. Folglich müssen die exprimierbaren DNA-Sequenzen keine natürlich vorkommende Sequenz sein, obwohl aus praktischen Gründen bevorzugt werden kann, dass hauptsächlich natürliche vorkommende Nukleotidsequenzen verwendet werden. Ob die DNA einzel- oder doppelsträngig vorliegt, wird von dem verwendeten Vektorsystem abhängig sein.
  • In den meisten Fällen wird die Orientierung bezüglich des Promotors einer exprimierbaren Nukleotidsequenz derart sein, dass der kodierende Strang in eine passende mRNA umgeschrieben wird. Es ist jedoch vorstellbar, dass die Sequenz umgedreht werden kann, was ein Antisense-Transkript erzeugt, dass die Expression eines spezifischen Gens blockieren kann.
  • Kassetten
  • Eine besondere Ausführungsform der Erfindung betrifft eine Kassette von Nukleotiden in einer höchst geordneten Sequenz, wobei die Kassette die allgemeine Formel in 5'→3' Richtung
    Figure 00220001
    worin RS1 und RS1' Restriktionsstellen bezeichnen, RS2 und RS2' Restriktionsstellen bezeichnen, die von RS1 und RS1' verschieden sind, SP einzeln eine Abstandshaltersequenz von mindestens zwei Nukleotiden bezeichnet, PR einen Promotor bezeichnet, CS eine Klonierungsstelle bezeichnet und TR einen Terminator bezeichnet.
  • Ein Vorteil besteht darin, dass zwei unterschiedliche Restriktionsstellen bereitgestellt werden, die beide Seiten des Expressionskonstrukts flankieren. Durch Behandeln der primären Vektoren mit Restriktionsenzymen, die beide Restriktionsstellen spalten, werden das Expressionskonstrukt und der primäre Vektor mit zwei nicht verträglichen Enden erzeugt. Dies fördert einen Verkettungsvorgang, da die leeren Vektoren nicht an der Verkettung von Expressionskonstrukten teilnehmen.
  • Restriktionsstellen
  • Prinzipiell kann eine beliebige Restriktionsstelle, für die ein Restriktionsenzym bekannt ist, verwendet werden. Jene schließen die Restriktionsenzyme ein, die allgemein bekannt sind und in dem Gebiet der Molekularbiologie, wie beispielsweise jenen in Sambrook, Fritsch, Maniatis, "A laboratory Manual", 2te Ausgabe. Cold Spring Harbor Laboratory Press, 1989, beschriebenen, verwendet werden.
  • Die Restriktionsstellen-Erkennungssequenzen sind vorzugsweise von einer so umfangreichen Länge, dass die Möglichkeit eines Auftretens einer identischen Restriktionsstelle innerhalb des klonierten Oligonukleotids minimiert wird. Folglich kann die erste Restriktionsstelle mindestens 6 Basen umfassen, wobei jedoch die Restriktionssequenz noch bevorzugter mindestens 7 oder 8 Basen umfasst. Restriktionsstellen, die 7 oder mehr nicht N-Basen in der Erkennungssequenz aufweisen, sind allgemein als "seltene Restriktionsstellen" (siehe Beispiel 6) bekannt. Die Erkennungssequenz kann jedoch ebenfalls mindestens 10 Basen aufweisen, wie beispielsweise mindestens 15 Basen, beispielsweise mindestens 16 Basen, wie beispielsweise mindestens 17 Basen, beispielsweise mindestens 18 Basen, wie beispielsweise mindestens 19 Basen, beispielsweise mindestens 20 Basen, wie beispielsweise mindestens 21 Basen, beispielsweise mindestens 22 Basen, wie beispielsweise mindestens 23 Basen, beispielsweise mindestens 25 Basen, wie beispielsweise mindestens 30 Basen, beispielsweise mindestens 35 Basen, wie beispielsweise mindestens 40 Basen, beispielsweise min 45 Basen, wie beispielsweise mindestens 50 Basen.
  • Vorzugsweise wird die erste Restriktionsstelle RS1 und RS1' durch ein Restriktionsenzym erkannt, das stumpfe Enden der doppelsträngigen Nukleotidsequenzen erzeugt. Durch das Erzeugen stumpfer Enden an dieser Stelle wird das Risiko stark verringert, dass der Vektor an einer nachfolgenden Verkettung teilnimmt. Die erste Restriktionsstelle kann ebenfalls klebrige Enden erzeugen, wobei jene dann vorzugsweise nicht verträglich mit den klebrigen Enden sind, die sich aus der zweiten Restriktionsstelle RS2 und RS2' ergeben und mit den klebrigen Enden in dem AC.
  • Gemäß einer bevorzugten erfindungsgemäßen Ausführungsform umfasst die zweite Restriktionsstelle, RS2 und RS2', eine seltene Restriktionsstelle. Folglich, je länger die Erkennungsstelle der seltenen Restriktionsstelle ist, desto seltener ist sie und desto weniger wahrscheinlich ist es, dass das Restriktionsenzym, das sie erkennt die Nukleotidsequenz an anderen – unerwünschten – Positionen spaltet.
  • Die seltene Restriktionsstelle kann weiterhin als eine PCR-Priming-Stelle dienen. Dadurch wird ermöglicht, dass die Kassetten via PCR-Verfahren kopiert werden, wobei folglich die Kassetten von einem Vektor indirekt "ausgeschnitten" werden.
  • Abstandssequenz
  • Die zwischen der RS2 und der PR-Sequenz angeordnete Abstandshaltersequenz ist vorzugsweise eine nicht transkribierte Abstandshaltersequenz. Der Zweck der Abstandshaltersequenz(en) besteht darin die Rekombination zwischen unterschiedlichen Konkatemeren zu minimieren, die in der gleichen Zelle oder zwischen Kassetten in dem gleichen Konkatemer vorhanden ist, wobei sie ebenfalls den Zweck aufweisen können die Nukleotidsequenzen in den Kassetten dem "Wirt" ähnlicher zu machen. Ein weiterer Zweck der Abstandssequenz besteht darin das Auftreten einer Haarnadel-Bildung zwischen angrenzenden Palindrom-Sequenzen zu verringern, die auftreten können, falls die Kassetten Kopf an Kopf oder Schwanz an Schwanz angeordnet werden. Abstandssequenzen können ebenfalls einfach für kurze konservierte Nukleotidsequenzen eingefügt werden, die beispielsweise als PCR-Primerstellen oder als Ziel für eine Hybridisierung, beispielsweise an eine Nukleinsäure oder PNA- oder LNA-Sonden dienen, was eine Affinitätsreinigung der Kassetten gestattet.
  • Die Kassetten können ebenfalls wahlweise eine andere Abstandshaltersequenz von mindestens zwei Nukleotiden zwischen TR und RS2 umfassen. Werden Kassetten aus einem Vektor geschnitten und in Konkatemeren von Kassetten verkettet, dann gewährleisten die Abstandshaltersequenzen zusammen, dass es zwischen zwei aufeinanderfolgenden identischen Promotor- und/oder Terminator-Sequenzen einen bestimmten Abstand gibt. Dieser Abstand bzw. diese Entfernung kann mindestens 50 Basen umfassen, wie beispielsweise mindestens 60 Basen, beispielsweise mindestens 75 Basen, wie beispielsweise mindestens 100 Basen, beispielsweise mindestens 150 Basen, wie beispielsweise mindestens 200 Basen, beispielsweise mindestens 250 Basen, beispielsweise mindestens 300 Basen, beispielsweise mindestens 400 Basen, beispielsweise mindestens 500 Basen, wie beispielsweise mindestens 750 Basen, beispielsweise mindestens 1000 Basen, wie beispielsweise mindestens 1100 Basen, beispielsweise mindestens 1200 Basen, wie beispielsweise mindestens 1300 Basen, beispielsweise mindestens 1400 Basen, wie beispielsweise mindestens 1500 Basen, beispielsweise mindestens 1600 Basen, wie beispielsweise mindestens 1700 Basen, beispielsweise mindestens 1800 Basen, wie beispielsweise mindestens 1900 Basen, beispielsweise mindestens 2000 Basen, wie beispielsweise mindestens 2100 Basen, beispielsweise mindestens 2200 Basen, wie beispielsweise mindestens 2300 Basen, beispielsweise mindestens 2400 Basen, wie beispielsweise mindestens 2500 Basen, beispielsweise mindestens 2600 Basen, wie beispielsweise mindestens 2700 Basen, beispielsweise mindestens 2800 Basen, wie beispielsweise mindestens 2900 Basen, beispielsweise mindestens 3000 Basen, wie beispielsweise mindestens 3200 Basen, beispielsweise mindestens 3500 Basen, wie beispielsweise mindestens 3800 Basen, beispielsweise mindestens 4000 Basen, wie beispielsweise mindestens 4500 Basen, beispielsweise mindestens 5000 Basen, wie beispielsweise mindestens 6000 Basen.
  • Die Anzahl der Nukleotide, die zwischen dem Abstandshalter 5' zu der PR-Sequenz angeordnet und dem einem 3' zu der TR-Sequenz angeordnet sind, kann beliebig sein. Es kann jedoch vorteilhaft sein zu gewährleisten, dass mindestens eine der Abstandshaltersequenzen zwischen 100 und 2500 Basen umfasst, vorzugsweise zwischen 200 und 2300 Basen, noch bevorzugter zwischen 300 und 2100 Basen, wie beispielsweise zwischen 400 und 1900 Basen, noch bevorzugter zwischen 500 und 1700 Basen, wie beispielsweise zwischen 600 und 1500 Basen, noch bevorzugter zwischen 700 und 1400 Basen.
  • Falls die vorgesehene Wirtszelle Hefe ist, dann sollten die in einem Konkatemer vorhandenen Abstandshalter vorzugsweise eine Kombination von mehreren ARSes mit unterschiedlichen DNA-Fragmenten des Lambda-Pagen umfassen.
  • Bevorzugte Beispiele von Abstandshaltersequenzen umfassen, sind jedoch nicht beschränkt aufq: DNA des Lambda-Phagen, prokaryotische genomische DNA, wie beispielsweise E. coli genomische DNA, ARSes.
  • Promotor
  • Ein Promotor ist eine DNA-Sequenz, an die die RNA-Polymerase bindet und die die Transkription herbeiführt. Der Promotor bestimmt die Polarität des Transkripts indem er spezifiziert welcher Strang transkribiert wird.
    • • Bakterielle Promotoren beinhalten normalerweise von -35 und -10 (relativ zu dem Transkriptionsstart) Konsensus-Sequenzen, die durch einen spezifischen Sigma-Faktor und RNA-Polymerase gebunden werden.
    • • Eukaryotische Promotoren sind noch komplexer. Die meisten Promotoren, die in Expressionsvektoren verwendet werden, werden durch RNA-Polymerase II transkribiert. Allgemeine Transkriptionsfaktoren (GTFs) binden zuerst spezifische Sequenzen nahe dem Transkriptionsstart und rekrutieren anschließend die Bindung von RNA-Polymerase II. Zusätzlich zu diesen minimalen Promotorelementen, werden kleine Sequenzelemente spezifisch durch modulare DNA-Bindung/transaktivierende Proteine (beispielsweise AP-1, SP-1) erkannt, die die Aktivität eines gegebenen Promotors regulieren.
    • • Virale Promotoren können der gleichen Funktion dienen wie bakterielle und eukaryotische Promotoren. Auf eine virale Infektion von deren Wirt, leiten virale Promotoren die Transkription entweder unter Verwendung der Transkriptionsmaschine des Wirts oder durch Versorgung mit von Virus kodierten Enzymen, um einen Teil der Wirtsmaschine zu ersetzen. Die viralen Promotoren werden durch die Transkriptionsmaschine einer großen Anzahl von Wirtsorganismen erkannt und werden folglich häufig in Klonierungs- und in Expressionsvektoren verwendet.
  • Promotoren können weiterhin regulatorische Elemente umfassen, die DNA Sequenzelemente sind, welche in Verbindung mit Promotoren wirken und entweder Repressoren (beispielsweise lacO/LAC Iq Repressorsystem in E. coli) oder Induktoren (beispielsweise gal1/GAL4 Induktorsystem in Hefe) binden. In beiden Fällen wird die Transkription tatsächlich "abgeschaltet" bis der Promotor dereprimiert oder induziert wird, an welchem Punkt die Transkription "angeschaltet" wird. Die Wahl des in der Kassette befindlichen Promotors ist hauptsächlich von dem Wirtsorganismus, in den die Kassetten vorgesehen sind, eingefügt zu werden, abhängig. Ein wichtiges Erfordernis für diesen Zweck besteht darin, dass der Promotor vorzugsweise in der Wirtszelle funktionieren kann, in der die exprimierbare Nukleotidsequenz exprimiert werden soll.
  • Vorzugsweise ist der Promotor ein Promotor, der extern gesteuert werden kann, wie beispielsweise ein indizierbarer Promotor und/oder ein reprimierbarer Promotor. Der Promotor kann entweder durch Chemikalien, wie beispielsweise der Abwesenheit/Anwesenheit von chemischen Induktoren, beispielsweise Metaboliten, Substraten, Metallen, Hormonen, Zuckern gesteuert (reprimierbar/indizierbar) werden. Der Promotor kann auf ähnliche Weise durch bestimmte physikalische Parameter, wie beispielsweise Temperatur, pH-Wert, Redox-Zustand, Wachstumsstadium, Entwicklungsstadium gesteuert werden, oder der Promotor kann durch einen synthetischen Induktor/Repressor, wie beispielsweise den gal-Induktor induzierbar/reprimierbar sein.
  • Um eine nicht vorhergesehene Störung zwischen den Systemen der Genregulation der Wirtszelle zu vermeiden, und um die Steuerbarkeit der koordinierten Genexpression zu verbessern, ist der Promotor vorzugsweise ein synthetischer Promotor. Geeignete Promotoren werden in der US-5,978,227 , US-5,667,986 beschrieben. Prinzipien zur Gestaltung geeigneter synthetischer eukaryotischer Promotoren sind in US-5,559,027 , US-5,877,018 oder US-6,072,050 offenbart.
  • Synthetische indizierbare eukaryotische Promotoren zur Regulation der Transkription eines Gens können verbesserte Grade bzw. Höhen einer Proteinexpression niedrigere Basisspiegel der Genexpression erreichen. Derartige Promotoren beinhalten vorzugsweise mindestens zwei unterschiedliche Klassen von regulatorischen Elementen, wobei gewöhnlich ein nativer Promotor modifiziert wird, der eines der indizierbaren Elemente beinhaltet, indem das andere der indizierbaren Elemente eingefügt wird. Beispielsweise können native Promotoren zusätzlich auf Metal reagierende Elemente IRs:Es) und/oder auf Glucocorticoid reagierende Elemente (GREs) bereitgestellt werden. Außerdem können ein oder mehrere konstitutive Elemente funktionell abgeschaltet sein, um die niedrigeren Basisspiegel der Genexpression bereitzustellen.
  • Bevorzugte Beispiele von Promotoren umfassen, sind jedoch nicht beschränkt auf jene Promotoren, die durch einen Faktor ausgewählt aus der Gruppe bestehend aus Kohlenhydraten, beispielsweise Galactose, induziert und/oder reprimiert werden, niedrigen Spiegeln anorganischen Phosphats, Temperatur, beispielsweise niedrige oder hohe Temperatursprünge, Metalle oder Metallionen, beispielsweise Kupfer-Ionen, Hormonen, beispielsweise Dihydrotestosteron, Desoxycorticosteron, Hitzeschock (beispielsweise 39°C), Methanol; Redox-Zustand, Wachstumszustand, beispielsweise Entwicklungszustand, synthetische Induktoren, beispielsweise Gal-Induktor. Beispiele derartiger Promotoren umfassen, ADH1, PGK1, GAP491, TPI, PYK, ENO, PMA1, PHO5, GAL1, GAL2, GAL10, MET25, ADH2, MEL1, CUP1, HSE; AOX, MOX, SV40, CaMV, Opaque-2, GRE, ARE, PGK/ARE-Hybrid, CYC/GRE-Hybrid, TPI/α2-Operator, AOX 1, MOX A.
  • Noch bevorzugter wird der Promotor jedoch unter Hybrid-Promotoren, wie beispielsweise PGK/ARE-Hybrid, CYC/GRE-Hybrid oder unter synthetischen Promotoren ausgewählt. Derartige Promotoren können so gesteuert werden, ohne dass sie zu sehr/stark die Regulation von nativen Genen in dem Expressionswirt stören/beeinträchtigen.
  • Hefe-Promotoren
  • Im Folgenden werden Beispiele bekannter Hefe-Promotoren gezeigt, die in Verbindung mit der vorliegenden Erfindung verwendet werden können. Die Beispiele sind in keiner Weise beschränkend und dienen lediglich dazu, um dem Fachmann zu zeigen, wie Promotoren gewählt oder gestaltet werden, die erfindungsgemäß nützlich sind.
  • Obwohl zahlreiche transkriptionelle Promotoren, die in Hefe funktionell sind, in der Literatur beschrieben wurden, wurde lediglich für einige von ihnen für die Produktion von Polypeptiden durch die rekombinante Route Wirksamkeit gezeigt. Es können insbesondere die Promotoren der PGK-Gene (3-Phosphoglycerat-Kinase, der TDH-Gene, die GAPDH (Glycerinaldehydphosphat-Dehydrogenase) kodieren), TEF1-Gene (Elongations-Faktor 1), MFα1 (α Sex-Pheromonvorläufer), die als starke konstitutive Promotoren angesehen werden oder alternativ der regulierbaren Promotor CYC1, der in der Anwesenheit von Glucose oder PHO5 reprimiert wird, verwendet werden, was durch Thiamin reguliert werden kann. Aus Gründen, die jedoch häufig ungeklärt sind gestatten sie nicht immer die wirksame Expression der Gene, die sie steuern. In diesem Zusammenhang ist es immer vorteilhaft neue Promotoren aufweisen zu können, um neue wirksame Wirts/Vektor-Systeme zu erzeugen. Die Wahl wirksamer Promotoren in einer gegebenen Zelle ermöglicht weiterhin die Produktion mehrerer Proteine in dieser gleichen Zelle (beispielsweise mehrere Enzyme der gleichen metabolischen Kette) vorzusehen, während die Probleme einer Rekombination zwischen homologen Sequenzen vermieden wird.
  • Im Allgemeinen wird ein Promotor in der 5'-Region der Gene angeordnet und umfasst alle die Elemente, die die Transkription eines DNA-Fragments gestatten, das unter deren Kontrolle angeordnet ist, insbesondere:
    • (1) eine so genannte minimale Promotorregion, die die TATA-Box und die Stelle der Initiation der Transkription umfasst, was die Position der Stelle der Initiation als auch den basalen Grad einer Expression bestimmt. In Saccharomyces cerevisiae ist die Länge der minimalen Promotorregion relativ variabel. Tatsächlich variiert die genaue Stelle der TATA-Box von einem Gen zum anderen und kann von -40 bis -120 Nukleotiden stromaufwärts der Stelle der Initiation (Chen and Struhl, EMBO J. 4 (1985), 3273–3280) angeordnet sein.
    • (2) Sequenzen, die stromaufwärts der TATA-Box (unmittelbar stromaufwärts bis zu mehreren Hundert Nukleotiden) angeordnet sind, wodurch ermöglicht wird einen wirksamen Grad einer Transkription, entweder konstitutiv (ungeachtet den Bedin gungen der Kultur ein relativ konstantes Niveau einer Transkription die ganze Zeit über den Zellzyklus) oder in einer regulierten Weise (Aktivierung der Transkription in der Anwesenheit eines Aktivators und/oder Repression in der Anwesenheit eines Repressors) zu gewährleisten. Diese Sequenzen können mehrere Typen aufweisen: Aktivator, Inhibitor, Verstärker, Induktor, Repressor und kann auf zelluläre Faktoren oder auf geänderte Kulturbedingungen reagieren.
  • Beispiele derartiger Promotoren sind die ZZA1 und ZZA2-Promotoren, die in US-5,641,661 offenbart sind, der EF1-α Protein-Promotor und der ribosomale Protein S7 Gen-Promotor, die in WO 97/44470 offenbart sind, der COX 4 Promotor und zwei unbekannte Promotoren (SEQ ID NO. 1 und 2 in dem Dokument) sind in US-5,952,195 offenbart. Andere nützlich Promotoren schließen den in WO 98/54339 offenbarten HSP-150 Promotor und die in US-4,870,013 offenbarten SV40 und RSV-Promotoren ein als auch die in EP 0 329 203 A1 offenbarten PyK- und GAPDH-Promotoren.
  • Synthetische Hefe-Promotoren
  • Noch bevorzugter nutzt die Erfindung die Verwendung von synthetischen Promotoren. Synthetische Promotoren werden häufig durch Kombinieren der minimalen Promotorregion von einem Gen mit den stromaufwärts gelegenen regulatorischen Sequenzen von einem anderen Gen zusammengesetzt. Eine erhöhte Promotorkontrolle kann durch Modifizieren spezifischer Sequenzen in den stromaufwärts gelegenen regulatorischen Sequenzen erhalten werden, beispielsweise durch Substitution oder Deletion oder durch Einfügen mehrerer Kopien spezifischer regulatorischer Sequenzen. Ein Vorteil der Verwendung synthetischer Promotoren besteht darin, dass sie ohne einer zu hohen bzw. zu starken Beeinträchtigung der nativen Promotoren der Wirtszelle gesteuert werden können.
  • Ein derartiger synthetischer Hefe-Promotor umfasst Promotoren oder Promotorelemente von zwei verschiedenen von der Hefe abgeleiteten Genen, Hefe-Killertoxin-Leader-Peptid und den Amino-Terminus von IL-1β ( WO 98/54339 ).
  • Ein anderes Beispiel eines synthetischen Hefe-Promotors wird in US-5,436,136 (Hinnen et al.,) offenbart, die einen Hybrid-Promotor der Hefe, einschließlich eines 5' stromaufwärts befindlichen Promotorelements betrifft, das (eine) stromaufwärts befindliche Aktivierungsstelle(n) des PHO5-Gens der Hefe und ein 3' stromabwärts gelegenes Promotorelement des GAPDH-Gens der Hefe umfasst, das bei Nukleotid -300 bis -180 beginnt und bei Nukleotid -1 des GAPDH-Gens endet.
  • Andere Beispiele eines synthetischen Promotors der Hefe werden in US-5,089,398 (Rosenberg et al.,) offenbart. In dieser Offenbarung wird ein Promotor mit der allgemeinen Formel:
    (P.R.(2)-P.R.(1)) beschrieben,
    worin:
    P.R.(1) die Promotorregion proximal zu der kodierenden Sequenz ist und die Transkriptions-Initiationsstelle, die Bindungsstelle der RNA-Polymerase und einschließlich der TATA-Box die CAAT-Sequenz aufweist, als auch translationale regulatorische Signale, beispielsweise soweit erforderlich die Capping-Sequenz:
    P.R.(2) ist die Promotorregion, die mit dem 5'-Ende von P.R.(1) verbunden ist, die mit einer Erhöhung/Verstärkung der Effektivität der Transkription der RNA-Polymerase-Bindungsstelle assoziiert ist;
    In US-4,945,046 (Hori et al.,) wird ein weiteres Beispiel offenbart, wie ein synthetischer Hefe-Promotor zu gestalten ist. Dieser spezifische Promotor umfasst Promotorelemente, die sowohl von der Hefe als auch von einem Säuger abgeleitet sind. Der Hybrid-Promotor besteht im Wesentlichen aus dem PHO5 oder GAP-DH Promotor von Saccharomyces cerevisiae, von dem die stromaufwärts gelegene Aktivierungsstelle (UAS) deletiert und durch die von, SV40 abgeleitete, unmittelbare Enhancer- bzw. Verstärker-Region ersetzt wurde.
  • Klonierungsstelle
  • Die Klonierungsstelle in der Kassette in dem primären Vektor sollte so gestaltet sein, dass eine beliebige Nukleotidsequenz in sie kloniert werden kann.
  • Die Klonierungsstelle in der Kassette gestattet vorzugsweise direktionales Klonieren. Hierdurch wird gewährleistet, dass die Transkription in einer Wirtszelle von dem kodierenden Strang in der vorgesehenen Richtung ausgeführt wird und dass das umgeschriebene Peptid identisch zu dem Peptid ist für das die ursprüngliche Nukleotidsequenz kodiert.
  • Gemäß mehrerer Ausführungsformen kann jedoch es vorteilhaft sein die Sequenz in entgegengesetzter Richtung einzufügen. Gemäß dieser Ausführungsformen können sogenannte Antisense-Konstrukte eingefügt werden, die eine funktionelle Expression spezifischer Gene verhindern, die in spezifische Wege involviert sind. Dadurch kann ermöglicht werden, dass metabolische Zwischenprodukte von einem vorherrschenden Weg zu einem anderen weniger dominanten Weg abgeleitet bzw. abgelenkt werden.
  • Die Klonierungsstelle in der Kassette kann mehrere Klonierungsstellen umfassen, die allgemein als MCS oder Polylinker-Stellen bekannt sind, welche eine synthetische DNA-Sequenz ist, die eine Reihe von Erkennungsstellen von Restriktionsendonukleasen kodieren. Diese Stellen sind für ein bequemes Klonieren von DNA in einen Vektor an eine spezifische Position und für ein direktionales Klonieren des Einsatzes konstruiert.
  • Ein Klonieren von cDNA muss nicht die Verwendung von Restriktionsenzymen einbeziehen. Andere alternative Systeme umfassen, sind jedoch nicht beschränkt auf;
    • – CreatorTM Cre-loxP System von Clontech, das Rekombinations- und loxP-Stellen verwendet;
    • – Verwendung von Lambda-Anbringungs-Stellen (att-λ), wie beispielsweise das GatewayTM System von Life Technologies.
    Beide Systeme sind direktional.
  • Terminator
  • Die Rolle der Terminator-Sequenz besteht darin, die Transkription auf die Länge der kodierenden Sequenz zu beschränken. Eine optimale Terminator-Sequenz ist daher eine, die diese Wirkung in der Wirtszelle ausführen kann.
  • In Prokaryoten sind Sequenzen als transkriptionelle Terminatoren bekannt, die der RNA-Polymerase signalisieren die DNA-Matrize freizusetzen und die Transkription der naszierenden RNA zu stoppen.
  • In Eukaryoten werden RNA-Moleküle weit jenseits über das Ende des reifen mRNA-Moleküls transkribiert. Neue Transkripte werden enzymatisch gespalten und durch die Anfügung einer langen Sequenz von Adenylsäure-Resten, bekannt als Poly-A-Schwanz, modifiziert. Eine Konsensus-Sequenz für die Polyadenylierung ist ungefähr 10 bis 30 Basen stromaufwärts von der aktuellen Spaltstelle gelegen.
  • Bevorzugte Beispiele von Hefe abgeleiteten Terminator-Sequenzen umfassen, sind jedoch nicht beschränkt auf: ADN1, CYC1, GPD, ADH1 Alkoholdehydrogenase.
  • Intron
  • Wahlweise umfasst die Kassette in dem Vektor ein Intron, das 5' oder 3' zu der exprimierbaren Nukleotidsequenz angeordnet sein kann. Die Gestaltung und das Layout von Introns sind im Stand der Technik wohl bekannt. Die Wahl einer Introngestaltung hängt hauptsächlich von der vorgesehenen Wirtszelle ab, in der die exprimierbare Nukleotidsequenz schließlich exprimiert werden soll. Die Wirkungen, dass die Expressionskassetten Intronsequenzen aufweisen, sind jene die allgemein mit Intronsequenzen assoziiert sind.
  • Beispiele von Introns der Hefe können in der Literatur und in spezifischen Datenbanken, wie beispielsweise Ares Lab Yeast Intron Database (Version 2.1), wie aktualisiert am 15. April 2000, gefunden werden. Frühere Versionen der Datenbank, als auch Extrakte der Datenbank wurden in: "Genome-wide bioinformatic and molecular analysis of introns in Saccharomyces cerevisiae. "by Spingola M, Grate L, Haussier D, Ares M Jr. (RNA 1999 Feb; 5 (2): 221-34) und "Test of intron predictions reveals novel splice sites, alternatively spliced mRNAs and new introns in meiotically regulated genes of yeast. "by Davis CA, Grate L, Spingola M, Ares M Jr, (Nucleic Acids Res 2000 Apr 15; 28 (8): 1700-6) veröffentlicht.
  • Primäre Vektoren (Eintritts-Vektoren)
  • Der Begriff Eintritts-Vektor bedeutet einen Vektor zum Speichern und Amplifizieren von cDNA oder anderen exprimierbaren Nukleotidsequenzen unter Verwendung der erfindungsgemäßen Kassetten. Die primären Vektoren können vorzugsweise in E. coli oder beliebigen anderen geeigneten standardisierten Wirtszellen vermehrt werden. Sie sollten vorzugsweise amplifiziert werden können und Normalisierungs- und Anreicherungsverfahren zugänglich sein.
  • Der primäre Vektor kann von einem beliebigen DNA-Typ sein, der die wesentlichen Erfordernisse aufweist von a) sich selbst in mindestens einem geeigneten Wirtsorganismus replizieren zu können und b) ein Einfügen von Fremd-DNA gestatten, die anschließend zusammen mit dem Vektor repliziert wird und c) die Selektion von Vektormolekülen gestatten, die Einfügungen der Fremd-DNA beinhalten. In einer bevorzugten Ausführungsform kann der Vektor in standardisierten Wirten, wie Hefen und Bakterien replizieren und er sollte vorzugsweise eine hohe Kopienanzahl pro Wirtszelle aufweisen. Es wird ebenfalls bevorzugt, dass der Vektor zusätzlich zu einem Wirtsspezifischen Ursprung der Replikation einen Ursprung einer Replikation für einen einzelsträngigen Virus, wie beispielsweise den f1-Ursprung für filamentöse Phagen beinhaltet. Dies wird die Herstellung von einzelsträngiger Nukleinsäure ermöglichen, die für Normalisierungs- und Anreicherungsverfahren klonierter Sequenzen nützlich sein können. Es wurde eine große Anzahl von Klierungsvektoren beschrieben, die allgemein genutzt werden, wobei beispielsweise verwiesen wird auf: Sambrook, J; Fritsch, E. F; and Maniatis T. (1989) Molecular Cloning: A laboratory manual. Cold Spring Harbour Laboratory Press, USA, Netherlands Culture Collection of Bacteria (www.cbs.knaw.n1/NCCB/collection.htm) or Department of Microbial Genetics, National Institute of Genetics, Yata 1111 Mishima Shizuoka 411–8540, Japan (www.shigen.nia.ac.ip/cvector/cvector.html). Mehrere Typen-Beispiele, die die Eltern zahlreicher populärer Derivate bzw. Abkömmlinge sind, sind M13mp10, pUC18, Lambda gt 10 und pYAC4. Beispiele von primären Vektoren umfassen, sind jedoch nicht beschränkt auf M13K07, pBR322, pUC18, pUC19, pUC118, pUC119, pSP64, pSP65, pGEM-3, pGEM-3Z, pGEM-3Zf(–), pGEM-4, pGEM-4Z, πAN13, pBluescript 11, CHARON 4A, λ+, CHARON 21A, CHARON 32, CHARON 33, CHARON 34, CHARON 35, CHARON 40, EMBL3A, λ2001, λDASH, λFIX, λgt10, λgt11, λgt18, λgt20, λgt22, λORF8, XZAP/R, pJB8, c2RB, pcos1EMBL.
  • Verfahren zum Klonieren von cDNA oder genomischer DNA in einen Vektor sind im Stand der Technik wohl bekannt. Es kann auf J. Sambrook, E. F. Fritsch, T. Maniatis: Molecular Cloning, A Laborstory Manual (2''d edition, Cold Spring Harbor Laborstory Press, 1989) verwiesen werden.
  • Ein Beispiel eines kreisförmigen Modells eines Eintrittsvektors wird in 3 beschrieben. Der Vektor, EVE, beinhaltet die Expressionskassette, R1-R2-Abstandshalter-Promotor-Mehrfachklonierungsstelle-Terminator-Abstandshalter-R2-R1. Der Vektor beinhaltet weiterhin ein Gen für die Ampicillinresistenz, AmpR und einen Ursprung der Replikation für E. coli, ColE1.
  • Die Eintritts-Vektoren EVE4, EVE5 und EVE8 sind in den 4, 5 und 6 gezeigt und beinhalten alle Srf1 als R1 und Asc1 als R2. Beide Stellen sind palindromartig und werden als seltene Restriktionsstellen, die 8 Basen in der Erkennungssequenz aufweisen, angesehen. Die Vektoren beinhalten weiterhin das AmpR Ampicillinresistenzgen und den ColE1 Ursprung der Replikation für E. coli, als auch f1, welches ein Ursprung einer Replikation für filamentöse Phagen, wie beispielsweise M13, ist. EVE4 (4) beinhaltet den MET25 Promotor und den ADH1 Terminator. EVE8 (6) beinhaltet den CUP1 Promotor und den ADH1 Terminator. Die Abstandshalter von EVE8 stellen eine 550 Bp DNA des Lambda-Phagen (Abstandshalter 3) und eine ARS Sequenz von Hefe (Abstandshalter 4) dar.
  • Nukleotidbibliothek (Eintrittsbibliothek)
  • Im Stand der Technik sind Verfahren als auch geeignete Vektoren und Wirtszellen zur Konstruktion und Erhaltung einer Bibliothek von Nukleotidsequenzen wohl bekannt. Das primäre Erfordernis für die Bibliothek besteht darin, dass es möglich sein sollte in ihr eine Anzahl erfindungsgemäßer primärer Vektoren (Konstrukte) zu speichern und zu amplifizieren, wobei die Vektoren (Konstrukte) exprimierbare Nukleotidsequenzen von mindestens einem Expressionszustand umfassen und worin mindestens zwei Vektoren (Konstrukte) verschieden sind.
  • Ein spezifisches Beispiel einer derartigen Bibliothek besteht in den wohl bekannten und weit genutzten cDNA-Bibliotheken. Der Vorteil der cDNA-Bibliothek besteht hauptsächlich darin, dass sie lediglich DNA-Sequenzen beinhaltet, die abgeschriebener Messenger-RNA in einer Zelle entspricht. Ebenfalls sind geeignete Verfahren vorhanden, um die isolierte mRNA oder die synthetisierte cDNA zu reinigen, so dass lediglich im Wesentlichen Volllängen cDNA in die Bibliothek kloniert wird.
  • Um im Wesentlichen Volllängen cDNA zu erhalten, können Verfahren zur Optimierung des Prozesses eine Größenselektion, beispielsweise Elektrophorese, Chromatographie, Präzipitation, umfassen, oder können Wege umfassen, die die Wahrscheinlichkeit erhöhen Volllängen cDNAs zu erhalten, beispielsweise das SMARTTM-Verfahren (Clonetech) oder das CapTrapTM-Verfahren (Stratagene).
  • Das Verfahren zum Herstellen der Nukleotidbibliothek umfasst vorzugsweise, Erhalten einer im Wesentlichen Volllängen-cDNA-Population, die eine normalisierte Darstellung einer cDNA-Spezies umfasst. Noch bevorzugter umfasst eine wesentliche Population von Volllängen-cDNA eine normalisierte Repräsentanz bzw. Darstellung von cDNA-Spezies, die für einen gegebenen Expressionszustand charakteristisch ist.
  • Eine Normalisierung verringert die Redundanz von Klonen, die die im Übermaß vorhandenen mRNA-Spezies darstellen und erhöht die relative Repräsentanz von Klonen von seltenen mRNA-Spezies.
  • Verfahren zum Normalisieren von cDNA-Bibliotheken sind im Stand der Technik wohl bekannt. Es kann auf geeignete Protokolle zur Normalisierung verwiesen werden, wie auf jene, die in US-5,763,239 (DIVERSA) und WO 95/08647 und WO 95/11986 und Bonaldo, Lennon, Soares, Genome Research, 6 (1996), 791–806; Ali, Holloway, Taylor, Plant Mol Biol Reporter, 18 (2000), 123–132 beschrieben sind.
  • Anreicherungsverfahren werden verwendet, um mRNA darstellende Klone zu isolieren, die für einen bestimmten Expressionszustand charakteristisch sind. Eine Anzahl von Variationen des allgemein als subtraktive Hybridisierung bezeichneten Verfahrens ist im Stand der Technik bekannt. Es kann auf Sive, John, Nucleic Acid Res, 1988,16: 10937; Diatchenko, Lau, Campbell et al, PNAS, 1996,93: 6025–6030; Carninci, Shibata, Hayatsu, Genome Res, 2000, 10: 1617-30, Bonaldo, Lennon, Soares, Genome Research 1996,6: 791–806; Ali, Holloway, Taylor, Plant Mol Biol Reporter, 2000,18: 123–132, verwiesen werden. Beispielsweise kann eine Anreicherung durch zusätzliche Runden einer Hybridisierung ähnlich den Normalisierungsverfahren unter Verwendung von beispielsweise cDNA aus einer Bibliothek abundanter Klone oder einfach einer Bibliothek erreicht werden, die den nicht induzierten Zustand als einen Antrieb gegenüber einer Tester-Bibliothek von dem induzierten Zustand darstellt. Alternativ können mRNA oder PCR amplifizierte cDNA, die von dem Expressionszustand der Wahl abgeleitet sind, verwendet werden, um übliche Sequenzen von einer Tester-Bibliothek abzuziehen bzw. zu subtrahieren. Die Wahl einer Antreiber- und Tester-Population wird von der Beschaffenheit der Ziel- bzw. Targetexprimierbaren Nukleotidsequenzen in jedem besonderen Experiment abhängig sein.
  • In der Bibliothek wird eine für ein Peptid kodierende exprimierbare Nukleotidsequenz vorzugsweise in unterschiedlichen jedoch ähnlichen Vektoren unter der Kotrolle von verschiedenen Promotoren gefunden. Vorzugsweise umfasst die Bibliothek mindestens drei primäre Vektoren mit einer exprimierbaren Nukleotidsequenz, die für das gleiche Peptid unter der Kontrolle von drei unterschiedlichen Promotoren kodieren. Noch bevorzugter umfasst die Bibliothek mindestens vier primäre Vektoren mit einer exprimierbaren Nukleotidsequenz, die für das gleiche Peptid unter der Kontrolle von vier unterschiedlichen Promotoren kodiert. Noch bevorzugter umfasst die Bibliothek mindestens fünf primäre Vektoren mit einer exprimierbaren Nukleotidsequenz, die für das gleiche Peptid unter der Kontrolle von fünf unterschiedlichen Promotoren kodiert, beispielsweise mindestens sechs primäre Vektoren mit einer exprimierbaren Nukleotidsequenz umfasst, die für das gleiche Peptid unter der Kontrolle von sechs unterschiedlichen Promotoren kodiert, beispielsweise mindestens sieben primäre Vektoren mit einer exprimierbaren Nukleotidsequenz umfasst, die für das gleiche Peptid unter der Kontrolle von sieben unterschiedlichen Promotoren kodiert, beispielsweise mindestens acht primäre Vektoren mit einer exprimierbaren Nukleotidsequenz umfasst, die für das gleiche Peptid unter der Kontrolle von acht unterschiedlichen Promotoren kodiert, beispielsweise mindestens neun primäre Vektoren mit einer exprimierbaren Nukleotidsequenz umfasst, die für das gleiche Peptid unter der Kontrolle von neun unterschiedlichen Promotoren kodiert, beispielsweise mindestens zehn primäre Vektoren mit einer exprimierbaren Nukleotidsequenz umfasst, die für das gleiche Peptid unter der Kontrolle von zehn unterschiedlichen Promotoren kodiert.
  • Die exprimierbare Nukleotidsequenz, die für das gleiche Peptid kodiert, umfasst vorzugsweise im Wesentlichen die gleiche Nukleotidsequenz, noch bevorzugter die gleiche Nukleotidsequenz.
  • Da die Bibliothek etwas aufweist, das als ein Gen unter der Kontrolle einer Anzahl unterschiedlicher Promotoren in verschiedenen Vektoren bezeichnet werden kann, besteht, die Möglichkeit aus der Nukleotidbibliothek eine Anordnung von Kombinationen von Genen und Promotoren zu konstruieren. Vorzugsweise umfasst eine Bibliothek eine vollständige oder wesentlich vollständige Kombination, wie beispielsweise eine zweidimensionale Anordnung von Genen und Promotoren, worin im Wesentlichen alle Gene unter der Kontrolle von im Wesentlichen allen einer ausgewählten Anzahl von Promotoren gefunden werden.
  • Gemäß einer anderen Ausführungsform der Erfindung umfasst die Nukleotidbibliothek Kombinationen von exprimierbaren Nukleotidsequenzen, die in unterschiedlichen Vektoren mit verschiedenen Abstandshaltersequenzen und/oder verschiedenen Intronsequenzen kombiniert werden. Somit kann jede beliebige eine exprimierbare Nukleotidsequenz in einer zwei-, drei-, vier- oder fünfdimensionalen Anordnung mit verschiedenen Promotoren und/oder verschiedenen Abstandshaltern und/oder verschiedenen Introns und/oder verschiedenen Terminatoren kombiniert werden. Die zwei-, drei-, vier- oder fünfdimensionale Anordnung kann vollständig oder unvollständig sein, da nicht alle Kombinationen vorhanden sein müssen.
  • Die Bibliothek kann geeigneter Weise in einer Wirtszelle aufrechterhalten werden, die prokaryotische Zellen oder eukaryotische Zellen umfassen. Bevorzugte prokaryotische Wirtsorganismen können, sind jedoch nicht schränkt auf Escherichia coli, Bacillus subtilis, Streptomyces lividans, Streptomyces coelicolor, Pseudomonas aeruginosa, Myxococcus xanthus.
  • Es können ebenfalls Hefe-Spezies, wie beispielsweise Saccharomyces cerevisiae (Knospungs- bzw. Budding-Hefe), Schizosaccharomyces pombe (Spalthefe), Pichia pastoris, und Hansenula polymorpha (methylotrophe Hefe) verwendet werden. Filamentöse Ascomyceten, wie beispielsweise Neurospora crassa und Aspergillus nidulans können ebenfalls verwendet werden. Pflanzenzellen, wie beispielsweise jene, die von Nicotiana und Arabidopsis abgeleitet sind, werden bevorzugt. Bevorzugte Wirtszellen vom Säuger umfassen, sind jedoch nicht beschränkt auf jene, die vom Menschen, Affen und Nagetieren, wie beispielsweise Chinesischen Hamsterovariarzellen (CHO), NIH/3T3, COS, 293, VERO, HeLa, etc., (siehe Kriegler M. in "Gene Transfer and Expression: A Laboratory Manual", New York, Freeman & Co. 1990) abgeleitet sind.
  • Konkatemere
  • Ein Konkatemer ist eine Reihe von verbundenen Einheiten. In dem vorliegenden Zusammenhang wird ein Konkatemer verwendet, um eine Anzahl von seriell verbundenen Nukleotidkassetten zu bezeichnen, worin mindestens zwei der seriell verbundenen Nukleotideinheiten eine Kassette umfassen, die die wesentliche Struktur
    Figure 00390001
    worin
    rs1 und rs2 zusammen eine Restriktionsstelle bezeichnen,
    SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet,
    PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann,
    X eine exprimierbare Nukleotidsequenz bezeichnet,
    TR einen Terminator bezeichnet, und
    SP einzeln einen Abstandshalter von mindestens zwei Nukleotidbasen bezeichnet.
  • Wahlweise umfassen die Kassetten zwischen dem Promotor und der exprimierbaren Nukleotidsequenz und/oder zwischen dem Terminator und der exprimierbaren Sequenz eine Intronsequenz.
  • Die exprimierbare Nukleotidsequenz in der Kassette des Konkatemers kann eine DNA-Sequenz umfassen, die ausgewählt ist aus der Gruppe bestehend aus cDNA und genomischer DNA.
  • Gemäß einer Ausführungsform der Erfindung umfasst ein Konkatemer Kassetten mit exprimierbaren Nukleotiden von verschiedenen Expressionszuständen, so dass nicht natürlich vorkommende Kombinationen oder nicht native Kombinationen von exprimierbaren Nukleotidsequenzen erhalten werden. Diese unterschiedlichen Expressionszustände können mindestens zwei unterschiedliche Gewebe, wie beispielsweise mindestens zwei Organe, wie beispielsweise mindestens zwei Spezies, wie beispielsweise mindestens zwei Gattungen darstellen. Die unterschiedlichen Spezies können von mindestens zwei verschiedenen Phylae, wie beispielsweise von mindestens zwei unterschiedlichen Klassen sein, wie beispielsweise von mindestens zwei unterschiedlichen Abteilungen, noch bevorzugter von mindestens zwei unterschiedlichen Unterreichen, wie beispielsweise von mindestens zwei unterschiedlichen Reichen.
  • Die exprimierbaren Nukleotidsequenzen können beispielsweise von Eukaryoten, wie beispielsweise Säugern, beispielsweise Menschen, Mäusen oder Walen, von Reptilien, wie beispielsweise Schlangen, Krokodilen oder Schildkröten abgeleitet sein, von Tunikaten, wie beispielsweise der Seescheiden, von Lepidoptera, wie beispielsweise Schmetterlingen und Motten, von Coelenteraten, beispielsweise Quallen, Anemonen, oder Korallen, von Fisch, wie beispielsweise Knochen- oder Knorpelfischen, von Pflanzen, beispielsweise Dicotyledonen, beispielsweise Kaffee, Eiche oder Monocotyledonen, wie beispielsweise Gräsern, Lilien und Orchideen, von niederen Pflanzen, wie beispielsweise Algen und Ginko, von höheren Pilzen, wie beispielsweise terrestrischen fruchttragenden Pilzen, von marinen Actinomyceten. Die exprimierbaren Nukleotidsequenzen können ebenfalls von Protozoen, wie beispielsweise Malaria oder Trypanosomen stammen, oder von Prokaryoten wie beispielsweise E. coli oder Archaeobakterien. Die exprimierbaren Nukleotidsequenzen können von einem oder mehreren, vorzugsweise von mehreren Expressionszuständen der Spezies und Gattungen stammen, die in der nachstehenden Tabelle aufgelistet sind.
    Bakterien Streptomyces, Micromonospora, Norcadia, Actinomadura, Actinoplanes, Strepto
    sporangium, Microbispora, Kitasatosporiam, Azobakterium, Rhizobium,
    Achromobakterium, Enterobakterium, Brucella, Micrococcus, Lactobacillus,
    Bacillus (B. t. Toxine), Clostridium (Toxine), Brevibakterium, Pseudomonas,
    Aerobacter, Vibrio, Halobakterium, Mycoplasmen, Cytophaga, Myxococcus
    Pilze Amanita muscari (Fliegenpilz, Ibotensäure, Muscimol), Psilocybe bzw.
    Kahlköpfe (Psilocybin) Physarium bzw. Physarum, Fuligo, Mucor, Phytophtora,
    Rhizopus, Aspergillus, Penicillium (Penicillin), Coprinus, Phanerochaete,
    Acremonium (Cephalosporin), Trochoderma bzw. Trichoderma, Helmintho
    sporium, Fusarium, Alternaria, Myrothecium, Saccharomyces
    Algen Digenea simplex (Kainsäure, Anti-Helminthenmittel), Laminaria anqustata
    (Laminin, hypoton)
    Flechten Usnea fasciata (Vulpinsäure, anti-mikrobiell; Usnic acid bzw. Usnicsäure, Anti-
    Tumor)
    Höhere Pflanzen Artemisia (Artemisinin), Coleus (Forskolin), Desmodium (K-Kanalagonist),
    Catharanthus (Vincaalkaloide), Digitalis (Herzglycoside), Podophyllum (Podo
    phyllotoxin), Taxus (Taxol), Cephalotaxus (Homoharringtonin), Camptotheca
    (Camptothecin), Camellia sinensis (Tee), Cannabis indica, Cannabis sativa
    (Hanf), Erythroxylum coca (Coca), Lophophora williamsii (Kaktus-Peyote
    Myristica fragrans (Muskat), Nicotiana, Papaver somniferum (Schlafmohn),
    Phalaris arundinacea (Rohrglanzgras)
    Protozoe Ptychodiscus brevis; Dinoflagellaten (Brevitoxin, kardiovaskulär)
    Schwämme Microciona prolifera (Ectyonin, antimicrobial) Cryptotethya cryta (D-
    Arabinofuranoside)
    Coelenteraten Portuguese Man 0 War bzw. Portugiesische Galeere & andere Quallen und
    medusenähnliche Toxine
    Korallen Pseudoterogonia species (Pseudoteracine, anti-entzündlich), Erythropodium
    (Erythrolide, anti-entzündlich)
    Aschelminthen Sekretorische Verbindungen von Nematoden
    Mollusken Konus-Toxine, Meeresschnecken-Toxine, Neurotransmitter von Cephalopoden,
    Tintenfisch-Tinten
    Annelida Lumbriconereis heteropa (Nereistoxin, insektizid)
    Arachniden Dolomedes ("fishingspider bzw. Fangspinnen-"gifte)
    Crustacea Xenobalanus (Hauthaftmittel)
    Insekten Epilachna (Alkaloid des mexikanischen Bohnenkäfers)
    Spinunculida Bonellia viridis (Bonellin, neuroaktiv)
    Bryozoa Bugula neritina (Bryostatine, Anti-Krebs)
    Echinoderma Crinoid-Chemie
    Tunikaten Trididemnum solidum (Didemnin, Anti-Tumor und Anti-Virus; Ecteinascidia
    turbinata Ecteinascidine, Anti-Tumor)
    Vertebraten Eptatretus stoutii (Eptatretin, kardioaktiv), Trachinus draco (proteinöse Toxine,
    verringerter Blutdruck, Atmung und verringerte Herzfrequenz). Dendrobates-
    Frösche (Batrachotoxine, Pumiliotoxine, Histrionicotoxine, und andere Poly
    amine); Schlangengifttoxine; Orinthorhynohus anatinus (Schnabeltier-Gift),
    modifizierte Carotenoide, Retinoide und Steroide; Vögel: Histrionicotoxine,
    modifizierte Carotenoide, Retinoide und Steroids
  • Gemäß einer bevorzugten erfindungsgemäßen Ausführungsform umfasst das Konkatemer mindestens eine erste Kassette, wobei die erste Kassette von der zweiten Kassette verschieden ist. Noch bevorzugter umfasst das Konkatemer Kassetten, worin im Wesentlichen alle Kassetten verschieden sind. Der Unterschied zwischen den Kassetten kann von den Unterschieden zwischen Promotoren, und/oder exprimierbaren Nukleotidsequenzen, und/oder Abstandshaltern, und/oder Terminatoren, und/oder Introns herrühren.
  • Die Anzahl der Kassetten in einem einzelnen Konkatemer ist größtenteils von der Wirtsspezies abhängig, in die das Konkatemer schließlich eingefügt werden soll und den Vektor durch den die Einfügung ausgeführt wird. Das Konkatemer kann folglich mindestens 10 Kassetten umfassen, wie beispielsweise mindestens 15, beispielsweise mindestens 20, wie beispielsweise 25, beispielsweise 30, wie beispielsweise von 30 bis 60 oder mehr als 60, wie beispielsweise mindestens 75, beispielsweise mindestens 100, wie beispielsweise mindestens 200, beispielsweise mindestens 500, wie beispielsweise mindestens 750, beispielsweise mindestens 1000, wie beispielsweise mindestens 1500, beispielsweise mindestens 2000 Kassetten.
  • Jede der Kassetten kann so ausgelegt sein wie vorstehend beschrieben.
  • Sobald das Konkatemer angeordnet oder verkettet wurde, kann es in einen geeigneten Vektor ligiert werden. Ein derartiger Vektor kann vorteilhafter Weise ein künstliches Chromosom umfassen. Die wesentlichen Erfordernisse für ein funktionelles künstliches Chromosom wurden in der US-4,464,472 beschrieben, deren Inhalte hier durch Bezugnahme aufgenommen werden. Ein künstliches Chromosom oder ein funktionelles Minichromosom, wie es ebenfalls bezeichnet werden kann, muss eine DNA-Sequenz umfassen, die eine Replikation und eine stabile mitotische Aufrechterhaltung in einer Wirtszelle ausführen kann, die ein DNA-Segment umfasst, das für eine Zentromer-ähnliche Aktivität während der Mitose der Wirtszelle kodiert und eine DNA-Sequenz, die für eine Replikationsstelle kodiert, die durch den Wirt erkannt wird.
  • Geeignete künstliche Chromosomen schließen ein künstliches Hefe-Chromosom (YAC) (siehe beispielsweise Murray et al., Nature 305: 189–193, oder US-4,464,472 ) ein, ein künstliches Mega-Hefe-Chromosom (Mega-YAC), ein künstliches Bakterien-Chromosom (BAC), ein künstliches Maus-Chromosom, ein künstliches Sauger-Chromosom (MAC) (siehe beispielsweise US-6,133,503 oder US-6,077,697 ), ein künstliches Insekten-Chromosom (BUGAC), ein künstliches Vogel-Chromosom (AVAC), ein künstliches Chromosom von Bakteriophagen, ein künstliches Chromosom vom Baculovirus, ein künstliches Pflanzen-Chromosom ( US-5,270,201 ), ein BIBAC-Vektor ( US-5,977,439 ) oder ein künstliches Chromosom des Menschen (HAC).
  • Das künstliche Chromosom ist vorzugsweise so groß, dass die Wirtszelle es als ein "reales" Chromosom wahrnimmt und es aufrechterhält und es als ein Chromosom weitergibt. Bei Hefe und anderen geeigneten Wirtsspezies wird dies häufig ungefähr der Größe des kleinsten nativen Chromosoms in der Spezies entsprechen. Bei Saccharomyces weist das kleinste Chromosom eine Größe von 225 Kb auf.
  • MACs können verwendet werden, um künstliche Chromosomen von anderen Spezies, wie beispielsweise Insekten- und Fischspezies zu konstruieren. Die künstlichen Chromosomen sind vorzugsweise völlig funktionelle stabile Chromosomen. Es können zwei Typen von künstlichen Chromosomen verwendet werden. Ein Typ, der als SATACs [künstliches Satellitenchromosom] bezeichnet wird, sind stabile heterochrome Chromosomen, und wobei der andre Typ auf der Amplifikation von Euchromatin basierende Minichromosomen sind.
  • Künstliche Chromosomen von Sägern stellen extra-genomische spezifische Integrationsstellen zum Einfügen von Genen bereit, die Proteine von Interesse kodieren und eine DNA-Integration von einer Megabasengröße gestatten, wie beispielsweise eine Integration von erfindungsgemäßen Konkatemeren.
  • Gemäß einer anderen erfindungsgemäßen Ausführungsform kann das Konkatemer in die Wirtschromosomen integriert sein oder in andere Typen von Vektoren, wie beispielsweise einen Plasmidvektor, einen Phagenvektor, einen viralen Vektor oder einen Cosmidvektor kloniert werden.
  • Ein bevorzugter künstlicher Chromosomenvektor ist einer, der in der Wirtszelle, beispielsweise in Hefe, bedingt amplifiziert werden kann. Die Amplifikation ist vorzugsweise eine zehnfache Amplifikation. Weiterhin ist es vorteilhaft, dass die Klonierungsstelle des künstlichen Chromosomenvektors so modifiziert werden kann, dass sie die gleiche Restriktionsstelle umfasst wie die eine, die an die vorstehend beschriebenen Kassetten, d. h. RS2 und RS2', angrenzt.
  • Verkettung
  • Die zu verkettenden Kassetten werden gewöhnlich von einem Vektor entweder durch Verdau mit Restriktionsenzymen oder durch PCR ausgeschnitten. Nach dem Ausschneiden können die Kassetten von dem Vektor durch eine Größenfraktionierung, wie beispielsweise einer Gelfiltration oder durch Etikettieren bekannter Sequenzen in den Kassetten getrennt werden. Die isolierten Kassetten können dann entweder durch eine Interaktion zwischen klebrigen Enden oder durch eine Ligation von stumpfen Enden miteinander verbunden werden.
  • Es können einzelsträngige verträgliche Enden durch einen Verdau mit Restriktionsenzymen erzeugt werden. Bei der Verkettung wäre ein bevorzugtes Enzym zum Ausschneiden der Kassetten ein seltener Schneider, d. h. ein Enzym, das eine Sequenz von 7 und mehr Nukleotiden erkennt. Beispiele von Enzymen, die sehr selten schneiden, sind die Meganukleasen, von denen zahlreiche intronkodiert sind, wie beispielsweise I-Ceu 1, I-Sce 1, I-Ppo I und PI-Psp I (siehe Beispiel 6d für mehr). Andere bevorzugte Enzyme erkennen eine Sequenz von 8 Nukleotiden, wie beispielsweise Asc I, AsiS I, CciN I, CspB I, Fse I, MchA I, Not 1, Pac I, Sbf I, Sda I, Sgf I, SgrA I, Sse232 I und Sse8387 I, wobei alle von denen einzelsträngige, palindromische verträgliche Enden erzeugen.
  • Andere bevorzugte seltene Schneider, die ebenfalls verwendet werden können, um die Orientierung von individuellen Kassetten in dem Konkatemer zu steuern, sind Enzyme, die Nicht-Palindrom-Sequenzen ähnlich wie beispielsweise Aar I, Sap I, Sfi I, Sdi I und Vpa (siehe für mehr Beispiel 6c) erkennen.
  • Alternativ können Kassetten durch die Hinzufügung von Restriktionsstellen zu den Enden, beispielsweise durch PCR oder Ligation (kurze synthetische dsDNA-Moleküle) hergestellt werden. Es werden fortdauernd Restriktionsenzyme isoliert und charakterisiert und es wird angenommen, dass mehrere derartiger neuer Enzyme dazu verwendet werden können einzelsträngige verträgliche Enden gemäß der vorliegenden Erfindung zu erzeugen.
  • Es ist denkbar, dass einzelsträngige verträgliche Enden durch eine Spaltung des Vektors mit synthetischen Cuttern bzw. Abschneidern ausgeführt werden kann. Folglich kann eine reaktive chemische Gruppe, die normalerweise DNA unspezifisch spalten wird, an spezifischen Positionen schneiden, falls sie an ein anderes Molekül gekoppelt ist, das spezifische Sequenzen erkennt und daran bindet. Beispiele von Molekülen, die spezifische dsDNA-Sequenzen erkennen, sind DNA, PNA, LNA, Phosphothioate, Peptide und Amide. Siehe beispielsweise Armitage, B. (1998) Chem. Rev. 98: 1171–1200, der eine Photospaltung unter Verwendung von beispielsweise Anthraquinon und UV-Licht beschreibt; Dervan P. B. & Burli R. W. (1999) Curr. Opin. Chem. Biol. 3: 688-93 beschreiben die spezifische Bindung von Polyamiden an DNA; Nielsen, P. E. (2001) Curr. Opin. Biotechnol. 12: 16–20 beschreiben die spezifische Bindung von PNA an DNA, und wobei die Chemical Reviews mit der speziellen Themenausgabe: RNA/DNA Cleavage (1998) vol. 98 (3) Bashkin J. K. (ed.) ACS Publikationen, beschreiben mehrere Beispiele von chemischen DNA-Spaltern.
  • Einzelsträngige verträgliche Enden können unter Verwendung von beispielsweise PCR-Primern, einschließlich dUTP erzeugt werden, und wobei anschließend das PCR-Produkt mit Uracil-DNA-Glycolase (Ref: US-5,035,996 ) behandelt wird, um einen Teil des Primers abzubauen. Alternativ können verträgliche Enden sowohl an dem Vektor als auch an dem Einsatz durch Anhängen von komplementären Nukleotiden unter Verwendung von terminaler Transferase (Chang, LMS, Bollum TJ (1971) J Biol Chem. 246: 909) erzeugt werden.
  • Ebenfalls ist denkbar, dass eine Rekombination verwendet werden kann, um Konkatemere beispielsweise durch die Modifikation von Techniken wie beispielsweise das CreatorTM System (Clontech) zu erzeugen, das den Cre-loxP Mechanismus (Sauer B, Methods Enzymol. 225 (1993), 890–900) anwendet, um DNA-Moleküle durch Rekombination direktional zu verbinden oder wie das GatewayTM System (Life Technologies, US-5,888,732 ), das Lambda att Anbringungsstellen für die direktionale Rekombination (Landy A, 1989, Ann Rev. Biochem 58: 913) verwendet. Es ist vorgesehen, dass ebenfalls von einer Lambda cos-Stelle abhängige Systeme entwickelt werden können, um eine Verkettung zu gestatten.
  • Noch bevorzugter können die Kassetten ohne einen beeinträchtigenden Reinigungsschritt durch Ausschneiden von einem Vektor mit zwei Restriktionsenzymen verkettet werden, einem, das klebrige Enden erzeugt, und wobei das andere stumpfe Enden in den Vektoren erzeugt. Dies ist das bevorzugte Verfahren zur Verkettung von Kassetten von Vektoren, die die Basisstruktur von [RS1-RS2-SP-PR-X-TR-SP-RS2'-RS1'] aufweisen.
  • Ein alternativer Weg zur Herstellung von Konkatemeren, die frei von Vektorsequenzen sind, bestünde darin die Kassetten von einem einzelsträngigen primären Vektor mit PCR zu amplifizieren. Das PCR-Produkt muss die Restriktionsstellen RS2 und RS2' einschließen, die anschließend durch deren Erkennungsenzym(e) gespalten werden. Die Verkettung kann dann unter Verwendung des verdauten PCR-Produkts im Wesentlichen ohne eine Beeinträchtigung von der einzelsträngigen primären Vektormatrix oder den kleinen doppelsträngigen Fragmenten ausgeführt werden, die von den Enden geschnitten wurden.
  • Das Konkatemer kann durch eine Verkettung von mindestens zwei Kassetten von Nukleotidsequenzen angeordnet oder verkettet werden, wobei jede Kassette ein erstes klebriges Ende, eine Abstandshaltersequenz, einen Promotor, eine exprimierbare Nukleotidsequenz, einen Terminator, eine Abstandshaltersequenz und ein zweites klebriges Ende umfassen. Ein Flussdiagramm des Verfahrens wird in 2 gezeigt.
  • Vorzugsweise umfasst eine Verkettung weiterhin:
    Ausgehend von einem primär Vektor [RS1-RS2-SP-PR-X-TR-SP-RS2'-RS1'],
    worin X eine exprimierbare Nukleotidsequenz bezeichnet,
    RS1 und RS1' Restriktionsstellen bezeichnen,
    RS2 und RS2' von RS1 und RS1' verschiedene Restriktionsstellen bezeichnen,
    SP einzeln einen Abstandshalter mit mindestens zwei Nukleotiden bezeichnet,
    PR einen Promotor bezeichnet,
    TR einen Terminator bezeichnet,
    • i) Schneiden des primären Vektors mit der Hilfe von mindestens einem Restriktionsenzym, das spezifisch für RS2 und RS2' ist, Erhalten von Kassetten, die die allgemeine Formel [rs2-SP-PR-X-TR-SP-rs1] aufweist, worin rs1 und rs2 zusammen eine funktionelle Restriktionsstelle RS2 und RS2' bezeichnen,
    • ii) Anordnen der ausgeschnittenen Kassetten durch eine Interaktion zwischen rs1 und rs2.
  • Auf diese Weise können mindestens 10 Kassetten, wie beispielsweise mindestens 15 verkettet werden, beispielsweise mindestens 20, wie beispielsweise 25, beispielsweise 30, wie beispielsweise von 30 bis 60 oder mehr als 60, wie beispielsweise mindestens 75, beispielsweise mindestens 100, wie beispielsweise mindestens 200, beispielsweise mindestens 500, wie beispielsweise mindestens 750, beispielsweise mindestens 1000, wie beispielsweise mindestens 1500, beispielsweise mindestens 2000 Kassetten.
  • Gemäß einer besonders bevorzugten Ausführungsform werden Vektorarme, die jeweils ein RS2 oder RS2' in einem Ende und einen nicht-komplementären Überhang oder ein stumpfes Ende in dem anderen Ende aufweisen zu dem Verkettungs- bzw. Konkatenationsgemisch zusammen mit den vorstehend beschriebenen Kassetten zugegeben, um das Verfahren (siehe 2b) weiter zu vereinfachen. Ein Beispiel eines geeigneten Vektors zum Bereitstellen von Vektorarmen wird in der 7 offenbart, wobei TRP1, URA3 und HIS3 auxotrophe Markergene sind, wobei AmpR ein Antibiotikum – Markergen von E. coli ist. CEN4 ist ein Zentromer und TEL Telomeren sind. ARS1 und PMB1 ermöglichen in Hefe bezieh ungsweise in E. coli eine Replikation. BamHI und Asc I sind Erkennungsstellen von Restriktionsenzymen. Die Nukleotidsequenz des Vektors ist in SEQ ID NO. 4 ausgeführt. Der Vektor wird mit BamHI und Asc I verdaut, um die Vektorarme freizusetzen, die zur Ligation an das Konkatemer verwendet werden.
  • Das Verhältnis von Vektorarmen zu Kassetten bestimmt die maximale Anzahl von Kassetten in dem, in 8 dargestellten, Konkatemer. Die Vektorarme sind vorzugsweise Vektorarme künstlicher Chromosomen, wie beispielsweise jene, die in 7 beschrieben wurden.
  • Es ist selbstverständlich ebenfalls möglich Stopperfragmente zu der Verkettungslösung hinzuzufügen, wobei die Stopperfragmente jeweils ein RS2 oder RS2' in einem Ende und einen nicht-komplementären Überhang oder ein stumpfes Ende in dem anderen Ende aufweisen. Das Verhältnis von Stopperfragmenten zu Kassetten kann die maximale Größe des Konkatemers gleichermaßen steuern.
  • Die vollständige Reihenfolge von vorzunehmenden Schritten kann, wenn von der Isolation von mRNA bis zum Einfügen in einen Eintrittsvektor ausgegangen wird, die folgenden Schritte umfassen
    • i) Isolieren von mRNA von einem Expressionszustand,
    • ii) Erhalten von im Wesentlichen Volllängen cDNA, die den mRNA-Sequenzen entspricht,
    • iii) Einfügen der im Wesentlichen Volllängen cDNA in eine Klonierungsstelle in einer Kassette in einem primären Vektor, wobei die Kassette der allgemeinen Formel in 5'→3' Richtung vorliegt: [RS1-RS2-SP-PR-CS-TR-SP-RS2'-RS1'] worin CS eine Klonierungsstelle bezeichnet.
  • Bei der Herstellung des Konkatemers können Gene von unterschiedlichen Eintrittsbibliotheken isoliert werden, um die wünschenswerte Auswahl von Genen bereitzustellen. Dementsprechend kann eine Verkettung weiterhin eine Auswahl von Vektoren umfassen, die exprimierbare Nukleotidsequenzen von mindestens zwei unterschiedlichen Expressions zustanden, wie beispielsweise von zwei unterschiedlichen Spezies, aufweisen. Die zwei unterschiedlichen Spezies können von zwei unterschiedlichen Klassen sein, wie beispielsweise von zwei unterschiedlichen Abteilungen, noch bevorzugter von zwei unterschiedlichen Unterreichen, wie beispielsweise von zwei unterschiedlichen Reichen.
  • Als Alternative zum Einschließen von Vektorarmen in die Verkettungsreaktion besteht die Möglichkeit das Konkatemer in ein künstliches Chromosom zu legieren, das ausgewählt ist aus der Gruppe bestehend aus künstliches Hefe-Chromosom, künstliches Mega-Hefe-Chromosom, künstliches Bakterienchromosom, künstliches Chromosom der Maus, künstliches Chromosom des Menschen.
  • Vorzugsweise umfasst mindestens ein eingefügtes Konkatemer einen Selektionsmarker. Der/Die Marker sind zweckdienlicher Weise nicht in dem Konkatemer als solchem eingeschlossen, jedoch vielmehr in einem künstlichen Chromosomenvektor, in dem das Konkatemer eingefügt vorliegt. Marker, die gewählt werden können, stellen gewöhnlich ein Mittel bereit, um lediglich jene Zellen, die einen Vektor beinhalten auf Wachstum zu selektionieren. Derartige Marker bestehen aus zwei Typen: Arzneimittelresistenz und Auxotrophie. Ein Arzneimittel-Marker ermöglicht Zellen in der Anwesenheit einer andererseits toxischen Verbindung zu wachsen. Auxotrophe Marker gestatten Zellen dadurch in einem Medium zu wachsen, dem eine essentielle Komponente fehlt, indem sie die Zellen befähigen die essentielle Komponente (gewöhnlich eine Aminosäure) zu synthetisieren.
  • Erläuternde und nicht beschränkende Beispiele gewöhnlicher Verbindungen, für die Selektionsmarker verfügbar sind, folgen mit einer kurzen Beschreibung deren Wirkungsmechanismus:
  • Prokaryotisch
    • • Ampicillin: greift in eine terminale Reaktion in der bakteriellen Zellwandsynthese ein. Das Resistenzgen (bla) kodiert beta-Lactamase, die den beta-Lactamring des Antibiotikums spaltet, wobei es folglich detoxifiziert wird.
    • • Tetracyclin: verhindert eine bakterielle Proteinsynthese, indem es an die 30S ribosomale Untereinheit bindet. Das Resistenzgen (tet) spezifiziert ein Protein, das die Bakterienmembran modifiziert und eine Akkumulation des Antibiotikums in der Zelle verhindert.
    • • Kanamycin: bindet an die 70S Ribosomen und bewirkt ein fehlerhaftes Ablesen der Messenger RNA. Das Resistenzgen (nptH) modifiziert das Antibiotikum und verhindert eine Interaktion mit dem Ribosom.
    • • Streptomycin: bindet an die 30S ribosomale Untereinheit, wodurch ein fehlerhaftes Ablesen der Messenger RNA bewirkt wird. Das Resistenzgen (Sm) modifiziert das Antibiotikum und verhindert eine Interaktion mit dem Ribosom.
    • • Zeocin: dieses neue zur Familie der Bleomycine gehörende Antibiotikum interkaliert in die DNA und spaltet sie. Das Zeocin-Resistenzgen kodiert ein Protein mit 13.665 Dalton. Dieses Protein überträgt Resistenz gegenüber Zeocin, indem es an das Antibiotikum bindet und es daran hindert DNA zu binden. Zeocin ist gegenüber den meisten aeroben Zellen wirksam und kann zur Selektion in Zelllinien von Säugern, in Hefe und Bakterien verwendet werden.
  • Eukaryotisch
    • • Hygromycin: ist ein Aminocyclitol, das die Proteinsynthese verhindert, indem die Ribosomentranslokation gestört wird, wobei eine fehlerhafte Translation gefördert wird. Das Resistenzgen (hph) detoxifiziert Hygromycin-B-Phosphorylierung.
    • • Histidinol: ist zytotoxisch für Säugerzellen, indem die Histidyl-tRNA-Synthese in Histidin freiem Medium gehemmt wird. Das Resistenzgen (hisD)-Produkt inaktiviert die Toxizität von Histidinol, indem es die essentielle Aminosäure Histidin umsetzt.
    • • Neomycin (G418): blockiert die Proteinsynthese, indem die ribosomalen Funktionen gestört werden. Das Resistenzgen ADH kodiert eine Aminoglycosid-Phosphotransferase, die G418 detoxifiziert.
    • • Uracil: Laborstämme der Hefe, die ein mutiertes Gen tragen, das Orotidin -5'-Phosphat-Decarboxylase kodiert, ein Enzym, das für die Uracil-Biosynthese essentiell ist, können in der Abwesenheit von exogenem Uracil nicht wachsen. Eine Kopie des Wild-Typgens (ura4+, S. pombe oder URA3 S. cerevisiae), das auf dem Vektor getragen wird, wird diesen Defekt in den transformierten Zellen komplementieren.
    • • Adenosin: Laborstämme, die eine Unzulänglichkeit bzw. Defizienz in der Adenosinsynthese tragen, können durch einen das Wild-Typgen, ADE 2 tragenden Vektor komplementiert werden.
    • • Aminosäuren: Vektoren, die die Wild-Typgene für LEU2, TRP1, HIS3 oder LYS2 tragen, können verwendet werden, um Stämme von Hefe zu komplementieren, die in diesen Genen defizient sind.
    • • Zeocin: dieses neue zur Familie der Bleomycine gehörende Antibiotikum interkaliert in die DNA und spaltet sie. Das Zeocin-Resistenzgen kodiert ein Protein mit 13.665 Dalton. Dieses Protein überträgt Resistenz gegenüber Zeocin, indem es an das Antibiotikum bindet und es daran hindert DNA zu binden. Zeocin ist gegenüber den meisten aeroben Zellen wirksam und kann zur Selektion in Zelllinien von Säugern, in Hefe und Bakterien verwendet werden.
  • Transgene Zellen
  • In einer Ausführungsform der Erfindung werden die Konkatemere, die die Vielzahl von Kassetten umfassen, in eine Wirtszelle eingefügt, in der die Konkatemere aufrechterhalten werden und die exprimierbaren Nukleotidsequenzen auf eine koordinierte Weise exprimiert werden können. Die Kassetten, die in den Konkatemeren umfasst sind, können von der Wirtszelle isoliert und aufgrund deren einheitlicher Struktur mit -vorzugsweise-Konkatemer-Restriktionsstellen zwischen den Kassetten erneut angeordnet werden.
  • Die für diesen Zweck selektionierten Wirtszellen können vorzugsweise unter standardisierten Laborbedingungen unter Verwendung standardisierter Kulturbedingungen, wie beispielsweise Standardmedien und Protokollen, kultiviert werden. Vorzugsweise umfassten die Wirtszellen eine im Wesentlichen stabile Zelllinie, in der die Konkatemere für Generationen von Zellteilungen aufrechterhalten werden können. Standardverfahren zur Transformation der Wirtszellen und insbesondere Verfahren zur Insertion künstlicher Chromosomen in die Wirtszellen sind wohl bekannt.
  • Es ist ebenfalls vorteilhaft, falls die Wirtszellen eine Meiose durchmachen können, um eine sexuelle Rekombination auszuführen. Es ist ebenfalls vorteilhaft, dass die Meiose durch externe Manipulationen der Zellkultur gesteuert werden kann. Ein besonders vorteilhafter Wirtszelltyp ist einer, bei dem die Zellen durch externe Manipulationen in unterschiedliche Paarungstypen manipuliert werden können.
  • Das Genom einer Anzahl von Spezies wurde bereit mehr oder weniger vollständig sequenziert, wobei die Sequenzen in Datenbanken aufgefunden werden können. Die Liste von Spezies für die das gesamte Genom sequenziert wurde erhöht sich fortlaufend. Vorzugsweise wird die Wirtszelle aus einer Gruppe von Spezies ausgewählt, für die das gesamte Genom oder im Wesentlichen das gesamte Genom sequenziert wurde. Die Wirtszelle sollte vorzugsweise ausgewählt werden unter einer Spezies, die in der Literatur bezüglich der Genetik, dem Metabolismus, der Physiologie, beispielsweise als ein Modellorganismus wohl beschrieben ist, der zur Genomik-Forschung verwendet wurde.
  • Der Wirtsorganismus sollte vorzugsweise bedingt fehlerhaft in den Befähigungen eine homologe Rekombination durchzumachen sein. Der Wirtsorganismus sollte vorzugsweise eine Codonverwendung bzw. -präferenz aufweisen, die zu der der Spenderorganismen ähnlich ist. Weiterhin wird, in dem Fall von genomischer DNA bevorzugt, falls eukaroytische Spenderorganismen verwendet werden, dass der Wirtsorganismus die Befähigung aufweist die Messenger RNA des Spenders genau bearbeiten, beispielsweise die Introns ausspleissen zu können.
  • Die Wirtszellen können Bakterien, Archaeobakterien oder Eukaryoten sein und können eine homogene Zelllinie oder eine gemischte Kultur bilden. Geeignete Zellen umfassen die bakteriellen und eukaryotischen Zelllinien, die gewöhnlich in der Gentechnik und der Proteinexpression verwendet werden.
  • Bevorzugte prokaryotische Wirtsorganismen können, sind jedoch nicht beschränkt auf Escherichia coli, Bacillus subtilis, B licehniformis bzw. licheniformis, B. cereus, Streptomyces lividans, Streptomyces coelicolor, Pseudomonas aeruginosa, Myxococcus xanthus.
  • Rhodococcus, Streptomyceten, Actinomyceten, Corynebacterien, Bacillus, Pseudomonas, Salmonella, und Erwinia. Die komplette Genomsequenz von E. coli und Bacillus subtilis werden durch Blattner et al., Science 277, 1454–1462 (1997); Kunst et al., Nature 390,249–256 (1997)) beschrieben.
  • Bevorzugte eukaryotische Organismen sind Säugetiere, Fische, Insekten, Pflanzen, Algen, und Pilze.
  • Beispiele von Säugerzellen umfassen jene von beispielsweise Affe, Maus, Ratte, Hamster, Primat und Mensch von sowohl Zelllinien als auch von primären Kulturen. Bevorzugte Wirtszellen von Säugern umfassen, sind jedoch nicht beschränkt auf jene, die von Menschen, Affen und Nagern abgeleitet sind, wie beispielsweise chinesische Hamsterovariar-(CHO)-zellen, NIH/3T3, COS, 293, VERO, HeLa, etc. (siehe Kriegler M. "Gene Transfer and Expression: A Laboratory Manual", New York, Freeman & Co. 1990), und Stammzellen einschließlich nicht-menschlicher embryonaler Stammzellen und hämatopoietischer Stammzellen, Zygoten, Fibroblasten, Lymphozyten, Niere, Leber, Muskel und Hautzellen.
  • Beispiele von Insektenzellen schließen Baculo-Lepidoptera ein.
  • Beispiele von Pflanzenzellen umfassen Mais, Reis, Weizen, Baumwolle, Sojabohne und Zuckerrohr. Bevorzugte Pflanzenzellen sind jene von Nicotiana und Arabidopsis.
  • Beispiele von Pilzen umfassen Penicillium, Aspergillus, wie beispielsweise Aspergillus nidulans, Podospora, Neurospora, wie beispielsweise Neurospora crassa, Saccharomyces, wie beispielsweise Saccharomyces cerevisiae (Knospungs-Hefe), Schizosaccharomyces, wie beispielsweise Schizosaccharomyces pombe (Spaltungs-Hefe), Pichia spp, wie beispielsweise Pichia pastoris, und Hansenula polymorpha (methylotrophe Hefe).
  • In einer bevorzugten Ausführungsform ist die Wirtszelle eine Hefezelle, wobei eine erläuternde und nicht beschränkende Liste geeigneter Wirtszellen der Hefe umfassen: Bäcker-Hefe, Kluyveromyces marxianus, K. factis, Candida utilis, Phaffia rhodozyma, Saccharomyces boulardii, Pichia pastoris, Hansenula polymorpha, Yarrowia lipolytica, Candida paraffinica, Schwanniomyces castellii, Pichia stipitis, Candida shehatae, Rhodotorula glutinis, Lipomyces lipofer, Cryptococcos curvatus, Candida spp. (beispielsweise C. palmioleophila), Yarrowia lipolytica, Candida guilliermondii, Candida, Rhodotorula spp., Saccharomycopsis spp., Aureobasidium pullulans, Candida brumptii, Candida hydrocarbofumarica, Torulopsis, Candida tropicalis, Saccharomyces cerevisiae, Rhodotorula rubra, Candida flaveri, Eremothecium ashbyii, Pichia spp., Pichia pastoris, Kluyveromyces, Hansenula, Kloeckera, Pichia, Pachysolen spp., oder Torulopsis bombicola.
  • Die Wahl des Wirtes wird von einer Anzahl von Faktoren abhängig sein, die von der vorgesehenen Verwendung des konstruierten Wirtes, einschließlich Pathogenität, Substratbereich, Widerstandsfähigkeit gegenüber der Umgebung, Anwesenheit von Schlüssel-Zwischenprodukten, Leichtigkeit einer genetischen Manipulation und Wahrscheinlichkeit eines promiskuitiven Transfers von genetischer Information auf andere Organismen, abhängen wird. Besonders vorteilhafte Wirte sind E. coli, Lactobacilli, Streptomyceten, Actinomyceten, Saccharomyces und filamentösen Pilze.
  • Es besteht die Möglichkeit in einer beliebigen Wirtszelle alle Sorten von Kombinationen von exprimierbaren Nukleotidsequenzen von allen möglichen Quellen auszuführen. Weiterhin besteht die Möglichkeit Kombinationen von Promotoren und/oder Abstandshaltern und/oder Introns und/oder Terminatoren in Kombination mit einer und der gleichen exprimierbaren Nukleotidsequenz auszuführen.
  • Folglich können in einer beliebigen einen Zelle exprimierbare Nukleotidsequenzen von zwei unterschiedlichen Expressionszuständen vorliegen. Weiterhin können jene zwei unterschiedlichen Expressionszustände von einer Spezies oder vorteilhafter Weise von zwei verschiedenen Spezies sein. Eine beliebige eine Wirtszelle kann ebenfalls exprimierbare Nukleotidsequenzen von mindestens drei Spezies, wie beispielsweise von mindestens vier, fünf, sechs, sieben, acht, neun oder zehn Spezies umfassen oder von mehr als 15 Spezies, beispielsweise von mehr als 20 Spezies, beispielsweise von mehr als 30, 40, oder 50 Spezies, wie beispielsweise mehr als 100 unterschiedlichen Spezies, beispielsweise von mehr als 300 verschiedenen Spezies, wie beispielsweise von mehr als 500 verschiedenen Spezies, beispielsweise von mehr als 1.000 verschiedenen Spezies, wodurch Kombinationen einer großen Anzahl von exprimierbaren Nukleotidsequenzen von einer großen Anzahl von Spezies erhalten werden. Auf diese Weise können möglicherweise unbegrenzte Mengen bzw. Anzahlen von Kombinationen von exprimierbaren Nukleotidsequenzen über unterschiedliche Expressionszustände kombiniert werden. Die unterschiedlichen Expressionszustände können mindestens zwei unterschiedliche Gewebe, wie beispielsweise mindestens zwei unterschiedliche Organe, wie beispielsweise mindestens zwei unterschiedliche Spezies, wie beispielsweise zwei unterschiedliche Gattungen darstellen. Die unterschiedlichen Spezies können von mindestens zwei unterschiedlichen Phylae sein, wie beispielsweise von zwei unterschiedlichen Klassen, wie beispielsweise von zwei unterschiedlichen Abteilungen, noch bevorzugter von mindestens zwei unterschiedlichen Unterreichen, wie beispielsweise von mindestens zwei unterschiedlichen Reichen.
  • Zwei beliebige jener Spezies können von unterschiedlichen Klassen sein, wie beispielsweise von zwei unterschiedlichen Abteilungen, noch bevorzugter von zwei unterschiedlichen Unterreichen, wie beispielsweise von zwei unterschiedlichen Reichen. Folglich können exprimierbare Nukleotidsequenzen von einem Eukaryoten und einem Prokaryoten in der gleichen Zelle kombiniert werden.
  • Gemäß einer anderen erfindungsgemäßen Ausfübrungsform können die exprimierbaren Nukleotidsequenzen von einem oder dem gleichen Expressionszustand sein. Die Produkte jener Sequenzen können mit den Genprodukten in der Wirtselle interagieren und neue Enzymkombinationen bilden, die zu neuen biochemischen Wegen führen. Weiterhin wird dadurch, dass die exprimierbaren Nukleotidsequenzen unter die Kontrolle einer Anzahl von Promotoren gestellt werden, ermöglicht, Gruppen von Genen in einer koordinierten Weise an und abzuschalten. Wird dies mit exprimierbaren Nukleotidsequenzen von lediglich einem Expressionszustand ausgeführt, dann werden ebenfalls neue Kombinationen von Genen exprimiert.
  • Die Anzahl von Konkatemeren in einer einzelnen Zelle kann mindestens ein Konkatemer pro Zelle betragen, vorzugsweise mindestens zwei Konkatemere pro Zelle, noch bevorzugter 3 pro Zelle, wie beispielsweise 4 pro Zelle, noch bevorzugter 5 pro Zelle, wie beispielsweise mindestens 5 pro Zelle, beispielsweise mindestens 6 pro Zelle, wie beispielsweise 7, 8, 9 oder 10 pro Zelle, beispielsweise mehr als 10 pro Zelle. Wie vorstehend beschrieben, kann jedes Konkatemer vorzugsweise bis zu 1.000 Kassetten umfassen, und es ist vorgesehen, dass ein Konkatemer bis zu 2.000 Kassetten umfasst. Durch Einfügen von bis zu 10 Konkatemeren in eine einzelne Zelle kann folglich diese Zelle mit bis zu 20.000 heterologen exprimierbaren Genen angereichert werden, die unter geeigneten Bedingungen durch Regulation der regulierbaren Promotoren an und abgeschaltet werden können.
  • Es wird häufig mehr bevorzugt, dass Zellen bereitgestellt werden, die irgendetwas zwischen 10 und 1.000 heterologe Gene aufweisen, wie beispielsweise 20–900 heterologe Gene, beispielsweise 30 bis 800 heterologe Gene, wie beispielsweise 40 bis 700 heterologe Gene, beispielsweise 50 bis 600 heterologen Gene, wie beispielsweise von 60 bis 300 heterologe Gene oder von 100 bis 400 heterologe Gene, die als 2 bis 4 künstliche Chromosomen eingefügt sind, wobei jedes ein Konkatemer von Genen beinhaltet. Die Gene können vorteilhafter Weise auf einem bis zehn, wie beispielsweise von 2 bis 5 unterschiedlichen Konkatemeren in den Zellen angeordnet sein. Jedes Konkatemer kann vorteilhafter Weise von 10 bis 1.000 Gene umfassen, wie beispielsweise von 10 bis 750 Gene, wie beispielsweise 10 bis 500 Gene, wie beispielsweise von 10 bis 200 Gene, wie beispielsweise von 20 bis 100 Gene, beispielsweise von 30 bis 60 Gene, oder von 50 bis 100 Gene.
  • Die Konkatemere können in die Wirtszellen gemäß einem beliebig bekannten Transformationsverfahren, vorzugsweise gemäß derartiger Transformationsverfahren eingefügt werden, die eine stabile und nicht transiente bzw. vorübergehende Transformation der Wirtszelle gewährleisten. Die Konkatemere können folglich als ein künstliches Chromosom eingefügt werden, das während sie sich teilen durch die Zellen repliziert wird, oder sie können in die Chromosomen der Wirtszelle eingefügt werden. Das Konkatemer kann ebenfalls in der Form eines Plasmids, wie beispielsweise eines Plasmidvektors, eines Phagenvektors, eines Virusvektors, eines Cosmidvektors eingefügt werden, der durch die Zellen während der Teilung repliziert wird. Es ist jede Kombination der drei Einfügungsverfahren ebenfalls möglich. Folglich können ein oder mehrere Konkatemere in das/die Chromosom(en) der Wirtszelle integriert werden, wobei ein oder mehrere Konkatemere als Plasmide oder künstliche Chromosomen eingefügt werden können. Es können ein oder mehrere Konkatemere als künstliche Chromosomen eingefügt werden, wobei ein oder mehrere in der gleichen Zelle über ein Plasmid eingefügt sein können.
  • Beispiele
  • Beispiel 1
  • In den Beispielen 1–3 wurde eine Asc1-Stelle in die EcoRI Stelle in pYAC4 (Sigma, Burke DT et al., Science Vol. 236 (1987), 806) eingefügt, so dass klebrige Enden mit der Asc1-Stelle (= RS2 in der allgemeinen Formel dieses Patents) der Kassetten in pEVE-Vektoren passen.
  • Präparation von EVACs (ableitbarer künstlicher Chromosomen) einschließlich einer Größen-Fraktionierung
  • Präparation von pYAC4-Asc Armen
    • 1. Inokulieren von 150 ml von LB (Sigma) mit einer einzelnen Kolonie von E. coli DH5α, welche pYAC4-Asc beinhaltet;
    • 2. Züchten bis zu einer OD 600~1, Gewinnen der Zellen und Ausführen einer Plasmidpräparation,
    • 3. Verdauen von 100 μg pYAC4-Asc mit BamH1 und Asc1;
    • 4. Dephosphorylieren von Fragmenten und Hitzeinaktivierung der Phosphatase (20 Min., 80°C);
    • 5. Reinigen der Fragmente (beispielsweise Qiaquick Gel-Extraktions-Kit);
    • 6. Auftrennen in 1% Agarosegel, um die Menge von Fragment zu beurteilen.
  • Präparation von Expressionskassetten
    • 1. Nehmen von 100 μg einer Plasmidpräparation von jeder der folgenden Bibliotheken a) pMA-CAR b) pCA-CAR c) Phaffia cDNA-Bibliothek d) Karotten cDNA-Bibliothek
    • 2. Verdauen mit Srf1 (10 Einheiten/Präparation, 37°C über Nacht),
    • 3. Dephosphorylieren (10 Einheiten/Präparation, 37°C, 2 Std.);
    • 4. Hitzeinaktivieren 80°C, 20 Min.;
    • 5. Konzentrieren und Wechsel von Puffer (Präzipitation oder Ultrafiltration);
    • 6. Verdauen mit Asc1 (10 Einheiten/Präparation, 37°C über Nacht);
    • 7. Anpassen des Volumens der Präparationen auf 100 μl.
  • Präparation von EVACs
  • Es wurden verschiedene Typen von EVACs erzeugt, indem das Verhältnis der unterschiedlichen Bibliotheken variiert wurde, die in die Ligationsreaktion eingehen.
    pMA-CAR pCA-CAR Phaffia cDNA Karotten cDNA
    EVAC
    A 40% 40% 10% 10%
    B 25 % 25 % 25 % 25 %
    • 1. Zugeben von ~100ng Armen von pYAC4-Asc/100 μg Kassettengemisch;
    • 2. Konzentrieren auf< 33,5 μl;
    • 3. Zugeben von 2,5 Einheiten T4-DNA-Ligase + 4 μl 10 × Ligase-Puffer. Anpassen auf 40 μl;
    • 4. Legieren 3 Std., 16 °C;
    • 5. Stoppen der Reaktion durch Zugabe von 2 μl von 500 mM EDTA;
    • 6. Auffüllen des Reaktionsvolumens auf 125 μl, Zugegen von 25 μl Beladungsgemisch, Erhitzen bei 60°C für 5 Min.
    • 7. Gleichmäßiges Verteilen in 10 Löchern eines 1% LMP Agarosegels;
    • 8. Laufen lassen eines Puls-Feld-Geles (CHEF III, 1% LMP Agarose, ½ Stärke TBE (BioRad), Winkel 120, Temperatur 12°C, Spannung 5.6 V/cm, Zeitschalt-Rampe 5–25 S. Laufzeit 30 Std.);
    • 9. Färben des Teiles des Gels, der Molekulargewichtsmarker + 1 Probenspur beinhaltet, um Qualität zu prüfen;
    • 10. Ausschneiden der 9 verbleibenden Spuren aus dem Gel entsprechend des MW 97–194 Kb (Fraktion 1); 194–291 Kb (Fraktion 2); 291–365 Kb (Fraktion 3);
    • 11. Agarosegel in einem hohem NaCl-Agarose-Puffer, 1 Einheit Agarose/100μg Gel, 40 °C, 3 Std.;
    • 12. Konzentrieren der Präparation auf < 20 μl;
    • 13. Transformieren eines geeigneten Hefestamms mit der Präparation unter Verwendung einer Alkali/Kation Transformation;
    • 14. Ausplattieren auf Platten mit minimalen Selektionsmedium;
    • 15. Inkubieren bei 30°C für 4–5 Tage;
    • 16. Picken von Kolonien;
    • 17. Analyse der Kolonien.
  • Beispiel 2
  • Präparation von EVACs (Ableitbarem künstlichen Chromosomen) mit direkter Transformation
  • Präparation von pYAC4-Asc Armen
    • 1. Inokulieren von 150 ml von LB mit einer einzelnen Kolonie von DH5α, welche pYAC4-Asc beinhaltet;
    • 2. Züchten bis zu einer OD 600~1, Gewinnen der Zellen und Ausführen einer Plasmidpräparation,
    • 3. Verdauen von 100 μg pYAC4-Asc mit BamH1 und Asc1;
    • 4. Dephosphorylieren von Fragmenten und Hitzeinaktivierung der Phosphatase (20 Min., 80°C);
    • 5. Reinigen der Fragmente (beispielsweise Qiaquick Gel-Extraktions-Kit);
    • 6. Auftrennen in 1% Agarosegel, um die Menge von Fragment zu beurteilen.
  • Präparation von Expressionskassetten
    • 1. Nehmen von 100 μg einer Plasmidpräparation von jeder der folgenden Bibliotheken e) pMA-CAR f) pCA-CAR g) Phaffia cDNA-Bibliothek h) Karotten cDNA-Bibliothek
    • 2. Verdauen mit Srf1 (10 Einheiten/Präparation, 37°C über Nacht),
    • 3. Dephosphorylieren (10 Einheiten/Präparation, 37°C, 2 Std.);
    • 4. Hitzeinaktivieren 80°C, 20 Min.;
    • 5. Konzentrieren und Wechsel von Puffer (Präzipitation oder Ultrafiltration);
    • 6. Verdauen mit Asc1 (10 Einheiten/Präparation, 37°C über Nacht);
    • 7. Anpassen des Volumens der Präparationen auf 100 μl.
  • Präparation von EVACs
  • Es wurden verschiedene Typen von EVACs erzeugt, indem das Verhältnis der unterschiedlichen Bibliotheken variiert wurde, die in die Ligationsreaktion eingehen.
    pMA-CAR pCA-CAR Phaffia cDNA Karotten cDNA
    EVAC
    A 40% 40% 10% 10%
    B 25% 25% 25% 25%
    • 1. Konzentrieren auf < 32 μl;
    • 2. Zugeben von 1 Einheit T4-DNA-Ligase + 4 μl 10 × Ligase-Puffer. Anpassen auf 40 μl;
    • 3. Legieren 2 Std., 16°C;
    • 4. Stoppen der Reaktion durch Zugabe von 2 μl von 500 mM EDTA; Hitzeinaktivierung 60°C, 20 Min.
    • 5. Auffüllen des Reaktionsvolumens auf 500 μl mit dH2O, Konzentrieren auf 30 μl;
    • 6. Zugeben von 10 Einheiten Asc1, 4 μl 10 × Asc1-Puffer, auf 40 μl bringen;
    • 7. Inkubieren bei 37°C für 1 Std. (alternativ 15 Min. 30 Min);
    • 8. Hitzeinaktivieren bei 60°C, 20 Min.;
    • 9. Zugeben von 2 μg YAC4-Asc Armen, 1 Einheit T4-DNA-Ligase, 10 ul 10 × Ligase-Puffer; Auffüllen auf 100 μl;
    • 10. Inkubieren über Nacht, 16°C;
    • 11. Zugeben von Wasser bis auf 500 μl;
    • 12. Konzentrieren auf 25 μl;
    • 13. Transformieren eines geeigneten Hefe-Stamms mit der Präparation unter Verwendung einer Alkali/Kation Transformation oder eines anderen geeigneten Transformationsverfahrens;
    • 14. Ausplattieren auf Platten mit Minimal-Selektionsmedium;
    • 15. Inkubieren bei 30°C für 4–5 Tage;
    • 16. Picken von Kolonien;
    • 17. Analysieren der Kolonien.
  • Beispiel 3
  • Präparation von EVACs (ableitbaren künstlichen Chromosomen) (Präparation in kleinem Maßstab)
  • Präparation von Expressionskassetten
    • 1. Inokulieren von 5 ml LB-Medium (Sigma) mit einem Bibliotheksinokulum, das einer 10+ fachen Repräsentanz einer Bibliothek entspricht. Wachsen über Nacht.
    • 2. Ausführen einer Plasmidpräparation von einer 1,5 ml Kultur (beispielsweise Qiaprep sein Minipräparations-Kit)
    • 3. Verdauen des Plasmid mit Srf1,
    • 4. Dephosphorylieren von Fragmenten und Hitzeinaktivieren der Phosphatase (20 Min. 80°C),
    • 5. Verdauen mit Asc1,
    • 6. Laufen lassen von 1/10 der Reaktion in 1% Agarose, um Menge von Fragmenten zu bewerten.
  • Präparation von pYAC4-Asc Armen
    • 1. Inokulieren von 150 ml von LB mit einer einzelnen Kolonie von E. coli DH5α, welche pYAC4-Asc beinhaltet;
    • 2. Züchten bis zu einer OD 600~1, Gewinnen der Zellen und Ausführen einer Plasmidpräparation,
    • 3. Verdauen von 100 μg pYAC4-Asc mit BamH1 und Asc1;
    • 4. Dephosphorylieren von Fragmenten und Hitzeinaktivierung der Phosphatase (20 Min., 80°C);
    • 5. Reinigen der Fragmente (beispielsweise Qiaquick Gel-Extraktions-Kit);
    • 6. Auftrennen in 1% Agarosegel, um die Menge von Fragment zu beurteilen.
  • Präparation von EVACs
    • 1. Mischen von Expressionskassetten-Fragmenten mit YAC-Armen, dass Kassetten/Arm Verhältnis ~1000/1 beträgt;
    • 2. Falls notwendig, Konzentrieren des Gemisches (beispielsweise verwenden eines Microcon YM30), so dass Fragmentkonzentration > 75 ng/μl Reaktion beträgt;
    • 3. Zugeben von 1 Einheit T4-DNA-Ligase, Inkubieren bei 16°C, 1–3 Std., Stoppen der Reaktion durch Zugabe von 1 μl von 500 mM EDTA;
    • 4. Laufen lassen eines Puls-Feld-Geles (CHEF III, 1% LMP Agarose, ½ Stärke TBE, Winkel 120, Temperatur 12°C, Spannung 5.6 V/cm, Zeitschalt-Rampe 5-25 Sek. Laufzeit 30 Std.); Laden der Probe in 2 Spuren.
    • 5. Färben des Teiles des Gels, der Molekulargewichtsmarker beinhaltet,
    • 6. Ausschneiden der Probenspuren entsprechend des MW 100–200 Kb
    • 7. Agarosegel in einem hohem NaCl-Agarose-Puffer, 1 Einheit Agarose/100 mg Gel,
    • 8. Konzentrieren der Präparation auf < 20 μl;
    • 9. Transformieren eines geeigneten Hefestamms mit der Präparation unter Verwendung einer Elektroporation;
    • 10. Ausplattieren auf Platten mit minimalen Selektionsmedium;
    • 11. Inkubieren bei 30°C für 4–5 Tage;
    • 12. Picken von Kolonien
  • Beispiel 4: cDNA-Bibliotheken, die bei der Herstellung von EVACs verwendet werden
    • 1. Daucus carota, Wurzelbibliothek der Karotte: • Volllängen • Oligo dT Primerunterstützte, direktionale cDNA-Bibliothek • cDNA-Bibliothek, die unter Verwendung eines Pools von 3 Evolva EVE 4, 5 & 8 Vektoren (4, 5, 6) erzeugt wurde; • Anzahl unabhängiger Klone: 41,6 × 106 • Durchschnittliche Größe: 0,9–2,9 Kb • Anzahl unterschiedlicher vorhandener Gene: 5.000–10.000
    • 2. Xanthophyllomyces dendrorhous, (Hefe), Bibliothek des Gesamtorganismus • Volllängen • Oligo dT Primerunterstützte, direktionale cDNA-Bibliothek • cDNA-Bibliothek, die unter Verwendung eines Pools von 3 Evolva EVE 4, 5 & 8 Vektoren (4, 5, 6) erzeugt wurde; • Anzahl unabhängiger Klone: 48,0 × 106 • Durchschnittliche Größe: 1,0–3,8 Kb • Anzahl unterschiedlicher vorhandener Gene: 5.000–10.000
    • 3. Ziel-Karotenoidgen cDNA-Bibliothek • Volllängen und normalisiert • Direktionales cDNA-Klonieren • Bibliothek, die durch Klonieren von jedem Gen einzeln in 2 Evolva EVE 4, 5 & 8 Vektoren erzeugt wurde; • Anzahl unterschiedlicher Gene: 48 • Verwendete Spezies und Gene: • Gentiana sp., ggps, psy, pds, zds, Icy-b, Icy-e, bhy, zep • Rhodobacter capsulatus, idi, crtC, crtF • Erwinia uredovora, crtE, crtB, crti, crtY, crtZ • Nostoc anabaena, zds • Synechococcus PCC7942, pds • Erwinia herbicola, crtE, crtB, crtI, crtY, crtZ • Staphylococcus aureus, crtM, crtN • Xanthophyllomyces dendrorhous, crtl, crtYb • Capsicum annuum, ccs, crtL • Nicotiana tabacum, crtL, bchy • Prochlorococcus sp:, Icy-b, Icy-e • Saccharomyces cerevisiae, idi • Corynebacterium sp., crtl, crtYe, crtYf, crtEb • Lycopersicon esculentum, psy-1 • Neurospora crassa, all
  • Beispiel 5: Transformation von EVACs
  • Beispiel 5a: Transformation
    • 1. Inokulieren einer einzelnen Kolonie in 100 ml YPD-Brühe und Züchten mit Belüftung bei 30°C bis mit. log, 2 × 106 bis 2 × 107 Zellen/ml;
    • 2. Zentrifugieren zu einem Pellet bei 400 × g für 5 Minuten, Überstand verwerfen;
    • 3. Resuspendieren der Zellen in insgesamt 9 ml TE, pH-Wert 7,5, Zentrifugieren, um Zellen zu pelletieren und Überstand verwerfen;
    • 4. Zellen sanft resuspendieren in 5 ml einer 0,1 M Lithium/Cäsiumacetat-Lösung, pH-Wert 7,5;
    • 5. Inkubieren bei 30°C für 1 Stunde mit sanftem Schütteln;
    • 6. Zentrifugieren bei 400 × g für 5 Minuten, um Zellen zu pelletieren und Überstand verwerfen;
    • 7. Sanft resuspendieren in 1 ml TE, pH-Wert 7,5. Zellen sind nun für die Transformation bereit;
    • 8. Kombinieren in einem 1,5 ml Röhrchen: • 100 μl Hefezellen • 5 μl Träger-DNA (10 mg/ml) • 5 μl Histaminlösung • 1/5 einer EVAC-Präparation in einem Volumen von 10 μl (max.). (Eine EVAC-Präparation ist aus 100 μg Verkettungs-Reaktionsgemisch hergestellt)
    • 9. Sanft Mischen und Inkubieren bei Raumtemperatur für 30 Minuten;
    • 10. Kombinieren von 0,8 ml (W/V) PEG 4000 und 0,1 ml TE und 0,1 ml von 1 M LiAc für jede Transformationsreaktion in einem getrennten Röhrchen. Zugeben von 1 ml von diesem PEG/TE/LiAc-Gemisch zu jeder Transformationsreaktion. Mischen der Zellen in der Lösung durch sanftes Pipettieren.
    • 11. Inkubieren bei 30°C, für 1 Stunde;
    • 12. Hitzeschock bei 42°C für 15 Minuten, Kühlen auf 30°C;
    • 13. Pelletieren der Zellen in einer Mikrozentrifuge bei hoher Geschwindigkeit für 5 Sekunden und Entfernen des Überstandes.
    • 14. Resuspendieren in 200 μl eines Vollmediums und Ausplattieren in geeigneten Selektionsmedien;
    • 15. Inkubieren bei 30°C für 48–72 Stunden bis transformierte Kolonien auftreten.
  • Beispiel 5b: Transformation von EVACs unter Verwendung einer Elektroporation
  • Es werden 100 ml von YPD mit einer Hefekolonie inokuliert und bis zu einer OD600 = 1,3 bis 1,5 gezüchtet. Die Kultur wird durch Zentrifugation bei 4000 × g und 4°C geerntet. Die Zellen werden in 16 ml sterilen Wassers resuspendiert. Es werden 2 ml 10 × TE-Puffer, pH-Wert 7,5 zugegeben und zum Mischen aufgewirbelt. Zugabe von 2 ml 10 × Lithiumacetat-Lösung (1 M, pH-Wert 7,5), wobei zum Mischen aufgewirbelt wird. Es wird für 45 Min. bei 30°C sanft geschüttelt. Es werden 1,0 ml 0,5M DTE während des Wirbelns zugegeben. Es wird 15 Min. bei 30°C sanft geschüttelt. Die Hefesuspension wird mit sterilem Wasser auf 100 ml verdünnt. Die Zellen werden gewaschen und durch Zentrifugation bei 4000 × g konzentriert, in eiskaltem sterilen Wasser wird das Pellet resuspendiert, bei 4000 × g zentrifugiert, das Pellet wird in 5 ml eiskaltem sterilem Wasser resuspendiert, bei 4000 × g zentrifugiert und das Pellet wird in 0,1 ml eiskaltem sterilem 1 M Sorbitol resuspendiert. Die Elektroporation wurde unter Verwendung eines Gen Pulsers von Bio-Rad ausgeführt. In einem sterilen 1,5 ml Mikrozentrifugenröhrchen wurden 40 μl konzentrierter Hefezellen mit 5 μl einer 1:10 verdünnten EVAC-Präparation gemischt. Das Hefe-DNA-Gemisch wird zu einer eiskalten eine 0,2 cm Lücke aufweisende wegwerfbare Elektroporationsküvette überführt und bei 1,5 kV, 25 μF, 200 Ω gepulst. Es wird 1 ml eiskalten 1 M Sorbitols zu der Küvette zugegeben, um die Hefe wieder zu Kräften kommen zu lassen. Es werden Aliquots auf Selektionsplatten ausgebreitet, die 1 M Sorbitol beinhalten. Anschließend wird bei 30°C solange inkubiert bis Kolonien auftreten.
  • Beispiel 6: Seltene Restriktionsenzyme mit Erkennungssequenzen und Spaltpunkten
  • In diesem Beispiel sind seltene Restriktionsenzyme zusammen mit deren Erkennungssequenz und Spaltpunkten aufgeführt. (^) zeigt Spaltpunkte 5'-3' Sequenz und (_) zeigt doe Spaltpunkte in der komplementären Sequenz an.
  • W=A oder T; N=A, C, G oder T 6a) Eindeutiger, palimdromischer Überhang
    Figure 00670001
    6b) Keinen Überhang
    Figure 00670002
    6c) Nicht palindromische und/oder variabler Überhang
    Figure 00670003
    Figure 00680001
    6d) Meganukleasen
    Figure 00680002
  • Mehrere Meganukleasen wurden identifiziert, wobei deren genaue Erkennungssequenz nicht bestimmt wurde, siehe beispielsweise www.meganuclease.com.
  • Beispiel 7: Größenbeschränkungsexperimente für ein Konkatemer (Verwendung von Stoppern)
  • Verwendete Materialien:
    pYAC4 (Sigma, Burke et al., Science Vol. 236 (1987), 806) wurde mit EcoR1 und BamH1 verdaut und dephosphoryliert;
    pSE420 (Invitrogen) wurde unter Verwendung von EcoR1 linearisiert und als das Modelfragment zur Verkettung verwendet;
    T4 DNA-Ligase (Amersham-Pharmacia-Biotech) wurde zur Ligation gemäß den Instruktionen des Herstellers verwendet.
  • Verfahren: Es wurden Fragmente und Arme in den Verhältnissen (Konzentrationen sind willkürliche Einheiten) vermischt, die in den 9a und 9b angezeigt sind. Der Ligation wurde gestattet für 1 Std. bei 16°C abzulaufen. Die Reaktion wurde durch Zugabe von 1 μl 500 mM EDTA gestoppt. Es wurden Produkte durch Standardagarose GE (1% Agarose, ½ Stärke TBE) oder durch PFGE (CHEF III, 1% LMP-Agarose, ½ Stärke TBE, Winkel 120, Temperatur 12°C, Spannung 5,6 V/cm, Zeitschalt-Rampe 5–25 Sek. Laufzeit 30 Std.)
  • Die Ergebnisse werden in 9a gezeigt, worin gezeigt wird, dass die Größe von Konkatemeren proportional zu dem Verhältnis von Kassetten pro YAC-Arm ist.
  • Beispiel 8: Integration von Expressionskassetten in künstliche Chromosomen
  • Die Integration von Expressionskassetten in YAC12 wurde im Wesentlichen so wie durch Sears D.D., Hieter P, Simchen G, Genetics 138 (1994), 1055–1065) ausgeführt.
  • Eine AscI-Stelle wurde in die Bgl II-Stelle der Integrationsvektoren pGS534 und pGS525 eingefügt.
  • Ein β-Galactosidase-Gen, als auch crtE, crtB, crtI und crtY von Erwinia uredovora wurden in pEVE4 kloniert. Diese Expressionskassetten wurden in AscI der modifizierten Integrationsvektoren pGS534 und pGS525 legiert.
  • Linearisierte pGS534 und pGS525, die die Expressionskassetten beinhalteten, wurden in haploide Hefestämme transformiert, die das entsprechende Ziel bzw. Target YAC beinhalten, das das Ade" Gen trägt. Rote Ade-Transformanden wurden (der Eltern-Wirtsstamm ist aufgrund der ade2-101-Mutation rot) selektioniert.
  • Eine zusätzliche Bestätigung einer korrekten Integration der Expressions-Kassette von β-Galactosidase wurde unter Verwendung eines β-Galactosidase-Tests ausgeführt.
  • Beispiel 9: Erneute Transformation von Zellen, die bereits künstliche Chromosomen beinhalten, um mindestens 2 künstliche Chromosomen pro Zelle zu erhalten
  • Hefe-Stämme, die YAC12 beinhalten (Sears D. D., Hieter P, Simchen G, Genetics 138 (1994), 1055–1065), wurden nach dem in Beispiel 4a beschriebenen Protokoll mit EVACs transformiert. Die transformierten Zellen wurden auf Platten ausplattiert, die auf Zellen selektionieren, die sowohl YAC12 als auch EVACs beinhalten.
  • Beispiel 10: Beispiel unterschiedlicher Expressionsmuster "Phänotypen", die unter
  • Verwendung der gleichen Hefeklone unter unterschiedlichen Expressionsbedingungen erhalten werden
  • Es wurden Kolonien mit einem sterilen Zahnstocher gepickt und sequentiell auf Platten ausgestrichen, die den vier reprimierten und/oder induzierten Bedingungen (-Ura/-Trp, -Ura/-Trp/-Met, -Ura/-Trp/+200 μM Cu2SO4, -Ura/-Trp/-Met+200 μM Cu2SO4) entsprechen. Es wurden 20 mg Adenin zu den Medien zugegeben, um den ockerfarbenen Phänotyp zu unterdrücken. SEQUENCE LISTING
    Figure 00710001
    Figure 00720001
    Figure 00730001
    Figure 00740001
    Figure 00750001
    Figure 00760001
    Figure 00770001
    Figure 00780001
    Figure 00790001
    Figure 00800001
    Figure 00810001
    Figure 00820001
    Figure 00830001
    Figure 00840001
    Figure 00850001
    Figure 00860001
    Figure 00870001
    Figure 00880001
    Figure 00890001
    Figure 00900001
    Figure 00910001
    Figure 00920001
    Figure 00930001
    Figure 00940001
    Figure 00950001
    Figure 00960001
    Figure 00970001
    Figure 00980001
    Figure 00990001
    Figure 01000001
    Figure 01010001
    Figure 01020001

Claims (43)

  1. Nukleinsäurekonkatamer, das in der 5'→3' Richtung eine Kassette einer Nukleotidsequenz der allgemeinen Formel
    Figure 01030001
    umfaßt, worin rs1 und rs2 zusammen eine funktionelle Restriktionsschnittstelle bezeichnen, SP einzeln einen Abstandshalter aus mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet, und SP einzeln einen Abstandhalter aus mindestens zwei Nukleotidbasen bezeichnet, und n ≥ 2 ist, und worin mindestens eine erste Kassette von einer zweiten Kassette verschieden ist.
  2. Konkatamer nach Anspruch 1, worin die exprimierbare Nukleotidsequenz eine DNA-Sequenz umfaßt ausgewählt ist aus der Gruppe umfassend cDNA, genomische DNA.
  3. Konkatamer nach einem der vorstehenden Ansprüche 1 bis 2, worin die rs1-rs2-Restriktionsschnittstelle von mindestens 2 Kassetten von dem gleichen Restriktionsenzym erkannt wird, vorzugsweise identisch ist.
  4. Konkatamer nach einem der Ansprüche 1 bis 3, worin mindestens eine Kassette ein Intron zwischen dem Promotor und der exprimierbaren Nukleotidsequenz umfaßt, worin vorzugsweise im Wesentlichen alle Kassetten ein Intron zwischen dem Promotor und der exprimierbaren Nukleotidsequenz umfassen.
  5. Konkatamer nach einem der vorstehenden Ansprüche 1 bis 4, das in einem artifiziellen Chromosom vorliegt.
  6. Konkatamer nach Anspruch 5, worin das artifizielle Chromosom ausgewählt ist aus der Gruppe umfassend ein artifizielles Hefechromosom, ein artifizielles mega-Hefechromosom, ein artifizielles Bakterienchromosom, ein artifizielles Mauschromosom, ein artifizielles Säugerchromosom, ein artifizielles Insektenchromosom, ein artifizielles Affenchromosom, ein artifizielles Bakteriophagenchromosom, ein artifizielles Baculoviruschromosom, oder ein artifiziellen humanes Chromosom.
  7. Konkatamer nach einem der vorstehenden Ansprüche, worin eine Restriktionsschnittstelle mindestens 6 Basen umfasst.
  8. Verfahren zur Konkatenation, welches die Schritte umfaßt, Verknüpfen von mindestens zwei Kassetten von Nukleotidsequenzen, wobei jede Kassette ein erstes überstehendes Ende aufweist, eine Abstandshaltersequenz, einen Promotor, eine exprimierbare Nukleotidsequenz, einen Terminator, eine Abstandshaltersequenz und ein zweites überstehendes Ende, und wobei das Verfahren weiter umfaßt, Beginnen mit einem primären Vektor [RS1-RS2-SP-PR-X-TR-SP-RS2'-RS1'], worin X eine exprimierbare Nukleotidsequenz bezeichnet, RS1 und RS1' Restriktionsschnittstellen bezeichnen, RS2 und RS2' Restriktionsschnittstellen bezeichnen, die verschieden sind von RS1 und RS1', SP einzeln eine Abstandshaltersequenz mit mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, TR einen Terminator bezeichnet, i) Schneiden des primären Vektors mittels mindestens einem für RS2 und RS2' spezifischen Restriktionsenzym, wobei Kassetten erhalten werden mit der allgemeinen Formel [rs2-SP-PR-X-TR-SP-rs1], worin rs1 und rs2 zusammen eine funktionelle Restriktionsschnittstelle RS2 oder RS2' bezeichnen, ii) Zusammenfügen der herausgeschnittenen Kassetten durch Interaktion zwischen rs1 und rs2.
  9. Verfahren nach Anspruch 8, weiter umfassend die Zugabe von Vektorarmen, von denen jeder ein RS2 oder RS2' an einem Ende und einen nicht-komplementären Überhang oder ein glattes Ende am anderen Ende aufweist.
  10. Verfahren nach Anspruch 8, weiter umfassend die Zugabe von Stopperfragmenten, wobei die Stopperfragmente jeweils ein RS2 oder RS2' an einem Ende und einen nicht-komplementären Überhang oder ein glattes Ende am anderen Ende aufweisen.
  11. Verfahren nach Anspruch 10, weiter umfassend, Ligieren von Vektorarmen an die Stopperfragmente.
  12. Verfahren nach Anspruch 8, weiter umfassend (i) Isolieren von mRNA aus einem Expressionszustand, (ii) Erhalten von im Wesentlichen Vollängen-cDNA-Klonen entsprechend der mRNA-Sequenzen, (ii) Inserieren der im Wesentlichen Vollängen-cDNA-Klone in eine Klonierungsstelle in eine Kassette eines primären Vektors, wobei die Kassette in 5'→3' Richtung die allgemeine Formel [RS1-RS2-SP-PR-CS-TR-SP-RS2'-RS1'] aufweist, worin CS eine Klonierungsstelle bezeichnet.
  13. Verfahren nach Anspruch 8, worin RS1 und RS1' identisch sind und worin RS2 und RS2' identisch sind.
  14. Verfahren nach einem der Ansprüche 8 bis 13, wobei das Konkatamer an ein artifizielles Chromosom ligiert ist ausgewählt ist aus der Gruppe umfassend artifizielles Hefechromosom, artifizielles mega-Hefechromosom, artifizielles Bakterienchromosom, artifizielles Mauschromosom, artifizielles humanes Chromosom.
  15. Verfahren nach einem der Ansprüche 8 bis 14, wobei RS2 und RS2' in mindestens zwei Kassetten durch ein Restriktionsenzym geschnitten werden, vorzugsweise wobei RS2 und RS2' in im Wesentlichen allen Kassetten durch ein Restriktionsenzym geschnitten werden.
  16. Verfahren nach einem der vorstehenden Ansprüche 8 bis 15, wobei RS2 und RS2' mehr als 7 Basen umfassen.
  17. Isolierte Zelle, die mindestens ein Konkatamer einzelner Oligonucleotid-Kassetten umfaßt, worin jedes Konkatamer in 5'→3' Richtung ein Oligonukleotid folgenden Formel
    Figure 01060001
    umfaßt, worin rs1 und rs2 zusammen eine funktionelle Restriktionsschnittstelle bezeichnen, SP einzeln einen Abstandshalter aus mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet, SP einzeln einen Abstandhalter aus mindestens zwei Nukleotidbasen bezeichnet, worin n ≥ 2 ist, und worin mindestens zwei exprimierbare Nukleotidsequenzen von unterschiedlichen Expressionsstadien herrühren.
  18. Isolierte Zelle, welche mindestens ein Konkatamer einzelner Oligonukleotid-Kassetten umfasst, worin jedes Konkatamer in 5'→3' Richtung ein Oligonukleotid folgenden Formel
    Figure 01060002
    umfaßt, worin rs1 und rs2 zusammen eine funktionelle Restriktionsschnittstelle bezeichnen, SP einzeln einen Abstandshalter mit mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet, und SP einzeln einen Abstandhalter mit mindestens zwei Nukleotidbasen bezeichnet, worin n ≥ 2 ist, und worin rs1-rs2 in mindestens zwei Kassetten von dem gleichen Restriktionsenzym erkannt werden.
  19. Zelle nach Anspruch 17 oder 18, worin im Wesentlichen alle rs1-rs2-Sequenzen von dem gleichen Restriktionsenzym erkannt werden, vorzugsweise worin im Wesentlichen alle rs1-rs2-Sequenzen im Wesentlichen identisch sind.
  20. Zelle nach Anspruch 17 oder 18, welche eine Hefezelle ist ausgewählt aus der Gruppe umfassend Bäcker-Hefe, Kluyveromyces marxianus, K. lactis, Candida utilis, Phaffia rhodozyma, Saccharomyces boulardii, Pichia pastoris, Hansenula polymorpha, Yarrowia lipolytica, Candida paraffinica, Schwanniomyces castellii, Pichia stipitis, Candida shehatae, Rhodotorula glutinis, Lipomyces lipofer, Cryptococcos curvatus, Candida spp. (beispielsweise C. palmioleophila), Yarrowia lipolytica, Candida guilliermondii, Candida, Rhodotorula spp., Saccharomycopsis spp., Aureobasidium pullulans, Candida brumptii, Candida hydrocarbofumarica, Torulopsis, Candida tropicalis, Saccharomyces cerevisiae, Rhodotorula rubra, Candida flaveri, Eremothecium ashbyii, Pichia spp., Kluyveromyces, Hansenula Kloeckera, Pichia, Pachysolen spp., oder Torulopsis bombicola.
  21. Zelle nach einem der vorstehenden Ansprüche 17 bis 20, worin mindestens ein Konkatamer, vorzugsweise im Wesentlichen alle Konkatamere ein Konkatamer(e) nach einem der Ansprüche 1 bis 7 ist/sind.
  22. Artifizielles Chromosom, welches mindestens ein Nukleotid-Konkatamer umfasst, worin das Konkatamer in 5'→3' Richtung Kassetten von Nukleotidsequenzen der allgemeinen Formel
    Figure 01070001
    umfaßt, worin rs1 und rs2 zusammen eine funktionelle Restriktionsschnittstelle bezeichnen, SP einen Abstandshalter aus mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, der in einer Zelle funktionieren kann, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet, und SP einen Abstandhalter aus mindestens zwei Nukleotidbasen bezeichnet, und n ≥ 2 ist.
  23. Artifizielles Chromosom, worin das Konkatamer nach einem der Ansprüche 1 bis 7 ist.
  24. Isolierte Zelle, welche mindestens ein artifizielles Chromosom nach einem der Ansprüche 22 und 23 umfasst.
  25. In vitro Verfahren zur Herstellung einer transgenen Zelle, welches umfasst, Einbringen eines Konkatamers nach einem der Ansprüche 1 bis 7 in eine Wirtszelle.
  26. Primärer Vektor, welcher eine Nukleotidsequenz-Kassette in 5'→3' Richtung der allgemeinen Formel
    Figure 01080001
    umfaßt, worin RS1 und RS1' Restriktionsschnittstellen bezeichnen, RS2' und RS2' Restriktionsschnittstellen bezeichnen, die verschieden sind von RS1 und RS1', SP einzeln eine Abstandshaltersequenz aus mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, CS eine Klonierungsstelle bezeichnet, TR einen Terminator bezeichnet.
  27. Vektor nach Anspruch 26, worin die Nukleotidsequenz eine DNA-Sequenz ist.
  28. Vektor nach einem der vorstehenden Ansprüche 26 bis 27, welcher weiter umfasst, eine Intronsequenz zwischen dem Promotor und der Klonierungsstelle und/oder zwischen der Klonierungsstelle und dem Terminator.
  29. Vektor nach einem der vorstehenden Ansprüche 26 bis 28, worin die Klonierungsstelle eine exprimierbare Nukleotidsequenz umfasst.
  30. Vektor nach einem der vorstehenden Ansprüche 26 bis 29, worin RS2 und RS2' identisch sind.
  31. Vektor nach einem der vorstehenden Ansprüche 26 bis 30, worin RS1 und RS1' identisch sind.
  32. Vektor nach einem der vorstehenden Ansprüche 26 bis 31, welcher weiter eine Abstandshaltersequenz zwischen TR und RS2' umfasst.
  33. Vektor nach einem der vorstehenden Ansprüche 26 bis 32, worin der Promotor ein extern steuerbarer Promotor ist.
  34. Vektor nach einem der vorstehenden Ansprüche 26 bis 33, worin der primäre Vektor, der die Kassette umfasst, ein Plasmidvektor mit einer hohen Kopienzahl ist, der in E. coli vermehrt werden kann und zum Erhalt in E. coli einen selektierbaren Marker aufweist.
  35. Konkatamer nach einem der Ansprüche 1 bis 7, worin mindestens eine Kassette die Kassette aus einem primären Vektor nach einem der Ansprüche 26 bis 34 umfasst, mehr bevorzugt worin im Wesentlichen alle Kassetten die Kassette aus einem primären Vektor nach einem der Ansprüche 26 bis 34 umfasst.
  36. Verfahren zur Herstellung eines primären Vektors, welches umfasst, Einbringen einer exprimierbaren Nukleotidsequenz in eine Klonierungsstelle in einem primären Vektor, der eine Kassette umfasst, worin die Kassette eine Nukleotidsequenz in 5'→3' Richtung der allgemeinen Formel
    Figure 01100001
    umfaßt, worin RS1 und RS1' Restriktionsschnittstellen bezeichnen, RS2' und RS2' Restriktionsschnittstellen bezeichnen, die verschieden sind von RS1 und RS1', SP einzeln eine Abstandshaltersequenz mit mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, CS eine Klonierungsstelle bezeichnet, TR einen Terminator bezeichnet.
  37. Verfahren nach Anspruch 36, welches weiter umfasst, Isolieren von Gesamt-mRNA eines Expressionsstadiums, und Erhalten von Vollängen-cDNA zum Inserieren in den Vektor.
  38. Verfahren nach Anspruch 37, welches weiter umfasst, Selektieren von cDNA, um im Wesentlichen Vollängen-cDNA zu erhalten.
  39. Nukleotid-Bank, welche mindestens zwei primäre Vektoren enthält, worin jeder Vektor eine Nukleotidsequenz-Kassette in 5'→3' Richtung der allgemeinen Formel
    Figure 01100002
    umfaßt, worin RS1 und RS1' Restriktionsschnittstellen bezeichnen, RS2' und RS2' Restriktionsschnittstellen bezeichnen, die verschieden sind von RS1 und RS1', SP einzeln eine Abstandshaltersequenz aus mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, X eine exprimierbare Nukleotidsequenz bezeichnet, TR einen Terminator bezeichnet, worin die exprimierbaren Nukleotidsequenzen isoliert werden aus mindestens einem Expressionsstadium, und worin mindestens ein erster und ein zweiter primärer Vektor eine exprimierbare Nukleotidsequenz enthalten, die das gleiche Peptid unter der Kontrolle von zwei unterschiedlichen Promotoren in dem ersten und zweiten primären Vektor codiert.
  40. Bank nach Anspruch 39, worin die Wirtszelle ausgewählt ist aus der Gruppe umfassend Bakterien, wie E.coli oder Bacillus subtilis, oder Pilzen, wie Hefe.
  41. Bank nach Anspruch 39, worin im Wesentlichen alle Vektoren die gleichen RS2 und RS2'-Sequenz umfassen.
  42. Bank nach einem der vorstehenden Ansprüche 39 bis 41, welche mindestens einen primären Vektor nach Anspruch 26 bis 34 umfasst.
  43. Verfahren zur Herstellung eines Nukleotidbank, welches umfasst, Erhalten von exprimierbaren Nukleotidsequenzen, Klonieren der exprimierbaren Nukleotidsequenzen in Klonierungsstellen eines Gemisches primärer Vektoren, worin die primären Vektoren eine Kassette umfassen, worin die Kassetten eine Nukleotidsequenz in 5'→3' Richtung der allgemeinen Formel
    Figure 01110001
    umfaßt, worin RS1 und RS1' Restriktionsschnittstellen bezeichnen, RS2' und RS2' Restriktionsschnittstellen bezeichnen, die verschieden sind von RS1 und RS1', SP einzeln eine Abstandshaltersequenz mit mindestens zwei Nukleotidbasen bezeichnet, PR einen Promotor bezeichnet, CS eine Klonierungsstelle bezeichnet, TR einen Terminator bezeichnet, und Überführen des primären Vektors in eine Wirtszelle.
DE60222857T 2001-01-25 2002-01-25 Concatemere unterschiedlich exprimierter multipler gene Expired - Lifetime DE60222857T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DKPA200100127 2001-01-25
DK200100127 2001-02-22
US30102201P 2001-06-27 2001-06-27
US301022P 2001-06-27
PCT/DK2002/000055 WO2002059296A2 (en) 2001-01-25 2002-01-25 Concatemers of differentially expressed multiple genes

Publications (2)

Publication Number Publication Date
DE60222857D1 DE60222857D1 (de) 2007-11-22
DE60222857T2 true DE60222857T2 (de) 2008-07-17

Family

ID=26068953

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60222857T Expired - Lifetime DE60222857T2 (de) 2001-01-25 2002-01-25 Concatemere unterschiedlich exprimierter multipler gene

Country Status (8)

Country Link
EP (1) EP1360308B1 (de)
JP (2) JP2004525623A (de)
AT (1) ATE375394T1 (de)
AU (1) AU2002227882B2 (de)
CA (1) CA2474161C (de)
DE (1) DE60222857T2 (de)
NZ (1) NZ527208A (de)
WO (1) WO2002059296A2 (de)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7227057B2 (en) 1997-06-03 2007-06-05 Chromatin, Inc. Plant centromere compositions
US7235716B2 (en) 1997-06-03 2007-06-26 Chromatin, Inc. Plant centromere compositions
US7119250B2 (en) 1997-06-03 2006-10-10 The University Of Chicago Plant centromere compositions
US7193128B2 (en) 1997-06-03 2007-03-20 Chromatin, Inc. Methods for generating or increasing revenues from crops
US8008459B2 (en) 2001-01-25 2011-08-30 Evolva Sa Concatemers of differentially expressed multiple genes
JP2004525624A (ja) 2001-01-25 2004-08-26 エボルバ バイオテック アクティーゼルスカブ 細胞コレクションのライブラリー
EP1529110B1 (de) * 2002-08-01 2011-10-05 Evolva Ltd. Verfahren zur mischung von vielen heterologen genen
EP1811832A4 (de) 2004-10-22 2009-12-30 Revivicor Inc Huftiere mit gentechnisch veränderten immunsystemen
WO2010051288A1 (en) 2008-10-27 2010-05-06 Revivicor, Inc. Immunocompromised ungulates
CA2767724A1 (en) 2009-07-23 2011-01-27 Chromatin, Inc. Sorghum centromere sequences and minichromosomes
WO2011146833A1 (en) 2010-05-20 2011-11-24 Evolva Inc. Method of producing isoprenoid compounds in yeast
AU2012333134B2 (en) 2011-07-22 2017-05-25 John Paul Guilinger Evaluation and improvement of nuclease cleavage specificity
JP6295512B2 (ja) * 2012-03-15 2018-03-20 株式会社豊田中央研究所 酵母における外来遺伝子の発現産物の生産方法、酵母における発現調節剤及びその利用
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
EP4079847A1 (de) 2014-07-30 2022-10-26 President And Fellows Of Harvard College Cas9-proteine mit ligandenabhängigen inteinen
CN106591370A (zh) * 2015-10-19 2017-04-26 南京华贞生物医药科技有限公司 一种治疗自身免疫性相关疾病以及糖尿病的病毒载体及其构建方法和应用
EP3365357B1 (de) 2015-10-23 2024-02-14 President and Fellows of Harvard College Entwickelte cas9-proteine für geneditierung
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
JP7201153B2 (ja) 2016-08-09 2023-01-10 プレジデント アンド フェローズ オブ ハーバード カレッジ プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
AU2017342543B2 (en) 2016-10-14 2024-06-27 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (de) 2017-03-09 2020-01-15 President and Fellows of Harvard College Unterdrückung von schmerzen durch geneditierung
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
EP3601562A1 (de) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nukleobasen-editoren mit nukleinsäureprogrammierbaren dna-bindenden proteinen
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
EP3797160A1 (de) 2018-05-23 2021-03-31 The Broad Institute Inc. Baseneditoren und verwendungen davon
US12281338B2 (en) 2018-10-29 2025-04-22 The Broad Institute, Inc. Nucleobase editors comprising GeoCas9 and uses thereof
SG11202109679VA (en) 2019-03-19 2021-10-28 Broad Inst Inc Methods and compositions for editing nucleotide sequences
US20200392554A1 (en) * 2019-06-13 2020-12-17 General Electric Company Expression of products from nucleic acid concatemers
BR112022022603A2 (pt) 2020-05-08 2023-01-17 Broad Inst Inc Métodos e composições para edição simultânea de ambas as fitas de sequência alvo de nucleotídeos de fita dupla

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5316922A (en) * 1992-04-15 1994-05-31 The United States Of America As Represented By Department Of Health And Human Services Method for indentifying and expressing proteins that recognize and adhere to specific probes
US6242211B1 (en) * 1996-04-24 2001-06-05 Terragen Discovery, Inc. Methods for generating and screening novel metabolic pathways

Also Published As

Publication number Publication date
AU2002227882B2 (en) 2007-06-28
EP1360308A2 (de) 2003-11-12
JP2004525623A (ja) 2004-08-26
JP5001346B2 (ja) 2012-08-15
WO2002059296A8 (en) 2004-04-15
JP2010057519A (ja) 2010-03-18
EP1360308B1 (de) 2007-10-10
AU2002227882C9 (en) 2002-08-06
WO2002059296A3 (en) 2003-05-01
CA2474161A1 (en) 2002-08-01
ATE375394T1 (de) 2007-10-15
NZ527208A (en) 2005-05-27
CA2474161C (en) 2012-03-27
DE60222857D1 (de) 2007-11-22
WO2002059296A2 (en) 2002-08-01
AU2002227882C1 (en) 2002-08-06

Similar Documents

Publication Publication Date Title
DE60222857T2 (de) Concatemere unterschiedlich exprimierter multipler gene
EP1356037B1 (de) Zellbibliothek
AU2002227882A1 (en) Concatemers of differentially expressed multiple genes
US8008459B2 (en) Concatemers of differentially expressed multiple genes
DE69432543T2 (de) Selektionmarker-genfreie rekombinante Stämme: Verfahren zur ihrer Herstellung und die Verwendung dieser Stämme
DE69929796T2 (de) Evolution ganzer zellen und organismen durch rekursive sequenz-rekombination
DE60222914T2 (de) Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
DE60221801T3 (de) Cpg-freie synthetische gene und bakterielle plasmide
JP2010187692A (ja) 所望の表現型を有する細胞に進化させる方法及び進化した細胞
DE4220759A1 (de) DNA-Sequenzen für Oligosaccharid-Transporter, Plasmide, Bakterien und Pflanzen enthaltend einen Transporter sowie Verfahren zur Herstellung und Transformation von Hefestämmen zur Identifikation des Transporteers
DE4018441A1 (de) Rekombinantes restriktionsenzym sau3ai
DE69332514T2 (de) Transformation von Phaffia Rhodozyma
WO2002059330A2 (en) Artificial chromosomes comprising concatemers of expressible nucleotide sequences
DE10021688A1 (de) Gene des 1-Desoxy-D-xylulose-Biosynthesewegs
DE112004001708T5 (de) Verfahren zur Herstellung einer nützlichen Zwischenstufe in der Alkaloid-Biosynthese unter Verwendung von RNAi-Technik
DE69329540T2 (de) Verfahren zur Herstellung von Proteaseinhibitoren
WO2006136311A1 (de) Metabolic engineering der q10-produktion in hefen der gattung sporidiobolus
EP0187138B1 (de) Mikroorganismus und Plasmid für konstitutive Creatinamidino-hydrolase-Bildung sowie Verfahren zur Herstellung derselben
EP2625275A1 (de) Verfahren zur semi-synthetischen herstellung hochreiner &#34;minicircle&#34; dna-vektoren aus plasmiden
EP1242603A2 (de) Integrationsvektoren und verfahren zur herstellung rekombinanter proteine in pilzen
WO2000023604A1 (de) Expressionsvektoren enthaltend regulative sequenzen aus stylonychia lemnae zur heterologen proteinexpression in eukaryontischen protisten und ein verfahren zur identifizierung solcher regulativen sequenzen
DE19919124A1 (de) Nukleinsäuremolekül, umfassend eine für ein Polypeptid mit Chorismatmutase-Aktivität kodierende Nukleinsäure
DE69014100T2 (de) Cdns des orsv-virus gens.
WO2003010334A1 (de) Verfahren zur identifizierung von leserastermutationen
WO2003006663A2 (de) Verfahren zur herstellung von deletionsmutanten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R082 Change of representative

Ref document number: 1360308

Country of ref document: EP

Representative=s name: BECKER, KURIG, STRAUS, 80336 MUENCHEN, DE