MX2013012479A - Metodos para modificacion genomica. - Google Patents

Metodos para modificacion genomica.

Info

Publication number
MX2013012479A
MX2013012479A MX2013012479A MX2013012479A MX2013012479A MX 2013012479 A MX2013012479 A MX 2013012479A MX 2013012479 A MX2013012479 A MX 2013012479A MX 2013012479 A MX2013012479 A MX 2013012479A MX 2013012479 A MX2013012479 A MX 2013012479A
Authority
MX
Mexico
Prior art keywords
host cell
nucleic acid
site
exogenous nucleic
cell
Prior art date
Application number
MX2013012479A
Other languages
English (en)
Other versions
MX351043B (es
Inventor
Zach Serber
Andrew Horwitz
Original Assignee
Amyris Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amyris Inc filed Critical Amyris Inc
Publication of MX2013012479A publication Critical patent/MX2013012479A/es
Publication of MX351043B publication Critical patent/MX351043B/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Se proporcionan en la presente métodos para integrar uno o más ácidos nucleicos exógenos en una o más sitio objetivo seleccionados de un genoma de la célula huésped. En ciertas modalidades, el método comprende poner en contacto un genoma de la célula huésped con una o más polinucleótidos de integración que comprende un ácido nucleico exógeno para integrarse en un sitio genómico objetivo, y una nucleasa capaces de provocar un rompimiento de la doble hebra cerca o dentro del sitio genómico objetivo.

Description

MÉTODOS PARA MODIFICACIÓN GENÓMICA 1. REFERENCIA CRUZADA PARA LAS SOLICITUDES RELACIONADAS Esta solicitud reclama el beneficio de prioridad del No. de Solicitud Provisional de los Estados Unidos 61/479,821, presentada el 27 de abril de 2011; No. de Solicitud Provisional de los Estados Unidos 61/500,741, presentada el 24 de junio de 2011; y No. de Solicitud Provisional de los Estados Unidos 61/539,389, presentada el 26 de Septiembre de 2011, el contenido de las cuales se incorpora en la presente para referencia en su totalidad. 2. CAMPO DE LA INVENCIÓN Los métodos y composiciones proporcionados en la presente se relacionan en general a los campos de la biología molecular e ingeniería genética. 3. ANTECEDENTES Las técnicas de ingeniería genética para introducir e integrar ácidos nucleicos exógenos en un genoma de la célula huésped son necesarias en una variedad de campos . Por ejemplo, en el campo de la biología sintética, la fabricación de una cepa genéticamente modificada requiere de la inserción de secuencias de ADN personalizadas en un cromosoma de la célula huésped, y comúnmente, la producción a escala industrial requiere de la introducción de docenas de genes en el organismo huésped. Los diseños' optimizados para la cepa industrial se han alcanzado empíricamente, en la construcción requerida y en las pruebas in vivo de muchos ensambles de ADN, solos y/o conjuntamente con otros componentes de la ruta biosintética.
La ingeniería genética es altamente dependiente del gen objetivo, el cual utiliza un fragmento extracromosómico de la plantilla del ADN donante y recurre a la maquinaria de recombinación homóloga (HR) de la célula para intercambiar una secuencia cromosómica con una secuencia de donante exógeno. Véase, por ejemplo, Capecchi, Science 244:1288-1292 (1989) . El gen objetivo se limita en su eficiencia; en células vegetales y de mamíferos, sólo ~1 en 10e células se proporciona con secuencias de plantilla en exceso que se someten a la modificación genética deseada. Las levaduras demuestran una capacidad incrementada para la recombinación homóloga. Sin embargo, la incorporación exitosa de ADN exógeno en los genomas de levadura todavía es un evento comparativamente raro (~1 en 105) , y requiere del uso de un marcador seleccionable para la detección de células recombinantes las cuales usualmente sólo comprenden una modificación genómica simple. Además, puesto que sólo un depósito limitado de marcadores seleccionables se encuentra disponible para su uso en levaduras, el o los marcadores seleccionables deben retirarse de una cepa recombinante para permitir modificaciones genómicas adicionales utilizando los mismos marcadores, y en algunos casos, antes de liberar la célula huésped en un ambiente de fabricación o natural. De este modo, independiente de la eficiencia en la cual puede lograrse la integración en cualquier lugar simple, la naturaleza en serie de uno a la vez de la ingeniería genómica requiere que se hagan cambios en lugares múltiples que requieren muchos ciclos de ingeniería cuando existen lugares para modificarse.
La eficiencia del gen objetivo puede mejorarse cuando se combina con un rompimiento genómico dirigido a la doble hebra (DSB) introducido cerca del sitio de integración pretendido. Véase por ejemplo, Jasin, M . , Trends Genet 12 (6) :224-228 (1996); y Urnov et al., Nature 435 (7042) : 646-651 (2005) . Las denominadas "nucleasas de diseño" son enzimas que pueden adaptarse para unirse a una secuencia "dirigida" específica de ADN in vivo e introducir un rompimiento de la doble hebra en el mismo. Pueden efectuarse tales rompimientos dirigidos de las dobles hebras, por ejemplo, al transformar una célula huésped con un plásmido que contiene un gen que codifica la nucleasa de diseño. La célula huésped repara estos rompimientos de dobles hebras ya sea por homología dirigida a la reparación del ADN o la incorporación del extremo no homólogo. En el curso de la reparación, cualquier mecanismo puede utilizarse para incorporar un ADN donante exógeno en el sitio objetivo. Si la nucleasa se introduce dentro de la célula al mismo tiempo cuando se introduce el ADN donante, la célula puede integrar al ADN donante en el lugar objetivo.
La llegada de las nucleasas de diseño ha permitido la introducción de transgenes en lugares objetivo particulares en cultivos ( right et al, Plant J 44:693-705 (2005) ) , para mejorar líneas de cultivo de células de mamíferos que expresan anticuerpos terapéuticos (Malphettes et al., Biotechnol Bioeng 106 ( 5 ) : 74 - 783 (2010)) , e incluso para editar el genoma humano para provocar resistencia al VIH (Urnov et al, Nat Rev Genet 11(9) :636-646 (2010)) . Si bien es impactante, la HR mediada por DSB aún no se ha explotado para reducir los redondeos múltiples de ingeniería necesarios para integrar ensambles múltiples de ADN, por ejemplo, hacia la construcción de rutas metabólicas funcionales en microbios industriales .
De este modo, existe una necesidad para métodos y composiciones que permitan la integración simultánea de una pluralidad de ácidos nucleicos exógenos en las regiones específicas de un genoma de la célula huésped. 4. COMPENDIO DE LA INVENCIÓN Se proporcionan en la presente métodos y composiciones para integrar uno o más ácidos nucleicos exógenos en lugares genómicos especificados de una célula huésped. En algunas modalidades, una pluralidad de ácidos nucleicos exógenos se integra de modo simultáneo con una sola reacción de transformación. En algunas modalidades, los métodos comprenden la introducción de una o más nucleasas y uno o más ensambles de ADN donante en la célula para facilitar la integración del ADN donante en ubicaciones especificadas en el genoma. Los métodos y composiciones utilizan la maquinaria de recombinación homologa natural de la célula huésped, cuya recombinación además se mejora al inducir el rompimiento dirigido de la doble hebra en el genoma de la célula huésped en los sitios de integración pretendidos .
De este modo, en un aspecto, se proporciona en la presente un método para integrar una pluralidad de ácidos nucleicos exógenos en un genoma de la célula huésped, el método comprende : (a) poner en contacto una célula huésped con: (i) una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno (ES)X comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homóloga mediada por una célula huésped de (ES)X en un sitio objetivo (TS)X del genoma de la célula huésped; y (ii) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homologa de (ES)x en (TS)X; y (b) recuperar una célula huésped en donde cada ácido nucleico exógeno (ES)X seleccionado se ha integrado en cada secuencia objetivo (TS)X seleccionada, en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
En algunas modalidades, (HR1)X es homologa a una región 5' de (TS)X, y (HR2)X, es homologa a una región 3' de (TS)X.
En algunas modalidades, (N)x es capaz de escindirse en una región colocada entre las regiones 5' y 3' de (TS)X.
En algunas modalidades, una nucleasa simple es capaz de escindir cada (TS)X.
En algunas modalidades, n= 3, 4, 5, 6, 7, 8, 9 o 10. En algunas modalidades, n>10.
En algunas modalidades, la recuperación no requiere de la integración de un marcador seleccionable . En algunas modalidades, la recuperación aparece en una alta frecuencia cuando se compara con la célula huésped que no tiene contacto con una nucleasa capaz de escindirse en el sitio objetivo. En algunas modalidades, la recuperación aparece en una frecuencia de alrededor de una de cada 10, 9, 8, 7, 6, 5, 4, 3, o 2 células huésped en contacto, o poblaciones clónales seleccionadas de la misma. En algunas modalidades, la recuperación comprende identificar las integraciones por al menos un método seleccionado del grupo que consiste de PCR, Transferencia Southern, mapeo de restricción, y secuenciación de ADN.
En algunas modalidades, (N)x es capaz de escindir una secuencia genómica del huésped endógeno, por ejemplo, un lugar natural dentro de (TS)X. En algunas modalidades, (N)x es capaz de escindir una secuencia exógena, por ejemplo, un sitio introducido dentro de (TS)X.
En algunas modalidades, (ES)X además comprende un ácido nucleico (D)x de interés colocado en 3' de (HR1) x y en 5' de (HR2)X. En algunas modalidades, (D)x se selecciona del grupo que consiste de un promotor, una secuencia de ácido nucleico que codifica un epítopo marcador, un gen de interés, un gen reportero, y una secuencia de ácido nucleico que codifica un codón de terminación.
En algunas modalidades, (ES)X es lineal. En algunas modalidades, (N)x se proporciona como un vector de expresión que comprende la secuencia de ácido nucleico que codifica (N)x. En algunas modalidades, (N)x se transforma en la célula huésped como una proteína purificada. En algunas modalidades, (?)? se transforma en la célula huésped como ARN purificado.
En algunas modalidades, la célula huésped comprende una o más secuencias de nucleótidos heterologos que codifican una o más enzimas de una ruta biosintética. En algunas modalidades, una o más secuencias de nucleótidos heterologos que codifican una o más enzimas de una ruta biosintética se integran genómicamente . En algunas modalidades, cada ácido nucleico exógeno (ES)X comprende un ácido nucleico (D)x de interés colocado en 3 ' de (HR1)X y en 5' de (HR2)X, que codifica una enzima de una ruta biosintética. En algunas modalidades, (D)x es un miembro de una biblioteca (L)x que comprende una pluralidad de moléculas de ácido nucleico que codifican variantes de una enzima de una ruta biosintética.
En algunas modalidades, la célula huésped de una o más secuencias de nucleótidos heterologos codifican una o más enzimas de una ruta de mevalonato (MEV) para elaborar pirofosfato de isopentenilo . En algunas modalidades, una o más enzimas de la ruta de mevalonato se seleccionan de acetil-CoA tiolasa, HMG-CoA sintasa, HMG-CoA reductasa, mevalonato cinasa, fosfomevalonato cinasa y mevalonato pirofosfato descarboxilasa . En algunas modalidades, la célula huésped comprende una pluralidad de ácidos nucleicos heterologos que codifican todas las enzimas de una ruta MEV. En otras palabras, la pluralidad de ácidos nucleicos heterologos, tomados juntos, codifican al menos una enzima de cada clase de enzimas de la ruta MEV listada en lo anterior. En algunas modalidades, cada ácido nucleico exógeno (ES)X comprende un ácido nucleico (D)x de interés colocado en 3 ' de (HRl)x y en 5' de (HR2)X, que codifica un terpeno sintasa. En algunas modalidades, el terpeno sintasa se selecciona del grupo que consiste de un monoterpeno sintasa, un diterpeno sintasa, un sesquiterpeno sintasa, un sesterterpeno sintasa, un triterpeno sintasa, un tetraterpeno sintasa, y un politerpeno sintasa.
En algunas modalidades, (N)x se selecciona del grupo que consiste de una endonucleasa, por ejemplo, una meganucleasa, una nucleasa de dedo de zinc, una proteína de fusión del dominio de nucleasa (TALEN) unida al ADN efector de TAL, una transposasa, y una recombinasa específica del sitio, en donde x es 1 o cualquier número entero de 1 a n. En algunas modalidades, la nucleasa de dedo de zinc es una proteína de fusión que comprende el dominio de escisión de una endonucleasa de restricción TypelIS fusionada a un dominio genomanipulado de unión al dedo de zinc. En algunas modalidades, la endonucleasa de restricción TypelIS se selecciona del grupo que consiste de Endonucleasa HO y endonucleasa Fok I. En algunas modalidades, el dominio de unión al dedo de zinc comprende 3, 5 ó 6 dedos de zinc. En algunas modalidades, la endonucleasa es una endonucleasa de base seleccionada del grupo que consiste de: una endonucleasa de base de LAGLIDADG, una endonucleasa de base de HNH, una endonucleasa de base en bloque de His-Cys, una endonucleasa de base de GIY-YIG, y una endonucleasa de base cianobacteriana. En algunas modalidades, la endonucleasa se selecciona del grupo que consiste de: H-Drel, I-Scel, I-SceII, I-SceIII, ?-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ceul, I-CeuAIIP, I-Creí, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-Tlil, I-Ppol, Pi-PspI, F-Scel, F-SceII, F-SuvI, F-Cphl, F-TevI, F-TevII, I-Amal, I-Anil, I-ChuI, I-Cmoel, I-Cpal, I-CpaII, I-Csml, I-Cvul, I-CvuAIP, I-Ddil, I-DdiII, I-DirI, I-Dmol, I-Hmul, I-HmuII, I-HsNIP, I-Llal, I-Msol, I-Naal, I-NanI, I-NclIP, I-NgrIP, I-Nitl, I-Njal, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP( I-PbpIP, I-SpBetalP, I-Scal, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, 1-VinIP, I-ZbiIP, PI-Mgal, PI- tuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-Thyl, PI-Tlil, o ??-TliII. En modalidades particulares, la endonucleasa es Fcph-I.
En algunas modalidades, la endonucleasa se modifica para unir específicamente una secuencia genómica de célula huésped endógena, en donde la endonucleasa modificada ya no se une a su secuencia de reconocimiento de endonucleasa tipo silvestre. En algunas modalidades, la endonucleasa modificada se deriva de una endonucleasa de base seleccionada del grupo que consiste de: una endonucleasa de base de LAGLIDADG, una endonucleasa de base de HNH, una endonucleasa de base en bloque de His-Cys, una endonucleasa de base de GIY-YIG, y una endonucleasa de base cianobacteriana . En algunas modalidades, la endonucleasa modificada se deriva de una endonucleasa seleccionada del grupo que consiste de: H-Drel, I-Scel, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ceul, l-CeuAHP, I-Creí, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-Tlil, I-Ppol, Pi-PspI, F-Scel, F-SceII, F-SuvI, F-Cphl, F-TevI, F-TevII, I-Amal, I-Anil, I-ChuI, I-Cmoel, I-Cpal, I-CpaII, I-Csml, I-Cvul, I-CvuAIP, I-Ddil, I-DdiII, I-DirI, I-Dmol, I-Hmul, I-HmuII, I-HsNIP, I-Llal, I-Msol, I-Naal, I-NanI, I-NclIP, I-NgrIP, I-Ni'tl, I-Njal, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, ?-PorIIP, I-PbpIP, 1-SpBetalP, I-Scal, I-SexIP, I-SneIP, I-Spoml, I-SpomCP, I-SpomIP, 1-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, ?-TdeIP, I-TevI, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-Mgal, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, Pl-Scel, PI-TfuI, PI-TfuII, PI-Thyl, PI-Tlil, o PI-TlilI.
En algunas modalidades, la célula huésped es una célula de hongo, una célula bacteriana, una célula vegetal, una célula animal, o una célula humana. En modalidades particulares, la célula huésped es una célula de levadura. En algunas modalidades, la célula de levadura es una célula de levadura haploide. En algunas modalidades, la célula de levadura es una célula de Saccharomyces cerevisiae . En algunas modalidades, la célula de Saccharomyces cerevisiae es de la cepa de levaduras de Baker, Mauri, Santa Fe, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1 O AL-1.
En otro aspecto, se proporciona en la presente un método para la integración sin marcadores de un ácido nucleico exógeno en un sitio objetivo de un genoma de la célula de levadura, el método comprende: (a) poner en contacto una célula huésped de levadura con: (i) un ácido nucleico exógeno (ES) que comprende una primera región de homología (HRl) y una segunda región de homología (HR2) , en donde (HRl) y (HR2) son capaces de iniciar una recombinación homologa mediada por una célula huésped en el sitio objetivo (TS) ; y (ii) una nucleasa (N) capaz de escindirse en (TS) , después de lo cual la escisión resulta en la recombinación homologa de (ES) en (TS) ; y (b) recuperar una célula huésped que tiene (ES) integrado en (TS) , en donde la recuperación no requiere la integración de un marcador seleccionable .
En otro aspecto, se proporciona en la presente una célula huésped modificada generada por cualquiera de los métodos de integrar genómicamente uno o más ácidos nucleicos exógenos descritos en la presente. En algunas modalidades, la célula huésped modificada comprende: (a) una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno (ES)X comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped de (ES)X en un sitio objetivo (TS)X del genoma de la célula huésped; y (b) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homóloga de (ES)X en (TS)x; en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
En algunas modalidades, la célula huésped modificada es una célula de levadura y comprende: (a) un ácido nucleico exógeno (ES) que comprende una primera región de homología (HR1) y una segunda región de homología (HR2) , en donde (HR1) y (HR2) son capaces de iniciar una recombinación homologa mediada por una célula huésped en un sitio objetivo (TS) del genoma de la célula huésped; y (b) una nucleasa (N) capaz de escindirse en (TS) , después de lo cual la escisión resulta en la recombinación homologa de (ES) en (TS) ; en donde (ES) no comprende un marcador seleccionable .
En otro aspecto, se proporciona en la presente una composición que comprende: (a) una célula de levadura; (b) una pluralidad de ácidos nucleicos exogenos, en donde cada ácido nucleico exógeno (ES)X comprende: (i) una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped de (ES)X en un sitio objetivo seleccionado (TS)X de un genoma de la célula de levadura; y (ii) un ácido nucleico (D)x de interés colocado en 3' de (HR1)X y en 5' de (HR2)X; (c) una pluralidad de nucleasas, en donde cada nucleasa (N)x es capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homologa de (ES)X en (TS)X; en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
En otro aspecto, se proporciona en la presente un kit útil para realizar los métodos para integrar genómicamente uno o más ácidos nucleicos exógenos descritos en la presente. En algunas modalidades, el kit comprende: (a) una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno (ES)X comprende: (i) una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped de (ES)X en un sitio objetivo seleccionado (TS)X de un genoma de la célula de levadura; y (ii) un ácido nucleico (D)x de interés colocado en 3' de (HR1)X y en 5 ' de (HR2)X; (b) una pluralidad de nucleasas, en donde cada nucleasa (N)x es capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homologa de (ES)x en (TS)x.; en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
En algunas modalidades, (D)x se selecciona del grupo que consiste de un marcador seleccionable , un promotor, una secuencia de ácido nucleico que codifica un epítopo marcador, un gen de interés, un gen reportero, y una secuencia de ácido nucleico que codifica un codón de terminación. En algunas modalidades, el kit comprende además una pluralidad de pares de cebadores (P)x, en donde cada par cebador es capaz de identificar la integración de (ES)X en (TS)x mediante PCR. En algunas modalidades, (ES)X es lineal. En algunas modalidades, (ES)X es circular.
En una modalidad particular, el kit permite la integración específica al sitio de un ácido nucleico exógeno en un sitio objetivo único dentro de cualquiera de los aproximadamente 6000 lugares genéticos del genoma de levadura. En estas modalidades, n >6000, en donde cada (TS)x es único para un lugar específico del genoma de la célula de levadura . 5. BREVE DESCRIPCIÓN DE LAS FIGURAS La FIGURA 1 proporciona una modalidad ejemplar de la integración genómica sin marcador de un ácido nucleico exógeno utilizando una nucleasa específica del sitio.
La FIGURA 2 proporciona una modalidad ejemplar de la integración genómica simultánea de una pluralidad de ácidos nucleicos exógenos utilizando una pluralidad de nucleasas específicas de sitio. HR1 - la región de homología corriente arriba; HR2 - la región de homología corriente abajo; TS - sitio objetivo; N - nucleasa específica del sitio; D - ácido nucleico de interés.
La FIGURA 3 proporciona una representación esquemática de la ruta MEV para la producción de isoprenoides .
La FIGURA 4 proporciona una modalidad ejemplar de los métodos para generar bibliotecas de integración combinatoria proporcionadas en la presente. Las marcas sombreadas representan miembros individuales de ácido nucleico exógeno de cada biblioteca (L)x.
La FIGURA 5 proporciona resultados de la colonia PCR de 96 colonias de células de levadura transformadas con un vector de ADN vacío y un "donante" lineal de ADN que codifican EmGFP funcional. Las células de levadura comprenden copias de ácidos nucleicos "objetivo" que codifican un EmGFP truncado, no funcional, integrado genómicamente en cada uno de los lugares HO, YGR250C, y NDT80. Las reacciones separadas de PCR se realizaron para probar los lugares HO, YGR250C, y NDT80 con cebadores específicos para ácidos nucleicos que codifican EmGFP funcional. No se observaron Productos PCR,. lo que indica que no hay sustituciones de ácidos nucleicos dirigidos que codifican EmGFP no funcional con ácidos nucleicos donantes que codifican el EmGFP funcional producido .
La FIGURA 6 proporciona resultados de la colonia PCR de 96 colonias de células de levadura transformadas con ADN de pZFN.gfp y ADN "donante" que codifican EmGFP funcional. Las células de levadura comprenden copias de ácidos nucleicos "objetivo" que codifica un EmGFP truncado, no funcional, integrado genómicamente en cada uno de los lugares HO, YGR250c, y NDT80. pZFN.gfp codifica una nucleasa de dedo de zinc que reconoce y escinde una secuencia de ácido nucleico específica para la secuencia de codificación emgfP no funcional. Las reacciones PCR separadas se realizaron para probar los lugares HO, YGR250c, y NDT80 con cebadores específicos para ácido nucleico que codifican EmGFP funcional. Se observaron numerosos productos PCR, que indican la sustitución exitosa de las integraciones no funcionales de EmGFP con ADN que expresan EmGFP funcional. Las 23 colonias tuvieron 3 sitios remplazados.
La FIGURA 7 proporciona las titulaciones de sequiterpeno de la Cepa B, una cepa de levadura que produce farneseno parental que comprende enzimas de la ruta de mevalonato y un plásmido que codifica farneseno sintasa (FS) ; la Cepa D, una cepa derivada de la Cepa B en la cual 4 copias de amorfadieno sintasa (ADS) se ha integrado genómicamente; y la Cepa E, una cepa derivada de la Cepa D en la cual el plásmido que codifica FS se ha perdido. Casi 100% de la capacidad del sesquiterpeno de la Cepa B parental se mantiene en las Cepas D y E sólo con la adición de copias múltiples de ADS.
La FIGURA 8, proporciona resultados para células co-transformadas con los ADN donantes lineales para los lugares SFC1 (ADN donante de GFP) y YJR030C (ADN donante de ADE2) , la endonucleasa YJR030C del plásmido (pCUT006) y la endonucleasa SFC1 del plásmido (pCUT058) . El 80% de las colonias seleccionadas en la pérdida de URA + placas de agar Kan fueron positivas a GFP. De estas colonias, 91% fueron positivas para la integración de ADE2. En total, 72.8% de las colonias han integrado exitosamente el ADN donante sin marcadores en ambos lugares . 6. DESCRIPCIÓN DETALLADA DE LAS MODALIDADES 6.1 Definiciones Como se utiliza en la presente, los términos "que se escinde" , "escisión" y/o "que escinde" con respecto a una nucleasa, por ejemplo, una endonucleasa de base, nucleasa de dedo de zinc o nucleasa efectora de TAL, se refieren al acto de crear un rompimiento de la doble hebra (DSB) en un ácido nucleico particular. El DSB puede dejar un extremo obstruido o extremo adherente (es decir, 5' o 3' sobresaliente), como se entiende por aquel con experiencia en la técnica.
Como se utiliza en la presente, el término "célula huésped genomanipulada" se refiere a una célula huésped que se genera al modificar genéticamente una célula parental utilizando técnicas de ingeniería genética (es decir, tecnología recombinante) . La célula huésped genomanipulada puede comprender adiciones, supresiones, y/o modificaciones de secuencias de nucleótidos para el genoma de la célula parental .
Como se utiliza en la presente, el término "heterólogo" se refiere a que no se encuentra normalmente en la naturaleza. El término "secuencia heteróloga de nucleótidos" se refiere a una secuencia de nucleótidos que normalmente no se encuentra en una célula dada en la naturaleza. Como tal, una secuencia heteróloga de nucleótidos puede ser: (a) extraña a su célula huésped (es decir, es "exógena" a la célula) ; (b) se encuentra naturalmente en la célula huésped (es decir, "endógena") pero presente en una cantidad no natural en una célula (es decir, una cantidad mayor o menor que la encontrada naturalmente en una célula huésped) ; o (c) puede encontrarse naturalmente en la célula huésped pero colocada fuera de su lugar natural .
Como se utiliza en la presente, el término "homología" se refiere a la identidad entre dos o más secuencias de ácido nucleico, o dos o más secuencias de aminoácidos . La identidad de secuencia puede medirse en términos de porcentaje de identidad (o de modo similar u homología) ; cuanto mayor sea el porcentaje, estarán más cerca de las secuencias idénticas entre sí. Los homólogos u ortólogos de ácido nucleico o secuencias de aminoácidos poseen relativamente un alto grado de identidad de secuencia cuando se alinean utilizando métodos estándar. Los métodos de alineación de secuencias para su comparación se conocen bien en la técnica. Diversos programas y algoritmos de alineación se describen en: Smith & Waterman, Adv. Appl. Math. 2:482, 1981; Needleman & unsch, J. Mol. Biol . 48:443, 1970; Pearson & Lipman, Proc. Nati. Acad. Sci. USA 85:2444, 1988; Higgins & Sharp, Gene, 73:237-44, 1988; Higgins & Sharp, CABIOS 5:151-3, 1989; Corpet et al, Nuc . Acids Res. 16:10881-90, 1988; Huang et al. Computer Appls. Biosc. 8, 155-65, 1992; y Pearson et al, Meth. Mol. Bio. 24:307-31, 1994. Altschul et al., J. Mol. Biol. 215:403-10, 1990, presentan una consideración detallada de los métodos de alineación de secuencias y cálculos de homología. La Herramienta de Búsqueda de Alineación Local Básica (BLAST) de NCBI (Altschul et al, J. Mol. Biol. 215:403-10, 1990) está disponible desde diversas fuentes, que incluyen el Centro Nacional para la Información Biológica (NCBI, Biblioteca Nacional de Medicina, Edificio 38 A, Habitación 8N805, Bethesda, Md. 20894) y en la Internet, para su uso junto con los programas de análisis de secuencias blastp, blastn, blastx, tblastn y tblastx. Puede encontrarse información adicional en el sitio web de NCBI.
Como se utiliza en la presente, el término "sin marcadores" se refiere a la integración de un ADN donante en un sitio objetivo dentro un genoma de la célula huésped sin la integración acompañante de un marcador seleccionable . En algunas modalidades, el término además se refiere a la recuperación de tal célula huésped sin utilizar un esquema de selección que se base en la integración de un marcador seleccionable en un genoma de la célula huésped. Por ejemplo, en ciertas modalidades, un marcador de selección que es episómico o extracromosómico puede utilizarse para seleccionar células que comprenden un plásmido que codifica una nucleasa capaz de escindir un sitio genómico objetivo.
Tal uso puede considerarse "sin marcadores" siempre que el marcador seleccionable no se integre en un genoma de la célula huésped.
Como se utiliza en la presente, el término "polinucleótido" se refiere a un polímero compuesto de unidades de nucleótidos como se entenderá por alguien de experiencia en la técnica. Las unidades de nucleótidos preferidas incluyen pero no se limitan a aquellas que comprenden adenina (A) , guanina (G) , citosina (C) , timina (T) , y uracilo (U) . Las unidades de nucleótidos útiles modificadas incluyen pero no se limitan a aquellas que comprenden 4-acetilcitidina, 5- (carboxihidroxilmetil) uridina, 2-0-metilcitidina, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilamino-metiluridina, dihidrouridina, 2-0-metilpseudouridina, 2-O-metilguanosina, inosina, N6-isopentiladenosina, 1-metiladenosina, 1-metilpseudouridina, 1-metilguanosina, 1-metilinosina, 2 , 2-dimetilguanosina, 2-metiladenosina, 2-metilguanosina, 3 -metilcitidina, 5-metilcitidina, N6-metiladenosina, 7-metilguanosina, 5-metilaminotnetiluridina, 5 -metoxiaminome il-2-tiouridina, 5-metoxiuridina, 5-metoxicarbonilmetil-2 -tiouridina, 5-metoxicarbonilmetiluridina, 2 -metiltio-N6 - isopentiladenosina, metiléster del ácido uridin-5-oxiacético, ácido uridin-5-oxiacético, wibutoxosina, wibutosina, pseudouridina, queuosina, 2-tiocitidina, 5-metil-2-tiouridina, 2 -tiouridina, 4 -tiouridina, 5-metiluridina, 2-0-metil-5-metiluridina, 2-O-metiluridina, y similares. Los polinucleótidos incluyen ácidos nucleicos que son de origen natural, tal como ácido desoxirribonucleico ( "ADN" ) y ácido ribonucleico ( "ARN" ) , así como ácidos nucleicos análogos. Los ácidos nucleicos análogos incluyen aquellos que incluyen bases que no son de origen natural, nucleótidos que participan en vínculos con otros nucleótidos diferentes a las uniones fosfodiéster de origen natural o que incluyen bases anexas a través de vínculos diferentes a los enlaces fosfodiéster. De este modo, análogos de nucleótidos incluyen, por ejemplo y sin limitación, fosforotioatos , fosforoditioatos , fosforotriésteres , fosforamidatos , boranofosfatos , metilfosfonatos, metilfosfonatos quirales, 2-0-metil ribonucleótidos, ácidos nucleicos peptídicos (PNA) , y similares.
Se utiliza en la presente la notación convencional para describir la secuencia de polinucleótidos: el extremo en el lado izquierdo de una secuencia de polinucleótidos de una sola hebra es el extremo 5'; la dirección n el lado izquierdo de una secuencia de polinucleótidos de doble hebra se denomina como la dirección 5' .
Como se utiliza en la presente, el término "simultáneo", cuando se utiliza con respecto a la integración múltiple, abarca un período de tiempo que comienza en el punto en el cual una célula huésped se co-trans orma con una nucleasa, por ejemplo, un plásmido que codifica una nucleasa, y más de un ADN donante para integrarse al genoma de una célula huésped, y termina en el punto en el cual la célula huésped transformada, o poblaciones clónales de la misma, se seleccionan para la integración exitosa de los ADN donantes en sus lugares objetivo respectivos. En algunas modalidades, el periodo de tiempo abarcado por "simultáneo" es al menos la cantidad de tiempo requerida por la nucleasa para unirse y escindir su secuencia objetivo dentro del o los cromosomas de la célula huésped. En algunas modalidades, el período de tiempo abarcado por "simultáneo" es de al menos 6, 12, 24, 36, 48, 60, 72, 96 o más de 96 horas, comenzando en el punto en el cual una célula huésped se co- transforma con una nucleasa, por ejemplo, un plásmido que codifica una nucleasa, y más de un ADN donante. 6.2 Métodos de integración de ácidos nucleicos exógenos Se proporcionan en la presente métodos para integrar uno o más ácidos nucleicos exógenos en uno o más sitios objetivo seleccionados de un genoma de la célula huésped. En ciertas modalidades, los métodos comprenden poner en contacto la célula huésped con uno o más polinucleótidos de integración, es decir, ADN donantes, que comprenden un ácido nucleico exógeno para integrarse en el sitio genómico objetivo, y una o más nucleasas capaces de provocar un rompimiento de la doble hebra cerca o dentro del sitio genómico objetivo. La escisión cerca o dentro del sitio genómico objetivo incrementa en gran medida la frecuencia de recombinación homóloga en o cerca del sitio de escisión.
En un aspecto particular, se proporciona en la presente un método para la integración sin marcadores de un ácido nucleico exógeno en un sitio objetivo de un genoma de la célula huésped, el método comprende: (a) poner en contacto una célula huésped con: (i) un ácido nucleico exógeno (ES) que comprende una primera región de homología (HR1) y una segunda región de homología (HR2) , en donde (HR1) y (HR2) son capaces de iniciar una recombinación homóloga mediada por una célula huésped en el sitio objetivo (TS) ; y (ii) una nucleasa (N) capaz de escindirse en (TS) , después de lo cual la escisión resulta en la recombinación homóloga de (ES) en (TS) ; y (b) recuperar una célula huésped que tiene (ES) integrado en (TS) , en donde la recuperación no requiere la integración de un marcador seleccionable .
La FIGURA 1 proporciona una modalidad ejemplar de la integración genómica sin marcadores de un ácido nucleico exógeno utilizando una nucleasa especifica del sitio. Se introduce un polinucleótido donante a una célula huésped, en donde el polinucleótido comprende un ácido nucleico de interés (D) flanqueado por una primera región de homología (HR1) y una segunda región de homología (HR2) . HRl y HR2 comparten homología con las regiones 5' y 3', respectivamente, de un sitio genómico objetivo (TS) . Una nucleasa (N) específica del sitio que además se introduce a una célula huésped, en donde la nucleasa es capaz de reconocer y escindir una secuencia única dentro del sitio objetivo. Después de la inducción de un rompimiento de la doble hebra dentro del sitio objetivo por la nucleasa específica del sitio, la maquinaria de recombinación homóloga endógena integra el ácido nucleico de interés en el sitio objetivo escindido en una alta frecuencia cuando se compara con un sitio objetivo que no comprende un rompimiento de la doble hebra. Esto incrementa la frecuencia de integración que hace obvia la necesidad de co-integrar un marcador seleccionable para seleccionar transformantes que hayan experimentado un evento de recombinación. Al eliminar la necesidad de marcadores seleccionables, por ejemplo, durante la construcción de un microbio genomanipulado, el tiempo necesario para construir una cepa que comprende una ruta biosintética completa y funcional se reduce en gran medida. Además, las estrategias de genomanipulación no siempre se limitan por la necesidad de reciclar marcadores seleccionables debido a que son un depósito limitado de marcadores disponibles para un organismo huésped proporcionado .
En algunas modalidades, la recuperación sin marcadores de una célula transformada comprende un ácido nucleico exógeno integrado exitosamente aparece dentro de una frecuencia de alrededor de una de cada 1000, 900, 800, 700, 600, 500, 400, 300, 200 ó 100 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades particulares, la recuperación sin marcadores de una célula transformada que comprende un ácido nucleico exógeno integrado exitosamente aparece dentro de una frecuencia de alrededor de una de cada 90, 80, 70, 60, 50, 40, 30, 20, o 10 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades más particulares, la recuperación sin marcadores de una célula transformada que comprende un ácido nucleico exógeno integrado exitosamente aparece dentro de una frecuencia de alrededor de una de cada 9, 8, 7, 6, 5, 4, 3, o 2 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades más particulares, una célula huésped es una célula de levadura, y la frecuencia incrementada de integración deriva de la capacidad incrementada de la levadura para una recombinación homologa relativa a otros tipos de célula huésped.
Una diversidad de métodos está disponible para identificar aquellas células que tienen un genoma alterado en o cerca del sitio objetivo sin el uso de un marcador seleccionable . En algunas modalidades, se observan tales métodos para detectar cualquier cambio en el sitio objetivo, e incluyen pero no se limitan a Métodos PCR, métodos de secuenciación, digestión de nucleasa, por ejemplo, mapeo de restricción, transferencias Southern, y cualquier combinación de los mismos.
En otro aspecto, se proporciona en la presente un método para integrar una pluralidad de ácidos nucleicos exógenos en un genoma de la célula huésped, el método comprende : (a) poner en contacto una célula huésped con: (i) una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno (ES)X comprende una primera región de homología (H 1)X y una segunda región de homología (HR2)X/ en donde (HR1)X y (HR2)X son capaces de iniciar la recombinación homologa mediada por la célula huésped de (ES)X en un sitio objetivo (TS)X del genoma de una célula huésped; y (ii) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homóloga de (ES)x en (TS)x; y (b) recuperar una célula huésped en donde cada ácido nucleico exógeno seleccionado (ES)X se ha integrado en cada secuencia objetivo seleccionada (TS)X, en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
La FIGURA 2 proporciona una modalidad ejemplar de la integración genómica simultánea de una pluralidad de ácidos nucleicos exógenos utilizando una pluralidad de nucleasas específicas del sitio. En este ejemplo, se introducen tres polinucleótidos a una célula huésped, en donde cada polinucleótido comprende un ácido nucleico exógeno (ES)X que comprende un ácido nucleico (D)x de interés, en donde x=l, 2 ó 3. Cada (D)x se flanquea por una primera región de homología (HR1)X y una segunda región de homología (HR2)X. (HRl)x y (HR2)X comparten homología con las regiones 5' y 3', respectivamente, de un sitio objetivo seleccionado (TS)x, de un total de tres sitios objetivo únicos en el genoma. Una pluralidad de nucleasas (N)x específicas del sitio que además se introducen a una célula huésped, en donde cada (N)x es capaz de reconocer y escindir una secuencia única dentro de su sitio objetivo correspondiente, (TS)X. Después de la escisión de un sitio objetivo (TS)X por su nucleasa (N)x específica del sitio correspondiente, la maquinaria de recombinación homologa endógena facilita la integración de los ácidos nucleicos (D)x de interés correspondiente en (TS)X.
En modalidades particulares, cada ácido nucleico exógeno (ES)X, comprende opcionalmente un ácido nucleico (D)x de interés, se integra en su sitio genómico objetivo (TS)X respectivo de modo simultáneo, es decir, con una transformación simple de la célula huésped con la pluralidad de polinucleótidos de integración y la pluralidad de nucleasas. En algunas modalidades, los métodos son útiles de modo simultáneo para integrar cualquier pluralidad de ácidos nucleicos exógenos (ES)X, esto es, donde x es cualquier número entero de 1 a n en donde n es al menos 2 , de acuerdo con las variables mencionadas para el método descrito en lo anterior. En algunas modalidades, el método de integración simultánea que se proporciona en la presente es útil para integrar de modo simultáneo hasta 10 ácidos nucleicos exógenos (ES)xen 10 sitios objetivo seleccionados (TS)X, esto es, donde x es cualquier número entero de 1 a n en donde n= 2, 3, 4, 5, 6, 7, 8, 9, o 10. En algunas modalidades, el método dé integración simultánea que se proporciona en la presente es útil para integrar de modo simultáneo hasta 20 ácidos nucleicos exógenos (ES)X en 20 sitios objetivo seleccionados (TS)X) esto es, donde x es cualquier número entero de 1 a n en donde n= 2, 3, 4, 5, 6, 7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20. En algunas modalidades, n =2. En algunas modalidades, n = 3. En algunas modalidades, n = 4. En algunas modalidades, n = 5. En algunas modalidades, n = 6. En algunas modalidades, n = 7. En algunas modalidades, n = 8. En algunas modalidades, n = 9. En algunas modalidades, n = 10. En algunas modalidades, n = 11. En algunas modalidades, n = 12. En algunas modalidades, n = 13. En algunas modalidades, n = 14. En algunas modalidades, n = 15. En algunas modalidades, n = 16. En algunas modalidades, n = 17. En algunas modalidades, n = 18. En algunas modalidades, n = 19. En algunas modalidades, n = 20. En algunas modalidades, el método de integración simultánea que se proporciona en la presente es útil para integrar de modo simultáneo más de 20 ácidos nucleicos exógenos.
Como con la integración de un solo ácido nucleico exógeno en un solo sitio objetivo, la integración simultánea múltiple de una pluralidad de ácidos nucleicos exógenos aparece sustancialmente en una alta frecuencia cuando se compara para no poner en contacto los sitios objetivo con una nucleasa capaz de inducir un rompimiento de la doble hebra. En algunas modalidades, durante la integración simultánea de una pluralidad de ácidos nucleicos exógenos en múltiple lugares, es decir, en presencia de múltiples nucleasas, la frecuencia de integración en cualesquier lugares simples sustancialmente es alta comparada con la frecuencia de integración en el mismo lugar durante un solo evento de integración, es decir, en presencia de una nucleasa simple. Tal ventaja se demuestra en el Ejemplo 6 (Sección 7.5.2) a continuación. Sim limitarse por la teoría, se cree que la presencia y actividad de múltiples nucleasas, crea los rompimientos de las dobles hebras (DSB) en una pluralidad de sitios objetivo, que se enriquece por transformantes que reparan exitosamente las DSB al integrar el o los ADN donantes en el sitio de corte, y/o seleccionar contra transformantes incapaces de reparar los DSB. Puesto que los DSB son tóxicos para las células, se cree que un número incrementado de nucleasas se deja para más DSB, y de modo correspondiente, un enriquecimiento para las células es capaz de reparar los DSB a través de la integración de los ADN donantes mediada por HR.
En algunas modalidades, esta frecuencia incrementada de integración hace obvio el requerimiento para la co- integración de uno o más marcadores seleccionables para la identificación de la pluralidad de eventos de recombinación. En algunas modalidades, la recuperación sin marcadores de una célula transformada comprende una pluralidad de ácidos nucleicos exógenos integrados exitosamente aparece dentro de una frecuencia de alrededor de una de cada 1000, 900, 800, 700, 600, 500, 400, 300, 200 ó 100 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades particulares, la recuperación sin marcadores aparece dentro de una frecuencia de alrededor de una de cada 90, 80, 70, 60, 50, 40, 30, 20, o 10 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades más particulares, la recuperación sin marcadores aparece dentro de una frecuencia de alrededor de una de cada 9, 8, 7, 6, 5, 4, 3, o 2 células huésped en contacto, o seleccionada de poblaciones clónales de la misma. En modalidades más particulares, la célula huésped es una célula de levadura, y la frecuencia incrementada de integración deriva de la capacidad incrementada de la levadura para la recombinación homologa relativa a otros tipos de célula huésped. 6.2.1. Métodos para la Genomanipulación de Rutas Metabólicas Los métodos y composiciones descritos en la presente proporcionan ventajas particulares para construir organismos recombinantes que comprenden rutas biosintéticas optimizadas, por ejemplo, hacia la conversión de biomasa en biocombustibles , farmacéuticos o biomateriales . Se han construido exitosamente rutas biológicas funcionales no naturales en huéspedes microbianos para la producción de precursores para el medicamento antimalárico artemisinina (véase, por ejemplo, Martin efc al, Nat Biotechnol 21:796-802 (2003); combustibles y químicos derivados de ácidos grasos (por ejemplo, ásteres grasos, alcoholes y ceras grasos; véase, por ejemplo, Steen et al, Wature 463:559-562 (2010); combustibles y químicos derivados de haluros de metilo (véase, por ejemplo, Bayer et al, JAm Chem Soc 131:6508-6515 (2009) ; policétido sintasas que elaboran medicamentos para reducir el colesterol (véase, por ejemplo, Ma et al, Science 326:589-592 (2009); y policétidos (véase, por ejemplo, Kodumal, Proc Nati Acad Sci US A 101:1557315578 (2004).
Tradicionalmente, la genomanipulación metabólica, y en particular, la construcción de rutas biosintéticas, ha procedido en un modo en serie de uno a la vez por lo cual se han introducido los componentes de la ruta, es decir, integrados en un genoma de la célula huésped en un solo lugar a la vez. Los métodos de integración proporcionados en la presente pueden utilizarse para reducir el tiempo típicamente requerido para genomanipular una célula huésped, por ejemplo, una célula microbiana, que comprende una o más secuencias de nucleótidos heterólogos que codifican enzimas de una nueva ruta metabólica, es decir, una ruta metabólica que produce un metabolito que no se produce endógenamente por una célula huésped. En otras modalidades particulares, los métodos de integración proporcionados en la presente pueden utilizarse para genomanipular de modo eficiente una célula huésped que comprende una o más secuencias de nucleótidos heterólogos que codifican enzimas de una ruta metabólica que es endógena a una célula huésped, es decir, una ruta metabólica que produce un metabolito que se produce endógenamente por una célula huésped. En un ejemplo, una estrategia de diseño puede observarse al sustituir tres genes naturales de una célula huésped con una ruta exógena complementaria. Al modificar estos tres lugares exógenos utilizando el estado actual de la técnica requiere de tres transformaciones separadas. En contraste, los métodos de integración múltiple simultánea proporcionados en la presente permiten las tres integraciones para realizarse en una transformación simple, al reducir de este modo los redondeos de genomanipulación necesarios por tres veces. Por otra parte, los métodos permiten la conservación de ensambles de ADN, que comprenden componentes de ruta optimizados integrados en múltiples sitios en un armazón de célula huésped, para sitios análogos en un segundo armazón de célula huésped. Al reducir el número de redondeos necesarios para genomanipular un genotipo deseado, se incrementa sustancialmente el ritmo de construcción de rutas metabólicas . 6.2.1.1 Genomanxpulacion de la Ruta de Isoprenoides En algunas modalidades, los métodos proporcionados en la presente pueden utilizarse de modo simultáneo para introducir o remplazar uno o más componentes de una ruta biosintética para modificar el perfil del producto de una célula huésped genomanipulada . En algunas modalidades, la ruta biosintética es la ruta del isoprenoide.
Los terpenos son una gran clase de hidrocarburos que se producen en muchos organismos. Cuando los terpenos se modifican químicamente (por ejemplo, a través de la oxidación o redisposición del esqueleto de carbono) los compuestos resultantes en general se denominan como terpenoides, los cuales también se conocen como isoprenoides. Los isoprenoides juegan muchos papeles biológicos importantes, por ejemplo, como quinonas en cadenas de transporte de electrones, como componentes de membranas, en la prenilación de proteínas a través de la regulación y orientación subcelular, como pigmentos fotosintéticos que incluyen carotenoides , clorofila, como hormonas y cofactores, y como compuestos de defensa en plantas con diversos monoterpenos, sesquiterpenos, y diterpenos. Son industrialmente útiles como antibióticos, hormonas, fármacos anticáncer, insecticidas, y químicos.
Los terpenos se derivan por unidades de vinculación del isopreno (C5H8) , y se clasifican por el número de unidades presentes de isopreno. Los hemiterpenos consisten de una sola unidad de isopreno. El isopreno en sí mismo se considera el único hemiterpeno. Los monoterpenos se hacen de dos unidades de isopreno, y tienen la fórmula molecular Ci0H16. Ejemplos de monoterpenos son geraniol , limoneno, y terpineol . Los sesquiterpenos se componen de tres unidades de isopreno, y tienen la fórmula molecular Ci5H2 . Ejemplos de sesquiterpenos son los fámesenos y el farnesol. Los diterpenos se hacen de cuatro unidades de isopreno, y tienen la fórmula molecular C20H32. Ejemplos de diterpenos son cafestol, kahweol, cembreno, y taxadieno. Los sesterterpenos se hacen de cinco unidades de isopreno, y tienen la fórmula molecular C25H40. Un ejemplo de un sesterterpeno es geranilfarnesol . Los triterpenos consisten de seis unidades de isopreno, y tienen la fórmula molecular C30H8. Los tetraterpenos contienen ocho unidades de isopreno, y tienen la fórmula molecular C40H64. Los tetraterpenos biológicamente importantes incluyen el licopeno acíclico, el gamma-caroteno monocíclico, y los alfa- y beta-carotenos bicíclicos. Los politerpenos consisten de grandes cadenas de muchas unidades de isopreno. El caucho natural consiste de poliisopreno en el cual los dobles enlaces son cis.
Los terpenos se biosintetizan a través de condensaciones de pirofosfato de isopentenilo (difosfato de isopentenilo o IPP) y su isómero de pirofosfato de dimetilalilo (difosfato de dimetilalilo o DMAPP) . Las dos rutas se conocen para generar IPP y DMAPP, denominadas la ruta mevalonato-dependiente (MEV) de los eurcariontes (FIG. 3) , y la ruta mevalonato-independiente o desoxixilulosa-5-fosfato (DXP) de los procariotes . Las plantas utilizan ambas de la ruta MEV y la ruta DXP. IPP y DMAPP se condensan a la vez a difosfatos de poliprenilo (por ejemplo, disfosfato de geranilo o GPP, difosfato de farnesilo o FPP, y difosfato de geranilgeranilo o GGPP) a través de la acción de prenil difosfato sintasas (por ejemplo, GPP sintasa, FPP sintasa, y GGPP sintasa, respectivamente) . Los intermediarios del difosfato de poliprenilo se convierten por las terpeno sintasas a estructuras isoprenoides más complejas.
Las terpeno sintasas se organizan en grande familias génicas que forman múltiples productos. Ejemplos de terpeno sintasas incluyen monoterpeno sintasas, las cuales convierten GPP a monoterpenos ; diterpeno sintasas, las cuales convierten GGPP a diterpenos; y sesquiterpeno sintasas, las cuales convierten FPP a sesquiterpenos . Tjn ejemplo de una sesquiterpeno sintasa es farneseno sintasa, las cuales convierten FPP a farneseno. Las terpeno sintasas son importantes en la regulación del flujo de la ruta a un isoprenoide debido a que operan en puntos de tamificación metabólica y dictan el tipo de isoprenoide producido por una célula. Por otra parte, las terpeno sintasas mantienen la clave para la producción de alto rendimiento de tales terpenos . Como tal, una estrategia para mejorar el flujo de la ruta en huéspedes genomanipulados para la producción heteróloga de isoprenoides es introducir múltiples copias de ácidos nucleicos que codifican terpeno sintasas. Por ejemplo, en microbios genomanipulados que comprenden la ruta MEV donde si se desea la producción de sesquiterpenos tales como farneseno, se utiliza una sesquiterpeno sintasa, por ejemplo, una farneseno sintasa como la enzima terminal de la ruta, y múltiples copias génicas de farneseno sintasa pueden introducirse en una célula huésped hacia la generación de una cepa optimizada para la producción de farneseno.
Debido a que la biosíntesis de cualquier isoprenoide depende de los mismos componentes corriente arriba de la ruta de la disfosfato prenil sintasa y la terpeno sintasa, estos componentes de ruta, una vez genomanipulados en una cepa huésped "plataforma" , pueden utilizarse hacia la producción de cualquier sesquiterpeno, y la identidad del sesquiterpeno puede dictarse por la sesquiterpeno sintasa particular introducida en una célula huésped. Por otra parte, donde se desea que la producción de terpenos tenga diferentes unidades de isopreno, por ejemplo un monoterpeno en vez de un sesquiterpeno, ambas de la prenil difosfato sintasa y la terpeno sintasa pueden remplazarse para producir los diferentes terpenos mientras se utilizan todavía los componentes corriente arriba de la ruta.
En conseceuencia, los métodos y composiciones proporcionados en la presente pueden utilizarse para modificar de modo eficiente una célula huésped que comprende un isoprenoide que produce una ruta, por e emplo, la ruta MEV para producir un isoprenoide deseado. En algunas modalidades, pueden utilizarse una célula huésped que comprende la ruta MEV, y los métodos de integración simultánea múltiples proporcionados en la presente para introducir de modo simultáneo múltiples copias de una prenil difosfato sintasa y/o una terpeno sintasa para definir el perfil del producto de terpeno de una célula huésped. En algunas modalidades, la prenil difosfato sintasa es GPP sintasa y la terpeno sintasa es una monoterpeno sintasa. En algunas modalidades, la prenil difosfato sintasa is FPP sintasa y la terpeno sintasa es una sesquiterpeno sintasa. En algunas modalidades, la prenil difosfato sintasa es GGPP sintasa y la terpeno sintasa es una diterpeno sintasa. En otras modalidades, una célula huésped comprende la ruta MEV y una prenil difosfato sintasa y/o una terpeno sintasa para la producción de un primer tipo de terpeno, por ejemplo, farneseno, y los métodos de integración simultánea múltiples proporcionados en la presente pueden utilizarse de modo simultáneo para remplazar una o más copias de la prenil difosfato sintasa y/o una terpeno sintasa para producir un segundo tipo de terpeno, por ejemplo, amorfadieno. Estas modalidades se ejemplifican en los Ejemplos 3 y 4 a continuación. Los métodos proporcionados en la presente pueden utilizarse de modo similar hacia la construcción y/o modificación de cualquier ruta biosintética que utiliza múltiples copias de componentes de ruta, y se utilizan en particular para la genomanipulación de células huésped cuyos perfiles de producto pueden modificarse fácilmente con la adición o intercambio de copias múltiples de un solo componente de ruta. 6.2.1.2 Métodos para generar Bibliotecas de integración combinatoria Una vez que se construyen las rutas biosintéticas , los niveles de expresión de todos los componentes necesitan organizarse para optimizar el flujo metabólico y lograr altas titulaciones de producto. Procedimientos comunes para optimizar el flujo incluyen hacer variar identidad del componente génico de la ruta, la optimización de codón del gen, el uso de etiquetas de solubilidad, el uso de mutaciones truncadas o conocidas, y el contexto de expresión del gen (es decir, la selección del promotor y terminador) . Para probar esta variabilidad en el curso de construir una cepa utilizando métodos tradicionales requiere de generar y archivar un gran número impráctico de cepas. Por ejemplo, si se planea genomanipular una cepa para integrar constructos en tres lugares, y se han concebido 10 variantes para cada lugar, se necesitarían 1,000 cepas para generar para probar totalmente la diversidad combinatoria. Puesto que los genes de la ruta trabajan en conjunto, y no todos los metabolitos intermedios pueden seleccionarse fácilmente para, a menudo es imposible evaluar la contribución individual de los genes de la ruta después de cada ciclo de integración. De este modo, la cepa de genomanipulación de modo rutinario hace elecciones que limitan severamente el espacio de diseño que se prueba cuando se construye una ruta metabólica novedosa.
Para identificar mejor el diseño óptimo de la ruta, los métodos de modificación genómica proporcionados en la presente pueden utilizarse para generar cepas que comprenden bibliotecas combinatorias de constructos de integración diseñados racionalmente. tos métodos dependen de la introducción de una o más nucleasas y uno o más ensambles de ADN donante en la célula para facilitar la integración múltiple simultánea del ADN donante en ubicaciones especificadas en el genoma. Sin embargo, para generar una diversidad de cepas genomanipuladas , los métodos comprenden co-transformar una biblioteca de ADN donantes, es decir, una mezcla de constructos de integración para cada lugar dirigido, de modo que pueden generarse las bibliotecas de integración combinatoria de las cepas huésped (FIGURA 4) . La alta frecuencia lograda de integraciones múltiples significa que las cepas resultantes pueden seleccionarse directamente de modo razonado para el producto sin un control de calidad genómico extenso, y la identidad de las cepas superiores puede determinarse después de la selección, por ejemplo, mediante secuenciación. Este método elimina la carga de generación de la cepa individual, el control de calidad y archivado, y permite al ingeniero generar diversas combinaciones de integración en un solo tubo, y clasificar las cepas con mejor rendimiento seleccionando, por ejemplo, para el producto terminal de la ruta.
De este modo, en algunas modalidades, los métodos para integrar una pluralidad de ácidos nucleicos exógenos en un genoma de la célula huésped proporcionadas en la presente comprenden: (d) poner en contacto una célula huésped con: · (i) una pluralidad de bibliotecas, en donde cada biblioteca (L)x comprende una pluralidad de ácidos nucleicos exógenos, en donde un ácido nucleico exógeno seleccionado comprende, en una orientación de 5' a 3' , una primera región de homología (HR1) ) cualquier ácido nucleico de interés seleccionado del grupo (D)x, y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped del ácido nucleico exógeno seleccionado en un sitio objetivo (TS)X del genoma de una célula huésped; y (ii) para cada sitio objetivo (TS)X, una nucleasa (N)x es capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recómbinación homóloga del ácido nucleico exógeno seleccionado en (TS)X; y (e) recuperar una célula huésped en donde un ácido nucleico exógeno de cada biblioteca (L)x se ha integrado en cada secuencia objetivo seleccionada (TS)X, en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
Una representación esquemática de este método se proporciona en la FIGURA 4.
También se proporciona en la presente una célula huésped que comprende: (a) una pluralidad de bibliotecas, en donde cada biblioteca (L)x comprende una pluralidad de ácidos nucleicos exógenos, en donde un ácido nucleico exógeno seleccionado comprende, en una orientación de 5' a 3', una primera región de homología (HR1)X, cualquier ácido nucleico de interés seleccionado del grupo (D)x< y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped del ácido nucleico exógeno seleccionado en un sitio objetivo (TS)x del genoma de una célula huésped; y (b) para cada sitio objetivo (TS)X, una nucleasa (N)x es capaz de escindirse en (TS)Xí después de lo cual resulta en la escisión en la recombinación homologa del ácido nucleico exógeno seleccionado en (TS)X,- en donde x es cualquier número entero desde 1 a n en donde n es al menos 2.
En algunas modalidades, cada biblioteca (L)x comprende ácidos nucleicos exógenos que codifican enzimas de una ruta biosintética común. En algunas modalidades, el grupo (D)x comprende al menos 101, 102, 103 , 104 , 105, 106, o más de 10s ácidos nucleicos únicos de interés. En algunas modalidades, cada biblioteca (L)x comprende una pluralidad de ácidos nucleicos exógenos que codifican variantes de una enzima de una ruta biosintética. Como se utiliza en la presente, el término "variante" se refiere a una enzima de una ruta biosintética que se compara con una enzima seleccionada que tiene una secuencia diferente de nucleótidos o aminoácidos. Por ejemplo, en algunas modalidades, una biblioteca (L)x que comprende variantes de sesquiterpeno sintasa, y se compara con la versión de tipo silvestre de la sesquiterpeno sintasa seleccionada, la variante de sesquiterpeno sintasa puede comprender adiciones, supresiones, y/o sustituciones de nucleótidos que pueden o no resultar en cambios para la secuencia de aminoácidos correspondiente. En otras modalidades, la variante de enzima comprende adiciones, supresiones y/o sustituciones de aminoácidos relativas a una enzima de referencia, por ejemplo, la versión de tipo silvestre.
En algunas modalidades, la célula huésped de una o más secuencias de nucleótidos heterólogos codifica una o más enzimas de una ruta biosintética antes de ponerse en contacto. En algunas modalidades, se integran genómicamente una o más secuencias de nucleótidos heterólogos que codifica una o más enzimas de una ruta biosintética. 6.3 Polinucleótidos de integración De modo ventajoso, un polinucleótido de integración, es decir, un ADN donante, facilita la integración de uno o más constructos de ácido nucleico exógeno en un sitio objetivo seleccionado de un genoma de la célula huésped. En modalidades preferidas, un polinucleótido de integración comprende un ácido nucleico exógeno (ES)X que comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, y opcionalmente un ácido nucleico de interés colocado entre (HRl)xy (HR2)X. En algunas modalidades, el polinucleótido de integración es una molécula lineal de ADN. En otras modalidades, el polinucleótido de integración es una molécula circular de ADN.
El polinucleótido de integración puede generarse por cualquier técnica aparente para aquel con experiencia en la técnica. En ciertas modalidades, el polinucleótido de integración se genera utilizando la reacción en cadena de la polimerasa (PCR) y técnicas de clonación molecular bien conocidas en el arte. Véase, por ejemplo, PCR Technology: Principies and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989); Sambrook et al., 2001, Molecular Cloning-A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; PCR Technology: Principies and Applications for DNA Amplification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989) ; Patente de los Estados Unidos No. 8,110,360. 6.3.1. Secuencias de integración genómica En modalidades preferidas, un polinucleótido de integración comprende un ácido nucleico exógeno (ES)X que comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped en un sitio objetivo seleccionado (TS)X dentro del genoma de una célula huésped. Para integrar un ácido nucleico exógeno en el genoma por recombinación homologa, el polinucleótido de integración comprende de preferencia (HR1)X en un término y (HR2)X en el otro término. En algunas modalidades, (HR1)X es homologa para una región 5' del sitio genómico objetivo (TS)X seleccionado, y (HR2)X, es homóloga a una región 3' del sitio objetivo seleccionado (TS)X. En algunas modalidades, (HR1)X es alrededor de 70%, 75%, 80%, 85%, 90%, 95% o 100% homóloga a una región 5' del sitio genómico objetivo (TS)X seleccionado. En algunas modalidades, (HR2)X, es alrededor de 70%, 75%, 80%, 85%, 90%, 95% o 100% homóloga a una región 3' del sitio objetivo (TS)X seleccionado.
En ciertas modalidades, (HR1)X se coloca en 5' hacia un ácido nucleico (D)x de interés. En algunas modalidades, (HR1)X se coloca inmediatamente adyacente al extremo 5' de (D)x. En algunas modalidades, (HR1)X se coloca corriente arriba en 5' de (D)x. En ciertas modalidades, (HR2)X se coloca en 3' hacia un ácido nucleico (D)x de interés. En algunas modalidades, (HR2)X se coloca inmediatamente adyacente al extremo 3' de (D)x. En algunas modalidades, (HR2)X se coloca corriente abajo en 3' de (D)x.
Las propiedades que pueden afectar la integración de un polinucleótido de integración en un sitio genómico particular incluyen pero no se limitan a: las longitudes de las secuencias de integración genómica, la longitud general del constructo de ácidos nucleicos escindible, y la secuencia de nucleótidos o ubicación del lugar de integración genómica. Por ejemplo, la formación efectiva del heterodúplex entre una hebra de una secuencia de integración genómica y una hebra de un lugar particular en un genoma de la célula huésped puede depender de la longitud de la secuencia de integración genómica. Un intervalo efectivo para la longitud de una secuencia de integración genómica es de 50 a 5,000 nucleótidos. Para una discusión de longitudes efectivas de homología entre secuencias de integración genómica y lugares genómicos . Véase, Hasty efc al, Mol Cell Blol 11:5586-91 (1991) .
En algunas modalidades, (HR1)X y (HR2)X pueden comprender cualquier secuencia de nucleótidos de longitud suficiente e identidad de secuencia que se permita para la integración genómica del ácido nucleico exógeno (ES)X en cualquier lugar genómico de la levadura. En ciertas modalidades, cada de (HR1) y (HR2)X consiste independientemente de alrededor de 50 a 5,000 nucleótidos. En ciertas modalidades, cada una de (HR1)X y (HR2)X consiste independientemente de alrededor de 100 a 2,500 nucleótidos. En ciertas modalidades, cada una de (HR1)X y (HR2)X consiste independientemente de alrededor de 100 a 1,000 nucleótidos. En ciertas modalidades, cada una de (HR1)X y (HR2)X consiste independientemente de alrededor de 250 a 750 nucleótidos. En ciertas modalidades, cada una de (HR1)X y (HR2)X consiste independientemente de alrededor de 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900 ó 5,000 nucleótidos . En algunas modalidades, cada una de (HR1)X y (HR2)X consiste independientemente de alrededor de 500 nucleótidos. 6.3.2. Acidos nucleicos de interés En algunas modalidades, el polinucleótido de integración además comprende un ácido nucleico (D)x de interés. El ácido nucleico de interés puede ser cualquier segmento de ADN considerado útil por aquel con experiencia en la técnica. Por ejemplo, el segmento de ADN puede comprender un gen de interés que puede "eliminarse en" para un genoma huésped. En otras modalidades, el segmento de ADN funciona como un constructo de "eliminación" que es capaz de alterar específicamente un gen objetivo después de la integración del constructo en el sitio objetivo del genoma de una célula huésped, haciendo así al gen alterado no funcional. Ejemplos útiles de un ácido nucleico (D)x de interés incluyen pero no se limitan a: una secuencia de codificación de proteína, gen reportero, secuencia de codificación de marcador fluorescente, promotor, mejorador, terminador, activador de la transcripción, represor de la transcripción, sitio de unión al activador de la transcripción, sitio de unión al represor de la transcripción, intrón, exón, cola de poli-A, sitio de clonación múltiple, señal de ubicación nuclear, señal de estabilización de AR m, lugar de integración, secuencia de codificación del epítopo marcador, señal de degradación, o cualquier otra molécula de ADN de origen natural o sintética. En algunas modalidades, (D)x puede ser de origen natural. Alternativamente, (D)x puede ser completamente de origen sintético, producirse in vitro. Además, (D)x puede comprender cualquier combinación de moléculas de ADN aisladas de origen natural, o cualquier combinación de una molécula de ADN aislada de origen natural y una molécula de ADN sintético. Por ejemplo, (D)x puede comprender un promotor heterólogo enlazado operativamente a una secuencia de codificación de proteína, una secuencia de codificación de proteína enlazada a una cola de poli-A, una secuencia de codificación de proteína enlazada dentro del marco con una secuencia de codificación de epítopo marcador, y similares. El ácido nucleico (D)x de interés puede obtenerse mediante procedimientos estándares de ADN clonado conocidos en la técnica (por ejemplo, . una "biblioteca" de ADN) , mediante síntesis química, por clonación de ADNc, o por la clonación de ADN genómico, o fragmentos de los mismos, purificado desde la célula deseada, o mediante amplificación y clonación por PCR. Véase, por ejemplo, Sambrook et al, Molecular Cloning, A Laboratory Manual, 3d. ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001) ; Glover, D.M. (ed.), DNA Cloning: A Practical Approach, 2d. ed. , MRL Press, Ltd., Oxford, U.K. (1995).
En modalidades particulares, el ácido nucleico (D)x de interés no comprende ácidos nucleicos que codifican un marcador seleccionable . En estas modalidades, se permite la alta eficiencia de integración proporcionada por los métodos descritos en la presente para la selección e identificación de los eventos de integración sin el requerimiento para el crecimiento de las células transformadas en el medio de selección. Sin embargo, en otras modalidades donde el crecimiento en el medio selectivo no obstante, se desea, el ácido nucleico (D)x de interés puede comprender un marcador seleccionable que puede utilizarse para seleccionar la integración del ácido nucleico exógeno en un genoma huésped.
Se conocen en la técnica una amplia variedad de marcadores seleccionables (véase, por ejemplo, Kaufman, Meth. Enzymol., 185:487 (1990); Kaufman, Meth. Enzymol . , 185:537 (1990); Srivastava and Schlessinger, Gene, 103:53 (1991); Romanos et al, in DNA Cloning 2: Expression Systems, 2nd Edition, pages 123-167 (IRL Press 1995); Markie, Methods Mol. Biol, 54:359 (1996); Pfeifer et al, Gene, 188:183 (1997); Tucker and Burke, Gene, 199:25 (1997); Hashida-Okado et al, FEBS Letters, 425:117 (1998)). En algunas modalidades, el marcador seleccionable es un marcador resistente al fármaco. Un marcador resistente al fármaco permite células para desintoxicar un fármaco exógeno que por otra parte pudiera exterminar una célula. Ejemplos ilustrativos de marcadores resistentes a fármacos incluyen pero no se limitan a aquellos que confieren resistencia a antibióticos tales como ampicilina, tetraciclina, kanamicina, bleomicina, estreptomicina, higromicina, neomicina, Zeocin™, y similares. En otras modalidades, el marcador seleccionable es un marcador auxotrofico. Un marcador auxotrofico permite a las células que sinteticen un componente esencial (usualmente un aminoácido) mientras crece en un medio que carece de este componente esencial. Las Secuencias génicas auxotróficas seleccionables incluyen, por ejemplo, hisD, que permite el crecimiento en un medio libre de histidina en presencia de histidinol. Otros marcadores seleccionables incluyen a un gen de resistencia a bleomicina, un gen de metalotioneína, un gen de higromicina B-fosfotransferasa, el gen AURI, un ge de adenosina deaminasa, un gen de aminoglicósido fosfotransferasa, un gen de dihidrofolato reductasa, un gen de timidina cinasa, un gen de xantina-guanina fosforribosiltransferasa, y similares. En otras modalidades, el marcador seleccionable es un marcador diferente de uno que rescata una mutación auxotrófica. Por ejemplo, una cepa de célula huésped puede comprender mutaciones diferentes de las mutaciones auxotróficas, por ejemplo, mutaciones que no son letales para el huésped y que tampoco provocan efectos adversos en el uso pretendido para la cepa, por ejemplo, fermentación industrial, siempre que las mutaciones puedan identificarse por un método de selección conocido.
Los transformantes de célula huésped que comprenden un polinucleótido cromosómicamente integrado también pueden identificarse al seleccionar transformantes de célula huésped que muestran otros rasgos codificados por segmentos de ADN individuales o por combinaciones de segmentos de ADN, por ejemplo, expresión de péptidos que emiten luz, o por análisis molecular de colonias de células huésped individuales, por ejemplo, por mapeo de enzimas de restricción, amplificación PCR, o análisis de secuencia de polinucleótidos ensamblados aislados o sitios de integración cromosómica. 6.4 Nucleasas En algunas modalidades de los métodos descritos en la presente, un genoma de la célula huésped se pone en contacto con una o más nucleasas capaces de escindirse, es decir, provocando un rompimiento de la doble hebra en una región designada dentro de un sitio objetivo seleccionado. En algunas modalidades, un agente que induce un rompimiento de la doble hebra es cualquier agente que reconoce y/o se une a una secuencia específica de reconocimiento de polinucleótido para producir un rompimiento en o cerca de la secuencia de reconocimiento. Ejemplos de agentes que inducen el rompimiento de la doble hebra incluyen, pero no se limitan a, endonucleasas, recombinasas específicas del sitio, transposasas, topoisomerasas , y nucleasas de dedos de zinc, e incluyen derivados modificados, variantes, y fragmentos de los mismos .
En algunas modalidades, cada una de una o más nucleasas es capaz de provocar un rompimiento de la doble hebra en una región designada dentro de un sitio objetivo seleccionado (TS)X. En algunas modalidades, la nucleasa es capaz de provocar un rompimiento de la doble hebra en una región colocada entre las regiones 5' y 3' regiones de (TS)X con las cuales (HR1)X y (HR2)X comparten homología, respectivamente. En otras modalidades, la nucleasa es capaz de provocar un rompimiento de la doble hebra en una región corriente arriba o corriente abajo de las regiones 5' y 3' de (TS)x.
Una secuencia de reconocimiento es cualquier secuencia de polinucleótidos que se reconoce específicamente y/o se enlaza por un agente que induce el rompimiento de la doble hebra. La longitud de la secuencia del sitio de reconocimiento puede variar, e incluye, por ejemplo, secuencias que son al menos de 10, 12, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 o más nucleótidos de longitud.
En algunas modalidades, la secuencia de reconocimiento es palindrómica, esto es, la secuencia en una hebra se lee igual en dirección opuesta de la hebra complementaria. En algunas modalidades, la muesca/sitio de escisión se encuentra dentro de la secuencia de reconocimiento. En otras modalidades, la muesca/sitio de escisión se encuentra fuera de la secuencia de reconocimiento. En algunas modalidades, la escisión produce una terminación de extremo obstruido. En otras modalidades, la escisión produce sobresalientes de una sola hebra, es decir, "extremos adherentes , " los cuales pueden ser ya sea 5' sobresalientes, o 3' sobresalientes.
En algunas modalidades, la . secuencia de reconocimiento dentro del sitio objetivo seleccionado puede ser endógena o exógena al genoma de la célula huésped. Cuando el sitio de reconocimiento es una secuencia endógena, puede ser una secuencia de reconocimiento reconocida por un agente que induce el rompimiento de la doble hebra de origen natural o nativo. Alternativamente, podría reconocerse y/o enlazarse un sitio de reconocimiento endógeno por un agente que induce el rompimiento de la doble hebra modificado o genomanipulado, diseñado o seleccionado para reconocer específicamente la secuencia de reconocimiento endógena para producir un rompimiento de la doble hebra. En algunas modalidades, el agente modificado que induce el rompimiento de la doble hebra se deriva de un agente que induce el rompimiento de la doble hebra natural, de origen natural. En otras modalidades, el agente modificado que induce el rompimiento de la doble hebra se crea o sintetiza artificialmente. Métodos para seleccionar tales agentes modificados o diseñados que inducen . el rompimiento de la doble hebra se conocen en la técnica. Por ejemplo, variantes de la o las proteínas de la secuencia de aminoácidos pueden prepararse por mutaciones en el ADN. Métodos para mutagénesis y alteraciones en la secuencia de nucleótidos incluyen, por ejemplo, Kunkel, (1985) Proc Nati Acad Sci USA 82:488-92; Kunkel, et al, (1987) et Enzymol 154:367-82; Patente de los Estados Unidos No. 4,873,192; alker and Gaastra, eds . (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York) y las referencias citadas en la presente, ka directriz con respecto a las sustituciones de aminoácidos probablemente no afectan la actividad biológica de la proteína que se encuentra, por ejemplo, en el modelo de Dayhoff, et al, (1978) Atlas of Protein Sequence and Structure (Nati Biomed Res Found, Washington, D.C.). Pueden preferirse sustituciones conservadoras, tales como intercambiar un aminoácido con otro que tiene propiedades similares. No se espera que las supresiones conservadoras, inserciones, y sustituciones de aminoácidos produzcan cambios radicales en las características de la proteína, y el efecto de cualquier sustitución, supresión, inserción, o combinación de los mismos puede evaluarse por ensayos de selección de rutina. Se conocen los ensayos para inducir la actividad de rompimiento de la doble hebra y generalmente miden la actividad general y especificidad del agente en sustratos de ADN que contienen sitios de reconocimiento.
En algunas modalidades de los métodos proporcionados en la presente, una o más de las nucleasas es una endonucleasa . Las endonucleasas son enzimas que escinden el enlace fosfodiéster dentro de una cadena de polinucleótido, e incluyen endonucleasas de restricción que escinden el ADN como sitios específicos sin dañar las bases. Las endonucleasas de restricción incluyen endonucleasas de Tipo I, Tipo II, Tipo III, y Tipo IV, las cuales además incluyen subtipos. Las endonucleasas de restricción se describen y clasifican además, por ejemplo en la base de datos REBASE (página web en rebase . ne . com; Roberts, et al., (2003) Nucleic Acids Res 31:418-20), Roberts, et al., (2003) Nucleic Acids Res 31:1805-12, and Belfort, et al, (2002) en Mobile DNA II, pp . 761-783, Eds . Craigie, et al, ASM Press, Washington, D.C.
Como se utiliza en la presente, las endonucleasas también incluyen endonucleasas de base, que al igual que las endonucleasas de restricción, se unen y se cortan en una secuencia de reconocimiento específica. Sin embargo, los sitios de reconocimiento para endonucleasas de base típicamente son más largos, por ejemplo, alrededor de 18 pb o más. Las endonucleasas de base, también conocidas como meganucleasas, se han clasificado en las siguientes familias basadas en motivos de secuencia conservados: una endonucleasa de base de LAGLIDADG (SEQ ID NO: 50) , una endonucleasa de base de HNH, una endonucleasa de base en bloque de His-Cys, una endonucleasa de base de GIY-YIG (SEQ ID NO: 51) , y una endonucleasa de base cianobacteriana. Véase, por ejemplo, Stoddard, Ouarterly Review ofBiophysics 38(1): 49-95 (2006). Estas familias difieren en gran medida en sus motivos nucleares activos en el sitio de la nucleasa conservada y mecanismos catalíticos, distribuciones genómicas y biológicas, y amplia relación con los sistemas de nucleasa que no son de base. Véase, por ejemplo, Guhan and Muniyappa (2003) Crit Rev Biochem Mol Biol 38:199-248; Lucas, et al., (2001) Nucleic Acids Res 29:960-9; Jurica and Stoddard, (1999) Cell Mol Life Sci 55:1304-26; Stoddard, (2006) 0 Rev Biophys 38:49-95; y Moure, et al, (2002) Nat Struct Biol 9:764. Ejemplos de endonucleasas de base específicas útiles de estas familias incluyen, pero no se limitan a: I-Creí (véase, Rochaix et al, Nucleic Acids Res. 13: 975-984 (1985), I-Msol (véase, Lucas et al, Nucleic Acids Res. 29: 960-969 (2001), I-Scel (véase, Foury et al, FEBS Lett. 440: 325-331 (1998), I-SceIV (véase, Moran etal, Nucleic Acids Res. 20: 4069-4076 (1992) , H-Drei (véase, Chevalier et al, Mol. Cell 10: 895-905 (2002), I-Hmul (véase, Goodrich-Blair et al, Cell 63: 417-424 (1990); Goodrich-Blair etal, Cell 84: 211-221 (1996), I-Ppol (véase, Muscarella et al, Mol. Cell. Biol. 10: 3386-3396 (1990), I-DirI (véase, Johansen et al, Cell 76: 725-734 (1994); Johansen, Nucleic Acids Res. 21: 4405 (1993), I-Njal (véase, Elde et al, Eur. J. Biochem. 259: 281-288 (1999); De Jonckheere etal, J. Eukaryot. Microbiol . 41: 457-463 (1994), I-NanI (véase, Elde et al, S. Bur. J. Biochem. 259: 281-288 (1999); De Jonckheere et al., J. Eukaryot. Microbiol. 41: 457-463 (1994)), I-Nitl (véase, De Jonckheere et al.,J. Eukaryot. Microbiol. 41: 457-463 (1994); Elde et al, Eur. J. Biochem. 259: 281-288 (1999), I-TevI (véase, Chu et al, Cell 45: 157-166 (1986), I-TevII (véase, Tomaschewski et al, Nucleic Acids Res. 15: 3632-3633 (1987), I-TevIII (véase, Eddy et al, Genes Dev. 5: 1032-1041 (1991), F-TevI (véase, Fujisawa et al, Nucleic Acids Res. 13: 7473-7481 (1985), F-TevII (véase, Kadyrov et al, Dokl Biochem. 339: 145-147 (1994); Kaliman, Nucleic Acids Res. 18: 4277 (1990), F-Cphl (véase, Zeng et al, Curr. Biol. 19: 218-222 (2009), PI-Mgal (véase, Saves et al, Nucleic Acids Res. 29:4310-4318 (2001) , I-Csml (véase, Colleaux et al, Mol. Gen. Genet. 223:288-296 (1990), I-Ceul (véase, Turmel et al, J.Mol. Biol. 218: 293-311 (1991) and Pi-Scel (véase, Hirata et al.,.J. Biol. Chem. 265: 6726-6733 (1990) .
En algunas modalidades de los métodos descritos en la presente, se utiliza una variante de origen natural, y/o derivado diseñado de una endonucleasa de base. Se conocen métodos para modificar la cinética, interacciones de cofactor, expresión, condiciones óptimas, y/o especificidad del sitio de reconocimiento, y seleccionar la actividad. Véase, por ejemplo, Epinat, et al, (2003) Nucleic Acids Res 31:2952-62; Chevalier, et al, (2002) Mol Cell 10:895-905; Gimble, et al, (2003) Mol Biol 334:993-1008; Seligman, et al, (2002) Nucleic Acids Res 30:3870-9; Sussman, et al, (2004; J Mol Biol 342:31-41; Rosen, et al, (2006) Nucleic Acids Res 34:4791-800; Chames, et al, (2005) Nucleic Acids Res 33:el78; Smith, et al, (2006) Nucleic Acids Res 34:el49; Gruen, et al, (2002) Nucleic Acids Res 30:e29; Chen and Zhao, (2005) Nucleic Acids Res 33:el54; WO2005105989 ; WO2003078619 ; WO2006097854; WO2006097853 ; O200609778 ; y WO2004031346. Las endonucleasas de base útiles también incluyen aquellas descritas en WO04/067736 ; WO04/067753; WO06/097784 ; O06/097853; WO06/097854 ; 007/034262; WO07/049095; WO07/049156; WO07/057781; O07/060495 ; WO08/152524; WO09/001159; WO09/095742; WO09/095793 ; WO10/001189 ; WOlO/015899; y WOlO/046786.
Cualquier endonucleasa de base puede utilizarse como un agente que ^induce el rompimiento de la doble hebra que incluye, pero no se limita a: H-Drel, I-Scel, I-SceII, I-SceIII; I-ScelV, I-SceV, I-SceVI, I-SceVII, I-Ceul, I-CeuAIIP, I-Creí, I-CrepsbIP, I-CrepsbIIP, 1-CrepsbIIIP, I-CrepsbIVP, I-Tlil, I-Ppol, Pi-PspI, F-Scel, F-SceII, F-SuvI, F-Cphl, F-TevI, F-TevII, I-Amal, I-Anil, I-ChuI, I-Cmoel, I-Cpal, ?-CpaII, I-Csml, I-Cvul, I-CvuAIP, I-Ddil, ?-DdiII, I-DirI, I-Dmol, I-Hmul, I-HmuII, I-HsNIP, I-Llal, I-Msol, I-Naal, I-NanI, I-NclIP, I-NgrIP, I-Nitl, I-Njal, I-Nsp236IP, I-Pakl, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PoblP, I-Porl, 1-PorlIP, I-PpblP, I-SpBetalP, I-Scal, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031 , 1-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3pb, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, ?-ZbiIP, PI-Mgal, PI-Mtul, PI-MtuHIP PI-MtuHIIP, Pl-Pful, Pl-PfuII, Pl-Pkol, Pl-PkoII, PI-Rma43812IP, PI-SpBetaIP, Pl-Scel, PI-TfuI, PI-TfuII, PI-Thyl, PI-Tlil, o ??-TliII, o cualquier variante o derivado de la misma.
En algunas modalidades, la endonucleasa se une a una secuencia de reconocimiento natural o endógena. En otras modalidades, la endonucleasa es una endonucleasa modificada que se une a una secuencia de reconocimiento exógena o no natural y no se une a una secuencia de reconocimiento natural o endógena .
En algunas modalidades de los métodos proporcionados en la presente, una o más de las nucleasas es una proteína de fusión del dominio de nucleasa (TALEN) unida al ADN efector de TAL. Los efectores TAL de bacterias patógenas en plantas del género Xanthomonas juegan papeles importantes en la enfermedad, o disparo de defensa, al unirse al ADN del huésped y activar los genes del huésped específico del efector, véase, por ejemplo, Gu et al. (2005) iVatujre 435:1122-5; Yang et al, (2006) Proc. Nati Acad. Sci. USA 103:10503-8; Kay et al, (2007) Science 318:648-51; Sugio' et al, (2007) Proc. Nati Acad. Sci. USA 104:107205; Romer et al, (2007) Science 318:645-8; Boch et al, (2009) Science 326 (5959) :1509-12; y Moscou and Bogdanove, (2009) 326(5959): 1501. Un efector TAL comprende un dominio de unión al ADN que interactúa con el ADN de una manera de secuencia específica a través de uno o más dominios de repetición en tándem. La secuencia repetida típicamente comprende 34 aminoácidos, y las repeticiones típicamente son 91-100% homologas entre sí. El polimorfismo de las repeticiones usualmente se ubica en las posiciones 12 y 13, y estas aparecen para tener una correspondencia de uno a uno entre la identidad de diresiduos variables de repetición en las posiciones 12 y 13 con la identidad de los nucleótidos contiguos en la secuencia objetivo del efector de TAL.
El dominio de unión al ADN efector de TAL puede genomanipularse para unirse a una secuencia objetivo deseada, y fusionarse a un dominio de nucleasa, por ejemplo, desde una endonucleasa de restricción tipo II, típicamente un dominio de escisión no específico desde una endonucleasa de restricción tipo II tal como Fokl (véase por ejemplo, Kim et al. (1996) Proc. Nati. Acad. Sci. USA 93:1156-1160). Otras endonucleasas útiles pueden incluir, por ejemplo, Hhal, HindIII, Nod, BbvCI, EcoRI, Bgll, y Alwl . De este modo, en modalidades preferidas, el TALEN comprende un Dominio efector de TAL que comprende una pluralidad de Secuencias de repetición efectoras de TAL que, en combinación, se unen a una secuencia específica de nucleótidos en la secuencia de ADN objetivo, tal que el TALEN que se escinde del ADN objetivo dentro o adyacente a la secuencia específica de nucleótidos. Los TALEN útiles para los métodos proporcionados en la presente incluyen aquellos descritos en WO10/079430 y el la Publicación de la Solicitud de Patente de los Estados Unidos No. 2011/0145940.
En algunas modalidades, el dominio efector de TAL que se une a una secuencia específica de nucleótidos dentro del ADN objetivo puede comprender 10 o más repeticiones de unión al ADN, y de preferencia 15 o más repeticiones de unión al ADN. En algunas modalidades, cada repetición de unión al ADN comprende un di-residuo variable de repetición (RVD) que determina el reconocimiento de un par de bases en la secuencia de ADN objetivo, en donde cada Repetición de unión al ADN es responsable de reconocer un par de bases en la secuencia de ADN objetivo, y en donde el RVD comprende uno o más de: HD para reconocer . C; NG para reconocer T; NI para reconocer A; NN para reconocer G o A; NS para reconocer A o C o G o T; N* para reconocer C o T, donde * representa un hueco en la segunda posición del RVD; HG para reconocer T; H* para reconocer T, donde * representa un hueco en la segunda posición del RVD; IG para reconocer T; NK para reconocer G; HA para reconocer C; ND para reconocer C; HI para reconocer C; HN para reconocer G; NA para reconocer G; SN para reconocer G o A; e YG para reconocer T.
En algunas modalidades de los métodos proporcionados en la presente, una o más de las nucleasas es una recombinasa específica del sitio. Una recombinasa específica del sitio, denominada además como una recombinasa, es un polipéptido que cataliza la recombinación conservadora específica en el sitio entre sus sitios de recombinación compatibles, e incluye polipéptidos naturales así como derivados, variantes y/o fragmentos que retienen actividad, y polinucleótidos naturales, derivados, variantes, y/o fragmentos que codifican una recombinasa que retiene actividad. Para revisiones de recombinasas específicas del sitio y sus sitios de reconocimiento, véase, Sauer (1994) Curr Op Biotechnol 5:521-7; y Sadowski, (1993) FASEB 7:760-7. En algunas modalidades, la recombinasa es una serina recombinasa o una tirosina recombinasa. En algunas modalidades, la recombinasa es de las familias Integrasa o Resolvasa. En algunas modalidades, la recombinasa es una integrasa seleccionada del grupo que consiste de FLP, Cre, lambda integrasa, y R. para otros miembros de la familia Integrasa, véase por ejemplo, Esposito, et al, (1997) Nucleic Acids Res 25:3605-14 and Abremski , et al, (1992) Protein Eng 5:87-91. Se conocen métodos para modificar la cinética, interacción del cof ctor y requerimientos, expresión, condiciones óptimas, y/o especificidad del sitio de reconocimiento y seleccionar para la actividad de recombinasas y variantes, véase por ejemplo Miller, et al, (1980) Cell 20:721-9; Lange -Gustafson y Nash, (1984) JBiol Chem 259:12724-32; Christ, et al, (1998) J Mol Biol 288:825-36; Lorbach, et al, (2000) J Mol Biol 296:1175-81; Vergunst, et al, (2000) Science 290:979-82; Dorgai, et al, (1995) J Mol Biol 252:178-88; Dorgai, et al, (1998) J Mol Biol 277:1059-70; Yagu, et al, (1995) J Mol Biol 252:163-7; Sclimente, et al, (2001) Nucleic Acids Res 29:5044-51; Santoro and Schultze, (2002) Proc Nati Acad Sci USA 99:4185-90; Buchholz and Stewart, (2001) Nat Biotechnol 19:1047-52; Voziyanov, et al, (2002) Nucleic Acids Res 30:1656-63; Voziyanov, et al, (2003) J Mol Biol 326:65-76; Klippel, et al, (1988) EMBOJ 7:3983-9; Arnold, et al, (1999) EMBOJ 18:1407-14; WO03/08045; WO99/25840; y W099/25841. El intervalo de sitios de reconocimiento alrededor de 30 sitios mínimos de nucleótidos para unos pocos cientos de nucleótidos. Puede utilizarse cualquier sitio de reconocimiento para una recombinasa, que incluye sitios de origen natural, y variantes. Se conocen los sitios de reconocimiento variantes, véase por ejemplo, Hoess, et al, (1986) Nucleic Acids Res 14:2287-300; Albert, et al, (1995) Plant J 7:649-59; Thomson, et al, (2003) Génesis 36:162-7; Huang, et al, (1991) Nucleic Acids Res 19:443-8; Siebler and Bode, (1997) Biochemistry 36:1740-7; Schlake and Bode, (1994) Biochemistry 33:12746-51; Thygarajan, et al, (2001) Mol Cell Biol 21:392634; Umlauf and Cox, (1988) EMBO J7: 1845-52; Lee and Saito, (1998) Gene 216:55-65; WO01/23545; W099/25821; W099/25851; WOOl/11058; WO01/07572 y Patente de los Estados Unidos No. 5,888,732.
En algunas modalidades de los métodos proporcionados en la presente, una o más de las nucleasas es una transposasa. Las transposasas son polipéptidos que median la transposición de un transposón desde una ubicación del genoma a otro. Las transposasas típicamente inducen rompimientos de la doble hebra para escindir el transposón, reconocer las repeticiones subterminales , y unirse juntas a los extremos del transposón escindido, en algunos sistemas también se requieren otras proteínas para unirse a los extremos durante la transposición. Ejemplos de transposones y transposasas incluyen, pero no se limitan a, los elementos de maíz Ac/Ds, Dt/rdt, Mu-Ml/Mn, y Spm (En) /dSpm, los elementos Tam de boca de dragón, el transposón Mu de bacteriófago, transposones (Tn) bacterianos y secuencias de inserción (IS) , elementos Ty de levadura (retrotransposón) , elementos Tal de Arabidopsis (retrotransposón) , el elemento P transposón de Drosophila (Gloor, et al., (1991) Science 253:1110-1117), los elementos Copia, Mariner y Minos de Drosophila, los elementos Hermes de la mosca doméstica, los elementos PiggyBack de Trichplusia ni, elementos Tcl "de C. elegans, y elementos IAP de ratones (retrotransposón) .
En algunas modalidades de los métodos proporcionados en la presente, una o más de las nucleasas es una nucleasa de dedo de zinc (ZFN) . Las ZFN son agentes diseñados que inducen el rompimiento de la doble hebras comprendidos de un dominio de unión al ADN del dedo de zinc y un dominio del agente que induce el rompimiento de la doble hebra. Los ZFN diseñados consisten de dos disposiciones de dedeos de zinc (ZFA) , cada una de las cuales se fusiona a una subunidad simple de una endonucleasa no específica, tal como el dominio de nucleasa de la enzima Fokl , que se vuelve activa después de la dimerización. Típicamente, un ZFA simple consiste de 3 ó 4 dominios de dedos de zinc, cada uno de los cuales se diseña para reconocer un triplete específico de nucleótido (GGC, GAT, etc.). De este modo, los ZFN compuestos de dos ZFA "de 3 dedos" son capaces de reconocer un sitio objetivo de 18 pares de bases; una secuencia de reconocimiento de 18 pares de bases es generalmente única, incluso dentro de genomas grandes tales como aquellos de humanos y plantas . Al dirigir la co-ubicación y dimerización de dos monómeros de nucleasa Fokl, los ZFN generan una endonucleasa funcional específica del sitio que crea un rompimiento de la doble hebra (DSB) en el ADN en el lugar objetivo.
Las nucleasas de dedo de zinc útiles incluyen aquellas que se conocen y aquellas que se diseñan para tener especificidad para uno o más sitios objetivo (TS) descritos en la presente. Los dominios de dedos de zinc son susceptibles para diseñar polipéptidos que se unen específicamente a una secuencia de reconocimiento de polinucleótido seleccionada, por ejemplo, dentro del sitio objetivo del genoma de una célula huésped. Los FN consisten de un dominio de dedos de zinc enlazando al ADN genomanipulado unido a un dominio de endonucleasa no específico, por ejemplo un dominio de nucleasa del Tipo endonucleasa lis tal como HO o Fokl. Alternativamente, los dominios de unión al ADN de los dedos de zinc genomanipulados pueden fusionarse a otros agentes que inducen el rompimiento de la doble hebra o derivados de los mismos que retienen la actividad de muescado/escisión del ADN. Por ejemplo, este tipo de fusión puede utilizarse para dirigir al agente que induce el rompimiento de la doble hebra a un sitio objetivo diferente, para alterar la ubicación de la muesca o sitio de escisión, para dirigir al agente de inducción a un sitio objetivo más corto, o para dirigir al agente de inducción a un sitio objetivo más largo. En algunos ejemplos, un dominio de unión al ADN de un dedo de zinc se fusiona a una recombinasa específica del sitio, transposasa, o un derivado del mismo que retiene la actividad de muescado y/o escisión del ADN. Pueden fusionarse funcionalidades adicionales al dominio de unión al dedo de zinc, que incluyen dominios activadores de la transcripción, dominios represores de la transcripción, y metilasas. En algunas modalidades, la dimerización del dominio de nucleasa se requiere para la actividad de escisión.
Cada dedo de zinc reconoce tres pares de bases consecutivas en el ADN dirigido. Por ejemplo, un dominio 3 de dedo reconoce una secuencia de 9 nucleótidos contiguos, con un requerimiento de dimerización de la nucleasa, se utilizan dos series de tripletes de dedos de zinc para unir una secuencia de reconocimiento de 18 nucleótidos. Los módulos útiles de diseño de dedos de zinc incluyen aquellos que reconocen diversos tripletes de GNN y ANN (Dreier, et al, (2001) J Biol Chem 276:29466-78; Dreier, et al, (2000) J Mol Biol 303:489-502; Liu, et al , (2002) J Biol Chem 277:3850-6), así como aquellos que reconocen diversos tripletes de CNN o TNN (Dreier, et al, (2005) J Biol Chem 280:35588-97; Jamieson, et al, (2003) iVature Rev Drug Discov 2:361-8). Véase también, Durai, et al, (2005) Nucleic Acids Res 33:5978-90; Segal, (2002) Methods 26:76-83; Porteus and Carroll, (2005) Nat Biotechnol 23:967-73; Pabo, et al, (2001) Ann Rev Biochem 70:313-40; Wolfe, et al, (2000) Ann Rev Biophys Biomol Struct 29:183-212; Segal and Barbas, (2001) Curr Opln Biotechnol 12:632-7; Segal, et al, (2003) Biochemistry 42:2137-48; Beerli and Barbas, (2002) Nat Biotechnol 20:135-41; Carroll, et al, (2006) iVature Protocols 1:1329; Ordiz, et al, (2002) Proc Nati Acad Sci USA 99:13290-5; Guan, et al, (2002) Proc Nati Acad Sci USA 99:13296-301; O2002099084; O00/42219; WO02/42459; WO2003062455 ; US20030059767 ; Publicación de Solicitud de Patente de los Estados Unidos Número 2003/0108880; Patentes de los Estados Unidos Nos. 6,140,466, 6,511,808 y 6,453,242. Las nucleasas de dedo de zinc útiles también incluyen aquellas descritas en WO03/080809; O05/014791; WO05/084190; WO08/021207; O09/042186; WO09/054985; y WOlO/065123. 6.5 Sitios Genómicos Dirigidos En los métodos proporcionados en la presente, una nucleasa se introduce a una célula huésped que es capaz de provocar un rompimiento de la doble hebra cerca o dentro de un sitio genómico objetivo, que incrementa en gran medida la frecuencia de recombinación homologa en o cerca del sitio de escisión. En modalidades preferidas, la secuencia de reconocimiento para la nucleasa se presenta en el genoma de una célula huésped sólo en el sitio objetivo, minimizando de este modo cualquier unión genómica fuera de objetivo y escisión por la nucleasa.
En algunas modalidades, el sitio genómico objetivo es endógeno a una célula huésped, tal como un lugar natural. En algunas modalidades, el sitio genómico objetivo natural se selecciona de acuerdo con el tipo de nucleasa a utilizarse en los métodos de integración proporcionados en la presente. Si la nucleasa a utilizarse es una nucleasa de dedo de zinc, los sitios objetivos óptimos pueden seleccionarse utilizando un número de recursos en linea disponibles públicamente. Véase, por ejemplo, Reyon et al, BMC Genomics 12:83 (2011), el cual se incorpora en la presente para referencia en su totalidad. Por ejemplo, Oligomerized Pool Engineering (OPEN) es un protocolo altamente sólido y disponible públicamente para las disposiciones de genomanipulación del dedo de zinc con alta especificidad y funcionalidad in vivo, y se ha utilizado exitosamente para generar los ZFN que funcionan de modo eficiente en plantas, pez cebra, y células madre somáticas y pluripotentes de humano. OPEN es un método de selección basado en una agrupación aleatorizada construida previamente de candidatos ZFA que se seleccionan para identificar a aquellos con alta afinidad y especificidad para una secuencia objetivo deseada. ZFNGenome es una herramienta basada en GBrowse para identificar y visualizar sitios objetivo potenciales para los ZFN generados por OPEN. ZFNGenome proporciona un compendio de sitios objetivo FN potenciales en genomas secuenciados y anotados de organismos modelo. ZFNGenome actualmente incluye un total de más de 11.6 millones de sitios objetivo ZFN potenciales, mapeados dentro de los genomas secuenciados totalmente de siete organismos modelo; S. cerevisiae, C. reinhardtii , A. thaliana, D. melanogaster, D. rerio, C. elegans, y H. sapiens. Organismos modelo adicionales, que incluyen tres especies de plantas; Glycine max (soya) , Oryza sativa (arroz) , Zea mays (maíz) , y se agregarán en el futuro cercano tres especies de animales, Tribolium castaneum (escarabajo rojo de la harina) , Mus musculus (ratón) , Rattus norvegicus (rata parda) . ZFNGenome proporciona información acerca de cada sitio objetivo ZFN potencial, que incluye su ubicación cromosómica y posición en relación con los sitios de inicio de la transcripción. Los usuarios pueden consultar ZFNGenome utilizando diversos criterios diferentes (por ejemplo, IF del gen, ID del transcripto, secuencia sitio dirigida) .
Si la nucleasa que debe utilizarse es una nucleasa efectora de TAL, en algunas modalidades, los sitios objetivo óptimos pueden seleccionarse de acuerdo con los métodos descritos por Sanjana et al., Nature Protocols, 7:171-192 (2012) , que se incorpora en la presente para referencia en su totalidad. En resumen, los TALEN funcionan como dímeros, y un par de TALEN, denominado como los TALEN izquierdo y derecho, secuencias dirigidas en las hebras opuestas de ADN. Los TALEN se diseñan como una fusión del dominio de unión TALE-ADN y un dominio catalítico Fokl monomérico. Para facilitar la dimerización de Fokl, Los TALEN sitio objetivos izquierdo y derecho se seleccionan con una separación de aproximadamente 14-20 bases. Por lo tanto, para un par de TALEN, cada una de las secuencias dirigidas de 20 pb, de sitio objetivo óptimo debe tener la forma de 5 ' -TN19N14~20N19A-3 ' , donde el TALEN izquierdo se dirige a 5'-TN19-3' y el TALEN derecho se dirige a la hebra antisentido de 5'-?19?-3' (N = A, G, T o C) .
En otras modalidades de los métodos proporcionados en la presente, el sitio genómico objetivo es exógeno a la célula huésped. Por ejemplo, uno o más sitios genómicos dirigidos pueden genomanipularse en un genoma de la célula huésped utilizando métodos tradicionales, por ejemplo, gen objetivo, antes de desempeñar los métodos de integración descritos en la presente. En algunas modalidades, se genomanipulan copias múltiples de la misma secuencia objetivo en un genoma de la célula huésped en diferentes lugares, de este modo se facilita la integración simultánea de eventos múltiples con el uso de sólo una nucleasa simple que reconozca específicamente la secuencia objetivo. En otras modalidades, una pluralidad de secuencias dirigidas diferentes se genomanipula en un genoma de la célula huésped en sitios diferentes. En algunas modalidades, el sitio objetivo genomanipulado comprende una secuencia objetivo que de otro modo no se representa en el genoma natural de una célula huésped. Por ejemplo, los sitios de reconocimiento grandes dirigidos de endonucleasas de base (12-40 pb) que usualmente se integran en intrones o inteínas, y como tal, sus sitios de reconocimiento son extremadamente raros, con uno o pocos de estos sitios presentes en un genoma dimensionado para mamífero. De este modo, en algunas modalidades, el sitio genómico exógeno dirigido es una secuencia de reconocimiento para una endonucleasa de base. En algunas modalidades, la nucleasa de base se selecciona del grupo que consiste de: H-Drel, I-Scel, I-SceII, 1-SceIII, I-ScelV, I-Scev, 1-SceVl, 1-sceVlI, I-Ceul, i-CeuAIIP, I-Creí, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsblVP, I-Tlil, I-Ppol, Pi-Pspl, F-Scel, F-Scell, F-Suvl, F-Cphl, F-TevI, F-TevII, I-Amal, I-Anil, I-ChuI, I-Cmoel, I-Cpal, I-CpaII, I-Csml, I-Cvul, I-CvuAIP, I-Ddil, I-DdiII, I-DirI, I-Dmol, I-Hmul, I-HmuII, I-HsNIP, I-Llal, I-Msol, I-Naal, I- anI, I- NclIP, I-NgrIP, I-Nitl, I-Njal, I-Nsp236IP, I-Pakl, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-Porl, I-PorlIP, I-PpbIP, I-SpBetaIP, I-Scal, I-SexIP, I-SneIPf I-Spoml, I-SpomCP, I-SpomIP, I-SpomlIP, I-SquIP, I-Ssp68031 , 1-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3pb, I-TdeIP, I-Tevl, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-Mgal, PI-MtuI, PI-MtuHIP PI-MtuHIIP, Pl-Í>ful, PI-PfuII, PI-Pkol, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-Scel, PI-TfuI, PI-TfuII, PI-Thyl, PI-Tlil, o ??-TliII, o cualquier variante o derivado del mismo. En modalidades particulares, el sitio genómico exógeno dirigido es la secuencia de reconocimiento para I-Scel, VDE (Pl-Scel) , F-Cphl, Pl-Mgal o Pl-MtuII, cada uno de los cuales se proporciona a continuación.
Tabla 1: Reconocimiento y sitios de escisión para seleccionar endonucleasas de base. 6.6 Liberación En algunas modalidades, se proporcionan una o más nucleasas útiles para los métodos descritos en la presente, por ejemplo, liberadas en una célula huésped como una proteína purificada. En otras modalidades, se proporcionan una o más nucleasas a través de polinucleótidos que comprenden los ácidos nucleicos que codifican la nucleasa. En otras modalidades, una o más nucleasas se introducen en una célula huésped como ARN purificado el cual puede traducirse directamente en el núcleo de una célula huésped.
En ciertas modalidades, un polinucleótido de integración, un polinucleótido que codifica una nucleasa, o una proteína de nucleasa purificada como se describe en lo anterior, o cualquier combinación de los mismos, puede introducirse en una célula huésped utilizando cualquier técnica convencional para introducir una proteína exógena y/o ácidos nucleicos en una célula conocida en la técnica. Tales métodos incluyen, pero no se limitan a, captación directa de la molécula por una célula desde la solución, o facilita la captación a través del uso de lipofección, por ejemplo, liposomas o immunoliposomas ; transfección mediada por partículas; etc. Véase, por ejemplo, Patente de los Estados Unidos No. 5,272,065; Goeddel et al, eds, 1990, Methods in Enzymology, vol . 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression — A Laboratory Manual, Stockton Press, NY; Sambrook et al, 1989, Molecular Cloning — A Laboratory Manual, Cold Spring Harbor Laboratory, NY; y Ausubel et al, eds., Edición Actual, Current Protocole in Molecular Biology, Greene Publishing Associates and Wiley Interscience , NY. Se conocen bien en la técnica métodos particulares para transformar células. Véase Hinnen et al, Proc. Nati Acad. Sci .. USA 75:1292-3 (1978); Cregg et al, Mol. Cell. Biol. 5:3376-3385 (1985). Técnicas ejemplares incluyen pero no se limitan a, esferoplastos , electroporación, transformación mediada por PEG 1000, y transformación mediada por acetato de litio o cloruro de litio.
En algunas modalidades, se utilizan biolísticas para introducir un polinucleótido de integración, un polinucleótido que codifica una nucleasa, una proteína de nucleasa purificada, o cualquier combinación de los mismos en una célula huésped, en particular, células huésped que de otro modo son difíciles de transformar/transfectar utilizando técnicas convencionales, tales como plantas. La biolística trabaja al unir la reacción de transformación con partículas microscópicas de oro, y después impulsar las partículas utilizando gas comprimido en las células objetivo.
En algunas modalidades, el polinucleótido que comprende ácidos nucleicos que codifican la nucleasa es un vector de expresión que se permite para la expresión de una nucleasa dentro de una célula huésped. Los vectores de expresión adecuados incluyen pero no se limitan a aquellos conocidos por su uso en genes que se expresan en Escherichia coli, levadura, o células de mamífero. Ejemplos de vectores de expresión en Escherichia coli incluyen pero no se limitan a pSCM525, pDIC73, pSCM351, y pSCM353. Ejemplos de vectores de expresión en levadura incluyen pero no se limitan a pPEX7 y pPEX408. Otros ejemplos de vectores de expresión adecuados incluyen la serie pRS de levadura-Escherichia coli de vectores lanzadera que comprende secuencias CEN.ARS y marcadores seleccionables de levadura; y plásmidos de 2µ. En algunas modalidades, un polinucleótido que codifica una nucleasa puede modificarse para sustituir codones que tienen una alta frecuencia de uso en una célula huésped, cuando se compara con la secuencia de polinucleótidos de origen natural. Por ejemplo, el polinucleótido que codifica la nucleasa puede modificarse para sustituir codones que tienen una alta frecuencia de uso en S. cerevisiae, cuando se compara con la secuencia de polinucleótidos de origen natural .
En algunas modalidades donde la nucleasa funciona como un heterodímero que requiere la expresión separada de cada monómero, como es el caso de las nucleasas de dedos de zinc y las nucleasas efectoras de TAL, cada monómero del heterodímero puede expresarse a partir del mismo plásmido de expresión, o a partir de plásmidos diferentes. En modalidades donde múltiple nucleasas se introducen a una célula para efectuar los rompimientos de la doble hebra en sitios objetivo diferentes, las nucleasas pueden codificarse sobre un plásmido sencillo o en plásmidos separados.
En ciertas modalidades, el vector de expresión de nucleasa comprende además un marcador seleccionable que se permite para la selección de células huésped que comprenden el vector de expresión. Tal selección puede ser útil para retener el vector en una célula huésped durante un periodo de tiempo necesario para la expresión de cantidades suficientes de nucleasa que aparecen, por ejemplo, durante un período de 12, 24, 36, 48, 60, 72, 84, 96, o más de 96 horas, después del cual las células huésped pueden cultivarse bajo condiciones bajo las cuales el vector de expresión ya no se retiene. En ciertas modalidades, el marcador seleccionable se selecciona del grupo que consiste de: URA3 , higromicina B fosfotransferasa, aminoglicósido fosfotransferasa, resistencia a zeocina, y fosfinotricina N-acetiltransferasa . En algunas modalidades, el vector de expresión de la nucleasa puede comprender un contador-marcador seleccionable que se permita para la selección de células huésped que no contienen el vector de expresión subsecuente a la integración de una o más moléculas donantes de ácidos nucleicos. El vector de expresión de la nucleasa utilizada también puede ser un vector transitorio que no tiene un marcador de selección, o es uno que no se selecciona en. En modalidades particulares, la progenie de una célula huésped que comprende un vector transitorio de expresión de la nucleasa pierde el vector con el tiempo.
En ciertas modalidades, el vector de expresión comprende además una secuencia de terminación de la transcripción y un promotor enlazado operativamente a la secuencia de nucleótidos que codifica la nucleasa. En algunas modalidades, el promotor es un promotor constitutivo. En algunas modalidades, el promotor es un promotor inducible. Ejemplos ilustrativos de promotores adecuados para su uso en células de levadura incluyen, pero no se limitan al promotor del gen TEF1 de K. lactls, el promotor del gen PGK1 de Saccharomyces cerevisiae, el promotor del gen TDH3 de Saccharomyces cerevisiae, promotores reprimibles, por ejemplo, el promotor del gen CTR3 de Saccharomyces cerevisiae, y promotores inducibles, por ejemplo, promotores inducibles de galactosa de Saccharomyces cerevisiae (por ejemplo, promotores de los genes GALl, GAL7, y GALIO) .
En algunas modalidades, una secuencia de nucleótidos adicional que comprende una secuencia de localización nuclear (NLS) se enlaza al 5' de la secuencia de nucleótidos que codifica la nucleasa. La NLS puede facilitar la localización nuclear de nucleasas más grandes (>25 kD) . En algunas modalidades, la secuencia de localización nuclear es una secuencia de localización nuclear SV40. En algunas modalidades, la secuencia de localización nuclear es una secuencia de localización nuclear en levadura.
Un vector de expresión de . la nucleasa puede elaborarse por cualquier técnica aparente por alguien con experiencia en la técnica. En ciertas modalidades, el vector se elabora al utilizar la reacción en cadena de la polimerasa (PCR) y técnicas de clonación molecular bien conocidas en la técnica. Véase, por ejemplo, PCR Technology: Principies and Applications for DNA A plification, ed. HA Erlich, Stockton Press, New York, N.Y. (1989) ; Sambrook et al, 2001, Molecular Cloning-A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY. 6.7 Células huésped En otro aspecto, se proporciona en la presente una célula huésped modificada generada por cualquiera de los métodos que integran genómicamente uno o más ácidos nucleicos exógenos descritos en la presente. Las células huésped adecuadas incluyen cualquier célula en la cual se desea la integración de un ácido nucleico o "ADN donante" de interés en un sitio cromosómico o episómico. En algunas modalidades, una célula es una célula de un organismo que tiene la capacidad de realizar una recombinación homologa. Aunque diversas de las modalidades ilustrativas se demuestran en levadura (S. cerevisiae) , se cree que los métodos de modificación genómica proporcionados en la presente pueden practicarse en todos los organismos biológicos que tienen un sistema de recombinación funcional, incluso donde el sistema de recombinación no es tan eficiente como en la levadura. Otras células o tipos de célula que tienen sistemas de recombinación homologa funcional incluyen bacterias tales como Bacillus subtilis y E. coli (la cual es la recombinación eficiente de RecE RecT; Muyrers efc al., EMBO rep. 1: 239-243, 2000); protozoarios ("por ejemplo, Plasmodiu , Toxoplasma) ; otras levaduras (por ejemplo, Schizosaccharomyces pombe) ; hongos filamentosos (por ejemplo, Ashbya gossypii) ; plantas, por ejemplo el musgo Physcomitrella patens (Schaefer and Zryd, Plant J. 11: 1195-1206, 1997) ; y células animales, tales como células de mamífero y células DT40 de pollo (Dieken eü al., Nat. Genet. 12:174-182, 1996).
En algunas modalidades, una célula huésped es una célula procariótica . En algunas modalidades, una célula huésped es una célula eucariótica. En algunas modalidades, una célula es una célula de hongo (por ejemplo, una célula de levadura), una célula de bacteria, una célula vegetal, o una célula animal (por ejemplo, una célula de pollo) . En algunas modalidades, una célula huésped es una célula de mamífero. En algunas modalidades, una célula huésped es una célula de ovario de hámster chino (CHO) , una célula COS-7, una célula de fibroblasto de ratón, una célula de carcinoma embrionario de ratón, o una célula madre embrionaria de ratón. En algunas modalidades, una célula huésped es una célula de insecto. En algunas modalidades, una célula huésped es una célula S2, una célula de Schneider, una célula S12, una célula 5B1-4, una célula Tn5, o una célula Sf9. En algunas modalidades, una célula huésped es una célula de organismo eucariótico unicelular .
En modalidades particulares, una célula huésped es una célula de levadura. Las células huésped de levadura útiles incluyen células de levadura que se han depositado con depósitos de microorganismos (por ejemplo, IFO, ATCC, etc.) y pertenecen a los géneros Aciculoconidium, A bro iozyma., Arthroascus, Arxiozyma, Ashbya, Babjevia, Bensingtonia, Botryoascus, Botryozyma, Brettanomyces, Bullera, Bulleromyces, Candida, Citeromyces, Clavispora, Cryptococcus, Cystofilobasidium, Debaryomyces, Dekkara, Dipodascopsis, Dipodascus, Eeniella, Endomycopsella, Eremascus, Ere othecium, Erythrobasidium, Fellomyces, Filobasidium, Galactomyces, Geotrichum, Guilliermondella, Hanseniaspora, Hansenula, Hasegawaea, Holtermannia, Hormoascus, Hyphopichia, TssatcftenJcia, Kloeckera, Kloeckeraspora, Kluyvero yces, Kondoa, Kuraishia, Kurtzmanomyces, Leucosporidium, Lipomyces, Lodderomyces, Malassezia, Metschnikowia, Mrakia, Myxozyma, Nadsonia, Nakazawaea, Nematospor , Ogataea, Oosporidium, Pachysolen, Phachytichospora, Phaffia, Pichia, Rhodosporidium, Rhodotorula, Saccharo yces, Saecharomycodes, Saccharomycopsis, Saitoella, Sakaguchia, Saturnospora, Schizoblastosporion, Schizosaccharomyces, Schwanniomyces, Sporidiobolus, Sporobolomyces, Sporopachyder ia, Stephanoascus, Sterigmatomyces, Sterigmatosporidium, Symbiotaphrina, Sympodiomyces, Sympodiomycopsis, Torulaspora, Trichosporiella, Trichosporon, Trigonopsis, Tsuchiyaea, Udeniomyces, Waltomyces, Wickerhamia, Wickerha iella, Williopsis, Yamadazyma, Yarrowia, Zygoascus, Zygosaccharomyces, Zygowilliopsis, y Zygozyma, entre otros.
En algunas modalidades, la célula huésped de levadura es una célula de Saccharomyces cerevlsiae, una célula de Pichia pastoris, una célula de Schizosaccharomyces pombe, una célula de Dekkera bruxellensis, una célula de luyveroiTiyces lactis, una célula de Arxula adeninivorans, o una célula de Hansenula polimorpha (ahora conocida como Pichia augusta) . En una modalidad particular, la célula huésped de · levadura es una célula de Saccharomyces cerevisiae. En algunas modalidades, la célula huésped de levadura es una célula de Saccharomyces f agilis o una célula de íluyvero-Tjyces lactis (previamente denominada Saccharomyces lactis) . En algunas modalidades, la célula huésped de levadura es una célula que pertenece al género Candida, tal como Candida lipolitica, Candida guilliermondii, Candida krusei, Candida pseudotropicalis, o Candida utilis. En otra modalidad particular, la célula huésped de levadura es una célula de Kluveromyces marxianus.
En modalidades particulares, la célula huésped de levadura es una célula de Saccharomyces cerevisiae seleccionada del grupo que consiste de una célula de levadura de Baker, una célula de CBS 7959, una célula de CBS 7960, una célula de CBS 7961, una célula CBS 7962, una célula CBS 7963, una célula CBS 7964, una célula IZ-1904, una célula TA, una célula BG-1, una célula CR-1, una célula SA-1, una célula M-26, una célula Y-904, una célula PE-2, una célula PE-5, una célula VR-1, una célula BR-1, una célula BR-2, una célula ME-2, una célula VR-2, una célula MA-3, una célula MA-4, una célula CAT-1, una célula CB-1, una célula NR-1, una célula BT-1, y una célula AL-1. En algunas modalidades, una célula huésped es una célula de Saccharomyces cerevisiae seleccionada del grupo que consiste de una célula PE-2, una célula CAT-1, una célula VR-1, una célula BG-1, una célula CR-1, y una célula SA-1. En una modalidad particular, la célula huésped de Saccharomyces cerevisiae es una célula PE-2. En otra modalidad particular, la célula huésped de Saccharomyces cerevisiae es una célula CAT-1. En otra modalidad particular, la célula huésped de Saccharomyces cerevisiae es una célula BG-1.
En algunas modalidades, la célula huésped de levadura es una célula que es adecuada para la fermentación industrial, por ejemplo, fermentación de bioetanol. En modalidades particulares, una célula se acondiciona para subsistir bajo una alta concentración de solvente, alta temperatura, utilización expandida de sustrato, limitación de nutrientes, debida a estrés osmótico, acidez, contaminación por sulfito y bacteriana, o combinaciones de los mismos, que son condiciones de estrés reconocidas para el ambiente de fermentación industrial. 6.8 Kits En otro aspecto, se proporciona en la presente un kit útil para realizar los métodos para integrar genómicamente uno o más ácidos nucleicos exógenos descritos en la presente. En algunas modalidades, el kit comprende: (a) una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno (ES)X comprende: (i) una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar la recombinación homologa de (ES)X mediada por la célula huésped en un sitio objetivo (TS)X seleccionado de un genoma de la célula huésped; y (ii) un ácido nucleico (D)x de interés colocado en 3' de (HRl)x y en 5 ' de (HR2)X; (b) una pluralidad de nucleasas, en donde cada nucleasa (N)x es capaz de escindirse en (TS)X/ después de lo cual la escisión resulta en la recombinación homóloga de (ES)x en (TS)x; en donde x es cualquier número entero de 1 a n en donde n es al menos 2.
En algunas modalidades, (D)x se selecciona del grupo que consiste de un marcador seleccionable , un promotor, una secuencia de ácido nucleico que codifica un epítopo marcador, un gen de interés, un gen reportero, y una secuencia de ácido nucleico que codifica un codón de terminación. En algunas modalidades, el kit comprende además una pluralidad de pares de cebadores (P)x, en donde cada par de cebadores es capaz de identificar la integración de (ES)X en (TS)x mediante PCR. En algunas modalidades, (ES)X es lineal. En algunas modalidades, (ES)X es circular.
En una modalidad particular, el kit permite la integración especifica al sitio de un ácido nucleico exógeno en un sitio objetivo único dentro de cualquiera de los aproximadamente 6000 lugares genéticos del genoma de levadura. En estas modalidades, n= >6000, en donde cada (TS)X es único para un sitio simple del genoma de la célula de levadura.
En algunas modalidades, el kit comprende además instrucciones para su uso que describen métodos para integrar uno o más ácidos nucleicos exógenos en cualquier lugar genético de una célula huésped de levadura. 7. EJEMPLOS 7.1 Ejemplo 1: Integración simultánea múltiple de una pluralidad de ácidos nucleicos exógenos Los métodos y composiciones descritos en la presente se implementaron para crear una célula de levadura modificada que comprende dos ácidos nucleicos exógenos integrados en dos lugares del genoma de la célula de levadura en una etapa de transformación simple , en donde . la recuperación de la célula de levadura modificada no requiere del uso de marcadores seleccionables .
Se proporciona una cepa huésped qué comprende: (a) un sitio de reconocimiento previamente introducido para la endonucleasa F-Cphl colocada dentro del lugar NDT80; y (b) : un sitio de reconocimiento previamente introducido para la endonucleasa I-Scel colocada dentro del lugar HO. Una célula huésped se transforma de modo simultáneo con: (1) un plásmido de expresión que codifica F-Cphl; (2) un plásmido de expresión que codifica I-Scel; (3) un ADN lineal que comprende un cásete de expresión que codifica la proteína verde fluorescente (GFP) , flanqueada por dos tramos de secuencia >500 pb que corresponde a las regiones 5' y 3' del lugar NDT80; y (4) un ADN lineal que comprende un cásete de expresión que codifica lacZ, flanqueado por dos tramos de secuencia >500 pb para las regiones 5' y 3' regiones del lugar HO. Como una alternativa a la inclusión de los plásmidos de expresión que codifican F-Cphl y I-Scel, respectivamente, se incluyen las proteínas purificadas F-Cphl y I-Scel proteína en la reacción de transformación. Se realiza un control de rompimiento de la cadena no doble al transformar solamente células huésped con los constructos de integración lineales (3) y (4) , en ausencia del plásmido de expresión o proteína purificada de F-Cphl y I-Scel.
Los transformantes experimentales y de control se colocaron en placa sobre un medio libre de selección, y las colonias de cada placa se visualizaron para la expresión de GFP y lacZ, respectivamente. La PCR de la colonia se realice independientemente con un par de cebadores que hibridan corriente arriba y corriente abajo de la unión entre el constructo de integración (3) o (4), integrado respectivamente, y sus secuencias dirigidas respectivas, para confirmar fidelidad y frecuencia de integración. 7.2 Ejemplo 2: Integración simultánea múltiple de una pluralidad de ácidos nucleicos exógenos Este Ejemplo proporciona resultados que demuestran la integración simultánea de tres ácidos nucleicos exógenos en tres lugares diferentes de un huésped de S. cerevisiae después de la inducción de los rompimientos dirigidos de la doble hebra en el genoma de la célula huésped. En resumen, una secuencia exógena de ácidos nucleicos "dirigidos" que codifica una copia truncada, no funcional de Proteína Verde Fluorescente de Emerald (emgfpA) se integra en los lugares HO, YGR250c y NDT80, respectivamente, de las células huésped de levaduras. Las células recombinantes se transformaron con ADN "donante" lineal que codifica una copia intacta, funcional de Proteina verde fluorescente (EmGFP) y cualquiera de: (1) un vector vacío; o (2) un vector de expresión, pZFN.gfp, codifican una nucleasa de dedo de zinc (ZFN.gfp) que reconoce específicamente y que escinde una secuencia dentro de la secuencia de codificación emgfpA. Las colonias transformadas se seleccionaron por el PCR de colonia (cPCR) para el remplazo de uno, dos o tres copias integrada genómicamentes de la secuencia de codificación emgfpA dirigida con la secuencia de codificación EmGFP donante. 7.2.1. Construcción e Integración de ADN dirigido Para generar sitios genómicos exógenos dirigidos para los rompimientos de la doble hebra mediados por nucleasa, se construyeron los ADN dirigidos que codifican emgfpA utilizando el ensamble mediado por RYSE, como se describe en el No. De Patente de los Estados Unidos 8,110,360, el contenido de la cual se incorpora en la presente por referencia en su totalidad. Los nucleótidos 450 a 462 de la secuencia de codificación emgfP tipo silvestre (SEQ ID N0:1) se remplazaron con la siguiente secuencia: 5'-CGTCTAAATCATG-3 ' (SEQ ID NO: 2), que resultó en la introducción de: (1) un codón de paro prematuro en la posición 152 de EmGFP (emgfpA) ; y (2) la secuencia de reconocimiento/escisión para ZFN.gfp.
Para la integración dirigida de la secuencia de codificación emgfpA en cada uno de los lugares HO, YGR250c y NDT80, la secuencia de codificación emgfpA se flanqueó con -200-500 pb de las secuencias homologas corriente arriba y corriente abajo para cada lugar (SEQ ID NOS: 3-8) . Un marcador único seleccionable también se incorporó en cada constructo, colocado 5' para la secuencia de codificación emgfpA, para la selección de colonias que tienen eventos de integración exitosa. El constructo de integración HO incluyó KanR, el constructo de integración YGR250c incluyó URA3 , y el constructo de integración NDT80 incluyó NatR. Cada constructo de integración se transformó secuencialmente en una cepa de levadura haploide CEN.PK2 no tratada (cepa A) , y la cepa se confirmó por tener tres copias integradas de la secuencia de codificación emgfpA. 7.2.2 Construcción del Plásmido de Expresión ZFN de Levadura Las nucleasas de dedos de zinc consisten de dos dominios funcionales: un dominio de unión al ADN comprendido de una cadena de proteínas de dedo de zinc y un dominio que escinde el ADN comprendido del dominio de nucleasa de Fokl. El dominio de endonucleasa de Fokl funciona como un heterodímero obligado con el fin de escindir ADN, y de este modo, se requiere un par de ZFN para unirse y cortar su secuencia objetivo. La secuencia objetivo de ZFN.gfp (CompoZr® zinc Finger Nuclease, Sigma-Aldrich, St. Louis, MO) es : 5 ' -ACAACTACAACAGCCACAACgtctatATCATGGCCGACAAGCA-3 ' (SEQ ID NO: 9), con la secuencia de reconocimiento indicada en mayúsculas y la secuencia de escisión indicada en minúsculas .
Un plásmido de expresión ZFN.gfp de levadura de alta copia, pZFN.gfp, se construyó como sigue. Cada uno de los genes ZFN.gfp.l y ZFN.gfp.2, que codifican un miembro del heterodímero ZFN.gfp obligado, se amplificó con PCR a partir de un plásmido de expresión de mamífero y se fusionó al promotor PGALI,IO divergente y a los terminadores ADH1 y CYC1, respectivamente. Los productos PCR individuales de PGALio>ZFN.gfp.1-TADHI y P PGALi>ZFN.gfp.2-TCYCI, junto con un esqueleto de vector linealizado que comprende un marcador LEU seleccionable, se co-transformaron en una cepa de levadura sin tratamiento para un ensamble in vivo a través de una recombinación homologa de extremos superpuestos. Los productos PCR recombinados en la secuencia promotora pGALl,lO y ensamblados en el esqueleto de vector a través de secuencias homologas agregadas por los cebadores terminales. Los transformantes se seleccionaron en un medio mínimo que carece de leucina, se aislaron, y se cultivaron en un medio líquido. Los plásmidos de múltiples clones se extrajeron de la levadura utilizando el kit Miniprep I de Plásmido de Levadura Zymoprep (Zymo Research) . El eluente del protocolo de extracción entonces se transformó en células competentes de E. coli XL-1 químicamente azules. Los plásmidos se propagaron durante la noche en E. coli y se miniprepararon (Qiagen, Valencia, CA) . Los clones correctos se identificaron por mapeo de restricción. 7.2.3. Transformación con ADN donante e Inducción de los Rompimientos de la Doble Hebra Se utilizó un protocolo estándar de acetato de litio/SSDNA/PEG (Gietz and Woods , Methods Enzymol. 350:87-96 (2002)) para co-transformar la cepa A con ADN "donante" lineal que codifica EmGFP y cualquiera de: (1) un vector vacío; o (2) el vector de expresión pZFN.gfp. La secuencia de codificación EmGFP difiere de la secuencia de codificación emgfpA en las posiciones dentro del sitio de reconocimiento/escisión para las posiciones denominadas ZFN.gfp, 450 (C?G) , 456 (A?T) , 461 (T?C) y 462 (G?C) . De este modo, se espera que ZFN.gfp reconozca y escinda dentro de la secuencia emgfpA aunque no dentro de la secuencia EmGFP .
Se co-transformó un microgramo del AND de plásmido apropiado con 70 ul de ADN de EmGFP lineal (-300 ng/ul) . Todas las transformaciones se recuperaron durante la noche en YP + galactosa al 2% para inducir la expresión de ZFN. Se colocaron en placas diversas diluciones sobre placas con medio mínimo de agar que carece de leucina para seleccionar las colonias transformadas con ADN del plásmido. Las placas se incubaron durante 3 días a 30°C. 7.2.4. Confirmación de la Integración Múltiple Simultánea Se realizó la PCR de la colonia para determinar la frecuencia de remplazo de la secuencia de codificación emgfpA con la secuencia de codificación EmGFP en cada lugar dirigido. Se prepara AND a partir de 96 colonias de cada transformación y se probaron con pares de cebadores específicos para EmGFP y HO, EmGFP y NDT80, y EmGFP e YGR250c, respectivamente, de modo que se esperó la integración exitosa de la secuencia de codificación EmGFP en cada lugar para producir un amplicón de un tamaño previsto, aunque no se esperó la integración para no producir el amplicón.
Tabla 2 . Secuencias de cebador para la verificación por cPCR de la integración múltiple de la secuencia de codificación EmGFP Como se indica en la FIGURA 5, de las 96 colonias transformadas con ADN donante lineal de EmGFP (SEQ ID NO: 1) y el control del vector vacío, no se produjeron amplicones durante la PCR, indicando que no hubo eventos de integración exitosa, es decir, remplazos en cualquiera de los tres lugares que comprenden la secuencia de codificación emgfpA dirigida en ausencia de un rompimiento de la doble hebra.
En contraste, de las 96 colonias transformadas con ADN lineal de EmGFP y pZFN.gfp, 2 colonias tuvieron un lugar remplazado, 4 colonias tuvieron dos lugares remplazados, y 23 colonias tuvieron los tres lugares remplazados con la secuencia de codificación EmGFP (FIG 6) . Los resultados PCR de las colonias se corroboraron al visualizar la fluorescencia de las colonias transformadas en las placas (datos no mostrados) . Ninguna de las colonias transformadas Con ADN de EmGFP DNA y el vector vacío aparecieron verdes, indicando que ninguna de las secuencias de codificación emgfpA dirigidas se remplazó con las secuencias de codificación EmGFP funcionales. En contraste, -20% de las colonias transformadas con ADN de EmGFP DNA y pZFN.gfp aparecieron verdes, correlacionándose más o menos con la frecuencia de los eventos de integración observada por cPCR.
Estos resultados demostraron que la inducción de múltiples rompimientos dirigidos de la doble hebra en el genoma de una célula huésped puede facilitar la integración múltiple dirigida simultánea de ácidos nucleicos donantes exógenos . 7.3 Ejemplo 3: Integración simultánea múltiple de los genes terpeno sintasa para facilitar la conversión de una cepa que produce farneseno a una cepa que produce amorfadieno Este Ejemplo proporciona resultados que demuestran la integración simultánea de tres genes de sesquiterpeno sintasa en tres sitios diseñados de modo diferente de un huésped de S. cerevisiae genomanipulado para una ruta de alto flujo de mevalonato. Como resultado, una cepa original que produce farneseno y que comprende una copia a base de plásmido del gen de farneseno sintasa se convirtió en una cepa que produce amorfadieno que comprende múltiples copias integrada genómicamente de amorfadieno sintasa. En resumen, los casetes marcadores URA3, NatR y KanR flanqueados por sitios F-Cphl se integraron en los sitios Gal80, HXT3 y Mata, respectivamente, de la cepa huésped. Entonces el huésped se co-transformó con un plásmido que codifica la endonucleasa F-Cphl así como tres constructos de ADN "donante" lineal que contienen distintas optimizaciones de codón del gen de amorfadieno sintasa (ADS) se expresó a partir del promotor Gall y se terminó por el terminador CYC1 (cásete ADS) , cada uno flanqueado por regiones de homología para su sitio objetivo .respectivo. Las colonias transformadas se seleccionaron por la PCR (cPCR) de colonia para el remplazo de uno, dos o tres sitios de marcador dirigido integrado genómicamente con los casetes ADS . Una cepa triplemente integrada se identificó y se genomanipuló además al integrar un cuarto cásete ADS, y la cepa resultante se cultivó bajo condiciones que se permitieron para la pérdida del plásmido que codifica farneseno sintasa, tal que su perfil de producto se convirtió completamente de farneseno a amorfadieno. 7.3.1. Construcción de una Cepa que Produce Farneseno Original Una cepa de levadura que produce farneseno, Y3639, útil para la integración múltiple simultánea del ADN donante exógeno que codifica amorfadieno sintasa, se preparó como sigue .
Se generaron las cepas Y93 (MAT A) e Y94 (MAT alfa) al remplazar el promotor del gen ERG9 de las cepas de levadura YO02 e YO03 (CEN.PK2 MAT A de fondo o MAT alfa, respectivamente; ura3-52; trpl-289; leu2-3,112; his3Al; MAL2-8C; SUC2; van Dijken et al. (2000) Enzyme Microb. Technol . 26:706-714), respectivamente, con el promotor del gen MET3 de Saccharomyces cerevisiae . Para este fin, las células Y002 e Y003 cultivadas exponencialmente se transformaron con el constructo de integración i8 (SEQ ID NO: 14), el cual comprende el marcador con resistencia a kanamicina (KanMX) flanqueado por el promotor y terminador del gen Tefl de Kluyveromyces lactis, la secuencia de codificación ERG9 , un segmento truncado del promotor ERG9 (PERG9 truncado) , y el promotor MET3 (PMET3) , flanqueado por las secuencias ERG9 corriente arriba y corriente abajo. Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende 0.5 µ /p\]_? de Geneticina (Invitrogen Corp., Carlsbad, CA) , y los clones seleccionados se confirmaron por PCR de diagnóstico, produciendo cepas Y93 e Y94.
Las cepas Y176 (MAT A) e Y177 (MAT alfa) se generaron al remplazar la secuencia de codificación del gen ADE1 en las cepas Y93 e Y94, respectivamente, con la secuencia de codificación del gen LEU2 de Candida glabrata (CgLEU2) . Para este fin, el sitio genómico CgLEU2 de 3.5 kb se amplificó mediante PCR a partir del ADN genómico de Candida glabrata (ATCC, Manassas, VA) utilizando . los cebadores 61-67-CPK066-G (SEQ ID NO: 15) y 61-67-CPK067-G (SEQ ID NO: 16) , y transformar el producto PCR en las células Y93 e Y94 cultivadas exponencialmente . Los transformantes de la célula huésped se seleccionaron sobre CSM-L, y los clones seleccionaron se confirmaron por PCR de diagnóstico, produciendo las cepas Y176 e Y177.
La cepa Y188 se generó al introducirse en la cepa Y176 una copia adicional de las secuencias de codificación de los genes ERG13 , ERGIO, y ERG12 de Saccharomyces cerevisiae, y una secuencia de codificación truncada del gen HMG1 de Saccharomyces cerevisiae, cada una bajo el control regulador de un promotor inducible por galactosa del gen GAL1 o GALIO de Saccharomyces cerevisiae. Para este fin, las células Y176 cultivadas exponencialmente se transformaron con 2 µg de los plásmidos de expresión pAM491 y pAM495 digeridos con la endonucleasa de restricción Pme (New England Biolabs, Beverly, MA) . Los transformantes de la célula huésped se seleccionaron sobre CSM que carece de uracilo e histidina (CSM-U-H) , y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y188.
La cepa Y189 se generó al introducir en la cepa Y177 una copia adicional de las secuencias de codificación de los genes ERG20, ERG8 , y ERG19 de Saccharomyces cerevisiae, y una secuencia de codificación truncada del gen H Gl de Saccharomyces cerevisiae, cada una bajo el control regulador de un promotor inducible por galactosa del gen GALl o GALIO de Saccharomyces cerevisiae. Para este fin, las células Y188 cultivadas exponencialmente se transformaron con 2µg de los plásmidos de expresión pAM489 y pAM497 digeridos con La endonucleasa de restricción Pmel . Los transformantes de la célula huésped se seleccionaron sobre CSM que carece de triptófano e histidina (CSM-T-H) , y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y189.
La cepa Y238 se generó al acoplar las cepas Y188 e Y189, y al introducir una copia adicional de la secuencia de codificación del gen IDI1 de Saccharomyces cerevisiae y una secuencia de codificación truncada del gen HMGl de Saccharomyces cerevisiae, cada una bajo el control regulador de un promotor inducible por galactosa del gen GALl o GALIO de Saccharomyces cerevisiae . Para este fin, se mezclaron aproximadamente 1 x 107 células de las cepas Y188 y Y189 en una placa con medio YPD durante 6 horas a temperatura ambiente, se seleccionaron células diploides sobre CSM-H-U-T, y los diploides cultivados exponencialmente se transformaron con 2 µg del plásmido de expresión pAM493 digeridos con la endonucleasa de restricción Pmel. Los transformantes de la célula huésped se seleccionaron sobre CSM que carece de adenina (CSM-A) , y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y238.
Las cepas Y210 (MAT A) e Y211 (MAT alfa) se generaron por la cepa Y238 de esporulación. Las células diploides se esporularon en acetato de potasio al 2% y medio líquido de rafinosa al 2%, y aproximadamente se aislaron 200 tétradas genéticas utilizando un micromanipulador Singer Instruments serie MS 300 (Singer Instrument Co, LTD. Somerset, UK) . Las esporas se seleccionaron sobre CSM-A-H-U-T, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepas Y210 (MAT A) e Y211 (MAT alfa) .
La cepa Y221 cultivada exponencialmente se generó al transformar células Y211 con el vector pAM178. Los transformantes de la célula huésped se seleccionaron sobre CSM-L.
La cepa Y290 se generó al suprimir la secuencia de codificación del gen GAL80 de la cepa Y221. Para este fin, las células Y221 cultivadas exponencialmente se transformaron con un constructo de integración i32 (SEQ ID NO: 17) , que comprende el marcador resistente a higromicina B (hph) flanqueado por el promotor y terminador del gen Tefl de Kluyveromyces lactis flanqueado por las secuencias corriente arriba y corriente abajo de GAL80. Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende higromicina B, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y290.
La cepa Y318 se generó al retirar el vector pAM178 a partir de la cepa Y290 por propagación en serie en un medio rico en leucina, y las colonias individuales se probaron para su incapacidad de crecer sobre CSM-L, produciendo la cepa Y318.
La cepa Y409 se generó al introducir una secuencia heteróloga de nucleótidos que codifica una P-farneseno sintasa en la cepa Y318. Para este fin, las células Y318 cultivadas exponencialíñente se transformaron con el plásmido de expresión pAM404. Los transformantes de la célula huésped se seleccionaron sobre CSM-L, produciendo la cepa Y409.
La cepa Y419 se generó por la representación de los promotores GAL de la cepa Y409 constitutivamente activa. Para este fin, las células Y409 cultivadas exponencialmente se transformaron con el constructo de integración i33 (SEQ ID NO: 18) , que comprende el marcador resistente a nurseotricina de Streptomyces noursei (NatR) flanqueado por el promotor y terminador del gen Tefl de Kluyveromyces lactis, y la secuencia de codificación del gen GAL4 de Saccharomyces cerevisiae bajo el control regulador de una versión "constitutiva operativamente" de su promotor natural (PGAL4oc; Griggs & Johnston (1991) PNAS 88 (19) : 8597-8601) and el terminador GAL4 (TGAL4) , flanqueado por las secuencias corriente arriba y corriente abajo del promotor ERG9 modificado las secuencias de codificación. Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende nurseotricina, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y419.
La cepa Y677 se generó al introducir en el lugar GAL80 modificado de la cepa Y419 una copia adicional de la región de codificación del gen ERG 12 de Saccharomyces cerevisiae bajo el control regulador del promotor del gen GALl de SacchcLro yces cerevisiae . Para este fin, las células Y677 cultivadas exponencialmente se transformaron con el constructo de integración i37 (SEQ ID NO: 19) , que comprende el marcador resistente a kanamicina de Streptomyces nóursei (KanR) flanqueado por el promotor y terminador del gen Tefl de Kluyveromyces lactis, y las secuencias de codificación y terminadora del ERG 12 de Saccharomyces cerevisiae flanqueado por el promotor GALl (PGAL1) y el terminador ERG 12 (TERG12) . Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende kanamicina, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y677.
La cepa Y1551 se generó a partir de la cepa Y677 por mutagénesis química. Las cepas mutadas se seleccinaron para la producción incrementada de ß-farneseno, produciendo la cepa Y1551.
La cepa Y1778 se generó a partir de la cepa Y1551 por mutagénesis química. Las cepas mutadas se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y1778.
La cepa Y1816 se generó al remplazar la secuencia de codificación HXT3 de la cepa Y1778 con dos copias de una secuencia de codificación de acetoacetil-CoA tiolasa, una se derivó a partir de Saccharomyces cerevisiae y la otra a partir de C. Jutylicum, y una copia de la secuencia de codificación del gen HMGS de B . júncea. Para este fin, las células Y1778 cultivadas exponencialmente se transformaron con el constructo de integración i301 (SEQ ID NO: 20) , la cual comprende el marcador resistente a higromicina B (hyg) flanqueado por el promotor y terminador del gen Tefl de Kluyveromyces lactis, la secuencia de codificación del gen ERGIO de Saccharomyces cerevisiae flanqueado por un promotor TDH3 truncado (tPTDFB) y el terminador AHP1 (TAHP1) , la secuencia de codificación del gen acetoacetil-CoA tiolasa de C. jbutylicum (tiolasa) flanqueado por el promotor YPD1 (PYPD1) y el terminador CCW12 (TCCW12) , y la secuencia de codificación del gen HMGS de B . júncea (HMGS) precedido por el promotor TUB2 (PTUB2) , flanqueado por las secuencias corriente arriba y corriente abajo del gen HXT3 de Saccharomyces cerevisiae . Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende higromicina B, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y1816.
La cepa Y2055 se generó a partir de la cepa Y1778 por mutagénesis química. Las cepas mutantes se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y2055.
La cepa Y2295 se generó a partir de la cepa Y2055 por mutagénesis química. Las cepas mutantes se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y2295.
La cepa Y3111 se generó al cambiar el tipo de acoplamiento de la cepa Y2295 de MAT A a MAT alfa. Para este fin, las células Y2295 cultivadas exponencialmente se transformaron con el constructo de integración i476 (SEQ ID NO: 21) , que comprende el sitio de acoplamiento MAT alfa y el marcador resistente a higromicina B (hygA) . Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende higromicina B, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y3111.
La cepa Y2168 se generó a partir de la cepa Y1816 por mutagénesis química. Las cepas mutantes se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y2168.
La cepa Y2446 se generó a partir de la cepa Y2168 por mutagénesis química. Las cepas mutantes se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y2446.
La cepa Y3118 se generó al insertar en el sitio URA3 sin tratamiento de la cepa Y2446 la secuencia de codificación, el promotor, y terminador del gen GAL80 de Saccharomyces cerevisia . Para este fin, las células Y2446 cultivadas exponencialmente se transformaron con el constructo de integración i477 (SEQ ID NO: 22) , que comprende el promotor, el terminador, y la secuencia de codificación del gen GAL80 de Saccharomyces cerevisiae (GAL80) flanqueado por las secuencias de superposición URA3 (que permiten la escisión del bucle de salida del gen GAL80 gene por recombinación homologa y restauración de la secuencia URA3 original) . Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende 5-FOA, produciendo la cepa Y3118.
La cepa Y3215 se generó al acoplar las cepas Y3111 e Y3118. Aproximadamente se mezclaron 1 x 107 células de las cepas Y3111 e Y3118 sobre una placa con medio YPD durante 6 horas a temperatura ambiente para permitir el acoplamiento, seguido por la colocación en placas sobre una placa con agar YPD para aislar colonias simples. Los diploides se identificaron al seleccionar por PCR de colonia para la presencia de ambos sitios de MAT alfa hphA marcado y el sitio MAT A tipo silvestre.
La cepa Y3000 se generó al esporular la cepa Y3215 y la secuencia de codificación GAL80 del bucle de salida. Las células diploides se esporularon en acetato de potasio al 2% y medio líquido de rafinosa al 0.02%. Se aislaron al azar esporas, se colocaron en placas sobre agar YPD, se cultivaron durante 3 días, y luego se replicaron en CSM-U para permitir sólo el crecimiento de células que carecen de GAL80 (es decir, que tienen un gen U A3 funcional) . Después las esporas se probaron para la producción de ß- farnéseno , se identificó el mejor productor, y se confirmó la presencia del constructo de integración i301 mediante PCR de diagnóstico, produciendo la cepa Y3000.
La cepa Y3284 se generó al remover el marcador URA3 de la cepa Y3000. Para este fin, las células Y3000 cultivadas exponencialmente se transformaron con el constructo de integración i94 (SEQ ID NO: 23) , que comprende la secuencia de codificación hisG de Salmonella, y la secuencia de codificación del gen ERG 13 y una secuencia de codificación truncada del gen HMG1 de Saccharomyces cerevisiae bajo el control de un promotor inducible por galactosa del gen GALl o GALIO de Saccharomyces cerevisiae, flanqueado por las secuencias corriente arriba y corriente abajo del gen URA3 de Saccharomyces cerevisia . Los transformantes de la célula huésped se seleccionaron sobre un medio que comprende 5-FOA, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y3284.
La cepa Y3385 se generó al remplazar la secuencia de codificación NDT80 de la cepa Y3284 con una copia adicional de la secuencia de codificación de un gen acetil-CoA sintetasa de Saccharomyces cerevisiae y la secuencia de codificación del gen PDC de Z. obilis. Para este fin, las células Y3385 cultivadas exponencialmente se transformaron con el constructo de integración i467 (SEQ ID NO: 24), que comprende el marcador URA3 , la secuencia de codificación del gen ACS2 de Saccharomyces cerevisiae (ACS2) flanqueada por el promotor HXT3 (PHXT3) y el terminador PGK1 (TPGK1) , y la secuencia de codificación del gen PDC de Z. mobilis (zmPDC) flanqueada por el promotor GAL7 (PGAL7) y el terminador TDH3 (TTDH3) , flanqueados por las secuencias NDT80 corriente arriba y corriente abajo. Los transformantes de la célula huésped se seleccionaron sobre CSM-U, y los clones seleccionados se confirmaron mediante PCR de diagnóstico, produciendo la cepa Y3385.
La cepa Y3547 se generó a partir de la cepa Y3385 por mutagénesis química. Las cepas mutadas se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y3547.
La cepa Y3639 se generó a partir de la cepa Y3547 por mutagénesis química. Las cepas mutadas se seleccionaron para la producción incrementada de ß-farneseno, produciendo la cepa Y3639. 7.3.2. Construcción e Integración del ADN objetivo Los sitios genómicos exógenos dirigidos por los rompimientos mediados por la endonucleasa Fcphl de la doble hebra se integraron en tres lugares diferentes de la cepa Y3639. Los tres casetes de sitio objetivo se construyeron utilizando un ensamble PCR de fragmentos de superposición, cada uno comprende la secuencia de reconocimiento para la endonucleasa Fcphl y la secuencia de codificación para: (1) URA3 (flanqueado por regiones de homología para el lugar Gal80 modificado) (SEQ ID NO: 25) ; (2) NatR (flanqueado por regiones de homología para el lugar HXT3 modificado) (SEQ ID NO: 26) ; y (3) KanR (flanqueado por regiones de homología para el lugar Mata modificado) (SEQ ID NO: 27), respectivamente. Cada cásete de sitio objetivo se transformó serialmente en Y3639, y la cepa se confirmó por PCR de colonia para tener tres copias integradas de los casetes marcadores flanqueados por F-Cphl en los sitios correctos ("cepa B" ) . 7.3.3. Construcción del Plásmido de Expresión de Levadura F-Cphl El plásmido de expresión pAM1799 de levadura F-Cphl, que comprende un marcador seleccionable HygR, se ha descrito previamente en la Patente de los Estados Unidos No. 7,919,605, que se incorpora en la presente por referencia en su totalidad. 7.3.4. Transformación con ADN Donante e Inducción de los Rompimientos de la Doble Hebra El protocolo estándar de acetato de litio/SSDNA/PEG (Gietz and Woods, Methods Enzy ol . 2002;350:87-96) se modificó para incluir una incubación de 30 grados, 30 minutos, de las células antes del choque térmico a 42 grados. Este método se utilizó para co- transformar la cepa B con pAM1799, que codifica la endonucleasa Fcphl, y tres ADN "donantes" lineales, cada uno comprende una secuencia de codificación optimizada de codón para amorfadieno sintasa (ADS) de Artemisia annua, flanqueada por regiones de homología a los lugares Gal80 (SEQ ID NO: 28) , HXT3 (SEQ ID NO: 29) y Mata (SEQ ID NO: 30) modificados, respectivamente, de la cepa B.
Se co-transformó un microgramo de pAM1799 con ~100 ng de cada una de las ADS a partir de los ADN donantes. Todas las transformaciones se recuperaron durante la noche en YP + galactosa al 2% para inducir la expresión F-Cphl. Diversas diluciones se colocaron en placas sobre placas de agar YPD que contienen higromicina para seleccionar por colonias transformadas con ADN del plásmido. Las placas se incubaron durante 3 días a 30°C. 7.3.5. Confirmación de la Integración Múltiple Simultánea Se realizó el PCR de colonias (cPCR) para determinar la frecuencia de remplazo de las secuencias de codificación del cásete marcador flanqueado con F-Cphl con la secuencia de codificación del cásete ADS. El ADN se prepare a partir de 20 colonias probadas con pares de cebadores específicos para ADS y el sitio Gal80, ADS y el sitio HXT3 , y ADS y el sitio Mata, respectivamente, tal que la integración exitosa de la secuencia de codificación del cásete ADS en cada sitio se esperó para producir un amplicón de un tamaño previsto, mientras que no se esperó la integración para no producir un amplicón. Las reacciones PCR para producir amplicones a partir de los extremos 5' y 3' de cada sitio se intentaron por multiplexación. En algunos casos, sólo el amplicón 5' o el 3' se detectó exitosamente, pero la integración apropiada del cásete ADS se confirmó en estos lugares al secuenciar fragmentos PCR más largos.
Tabla 3. Secuencias de cebador para la verificación por cPCR de la integración múltiple de la secuencia de codificación del cásete ADS De las 20 colonias seleccionadas por cPCR, 14 tuvieron ADS integrada en el sitio Gal80, 17 tuvieron ADS integrada en el sitio HXT3 , y cuatro tuvieron ADS integrada en el sitio Mata. El bajo índice de integración en él sitio Mata puede explicarse por el propio cierre en este sitio mediado por una secuencia de repetición directa que flanquea los sitios F-Cphl. En total, 6 clones tuvieron ADS integrada en un solo sitio, 10 clones tuvieron ADS integrada en dos sitios, y tres clones tuvieron ADS integrada en los tres lugares ("cepas C" ) . Las cepas triplemente integradas se confirmaron además al secuenciar productos PCR más largos que abarcan ambos flancos. 1.1.5 Terminación de la cepa ADS integrada y ensayo de sesquiterpeno Las cepas ADS triplemente integradas además genomanipularon al integrar una copia final de ADS marcada con un cásete URA (SEQ ID NO: 40) en el sitio His3 utilizando un protocolo estándar, y una cepa resultante se confirmó para esta cuarta, copia ("cepa D" ) . Finalmente, las células de la cepa D se pasaron a un medio no selectivo para perder el plásmido (pAM404) ("cepa E" ) farneseno sintasa de alta copia marcada con Leu+ .
Diversos aislados de la cepa E se analizaron para la producción de sesquiterpeno junto a la cepa D y la cepa B progenitora original. En resumen, los aislados de la cepas B, D y E se incubaron en pozos separados de una placa de 96 pozos que contienen 360 µL de Medio de Siembra Bird (BSM) con sacarosa al 2% por pozo (precultivo) . Después de 3 días de incubación a 33.5°C con agitación a 999 rpm, 14.4 µL de cada pozo se incubaron en un pozo de una nueva placa de 96 pozos que contiene 360 µL de BSM reciente con sacarosa al 4% (cultivo de producción) . Después de otros 2 días de incubación a 33.5°C con agitación a 999 rpm, se tomaron y analizaron muestras para la producción de sesquiterpeno mediante análisis por cromatografía de gases (GC) . Las muestras se extrajeron con metanol-he tano (1:1 v/v) , y las mezclas se centrifugaron para retirar el material celular. Una alícuota del extracto de metanol-heptano se diluyó en heptano, y luego se inyectó sobre una fase estacionaria de metilsilicona utilizando una inyección dividida por impulsos. El farneseno y amorfadieno se separaron por su punto de ebullición utilizando GC con detección de ionización de flama (FID) . Se utilizó trans-P-cariofileno como un marcador del tiempo de retención para monitorear la inyección exitosa y elución durante el perfil del horno GC especificado.
Como se muestra en la FIGURA 7, la producción de sesquiterpeno total permaneció casi idéntica (3-3.5 g/L) para todas las cepas, pero el perfil del producto se convirtió exitosamente del Farneseno (cepa B) al producto mezclado (cepa D) a amorfadieno (cepa E) .
Estos resultados demuestran que la inducción de múltiples rompimientos objetivo de doble hebra en el genoma de una célula huésped pueden facilitar integraciones simultáneas múltiples de un c sete genético funcional, al facilitar en este caso la conversión de una cepa que produce farneseno en una cepa que produce amorfadieno en una transformación simple. 7.4 Ejemplo 4: Sustitución simultánea de múltiples copias integradas de farneseno sintasa con amorfadieno sintasa Este Ejemplo proporciona resultados que demuestran el remplazo simultáneo de cuatro genes terpeno sintasa integrados genómicamente , facilitado por los rompimientos de la doble hebra inducidos por la nucleasa de diseño dentro de las regiones de codificación de sintasa. En resumen, una cepa de producción de farneseno existente, derivada de la cepa Y3639 (descrita en el Ejemplo 3) pero que comprende cuatro copias integradas en vez de extracromosómicas del gen farneseno sintasa (FS) , se co-transformó con un plásmido que codifica una nucleasa de diseño efectora de TAL (TALEN) y cuatro ADN donantes lineales que codifican nuevos genes terpeno sintasa. La TALEN de diseño es capaz de unirse a y escindir una secuencia única para los genes farneseno sintasa integrados. Las colonias transformadas se seleccionaron por PCR de colonia (cPCR) y se identificaron cepas con uno, dos o tres o cuatro lugares marcadores objetivo integrados genómicamente. 7.4.1. Construcción e Integración del ADN Objetivo Cuatro casetes de donantes, cada uno comprende una secuencia de codificación de terpeno sintasa flanqueada por regiones de homología (~500 pb) para sus sitios objetivo respectivos, se ensamblaron por PCR de superposición. Tres de los ADN donantes comprendieron secuencias de codificación ADS y marcador no seleccionable (SEQ ID NOs : 41-43), mientras el ADN donante final fue un cásete que comprende una optimización de codón novedosa de la farneseno sintasa (FS) fusinada a un cásete marcador URA3 (SEQ ID NO: 44) . Ninguno de los ADN donantes contenidos en el sitio objetivo se reconocieron por el TALEN específico para FS ( 5 ' -TAGTGGAGGAATTAAAAGAGGAAGTTAAGAAGGAATTGATAACTATCAA- 3 ' (SEQ ID NO:45) ) .
Para el remplazo de los cuatro casetes FS integrados en la cepa (Cepa F) , el plásmido TALEN hyg+ marcado se co- transformó en la cepa huésped junto con -500 ng de cada ADN donante lineal utilizando el protocolo descrito en el Ejemplo 3. Diversas diluciones se colocaron en placa sobre placas de CSM-URA + Hyg y se incubaron a 30 grados durante 3 días . 7.4.2. Confirmación de la Integración Múltiple Simultánea Después de la selección del plásmido TALEN e integración del cásete FS de codón marcado con URA3 en placas CSM-URA + Hyg, se realizó el PCR de colonia para determinar la frecuencia de reemplazo de los casetes FS integrados con los casetes ADS sin marcar en tres lugares. Se preparó el ADN a partir de 20 colonias y se probó con pares de cebadores específicos para la integración del cásete ADS en los lugares NDT80, DIT1 y ERGIO, de modo que la integración exitosa de la secuencia de codificación del cásete ADS en cada lugar se esperó para producir un amplicón de un tamaño previsto, mientas que no se esperó la integración para no producir amplicón.
Tabla 4. Secuencias de cebador para la verificación cPCR del remplazo de múltiples casetes de farneseno sintasa con casetes de amorfadieno sintasa.
Tres salidas de 48 clones examinados habían integrado un cásete ADS simple además del FS marcado con URA3 , un clon había integrado dos casetes ADS, y un clon había integrado los tres casetes ADS. Los resultados de la integración múltiple fueron confirmados aún más por la secuenciación de los productos PCR más largos que abarcaban ambos flancos.
Estos resultados demostraron que la expresión de un sitio específico de nucleasa de diseño en una célula huésped que comprende una ruta biosintética puede facilitar el reemplazo simultáneo de múltiples copias integradas de un gen de la ruta con nuevos genes de ruta en una etapa de transformación simple. 7.5 Ejemplo 5: Integración simultánea múltiple sin marcadores constructos de AND en dos lugares de corte con distintas nucleasas de diseño Este Ejemplo proporciona resultados que demuestran la integración simultánea de dos constructos de ADN sin marcadores en dos sitios objetivo sin tratamiento, cada sitio se cortó con una nucleasa de diseño distinta. En resumen, una cepa huésped ADE" se co-transformó con: (1) un fragmento de ADN lineal que comprende un cásete GFP (flanqueado por regiones homologas corriente arriba y corriente abajo para el lugar SFC1) ; (2) un fragmento ADN lineal que comprende un cásete ADE2 (flanqueado con regiones homologas corriente arriba y corriente abajo para el lugar YJR030c) ; y (3) plásmidos que codifican nucleasas de diseño que secuencias dirigidas en los marcos de lectura abierta SFC1 y YJR030c sin tratamiento, respectivamente. Después de la selección para los plásmidos, las colonias transformadas se seleccionaron visualmente para fluorescencia con GFP y para color blanco, indicando la complementación del fenotipo ADE" . Además se realizó la PCR (cPCR) de colonia para confirmar el remplazo de ambos lugares. De forma interesante, se observó una mejora significativa en el índice de integración en ambos sitios objetivo cuando se utilizaron las endonucleasas de diseño en combinación comparadas con el índice de integración cuando sólo se utilizó una nucleasa de diseño simple. 7.5.1. Construcción de los casetes de ADN donante Dos ADN donantes se generaron utilizando el ensamble PCR de fragmentos de superposición: (1) un fragmento de ADN lineal que comprende un cásete GFP flanqueado por ~500 pb de regiones homólogas corriente arriba y corriente abajo para el lugar SFC1 (SEQ ID NO: 58) ; y (2) un fragmento de ADN lineal que comprende un cásete ADE2 flanqueado por -500 pb de regiones homólogas corriente arriba y corriente abajo para el lugar YJR030C (SEQ ID NO: 59) . 7.5.2. Construcción de Plásmidos ZFN de Expresión heterodimérica Un plásmido que codifica la nucleasa de dedo de zinc (ZFN) específica de YJR030c se construyó de dos maneras. En la primera versión, los dos ORF de una ZFN heterodimérica bajo la expresión de un promotor Gall-10 divergente y terminada por los terminadores Adhl y CYC1 se clonaron en un vector CEN-ARS marcado con Kan por tres separaciones de reparación en la levadura (pCUT006) . Una segunda versión también se construyó en donde ambos ORF de la ZFN heterodimérica se expresaron a partir del promotor GallO como una ORF sencilla con los monómeros separados por una secuencia de ADN que codifica un enlazador peptidico escindible. Este segundo plásmido se construyó por una ligadura en tres partes utilizando enlazadores producidos por la enzima de restricción tipo IIS recopilada de fragmentos PCR en un esqueleto de vector CEN-ARS marcado con Kan (pCUT016) . Un plásmido que codifica la ZFN específica para SFCl también se construyó como una ORF sencilla utilizando la misma estrategia de enlazador, marcador y esqueleto (pCUT0l5) . El marcador entonces se cambió a URA por medio de una reacción de reparación de espacio en levadura (pCUT058) . Para construir un plásmido sencillo para la expresión de ambas nucleasas YJR030c y SFCl específicas, las ORF sencillas de pCUT16 y pCUT15 se subclonaron en un nuevo esqueleto de vector CEN-ARS Kan+, y se expresaron a partir del promotor Gall-10 divergente con los terminadores Cycl y Adhl (pCUT032) . 7.5.1. Transformación con ADN Donante e Inducción de Rompimientos de la Doble Hebra Se co-transformó un microgramo de cada ADN plásmido de la nucleasa íde diseño, o el plásmido que contiene ambas endonucleasas de diseño en un solo plásmido, con ~1 microgramo de cada uno de los ADN donantes . Todas las transformaciones se recuperaron durante la noche en YP + galactosa al 2% para inducir la expresión de nucleasa. Diversas diluciones se colocaron en placas de agar con URA defectuoso + Kan (para los plásmidos duales) o YPD + Kan para seleccionar en colonias transformadas con ADN plásmido. Las placas se incubaron durante 3-4 días a 30°C. 7.5.2. Confirmación de la Integración Múltiple Simultánea La integración sin marcador en el sitio SFC1 se registró por observación de fluorescencia de GFP bajo luz UV utilizando filtros apropiados. La integración sin marcador de ADE2 se calificó por observación de una colonia de color blanco, indicando la complementación del fenotipo de supresión ADE2 (colonias rosas) en la cepa huésped. En un experimento típico, se evaluaron 50-150 colonias. La estrategia de puntuación final se confirmó en un subconjunto de colonias por el PCR de colonia utilizando los cebadores 5' del constructo de integración y un cebador inverso interno. La integración en cada lugar se esperó para producir un amplicón de un tamaño previsto, mientras que no se esperó integración para no producir amplicón. Los resultados cPCR confirmaron la precisión del método de puntuación visual.
Tabla 4. Secuencias de cebador para la verificación exitosa cPCR de integración múltiple de la secuencia de codificación del cásete ADS Como se indicó en la FIGURA 8, en células co-transformadas con los ADN donantes lineales para los lugares SFC1 y YJR030c, y el plásmido de endonucleasa YJR030C (pCUT006) y el plásmido de endonucleasa SFC1 (pCUT058) , 80% de las colonias seleccionadas en URA defectuoso + placas de agar con Kan fueron GFP positivos. De estas colonias, 91% fueron positivas para la integración de ADE2. En total, 72.8% de las colonias tuvieron integrado el ADN donante en ambos lugares.
En células co-transformadas con ADN donante lineal para el lugar SFC1 y el plásmido de nucleasa de diseño dirigido SFC1 (pCUT015) , 50% de células fue positivas para GFP. Cuando las células se co-transformaron con ADN donante lineal para el lugar YJR030c y el plásmido de la nucleasa de diseño objetivo al lugar YJR030C (pCUT016) , sólo 5% de las células fue positivo para la integración de ADE2. Cuando las células huésped se co-transformaron con ADN lineales para los lugares SFC1 e YJR030c, y el plásmido de la nucleasa de diseño SFC1/YJR030C (pCUT032), 76% de las células fueron positivas a GFP, y 63% fueron positivas a ADE2. Este resultado es notable en que demuestra una mejora significativa inesperada en la eficacia de integración cuando sitios múltiples se dirigieron por las endonucleasas de diseño.
Estos resultados demuestran que la inducción de múltiples rompimientos de la doble hebra dirigidos en los sitios naturales en el genoma de una célula huésped pueden facilitar las integraciones sin marcador de modo simultáneo, múltiple, de los casetes de gen funcional.
Todas las publicaciones, patentes y solicitudes de patentes citadas en esta especificación se incorporan en la presente por referencia como si cada publicación individual o solicitud de patente se indicaran específica e individualmente para incorporarse por referencia. Aunque la invención precedente se ha descrito en cierto detalle a manera de ilustración y ejemplo para propósitos de claridad de entendimiento, será fácilmente aparente para aquel con experiencia ordinaria en la técnica en la luz de las enseñanzas de esta invención que ciertos cambios y modificaciones pueden hacerse sin apartarse del espíritu o alcance de las reivindicaciones anexas.

Claims (27)

REIVINDICACIONES
1. Un método para integrar simultáneamente en una pluralidad de sitios objetivo (n) de un genoma de la célula huésped, en donde n es al menos dos, el método caracterizado porque comprende: (a) poner en contacto una célula huésped con: (i) una pluralidad de ácidos nucleicos exógenos , en donde : x es un número entero que varía de 1 a n, y para cada número entero x, cada ácido nucleico exógeno (ES)X comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped de (ES)X en un sitio objetivo (TS)X se selecciona de la pluralidad de sitios objetivo (n) del genoma de una célula huésped; y (ii) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homologa de (ES)X en (TS)X; y (b) recuperar una célula huésped en donde cada ácido nucleico exógeno seleccionado (ES)X se ha integrado a cada sitio objetivo seleccionado (TS)X.
2. Una célula huésped caracterizada porque comprende : (a) una pluralidad de sitios genómicos objetivo (n) , en donde n es al menos dos; (b) una pluralidad de ácidos nucleicos exógenos (n) , en donde x es un número entero que varía de 1 a n, y para cada número entero x, cada ácido nucleico exógeno (ES)X comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)XÍ en donde (HR1)X y (HR2)X son capaces de iniciar la recombinación homologa mediada por células huésped de (ES)X en un sitio objetivo (TS)X seleccionado de la pluralidad de sitios genómicos objetivo (n) ; y (c) para cada sitio objetivo (TS)X> una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la combinación homologa de (ES)X en (TS)X.
3. Una célula huésped, caracterizada porque comprende : (a) una pluralidad de sitios genómicos objetivo (n) , en donde n es al menos dos; y (b) una pluralidad de ácidos nucleicos exógenos (n) , en donde x es un número entero que varía de 1 a n, y para cada número entero x, cada ácido nucleico exógeno (ES)X comprende una primera región de homología (HR1)X y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar la recombinación homologa mediada por células huésped de (ES)X en un sitio objetivo (TS)X seleccionado de la pluralidad de sitios genómicos objetivo (n) ; en donde cada sitio objetivo genómico (TS)X, comprende un rompimiento de doble hebra .
4. El método de conformidad con la reivindicación 1, o una célula huésped de la reivindicación 2 ó 3, caracterizado porque (HR1)X es homologa a una región 5' de (TS)X, y (HR2)X, es homologa a una región 3' de (TS)X.
5. El método de conformidad con la reivindicación 1, o una célula huésped de la reivindicación 2, caracterizado porque (N)x es capaz escindirse en una región colocada entre las regiones 5' y 3' de (TS)X.
6. El método de conformidad con la reivindicación l, o una célula huésped de la reivindicación 2, caracterizado porque una nucleasa simple es capaz de escindir cada (TS)X.
7. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1 a 6, caracterizado porque n = 3, 4, 5, 6, 7, 8, 9 ó 10.
8. El método de conformidad con cualquiera de las reivindicaciones 1 y 4 a 7, caracterizado porque, la recuperación no requiere integración de un marcador seleccionable .
9. El método de conformidad con cualquiera de las reivindicaciones 1 y 4 a 7, caracterizado porque la recuperación aparece en una alta frecuencia cuando se compara para no poner en contacto una célula huésped con una nucleasa capaz de escindirse en el sitio objetivo.
10. El método de conformidad con cualquiera de las reivindicaciones 1 y 4 a 7, caracterizado porque la recuperación ocurre en una alta frecuencia cada una seleccionada alrededor de 10, 9, 8, 7, 6, 5, 4, 3, o 2 células huésped en contacto, o poblaciones clónales de la misma .
11. El método de conformidad con cualquiera de las reivindicaciones 1, 2, y 4 a 10, caracterizado porque (N)x es, capaz de escindir una secuencia genómica endógena dentro de (TS)X.
12. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1, 2, y 4 a 10, caracterizado porque (N)x es capaz de escindir una secuencia exógena dentro de (TS)X.
13. El método o célula huésped de conformidad con la reivindicación 12, caracterizado porque la secuencia exógena es una secuencia de reconocimiento para una endonucleasa base.
14. El método o célula huésped de conformidad con la reivindicación 13, caracterizado porque la endonucleasa base es F-cphl.
15. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1 a 14, caracterizado 5 porque (ES)X comprende además un ácido nucleico (D)x de interés colocado en 3 ' de (HR1)X y 5' de (HR2)X.
16. El método o célula huésped de conformidad con la reivindicación 15, caracterizado porque (D)x se selecciona del grupo que consiste de un marcador seleccionable, un 10 promotor, una secuencia de aminoácidos que codifica un epítopo marcador, un gen de interés, un gen reportero, y una secuencia de ácidos nucleicos que codifica un codón de terminación .
17. El método o célula huésped de conformidad con 15 cualquiera de las reivindicaciones 1 a 16, caracterizado porque (ES)X es lineal.
18. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1, 2 y 4 a 17, caracterizado porque (N)x se proporciona como un vector de '20 expresión que comprende una secuencia de aminoácidos que codifica (N)x.
19. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1, 2 y 4 a 18, caracterizado porque (N)x se selecciona del grupo que 25 consiste de una endonucleasa, una nucleasa de dedo de zinc, una proteína de fusión de dominio de nucleasa (TALEN) unida al ADN efector de TAL, una transposasa, y una recombinasa de sitio específico.
20. El método o célula huésped de conformidad con la reivindicación 19, caracterizado porque la endonucleasa se modifica al unir específicamente una secuencia genómica endógena, en donde la endonucleasa modificada no siempre se une a su secuencia de reconocimiento de endonucleasa tipo silvestre.
21. El método o célula huésped de conformidad con la reivindicación 19 ó 20, caracterizado porque la endonucleasa es una endonucleasa base seleccionada del grupo que consiste de: una endonucleasa base de LAGLIDADG, una endonucleasa base de HNH, una endonucleasa base en bloque His-Cys, una endonucleasa base GIY-YIG, y una endonucleasa base cianobacteriana .
22. El método o célula huésped de conformidad con la reivindicación 19 ó 20, caracterizado porque la endonucleasa se deriva de una endonucleasa seleccionada del grupo que consiste de: H-Drel, I-Scel, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ceul, I-CeuAIIP, I-Creí, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-Tlil, I-Ppol, Pi-PspI, F-Scel, F-SceII, F-SuvI, F-Cphl, F-TevI, F-TevII, I-Amal, I-Anil, I-ChuI, I-Cmoel, I-Cpal, I-CpaII, I-Csml, I-Cvul, I-CvuAIP, I-Ddil, ?-DdiII, I-Dirl, I-Dmol, I-Hmul, I-HmuII, I-HsNIP, I-Llal, I-Msol, I-Naal, I-Nanl, I-NclIP, I-NgrIP, I-Nitl, I-Njal, I-Nsp236IP, I-Pakl, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-Porl, 1-PorIIP, I-PbpIP, I-SpBetaIP, I-Scal, I-SexIP, I-SneIP, I-Spoml, I-SpomCP, 1-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, ?-TdeIP, I-Tevl, I-TevII, I-TevIII, i-UarAP, i-UarHGPAIP, I-UarHGPA13P, I-VinIP, ?-ZbiIP, PI-Mgal, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, Pl-Pkol, PI-PkoII, PI-Rma43812IP, PI-SpBetalP, PI-SceI, PI-TfuI, PI-TfuII, PI-Thyl, PI-Tlil, o PI-Tlill.
23. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1 a 22, caracterizado porque la célula huésped se selecciona del grupo que consiste de una célula de hongo, una célula bacteriana, una célula vegetal, y una célula animal.
24. El método o célula huésped de conformidad con cualquiera de las reivindicaciones 1 a 23, caracterizado porque una célula huésped es una célula de levadura.
25. El método o célula huésped de conformidad con la reivindicación 24, caracterizado porque una célula de levadura es una célula de Saccharomyces cerevisiae .
26. Un método para integrar simultáneamente una pluralidad de ácidos nucleicos exógenos (n) en una pluralidad de sitios objetivo (n) de un genoma de la célula huésped, en donde n es al menos dos, el método caracterizado porque comprende : (a) contactar simultáneamente una célula huésped con: (i) una pluralidad de bibliotecas, en donde x en un número entero que varía de 1 a n, y para cada número entero x, cada biblioteca (L)x comprende una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno seleccionado comprende, en una orientación 5' a 3', una primera región de homología (HR1)X, cualquier ácido nucleico de interés seleccionado del grupo (D)x, y una segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped del ácido nucleico exógeno seleccionado en un sitio objetivo (TS)X del genóma de una célula huésped; y (ii) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindirse en (TS)X, después de lo cual la escisión resulta en la recombinación homologa del ácido nucleico exógeno de (L)x en (TS)X; y (b) recuperar una célula huésped en donde un ácido nucleico exógeno de cada biblioteca (L)x se ha integrado en cada secuencia objetivo seleccionada (TS)X.
27. Una célula huésped, caracterizada porque comprende: (a) una pluralidad de sitios genómicos objetivo (n) , en donde n es al menos dos; (b) una pluralidad de librerías, en donde x es un número entero que varía de 1 a n, t para cada número entero x, cada biblioteca (L)x comprende una pluralidad de ácidos nucleicos exógenos, en donde cada ácido nucleico exógeno comprende en una orientación de 5 ' a 3 ' , una primera región de homología (HR1)X, cualquier ácido nucleico de interés seleccionado del grupo (D)x, y una' segunda región de homología (HR2)X, en donde (HR1)X y (HR2)X son capaces de iniciar una recombinación homologa mediada por una célula huésped del ácido nucleico exógeno seleccionado en un sitio objetivo (TS)X, del genoma de una célula huésped; y (c) para cada sitio objetivo (TS)X, una nucleasa (N)x capaz de escindir en (TS)X, después de lo cual la escisión resulta en una recombinación homologa de un ácido nucleico exógeno de (L)x en (TS)X. RESUMEN DE LA INVENCIÓN Se proporcionan en la presente métodos para integrar uno o más ácidos nucleicos exógenos en una o más sitio objetivo seleccionados de un genoma de la célula huésped. En ciertas modalidades, el método comprende poner en contacto un genoma de la célula huésped con una o más polinucleótidos de integración que comprende un ácido nucleico exógeno para integrarse en un sitio genómico objetivo, y una nucleasa capaces de provocar un rompimiento de la doble hebra cerca o dentro del sitio genómico objetivo.
MX2013012479A 2011-04-27 2012-04-27 Metodos para modificacion genomica. MX351043B (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161479821P 2011-04-27 2011-04-27
US201161500741P 2011-06-24 2011-06-24
US201161539389P 2011-09-26 2011-09-26
PCT/US2012/035657 WO2012149470A1 (en) 2011-04-27 2012-04-27 Methods for genomic modification

Publications (2)

Publication Number Publication Date
MX2013012479A true MX2013012479A (es) 2014-01-31
MX351043B MX351043B (es) 2017-09-29

Family

ID=46051948

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013012479A MX351043B (es) 2011-04-27 2012-04-27 Metodos para modificacion genomica.

Country Status (13)

Country Link
US (3) US8685737B2 (es)
EP (1) EP2702160B1 (es)
JP (2) JP6158170B2 (es)
KR (1) KR102068107B1 (es)
CN (1) CN103492578B (es)
AU (2) AU2012249390B2 (es)
BR (1) BR112013025567B1 (es)
CA (1) CA2834375C (es)
MX (1) MX351043B (es)
PT (1) PT2702160T (es)
SG (1) SG194089A1 (es)
WO (1) WO2012149470A1 (es)
ZA (1) ZA201307225B (es)

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013025567B1 (pt) * 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10813630B2 (en) 2011-08-09 2020-10-27 Corquest Medical, Inc. Closure system for atrial wall
US10307167B2 (en) 2012-12-14 2019-06-04 Corquest Medical, Inc. Assembly and method for left atrial appendage occlusion
US10314594B2 (en) 2012-12-14 2019-06-11 Corquest Medical, Inc. Assembly and method for left atrial appendage occlusion
WO2013074916A1 (en) 2011-11-18 2013-05-23 Board Of Regents, The University Of Texas System Car+ t cells genetically modified to eliminate expression of t- cell receptor and/or hla
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9213944B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Trio-based phasing using a dynamic Bayesian network
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
US20140142689A1 (en) 2012-11-21 2014-05-22 Didier De Canniere Device and method of treating heart valve malfunction
PT2896697E (pt) * 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
CN105658796B (zh) * 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
KR20140109183A (ko) * 2013-03-05 2014-09-15 삼성전자주식회사 다중 유전자 삽입 기술을 이용한 유전자 재조합 균주 제작 방법
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
CN105338805A (zh) * 2013-03-15 2016-02-17 希博斯美国有限公司 采用寡核苷酸介导的基因修复提高靶向基因修饰的效率的方法和组合物
WO2014169810A1 (zh) * 2013-04-16 2014-10-23 深圳华大基因科技服务有限公司 分离的寡核苷酸及其用途
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
EP3011029B1 (en) 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
JP6702858B2 (ja) 2013-06-17 2020-06-03 ザ・ブロード・インスティテュート・インコーポレイテッド ウイルス成分を使用して障害および疾患をターゲティングするためのCRISPR−Cas系および組成物の送達、使用および治療上の適用
US20150044192A1 (en) * 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
KR101735697B1 (ko) 2013-10-07 2017-05-24 서울대학교산학협력단 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법
WO2015053510A1 (ko) * 2013-10-07 2015-04-16 서울대학교산학협력단 이종 시스템에서 (-)-α-비사보롤을 생산하는 방법
US9566443B2 (en) 2013-11-26 2017-02-14 Corquest Medical, Inc. System for treating heart valve malfunction including mitral regurgitation
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
CN111206032A (zh) 2013-12-12 2020-05-29 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
SG10201804973TA (en) 2013-12-12 2018-07-30 Broad Inst Inc Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
KR102274445B1 (ko) * 2013-12-19 2021-07-08 아미리스 인코퍼레이티드 게놈 삽입을 위한 방법
MX2016010285A (es) * 2014-02-11 2017-01-11 Univ Colorado Regents Ingenieria genetica multiplexada habilitada por crispr.
WO2015164748A1 (en) 2014-04-24 2015-10-29 Sangamo Biosciences, Inc. Engineered transcription activator like effector (tale) proteins
CA2946881A1 (en) * 2014-04-28 2015-11-05 Recombinetics, Inc. Multiplex gene editing in swine
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
CN105331604A (zh) * 2014-05-29 2016-02-17 中国科学院上海生命科学研究院 一种dna构建物以及dna体外拼接方法
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2967027A1 (en) * 2014-11-12 2016-05-19 Recombinetics, Inc. Heterozygous modifications of tumor suppressor genes
US11352666B2 (en) 2014-11-14 2022-06-07 Institute For Basic Science Method for detecting off-target sites of programmable nucleases in a genome
JP6621820B2 (ja) * 2014-11-14 2019-12-18 インスティチュート フォー ベーシック サイエンスInstitute For Basic Science ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法
CN105713885B (zh) * 2014-12-04 2019-06-11 清华大学 特异识别并修复β地中海贫血症beta-globin基因的嵌合核酸酶
US10842626B2 (en) 2014-12-09 2020-11-24 Didier De Canniere Intracardiac device to correct mitral regurgitation
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
US11673928B2 (en) 2015-03-03 2023-06-13 Regents Of The University Of Minnesota Genetically modified pig cells with an inactivated Etv2 gene
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
CN108290933A (zh) 2015-06-18 2018-07-17 布罗德研究所有限公司 降低脱靶效应的crispr酶突变
AU2016284689B9 (en) 2015-06-25 2022-01-20 Amyris, Inc. Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds
AU2016288196A1 (en) 2015-06-30 2018-02-01 Regents Of The University Of Minnesota Humanized skeletal muscle
WO2017004388A1 (en) 2015-06-30 2017-01-05 Regents Of The University Of Minnesota Humanized heart muscle
US20170000743A1 (en) * 2015-07-02 2017-01-05 Vindico NanoBio Technology Inc. Compositions and Methods for Delivery of Gene Editing Tools Using Polymeric Vesicles
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
WO2017075538A1 (en) 2015-10-29 2017-05-04 Amyris, Inc. Compositions and methods for production of myrcene
BR112018011503A2 (pt) 2015-12-07 2018-12-04 Zymergen Inc promotores da corynebacterium glutamicum
CA3105722C (en) * 2015-12-07 2022-10-11 Zymergen Inc. Microbial strain improvement by a htp genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
EP4089166A1 (en) 2016-01-27 2022-11-16 Oncorus, Inc. Oncolytic viral vectors and uses thereof
US20190249172A1 (en) 2016-02-18 2019-08-15 The Regents Of The University Of California Methods and compositions for gene editing in stem cells
JP2019515654A (ja) 2016-03-16 2019-06-13 ザ ジェイ. デヴィッド グラッドストーン インスティテューツ 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物
ES2865481T3 (es) 2016-04-29 2021-10-15 Poseida Therapeutics Inc Micelas basadas en poli(histidina) para la complejación y el aporte de proteínas y ácidos nucleicos
EP4219731A3 (en) * 2016-05-18 2023-08-09 Amyris, Inc. Compositions and methods for genomic integration of nucleic acids into exogenous landing pads
CN107513538A (zh) * 2016-06-17 2017-12-26 北京大学 基因敲除方法
WO2018005655A2 (en) 2016-06-30 2018-01-04 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof
JP2019519241A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド グルコース透過酵素ライブラリーを生成するための方法およびその使用
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US10576167B2 (en) * 2016-08-17 2020-03-03 Factor Bioscience Inc. Nucleic acid products and methods of administration thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
AU2017378427A1 (en) 2016-12-14 2019-06-20 Ligandal, Inc. Methods and compositions for nucleic acid and protein payload delivery
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US12016313B2 (en) 2017-01-19 2024-06-25 Omniab Operations, Inc. Human antibodies from transgenic rodents with multiple heavy chain immunoglobulin loci
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
JP6990385B2 (ja) * 2017-05-16 2022-02-03 国立大学法人 長崎大学 多重遺伝子導入手法
US20200370058A1 (en) * 2017-06-06 2020-11-26 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
HRP20220615T1 (hr) 2017-06-30 2022-06-24 Inscripta, Inc. Postupci, moduli, instrumenti i sustavi za automatiziranu obradu stanica
RU2771110C2 (ru) 2017-07-26 2022-04-26 Онкорус, Инк. Онколитические вирусные векторы и их применение
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3684927B1 (en) 2017-09-18 2024-05-29 Amyris, Inc. Methods for genomic integration for kluyveromyces host cells
CN111356766A (zh) 2017-09-18 2020-06-30 阿迈瑞斯公司 用于遗传工程改造克鲁维酵母宿主细胞的方法
EP3687621A4 (en) 2017-09-30 2021-08-11 Inscripta, Inc. CONTINUOUS FLOW ELECTROPORATION INSTRUMENTATION
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
GB201720351D0 (en) 2017-12-06 2018-01-17 Iontas Ltd Selecting for developability in drug discovery
WO2020047138A1 (en) * 2018-08-29 2020-03-05 Amyris, Inc. Cells and methods for selection based assay
BR112021005115A2 (pt) * 2018-09-20 2021-06-15 Sanofi métodos e composições de clonagem universal baseada em íntron
US20220145330A1 (en) 2019-02-10 2022-05-12 The J. David Gladstone Institutes, a testamentary trust established under the Will of J. David Glads Modified mitochondrion and methods of use thereof
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
US10501404B1 (en) 2019-07-30 2019-12-10 Factor Bioscience Inc. Cationic lipids and transfection methods
WO2021100731A1 (ja) * 2019-11-19 2021-05-27 国立大学法人 長崎大学 Cas9ヌクレアーゼを用いて相同組み換えを誘導する方法
CN111154704B (zh) * 2020-03-30 2023-04-11 河南巨龙生物工程股份有限公司 一株粘质沙雷氏菌突变株以及发酵生产组氨酸的方法
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
CA3229003A1 (en) 2021-08-25 2023-03-02 Kothai Nachiar Devi PARTHIBAN Preparation of libraries of protein variants expressed in eukaryotic cells
WO2023228969A1 (ja) * 2022-05-25 2023-11-30 キッコーマン株式会社 遺伝子導入のための糸状菌

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5272065A (en) 1983-10-20 1993-12-21 Research Foundation Of State University Of New York Regulation of gene expression by employing translational inhibition of MRNA utilizing interfering complementary MRNA
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
ATE222289T1 (de) 1995-06-07 2002-08-15 Invitrogen Corp Rekombinatorische klonierung in vitro unter verwendung genmanipulierter rekombinationsorte
JP4206154B2 (ja) 1997-11-13 2009-01-07 大日本住友製薬株式会社 変異型loxP配列とその応用
DE69833457T2 (de) 1997-11-18 2006-09-14 Pioneer Hi-Bred International, Inc. Neuartige methode zur integration von fremd-dna ins eukaryotische genom
US5929301A (en) 1997-11-18 1999-07-27 Pioneer Hi-Bred International Nucleic acid sequence encoding FLP recombinase
AU760113C (en) 1997-11-18 2004-04-22 Pioneer Hi-Bred International, Inc. Compositions and methods for genetic modification of plants
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7398262B1 (en) 1999-06-18 2008-07-08 Multex.Com, Inc. Method and system for referencing, archiving and retrieving symbolically linked information
CA2379115C (en) 1999-07-23 2011-04-26 The Regents Of The University Of California Dna recombination in eukaryotic cells by the bacteriophage phic31 recombination system
AU6529900A (en) 1999-08-09 2001-03-05 Monsanto Technology Llc Novel cloning methods and vectors
AU7447000A (en) 1999-09-30 2001-04-30 Izumu Saito Dna containing variant frt sequences
EP2210948A3 (en) * 1999-12-10 2010-10-06 Life Technologies Corporation Use of multiple recombination sites with unique specificity in recombinational cloning
AU2001257331A1 (en) 2000-04-28 2001-11-12 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
US6503712B1 (en) 2000-05-10 2003-01-07 Amgen Inc. Methods and compositions for preparing a genomic library for knockout targeting vectors
US20030082561A1 (en) 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
AT5356U1 (de) 2001-07-16 2002-06-25 Uv & P Umweltman Verfahrenstec Verfahren zur immobilisierung von verbrennungsrückständen
AU2002319696B2 (en) 2001-07-27 2007-11-01 The Government Of The United States Of America As Represented By The Secretary Of Health And Human Services Systems for in vivo site-directed mutagenesis using oligonucleotides
WO2009095742A1 (en) 2008-01-31 2009-08-06 Cellectis New i-crei derived single-chain meganuclease and uses thereof
DE60316124T3 (de) 2002-03-15 2018-03-22 Cellectis Hybride and einzelkettige meganukleasen und deren anwendungen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
AU2003290518A1 (en) 2002-09-06 2004-04-23 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
AU2004208031B2 (en) 2003-01-28 2009-10-08 Cellectis Use of meganucleases for inducing homologous recombination ex vivo and in toto in vertebrate somatic tissues and application thereof.
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
DK2927318T3 (da) 2003-08-08 2020-08-03 Sangamo Therapeutics Inc Fremgangsmåde og sammensætninger til målrettet spaltning og rekombination
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
WO2007034262A1 (en) 2005-09-19 2007-03-29 Cellectis Heterodimeric meganucleases and use thereof
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
US20110158974A1 (en) 2005-03-15 2011-06-30 Cellectis Heterodimeric Meganucleases and Use Thereof
WO2007060495A1 (en) 2005-10-25 2007-05-31 Cellectis I-crei homing endonuclease variants having novel cleavage specificity and use thereof
WO2007049095A1 (en) 2005-10-25 2007-05-03 Cellectis Laglidadg homing endonuclease variants having mutations in two functional subdomains and use thereof
WO2007140339A2 (en) * 2006-05-26 2007-12-06 Amyris Biotechnologies, Inc. Production of isoprenoids
CA2660485C (en) 2006-08-11 2016-04-12 Sangamo Biosciences, Inc. Zinc finger nuclease-mediated homologous recombination
WO2009001159A1 (en) 2007-06-25 2008-12-31 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
NZ581396A (en) * 2007-06-01 2012-07-27 Omt Inc Compositions and methods for inhibiting endogenous immunoglobulin genes and producing transgenic human idiotype antibodies
WO2008152524A2 (en) 2007-06-06 2008-12-18 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
JP2010539931A (ja) 2007-09-27 2010-12-24 サンガモ バイオサイエンシーズ, インコーポレイテッド ジンクフィンガーヌクレアーゼを使用したゼブラフィッシュにおけるゲノム編集
DK2205749T3 (en) 2007-09-27 2016-08-22 Dow Agrosciences Llc MODIFIED PROTEINS zinc finger, which target the 5-enolpyruvylshikimate-3-phosphate synthase genes
EP2205752B1 (en) 2007-10-25 2016-08-10 Sangamo BioSciences, Inc. Methods and compositions for targeted integration
WO2010001189A1 (en) 2008-07-03 2010-01-07 Cellectis The crystal structure of i-dmoi in complex with its dna target, improved chimeric meganucleases and uses thereof
EP2329017A2 (en) 2008-08-04 2011-06-08 Cellectis Novel method to generate meganucleases with altered characteristics
EP2180058A1 (en) 2008-10-23 2010-04-28 Cellectis Meganuclease recombination system
BRPI0922187B1 (pt) 2008-11-19 2021-05-04 Amyris, Inc Métodos para gerar um polinucleotídeo e para gerar uma célula hospedeira
ES2627552T3 (es) 2008-12-04 2017-07-28 Sigma Aldrich Company Edición de genoma en ratas usando nucleasas con dedos de cinc
KR20100080068A (ko) * 2008-12-31 2010-07-08 주식회사 툴젠 신규한 징크 핑거 뉴클레아제 및 이의 용도
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
CN102770539B (zh) * 2009-12-10 2016-08-03 明尼苏达大学董事会 Tal效应子介导的dna修饰
US7919605B1 (en) * 2010-08-30 2011-04-05 Amyris, Inc. Nucleic acids, compositions and methods for the excision of target nucleic acids
BR112013025567B1 (pt) * 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica

Also Published As

Publication number Publication date
CN103492578A (zh) 2014-01-01
AU2012249390A1 (en) 2013-12-12
BR112013025567B1 (pt) 2021-09-21
US20120277120A1 (en) 2012-11-01
AU2017204456A1 (en) 2017-07-20
US8685737B2 (en) 2014-04-01
CA2834375C (en) 2020-07-14
AU2017204456B2 (en) 2019-08-15
US9701971B2 (en) 2017-07-11
PT2702160T (pt) 2020-07-30
JP2017042173A (ja) 2017-03-02
EP2702160B1 (en) 2020-05-27
MX351043B (es) 2017-09-29
JP2014513535A (ja) 2014-06-05
JP6158170B2 (ja) 2017-07-12
US20140186942A1 (en) 2014-07-03
US20170240923A1 (en) 2017-08-24
JP6527126B2 (ja) 2019-06-05
SG194089A1 (en) 2013-11-29
WO2012149470A1 (en) 2012-11-01
CA2834375A1 (en) 2012-11-01
BR112013025567A2 (pt) 2020-11-17
EP2702160A1 (en) 2014-03-05
KR20140027354A (ko) 2014-03-06
ZA201307225B (en) 2014-12-23
KR102068107B1 (ko) 2020-01-20
AU2012249390B2 (en) 2017-03-30
CN103492578B (zh) 2016-10-19

Similar Documents

Publication Publication Date Title
AU2017204456B2 (en) Methods for genomic modification
US11390888B2 (en) Methods for genomic integration
US20220251606A1 (en) Compositions and methods for genomic integration of nucleic acids into exogenous landing pads

Legal Events

Date Code Title Description
FG Grant or registration