ES2445565T3 - Método para generar mosaicos de genes - Google Patents
Método para generar mosaicos de genes Download PDFInfo
- Publication number
- ES2445565T3 ES2445565T3 ES11715196.9T ES11715196T ES2445565T3 ES 2445565 T3 ES2445565 T3 ES 2445565T3 ES 11715196 T ES11715196 T ES 11715196T ES 2445565 T3 ES2445565 T3 ES 2445565T3
- Authority
- ES
- Spain
- Prior art keywords
- gene
- genes
- cell
- sequence
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1027—Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Ecology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
Un método para generar un mosaico de genes mediante recombinación somática in vivo de secuencias deADN homeólogas, que comprende a) en un procedimiento de una sola etapa, (i) transformar 5 una célula que carece de reparación de ADN con al menos un gen A que tiene unahomología de secuencia de al menos 30% y menos de 99,5% con otro gen que se va a recombinar quees una parte integral del genoma celular o está presente en el armazón de una estructura artificialgenética, empleando al menos un gen B que se va a recombinar, (ii) recombinar dichos genes, (iii) generar un mosaico génico de los genes en un sitio de integración de un genoma diana,en donde dicho al menos un gen A tiene una única secuencia diana flanqueante en el extremo 5' o elextremo 3' que se ancla al extremo 5' o al extremo 3' de dicho sitio de integración, en donde lasecuencia diana flanqueante única del gen A está anclada al extremo 5' del sitio de integraciónmientras que el gen B tiene una secuencia diana flanqueante única que se ancla al extremo 3', y b) seleccionar los clones que comprenden al menos un mosaico de genes intragénico.
Description
Método para generar mosaicos de genes
La invención se refiere a métodos para generar mosaicos de genes mediante recombinación homeóloga in vivo.
5 Uno de los principales objetivos del diseño de proteínas es generar proteínas con nuevas propiedades o mejoradas. La capacidad para conferir una actividad deseada a una proteína o enzima tiene una aplicación práctica considerable en la industria química y farmacéutica. La evolución dirigida de proteínas ha emergido como una plataforma tecnológica de gran alcance en la ingeniería de proteínas, en donde en genotecas de variantes se buscan experimentalmente clones que poseen las propiedades deseadas.
10 La evolución dirigida de proteínas aprovecha el poder de la selección natural para evolucionar proteínas o ácidos nucleicos con propiedades deseables que no se encuentran en la naturaleza. Se utilizan diversas técnicas para la generación de proteínas mutantes y variantes, y la selección de funciones deseables. Tecnologías de ADN recombinante han permitido la transferencia de genes estructurales individuales o de genes para una ruta completa, a un hospedador representativo adecuado para una propagación rápida y/o una producción superior de proteínas.
15 Mejoras acumuladas en la actividad o de otras propiedades se obtienen generalmente a través de repeticiones de mutaciones y selección. Las aplicaciones de la evolución dirigida se destinan principalmente a laboratorios experimentales e industriales, para mejorar la estabilidad proteica y mejorar la actividad o el rendimiento general de enzimas y organismos, o para alterar la especificidad de un sustrato enzimático y para diseñar nuevas actividades. La mayoría de los proyectos de evolución dirigida buscan evolucionar propiedades que son útiles para los seres
20 humanos en un contexto agrícola, médico o industrial (biocatálisis).
La evolución de rutas metabólicas completas es un concepto particularmente atractivo, porque la mayoría de los compuestos naturales y novedosos son producidos por rutas en lugar de por enzimas individuales. La modificación genética de rutas metabólicas por lo general requiere la manipulación coordinada de todas las enzimas de la ruta. La evolución de nuevas rutas metabólicas y la mejora del bioprocesamiento normalmente se realiza a través de un
25 procedimiento de ciclos repetitivos de recombinación y escrutinio o selección para evolucionar genes individuales, plásmidos enteros, agrupamientos multigénicos o incluso genomas enteros.
Shao et al. (Nucleic Acids Research 37(2):e16 Epub 12 de diciembre 2008) describen el ensamblaje de ADN recombinante largo que codifica una ruta bioquímica completa o un genoma en una sola etapa a través de la recombinación homóloga in vivo de dos regiones flanqueantes (anclaje) en los extremos 5’ y 3’ que contienen
30 secuencias del extremo 5’ o 3’ del fragmento adyacente en Saccharomyces cerevisiae.
Elefanty et al. (Proc. Natl. Acad. Sci. 95, 11897-11902 (1998)) describen experimentos de direccionamiento de genes para generar ratones mutantes, en donde el gen informador lacZ se ha inactivado en el locus SCL. Se hace referencia a la Fig. 1 que muestra la estrategia de direccionamiento de genes para SCL-lacZ empleando dos secuencias de anclaje, es decir, una en cada uno de los extremos 5’ y 3’.
35 La evolución dirigida se puede realizar en células vivas, también llamada evolución in vivo, o puede no implicar células en absoluto (evolución in vitro). La evolución in vivo tiene la ventaja de seleccionar características en un entorno celular, que es útil cuando la proteína o el ácido nucleico evolucionado se va a utilizar en organismos vivos. La recombinación homóloga in vivo en levadura ha sido ampliamente utilizada para la clonación de genes, la construcción de plásmidos y la creación de genotecas.
40 La diversidad de una genoteca se obtiene a través de mutagénesis o recombinación. La transposición de ADN permite la recombinación directa de mutaciones beneficiosas procedentes de múltiples genes. En la transposición de ADN, una población de secuencias de ADN se fragmentan al azar y a continuación se vuelven a ensamblar en secuencias híbridas de longitud completa.
A los efectos de la recombinación homóloga, se utilizan genes homólogos presentes en la naturaleza como fuente
45 para iniciar la diversidad. Los miembros de una genoteca de transposición de un solo gen son idénticos típicamente en más del 95%. La transposición de familias, sin embargo, permite el intercambio en bloque de secuencias que son idénticas típicamente en más del 60%. La diversidad funcional de la secuencia proviene de secuencias parentales relacionadas que han sobrevivido a la selección natural; por lo tanto, se tolera un número mucho mayor de mutaciones en una secuencia dada, que no introducen efectos perjudiciales en la estructura o la función.
50 La recombinación de fragmentos de ADN de origen diferente, con hasta un 30% de diversidad se describe en el documento WO1990007576A1. Se producen genes híbridos in vivo mediante recombinación intergenérica y/o interespecífica en bacterias que carecen de reparación de apareamientos erróneos o en bacterias en las que el sistema de reparación de apareamientos erróneos (MMR) está inactivado transitoriamente. De esta manera se evitan los procesos a través de los cuales se repara el ADN dañado, lo que tendría un efecto inhibidor sobre la
55 frecuencia de la recombinación entre secuencias divergentes, es decir, la recombinación homeóloga.
Una revisión de los mecanismos básicos de la MMR es proporcionada por Kunz et al. (Cell. Mol. Life Sci. 66 (2009) 1021-1038)).
Una recombinación homeóloga dirigida se describe en plantas carentes de MMR (documento WO2006/134496A2). El direccionamiento a un locus con secuencias que tienen hasta 10% de diferencias era posible.
La recombinación homóloga en bacterias para la generación de genotecas de polinucleótidos se describe en el documento WO03/095658A1. Se generó una genoteca de expresión de polinucleótidos, en la que cada polinucleótido se integra mediante recombinación homóloga en el genoma de una célula hospedadora bacteriana competente, usando un casete de integración lineal no replicante que comprende el polinucleótido y dos secuencias flanqueantes homólogas a una región del genoma de la célula hospedadora.
La diversidad de las genotecas se puede mejorar aprovechando la capacidad de las células haploides para aparearse de manera eficaz, lo que lleva a la formación de un organismo diploide. En su ciclo de vida vegetativa las células de S. cerevisiae tienen un genoma haploide, es decir, cada cromosoma está presente como una sola copia. En ciertas condiciones, las células haploides pueden aparearse. De esta manera se forma una célula diploide. Las células diploides pueden formar células haploides de nuevo, especialmente cuando faltan ciertos nutrientes. A continuación, se someten a un proceso llamado meiosis seguido de esporulación, para formar cuatro esporas haploides. Durante la meiosis los diferentes cromosomas de los dos genomas parentales, se recombinan. Durante la recombinación meiótica, se intercambian fragmentos de ADN dando como resultado un material de ADN recombinado.
El documento WO2005/075654A1 da a conocer un sistema para generar secuencias de ADN recombinante en Saccharomyces cerevisiae, que se basa en el ciclo reproductivo sexual de S. cerevisiae. Células diploides heterocigotas se cultivan en condiciones que inducen los procesos de meiosis y formación de esporas. La meiosis se caracteriza generalmente por frecuencias elevadas de recombinación genética. Por lo tanto, los productos de la meiosis, que son células haploides o esporas, pueden contener secuencias de ADN recombinante debido a la recombinación entre las dos secuencias de ADN divergente. A través de un método iterativo, se selecciona la progenie haploide recombinante y se aparea entre sí, los diploides resultantes esporulan de nuevo, y las esporas de su progenie se someten a unas condiciones de selección apropiadas para identificar nuevos eventos de recombinación. Este proceso se describe en células de S. cerevisiae de tipo silvestre o que carecen de una reparación de los apareamientos erróneos. Por lo tanto, los genes de interés, en donde cada uno está flanqueado por dos marcadores de selección, se integran en un locus idéntico en cada uno de los dos cromosomas hermanos de cepas diploides que carecen de una reparación de los apareamientos erróneos. Las secuencias de ADN se añaden al extremo 5’ o 3’ del nuevo fragmento de ADN y son 100% idénticas a las secuencias de ADN flanqueantes del locus en el que el ADN se va a integrar. Estas secuencias diana flanqueantes tienen una longitud de aproximadamente 400-450 nucleótidos. A continuación, las células se fuerzan para que inicien la esporulación. Durante la esporulación, tiene lugar el proceso de recombinación. Las esporas resultantes y las secuencias recombinantes se pueden diferenciar mediante selección de los marcadores flanqueantes apropiados.
La capacidad de la levadura para recombinar de manera eficaz secuencias de ADN homólogas, también se puede aprovechar para aumentar la diversidad de una genoteca. Cuando dos genes que comparten 89,9% de homología se mutaron mediante PCR y se transformaron en levadura de tipo silvestre, se creó una genoteca quimérica 10e7 a través de recombinación homóloga in vivo, que muestra varios puntos de entrecruzamiento a lo largo de los dos genes (Swers et al. Nucleic Acids Research 32(3) e36 (2004)).
Un método de recombinación mitótica homeóloga ha sido descrito por Nicholson et al. (Genetics 154: 133-146 (2000)). Se investigaron los efectos de apareamientos erróneos definidos contenidos en repeticiones invertidas cortas, sobre la tasa de recombinación en cepas de tipo silvestre o carentes de MMR.
El objeto de la presente invención es proporcionar un método mejorado para la preparación y el ensamblaje de una diversidad de mosaicos de genes, especialmente para recombinar fragmentos de ADN largos. Como resultado, sería deseable proporcionar genotecas de respectivas variantes para la selección de recombinantes mejorados.
El objeto se consigue poniendo a disposición las realizaciones de la presente solicitud.
Compendio de la invención
La presente invención proporciona un nuevo método para la generación de un mosaico de genes mediante recombinación somática in vivo de secuencias de ADN homeólogas, que comprende
1. a) en un procedimiento de una solo etapa,
- (i)
- transformar una célula que carece de reparación de ADN con al menos un gen A que tiene una homología de secuencia de al menos 30% y menos de 99,5% con otro gen que se va a recombinar que es una parte integral del genoma celular o está presente en el armazón de una estructura artificial genética, empleando al menos un gen B que se va a recombinar,
- (ii)
- recombinar dichos genes,
(iii) generar un mosaico génico de los genes en un sitio de integración de un genoma diana,
en donde dicho al menos un gen A tiene una única secuencia diana flanqueante en el extremo 5’ o el extremo 3’ que se ancla al extremo 5’ o al extremo 3’ de dicho sitio de integración, en donde la secuencia diana flanqueante única del gen A está anclada al extremo 5’ del sitio de integración mientras que el gen B tiene una secuencia diana flanqueante única que se ancla al extremo 3’, y
2. b) seleccionar los clones que comprenden al menos un mosaico de genes intragénico.
Específicamente, se prefiere un método para generar un mosaico de genes mediante recombinación somática in vivo, que comprende
1. a) en un procedimiento de una solo etapa,
- (i)
- transformar una célula con al menos un gen A que tiene una homología de secuencia de menos de 99,5% con un gen B diferente que es una parte integral del genoma celular o está presente en el armazón de una estructura artificial genética o un casete de expresión,
- (ii)
- recombinar dichos genes,
(iii) generar un mosaico génico de los genes A y B en un sitio de integración de un genoma diana, en donde dicho al menos un gen A está ligado a una secuencia diana flanqueante única en el extremo 5’
o en el extremo 3’ de la estructura artificial genética que se ancla al extremo 5’ o al extremo 3’ de dicho sitio de integración y
2. b) seleccionar los clones que comprenden el mosaico de genes.
Se prefiere específicamente que se utilice un marcador de selección en el mosaico de genes y los clones se seleccionan de acuerdo con la presencia del marcador de selección. Por ejemplo, el mosaico de genes comprende un marcador de selección, por ejemplo, en el que dicho gen A está unido a un marcador de selección. Alternativamente, la selección también se puede realizar por la presencia de cualquier producto resultante recombinante, por ejemplo, a través de la determinación del rendimiento o de características funcionales. Específicamente se pueden utilizar uno o varios marcadores de selección diferentes para diferenciar el tipo de mosaicos de genes.
Específicamente, el método de acuerdo con la invención emplea dicho otro gen que es parte del genoma diana, por ejemplo, el genoma de la célula. En una realización preferida, dicho gen de las anteras es el gen B que forma parte del genoma de la célula.
De acuerdo con una realización preferida alternativamente, dicho otro gen es una estructura artificial genética distinta del genoma diana, tal como un polinucleótido lineal, y opcionalmente se integra en el genoma diana durante la recombinación.
De acuerdo con una realización específica de la invención, la célula se cotransforma con al menos un gen A y al menos con un gen B, en donde dicha secuencia diana única flanqueante del gen A está anclada al extremo 5’ de un sitio de integración en dicho genoma diana, y en donde el gen B está unido a una única secuencia diana flanqueante que está anclada al extremo 3’ del sitio de integración.
Específicamente, la célula se puede cotransformar con al menos un gen A con un marcador de selección y al menos con un gen B, en donde dicha secuencia diana única flanqueante del gen A está anclada al extremo 5’ de un sitio de integración en dicho genoma diana, y en donde el gen B está unido a un marcador de selección diferente y una secuencia diana única flanqueante que está anclada al extremo 3’ del sitio de integración, y en donde se seleccionan clones para al menos los dos marcadores de selección.
Específicamente, la célula se puede cotransformar con al menos dos variantes diferentes del gen A que se va a recombinar, que son los genes A1 y A2, y, opcionalmente, con al menos dos variantes diferentes del gen B que se va a recombinar, que son los genes B1 y B2.
De acuerdo con una realización específica, al menos se cotransforma un gen adicional C que tiene una secuencia que se hibrida con una secuencia del gen A y/o dicho otro gen, para obtener el ensamblamiento de dicho otro gen C con el gen A y/o dicho otro gen, en donde uno o varios de los genes ensamblados tiene un mosaico de genes intragénico.
Específicamente, al menos un gen C adicional se cotransforma, el cual tiene una secuencia que se hibrida con una secuencia del gen A y/o B, por ejemplo, el gen A o el gen B de longitud completa o una secuencia parcial del gen A y/o B, para obtener la recombinación y el ensamblamiento de dicho otro gen C con el gen A y/o B.
Específicamente, la secuencia que se hibrida de dicho gen C tiene una homología de secuencia menor del 99,5% con dicha secuencia, y preferiblemente al menos 30% de homología de secuencia.
Específicamente, se seleccionan los mosaicos de genes que tienen al menos un intercambio de nucleótidos o entrecruzamiento dentro de los genes, es decir, mosaicos con un entrecruzamiento intragénico, tales como los que comprenden partes del gen A y partes de dicho otro gen(es) combinadas, que se entiende como una mezcla de genes parciales para obtener un mosaico de genes recombinados de forma intragénica, tales como genes adecuados para la expresión de productos de una manera diferente, por ejemplo que tienen propiedades mejoradas
o con rendimientos mejorados. Tales mosaicos de genes intragénicos se pueden producir por recombinación y preferiblemente también el ensamblamiento de una serie de genes, en donde uno o varios de los genes ensamblados tienen un mosaico de genes intragénicos de este tipo.
De acuerdo con una realización preferida, se pueden obtener mosaicos de al menos tres genes diferentes A y/o B y/o C.
De acuerdo con una realización específica, se pueden obtener mosaicos de genes de una secuencia no codificadora, de un gen parcial o de genes de al menos 3 hasta 20.000 pares de bases.
De acuerdo con una realización específica, dicho gen A y/o dicho otro gen son secuencias no codificadores o que codifican un polipéptido o una parte de un polipéptido que tiene una actividad.
Preferiblemente, dicho gen A y/o dicho otro gen codifican un polipéptido o una parte de un polipéptido que tiene una actividad.
Específicamente, el método de la invención emplea los genes A, B y/o C, que codifican parte de un polipéptido que tiene una actividad. En consecuencia, los genes, tales como los genes A y/o B y/o C, preferiblemente todos ellos, no codifican individualmente un polipéptido biológicamente activo como tal, sino que codificarán solo una parte del mismo, y pueden provocar una actividad respectiva o una actividad modificada solo después del ensamblamiento de los genes.
Empleando el método de la invención, múltiples genes que codifican polipéptidos de una ruta bioquímica se pueden ensamblar y recombinar.
En otra realización específica, el método de la invención proporciona una recombinación y un ensamblamiento eventual de genes que dan como resultado una secuencia no codificante, tal como un promotor, una región no traducida, un sitio de unión al ribosoma, un terminador, etc.
Cualquier célula hospedadora eucariota o procariota competente para la recombinación se puede utilizar para generar un mosaico de genes mediante recombinación somática in vivo, de acuerdo con la presente invención. De acuerdo con la invención, la célula es una célula que carece de reparación del ADN, por ejemplo, una célula que carece de reparación del ácido nucleico, con una deficiencia en la reparación del ADN, o una célula que carece de MMR.
Específicamente, la célula es una célula eucariota, preferiblemente una célula fúngica, de mamífero o vegetal, o una célula procariota.
Preferiblemente, la célula es un Aspergillus sp o una célula fúngica, preferiblemente, se puede seleccionar entre el grupo que consiste en los géneros Saccharomyces, Candida, Kluyveromyces, Hansenula, Schizosaccaromyces, Yarrowia, Pichia y Aspergillus.
Preferiblemente se emplean cepas haploides, tales como cepas de levadura haploides.
Alternativamente, se pueden utilizar procariotas, tales como E. coli, Bacillus, Streptomyces, o células de mamífero, tales como las células HeLa o células Jurkat, o células vegetales, como Arabidopsis.
De acuerdo con una realización específica, la secuencia diana flanqueante tiene una longitud de al menos 5 pb, preferiblemente al menos 10 pb, más preferiblemente al menos 20 pb, 50 pb, 100 pb hasta 5000 pb de longitud. Específicamente, la secuencia diana flanqueante está ligada a dicho gen o es una parte integral, terminal de dicho gen. Se prefiere que dicha secuencia diana flanqueante tenga una homología en el intervalo de 30% a 99,5%, preferiblemente menos de 95%, menos de 90%, menos de 80%, que se hibrida con la secuencia de anclaje de dicho sitio de integración,
Cuando se utilizan al menos dos secuencias diana flanqueantes diferentes que se anclan en el sitio de integración diana del genoma según la invención, se prefiere que no se recombinen entre sí, preferiblemente que compartan menos de 30% de homología.
Los marcadores de selección útiles para el método de la invención se pueden seleccionar a partir del grupo que consiste en cualquiera de los marcadores conocidos auxótrofos de la nutrición, marcadores de resistencia a antibióticos, marcadores fluorescentes, marcadores de transgénesis dirigida (del inglés, “knock-in”), marcadores del dominio activador/unión y marcadores dominantes recesivos y marcadores colorimétricos. Los marcadores preferidos se pueden inactivar temporalmente o inactivar funcionalmente, y se pueden restablecer para recuperar su propiedad marcadora. Otros marcadores preferidos son los genes localizables, en donde el marcador es una función de cualquiera de las secuencias génicas A y/o del otro gen(es), tal como el gen B, sin secuencias distintas con función marcadora, de manera que la expresión del mosaico de genes se puede determinar directamente a través de la detección del propio mosaico. En este caso el mosaico de genes es localizable directamente.
De acuerdo con una realización específica, dichos genes están comprendidos en un polinucleótido lineal, un vector o un cromosoma artificial de levadura. Específicamente, el gen A y/o otros genes que se van a recombinar están en forma de polinucleótidos lineales, preferiblemente de 300 a 20.000 pb. Específicamente, no habría necesidad de construir o emplear plásmidos o megaplásmidos. El gen(es) se puede utilizar de este modo como tal, es decir, sin vehículo.
Los genes utilizados para la recombinación y la integración también pueden estar comprendidos en cualquier estructura artificial genética, por ejemplo, para ser utilizada como vector para transportar dicho gen(es). Dichos genes pueden estar comprendidos por ello en una estructura artificial genética, por ejemplo, un polinucleótido lineal, un vector o un cromosoma artificial de levadura. Éstos incluyen preferentemente polinucleótidos lineales, plásmidos, estructuras artificiales de PCR, cromosomas artificiales, tales como cromosomas artificiales de levadura, vectores víricos o elementos transponibles.
De acuerdo con una realización específica de la invención, el sitio de integración del genoma diana se encuentra en cualquiera de los genes, por ejemplo, dentro de un polinucleótido lineal, un plásmido o un cromosoma, incluyendo los cromosomas artificiales.
El método de acuerdo con la invención proporciona específicamente la selección de al menos un clon que tiene un mosaico de genes intragénico. Específicamente, se selecciona al menos un clon que tiene un ensamblaje de genes y al menos un mosaico de genes intragénico.
Usando el método de acuerdo con la invención, se pueden obtener mosaicos de genes de al menos 3, preferiblemente al menos 9, hasta 20.000 pares de bases, así como mosaicos de genes, por ejemplo, que comprenden al menos un mosaico intragénico, preferiblemente con al menos 3 eventos de entrecruzamiento, preferiblemente al menos 4, 5, o 10 eventos de entrecruzamiento por cada 700 pares de bases, más preferiblemente por cada 600 pb, 500 pb por o incluso menos. Normalmente, un alto grado de eventos de entrecruzamiento proporciona una gran diversidad de genes recombinados, lo que se puede utilizar para producir una genoteca para seleccionar miembros adecuados de la genoteca. El grado de mosaicismo o de eventos de entrecruzamiento se puede entender como un parámetro de la calidad de una genoteca de este tipo.
Los genes que se modifican de acuerdo con el método de la invención pueden ser cualquier gen útil para fines científicos o industriales. Estos genes pueden ser, por ejemplo, secuencias no codificadoras, por ejemplo, aquellas que se pueden usar en sistemas de expresión recombinantes, o variantes de polipéptidos, en su totalidad o en parte, incluyendo las secuencias parciales que no codifican un polipéptido con actividad biológica, en donde los polipéptidos se seleccionan específicamente entre el grupo que consiste en enzimas, anticuerpos o partes de los mismos, citocinas, antígenos de vacunas, factores de crecimiento o péptidos. Si se modifican genes que codifican una secuencia no codificadora o una secuencia de aminoácidos como parte de un polipéptido que tiene una actividad biológica, también denominados "genes parciales", se puede preferir que un ensamblaje de tales genes parciales tenga características funcionales, por ejemplo, que codifique un polipéptido que tiene una actividad biológica. Preferiblemente, una variedad de genes diferentes, por ejemplo, diferentes genes parciales, con un tamaño que varía desde 3 pb a 20.000 pb, específicamente al menos 100 pb, preferiblemente desde 300 pb a
20.000 pb, específicamente hasta 10.000 pb, se recombinan, en donde el número de genes diferentes es de al menos 2, más específicamente, al menos 3, 4, 5, 6, 7, 8, 9, o al menos 10 para producir una secuencia génica recombinada que no es codificadora o que codifica un polipéptido recombinante, por ejemplo, que tiene una actividad biológica, que se modula de manera ventajosa, por ejemplo, que tiene una actividad biológica incrementada. La expresión "actividad biológica" tal como se utiliza en este sentido, se refiere específicamente a una actividad enzimática, tal como una actividad que convierte un sustrato particular en un producto particular. Los genes preferidos como diversificados según la invención, codifican polipéptidos multicadena.
De acuerdo con una realización particular de la invención, se proporciona un método de presentación en células de variantes de genes, que comprende la creación de una variedad de mosaicos de genes en células usando el método de acuerdo con la invención, y la presentación de dicha variedad en la superficie de dichas células para obtener una genoteca de mosaicos.
La genoteca obtenible a través de dicha presentación preferida, comprende específicamente un alto porcentaje de mosaicos de genes dentro de un marco de lectura abierto funcional (ORF), preferiblemente al menos 80%.
Una genoteca de acuerdo con la invención puede estar específicamente en cualquier forma adecuada, específicamente una genoteca biológica que comprende una variedad de organismos que contienen las variantes génicas. La genoteca biológica de acuerdo con la invención puede estar contenida y/o expresada específicamente en una población de organismos para crear un repertorio de organismos, en donde los organismos individuales incluyen al menos un miembro de la genoteca.
De acuerdo con un aspecto específico de la invención, se proporciona además un organismo que comprende una variante génica procedente de dicha genoteca, por ejemplo, un organismo seleccionado a partir de un repertorio de organismos. El organismo tal y como se proporciona de acuerdo con la invención, se puede utilizar para expresar un producto de expresión génica en un sistema de expresión adecuado, por ejemplo, como una célula hospedadora productora.
Figuras
Fig. 1: Recombinación in vivo no meiótica
Los genes homeólogos A y B (homología menor del 99,5%) se recombinaron. Como las secuencias marcadoras y las secuencias diana flanqueantes no son homólogas, la recombinación/ensamblaje solo se produjo entre los genes A y B. Como consecuencia, el ADN del híbrido/mosaico contenía los genes A y B recombinados, dos marcadores y ambas secuencias diana flanqueantes. El mosaico de genes está integrado en el locus diana en un cromosoma diana. Los clones en los que se ha integrado la estructura artificial completa, crecieron en un medio apropiado que es selectivo para ambos marcadores.
T 5’ y T 3’ se corresponden a las secuencias diana (de homología menor del 99,5%) en el genoma de levadura (aprox. 400 pb) que dirigen la integración homóloga en el sitio del cromosoma. M1 y M2 son los marcadores flanqueantes para la selección doble. El gen A y el gen B son versiones homeólogas relacionadas con un determinado grado de homología (menos del 99,5%). Las secuencias solapantes se corresponden con la totalidad de los ORFs de los dos genes. Después del ensamblaje mediante recombinación homeóloga en un transformante de levadura carente de MMR, la doble selección permite el aislamiento de los recombinantes.
Fig. 2: Recombinación y ensamblaje del ADN mediante recombinación homeóloga
Esta figura muestra una presentación esquemática de una realización específica, en donde la célula se cotransforma con al menos dos genes, aquí los fragmentos de ADN A y B, que tienen una homología menor del 99,5% en su fracción de solapamiento de 80 pb. Cada fragmento de ADN estaba flanqueado por un marcador de selección.
El fragmento A contenía una secuencia diana flanqueante que se corresponde con el extremo 5’ del sitio de integración correcto en el cromosoma y una región que se hibrida que se solapa con el fragmento B, el fragmento B contenía la secuencia diana flanqueante que se corresponde con el sitio de integración 3’ y una región que se hibrida que se solapa con el fragmento A. Células de levadura que carecen de apareamientos erróneos se transformaron con los fragmentos resultantes. Los transformantes resultantes se sembraron en placas en un medio que era selectivo para ambos marcadores. Se aislaron los clones que se podían seleccionar con ambos marcadores, y la integridad de la agrupación ensamblada/integrada, así como la reconstitución de los ORFs de los genes A y B se verificaron mediante un análisis molecular del ADN genómico de los recombinantes seleccionados.
T 5’ y T 3’ se corresponden a las secuencias diana (homología menor del 99,5%) en el genoma de levadura (aprox. 400 pb) que dirigen la integración homóloga en el sitio del cromosoma. M1 y M2 son los marcadores flanqueantes para la doble selección. Los fragmentos de ADN de A y B se pueden ensamblar en un gen, que se puede localizar tal como GFP, o pueden representar dos genes que se ensamblan a través de este método. Las secuencias solapantes de todos los genes tienen una homología menor del 99,5% (120 pb), lo que permite la reconstitución de los ORFs después del ensamblaje mediante recombinación homeóloga. La doble selección permite el aislamiento de recombinantes y sirve como una verificación principal del ensamblamiento.
Fig. 3: Recombinación y ensamblaje de los genes A, B y C
Esta figura muestra la cotransformación de un gen C adicional, que tiene una secuencia que se hibrida con una secuencia flanqueante de los genes A y/o B para obtener el ensamblaje de dicho gen C con los genes A y B.
T 5’ y T 3’ se corresponden a las secuencias diana (homología menor del 99,5%) en el genoma de levadura (aprox. 400 pb) que dirigen la integración homóloga en el sitio del cromosoma. M1 y M2 son los marcadores flanqueantes para la doble selección. El gen A, el gen B y el gen C son versiones homeólogas relacionadas con un determinado grado de homología (menos del 99,5%). Las secuencias solapantes se corresponden a la parte 5’ y a la parte 3’ de los genes. El gen B conecta los fragmentos flanqueantes y se reconstituye una nueva ORF ABC por similitud de secuencias. Después del ensamblaje mediante recombinación homeóloga en un transformante de levadura que carece de MMR, la doble selección permite el aislamiento de los recombinantes.
Fig. 4: Sustratos de recombinación Oxa
Los cuatro genes codifican variantes de la enzima β-lactamasa. Son versiones relacionadas con un grado de homología diferente a nivel de ADN (desde 95% a 49%). El panel superior muestra la reasociación esquemática de los ORFs de los genes, con un dendrograma generado después de la alineación. Los tamaños de los genes son aprox. 800 pb. ATG y TAA significan los codones de iniciación y de parada. La tabla inferior muestra el porcentaje de similitud de secuencia entre los cuatro genes a nivel de ADN.
Fig. 5: Secuencias de mosaicos de genes y proteínas OXA11/OXA7 (SEQ ID NOs 1-14)
Las secuencias de nucleótidos OXA7 de partida están en negrita y subrayadas, las secuencias de nucleótidos con mutación están en negrita y cursiva.
Los clones se aislaron mediante doble selección y el ADN se empleó para la amplificación y la secuenciación. Solo se usaron secuencias claramente legibles de ambas hebras. Los cromatogramas resultantes se alinearon con un programa de tipo Clustal.
Fig. 6: Secuencias de mosaicos de genes y proteínas OXA11/OXA5 (SEQ ID NOs 15-38)
Las secuencias de nucleótidos OXA5 de partida están en negrita y subrayadas, las secuencias de nucleótidos con mutación están en negrita y cursiva.
Los clones se aislaron mediante doble selección y el ADN se empleó para la amplificación y la secuenciación. Solo se usaron secuencias claramente legibles de ambas hebras. Los cromatogramas resultantes se alinearon con un programa de tipo Clustal.
Fig. 7: Secuencias de genes parentales OXA11, OXA7 y OXA5 (SEQ ID NOs 39-41)
Fig. 8: Secuencias de clones que comprenden genes de mosaicos complejos, correspondientes al ensamblaje homeólogo OXA11/OXA5/OXA7
Secuencias de clones y resultados de reasociaciones de proteínas respectivas: Fig. 8a) OUL3-05-II (SEQ ID NO 42 y 43), Fig. 8b) OUL3-05-III (SEQ ID NOs 44 y 45), Fig. 8c) OUL3-05-IV (SEQ ID NOs 46 y 47), Fig. 8d) OUL3-05-IX (SEQ ID NOs 48 y 49) y Fig. 8e) OUL3-05-X (SEQ ID NOs 50 y 51) de OXA11/OXA5/OXA7.
Las secuencias de nucleótidos de OXA 5 están en negrita y las correspondientes a OXA 7 están subrayadas. Las secuencias sin negrita y sin subrayar corresponden a OXA 11.
Fig. 9: Secuencias de genes ADH1 de Kluyveromyces lactis, Saccharomyces cerevisiae y secuencias recombinantes
Las secuencias de nucleótidos de partida de Kluyveromyces lactis están subrayadas.
Fig. 9a): (SEQ ID NO 52) ADH de Kluyveromyces, Fig. 9b): (SEQ ID NO 53) Saccharomyces, Fig. 9c): (SEQ ID NO 54) clon A02, Fig. 9d): (SEQ ID NO 55) A03, Fig. 9e): (SEQ ID NO 56) A05, Fig. 9f): (SEQ ID NO 57) A06, Fig. 9g): (SEQ ID NO 58) A10, Fig. 9h): (SEQ ID NO 59) A11.
Descripción detallada de la invención
Por lo tanto, la presente invención se refiere a un método nuevo y altamente eficaz para la recombinación in vivo de secuencias de ADN homeólogas, es decir, secuencias similares pero no idénticas. En lo sucesivo, la expresión recombinación homóloga, denominada a veces recombinación homeóloga cuando se recombinan secuencias homeólogas, se refiere a la recombinación de secuencias que tienen cierta homología, que pueden ser o no idénticas. A diferencia del enfoque de la clonación convencional que se basa en la digestión y ligación específica del sitio, la recombinación homóloga alinea secuencias complementarias y permite el intercambio entre fragmentos. Los genes del mosaico recombinantes, también llamados genes híbridos, se generan en la célula a través de la hibridación de secuencias que tienen bases con apareamiento erróneo. A través de un método de mutagénesis de este tipo de la invención, es posible crear fácilmente una diversidad de selecciones adecuadas y rediseñar polipéptidos de interés de una manera temporalmente eficaz.
Específicamente, la invención permite por primera vez la recombinación eficaz y la formación de un mosaico, la diversificación y el ensamblaje de diversos genes en un procedimiento de una sola etapa, mediante el empleo del sistema funcional de recombinación in vivo.
La expresión "procedimiento de una sola etapa" significa que diferentes etapas del proceso de manipulación genética de recombinantes, como la transformación de células con un gen, la recombinación de genes, la generación de un gen mosaico y la integración de un gen en el genoma diana, se llevan a cabo técnicamente en un método de una sola etapa. Por lo tanto, no habría necesidad de una recombinación in vitro de vehículos del ADN antes de la recombinación in vivo, o cualquier ciclo repetitivo de las etapas del proceso, incluyendo las que emplean la meiosis. Ventajosamente, se puede evitar el uso de células meióticas de levadura.
El procedimiento de una sola etapa de acuerdo con la invención puede incluir incluso al mismo tiempo la expresión de tales recombinantes por ingeniería genética a través de un hospedador. Por ello no sería necesaria una manipulación adicional para obtener un producto de expresión.
La expresión "mosaico de genes" de acuerdo con la invención, significa la combinación de al menos dos genes diferentes con al menos un evento de entrecruzamiento. Específicamente un entrecruzamiento de este tipo proporciona la combinación o la mezcla de secuencias de ADN. Un mosaico de genes se puede crear mezclando gen(es) de forma intragénica, un mosaico de genes intragénico y/o un ensamblaje de genes, opcionalmente un ensamblaje de genes con entrecruzamiento(s) intragénico e intergénico o un mosaico(s) de genes.
El término "entrecruzamiento" se refiere a la recombinación entre genes en un sitio en el que dos hebras de ADN pueden intercambiar información genética, es decir, al menos un nucleótido. El proceso de entrecruzamiento conduce a genes mosaico en la descendencia que tienen diferentes combinaciones de genes o de secuencias procedentes de los genes parentales.
Por otra parte, se pueden proporcionar otros mecanismos de reparación, que no se basan en el entrecruzamiento, por ejemplo, la reparación por escisión de nucleótidos o mecanismos de unión de extremos no homólogos que comprenden el reconocimiento de nucleótidos incorrectos, la escisión y/o la sustitución después de la unión de las hebras.
La expresión "secuencia diana flanqueante" se refiere a regiones de una secuencia de nucleótidos que son complementarias a la diana de interés, tal como un sitio de integración diana genómico, incluyendo un sitio del gen(es) A y/o de otro gen(es) que se va a recombinar, polinucleótidos lineales, plásmidos de YACs lineales o circulares y similares. Debido a un determinado grado de complementación o de homología, la secuencia diana flanqueante se puede hibridar e integrar un gen(es) en el sitio de integración diana.
El término "genoma" de una célula se refiere a la totalidad de la información hereditaria de un organismo, representada por genes y secuencias no codificadoras de ADN, ya sea elementos genéticos cromosómicos o no cromosómicos tales como, polinucleótidos lineales, por ejemplo, que incluyen el gen A y/o el otro gen(es) que se va a recombinar, virus, vehículos y vectores autorreplicantes, plásmidos y elementos transponibles, que incluyen cromosomas artificiales y similares. Los cromosomas artificiales son moléculas de ADN lineal o circular que contiene todas las secuencias necesarias para un mantenimiento estable después de la introducción en una célula, en donde se comportan de forma similar a los cromosomas naturales y por lo tanto se consideran parte del genoma.
El término "homología" indica que dos o más secuencias de nucleótidos tienen (hasta un cierto grado, hasta el 100%) los mismos pares de bases o pares de bases conservados en una posición correspondiente. Una secuencia homóloga, también llamada complementaria, correspondiente o secuencia que se aparea, tal como se utiliza de acuerdo con la invención, preferiblemente se hibrida con la secuencia homóloga equivalente, por ejemplo, tiene al menos 30% de identidad de secuencia, pero menos de 99,5% de identidad de secuencia, posiblemente menos de 95%, menos de 90%, menos de 85% o menos de 80%, con una secuencia complementaria respectiva, en relación con una secuencia de ADN natural de longitud completa o un segmento de una secuencia de ADN tal y como se describe en esta memoria. Preferiblemente, una secuencia homóloga tendrá al menos aproximadamente 30% de identidad de secuencia de nucleótidos, preferiblemente al menos aproximadamente 40% de identidad, más preferiblemente al menos aproximadamente 50% de identidad, más preferiblemente al menos aproximadamente 60% de identidad, más preferiblemente al menos aproximadamente 70% de identidad, más preferiblemente al menos aproximadamente 80% de identidad, más preferiblemente al menos aproximadamente 90% de identidad, más preferiblemente al menos aproximadamente 95% de identidad. Los intervalos preferidos con límites superior e inferior tal y como se han mencionado anteriormente, están dentro del intervalo de 30% a 99,5% de identidad de secuencia correspondiente. Tal y como se usa en el presente documento, el grado de identidad siempre se refiere también a las secuencias complementarias.
"Porcentaje (%) de identidad" con respecto a la secuencia de nucleótidos de un gen se define como el porcentaje de nucleótidos en una secuencia de ADN candidata que es idéntica a los nucleótidos en la secuencia de ADN, después de alinear la secuencia e introducir huecos, si es necesario, para lograr la máxima identidad de secuencia porcentual, y sin considerar ninguna sustitución conservadora como parte de la identidad de secuencia. La alineación con fines de determinar el porcentaje de identidad de secuencia de nucleótidos, se puede lograr de varias maneras que están dentro de la experiencia técnica, por ejemplo, utilizando un programa informático disponible públicamente. Los expertos en la materia pueden determinar parámetros apropiados para medir la alineación, incluyendo cualquier algoritmo necesario para conseguir una alineación máxima a lo largo de toda la longitud de las secuencias que se van a comparar.
El término "anclaje" significa la unión de un gen o de un mosaico de genes a una secuencia de integración a través de un segmento llamado "secuencia de anclaje" con una homología de secuencia parcial o completa, para permitir la integración de dicho gen o mosaico de genes en el sitio de integración de un genoma. Específicamente, la secuencia de anclaje puede ser una región diana flanqueante homóloga o parcialmente homóloga a un sitio de integración de una secuencia genómica. La secuencia de anclaje preferida tiene preferiblemente al menos aproximadamente 70% de homología de secuencia con un sitio de integración diana, más preferiblemente al menos 80%, 90%, 95% hasta 99,55% o una coincidencia completa con la sección que se hibrida del genoma.
El sitio de integración puede ser adecuadamente un locus definido en el genoma del hospedador, en donde se produciría una alta frecuencia de eventos de recombinación. Un locus preferido es, por ejemplo, el locus BUD31HCM1 en el cromosoma III de S. cerevisiae. En general, se prefiere cualquier loci adicional en cromosomas de levadura que muestre una alta frecuencia de recombinación, pero ningún cambio de la viabilidad celular.
El término "expresión" o "sistema de expresión" o "casete de expresión" se refiere a moléculas de ácido nucleico que contienen una secuencia codificadora deseada y secuencias de control ligadas funcionalmente, de manera que los hospedadores transformados o transfectados con estas secuencias son capaces de producir las proteínas codificadas. Con el fin de efectuar la transformación, el sistema de expresión se puede incluir en un vector; sin embargo, el ADN relevante se puede integrar entonces también en el cromosoma hospedador.
El término "gen" también debe incluir fragmentos de ADN de un gen, en particular los que son genes parciales. Un fragmento también puede contener varios marcos de lectura abierta, o bien repeticiones del mismo ORF u ORFs diferentes. El término debe incluir específicamente secuencias de nucleótidos, que no son codificantes, por ejemplo, secuencias no transcritas o sin traducir, o que codifican polipéptidos totalmente o en parte.
El término "gen A" tal y como se utiliza de acuerdo con la invención, debe significar cualquier secuencia de nucleótidos de una secuencia no codificadora o una secuencia que codifica un polipéptido o polipéptidos de interés. El gen A se caracteriza por que se presenta en el armazón de una estructura artificial genética, tal como un casete de expresión, un polinucleótido lineal, un plásmido o un vector, que incorpora preferiblemente al menos una secuencia marcadora y tiene una única secuencia diana flanqueante, ya sea en el extremo 5' o en el extremo 3’ del gen A o la estructura genética artificial. En el método de acuerdo con la invención, el gen A es típicamente un primer gen en una serie de genes que se van a recombinar para la formación de un mosaico de genes. El gen A es homólogo a otro gen que se va a recombinar, que es, eventualmente, ya sea una variante del gen A o cualquiera de los genes B, C, D, E, F, G, H, etc., según sea el caso. De este modo solo se proporciona típicamente una secuencia diana flanqueante por gen A, para el fin de máxima fidelidad. Las variantes del gen A se denominan gen A1, A2, A3, etc., las cuales tienen homología de secuencia, hasta cierto punto, y características funcionales opcionalmente similares. La expresión "al menos un gen A", significa al menos el gen A y opcionalmente variantes del gen A.
El término "gen B" tal como se utiliza de acuerdo con la invención, debe significar cualquier secuencia de nucleótidos de una secuencia no codificadora o una secuencia que codifica un polipéptido o polipéptidos de interés, que se selecciona para la formación de un mosaico de genes con otro gen que se va a recombinar, que es, eventualmente, ya sea un gen A, una variante del gen B o cualquiera de los genes C, D, E, F, G, H, etc., según sea el caso. El gen B es homólogo al gen A o a los otros genes hasta un cierto punto para permitir la formación de un mosaico con el gen A o con los otros genes que se van a recombinar. En el método de acuerdo con la invención, el gen B es típicamente el gen final en una serie de genes que se van a recombinar para la formación de un mosaico de genes. El gen B puede ser una parte integral del genoma celular, o presentarse en el armazón de una estructura genética artificial, tal como un casete de expresión, un polinucleótido lineal, un plásmido o un vector, el cual incorpora preferiblemente al menos una secuencia marcadora y tiene una sola secuencia diana flanqueante, ya sea en el extremo 5’ o en el extremo 3’ del gen B o de la estructura genética artificial, como un equivalente de la secuencia diana flanqueante del gen A, es decir, en el extremo opuesto del gen. Si la secuencia diana flanqueante del gen A está en el extremo 5’ del gen A, entonces el gen B tendría típicamente su secuencia diana flanqueante en el extremo 3’ y viceversa. De este modo solo se proporciona típicamente una secuencia diana flanqueante por gen B para el fin de máxima fidelidad. El gen B puede ser una variante del gen A. Variantes del gen B se denominan gen B1, B2, B3, etc., las cuales tienen homología de secuencia, hasta cierto punto, y opcionalmente características funcionales similares. La expresión "al menos un gen B", significa al menos el gen B y opcionalmente variantes del gen B.
El término "gen C", tal y como se usa de acuerdo con la invención, debe significar cualquier secuencia de nucleótidos de una secuencia no codificadora o una secuencia que codifica un polipéptido de interés. El gen C se caracteriza por que se presenta en el armazón de una estructura genética artificial, tal como un casete de expresión, un polinucleótido lineal, un plásmido o un vector, que opcionalmente incorpora una secuencia marcadora, y se caracteriza además por un segmento de su secuencia de nucleótidos que es homólogo a una secuencia del gen A y/o del gen B, una variante del gen C o, eventualmente, otros genes D, E, F, G, H, etc., según sea el caso. El gen C tiene preferiblemente una sola secuencia diana flanqueante, ya sea en el extremo 5’ o en el extremo 3’ del gen C, o una secuencia diana flanqueante en ambos lados. De este modo el gen C se puede hibridar parcial o completamente con el gen A y/o los otros genes para recombinar, enlazar y ensamblar los genes. En el método de acuerdo con la invención, el gen C es típicamente el segundo gen después del gen A en una serie de genes que se van a recombinar para la formación de un mosaico de genes. Las variantes del gen C se denominan C1, C2, C3, etc., las cuales tienen homología de secuencia, hasta cierto punto, y características funcionales opcionalmente similares.
Un gen D adicional se puede recombinar y ensamblar adicionalmente a través de la hibridación de su secuencia de nucleótidos o de un segmento de su secuencia de nucleótidos que es homóloga a una secuencia del gen C, a una variante del gen D o eventualmente otros genes A, B, E, F, G, H, etc., según sea el caso, para proporcionar la recombinación y el enlace respectivos. El gen D tiene preferiblemente una única secuencia diana flanqueante, ya sea en el extremo 5’ o en el extremo 3’ del gen D, o una secuencia diana flanqueante en ambos lados. En el método de acuerdo con la invención, el gen D es típicamente el siguiente gen después del gen C en una serie de genes que se van a recombinar para la formación de un mosaico de genes. Las variantes del gen D se denominan D1, D2, D3, etc., las cuales tienen homología de secuencia, hasta cierto punto, y características funcionales opcionalmente similares.
Un gen E adicional se puede recombinar y ensamblar adicionalmente a través de un segmento de su secuencia de nucleótidos que es homóloga a una secuencia del gen D, a una variante del gen E o eventualmente otros genes A, B, C, F, G, H, etc., según sea el caso, para proporcionar la recombinación y el enlace respectivos. El gen E tiene preferiblemente una única secuencia diana flanqueante, ya sea en el extremo 5’ o en el extremo 3’ del gen E, o una secuencia diana flanqueante en ambos lados. En el método de acuerdo con la invención, el gen E es típicamente el siguiente gen después del gen D en una serie de genes que se van a recombinar para la formación de un mosaico de genes. Las variantes del gen E se denominan E1, E2, E3, etc., las cuales tienen homología de secuencia, hasta cierto punto, y características funcionales opcionalmente similares
Otros genes F, G, H, etc. se pueden utilizar en consecuencia. Las series de otros genes no está limitada por el número de letras alfabéticas. La cadena final de genes de interés se obtendría a través de la unión a los genes A y B para obtener el ensamblaje de genes en el sitio de integración del genoma. Los genes de interés ensamblados de este modo pueden estar ligados funcionalmente para apoyar la expresión de los polipéptidos de interés correspondientes y los metabolitos, respectivamente. Un método específico de ensamblaje emplea la combinación de casetes mediante la recombinación in vivo para ensamblar incluso un gran número de fragmentos de ADN para obtener moléculas de ADN deseadas de tamaño sustancial. Los casetes que representan secuencias solapantes se diseñan de forma adecuada para cubrir toda la secuencia deseada. En una realización, los solapamientos preferidos son de al menos aproximadamente 5 pb, preferiblemente de al menos aproximadamente 10 pb. En otras realizaciones, los solapamientos pueden ser de al menos 15, preferiblemente de al menos 20 hasta 1.000 pb.
En una realización preferida, algunos de los casetes están diseñados para contener secuencias marcadoras que permiten la identificación. Típicamente, las secuencias marcadoras se encuentran en sitios que toleran las inserciones de transposones a fin de minimizar los efectos biológicos sobre la secuencia de ácido nucleico deseada final.
En una realización específica, la célula hospedadora es capaz de recombinar o ensamblar incluso un gran número de genes o de fragmentos de ADN de ácidos nucleicos con secuencias que se solapan, por ejemplo, al menos 2, preferiblemente al menos 3, 4, 5, 6, 7, 8, 9, más preferiblemente al menos 10 genes o fragmentos de ácido nucleico en la célula hospedadora mediante la cotransformación con una mezcla de dichos genes o fragmentos y cultivar dicho hospedador al que se transfieren las secuencias recombinadas o ensambladas.
Los genes o los fragmentos de ADN que se van a utilizar de acuerdo con la invención, ya sea como un gen completo
o como una parte, pueden ser de cadena doble o de cadena sencilla. Las secuencias de ácidos nucleicos bicatenarias son generalmente de 300-20.000 pares de bases y los fragmentos monocatenarios son generalmente más cortos y pueden variar desde 40 hasta 10.000 nucleótidos. Por ejemplo, ensamblajes desde 2 Mb hasta 500 Mb se podrían ensamblar en la levadura.
Las secuencias genómicas de una variedad de organismos están disponibles públicamente y se pueden utilizar con el método de acuerdo con la invención. Estas secuencias genómicas incluyen preferiblemente información obtenida a partir de diferentes cepas de la célula hospedadora o de diferentes especies, para proporcionar secuencias homólogas que tienen una diversidad específica.
Los genes iniciales utilizados como sustratos para la recombinación son generalmente una colección de polinucleótidos que comprende formas variantes de un gen. Las formas variantes muestran una identidad de secuencia sustancial entre sí, suficiente para permitir la recombinación homóloga entre sustratos. La diversidad entre los polinucleótidos puede ser natural, por ejemplo, variantes alélicas o variantes de especies, inducida, por ejemplo, PCR propensa a errores o recombinación de secuencias recursiva propensa a errores o el resultado de una recombinación in vitro. La diversidad también puede ser el resultado de una síntesis de nuevo de genes que codifican proteínas naturales con un uso alternativo de los codones. Debe haber al menos suficiente diversidad entre los sustratos para que la recombinación pueda generar más productos diversos que los que hay en los materiales de partida. Debe haber al menos dos sustratos que difieren en al menos una o más posiciones. El grado de diversidad depende de la longitud del sustrato que se está recombinando y de la extensión del cambio funcional que se va a evolucionar. Es típica una diversidad de hasta el 69% de las posiciones.
De acuerdo con el método de la invención se prefiere que los genes A, B, C y otros genes compartan una homología de al menos 30%, al menos en un segmento específico, diseñado para la hibridación, que podría incluir el gen de longitud completa. El porcentaje de homología preferido es de al menos 40%, más preferido al menos 50%, más preferido al menos 60%, más preferido al menos 70%, más preferido al menos 80%, más preferido al menos 90%, incluso más preferido al menos 95% hasta menos de 99,5%.
También puede ser deseable ensamblar simplemente, por ejemplo, para ensartar y opcionalmente mezclar dichos genes con variantes génicas, para diversificar genes más grandes, por ejemplo, miembros de una ruta metabólica individual o para ensamblar una pluralidad de rutas metabólicas de acuerdo con este método. Rutas metabólicas, que no existen en la naturaleza, se pueden construir de esta manera. Por lo tanto, enzimas que están presentes en un organismo que actúa sobre un sustrato deseado producido por un organismo diferente que carece de una enzima tal aguas abajo, se pueden codificar en el mismo organismo gracias a la construcción del ensamblaje de genes o de genes parciales para obtener enzimas recombinadas. Por lo tanto, se pueden incluir múltiples enzimas para la construcción de rutas metabólicas complejas. Esto es ventajoso si un grupo de polipéptidos o de polipéptidos parciales se tiene que disponer de acuerdo con su función bioquímica dentro de la ruta. Ejemplos de rutas génicas de interés son enzimas que codifican la síntesis de metabolitos secundarios de interés industrial, tales como flavonoles, macrólidos, policétidos, etc.
Además, se pueden preparar genotecas combinatorias mezclando fragmentos, en donde uno o varios de los fragmentos se suministran con las mismas secuencias de hibridación, pero en donde secuencias diferentes intercaladas codifican enzimas u otras proteínas.
Las rutas genéticas se pueden construir de manera combinatoria, de tal manera que cada miembro en la genoteca combinatoria tiene una combinación diferente de variantes génicas. Por ejemplo, una genoteca combinatoria de variantes se puede construir a partir de elementos individuales de ADN, en donde diferentes fragmentos se recombinan y se ensamblan y en donde cada uno de los diferentes fragmentos tiene varias variantes. La recombinación y el ensamblaje de una ruta metabólica pueden no requerir la presencia de una secuencia marcadora para mostrar el éxito de la modificación genética. La expresión de un metabolito de una manera deseada ya sería indicativa del ejemplo activo. La recombinación exitosa y el ensamblaje de la ruta metabólica se pueden determinar, por ejemplo, mediante la detección del metabolito secundario en el medio de cultivo celular.
Las células hospedadoras procariotas y eucariotas se contemplan ambas para el uso en el método descrito, incluyendo células hospedadoras bacterianas tales como E. coli o Bacillus sp, células hospedadoras de levadura, tales como S. cerevisiae, células hospedadoras de insecto, tales como Spodooptera frugiperda o células hospedadoras humanas, tales como HeLa y Jurkat.
Las células hospedadoras preferidas son células haploides, tales como las procedentes de Candida sp, Pichia sp y Saccharomyces sp.
El método de la invención no usaría el ciclo sexual o la recombinación meiótica. Los fragmentos de ADN se pueden transformar en células haploides. Los transformantes se pueden sembrar inmediatamente en placas selectivas. Los recombinantes se podrían aislar a continuación mediante PCR o por otros medios, tales como la reparación de huecos.
El procedimiento de la invención puede llevarse a cabo en cualquier célula procariota o eucariota que carece de reparación del ADN.
Las mutaciones o modificaciones del sistema de reparación de apareamientos erróneos (MMR) aumentarían la frecuencia de la recombinación en las células. Alternativamente, se puede utilizar otra célula con una inactivación de un gen de reparación de ADN, tal como la inactivación completa o temporal de los genes de reparación del ADN rad1, recQ, que pueden mejorar la recombinación.
Las células que carecen de reparación del ADN se utilizan preferiblemente en el método de acuerdo con la invención. A modo de ejemplo, la reparación de apareamientos erróneos se puede inactivar completa o temporalmente, o puede ser condicional o estar inducida por la adición de sustratos específicos en el medio de cultivo celular, en donde las células se cultivan durante o después de realizar una recombinación dirigida. Específicamente, la carencia de MMR en una célula se puede lograr mediante cualquier estrategia que impide transitoria o permanentemente la reparación de apareamientos erróneos, incluyendo la mutación de un gen implicado en la reparación de apareamientos erróneos, el tratamiento con luz UV, el tratamiento con productos químicos, tales como 2-aminopurina, la expresión o represión inducible de un gen implicado en la reparación de apareamientos erróneos, por ejemplo, a través de promotores regulables, lo que permitiría una inactivación y activación transitorias.
Los sistemas de reparación de apareamientos erróneos bacterianos han sido ampliamente investigados. En otros sistemas, tales como levadura, se han identificado varios genes cuyos productos comparten homología con proteínas bacterianas de reparación de apareamientos erróneos, por ejemplo, análogos de la proteína MutS, es decir, Msh1, Msh2p, Msh3p, Msh4, Msh5, Msh6p y análogos de la proteína MutL, es decir, Mlh1p, Mlh2p, Mlh3p y Pms1 en S. cerevisiae.
Ejemplos de células preferidas que carecen de reparación de apareamientos erróneos son células de levadura específicas, tales como cepas de S. cerevisiae con MSH2 defectuoso o (temporalmente) inactivado, por ejemplo, por las cepas W303, BY, SK1 modificadas genéticamente, tales como la cepa MXY47 (W303 con MSH2 destruido).
Otros sistemas preferidos de MMR son una selección de cepas bacterianas bien conocidas, tales como las descritas en el documento US5912119, tales como cepas defectuosas para el sistema enzimático de reparación de apareamientos erróneos MutHLS, por ejemplo, las de tipo mutS o mutL, que crece de las proteínas MutS y MutL, que participa en el reconocimiento de los apareamientos erróneos. Las cepas preferidas son, por ejemplo, cepas de
S. typhimurium que emplean F-mutL o E. Coli Hfr/S. recombinante Typhimurium F-mutL.
Además, otras células eucariotas que carecen de reparación de apareamientos erróneos, tales como las células HeLa y Jurkat se utilizan preferiblemente de acuerdo con la invención.
El método de acuerdo con la invención emplea principalmente una selección asistida por marcadores de un producto de recombinación exitosa. Con el uso de herramientas tales como los marcadores moleculares o huellas dactilares de ADN, se pueden cartografiar los genes de interés. Esto permite el escrutinio de un gran repertorio de células para obtener una selección de células que poseen el rasgo de interés. El escrutinio se basa en la presencia o ausencia de un determinado gen.
La expresión "marcador de selección", tal y como se usa de acuerdo con la invención, se refiere a proteínas que codifican o que no codifican secuencias de ADN que proporcionan una marca después de la integración exitosa. Específicamente, las secuencias marcadoras que codifican una proteína se seleccionan a partir del grupo de marcadores nutricionales, marcadores con pigmentos, marcadores de resistencia a antibióticos, marcadores de sensibilidad a antibióticos, marcadores fluorescentes, marcadores de transgénesis dirigida, marcadores del dominio activador/unión y marcadores dominantes recesivos, marcadores colorimétricos, y secuencias que codifican diferentes subunidades de una enzima, que funciona solo si dos o más subunidades se expresan en la misma célula. La expresión se referirá también a un gen localizable que se va a recombinar que proporciona la determinación directa del mosaico de genes, sin la necesidad de utilizar secuencias marcadoras distintas.
Un "marcador nutricional" es una secuencia marcadora que codifica un producto génico que puede compensar una auxotrofia de la célula y por lo tanto conferir prototrofía a esa célula auxotrófica. Según la presente invención, el término "auxotrofia" significa que la célula debe ser cultivada en medio que contiene un nutriente esencial que no puede ser producido por la propia célula auxotrófica. El producto génico del gen marcador nutricional favorece la síntesis de este nutriente esencial que falta en la célula auxotrófica. Con la expresión exitosa el gen marcador nutricional, no se tiene que añadir entonces este nutriente esencial al medio de cultivo en el que se cultiva la célula.
Las secuencias marcadoras preferidas son URA3, LEU2, CAN1, CYH2, TRP1, ADE1 y MET5.
Un gen que codifica un "marcador de pigmento" está codificando un producto génico que está implicado en la síntesis de un pigmento que después de la expresión puede teñir la célula. De este modo se proporciona una detección fenotípica rápida de células que expresan con éxito marcadores de pigmento.
Un "marcador de resistencia a antibióticos" es un gen que codifica un producto génico que permite a la célula crecer en presencia de antibióticos a una concentración en la que las células que no expresan dicho producto, no pueden crecer.
Un "marcador de sensibilidad a antibióticos" es un gen marcador, en el que el producto génico inhibe el crecimiento de células que expresan dicho marcador en presencia de un antibiótico.
Un marcador de "transgénesis dirigida" se entiende como una secuencia de nucleótidos que representa un elemento perdido de una célula desactivada, lo que provoca que la célula crezca después de una recombinación y una manipulación exitosas. Una célula desactivada es una célula modificada genéticamente, en la que uno o varios genes se han desactivado a través de una mutación dirigida. Los genes que faltan se pueden usar adecuadamente como marcadores de la transgénesis dirigida.
Un "marcador de fluorescencia" significa una secuencia de nucleótidos que codifica un fluoróforo que es detectable mediante la emisión de la señal fluorescente respectiva. Las células se pueden clasificar fácilmente mediante técnicas bien conocidas de citometría de flujo basándose en el marcador fluorescente diferencial.
Los genes tal como se utilizan para la diversificación o la recombinación pueden ser secuencias no codificadoras o secuencias que codifican polipéptidos o secuencias que codifican proteínas o partes o fragmentos de las mismas que tienen una longitud de secuencia suficiente para tener éxito en los eventos de recombinación. Más específicamente, dichos genes tienen una longitud mínima de 3 pb, preferiblemente al menos 100 pb, más preferido al menos 300 pb.
Los mosaicos de genes preferidos obtenidos según la invención tienen al menos 3, preferiblemente hasta 20.000 pares de bases, un intervalo preferido sería de 300 - 10.000 pb; particularmente preferidas son secuencias de ADN grandes de al menos 500 pb o al menos 1.000 pb.
Se prefieren específicamente mosaicos de genes que se caracterizan por tener al menos 3 eventos de entrecruzamiento por cada 700 pares de bases, preferiblemente al menos 4 entrecruzamientos por cada 700 pares de bases, más preferiblemente al menos 5, 6 o 7 entrecruzamientos por cada 700 pares de bases o por cada 500 pares de bases, lo que incluye el cruzamiento de nucleótidos individuales o de segmentos con al menos secuencias de 1 nucleótido, preferiblemente al menos 2, 3, 4, 5, 10, 20 nucleótidos hasta secuencias de nucleótidos más grandes.
De acuerdo con el método de la presente invención se puede obtener no solo un número impar de eventos de recombinación sino también un número par en un gen recombinado aislado. Esto es una ventaja específica sobre la recombinación meiótica in vivo.
Patrones complejos de mosaicismo recombinante se pueden obtener con el presente método, alcanzando un gran número de bloques de secuencias recombinadas de diferente longitud dentro de una sola molécula. Además, se puede obtener una sustitución de nucleótidos de tipo puntual que se corresponde a uno de los moldes de la cadena como una fuente importante de diversidad, respetando el marco de los marcos de lectura abiertos. El mosaicismo y cambio de tipo puntual no son necesariamente conservadores a nivel de proteína. De hecho, se pueden generar nuevos aminoácidos con diferentes propiedades polares después de la recombinación, proporcionando nuevas propiedades proteicas potenciales y enzimáticas a las proteínas recombinantes obtenidas por este método.
Preferiblemente, los genes son secuencias que codifican proteínas o partes de fragmentos de las mismas que codifican enzimas o proteínas para aplicaciones terapéuticas o industriales. De aquí en adelante, el término "polipéptidos" deberá incluir péptidos de interés que tienen preferiblemente al menos 2 aminoácidos, preferiblemente al menos 3 polipéptidos y proteínas. Los polipéptidos de interés se seleccionan preferiblemente, pero no se limitan a enzimas, miembros de la superfamilia de inmunoglobulinas, tales como anticuerpos y dominios de anticuerpos o fragmentos, citocinas, antígenos de vacunas, factores de crecimiento y péptidos.
Los catalizadores enzimáticos se usan adecuadamente en muchos procesos industriales debido a su alta selectividad. Las enzimas preferidas tal y como se utilizan para la diversificación de acuerdo con la invención, incluyen enzimas proteolíticas, tales como subtilisinas; enzimas celulolíticas, tales como enzimas para soltar la pared celular tal como se utilizan en la industria de la pulpa y del papel, endoglucanasa, amilosacarasa, aldolasa, cinasa de azúcar, celulosa, amilasa, xilanasa, deshidrogenasa de glucosa y beta-glucosidasa, lacasa; lipasas tal como se utilizan en la síntesis de productos de química fina, agroquímicos y farmacéuticos; esterasas, por ejemplo, para la producción de biocombustible. Un ejemplo preferido de la mejora de una enzima es la producción de una alcohol deshidrogenasa con termoestabilidad mejorada.
Se puede mostrar que incluso los genes que codifican polipéptidos de cadenas múltiples con estructuras complejas y plegamientos se pueden recombinar y ensamblar. Ejemplos preferidos son los miembros de la superfamilia de inmunoglobulinas, entre ellos las inmunoglobulinas y los polipéptidos que comparten características estructurales con inmunoglobulinas que poseen un dominio conocido, como un dominio o un plegamiento de inmunoglobulina, incluyendo receptores de antígenos en la superficie celular, correceptores y moléculas coestimuladoras del sistema inmune, moléculas involucradas en la presentación de antígenos a linfocitos, moléculas de adhesión celular, determinados receptores de citocinas y proteínas musculares intracelulares. Preferiblemente se recombinan y se ensamblan anticuerpos o fragmentos de anticuerpos, tales como Fab, Fv o scFv.
Alternativamente, los genes de mosaicos también pueden ser secuencias que no codifican proteínas, como por ejemplo secuencias que están implicadas en la regulación de la expresión de una secuencia que codifica una proteína, incluso secuencias reguladoras tales como ARNs no codificantes cortos y largos. Estos pueden ser, pero no se limitan a secuencias promotoras, secuencias de intrones, secuencias que codifican señales de poliadenilación.
En una realización preferida de la invención, el ensamblaje de un gen de un mosaico, su recombinación con un genoma hospedador y, además, la expresión del gen del mosaico para producir un polipéptido recombinante de interés o un metabolito de dicha célula hospedadora, se lleva a cabo en un procedimiento de una sola etapa.
De acuerdo con la presente invención, se puede emplear la biología molecular convencional, la microbiología y técnicas de ADN recombinante dentro de los conocimientos de la técnica. Tales técnicas se explican completamente en la bibliografía. Véase, por ejemplo, Maniatis, Fritsch y Sambrook, "Molecular Cloning: A Laboratory Manual” (1982).
Para la recombinación in vivo, el gen que se va a recombinar con el genoma o con otros genes se utiliza para transfectar el hospedador usando técnicas de transfección convencionales. En una realización adecuada, un ADN que proporciona un origen de replicación está incluido en la estructura artificial. El origen de replicación puede ser seleccionado de manera adecuada por una persona experta. Dependiendo de la naturaleza de los genes, un origen de replicación suplementario puede no ser necesario si las secuencias ya están presentes en los genes o en el genoma las cuales pueden funcionar como orígenes de replicación ellas mismas.
Secuencias de ácido nucleico sintético o casetes y subconjuntos se pueden producir en forma de polinucleótidos lineales, plásmidos, megaplásmidos, cromosomas sintéticos o artificiales, tales como cromosomas vegetales, bacterianos, de mamífero o cromosomas artificiales de levadura.
Una célula se puede transformar con ADN exógeno o heterólogo cuando dicho ADN se ha introducido dentro de la célula. El ADN transformante se puede integrar o no, es decir, estar unido covalentemente al genoma de la célula. En procariotas, levaduras y células de mamífero, por ejemplo, el ADN transformante se puede mantener en un elemento episomal tal como un plásmido. Con respecto a las células eucariotas, una célula transformada de manera estable es una en la que el ADN transformante se ha integrado en un cromosoma de manera que es heredado por las células hijas a través de la replicación cromosómica. Esta estabilidad se demuestra por la capacidad de la célula eucariota para establecer líneas celulares o clones compuestos de una población de células hijas que contienen el ADN transformante.
Los diversos sustratos génicos se pueden incorporar en plásmidos. Los plásmidos son frecuentemente vectores de clonación convencionales, por ejemplo, plásmidos multicopia bacterianos. Los sustratos se pueden incorporar en los mismos plásmidos o en diferentes. Frecuentemente se utilizan al menos dos tipos diferentes de plásmidos que tienen diferentes tipos de marcadores seleccionables para permitir la selección de células que contienen al menos dos tipos de vector.
Los plásmidos que contienen diversos sustratos génicos se introducen inicialmente en las células a través de cualquier método (por ejemplo, transformación química, competencia natural, electroporación, biolística, empaquetamiento en sistemas de fagos o víricos). Frecuentemente los plásmidos están presentes a una concentración de saturación o una concentración próxima (con respecto a la capacidad máxima de transfección) para aumentar la probabilidad de que más de un plásmido entre en la misma célula. Los plásmidos que contienen diversos sustratos se pueden transfectar simultáneamente o en rondas múltiples. Por ejemplo, en la última metodología, las células se pueden transfectar con una primera parte alícuota de plásmido, los transfectantes se seleccionan y se propagan, y después se infectan con una segunda parte alícuota de plásmido. Los plásmidos preferidos son, por ejemplo, derivados de pUC y pBluscribe, como pMXY9, pMXY12 y pMIX-LAM o derivados de YAC como YCp50.
La tasa de evolución se puede incrementar permitiendo que todos los sustratos génicos participen en la recombinación. Esto se puede lograr sometiendo las células transfectadas a electroporación Las condiciones para la electroporación son las mismas que las que se utilizan convencionalmente para introducir ADN exógeno en las células. La tasa de evolución también se puede incrementar fusionando células para inducir el intercambio de plásmidos o de cromosomas. La fusión se puede inducir mediante agentes químicos, tales como PEG, o proteínas víricas, tales como hemaglutinina del virus de la influenza, gB y gD de HSV-1. La tasa de evolución también se puede incrementar empleando células hospedadoras mutadoras (por ejemplo, Mut L, S, D, T, H en bacterias, mutantes análogos en levaduras y líneas celulares humanas de Ataxia telangiectasia).
Las células que son portadoras de los genes recombinados están sujetas a escrutinio o a selección en busca de una función deseada. Por ejemplo, si el sustrato que se va a evolucionar contiene un gen de resistencia a fármacos, se podría seleccionar por resistencia a fármacos.
Típicamente, en este método de recombinación de la invención, el producto final de la recombinación que ha adquirido el fenotipo deseado, difiere de los sustratos de partida en el 0,1%-50% de las posiciones y ha evolucionado con una tasa con órdenes de magnitud en exceso (por ejemplo, por lo menos 10 veces, 100 veces,
1.000 veces o 10.000 veces) de la tasa de mutación adquirida de forma natural. El producto final de mosaico de genes se puede transferir a otro hospedador más deseable para la utilización del barajado de ADN para fines de producción.
En un método preferido de acuerdo con la invención, la célula hospedadora está presentando el mosaico de genes en la superficie celular utilizando sistemas de presentación en células bien conocidos. Mediante la diversificación a través de tal hibridación, se produce un repertorio de variantes génicas que se puede presentar convenientemente para crear una genoteca de tales variantes.
Los métodos adecuados de presentación incluyen la presentación en levaduras y la presentación en células bacterianas. Genotecas particularmente preferidas son genotecas de presentación en la superficie de levaduras, tal como se utilizan en muchas aplicaciones en la modificación genética de proteínas y el escrutinio de genotecas. Tales genotecas proporcionan una selección adecuada de las variantes de polipéptidos con propiedades fenotípicas mejoradas, en relación con las del polipéptido de tipo silvestre. Preferiblemente se utilizan métodos de selección basados en células, por ejemplo, frente a ligandos inmovilizados en la superficie. Una técnica de selección comúnmente utilizada comprende analizar y comparar las propiedades del polipéptido mutante obtenido a partir de tal genoteca, con las propiedades del polipéptido de tipo silvestre. La mejora de propiedades deseables incluiría un cambio de la especificidad o de la afinidad de las propiedades de unión de un polipéptido ligando, que es capaz de unirse a un receptor. La maduración de la afinidad del polipéptido es una realización particularmente preferida de la invención. Otras propiedades deseables de una variante se refieren a la estabilidad, por ejemplo, termoestabilidad, estabilidad frente al pH, estabilidad frente a proteasas, solubilidad, rendimiento o nivel de secreción del polipéptido recombinante de interés.
Una genoteca obtenida por el método de acuerdo con la invención contiene un alto porcentaje de candidatos principales potenciales de genes de mosaico funcionales, que se pueden expresar en un ORF funcional. La genoteca preferida tiene al menos 80% de los mosaicos de genes contenidos dentro de un ORF funcional, preferiblemente al menos 85%, al menos 90%, incluso al menos 95%. La genoteca tal y como se proporciona de acuerdo con la invención, se caracteriza además específicamente por la presencia de la secuencia marcadora que indica el alto porcentaje de éxito de la hibridación. De acuerdo con la invención, se pueden obtener no solo números impares de parches de mosaicos, sino que se pueden obtener números pares que aumentan el número de variantes
o de miembros de la genoteca en genotecas recombinantes producidas por dicho método.
Las genotecas comprenden generalmente al menos 10 variantes de los mosaicos de genes, preferiblemente al menos 100, más preferiblemente al menos 1.000, más preferiblemente al menos 104, más preferiblemente al menos 105, más preferiblemente al menos 106, más preferiblemente al menos 107, más preferiblemente al menos 108, más preferiblemente al menos 109, más preferiblemente al menos 1010, más preferiblemente al menos 1011, hasta 1012, incluso es factible un número mayor.
El método de acuerdo con la invención puede proporcionar una genoteca que contiene al menos 102 clones
5 independientes que expresan variantes funcionales de mosaicos de genes. También se puede proporcionar un grupo de clones independientes preseleccionados, que por ejemplo se madura por afinidad, en donde dicho grupo comprende preferiblemente al menos 10, más preferiblemente al menos 100, más preferiblemente al menos 1.000, más preferiblemente al menos 10.000, incluso más de 100.000 clones independientes. Las genotecas que contienen los grupos preseleccionados, son fuentes preferidas para seleccionar variantes de alta afinidad de acuerdo con la
10 invención.
Las genotecas comprenden preferiblemente al menos 102 miembros de la genoteca, más preferiblemente al menos 103, más preferiblemente al menos 104, más preferiblemente al menos 105, más preferiblemente al menos 106 miembros de una genoteca, más preferiblemente al menos 107, más preferiblemente al menos 108, más preferiblemente al menos 109, más preferiblemente al menos 1010, más preferiblemente al menos 1011, hasta 1012
15 miembros de una genoteca, preferiblemente obtenida a partir de un gen parental para modificar genéticamente una nueva propiedad del polipéptido de interés correspondiente.
Preferiblemente, la genoteca es una genoteca de levadura y la célula hospedadora de levadura muestra preferiblemente en la superficie de la célula, el polipéptido de interés que tiene actividad biológica. Alternativamente, los productos permanecen dentro de la célula o se secretan fuera de la célula. La célula hospedadora de levadura se 20 selecciona preferiblemente entre los géneros Saccharomyces, Pichia, Hansenula, Schizosaccharomyces, Kluyveromyces, Yarrowia y Candida. Lo más preferido es que la célula hospedadora sea Saccharomyces cerevisiae.
Los ejemplos descritos en el presente documento son ilustrativos de la presente invención y no se pretende que sean limitaciones de la misma. Diferentes realizaciones de la presente invención se han descrito de acuerdo con la presente invención. Se pueden realizar muchas modificaciones y variaciones de las técnicas descritas e ilustradas
25 en esta memoria, sin apartarse del espíritu y del alcance de la invención. Por consiguiente, debe entenderse que los ejemplos son solo ilustrativos y no son limitativos del alcance de la invención.
Ejemplos
Ejemplo 1
Descripción
30 En nuestra configuración experimental inicial utilizamos genes de beta lactamasa de la clase OXA como sustrato para ser recombinado. La ventaja de los genes OXA radica en el hecho de que son genes homeólogos disponibles con diferente diversidad (de 5-50%). Estos genes son, por lo tanto, buenos candidatos para someter a ensayo los límites de la diversidad de una recombinación in vivo. Los genes también son de fácil manejo (aproximadamente 800 pb de longitud).
35 La Fig. 4 muestra los sustratos de recombinación de OXA: genes y homología
Tabla 1: Identidad de secuencia de los genes Oxa
- Oxa 7 Oxa 11 Oxa 5 Oxa 1
- Oxa 7
- 100%
- Oxa 11
- 95% 100%
- Oxa 5
- 77% 78% 100%
- Oxa 1
- 50% 49% 50% 100%
En el primer experimento, Oxa 11 se recombinó respectivamente con Oxa 7 (95% de identidad), Oxa 5 (77% de identidad) y Oxa 1 (49% de identidad).
40 Se utilizó la cepa de levadura BY47 obtenida a partir de una colección de cepas (EUROSCARF) que contiene inactivaciones de genes marcadores auxotróficos (-ura3, -leu2) genes marcadores y msh2. Los defectos génicos en la ruta biosintética de uracilo y leucina dan como resultado una auxotrofía, es decir, se tiene que añadir uracilo y leucina al medio de crecimiento.
En una primera etapa se diseñaron fragmentos de genes que contenían por un lado el marcador URA3 y OXA11 o
45 por otro lado OXA 5/7/1 respectivamente con el otro marcador LEU2. De forma adyacente al extremo 5’ del fragmento URA-OXA11, se insertó un fragmento de ADN de aproximadamente 400 pb (secuencia diana flanqueante en 5’) que se corresponde con el sitio de inserción 5’ en la región BUD 31 del cromosoma de levadura. En el extremo 3’ de OXA 5/7/1, se insertó un fragmento de ADN de aproximadamente 400 pb (secuencia diana flanqueante en 3’) que se corresponde con el sitio 3’ adyacente en el cromosoma (véase, Fig. 3). Todos los fragmentos fueron sintetizados de acuerdo con protocolos convencionales en Geneart (Alemania).
Los fragmentos sintetizados fueron amplificados con PCR y se utilizaron para la transformación.
5 El fragmento URA3-OXA 11 y uno de los otros fragmentos OXA-LEU2 se transformaron en cepas de tipo silvestre (BY26240 diploide, Euroscarf) y en cepas carentes de reparación de apareamientos erróneos (BY06240 haploide amater, msh2-, Euroscarf). El protocolo de la transformación era según Gietz [Gietz, R.D. y R.A. Woods. (2002) “TRANSFORMATION OF YEAST BY THE Liac/SS CARRIER DNA/PEG METHOD”. Methods in Enzymology 350: 87-96]. Los transformantes se sembraron en placas que contenían medio selectivo para la selección de los
10 marcadores apropiados (sin uracilo, leucina). Después de 72 horas se pudieron observar colonias.
Tabla 2: Número de clones obtenidos después de la transformación/selección
- Levadura / trafo
- Oxa11/Oxa11 (1) Oxa11/Oxa07 (2) Oxa11/Oxa05 (3) Oxa11/Oxa1 (4)
- BY26240 (diploide msh+)
- 106 (5) <10 0 ND
- BY06240 (haploide Δmsh2)
- 5x104 5x103 103 ND
- (1)
- Testigo homólogo
- (2)
- 5% de divergencia a nivel de ADN
(3) 23% de divergencia a nivel de ADN 15 (4) 51% de divergencia a nivel de ADN
(5) Número de upc estimado por ml de mezcla de transformación y μg de ADN en medios selectivos (-ura -leu).
Se aislaron un total de 48 colonias a partir de la transformación de BY06240 y se realizó una PCR de la colonia (lisis y PCR Herculase basada en el protocolo de Cha y Thilly: “Specificity, Efficiency and fidelity of PCR, in PCR primer: A laboratory Manual”, Dieffenbach y Dveksler compiladores, 1995, pág 37). Se realizaron diferentes reacciones de 20 PCR para verificar la inserción correcta de los fragmentos en la región diana. 37 clones de los 48 mostraron perfiles de inserción correcta. De estos 37, 31 proporcionaron productos de amplificación claros y explotables para secuenciación. La reacción que utiliza dos cebadores específicos que flanquean las ORFs de Oxa, solo permite la amplificación de recombinantes verdaderos si las secuencias OXA están realmente ensambladas. Además, el producto obtenido es un sustrato adecuado para una secuenciación directa. Por lo tanto, los productos positivos de
25 la amplificación fueron secuenciados (GATC).
Resultados de la secuenciación
Se secuenciaron 24 clones de los 31 (los que tenían señales de amplificación positivas más claras). Se correspondían a:
Testigo homólogo Oxa11/Oxa11 (SEQ ID NO 39), testigo homólogo Oxa07/Oxa07 (SEQ ID NO 40), testigo 30 homólogo Oxa05/0xa05 (SEQ ID NO 41)
fe02 a fe06, fe09 y fe11: Oxa11/Oxa07 (SEQ ID NO 1 a SEQ ID NO 14)
fe09 y fe13, fe14, fe16 a fe24: Oxa11/Oxa5 (SEQ ID NO 15 a SEQ ID NO 38)
Para ver los resultados de la secuenciación de todos los clones, véanse las figuras 5 y 6 y SEQ ID NOs 1 a 38.
Para la reasociación del ADN de los clones Oxa11/Oxa07, véase la fig. 5, SEQ ID NOs 1, 3, 5, 7, 9, 11 y 13.
35 Para la reasociación del ADN de los clones Oxa11/Oxa05, véase la fig. 6, SEQ ID NOs 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 y 37.
Para la reasociación de proteínas de OXA11/Oxa07, véase la fig. 5, SEQ ID NOs 2, 4, 6, 8, 10, 12 y 14.
Para la reasociación de proteínas de Oxa11/Oxa05, véase la fig. 6, SEQ ID NOs 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 y 38.
40 Ejemplo 2
Descripción
Como una segunda alternativa para generar genotecas de genes de mosaicos complejos, se ensamblaron tres secuencias de genes diferentes, pero relacionadas, y se recombinaron. Como en el ejemplo 1, se utilizaron secuencias del gen OXA para su ensamblaje en levadura carente de MMR (para la identidad del gen OXA, véase la 45 fig. 4). Como se muestra en la figura 3, el principio de la generación del mosaico se basa en el uso de secuencias
truncadas respectivamente de OXA 11 (gen A) y OXA 7 (gen B) que se hibridan con el ORF completo de OXA 5 (gen C). Por lo tanto, solo los casetes ensamblados e integrados de A-B-C que comparten los marcadores auxotróficos, serán seleccionadas después de la transformación.
Como en el ejemplo 1, se utilizó la cepa de levadura BY47 obtenida a partir de una colección de cepas
5 (EUROSCARF) que contenía inactivaciones de genes marcadores auxótrofos (-ura3, -leu2) y una deleción de msh2. Los defectos génicos en la ruta biosintética de uracilo y leucina dan como resultado una auxotrofía, es decir, se tiene que añadir uracilo y leucina al medio de crecimiento.
Se obtuvieron nuevos fragmentos génicos que contenían los genes truncados A y B, mediante PCR específica de los fragmentos ya descritos en el ejemplo 1: URA-OXA11 (reasociación del cebador inverso en los nucleótidos 386
10 406 del ORF de OXA11) y OXA7-Leu (reasociación del cebador directo en los nucleótidos 421-441 del ORF de OXA 7). El ORF completo del gen OXA 5 se obtuvo mediante PCR a partir del fragmento OXA5-Leu. El fragmento END-Leu se utilizó como en el ejemplo 1. Fragmentos de PCR purificados se utilizaron para la transformación.
El protocolo de la transformación era según Gietz [Gietz, R.D. y R.A. Woods. (2002) “TRANSFORMATION OF YEAST BY THE Liac/SS CARRIER DNA/PEG METHOD”. Methods in Enzymology 350: 87-96]. Los transformantes
15 se sembraron en placas que contenían medio selectivo para la selección de los marcadores apropiados (sin uracilo, leucina). Después de 72 horas se pudieron observar colonias
Tabla 3: Número de clones obtenidos después de la transformación/selección
- Levadura / trafo
- Oxa11/Oxa5/Oxa7 (1) Oxa11/Oxa07 (2)
- BY26240 (diploide msh2+)
- <101 (3) ND (5)
- BY06240 (haploide Δmsh2)
- 1,4x104 (4) <5
(6) Tres secuencias OXA para ensamblar
(7) Secuencia media OXA5 falta (testigo negativo) 20 (8) Ruido de fondo de la recombinación homeóloga en levadura capaz de MMR
- (9)
- Ruido de fondo de la recombinación homeóloga en levadura carente de MMR
- (10)
- ND = colonias no detectadas
Se aislaron al azar un total de 8 colonias procedentes de la transformación BY06240 y se realizó una PCR de las colonias (lisis y PCR Herculase basada en el protocolo de Cha y Thilly: “Specificity, Efficiency and fidelity of PCR, in 25 PCR primer: A laboratory Manual”, Dieffenbach y Dveksler compiladores, 1995, pág 37). Se realizaron diferentes reacciones de PCR para verificar la inserción correcta de los fragmentos en la región diana. 7 clones de los 8 mostraron perfiles de inserción correctos. De estos, 7 proporcionaron productos de la amplificación claros y explotables para secuenciación. La reacción que utiliza dos cebadores específicos que flanquean los ORFs de Oxa, solo permite la amplificación de recombinantes verdaderos si las secuencias OXA están realmente ensambladas.
30 Además, el producto obtenido es un sustrato adecuado para secuenciación directa. Por lo tanto, los productos positivos de la amplificación fueron secuenciados (GATC).
Resultados de la secuenciación
Siete clones de los 8 (los que tenían las señales de amplificación positivas más claras) fueron secuenciados y se obtuvieron 5 secuencias explotables. Todos ellos se correspondían con el ensamblaje homeólogo
35 OXA11/OXA5/OXA7 procedente de los clones OUL3-05-II, OUL3-05-III, OUL3-05-IV, OUL3-05-IX y OUL3-05-X.
Para ver los resultados de la secuenciación de todos los clones y de la reasociación de proteínas, véase la figura 8: OUL3-05-II (SEQ ID NOs 42 y 43), OUL3-05-III (SEQ ID NOs 44 y 45), OUL3-05-IV (SEQ ID NOs 46 y 47), OUL3-05-IX (SEQ ID NOs 48 y 49) y OUL3-05-X (SEQ ID NOs 50 y 51) de OXA11/OXA5/OXA7.
Discusión
40 Se ha comprobado este método simple de transformación de células mitóticas que carecen de MMR con secuencias divergentes como moldes para el ensamblaje en la célula y la generación de diversidad mediante recombinación in vivo (figuras 5, 6 y 8).
Los patrones complejos de mosaicismo recombinante se han obtenido por el método descrito en el ejemplo 1, consiguiendo al menos 17 parches de diferente longitud en una sola molécula de 800 pb (es decir, los clones fe19
45 (SEQ ID NO 27) y fe20 (SEC ID NO 28). Los eventos de recombinación parecen tener lugar todo el largo de las secuencias.
Por otra parte, la sustitución de tipo puntual de nucleótido que se corresponde con una de las plantillas de la cadena, se observó como una fuente importante de diversidad, respetando el marco de los ORFs (es decir, los clones fe19 (SEQ ID NO 27) y fe20 (SEQ ID NO 29).
Además, este método de recombinación producía mosaicos de más de dos genes relacionados, tal y como se muestra en el ejemplo 2, mediante el uso de secuencias procedentes de tres genes relacionados (OXA 11, OXA 7 y OXA 5) al mismo tiempo (es decir, los clones OUL3-05-III y OUL3-05-IX). Esta es una forma altamente eficaz para recombinar regiones de interés a partir de varios genes, y representa una nueva fuente de divergencia basada en la generación de genotecas de genes de mosaicos in vivo.
Ninguno de los clones recombinantes produjo productos proteicos truncados, tal y como se verificó mediante análisis in silico de ADNs traducidos (figuras 5, 6 y 8).
Solo 1 clon (fe15) de los 21 mostró un perfil parental (datos no presentados).
El mosaicismo y el intercambio de tipo puntual no son necesariamente conservadores a nivel proteico. De hecho, se generaron nuevos aminoácidos con diferentes propiedades polares después de la recombinación, proporcionando nuevas propiedades proteicas potenciales y enzimáticas a las muteínas recombinantes (es decir, los clones fe19 (SEQ ID NO 27) y fe20 (SEQ ID NO 29)
Una característica muy atractiva de la generación de recombinantes a través de este enfoque preparando genotecas de recombinantes más ricas, es el hecho de que no solo se podría obtener un número impar de eventos de recombinación sino también incluso un número par de eventos (es decir, fe06 (SEQ ID NO 7), fe11 (SEQ ID NO 13), fe13 (SEQ ID NO 17), fe19 (SEQ ID NO 27), en comparación con el enfoque de recombinación meiótica, con el que solo se podían representar en la genoteca los eventos impares.
Algunas mutaciones puntuales, no relacionadas con los moldes parentales, se observaron en algunas pocas secuencias (es decir, fe16 (SEQ ID NO 21) y fe17 (SEQ ID NO 23). En todos esos casos, las mutaciones no cambiaron el marco de lectura de los ORFs resultantes.
Ejemplo 3:
ADH 1
En un segundo ejemplo, seleccionamos un ADN endógeno como diana para la recombinación. La alcohol deshidrogenasa 1 (ADH1) es la enzima clave para la producción de etanol en la levadura Saccharomyces cerevisiae. Tiene interés industrial para generar variantes de Adh1 mejoradas.
Las cepas BY06246 procedente de Euroscarf y W303 procedente de Euroscarf se utilizan para este experimento.
El gen ADH1 de Saccharomyces cerevisiae ya se ha localizado en el cromosoma XV. Por lo tanto, la introducción de un solo gen homeólogo es suficiente para la recombinación. Con el fin de asegurar que los recombinantes recombinados no van a seguir mutando, también restablecimos el tipo silvestre con reparación de apareamientos erróneos. Por lo tanto, además, añadimos un fragmento que contenía un gen MSH2 funcional con sus regiones promotora y terminadora.
Como ligando para la recombinación de genes somáticos seleccionamos el gen ADH1 de Kluyveromyces thermotholerans/Lachancea thermotolerans que tiene 82% de homología con el gen de Saccharomyces cerevisiae. Se diseñaron dos fragmentos. Un fragmento contiene el marco de lectura abierto de ADH1 de K. thermotholerans. En su extremo 3’, se diseña un fragmento que contiene 296 pb de la región terminadora procedente del casete del gen TRP1 que comprende 283 pb del promotor y las primeras 743 pb del ORF URA3 de Kluyveromyces lactis. El producto génico URA3 de K. lactis puede complementar el defecto ura3 en Saccharomyces cerevisiae. El segundo fragmento contiene las últimas 160 pb de URA3 y 223 pb de la región terminadora de URA3. Esta secuencia viene seguida por 468 pb del promotor endógeno de MSH2 y el ORF MSH2 (2894 pb) y 242 pb del terminador TEF1. El fragmento está flanqueado en el lado 3’ por una secuencia de 403 pb que es idéntica a la del sitio de inserción en el Cr. XV. Todos los fragmentos fueron sintetizados en Geneart.
Ya que el extremo 3’ del fragmento ADH1-URA3 y el extremo 5’ del fragmento URA3-MSH2 son homólogos, los dos fragmentos se pueden ensamblar. Después del ensamblaje tiene lugar la recombinación con el gen ADH1 de Saccharomyces cerevisiae y la etapa de integración.
Después de la transformación, varios clones fueron aislados al azar y se preparó el ADN. El ADN de los recombinantes ADH se secuenció. Las secuencias subrayadas se han obtenido a partir de ADH de Kluyveromyces lactis, la otra a partir de ADH de Saccharomyces cerevisiae (véase la Figura 9).
LISTA DE SECUENCIAS
- <110> Eviagenics
- 5
- <120> Método para generar genes híbridos
- <130> Ev001P
- 10
- <160> 59 <170> PatentIn versión 3.5
- 15
- <210> 1 <211> 801 <212> ADN <213> Artificial
- 20
- <220> <223> gen híbrido OXA11/OXA7 <400> 1
<210> 2 25 <211> 266
<212> PRT
<213> Artificial
<220> 30 <223> proteína híbrida OXA11/OXA7
<400> 2 <210> 3
<213> Artificial
<220>
- <223>
- gen híbrido OXO11/OXO7 10
<400> 3
<210> 4
<213> Artificial
<220>
- <223>
- proteína híbrida OXA11/OXA7 10
<400> 4
<210> 5
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA7 10
<400> 5
<210> 6
<213> Artificial
<220>
- <223>
- proteína híbrida OXA11/OXA7 10
<400> 6
<210> 7
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA7 10
<400> 7
<210> 8
<211> 266
<212> PRT
<213> Artificial
<220>
<223> proteína híbrida OXA11/OXA7
<400> 8
<210> 9
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA7 10
<400> 9
<210> 10 15 <211> 266
<212> PRT
<213> Artificial
<220> 20 <223> proteína híbrida OXA11/OXA7
<400> 10
<210> 11
<211> 801
<212> ADN
<213> Artificial
<220>
<223> gen híbrido OXA11/OXA7
<400> 11
- 10
- <210> 12
- <211> 266
- <212> PRT
- <213> Artificial
- 15
- <220>
- <223> proteína híbrida OXA11/OXA7
- <400> 12
<210> 13
<211> 801
<212> ADN
<213> Artificial <220>
<223> gen híbrido OXA11/OXA7
<400> 13
<210> 14
<211> 266
<212> PRT 10 <213> Artificial
<220>
<223> proteína híbrida OXA11/OXA7
15 <400> 14 <210> 15
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA5 10
<400> 15
<210> 16
<213> Artificial
<220>
- <223>
- proteína híbrida OXA11/OXA5 10
<400> 16
<210> 17
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA5 10
<400> 17
<210> 18
<211> 266
<212> PRT
<213> Artificial
<220>
<223> proteína híbrida OXA11/OXA7
<400> 18
<210> 19
<213> Artificial
<220>
- <223>
- gen híbrido OXA11/OXA5 10
<400> 19
<210> 20 15 <211> 267
<212> PRT
<213> Artificial
<220> 20 <223> proteína híbrida OXA11/OXA5
<400> 20
<210> 21
<211> 801
<212> ADN
<213> Artificial
<220>
<223> gen híbrido OXO11/OXO5
<400> 21
<210> 22
<211> 266
<212> PRT 15 <213> Artificial
<220>
<223> proteína híbrida OXO11/OXO5
20 <400> 22 <210> 23
<213> Artificial
<220>
- <223>
- gen híbrido OXO11/OXO5 10
<400> 23
<210> 24
<213> Artificial
<220>
- <223>
- proteína híbrida OXO11/OXO5 10
<400> 24
<210> 25
<213> Artificial
<220>
- <223>
- gen híbrido OXO11/OXO5 10
<400> 25
<210> 26
<213> Artificial
<220>
- <223>
- proteína híbrida OXO11/OXO5 10
<400> 26
<210> 27
<213> Artificial
<220>
- <223>
- gen híbrido OXO11/OXO5 10
<400> 27
<210> 28 15 <211> 266
<212> PRT
<213> Artificial
<220>
<223> proteína híbrida OXO11/OXO5
<400> 28
<210> 29
<213> Artificial
<220>
<223> gen híbrido OxO11/OXO5 10
<400> 29
<210> 30 15 <211> 266
<212> PRT
<213> Artificial
<220> 20 <223> proteína híbrida OXO11/OXO5
<400> 30
<210> 31
<211> 801
<212> ADN
<213> Artificial
<220>
<223> gen híbrido OXO11/OXO5
<400> 31
<210> 32
<211> 266
<212> PRT 15 <213> Artificial
<220>
<223> proteína híbrida OXO11/OXO5
20 <400> 32 <212> ADN
<213> Artificial
<220> 10 <223> gen híbrido OxO11/OXO5
<400> 33 5 <210> 34
<211> 266
<212> PRT
<213> Artificial
10 <220>
<223> proteína híbrida OXO11/OXO5
<400> 34
<210> 35
<211> 804
<212> ADN
5 <213> Artificial
<220>
<223> gen híbrido OXO11/OXO5
10 <400> 35
15 <210> 36
<211> 267
<212> PRT
<213> Artificial
20 <220>
<223> proteína híbrida OXO11/OXO5
<400> 36
<210> 37
<211> 804
<212> ADN
<213> Artificial
<220>
<223> gen híbrido OXO11/OXO5
<400> 37
<210> 38
<211> 267
<212> PRT 15 <213> Artificial
<220>
<223> proteína híbrida OXO11/OXO5
20 <400> 38 <210> 39
<211> 801
<212> ADN
<213> Saccharomyces cerevisiae
<400> 39
<210> 40
<211> 801
<212> ADN
- <213>
- Saccharomyces cerevisiae 10
<400> 40
<210> 41
<211> 804
<212> ADN
- <213>
- Saccharomyces cerevisiae 20
<400> 41
<210> 42
5 <211> 827
<212> ADN
<213> Secuencia Artificial
<220> 10 <223> OUL3-05-II
<210> 43
<211> 266
<212> PRT
<213> Artificial
<220>
<223> OUL3-05-II
<400> 43
<210> 44
<213> Artificial
<220>
- <223>
- OUL3-05-III 10
<400> 44
<210> 45
<213> Artificial
<220>
- <223>
- OUL3-05-III 10
<400> 45
<210> 46
<213> Secuencia Artificial
<220>
- <223>
- OUL3-05-IV 10
<400> 46
<210> 47 15 <211> 266
<212> PRT
<213> Secuencia Artificial
<220> 20 <223> OUL3_05_IV
<400> 47
<210> 48
<213> Secuencia Artificial
<220>
<223> OUL3-05-IX 10
<400> 48
<210> 49 15 <211> 266
<212> PRT
<213> Secuencia Artificial
<220> 20 <223> OUL3-05-IX
<400> 49
<210> 50
<211> 801
<212> ADN
<213> Secuencia Artificial
<220>
<223> OUL3-05-X
<400> 50
<210> 51 10 <211> 266
<212> PRT
<213> Secuencia Artificial
<220> 15 <223> OUL3-05-X
<400> 51
<210> 52
<211> 1056
<212> ADN
<213> Kluyveromyces
<400> 52
<210> 53
<211> 1045
<212> ADN
<213> Saccharomyces
<400> 53
<210> 54
<211> 1047
<212> ADN
<213> Artificial
<220>
<223> Clon A02
<400> 54
10 <210> 55
<211> 1060
<212> ADN
<213> Artificial
15 <220>
<223> Clon A03
<400> 55
<210> 56
5 <211> 1047
<212> ADN
<213> Artificial
<220> 10 <223> Clon A05
<210> 57
<211> 1047
<212> ADN
<213> Artificial
<220>
<223> Clon A06
<400> 57
<210> 58
<211> 1049
<212> ADN 15 <213> Artificial
<220>
<223> Clon A10
20 <400> 58
<210> 59
<211> 1047
5 <212> ADN
<213> Artificial
<220>
<223> Clon All 10
<400> 59
Claims (14)
- REIVINDICACIONES1. Un método para generar un mosaico de genes mediante recombinación somática in vivo de secuencias de ADN homeólogas, que comprendea) en un procedimiento de una sola etapa,
- (i)
- transformar una célula que carece de reparación de ADN con al menos un gen A que tiene una homología de secuencia de al menos 30% y menos de 99,5% con otro gen que se va a recombinar que es una parte integral del genoma celular o está presente en el armazón de una estructura artificial genética, empleando al menos un gen B que se va a recombinar,
- (ii)
- recombinar dichos genes,
(iii) generar un mosaico génico de los genes en un sitio de integración de un genoma diana,en donde dicho al menos un gen A tiene una única secuencia diana flanqueante en el extremo 5’ o el extremo 3’ que se ancla al extremo 5’ o al extremo 3’ de dicho sitio de integración, en donde la secuencia diana flanqueante única del gen A está anclada al extremo 5’ del sitio de integración mientras que el gen B tiene una secuencia diana flanqueante única que se ancla al extremo 3’, yb) seleccionar los clones que comprenden al menos un mosaico de genes intragénico. -
- 2.
- Un método según la reivindicación 1, en el que un marcador de selección se utiliza en el mosaico de genes y los clones se seleccionan según la presencia del marcador de selección.
-
- 3.
- Un método según la reivindicación 1 o 2, en el que se obtienen mosaicos de genes de una secuencia no codificadora, un gen o genes parciales con al menos 3 hasta 20.000 pares de bases
-
- 4.
- Un método según una cualquiera de las reivindicaciones 1 a 3, en el que la célula se cotransforma con al menos dos variantes diferentes del gen A que se va a recombinar, que son los genes A1 y A2, y opcionalmente con al menos dos variantes diferentes del gen B que se va a recombinar, que son los genes B1 y B2.
-
- 5.
- Un método según una cualquiera de las reivindicaciones 1 a 4, en el que al menos un gen C adicional se cotransforma, el cual tiene una secuencia que se hibrida con una secuencia del gen A y/o dicho otro gen para obtener el ensamblaje de dicho gen C adicional con el gen A y/o dicho otro gen, en donde uno o varios de los genes ensamblados tiene un mosaico de genes intragénico.
-
- 6.
- Un método según cualquiera de las reivindicaciones 1 a 5, en el que dicho gen A y/o dicho otro gen son secuencias no codificadoras o que codifican un polipéptido o parte de un polipéptido que tiene una actividad.
-
- 7.
- Un método según la reivindicación 5 o 6, en el que múltiples genes que codifican polipéptidos de una ruta bioquímica se recombinan y se ensamblan.
-
- 8.
- Un método según una cualquiera de las reivindicaciones 1 a 7, en el que la célula es una célula con una inactivación de un gen de reparación del ADN o una célula que carece de reparación de apareamientos erróneos.
-
- 9.
- Un método según una cualquiera de las reivindicaciones 1 a 8, en el que la célula es una célula eucariota, preferiblemente una célula fúngica, de mamífero o vegetal, o una célula procariota.
-
- 10.
- Un método según la reivindicación 9, en el que la célula es una célula fúngica, preferiblemente seleccionada a partir del grupo que consiste en Saccharomyces, Candida, Kluyveromyces, Hansenula, Schizosaccaromyces, Yarrowia, Pichia y Aspergillus.
-
- 11.
- Un método según una cualquiera de las reivindicaciones 1 a 10, en el que se utiliza un marcador de selección, que se selecciona a partir del grupo que consiste en marcadores nutricionales auxotróficos, marcadores de resistencia a antibióticos, marcadores fluorescentes, marcadores de transgénesis dirigida, marcadores de dominios activadores/de unión y marcadores dominantes recesivos y marcadores colorimétricos.
-
- 12.
- Un método según una cualquiera de las reivindicaciones 1 a 11, en el que dichos genes están comprendidos en un polinucleótido lineal, un vector o un cromosoma artificial de levadura.
-
- 13.
- Un método según una cualquiera de las reivindicaciones 1 a 12, en el que dichos genes son polinucleótidos lineales, preferiblemente de 300 a 20.000 pb.
-
- 14.
- Un método según una cualquiera de las reivindicaciones 1 a 13, en el que los genes son secuencias no codificadoras o variantes que codifican un polipéptido seleccionado a partir del grupo que consiste en enzimas, anticuerpos o partes de los mismos, citocinas, factores de crecimiento, antígenos de vacunas y péptidos.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32268010P | 2010-04-09 | 2010-04-09 | |
US322680P | 2010-04-09 | ||
EP10159515 | 2010-04-09 | ||
EP10159515 | 2010-04-09 | ||
PCT/EP2011/055530 WO2011124693A1 (en) | 2010-04-09 | 2011-04-08 | Method of generating gene mosaics |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2445565T3 true ES2445565T3 (es) | 2014-03-04 |
Family
ID=42288683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES11715196.9T Active ES2445565T3 (es) | 2010-04-09 | 2011-04-08 | Método para generar mosaicos de genes |
Country Status (15)
Country | Link |
---|---|
US (1) | US8912127B2 (es) |
EP (2) | EP2478100B1 (es) |
JP (1) | JP2013524785A (es) |
KR (1) | KR20130098150A (es) |
CN (1) | CN102933710A (es) |
AU (1) | AU2011237547A1 (es) |
BR (1) | BR112012025858A2 (es) |
CA (1) | CA2795246A1 (es) |
DK (1) | DK2478100T3 (es) |
ES (1) | ES2445565T3 (es) |
HR (1) | HRP20140079T1 (es) |
PL (1) | PL2478100T3 (es) |
PT (1) | PT2478100E (es) |
SG (1) | SG184470A1 (es) |
WO (1) | WO2011124693A1 (es) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2839074A1 (en) * | 2011-06-21 | 2012-12-27 | Eviagenics S.A. | Method of metabolic evolution |
US20140274803A1 (en) * | 2011-10-12 | 2014-09-18 | Eviagenics S.A. | Method of generating gene mosaics in eukaryotic cells |
WO2013076280A1 (en) * | 2011-11-23 | 2013-05-30 | Dsm Ip Assets B.V. | Nucleic acid assembly system |
EP2749644B1 (en) | 2012-12-27 | 2018-08-22 | Rhodia Operations | Recombinant host cell for biosynthetic production of vanillin |
US10519472B2 (en) | 2012-12-27 | 2019-12-31 | Rhodia Operations | Recombinant host cell for biosynthetic production |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2641793B1 (fr) | 1988-12-26 | 1993-10-01 | Setratech | Procede de recombinaison in vivo de sequences d'adn presentant des mesappariements de bases |
ES2230554T3 (es) | 1995-07-26 | 2005-05-01 | Mixis France S.A. | Recombinacion hologa de las celulas eucariotas con el sistema de reparacion del mal emparejamiento desactivado. |
AU2003223928A1 (en) | 2002-05-07 | 2003-11-11 | Novozymes A/S | Homologous recombination into bacterium for the generation of polynucleotide libraries |
NZ548444A (en) | 2004-01-30 | 2010-09-30 | Mixis France Sa | Generation of recombinant genes in saccharomyces cerevisiae |
EP1734125A1 (en) | 2005-06-16 | 2006-12-20 | Institut National De La Recherche Agronomique | Homeologous recombination in MSH2 inactivated plants or cells thereof |
-
2011
- 2011-04-08 CN CN2011800283522A patent/CN102933710A/zh active Pending
- 2011-04-08 DK DK11715196.9T patent/DK2478100T3/da active
- 2011-04-08 US US13/640,313 patent/US8912127B2/en not_active Expired - Fee Related
- 2011-04-08 EP EP11715196.9A patent/EP2478100B1/en active Active
- 2011-04-08 AU AU2011237547A patent/AU2011237547A1/en not_active Abandoned
- 2011-04-08 CA CA2795246A patent/CA2795246A1/en not_active Abandoned
- 2011-04-08 JP JP2013503133A patent/JP2013524785A/ja active Pending
- 2011-04-08 PT PT117151969T patent/PT2478100E/pt unknown
- 2011-04-08 WO PCT/EP2011/055530 patent/WO2011124693A1/en active Application Filing
- 2011-04-08 PL PL11715196T patent/PL2478100T3/pl unknown
- 2011-04-08 BR BR112012025858A patent/BR112012025858A2/pt not_active IP Right Cessation
- 2011-04-08 EP EP13173933.6A patent/EP2647710A1/en not_active Withdrawn
- 2011-04-08 SG SG2012074274A patent/SG184470A1/en unknown
- 2011-04-08 ES ES11715196.9T patent/ES2445565T3/es active Active
- 2011-04-08 KR KR1020127029534A patent/KR20130098150A/ko not_active Application Discontinuation
-
2014
- 2014-01-27 HR HRP20140079AT patent/HRP20140079T1/hr unknown
Also Published As
Publication number | Publication date |
---|---|
PL2478100T3 (pl) | 2014-04-30 |
CN102933710A (zh) | 2013-02-13 |
US8912127B2 (en) | 2014-12-16 |
EP2647710A1 (en) | 2013-10-09 |
DK2478100T3 (da) | 2014-02-17 |
WO2011124693A1 (en) | 2011-10-13 |
AU2011237547A1 (en) | 2012-10-25 |
CA2795246A1 (en) | 2011-10-13 |
JP2013524785A (ja) | 2013-06-20 |
BR112012025858A2 (pt) | 2015-10-06 |
KR20130098150A (ko) | 2013-09-04 |
EP2478100B1 (en) | 2013-11-13 |
US20130090246A1 (en) | 2013-04-11 |
SG184470A1 (en) | 2012-11-29 |
EP2478100A1 (en) | 2012-07-25 |
PT2478100E (pt) | 2014-02-20 |
HRP20140079T1 (hr) | 2014-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2257866T3 (es) | Evolucion de celulas y organismos completos mediante recombinacion recurrente de secuencias. | |
US12054754B2 (en) | CRISPR-associated transposon systems and components | |
Nielsen et al. | Efficient PCR-based gene targeting with a recyclable marker for Aspergillus nidulans | |
CN110520528A (zh) | 高保真性cas9变体及其应用 | |
ES2445565T3 (es) | Método para generar mosaicos de genes | |
US20200370035A1 (en) | Methods for in vitro site-directed mutagenesis using gene editing technologies | |
Eckert‐Boulet et al. | Optimization of ordered plasmid assembly by gap repair in Saccharomyces cerevisiae | |
AU2011202192A1 (en) | Generation of recombinant genes in Saccharomyces cerevisiae | |
US6232112B1 (en) | Reagents and methods for diversification of DNA | |
US20140274803A1 (en) | Method of generating gene mosaics in eukaryotic cells | |
US20140200145A1 (en) | Method of metabolic evolution | |
Lim et al. | Effects of the loss of mismatch repair genes on single-strand annealing between divergent sequences in Saccharomyces cerevisiae | |
AU2005217093B2 (en) | Generation of recombinant genes in prokaryotic cells by using two extrachromosomal elements |