ES2575005T3 - Método de síntesis de variantes de polinucleótidos - Google Patents

Método de síntesis de variantes de polinucleótidos Download PDF

Info

Publication number
ES2575005T3
ES2575005T3 ES09763625.2T ES09763625T ES2575005T3 ES 2575005 T3 ES2575005 T3 ES 2575005T3 ES 09763625 T ES09763625 T ES 09763625T ES 2575005 T3 ES2575005 T3 ES 2575005T3
Authority
ES
Spain
Prior art keywords
polynucleotide
sequence
amplicons
amino acid
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09763625.2T
Other languages
English (en)
Inventor
Jeffrey Colbeck
Benjamin Mijts
Lorraine Jean Giver
Richard J. Fox
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Application granted granted Critical
Publication of ES2575005T3 publication Critical patent/ES2575005T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Abstract

Un procedimiento de síntesis de una pluralidad de variantes de polinucleótido teniendo cada uno al menos una diferencia de un nucleótido definido con respecto a una secuencia de polinucleótido de referencia, comprendiendo el método: (a) amplificar por separado una plantilla de polinucleótido de referencia con cada uno de una pluralidad de pares de cebadores delanteros y traseros, en el que la pluralidad de pares de cebadores delanteros y traseros comprende la pluralidad de diferencias de nucleótidos definidas y en las que cada par genera un amplicón que comprende una secuencia capaz de unirse a una secuencia de solapamiento adyacente de al menos otro amplicón, generando de ese modo una biblioteca direccionable de amplicones en los que: (i) la biblioteca de amplicones comprende miembros para el montaje de dos o más diferentes variantes de polinucleótido que comprende diferencias definidas de nucleótidos con respecto a una secuencia de polinucleótido de referencia; y (ii) los miembros de la biblioteca están dispuestos en lugares posicionalmente distintos sobre un sustrato; (b) ensamblar por separado una pluralidad de conjuntos de amplicones, en los que cada conjunto comprende amplicones que tienen secuencias adyacentes superpuestas capaces de unirse para formar la longitud completa de la secuencia de polinucleótidos de referencia; (c) la replicación de la pluralidad de conjuntos de amplicones reunidos, generando de ese modo una biblioteca de variantes de polinucleótidos direccionables en los que los miembros de la biblioteca están dispuestos en ubicaciones posicionalmente distintas en un sustrato.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
Metodo de sfntesis de variantes de polinucleotidos Descripcion
1. ANTECEDENTES
[0001] Diversas tecnicas de evolucion dirigida basadas en in silico e in vitro de la funcion de protefna han permitido la generacion de protefnas con propiedades novedosas. Por ejemplo, las enzimas del citocromo P450 han sido evolucionadas para tener actividad contra los sustratos normalmente no reconocidos por la enzima de origen natural (vease, por ejemplo, Landwehr et al, 2007, Chem Biol l4 (3): 269-78; Kubo et al., 2006 , Chemistry 12(4):1216-20.). Tfpicamente, para la generacion de tales nuevas enzimas, un polinucleotido que codifica un polipeptido de referencia, tal como una enzima de tipo silvestre, se somete a mutagenesis para generar polinucleotidos que codifican variantes de polipeptidos con cambios en la secuencia de aminoacidos. El examen de las variantes para una propiedad deseada, tal como una mejora en una estabilidad de la enzima o actividad frente a nuevos sustratos, permite la identificacion de los residuos de aminoacidos asociados con la propiedad cambiada. Sin embargo, no todas las combinaciones de las mutaciones estaran presentes en la poblacion de variantes seleccionadas. Por ejemplo, una mutacion asociada con la estabilidad termica de una enzima no puede ser encontrada en asociacion con una mutacion asociada con un cambio en la especificidad de sustrato. Este sesgo en la poblacion puede surgir de varios factores, incluyendo, entre otros, la secuencia de aminoacidos parental codificada por el polinucleotido usado para la mutagenesis, es posible la seleccion en contra de la combinacion durante la propagacion in vitro del polinucleotido, y el sesgo en la tecnica utilizada para la mutagenesis (por ejemplo, uso de polimerasas de introducir errores). EE.uU. 6,153,410 muestra un metodo para la mutagenesis in vitro y la recombinacion de secuencias de polinucleotidos basadas en extension de polimerasa catalizada de oligonucleotidos cebadores.
[0002] Debido a que las mutaciones en las posiciones de residuos de aminoacidos definidas de una secuencia de polipeptido de referencia pueden proporcionar una gran cantidad de informacion acerca de las actividades biologicas del polipeptido, una vez que se han identificado mutaciones inicialmente, es deseable preparar varias combinaciones de las mutaciones no se encuentran en la inicial conjunto de variantes seleccionados que pueden ser probados para la propiedad deseada. La seleccion basada In silico de mutaciones definidas o conjuntos de mutaciones proporcionan un marco para la generacion de un gran numero de posibles combinaciones de mutaciones. por ejemplo, las mutaciones que afectan a la especificidad de sustrato se pueden combinar con mutaciones que afectan otras propiedades de las enzimas, incluyendo, entre otros, la actividad enzimatica, estabilidad termica, y el inhibidor de la resistencia. Tfpicamente, el enfoque para la generacion de estos polipeptidos que tienen nuevas combinaciones de mutaciones es la sintetizacion de especies individuales (es decir, la sfntesis de cada polinucleotido que codifica el gen mutante). Esto se puede lograr mediante sfntesis qufmica y/o enzimatica del polinucleotido en combinacion con tecnicas de recombinacion estandar. Tales tecnicas de sfntesis de novo requieren la sfntesis de la totalidad de genes de cada variante de polinucleotido y/o sfntesis de un gran numero de cebadores de oligonucleotidos que luego se utilizan para sintetizar la variante de polinucleotido entero (por ejemplo, a traves de ION-PCR). Estas tecnicas requieren mas sfntesis de oligonucleotidos y dan como resultado menores rendimientos de variantes que tienen la secuencia correcta. En consecuencia, si el conjunto de datos de mutaciones es grande, el costo y la eficiencia de la generacion de las combinaciones de mutacion pueden limitar la capacidad para detectar un gran numero de nuevas combinaciones. Por lo tanto, los metodos eficaces y rentables de generar polinucleotidos que codifican combinaciones de mutaciones definidas son deseables.
2. RESUMEN
[0003] La presente invencion proporciona un metodo de sfntesis de una pluralidad de variantes de polinucleotido que tienen cada uno al menos una diferencia de nucleotidos definida en relacion con una secuencia de polinucleotidos de referencia, comprendiendo el metodo: (a) amplificar por separado una plantilla de polinucleotido de referencia con cada uno de una pluralidad de pares de cebadores directo e inverso, en el que la pluralidad de pares de cebadores directo e inverso comprende la pluralidad de diferencias de nucleotidos definidas y en el que cada par genera un amplicon que comprende una secuencia capaz de unirse a una secuencia de solapamiento adyacente de al menos otro amplicon, generando de este modo una biblioteca direccionable de amplicones en el que: (i) la biblioteca de amplicones comprende elementos para el montaje de dos o mas diferentes variantes de polinucleotido que comprende diferencias de nucleotidos definidas en relacion con la secuencia de polinucleotidos de referencia; y (ii) los miembros de la biblioteca estan dispuestos en lugares distintos posicionalmente sobre un sustrato; (b) ensamblar por separado una pluralidad de conjuntos de amplicones, en el que cada conjunto comprende amplicones que tienen secuencias adyacentes superpuestas capaces de unirse para formar la longitud completa de la secuencia de polinucleotidos de referencia; (c) la replicacion de la pluralidad de conjuntos de amplicones reunidos, generando de ese modo una biblioteca direccionable de variantes de polinucleotido en el que los miembros de la biblioteca estan dispuestos en lugares distintos posicionalmente sobre un sustrato.
[0004] La invencion tambien proporciona una biblioteca direccionable de amplicones que comprenden una pluralidad de amplicones, en el que cada miembro de la biblioteca de los amplificones comprende al menos una diferencia de nucleotidos definida en relacion con una secuencia de polinucleotidos de referencia y una region adyacente superpuesta capaz de unirse a la region adyacente superposicion de al menos otro amplicon en la biblioteca, en el
5
10
15
20
25
30
35
40
45
50
55
60
65
que la pluralidad de amplicones comprenden una pluralidad de conjuntos de amplicones capaces de unirse para formar la longitud completa de la secuencia de polinucleotidos de referencia, en el que la pluralidad de amplicones comprende miembros para el montaje de dos o mas differentes variantes de polinucleotido de longitud completa que comprende diferencias de nucleotidos definidas con respecto a la secuencia de polinucleotido de referencia, en el que: (i) al menos uno de la pluralidad de conjuntos de amplicones comprende miembros para el montaje de una variante de polinucleotido que comprende al menos 5 diferencias de nucleotidos definidas en relacion con la secuencia de polinucleotidos de referencia; (ii) al menos uno de la pluralidad de conjuntos de amplicones comprende al menos 3 diferentes amplicones; o (iii) la longitud de la secuencia de polinucleotidos de referencia es de al menos 500 pb, y en el que los miembros de la biblioteca estan dispuestos en ubicaciones distintas posicionalmente sobre un sustrato.
[0005] La presente descripcion se refiere a metodos de generacion eficiente de polinucleotidos que tienen diferentes combinaciones de cambios de secuencia definidos (por ejemplo, mutaciones de aminoacidos deseadas) en comparacion con una secuencia de polinucleotido de referencia. Los metodos se basan en el uso de una biblioteca de fragmentos de polinucleotidos (es decir, amplicones) que tienen regiones adyacentes se superponen de manera que un conjunto de los fragmentos de polinucleotidos pueden ser ensamblados para generar una pluralidad de variantes de polinucleotido que tienen cada uno un conjunto definido de cambios de secuencia. Cebadores delanteros y traseros seleccionados se utilizan para introducir los cambios de secuencia mediante la amplificacion de una plantilla de polinucleotido de referencia y por lo tanto generar fragmentos de polinucleotido que comprende la secuencia de los cambios definidos. La biblioteca esta disenada para tener suficientes fragmentos de polinucleotidos para ensamblar al menos dos secuencias variantes de polinucleotidos diferentes. En algunas realizaciones, la biblioteca de fragmentos de polinucleotidos contiene miembros que tienen todas las diferencias definidas en la secuencia de polinucleotido (por ejemplo, cambios de nucleotidos deseados) en comparacion con una secuencia de referencia de tal manera que todas las permutaciones de la secuencia se pueden montar. En algunas realizaciones, los polinucleotidos pueden ser disenados para codificar polipeptidos que tienen diferencias definidas en la secuencia de aminoacidos en comparacion con una secuencia de aminoacidos de referencia.
[0006] Los procedimientos de la presente descripcion son capaces de producir grandes bibliotecas de secuencias variantes de polinucleotidos que tienen diferencias de nucleotidos definidas (por ejemplo, bibliotecas de 10, 50, 100, 150, o mas variantes, cada uno con 1, 2, 3, 5, 9 , 12, 15, o mas, cambios deseados), con relativamente pocos (por ejemplo, en comparacion con los metodos de sfntesis de genes enteros), y oligonucleotidos relativamente cortos (por ejemplo, 35-mer o menos), y en el que el porcentaje medio de secuencias correctas es sorprendentemente alto (por ejemplo, al menos 65%, 75%, 85%, 95%, o mas).
[0007] En algunas realizaciones, el metodo de formacion de los polinucleotidos que codifican variantes de polipeptidos puede comprender: la seleccion de una pluralidad de diferencias de restos de aminoacidos definidos relativos a una secuencia de aminoacidos de referencia; la definicion de segmentos de superposicion de una secuencia de polinucleotido que codifica el polipeptido con la diferente secuencia de aminoacidos o la secuencia de aminoacidos de referencia, cada segmento estando limitada por un conjunto de avance y retroceso secuencias de cebador de union y en el que una diferencia en la secuencia de polinucleotidos que codifica cada una de la pluralidad de diferencias de residuos de aminoacido se engloban en la secuencia de union a cebador; amplificando cada segmento con el conjunto de cebadores directo e inverso, en el que cebadores delanteros y/o trasteros seleccionados contienen las diferencias de secuencia de polinucleotidos, para generar una biblioteca de amplicones que comprenden miembros que codifican diferencias de residuo de aminoacido, en las que la biblioteca comprende elementos para el montaje de dos o mas diferentes permutaciones de secuencias de aminoacidos de las diferencias de aminoacidos definidas; el montaje de la biblioteca de un conjunto de amplicones que tienen regiones adyacentes solapadas complementarias, en las que el conjunto de amplicones juntos codifican el polipeptido con una permutacion de secuencia de aminoacidos definida que tiene una o mas diferencias de residuos de aminoacidos; y replicar el conjunto de amplicones ensamblados para sintetizar el polinucleotido que codifica el polipeptido.
[0008] Ademas se describen aquf metodos de generacion de la biblioteca de fragmentos de polinucleotidos, donde el metodo comprende: (a) la generacion de una pluralidad de permutaciones de secuencias de aminoacidos que difieren de una secuencia de aminoacidos de referencia basado en una pluralidad de diferencias de restos de aminoacidos definida a partir de la secuencia de referencia de aminoacidos, y para cada permutacion; (i) la determinacion de una secuencia de polinucleotidos que codifica la secuencia de aminoacidos de permutacion basada en una secuencia de polinucleotidos de referencia; (ii) la identificacion de un cambio en la secuencia de polinucleotidos que codifica una diferencia de residuo de aminoacido en comparacion con una secuencia de aminoacidos de referencia, y la determinacion de la proximidad de un cambio de vecino mas proximo en la secuencia de polinucleotido que codifica otra diferencia de residuo de aminoacido en la secuencia de aminoacidos de permutacion; (iii) seleccionar un cebador de oligonucteotido delantero que tiene una secuencia que codifica la diferencia de residuos de aminoacidos y, opcionalmente, incluyendo el cambio del vecino mas proximo en la secuencia de polinucleotido en el mismo cebador de oligonucleotidos delanteros si la proximidad del primer cambio en la secuencia de polinucleotido; (iv) la identificacion del siguiente cambio en la secuencia de polinucleotido o hasta que se alcance el extremo del polinucleotido, y la seleccion de un cebador inverso de oligonucleotido para amplificar un fragmento de polinucleotido con los cebadores delanteros de oligonucleotidos, en el que el cebador inverso codifica opcionalmente el proximo cambio en diferencias de residuo de aminoacidos; (v) la reiteracion de pasos (ii) a
5
10
15
20
25
30
35
40
45
50
55
60
65
(iv) para cada cambio en la secuencia de polinucleotido que codifica una diferencia de residuos de aminoacidos de tal manera que todos los cambios en la secuencia de polinucleotidos estan presentes en los cebadores de oligonucleotidos; y (b) amplificar con cada conjunto de cebadores delanteros y traseros de oligonucleotidos para generar la biblioteca de amplicones que tienen miembros que codifican diferencias de residuos de aminoacidos superpuestos.
[0009] En otro aspecto, la presente descripcion proporciona biblioteca de tales fragmentos de polinucleotidos (es decir, amplicones) para el montaje de los polinucleotidos. En algunas realizaciones, la pluralidad de fragmentos de polinucleotido comprende fragmentos de polinucleotidos con la superposicion de las regiones adyacentes, cada fragmento de polinucleotido de ser limitada por las secuencias de union del cebador para los cebadores delanteros y traseros, en el que la pluralidad de fragmentos de polinucleotidos tienen miembros que codifican en las secuencias de union a una diferencia de residuo de aminoacido especffica a partir de una pluralidad definida de las diferencias de residuos de aminoacidos con respecto a una secuencia de aminoacidos de referencia de tal manera que la pluralidad de fragmentos de polinucleotido codifica toda una pluralidad seleccionada de diferencias de restos de aminoacidos de la pluralidad definida de diferencias de restos de aminoacidos; y en el que la pluralidad de fragmento de polinucleotido comprende miembros para el montaje de dos o mas diferentes permutaciones de secuencias de aminoacidos de las diferencias de aminoacidos definidas. En algunas realizaciones, la pluralidad de fragmentos de polinucleotido comprende miembros suficientes para el montaje de la totalidad de las permutaciones de secuencia de aminoacidos posible de la pluralidad seleccionada de las diferencias de residuo de aminoacido.
[0010] En otro aspecto, la presente descripcion proporciona un metodo para sintetizar una pluralidad de variantes de polinucleotido que tienen cada una una diferencia de nucleotidos definida en relacion con una secuencia de polinucleotidos de referencia, en el que el metodo comprende: (a) la amplificacion por separado de una plantilla de polinucleotido de referencia con cada uno de una pluralidad de pares de cebadores delanteros y traseros, en el que la pluralidad de pares de cebadores delanteros y traseros comprende la pluralidad de diferencias de nucleotidos definidas y en el que cada par genera un amplicon que comprende una secuencia capaz de unirse a una secuencia de solapamiento adyacente de al menos otro amplicon; (b) ensamblar por separado una pluralidad de conjuntos de amplicones, en el que cada conjunto comprende amplicones que tienen secuencias adyacentes superpuestas capaces de unirse para formar la longitud completa de la secuencia de polinucleotidos de referencia; y (c) la replicacion de la pluralidad de conjuntos de amplicones ensamblados, sintetizando de ese modo una pluralidad de variantes de polinucleotidos.
[0011] En otra realizacion, la descripcion proporciona un metodo para sintetizar una pluralidad de variantes de polinucleotido que tienen cada uno una diferencia de nucleotidos definida en relacion con una secuencia de polinucleotidos de referencia, comprendiendo el metodo: (a) la seleccion de una pluralidad de diferencias de nucleotidos definida en relacion con la secuencia de polinucleotidos de referencia; (b) que define una pluralidad de segmentos de la secuencia de polinucleotidos de referencia, en el que cada segmento se solapa con al menos un segmento adyacente y esta delimitada por un par de secuencias de union de cebadores delanteros y traseros, en el que los cebadores delanteros y/o traseros comprenden al menos una de la pluralidad de diferencias de nucleotidos definidas; (c) amplificar por separado una plantilla de polinucleotido de referencia con cada uno de una pluralidad de pares de cebadores delanteros y traseros, en el que cada par de cebadores comprende al menos uno de la pluralidad de diferencias de nucleotidos definidas, generando de este modo una biblioteca direccionable de amplicones cada uno correspondiente a una segmento de la secuencia de polinucleotidos de referencia que tiene un diferencias de nucleotidos definidas; (d) ensamblar por separado una pluralidad de conjuntos de amplicones de la biblioteca direccionable de amplicones, en el que cada conjunto comprende amplicones que corresponde a la superposicion de los segmentos adyacentes que comprenden la longitud completa de la secuencia de polinucleotidos de referencia; y (e) la replicacion de la pluralidad de conjuntos de amplicones ensamblados, sintetizando de ese modo una pluralidad de variantes de polinucleotidos.
[0012] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotido se describe aquf, los metodos pueden llevarse a cabo en el que el polinucleotido de referencia codifica un polipeptido de referencia y cada uno de la pluralidad de variantes de polinucleotido codifica un polipeptido que tiene al menos una diferencia de secuencia de aminoacido. En realizaciones adicionales, los metodos pueden ser llevados a cabo en el que comprende ademas las etapas de. (i) la clonacion de cada una de la pluralidad de variantes de polinucleotido en un vector de expresion; (ii) la transformacion de celulas con los vectores de expresion; (iii) la seleccion de las celulas transformadas para la actividad de los polipeptidos codificados por las variantes de polinucleotidos; o (iv) el aislamiento de al menos un polipeptido codificado por las variantes de polinucleotidos. Ademas, los metodos pueden llevarse a cabo en los que cada variante de polinucleotido se monta en una posicion conocida en una matriz.
[0013] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotido se describe aquf, los metodos pueden llevarse a cabo en donde las secuencias de la pluralidad de secuencias de cebadores delanteros y traseros se generan por las etapas de: (i) la identificacion de una primera diferencia definida en la secuencia variante de polinucleotido en comparacion con la secuencia de referencia, y la determinacion de la proximidad de una diferencia de vecino mas cercana se define en la secuencia de polinucleotido; (ii) la seleccion de un cebador directo que tiene una secuencia que comprende la primera diferencia de nucleotidos definida, y,
5
10
15
20
25
30
35
40
45
50
55
60
65
opcionalmente, incluyendo cualquier diferencia de vecino mas cercano se define en el mismo cebador delantero si la proximidad de la primera diferencia de nucleotidos definida; (iii) identificar una siguiente diferencia definida en la secuencia variante de polinucleotido en comparacion con la secuencia de referencia, y la determinacion de la proximidad de una diferencia definida de vecino mas proxima en la secuencia de polinucleotidos, o la identificacion de que el final de la variante de polinucleotido ha sido alcanzada; (iv) la seleccion de un cebador trasero que tiene una secuencia que comprende la siguiente diferencia de nucleotidos definida, y, opcionalmente, incluyendo cualquier diferencia de vecino mas cercana definida en el mismo cebador trasero si la proximidad de la siguiente diferencia de nucleotidos definida; y (v) repetir las etapas (iii) a (iv) para cada diferencia definida en la secuencia variante de polinucleotido tal que toda diferencia definida estan presentes en los cebadores.
[0014] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotido se describe aquf, la pluralidad de variantes de polinucleotidos comprende al menos 10, 25, 35, 50, 75, 90, 120, 150, 180 o incluso mas diferentes variantes de polinucleotidos .
[0015] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotido se descritas aquf, al menos una de la pluralidad de variantes de polinucleotidos comprende al menos 2, 3, 6, 9, 12, 15, 18, 21, 24, 27 , 30, o diferencias incluso mas definidas de nucleotidos con respecto a la secuencia de referencia de polinucleotidos. En algunas realizaciones, dos o mas, o en algunas formas de realizacion cada una de la pluralidad de variantes de polinucleotidos comprende al menos 1, 2, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, o diferencias incluso mas definidas de nucleotidos respecto a la secuencia de polinucleotidos de referencia.
[0016] En algunas realizaciones de los metodos de sfntesis de una pluralidad de polinucleotidos de variantes se describe aquf, al menos una de la pluralidad de conjuntos de amplicones comprende al menos 3, al menos 5, al menos 7, al menos 10, o mas amplicones diferentes. En algunas realizaciones, dos o mas, o en algunas formas de realizacion cada una de la pluralidad de conjuntos de amplicones comprende al menos 3, al menos 5, al menos 7, al menos 10, o mas amplicones diferentes.
[0017] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotido se describe aquf, la longitud de la secuencia de polinucleotidos de referencia es al menos 500 pb, 750 pb, 1000 pb, 1250 pb, 1500 pb, o incluso mas largo.
[0018] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotidos divulgadas en el presente documento, la pluralidad de pares de cebadores delanteros y traseros comprende 400 o menos, 300 o menos, 200 o menos, 100 o menos, 50 o menos, o incluso 25 o menos. En algunas realizaciones, la pluralidad de pares de cebadores delanteros y traseros comprende de 6 a aproximadamente 200, de 6 a aproximadamente 150, de 6 a aproximadamente 100, de 6 a aproximadamente 50, 6 a aproximadamente 40, 6 a aproximadamente 30, 6 a aproximadamente 25, 6 a aproximadamente 20, 6 a aproximadamente 15, o incluso menos oligonucleotidos diferentes, y en el que las longitudes de los oligonucleotidos son de aproximadamente 20 a aproximadamente 50 nucleotidos, aproximadamente 20 a aproximadamente 40 nucleotidos, o aproximadamente 25 a aproximadamente 35 nucleotidos.
[0019] En algunas realizaciones de los metodos de sfntesis de una pluralidad de variantes de polinucleotidos descritas aquf, el porcentaje medio de la pluralidad de variantes de polinucleotidos sintetizados que comprende la secuencia correcta es al menos aproximadamente 65%, 75%, 85%, o 95%, o mas.
[0020] En algunas realizaciones, la descripcion proporciona metodos para sintetizar una pluralidad de variantes de polinucleotido en las que cualquiera de los parametros descritos anteriormente (por ejemplo, numero de variantes, numero de diferencias de nucleotidos definidas, la longitud de la secuencia de polinucleotidos de referencia, numero de pares de cebadores delanteros e traseros, longitud de cebadores de oligonucleotidos, y/o porcentaje de secuencias perfectas de longitud completa) se combinan.
[0021] Ademas de los metodos anteriores, la descripcion tambien proporciona una biblioteca de variantes direccionables de polinucleotido que comprende una pluralidad de variantes de polinucleotidos o amplicones sintetizados segun cualquiera de los metodos anteriores. Por consiguiente, en algunas realizaciones, la descripcion proporciona una biblioteca direccionable de amplicones, en el que cada miembro de la biblioteca de los amplicones comprende al menos una diferencia de nucleotidos definidas en relacion con una secuencia de polinucleotidos de referencia y una region adyacente superpuesta capaz de unirse a la region adyacente de solapamiento de por lo menos otro amplicon en la biblioteca, y en el que la pluralidad de amplicones comprenden al menos un conjunto de amplicones capaces de unirse para formar la longitud completa de la secuencia de polinucleotido de referencia. En algunas realizaciones, la biblioteca direccionable de amplicones comprende miembros para el montaje de dos o mas diferentes variantes de polinucleotido que comprende diferencias de nucleotidos definidas con respecto a la secuencia de polinucleotido de referencia. En algunas realizaciones de la biblioteca direccionables de amplicones, la secuencia de polincleotidos de referencia codifica un polipeptido de referencia y la pluralidad de amplicones comprende miembros suficientes para el montaje de todas las posibles diferencias de nucleotidos que codifica una pluralidad seleccionada de diferencias de restos de aminoacidos.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0022] Tambien se describe en este documento metodos implementadas en ordenador para llevar a cabo diversos pasos de los metodos aqrn descritos.
3. BREVE DESCRIPCION DE LAS FIGURAS
[0023]
FIG. 1 muestra una tecnica estandar para la generacion de polinucleotidos que codifican variantes de polipeptidos definidos (a la izquierda) en comparacion con el metodo descrito en el presente documento para el uso de bibliotecas de la superposicion de fragmentos de polinucleotidos (a la derecha).
FIG. 2 proporciona un esquema de flujo de trabajo de ejemplo para la generacion de bibliotecas de la superposicion de fragmentos de polinucleotidos basadas en la generacion de cebadores de oligonucleotidos para la superposicion de los segmentos de un polinucleotido y el uso de los oligonucleotidos en reacciones de PCR para generar bibliotecas de la superposicion de fragmentos de polinucleotidos.
FIG. 3 muestra los geles de agarosa de 96 muestras (y 8 controles) resultantes de ensamblaje de los fragmentos de polinucleotidos se solapan y la reproduccion de los fragmentos de polinucleotidos ensamblados para sintetizar el variantes de polinucleotido que codifican la variante de polipeptido deseado. Casi todos los geles mostraron una unica banda fuerte que indica la secuencia de longitud esperada estaba presente.
FIG. 4. La figura 4 muestra un diagrama de flujo para la generacion de polinucleotidos que codifican variantes mediante el uso de la biblioteca de la superposicion de fragmentos de polinucleotidos.
FIG. 5 muestra un diagrama de flujo para la generacion de una biblioteca de cebadores de oligonucleotidos para la generacion de una biblioteca de la superposicion de amplicones de polinucleotidos para cada secuencia de aminoacidos de permutacion.
FIG. 6 muestra un diagrama de flujo de instrucciones para la creacion y seleccion de cebadores de oligonucleotidos y fragmentos de oligonucleotidos superpuestos automatizado.
4. DESCRIPCION DETALLADA
[0024] Tal como se utiliza en esta memoria descriptiva y las reclamaciones adjuntas, las formas singulares "un", "una" y "el" incluyen referentes plurales a menos que el contexto indique claramente lo contrario. Asf, por ejemplo, la referencia a "una protema" incluye mas de una protema, y la referencia a "un compuesto" se refiere a mas de un compuesto.
[0025] Ademas, el uso de "o" significa "y/o" a menos que se indique lo contrario. Del mismo modo, "comprender", "comprende", "que comprende" "incluir", "incluye" e "incluyendo" son intercambiables y no pretenden ser limitantes.
[0026] Se ha de entender ademas que en la descripcion de varias formas de realizacion utilizan el termino "que comprende", los expertos en la tecnica entenderan que, en algunos casos espedficos, una forma de realizacion puede describirse, alternativamente, usando el lenguaje "que consiste esencialmente en" o "que consiste de."
[0027] Los tftulos de las secciones que aparecen aqrn son unciamente para fines de organizacion y no deben interpretarse como una limitacion del objeto descrito. En la presente memoria, los siguientes terminos estan destinados a tener los siguientes significados.
4.1 Definiciones
[0028] "Amplificar" y "amplificacion", como se usa en el presente documento, incorporan su uso comun y se refieren al uso de cualquier metodologfa de amplificacion adecuada para generar o detectar cualquier polinucleotido, recombinante o expresado de forma natural, susceptible a la amplificacion in vivo o in vitro, tal como mediante reaccion en cadena de la polimerasa (PCR).
[0029] "Amplicon se refiere al producto de la reaccion de amplificacion generado a traves de la extension de uno o ambos de un par de cebadores de amplificacion. Un amplicon puede contener exponencialmente acidos nucleicos amplificados si ambos cebadores utilizados se hibridan a una secuencia diana. Como alternativa, los amplicones se pueden generar mediante amplificacion lineal si uno de los cebadores utilizados no se hibrida a la secuencia diana. por lo tanto, este termino se utiliza genericamente en la presente memoria y no implica la presencia de acidos nucleicos de manera exponencial amplificados.
[0030] "Recocido" o" "hibridacion" se refiere a las interacciones de apareamiento de bases de un polfmero de nucleobase con otra que resulta en la formacion de una estructura de doble cadena, una estructura triplex o una
5
10
15
20
25
30
35
40
45
50
55
60
65
estructura cuaternaria. El recocido o hibridacion puede ocurrir a traves de interacciones de apareamiento de bases Watson Crick, pero puede mediarse por otras interacciones de enlace de hidrogeno, tales como el emparejamiento de bases de Hoogsteen.
[0031] "Montaje" se refiere a la reunion de una pluralidad de fragmentos de polinucleotidos (por ejemplo, amplicones) en condiciones en las que las regiones complementarias entre polinucleotidos pueden recocerse para formar un complejo de hibridacion, por ejemplo, que tenga una doble region hibridada hebra con voladizos para las regiones no complementarias. Una pluralidad de polinucleotidos puede ser ensamblada para formar un polinucleotido mas grande que codifica un polipeptido de interes.
[0032] "Polinucleotido puente" se refiere a un polinucleotido que tiene regiones complementarias a las regiones terminales de tal manera que un polinucleotido se puede hibridar con una region terminal y otro polinucleotido puede hibridarse a la otra region terminal del polinucleotido de puente.
[0033] "Secuencia de codificacion" se refiere a aquella porcion de un acido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoacidos de una protefna.
[0034] "Optimizado por codones" se refiere a cambios en los codones del polinucleotido que codifica una protefna a los utilizados preferentemente en un organismo particular de tal manera que la protefna codificada se expresa de manera eficiente en el organismo de interes. Aunque el codigo genetico es degenerado en que las mayorfa de los aminoacidos estan representados por varios codones, llamados "sinonimos" o codones "sinonimas", es bien conocido que el uso de codones por organismos particulares no es aleatorio y sesgado hacia determinados tripletes de codones. Este sesgo del uso de codon puede ser mayor en referencia a un gen dado, genes de la funcion o de origen ancestral comun, protefnas altamente expresadas frente a las protefnas de bajo numero de copias, y las regiones de codificacion de protefnas agregadas del genoma de un organismo.
[0035] "Complementario" se refiere a la hibridacion o la base de emparejamiento entre los nucleotidos o acidos nucleicos, tales como, por ejemplo, entre las dos hebras de una molecula de ADN de doble hebra o entre un cebador de oligonucleotido y un sitio de union a cebador en un polinucleotido monocatenario a ser secuenciado o amplificado. Nucleotidos complementarios son, en general, A y T (o A y A), o C y G. Se dice que dos moleculas de ARN o ADN de hebra doble son sustancialmente complementarias cuando una hebra de polinucleotido (ARN o ADN) se hibridara bajo condiciones de hibridacion selectivas a su complemento. Tfpicamente, la hibridacion selectiva se producira cuando existe al menos aproximadamente 65% complementarias en un tramo de al menos 14 a 25 nucleotidos, preferiblemente al menos aproximadamente 75%, mas preferiblemente al menos aproximadamente 90% complementarias. Vease, por ejemplo, M. Kanehisa, 1984, Nucleic Acids Res 12:203. "Complementario a" se utiliza en la presente memoria para significar que la secuencia complementaria es sustancialmente identica o identica a el complemento trasero de la totalidad o una porcion de una secuencia de referencia o polinucleotido que cada nucleotido en una hebra es capaz de formar un par de bases con un nucleotido o analogo de la misma en la cadena opuesta.
[0036] "Sustituciones conservadoras de aminoacidos" se refieren a la intercambiabilidad de residuos que tienen cadenas laterales similares, y por lo tanto tfpicamente implica la sustitucion del aminoacido en el polipeptido con aminoacidos dentro de la misma o similar clase definida de aminoacidos. A modo de ejemplo y no de limitacion, un aminoacido con una cadena lateral alifatica puede estar sustituido con otro aminoacido alifatico, por ejemplo, alanina, valina, leucina, isoleucina y metionina; un aminoacido con la cadena lateral de hidroxilo esta sustituido con otro aminoacido con una cadena lateral hidroxilo, por ejemplo, serina y treonina; un aminoacido que tenga cadenas laterales aromaticas estara sustituido con otro aminoacido que tiene una cadena lateral aromatica, por ejemplo, fenilalanina, tirosina, triptofano e histidina, un aminoacido con una cadena lateral basica estara sustituido con otro aminoacido con una cadena lateral de base, por ejemplo, lisina, arginina, e histidina; un aminoacido con una cadena lateral acida esta sustituido con otro aminoacido con una cadena lateral acida, por ejemplo, acido aspartico o acido glutamico; y un aminoacido hidrofobo o hidrofilo se sustituye con otro aminoacido hidrofobo o hidrofilo, respectivamente.
[0037] "Secuencia de control" se refiere a una secuencia de polinucleotido utilizado para efectuar la expresion de secuencias de codificacion y de no codificacion a las que estan asociadas. La naturaleza de tales secuencias de control difiere dependiendo del organismo huesped. Las secuencias de control generalmente incluyen promotor, sitio de union ribosomal, y la secuencia de terminacion de la transcripcion. El termino "secuencias de control" pretende incluir componentes cuya presencia puede influir en la expresion, y tambien puede incluir componentes adicionales cuya presencia es ventajosa, por ejemplo, el secuencias lfderes y secuencias de companeros de fusion.
[0038] "Diferencia definida" como se usa en la presente memoria en el contexto de mutaciones a una secuencia de polinucleotido o polipeptido se refiere a un a priori especificado, seleccionado, y/o cambio deseado a la secuencia (por ejemplo, un cambio de nucleotido de c a g en una posicion seleccionada de una secuencia de polinucleotidos que resulta en un aminoacido diferente en una posicion deseada del polipeptido codificado).
[0039] "Delecion" con respecto a un polipeptido o polinucleotido se refiere a la eliminacion de uno o mas
5
10
15
20
25
30
35
40
45
50
55
60
65
aminoacidos o nucleotidos a partir del polipeptido de referencia o polinucleotido, respectivamente. Las deleciones puede comprender la eliminacion de mas aminoacidos mas aminoacidos o nucleotidos 1 o, 2 o o nucleotidos, 3 o mas aminoacidos o nucleotidos, 5 o mas aminoacidos, 6 o mas aminoacidos o nucleotidos, 10 o mas aminoacidos o nucleotidos, 15 o mas aminoacidos o nucleotidos, o 20 o mas aminoacidos o nucleotidos, de hasta 10% del numero total de aminoacidos o nucleotidos, o hasta el 20% del numero total de aminoacidos o nucleotidos que componen el polipeptido de referencia o polinucleotido. Las deleciones pueden ser dirigidas a las partes internas y/o porciones terminales del polipeptido o polinucleotido. En diversas realizaciones, la eliminacion puede comprender un segmento continuo o puede ser discontinuo.
[0040] "Heterologo" cuando se usa con referencia a un acido nucleico o polipeptido, indica que una secuencia que comprende dos o mas subsecuencias que no se encuentran en la misma relacion entre si como se encuentra normalmente en la naturaleza, o se ha disenado de forma recombinante de modo que su nivel de expresion, o relacion ffsica con otros acidos nucleicos u otras moleculas en una celula, o de la estructura, no se encuentra normalmente en la naturaleza. Por ejemplo, un acido nucleico heterologo tfpicamente se produce de forma recombinante, teniendo dos o mas secuencias de genes no relacionados dispuestos de manera que no se encuentra en la naturaleza, por ejemplo, un marco de lectura abierta de acido nucleico (ORF) de la invencion operativamente unido a una secuencia de promotor insertado en un casete de expresion, por ejemplo, un vector.
[0041] "Insercion" o "Adicion" se refiere a un cambio en una secuencia de nucleotidos o de aminoacidos mediante la adicion de uno o mas nucleotidos o residuos de aminoacidos, respectivamente, en comparacion con una secuencia de referencia, tal como por ejemplo, una secuencia de tipo silvestre.
[0042] "Biblioteca" se refiere a un conjunto (por ejemplo, una pluralidad) de polipeptidos o acidos nucleicos heterogeneos. Una biblioteca esta compuesta por miembros, que tienen un unico polipeptido o secuencia de acido nucleico. En este sentido, "biblioteca" es sinonima de "repertorio". Las diferencias de secuencia entre miembros de la biblioteca son responsables de la diversidad presente en la biblioteca. La biblioteca puede tomar la forma de una simple mezcla de polipeptidos o acidos nucleicos, o puede ser en los organismos de formulario o celulas, por ejemplo, bacterias, virus, animales o celulas vegetales y similares, transformados con una biblioteca de acidos nucleicos.
[0043] "Sustitucion no conservadora" se refiere a la sustitucion de un aminoacido en el polipeptido con un aminoacido con propiedades significativamente diferentes de la cadena lateral. Las sustituciones no conservativas pueden utilizar aminoacidos entre, en lugar de dentro, los grupos definidos y afecta a (a) la estructura del esqueleto peptfdico en el area de sustitucion (por ejemplo, prolina para la glicina) (b) la carga o hidrofobicidad, o (c) el grueso de la cadena lateral. A modo de ejemplo y no de limitacion, un ejemplar de sustitucion no conservadora puede ser un aminoacido acido sustituido con un aminoacido basico o alifatico; un aminoacido aromatico sustituido con un aminoacido pequeno; y un aminoacido hidrofilo sustituido con un aminoacido hidrofobo.
[0044] "De origen natural" o "de tipo silvestre" se refiere a la forma que se encuentra en la naturaleza. Por ejemplo, una de origen natural o un polipeptido de tipo silvestre o secuencia de polinucleotidos es una secuencia presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificado intencionadamente por manipulacion humana.
[0045] "Nucleobase" o "base" se refiere a aquellos de origen natural y fragmentos heterocfclicos sinteticos comunmente conocidos por los que utilizan la tecnologfa de acido o polinucleotido nucleico o utilizan poliamida o tecnologfa de acido nucleico peptfdico para generar de ese modo los polfmeros que pueden hibridar con los polinucleotidos de una manera especffica de secuencia. Los ejemplos no limitantes de nucleobases adecuadas incluyen: adenina, citosina, guanina, timina, uracilo, 5-propinilo-uracilo, 2-tio-5-propinil-uracilo, 5-metilcitosina, pseudoisocitosina, 2-tiouracilo y 2-tiotimina, 2-aminopurina, N9-(2-amino-6-cloropurina), N9-(2,6-diaminopurina), hipoxantina, N9-(7-deaza-guanina), N9-(7-deaza-8 aza-guanina) y N8-(7-deaza-8-aza-adenina). Otros ejemplos no limitantes de nucleobases adecuadas incluyen las nucleobases ilustradas en las Figuras 2 (A) y 2 (B), de Buchardt et al. (WO 92/20702 o WO 92/20703).
[0046] "Polfmero de nucleobase" o "Oligomero" se refiere a dos o mas nucleobases que estan conectadas por enlaces que permiten el polfmero resultante nucleobase u oligomero para hibridar con un polinucleotido que tiene una secuencia de nucleobase complementaria. Polfmeros u oligomeros nucleobasicos incluyen, pero no se limitan a, poli- y oligonucleotidos (por ejemplo, polfmeros de ADN y ARN y oligomeros), analogos poli- y oligonucleotidos e imitador poli- y oligonucleotidos, tales como acidos nucleicos de poliamida o de peptidos. polfmeros u oligomeros nucleobasicos pueden variar en tamano desde unas pocas nucleobases, de 2 a 40 nucleobases, a varios cientos de bases nitrogenadas, a varios miles de nucleobases, o mas.
[0047] "Vinculado operablemente" se refiere a una relacion funcional entre dos o mas segmentos de acidos nucleicos (por ejemplo, ADN). En algunas realizaciones, se refiere a la relacion funcional de una secuencia reguladora de la transcripcion de una secuencia transcrita. Por ejemplo, un promotor (definido a continuacion) esta unido operativamente a una secuencia codificante, tal como un acido nucleico de la invencion, si estimula o modula la transcripcion de la secuencia codificante en una celula huesped apropiada u otro sistema de expresion. En
5
10
15
20
25
30
35
40
45
50
55
60
65
general, el promotor de las secuencias reguladoras de la transcripcion que se unen operativamente a una secuencia transcrita estan ffsicamente contiguas a la secuencia transcrita, es decir, son de actuacion cis. Sin embargo, algunas secuencias reguladoras de la transcripcion, tales como potenciadores, no necesitan ser ffsicamente contiguas o situado muy cerca de las secuencias codificantes cuya transcripcion potencian, en algunos formas de realizacion, la secuencia reguladora es una secuencia reguladora de la traduccion unida a una secuencia de codificacion.
[0048] "Zona de solapamiento" se refiere a una region de un primer polinucleotido que es complementary a un segundo polinucleotido, donde las zonas de solapamiento son capaces de hibridar entre si para formar un complejo de hibridacion. En general, el primer polinucleotido y el segundo polinucleotido parcialmente se solaparan de tal manera que los polinucleotidos tendran regiones no complementarias que no recuecen entre los dos polinucleotidos.
[0049] "Permutaciones" se refiere a la disposicion de los elementos (por ejemplo, mutaciones de sustitucion) de un conjunto finito dado. En el contexto de las descripciones de la presente memoria para los polipeptidos y polinucleotidos, las diferencias en los residuos de aminoacidos o residuos de nucleotidos de una secuencia de referencia, tfpicamente caracterizadas como" mutaciones ", se pueden organizar en varias combinaciones en la secuencia para formar una permutacion de la mutacion establecida. Permutaciones incluyen mutaciones individuales y todas las combinaciones de mutaciones posibles del conjunto definido.
[0050] "Polinucleotidos" o "Oligonucleotidos" se refieren a base nitrogenada polfmeros u oligomeros en los que las nucleobases estan unidas por enlaces de fosfato de azucar (azucar de la cadena principal de fosfato). Poli- y oligonucleolidos ejemplares incluyen polfmeros de 2' desoxirribonucleotidos (ADN) y polfmeros de ribonucleotidos (ARN). Un polinucleotido puede estar compuesto enteramente de ribonucleotidos, enteramente de 2' desoxirribonucleotidos o combinaciones de los mismos.
[0051] "Polinucleotido" o "Analogo de Oligonucleotido" se refiere a polfmeros de nucleobase u oligomeros en los que las nucleobases estan conectadas por una cadena principal de fosfato de azucar que comprende uno o mas analogos de fosfato de azucar. Analogos tfpicos de fosfato de azucar incluyen, pero no se limitan a, alquilofosfonatos de azucar, fosforamiditas de azucar, el alquilo de azucar o sustituidos alquilofosfotriesteres, fosforotioatos de azucar, fosforoditioatos de azucar, fosfatos de azucares y analogos de fosfato de azucar en la que el azucar es distinto de 2' desoxirribosa o ribosa, polfmeros de nucleobases que tienen interrelaciones de carga positiva de guanidilo de azucar tales como los descritos en la Patente de Estados Unidos N°. 6.013.785 y la Patente de Estados Unidos N° 5.696.253 (vease, tambien, Dagani 1995, Chem. Eng. News 4-5: 1153; Dempey et al, 1995, J Am Chem Soc 117:6140-6141). Tales analogos de carga positiva en la que el azucar es 2'-desoxirribosa se conocen como "DNGs", mientras que aquellos en los que la ribosa de azucar se les conoce como "generadores de numeros aleatorios." Se incluyen especfficamente dentro de la definicion de los analogos poli- y oligonucleotidos estan acidos nucleicos encerrados (LNAs; vease, por ejemplo Elayadi et al, 2002, Biochemistry 41: 9973-9981; Koshkin et al, 1998, J Am Chem Soc 120: 13252-3; Koshkin et al, 1998, Tetrahedron Letters 39:4381-4384; Jumar et al, 1998, Bioorganic & amp; Medicinal Chemistry Letters 8:2219-2222; Singh y Wengel, 1998, Chem Commun, 12:1247-1248; WO 00/56746; El documento WO 02/28875; y, WO 01/48190).
[0052] "Cebadores" se refieren a oligonucleotidos que tienen una secuencia complementaria a una secuencia diana, se hace referencia generalmente como una secuencia de union a cebador. La parte complementaria de un cebador puede ser de cualquier longitud que soporta la hibridacion especffica y estable entre el cebador y la secuencia diana en la reaccion de condiciones. Los cebadores pueden ser de aproximadamente 5 a 60 nucleotidos de longitud, alrededor de 10 a 35 nucleotidos de longitud, o pueden ser de, y, en particular, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, y/o 20 nucleotidos de largo. En general, los cebadores para la replicacion por la polimerasa son capaces de soportar la extension por la polimerasa cuando el cebador se hibrida con la secuencia diana. "Cebador de amplificacion" se refiere a un cebador oligonucleotido usado para la amplificacion de una secuencia de acido nucleico diana.
[0053] "Cebador delantero" y "Cebador trasero" se refieren a un conjunto de cebadores de amplificacion, donde un cebador hibrido con el extremo 3' de la diana (cadena molde), mientras que el otro cebador hibrida con el extremo 3' de la cadena diana complementaria para amplificar un amplicon.
[0054] "Proximal" se refiere a la distancia de nucleotidos a partir de una base definido (por ejemplo, una primera mutacion de nucleotidos) a una segunda base definida (por ejemplo, una segunda mutacion de nucleotidos), donde la primera y segunda mutaciones pueden ser alojadas en un unico cebador oligonucleotido usado para los propositos de amplificacion (por ejemplo, cebador delantero o trasero). por lo tanto, en algunas realizaciones, el termino "proximal" se determina con respecto a la longitud del cebador. En algunas realizaciones, dos mutaciones pueden ser proxima si estan separados por 1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 18, 20, o 25 bases de nucleotidos y estan dentro de la imprimacion. En algunas realizaciones, la ubicacion de las mutaciones con respecto al extremo 3' del cebador es tal que un oligonucleotido hibridado con una hebra molde puede someterse a la extension por la polimerasa, como se describe en detalle a continuacion.
[0055] "Protefna", "polipeptido", "oligopeptido", y "peptido" se utilizan indistintamente para referirse a un polfmero de al menos dos aminoacidos unidos covalentemente mediante un enlace amida, independientemente de la longitud o modificacion postraduccional (por ejemplo, glicosilacion, fosforilacion, lipidacion, miristilacion, ubiquitinacion, etc.). se
5
10
15
20
25
30
35
40
45
50
55
60
65
incluyen dentro de esta definicion son los aminoacidos D y L, y las mezclas de aminoacidos D y L.
[0056] "Recombinante" cuando se usa con referencia a, por ejemplo, una celula, acido nucleico, polipeptido, casete de expresion o vector, se refiere a un material, o un material correspondiente a la forma natural o nativa del material, que ha sido modificado por la introduccion de un nuevo resto o alteracion de un resto existente mediante tecnicas recombinantes, o es identica a las mismas pero producidas o derivadas de materiales sinteticos utilizando tecnicas recombinantes. por ejemplo, las celulas recombinantes expresan genes que no se encuentran dentro de la forma nativa (no recombinante) de la celula (es decir, "acidos nucleicos exogenos") o expresan genes nativos que se expresan de otra manera en un nivel diferente, por lo general, expresado en menor medida o no expresado en absoluto.
[0057] "Secuencia de referencia" se refiere a una secuencia definida usada como base para una comparacion de secuencias. Una secuencia de referencia puede ser un subconjunto de una secuencia mayor, por ejemplo, un segmento de un gen de longitud completa o secuencia de polipeptido. En general, una secuencia de referencia es de al menos 20 nucleotidos o aminoacidos residuos de longitud, al menos 25 residuos de longitud, al menos 50 residuos de longitud, o de toda la longitud del acido nucleico o polipeptido. Dado que dos polinucleotidos o polipeptidos pueden cada uno (1) comprender una secuencia (es decir, una porcion de la secuencia completa) que es similar entre las dos secuencias, y (2) puede comprender ademas una secuencia que es divergente entre las dos secuencias, las comparaciones de secuencias entre dos (o mas) polinucleotidos o polipeptidos se realizan tfpicamente por la comparacion de secuencias de los dos polinucleotidos o polipeptidos a traves de una "ventana de comparacion" para identificar y comparar regiones locales de similitud de secuencia.
[0058] "Replicar" se refiere a la copia de una secuencia de polinucleotido diana para sintetizar una copia complementaria inversa del polinucleotido. Generalmente, la replicacion se realiza mediante polimerasas que copian un polinucleotido molde para sintetizar un polinucleotido que es un complemento trasero de la secuencia de polinucleotido diana.
[0059] " Segmento" se refiere a una secuencia que es una porcion de una secuencia de polinucleotido mas grande. La secuencia de polinucleotido mas grande puede ser dividido en una pluralidad de segmentos, en el que la combinacion de los segmentos comprende la longitud completa de la secuencia de polinucleotido mas grande.
[0060] "Variante de polipeptido" o "analogo de polipeptido" tal como se utiliza aquf, se refiere a polipeptidos que se componen de un segmento que tiene actividad funcional, con o sin la retencion de cualquier propiedad mejorada, y tiene una identidad sustancial con una porcion de un polipeptido de referencia. En algunas realizaciones, polipeptidos analogos comprenden una sustitucion conservadora o no conservadora de aminoacidos, o la adicion o delecion de uno o mas residuos de aminoacidos con respecto a la secuencia de referencia.
[0061] "Watson/Crick base de sincronizacion" se refiere a un patron de pares especfficos de nucleobases y analogos que se unen juntos a traves de enlaces de hidrogeno especfficos de la secuencia, por ejemplo, A se aparea con T y U, y G se aparea con C.
[0062] "Sustitucion" se refiere a la sustitucion de uno o mas nucleotidos o aminoacidos por diferentes nucleotidos o aminoacidos, respectivamente, con respecto a una secuencia de referencia, tal como, por ejemplo, una secuencia de tipo silvestre.
[0063] "Sustrato" "Soporte". "Soporte solido," "Vehfculo solido", o "Resina" son terminos intercambiables y se refieren a cualquier material en fase solida. El sustrato tambien incluye terminos como "fase solida", "superficie", y/o "membrana". Un soporte solido puede estar compuesto por polfmeros organicos tales como poliestireno, polietileno, polipropileno, polifluoroetileno, polietilenoxi y poliacrilamida, asf como copolfmeros y los injertos de los mismos. Un soporte solido tambien puede ser inorganico, tal como vidrio, sflice , vidrio de poro controlado (CPG), sflice de fase inversa o de metal, como el oro o el platino. La configuracion de un sustrato puede estar en forma de perlas, esferas, partfculas, granulos, un gel, una membrana o una superficie. Las superficies pueden ser plana, sustancialmente plana, o no plana. Los soportes solidos pueden ser porosos o no porosos, y pueden tener hinchazon o caracterfsticas no hinchazon. Un soporte solido puede estar configurado en forma de un pozo, depresion, u otro recipiente, recipiente, caracterfstica o ubicacion. Una pluralidad de soportes se puede configurar en una matriz en varios lugares, direccionable para la entrega robotica de reactivos, o por metodos y/o instrumentos de deteccion.
[0064] "Matriz" se refiere a una disposicion de agentes (por ejemplo, protefnas, anticuerpos, paquetes geneticos replicables) sobre un sustrato en lugares posicionalmente distintos. En algunas realizaciones, los agentes de la matriz estan espacialmente codificados de tal manera que la identidad de un agente puede determinarse a partir de su ubicacion en la matriz. Una "micromatriz" generalmente se refiere a una matriz en la que la deteccion requiere el uso de deteccion microscopica para detectar los complejos formados con los agentes sobre el sustrato. Un "lugar" en una matriz se refiere a un area localizada en la superficie de la matriz que incluye agentes, definidos cada uno de modo que se puede distinguir de sitios adyacentes (por ejemplo, ser colocado en la matriz general, o tener alguna caracterfstica detectable, que permite la ubicacion de distinguirse de otras ubicaciones). La ubicacion puede tener cualquier forma conveniente (por ejemplo, circular, rectangular, elfptica o en forma de cuna). El tamano o area de
5
10
15
20
25
30
35
40
45
50
55
60
65
una ubicacion pueden variar significativamente. Las matrices se pueden construir sobre sustratos, tales como vidrio o plastico de microscopio diapositivas, y configurarse en forma de pozos, depresiones, gotitas, u otros recipientes, o recipientes de reaccion, tal como un pocillo de la microplaca. En general, no hay ninguna restriccion en el formato de la matriz proporciona los sitios individuales a los que estan dispuestos pueden ser localizados e identificados los agentes.
[0065] Camara de reaccion "se entiende que el entorno en el que los agentes y/o de reaccion los componentes se lleva a cabo. Recipientes de reaccion comercialmente disponibles contienen al menos una camara de reaccion, pero puede contener camaras de reaccion 8, 24, 96 o 384. Para los fines de la presente descripcion, "camara(s) de reaccion", "pocillo(s)", "sitio(s) de reaccion," se utilizan indistintamente. un ejemplo de una camara de reaccion es uno de los 96 pocillos de microtitulacion en una placa de microtitulacion de 96 pocillos.
[0066] "Ensayo de cebador" se refiere a la serie de cebadores o conjuntos de cebadores usados en una reaccion de amplificacion en lugares posicionalmente distintos sobre un sustrato (por ejemplo, sustrato de matriz). En general, el conjunto de cebadores comprende un par de cebadores delantero y traseros utilizados para amplificar un amplicon.
[0067] "Ensayo de amplicon" se refiere a una disposicion de polinucleotidos amplificados en lugares posicionalmente distintos sobre un sustrato (por ejemplo, sustrato de matriz). En algunas realizaciones, la matriz de amplicon puede tener la misma disposicion posicional como ensayo de cebador, tal como cuando la reaccion de amplificacion es llevada a cabo en la matriz de cebadores para generar polinucleotidos amplificados.
[0068] "Plasmido", "vector", y "casete" se refieren a un elemento cromosomico adicional, que frecuentamente llevan genes, y por lo general en forma de moleculas de ADN de doble cadena circular. Tales elementos pueden ser secuencias de replicacion autonoma, secuencias de integracion de genoma, secuencias de fagos o nucleotfdicas, lineales o circulares, de un ADN o ARN monocatenario o bicatenario, derivado de cualquier fuente, donde un numero de secuencias de nucleotidos se han unido o recombinado en una construccion unica que es capaz de introducir un fragmento promotor y la secuencia de ADN para un producto genico seleccionado junto con la secuencia no traducida apropiada 3' en una celula. "Casete de expresion" se refiere a un vector especffico que contiene un gen extrano y que tiene elementos ademas del gen extrano que permiten la expresion de ese gen en un huesped.
4.2 Metodos de sfntesis de variantes de polinucleotidos
[0069] La presente descripcion proporciona metodos de generacion de variantes de polinucleotido que tienen un conjunto definido de la secuencia de diferencias de una secuencia de polinucleotidos de referencia. En algunas realizaciones, los metodos son aplicables para la generacion de polinucleotidos que codifican variantes de polipeptidos que tienen diferencias definidas en la secuencia de aminoacidos en comparacion con un polipeptido de referencia. En algunas realizaciones, las variantes de polinucleotidos tienen un conjunto definido de diferencias de nucleotidos en las regiones no codificantes, por ejemplo, mutaciones silenciosas. Los polinucleotidos se generan de manera eficiente mediante el uso de bibliotecas de fragmentos de polinucleotidos, donde los miembros de la biblioteca codifican una o mas de las diferencias de aminoacidos en comparacion con una secuencia de polipeptido de referencia, y los fragmentos de polinucleotidos estan disenados para tener la superposicion de las regiones adyacentes de tal manera que la seleccion de un conjunto apropiado de fragmentos, con y sin mutaciones, permite su montaje en una variante de polinucleotido, tal como un polinucleotido que codifica una variante del polipeptido deseado.
[0070] En algunas realizaciones, el metodo para generar un polinucleotido que codifica un polipeptido que tiene una secuencia de aminoacidos con una o mas diferencias definidas en residuos de aminoacidos, comprende (a) seleccionar una pluralidad de diferencias de restos de aminoacidos se define con respecto a una secuencia de aminoacidos de referencia; (b) la definicion de segmentos de superposicion de una secuencia de polinucleotido que codifica el polipeptido con la diferente secuencia de aminoacidos, u opcionalmente el polipeptido de referencia, con cada segmento esta limitada por un conjunto de secuencias de union de cebadores delanteros y traseros, donde una diferencia en la secuencia de polinucleotido que codifica cada uno de la pluralidad de diferencias de restos de aminoacidos se engloba en las secuencias de union de cebadores delanteros y/o traseros que se unen a las secuencias de union de cebadores; (c) amplificar cada segmento con el conjunto de cebadores delanteros y traseros, donde un cebador delantero y/o trasero contiene las diferencias en la secuencia de polinucleotidos, para generar una biblioteca de amplicones que comprenden miembros que codifican las diferencias de aminoacidos definidas y donde la biblioteca comprende miembros suficientes para el montaje de dos o mas diferentes permutaciones de secuencias de aminoacidos de las diferencias de residuos de aminoacidos definidas; (d) realizar el montaje de la biblioteca de un conjunto de amplicones que tienen regiones adyacentes complementarias que juntas codifican el polipeptido con una secuencia de aminoacidos de permutacion definida, teniendo una o mas diferencias de residuos de aminoacidos definidas; y (e) replicar el conjunto de amplicones ensamblados para sintetizar el polinucleotido que codifica el polipeptido. Una biblioteca de amplicones que contienen todas las diferencias de aminoacidos definidas deberfan permitir la sfntesis de una pluralidad de polinucleotidos que codifican para todas las posibles permutaciones de secuencias de aminoacidos.
[0071] Como sera evidente para el experto en la tecnica, la seleccion de la pluralidad de residuos de aminoacidos
5
10
15
20
25
30
35
40
45
50
55
60
65
definida las diferencias se pueden obtener de diversas fuentes. En algunas realizaciones, las posiciones de residuo de aminoacido y las mutaciones correspondientes para un polipeptido definido se pueden obtener a partir de estudios de mutagenesis al azar, tales como los descritos en Crameri et al, 1998, "Barajado de ADN de una familia de genes de diversas especies acelera la evolucion dirigida":. Nature 391: 288-291 ; . Crameri et al, 1997, "La evolucion molecular de una via de arseniato de desintoxicacion por barajado de ADN," Nature Biotech 15: 436-438; . Zhang et al, 1997, "Evolucion dirigida de una fruciosidasa efectiva de una galactosidasa mediante barajado de ADN y la deteccion," Proc Nati Acad Sci EE.UU. 94:45-4-4509; . Crameri y otros, 1996, "Mejora de la protefna verde fluorescente por la evolucion molecular mediante barajado de ADN, Nature Biotech 14:315-319; Stemmer, 1994, "La rapida evolucion de una protefna in vitro mediante la transposicion de ADN", Nature 370:389-391; Stemmer , 1994, "Barajado de ADN mediante fragmentacion aleatoria y reensamblaje: En la recombinacion in vitro para la evolucion molecular', Proc Nail Acad Sci EE.UU. 91:10747-10751, WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 y la patente de EE.UU.. 6.537.746.
[0072] Tfpicamente, una biblioteca mutagenizada de polinucleotidos se expresa y los polipeptidos expresados seleccionados para un rasgo propiedad deseada, y las mutaciones asociadas con los cambios en la propiedad deseada identificada. Un gran numero de mutaciones que afectan a la funcion del polipeptido se puede obtener facilmente utilizando estas tecnicas.
[0073] En algunas formas de realizacion, las opciones de diferencias de restos de aminoacidos se pueden obtener a partir de la comparacion de secuencias de aminoacidos de las protefnas relacionadas, tales como las que se encuentran en una base de datos de secuencia. La comparacion de secuencias puede identificar posiciones, por ejemplo, residuos conservados que pueden ser importantes para la funcion de protefnas, que a su vez pueden ser objeto de cambios de aminoacidos definidas. Vease, por ejemplo, Wankhade et al., 2000, J. Biol. Chem. 275 (38): 29701-29708 y Reddy et al, 2001, Protefnas:. Estructura, Funcion y Genetica 42:148-163.
[0074] En algunas realizaciones, la pluralidad de diferencias de restos de aminoacidos definidas pueden basarse en diferencias de secuencia que se encuentran en la naturaleza, como los polimorfismos encontrados para un gen particular. En algunos casos, los polimorfismos estan asociados con efectos biologicos particulares y los fenotipos asociados. Vease, por ejemplo, Bidwell et al, 1999, Genes y Inmunidad 1:3-19; Chen et al, 2003, Mol. Biol. Evo. 18: 1771-1788. Las colecciones de polimorfismos pueden formar la base para definir una pluralidad de las diferencias de residuos de aminoacidos para la formacion de polipeptidos variantes de una secuencia de aminoacidos de referencia. Las combinaciones de diferentes polimorfismos de aminoacidos se pueden utilizar para examinar la funcion de una protefna particular.
[0075] Cuando la pluralidad de diferencias de restos de aminoacidos se define con respecto a una secuencia de referencia, el polinucleotido que codifica el polipeptido de referencia o de las variantes de polipeptidos pueden ser utilizadas como una base para la identificacion de segmentos para la definicion de los amplicones para ser generados para crear el fragmento de polinucleotido (es decir, amplificacion) de la biblioteca. En algunas realizaciones, la secuencia de polinucleotido no necesita ser restringido a cualquier secuencia particular siempre que codifica, o se puede utilizar como una base para generar polinucleotidos que codifican, la secuencia de aminoacidos de interes. El polinucleotido se puede basar en la (por ejemplo, de tipo silvestre) secuencia de origen natural o una secuencia optimizada para la expresion en un organismo particular de interes (por ejemplo, codones optimizados). Por ejemplo, si el polipeptido de interes se va a expresar en E. coli., Una secuencia de polinucleotido en el que los codones han sido optimizados para la expresion en E. coli. puede ser usada. Tecnicas de optimizacion de codones estan bien dentro de la experiencia de expertos en la tecnica.
[0076] Como sera evidente para el experto en la materia, dividir el polinucleotido en segmentos definidos para la amplificacion puede llevarse a cabo utilizando tecnicas bien conocidas en la tecnica. En algunas realizaciones, ya que los segmentos se definen por las secuencias de union a cebador, que a su vez se utilizan para introducir mutaciones en el amplicon. La division del polinucleotido en segmentos puede tener inicialmente en cuenta la ubicacion de las mutaciones en el polinucleotido. Las divisiones del polinucleotido en segmentos tambien pueden tener en cuenta la longitud total del polinucleotido, la eficiencia de la replicacion (por ejemplo, la amplificacion de segmentos), y el numero deseado de amplicones para el montaje. Otras consideraciones seran evidentes para el experto en la materia.
[0077] Las reacciones de amplificacion pueden ser afectadas por la secuencia, el tipo de polimerasa utilizado, la eficiencia de los cebadores, y reacciones secundarias no deseadas (por ejemplo, dfmeros de cebadores). Por lo tanto, en algunas realizaciones, dependiendo de la longitud total del polinucleotido a ensamblar, las longitudes de segmento pueden ser de 2000 bases o menos, 1500 bases o menos, 1200 bases o menos, 1000 bases o menos, 900 bases o menos, 800 bases o menos, 700 bases o menos, 600 bases o menos, 500 bases o menos, 400 bases o menos, 300 bases o menos, 250 bases o menos, o 200 bases o menos a aproximadamente 100 o tan pocos como aproximadamente 50 bases de longitud. En general, la duracion de los segmentos es de aproximadamente 50 a aproximadamente 1.000 bases, aproximadamente 200 a 1.000 bases, aproximadamente 300 a 700 bases, o aproximadamente 400 a 600 bases, con alrededor de 500 bases siendo longitud media util dada la eficiencia de las polimerasas utilizadas en las reacciones de amplificacion. En diversas formas de realizacion, los segmentos se solapan de tal manera que los amplicones producidos a partir tambien tendran las regiones adyacentes se
5
10
15
20
25
30
35
40
45
50
55
60
65
superponen (es decir, la superposicion de regiones complementarias) para el montaje del polinucleotido.
[0078] En algunas realizaciones, las regiones superpuestas adyacentes deben ser de longitud y complementariedad suficiente para permitir la formacion de amplicones hibridados estables (es decir, hibridadas) durante el montaje del polinucleotido. Por lo tanto, en algunas realizaciones, la longitud del solapamiento puede ser de 4 o mas nucleotidos, 5 o mas nucleotidos, 6 o mas nucleotidos, 8 o mas nucleotidos, 10 o mas nucleotidos, 15 o mas nucleotidos, 20 o mas nucleotidos, 25 o mas nucleotidos, 30 o mas nucleotidos, 40 o mas nucleotidos, 50 o mas nucleotidos, y 100 o menos, 90 o menos, 80 o menos, 70 o menos, 60 o menos nucleotidos de longitud segun lo permitido por la capacidad de formar amplicones hibridados estables. Dado que las regiones de superposicion generalmente incluyen la union de secuencias utilizan para generar los amplicones de imprimacion, la longitud de solapamiento pueden dar cuenta de las diferencias en la secuencia del cebador (por ejemplo, delanteros y/o hacia atras) se utiliza para generar las diferencias de polinucleotidos que codifican la mutacion a Ser presentado.
[0079] En algunas formas de realizacion, los segmentos estan delimitadas por las secuencias de union del cebador a la que los cebadores recocidos delanteros / traseros. En su caso, las secuencias de union de cebadores que definen los segmentos tambien pueden abarcar la posicion del polinucleotido que codifica una diferencia en la secuencia de aminoacidos. La secuencia de union a cebador puede ser de cualquier longitud suficiente para hibridarse al cebador (adelante o atras) durante la reaccion de amplificacion. Por consiguiente, la secuencia de union a cebador puede ser de 100 bases o menos, 90 bases o menos, 80 bases o menos, 70 bases o menos, 60 bases o menos, 50 bases o menos, 40 bases o menos, 30 bases o menos, 20 bases o menos 15 bases o menos, a aproximadamente 8 bases o 10 bases. En algunas realizaciones, la longitud de las secuencias de union de cebadores puede comprender de aproximadamente 8 a 50 bases, de aproximadamente 8 a 40 bases, aproximadamente 10 a 30 bases, o alrededor de 15 a 25 bases.
[0080] Cuando el cebador contiene una secuencia que codifica una diferencia de aminoacidos definidos, la mutacion puede estar situada en una region del cebador que no interfiera con la extension del cebador. En algunas formas de realizacion, la mutacion se encuentra en alrededor de la mitad del cebador mutagenico, donde el cebador tiene una Tm que es suficiente para hibridarse con el acido nucleico molde y servir como cebador para la reaccion de extension de la polimerasa mediada. En algunas realizaciones, las diferencias en la secuencia de polinucleotidos puede ser localizada, en funcion de la longitud del cebador, aproximadamente 5 bases, 6 bases, 8 bases, 10 bases, 12 bases, 15 bases, 20 bases, 25 bases desde el extremo 3 'de el cebador. En consecuencia, en algunas realizaciones, la longitud del cebadores delanteros/traseros pueden ser de aproximadamente 8 a 50 nucleotidos, aproximadamente de 8 a 40 nucleotidos, aproximadamente 10 a 30 nucleotidos, o aproximadamente 15 a 25 nucleotidos, y comprenden ademas nucleotidos diferencia en la secuencia en alrededor de la mitad de la imprimacion. Por lo tanto, en algunas realizaciones los cebadores delanteros/traseros son alrededor de 50 nucleotidos de longitud con una diferencia de nucleotidos aproximadamente 25 nucleotidos a partir del extremo 3', alrededor de 40 nucleotidos de longitud con una diferencia de nucleotidos aproximadamente 20 nucleotidos del extremo 3', alrededor de 30 nucleotidos de longitud con una diferencia de nucleotidos aproximadamente 15 nucleotidos del extremo 3', alrededor de 25 nucleotidos de longitud con una diferencia de nucleotidos sobre 12 nucleotidos desde el extremo 3', o alrededor de 20 nucleotidos de longitud con una diferencia de nucleotidos aproximadamente 10 nucleotidos desde el extremo 3',
[0081] La estabilidad de los cebadores de oligonucleotidos, por ejemplo, la temperatura de fusion termica, es una funcion de la fuerza ionica, temperatura, contenido de G / C, y la presencia de agentes caotropicos y se puede calcular usando metodos conocidos para predecir las temperaturas de fusion (vease, por ejemplo, Baldino y otros, Methods Enzymology 168:761-777; Bolton et al, 1962, Proc Natl Acad Sci EE.UU. 48:1390; Bresslauer et al, 1986, Proc Nati Acad Sci EE.UU. 83:8893-8897;. Freier et al, 1986, Proc Nat] Acad. Sci EE.UU. 83:9373-9377; Kierzek et al, Biochemistry 25:7840-7846; Rychlik et al, 1990, Acidos Nucleicos Res 18:6409-6412 (errata, 1991, Acidos Nucleicos Res 19:698); Sambrook et al, 2001, Molecular Cloning: A Laboratory Manual, 3a Ed, Cold Spring Harbor Laboratory Press, NY; Suggs et al., 1981, En biologfa de desarrollo utilizando genes purificados (Brown et al., Eds.), Pp. 683-693,
[0082] Para generar la biblioteca de amplicones, delanteros y cebadores que hibridan con la se utilizan en una reaccion de amplificacion para generar amplicones de secuencias de cada segmento del polinucleotido de union a cebador trasero. Cuando el amplicon tiene una diferencia de polinucleotido que codifica un aminoacido definido cambio relativo a la secuencia de referencia, la secuencia de cebadores traseros y/o delanteros se disenan para introducir la secuencia diferente (es decir, mutacion) en la reaccion de amplificacion. Las combinaciones adecuadas de cebadores delanteros y traseros se utilizan para generar una biblioteca de amplicones que comprenden miembros que pueden codificar para cada una de la pluralidad de diferencias de restos de aminoacidos.
[0083] En algunas realizaciones, los conjuntos de cebadores delanteros y traseros pueden ser almacenados en una matriz, por ejemplo una matriz de imprimacion, de manera que se puede acceder facilmente cuando se necesitan amplicones para la sfntesis de un polinucleotido que codifica una secuencia de amino definida de acido de permutacion. Como se apreciara en la tecnica, los cebadores de oligonucleotidos se pueden usar para introducir cualquier tipo de mutacion seleccionada en la pluralidad definida de diferencias de restos de aminoacidos, incluidos, entre otros, inserciones de aminoacidos, deleciones y sustituciones. Las sustituciones pueden ser mutaciones
5
10
15
20
25
30
35
40
45
50
55
60
65
conservatives o no conservatives, segun lo dictado por la pluralidad escogida de las diferencias de residuos de aminoacidos.
[0084] En algunas realizaciones, mas de un acido amino diferencia en la secuencia puede estar presente en la misma posicion de residuos de aminoacidos en una secuencia polipeptfdica. En estas realizaciones, diferentes amplicones desde el mismo segmento de solapamiento se pueden generar, en donde cada amplicon se prepara con pares de cebadores delanteros y traseros para cada mutacion definida en la posicion de residuo identico. Para preparar un polinucleotido que codifica una permutacion de secuencia particular en esa posicion de residuo de aminoacido especffico, uno de los amplicones que contienen la mutacion deseada (es decir, diferencia de nucleotidos definida) se elige y se monta como un miembro del conjunto de amplicons para generar el polinucleotido que codifica un polipeptido que contiene la mutacion deseada en la posicion de residuo de aminoacido especificado.
[0085] En algunas realizaciones, mas de un par de cebadores (por ejemplo, un conjunto de cebadores degenerados) se puede utilizar para generar un conjunto de amplicones (es decir, fragmentos de polinucleotidos) que pueden utilizarse para ensamblar un conjunto de variantes de polinucleotido de polipeptidos que codifican tienen cambios mas residuos de aminoacidos (por ejemplo, sustituciones) en una posicion definida especffica. Las variantes de polinucleotidos ensamblados a partir de los amplicones realizan cebadores degenerados pueden ser secuenciados antes o despues de su polipeptido codificado se ensaya con el fin de determinar la secuencia especffica a la posicion de interes.
[0086] Como sera evidente para el experto en la materia, en algunas realizaciones, un segmento de solapamiento definido para una secuencia de polinucleotidos no puede tener ningunas mutaciones asociadas. Ademas, el mismo segmento puede en una secuencia de aminoacidos de permutacion abarcan una mutacion especificada, pero en algunas permutaciones de secuencia pueden no tener ninguna mutacion asociada con el segmento. Asf, en algunas formas de realizacion, la biblioteca de los amplicones pueden contener miembros que no tienen las diferencias de secuencia de polinucleotido en comparacion con la secuencia de referencia para un segmento particular. Estos polinucleotidos de puente, que no tienen cambios asociados en la secuencia en comparacion con la secuencia de referencia, pueden utilizarse como un conector para montar el polinucleotido completo.
[0087] Con la eleccion apropiada de los segmentos, la biblioteca de amplicon comprende miembros que pueden ser utilizados para ensamblar al menos dos o mas diferentes permutaciones de secuencias de aminoacidos de las diferencias de aminoacidos definidos en relacion con la secuencia de referencia. Por ejemplo, una pluralidad de mutaciones definidas por las diferencias de restos de aminoacidos A y B puede tener las siguientes permutaciones: A solo, B solo, o A y B. Asf, la biblioteca de amplicon tiene miembros suficiente para generar una permutacion de secuencia de aminoacidos que tiene, independientemente, A mutacion o B mutacion. En algunas realizaciones, la biblioteca de amplicon tiene miembros suficientes para generar cada secuencia de aminoacidos de permutacion de las diferencias de residuos de aminoacidos definidas en relacion con la secuencia de referencia. Asf, para el ejemplo dado, la biblioteca de amplicon tiene miembros suficiente para generar permutaciones de secuencias de aminoacidos que tienen, independientemente, una mutacion A o mutacion B, o una mutacion A + B. Dado que el tamano de los amplicones se corresponded con el tamano de los segmentos, los amplicones pueden ser de 2000 bases o menos, 1500 bases o menos, 1200 bases o menos, 1000 bases o menos, 900 bases o menos, 800 bases o menos, 700 bases o menos, 600 bases o menos, 500 bases o menos, 400 bases o menos, 300 bases o menos, 250 bases o menos, o 200 bases o menos a aproximadamente 100 o tan pocos como aproximadamente 50 bases de longitud. En general, la longitud de los amplicones es de aproximadamente 50 a aproximadamente 1.000 bases, aproximadamente 200 a 1000 bases, aproximadamente 300 a 700 bases, o aproximadamente 400 a 600 bases, con alrededor de 500 bases o menos una longitud util, dada la eficiencia de polimerasas utilizadas en las reacciones de amplificacion. En algunas realizaciones, los amplicones son alrededor de 400 bases o menos de longitud.
[0088] En general, la reaccion de amplificacion puede utilizar cualquier enzima utilizada para la polimerasa mediada por reacciones de extension, tales como la polimerasa Taq, la polimerasa Pfu, polimerasa Pwo, polimerasa Tfl, polimerasa rTth, polimerasa Tli, polimerasas Tma, y el fragmento Klenow. Condiciones para la amplificacion de un segmento de polinucleotido usando la reaccion en cadena de la polimerasa puede seguir condiciones estandar conocidas en la tecnica. Vease, por ejemplo, Sambrook et al, 2001, Molecular Cloning: A Laboratory Manual, 3a Ed, Cold Spring Harbor Laboratory Press, NY y Ausubel et al, 1989, Current Protocols in Molecular Biology, Greene Publishing Associates y Wiley Interscience, Ny (actualizaciones hasta 2008).
[0089] En algunas realizaciones, la amplificacion de cada amplificon puede llevarse a cabo en reacciones separadas, minimizando asf la necesidad de aislar un producto de amplificacion de otro amplicon. Sin embargo, las reacciones de amplificacion de dos o mas amplicones pueden llevarse a cabo en una sola reaccion y los productos aislados, como por electroforesis o cromatograffa. En algunas formas de realizacion, los productos de la reaccion de amplificacion pueden ser tratados con varias combinaciones de exonucleasas y fosfatasas para eliminar restantes cebadores y nucleotidos libres (por ejemplo, combinacion de exonucleasa I y fosfatasa de alcalina).
[0090] Para generar el polinucleotido que codifica el polipeptido con la secuencia de permutacion de aminoacidos definida, se selecciona un conjunto de amplicones que tienen regiones solapadas complementarias y montadas en condiciones que permitan la reasociacion de las regiones solapadas complementarias entre sf. Por ejemplo, los
5
10
15
20
25
30
35
40
45
50
55
60
65
amplicones se pueden desnaturalizar y luego se dejo recocido para formar un complejo de amplicones que juntos codifican el polipeptido con una permutacion de secuencia de aminoacidos definida que tiene una o mas de las diferencias de residuos de aminoacidos con relacion a una secuencia de referencia. Generalmente, el montaje de cada conjunto de amplicones puede realizarse por separado de tal manera que el polinucleotido que codifica una secuencia de aminoacidos de permutacion se distingue facilmente de otro polinucleotido que codifica una secuencia de aminoacidos diferente de permutacion. En algunas realizaciones, el montaje puede llevarse a cabo en ubicaciones direccionables sobre un sustrato (por ejemplo, una matriz) de tal manera que una pluralidad de polinucleotidos que codifican una pluralidad de secuencias de permutaciones de aminoacidos definidas pueden ser generadas simultaneamente.
[0091] En algunas formas de realizacion, los conjuntos se pueden preparar de tal manera que multiples (es decir, 2 o mas) amplicones estan representados por el mismo fragmento. El producto resultante de esta reaccion de ensamblaje contendra una mezcla de polinucleotidos que contienen diferentes permutaciones de secuencia de diferencias de aminoacido definidas. Esta mezcla se puede clonar directamente y variantes puede ser secuenciadas antes o despues de polipeptidos codificados se ensayan.
[0092] Los amplicones reunidos se replican utilizando una polimerasa para sintetizar el polinucleotido que codifica el polipeptido de interes. En algunas realizaciones, las condiciones de reaccion pueden utilizar las mismas condiciones y las polimerasas utilizadas para la reaccion de amplificacion. Los amplicones reunidos actuan como iniciadores de tal manera que una sola ronda de replicacion crea un duplicado de los amplicones reunidos. Generalmente, en la etapa de replicacion, cebadores que hibridan con secuencias de union cebador que flanquean el polinucleotido (es decir, el region 5' terminal y el region 3' terminal) puede ser anadido para amplificar el producto de polinucleotido mediante la realizacion de reacciones de amplificacion adicionales. En algunas realizaciones, estos cebadores flanqueantes pueden incorporar secuencias de reconocimiento para enzimas de restriccion para facilitar la clonacion del producto polinucleotido sintetizado en plasmidos o vectores, tales como vectores de expresion.
[0093] En algunas realizaciones, los cebadores de flanqueo pueden tener secuencias que permiten la expresion directa in vitro utilizando un sistema de traduccion acopladas de transcripcion para la sfntesis del producto de protefna sin la necesidad de transformacion en un organismo huesped. Por lo tanto, algunos cebadores que flanquean puede incorporar secuencias de control para controlar la expresion de la region codificante del polipeptido. Las reacciones de amplificacion utilizando dichos cebadores flanqueantes pueden ligarse operativamente las secuencias de control para el polipeptido de la region codificante de interes.
[0094] En algunas realizaciones, la pluralidad de diferencias de aminoacidos es al menos 2. En algunas realizaciones, la pluralidad de diferencias de aminoacidos es al menos 2,3,4,5,6, 7, 8, 9, 10, 11, 12 , 13, 14, 15, o mas. De acuerdo con ello, el numero de diferencias de nucleotidos definidas puede variar de 2 a 45, o mas. El numero de permutaciones para pluralidad "n" diferencias de residuo de aminoacidos definidas es dado por la formula n!/(k!(n-k)!, donde n es el numero de no mutaciones mutuamente excluyentes y k es el numero de diferencias de aminoacidos y n! denota el operador factorial. En algunas realizaciones, el tamano de la biblioteca de amplificacion, por ejemplo durante un mfnimo de 2 diferencias de residuos de aminoacidos es un tamano de la biblioteca que contiene al menos 3 diferentes amplicones. En algunas realizaciones, el tamano de la biblioteca es de al menos 5, 6, 7, 8, 9, 10, 11, o incluso mas amplicones diferentes. Por ejemplo, para una pluralidad de variantes que comprende al menos 10 diferencias definidas, asumiendo ninguna de las diferencias se encuentran madamente tal que mas de lo que puede ser incluido por imprimacion, el montaje de las variantes con 10 diferencias definidas utiliza hasta 11 amplificones por reaccion de ensamblaje. Suponiendo una pluralidad de diferentes mutaciones que se desean en cualquiera de la pluralidad de posiciones que tienen diferencias definidas, las bibliotecas mucho mas grandes de los amplicones se pueden utilizar. Por consiguiente, en algunas formas de realizacion, la biblioteca de los amplicones pueden comprender al menos 5, 10, 20, 30, 40, 50, 75, 100, o mas amplicones diferentes.
[0095] Una vez que la biblioteca de los amplificones han sido sintetizados, cualquier polinucleotido que codifica una secuencia de permutacion de aminoacidos especificada en base a una pluralidad de diferencia de residuo de aminoacidos se puede hacer uso de la biblioteca de los amplicones. En algunas realizaciones, el metodo de generacion de un polinucleotido que codifica un polipeptido que tiene una secuencia de aminoacidos con una o mas diferencias definidas en los residuos de aminoacidos en comparacion a una secuencia de polipeptido de referencia puede comprender las etapas de: (a) el montaje de un conjunto de amplicones que tienen regiones adyacentes solapadas complementarias, donde el conjunto montado de los amplicones comprende una secuencia de polinucleotido que codifica una secuencia de aminoacidos con una o mas diferencias definidas de residuo de aminoacido en comparacion con una secuencia de referencia, en donde se seleccionan los amplicones de una biblioteca de amplicones que tienen miembros que codifican una pluralidad de diferencias de aminoacidos, y (b) reproducir el conjunto de fragmentos de polinucleotidos superpuestos ensamblados a sintetizar el polinucleotido de interes.
[0096] En algunas realizaciones, la biblioteca de amplicon se puede utilizar para generar polinucleotidos que codifican cualquier permutacion de una pluralidad definida de diferencias de aminoacidos definidas, comprendiendo el metodo: (a) la generacion de permutaciones de secuencias de aminoacidos que difieren de una secuencia de aminoacidos de referencia basado en una pluralidad de diferencias de restos de aminoacidos definidas en
5
10
15
20
25
30
35
40
45
50
55
60
65
comparacion con una secuencia de aminoacidos de referencia, (b) seleccionar una secuencia de permutacion de aminoacidos definidas y determinar una secuencia correspondiente de polinucleotidos basada en una secuencia de referencia, (c) seleccionar un conjunto de la superposicion de fragmentos de polinucleotido que codifica las permutaciones de secuencias de aminoacidos definidas, donde al menos cada fragmento de polinucleotido de superposicion que codifica una diferencia de un aminoacido es de una pluralidad de fragmentos de codificacion de polinucleotido diferente de aminoacidos que conocida las diferencias de residuos, en el que la pluralidad de fragmentos tiene miembros suficientes para ensamblar polinucleotidos que codifican al menos dos diferentes permutaciones de secuencias de aminoacidos, (d) montar el conjunto de fragmentos de polinucleotidos que tiene regiones adyacentes solapadas complementarias, y (e) que replican el conjunto de fragmentos superpuestos montados para sintetizar el polinucleotido que codifica el polipeptido. Para cada secuencia de permutacion de aminoacidos deseada, las etapas de (b) a (e) pueden repetirse.
[0097] un proceso ejemplar para la generacion de los amplicones para el numero "n" de variantes se muestra en la FIG. 4. En la realizacion ilustrada, el procedimiento comprende: (a) la importacion de una secuencia de referencia y una lista de mutaciones asociadas con la secuencia, (b) la creacion de una lista de variaciones basada en la lista de mutaciones, (c) seleccionar una permutacion definida de la secuencia de aminoacidos (es decir, la variante 1), (d) la identificacion de la superposicion de fragmentos de polinucleotidos de una biblioteca de amplicones (por ejemplo, como la preparada en la FlG. 5), (e) determinar el numero de variantes y si el numero de variantes es menor que el numero total de variantes deseadas, reiterando las etapas (a) a (d).
[0098] Para la sfntesis eficiente de las bibliotecas de amplificacion, cebadores disenados apropiadamente oligonucleotidc se utilizan en una reaccion de amplificacion. En algunas realizaciones, el metodo de generacion de una biblioteca de la superposicion de fragmentos de polinucleotidos puede comprender: (a) generar una pluralidad de permutaciones de secuencias de aminoacidos que difieren de una secuencia de aminoacidos de referencia basado en una pluralidad de diferencias de restos de aminoacidos definida a partir de una secuencia de aminoacidos de referencia, y para cada permutacion (i) la determinacion de una secuencia de polinucleotido que codifica la secuencia de aminoacidos basadas en un polinucleotido de referencia secuencia; (ii) exploracion de una secuencia de polinucleotidos y la identificacion de un cambio en la secuencia de polinucleotido que codifica una diferencia residuo de aminoacido, y determinar opcionalmente la proximidad de un proximo cambio en la secuencia de polinucleotidos que codifica un siguiente diferencia residuo de aminoacido en la secuencia de aminoacidos de permutacion; (iii) seleccionar un oligonucleotido cebador delanteros que tiene una secuencia que codifica la diferencia de un aminoacido, y opcionalmente incluyendo el siguiente cambio en la secuencia de polinucleotido en el mismo cebador directo si proximo a el cambio en la secuencia de polinucleotido; (iv) la exploracion de una secuencia de polinucleotidos de la ubicacion del cebador delantero hasta que se identifica el siguiente cambio en la secuencia de polinucleotido o hasta que el extremo del polinucleotido, y la seleccion de un oligonucleotido de cebador trasero para amplificar un fragmento de polinucleotido con el cebador de oligonucleotido directo, en el que el cebador trasero tiene una secuencia que codifica opcionalmente el siguiente cambio en la diferencia de residuo de aminoacido; (v) reiterar las etapas (ii) a (iv) para cada cambio en la secuencia de polinucleotido que codifica una diferencia de residuo de aminoacido hasta que todos los cambios en la secuencia de polinucleotidos que estan presentes en los cebadores de oligonucleotidos y los fines de que se alcance la secuencia de polinucleotido; y (g) amplificar con cada conjunto de cebadores delanteros y traseros de oligonucleotidos para generar la biblioteca de amplicones que tienen miembros que codifican las diferencias de aminoacidos superpuestas. En estas realizaciones, cuando la exploracion de la secuencia de polinucleotidos se encuentra con el extremo del polinucleotido, cebadores flanqueantes se pueden utilizar en combinacion con los cebadores internos para completar la generacion de los amplicones.
[0099] Un proceso ejemplar para la seleccion de cebadores adecuados delanteros y traseros se ilustra en la figura. 5. En la fig. 5, el proceso de seleccion de los cebadores de oligonucleotidos comprende: (a) seleccionar una variante (un aminoacido de secuencia de permutacion) y la generacion de la secuencia de polinucleotido correspondiente sobre la base de una secuencia de referencia, (b) la creacion de un cebador de oligonucleotidos delanteros para un fragmento con una primera mutacion, (c) exploracion de la secuencia a partir de la primera mutacion a la siguiente mutacion o hasta el final del gen y la creacion de un cebador de oligonucleotido trasero para la proxima mutacion, (d) y si el siguiente mutacion es proxima a la primera mutacion, colocando la siguiente mutacion en el mismo cebador de oligonucleotidos delanteros, (e) reiterar las etapas (b) a (d) hasta que los extremos de la variante de polinucleotido n se alcance.
[0100] Como se ha senalado anteriormente, en algunas realizaciones en las que el polinucleotido ha separado en segmentos superpuestos definidos por un conjunto de cebadores delanteros y traseros, cebadores delanteros y traseros pueden no tener mutaciones asociadas. Un contexto en el que esto puede ocurrir es que si los segmentos de polinucleotidos deben ser restringidos en tamano, por ejemplo, aproximadamente menos de 1000 bases, debido a la necesidad para la sfntesis eficiente de un amplicon, tales cambios que no todos los segmentos han definido en la secuencia de polinucleotido. En algunas formas de realizacion, en la preparacion de los oligonucleotidos basados en el metodo anterior, la busqueda de la secuencia se puede limitar a un tamano particular "I", por ejemplo en alrededor de 1.200 bases en la etapa (iv) para la seleccion de un cebador trasero. En otras palabras, tras la identificacion de un cebador delantero basado en una diferencia en la secuencia, una exploracion se realiza en uno o el otro sentido de la secuencia de polinucleotidos para determinar la distancia de nucleotidos a la siguiente
5
10
15
20
25
30
35
40
45
50
55
60
65
mutacion. Si la distancia excede el limite establecido, un segmento que no abarca ningunas mutaciones puede ser creadas para tender un puente sobre dos segmentos que contienen las dos mutaciones distantes. El proceso de digitalizacion puede ser reiterado en el punto de la siguiente mutacion.
[0101] Como se senalo anteriormente, los cebadores de oligonucleotidos, ya sea solos o en conjunto (por ejemplo, delanteros y traseros) oligonucleotidos, asf como los amplicones correspondientes se pueden colocar sobre sustratos direccionables para la automatizacion y/o almacenamiento. Los cebadores de oligonucleotidos en los sustratos direccionables, tambien descritos en el presente documento como un ensayo de cebador, pueden ser accedidos roboticamente para sintetizar bibliotecas de amplicones para una pluralidad definida de diferencias de aminoacidos. Del mismo modo, los amplicones en los sustratos direccionables, tambien aquf se describen como matrices de amplicon, se puede acceder para generar una secuencia de polinucleotidos que codifica un aminoacido deseado de secuencia de permutacion de acido basado en la pluralidad definida de diferencias de residuos de aminoacidos. Un sustrato o soporte solido para la matriz pueden estar compuestas de polfmeros organicos tales como poliestireno, polietileno, polipropileno, polifluoroetileno, polietilenoxi y poliacrilamida, asf como copolfmeros e injertos de los mismos. Un soporte solido tambien puede ser inorganico, tal como vidrio, sflice, vidrio de poro controlado (CPG), sflice de fase inversa o de metal, como el oro o el platino. La configuracion de un sustrato puede estar en forma de perlas, esferas, partfculas, granulos, un gel, una membrana o una superficie. Las superficies pueden ser planas, sustancialmente planas, o no planas. Los soportes solidos pueden ser porosos o no porosos, y pueden tener hinchazon o inflamacion no caracterfsticas. Un soporte solido puede estar configurado en forma de un pozo, depresion, u otro recipiente, recipiente, caracterfstica, o la ubicacion. Una pluralidad de soportes pueden configurarse en una matriz en varios lugares, direccionable para la entrega robotica de reactivos, o por metodos y/o instrumentos de deteccion, en algunas realizaciones, el sustrato es una camara de reaccion. Comercialmente recipientes de reaccion disponibles contienen al menos una camara de reaccion, pero pueden contener camaras de reaccion 8, 24, 96 o 384. Un ejemplo de una camara de reaccion es uno de los 96 pocillos de microtitulacion en una placa de microtitulacion de 96 pocillos.
[0102] En algunas realizaciones, un sistema robotico y un sistema de ordenador asociado capaz de cebadores de muestreo o pares de cebadores a partir de las matrices se pueden utilizar para entregarlos a una camara de reaccion. Los reactivos para la amplificacion de la polimerasa mediada tambien pueden ser entregada a cada conjunto de cebadores en la camara de reaccion, seguida de la aplicacion de una rutina de amplificacion (por ejemplo, en un termociclador automatizado). Esto permite la formacion de un sustrato que contiene amplicones direccionables definidos basados en segmentos de una secuencia de polinucleotidos que se superponen. El sistema robotico puede elegir el conjunto apropiado de los amplicones en base a la permutacion deseada de la secuencia de aminoacidos, los cebadores flanqueantes para la amplificacion del producto de polinucleotido final, y entregar los reactivos para la reaccion de ensamblaje y amplificacion. Un sistema robotico ejemplar se proporciona en la FIG. 6. El sistema robotico en la FIG. 6 comprende instrucciones para (a) seleccionar un segmento y amplicon asociado para la amplificacion, (b) la identificacion de oligonucleotidos delanteros y traseros para el fragmento seleccionado (es decir, amplificacion), el almacenamiento de la informacion de datos en los oligonucleotidos en la lista de oligonucleotidos unicos (por ejemplo, 96 placa de microtitulacion de pozo), y la colocacion de los oligonucleotidos en un primer sustrato direccionable (c) almacenar la informacion de datos en fragmento sintetizado (por ejemplo, la posicion en la matriz, la secuencia, los oligonucleotidos utilizados, etc) a la lista de fragmentos unicos, y colocando el oligonucleotido en un sustrato segundo direccionable, (d) determinar el numero de fragmentos seleccionados contra el numero total de fragmentos necesarios para el montaje, y reiterando las etapas (a) a (d) hasta que todos los fragmentos se han seleccionado, (e) colocar el gen de montaje en un tercer sustrato direccionable y pasos reiterando (a) a (d) hasta que todas las variantes deseadas que se han generado.
[0103] En algunas formas de realizacion, la presente descripcion tambien proporciona bibliotecas de fragmentos de polinucleotidos (es decir, amplicones) para el montaje de una pluralidad de polinucleotidos que codifican diferentes secuencia de permutaciones de aminoacidos. En algunas realizaciones, la pluralidad de polinucleotidos comprende: fragmentos de polinucleotidos con la superposicion de las regiones adyacentes, cada fragmento de polinucleotido estando limitada por las secuencias de union del cebador para los cebadores delanteros y traseros, en el que la pluralidad de polinucleotidos tienen miembros que codifican en las secuencias de una diferencia de residuo de aminoacido especffica de union a partir de una pluralidad definida de las diferencias de residuos de aminoacidos con respecto a una secuencia de aminoacidos de referencia de cebador de tal modo que la pluralidad de fragmentos de polinucleotido codifica toda una pluralidad seleccionada de restos de aminoacidos de diferencias de pluralidad de diferencias definidas de residuos de aminoacidos; y en el que la pluralidad de fragmento de polinucleotido comprende miembros para el montaje de dos o mas diferentes permutaciones de secuencias de aminoacidos de las diferencias de aminoacidos definidas. En algunas realizaciones, la pluralidad de fragmentos de polinucleotido comprende miembros suficientes para el montaje de todas las posibles permutaciones de la secuencia de aminoacidos de la pluralidad seleccionada de las diferencias de residuos de aminoacidos. En algunas realizaciones, los miembros de la pluralidad son amplicones formadas utlizando los cebadores delanteros y traseros.
[0104] Como sera evidente para el experto artesano, los metodos descritos en el presente documento se puede practicar usando tecnicas estandar disponibles para el experto en la tecnica, tales como los descritos en Sambrook et al, 2001, Molecular Cloning: A Laboratory Manual, 3a Ed. , Cold Spring Harbor Laboratory Press, Nueva York y Ausubel et al., 1989, Current Protocols in Molecular Biology, Greene Publishing Associates y Wiley Interscience,
5
10
15
20
25
30
35
40
45
50
55
60
65
Nueva York (actualizaciones hasta 2008). Los oligonucleotidos se pueden sintetizar utilizando metodologfas qufmicas conocidas, tales como los basados en metodologfas de sfntesis en fase solida de fosforamidita (Vease, por ejemplo, Wright, et al, 1993, Tetrahedron Letters 34, 3373-3376; Caruthers, 1991, Acc. Chem. Res. 24, 278-284; y las referencias citadas en este documento).
[0105] Tambien se describe aquf sistemas informaticos implementados en forma de software de ordenador para llevar a cabo los metodos descritos anteriormente. En algunas realizaciones, el producto de programa de ordenador comprende un medio de almacenamiento legible por maquina que tiene instrucciones de programa que comprenden codigos para cada una de las etapas de: (a) la importacion de una secuencia de referencia y una lista de mutaciones asociadas con la secuencia, (b) lista de permutaciones creadas basadas en la lista de mutaciones, (c) seleccionar una permutacion definida de la secuencia de aminoacidos, (d) la identificacion de la superposicion de fragmentos de polinucleotidos de una biblioteca de amplicones (por ejemplo, como se preparo en la FIG. 5), (e) determinar el numero de variantes y si el numero de variantes es menor que el numero total de variantes deseadas, reiterando las etapas (a) a (d).
[0106] En algunas realizaciones, el producto de programa de ordenador comprende un medio de almacenamiento legible por maquina que tiene instrucciones de programa que comprenden codigos para cada una de las etapas de: (a) seleccionar una variante (un aminoacido de secuencia de permutacion) y la generacion de la secuencia de polinucleotido correspondiente basado en una referencia secuencia, (b) la creacion de un cebador de oligonucleotido delantero para un fragmento con una primera mutacion, (c) exploracion de la secuencia a partir de la primera mutacion a la siguiente mutacion o hasta el final del gen y la creacion de un cebador trasero de oligonucleotidos para la proxima mutacion, (d) y si el siguiente mutacion es proxima a la primera mutacion, la colocacion de la siguiente mutacion en el mismo oligonucleotido delantero, (e) las medidas que reiteran (b) a (d) hasta que extremos de la variante de polinucleotido n se alcanza.
[0107] Como se muestra en las ilustraciones de la FIG. 4, FIG. 5, y FIG. 6, el equipo llevo a cabo programas para la seleccion de los amplicones, la seleccion de cebadores de oligonucleotidos, y el almacenamiento en formatos direccionables pueden ser integrados para permitir la automatizacion de las diversas etapas de los metodos de la descripcion.
[0108] Como se describe en el presente documento, en algunas realizaciones, el metodo se puede utilizar para sintetizar polinucleotidos que codifican polipeptidos que tienen un conjunto definido de mutaciones seleccionadas de entre una pluralidad de diferencias definidas en los residuos de aminoacidos de una secuencia de referencia. Los metodos de la presente memoria permiten la sfntesis eficiente de varias permutaciones de secuencias de aminoacidos sobre la base de las diferencias de residuos de aminoacidos. Sfntesis eficiente de los polinucleotidos que codifican diferentes secuencias de permutaciones de aminoacidos es util para una variedad de aplicaciones de ingenierfa de protefnas. Vease, por ejemplo, la publicacion de solicitud de EE.UU. US20060195947; La publicacion de solicitud de Estados Unidos. US20050153417; y la patente de Estados Unidos N° 7.220.566. En algunas realizaciones, los metodos se pueden utilizar para sintetizar polinucleotidos que codifican enzimas variantes que tienen propiedades mejoradas sobre la base de un conjunto de mutaciones que se sabe afectan diferentes propiedades de la enzima. Por ejemplo, algunas mutaciones pueden afectar, entre otros, la actividad enzimatica, estabilidad termica, especificidad de sustrato, estereoselectividad, estereospecificidad, y refractariedad a la inhibicion del producto. Mientras que las tecnicas tradicionales de mutagenesis aleatoria y tecnicas de evolucion de protefnas pueden conducir a la identificacion de mutaciones que afectan a estas diversas propiedades de las enzimas, muchas de estas mutaciones pueden ocurrir independientemente de los otros. Utilizando los metodos en el presente documento, varias permutaciones de mutaciones que afectan a diferentes rutas, tales como la actividad enzimatica, especificidad de sustrato, estabilidad termica y se pueden hacer y se cribaron para identificar enzimas de ingenierfa que tienen multiples alterado rasgos deseados.
[0109] Los metodos proporcionados en este documento proporcionan eficiencia y precision sorprendente en la
generacion de grandes bibliotecas de variantes de polinucleotido que comprende varias permutaciones de la secuencia de cambios. Por ejemplo, la secuencia de la protefna para la gulonolactona (L-) oxidasa (GLO) de Railus norvegicus (adhesion: gi-92090602-sp-P10867,3-GGLO_RAT) se puede traducir al reves para proporcionar una secuencia de ADN de 1,3 kb que se puede utilizar como una plantilla para disenar 90 variantes de polinucleotido, cada uno codifica una variante de polipeptido que tiene una combinacion diferente de tres a cinco sustituciones de aminoacidos. Por ejemplo, una lista de 90 permutaciones de sustituciones de 3-5 aminoacidos se puede seleccionar de la siguiente lista de 10 posibles sustituciones: T28S, D95A, S156N, G175S, R212D, 1251E, F302S, H330I, Y370G y K423N:. Las 90 diferentes permutaciones de sustituciones de aminoacidos codificadas por las variantes de polinucleotidos fueron las siguientes: D95A/F302S/H3301/K423N; D95A/F302S/Y370G;
D95A/G1755/H330I/Y370G/K423N; D95A/G175S/R212D/F302S/Y370G; D95A/G175S/R212D/H330I;
D9SA/G175S/R212D/Y370G/K423N; D95A/1251E/F302S/K423N; D95A/1251E/H3301; D95A/I125E/K423N; D95A/ I251E/Y370G; D95A/R212D/F302; D95A/R212D/I251E/F302S; D95A/S156N/F302S/H330I/K423N;
D95A/S156N/G175S; D95A/S156N/G175S/H330I/Y370G; D95A/S1S6N/G175S/1251E/F302S;
D95A/S156N/I251E/H330I; D95A/S156N/I251E/K423N; D95A/S156N/K423N; D95A/S156N/R212D/I251E;
F302S/H330I/K423N; G175S/F302/Y370G/K423N; G175S/H330I/K423N; G175S/I251E/F302; G175S/R212D/H330I; G1 75S/R212D/K125E/H3301; G175S/R212D/K423N; S175S/R212D/Y370G; G175S/R212D/Y370G/K423N;
5
10
15
20
25
30
35
40
45
50
55
60
65
H3301/Y370G/K423N; 1251E/H330I/Y3700; 1251E/H330I/Y370G; 1251E/Y370G/K423N
R212D/F302S/Y370G/K423N; R212D/H3301/K423N; R212D/1251E/F302S; R212D/1251E/F302S/H330I
R212D/I251E/Y370G; R212D/I251E/Y370G; S156N/F302S/H3301; S156N/F3025/K423N; S156N/F302/Y370G S156N/G175S/F302S/Y370G; S156N/G17SS/I251E/F302S; S156N/G175S/K423N; S156N/G175S/K423N
S156N/GI75S/R212D/F302S/H330I; S156N/1251E/F302S/H3301; S156N/I251E/H330I/Y370G
SI56N/I251E/H330I/Y3700/K423N; S156N/I251E/Y370G; S156N/R212D/F302S/H3301/Y370G
S156N/R212D/K423N; T28S/D95A/G175S/F302; T28S/D95A/G175S/F302S/Y3700; T285/D95A/H3301
T285/D95A/I251E; T28S/D95A/I251E/F302/K423N; T28S/D95A/R212D; T28S/D95A/S156N/H3301/Y370G
T28S/D95A/S156N/R2I2D; T28S/D95A/S156N/R212D; T28S/D95A/S156N/R212D/Y370G; T28S/D95A/Y370G
T28S/D95A/Y3700/K423N; T28S/F302S/K423N; T28S/G175S/H3301; T28S/G175S/H330I/Y3700
T28S/GI75S/I251E/F302; T28S/GI75S/I251E/F3O2S/Y370G; T28S/G175S/I251E/H3301
T28S/G175S/I251E/K423N; T28S/H330I/K423N; T28S/I251E/F302S/H330I/K423N; T2SS/R212D/F302S/H3301 T28S/R212D/H3301; T28S/R212D/I251E/F302; T28S/R212D/I251E/Y370G/K423N; T28S/R212D/Y370G
T28S/S156N/F302S/H3301/Y370G; T28S/S156N/F302S/Y3700; T28S/S156N/F302S/Y370G; T28S/S156N/G175S T28S/S156N/G175S; T28S/S156N/G175S/I251E; T28S/S156N/G175S/I251E/K423N
T28S/S156N/R212D/1251E/H3301; T28S/S156N/R2I2D/I251E/K423N; y T28S/S156N/R212D/K423N.
[0110] Software (por ejemplo, como se describe en las figuras 5-7) se puede utilizar para determinar un total de solo 55 amplicones, que corresponden a fragmentos de variantes de polinucleotido con regiones de secuencia de la superposicion, pueden ser utilizados para montar las 90 variantes de polinucleotidos en una reaccion de Ronda 2 SOE-PCR. El software tambien se puede utilizar para determinar que se necesita un total de solo 22 cebadores de oligonucleotidos en 55 reacciones separadas Ronda 1 de PCR con el polinucleotido de referencia 1,3 kb como molde para generar los necesarios 55 amplicones. Los cebadores de oligonucleotidos 22 son solo 30 o 33 nucleotidos de longitud, e incluyen cebadores mutagenicos que comprenden cambios de nucleotidos en el medio de la secuencia (por ejemplo, en los nucleotidos 15-17).
[0111] Por lo tanto, de acuerdo con los metodos descritos en este documento, la construccion de las 90 diferentes variantes de polinucleotidos requiere sfntesis de solo 22 oligonucleotidos relativamente cortos (30-mer a 33-mer), una primera reaccion de Redonda 1 PCR para crear los 55 amplicones (es decir, la variante de fragmentos de polinucleotido), y una segunda reaccion de la Ronda 2 SOE-PCR en la que los 55 amplicous se agrupan en diversas combinaciones (con cebadores flanqueantes delanteros y traseros) para permitir el montaje de SOE-PCR de las 90 variantes de polinucleotidos. En la preparacion de las reacciones de Ronda 2 de PCR-SOE, cada uno de los 55 amplicones pueden ser reutilizados en promedio 7,8 veces, con ciertos fragmentos utilizados solo una vez o dos veces, y otros utilizados hasta 36 veces.
[0112] El flujo de trabajo de las reacciones Ronda 1 y Ronda 2 y pueden ser controladas por listas de trabajo generadas por software (por ejemplo, como en Figs. 4 y 6) que se utilizan para ejecutar la robotica Tecan para el manejo de lfquidos. Las listas de trabajo de esta construccion de biblioteca ilustrativa llamada 90 variantes para solo 110 operaciones de manejo de lfquidos para las reacciones de Ronda 1 de PCR para generar los 55 amplificones utilizando 22 cebadores, y solo 430 operaciones de manejo de lfquidos para las reacciones de Ronda 2 de ensamblaje SOE-PCR para preparar 90 variantes completas de longitud de polinucleotidos de 55 amplicones.
[0113] La precision de las secuencias de variantes de polinucleotidos proporcionadas por los metodos descritos en el presente documento se puede determinar mediante etapas adicionales de clonacion y secuenciacion de cada una de la pluralidad de construcciones de las reacciones de Ronda 2. Como se ilustra por los Ejemplos (mas abajo), los metodos descritos en el presente documento como resultado sorprendentemente de alto nivel de las secuencias correctas (secuencias perfectas de larga duracion de (FLP))... es decir secuencias que tienen el nucleotido deseadas relativas al polinucleotido de referencia.
[0114] Al menos algunas de las sorprendentes ventajas de los metodos descritos en este documento estan en la mayor precision de las grandes bibliotecas de variantes de polinucleotidos producidos. En algunas realizaciones, los metodos se pueden utilizar para preparar una biblioteca direccionable de al menos 10 variantes de polinucleotidos diferentes, comprendiendo cada una al menos una diferencia en la secuencia definida con respecto a una secuencia de polinucleotidos de referencia, en el que al menos una media de 75% de las secuencias variantes de polinucleotidos son secuencias correctas (por ejemplo, las secuencias que comprenden la secuencia de referencia de longitud completa con las diferencias de nucleotidos definidas introducidas por los cebadores utilizados en el metodo). En algunas realizaciones, los metodos proporcionan una biblioteca direccionable de al menos 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200 o mas diferentes variantes de polinucleotidos, que comprende cada uno al menos una diferencia secuencia definida relativa a una secuencia de polinucleotidos de referencia, donde al menos 75%, 80%, 85%, 90%, 95% o mas de las secuencias variantes de polinucleotidos son correctas, por ejemplo, FLP por analisis de secuencia.
[0115] En ciertas realizaciones, los metodos descritos en el presente documento comprenden una pluralidad de reacciones de Ronda 1 de PCR utilizando una plantilla de polinucleotido de referencia y una pluralidad de Ronda 2 SOE-PCR reacciones de montaje amplicon se puede utilizar para preparar una biblioteca direccionable de 10 o mas variantes de polinucleotidos de referencia de polinucleotido de al menos 500 pb, 750 pb, 1000 pb, 1250 pb, 1500 pb
5
10
15
20
25
30
35
40
45
50
55
60
65
o mas, cada variante que comprende de aproximadamente 1-30, 1-25, 1-20, 1-15, 3-30, 3-20, o 3-15 nucleotidos cambios relativos con el polinucleotido de referencia, en el que las reacciones Ronda 1 de PCR comprenden aproximadamente 6-300, 6-200, 6-100, 6-50, 6-40, 6-30, 6-25, 6-20, 6-15, o tan solo 6-10 cebadores diferentes de oligonucleotidos, y al menos 75%, 80%, 85%, 90%, 95% o mas de las secuencias de variantes de polinucleotido son de longitud perfecta completa.
[0116] En algunas realizaciones, varias permutaciones de fragmentos de polinucleotidos (por ejemplo, seleccionado de una biblioteca direccionable) se puede montar en una biblioteca direccionable de variantes de polinucleotido cada codifica una variante diferente de polipeptido que tiene una diferencia definida de residuos de aminoacido. Cada una de estas variantes de polinucleotidos a continuacion se puede clonar en un sistema de expresion para generar una biblioteca de clones direccionable, cada uno capaz de generar una variante de polipeptido diferente. Esta biblioteca de clones direccionable se puede transformar en celulas (por ejemplo, E. coli), para la traduccion, y de las placas automatizadas y recogiendo de colonias (es decir, transformantes viables). La secuenciacion entonces se puede ganar a cabo para confirmar la combinacion de mutaciones en cada secuencia de variante de polipeptido asf generada. Ensayo (por ejemplo, a traves del examen de alto rendimiento) de las variantes de polipeptidos para los rasgos alterados deseados puede llevarse a cabo en todas las variantes de polipeptidos, u opcionalmente solo en aquellas variantes de polipeptidos confirmadas por secuenciacion que tienen la combinacion deseada de mutaciones.
[0117] Alternativamente, la biblioteca direccionable de la variante de polinucleotido que codifican cada uno un polipeptido de variante diferente que tiene una diferencia de residuos de aminoacidos definida se puede combinar (por ejemplo, agrupado) y se clono en un sistema de expresion, creando de este modo una biblioteca agrupada de clones. Esta biblioteca combinada de los clones puede ser transformada (por ejemplo, en una unica etapa de transformacion) en celulas para la traduccion, enchapada y recogida de colonias (es decir, transformantes viables). Ensayo de las colonias de esta biblioteca agrupada de clones puede llevarse a cabo (por ejemplo, mediante examen de alto rendimiento) antes de la secuenciacion para identificar polinucleotidos que codifican variantes de polipeptidos que tienen los rasgos alterados deseados. Una vez que tal "exito" se identifica por un rasgo alterado, se puede secuenciar para determinar la combinacion especffica de las mutaciones presentes en la secuencia variante de polinucleotido. Opcionalmente, las variantes que codifican polipeptidos que tienen los rasgos no alterados deseados buscados en el ensayo no necesitan ser secuenciados. De acuerdo con ello, la biblioteca combinada de metodo de clones puede dar mas eficiencia requeriendo solo una sola transformacion en lugar de un conjunto de reacciones de transformacion paralelas.
[0118] Analogamente, el metodo puede tambien ser usado para generar varias permutaciones de combinaciones de mutacion para examinar las caracterfsticas estructurales de las protefnas biologicamente importantes. Por ejemplo, receptores implicados en la transduccion de senales de moleculas extracelulares actuan a traves de la interaccion con otros receptores, asf como diversas protefnas intracelulares. Estas interacciones complejas pueden afectar a diferentes procesos de senalizacion celulares del mismo tipo de molecula de receptor. Tanto la senalizacion negativa y positiva puede ser iniciada por el mismo receptor. Un ejemplo especffico es receptores de protefna de acoplamiento G, que interactuan con protefnas, Py Gsa, y Gia. Vease, por ejemplo, las madres et al., 1999, Physiol. Rev. 79:1373-1430. Debido a que las mutaciones en diferentes dominios del receptor pueden tener diferentes efectos, los metodos de la presente memoria proporcionan un procedimiento eficaz para la generacion de diferentes permutaciones de combinaciones de mutaciones que se sabe afectan diferentes aspectos de la funcion del receptor, lo que permite estudios sobre las funciones biologicas y estructurales asociadas de la protefna de interes.
[0119] Si bien los metodos para la generacion de diferentes permutaciones de una secuencia de polinucleotidos se han ilustrado para la generacion de polinucleotidos que codifican varias permutaciones de un polipeptido a partir de un conjunto definido de diferencias de residuos de aminoacidos, es de entenderse que los metodos pueden adaptarse generalmente para generar permutaciones de secuencias de polinucleotidos. Por ejemplo, los metodos de este documento pueden usarse para generar diferentes permutaciones de polinucleotidos funcionales, tales como los genes de ARNs ribosomales. Varios ARNs forman complejos de nucleoprotefna que participan en la sfntesis de protefnas en procariotas y eucariotas. Muchos antibioticos funcionan mediante la interrupcion de la funcion de ribosoma y se sabe que interactuan con regiones definidas de ARNs determinadas. Varias mutaciones se han identificado que afectan a la sfntesis de protefnas y estas regiones se correlaciona con los sitios de interaccion con antibioticos. Vease, por ejemplo, Yassin et al., 2005, Proc Natl Acad Sci. EE.UU. 102(46):16620-16625.
[0120] Utilizando los metodos descritos en el presente documento, varias permutaciones de mutaciones conocidas que afectan a la funcion del ARN ribosomal pueden ser sintetizados y los efectos de cierta combinacion de mutacion examinada. Otras aplicaciones seran evidentes para el experto en la materia.
5. EJEMPLOS
Ejemplo 1: Preparacion de amplicones
[0121] Preparacion de oligonucleotidos. Cebadores de oligonucleotidos a una concentracion 200uM se diluyen a 4uM con agua esteril en una placa Axygen HalfDeep 96 (1,1 ml). Para la mayorfa de las posiciones en la placa de
5
10
15
20
25
30
35
40
45
50
55
60
65
microtitulacion, la adicion de 10 pi de oligo a 490 pi dh^O sera suficiente. Para los puestos de A01 y D01 en la placa de oligonucleotido, los cebadores comunes delanteros y traseros, un mayor volumen puede ser necesario. Los volumenes maximos de aspiracion en el informe de salida en la seccion de volumenes aspiradas y dispensadas se verifica antes de la siguiente etapa.
[0122] Ronda 1 - Formacion de Amplicones por PCR. Tecan robotico se utilizan para alfcuota de 5 pL de cada cabador delantero y trasero de oligonucleotido en placas BioRad HardShellPCR96 (salida del script Tecan) y anadir 40 pL de la mezcla maestra. Realizar la Ronda 1 PCR y verificar la amplificacion utilizando un 2% de 96 pocillos e gel. Reactivo para la PCR es el siguiente: 5 pL 10x tampon Herculase, 1 pL 40 mM dNTPs, 1 pL AL de 100 ng/pL de plantilla de SOE, 2,5 unidades de la polimerasa de Herculasa (Stratagene, LaJolla, CA, EE.UU.). PCR se lleva a cabo de la siguiente manera: 2 min de desnaturalizacion a 95 ° C seguido de un ciclo a 95 ° C durante 30 s, 56 ° C durante 30 s, 72 ° C durante 1 min/Kb. El numero de ciclos es 17.
[0123] Tratamiento con ExoSAP-it. Para la Ronda 1 de PCR, 25 pl del producto de reaccion se transfiere a una placa fresca 96, y 2 pl ExoSAP-It (USB Corp., Ohio, EE.UU.) mas 0,5 pl Dpnl se anade y el ciclaje se lleva a cabo (transferencia manual de 37 ° C 1 hora 80 ° C 15 mm). Las muestras se diluyeron a un volumen final de 100 pl por la adicion de 73 pl dH2O y se agruparon en otra placa BioRad HardShellPCR96 PCR utilizando una secuencia de comandos Tecan.
Ejemplo 2: Montaje de amplicones y analisis de los productos
[0124] Ronda 2 - Asamblea y SOE-PCR La robotica Tecan se utiliza para alicuotar un conjunto de fragmentos de 15 pl (es decir, amplicones de Ronda 1) en placas BioRad HardShellPCR96 (secuencia de comandos Tecan) y anadir 35 pl de mezcla maestra (5 pl de 10X Tampon de Herculasa, 1 pl de 40 mM dNTPs, 0,2 pl de cebadores directos, 0,2 pl de cebadores delanteros, 2,5 unidades de enzima de Herculasa y 28.1 pl dH2O. La realizacion de PCR y verificar la amplificacion usando un e-gel de 2% 96. PCR se lleva a cabo como sigue: 2 mm de desnaturalizacion a 95 ° C despues de un ciclo a 95 ° C durante 30 s, 56 ° C durante 30 s, 72 ° C durante 1 min / Kb El numero de ciclos es 17.
[0125] Purificacion de placa de 96 pocillos. La purificacion de todas las muestras usando Zymo ZR-96 PCR limpian placas de 96 pocillos (protocolo del fabricante con las siguientes modificaciones) (Investigacion Zymo, CA, EE.UU.). La realizacion de todos los pasos de centrifugacion a 2800 rpm durante 10 minutos. Para eluir el ADN, se aplican 25 pl dH2O de temperatura de 55 ° C directamente a la membrana de sflice, centrifugado durante 10 minutos y derogacion. Usando este metodo 48-50 pl de producto se recupera.
[0126] Enzima de digestion de restriccion Bg1I. Transferencia 30 pl. de cada insercion purificada es una placa de PCR medio skirt fresca, anadir 20 pl de BglI maestro de mezcla de digestion (5 pl 10X Tampon NEB 3, 20 unidades de BglI (New England Biolabs, mA, EE.UU), que 13uL dH2O) a todas las muestras e incubar a 37 ° C durante 4 horas. La digestion Bgl es para la clonacion en BglI sitio de un vector de expresion.
[0127] Purificacion de 96 pocillos. Purificar todas las muestras usando Zymo ZR-96 PCR limpiar placas de 96 pocillos (protocolo del fabricante con las siguientes modificaciones). Realizar todos los pasos de centrifugacion a 2800 rpm durante 10 minutos. Para eluir el ADN, aplique 25 pl H2O destilada a la temperatura de 55 ° C directamente a la membrana de sflice, giro de 10 mm, y repetir. Usando este metodo, se recupera 48 50 pl de producto. Verificar la recuperacion de producto usando un gel e de 2% de 96.
[0128] Ligaduras a vector de expresion. Transferencia 3 pl de cada insercion purificada a una placa fresca y anadir 27 pl de mezcla maestra de la ligadura de las muestras. Se incubaron durante 14 horas a 16 ° C seguido de 15 minutos en 65 ° C, seguido de retencion 8 ° C. Mezcla de ligadura: 3 pl 10X Tampon de Ligasa (New England Biolabs, MA, EE.UU.), I pl BglI vector digerido (50 ng/pl), 400 unidades de ligasa t4 (New England Biolabs, MA, EE.UU.), 22 pl dH2O.
[0129] Transformacion-HTP. Transferencia 2uL de cada reaccion de ligacion a 20uL de celulas qufmicamente competentes TSS e incubar en hielo en un bloque de metal durante al menos 15 mm. choque termico a 42 ° C durante 35 segundos y volver al bloque de metal de 2 min. Anadir 80 pl de 37 ° C medios SOC a cada muestra. Incubar a 37 ° C durante 1 hora antes del enchapado.
[0130] Enchapado: Enchapar la mezcla de transformacion de 48 bandejas Q bien divididas utilizando el Tecan. Dispensar tres 5 mm grano a cada pocillo de la bandeja Q usando un dispensador de cuentas. Utilice la dispensa Tecan para 40 pl por pocillo de mezcla de transformacion. Cultiva los transformantes durante la noche a 37 ° C.
[0131] Recoleccion y el cultivo para placas de secuencia verificada, solicitar dos colonias por bandeja Q bien recogidas a dos placas de fondo plano Nunc separadas que contienen LB, CAM, y 1% de glucosa. Para placas variantes no secuencia verificadas, solicitan que tres colonias por bandeja Q se recogeran por separado a tres placas de fondo plano Nunc que contienen LB, CAM, y 1% de glucosa.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0132] PCR de colonias Para llevar a cabo la PCR de colonias en una de las dos placas maestras replicadas, anadir 2uL de cultivo a la colonia estandar de PCR Master Mix y llevar a cabo la PCR de colonias. ExoSAP se utiliza para limpiar el producto del PCT de la siguiente manera: Transferencia 5 pl de la muestra de PCR a una nueva placa de PCR que contiene 2 pl ExoSap-it. Incubar a 37 ° C durante 15 min y 80 ° C por 15 min. Diluir las muestras a un volumen final de 40 pl mediante la adicion de 33 pl de dhhO.
[0133] Secuenciacion de productos PCR Anadir 4 pl del cebador de secuenciacion 1mM a la placa de secuenciacion. Anadir 4 pl de limpiado de muestra de PCR.
Ejemplo 3: Generacion de un conjunto de 190 variantes de polinucleotido diferentes cada una codificando de un polipeptido que tiene un solo cambio de aminoacido con relacion a un polipeptido de referencia
[0134] Diseno experimental: Se selecciono un polinucleotido de referencia de 1.359 pb (que codifica una enzima de 453 aminoacidos). Un total de 190 diferencias de aminoacidos de restos de acido a partir de la secuencia de referencia fueron seleccionados en base a la secuencia de cambios observados en las enzimas homologas. Las 190 variantes se hicieron como polinucleotidos individuales que codifican las 190 protefnas diferentes que se expresan y se ensayaron. Cada una de las 190 variantes de polinucleotidos se ensamblo mediante la combinacion de dos amplicones que comprenden el cambio de codon unico deseado en su zona de solapamiento (como se preparo en Ronda I a continuacion) en una reaccion de SOE (Ronda 2 a continuacion).
[0135] Preparacion de oligonucleotidos: Un total de 382 cebadores de oligonucleotidos para la PCR se disenaron y se sintetiza de acuerdo con metodos estandar. Los oligonucleotidos fueron generalmente 31 nucleotidos (nt) de longitud con el cambio deseado para el codon de interes situado en el centro (- base 15) del cebador de oligonucleotido. Todos los oligonucleotidos se diluyeron a 4 pm con agua esteril en una placa Axygen HalfDeep 96 (1,1 ml).
[0136] Ronda 1 - Formacion de Amplicaones por PCR: Cada amplicon, correspondiente a un fragmento de variante de polinucleotidos, se genero en una reaccion PCR utilizando un vector que comprende 1359 nt de polinucleotidos de referencia como molde y utilizando un cebador mutagenico en combinacion con un comun cebador flanqueante (recocido al vector de aguas arriba o aguas abajo del gen que no contiene la mutacion). Reaccion de flujo de trabajo, las condiciones y la limpieza eran como se describe en el Ejemplo 1.
[0137] Ronda 2 - Amplicones de Ensamblaje. Amplicones purificados a partir de Ronda I se agruparon de tal manera que 2 amplicones con regiones superpuestas que comprende el cambio de la secuencia de codones deseada para cada una de las 190 variantes de polinucleotidos y cada grupo se dividio en alfcuotas en el pocillo de una placa de 96 pocillos como se describe en los Ejemplos 1 y 2. Cebadores flanqueantes comunes delanteros y traseros se anadieron a cada conjunto y PCR se llevo a cabo como se describe en el Ejemplo 2 que resulta en el montaje de los amplicones (i.e., fragmentos de polinucleotidos) para formar la variante de polinucleotido de longitud completa. Inspeccion de las reacciones de ensamblaje se realizo en un gel de agarosa y se encontro que contienen el producto del tamano esperado. (Ver por ejemplo, Fig. 3.)
[0138] Analisis de Seguencia de Variantes de Polinucleotidos. Despues de la purificacion mediante Xymo ZR- 96PCR limpiar, los productos se clonaron en un vector de expresion, y cada ligacion se transformo en celulas huesped de E. coli. Dos colonias de cada transformacion se recogieron y se preparo ADN plasmfdica para la secuenciacion de ADN. Una muestra de cada transformacion se secuencio usando cebadores de secuenciacion internos para y flanqueando el gen. De las 190 variantes de polinucleotidos, 160 (84%) mostraron tener secuencia de longitud perfecta completa (FLP) con los cambios de secuencia de codones deseados. Al secuenciar la segunda preparacion de plasmido de las 30 variantes que eran incorrectas, se identificaron 25 secuencias correctas adicionales. Con ello, el porcentaje de exito global de las secuencias correctas 97%. (185 de los 190 polinucleotidos deseados se identificaron). Los polinucleotidos se expresaron y se ensayaron los variantes de polipeptidos.
Ejemplo 4: Generacion de un conjunto de 96 diferentes variantes de polinucleotidos que codifican cada uno un polipeptido, teniendo cambio de uno de tres aminoacidos en relacion a un polipeptido de referencia.
[0139] Diseno Experimental: Se selecciono un polinucleotido de referencia de 1359 nt. 96 variantes se disenaron, que contienen cada uno tres mutaciones relativas con la secuencia de referencia. Las 96 variantes se hicieron como polinucleotidos individuales de cada uno de codificacion de 96 protefnas diferentes que se expresaron y se ensayaron. Cada una de las variantes de polinucleotidos 96 se ensamblo mediante la combinacion de cuatro amplicones que comprende los cambios de codon deseados en su zona de solapamiento (como se preparo en Ronda 1 a continuacion) en una reaccion de SOE (Ronda 2 a continuacion).
[0140] Preparacion de Oligonucleotido: Un total de 130 cebadores de oligonucleotidos fueron disenados y sintetizados de acuerdo con metodos estandar. Los oligonucleotidos fueron generalmente 31 nt de longitud con el cambio deseado para el codon de interes en el medio (- base 15) del oligonucleotido. Todos los oligonucleotidos se diluyeron a 4pM con agua esteril en una placa Axygen HalfDeep 96 (1.1ml).
5
10
15
20
25
30
35
40
45
50
55
60
65
[0141] Ronda 1 - Formacion de los Amplicones por PCR: Cada amplicon, correspondiente a un fragmento de variante de polinucleotido, se genero en una reaccion PCR utilizando un vector que comprende 1359 nt referencian polinucleotido como molde y utilizando un cebador mutagenico en combinacion con otro cebador mutagenico o un cebador flanqueante comun (recocido al vector de aguas arriba o aguas abajo del gen que no contiene la mutacion). Reaccion de flujo de trabajo, las condiciones y la limpieza eran como se describe en Ejemplo 1.
[0142] Ronda 2 - Amplicones de Ensamblaje. Amplicones purificados de Ronda 1 se agruparon de tal manera que 4 amplicones con regiones superpuestas que comprende la secuencia de codones deseada cambia para cada una de las variantes de polinucleotidos 96 y cada grupo se dividio se alfcuotaron en el pocillo de una placa de 96 pocillos como se describe en Ejemplos 1 y 2. Cebadores comunes de flanqueo delanteros y traseros se anadieron a cada conjunto y PCR se llevo a cabo como se describe en el Ejemplo 2 que resulta en el montaje de los amplicones (es decir, fragmentos de polinucleotidos) para formar la variante de polinucleotido de longitud completa. Inspeccion de las reacciones de ensamblaje se realizo en un gel de agarosa y se encontro que contienen el producto del tamano esperado. (Vease, por ejemplo, Fig. 3.)
[0143] Analisis de secuencias de producto de Polinucleotido. Despues de la purificacion mediante PCR Xymo ZR-96 limpiar, los productos se clonaron en un vector de expresion, y cada ligacion se transformo en celulas huesped de E. coli. Dos colonias de cada transformacion se recogieron y se preparo ADN plasmfdica para la secuenciacion de ADN. Una muestra de cada transformacion se secuencio usando cebadores de secuenciacion interna para y flanquear el gen. De las variantes de polinucleotidos 96, 82 (85%) fueron determinadas a tener solo la secuencia correcta de FLP con los cambios deseados.
Ejemplo 5: Generacion de un conjunto de 96 variantes diferentes de polinucleotidos cada una codificando de un polipeptido que tiene de uno a seis cambios de aminoacidos con relacion a un polipeptido de referencia.
[0144] Diseno experimental: Se selecciono una referencia de polinucleotidos de 1,056 nt. 96 variantes se disenaron, cada uno que contiene de uno (1) a seis (6) mutaciones de la secuencia de referencia. Las 96 variantes se hicieron como polinucleotidos individuales cada una codificando una de las 96 protefnas diferentes que se expresa y se ensayaron. Cada una de las variantes de polinucleotidos 96 se ensamblo mediante la combinacion de dos (por ejemplo, para la variante que codifica un unico cambio de aminoacido) a siete (por ejemplo, para la variante de codificacion de seis cambios de aminoacido) amplicones que comprenden los cambios de codon deseados en su zona de solapamiento (como se preparo en Ronda 1 a continuacion) en una reaccion de SOE (Ronda 2 a continuacion).
[0145] Preparacion de olionucleotido: Un total de 108 cebadores de oligonucleotidos fueron disenados y sintetiza de acuerdo con metodos estandar. Los oligonucleotidos fueron generalmente 31 nt de longitud con el cambio deseado para el codon de interes en el medio (- base 15) del oligonucleotido. Si dos cambios de aminoacidos estaban muy juntos, un oligo mas largo se diseno para codificar para que los cambios se introduzcan. Todos los oligonucleotidos se diluyeron a 4pM con agua esteril en una placa de Axygen HalfDeep 96 (1,1 ml).
[0146] Ronda 1 - Formacion de los amplificones por PCR: Cada amplicon, correspondiente a un fragmento de variante de polinucleotido, se genero en una reaccion PCR utilizando un vector que comprende 1056 nt de referencia de polinucleotido como molde y utilizando un cebador mutagenico en combinacion con otro cebador mutagenico o un flanqueo comun cebador (hibridacion al vector de aguas arriba o aguas abajo del gen que no contiene la mutacion). flujo de trabajo de reaccion, condiciones y limpieza fueron como se describe en el Ejemplo 1.
[0147] Ronda 2 - Asamblea de Amplicones. Amplicones purificados agrupados (a partir de 2 a 7 amplicones/polinucleotidos) se dividen en partes alfcuotas en placas como se describe en el Ejemplo 1. Cebadores delanteros y traseros comunes flanqueados se anadieron y la PCR se llevo a cabo como se describe en el Ejemplo 1.
[0148] Analisis de Secuencia de Producto de Polinucleotido. Despues de la purificacion mediante Xymo ZR-96 PCR limpiar, los productos se clonaron en un vector de expresion, y cada ligacion se transformo en celulas huesped de E. coli. Dos colonias de cada transformacion se recogieron y se preparo ADN plasmfdica para la secuenciacion de ADN. Una muestra de cada transformacion se secuencio usando cebadores de secuenciacion internos para y que flanquean el gen. Como se muestra en la Tabla 1 (a continuacion), de las variantes de polinucleotidos 96, 72 (75%) mostraron tener solo la secuencia correcta FLP con cambios deseados de 2-7 codones.
10
15
Tabla 1: 96 Variantes Construidas - 88 variantes requeridas para hacer la placa final
Conjunto de secuenciacion
1(n = 96) 2(n = 96) 3(n = 16
Total correcto
72 84 92
Secuencias fallidas
5 3 2
Contaminacion cruzada
5 2 0
Mutacion de codificacion
8 2 0
Indeles
6 4 2

Claims (12)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    Reivindicaciones
    1. Un procedimiento de sfntesis de una pluralidad de variantes de polinucleotido teniendo cada uno al menos una diferencia de un nucleotido definido con respecto a una secuencia de polinucleotido de referencia, comprendiendo el metodo:
    (a) amplificar por separado una plantilla de polinucleotido de referencia con cada uno de una pluralidad de pares de cebadores delanteros y traseros, en el que la pluralidad de pares de cebadores delanteros y traseros comprende la pluralidad de diferencias de nucleotidos definidas y en las que cada par genera un amplicon que comprende una secuencia capaz de unirse a una secuencia de solapamiento adyacente de al menos otro amplicon, generando de ese modo una biblioteca direccionable de amplicones en los que:
    (i) la biblioteca de amplicones comprende miembros para el montaje de dos o mas diferentes variantes de polinucleotido que comprende diferencias definidas de nucleotidos con respecto a una secuencia de polinucleotido de referencia; y
    (ii) los miembros de la biblioteca estan dispuestos en lugares posicionalmente distintos sobre un sustrato;
    (b) ensamblar por separado una pluralidad de conjuntos de amplicones, en los que cada conjunto comprende amplicones que tienen secuencias adyacentes superpuestas capaces de unirse para formar la longitud completa de la secuencia de polinucleotidos de referencia;
    (c) la replicacion de la pluralidad de conjuntos de amplicones reunidos, generando de ese modo una biblioteca de variantes de polinucleotidos direccionables en los que los miembros de la biblioteca estan dispuestos en ubicaciones posicionalmente distintas en un sustrato.
  2. 2. El metodo de la reclamacion 1, en la que el polinucleotido de referencia codifica un polipeptido de referencia y cada uno de la pluralidad de variantes de polinucleotido codifica un polipeptido que tiene al menos una diferencia de secuencia de aminoacido.
  3. 3. El metodo de la reclamacion 2, en la que el metodo comprende ademas la etapa de clonacion de cada una de la pluralidad de variantes de polinucleotido en un vector de expresion.
  4. 4. El metodo de la reclamacion 3, en la que el metodo comprende ademas la transformacion de celulas con los vectores de expresion.
  5. 5. El metodo de la reclamacion 4, en la que el metodo comprende ademas la deteccion de las celulas transformadas para la actividad de los polipeptidos codificados por las variantes de polinucleotidos.
  6. 6. El metodo de la reclamacion 5, en la que el metodo comprende ademas el aislamiento de al menos un polipeptido codificado por las variantes de polinucleotidos.
  7. 7. El metodo de la reclamacion 1, en la que:
    (i) la pluralidad de variantes de polinucleotidos comprende al menos 10 variantes de polinucleotidos diferentes, o la pluralidad de variantes de polinucleotidos comprende al menos 40 variantes de polinucleotidos diferentes;
    (ii) cada una de la pluralidad de variantes de polinucleotidos comprende al menos 3 diferencias de nucleotidos definidos en relacion con la secuencia de referencia de polinucleotido;
    (iii) al menos una de la pluralidad de variantes de polinucleotidos comprende al menos 5, 6, 9, 12, 15, 18, 21, 24, 27 o 30 diferencias de nucleotidos definidos en relacion con la secuencia de polinucleotidos de referencia;
    (iv) al menos una de la pluralidad de conjuntos de amplicones comprende al menos 3 amplicones diferentes, o al menos uno de la pluralidad de conjuntos de amplicones comprende al menos 5 diferentes amplicones;
    (v) al menos uno de la pluralidad de conjuntos de amplicones comprende un polinucleotido puente que comprende ninguna diferencia de nucleotidos con respecto a la secuencia de polinucleotidos de referencia;
    (vi) las longitudes de los cebadores delanteros y traseros son de aproximadamente 20 a 50 nucleotidos, o las longitudes de los cebadores delanteros y traseros son de aproximadamente 25 a 35 nucleotidos;
    (vii) la longitud de la secuencia de polinucleotidos de referencia es de al menos 500 pb, 750 pb, 1000 pb, 1250 bp, o la longitud de la secuencia de polinucleotidos de referencia es de al menos 1500 pb; y/o
    (viii) la pluralidad de pares de cebadores delanteros y traseros comprende de aproximadamente 6 a 50 oligonucleotidos diferentes, o la pluralidad de pares de cebadores delanteros y traseros comprende de aproximadamente 6 a 25 oligonucleotidos diferentes.
  8. 8. El metodo de la reclamacion 1, en la que las secuencias de la pluralidad de secuencias de cebadores delanteros y traseros son generadas por:
    5
    10
    15
    20
    25
    30
    35
    40
    45
    (i) la identificacion de una primera diferencia definida en la secuencia de variante de polinucleotido en comparacion con la secuencia de referencia y la determinacion de la proximidad de un vecino mas cercano define diferencia en la secuencia de polinucleotido;
    (ii) la seleccion de un cebador delantero que tiene una secuencia que comprende la primera diferencia de nucleotidos definida, y, opcionalmente, incluyendo cualquier diferencia definida de vecino mas cercano en el mismo cebador delantero si la proximidad de la primera diferencia definida de nucleotidos;
    (iii) la identificacion de una proxima diferencia definida en la secuencia de variante de polinucleotido en comparacion con la secuencia de referencia, y la determinacion de la proximidad de una diferencia definida de vecino mas proxima en la secuencia de polinucleotidos, o la identificacion de que el final de la variante de polinucleotido se ha alcanzado;
    (iv) la seleccion de un cebador trasero que tiene una secuencia que comprende la siguiente diferencia de nucleotidos definida, y, opcionalmente, incluyendo cualquier diferencia de vecino mas cercana definida en el mismo cebador trasero si la proximidad de la siguiente diferencia de nucleotidos definida; y
    (v) repetir las etapas (iii) a (iv) para cada diferencia definida en la secuencia de variante de polinucleotido tal que toda diferencia definida esta presente en los cebadores.
  9. 9. El metodo de la reclamacion 8, en la que el metodo comprende ademas la seleccion de cebadores de oligonucleotidos delanteros y traseros no mutagenicos para segmentos de polinucleotido no definidos por cebadores delanteros y traseros de (ii) y (iv).
  10. 10. El metodo de la reclamacion 1, en la que la amplificacion y replicacion es por reaccion en cadena de polimerasa.
  11. 11. Una biblioteca direccionable de amplicones que comprenden una pluralidad de amplicones, en el que cada miembro de la biblioteca de los amplicones comprende al menos una diferencia de nucleotidos definida en relacion con una secuencia de polinucleotidos de referencia y una region adyacente superpuesta capaz de unirse a la region adyacente superpuestas de al menos otro amplicon en la biblioteca, en el que la pluralidad de amplicones comprende una pluralidad de conjuntos de amplicones capaz de unirse para formar la longitud completa de la secuencia de polinucleotidos de referencia, en la que la pluralidad de amplicones comprende miembros para el montaje de dos o mas diferentes variantes de polinucleotidos de longitud completa comprende diferencias de nucleotidos definidas en relacion con la secuencia de polinucleotidos de referencia, en donde:
    (i) al menos uno de la pluralidad de conjuntos de amplicones comprende miembros para el montaje de una variante de polinucleotido que comprende al menos 5 diferencias de nucleotidos definidas relativas a la secuencia de polinucleotidos de referencia;
    (ii) al menos uno de la pluralidad de conjuntos de amplicones comprende al menos 3 diferentes amplicones; o
    (iii) la longitud de la secuencia de polinucleotidos de referencia es de al menos 500bp, y en el que los miembros de la biblioteca estan dispuestos en ubicaciones posicionalmente distintas en un sustrato.
  12. 12. La biblioteca de la reclamacion 11 direccionable, en la que la secuencia de polinucleotido de referencia codifica un polipeptido de referencia y la pluralidad de amplicones comprende miembros suficientes para el montaje de todas las diferencias posibles de nucleotidos que codifica una pluralidad seleccionada de las diferencias de residuo de aminoacidos.
ES09763625.2T 2008-06-13 2009-06-11 Método de síntesis de variantes de polinucleótidos Active ES2575005T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6158108P 2008-06-13 2008-06-13
US61581P 2008-06-13
PCT/US2009/047046 WO2009152336A1 (en) 2008-06-13 2009-06-11 Method of synthesizing polynucleotide variants

Publications (1)

Publication Number Publication Date
ES2575005T3 true ES2575005T3 (es) 2016-06-23

Family

ID=41415347

Family Applications (2)

Application Number Title Priority Date Filing Date
ES15199731T Active ES2705694T3 (es) 2008-06-13 2009-06-11 Método de síntesis de variantes de polinucleótidos
ES09763625.2T Active ES2575005T3 (es) 2008-06-13 2009-06-11 Método de síntesis de variantes de polinucleótidos

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES15199731T Active ES2705694T3 (es) 2008-06-13 2009-06-11 Método de síntesis de variantes de polinucleótidos

Country Status (7)

Country Link
EP (2) EP2285958B1 (es)
CN (1) CN102066561B (es)
CA (1) CA2726850C (es)
DK (2) DK3023494T3 (es)
ES (2) ES2705694T3 (es)
HU (2) HUE029228T2 (es)
WO (1) WO2009152336A1 (es)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090312196A1 (en) * 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
EP2443139B1 (en) 2009-06-16 2016-08-10 Codexis, Inc. Beta-glucosidase variant enzymes and related polynucleotides
US20110294170A1 (en) 2010-05-28 2011-12-01 Codexis, Inc. Pentose Fermentation By a Recombinant Microorganism
CA2804019A1 (en) 2010-06-28 2012-01-12 Codexis, Inc. Fatty alcohol forming acyl reductases (fars) and methods of use thereof
WO2012024662A2 (en) 2010-08-20 2012-02-23 Codexis, Inc. Expression constructs comprising fungal promoters
US9493802B2 (en) 2010-08-20 2016-11-15 Codexis, Inc. Use of glycohydrolase 61 protein variants with improved thermostability for processing cellulose
EP2691517A4 (en) 2011-03-30 2015-04-22 Codexis Inc FERMENTATION OF PENTOSES BY A RECOMBINANT MICROORGANISM
US8778652B2 (en) 2011-06-30 2014-07-15 Codexis, Inc. Pentose fermentation by a recombinant microorganism
BR112014004171A2 (pt) 2011-08-22 2018-11-06 Codexis Inc variantes da proteína glicósideo hidrolase gh61 e cofatores que aumentam a atividade de gh61
WO2013048661A1 (en) 2011-09-30 2013-04-04 Codexis, Inc. Fungal proteases
US9611462B2 (en) 2011-12-20 2017-04-04 Codexis, Inc. Endoglucanase 1B (EG1B) variants
WO2013134341A1 (en) 2012-03-07 2013-09-12 Dow Agrosciences Llc Primer designing pipeline for targeted sequencing
BR112014031024A2 (pt) 2012-06-11 2017-06-27 Codexis Inc xilanases e xilosidases fúngicas.
AU2013348272A1 (en) 2012-11-20 2015-05-14 Shell Internationale Research Maatschappij B.V. Pentose fermentation by a recombinant microorganism
KR102218930B1 (ko) 2013-04-18 2021-02-23 코덱시스, 인코포레이티드 조작된 페닐알라닌 암모니아 리아제 폴리펩티드
WO2015048572A1 (en) 2013-09-27 2015-04-02 Codexis, Inc. Automated screening of enzyme variants
WO2015073555A1 (en) 2013-11-13 2015-05-21 Codexis, Inc. Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
US9605252B2 (en) 2014-04-16 2017-03-28 Codexis, Inc. Engineered tyrosine ammonia lyase
DK3167052T3 (da) 2014-07-09 2020-02-10 Codexis Inc P450-bm3-varianter med forbedret aktivitet
WO2016085916A1 (en) 2014-11-25 2016-06-02 Codexis, Inc. Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
LT3237621T (lt) 2014-12-22 2023-09-25 Codexis, Inc. Žmogaus alfa-galaktozidazės variantai
US10696953B2 (en) 2015-02-10 2020-06-30 Codexis, Inc. Ketoreductase polypeptides for the synthesis of chiral compounds
KR102604503B1 (ko) 2015-05-07 2023-11-20 코덱시스, 인코포레이티드 페니실린-g 아실라아제
CN108271374B (zh) 2015-07-07 2021-09-21 科德克希思公司 具有改进的活性的新颖p450-bm3变体
EP3452587B1 (en) 2016-05-05 2021-09-08 Codexis, Inc. Penicillin-g acylases
US10184117B2 (en) 2016-06-09 2019-01-22 Codexis, Inc. Biocatalysts and methods for hydroxylation of chemical compounds
KR20190018512A (ko) 2016-06-15 2019-02-22 코덱시스, 인코포레이티드 조작된 베타-글루코시다아제 및 글루코실화 방법
CN109863162B (zh) 2016-08-26 2023-03-17 科德克希思公司 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CA3048475A1 (en) 2017-01-05 2018-07-12 Codexis, Inc. Penicillin-g acylases
EP3577229A4 (en) 2017-02-03 2020-12-23 Codexis, Inc. MANIPULATED GLYCOSYL TRANSFERASES AND METHOD FOR STEVIOL GLYCOSIDE GLUCOSYLATION
NZ755628A (en) 2017-02-13 2023-09-29 Codexis Inc Engineered phenylalanine ammonia lyase polypeptides
JP7045725B2 (ja) 2017-04-27 2022-04-01 コデクシス, インコーポレイテッド ケトレダクターゼポリペプチドおよびポリヌクレオチド
CA3062550A1 (en) 2017-05-08 2018-11-15 Codexis, Inc. Engineered ligase variants
JP7122009B2 (ja) 2017-06-14 2022-08-19 コデクシス, インコーポレイテッド 産業上の生体触媒作用のための操作されたトランスアミナーゼポリペプチド
US11643642B2 (en) 2017-06-27 2023-05-09 Codexis, Inc. Penicillin-g acylases
KR20200023455A (ko) 2017-06-30 2020-03-04 코덱시스, 인코포레이티드 T7 rna 폴리머라제 변이체
CA3066767A1 (en) 2017-06-30 2019-01-03 Codexis, Inc. T7 rna polymerase variants
CN111511389A (zh) 2017-11-07 2020-08-07 科德克希思公司 转谷氨酰胺酶变体
US11015180B2 (en) 2017-12-13 2021-05-25 Codexis, Inc. Carboxyesterase polypeptides for amide coupling
WO2019126211A1 (en) * 2017-12-20 2019-06-27 Basf Se Gene site saturation mutagenesis (gssm) method
WO2019241132A1 (en) 2018-06-12 2019-12-19 Codexis, Inc. Engineered tyrosine ammonia lyase
KR20210031933A (ko) 2018-07-09 2021-03-23 코덱시스, 인코포레이티드 조작된 포스포펜토뮤타제 변이체 효소
JP2021530216A (ja) 2018-07-09 2021-11-11 コデクシス, インコーポレイテッド 操作されたパントテン酸キナーゼ改変体酵素
SG11202012138XA (en) 2018-07-09 2021-01-28 Codexis Inc Engineered galactose oxidase variant enzymes
WO2020014048A1 (en) 2018-07-09 2020-01-16 Codexis, Inc. Engineered deoxyribose-phosphate aldolases
CA3103718A1 (en) 2018-07-09 2020-01-16 Codexis, Inc. Engineered purine nucleoside phosphorylase variant enzymes
CA3105916A1 (en) 2018-07-12 2020-01-16 Codexis, Inc. Engineered phenylalanine ammonia lyase polypeptides
KR20210040408A (ko) 2018-07-30 2021-04-13 코덱시스, 인코포레이티드 조작된 글리코실트랜스퍼라제 및 스테비올 글리코시드 글루코실화 방법
BR112021008186A2 (pt) 2018-10-29 2021-08-17 Codexis, Inc. dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase.
SG11202105668PA (en) 2018-12-14 2021-06-29 Codexis Inc Engineered tyrosine ammonia lyase
US11427813B2 (en) 2018-12-20 2022-08-30 Codexis, Inc. Human alpha-galactosidase variants
EP4077727A1 (en) 2019-12-18 2022-10-26 Basf Se Nucleic acid analysis methods and apparatus
JP2023521772A (ja) 2020-04-10 2023-05-25 コデクシス, インコーポレイテッド 操作されたトランスアミナーゼポリペプチド
EP4204552A1 (en) 2020-08-28 2023-07-05 Codexis, Inc. Engineered amylase variants
JP2023539632A (ja) 2020-08-28 2023-09-15 コデクシス, インコーポレイテッド 操作されたプロテアーゼバリアント
US11898174B2 (en) 2020-12-18 2024-02-13 Codexis, Inc. Engineered uridine phosphorylase variant enzymes
US11913036B2 (en) 2021-04-02 2024-02-27 Codexis, Inc. Engineered acetate kinase variant enzymes
CN117120600A (zh) 2021-04-02 2023-11-24 科德克希思公司 工程化腺苷酸激酶变体酶
CA3214975A1 (en) 2021-04-02 2022-10-06 Codexis, Inc. Engineered cyclic gmp-amp synthase (cgas) variant enzymes
IL305922A (en) 2021-04-02 2023-11-01 Codexis Inc Transgenic enzymes of variant guanylate kinase
WO2024040020A1 (en) 2022-08-15 2024-02-22 Absci Corporation Quantitative affinity activity specific cell enrichment

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK51092D0 (da) 1991-05-24 1992-04-15 Ole Buchardt Oligonucleotid-analoge betegnet pna, monomere synthoner og fremgangsmaade til fremstilling deraf samt anvendelser deraf
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5696253A (en) 1994-06-30 1997-12-09 The Regents Of The University Of California Polynucleoside chain with 3'→5' guanidyl linkages
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
US6153410A (en) * 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
CA2318880C (en) * 1998-02-04 2010-07-27 Perkin-Elmer Corporation Determination of a genotype of an amplification product at multiple allelic sites
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6639059B1 (en) 1999-03-24 2003-10-28 Exiqon A/S Synthesis of [2.2.1]bicyclo nucleosides
AU3041701A (en) 1999-12-23 2001-07-09 Exiqon A/S Therapeutic uses of lna-modified oligonucleotides
AU2788101A (en) * 2000-01-11 2001-07-24 Maxygen, Inc. Integrated systems and methods for diversity generation and screening
AU4964101A (en) 2000-03-30 2001-10-15 Maxygen Inc In silico cross-over site selection
EP1287123B1 (en) 2000-04-03 2011-03-02 Maxygen, Inc. Subtilisin variant
FR2810339B1 (fr) * 2000-06-14 2004-12-10 Hoechst Marion Roussel Inc Banques combinatoires ameliorees par recombinaison dans la levure et procede d'analyse
US6998484B2 (en) 2000-10-04 2006-02-14 Santaris Pharma A/S Synthesis of purine locked nucleic acid analogues
JP4858932B2 (ja) * 2002-03-19 2012-01-18 株式会社 東北テクノアーチ 変異p53ライブラリー
EP1654354A1 (en) 2003-08-11 2006-05-10 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
SG148180A1 (en) 2003-08-11 2008-12-31 Codexis Inc Improved halohydrin dehalogenases and related polynucleotides

Also Published As

Publication number Publication date
ES2705694T3 (es) 2019-03-26
HUE029228T2 (en) 2017-02-28
EP2285958B1 (en) 2016-03-09
CA2726850C (en) 2015-06-02
WO2009152336A1 (en) 2009-12-17
DK2285958T3 (en) 2016-03-29
EP3023494A1 (en) 2016-05-25
EP2285958A1 (en) 2011-02-23
EP2285958A4 (en) 2012-02-01
EP3023494B1 (en) 2018-11-28
CA2726850A1 (en) 2009-12-17
CN102066561A (zh) 2011-05-18
HUE041367T2 (hu) 2019-05-28
CN102066561B (zh) 2013-09-25
DK3023494T3 (en) 2019-02-25

Similar Documents

Publication Publication Date Title
ES2575005T3 (es) Método de síntesis de variantes de polinucleótidos
ES2671027T3 (es) Síntesis en paralelo automatizada combinada de variantes de polinucleótidos
US8383346B2 (en) Combined automated parallel synthesis of polynucleotide variants
AU2019203198B2 (en) Methods And Compositions For Nucleic Acid Sequencing
US20200325471A1 (en) Compositions and methods for detecting nucleic acid regions
EP1604040B1 (en) Amplification and analysis of whole genome and whole transcriptome libraries generated by a dna polymerization process
AU2010202702B2 (en) Evolving new molecular function
CA3066424A1 (en) Single cell whole genome libraries for methylation sequencing
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
KR20040088562A (ko) 핵산 집단내 오류 저감 방법
KR20240039167A (ko) 인덱스 스플린트 올리고를 사용하는 결찰에 의한 긴 핵산의 조립
WO2024050304A1 (en) Preparation and use of blocked substrates
NZ794511A (en) Single cell whole genome libraries for methylation sequencing
JP2004529663A (ja) Happiarマッピング