MXPA00011569A - Re-ensamble de acidos nucleicos mediado por exonucleasa en evolucion dirigida. - Google Patents

Re-ensamble de acidos nucleicos mediado por exonucleasa en evolucion dirigida.

Info

Publication number
MXPA00011569A
MXPA00011569A MXPA00011569A MXPA00011569A MXPA00011569A MX PA00011569 A MXPA00011569 A MX PA00011569A MX PA00011569 A MXPA00011569 A MX PA00011569A MX PA00011569 A MXPA00011569 A MX PA00011569A MX PA00011569 A MXPA00011569 A MX PA00011569A
Authority
MX
Mexico
Prior art keywords
nucleic acid
exonuclease
polynucleotides
polynucleotide
yes
Prior art date
Application number
MXPA00011569A
Other languages
English (en)
Inventor
Johann Frey Gerhard
Original Assignee
Diversa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/276,860 external-priority patent/US6352842B1/en
Priority claimed from US09/332,835 external-priority patent/US6537776B1/en
Application filed by Diversa Corp filed Critical Diversa Corp
Publication of MXPA00011569A publication Critical patent/MXPA00011569A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)

Abstract

Esta invencion provee metodos de obtener novedosos polinucleotidos y polipeptidos codificados mediante el uso de metodos no estocasticos de evolucion dirigida (DirectEvolution tm) .Una ventaja particular de lo metodos de re-ensamble mediados por exonucleasa es la capacidad de re-ensamblar filamentos de acidos nucleicos, que de otra manera serian dificiles de quimerizar.Los metodos de re-ensamble mediados por exonuclerasa pueden ser usados en combinacion con otros metodos de mutagenesis provistos en la presente. Estos metodos incluyen mutagenesis de saturacion de sitio de polinucleotido no estocastica (GeneReassembly tm). Esta invencion provee metodos de obtener novedosas enzimas que tienen propiedades fisicas y/o biologicas optimizadas. mediante el uso de los metodos reivindicados, vacunas geneticas, enzimas, moleculas pequenas y otras moleculas deseables pueden ser evolucionadas hacia propiedades deseables. Por ejemplo, pueden obtenerse vectores de vacuna que exhiben una eficacia incrementada para uso como vacunas geneticas. Los vectores obtenidos usando los metodos pueden tener, por ejemplo, una mejorada expresion de antigenos, una incrementada toma en una celula, estabilidad incrementada en una celula, la capacidad de desarrollar una respuesta inmune a la medida, y similares. a mayor abundimiento, esta invencion provee metodos de obtener una variedad de moleculas biologicamente activas, novedosas, en el campo de los antibioticos, la farmacoterapia, y rasgos transgenicos.

Description

-ENSAMBLE DE ÁCIDOS NUCLEICOS MEDIADO EXONUCLEASA EN EVOLUCIÓN DIRIGIDA Campo de la Invención Esta invención se relaciona con el campo del diseño técnico de proteínas. Más específicamente, se relaciona con un método de evolución dirigida para preparar polinucleótidos que codifican polipéptidos . Este método comprende el paso de generar mutagénesis dirigida al sitio opcionalmente en combinación con el paso de quimerización de polinucleótido, el paso de seleccionar moléculas de progenie potencialmente deseable, que incluye un proceso denominado selección de extremo (el cual se puede seleccionar adicionalmente) , y el paso de seleccionar los polinucleótidos para la producción del o los polipéptidos que tienen una propiedad útil. En un aspecto particular, la presente invención es relevante a las enzimas, particularmente a las enzimas termoesta-bles, y a su generación mediante evolución dirigida. Más particularmente, la presente invención se relaciona con enzimas termoestables que son estables a alta temperatura, que tienen actividad mejorada a temperaturas más bajas. Antecedentes Al recoger el potencial entero de la diversidad de la naturaleza, se puede incluir tanto el paso de descubrimiento como el paso de optimizar lo que se descubre. Por ejemplo, el paso de descubrimiento permite que se exploten las moléculas biológicas que tienen utilidad industrial. Sin embargo, para ciertas necesidades industriales, es ventajoso modificar adicionalmente estas enzimas experimentalmente para lograr propiedades más allá de lo que la evolución natural ha proporcionado y es probable que proporcione en el futuro cercano. El proceso, denominado evolución dirigida, de modificar experimentalmente una molécula biológica hacia una propiedad deseable, se puede lograr mutagenizando una o más plantillas moleculares padres e identificar cualquier molécula deseable entre las moléculas de progenie. Sin embargo, las tecnologías actualmente disponibles usadas en la evolución dirigida tienen algunas desventajas. Entre estas desventajas están: 1) La tecnología de mutagénesis dirigida al sitio, tales como la reacción de cadena de polimerasa fangosa de baja fidelidad, son ineficaces para lograr sistemáticamente en cada posición (sitio) en la secuencia de polipéptidos el rango completo (saturado) de mutaciones posibles (es decir, todas las sustituciones de aminoácidos posibles) . 2) No hay medios sistemáticos relativamente fáciles para analizar rápidamente la gran cantidad de información que puede estar contenida en una secuencia molecular y en el número colosal potencialmente de moléculas de progenie que podrían concebiblemente obtenerse por la evolución dirigida de una o más plantillas moleculares. 3) No hay medios sistemáticos relativamente fáciles para proporcionar información empírica comprensiva que relacione la estructura con la función para las posiciones moleculares. 4) No hay medios sistemáticos fáciles para incorporar controles internos en ciertos procedimientos de mutagénesis (por ejemplo, quimerización) . 5) No hay medios sistemáticos fáciles para seleccionar moléculas de progenie específicas, tales como quimeras de longitud completa, de entre secuencias parciales más pequeñas. La mutagénesis molecular se presenta en la naturaleza y ha dado como resultado la generación de una riqueza de compuestos biológicos que han mostrado utilidad en ciertas aplicaciones industriales. Sin embargo, la evolución en la naturaleza frecuentemente selecciona propiedades moleculares que son discordantes con muchas necesidades industriales no satisfechas. Adicionalmente, frecuentemente se da el caso de que cuando unas mutaciones industrialmente útiles de otro modo serían favorecidas a nivel molecular, la evolución natural frecuentemente rebasa la selección positiva de estas mutaciones cuando hay un perjuicio concurrente a un organismo como un todo (tal como cuando una mutación favorable está acompañada por una mutación perjudicial) . Adicionalmente todavía, la evolución natural es lenta, y le da mucho énfasis a la fidelidad en la réplica. Finalmente, la evolución natural prefiere una senda pavimentada principalmente por mutaciones benéficas al mismo tiempo que tiende a evitar una pluralidad de mutaciones negativas sucesivas, aún cuando esas mutaciones negativas puedan demostrar ser benéficas cuando se combinan, o puedan conducir - a través de una ruta de circuito - a un estado final que es benéfico. La evolución dirigida, por otro lado, se puede realizar mucho más rápidamente y conducir directamente a evolucionar una propiedad molecular que sea deseable industrialmente cuando la naturaleza no la proporciona. Existe un número cada vez más grande de posibilidades para las combinaciones intencionales y aleatorias de los aminoácidos dentro de una proteína para producir proteínas híbridas útiles y sus moléculas biológicas correspondientes que codifican estas proteínas híbridas, es decir, ADN, ARN. De conformidad con lo anterior, hay una necesidad para producir y seleccionar una amplia variedad de estas proteínas híbridas para una utilidad deseable, particularmente proteínas aleatorias que varían ampliamente. La complejidad de una secuencia activa de una macromo-lécula biológica (por ejemplo, polinucleótidos, polipéptidos, y moléculas que están compuestas tanto de secuencias de polinucleótidos como de polipéptidos) se ha denominado su Contenido de Información ("IC") , el cual se ha definido como la resistencia de la proteína activa a la variación de secuencia de aminoácidos (calculada a partir del número mínimo de aminoácidos invariables (pedacitos) requeridos para describir una familia de secuencias relacionadas con la misma función) . Las proteínas que son más sensibles a la mutagénesis aleatoria tienen un alto contenido de información . Los descubrimientos de biología molecular, tales como las bibliotecas moleculares, han permitido la identificación de un número bastante grande de bases variables, y todavía proporcionan maneras para seleccionar secuencias funcionales a partir de bibliotecas aleatorias. En estas bibliotecas, la mayoría de los residuos se puede variar (aunque típicamente no todos al mismo tiempo) dependiendo de los cambios de compensación en el contexto. De este modo, mientras que una proteína de 100 aminoácidos puede contener solamente 2000 mutaciones diferentes, son posibles 20100 combinaciones de secuencias. La densidad de información es el contenido de información por longitud unitaria de una secuencia. Los sitios activos de enzimas tienden a tener una alta densidad de información. En cambio, los enlazadores flexibles de información en enzimas tienen una baja densidad de información. Los métodos actuales en amplio uso para crear proteínas alternativas en formato de biblioteca son reacciones de cadena de polimerasa (PCR) y mutagénesis de cásete propensas a error, en las cuales la región específica que se va a optimizar se reemplaza con un oligonucleótido sintéticamente mutagenizado. En ambos casos, se genera un número sustancial de sitios imitantes alrededor de ciertos sitios en la secuencia original . La reacción de cadena de polimerasa propensa a error usa condiciones de polimerización de baja fidelidad para introducir un bajo nivel de mutaciones puntuales aleatoriamente a lo largo de una secuencia larga. En una mezcla de fragmentos de secuencia desconocida, la reacción de cadena de polimerasa propensa al error se puede usar para mutagenizar la mezcla. Los protocolos de reacción de cadena de polimerasa propensa a error publicados padecen de baja capacidad de proceso de la polimerasa. Por lo tanto, el protocolo es incapaz de dar como resultado la mutagénesis aleatoria de un gen de tamaño promedio. Esta incapacidad limita la aplicación práctica de la reacción de cadena de polimerasa propensa al error. Algunas simulaciones por computadora han sugerido que la mutagénesis puntual sola frecuentemente es demasiado gradual para permitir los cambios en bloque a gran escala que se requieren para la evolución de secuencias continua y dramática. Además, los protocolos de reacción de cadena de polimerasa propensa a error publicados no permiten la amplificación de fragmentos de ADN mayores de 0.5 a 1.0 kb, limitando su aplicación práctica. Además, ciclos repetidos de reacción de cadena de polimerasa propensa a error pueden conducir a una acumulación de mutaciones neutras con resultados indeseables, tales como afectar la inmunogenicidad de una proteina pero no su afinidad de enlace. En mutagénesis dirigida a oligonucleótido, una secuencia corta es reemplazada por un oligonucleótido mutageniza-do sintéticamente. Este enfoque no genera combinaciones de mutaciones distantes y de este modo no son combinatorias. El tamaño limitado de la biblioteca relativo a la vasta longitud de secuencia significa que son inevitables muchas rondas de selección para la optimización de la proteína. La mutagénesis con oligonucleótido sintético requiere el secuenciamiento de clonas individuales después de cada ronda de selección seguida por el agrupamiento de ellas en familias, eligiendo arbitrariamente una sola familia, y reduciéndola a un motivo de consenso. Este motivo se re-sintetiza y re-inserta en un solo gen seguido por selección adicional . Este proceso por pasos constituye un cuello de botella estadístico, exige mucho trabajo, y no es práctico para muchas rondas de mutagénesis. La reacción de cadena de polimerasa propensa a error y la mutagénesis dirigida al oligonucleótido son de este modo útiles para ciclos únicos de afinación fina de secuencia, pero rápidamente se vuelven demasiado limitantes cuando se aplican a ciclos múltiples. Otra limitación de la reacción de cadena de polimerasa propensa a error es que el régimen de mutaciones hacia abajo crece con el contenido de información de la secuencia. Conforme crece el contenido de información, el tamaño de la biblioteca y el régimen de mutagénesis, el equilibrio de las mutaciones hacia abajo con las mutaciones hacia arriba estadísticamente evitará la selección de otros mejoramientos (techo estadístico) . En mutagénesis de cásete, un bloque de secuencias, de una sola plantilla típicamente se reemplaza por una secuencia aleatorizada (parcialmente) . Por lo tanto, el contenido de información máximo que se puede obtener está estadísticamente limitado por el número de secuencias aleatorias (es decir, el tamaño de la biblioteca) . Esto elimina otras familias de secuencias que no son actualmente mejores, pero que pueden tener mayor potencial a largo plazo. También, las mutagénesis con oligonucleótidos sintéticos requieren el secuenciamiento de clonas individuales después de cada ronda de selección. De este modo, este enfoque es tedioso e impráctico para muchas rondas de mutagénesis. De este modo, la reacción de cadena de polimerasa propensa a error y la mutagénesis de cásete son más adecuadas, y han sido ampliamente usadas, para áreas de afinación fina de contenido de información comparativamente bajo. Una excepción aparente es la selección del ribozima ligasa de A N a partir de una biblioteca aleatoria usando muchas rondas de amplificación mediante reacción de cadena de polimerasa propensa a error y selección. En la naturaleza, la evolución de la mayoría de los organismos se presentan mediante selección natural y reproducción sexual. La reproducción sexual asegura la mezcla y combinación de los genes en los descendientes de los individuos selecciona-dos . Durante la meiosis, los cromosomas homólogos de los padres se alinean hacia arriba uno con otro y cruzan parte del camino a lo largo de su longitud, cambiando aleatoriamente de este modo el material genético. Este cambio o mezcla del ADN permite que los organismos evolucionen más rápidamente. En la recombinación, debido a que las secuencias insertadas tuvieron utilidad probada en un ambiente homólogo, las secuencias insertadas probablemente todavía tengan contenido de información sustancial en cuanto se insertan en una nueva secuencia . El término Evolución Molecular Aplicada ("AME") significa la aplicación de un algoritmo de diseño evolucionarlo para una meta específica, útil. Aunque se han reportado muchos formatos de bibliotecas diferentes para la evolución molecular aplicada para polinucleótidos , péptidos y proteínas (fago, lacl y polisomas) , ninguno de estos formatos se ha proporcionado para la recombinación por cruzas aleatorias para crear deliberadamente una biblioteca combinatoria. Teóricamente hay 2,000 diferentes mutantes únicos de una proteína con 100 aminoácidos. Sin embargo, una proteína con 100 aminoácidos tiene 20100 posibles combinaciones de secuencia, un número que es demasiado grande para explorarlo exhaustivamente mediante métodos convencionales. Sería ventajoso desarrollar un sistema que pudiera permitir la generación y la selección de todas estas mutaciones de posibles combinaciones.
Algunos trabajadores en la técnica han utilizado un sistema de recombinación específica al sitio en vivo para generar híbridos de genes de anticuerpos de cadena ligera combinados con genes de anticuerpos de cadena pesada para la expresión en el sistema de un fago. Sin embargo, su sistema depende de los sitios específicos de la recombinación y se limita de conformidad con esto. Se ha reportado la mutagénesis simultánea de regiones CDR de anticuerpos en una sola cadena de anticuerpos (scFv) mediante extensión traslapante y reacción de cadena de polimera-sa . Otros han descrito un método para generar una gran población de múltiples híbridos usando recombinación en vivo aleatoria. Este método requiere la recombinación de dos diferentes bibliotecas de plásmidos, teniendo cada biblioteca un marcador seleccionable diferente. Este método se limita a un número finito de recombinaciones igual al número de marcadores seleccionables , y produce un aumento lineal concomitante en el número de genes marcadores enlazados con la o las secuencias seleccionadas . La recombinación en vivo entre dos genes homólogos, pero truncados, de toxina de insecto en un plásmido se ha reportado como un método para producir un gen híbrido. Se ha reportado la recombinación en vivo de secuencias de ADN sustan-cialmente no apareadas en una célula hospedera que tiene enzimas de reparación no apareadas defectuosas, que da como resultado la formación de molécula híbrida . Compendio de la Invención Esta invención se relaciona en general con el campo de ingeniería de los ácidos nucleicos y la ingeniería de proteínas recombinantes codificadas correspondientemente. Más particularmente, la invención se relaciona con la evolución dirigida de ácidos nucleicos y la selección de clonas que contienen los ácidos nucleicos evolucionados para la actividad o actividades resultantes de interés, tales como actividad o actividades de ácidos nucleicos y/o de proteína específica, particularmente enzima, actividad o actividades de interés. Esta invención se relaciona en general con un método para: 1) preparar una molécula de generación de progenie (incluyendo una molécula que está compuesta de una secuencia de polinucleótidos, una molécula que está compuesta de una secuencia de polipéptidos, y una molécula que está compuesta en parte de una secuencia de polinucleótidos y en parte de una secuencia de polipéptidos) , que se mutageniza para lograr cuando menos una mutación puntual , adición, supresión, y/o quimerización, a partir de una o más plantillas ancestrales o de generación padre; 2) seleccionar la molécula de generación de progenie - usando preferiblemente un método de producción - durante cuando menos una propiedad de interés (tal como un mejoramiento en una actividad de enzima o un aumento en la estabilidad o un efecto quimioterapéutico novedoso) ; 3) obtener opcionalmente y/o catalogar información estructural y/o funcional con respecto a las moléculas padres y/o de generación de progenie; y 4) repetir opcionalmente cualquiera de los pasos 1) al 3) . En una modalidad preferida, esta invención proporciona un método para producir un polinucleótido de progenie mutageniza-do, que comprende : (a) someter un conjunto inicial o padre de polinucleó-tidos a un proceso de re-ensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótidos de progenie; mediante lo cual se ejemplifica el proceso de re-ensamble mediado por exonucleasa, de una manera no limitante, sometiendo a un tratamiento de 3' exonucleasa, tal como un tratamiento con exonucleasa III, que actúa sobre los extremos romos y colgantes 3', para liberar los nucleótidos 3 ' -terminales pero no los 5'-terminales de un polinucleótido inicial de cadena doble, dejando una cadena restante que está parcialmente o completamente libre de su compañera original de manera que, si se desea, la cadena restante se puede usar para lograr la hibridación con otra compañera; mediante lo cual además se ejemplifica, de una manera no limitante, el proceso de re-ensamble mediado por exonucleasa, sometiendo a un tratamiento de 5' exonucleasa, tal como un tratamiento con producto de gen rojo alfa, que actúa sobre los colgantes 5' para liberar los nucleótidos 5 ' -terminales del polinucleótido inicial de cadena doble, dejando una cadena restante que está parcialmente o completamente libre de su compañera original de manera que, si se desea, la cadena restante se puede usar para lograr la hibridación con otra compañera; mediante lo cual el proceso de re-ensamble mediado por exonucleasa se ejemplifica adicionalmente, de una manera no limitante, sometiendo a un tratamiento de exonucleasa, tal como el tratamiento con nucleasa de frijol Mung o tratamiento con nucleasa SI o tratamiento con polimerasa de ADN de E. coli, que actúa sobre los extremos colgantes, incluyendo los extremos no hibridados, para liberar a los nucleótidos terminales de un extremo de una sola cadena no hibridada de una cadena de ácido nucleico recocida en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero hibridado para facilitar la extensión basada en polimerasa y/o la ligación mediada con ligasa del extremo tratado; y mediante lo cual el proceso de re-ensamble mediado por exonucleasa también se ejemplifica por un tratamiento dual, que se puede realizar, por ejemplo, no simultáneamente, tanto con una exonucleasa que libera los nucleótidos terminales de los extremos colgantes o los extremos romos así como una exonucleasa que libera los nucleótidos terminales de los extremos colgantes tales como los extremos no hibridados . En un aspecto preferido de esta modalidad, esta invención proporciona un método para producir un polinucleótido de progenie mutagenizada, en el cual el paso de (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de re-ensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótidos de progenie; está compuesto de: (i) someter un conjunto de polinucleótidos inicial o padre a un tratamiento de 3 ' exonucleasa que actúa sobre los extremos romos y colgantes 3 ' para liberar a los nucleótidos 3 ' -terminales pero no a los 5 ' -terminales ; mediante lo cual se ejemplifica la 3' exonucleasa, de una manera no limitante, mediante tratamiento con una exonucleasa, tal como la exonucleasa III, para liberar a los nucleótidos 3 ' -terminales pero no a los 5 ' -terminales de un polinucleótido de doble cadena inicial, dejando una cadena restante que está parcialmente o completamente libre de su compañera original de manera que, si se desea, la cadena restante se puede usar para lograr la hibridación con otra compañera. En otro aspecto preferido de esta modalidad, esta invención proporciona un método para producir un polinucleótido de progenie mutagenizado, en donde el paso de (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de reensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótidos de progenie; está compuesto de: (i) someter el conjunto de polinucleótidos inicial o padre a un tratamiento por 5 ' exonucleasa que actúa sobre los colgantes 5' para liberar a los nucleótidos 5 ' -terminales; mediante lo cual la 5' exonucleasa se ejemplifica, de una manera no limitante, mediante el tratamiento con una exonucleasa, tal como el producto de gen rojo alfa, para liberar a los nucleótidos 5 ' -terminales de un polinucleótido inicial de doble cadena, dejando una cadena restante que está parcialmente o completamente libre de su compañera original de manera que, si se desea, la cadena restante se puede usar para lograr la hibridación con otra compañera . En todavía otro aspecto de esta modalidad, esta invención proporciona un método para producir un polinucleótido de progenie mutagenizada, en donde el paso de (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de reensamble mediado por exonucleasa in vitro para producir un conjunto de polinucleótidos de progenie; está compuesto de: (i) someter un conjunto de polinucleótidos inicial o padre a un tratamiento de exonucleasa que libera nucleótidos terminales de colgantes hacia arriba de ácidos nucleicos; mediante lo cual el tratamiento se ejemplifica, de una manera no limitante, sometiendo a un tratamiento de exonucleasa, tal como el tratamiento con nucleasa de frijol Mung o el tratamiento con nucleasa SI o tratamiento con polimerasa de ADN de E. coli, que actúa sobre los extremos colgantes, incluyendo los extremos no hibridados, para liberar nucleótidos de un extremo de cadena simple no hibridado de una cadena de ácido nucleico recocida en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero hibridado para facilitar la extensión basada en polimerasa y/o la ligación mediada por ligasa del extremo tratado. En todavía otro aspecto de esta invención, esta invención proporciona un método para producir un polinucleótido de progenie mutagenizado, en donde el paso de (a) someter un conjunto de polinucleótido inicial o padre a un proceso de reensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótido progenie; está compuesto de: (i) someter un conjunto de polinucleótidos inicial o padre a un tratamiento por 3 ' exonucleasa que actúa en colgantes 3' y extremos romos, para liberar los nucleótidos 3 ' -terminales pero no los 5 ' -terminales ; y (ii) someter un conjunto de polinucleótidos inicial o padre a un tratamiento por exonucleasa que libere los nucleótidos terminales de los colgantes de ácido nucleico; en donde el proceso de re-ensamble mediado por exonucleasa está compuesto de un tratamiento dual, que se puede realizar, por ejemplo, no simultáneamente, tanto con una exonucleasa que libera los nucleótidos terminales de colgantes o extremos romos así como exonucleasa que libera los nucleótidos terminales de colgantes tales como extremos no hibridados. En todavía otro aspecto preferido de esta modalidad, esta invención proporciona un método para producir un polinucleótido de progenie mutagenizado, en donde el paso de (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de re-ensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótidos de progenie; está compuesto de: (i) someter un conjunto de polinucleótidos inicial o padre a un tratamiento por 5 ' exonucleasa que actúa sobre los colgantes 5' para liberar los nucleótidos 5 ' -terminales; y (ii) someter un conjunto de polinucleótidos inicial o padre a un tratamiento por exonucleasa que libere los nucleótidos terminales de los colgantes hacia arriba de ácido nucleico; mediante lo cual el proceso de re-ensamble mediado por exonucleasa está compuesto de un tratamiento dual, que se puede realizar, por ejemplo, no simultáneamente, tanto con una exonucleasa que libera a los nucleótidos terminales de los colgantes o extremos romos así como una exonucleasa que libera a los nucleótidos terminales de colgantes tales como extremos no hibridados . En otra modalidad preferida, esta invención proporciona un método para producir un polinucleótido de progenie mutageniza-do que tiene cuando menos una propiedad deseable compuesta de los pasos de: (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de re-ensamble mediado por exonucleasa in vi tro para producir un conjunto de polinucleótidos de progenie; y (b) someter el conjunto de polinucleótidos de progenie a un proceso de selección y enriquecimiento basado en selección de extremo, para seleccionar un subconjunto deseable del conjunto de polinucleótidos de progenie; mediante lo cual los pasos anteriores se pueden realizar iterativamente y en cualquier orden y combinación; mediante lo cual el proceso basado en selección de extremo crea extremos compatibles por ligación; mediante lo cual la creación de los extremos compatibles por ligación se usa opcionalmente para facilitar una o más ligaciones intermoleculares, que preferiblemente son ligaciones direccionales , dentro de los miembros del conjunto de polinucleótidos de progenie para lograr la mutagénesis de ensamble y/o reensamble ; mediante lo cual la creación de los extremos compatibles por ligación sirve para facilitar la ligación del conjunto de polinucleótidos de progenie en un sistema de vector de expresión y clonación de expresión; mediante lo cual la clonación de expresión del conjunto de polinucleótidos de progenie sirve para generar un conjunto de polipéptidos; mediante lo cual el conjunto de polipéptidos generados se puede someter a un proceso de selección de expresión; y mediante lo cual la selección de expresión del conjunto de polipéptidos de progenie proporciona un medio para identificar una especie deseable, por ejemplo, un polipéptido mutante o alternativamente un fragmento de polipéptido, que tiene una propiedad deseable, tal como una actividad enzimática específica. En otra modalidad preferida, esta invención proporciona un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos de progenitores, que comprende : a) recocer una cadena de ácido nucleico de poli-enlace con dos cadenas de ácido nucleico de mono-enlace para generar un complejo heteromérico recocido de cadenas de ácido nucleico; donde la cadena de ácido nucleico de poli-enlace y las dos cadenas de ácido nucleico de mono-enlace cada una se deriva de una especie molecular diferente en dicha colección de polinucleótidos progenitores ; donde la colección de polinucleótidos progenitores preferiblemente está compuesta de polinucleótidos progenitores no idénticos aunque posiblemente relacionados, como se ejemplifica mediante una colección de genes que codifican deshalogenasas ; y donde la cadena de ácido nucleico de poli-enlace con las dos cadenas de ácido nucleico de mono-enlace, cada una tiene cuando menos una secuencia de siete nucleótidos de longitud de identidad con los polinucleótidos del progenitor a partir del cual se deriva; y b) someter los extremos de la cadena única no hibrida-dos de las cadenas de ácidos nucleicos de mono-enlace recocidas en el complejo heteromérico a un tratamiento de exonucleasa que degrada los extremos no hibridados; mediante lo cual el re-cocimiento de las cadenas de poli-enlace y mono-enlace de trabajo derivadas de polinucleótidos no idénticos de este modo permite que se genere una quimerización de dichos polinucleótidos no idénticos; mediante lo cual, en una biblioteca de los complejos recocidos de cadenas de ácidos nucleicos, muchas cadenas componentes tienen extremos no hibridables que son sub-óptimos o no servibles para cebar extensiones basadas en polimerasa; y mediante lo cual el tratamiento de exonucleasa remueve estos extremos no hibridables para convertir los complejos recocidos de cadenas de ácido nucleico en cebadores mejores para la extensión basada en polimerasa. En un aspecto preferido de esta modalidad, esta invención proporciona un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que además comprende el paso de: c) someter el complejo heteromérico recocido a extensión basada en polimerasa. En otro aspecto de esta modalidad, esta invención proporciona un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que además comprende el paso de: d) someter las cadenas de ácido nucleico recocida a un tratamiento de ligasa; mediante el cual el sometimiento al tratamiento de ligasa se ejemplifica mediante el sometimiento a tratamiento de ligasa de ADN de T4 para lograr la ligación intramolecular entre las dos cadenas de mono-enlace recocidas, las cuales se vuelven enlazadas covalentemente formando una cadena quimerizada. En todavía otro aspecto preferido de esta modalidad, esta invención proporciona un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que además comprende el paso de: e) separar la cadena de ácido nucleico de poli-enlace de las cadenas de ácido nucleico de mono-enlace ligadas; mediante lo cual la separación de una cadena de ácido nucleico de poli-enlace a partir de las cadenas de ácido nucleico de mono-enlace a la cual se recuece se puede lograr, por ejemplo, ya sea mediante la desnaturalización o mediante la exposición a una actividad enzimática que selectivamente actúa en las cadenas de ácido nucleico de poli-enlace. En todavía otro aspecto preferido de esta modalidad, esta invención proporciona un método para crear un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que además comprende el paso de: f) generar una cadena de ácido nucleico que es complementaria a la cadena de ácido nucleico de mono-enlace; mediante lo cual el producto resultante está compuesto de un polinucleótido de progenie mutagenizado de doble cadena. En todavía otro aspecto preferido de esta modalidad, esta invención proporciona un método para generar un polinucleó-tido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, además en donde el polinucleótido de progenie mutagenizado es un gen o una senda de gen. En todavía otro aspecto preferido de esta modalidad, esta invención proporciona un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que además comprende: expresar el polipéptido de progenie mutagenizado generado en una hospedera conveniente; mediante lo cual la- expresión conduce a la generación de un producto del polipéptido que se puede detectar mediante el análisis de expresión. En una modalidad preferida, se genera (por ejemplo, a partir de una plantilla de polinucleótido padre) - en lo que se denomina "mutagénesis de saturación de sitio de codón" - una generación de progenie de polinucleótidos, teniendo cada uno cuando menos hasta tres mutaciones puntuales contiguas (es decir diferentes bases que comprenden un nuevo codón) , de manera que cada codón (o cada familia de codones degenerados que codifican el mismo aminoácido) se representa en cada posición de codón. Correspondiendo a - y codificado por - esta generación de progenie de polinucleótidos, también se genera un conjunto de polipéptidos de progenie, teniendo cada uno cuando menos una mutación puntual de un solo aminoácido. En un aspecto preferido, se genera - en lo que se denomina "mutagénesis de saturación de sitio de aminoácidos" - uno de estos polipéptidos mutantes para cada una de las sustituciones de alfa-aminoácidos que forman polipéptidos codificados naturalmente en cada una y todas las posiciones de aminoácidos a lo largo del polipéptido. Esto produce - para cada una y todas las posiciones de aminoácidos a lo largo del polipéptido padre - un total de 20 polipéptidos de progenie distintos que incluyen al aminoácido original, o potencialmente más de 21 polipéptidos de progenie distintos si se usan aminoácidos adicionales ya sea en vez de o además de los 20 aminoácidos codificados naturalmente. De este modo, en otro aspecto, este enfoque también sirve para generar mutantes que contienen - además de y/o en combinación con los 20 alfa-aminoácidos que forman polipéptido codificado naturalmente - otros aminoácidos raros y/o no codificados naturalmente y derivados de aminoácidos . En todavía o otro aspecto, este enfoque también sirve para generar mutantes mediante el uso de - además de y/o en combinación con los sistemas de reconocimiento de codones naturales o inalterados de hospederas convenientes - sistemas de reconocimiento de codones alterados, mutagenizados , y/o de diseñador (tales como en una célula hospedera con una o más moléculas de ARNt alteradas) . En todavía otro aspecto, esta invención se relaciona con la recombinación y más específicamente con un método para preparar polinucleótidos que codifican un polipéptido mediante un método de reclasificación en vivo de secuencias de polinucleóti-dos que contienen regiones de homología parcial , ensamblando los polinucleótidos para formar cuando menos un polinucleótido y seleccionar los polinucleótidos para la producción de un polipéptido o polipéptidos que tienen una propiedad útil. En todavía otra modalidad preferida, esta invención sirve para analizar y catalogar - con respecto a cualquier propiedad molecular (por ejemplo, una actividad enzimática) o combinación de propiedades permitidas por la tecnología actual -los efectos de cualquier cambio mutacional logrado (incluyendo particularmente la mutagénesis por saturación) . De este modo, se proporciona un método comprensivo para determinar el efecto de cambiar cada aminoácido en un polipéptido padre en cada una de cuando menos 19 posibles sustituciones. Esto permite que cada aminoácido en un polipéptido padre sea caracterizado y catalogado de acuerdo con su espectro de efectos potenciales sobre una propiedad medible del polipéptido. En otro aspecto, el método de la presente invención utiliza la propiedad natural de las células para recombinar moléculas y/o mediar los procesos reductivos que reducen la complejidad de las secuencias y la extensión de secuencias repetidas o consecutivas que poseen regiones de homología. Es un objeto de la presente invención proporcionar un método para generar polinucleótidos híbridos que codifican polipéptidos híbridos biológicamente activos con actividades mejoradas. Para llevar a cabo éstos y otros objetos, se ha proporcionado, de acuerdo con un aspecto de la invención, un método para introducir polinucleótidos en una célula hospedera conveniente y cultivar la célula hospedera bajo condiciones que produzcan un polinucleótido híbrido. En otro aspecto de la invención, la invención proporciona un método para seleccionar polipéptidos híbridos biológicamente activos codificados por polinucleótidos híbridos. El presente método permite la identificación de polipéptidos híbridos biológicamente activos con actividades biológicas me oradas . Otros objetos, características y ventajas de la presente invención serán aparentes a partir de la siguiente descripción detallada. Sin embargo, deberá entenderse que la descripción detallada y los ejemplos específicos, aunque indiquen las modalidades preferidas de la invención, se dan solamente a manera de ilustración, ya que varios cambios y modificaciones dentro del espíritu y alcance de la invención serán aparentes para los técnicos en la técnica a partir de esta descripción detallada. En una modalidad específica, esta invención proporciona un método para producir y aislar una biblioteca de polinucleótidos de progenie que tienen cuando menos una propiedad deseable que se compone de los pasos de: (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de mutagenesis para producir un conjunto de polinucleótidos de progenie; y (b) someter el conjunto de polinucleótidos de progenie a una selección basada en selección de extremo y proceso de enriquecimiento, para seleccionar un subconjunto deseable del conjunto de polinucleótidos de progenie; mediante esto los pasos anteriores se pueden realizar iterativamente y en cualquier orden y combinación, mediante lo cual el proceso basado en selección de extremo crea extremos compatibles por ligación, mediante el cual la creación de los extremos compatibles por ligación opcionalmente se usan para facilitar una o más ligaciones intermoleculares, que preferiblemente son ligaciones direccionales, dentro de los miembros del conjunto de polinucleótidos de progenie para lograr mutagénesis de ensamble y/o reensamble, mediante lo cual la creación de extremos compatibles por ligación sirve para facilitar la ligación del conjunto de polinucleótidos de progenie en un sistema de vector de expresión y clonación de expresión, mediante lo cual el proceso de selección y enriquecimiento basado en selección de extremo permite que se produzca una biblioteca de polinucleótidos de progenie generados por un proceso de mutagénesis, incluyendo mutagénesis de saturación en el sitio de polinucleótidos no estocástica (Gene Site Saturation Mutagénesis®) y re-ensamble de polinucleótidos no estocástico (GeneReassembly®) , mediante lo cual la clonación de expresión del conjunto de polinucleótidos de progenie sirve para generar un conjunto de polipéptidos de longitud entera, mediante lo cual el conjunto de polipéptidos generado se puede someter a un proceso de selección de expresión, y mediante lo cual la selección de expresión del conjunto de polipéptidos de progenie proporciona un medio para identificar una especie deseable (por ejemplo, un polipéptido mutante o alternativamente, un fragmento de polipéptido, que tiene una propiedad deseable, tal como una actividad enzimática específica. En otra modalidad específica, esta invención proporciona un método para producir y aislar un polipéptido que tiene cuando menos una propiedad deseable compuesto de los pasos de : (a) someter un conjunto de polinucleótidos inicial o padre a un proceso de mutagénesis para producir un conjunto de polinucleótidos de progenie; y (b) someter el conjunto de polinucleótidos de progenie a un proceso de análisis y enriquecimiento basado en selección de extremo, para seleccionar un subconjunto deseable del conjunto de polinucleótidos de progenie; mediante lo cual los pasos anteriores se pueden realizar iterativamente y en cualquier orden y combinación, donde el proceso basado en selección de extremo crea extremos compatibles por ligación, donde la creación de los extremos compatibles por ligación opcionalmente se usan para facilitar una o más ligaciones intermoleculares, que preferiblemente son ligaciones direccionales, dentro del conjunto de polinucleótidos de progenie para lograr mutagénesis de ensamble y/o re-ensamble, donde el proceso de análisis y enriquecimiento basado en selección de extremo permite que se produzca una biblioteca de polinucleótidos de progenie generados por un proceso de mutagénesis, incluyendo mutagénesis de saturación de sitio de polinucleótidos no estocástica (Gene Site Saturation Mutagénesis®) y reensamble de polinucleótidos no estocástico (GeneReassembly®) , donde la clonación de expresión del conjunto de polinucleótidos de progenie sirve para generar un conjunto de polipéptidos de longitud entera, donde la creación de extremos compatibles por ligación sirve para facilitar la ligación del conjunto de polinucleótidos de progenie en un sistema de vector de expresión y clonación de expresión, donde el conjunto de polipéptidos generado se puede someter a un proceso de análisis de expresión, y donde el análisis de expresión del conjunto de polipéptidos de progenie proporciona un medio para identificar una especie deseable, por ejemplo, un polipéptido mutante o alternativamente, un fragmento de polipéptidos, que tiene una propiedad deseable, tal como una actividad enzimática específica.
En un aspecto específico de esta modalidad, esta invención proporciona los métodos inmediatamente precedentes, en donde el proceso de mutagénesis del paso (a) está compuesto de un proceso, denominado mutagénesis por saturación, para generar, a partir de una plantilla de polipéptidos padres que contienen codón, un conjunto de polipéptidos de progenie en el cual un rango entero de sustituciones de aminoácidos simples se representa en cada posición de aminoácido, que comprende los pasos de: (a) someter un polinucleótido de plantilla que contiene codón de trabajo a una amplificación basada en polimerasa usando un oligonucleótido degenerado para cada codón a mutagenizar, en donde cada uno de los oligonucleótidos degenerado está compuesto de una primera secuencia homologa y una secuencia de triplete degenerado, para generar un conjunto de polinucleótidos de progenie; donde la secuencia de tripletes degenerados se selecciona del grupo que consiste en i) ?,?,?; ii) N,N,G/T; iii) N,N,G/C; iv) N,N, C/G/T; v) N,N,A/G/T; vi) N,N, A/C/T; vii) N,N,A/C/G; y viii) cualquier codón degenerado que codifica los 20 aminoácidos; y (b) someter el conjunto de polinucleótidos de progenie a expresión recombinante de manera que se produzcan los polipéptidos codificados por los polinucleótidos de progenie; donde los pasos anteriores se pueden realizar iterativamente y en cualquier orden y combinación, y donde los métodos proporcionan un medio para generar los 20 cambios de aminoácidos en cada sitio de aminoácidos a lo largo de la plantilla de polipéptidos padre, debido a que la degeneración de la secuencia de tripletes incluye codones para todos los 20 aminoácidos. En un aspecto especifico de esta modalidad, esta invención además proporciona los métodos inmediatamente precedentes, en donde el proceso de mutagénesis del paso (a) está compuesto de un proceso, denominado re-ensamble de gen de ligación sintética o re-ensamble de gen de ligación simplemente sintética. Breve Descripción de los Dibujos La Figura 1 muestra la actividad de la enzima exonu-cleasa III. Esta es una enzima ejemplar que se puede usar para modificar, ensamblar, re-ensamble, recombinar, y/o concatenar bloques de construcción de polinucleótidos . El asterisco indica que la enzima actúa desde la dirección 3 ' hacia la dirección 5 ' del sustrato de polinucleótido. La Figura 2 muestra una aplicación ejemplar de la enzima exonucleasa III en el re-ensamble de polinucleótidos mediados por exonucleasa. También se muestra el uso combinado de una "reparación" en vivo transformando una hospedera conveniente (por ejemplo Escherichia, Pseudomonas, Streptomyces, o Bacillus) y utilizando el mecanismo de reparación de la hospedera para proporcionar más diversidad generando una biblioteca de ácidos nucleicos de progenie mutagenizado clonados (y preferiblemente polipéptidos expresados por estos ácidos nucleicos) que se pueden analizar mediante selección de expresión. La Figura 3 muestra la generación de una cadena de ácido nucleico de poli-enlace. En este caso, la cadena generada es de la misma longitud que la plantilla padre, pero no está metilada. El tratamiento Dpn I se puede usar para seleccionar la cadena generada. Aunque no se muestra, la plantilla así como el producto generado pueden ser parte de un vector (lineal o circular) . La Figura 4 muestra el uso de tratamiento por exonu-cleasa como un medio para liberar los nucleótidos terminales 3 ' y 5 ' del extremo de cadena simple no hibridado de una cadena de ácido nucleico recocido en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero hibridado para facilitar la extensión basada en polimerasa y/o la ligación mediada por ligasa del extremo tratado. También se muestra el uso combinado de la "reparación" en vivo transformando una hospedera conveniente (por ejemplo, Escherichia, Pseudomonas, Streptomyces, o Bacillus) y utilizando el mecanismo de reparación de la hospedera para proporcionar más diversidad generando una biblioteca de ácidos nucleicos de progenie mutagenizado clonados (y preferiblemente polipéptidos expresados por estos ácidos nucleicos) que se pueden analizar mediante selección de expresión.
La Figura 5 muestra el uso de re-ensamble de ácido nucleico mediado por exonucleasa en un ejemplo en el cual una cadena de ácido nucleico de poli-enlace metilado se recuece con varias cadenas de ácido nucleico de mono-enlace no metilados. Las cadenas de ácido nucleico recocidas forman complejos de ácido nucleico heteromérico y están sometidas a tratamiento por exonucleasa como un medio para liberar los nucleótidos terminales 3 ' y 5 ' de los extremos de cadena simple no hibridados de una pluralidad de cadenas de ácido nucleico recocidas en los complejos de ácido nucleico heteromérico, dejando extremos acortados pero hibridados para facilitar la extensión basada en polimerasa y/o la ligación mediada por ligasa de los extremoonca-tens tratados. El tratamiento con Dpnl sirve entonces para seleccionar contra las cadenas de ácido nucleico de mono-enlace recocidas generadas que son no metiladas y quiméricas por naturaleza . La Figura 6 muestra el uso de re-ensamble de ácido nucleico mediado por exonucleasa en un ejemplo en el cual una pluralidad de cadenas de ácido nucleico de poli-enlace metiladas se recuecen con varias cadenas de ácido nucleico de mono-enlace no metiladas. Las cadenas de ácido nucleico recocidas forman complejos de ácido nucleico heteromérico que se somete a tratamiento por exonucleasa como un medio para liberar los nucleótidos terminales 3 ' y 5 ' de los extremos de cadena simple no hibridados de una pluralidad de cadenas de ácido nucleico recocidas en los complejos de ácido nucleico heteroméricos, dejando extremos acortados pero hibridados para facilitar la extensión basada en polimerasa y/o la ligación mediada por ligasa de los extremos tratados. El tratamiento con Dpnl sirve entonces para seleccionar contra las cadenas de ácido nucleico de mono-enlace recocidas generadas que son no metiladas y quiméricas en naturaleza . Definiciones de Términos Con el fin de facilitar el entendimiento de los ejemplos proporcionados en la presente, ciertos métodos que se presentan frecuentemente y/o términos se describirán. El término "agente" se usa en la presente para denotar un compuesto químico, una mezcla de compuestos químicos, un arreglo de compuestos localizados espacialmente (por ejemplo, un arreglo de péptidos VLSIPS, arreglo de polinucleótidos, y/o arreglo de molécula pequeña combinatoria) , macromolécula biológica, una biblioteca de despliegue de péptido bacteriófago, un anticuerpo bacteriófago (por ejemplo, scFv) biblioteca de despliegue, una biblioteca de despliegue de péptido de polisoma, o un extracto hecho de materiales biológicos tales como bacterias, plantas, hongos, o células o te idos animales (particularmente de mamíferos) . Los agentes se evalúan por la actividad potencial como antineoplásicos, anti- inflamatorios, o moduladores de apóptosis mediante la inclusión en ensayos de selección descritos más adelante en la presente . Los agentes se evalúan por la actividad potencial como inhibidores de interacción de proteína específicos (es decir, un agente que selectivamente inhibe una interacción de enlace entre dos polipéptidos predeterminados pero no muestra interferencia sustancial con la viabilidad de la célula) mediante la inclusión en ensayos de selección descritos más adelante en la presente. Un "requerimiento de base ambigua" en un sitio de restricción se refiere a un requerimiento de base de nucleótido que no se especifica en su extensión más amplia, es decir, que no es una base específica (tal como, en un ejemplo no limitante, una base específica seleccionada entre A, C, G, y T) , si no puede ser cualquiera de cuando menos dos o más bases . Las abreviaturas comúnmente aceptadas que se usan en la técnica así como en la presente para representar la ambigüedad en bases incluye las siguientes: R = G O A; Y = C O T; M = A O C K = G o T S = G o C; W = A o T; H = A o C o T; B = G o T o C; V = G o C o A; D = G O A o T; N = A o C o G o T. El término "aminoácido" como se usa en la presente se refiere a cualquier compuesto orgánico que contiene un grupo amino ( - H2) y un grupo carboxilo (-COOH) ; preferiblemente ya sea como grupos libres o alternativamente, después de la condensación como partes de enlaces de péptidos. Los "veinte alfa-amino ácidos que forman polipéptidos naturalmente codificados" se conocen en la técnica y se refieren a: alanina (ala o A), arginina (arg o R) , asparagina (asn o N) , ácido aspártico (asp o D) , cisteína (cys o C) , ácido glutámico (glu o E) , glutamina (gln o Q) , glicina (gly o G) , histidina (his o H) , isoleucina (ile o I) , leucina (leu o L) , lisina (lys o K) , metionina (met o M) , fenilalanina (phe o F) , prolina (pro o P) , serina (ser o S) , treonina (thr o T) , triptofano (trp o W) , tirosina (tyr o Y) , y valina (val o V) . El término "amplificación" significa que el número de copias de un polinucleótido aumenta. El término "anticuerpo", como se usa en la presente, se refiere a moléculas de inmunoglobulina intactas, así como fragmentos de moléculas de inmunoglobulina, tales como Fab, Fab' , (Fab')2, Fv, y fragmentos SCA, que son capaces de enlazarse a un epítope de un antígeno. Estos fragmentos de anticuerpos, que retienen alguna capacidad para enlazar selectivamente a un antígeno (por ejemplo, un antígeno de polipéptido) del anticuerpo del cual se derivan, se puede hacer usando métodos muy conocidos en la técnica (ver, por ejemplo, Harlow y Lañe, supra) , y se describen adicionalmente, como sigue. (1) Un fragmento Fab consiste en un fragmento de enlace de antígeno monovalente de una molécula de anticuerpo, y se puede producir mediante la digestión de una molécula de anticuerpo entera con la enzima papaína, para producir un fragmento que consiste en una cadena ligera intacta y una porción de una cadena pesada. (2) Un fragmento Fab' de una molécula de anticuerpo se puede obtener tratando una molécula de anticuerpo entera con pepsina, seguida por la reducción, para producir una molécula que consiste en una cadena ligera intacta y una porción de una cadena pesada. Se obtienen dos fragmentos Fab' por molécula de anticuerpo tratada de esta manera. (3) Un fragmento (Fab')2 de un anticuerpo se puede obtener tratando una molécula de anticuerpo entera con la enzima pepsina, sin reducción posterior. Un fragmento (Fab')2 es un dímero de dos fragmentos de Fab', mantenidos juntos mediante dos enlaces bisulfuro. (4) Un fragmento Fv se define como un fragmento diseñado técnicamente genéticamente que contiene la región variable de una cadena ligera de la región variable de una cadena pesada expresada como dos cadenas . (5) Un anticuerpo de cadena simple ("SCA") es una molécula de cadena simple genéticamente diseñada técnicamente que contiene una región variable de una cadena ligera y la región variable de una cadena pesada, enlazada por un enlazador de polipéptido conveniente, flexible. Una molécula que tiene una "propiedad quimérica" es una molécula que es: l) en parte homóloga y en parte heterologa a una primera molécula de referencia; mientras que 2) al mismo tiempo es en parte homóloga y en parte heterologa a una segunda molécula de referencia; sin 3) impedir la posibilidad de ser al mismo tiempo parcialmente homóloga y parcialmente heterologa a todavía una o más moléculas de referencia adicionales. En una modalidad no limitante, una molécula quimérica se puede preparar ensamblando una reclasificación de secuencias moleculares parciales. En un aspecto no limitante, una molécula de polinucleótido quimérico se puede preparar sintetizando el polinucleótido quimérico usando una pluralidad de plantillas moleculares, de manera que el polinucleótido quimérico resultante tenga propiedades de una pluralidad de plantillas. El término "cognado" como se usa en la presente se refiere a una secuencia de gen que es evolucionariamente o funcionalmente relacionada entre especies. Por ejemplo, pero sin limitación, en el genoma humano el gen CD4 humano es el gen cognado al gen 3d4 de ratón, ya que las secuencias y estructuras de estos dos genes indican que son muy homólogos y ambos genes codifican una proteína que funciona para señalar la activación de las células T a través del reconocimiento de antígeno MHC de clase II restringida. Una "ventana de comparación" , como se usa en la presente, se refiere a un segmento conceptual de cuando menos 20 posiciones de nucleótidos contiguos en donde una secuencia de polinucleótidos se puede comparar con una secuencia de referencia de cuando menos 20 nucleótidos contiguos y en donde la porción de la secuencia de polinucleótidos en la ventana de comparación puede comprender adiciones o supresiones (es decir, huecos) de 20 por ciento menos en comparación con la secuencia de referencia (que no comprende adiciones o supresiones) para la alineación óptima de dos secuencias. La alineación óptima de secuencias para alinear una ventana de comparación se puede llevar a cabo mediante el algoritmo de homología local de Smith (Smith y Waterman, Adv Appl Math, 1981; Smith y Waterman, J Teor Biol, 1981; Smith y Waterman, J Mol Biol, 1981; Smith y colaboradores, J Mol Evol, 1981) , mediante el algoritmo de alineación de homología de Needleman (Needleman y Wuncsch, 1970) , mediante la búsqueda del método de similaridad de Pearson (Pearson y Lipman, 1988) , mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA, y TFASTA en el isconsin Genetics Software Package Versión 7.0, Genetics Computer Group, 575 Science Dr., Madison, WI) , o mediante la inspección, y la mejor alineación (es decir, dando como resultado el porcentaje más alto de homología sobre la ventana de comparación) generada por los distintos métodos se selecciona. Como se usa en la presente, el término "región de determinación de complementariedad" y "CDR" se refiere al término reconocido en la técnica como se ejemplifica por las definiciones de CDR de Kabat y Chothia generalmente se conocen como regiones super-variables o de ciclos hiper-variables (Chothia y Lesk, 1987; Clothia y colaboradores, 1989; Kabat y colaboradores, 1987; y Tramontano y colaboradores, 1990) . Los dominios de región variable típicamente comprenden los aminoácidos 105-115 aproximadamente amino-terminales de la cadena de inmunoglobulina que se presentan naturalmente (por ejemplo, los aminoácidos 1-110) , aunque dominios variables un poco más cortos o más largos también son convenientes para formar anticuerpos de cadena simple . "Sustituciones de aminoácidos conservadores" se refiere a la intercambiabilidad de residuos que tienen cadenas laterales similares. Por ejemplo, un grupo de aminoácidos que tiene cadenas laterales alifáticas es glicina, alanina, valina, leucina, e isoleucina; un grupo de aminoácidos que tiene cadenas laterales alifáticas-hidroxilo es serina y treonina; un grupo de aminoácidos que tiene cadenas laterales que contienen amida es asparagina y glutamina; un grupo de aminoácidos que tiene cadenas laterales aromáticas es fenilalanina, tirosina, y triptofano,- un grupo de aminoácidos que tiene cadenas laterales básicas es licina, arginina, e histidina; y un grupo de aminoácidos que tiene cadenas laterales que contienen azufre es cisteína y metionina. Los grupos de sustitución de aminoácidos conservadores preferidos son: valina-leucina-isoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina, y asparagina-glutamina . El término "corresponde a" se usa en la presente para significar que una secuencia de polinucleótido es homologa (es decir, es idéntica, no estrictamente relacionada evolucionaria-mente) a toda o a una porción de una secuencia de polinucleótidos de referencia, o que una secuencia de polinucleótidos es idéntica a una secuencia de polipéptidos de referencia. En contraposición, el término "complementario a" se usa en la presente para significar que la secuencia complementaria es homologa a toda o a una porción de la secuencia de polinucleótidos de referencia. Como ilustración, la secuencia de nucleótidos "TATAC" corresponde a una "TATAC" de referencia y es complementaria a una secuencia de referencia "GTATA" . El término "efectivo degradante" con respecto a la cantidad significa la cantidad de enzima que se requiere para procesar cuando menos 50 por ciento del sustrato, en comparación con un sustrato que no tiene contacto con la enzima. Preferiblemente, cuando menos 80 por ciento del sustrato se degrada. Como se usa en la presente, el término "estructura de secuencia definida" se refiere a un conjunto de secuencias definidas que se seleccionan en una base no aleatoria, generalmente con base en datos experimentales o en datos estructurales; por ejemplo, una estructura de secuencia definida puede comprender un conjunto de secuencias de aminoácidos que se producen para formar una estructura de ß-lámina o puede comprender un motivo de repetición de heptada de cremallera de leucina, un dominio de dedo de zinc, entre otras variaciones. Una "secuencia nuclear definida" es un conjunto secuencial que abarca un alcance limitado de variabilidad. Mientras que (1) una secuencia de 10-mer completamente aleatoria de 20 aminoácidos convencionales puede ser cualquiera de (20) 10 secuencias, y (2) una secuencia de 10-mer pseudo-aleatoria de los 20 aminoácidos convencionales puede ser cualquiera de (20) 10 secuencias pero exhibirá una desviación de ciertos residuos en ciertas posiciones y/o global, (3) una secuencia definida nuclear es un subconjunto de secuencias si cada posición de residuo se le permite ser cualquiera de los 20 aminoácidos convencionales permisibles (y/o amino/ inminoácidos no convencionales permisibles) . Una secuencia definida nuclear generalmente comprende posiciones de residuo variantes e invariantes (y/o comprende posiciones de residuo variantes que pueden comprender un residuo seleccionado a partir del subconjunto definido de residuos de aminoácido) , y similar-mente, ya sea segmentariamente o sobre la longitud entera de la secuencia de miembros de biblioteca seleccionada individuales. Los núcleos de secuencia definida se pueden referir ya sea a secuencias de aminoácidos o secuencias de polinucleótidos . Como ilustración y no limitación, las secuencias (NNK) 10 y (NN )10, en donde N representa A, T# G, o C; K representa G o T; y M representa A o C, son núcleos de secuencias definidas. "Digestión" de ADN se refiere a la disociación catalítica del ADN con una enzima de restricción que actúa solamente en ciertas secuencias en el ADN. Las distintas enzimas de restricción usadas en la presente están disponibles comercial -mente y sus condiciones de reacción, co- factores y otros requisitos se usaron como es conocido para el técnico en la materia. Para propósitos analíticos, típicamente un microgramo de plásmido de fragmento de ADN se usa con aproximadamente 2 unidades de enzima en aproximadamente 20 microlitros de solución reguladora. Para el propósito de aislar fragmentos de ADN para construcción de plásmidos, típicamente de 5 a 50 microgramos de ADN se digieren con 20 a 250 unidades de enzima en un volumen más grande. Las cantidades de reguladores y sustrato adecuados para enzimas de restricción particulares se especifican por el fabricante. Los tiempos de incubación de aproximadamente 1 hora a 37 °C se usan ordinariamente, pero pueden variar de acuerdo con las instrucciones del proveedor. Después de la digestión la reacción se electrofora directamente en un gel para aislar el fragmento deseado. "Ligación direccional" se refiere a una ligación en la cual un extremo 5' y un extremo 3' de un polinucleótido son suficientemente diferentes para especificar una orientación de ligación preferida. Por ejemplo, un producto de reacción de cadena de polimerasa no digerido y de otro modo no tratado que tenga dos extremos romos típicamente no tendrá una orientación de ligación preferida cuando se liga en un vector de clonación digerido para producir extremos romos en su sitio de clonación múltiple; esto es, la ligación direccional típicamente no se despliega bajo estas circunstancias. En cambio, la ligación direccional típicamente se desplegará cuando el producto de reacción de cadena de polimerasa digerido que tiene un extremo tratado 5 ' EcoR I y un extremo 3 ' Bairíü I se liga en un vector de clonación que tiene un sitio de clonación múltiple digerido con EcoR I y Bamü I . El término "mezcla de ADN" se usa para indicar la recombinación entre secuencias homologas sustancialmente pero no idénticas, en algunas modalidades la mezcla de ADN puede implicar cruza vía recombinación no homologa, tal como vía sistemas cer/lox y/o flp/frt y similares. Como se usa en esta invención, el término "epítope" se refiere a un determinante antigénico o a un antígeno, tal como un polipéptido fitasa, al cual el parátopo de un anticuerpo, tal como un anticuerpo específico para la fitasa, se enlaza. Los determinantes antigénicos usualmente consisten en agrupación de moléculas en superficie químicamente activas, tales como aminoácidos o cadenas laterales de azúcares, y pueden tener características estructurales de tercera dimensión específicas, así como características de carga específicas. Como se usa en la presente, "epítope" se refiere a la porción de un antígeno u otra macromolécula capaz de formar una interacción de enlace que interactúa con el cuerpo de enlace de región variable de un anticuerpo. Típicamente, esta interacción de enlace se manifiesta como un contacto intermolecular con uno o más residuos de aminoácidos de un CDR. Los términos "fragmento", "derivado" y "análogo" cuando se refieren a un polipéptido de referencia comprenden un polipéptido que retiene cuando menos una función o actividad biológica que es cuando menos esencialmente igual a la del polipéptido de referencia. Además, los términos "fragmento", "derivado" o "análogo" se ejemplifican mediante una molécula de "proforma", que tiene una proproteína de baja actividad que se puede modificar mediante disociación para producir una enzima madura con actividad significativamente más alta. Se proporciona un método en la presente para producir a partir de un polipéptido de plantilla un conjunto de polipéptido de progenie en los cuales un "rango entero de sustituciones de aminoácidos simple" se representa en cada posición de aminoácidos. Como se usa en la presente, "rango entero de sustituciones de aminoácidos simple" es en referencia a los 20 alfa-amino ácidos que forman polipéptido codificados naturalmente, como se describe en la presente. El término "gen" significa segmento de ADN implicado para producir una cadena de polipéptidos ; incluye regiones que preceden y siguen a la región de codificación (delantera y trasera) así como las secuencias de intervención (intrones) entre secuencias de codificación individuales (exones) . "Inestabilidad genética", como se usa en la presente, se refiere a la tendencia natural de secuencias muy repetitivas a ser perdidas a través del proceso de eventos reductores generalmente que involucran simplificación de secuencias a través de la pérdida de secuencias repetidas. Las supresiones tienden a implicar la pérdida de una copia de una repetición y todo entre las repeticiones. El término "heterólogo" significa que una secuencia de ácido nucleico de una cadena simple es incapaz de hibridar en otra secuencia de ácido nucleico de cadena simple o su complemento. De este modo las áreas de heterología significa que las áreas de polinucleótidos o polinucleótidos tienen áreas o regiones dentro de su secuencia que son incapaces de hibridar en otro ácido nucleico o polinucleótido. Estas regiones o áreas son por ejemplo, áreas de mutaciones. El término "homólogos" u "homeólogos" significa que una secuencia de ácido nucleico de un ácido nucleico de una cadena simple se puede hibridar en una secuencia de ácido nucleico de cadena simple complementaria. El grado de hibridación puede depender del número de factores incluyendo la cantidad de identidad entre las secuencias y las condiciones de hibridación tal como la temperatura y las concentraciones de sal como se discute más adelante. Preferiblemente la región de identidad es mayor de aproximadamente 5 pares de bases, más preferiblemente la región de identidad es mayor de 10 pares de bases. Una región variable de cadena ligera o cadena pesada de inmunoglobulina consiste en una región de "estructura" interrumpida por tres regiones hipervariables , también llamadas CDR. La extensión de la región de estructura y las CDR se han definido precisamente; ver "Sequences of Proteins of Immunological Interest" (Secuencias de Proteínas de Interés Inmunológico) (Kabat y colaboradores, 1987) . Las secuencias de las regiones de estructura de diferentes cadenas ligeras o pesadas se conservan relativamente dentro de una especie. Como se usa en la presente, "región de estructura humana" es una región de estructura que es sustancialmente idéntica (aproximadamente 85 o más, usualmente 90-95 o más) a la región de estructura de la inmunoglobulina humana que se presenta naturalmente. La región de estructura de un anticuerpo, que es las regiones de estructura combinada de cadenas ligeras y pesadas constituyentes, sirve para colocar y alinear los CDR. Los CDR son principalmente responsables de enlazar un epítope de un antígeno. Los beneficios de esta invención se extienden a "aplicaciones industriales" (o procesos industriales) , este término se usa para incluir aplicaciones en la propia industria comercial (o simplemente industria) así como en aplicaciones industriales no comerciales (por ejemplo, investigación biomédica en una institución no lucrativa) . Aplicaciones relevantes incluyen aquellas en las áreas de diagnóstico, medicina, agricultura, fabricación, y académicas. El término "idéntica" o "identidad" significa que dos secuencias de ácidos nucleicos tienen la misma secuencia o una secuencia complementaria. De este modo, "áreas de identidad" significa las regiones o áreas de un polinucleótido o del polinucleótido global son idénticas o complementarias a las áreas de otro polinucleótido o el polinucleótido.
El término "aislado" significa que el material se remueve de su ambiente original (por ejemplo, el ambiente natural si se presenta naturalmente) . Por ejemplo, un polinucleótido que se presenta naturalmente o enzima presente en un animal vivo no es aislado, pero el mismo polinucleótido o enzima, separado de alguno o de todos los materiales coexistentes en el sistema natural, es aislado. Estos polinucleótidos pueden ser parte de un vector y/o estos polinucleótidos o enzima podían ser parte de una composición, y todavía estar aislados debido a que el vector de la composición si no es parte de su ambiente natural . Por "ácido nucleico aislado" significa un ácido nucleico, por ejemplo, un ADN o una molécula de AR , que no está inmediatamente contigua con las secuencias de flanqueo 5' y 3' con las cuales normalmente es contigua inmediatamente cuando está presente en el genoma que se presenta naturalmente del organismo del cual se deriva. El término de este modo describe, por ejemplo, un ácido nucleico que se incorpora en un vector, tal como un plásmido o vector viral; un ácido nucleico que se incorpora en el genoma de una célula heteróloga (o el genoma de una célula homologa, pero en un sitio diferente de la que en donde se presenta naturalmente) ; y un ácido nucleico que existe como una molécula separada, por ejemplo, un fragmento de ADN producido mediante amplificación de reacción de cadena de polimerasa o de gestión de enzima de restricción, o una molécula de ARN producida mediante transcripción in vi tro. El termino también describe un ácido nucleico recombinante que forma parte de un gen híbrido que codifica secuencias de polipéptidos adicionales que se pueden usar, por ejemplo, en la producción de una proteína de fusión. Como se usa en la presente, "ligando" se refiere a una molécula, tal como un péptido aleatorio o secuencia de segmento variable, que se reconoce por un receptor particular. Como alguien con experiencia en la técnica reconocerá, una molécula (o un complejo macromolecular) puede ser tanto un receptor como un ligando. En general, el compañero de enlace que tiene un peso molecular más pequeño se conoce como el ligando y el compañero de enlace que tiene un peso molecular mayor se conoce como un receptor . "Ligación" se refiere a un proceso de formar enlaces de fosfodiéster entre dos fragmentos de ácido nucleico de cadena doble (Sambrook y colaboradores, 1982, p. 146; Sambrook, 1989) . A menos que se proporcione otra cosa, la ligación puede llevarse a cabo usando reguladores conocidos y condiciones con 10 unidades de ligasa de ADN de T4 ("ligasa") por 0.5 microgramos de aproximadamente cantidades equimolares de los fragmentos de ADN que se van a ligar. Como se usa en la presente, "enlazador" o "espaciador" se refiere a una molécula o grupo de moléculas que conecta dos moléculas, tales como una proteína de enlace de ADN y un péptido aleatorio, y sirve para colocar las dos moléculas en una configuración preferida, por ejemplo, de manera que el péptido aleatorio se pueda enlazar a un receptor con mínimo impedimento estérico de la proteína de enlace de ADN. Como se usa en la presente, una "propiedad molecular que va a evolucionar" incluye referencia a las moléculas compuestas de una secuencia de polinucleótidos, moléculas compuestas de una secuencia de polipéptidos, y moléculas compuestas en parte de una secuencia de polinucleótidos y en parte de una secuencia de polipéptidos . Particularmente relevantes, pero de ninguna manera limitantes, ejemplos de propiedades moleculares que van a evolucionar incluyen actividades enzimáticas en condiciones específicas, tales como las relacionadas con la temperatura; salinidad; presión,- pH; y concentración de glicerol, DMSO, detergente, y/o cualquier otra especie molecular con la cual se hace contacto en un ambiente de reacción. Ejemplos adicionales particularmente relevantes - pero de ninguna manera limitantes - de propiedades moleculares que van a evolucionar incluyen estabilidades - por ejemplo, la cantidad de la propiedad molecular residual que está presente después de un tiempo de exposición específico a un ambiente específico, tal como se puede encontrar durante el almacenamiento. El término "mutaciones" significa cambios en la secuencia de una secuencia de ácidos nucleicos del tipo natural o cambios en la secuencia de un péptido. Estas mutaciones pueden ser mutaciones puntuales tales como transiciones o transversio-nes. Las mutaciones pueden ser supresiones, inserciones o duplicaciones. Como se usa en la presente, la secuencia de nucleótidos "N,N,G/T" degenerada representa 32 tripletes posibles, en donde "N" puede ser A, C, G o T. El término "que se presenta naturalmente" como se usa en la presente aplicado al objeto significa el hecho de que un objeto se puede encontrar en la naturaleza. Por ejemplo, una secuencia de polipéptidos o polinucleótidos que está presente en un organismo (incluyendo virus) que se pueden aislar de una fuente en la naturaleza y el cual no ha sido intencionalmente modificado por el hombre en el laboratorio se presenta naturalmente. Generalmente, el término en que se presenta naturalmente se refiere a un objeto como está presente en un individuo no patógeno (no enfermo), lo cual sería típico para las especies. Como se usa en la presente, una "molécula de ácido nucleico" está compuesta de cuando menos una base o un par de bases, dependiendo de si es de cadena simple o cadena doble, respectivamente. Además, una molécula de ácido nucleico puede pertenecer exclusivamente o quiméricamente a cualquier grupo de moléculas que contienen nucleótidos, como se ejemplifica por, pero sin limitarse a, los siguientes grupos de moléculas de ácidos nucleicos: AR , ADN, ácidos nucleicos genómicos, ácidos nucleicos no genómicos, ácidos nucleicos que se presentan naturalmente y que no se presentan naturalmente, y ácidos nucleicos sintéticos. Esto incluye, a manera de ejemplo no limitante, ácidos nucleicos asociados con cualquier organelo, tales como la mitocondria, el ARN ribosomal, y las moléculas de ácido nucleico compuestas quiméricamente de uno o más componentes que no se presentan naturalmente junto con componentes que sí se presentan naturalmente. Adicionalmente, una "molécula de ácido nucleico" puede contener en parte uno o más componentes basados en no nucleótidos como se especifica por, pero no se limita a, aminoácidos y azúcares. De este modo, a manera de ejemplo, pero sin limitación, una ribozima que es en parte basada en nucleótido y en parte basada en proteínas se considera una "molécula de ácido nucleico" . Además, a manera de ejemplo, pero no de limitación, una molécula de ácido nucleico que está etiquetada con una fracción detectable, tal como una etiqueta radioactiva o alternativamente una etiqueta no radioactiva, igualmente se considera una "molécula de ácido nucleico" . Los términos "secuencia de ácido nucleico que codifica para" o una "ADN que codifica secuencia de" o una "secuencia de nucleótidos que codifica" una enzima particular - así como otros términos sinónimos - se refieren a una secuencia de ADN que se transcribe y se traduzca en una enzima cuando se coloca bajo el control de secuencias reguladoras adecuadas. Una "secuencia promotora" es una región reguladora de ADN capaz de enlazar polimerasa de ARN en una célula e iniciar la transcripción de una secuencia de codificación corriente abajo (dirección 3'). El promotor es parte de una secuencia de ADN. Esta región de secuencia tiene un codón inicial en su término 3 ' . La secuencia promotora incluye el número mínimo de bases cuyos elementos son necesarios para iniciar la transcripción a niveles detectables sobre el fondo. Más aún, después de que la polimerasa de ARN se enlaza con la secuencia y se inicia la transcripción en el codón inicial (término 3' con un promotor), la transcripción continúa corriente abajo en la dirección 3'. Dentro de la secuencia promotora se encontrará un sitio de iniciación de transcripción (convenientemente definido por el mapeo con la nucleasa SI) así como dominios de enlace de proteína (secuencias de consenso) responsable de enlazar la polimerasa de ARN. Los términos "ácido nucleico que codifica una enzima (proteína) " o "ADN que codifica una enzima (proteína)" o "polinucleótido que codifica una enzima (proteína)" y otros términos sinónimos abarcan un polinucleótido que incluye solamente una secuencia de codificación para la enzima así como un polinucleótido que incluye codificación adicional y/o secuencia de no codificación. En una modalidad preferida, una "especie de molécula de ácido nucleico específica" se define por su estructura química, como se ejemplifica por, pero sin limitarse a, su secuencia primaria. En otra modalidad preferida, una "especie de molécula de ácido nucleico" se define por una función de la especie de ácido nucleico o por una función de un producto derivado de la especie de ácido nucleico. De este modo, a manera de ejemplo no limitante, una "especie molécula de ácido nucleico específica" se puede definir por una o más actividades o propiedades atribuibles a ella, incluyendo actividades o propiedades atribuibles a su producto expresado. La definición presente de "ensamblar una muestra de ácido nucleico de trabajo en una biblioteca de ácido nucleico" incluye el proceso de incorporar una muestra de ácido nucleico en una colección basada en vectores, tales como por ligación en un vector y transformación de una hospedera. Una descripción de vectores relevantes, hospederas, y otros reactivos así como los ejemplos no limitantes específicos de los mismos se proporciona más adelante en la presente . La presente invención de "ensamblar una muestra de ácido nucleico de trabajo en una biblioteca de ácido nucleico" también incluye el proceso de incorporar una muestra de ácido nucleico en una colección basada en un no vector, tal como mediante ligación o adaptadores. Preferiblemente los adaptadores se pueden recocer a cebadores de reacción de cadena de polimerasa para facilitar la amplificación mediante reacción de cadena de polimerasa. De conformidad con lo anterior, en una modalidad no limitante, una "biblioteca de ácido nucleico" está compuesta de una colección basada en vector de una o más moléculas de ácido nucleico. En otra modalidad preferida una "biblioteca de ácido nucleico" está compuesta de una colección basada en vectores de moléculas de ácido nucleico. En todavía otra modalidad preferida una "biblioteca de ácido nucleico" está compuesta de una colección combinada de moléculas de ácido nucleico que en parte se basa en vector y en parte no se basa en vectores. Preferiblemente, la colección de moléculas que comprenden una biblioteca es susceptible de buscarse y separarse de acuerdo con la especie de moléculas de ácido nucleico individuales. La presente invención proporciona una "construcción de ácido nucleico" o alternativamente una "construcción de nucleóti-do" o alternativamente una "construcción de ADN". El término "construcción" se usa en la presente para describir una molécula, tal como un polinucleótido (por ejemplo, un polinucleótido fitasa) que se puede opcionalmente o químicamente enlazar a una o más fracciones moleculares adicionales, tales como un vector, o parte de un vector. En un aspecto específico - pero no limitante, una construcción de nucleótidos se ejemplifica mediante una construcción de expresión de ADN conveniente para la transformación de una célula huésped. Un "oligonucleótido" (o sinónimamente un "oligo") se refiere ya sea a un polidesoxinucleótido de cadena simple o dos cadenas complementarias de polidesoxinucleótido que se pueden sintetizar químicamente. Estos oligonucleótidos sintéticos pueden o no tener un fosfato 5'. Aquellos que no se ligarán a otro oligonucleótido sin añadir un fosfato con un ATP en presencia de una quinasa. Un oligonucleótido sintético se ligará a un fragmento que no ha sido desfosforilado. Para lograr la amplificación basada en polimerasa (tal como por reacción de cadena de polimerasa) , un "oligonucleótido degenerado 32 veces que está compuesto de, en serie, cuando menos una primera secuencia homologa, una secuencia N,N,G/T degenerada, y una segunda secuencia homologa" se menciona. Como se usa en este contexto, "homólogo" es en referencia a la homología entre el polinucleótido oligo y el padre que se somete a la amplificación basada en polimerasa. Como se usa en la presente, el término "operablemente enlazado" se refiere a un enlace de elementos de polinucleótidos en una relación funcional . Un ácido nucleico está "operablemente enlazado" cuando se coloca en una relación funcional con otra secuencia de ácidos nucleicos. Por ejemplo, un promotor o me orador se enlaza operativamente a una secuencia de codificación si afecta la transcripción de la secuencia de codificación. Operablemente enlazado significa que las secuencias de ADN que se están enlazando típicamente son contiguas y, cuando es necesario unir dos regiones de codificación de proteínas, contiguas y en marco de lectura. Una secuencia de codificación está "operablemente enlazada con" otra secuencia de codificación cuando la polimerasa de ARN transcribirá las dos secuencias de codificación en un solo ARNm, el cual se traduce entonces en un solo polipéptido que tiene aminoácidos derivados de ambas secuencias de codificación. Las secuencias de codificación no necesitan ser contiguas entre sí en tanto las secuencias expresadas finalmente se procesan para producir la proteína deseada. Como se usa en la presente el término "conjunto de polinucleótidos padre" es un conjunto compuesto de una o más especies de polinucleótidos distintas. Usualmente este término se usa en referencia a un conjunto de polinucleótidos progenie que preferiblemente se obtiene mediante la mutagenización del conjunto padre, en cuyo caso los términos "padre", "iniciar" y "plantilla" se usan intercambiablemente. Como se usa en la presente el término "condiciones fisiológicas" se refiere a la temperatura, pH, fuerza iónica, viscosidad, y parámetros bioquímicos similares que son compatibles con un organismo viable, y/o que típicamente existe intracelularmente en una célula de levadura cultivada viable o célula de mamífero. Por ejemplo, las condiciones intracelulares en una célula de levadura cultivada bajo condiciones de cultivo típicas de laboratorio son condiciones fisiológicas. Las condiciones de reacción convenientes in vi tro para los cocteles de transcripción in vi tro generalmente son condiciones fisiológicas. En general las condiciones fisiológicas in vi tro comprenden 50-200 m NaCl o KCl , pH 6.5-8.5, 20-45°C y 0.001-10 mM catión divalente (por ejemplo, Mg++, Ca++) ; preferiblemente aproximada-mente 150 mM NaCl o KC1, pH 7.2-7.6, 5 mM catión divalente, y frecuentemente incluyen 0.01-1.0 por ciento de proteína no específica (por ejemplo, BSA) . Un detergente no iónico (Tween, NP-40, Tritón X-100) frecuentemente puede estar presente, usualmente a aproximadamente 0.001 a 2 por ciento, típicamente 0.05-0.2 por ciento (volumen/volumen) . Las condiciones acuosas particulares se pueden seleccionar por el practicante de acuerdo con métodos convencionales. Para guía general, las siguientes condiciones acuosas reguladas pueden ser aplicables: 10-250 mM NaCl, 5-50 mM Tris HCl, pH 5-8, con la adición opcional de catión o cationes divalentes y/o queladores metálicos y/o detergentes no iónicos y/o fracciones de membrana y/o agentes anti-formadores de espuma y/o centellantes. La convención estándar (5' a 3') se usa en la presente para describir la secuencia de polinucleótidos de cadena doble. El término "población" como se usa en la presente significa una colección de componentes tales como polinucleótidos, porciones o polinucleótidos o proteínas. Una "población mezclada" significa una colección de componentes que pertenecen a la misma familia de ácidos nucleicos o proteínas (es decir, se relacionan) pero que difieren en su secuencia (es decir, no son idénticas) y por lo tanto en su actividad biológica. Una molécula que tiene una "proforma" se refiere a una molécula que sufre cualquier combinación de una o más modificaciones químicas covalentes o no covalentes (por ejemplo, glicosilación, disociación proteolítica, dimerización u oligome-rización, cambio de conformación inducido por temperatura o inducido por pH, asociación con un co-factor, etcétera) en ruta para alcanzar una forma molecular más madura que tenga una diferencia de propiedades (por ejemplo, un aumento en actividad) en comparación con la molécula de proforma de referencia. Cuando dos o más modificaciones químicas (por ejemplo, dos disociaciones proteolíticas , o una disociación proteolítica y una desglicosila-ción) se puede distinguir en ruta a la producción de una molécula madura, la molécula precursora de referencia se puede denominar una molécula "pre-proforma" . Como se usa en la presente, el término "pseudo-aleatorio" se refiere a un conjunto de secuencias que tiene una variabilidad limitada, tales como, por ejemplo, el grado de variabilidad residual en otra posición, pero cualquier posición pseudo-aleatoria que permita algún grado de variación de residuo, circunscrita sin embargo. "Unidades casi repetidas", como se usa en la presente, se refiere a las repeticiones que se van a reasignar y por definición no son idénticas. Sin duda el método se propone no solamente para codificar prácticamente idénticas unidades producidas por mutagénesis de la secuencia inicial idéntica, sino también la reclasificación de secuencias similares o relacionadas que pueden diferenciarse significativamente en algunas regiones. Sin embargo, si las secuencias contienen homologías suficientes para ser reclasificadas por este enfoque, se pueden denominar unidades "casi repetidas" . Como se usa en la presente "biblioteca de péptidos aleatorios" se refiere a un conjunto de secuencia de polinucleó-tidos que codifican un conjunto de péptidos aleatorios, y al conjunto de péptidos aleatorios codificados por estas secuencias de polinucleótidos, así como las proteínas de fusión que contienen estos péptidos aleatorios. Como se usa en la presente, "secuencia de péptido aleatorio" se refiere a una secuencia de aminoácidos compuesta de dos o más monómeros de aminoácidos y construidos por un proceso estocástico o aleatorio. Un péptido aleatorio puede incluir una estructura o motivos de andamio, que puede comprender secuencias invariantes . Como se usa en la presente, "receptor" se refiere a una molécula que tiene una afinidad por un ligando dado. Los receptores se pueden presentar naturalmente o pueden ser moléculas sintéticas. Los receptores se pueden emplear en un estado inalterado o como agregados con otras especies. Los receptores se pueden unir, covalentemente o no cova1entemente, a un miembro de enlace, ya sea directamente o vía una sustancia de enlace específica. Ejemplos de receptores incluyen, pero no se limitan a, anticuerpos, incluyendo anticuerpos monoclonales y reactivos de antisuero con determinantes antigénicos específicos (tales como sobrevirus, células, u otros materiales) , receptores de membrana celular, carbohidratos complejos y glicoproteínas, enzimas, y receptores de hormonas. Enzimas "recombinantes" se refieren a enzimas producidas por técnicas de ADN recombinantes, es decir, producidas a partir de células transformadas por una construcción de ADN exógena que codifica la enzima deseada. Enzimas "sintéticas" son aquellas preparadas por síntesis química. El término "polinucleótidos relacionados" significa que las regiones o áreas de los polinucleótidos son idénticas y las regiones o áreas de los polinucleótidos son heterólogas. "Reclasificación reductiva" , como se usa en la presente, significa aumentar la diversidad molecular que se alcanza a través de la supresión (y/o inserción) que son mediados por secuencias repetidas. Los siguientes términos se usan para describir las relaciones de secuencias entre dos o más polinucleótidos: "secuencia de referencia", "ventana de comparación", "identidad de secuencia", "porcentaje de identidad de secuencia" e "identidad sustancial" . Una "secuencia de referencia" es una secuencia definida usada como una base para una comparación de secuencias; una secuencia de referencia puede ser un subconjunto de una secuencia más grande, por ejemplo, como un segmento de una secuencia de genes o de ADNc de longitud completa dada en un listado de secuencias, o puede comprender una secuencia de genes o de ADNc completa. Generalmente, una secuencia de referencia tiene cuando menos 20 nucleótidos de longitud, frecuentemente cuando menos 25 nucleótidos de longitud, y frecuentemente cuando menos 50 nucleótidos de longitud. Ya que dos polinucleótidos pueden cada uno (1) comprender una secuencia (es decir, una porción de una secuencia de polinucleótidos completa) que sea similar entre dos polinucleótidos y (2) además puede comprender una secuencia que sea divergente entre dos polinucleótidos, las comparaciones de secuencia entre dos (o más) polinucleótidos típicamente se realizan comparando secuencias de los polinucleótidos sobre una "ventana de comparación" para identificar y comparar regiones locales de similaridad de secuencia. "índice repetitivo (RI)", como se usa en la presente, es el número promedio de copias de las unidades casi repetidas contenidas en el vector de clonación. El término "sitio de restricción" se refiere a una secuencia de reconocimiento que es necesaria para la manifestación de la acción de una enzima de restricción, e incluye un sitio de disociación catalítica. Se aprecia que un sitio de disociación puede o no estar contenido dentro de una porción de un sitio de restricción que comprende una secuencia de baja ambigüedad (es decir, una secuencia que contiene el determinante principal de la frecuencia de ocurrencia del sitio de restricción) . De este modo, en muchos casos, los sitios de restricción relevantes contienen solamente una secuencia de ambigüedad baja con un sitio de disociación interna (por ejemplo, G/AATTC en el sitio EcoR I) o un sitio de disociación inmediatamente adyacente (por ejemplo, /CCWGG en el sitio EcoR II) . En otros casos, las enzimas de restricción relevantes [por ejemplo, el sitio Eco57 I o CTGAAG (16/14 ) ] contiene una secuencia de baja ambigüedad (por ejemplo, la secuencia CTGAAG en el sitio Eco57 I) con un sitio de disociación externo (por ejemplo, en la porción N16 del sitio Eco57 I) . Cuando una enzima (por ejemplo, una enzima de restricción) se dice que "disocia" un polinucleótido, se entiende que significa la enzima de restricción cataliza o facilita una disociación de un polinucleótido. En un aspecto no limitante, un "polinucleótido seleccionable" está compuesto de una región terminal 5' (o región final) , una región intermedia (es decir, una región interna o central), y una región 3' terminal (o región extrema). Como se usa en este aspecto, una región terminal 5' es una región que se localiza hacia un término de polinucleótido 5' (o un extremo de polinucleótido 5'); de este modo está ya sea parcialmente o enteramente en una mitad 5' de un polinucleótido. Igualmente, una región terminal 3' es una región que se localiza hacia un término de polinucleótido 3' (o un extremo de polinucleótido 3 ' ) ; de este modo está ya sea parcialmente o completamente en una mitad 3' de un polinucleótido. Como se usa en este ejemplo no limitante, puede haber un traslape de secuencias entre dos regiones o aún entre tres regiones.
El término "identidad de secuencia" significa que dos secuencias de polinucleótidos son idénticas (es decir, en una base de nucleótido por nucleótido) sobre la ventana de comparación. El término "porcentaje de identidad de secuencia" se calcula comparando dos secuencias alineadas óptimamente sobre la ventana de comparación, determinando un número de posiciones en las cuales las bases de ácidos nucleicos idénticas (por ejemplo, A, T, C, G, U, o í) se presentan en ambas secuencias para producir el número de posiciones apareadas, dividiendo el número de posiciones apareadas por el número total de posiciones en la ventana de comparación (es decir, el tamaño de ventana) , y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia. Esta "identidad sustancial", como se usa en la presente, denota una característica de una secuencia de polinucleótidos, en donde el polinucleótido comprende una secuencia que tiene cuando menos 80 por ciento de identidad de secuencia, preferiblemente cuando menos 85 por ciento de identidad, frecuentemente del 90 al 95 por ciento de identidad de secuencia, y más comúnmente cuando menos 99 por ciento de identidad de secuencia en comparación con una secuencia de referencia de una ventana de comparación de cuando menos 25-50 nucleotidos, en donde el porcentaje de identidad de secuencia se calcula comparando la secuencia de referencia con la secuencia de polinucleótidos que puede incluir supresiones o adiciones en donde el total del 20 por ciento menos de la secuencia de referencia sobre la ventana de comparación. Como se conoce en la técnica "similaridad" entre dos enzimas se determina comparando la secuencia de aminoácidos y sus sustitutos de aminoácidos conservados de una enzima a la secuencia de una segunda enzima. Similaridad se puede determinar por procedimientos que son muy conocidos en la técnica, por ejemplo, un programa BLAST (Basic Local Alignment Search Tool en el National Center for Biological Information) . Como se usa en la presente, el término "anticuerpo de cadena simple" se refiere a un polipéptido que comprende un dominio VH y un dominio VL en el enlace de polipéptidos, general mente enlazado vía un péptido separador (por ejemplo, [Gly-Gly-Gly-Gly-Ser] x) , y el cual comprende secuencias de aminoácidos adicionales en los términos amino y/o carboxi . Por ejemplo, un anticuerpo de cadena simple puede comprender un segmento de ronzal para enlazar al polinucleótido de codificación. Como un ejemplo, un scFv es un anticuerpo de cadena simple. Los anticuerpos de cadena simples generalmente son proteínas que consisten en uno o más segmentos de polipéptidos de cuando menos 10 aminos contiguos codificados por genes de la superfamilia de inmunoglobulinas (por ejemplo, ver Williams y Barclay, 1989, páginas 361-368, la cual se incorpora en la presente mediante referencia) , más frecuentemente codificado por una secuencia de genes de cadena ligera o cadena pesada de roedores, primates no humanos, aves, porcinos, bovinos, ovinos, cabra o humanos. Un anticuerpo de cadena simple funcional generalmente contiene una porción suficiente de producto de gen de superfamilia de inmunoglobulinas para retener la propiedad de enlace con una molécula objetivo específica, típicamente un receptor o antígeno (epítope) . Los miembros de un par de moléculas (por ejemplo, un par anticuerpo-antígeno o un par de ácidos nucleicos) se dice que "se enlaza específicamente" uno al otro si se enlazan con el otro con una afinidad mayor que a otra molécula no específica. Por ejemplo, un anticuerpo cultivado contra un antígeno con el cual se enlaza más eficientemente que con una proteína no específica se puede describir como que se enlaza específicamente al antígeno. (Similarmente, una sonda de ácido nucleico se puede describir como que se enlaza específicamente con un objetivo de ácido nucleico y forma un dúplex específico con objetivo mediante interacciones de pares de bases (ver anteriormente) ) . "Hibridación específica" se define en la presente como la formación de híbridos entre un primer polinucleótido y un segundo polinucleótido (por ejemplo, un polinucleótido que tiene una secuencia distinta pero sustancialmente idéntica al primer polinucleótido) , en donde las secuencias de polinucleótido sustancialmente no relacionadas no forman híbridos en la mezcla. El término "polinucleótido específico" significa un polinucleótido que tiene ciertos puntos extremos y que tiene cierta secuencia de ácido nucleico. Dos polinucleótidos en donde un polinucleótido tiene la secuencia idéntica como una porción del segundo polinucleótido pero diferentes extremos comprende dos diferentes polinucleótidos específicos. "Condiciones de hibridación estricta" significa que la hibridación ocurrirá solamente si hay cuando menos 90 por ciento de identidad, preferiblemente cuando menos 95 por ciento de identidad y más preferiblemente cuando menos 97 por ciento de identidad entre las secuencias. Véase Saxnbrook y colaboradores, 1989, el cual se incorpora mediante la presente por entero como referencia . También se incluye en la invención polipéptidos que tienen secuencias que son "sustancialmente idénticas" a la secuencia de un polipéptido fitasa, tal como una de SEQ ID 1. Una secuencia de aminoácidos "sustancialmente idéntica" es una secuencia que difiere de una secuencia de referencia únicamente por sustituciones de aminoácidos conservadoras, por ejemplo, sustituciones de un aminoácido por otro de la misma clase (por ejemplo, la sustitución de un aminoácido hidrófobo, tal como isoleucina, valina, leucina, o metionina, por otro, o sustitución de un aminoácido polar por otro, tal como la sustitución de arginina por lisina, ácido glutámico por ácido aspártico, o glutamina por asparagina) . Adicionalmente una secuencia de aminoácidos "sustancialmente idéntica" es una secuencia que difiere de una secuencia de referencia o por una o más sustituciones, supresiones, o inserciones no conservadoras, particularmente cuando esta sustitución se presenta en un sitio que no es el sitio activo de la molécula, y a condición de que el polipéptido esencialmente retenga propiedades de comportamiento. Por ejemplo, uno o más aminoácidos se pueden suprimir de un polipéptido fitasa, dando como resultado la modificación de la estructura del polipéptido, sin alterar significativamente su actividad biológica. Por ejemplo, los aminoácidos amino o carboxilo terminales que no se requieren para la actividad biológica de fitasa se pueden remover. Estas modificaciones pueden dar como resultado el desarrollo de polipéptidos de fitasa activos más pequeños. La presente invención proporciona una "enzima sustancialmente pura" . El término "enzima sustancialmente pura" se usa en la presente para describir una molécula, tal como un polipéptido (por ejemplo, un polipéptidos fitasa, o un fragmento del mismo) que está sustancialmente libre de otras proteínas, llpidos, carbohidratos, ácidos nucleicos, y otros materiales biológicos con los cuales se asocia naturalmente. Por ejemplo, una molécula sustancialmente pura tal como un polipéptido, puede ser cuando menos 60 por ciento, en peso seco, la molécula de interés. La pureza de los polipéptidos se puede determinar usando métodos estándares que incluyen, por ejemplo, electrofore-sis en gel de poliacrilamida {por ejemplo, SDS-PAGE) , cromatografía en columna (por ejemplo, cromatografía líquida de alto rendimiento (HPLC) ) , análisis de secuencia de aminoácidos amino-terminales . Como se usa en la presente, "sustancialxnente puro" significa una especie de objeto es la especie predominante presente (es decir, en una base molar es más abundante que cualquier otra especie macromolecular individual en la composición) , y fracción preferiblemente sustancialmente purificada es una composición en donde la especie objeto comprende cuando menos aproximadamente 50 por ciento (en una base molar) de todas las especies macromoleculares presentes. Generalmente, una composición sustancialmente pura comprenderá más de aproximadamente 80 a 90 por ciento de todas las especies macromoleculares presentes en la composición. Más preferiblemente, la especie objeto se purifica a homogeneidad esencial (las especies contaminantes no se detectan en la composición mediante métodos de detección convencionales) en donde la composición consiste esencialmente en una sola especie macromolecular. Las especies solventes, moléculas pequeñas (<500 Daltons) , y las especies de iones elementales no se consideran especies macromoleculares. Como se usa en la presente, el término "segmento variable" se refiere a una porción de péptido naciente el cual comprende una secuencia nuclear aleatoria, pseudo-aleatoria, o definida. Un "segmento variable" se refiere a una porción de un péptido naciente que comprende una secuencia nuclear aleatoria, pseudo-aleatoria, o definida. Un segmento variable puede comprender tanto posiciones residuales variantes como invarian- tes, y el grado de variación de residuo en una posiciones de residuo variante se puede limitar: ambas opciones se seleccionan a la discreción del practicante. Típicamente, los segmentos variables son aproximadamente de 5 a 20 residuos de aminoácidos de longitud (por ejemplo, 8 a 10) , aunque los segmentos variables pueden ser más largos y pueden comprender porciones de anticuerpos o proteínas receptores, tales como un fragmento de anticuerpo una proteína de enlace de ácido nucleico, una proteína receptora, y similares. El término "tipo natural" significa que el polinucleó-tido no comprende mutaciones. Una proteína del "tipo natural" significa que la proteína será activa a un nivel de actividad encontrado en la naturaleza y comprenderá la secuencia de aminoácidos encontrada en la naturaleza. El término "trabajo", como en "muestra de trabajo", por ejemplo, simplemente es una muestra con la cual uno está trabajando. Igualmente, una "molécula de trabajo", por ejemplo, es una molécula con la cual se está trabajando. Descripción Detallada de la Invención La invención descrita en la presente se dirige al uso de ciclos repetidos de reclasificación reductiva, recombinación y selección que permite la evolución molecular dirigida de secuencias lineales muy complejas, tales como ADN, ARN o proteínas a través de la recombinación. La mezcla en vivo de moléculas se puede realizar usando la propiedad natural de las células para recombinar multímeros. Mientras que la recombinación en vivo ha proporcionado la mayor ruta natural a la diversidad molecular, la recombinación genética sigue siendo un proceso relativamente complejo que involucra 1) el reconocimiento de homologías; 2) la disociación de cadenas, la invasión de cadenas, y los pasos metabólicos que conducen a la producción de quiasma recombinante; y finalmente 3) la resolución del quiasma en moléculas recombinadas discretas. La formación del quiasma requiere el reconocimiento de secuencias homologas . En una modalidad preferida, la invención se relaciona con un método para producir un polinucleótido híbrido a partir de cuando menos un primer polinucleótido y un segundo polinucleótido. La presente invención se puede usar para producir un polinucleótido híbrido introduciendo cuando menos un primer polinucleótido y un segundo polinucleótido que comparten cuando menos una región de homología de secuencia parcial en una célula hospedera conveniente . Las regiones de homología de secuencia parcial promueven procesos que dan como resultado la reorganización de secuencias produciendo un polinucleótido híbrido. El término "polinucleótido híbrido", como se usa en la presente, es cualquier secuencia de nucleótidos que es resultado del método de la presente invención y contiene secuencia de cuando menos dos secuencias de polinucleótidos originales. Estos polinucleótidos híbridos pueden ser resultado de eventos de recombinación intermolecular los cuales promueven la integración de secuencias entre moléculas de ADN. Además, estos polinucleótidos híbridos pueden ser resultado de procesos de clasificación reductiva intramolecular que utilizan secuencias repetidas para alterar una secuencia de nucleótidos dentro de una molécula de ADN. La invención proporciona un medio para generar polinucleótidos híbridos los cuales pueden codificar polipéptidos híbridos biológicamente activos. En un aspecto, los polinucleótidos originales codifican polipéptidos activos biológicamente. El método de la invención produce nuevos polipéptidos híbridos utilizando procesos celulares que integran la secuencia de los polinucleótidos originales de manera que el polinucleótido híbrido resultante codifica un polipéptido que demuestra actividades derivadas de los polipéptidos originales biológicamente activos. Por ejemplo, los polinucleótidos originales pueden codificar una enzima particular de diferentes microorganismos. Una enzima codificada por un primer polinucleótido a partir de un organismo, por ejemplo, puede funcionar efectivamente bajo una condición ambiental particular, por ejemplo, alta salinidad. Una enzima codificada por un segundo polinucleótido de un organismo diferente puede funcionar efectivamente bajo una condición ambiental diferente, tal como temperaturas extremadamente altas. Un polinucleótido híbrido que contiene secuencias del primero y segundo polinucleótidos originales puede codificar una enzima que exhibe características de ambas enzima codificadas por los polinucleótidos originales. De este modo, la enzima codificada por el polinucleótido híbrido puede funcionar efectivamente bajo condiciones ambientales compartidas por cada una de las enzimas codificadas por el primero y segundo polinucleótidos, por ejemplo, alta salinidad y temperaturas extremas. Las enzimas codificadas de los polinucleótidos originales de la invención incluyen, pero no se limitan a: oxido-reductasas, transferasas , hidrolasas, liasas, isomerasas, y ligasas. Un polipéptido híbrido que resulta del método de la invención puede exhibir actividad de enzima especializada no desplegada en las enzimas originales. Por ejemplo, después de la recombinación y/o la reclasificación reductiva de polinucleótidos que codifican actividades hidrolasas, el polipéptido híbrido resultante codificado por un polinucleótido híbrido puede ser seleccionado para actividades hidrolasa especializadas obtenidas de cada una de las enzimas originales, es decir, el tipo de enlace en el cual actúa la hidrolasa y la temperatura a la cual funciona la hidrolasa. De este modo, por ejemplo, la hidrolasa se puede seleccionar para alcanzar aquellas funcionalidades químicas que distinguen a la hidrolasa híbrida de las hidrolasas originales, tales como: (a) amida (enlaces péptidos) , es decir, proteasas; (b) enlaces éster, es decir, esterasas y lipasas; (c) acétales, es decir, glicosidasas y, por ejemplo, la temperatura, pH o concentración de sal al cual funciona el polipéptido híbrido .
Fuentes de los polinucleótidos originales se pueden aislar de organismos individuales ("aislados"), colecciones de organismos que han sido cultivados en medios definidos ("cultivos de enriquecimiento"), o, más preferiblemente, organismos no cultivados ("muestras ambientales") . El uso de un enfoque independiente del cultivo para derivar polinucleótidos que codifican bio-actividades novedosas a partir de muestras ambientales es más preferible ya que permite que se tenga acceso a recursos no tapados de biodiversidad. "Bibliotecas ambientales" se generan de muestras ambientales y representan genomas colectivos de organismos que se presentan naturalmente logrados en vectores de clonación que se pueden propagar en hospederas procarióticas convenientes. Debido a que el ADN clonado esencialmente se extrae directamente de muestras ambientales, las bibliotecas no se limitan a la fracción pequeña de procariotes que se pueden cultivar en cultivo puro. Adicionalmente, una normalización del ADN ambiental presente en estas muestras podría permitir una representación más igual del ADN de todas las especies presentes en la muestra original. Esto puede aumentar dramáticamente la eficiencia de encontrar genes interesantes a partir de constituyentes menores de la muestra los cuales pueden sub-representar en varios órdenes de magnitud comparados con las especies dominantes. Por ejemplo, las bibliotecas de genes generados de uno o más micro-organismos no cultivados se seleccionan por una actividad de interés. Las sendas potenciales que codifican moléculas bio-activas de interés se capturan primero en células procarióticas en formas de bibliotecas de expresión de genes. Los polinucleótidos que codifican actividades de interés se aislan de estas bibliotecas y se introducen en una célula hospedera. La célula hospedera se cultiva bajo condiciones que promueven recombinación y/o la reclasificación reductiva creando biomoléculas potencialmente activas con actividades novedosas o aumentadas . Los micro-organismos a partir de los cuales el polinucleótido se puede preparar incluyen micro-organismos procarióticos, tales como Eubacteria y Archaebacteria, y microorganismos eucarióticos inferiores tales como hongos, algunas algas y protozoarios . Los polinucleótidos se pueden aislar de muestras ambientales en cuyo caso el ácido nucleico se puede recuperar sin el cultivo de un organismo o recuperar uno o más organismos cultivados. En un aspecto, estos micro-organismos pueden ser extremófilos, tales como hipertermófilos, psicrófilos, psicótropos, halófilos, barófilos y acidófilos. Los polinucleótidos que codifican enzimas aislados de los organismos extremofí-licos se prefieren particularmente. Estas enzimas pueden funcionar a temperaturas por encima de 100°C en manantiales calientes terrestres y en vientos térmicos de mares profundos, a temperaturas por debajo de 0°C en aguas árticas, en el ambiente saturado de sal del Mar Muerto, a valores de pH alrededor de 0 en depósitos de carbón y en manantiales sulfúricos geotérmicos, o en valores de pH mayores de 11 en material de drenaje. Por ejemplo, varias esterasas y lipasas clonadas y expresadas a partir de organismos extremofílieos muestran alta actividad en todo un amplio rango de temperaturas y. pHs. Los polinucleótidos seleccionados y aislados como se describe anteriormente en la presente se introducen en una célula hospedera conveniente. Una célula hospedera conveniente es cualquier célula que sea capaz de promover la recombinación y/o la reclasificación reductiva. Los polinucleótidos seleccionados preferiblemente están en un vector el cual incluye secuencias de control adecuadas . La célula huésped puede ser una célula eucariótica superior, tal como una célula de mamífero, o una célula eucariótica inferior, tal como una célula de levadura, o preferiblemente la célula huésped puede ser una célula procarió-tica, tal como una célula bacteriana. La introducción de la construcción en la célula huésped se puede efectuar mediante transfección con fosfato de calcio, transfección mediada por DEAE-Dextran o electroincorporación (Davis y colaboradores, 1986) . Como ejemplos representativos de hospederas adecuadas, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Sal onella typhimurium; células de hongos, tales como levaduras; células de insectos tales como Drosophila S2 y Spodoptera Sf9; células animales tales como CHO, COS o melanoma Bowes; adenovirus; y células vegetales. La selección de una hospedera adecuada se considera estar dentro del alcance de los técnicos en la materia a partir de las enseñanzas en la presente. Con referencias particulares a varios sistemas de cultivos celulares de mamíferos que se pueden emplear para expresar la proteína recombinante, ejemplos de sistema de expresión de mamíferos incluyen las líneas COS-7 de fibroblastos de riñon de mono, descritos en "SV 0-transíormed simian cells support the replication of early SV40 mutants" (Gluzman, 1981) , y otras líneas celulares capaces de expresar un vector compatible, por ejemplo, las líneas celulares C127, 3T3, CHO, HeLa y BHK. Los vectores de expresión de mamíferos comprenderán un origen de réplica, un promotor conveniente y mejorador, y también cualquier sitio de enlace de ribosoma necesarios, un sitio de poliadenilación, un donador de traslape y sitio aceptador, secuencias de terminación de transcripción, y secuencias no transcritas que flanquean 5'. Secuencias de ADN derivadas del traslape SV40, y sitios de poliadenilación se pueden usar para proporcionar los elementos genéticos no transcritos requeridos. Las células hospederas que contienen polinucleótidos de interés se pueden cultivar en medio nutriente convencional modificado como sea apropiado para promotores de activación, transformantes de selección o genes de amplificación. Las condiciones de cultivo, tales como la temperatura, pH y similares, son las previamente usadas con la célula hospedera seleccio-nada para la expresión, y será aparente para el técnico en la materia. Las clonas que se identifican por tener una actividad de enzima específica se pueden secuenciar para identificar la secuencia de polinucleótidos que codifica una enzima que tiene la actividad mejorada. En otro aspecto, se considera que el método de la presente invención se puede usar para generar polinucleótidos novedosos que codifican sendas bioquímicas de uno o más operones o racimos de genes o porciones de los mismos. Por ejemplo, las bacterias y muchos eucariotes tienen un mecanismo coordinado para genes de regulación cuyos productos se involucran en procesos relacionados. Los genes se agrupan en racimos, en estructuras denominadas "racimos de genes" , o en un solo cromosoma y se transcriben juntos bajo el control de una sola secuencia reguladora, que incluye un solo promotor que inicia la transcripción del racimo entero. De este modo, un racimo de genes es un grupo de genes adyacentes que son ya sea idénticos o relacionados, usualmente con respecto a su función. Un ejemplo de una senda bioquímica codificada por racimos de genes son los poliquetidas . Los poliquetidas son moléculas que son una fuente extremadamente rica de bio-actividades, incluyendo los antibióticos (tales como las tetraciclinas y la eritromicina) , agentes anti-cáncer (daunomicina) , inmunosupresores (FK506 y rapamicina) , y productos veterinarios (monensina) . Muchas poliquetidas (producidas por sintasas de poliquetidas) son valiosas como agentes terapéuticos. Las sintasas poliquetidas son enzimas multi-funcionales que catalizan la biosíntesis de una gran variedad de cadenas de carbono que difieren en longitud y patrones de funcionalidad y ciclización. Los genes de poliqueti-da sintasa caen en racimos de genes y cuando menos un tipo (designado tipo I) de sintasas de poliquetida tienen genes y enzimas de gran tamaño, complicando la manipulación genética y los estudios in vi tro de estos genes/proteínas. La capacidad para seleccionar y combinar los componentes deseados de una biblioteca de poliquetidas, o fragmentos de las mismas, y los genes de biosíntesis de postpoliquetida para la generación de poliquetidas novedosas para estudio es atractivo. El método de la presente invención hace posible facilitar la producción de sintasas de poliquetida novedosas a través de recombinación intermolecular. Preferiblemente, el ADN de racimos de genes se puede aislar de diferentes organismos y ligar en vectores, particularmente vectores que contienen secuencias reguladoras de expresión que pueden controlar y regular la producción de una proteína detectable o actividad de arreglo relacionado de proteína a partir de los racimos de genes ligados. El uso de vectores que tienen una capacidad excepcionalmente grande para la introducción de ADN exógena es particularmente adecuado para su uso con estos racimos de genes y se describe a manera de ejemplo en la presente para incluir el factor f (o factor fertilidad) de E. coli. Este factor f de E. coli es un plásmido que afecta la transferencia de alta frecuencia de sí mismo durante la conjugación y es ideal para lograr y propagar establemente fragmentos de ADN grande, tales como racimos de genes a partir de muestras microbianas mezcladas. Una vez ligado en un vector adecuado, dos o más vectores que contienen diferentes racimos de genes poliquetida sintasa se pueden introducir en una célula hospedera conveniente. Las regiones de homología de secuencia parcial compartidas por los racimos de genes promoverán procesos que darán como resultado la reorganización de secuencias dando como resultado un racimo de genes híbrido. El racimo de genes híbrido novedoso se puede seleccionar para actividades mejoradas no encontradas en los racimos de genes originales. Por lo tanto, en una modalidad preferida, la presente invención se relaciona con método para producir un polipéptido híbrido biológicamente activo y seleccionar este polipéptido para actividad mejorada mediante: 1) introducir cuando menos un primer polinucleótido en enlace operable y un segundo polinucleótido en enlace operable, el cuando menos un polinucleótido y segundo polinucleótido comparten cuando menos una región de homología de secuencia parcial, en una célula hospedera conveniente; 2) cultivar la célula hospedera bajo condiciones que promuevan la reorganización de secuencia resultante en un polinucleótido híbrido en enlace operable; 3) expresar un polipéptido híbrido codificado por el polinucleótido híbrido; 4) seleccionar el polipéptido híbrido bajo condiciones que promueven la identificación de actividad biológica aumentada; y 5) aislar un polinucleótido que codifica el polipéptido híbrido. Los métodos para seleccionar las diferentes actividades de enzimas son conocidas para los técnicos en la materia y se discuten en toda la presente especificación. Estos métodos se pueden emplear cuando se aislan los polipéptidos y polinucleóti-dos de la presente invención. Como ejemplos representativos de vectores de expresión que se pueden usar se pueden mencionar partículas virales, baculovirus, fago, plásmidos, fagémidos, cósmidos, fósmidos, cromosomas artificiales bacterianos, ADN viral (por ejemplo, vacuna, adenovirus, virus de viruela de ave, pseudo-rabia y derivados de SVO40) , cromosomas artificiales basados en Pl, plásmidos de levadura, cromosomas artificiales de levadura, y cualquier otro vector específico para hospederas específicas de interés (tales como bacilus, aspergilus y levadura) . De este modo, por ejemplo, el ADN se puede incluir en cualquiera de una variedad de vectores de expresión para expresar un polipéptido. Estos vectores incluyen secuencias cromosomales, no cromosomales y de ADN sintético. Grandes números de vectores convenientes son conocidos para los técnicos en la materia, y están comercialmente disponibles. Los siguientes vectores se proporcionan de manera de ejemplo; bacterianos: vectores pQE (Qiagen) , plásmidos pBluescript, vectores p H, (vectores lambda-ZAP (Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); eucarióticos : pXTl, pSG5 (Stratagene), pSVK3 , pBPV, pMSG, pSVLSV40 (Pharmacia) . Sin embargo, cualquier otro plásmido u otro vector se puede usar en tanto sea replicable y viable en la hospedera. Un número bajo de copias o vectores con número alto de copias se puede emplear con la presente invención. Un tipo preferido de vector para su uso en la presente invención contiene una réplica de origen de factor f . El factor f (o factor fertilidad) en E. coli es un plásmido que efectúa transferencia de alta frecuencia de sí mismo durante la conjugación y transferencia menos frecuente del mismo cromosoma bacteriano. Una modalidad particularmente preferida es usar vectores de clonación, conocidos como "fósmidos" o vectores de cromosomas artificiales bacterianos (BAC) . Estos se derivan del factor f de E. coli que es capaz de integrar establemente segmentos grandes de ADN genómico. Cuando se integra con ADN a partir de una muestra ambiental no cultivada mezclada, esto hace posible lograr grandes fragmentos genómicos en forma de una "biblioteca de ADN ambiental" estable. Otro tipo preferido de vector para su uso en la presente invención es un vector cósmido. Los vectores cósmidos originalmente se diseñaron para clonar y propagar grandes segmentos de ADN genómico. La clonación en vectores cósmidos se describen en detalle en "Molecular Cloning: A laboratory Manual" (Sambrook y colaboradores, 1989) . La secuencia de ADN en el vector de expresión está operativamente enlazado a una secuencia o secuencias de control de expresión adecuadas (promotores) para dirigir la síntesis de ARN . Los promotores bacterianos particulares incluyen lacl, lacZ, T3 , T7, gpt, lambda PR, PL y trp. Los promotores eucarióti-cos incluyen CMV inmediato temprano, HSV timidina quinasa, SV40 temprano y tardío, LTR de retrovirus, y metalotionein-I de ratón. La selección del vector y promotor apropiados está bien dentro del nivel de experiencia ordinaria en la técnica. El vector de expresión también contiene un sitio de enlace de ribosoma para el inicio de la traducción y un terminador de la transcripción. El vector también puede incluir secuencias adecuadas para la expresión de amplificación. Las regiones promotoras se pueden seleccionar a partir de cualquier gen deseado usando vectores CAT (cloranfenicol transferasa) u otros vectores con marcadores seleccionables . Además, los vectores de expresión preferiblemente contienen uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para la selección de células hospederas transformadas tales como dihidrofolato reductasa o resistencia a la neomicina para cultivo celular eucariótico, o tal como resistencia a la tetraciclina o ampicilina en E. coli. Generalmente, los vectores de expresión recombinantes incluirán orígenes de réplica y marcadores seleccionables que permiten la transformación de la célula hospedera, por ejemplo, el gen de resistencia a la ampicilina de E. coli y S. cerevisiae el gen TRP1, y un promotor derivado de un gen muy expresado para dirigir la transcripción de una secuencia estructural corriente abajo. Estos promotores se pueden derivar a partir de operones que codifican enzimas glicolíticas tales como 3-fosfoglicerato quinasa (PGK) , factor alfa, fosfatasa ácida, o proteínas de choque por calor, entre otras. La secuencia estructural heteróloga se ensambla en fase adecuada con inicio de la traducción y secuencias de terminación, y preferiblemente, una secuencia delantera capaz de dirigir la secreción de la proteína producida en el espacio periplásmico o medio extracelular. La estrategia de clonación permite la expresión vía tanto el vector dirigido y los promotores endógenos; la promoción de vector puede ser importante con la expresión de genes cuyo promotor endógeno no funcionará en E. coli. El ADN aislado o derivado de micro-organismos preferiblemente puede insertarse en un vector o en un plásmido antes de sondear el ADN seleccionado. Estos vectores o plásmidos preferiblemente son los que contienen secuencias reguladoras de expresión, incluyendo promotores, mejoradores y similares . Estos polinucleótidos pueden ser parte de un vector y/o una composición y todavía ser aislados, porque este vector o composición no es parte de su ambiente natural. El fago o plásmido particularmente preferido y los métodos para introducción y empacarlos se describen en detalle en el protocolo presentado en la presente. La selección del vector de clonación depende del enfoque tomado, por ejemplo, el vector puede ser cualquier vector de clonación con una capacidad adecuada para multiplicar copias repetidas de una secuencia, o múltiples secuencias que se pueden transformar exitosamente y seleccionar en una célula hospedera. Un ejemplo de este vector se describe en "Polycos vectors: a system for packaging filamentous phage and phagemid vectors using lambda phage packaging extracts" (Alting-Mecs y Short, 1993) . La propagación/mantenimiento puede ser mediante una resistencia al antibiótico llevado por el vector de clonación. Después de un período de crecimiento, las moléculas abreviadas naturalmente se recuperan e identifican mediante fraccionamiento por tamaño en un gel o columna, o se amplifica directamente. El vector de clonación utilizado puede contener un gen seleccionable que se interrumpe por la inserción de la construcción larga. Conforme continúa la reclasificación reductiva, el número de unidades repetidas se reduce y el gen interrumpido de nuevo se expresa y por lo tanto la selección para la construcción procesada se puede aplicar. El vector puede ser un vector de expresión/selección que permitirá la selección de un producto expresado que posee propiedades biológicamente deseables . El inserto se puede colocar corriente abajo de un promotor funcional y la propiedad deseable seleccionar por medios adecuados . La reclasificación en vivo se enfoca sobre procesos "intermoleculares" colectivamente denominado como "recombinación" en el cual en bacterias, generalmente se ve como un fenómeno "dependiente de RecA" . La presente invención puede depender en procesos de recombinación de una célula hospedera con secuencias de recombinación y reclasificación, o la capacidad de las células para mediar procesos reductivos para disminuir la complejidad de secuencias casi repetidas en la célula mediante supresión. Este proceso de "reclasificación reductiva" se presenta mediante un proceso independiente de RecA "intramolecular" . Por lo tanto, en otro aspecto de la presente invención, polinucleótidos novedosos se pueden generar mediante el proceso de reclasificación reductiva. El método involucra la generación de construcciones que contienen secuencias consecutivas (secuencias de codificación originales) , su inserción en un vector adecuado, y su introducción subsecuente en una célula hospedera adecuada. La reclasificación de las identidades moleculares individuales se presenta mediante procesos combinatorios entre las secuencias consecutivas en la construcción que posee regiones de homología, o entre unidades casi repetidas. El proceso de reclasificación recombina y/o reduce la complejidad y el grado de secuencias repetidas, y da como resultado la producción de especies moleculares novedosas. Varios tratamientos se pueden aplicar para aumentar el régimen de reclasificación. Estos podrían incluir tratamiento con luz ultravioleta, o productos químicos que dañan el ADN, y/o el uso de líneas celulares hospederas que despliegan niveles aumentados de "inestabilidad genética" . De este modo el proceso de reclasificación puede involucrar combinación homologa o la propiedad natural de secuencias casi repetidas para dirigir su propia evolución. Las secuencias repetidas o "casi repetidas" representan un papel en la inestabilidad genética. En la presente invención, las "casi repeticiones" son repeticiones que no se restringen a su estructura unitaria original. Las unidades casi repetidas se pueden presentar como un arreglo de secuencias en una construcción; unidades consecutivas de secuencias similares. En cuanto se ligan, las uniones entre las secuencias consecutivas se vuelven esencialmente invisibles y la naturaleza casi repetitiva de la construcción resultante ahora es continua al nivel molecular. El proceso de supresión la célula realiza para reducir la complejidad de la construcción resultante opera entre las secuencias casi repetidas. Las unidades casi repetidas proporcionan un repertorio prácticamente inagotable de plantillas sobre las cuales se pueden presentar eventos de traslape. Las construcciones que contienen casi repeticiones efectivamente de este modo proporcionan suficiente elasticidad molecular que los eventos de supresión (y potencialmente inserción) pueden presentarse virtualmente en cualquier lado dentro de las unidades casi repetitivas. Cuando las secuencias casi repetitivas se ligan en la misma orientación, por ejemplo, cabeza a cola o viceversa, la célula no puede distinguir unidades individuales. En consecuencia, el proceso reductivo se puede presentar en todas las secuencias. En cambio, cuando por ejemplo, las unidades se presentan cabeza a cabeza, en lugar de cabeza a cola, la inversión de línea los puntos extremos de la unidad adyacente de manera que la formación de supresión favorecerá la pérdida de unidades discretas. De este modo, es preferiblemente que el presente método que las secuencias estén en la misma orientación. La orientación aleatoria de secuencias casi repetidas dará como resultado la pérdida de eficiencia de reclasificación, al mismo tiempo que la orientación consistente de las secuencias ofrecerá la eficiencia más alta. Sin embargo, aunque se tienen menos de las secuencias contiguas en la misma orientación se disminuye la eficiencia, puede todavía proporcionar suficiente elasticidad para la recuperación efectiva de moléculas novedosas. Las construcciones se pueden hacer con secuencias casi repetidas en la misma orientación para permitir mayor eficiencia. Las secuencias se pueden ensamblar en orientación cabeza a cola usando cualquiera de una variedad de métodos, incluyendo los siguientes: a) se pueden utilizar cebadores que incluyen una cabeza poli-A y cola poli-T las cuales cuando se hacen de cadena simple proporcionarían orientación. Esto se lleva a cabo haciendo que las primeras bases de los cebadores se hagan de AR y entonces fácilmente se remueve la RNA seH. b) cebadores que incluyen sitios de disociación de restricción únicos se pueden utilizar. Se requerirían pasos de sitios múltiples, una batería de secuencias únicas, y pasos de síntesis repetida y ligación. c) las pocas bases internas del cebador podrían ser tioladas y una exonucleasa usarse para producir moléculas con cola adecuadamente . La recuperación de las secuencias reclasificadas se basa en la identificación de los vectores de clonación con un RI reducido. Las secuencias de codificación reclasificadas se pueden recuperar mediante amplificación. Los productos se re-clonan y expresan. La recuperación de vectores de clonación con RI reducida se pueden efectuar mediante: 1) el uso de vectores solamente establemente mantenidos cuando la construcción se reduce en complejidad. 2) la recuperación física de vectores acortados por procedimientos físicos. En este caso, el vector de clonación se recuperaría usando procedimientos de aislamiento de plásmidos estándares y fraccionando el tamaño ya sea en gel de agarosa, o columna con un corte de peso molecular bajo usando procedimientos estándares . 3) la recuperación de vectores que contienen genes interrumpidos que se pueden seleccionar cuando el tamaño del inserto disminuye. 4) el uso de técnicas de selección directas con un vector de expresión y la selección adecuada. Las secuencias de codificación (por ejemplo, genes) de organismos relacionados puede demostrar un alto grado de homología y codificar productos de proteínas bastante diversos. Estos tipos de secuencia son particularmente útiles en la presente invención como casi repeticiones. Sin embargo, mientras que los ejemplos ilustrados más adelante demuestran la reclasificación de secuencias de codificación originales casi idénticas (casi repeticiones) , este proceso no se limita a estas repeticiones casi idénticas. El siguiente ejemplo demuestra el método de la invención. La codificación de secuencias de ácido nucleico (casi repeticiones) derivadas de tres (3) especies únicas se representa. Cada secuencia codifica una proteína con un conjunto distinto de propiedades. Cada una de las secuencias difiere por una sola o unas pocas pares de bases en una posición única en la secuencia que se designa WA" , "B" y "C" . Las secuencias casi repetidas se amplifican separadamente o colectivamente y se ligan en ensambles aleatorios de manera que todas las posibles permutaciones y combinaciones están disponibles en la población de moléculas ligadas. El número de unidades casi repetidas se puede controlar por las condiciones del ensamble. El número promedio de las unidades casi repetidas en una construcción se define como el índice repetitivo (RI) . En cuanto se forman, las construcciones pueden o no fraccionarse por tamaño en un gel de agarosa de acuerdo con protocolos publicados, insertarse en un vector de clonación, y transfectarse en una célula hospedera adecuada. Las células se propagan entonces y se efectúa la "reclasificación reductiva" . El régimen del proceso de reclasificación reductiva se puede estimular por la introducción de daño al ADN si se desea. Si la reducción en el índice repetitivo está mediado por la formación de supresión entre secuencias repetidas por un mecanismo "intramolecular", o mediado por eventos como recombinación a través del mecanismo "intermolecular" no importa. El resultado final es la reclasificación de las moléculas en todas las combinaciones posibles . Opcionalmente , el método comprende el paso adicional de seleccionar los miembros de la biblioteca del depósito mezclado para identificar los miembros de la biblioteca mezclada individuales que tienen la capacidad para enlazar o de interactuar de otro modo (por ejemplo, tal como los anticuerpos catalíticos) con una macromolécula predeterminada tal como por ejemplo, un receptor proteináceo, oligosacárido péptido, virón, u otro compuesto o estructura predeterminada. Los polipéptidos desplegados, anticuerpos, anticuerpos peptidomiméticos , y las secuencias de región variable se identifican a partir de estas bibliotecas se pueden usar para propósitos terapéuticos, de diagnóstico, de investigación y relacionados (por ejemplo, catalizadores, solutos para aumentar la osmolaridad de una solución acuosa, y similares) , y/o se pueden someter a uno o más ciclos adicionales de mezcla y/o selección por afinidad. El método se puede modificar de manera que el paso de seleccionar una característica fenotípica pueda ser otra que la afinidad de ensamble para una molécula predeterminada (por ejemplo, por actividad catalítica, resistencia a la oxidación de estabilidad, resistencia a fármacos, fenotipo detectable conferido sobre una célula hospedera) . La presente invención proporciona un método para generar bibliotecas de anticuerpos desplegados conveniente para el análisis de interacciones de afinidad. El método comprende (1) obtener primero una pluralidad de miembros de biblioteca seleccionada que comprende un anticuerpo desplegado y un polinucleótido asociado que codifica el anticuerpo desplegado, y obtener el polinucleótido asociado que codifica el anticuerpo desplegado y obtener los polinucleótidos asociados o copias de los mismos, en donde los polinucleótidos asociados comprenden una región de secuencia de estructura de región variable sustancial-mente idéntica, y (2) introducir los polinucleótidos en una célula hospedera conveniente y cultivar las células bajo condiciones que promuevan recombinación y la reclasificación reductiva dando como resultado los polinucleótidos mezclados.
Las combinaciones CDR compuestas por el depósito mezclado no están presentes en la primera pluralidad de miembros de biblioteca seleccionados, comprendiendo el depósito mezclado una biblioteca de anticuerpos desplegados que comprenden permutaciones de CDR y convenientes para la selección de interacción por afinidad. Opcionalmente, la combinación mezclada se somete a selección por afinidad para seleccionar los miembros de la biblioteca mezclados que se enlazan a un epítope predeterminado (antígeno) y mediante esto se selecciona una pluralidad de miembros de biblioteca mezclados seleccionados. Además, la pluralidad de miembros de biblioteca mezclados selectivamente se pueden mezclar y seleccionar iterativamente, de 1 hasta aproximadamente 1000 ciclos o como se desee hasta que los miembros de la biblioteca que tienen una afinidad de ensamble deseado se obtiene. En otro aspecto de la invención, se considera que antes de o durante la recombinación o la reclasificación, los polinu-cleótidos generados por el método de la presente invención se pueden someter a agentes o procesos que promueven la introducción de mutaciones en los polinucleótidos originales. La introducción de estas mutaciones aumentaría la diversidad de los polinucleótidos híbridos resultantes y polipéptidos codificados a partir de los mismos . Los agentes o procesos que promueven la mutagénesis pueden incluir, pero no se limitan a: (+)-CC-1065, o un análogo sintético tal como ( + ) -CC-1065- (N3-Adenina, ver Sun y Hurley, 1992); un aducto de 4 ' -fluoro-4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (ver, por ejemplo, van de Poli y colaboradores, 1992); o aducto 4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (ver también, van de Poli y colaboradores, 1992, páginas 751-758) ; cromo trivalente, una sal de cromo trivalente, un hidrocarburo aromático policíclico ("PAH") aducto de ADN capaz de inhibir la réplica de ADN tal como 7-bromometil-benz [a] antra-ceno ( "BMA" ) , tris (2 , 3 -dibromopropil) fosfato ("Tris-BP"), 1,2-dibromo-3 -cloropropano ("DBCP"), 2-bromoacroleína (2BA) , benzo [a] pireno-7, 8-dihidrodiol-9-10-epóxido ("BPDE"), una sal de halógeno de platino (II), N-hidroxi-2-amino-3-metilimidazo [4 , 5-f] -quinolina ( "N-hidroxi-IQ" ) , y N-hidroxi-2-amino-l-metil-6-fenilimidazo [4 , 5-r"] -piridina ( "N-hidroxi-PhIP" ) . Especialmente preferido "medios para hacer más lento o detener la amplificación de reacción de cadena de polimerasa consiste en luz ultravioleta (+)-CC-1065 y (+) -CC-1065- (N3-Adenina) . Medios particularmente abarcados son aductos de ADN o polinucleótidos que comprenden aductos de ADN a partir de los polinucleótidos o la combinación de polinucleótidos, que se pueden liberar o remover mediante un proceso que incluye calentar la solución que comprende los polinucleótidos antes de procesamiento adicional. En otro aspecto la presente invención se dirige a un método para producir proteínas recombinantes que tienen actividad biológica tratando una muestra que comprende polinucleótidos de plantilla de doble cadena que codifican una proteína de tipo natural bajo condiciones de acuerdo con la presente invención las cuales proporcionan la producción de polinucleótidos híbridos o reclasificados . La invención también proporciona el uso de mezclas de polinucleótidos para mezclar una población de genes virales (por ejemplo, proteínas de cápsidos, glicoproteínas de picos, polimerasas, y proteasas) o genomas virales (por ejemplo, paramixoviridae, ortomixoviridae, virus de herpes, retrovirus, reovirus y rinovirus) . En una modalidad, la invención proporciona un método para mezclar secuencias que codifican todas o porciones de proteínas virales inmunogénicos para generar combinaciones novedosas de epítopes así como epítopes novedosos creados por recombinación; estas proteínas virales mezcladas pueden comprender epítopes o combinaciones de epítopes así como epítopes novedosos creados por combinación; estas proteínas virales mezcladas pueden comprende epítopes o combinaciones de epítopes que probablemente surjan en el ambiente natural como una consecuencia de la evolución viral (por ejemplo, tal como recombinación de cepas de virus de influenza) . La invención también proporciona un método conveniente para mezclar secuencias de polinucleótidos para generar vectores de terapia de gen y genes de réplica defectuosa construcciones para terapia, tales como se pueden usar para terapia de genes humana, incluyendo pero no limitándose a vectores de vacunación para vacunación basada en ADN, así como terapia de genes antineoplásica y otros formatos de terapias generales. En la notación de polipéptidos usada en la presente, la dirección del lado izquierdo es la dirección terminal amino y la dirección del lado derecho es la dirección terminal carboxi, de acuerdo con el uso y convención estándares. De manera similar, a menos que se especifique otra cosa, el extremo del lado izquierdo de las secuencias de polinucleótidos de cadena simple es el extremo 5'; la dirección del lado izquierdo de las secuencias de polinucleótidos de cadena doble se refiere como la dirección 5'. La dirección de 5 ' a 3' de adición de transcripciones de ARN se conoce como la dirección de transcripción; las regiones de secuencia de la cadena de ADN que tiene la misma secuencia que la ARN y la cual es 5 ' al extremo 5 ' de la transcripción de ARN se conoce como "secuencias corriente arriba" ; las regiones de secuencia sobre la cadena de ADN que tiene la misma secuencia que la ARN y las cuales son de 3 ' al extremo 3' de la transcripción de ARN de codificación se conoce como las "secuencias corriente abajo". Metodología La mezcla de ácidos nucleicos es un método para la recombinación in vitro o in vivo homologa de depósitos de polinucleótidos más cortos o más pequeños para producir un polinucleótido o polinucleótidos. Las mezclas de secuencias de ácidos nucleicos relacionados o polinucleótidos se somete a reacción de cadena de polimerasa sexual para proporcionar polinucleótidos aleatorios, y re-ensamblarlos para producir una biblioteca o población mezclada de moléculas de ácido nucleico híbridas recombinantes o polinucleótidos. En contraste con la mutagénesis de cásete, solamente la mezcla y la reacción de cadena de polimerasa propensa al error permiten mutar un depósito de secuencias ciegamente (sin información de secuencia distinta de los cebadores) . La ventaja de la mezcla mutagénica de esta invención sobre la reacción de cadena de polimerasa propensa a error sólo para la selección repetida se puede explicar mejor con un ejemplo a partir de la ingeniería de anticuerpos. Considérese la mezcla de ADN en comparación con la reacción de cadena de polimerasa propensa al error (no reacción de cadena de polimerasa sexual) . La biblioteca inicial de las secuencias combinadas seleccionados puede consistir de secuencias relacionadas de origen diverso (es decir, anticuerpos de ARNm naturales) o se puede derivar de cualquier tipo de mutagénesis (incluyendo mezclado) de un gen de un solo anticuerpo. Una colección de regiones determinantes de complementariedad seleccionada (WCDR") se obtiene después de la primera ronda de selección por afinidad. En el diagrama el CDR grueso confiere en la molécula de anticuerpos afinidad aumentada para el antígeno. La mezcla permite la asociación combinatoria libre de todos los CDR1 con todos los CDR2 con todos los CDR3, por ejemplo. 4 -97- Este método difiere de la reacción de cadena de polimerasa propensa al error, porque es una reacción de cadena inversa. La reacción de cadena de polimerasa propensa al error, el número de sitios de inicio de polimerasa y el número de moléculas crece exponencialmente . Sin embargo, la secuencia de la polimerasa inicia sitios y la secuencia de las moléculas sigue esencialmente siendo igual. En contraste, en el re-ensamble o mezcla de ácidos nucleicos de polinucleótidos aleatorios del número de sitios iniciales y el número (pero no el tamaño) de los polinucleótidos aleatorios disminuye durante el tiempo. Para los polinucleótidos derivados de los plásmidos enteros el punto final teórico es una sola molécula grande concatemérica. Ya que los cruces ocurren en regiones de homología, la recombinación principalmente ocurrirá entre miembros de la misma familia de secuencias. Esto desalienta las combinaciones de CDR que son muy incompatibles (por ejemplo, dirigidas contra diferentes epítopes del mismo antígeno) . Se contempla que múltiples familias de secuencias se pueden mezclar en la misma reacción. Además, la mezcla generalmente conserva el orden relativo, de manera que, por ejemplo, CDR1 no se encontrará en la posición de CDR2. Las mezclas raras contendrán un gran número de los CDR mejores (por ejemplo con afinidad más alta) y estos mezcladores raros se pueden seleccionar basándose en su afinidad superior. Los CDR de un depósito de 100 diferentes secuencias de anticuerpos seleccionadas se pueden permutar en hasta 1006 maneras diferentes . Este número grande de permutaciones no se puede representar en una sola biblioteca de secuencias de ADN. De conformidad con esto, se contempla que múltiples ciclos de mezclado y selección de ADN se puede requerir dependiendo de la longitud de la secuencia de la diversidad de secuencia deseada. La reacción de cadena de polimerasa propensa a error, en cambio, mantiene todos los CDR seleccionados en la misma secuencia relativa, generando una nube de mutantes mucho más pequeña . El polinucleótido de plantilla que se puede usar en los métodos de esta invención puede ser ADN o ARN. Puede ser de varias longitudes dependiendo del tamaño del gen o del polinucleótido más corto o más pequeño que se va a recombinar o re-ensamblar. Preferiblemente, la plantilla de polinucleótido es de 50 pares de bases a 50 kb. Se contempla que el vector entero que contiene el ácido nucleico que codifica a la proteína de interés se puede usar en los métodos de esta invención, y de hecho se ha usado con éxito. El polinucleótido de plantilla se puede obtener mediante amplificación usando la reacción de cadena de polimerasa (patente de los Estados Unidos No. 4,683,202 y patente de los Estados Unidos No. 4,683,195) u otra amplificación o método de clonación. Sin embargo, la remoción de cebadores libres de los productos de reacción de cadena de polimerasa antes de someterlos a la combinación de los productos de reacción de cadena de polimerasa y reacción de cadena de polimerasa sexual puede proporcionar resultados más eficientes. La falla en remover adecuadamente los cebadores del depósito original antes de la reacción de cadena de polimerasa puede conducir a baja frecuencia de clonas de traslape. El polinucleótido de plantilla frecuentemente deberá ser de cadena doble. Una molécula de ácido nucleico de cadena doble se recomienda para asegurar que las regiones de los polinucleótidos resultantes de cadena simple son complementarios entre sí y de este modo se pueden hibridar para formar molécula de cadena doble . Se contempla que los polinucleótidos de ácido nucleico de cadena simple o cadena doble que tienen regiones de identidad con el polinucleótido de plantilla y regiones de heterología con el polinucleótido de plantilla se pueden añadir al polinucleótido de plantilla, en este paso. Se contempla que dos diferentes plantillas de polinucleótidos relacionados se pueden mezclar en este paso. La plantilla de polinucleótido de cadena doble y cualquier polinucleótido de cadena doble o simple se someten a reacción de cadena de polimerasa sexual la cual incluye disminuir o detener para proporcionar una mezcla de desde aproximadamente 5 pares de base hasta 5 kb o más . Preferiblemente el tamaño de los polinucleótidos aleatorios es de 10 pares de bases hasta 1000 pares de bases, más preferiblemente el tamaño de los polinucleó-tidos es de 20 pares de bases a 500 pares de bases. De manera alternativa, también se contempla que el ácido nucleico de cadena doble que tiene múltiples muescas se puede usar en los métodos de esta invención. Una muesca es un rompimiento en una cadena del ácido nucleico de cadena doble. La distancia entre estas muescas preferiblemente es de 5 pares de bases a 5 kb, más preferiblemente entre 10 pares de bases a 1000 pares de bases. Esto puede proporcionar áreas de auto-cebado para producir polinucleótidos más cortos o más pequeños que se van a incluir con los polinucleótidos resultantes de los cebadores aleatorios, por ejemplo. La concentración de cualquier polinucleótido específico no será mayor del 1 por ciento en peso de los polinucleótidos totales, más preferiblemente la concentración de cualquier secuencia de ácido nucleico específica no será mayor del 0.1 por ciento en peso del ácido nucleico total. El número de diferentes polinucleótidos específicos en la mezcla será cuando menos de aproximadamente 100, preferiblemente cuando menos aproximadamente 500, y más preferiblemente cuando menos aproximadamente 1000. En este paso los polinucleótidos de cadena simple o cadena doble, ya sean sintéticos o naturales se pueden añadir a los polinucleótidos más cortos o más pequeños de cadena doble aleatoria con el fin de aumentar la heterogeneidad de la mezcla de nucleótidos. También se contempla que las poblaciones de polinucleó-tidos de cadena doble aleatoriamente rotos se pueden mezclar o combinar en este paso con los polinucleótidos del proceso de reacción de cadena de polimerasa sexual y opcionalmente someter a uno o más ciclos de reacción de cadena de polimerasa sexual adicionales . Cuando se desea la inserción de mutaciones en el polinucleótido de plantilla, los polinucleótidos de cadena simple o cadena doble que tienen una región de identidad con el polinucleótido de plantilla y una región de heterología con el polinucleótido de plantilla se pueden añadir en un exceso de 20 veces en peso en comparación con el ácido nucleico total, más preferiblemente los polinucleótidos de cadena simple se pueden añadir en un exceso de 10 veces en peso en comparación al ácido nucleico total . Cuando se desea una mezcla de polinucleótidos de plantilla diferentes pero relacionados, poblaciones de polinucleótidos de cada una de las plantillas se pueden combinar en una proporción de menos de aproximadamente 1:100, más preferiblemente la proporción menor de aproximadamente 1:40. Por ejemplo, una cruza trasera del polinucleótido de tipo natural con una población de polinucleótido mutado se puede desear para eliminar mutaciones neutras (por ejemplo, mutaciones que producen una alteración insustancial en la propiedad fenotípica que se está seleccionando) . En este ejemplo, la proporción de polinucleóti-dos del tipo natural aleatoriamente proporcionados que se puede añadir a los polinucleótidos híbridos de ciclo de reacción de cadena de polimerasa sexual proporcionado aleatoriamente es de aproximadamente 1:1 hasta aproximadamente 100:1, y más preferiblemente 1:1 a 40:1. La población mezclada de polinucleótidos aleatorios se desnaturaliza para formar polinucleótidos de cadena simple y después se recuecen. Solamente aquellos polinucleótidos de cadena simple que tienen regiones de homología con otros polinucleótidos de cadena simple se recocerán. Los polinucleótidos aleatorios se pueden desnaturalizar mediante calentamiento. Un técnico en la materia podría determinar las condiciones necesarias para desnaturalizar completamente el ácido nucleico de cadena doble. Preferiblemente la temperatura es de 80 °C a 100 °C, más preferiblemente la temperatura es de 90 "C a 96°C. Otros métodos que se pueden usar para desnaturalizar los polinucleótidos incluyen la presión (36) y PH. Los polinucleótidos se pueden recocer mediante enfriamiento. Preferiblemente la temperatura es de 20 °C a 75 °C, más preferiblemente la temperatura es de 40 "C a 65 °C. Si se necesita frecuencia alta de traslapes basándose en el promedio de solamente 4 bases consecutivas de homología, la recombinación se puede forzar usando una temperatura de recocido baja, aunque el proceso se vuelve más difícil. El grado de re-naturalización el cual ocurre dependerá en el grado de homología entre la población de polinucleótidos de cadena simple. La re-naturalización se puede acelerar mediante la adición de polietilenglicol ("PEG") o sal. La concentración de sal preferiblemente es de 0 mM hasta 200 mM, más preferiblemente la concentración de sal es de 10 mM hasta 100 mM. La sal puede ser KCl o NaCl . La concentración de PEG preferiblemente es de 0 por ciento hasta 20 por ciento, más preferiblemente desde 5 por ciento a 10 por ciento. Los polinucleótidos recocidos se incuban enseguida en presencia de una polimerasa de ácido nucleico y dNTP (es decir, dATP, dCTP, dGTP y dTTP) . La polimerasa de ácido nucleico puede ser un fragmento de Klenow, la polimerasa Taq y otra polimerasa de ADN conocida en la técnica. El enfoque que se va a usar para el ensamble depende del grado mínimo de homología que deberá todavía producir traslapes. Si las áreas de identidad son grandes, la polimerasa Taq se puede usar con una temperatura de recocido de entre 45-65 °C. Si las áreas de identidad son pequeñas, la polimerasa Klenow se puede usar con una temperatura de recocido de entre 20 y 30°C. Un técnico en la materia podría variar la temperatura de recocido para aumentar el número de traslapes logrados. La polimerasa se puede añadir a los polinucleótidos aleatorios desde el recocido, simultáneamente con el recocido o después del recocido. El ciclo de desnaturalización, re-naturalización e incubación en presencia de polimerasa se conoce en la presente como mezcla o re-ensamble de ácido nucleico. Este ciclo se repite durante un número deseado de veces . Preferiblemente el ciclo se repite de 2 a 50 veces, más preferiblemente la secuencia se repite de 10 a 40 veces. El ácido nucleico resultante es un polinucleótido más grande de cadena doble o de aproximadamente 50 pares de bases hasta aproximadamente 100 kb, preferiblemente el polinucleótido más grande es de 500 pares de bases a 50 kb. Estos polinucleótidos más grandes pueden contener varias copias de un polinucleótido que tiene el mismo tamaño como un polinucleótido de plantilla en línea. Este polinucleótido concatemérico se desnaturaliza entonces en copias simples del polinucleótido de plantilla. El resultado será una población de polinucleótidos de aproximadamente el mismo tamaño que el polinucleótido de plantilla. La población será una población mezclada donde los polinucleótidos de cadena simple o doble que tienen una área de identidad y una área de heterología se han añadido al polinucleótido templado antes de la mezcla. Estos polinucleótidos se clonan entonces en el vector adecuado y la mezcla de ligación se usa para transformar bacterias . Se contempla que los polinucleótidos simples se pueden obtener a partir de polinucleótido concatemérico más grande mediante la amplificación del polinucleótido simple antes de la clonación mediante una variedad de métodos que incluyen la reacción de cadena de polimerasa (patente de los Estados Unidos No. 4,683,195 y patente de los Estados Unidos No. 4,683,202), en vez de por digestión del concatémero. El vector usado para clonación no es crítico ya que aceptará un polinucleótido del tamaño deseado. Si la expresión del polinucleótido particular se desea, el vehículo de clonación deberá además comprender las señales de transcripción y traducción cercanas al sitio de inserción del polinucleótido para permitir la expresión del polinucleótido en la célula huésped. Los vectores preferidos incluyen la serie pUC y la serie pBR de plásmidos . La población bacteriana resultante incluirá un número de polinucleótidos recombinantes que tienen mutaciones aleatorias. Esta población mezclada se puede probar para identificar los polinucleótidos recombinantes deseados. El método de selección dependerá del polinucleótido deseado. Por ejemplo, si un polinucleótido que codifica una proteína con eficiencia de ensamble aumentado a un ligando se desea, las proteínas expresadas por cada una de las porciones de los polinucleótidos en la población o biblioteca se pueden probar para su capacidad de enlazar con el ligando mediante métodos conocidos en la técnica (es decir, lavado, cromatografía por afinidad) . Si un polinucleótido que codifica una proteína con resistencia a un fármaco aumentada se desea, las proteínas expresadas por cada uno de los polinucleótidos en la población o biblioteca se puede probar para determinar su capacidad para conferir resistencia al fármaco al organismo hospedero. Un técnico en la materia, dado el conocimiento de la proteína deseada, podría fácilmente probar la población para identificar los polinucleótidos que confieren las propiedades deseadas sobre la proteína. Se contempla que un técnico en la materia podría usar un sistema de despliegue de fago en cuyos fragmentos de la proteína se expresa como proteínas de fusión sobre la superficie del fago (Pharmacia, Milwaukee WI) . Las moléculas de ADN recombinantes se clonan en el ADN del fago en un sitio que es resultado de la transcripción de una proteína de fusión una porción de la cual está codificada por la molécula de ADN recombinante . El fago que contiene la molécula de ácido nucleico recombinante sufre réplica y transcripción en la célula. La secuencia delantera de la proteína de fusión dirige el transporte de la proteína de fusión a la punta de la partícula del fago. De este modo la proteína de fusión la cual está parcialmente codificada por la molécula de ADN recombinante se despliega en la partícula del fago para la detección y selección mediante los métodos descritos anteriormente. Se contempla además que varios ciclos de mezcla de ácido nucleico se pueden llevar a cabo con polinucleótidos a partir de la subpoblación de la primera población, esta subpobla-ción contiene ADN que codifica la proteína recombinante deseada. De esta manera, las proteínas con aún afinidades de ensamble más altas o actividad enzimática más alta podría lograrse. También se contempla que un número de ciclos de mezcla de ácido nucleico se puede llevar a cabo con una mezcla de polinucleótidos del tipo natural y una subpoblación de ácido nucleico de la primera o rondas posteriores de mezclas de ácidos nucleicos con el fin de remover cualquier mutación silenciosa de la subpoblación. Cualquier fuente de ácidos nucleicos, en forma purificada se puede utilizar como el ácido nucleico inicial. De este modo el proceso puede emplear ADN o ARN que incluye ARN mensajero, este ADN o ARN puede ser de cadena simple o doble. Además, un híbrido de ADN - ARN que contiene una cadena de cada uno se puede utilizar. La secuencia de ácido nucleico puede ser de varias longitudes dependiendo del tamaño de la secuencia de ácido nucleico que se va a mutar. Preferiblemente la secuencia de ácido nucleico específica es de 50 a 50000 pares de bases. Se contempla que los vectores enteros que contienen el ácido nucleico que codifica la proteína de interés se puede usar en los métodos de esta invención. El ácido nucleico se puede obtener a partir de cualquier fuente, por ejemplo, a partir de plásmidos tales como pBR322, a partir de ADN o ARN clonada o de ADN o ARN natural de cualquier fuente que incluye bacterias, levaduras, virus y organismos superiores tales como vegetales o animales. El ADN o ARN se puede extraer de sangre o tejido. El polinucleótido de plantilla se puede obtener mediante la amplificación usando la reacción de cadena de polinucleótido (PCR, ver patente de los Estados Unidos No. 4,683,202 y patente de los Estados Unidos No. 4,683,195). Alternativamente, el polinucleótido puede estar presente en un vector presente en una célula y se puede obtener suficiente ácido nucleico cultivando la célula y extrayendo el ácido nucleico de la célula mediante métodos conocidos en la técnica. Cualquier secuencia de ácido nucleico específica se puede usar para producir la población de híbridos mediante el proceso presente. Solamente es necesario que una pequeña población de secuencias híbridas de la secuencia de ácido nucleico específica exista o sea creada antes del proceso actual. La población pequeña inicial de las secuencias de ácido nucleico específicas que tienen mutaciones se pueden crear por varios métodos diferentes. Las mutaciones se pueden crear por una cadena de polimerasa propensa a error. La reacción de cadena de polimerasa propensa a error utiliza condiciones de polimerización de baja fidelidad para introducir un bajo nivel de mutaciones puntuales aleatoriamente durante una secuencia larga. Alternativamente, las mutaciones se pueden introducir en el polinucleótido de plantilla mediante mutagénesis dirigida al oligónucleótido . En la mutagénesis dirigida al oligonucleótido, una secuencia corta del polinucleótido se remueve del polinucleótido usando digestión de enzima de restricción y se reemplaza con un polinucleótido sintético en el cual varias bases han sido alteradas de la secuencia original. La secuencia de polinucleótido también se puede alterar por mutagénesis química. La mutagénesis química incluye, por ejemplo, bisulfito de sodio, ácido nitroso, hidroxilamina, hidrazina o ácido fórmico. Otros agentes que son análogos o precursores de nucleótidos incluyen nitrosoguanidina, 5-bromouracilo, 2-aminopurina, o acridina. Generalmente, estos agentes se añaden a la reacción de cadena de polimerasa en lugar del precursor nucleótido mediante lo cual se muta la secuencia. Los agentes de intercalado tales como la proflavina, acriflavina, quinacrina y similares también se pueden usar. Mutagénesis aleatoria de la secuencia de polinucleótidos también se puede lograr mediante irradiación con rayos X o luz ultravioleta. Generalmente, los polinucleótidos de plásmidos así mutagenizados se introducen en E. coli y se propagan como un depósito o biblioteca de plásmidos híbridos. Alternativamente, la población mezclada pequeña de ácidos nucleicos específicos se puede encontrar en la naturaleza en que ellos pueden consistir de diferentes alelos del mismo gen o el mismo gen de diferentes especies relacionadas (es decir, genes cognados) . Alternativamente, pueden ser secuencias de ADN relacionadas encontradas dentro de una especie, por ejemplo, los genes de inmunoglobulina . En cuanto la población mezclada de las secuencias de ácido nucleico específicas se genera, los polinucleótidos se pueden usar directamente o insertarse en un vector de clonación adecuado, usando técnicas muy conocidas en la técnica. La reacción de vector depende del tamaño de la secuencia de polinucleótido y la célula hospedera que se va a emplear en los métodos de esta invención. Las plantillas de esta invención pueden ser plásmidos, fagos, cósmidos, fagémidos, virus (por ejemplo, retrovirus, virus de para-influenza, virus del herpes, reovirus, paramixovirus , y similares) , o porciones seleccionadas de los mismos (por ejemplo, proteína de recubrimiento, glicoproteína de pico, proteína de cápsido) . Por ejemplo, los cósmidos y fagémidos se prefieren cuando la secuencia de ácido nucleico específica que se va a mutar es más grande debido a que estos vectores son capaces de propagar establemente polinucleótidos grandes. Si la población mezclada de la secuencia de ácido nucleico específica se clona en un vector se puede amplificar clonalmente insertando cada vector en una célula hospedera y permitiendo que la célula hospedera amplifique al vector. Esto se reconoce como amplificación clonal debido a que mientras el número absoluta de secuencias de ácido nucleico aumenta, el número de híbridos no aumenta. La utilidad se puede determinar fácilmente seleccionando los polipéptidos expresados. El método de mezclado de ADN de esta invención se puede realizar a ciegas en un depósito de secuencias desconocidas. Añadiendo a la mezcla de re-ensamble oligonucleótidos (con extremos que son homólogos a las secuencias que se están re-ensamblando) cualquier mezcla de secuencia se puede incorporar en cualquier posición específica en otra mezcla de secuencias. De este modo, si se contempla que las mezclas de oligonucleótidos sintéticos, los polinucleótidos de reacción de cadena de polimerasa o aún los genes completos se pueden mezclar en otra biblioteca de secuencias en posiciones definidas. La inserción de una secuencia (mezcla) es independiente de la inserción de una secuencia en otra parte de la plantilla. De este modo, el grado de recombinación, la homología requerida, y la diversidad de la biblioteca se puede variar independientemente y simultáneamente a lo largo de la longitud del ADN re-ensamblado . Este enfoque de mezclar dos genes puede ser útil para la humanización de anticuerpos a partir de hibridomas murinos . El enfoque de mezclar dos genes o insertar secuencias alternativas en genes puede ser útil para cualquier proteína usada terapéuticamente, por ejemplo, interleucina I, anticuerpos, tPA y hormona del crecimiento. El enfoque también puede ser útil en cualquier ácido nucleico por ejemplo, promotores o introñes o la región no traducida 31 o las regiones no traducidas 51 de los genes para aumentar la expresión o alterar la especificidad de la expresión de las proteínas . El enfoque se puede usar para imitar los ribozimas o aptámeros . La mezcla requiere la presencia de regiones homologas que separan regiones de diversidad. Las estructuras de proteína parecidas a andamio pueden ser particularmente convenientes para la mezcla. El andamio conservado determina el doblado total mediante auto-asociación, mientras que despliega los ciclos relativamente no restringidos que median al ensamble específico. Los ejemplos de estos andamios son el betabarril de inmunoglobu-lina, y el haz de cuatro hélices que son muy conocidos en la técnica. Esta mezcla se puede usar para crear proteínas parecidas a andamios con varias combinaciones de secuencias mutadas para enlace. Mutagénesis de saturación En un aspecto esta invención proporciona el uso de cebadores de codón propietarios (que contienen una secuencia N,N,G/T degenerada) para introducir mutaciones puntuales en un polinucleótido, para generar un conjunto de polipéptidos de progenie en el cual un rango completo de sustituciones de aminoácidos que se representa en cada posición de aminoácido. Los oligos usados están compuestos contiguamente de una primera secuencia homologa, una secuencia N,N,G/T degenerada, y preferiblemente pero no necesariamente una segunda secuencia homologa. Los productos de traducción de progenie corriente abajo a partir del uso de estos oligos incluye todos los cambios de aminoácidos - Imposibles en cada sitio de aminoácido a lo largo del polipéptido, debido a la degeneración de la secuencia N,N,G/T incluye codones para todos los 20 aminoácidos. En un aspecto, uno de estos oligos degenerados (compuestos de un cásete N,N,G/T degenerado) se usa para someter cada codón original en una plantilla de polinucleótidos padre a un rango completo de sustituciones de codón. En otro aspecto, cuando menos dos casetes N,N,G/T degenerados se usan - ya sea el mismo oligo o no, para someter cuando menos dos codones originales en una plantilla de polinucleótidos padres a un rango completo de sustituciones de codón. De este modo, más de una secuencia de N,N,G/T se puede contener en un oligo para introducir mutaciones de aminoácidos en más de un sitio. Esta pluralidad de secuencias N,N,G/T puede ser directamente contigua, o separado por uno o más secuencias de nucleótidos adicionales. En otro aspecto, los oligos útiles para introducir adiciones o supresiones se pueden usar ya sea solos o en combinación con los codones que contienen una secuencia N,N,G/T, para introducir cualquier combinación o permutación de adiciones, supresiones, y/o sustituciones de aminoácidos. En una ejemplificación particular, es posible mutageni-zar simultáneamente o más posiciones de aminoácidos contiguas usando un oligo que contiene tripletes N, , G/T contiguos, es decir, una secuencia (N,N, G/T) n degenerada. En otro aspecto, la presente invención proporciona el uso de casetes degenerados que tienen menos degeneración que la secuencia N,N,G/T. Por ejemplo, puede ser deseable en algunos casos usar (por ejemplo, en un oligo) una secuencia de triplete degenerada compuesta solamente de una N, en donde la N puede estar en la primera, segunda o tercera posición del triplete. Cualquier otra base incluyendo cualquier combinación y permutación de las mismas se puede usar en las restantes dos posiciones del triplete. Alternativamente, puede ser deseable en algunos casos usar (por ejemplo, en un oligo) una secuencia triplete ?,?,? degenerada, o una secuencia de triplete N,N,G/C. Sin embargo, se aprecia que el uso de un triplete degenerado (tal como la secuencia de triplete N,N,G/T o N,N,G/C) como se describe en la presente invención es ventajosa por varias razones. En un aspecto, esta invención proporciona un medio para sistemáticamente y bastante fácilmente generar la sustitución de rango completo de aminoácidos posibles (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido. De este modo, para un polipéptido con 100 aminoácidos, la presente invención proporciona una manera para sistemáticamente y bastante fácilmente generar 2000 especies distintas (es decir, 20 aminoácidos posibles por posición x 100 posiciones de aminoácidos) . Se aprecia que se proporciona, a través del uso de un oligo que contiene una secuencia de triplete degenerada N, , G/T o N,N,G/C, 32 secuencias individuales que codifican 20 posibles aminoácidos. De este modo, en un recipien-te de reacción en el cual una secuencia de polinucleótidos padre se somete a mutagénesis por saturación usando solamente un oligo, se generan 32 polinucleótidos de progenie distintos que codifican 20 polipéptidos distintos. En contraste, el uso de oligo no degenerado en la mutagénesis dirigida al sitio conduce a solamente un polipéptido de progenie producto por recipiente de reacción. Esta invención también proporciona el uso de oligos no degenerados, que opcionalmente se pueden usar en combinación con los cebadores degenerados descritos. Se aprecia que en algunos situaciones, es ventajoso usar oligos no degenerados para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a los cambios de aminoácidos correspondientes, y mutaciones puntuales que causan la generación de codones de detención y la expresión correspondiente de fragmentos de polipéptidos. De este modo, en una modalidad preferida de esta invención, cada recipiente de reacción de mutagénesis por saturación contiene polinucleótidos que codifican cuando menos 20 moléculas de polipéptidos progenie de manera que los 20 aminoácidos están representados en una posición de aminoácido específico correspondiente a la posición de codón mutagenizado en el polinucleótido padre. Los polipéptidos de progenie degenerados 32 veces generados de cada recipiente de reacción de mutagénesis por saturación se pueden someter a amplificación clonal (por ejemplo, se clonan en una hospedera de E. coli conveniente usando un vector de expresión) y se someten a selección de expresión. Cuando un polipéptido de progenie individual se identifica mediante selección para desplegar un cambio favorable en propiedad (en comparación con el polipéptido padre) , se puede secuenciar para identificar la sustitución de . aminoácido favorable correspondientemente contenida en el mismo. Se aprecia que después de mutagenizar todos y cada una posiciones de aminoácidos en un polipéptido padre usando mutagénesis de saturación como se describe en la presente, se pueden identificar los cambios de aminoácidos favorables en más de una posición de aminoácidos. Una o más moléculas de progenie nuevas se pueden generar que contienen una combinación de todas o parte de estas sustituciones de aminoácidos favorables. Por ejemplo, si dos cambios de aminoácidos favorables específicos se identifican en cada uno de tres posiciones de aminoácidos en un polipéptido, las permutaciones incluyen tres posibilidades en cada posición (ningún cambio a partir del aminoácido original, y cada uno de dos cambios favorables) y 3 posiciones. De este modo, hay 3 x 3 x 3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente - 6 mutaciones puntuales simples (es decir, 2 en cada una de tres posiciones) y ningún cambio en ninguna posición. En todavía otro aspecto, la mutagénesis de saturación de sitio se puede usar con mezcla, quimerización, recombinación y otros procesos de mutagenización, junto con selección. Esta invención proporciona el uso de cualquier proceso o procesos de mutagenización, incluyendo mutagénesis por saturación, en una manera iterativa. En otra ej emplificación, el uso iterativo de cualquier proceso de mutagenización se usa en combinación con selección. De este modo, en una ejemplificación no limitante, esta invención proporciona el uso de mutagénesis por saturación en combinación con procesos de mutagenización adicionales, estos procesos en donde dos o más polinucleótidos relacionados se introducen en una célula hospedera conveniente de manera que el polinucleótido híbrido se genera mediante la recombinación y reclasificación reductiva. Además de realizar mutagénesis a lo largo de la secuencia entera de un gen, la presente invención proporciona que la mutagénesis se puede usar para reemplazar cada uno de cualquier número de bases en una secuencia de polinucleótidos, en donde el número de bases que se va a mutagenizar preferiblemente es cualquier entero de 15 a 100,000. De este modo, en vez de mutagenizar todas las posiciones a lo largo de una molécula, se puede someter a un número discreto de bases (preferiblemente un subconjunto que totaliza de 15 a 100,000) a mutagénesis. Preferiblemente, se usa un nucleótido separado para mutagenizar cada posición o grupo de posiciones a lo largo de una secuencia de polinucleótidos . Un grupo de tres posiciones que se va a mutagenizar puede ser un codón. Las mutaciones preferiblemente se introducen usando un cebador mutagénico, que contiene un cásete heterólogo, también conocido como cásete mutagénico. Los casetes preferidos pueden tener de 1 a 500 bases. Cada posición de nucleótido en estos casetes heterólogos es N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G, o E, en donde E es una base que no es A, C, G o T (E se puede referir como un oligo de diseñador) . Las tablas más adelante muestran casetes de trinucleótidos ejemplares (hay más de 3000 posibilidades además de N, N, G/T y ?,?,? y N,N#A/C) . En sentido general, la mutagénesis por saturación está compuesta de mutagenizar un conjunto completo de casetes mutagénicos (donde cada cásete preferiblemente tiene de 1 a 500 bases de longitud) en la secuencia de polinucleótidos definida que se va a mutagenizar (en donde la secuencia que se va a mutagenizar preferiblemente tiene de 15 a 100,000 bases de longitud) . De este modo, un grupo de mutaciones (que varía de 1 a 100 mutaciones) se introduce en cada cásete que se va a mutagenizar. Un agrupamiento de mutaciones que se va a introducir en un cásete puede ser diferente o el mismo de un segundo agrupamiento de mutaciones que se va a introducir en un segundo cásete durante la aplicación de una ronda de mutagénesis por saturación. Estos agrupamientos se ejemplifican por supresiones, adiciones, agrupamientos de codones particulares, y agrupamientos de casetes de nucleótidos particulares. Las secuencias definidas que se van a mutagenizar (véase la Figura 20) incluyen preferiblemente un gen entero, senda, ADNc, un marco de lectura abierto entero (ORF) , y promotor entero, mejorador, represor/transactivador, origen de réplica, intrón, operador, o cualquier grupo funcional de polinucleótidos . Generalmente, unas "secuencias definidas" preferidas para este propósito puede ser cualquier polinucleótido que tenga una secuencia de polinucleótidos de 15 bases, y secuencias de polinucleótidos de longitudes entre 15 bases y 15,000 bases (esta invención específicamente nombra todo entero enmedio) . Las consideraciones en elegir agrupamientos de codones incluyen tipos de aminoácidos codificados por un cásete mutagénico degenerado. En una ejemplificación preferida particularmente un agrupamiento de mutaciones se puede introducir en un cásete mutagénico (ver las Tablas 1-85) , esta invención específicamente proporciona sustituciones de codones degenerados (usando oligos degenerados) que codifican 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, y 20 aminoácidos en cada posición, y una biblioteca de polipéptidos codificada mediante estos.
TABLA SITIOl SITI02 SITI03 # of a.a.'s NPL: POL: NEG: POS: STP 1. N,N,GT N N GT 20 15: 9: 2: 5: 1 2. N.N.G/C N N G/C 20 15: 9: 2: 5: 1 3. N, N.G/A N N G/A 14 15: 6: 2: 6: 3 4. ?,?,?C N N A/C 18 14: 9: 2: 5: 2 . N.N.AT N N ATT 18 14: 9: 2: 5: 2 6. N,N,C/T N N U 15 14: 12: 2: 4: 0 7. ?,?,? N N N 20 29: 18: 4: 10: 3 8. N.N.G N N G 13 8: 3: 1: 3: 1 9. ?,?,? N N A 12 7: 3: 1: 3: 2 . N,N,C N N C 15 7: 6: 1: 2: 0 ??.?,?,? N N T 15 7: 6: 1: 2: 0 12. N,N,AG/T N N C/GT 20 22: 15: 3: 7: 1 13. N,N,A/GT N N A/GT 20 22: 12: 3: 8: 3 14. ?,?,?/C/T N N A/C/T 18 21: 15: 3: 7: 2 . ?,?,?C/G N N ACG 20 22: 12: 3: 8: 3 16. ?,?,? N A A 3 0: 1: 1: 1: 1 17. N,A,C N A C 4 0: 2: 1: 1: 0 18. N,A,G N A G 3 0: 1: 1: 1: 1 19. ?,?,? N A T 4 0: 2: 1: 1: 0 . N,C,A N C A 4 2: 2: 0: 0: 0 21.N,C,C N C C 4 2: 2: 0: 0: 0 22. N,C,G N C G 4 2: 2: 0: 0: 0 23. N,C,T N C T 4 2: 2: 0: 0: 0 24. N,G,A N G A 2 1: 0: 0: 2: 1 . N,G,C N G C 4 1: 2: 0: 1: 0 26. N.G.G N G G 3 2: 0: 0: 2: 0 7. N.G.T N G T 4 1: 2: 0: 1: 0 8. ?,?,? N T A 3 4: 0: 0: 0: 0 9. N,T,C N T C 4 4: 0: 0: 0: 0 0. N,T,C N T G 3 4: 0: 0: 0: 0 1.N,T,T N T T 4 4: 0: 0: 0: 0 2. ?,?/C.A N AC A 7 2: 3: 1: 1: 1 3. N,A/G,A N A/G A 5 1: 1: 1: 3: 2 4. ?,?/?,? N A/T A 6 4: 1: 1: 1: 1 5. N.C/G.A N C/G A 6 3: 2: 0: 2: 1 6. ?,??,? N C/T A 7 6: 2: 0: 0: 0 7. N,T/G,A N T/G A 5 5: 0: 0: 2: 1 8. N,C/G/T,A N C/G/T A 9 7: 2: 0: 2: 1 9. N,AGT,A N A/G/T A 8 5: 1: 1: 3: 3 0. N,A/C/T,A N A/C/T A 10 6: 3: 1: 1: 1 l.N,A/C/G,A N A/C/G A 9 3: 3: 1: 3: 2 2. ?,?,? A N N 7 4: 8: 0: 4: 0 3. C,N,N C N N 5 8: 2: 0: 6: 0 . G,N,N G N N 5 12: 0: 4: 0: 0 5. ?,?,? T N N 6 5: 8: 0: 0: 3 . AC,N,N AC N N 11 12: 10: 0: 10: 0 . A/G.N AG N N 12 16: 8: 4: 4: 0 . A/T,N,N AT N N 12 9: 16: 0: 4: 3 . C/G.N.N C/G N N 10 20: 2: 4: 6: 0 . ??,?,? C/T N N 10 13: 10: 0: 6: 3 1.G/T.N.N G/T N N 11 17: 8: 4: 0: 3 . ?,?,? N A N 7 0: 6: 4: ¦ 4: 2 . N,C,N N C N 4 8: 8: 0: 0: 0: . N,G,N N G N 5 5: 4: 0: 6: 1 55. ?,?,? N T N 5 16: 0: 0: 0: 0 56. ?,?/C.N N A C N 11 S: 14: 4: 10: 3 57. ,A^G,N N A/G N 12 5: 10: 4: 10: 3 58. ?,?/?,? N A/T N 12 16: 6: 4: 4: 2 59. N,C/G,N N C G N 8 13: 12: 0: 6: 1 60. N.C/?,? N C/T N 9 24: 8: 0: 0: 0 61. N,G T,N N G T N 10 21 : 4: 0: 6: 1 62. N,A/C/G,N N A C/G N 15 13: 18: 4: 10: 3 63. N,A/C T,N N A/C T N 16 24: 14: 4: 4: 2 64. N,A/G/T,N N A/GAT N 17 21 : 10: 4: 10: 3 65. N,C/G T,N N C/G T N 13 29: 12: 0: 6: 1 66. C,C,N C C N 1 4: 0: 0: 0: 0 67. G,G,N G G N 1 4: 0: 0: 0: 0 68. G,C,N G C N I 4: 0: 0: 0: 0 69. G,T,N G T N 1 4: 0: 0: 0: 0 70. C,G,N C G N 1 0: 0: 0: 4: 0 71. C.T.N C T N 1 4: 0: 0: 0: 0 72. T,C,N T C N 1 0: 4: 0: 0: 0 73. A,C,N A C N 1 0: 4: 0: 0: 0 74. G,A,N G A N 2 0: 0: 4: 0: 0 75. ?,?,? A T N 2 4: 0: 0: 0: 0 76. C.A.N C A N 2 0: 2: 0: 2: 0 77. ?,?,? T T N 2 4: 0: 0: 0: 0 78. ?,?,? A A N 2 0: 2: 0: 2: 0 79. ?,?,? T A N 1 0: 2: 0: 0: 2 80. T,G,N T G N 2 1 : 2: 0: 0: 1 81. A,G,N A G N 2 0: 2: 0: 2: 0 82. G/C,G,N G/C G N 2 4: 0: 0: 4: 0 83. G/CC.N G/C C N 2 8: 0: 0: 0: 0 84. G/C,A,N G/C A N 4 0: 2: 4: 2: 0 85. G/T,C,N G/C T N 2 8: 0: 0: 0: 0 TABLA 1. Cartucho Mutagenico: N,N,G/T CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 2 NO POLAR 15 (NPL) GGC NO GGA NO GGG SI GCT SI ALANINA 2 GCC NO GCA NO GCG SI GTT SI VALINA 2 GTC NO GTA NO GTG SI TTA NO LEUCINA 3 TTG SI CTT SI CTC NO CTA NO CTG SI ATT SI ISOLEUCINA 1 ATC O ATA O ATG SI METIONINA 1 TTT SI FENILALANINA 1 TTC NO TGG SI TRIPTOFANO 1 CGT NO ARGININA 3 CGC NO CGA NO CGG SI AGA NO AGG SI CAT SI HISTIDINA 1 CAC NO TAA NO CO oDE 1 TAG SI TGA NO TO^-L Están repre- 32 seiftadog. O aminoácidos TABLA 2. Cartucho Hutagénico: N,N,G/C CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 2 O POLAR 15 (NPL) GGC SI GGA NO GGG SI GCT NO ALANINA 2 GCC SI GCA NO GCG SI GTT NO VALI A 2 GTC SI GTA NO GTG SI TTA NO LEUCINA 3 TTG SI CTT NO CTC SI CTA NO CTG SI ATT NO ISOLEUCINA 1 ATC SI ATA NO ATG SI METIONINA 1 TTT NO FENILALANINA 1 TC SI TGG SI TRIPTOFANO 1 CCT O PROT.TMA 2 CGC SI CGA NO CGG SI AGA NO AGG SI CAT NO HISTIDINA 1 CAC SI TAA NO CO oDE 1 TAG SI 10 TGA NO TO^-L Están repre- 32 aminoácidos 4 •5 50 55 60 65 70 TABLA 3. Cartucho Mutagenico: N,N,G/A CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 2 NO POLAR 15 (NPL) GGC NO GGA SI GGG SI GCT NO ALANINA 2 GCC NO GCA SI GCG SI GTT NO VALINA 2 GTC NO GTA SI GTG SI TTA SI LEUCINA 4 TTG SI CTT NO CTC O CTA SI CTG SI ATT NO ISOLEUCINA 1 ATC NO ATA SI ATG SI METIONINA 1 TTT NO FENILALANINA 0 TTC O TGG SI TRIPTOFANO 1 CCT NO PROLTNA 2 CGC NO CGA SI CGG SI AGA SI AGG SI CAT NO HISTIDINA 0 CAC NO TAA SI CO oDE 3 TAG SI TGA SI TORUEstán repre¬ 32 sentados ,14 aminoácidos TABLA 4. Cartucho Mutagenico: N,N,A/C CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 2 NO POLAR 14 (NPL) GGC SI GGA SI GGG NO GCT NO ALANINA 2 GCC SI GCA SI GCG NO GTT NO VALINA 2 GTC SI GTA SI GTG NO TTA SI LEUCINA 3 TTG NO CTT NO CTC SI CTA SI CTG NO ATT NO ISOLEUCINA 2 ATC SI ATA SI ATG NO METIONINA 0 TTT O FENILALANINA 1 TTC SI TGG NO TRIPTOFANO 0 CCT O PROLTNA 2 TABLA 5. Cartucho Mutagenico: ?,?,?/? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 2 NO POLAR 14 (NPL) GGC NO GGA SI GGG NO GCT SI ALANINA 2 GCC NO GCA SI GCG NO GTT SI VALINA 2 GTC NO GTA SI GTG O TTA SI LEUCINA 3 TTG NO CTT SI CTC NO CTA SI CTG NO ATT SI ISOLEUCINA 2 ATC NO ATA SI ATG O METIONINA 0 TTT SI FENILALANINA 1 TC O TGG NO TRIPTOFANO 0 CCT SI PROT.TNA 2 CGC NO CGA SI CGG NO AGA SI AGG NO CAT SI HISTIDINA 1 CAC NO TAA SI CO oDE 2 TAG NO TGA SI TORUEstán repre¬ 32 sentado!? ,G8 aminoácidos TABLA 6. Cartucho Mutagenico: N,N,C/T CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 2 NO POLAR 14 (NPL) GGC SI GGA NO. GGG NO GCT SI ALANINA 2 GCC SI GCA NO GCG NO GTT NO VALINA 2 GTC SI GTA NO GTG NO TTA NO LEUCINA 3 TTG NO CTT SI CTC SI CTA NO CTG NO ATT SI ISOLEUCINA 2 ATC SI ATA NO ATG NO ETIONINA 0 TTT SI FENILALANINA 2 TTC SI TGG NO TRIPTOFANO 0 CCT SI PROT.TNA 2 CGC SI CGA NO CGG NO AGA NO AGG NO CAT SI HISTIDINA 2 CAC SI TAA NO CO oDE 0 TAG NO TGA NO TO^-L Están repre- 32 seotaaos G 5 aminoácidos TABLA 7. Cartucho Mutagenico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 4 NO POLAR 29 (NPL) GGC SI GGA SI GGG SI GCT SI ALANINA 4 GCC SI GCA SI GCG SI GTT SI VALINA 4 GTC SI GTA SI GTG SI TTA SI LEUCINA · 6 TTG SI CTT SI CTC SI CTA SI CTG SI ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 TTT SI FENILALANINA 2 TTC SI TGG SI TRIPTOFANO 1 CCT SI PROTiTNA 4 CGC SI CGA SI CGG SI AGA SI AGG SI CAT SI HISTIDINA 2 CAC SI TAA SI co oDE 3 TAG SI S¾DE TGA SI Están repre- 64 seafcados 72.0 aminoácidos TABLA 8. Cartucho Mutagenico: N,N,G CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 1 NO POLAR 8 (NPL) GGC NO GGA NO GGG SI GCT O ALANINA 1 GCC NO GCA NO GCG SI GTT O VALINA 1 GTC NO GTA NO GTG SI TTA NO LEUCINA 2 TTG SI CTT NO CTC NO CTA NO CTG SI ATT NO ISOLEUCINA 0 ATC NO ATA NO ATG SI METIONINA 1 TTT NO FE ILALANINA 0 TTC NO TGG SI TRIPTOFANO 1 CCT NO PROT.TNA 1 CGC NO CGA NO CGG SI AGA NO AGG SI CAT NO HISTIDINA 0 CAC NO TAA NO CO oDE 1 TAG SI TGA NO TORUEstán repre¬ 16 sentados ,G3 aminoácidos TABLA 9. Cartucho Mutagénico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 1 NO POLAR 7 (NPL) GGC NO GGA SI GGG O GCT NO ALANI A 1 GCC NO GCA SI GCG NO GTT NO VALINA 1 GTC NO GTA SI GTG NO TTA SI LEUCINA 2 TTG NO CTT NO CTC NO CTA SI CTG NO ATT NO ISOLEUCINA 1 ATC NO ATA SI ATG NO METIONINA 0 TTT NO FENILALANINA 0 TTC NO TGG NO TRIPTOFANO 0 CCT NO PROTiTNA 1 CGC NO CGA SI CGG NO AGA SI AGG NO CAT NO HISTIDINA 0 CAC NO TAA SI coffloDE 2 TAG NO TGA SI TCgTAL Están repre- 16 aetifcadoa GG2 aminoácidos TABLA 10. Cartucho Mutagenico: N,N,C CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 1 NO POLAR 7 (NPL) GGC SI GGA O GGG NO GCT NO ALANINA 1 GCC SI GCA NO GCG NO GTT NO VALI A 1 GTC SI GTA NO GTG NO TTA NO LEUCINA 1 TTG NO CTT NO CTC SI CTA NO CTG NO ATT NO ISOLEUCINA 1 ATC SI ATA NO ATG NO METIONINA 0 TTT NO FENILALANINA 1 TTC SI TGG NO TRIPTOFANO 0 CCT O PROLTNA 1 CGC • SI CGA NO CGG NO AGA NO AGG NO CAT NO HISTIDINA 1 CAC SI TAA NO CO oDE 0 TAG NO 10 TGA NO TO^rAL Están repre- 16 sentados G?5 aminoácidos 0 0 •5 0 0 0 TABLA 11. Cartucho Mutagenico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 1 NO POLAR 7 (NPL) GGC NO GGA NO GGG NO GCT SI ALANINA 1 GCC NO GCA NO GCG NO GTT SI VALINA 1 GTC NO GTA NO GTG NO TTA NO LEUCINA 1 TTG NO CTT SI CTC NO CTA NO CTG NO ATT SI ISOLEUCINA 1 ATC NO ATA O ATG NO METIONINA 0 TTT SI FENILALANINA 1 TTC NO TGG O TRIPTOFANO 0 CCT SI PROT.TNA 1 CGC NO CGA NO CGG NO AGA NO AGG NO CAT SI HISTIDINA 1 CAC NO TAA NO CO oDE 0 TAG NO TGA NO TO^L Están repre¬ 16 sentados .15 aminoácidos TABLA 12. Cartucho Mutagenico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 3 NO POLAR 22 (NPL) GGC SI GGA NO GGG SI GCT SI ALANINA 3 GCC SI GCA NO GCG SI GTT SI VALINA 3 GTC SI GTA NO GTG SI TTA NO LEUCINA 4 TTG SI CTT SI CTC SI CTA NO CTG SI ATT SI ISOLEUCINA 2 ATC SI ATA NO ATG SI METIONINA 1 TTT SI FENILAIiANINA 2 TTC SI TGG SI TRIPTOFANO 1 CCT SI PROT.TNA ? CGC SI CGA NO CGG SI AGA NO AGG SI CAT SI HISTIDINA 2 CAC SI TAA NO CO oDE 1 TAG SI TGA NO TO^-L Están repre- 48 aminoácidos TABLA 13. Cartucho Mutagenico: ?,?,?/G/T CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 3 NO POLAR 22 (NPL) GGC NO GGA SI GGG SI GCT SI ALANINA 3 GCC NO GCA NO GCG SI GTT SI VALINA 3 GTC NO GTA SI GTG SI TTA NO LEUCINA 5 TTG SI CTT SI CTC NO CTA SI CTG SI ATT SI ISOLEUCINA 2 ATC NO ATA SI ATG SI METIONINA 1 TTT SI FENILALANINA 1 TTC NO TGG SI T IPTOFANO 1 CCT SI PROT.TNA 3 CGC NO CGA SI CGG SI AGA SI AGG SI CAT SI HISTIDINA 1 CAC NO TAA SI C¾DE 3 TAG SI TGA SI TO^TAL Están repre¬ 48 sentado!? 720 aminoácidos TABLA 14. Cartucho Mutagénico: N,N,A/C/T CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 3 NO POLAR 21 (NPL) GGC SI GGA SI GGG NO GCT SI ALANINA 3 GCC SI GCA SI GCG NO GTT SI VALINA 3 GTC SI GTA SI GTG NO TTA SI LEUCINA 4 TTG NO CTT SI CTC SI CTA SI CTG NO ATT SI ISOLEUCINA 0 ATC SI ATA SI ATG NO METIONINA 2 TTT SI FENILALANINA 0 TTC SI TGG NO TRIPTOFANO 0 CCT SI PROLTNA 1 CGC SI CGA SI CGG NO AGA SI AGG NO CAT SI HISTIDINA 2 CAC SI TAA SI CO oDE 2 TAG NO TGA SI Están repre- o 48 ses ado? JZO aminoácidos TABLA 15. Cartucho Mutagenico: ?,?,?/C/G CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGT NO GLICINA 3 NO POLAR 22 (NPL) GGC SI GGA SI GGG SI GCT NO ALANINA 3 GCC SI GCA SI GCG SI GTT NO VALINA 3 GTC SI GTA SI GTG SI TTA SI LEUCINA 5 TTG SI CTT NO CTC SI CTA SI CTG SI ATT NO ISOLEUCINA 2 ATC SI ATA SI ATG SI METIONINA 1 TTT NO FENILALANINA 1 TTC SI TGG SI TRIPTOFANO 1 CCT NO PROTiTNA 1 CGC SI CGA SI CGG SI AGA SI AGG SI CAT NO HISTIDINA 1 CAC SI TAA SI co oDE 3 TAG SI 3¾fef TGA SI Están repre- 48 sentados 2 aminoácidos TABLA 16: Cartucho Mutagenico: N,A, CODÓN Reparesen- AMINOACIDO (FrecuenCATEGORÍA (Fre^cuen- cia) GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 ETIONINA 0 FENILALA INA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 1 IO IZABLE CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 1 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 1 CARGA ACIDA NEGATI¬ GAA SI ACIDO GLUTAMICO 1 VA (NEG) AAA SI LISINA 1 IONIZABLE: 1 s¾cGAo¾-- ARGININA 0 TIVA (POS) HISTIDINA 0 TAA SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 4 Están representados NPL; POL: NEG: POS: STP- 3 aminoácidos 0: 2: 1: 1: 0 TABLA 17: Cartucho Mutagenico: ?,?, CODÓN RepresenAMINOACIDO (Fre^uen- CATEGORÍA (Frecuentado cia) GLICINA 0 NO POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 2 IO IZARLE CISTEINA 0 AAC SI ASPARAGINA 1 GLUTAMINA 0 TAC SI TIROSINA 1 TREONINA 0 GAC SI ACIDO ASPARTICO 1 IONIZABLE : 1 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) AAA SI LISINA 0 IONIZABLE: 1 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) CAC SI HISTIDINA 1 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS : STP- 4 aminoácidos 0: 2: 1: 1: 0 TABLA 18; Cartucho Mutagenico: N,A,G CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 1 IONIZARLE CISTEINA 0 ASPARAGINA 0 CAG SI GLUTAMINA 1 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 1 CARGA ACIDA NEGATI¬ GAG SI ACIDO GLUTAMICO 1 VA (NEG) AAG SI LISINA 1 IONIZABLE: 1 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 TAG SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP. 3 aminoácidos 0: 1: 1: 1: 1 TABLA 19: Cartucho Mutagenico: ?,?, CODÓN Rej>regen- AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 2 IO IZARLE CISTEINA 0 ASPARAGINA 1 AAT SI GLUTAMINA 0 TIROSINA 1 TREONINA 0 ACIDO ASPARTICO 1 IONIZABLE: 1 CARGA ACIDA NEGATI¬ TAT SI ACIDO GLUTAMICO 0 VA (NEG) GAT SI LISINA 0 IONIZABLE: 1 CARGA BASICA POSI¬ ARGININA 0 TIVA POS) HISTIDINA 1 CAT SI CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP- 4 aminoácidos 0: 2: 1: 1: 0 TABLA 213: Cartucho Mutagenico: N,íL,A CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 2 (NPL) GCA SI ALANINA 1 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCA SI PROLINA 1 TCA SI SERINA 1 POLAR NO 2 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACA SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados 4 aminoácidos TABLA 21; Cartucho Mutagenico; N,C,C CODON RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO POLAR 2 (NPL) GCC SI ALANINA 1 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCA SI PROLINA 1 TCC SI SERINA 1 POLAR NO 2 IONIZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACA SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados HFL: POL.: NEG: POS : STP- 4 aminoácidos 2: 2: 0: 0: 0 TABLA 23: Cartucho Mutagenico: N, C, CODÓN ReDregen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 2 (NPL) GCT SI ALANINA 1 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCT SI PROLINA 1 TCT SI SERINA 1 POLAR NO 2 IO IZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACT SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE : 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP* 4 aminoácidos 2: 2: 0: 0: 0 TABLA 25: Cartucho Mutagenico: N,G, CODÓN Rejoregen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGC SI GLICINA 1 NO, POLAR 1 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 AGC SI SERINA 1 POLAR NO 2 IONIZARLE TGC SI CISTEINA 1 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 1 CARGA BASICA POSI¬ CGC SI ARGININA 1 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE. 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS : STP- 4 aminoácidos 1: 2: 0: 1: 0 TABLA 26: Cartucho Hutagenico: N,G, CODON RepresenAMINOÁCIDO tado l (Fr^cuen- CATEGORÍA (Frecuencia) GGG SI GLICINA 1 NO POLAR 2 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FE ILALANINA 0 TGG SI TRIPTOFANO 1 PROLINA 0 SERINA 0 POLAR NO 0 IONIZABLE (POLT CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ SI ARGININA 2 TIVA (POS) SI HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Está representados NPL: POL: NEG: POS: STP. 2 aminoácidos 2: 0: 0: 2: 0 TABLA 27: Cartucho Mutagenico: N,G, CODÓN Re£>regen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGT SI GLICINA 1 NO, POLAR 1 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALA INA 0 TRIPTOPANO 0 PROLINA 0 AGT SI SERINA 1 POLAR NO 2 IO IZABLE TGT SI CISTEINA 1 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 : ACIDO GLUTAMICO 0 SA VWTÍ A (NEG) LISINA 0 IONIZABLE: 1 CARGA BASICA POSI¬ CGT SI ARGININA 1 TIVA (POS) AGA SI HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP- 4 aminoácidos 1: 0: 1: 0 TABLA 29: Cartucho Mutagenico: N,T,C CODÓN Rep^re^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 O POLAR 4 (NPL) ALA INA 0 GTC SI VALINA 1 CTC SI LEUCINA 1 ATC SI ISOLEUCINA 1 METIONINA 0 TTC SI FENILALANINA 1 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados 4 amino cidos TABLA 30: Cartucho Mutagenico: ?,?, CODÓN Rej>regen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 4 (NPL) ALANINA 0 GTC SI VALINA 1 TTC SI LEUCINA 2 CTG SI ISOLEUCINA 0 METIONINA 1 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZABLE ÍPOLT CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL.: NEG: POS: STP- 3 aminoácidos 4: 0: 0: 0: 0 35 TABLA 34; Cartucho Mutagenico; ?,?/?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Fre^uen- tado cia) GLICINA 0 NO POLAR 4 (NPL) ALANINA 0 GTA SI VALINA 1 TTA SI LEUCINA 2 CTA SI ATA SI ISOLEUCINA 1 METIONINA 0 FENILALANINA 0 TRIPTOFANO b PROLINA 0 SERINA 0 POLAR NO 4 CISTEINA 0 I0WLE ASPARAGINA 0 CAA SI GLUTAMINA 1 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 1 CARGA ACIDA NEGATI¬ GAA SI ACIDO GLUTAMICO 1 VA (NEG) AAA SI LISINA 1 IONIZABLE: 1 CARGA BASICA POSI¬ ARGININA 0 TIVA POS) HISTIDINA 0 TAA SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 8 Están representados NPL: POL: NEG: POS : STP. 6 aminoácidos 4: 1: 1: 1 : 1 TABLA 36: Cartucho Mutagénico: N,T, CODÓN Rejsregen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO POLAR 6 (NPL) GCA SI ALANINA 1 GTA SI VALINA 1 TTA SI LEUCINA CTA SI ATA SI ISOLEUCINA 1 MSTIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCA SI PROLINA 1 TCA SI SERINA 1 POLAR NO 2 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACA SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 8 Están representados NPL: POL: NEG: POS : STP» 7 aminoácidos 6: 2: 0: 0 ! 0 TABLA 37: Cartucho Mutagenico; N,T/G,A CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GGA SI GLICINA 1 NO, POLAR 5 (NPL) ALANINA 0 GTA SI VALINA 1 TTA SI LEUCINA 2 CTA SI ATA SI ISOLEUCINA 1 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IO IZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ CGA SI ARGININA 2 TIVA POS) AGA SI HISTIDINA 0 TGA SI CODÓN DE PARO 1 SEÑAL, DE, 1 PARO (STP) TOTAL 8 Están representados 5 aminoácidos TABLA 313 : Cartucho Mutagenico: N,C:/G/T,A CODÓN Rejaregen- AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) G6A SI GLICINA 1 NO POLAR 7 GCA SI ALANINA 1 GTA SI VALINA 1 TTA SI LEUCINA 2 CTA SI ATA SI ISOLEUCINA 1 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 ACA SI PROLINA 1 TCA SI SERINA 1 POLAR NO 2 IO IZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACA SI TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE : 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ CGA SI ARGININA 2 TIVA (POS) AGA SI HISTIDINA 0 TGA SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 12 Están representados 9 aminoácidos TABLA 39; Cartucho Mutagenico; N,A/G/T,A CODÓN RepresenAMINOACIDO (FrecuenCATEGORÍA (Frecen- tado cia) GGA SI GLICINA 1 NO, POLAR 5 (NPL) ALANINA 0 GTA SI VALINA 1 TTA SI LEUCINA 2 CTA SI ATA SI ISOLEUCINA 1 ETIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 1 IO IZARLE CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 1 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 1 CARGA ACIDA NEGATI¬ GAA SI ACIDO GLUTAMICO 1 VA (NEG) AAA SI LISINA 0 IONIZABLE: 3 CARGA BASICA POSI- CGA AGININA 2 TIVA (POS) AGA ?? HISTIDINA 0 TAA SI CODÓN DE PARO 2 SEÑAL DE, 2 TGA SI PARO (STP) TOTAL 12 Está representados 8 aminoácidos TABLA 413: Cartucho Mutagénico: N,í_/C/T,A CODÓN Rejsregen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 6 (NPL) GCA SI ALANINA 1 GTA SI VALINA 1 TTA SI LEUCINA 2 CTA SI ATA SI ISOLEUCINA 1 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCA SI PROLINA 1 TCA SI SERINA 1 POLAR NO 3 IO IZARLE CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 1 TIROSINA 0 ACA SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE: 1 CARGA ACIDA NEGATI¬ GAA SI ACIDO GLUTAMICO 1 VA (NEG) AAA SI LISINA 1 IONIZABLE: 1 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 TAA SI CODÓN DE PARO 1 SEÑAL DE. 1 PARO (STP) TOTAL 12 Están representados HPL: POL: NEG: POS : STP- 10aminoácidos 6: 3: 1: 1 : 1 TABLA 41; Cartucho Mutagenico: N,A/C/G,A CODÓN AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGA SI GLICINA 1 NO POLAR 3 (NPL) GCA SI ALANINA 1 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENIIiALANINA 0 TRIPTOFANO 0 CCA SI PROLINA 1 TCA SI SERINA . 1 POLAR NO 3 IONIZABLE (POLÍ CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 1 TIROSINA 0 ACA SI TREONINA 1 ACIDO ASPARTICO 0 IONIZABLE: 1 GAA SI ACIDO GLUTAMICO 1 M VAIGA- TNEGÍÍ): AAA SI LISINA 1 IONIZABLE: 3 CARGA BASICA POSI¬ CGA §1 ARGININA 2 TIVA POS) AGA SI HISTIDINA 0 TAA SI CODÓN DE PARO 2 SEÑAL DE, 2 TGA SI PARO (STP) TOTAL 12 Están representados 9 aminoácidos TABLA 42; Cartucho Mutagenico; ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 4 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 AGT SI SERINA 2 POLAR NO 8 AGC SI IO IZABLE CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI GLUTAMINA 0 TIROSINA 0 ACT SI TREONINA 4 ACC SI ACA SI ACG SI ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) AAA SI LISINA 2 IONIZABLE: 4 AAG SI CARGA BASICA POSITIVA (POS) AGA SI ARGININA 2 AGG SI HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 16 Están representados 7 aminoácidos TABLA 43: Cartucho Mutagenico: C,N,N CODÓN Rei>r^anAMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO POLAR 8 (NPL) ALANINA 0 VALINA 0 CTT sí LEUCINA 4 CTC SI CTA SI CTG SI ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCT SI PROLINA 4 CCC SI CCA SI CCG SI SERINA 0 POLAR NO 2 IONIZARLE CISTEINA 0 ASPARAGINA 0 CCA SI GLUTAMINA 2 CAG SI TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE : 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA TNEG) LISINA 0 IONIZABLE: 6 CARGA BASICA POSI¬ CGT SI ARGININA 4 TIVA (POS) CGC SI CGA SI CGG SI CAT SI HISTIDINA 2 CAC SI CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 16 Están representados 5 aminoácidos TABLA 44: Cartucho Mutagénico: G,N,N CODÓN e^re^en- AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGT SI GLICINA 4 NO, POLAR 12 GGC SI (NPL) GGA SI GGG SI GCT SI ALAMINA 4 GCC SI GCA SI GCG SI GTT SI VALINA 4 GTC SI GTA SI GTG SI LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALA INA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE. 0 PARO (STP) TOTAL 16 Están representados NPL: POL: NEG: POS: STP- 5 aminoácidos 12: 0: 4: 0: 0 TABLA 45: Cartucho Mutagénico: ?,?,? CODÓN Rejare^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 5 (NPL) ALANINA 0 VALINA 0 TTA SI LEUCINA 2 TTG SI ISOLEUCINA 0 METIONINA 0 TTT FENILALANINA 2 TTC SI TGG SI T IPTOFANO 1 PROLINA 0 TCT SI SERINA 4 POLAR NO 8 TCC SI IONIZARLE TCA SI TCG SI TGT SI CISTEINA 2 TGC SI ASPARAGINA 0 GLUTAMINA 0 TAT TAC ¡£ TIROSINA 2 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 ACIDO GLUTAMICO 0 SMGA-T VA T EGÍ): LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) TAA SI HISTIDINA 3 TAG SI TGA SI CODÓN DE PARO 0 SEÑAL, DE 3 PARO (STP) TOTAL 16 Estái? representados NPL: POL: HEG: POS : STP- 6 aminoácidos 5: 8: 0: 6: } 0 TABLA 46: Cartucho Mutagenico: A/C,N,N CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 32 Están , representados HPL: POL: NEG: POS: STP- 11 aminoácidos 12: 10: 0: 10: 0 TABLA 47: Cartucho Mutagenico: A/G,N,N CODÓN Rej>regen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGT SI GLICINA 4 NO, POLAR 16 GGC SI (NPL) GGA SI GGG SI GCT SI ALANINA 4 GCC SI GCA SI GCG SI GTT SI VALI A 4 GTC SI GTA SI GTG SI LEUCINA 4 ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 AGT SI SERINA 2 POLAR NO 8 AGC SI IO IZARLE CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI GLUTAMINA 0 TIROSINA 0 ACT SI TREONINA 4 ACC SI ACA SI ACG SI GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI AAA SI LISINA 2 IONIZABLE: 4 AAG SI CARGA BASICA POSITIVA 1POS) AGA SI ARGININA 2 AGG SI ?tatt?t?? n CODÓN DE PARO 0 SEÑAL DE, 0 PARO TSTP) TOTAL 32 Están . representados NPL: POL: NEO: POS: STP- 12 aminoácidos 16! 8: 4! 4: 0 TABLA 48: Cartucho Mutagénico: ?/?,?,? TAA SI CODÓN DE PARO 3 SEÑAL DE, 3 TAG SI PARO (STP) TGA SI TOTAL 32 Están . representados NPL; POL: NEG: POS: 5TP- 12 aminoácidos 9: 15: 0: 4: 3 TABLA 49: Cartucho Mutagénico: C/G,N,N CODÓN RepresenAMINOÁCIDO (Frecuen- CATEGORÍA (Frecuentado cia) cia) GGT SI GLICINA 4 NO, POLAR 20 iil SI (NPL) SI SI GCT SI ALANINA 4 GCC SI GCA SI GCA SI GTT SI VALINA 4 GTC SI GTA SI GTG SI CTT SI LEUCINA 4 CTC SI §1 SI ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCT SI PROLINA 4 CCC SI CCA SI CCG SI SERINA 0 POLAR NO 2 IO IZABLE CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 2 CAG SI TIROSINA 0 TREONINA 0 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI LISINA 0 IONIZABLE: 6 CARGA BASICA POSI¬ CGT SI ARGININA 4 TIVA (POS CGC SI CGA SI CGG SI CAT SI HISTIDINA 2 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 32 Están . representados 10 aminoácidos TABLA 50: Cartucho Mutagenico: C/T,N,N CODÓN Rep^re^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO POLAR 13 (NPL) ALANINA 0 VALINA 0 TTA SI LEUCINA 6 TTG SI CTT SI CTC SI CTA SI CTG SI ISOLEUCINA 0 METIONINA 0 TTT SI FENILALANINA 2 TTC SI TGG SI T IPTOFANO 1 CCT SI PROLINA 4 CCC SI CCA SI CCG SI CT SI SE INA 4 POLAR NO 10 TCC SI IO IZABLE TCA SI TCG SI TGT SI CISTEINA 2 TGC SI ASPARAGINA 0 CAA SI GLUTAMINA 2 CAG SI TAT SI TIROSINA 2 TAC SI TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 2 IONIZABLE: 6 CARGA BASICA POSI¬ CGT SI ARGININA 4 TIVA (POS CGC SI CGA SI CGG SI CAT S OIT HISTIDINA 2 TAA SI CODÓN DE PARO 3 SEÑAL DE. 3 TAG SI PARO (STP) TGA SI- TOTAL 32 Están , representados NPL: POL: NEG: POS : STP- 10 aminoácidos 13: 10: 0: 6: 3 TABLA 51: Cartucho Mutagenico: ?/?,?,? CODÓN Refjregen- AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGT SI GLICINA 4 NO, POLAR 17 GGC SI (NPL) GGA SI GGG SI GCT SI ALANINA 4 GCC SI GCA SI GCG SI GTT SI VALINA 4 GTC SI GTA SI GTG SI TTA SI LEUCINA 2 TTG SI ISOLEUCINA 0 METIONINA 0 TTT SI FENILALANINA 2 TTC SI TGG SI T IPTOFANO 1 PROLINA 0 TCT SI SERINA 4 POLAR NO 8 TCC SI IO IZARLE TCA SI TCG SI TGT SI CISTEINA 2 TGC SI ASPARAGINA 0 GLUTAMINA 0 TAT SI TIROSINA 2 TAC SI TREONINA 2 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA POS) ?????????? n TAA SI CODÓN DE PARO 3 SEÑAL DE, 3 TAG SI PARO (STP) TGA SI TOTAL 32 Están . representados 11 aminoácidos TABLA 52: Cartucho Mutagénlco: N,A, CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR O 6 IONIZABLE (POLT CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI CAA SI GLUTAMINA 2 CAG SI TAT SI TI OSINA 2 TAC SI TREONINA 0 GAT ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI AAA SI LISINA 2 IONIZABLE: 4 AAG SI CARGA BASICA POSITIVA (POS) ARGININA 0 CAT SI HISTIDINA 2 CAC SI TAA SI CODÓN DE PARO 2 SEÑAL DE 2 TAG SI PARO (STP) TOTAL 16 Están representados 7 aminoácidos TABLA 54; Cartucho Mutagenico; N,G,N CODÓN Rep^re^en- AMINOÁCIDO (Frecen- CATEGORÍA (Frecuencia) GGT SI GLICINA 4 NO POLAR 5 GGC SI (NPL) GGA SI GGG SI ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TGG SI TRIPTOFANO 1 PROLINA 0 AGT SI SERINA 2 POLAR NO 4 AGC SI IO IZABLE TGT SI CISTEINA 2 TGC SI ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IO IZABLE : 0 CARGA BASICA OSI¬ CGT SI ARGININA 6 TIVA (POS) CGC SI CGA SI CGG SI AGA SI AGG SI HISTIDINA 0 TGA SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 16 Estáp representados 5 aminoácidos TABLA 56: Cartucho Mutagenico; N,A/C,N CODÓN Resjregen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia GLICINA 0 NO, POLAR 8 (NPL) GCT SI ALANINA 4 GCC SI GCA SI GCG SI VALI A 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 CCT SI PROLINA 4 CCC SI CCA SI CCG SI TCT SI SERINA 4 POLAR NO 14 TCC SI IONIZABLE TCA SI TCG SI CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI CAA SI GLUTAMINA 2 CAG SI TAT SI TIROSINA 2 TAC SI ACT SI TREONINA 4 ACC SI ACA SI ACG SI GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI ?? SI LISINA 0 IONIZABLE: 4 AAG SI CARGA BASICA POSITIVA (POS) ARGININA CAT SI HISTIDINA 2 CAC SI TAA S CIT CODÓN DE PARO 2 SEÑAL DE, 2 TOTAL 32 Están . reí jre¡ sentados II 11 aminoc ios II TABLA 57; Cartucho Mutagenico; N,A/G,N CODÓN RepresenAMINOACIDO (FrecuenCATEGORÍA (Fre^cuen- tado cia) GGT SI GLICINA 4 NO, POLAR 5 SI (NPL) GGA SI GGG SI ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TGG SI TRIPTOPANO 1 PROLINA 0 AGT SI SERINA 2 POLAR NO 10 AGC SI IONIZABLE TGT SI CISTEINA 2 TGC SI AAT SI ASPARAGINA 2 AAC SI CAA SI GLUTAMINA 2 CAG SI TAT TAC §! TIROSINA 2 TREONINA 0 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA TNEG) Sic SI ACIDO GLUTAMICO 2 SI AAA SI LISINA 2 IONIZABLE : 10 AAG SI CARGA BASICA POSITIVA POS) CGT SI ARGININA 6 CGC SI CGA SI CGG SI AGA SI AGG SI CAT SI HISTIDINA 2 CAC SI TAA SI CODÓN DE PARO 3 SEÑAL DE, 3 TAG SI PARO (STP) TOTAL 32 Están , reípresentados NPL: POL: NEG: POS: STP- 12 aminoí.cíaos 5: 10: 4: 10: 3 TABLA 58; Cartucho Mutagónico: ?,?/?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 16 ALANINA 0 GTT SI VALINA 4 GTC SI GTA SI GTG SI TTA SI LEUCINA 6 TTG SI CTT SI CTC SI CTA SI CTG SI ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI ETIONINA 1 TTT SI FENILALANINA 2 TTC SI TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 6 IONIZABLE CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI CAA SI GLUTAMINA 2 CAG SI TAT SI TIROSINA 2 TAC SI TREONINA 4 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI AA SI LISINA 0 IONIZABLE: 4 AAG SI CARGA BASICA POSITIVA (POS) ARGININA CAT SI HISTIDINA 2 CAC SI TAA S CIT CODÓN DE PARO 2 SEÑAL DE, 2 TOTAL 32 Están , reí?ressentados HPL: POL: HEG: POS : STP» 12 aminoíiciclos 16: 6: 4: 4: 2 TABLA 59: Cartucho Mutagenico: N,C/G,N TGA SI CODÓN DE PARO 1 SEÑAL DE. 1 PARO (STP) TOTAL 32 Están representados NPL: POL.; NSG: POS : STP. 8 aminoácidos 13: 12: 0: 6: 1 TABLA 60: Cartucho Hutagenico: N,C/T,N HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 32 Están representados NFL: POL: NEG: POS: STP. 9 aminoácidos 24: 8: 0: 0: 0 TABLA 61: Cartucho Mutagenico; N,G/T,N CODÓN Rei>regen- AMINOÁCIDO (FrecuenCATEGORÍA' (Frecuencia) cia) GGT SI GLICINA 4 NO, POLAR 21 GGC SI (NPL) GGA SI GGG SI ALAMINA 0 GTT SI VALINA 4 GTC SI GTA SI GTG SI TTA SI LEUCINA 6 TTG SI CTT SI CTC SI CTA SI GTG SI ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 TTT SI FENILALA INA 2 TTC SI TGG SI TGG SI TRIPTOFANO 1 PROLINA 0 AGT SI SERINA 2 POLAR NO 4 AGC SI IO IZARLE TGT SI CISTEINA 2 TGC SI ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 6 CARGA BASICA POSI¬ GCT SI ARGININA 6 TIVA (POS CGC SI CGA SI CGG SI AGA SI AGG SI n TAG SI CODÓN DE PARO 1 SEÑAL DE, 1 PARO (STP) TOTAL 32 Están . representados NPL: POL: NEG: POS: STP- 10 aminoácidos 21: 4: 0: 6: 1 TABLA 63: Cartucho Mutagénico: N,A/C/T,N CODÓN AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 8 (NPL) GCT SI ALA INA 4 GCC SI GCA SI GCG SI GTT SI VALINA 4 GTC SI GTA SI GTG SI TTA SI LEUCINA 6 TTG SI CTT SI CTC SI CTA SI CTG SI ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 TTT SI FENILALANINA 2 TTC SI TRIPTOFANO 0 CCT SI PROLINA 4 CCC SI CCA SI CCG SI TCT SI SERINA 4 POLAR NO 14 TCC SI IONIZARLE TCA SI TCG SI CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI CAA SI GLUTAMINA 2 CAG SI TAT SI TIROSINA 2 TAC SI ACT SI TREONINA 4 ACC SI ACA SI ACG SI GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG7 GAA SI ACIDO GLUTAMICO 2 AAA SI LISINA 2 lONIZABLE : 4 AAG SI CARGA BASICA POSITIVA (POS) ARGININA CAT SI HISTIDINA 2 CAC SI TAA SI CODÓN DE PARO 2 SEÑAL DE, 2 TAG SI PARO (STP) TOTAL 48 Están . representados 16 aminoácidos TABLA 64: Cartucho Mutagenico: N,A/G/T,N CAT SI HISTIDINA 2 CAC SI TAA SI CODÓN DE PARO 3 SEÑAL DE, 3 TAG SI PARO (STP) TGA SI TOTAL 48 Están , representados NPL: POL: NEG: POS: STP- 17 aminoácidos 21 ; 10 4: 10; 3 TABLA 65: Cartucho Mutagenico: N,A/G/T,N LISINA 0 lONIZABLE: 4 CARGA BASICA POSI¬ SI ARGININA 6 TIVA (POS) 31 CGA SI CGG SI AGA SI AGG SI HISTIDINA 0 TGA SI CODÓN DE PARO 1 SEÑAL DE 1 PARO (STP) TOTAL 48 Están . representados 13 aminoácidos TABLA 66: Cartucho Mutagenico: C,C,N CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 4 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILAIANINA 0 TRIPTOFANO 0 CCT SI PROLINA 4 ccc §1 CCA SI CCG SI SERINA 0 POLAR NO 0 IO IZARLE CISTEINA 0 ASPAKAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Estás representados NPL: POL: NEG: POS: STP- 1 aminoácidos 4: 0: 0: 0: 0 TABLA 67: Cartucho Mutagenico: G,G,N CODÓN Rejgesen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GGT SI GLICINA 4 NO, POLAR 4 GGC SI (NPL) GGA SI GGG SI ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IO IZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 M ACIDO GLUTAMICO 0 VAf(GN»EG) LISINA 0 IONIZABLE : 0 CARGA BASICA POSI¬ ARGININA TIVA 7POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados 1 aminoácidos TABLA 68: Cartucho Mutagenico: G,C,N CODÓN Rep^resen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 4 ( PL) GCT SI ALANINA 4 GCC SI GCA GCG SI VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IO IZABLE : 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE : 0 CARGA BASICA POSI¬ ARGININA TIVA (POS) HISTIDINA 2 CODÓN DE PARO 2 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP. 1 aminoácidos 4: 0: 0: 0: 0 TABLA 69: Cartucho Mutagénico: G,T,N TABLA 70: Cartucho Mutagénico: G,C,N CODÓN Rejare^sen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALA INA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IO IZARLE CISTEINA 0 AS ARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ CGT SI ARGININA 4 TIVA (POS) CGC SI CGA SI CGG SI HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP- 1 aminoácidos 4: 0: 0: 0: 0 TABLA 71: Cartucho Mutagenico: G,T,N TABLA 72: Cartucho Mutagenico: T,C,N CODÓN Repregen- AMINOACIDO (Fr^n^en- CATEGORÍA (Fre^ci^en- GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 4 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 TCT SI SERINA 4 POLAR NO 4 TCC SI IO IZABLE TCA SI TCG SI CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEO: POS: STP- 1 aminoácidos 0: 4: 0; 0: 0 TABLA 73: Cartucho Mutagenico: A,C,N CODÓN Rejtregen- AMINOACIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, OLAR 0 ALAMINA 0 VALINA 0 LEUCINA 4 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 4 IO IZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 ACT SI TREONINA 4 ACC SI ACA SI ACG SI ACIDO ASPARTICO 0 0 DA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSIr ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE. 0 PARO (STP) TOTAL 4 Están representados 1 aminoácidos TABLA 74: Cartucho Mutagenico: G,A,N CODÓN Re£>resen- AMINOÁCIDO (Fre.cuen- CATEGORÍA (Frecuencia) GLICINA 0 NO, POLAR 4 (NPL) ALANINA 0 VALINA 0 LEUCINA 4 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA IPOS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados 2 aminoácidos TABLA 75: Cartucho Mutagénico: ?,?,? CODÓN Rep^re^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 4 (NPL) ALAMINA 0 VALINA 0 LEUCINA 0 ATT SI ISOLEUCINA 3 ATC SI ATA SI ATG SI METIONINA 1 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE : 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados 2 aminoácidos TABLA 76: Cartucho Mutagenico: C,A,N CODÓN Rep^re^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 P OLINA 0 SERINA 0 POLAR NO 2 IO IZARLE CISTEINA 0 ASPARAGINA 0 CAA SI GLUTAMINA 2 CAG SI TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) CAT SI HISTIDINA 2 CAC SI CODÓN DE PARO 0 0 PAROOS?!) TOTAL 4 Están representados 2 aminoácidos TABLA 77: Cartucho Mutagenico: ?,?,? CODON Rejure^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 4 ALANINA 0 VALINA 0 TTA SI LEUCINA 2 TTG SI ISOLEUCINA 0 METIONINA 0 TT SI FENILALANINA 2 TTC SI TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLOTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: CARGA SICA POBSAI0 ¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP. 2 aminoácidos 4: 0: 0: 0: 0 TABLA 78: Cartucho Mutagenico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 2 IONIZABLE CISTEINA 0 AAT SI ASPARAGINA 2 AAC SI GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) AAA SI LISINA 2 IONIZABLE : 2 AAG SI CARGA BASICA POSITIVA (POS) ARGININA 0 HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 4 Están representados NPL: POL; NEG: POS : STP. 2 aminoácidos 0: 2: 0: 2: 0 TABLA 79: Cartucho Mutagénico: ?,?,? CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia) GLICINA 0 NO, POLAR 0 (NPLT ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 2 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TAT SI TIROSINA 2 TAC SI TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BAC ARGININA 0 TSIIVAA POSI(POS) HISTIDINA 0 TAA SI CODÓN DE PARO 2 SEÑAL DE, 2 TAG SI PARO (STP) TOTAL 4 Están representados 1 aminoácidos TABLA 80: Cartucho Mutagenico: T,G,N TABLA 81: Cartucho Mutagenico: A,G,N CODON Rep^r^en- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO, POLAR 0 (NPL) ALANINA 0 VALINA 0 LEUCINA 0 ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 AGT SI SERINA 2 2 AGC SI CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ AGA SI ARGININA 0 TIVA (POS) AGG SI HISTIDINA 0 CODÓN DE PARO 0 0 TOTAL 4 Están representados NPL: POL: NEG: POS : STP- 2 aminoácidos 0: 2: 0: 2: 0 TABLA 82: Cartucho Mutagénico: G/C,G,N CODÓN RepresenAMINOÁCIDO (FrecuenCATEGORÍA (Frecuentado cia) cia!) GLICINA 0 NO, POLAR 4 (NPL) ALANINA 0 VALINA 0 CTT SI LEUCINA 4 CTC SI CTA SI CTG SI ISOLEUCINA 0 METIONINA 0 FENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZABLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA 7POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE. 0 PARO (STP) TOTAL 4 Están representados NPL: POL: NEG: POS: STP- 1 aminoácidos 4: 0: 0: 0: 0 TABLA 83: Cartucho Mutagenico: 6/C,C,N TABLA 84: Cartucho Mutagénico: G/C,A,N CODÓN Represen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 O, POLAR 0 (NPL) ALAMINA 0 VALI A 0 LEUCINA 4 ISOLEUCINA 0 METIONINA 0 FENILALANI A 0 TRIPTOFANO 0 P OLINA 0 SERINA 0 POLAR NO 2 IONIZARLE CISTEINA 0 ASPARAGINA 0 CAA Si GLUTAMINA 2 CAG SI TIROSINA 0 TREONINA 0 GAT SI ACIDO ASPARTICO 2 IONIZABLE: 4 GAC SI CARGA ACIDA NEGATIVA (NEG) GAA SI ACIDO GLUTAMICO 2 GAG SI LISINA 0 IONIZABLE: 2 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) CAT SI HISTIDINA 2 CAC SI CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 8 Están representados NPL: POL: NEG: POS : STP- 4 aminoácidos 0: 2: 4: 0: 0 2 TABLA 85: Cartucho Mutagenico: G/C,T,N CODÓN Rej>regen- AMINOÁCIDO (FrecuenCATEGORÍA (Frecuencia) cia) GLICINA 0 NO POLAR 8 (NPL) ALA INA 0 GTT SI VALINA 4 GTC SI GTA SI GTG SI CTT SI LEUCINA 4 CTC SI CTA SI CTG SI ISOLEUCINA 0 METIONINA 0 PENILALANINA 0 TRIPTOFANO 0 PROLINA 0 SERINA 0 POLAR NO 0 IONIZARLE CISTEINA 0 ASPARAGINA 0 GLUTAMINA 0 TIROSINA 0 TREONINA 0 ACIDO ASPARTICO 0 IONIZABLE: 0 CARGA ACIDA NEGATI¬ ACIDO GLUTAMICO 0 VA (NEG) LISINA 0 IONIZABLE: 0 CARGA BASICA POSI¬ ARGININA 0 TIVA (POS) HISTIDINA 0 CODÓN DE PARO 0 SEÑAL DE, 0 PARO (STP) TOTAL 8 Están representados 2 aminoácidos 2.11.2.3. RE-ENSAMBLE MEDIADO POR EXONUCLEASA En una modalidad particular, esta invención proporciona un método para mezclar, ensamblar, re-ensamblar, recombinar, y/o concatenar cuando menos dos polinucleótidos para formar un polinucleótido de progenie (por ejemplo, un polinucleótido de progenie quimérico que se puede expresar para producir un polipéptido o una senda de gen) . En una modalidad particular, un extremo de polinucleótido de cadena doble (por ejemplo, dos secuencias de cadena simple hibridadas una con la otra como compañeros de hibridación) se trata como una exonucleasa para liberar nucleótidos de una de las dos cadenas, dejando la cadena restante libre de su compañero original de manera que, si se desea, la cadena restante se puede usar para lograr la hibridación con otro compañero. En un aspecto particular, un extremo de polinucleótido de cadena doble (que puede ser parte de - o conectado con - un polinucleótido o una secuencia que no sea de polinucleótido) se somete a una fuente de actividad de exonucleasa. Las fuentes útiles de actividad de exonucleasa pueden ser una enzima con actividad exonucleasa 3 ' , una enzima con actividad exonucleasa 5', una enzima tanto con actividad exonucleasa 3' como actividad exonucleasa 5', y cualquier combinación de las mismas. Una exonucleasa se puede usar para liberar nucleótidos de uno o ambos extremos de un polinucleótido de cadena doble lineal, y de uno de todos los extremos de un polinucleótido ramificado que tiene más de dos extremos. El mecanismo de acción de esta liberación se cree que está compuesto de una hidrólisis catalizada enzimática-mente de nucleótidos terminales, y se puede permitir proceder de una manera que depende del tiempo, permitiendo el control experimental de la progresión del proceso enzimático. En cambio, un paso no enzimático se puede usar para mezclar, ensamblar, re-ensamblar, recombinar, y/o concatenar bloques de construcción de polinucleótidos que están compuestos de someter una muestra de trabajo a condiciones de desnaturalización (o "fusión") (por ejemplo, cambiando la temperatura, pH, y/o las condiciones de salinidad) de manera de fundir un conjunto de trabajo de polinucleótidos de doble cadena en cadenas de polinucleótido simples. Para mezclar, es deseable que las cadenas simples de polinucleótido participen en algún grado en el recocido con diferentes compañeras de hibridación (es decir y no únicamente reviertan al re-cocimiento exclusivo entre las que fueron compañeras anteriores antes del paso de desnaturalización) . La presencia de las compañeras de hibridación anteriores en el recipiente de la reacción, sin embargo, no impide, y algunas veces hasta favorece, el recocido de un polinucleótido de cadena simple con su compañera anterior para recrear un polinucleótido de cadena doble original . En contraste con este paso de mezcla no enzimático compuesto de someter los bloques de construcción de polinucleótido de doble cadena a desnaturalización, seguida por recocido, la presente invención además proporciona un enfoque basado en exonucleasa que no requiere desnaturalización - en vez de eso, evitando las condiciones de desnaturalización y el mantenimiento de los sustratos de polinucleótido de cadena doble en estado recocido (es decir, no desnaturalizado) son condiciones necesarias para la acción de las exonucleasas (por ejemplo, exonucleasa III y producto de gen rojo alfa) . Adicionalmente en contraste, la generación de secuencias de polinucleótidos de cadena simple capaces de hibridar con otras secuencias de polinucleótidos de cadena simple es el resultado de la disociación covalente - y por tanto la destrucción de secuencia - en una de las compañeras de hibridación. Por ejemplo, una enzima exonucleasa III se puede usar para liberar enzimáticamente los nucleótidos terminales 3 ' en una cadena de hibridación (para lograr la hidrólisis covalente en esta cadena de polinucleótidos) ; y esto favorece la hibridación de la cadena simple restante con una nueva compañera (ya que su compañera anterior se sometió a disociación covalente) . A manera de otra ilustración, una exonucleasa específica, a saber exonucleasa III se proporciona en la presente como un ejemplo de una exonucleasa 3'; sin embargo, otras exonucleasas también se pueden usar, incluyendo enzimas con actividad exonucleasa 5 ' y enzimas con actividad exonucleasa 3 ' e incluyendo enzimas todavía no descubiertas y enzimas todavía no desarrolladas. Se aprecia particularmente que las enzimas se pueden descubrir, optimizar (por ejemplo, diseñar técnicamente mediante evolución dirigida) , o tanto descubrir como optimizar específicamente para el enfoque actualmente descrito que tenga regímenes más óptimos y/o actividades específicas más altas y/o mayor falta de actividades no deseadas . De hecho se espera que la presente invención puede alentar el descubrimiento y/o desarrollo de estas enzimas de diseñador. En suma, esta invención se puede practicar con una variedad de enzimas de exonucleasa actualmente disponibles, así como enzimas todavía no descubiertas y enzimas todavía no desarro11adas . La acción de exonucleasa de la exonucleasa III requieren un extremo de polinucleótido de cadena doble de trabajo que sea romo o tenga un colgante 5', y la acción de exonucleasa está compuesta de liberar enzimáticamente nucleótidos terminales 3', dejando un extremo 5' de cadena simple que se vuelve más largo y más largo conforme la acción de la exonucleasa continúa (ver la Figura 1). Cualquier colgante 5' producido por este enfoque se puede usar para hibridar a otra secuencia de polinucleótido de cadena simple (que también puede ser un polinucleótido de cadena simple o un colgante terminal de un polinucleótido de parcialmente cadena doble) que comparte suficiente homología para permitir la hibridación. La capacidad de las secuencias de cadena simple generadas por exonucleasa III (por ejemplo, en colgantes 5 ' ) para hibridar con otras secuencias de cadena simple permite que dos o más polinucleótidos se mezclen, ensamblen, re-ensamblen, y/o concatenen.
Además, se aprecia que uno puede proteger el extremo de un polinucleótido de doble cadena o volverlo susceptible a una acción enzimática deseada de una exonucleasa útil conforme sea necesario. Por ejemplo, un extremo de polinucleótido de cadena doble que tenga un colgante 3 ' no es susceptible a la acción de exonucleasa de la exonucleasa III. Sin embargo, se puede volver susceptible a la acción de exonucleasa de la exonucleasa III por una variedad de medios; por ejemplo, puede ser roma por tratamiento con una polimerasa, disociarse para proporcionar un extremo romo o un colgante 5', unir (ligarse o hibridarse) con otro polinucleótido de cadena doble para proporcionar un extremo romo o un colgante 5', hibridarse en un polinucleótido de cadena simple para proporcionar un extremo romo o un colgante 5 ' , o modificarse por cualquier variedad de medios) . De acuerdo con un aspecto, una exonucleasa se puede permitir que actúe en uno o en ambos extremos de un polinucleótido de cadena doble lineal y seguir hasta completar, para, o cerca del completamiento, o una completamiento parcial. Cuando la acción de exonucleasa se deja ir a completamiento, el resultado será que la longitud de cada colgante 5' se extenderá más allá de la región media del polinucleótido en la dirección de lo que se podría considerar un "punto de encuentro" (el cual sería algo cerca del punto medio del polinucleótido) . Finalmente, esto da como resultado la producción de polinucleótidos de cadena simple (que se pueden volver desasociados) que cada uno tiene la mitad de la longitud del polinucleótido de cadena doble original (ver la Figura 1) . Alternativamente, una reacción mediada por exonucleasa se puede terminar antes de continuar el completamien-to . De este modo este enfoque mediado por exonucleasa es útil para mezclar, ensamblar y/o re-ensamblar, recombinar, y concatenar bloques de construcción de polinucleótido, estos bloques de construcción de polinucleótido pueden ser hasta 10 bases de longitud o decenas de bases de longitud o cientos de bases de longitud o miles de bases de longitud o decenas de miles de bases de longitud o cientos de miles de bases de longitud o millones de bases de longitud o aún más largas. Este enfoque mediado por exonucleasa se basa en la acción del ADN de cadena doble específico para la actividad de exodesoxirribonucleasa de la exonucleasa III de E.coli. Los sustratos para la exonucleasa III se pueden generar sometiendo un polinucleótido de cadena doble a fragmentación. La fragmentación se puede lograr mediante medios mecánicos (por ejemplo, cizalla, sonificación, etcétera) , por medios enzimáticos (por ejemplo, usando enzimas de restricción) , y por cualquier combinación de las mismas. Los fragmentos de un polinucleótido más grande también se pueden generar mediante síntesis mediada por polimera-sa . La exonucleasa III es una enzima monomérica de 28 K, el producto del gen x A de E.coli con cuatro actividades conocidas: exodesoxirribonucleasa (alternativamente denominada como exonucleasa en la presente), aseH, DNA-3 ' -fosfatasa, y AP endonucleasa . La actividad de exodesoxirribonucleasa es específica para ADN de cadena doble. El mecanismo de acción se piensa que involucra hidrólisis enzimática de ADN a partir de un extremo 3' progresivamente hacia una dirección 5', con la formación de nucleosida 5 '-fosfatos y una cadena simple residual. La enzima no despliegue hidrólisis eficiente de ADN de cadena simple, ARN de cadena simple, o ARN de cadena doble; sin embargo, degrada ARN en el híbrido de ADN-ARN que libera nucleósido 5 '-fosfatos. La enzima también libera fosfato inorgánico específicamente de los grupos 3 ' fosfomonoéster en ADN, pero no de ARN o de oligonucleótidos cortos. La remoción de estos grupos convierte el término en un cebador para la acción de polimerasa de ADN. Ejemplos adicionales de enzimas con actividad exonucleasa incluyen fosfodiesterasas rojo alfa y venom. El producto de gen rojo alfa (redo) (también denominadas como lambda exonucleasa) es de origen de bacteriófago X. El gen rojo alfa se transcribe a partir del promotor del lado izquierdo y su producto está involucrado (24 kD) en recombinación. El producto gen rojo alfa actúa progresivamente desde los términos 5'-fosforilados para liberar los mononucleótidos del ADN dúplex (Takahashi & Kobayashi, 1990) . Las fosfodiesterasas venom (Laskowski, 1980) son capaces de abrir rápidamente el ADN super enrollado. Se aprecia que las cadenas de ácido nucleico relacionadas pero no idénticas se pueden hibridar en el paso hacia la generación de moléculas quiméricas. Sin embargo, debido a que no son idénticas, pueden formar lo que podría denominarse un complejo heteromérico, es decir, un recocido de ácidos nucleicos no idénticos. En este complejo, se aprecia que aún cuando dos cadenas heterólogas se pueden hibridar en parte, las secuencias terminales de cadena suficientemente heteróloga no se hibridarán, entonces son hibridables. Esto plantea un problema, debido a que los extremos no hibridados son subóptimos para la extensión de la iniciación y para servir como puntos de ligación. De conformidad con lo anterior, en otra modalidad, esta invención proporciona el uso de tratamiento de exonucleasa como un medio para liberar los nucleótidos 3 ' y 5 ' terminales a partir del extremo de cadena simple no hibridado de una cadena de ácido nucleico recocida en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero hibridado para facilitar la extensión basada en polimerasa y/o la ligación mediada por ligasa del extremo tratado. Este procedimiento se apoda "la poda de extremos sueltos" . Una variedad de exonucleasa son útiles para este propósito de "poda". De este modo, los tratamientos de exonucleasa particularmente preferidos para este propósito de "poda" de acuerdo con esta invención incluyen tratamiento con nucleasa de frijol Mung, tratamiento con nucleasa SI, y tratamiento con ADN de E.coli. Los tratamientos de exonucleasa preferidos adicionalmente para este propósito de "poda" de acuerdo con esta invención incluyen el uso de las enzimas enlistadas más adelante (las propiedades de enzima proporcionadas se proporcionan) .
Exonucleasas a. Stratagene b. Promega c . Epicenter d. Roche e. Kong, H.M. , Kucera, R.B. y Jack, W.E. (1993), J. Biol. Chem. 268, 1965-1975 f. McClure, W.R. y Jovin, T.M. (1975), J. Biol. Chem. 250, 4073-4080 g. Polesky, A.H. , Steitz, T.A., Grindley, N.D.F., y Joyce, C.M. (1990), J. Biol. Chem. 265, 14579-14591 h. Glllin, F.D. y Noasal, N.G. (1975) Bioche . Biophys. Res. Cowmun. 64, 457-464 i. Patel, S.S. Wong, E. y Johnson, K.A. (1991), Biochemistry 30, 511-525 k. exhibe cierta actividad de exonucleasa de doble hélice desde andaos extremos a mayores concentraciones de enzima m. exhibe cierta actividad de exonucleasa de doble hélice a mayores concentraciones de enzima En otra modalidad preferida, esta invención proporciona los bloques de construcción de ácido nucleico para el re-ensamble mediado por exonucleasa que incluyen cadenas de ácido nucleico que después de la hibridación con cadenas de ácido nucleico no idénticas forman complejos heteroméricos . Dentro de estos complejos, una cadena que está recocida a más de otra cadena se denomina cadena de polienlace, y una cadena que está recocida a otra cadena se conoce como cadena de monoenlace. De conformidad con lo anterior, las cadenas de monoenlace usualmente, pero no siempre son más cortas de longitud que las cadenas de polienlace. A manera de ejemplificación no limitante, tanto las cadenas de monoenlace como las cadenas de polienlace se pueden generar a partir de una molécula progenitora de plantilla ya sea por síntesis, fragmentación (física o basada en enzima) , aislamiento (por ejemplo, mediante tratamiento selectivo con Dpnl) y/o por desnaturalización. 2.11.2.3. RE-ENSAMBLE DE LIGACION NO ESTOCASTICO En un aspecto, la presente invención proporciona un método no estocástico denominado re-ensamble de ligación sintético (SLR) , que está algo relacionado con mezcla estocásti-ca, salvo que los bloques de construcción de ácido nucleico no se mezclan ni concatenan ni quimerizan aleatoriamente, si no se ensamblan no estocásticamente . Una diferencia particularmente notable es que el presente método de re-ensamble de ligación sintética no depende de la presencia de un alto nivel de homología entre los polinu-cleótidos que se van a mezclar. En contraste, los métodos anteriores, particularmente antes de los métodos de mezcla estocástica requieren esa presencia de un alto nivel de homología, particularmente en los sitios de acoplamiento, entre los polinucleótidos que se van a mezclar. De conformidad con lo anterior, estos métodos anteriores favorecen la regeneración de las moléculas progenitoras originales, y son sub-óptimas para generar grandes números de quimeras de progenie novedosas, particularmente progenies de longitud entera. La presente invención, por otro lado, se puede usar para generar no estocás-ticamente bibliotecas (o conjuntos) de moléculas de progenie compuestas de más de 10100 quimeras diferentes. Preferiblemente, un re-ensamble de ligación sintético también se puede usar para generar bibliotecas compuestas de más de io1000 quimeras de progenie diferente con (ningún límite superior a la vista) . De este modo, en un aspecto, la presente invención proporciona un método,' este método es no estocástico, para producir un conjunto de moléculas de ácido nucleico quiméricas finalizado que tienen un orden de enlace global que se elige por diseño, este método está compuesto de los pasos de generar por diseño una pluralidad de bloques de construcción de ácido nucleico específicos que tienen unos extremos ligables mutuamente compatibles útiles, y ensamblar estos bloques de construcción de ácido nucleico, de manera que se logra un orden de enlace global diseñado. Los extremos ligables compatibles mutuamente de los bloques de construcción de ácido nucleico que se van a ensamblar se consideran que son "útiles" para este tipo de enlace ordenado si permiten que los bloques de construcción se acoplen en órdenes predeterminados. De este modo, en un aspecto, el orden del enlace global al cual los bloques de construcción de ácido nucleico se pueden acoplar se especifica por el diseño de los extremos ligables y, si más de un paso de enlace se va a usar, entonces el orden del enlace global es en el cual los bloques de construcción de ácido nucleico se puede acoplar también se especifica mediante el orden secuencial de los pasos de enlace. La Figura 4, el panel C ilustra un proceso de enlace ejemplar compuesto de dos pasos secuenciales para lograr un orden de enlace global diseñado (no estocástico) para 5 bloques de construcción de ácido nucleico. En una modalidad preferida de esta invención, las piezas de construcción recocidas se tratan con una enzima, tal como una ligasa (por ejemplo, ligasa de ADN T4) , logran enlace covalente de las piezas de construcción. En una modalidad preferida, el diseño de construcción de ácido nucleico se obtiene después del análisis de la secuencia de un conjunto de plantillas de ácido nucleico progenitor que sirven como base para producir un conjunto de progenie de moléculas de ácido nucleico quimérico finalizadas. Estas plantillas de ácido nucleico progenitor sirven como una fuente de información de secuencias que ayuda en el diseño de bloques de construcción de ácido nucleico que se van a mutagenizar, es decir, quimerizar o mezclar. En una ejemplificación, esta invención proporciona la quimerización de una familia de genes relacionados y su familia codificada de productos relacionados. En una ej emplificación particular, los productos codificados son enzimas. Como una lista representativa de familias de enzimas que se pueden mutagenizar de acuerdo con los aspectos de la presente invención, se puede mencionar, las siguientes enzimas y sus funciones: 1. Lipasa/Esterasa a. Hidrólisis enantioselectiva de ésteres (lípidos)/ tioésteres 1) Resolución de mezclas racémicas 2) Síntesis de ácidos activos ópticamente o alcoholes a partir de meso-diésteres b. Síntesis selectiva 1) Hidrólisis regioespecífica de ésteres de carbohidratos 2) Hidrólisis selectiva de alcoholes secundarios cíclicos c. Síntesis de ésteres ópticamente activos, lactonas, ácidos, alcoholes 1) Transesterificación de ésteres activados/no activados 2) Interesterificación 3) Lactonas ópticamente activas a partir de hidro-xiésteres 4) Abertura de anillo regio y enantioselectivo de anhídridos d. Detergentes e. Conversión de grasa/aceite f . Madurez de queso 2. Froteasa a. Síntesis de éster/amida b. Síntesis de péptido c. Resolución de mezclas racémicas de ésteres de aminoácidos d. Síntesis de aminoácidos no naturales e. Hidrólisis de detergentes/proteína 3. Glicosidasa/Glicosil transferasa a. Síntesis de azúcar/polímero b. Disociación de ensambles glicosídicos para formar mono, di y oligosacáridos c. Síntesis de oligosacáridos complejos d. Síntesis de glicosida usando UDP-galactosil transferasa e. Transglicosilación de disacáridos, fluoruros de glicosilo, aril galactosidas f . Transferencia de glicosilo e síntesis de oligosa-cáridos g. Disociación diastereoselectiva de ß-glucosilsulfó-xidos h. Glicosilaciones asimétricas i. Procesamiento de alimentos j . Procesamiento de papel 4. Fosfatasa/Quinasa a. Síntesis/hidrólisis de ésteres de fosfato 1) Fosforilación regio-, enantioselectiva 2) Introducción de ésteres de fosfato 3) Síntesis de precursores fosfolípidos 4) Síntesis de polinucleótido controlado b. Molécula biológica activada c. Formación de enlace fosfato selectivo sin grupos de protección 5. Hono/Dioxigenasa a. Oxifuncionalización directa de sustratos orgánicos no activados b. Hidroxilación de alcano, aromáticos, esteroides c . Epoxidación de alquenos d. Sulfoxidación enantioselectiva e. Oxidaciones regio- y estereoselectivas Bayer- Villiger 6. Haloperoxidasa a. Adición oxidativa de ion haluro a los sitios nucleófilos b. Adición de ácidos hipo-halosos con ensambles olefínicos c. Disociación de anillo de ciclopropanos d. Sustratos aromáticos activados convertidos en derivados orto y para e. 1,3 dicetonas convertidas en derivados 2 -halo f . Oxidación de heteroátomos de azufre y nitrógeno que contienen sustratos g. Oxidación de enol acetatos, alquinos y anillos aromáticos activados 7. Lignina peroxidasa/Diarilpropano peroxidasa a. Disociación oxidativa de ensambles C-C b. Oxidación de alcoholes bencílicos el aldehidos c. Hidroxilación de carbonos bencílicos d. Dimerización de fenol e. Hidroxilación de ensambles dobles para formar dioles f . Disociación de lignina aldehidos 8. Epóxido hidrolasa a. Síntesis de compuestos bio-activos enantiomérica-mente puros b. Hidrólisis regio- y enantioselectiva de epóxido c. Epoxidación aromática y olefínica mediante mono-oxigenasas para formar epóxidos d. Resolución de epóxidos racémicos e. Hidrólisis de epóxidos esteroides 9. Nitrilo hidratasa/nitrilasa a. Hidrólisis de nitrilos alifáticos en carboxamidas b. Hidrólisis de nitrilos alifáticos aromáticos, heterocíclicos , no saturados en ácidos correspondientes c. Hidrólisis de acrilonitrilo d. Producción de ácidos carboxílieos aromáticos y carboxamidas, (nicotinamida, picolinamida, isonicotinamida) e. Hidrólisis regioselectiva de dinitrilo acrílico f. a-aminoácidos a partir de a-hidroxinitrilos 10. Transaminasa a. Transferencia de grupos amino en ácidos oxo 11. Amidasa/Acilasa a. Hidrólisis de amidas, amidinas, y otros ensambles C-N b. Resolución de aminoácidos no natural y síntesis Estas ejemplificaciones, aunque ilustran ciertos aspectos específicos de la invención, no retratan las limitaciones ni circunscriben el alcance de la invención descrita. De este modo de acuerdo con un aspecto de la invención, las secuencias de una pluralidad de plantillas de ácido nucleico padres se alinean con el fin de seleccionar uno o más puntos de demarcación, estos puntos de demarcación se pueden localizar en un área de homología, y están compuestos de uno o más nucleóti-dos, y estos puntos de demarcación se comparan con cuando menos dos plantillas progenitoras . Los puntos de demarcación se pueden usar para delinear los límites de bloques de construcción de ácidos nucleicos que se van a generar. De este modo, los puntos de demarcación identificados y seleccionados en las moléculas padres sirven como puntos de quimerización potencial en el enlace de las moléculas de progenie. Preferiblemente un punto de demarcación es útil es un área de homología (compuesta de cuando menos una base de nucleótido homologa) compartida por cuando menos dos plantillas padres. Más preferiblemente un punto de demarcación útil es un área de homología que está compartida por cuando menos la mitad de las plantillas padres. Más preferiblemente, todavía un punto de demarcación útil es un área de homología que es compartida por cuando menos dos tercios de las plantillas padres. Aún más preferiblemente un punto de demarcación útil es un área de homología que se comparte por cuando menos tres cuartas partes de las plantillas padres. Aún más preferiblemente todavía un punto de demarcación útil es un área de homología que se comparte por casi todas las plantillas padres. Aún más preferiblemente todavía un punto de demarcación útil es un área de homología que se comparte por todas las plantillas padres. El proceso de diseñar bloques de construcción de ácido nucleico y de diseñar los extremos ligables compatibles mutuamente de los bloques de construcción de ácido nucleico que se van a ensamblar se ilustra en las Figuras 6 y 7. Como se muestra, la alineación de un conjunto de plantillas padres revela varios puntos de demarcación que se presentan naturalmente, y la identificación de puntos de demarcación compartidos por estas plantillas ayuda a determinar no estocásticamente los bloques de construcción que se van a generar y usar para la generación de moléculas quiméricas de progenie. En una modalidad preferida, esta invención proporciona que el proceso de re-ensamble de ligación se realice exhaustivamente con el fin de generar una biblioteca exhaustiva. En otras palabras, todas las combinaciones ordenadas posibles de los bloques de construcción de ácido nucleico se representan en el conjunto de moléculas de ácido nucleico quimérico finalizadas. Al mismo tiempo, en una modalidad particularmente preferida, el orden del enlace (es decir el orden del enlace de cada bloque de construcción en la secuencia 5' a 3' de cada ácido nucleico quimérico finalizado) en cada combinación es mediante el diseño (o no estocástico) . Debido a la naturaleza no estocástica de esta invención, la posibilidad de productos colaterales no deseados se reduce en gran medida. En otra modalidad preferida, esta invención proporciona que el proceso de re-ensamble de ligación se realice sistemáticamente, por ejemplo, con el fin de generar una biblioteca compartimentalizada sistemáticamente, con compartimientos que se pueden seleccionar sistemáticamente, es decir, uno por uno. En otras palabras esta invención proporciona que, a través del uso selectivo y juicioso de bloques de construcción de ácido nucleico específicos, acoplados con el uso selectivo y juicioso de reacciones de enlace escalonadas secuencialmente, se puede lograr un diseño experimental en donde conjuntos específicos de productos de progenie se hacen en cada uno de los recipientes de reacción distintos. Esto permite que se realice un examen sistemático y un procedimiento de selección. De este modo, permite un número potencialmente muy grande de moléculas de progenie que se examinen sistemáticamente en grupos más pequeños. Debido a su capacidad para realizar quimerizaciones de una manera que es muy flexible aunque exhaustiva y también sistemática, particularmente cuando hay un bajo nivel de homología entre las moléculas progenitoras , la presente invención proporciona la generación de una biblioteca (o conjunto) compuesto de un gran número de moléculas de progenie . Debido a la naturaleza no estocástica de la invención de re-ensamble de ligación presente, las moléculas de progenie generadas preferiblemente comprenden una biblioteca de moléculas de ácido nucleico quimérico finalizadas que tienen un orden de enlace global que se elige por diseño. En una modalidad particularmente preferida de esta invención, esta biblioteca generada está compuesta de preferiblemente más de 103 diferentes especies moleculares de progenie, más preferiblemente mayor de 105 diferentes especies moleculares de progenie, más preferiblemente mayor de 1010 diferentes especies moleculares de progenie, más preferiblemente mayor de 1015 diferentes especies moleculares de progenie, más preferiblemente mayor de 1020 diferentes especies moleculares de progenie, más preferiblemente mayor de 1030 diferentes especies moleculares de progenie, más preferiblemente mayor de 1040 diferentes especies moleculares de progenie, más preferiblemente mayor de 1050 diferentes especies moleculares de progenie, más preferiblemente mayor de 1060 diferentes especies moleculares de progenie, más preferiblemente mayor de 1070 diferentes especies moleculares de progenie, más preferiblemente mayor de 1080 diferentes especies moleculares de progenie, más preferiblemente mayor de 10100 diferentes especies moleculares de progenie, más preferiblemente mayor de 10110 diferentes especies moleculares de progenie, más preferiblemente mayor de 10120 diferentes especies moleculares de progenie, más preferiblemente mayor de 10130 diferentes especies moleculares de progenie, más preferiblemente mayor de 10140 diferentes especies moleculares de progenie, más preferiblemente mayor de 10150 diferentes especies moleculares de progenie, más preferiblemente mayor de 10175 diferentes especies moleculares de progenie, más preferiblemente mayor de 10200 diferentes especies moleculares de progenie, más preferiblemente mayor de 10300 diferentes especies moleculares de progenie, más preferiblemente mayor de 10400 diferentes especies moleculares de progenie, más preferiblemente mayor de 10500 diferentes especies moleculares de progenie, más preferiblemente mayor de io1000 diferentes especies moleculares de progenie. En un aspecto, un conjunto de moléculas de ácido nucleico quimérico finalizadas, producidas como se describe están compuestas de un polinucleótido que codifica un polipéptido. De acuerdo con una modalidad preferida, este polinucleótido es un gen, que puede ser un gen hecho por el hombre. De acuerdo con otra modalidad preferida, este polinucleótido es una senda de gen, que puede ser una senda de gen hecha por el hombre. Esta invención proporciona que uno o más genes hechos por el hombre generados por esta invención se pueden incorporar en una senda de gen hecha por el hombre, tal como una senda operable y un organismo eucariótico (incluyendo una planta) . Se aprecia que el poder de esta invención es excepio-nal, ya que hay mucha libertad de elección y control con respecto a la selección de puntos de demarcación, el tamaño y el número de los bloques de construcción de ácido nucleico, y el tamaño y diseño de los acoplamientos. Se aprecia, además, que el requisito de homología intermolecular se relaja mucho para la operabilidad de esta invención. De hecho, los puntos de demarcación se pueden aún elegir en áreas de poca o ninguna homología intermolecular. Por ejemplo, debido a bamboleo de codón, es decir, la degeneración de codones, las sustituciones de nucleótidos se pueden introducir en bloques de construcción de ácidos nucleicos sin alterar el aminoácidos originalmente codificado en la plantilla progenitora correspondiente.
Alternativamente, un codón se puede alterar de manera que se altere la codificación de un aminoácido original. Esta invención proporciona que estas sustituciones se puedan introducir en el bloque de construcción de ácido nucleico con el fin de aumentar la incidencia de puntos de demarcación intermolecular-mente homólogos y de este modo permitir que se logre una cantidad mayor de acoplamiento entre los bloques de construcción, lo cual a su vez permite que se genere un mayor número de moléculas quiméricas de progenie . En otra ejemplificación, la naturaleza sintética del paso en el cual se generan los bloques de construcción, permite el diseño y la introducción de nucleótidos (por ejemplo, uno o más nucleótidos, que pueden ser, por ejemplo, codones o introñes o secuencias reguladoras) eso más tarde se puede remover opcionalmente en un proceso in vitro (por ejemplo, mediante mutagénesis) o en un proceso en vivo (por ejemplo, utilizando una capacidad de traslape de gen de un organismo hospedero) . Se aprecia que en muchos casos la introducción de estos nucleótidos también puede ser deseable por muchas otras razones además del beneficio potencial de crear un punto de demarcación útil. De este modo, de acuerdo con otra modalidad, esta invención proporciona que un bloque de construcción de ácido nucleico se pueda usar para introducir un intrón. De este modo, esta invención proporciona que los intrones funcionales se puedan introducir en un gen, hecho por el hombre, de esta invención.
Esta invención también proporciona que intrones funcionales se puedan introducir en una senda de gen hecha por el hombre de esta invención. De conformidad con lo anterior, esta invención proporciona la generación de un polinucleótido quimérico que es un gen hecho por el hombre que contiene uno (o más) intrones introducidos artificialmente. De conformidad con lo anterior, esta invención también proporciona la generación de un polinucleótido quimérico que es una senda de gen hecha por el hombre que contiene uno (o más) intrones introducidos artificialmente. Preferiblemente, los intrones introducidos artificialmente son funcionales en una o más células huéspedes para el traslape de genes mucho de la manera que los intrones que se presenta naturalmente sirven funcionalmente en el traslape de genes. Esta invención proporciona un proceso para producir polinucleótidos que contienen intrones hechos por el hombre para ser introducidos en organismos huéspedes para la recombinación y/o traslape. La capacidad para lograr quimerizaciones , usando los acoplamientos como se describe en la presente, en áreas de poca o ninguna homología entre las moléculas progenitoras, es particularmente útil, y de hecho crítica, para el enlace de sendas de genes novedosos . Esta invención proporciona de este modo la generación de sendas de genes hechas por el hombre novedosas usando re-ensamble de ligación sintética. En un aspecto particular, esto se logra mediante la introducción de secuencias reguladoras, tales como promotores, que son operables en una hospedera destinada, para conferir operabilidad a una senda de gen novedoso cuando se introduce en la hospedera destinada. En una ejemplificación particular, esta invención proporciona la generación de sendas de genes hechos por el hombre novedosos que son operables en una pluralidad de hospederas destinadas (por ejemplo, en un organismo microbiano así como en una célula vegetal) . Esto se puede lograr, por ejemplo, mediante la introducción de una pluralidad de secuencias reguladoras, compuestas de una secuencia reguladora que es operable en una primera hospedera destinada y una secuencia reguladora que es operable en una segunda hospedera destinada. Un proceso similar se puede realizar para lograr la operabilidad de una senda de gen en una tercera especie de hospedera destinada, etcétera. El número de especies de hospederas destinadas puede ser un entero de 1 a 10 o alternativamente, mayor de 10. Alternativamente, por ejemplo, operabilidad de una senda de gen en una pluralidad de hospederas destinadas se puede lograr mediante la introducción de una secuencia reguladora que tenga operabilidad intrínseca en una pluralidad de hospederas destinadas. De este modo, de acuerdo con una modalidad particular, esta invención proporciona que un bloque de construcción de ácido nucleico se pueda usar para introducir una secuencia reguladora, particularmente una secuencia reguladora para la expresión del gen. Las secuencias reguladoras preferidas incluyen, pero no se limitan a, aquellas que son hechas por el hombre, y aquellas encontradas en organismos arquéales, bacterianos, eucarióticos (incluyendo mitocondrias) , virales, priónicos o parecidos a priones . Las secuencias reguladoras preferidas incluyen, pero no se limitan a, promotores, operadores, y sitios de enlace de activadores. De este modo, la invención proporciona que las secuencias reguladoras funcionales se puedan introducir en un gen hecho por el hombre de esta invención. Esta invención también proporciona que las secuencias reguladoras funcionales se puedan introducir en una senda de gen hecho por el hombre de esta invención. De conformidad con lo anterior, esta invención proporciona la generación de un polinucleótido quimérico que es un gen hecho por el hombre que contiene uno (o más) secuencias reguladoras introducidas artificialmente. De conformidad con lo anterior, esta invención también proporciona la generación de un polinucleótido quimérico que es una senda de gen hecha por el hombre que contiene una (o más) secuencias reguladoras introducidas artificialmente. Preferiblemente, una secuencia reguladora introducida artificialmente está operativamente enlazada a uno o más genes en el polinucleótido hecho por el hombre, y son funcionales en una o más células hospederas. Los promotores bacterianos preferidos que son útiles para esta invención incluyen lacl, lacZ, T3, T7, gpt, lambda PR, PL y trp. Los promotores eucarióticos útiles incluyen CMV inmediato temprano, HSV timidina quinasa, SV40 temprano y tardío, LTR de retrovirus, y metalotioneína-I de ratón. Las secuencias reguladoras vegetales particulares incluyen promotores activos para dirigir la transcripción en vegetales, ya sea constitutivamente o por etapas y/o específicas de tejido, dependiendo del uso del vegetal o partes del mismo. Estos promotores incluyen, pero no se limitan a promotores que muestran expresión constitutiva, tales como el promotor 35S del virus de mosaico de coliflor (CaMV) (Guilley y colaboradores, 1982) , aquellos para la expresión específica de hojas, tales como el promotor del gen de sub-unidad pequeña de ribulosa bifosfato carboxilasa (Coruzzi y colaboradores, 1984) , aquellos para la expresión específica de la raíz, tales como el promotor del gen glutamina sintasa (Tingey y colaboradores, 1987), aquellos para la expresión específica de la semilla, tales como el promotor de cruciferina A a partir de Brassica napus (Ryan y colaboradores, 1989), aquellos para la expresión específica del tubérculo, tales como el promotor de patatina clase I a partir de la papa (Rocha-Sasa y colaboradores, 1989; Wenzler y colaboradores, 1989) o aquellos para la expresión específica de la fruta, tales como la poligalacturonasa (PG) promotor del tomate (Bird y colaboradores, 1988) . Otras secuencias reguladoras que se prefieren para esta invención incluyen secuencias de terminador y señales de poliadenilación y cualquiera de estas secuencias que funcionan como tales en plantas, la elección de las cuales está dentro del nivel de la persona con experiencia. Un ejemplo de estas secuencias es la región de flanqueo 3 ' del gen de nopalina sintasa (nos) de Agrobacterium tumefaciens (Bevan, 1984) . Las secuencias reguladoras también pueden incluir secuencias mej oradoras, tales como las encontradas en el promotor 35S de CaMV y secuencias estabilizantes de ARNm tales como la secuencia delantera del virus de mosaico de alfalfa (AlMV) ARN4 (Brederode y colaboradores, 1980) y cualquier otra secuencia que funciona de una manera semejante. Los genes hechos por el hombre producidos usando esta invención también pueden servir como un sustrato para la recombinación con otro ácido nucleico. Igualmente, una senda de gen hecha por el hombre producida usando esta invención también puede servir como un sustrato para la recombinación con otro ácido nucleico. En un ejemplo preferido, la recombinación se facilita por, o se presenta en, áreas de homología entre el gen que contiene intrones hechos por el hombre y un ácido nucleico que sirve como un compañero de recombinación. En un caso particularmente preferido, el compañero de recombinación puede ser un ácido nucleico generado por esta invención, incluyendo un gen hecho por el hombre o una senda de gen hecha por el hombre. La recombinación se puede facilitar o puede presentarse en áreas de homología que existen en el uno (o más) intrones introducidos artificialmente en el gen hecho por el hombre. El método de re-ensamble de ligación sintética de esta invención utiliza una pluralidad de bloques de construcción de ácido nucleico, cada uno de los cuales preferiblemente tiene dos extremos ligables. Los dos extremos ligables en cada bloque de construcción de ácido nucleico pueden ser dos extremos romos (es decir, que cada uno tiene un colgante de cero nucleótidos) , o preferiblemente un extremo romo y un colgante, o más preferiblemente todavía dos colgantes . Un colgante útil para este propósito puede ser un colgante 3' o un colgante 5'. De este modo, un bloque de construcción de ácido nucleico puede tener un colgante de 3 ' o alternativamente, un colgante de 5 ' o alternativamente, dos colgantes de 3 ' o alternativamente, dos colgantes de 5 ' . El orden global en el cual los bloques de construcción de ácido nucleico se ensamblan para formar una molécula de ácido nucleico quimérica finalizada se determina por el diseño experimental a propósito y no es aleatorio. De acuerdo con una modalidad preferida, un bloque de construcción de ácido nucleico se genera mediante la síntesis química de dos ácidos nucleicos de cadena simple (también conocidos como oligos de cadena simple) y poniéndolos en contacto para permitir que se recuezan para formar un bloque de construcción de ácido nucleico de cadena doble. Un bloque de construcción de ácido nucleico de cadena doble puede ser de tamaño variable . Los tamaños de estos bloques de construcción pueden ser pequeños o grandes dependiendo de la elección del experimentador. Los tamaños preferidos para el rango de bloque de construcción son de 1 par de bases (no incluyendo ningún colgante) hasta 100,000 pares de bases (no incluyendo ningún colgante) . También se proporcionan otros rangos de tamaño preferidos, que tienen límites inferiores de desde 1 par de bases hasta 10,000 pares de bases (incluyendo todo valor entero intermedio) , y límites superiores de desde 2 pares de bases hasta 100,000 pares de bases (incluyendo todo valor entero intermedio) . Se aprecia que los métodos actuales de amplificación basados en polimerasa se pueden usar para generar ácidos nucleicos de cadena doble hasta de miles de pares de bases, si no decenas de miles de pares de bases, de longitud, con alta fidelidad. La síntesis química (por ejemplo, basada en fosfora-midita) se puede usar para generar ácidos nucleicos de hasta cientos de nucleótidos de longitud con alta fidelidad; sin embargo, estos se pueden ensamblar, por ejemplo, usando colgantes o extremos pegajosos, para formar ácidos nucleicos de cadena doble de hasta miles de pares de bases, si no décimas de miles de pares de bases, de longitud, si así se desea. Una combinación de métodos (por ejemplo, síntesis química basada en fosforamidita y reacción de cadena de polimerasa) también se puede usar de acuerdo con esta invención. De este modo, el bloque de construcción de ácido nucleico puede ser mediante diferentes métodos que también se pueden usar en combinación para generar una molécula de progenie de esta invención. El uso de síntesis química para generar bloques de construcción de ácido nucleico se prefiere particularmente en esta invención y es ventajosa por otras razones también, incluyendo la seguridad y facilidad de procedimiento. No se requiere la clonación o cultivo de manejo real de ninguna muestra biológica. El diseño de bloques de construcción de ácido nucleico se puede llevar a cabo en papel. De conformidad con lo anterior, esta invención muestra un avance en la seguridad de procedimiento en tecnologías recombinantes . Sin embargo, de acuerdo con una modalidad preferida, un bloque de construcción de ácido nucleico de cadena doble de acuerdo con esta invención también se puede generar por amplificación basada en polimerasa de una plantilla de polinucleótido. En una ejemplificación no limitante tal como se ilustra en la Figura 2, una primera reacción de amplificación basada en polimerasa usando un primer conjunto de cebadores, F2 y Rlf se usa para generar un producto con extremo romo (etiquetado Reacción 1, Producto 1) , el cual es esencialmente idéntico al producto A. Una segunda reacción de amplificación basada en polimerasa usando un segundo conjunto de cebadores, F1 y R2, se usa para generar un producto de extremo romo (etiquetado Reacción 2, Producto 2), el cual es esencialmente idéntico al producto B. Estos dos productos se mezclan y permiten fundirse y recocerse, generando bloques de construcción de ácido nucleico de cadena doble potencialmente útiles con dos colgantes. En el ejemplo de la Figura.2, el producto con colgantes 3' (Producto C) se selecciona mediante degradación basada en nucleasa de los otros tres productos usando una exonucleasa de actuación 3 ' , tal como la exonucleasa III. Se aprecia que también se puede usar una exonucleasa de actuación 5' (por ejemplo, rojo alfa) por ejemplo, para seleccionar en vez de eso al Producto D. También se aprecia que otra selección que también se pueda usar, significa que incluye medios basados en hibridación y que estos medios pueden incorporar otros medios, tales como medios basados en cinta magnética, para facilitar la separación del producto deseado. Existen muchos otros métodos por medio de los cuales se puede generar un bloque de construcción de ácido nucleico de cadena doble que sea útil para esta invención; estos son conocidos en la técnica y los puede realizar fácilmente el técnico en la materia. De acuerdo con una modalidad preferida particularmente, se genera un bloque de construcción de ácido nucleico de cadena doble que es útil para esta invención primero generando dos ácidos nucleicos de cadena simple y permitiéndoles recocerse para formar un bloque de construcción de ácido nucleico de cadena doble. Las dos cadenas del bloque de construcción de ácido nucleico de cadena doble pueden ser complementarias en todo nucleótido aparte de cualquier forma de colgante; no conteniendo de este modo, faltas de coincidencia, aparte de cualquier colgante. De acuerdo con otra modalidad, las dos cadenas del bloque de construcción de ácido nucleico de cadena doble son complementarios en menos de todos los nucleótidos aparte de cualquiera que forme un colgante. De este modo, de acuerdo con esta modalidad, se puede usar un bloque de construcción de ácido nucleico de cadena doble para introducir degeneración de codón. Preferiblemente la degeneración de codón se introduce usando la mutagénesis de saturación de sitio descrita en la presente, usando uno o más casetes N,N,G/T o alternativamente, usando uno o más casetes ?,?,?. Contenido dentro de un diseño experimental ejemplar para lograr un ensamble ordenado de acuerdo con esta invención están: 1) El diseño de bloques de construcción de ácido nucleico específico. 2) El diseño de extremos ligables específicos en cada bloque de construcción de ácido nucleico. 3) El diseño de un orden particular de ensamble de los bloques de construcción de ácido nucleico. Un colgante puede ser un colgante 3 ' o un colgante 5 ' . Un colgante puede también tener un grupo fosfato terminal o alternativamente, puede estar desprovisto de un grupo fosfato terminal (teniendo, por ejemplo, en vez de eso un grupo hidroxi-lo) . Un colgante puede estar compuesto de cualquier número de nucleótidos . Preferiblemente un colgante está compuesto de cero nucleótidos (como en un extremo romo) hasta 10,000 nucleótidos. De este modo, un rango amplio de tamaños de colgantes puede ser útil. De conformidad con lo anterior, el límite inferior puede ser cualquier entero de 1 a 200 y el límite superior puede ser cualquier entero de 2 a 10,000. De acuerdo con una ejemplifica-ción particular, un colgante puede consistir de cualquier de un nucleótido hasta 200 nucleótidos (incluyendo todo valor entero intermedio) . La molécula de ácido nucleico quimérica final se puede generar ensamblando secuencialmente dos o más bloques de construcción a la vez hasta que se han ensamblado todos los bloques de construcción diseñados. Una muestra de trabajo opcionalmente se puede someter a un proceso para la selección de tamaño o purificación u otro proceso de selección o enriquecimiento entre la realización de dos pasos de ensamble. Alternativamente, la molécula de ácido nucleico quimérica final se puede generar ensamblando todos los bloques de construcción diseñados en un solo paso al mismo tiempo. Mezclado in vitro Los equivalentes de algunos apareamientos genéticos estándares también se pueden realizar mediante mezclado in vitro. Por ejemplo, se puede realizar una "cruza hacia atrás molecular" mezclando repetidamente el ácido nucleico del híbrido con un ácido nucleico de tipo natural al mismo tiempo que se seleccionan las mutaciones de interés. Como en la cría tradicional, este enfoque se puede usar para combinar fenotipos de diferentes fuentes en un fondo de elección. Es útil, por ejemplo, para la remoción de mutaciones neutras que afecta características no seleccionadas (por ejemplo, inmunogenicidad) . Así puede ser útil para determinar cuáles mutaciones en una proteína están involucradas en la actividad biológica mejorada y cuáles no, una ventaja que se puede lograr mediante la mutagénesis propensa al error o métodos de mutagénesis de cásete. Los genes grandes, funcionales, se pueden ensamblar correctamente a partir de una mezcla de polinucleótidos aleatorios pequeños. Esta reacción puede ser de uso para el reensamble de genes a partir de los ADN muy fragmentados o fósiles. Además de los fragmentos de ácido nucleico aleatorio a partir de fósiles se pueden combinar con polinucleótidos o a partir de genes similares de especies relacionadas. También se contempla que el método de esta invención se puede usar para la amplificación in vitro del genoma entero a partir de una sola célula conforme sea necesario para una variedad de aplicaciones de investigación y diagnóstico. La amplificación de ADN mediante reacción de cadena de polimerasa está en la práctica limitado a una longitud de aproximadamente 40 kb. La amplificación de un genoma entero tal como el de E. coli (5,000 kb) mediante reacción de cadena de polimerasa requeriría aproximadamente 250 cebadores produciendo 125 polinucleótidos de 40 kb. Este enfoque no es práctico debido a la indisponibilidad de datos de secuencia suficientes. Por otro lado, la producción aleatoria de polinucleótidos del genoma con ciclos de reacción de cadena de polimerasa sexual, seguidos por purificación en gel de polinucleótidos pequeños proporcionará una multitud de cebadores posibles. El uso de esta mezcla de polinucleótidos pequeños aleatorios como cebadores en una reacción de cadena de polimerasa sola o con el genoma completo como la plantilla deberá dar como resultado una reacción de cadena inversa con el punto final teórico de un solo concatémero que contiene muchas copias del genoma . La amplificación de 100 veces en el número de copias y un tamaño de polinucleótido promedio mayor de 50 kb se puede obtener cuando solamente se usan polinucleótidos aleatorios. Se piensa que el concatémero mayor se genera mediante el traslape de muchos polinucleótidos más pequeños. La calidad de productos de reacción de cadena de polimerasa específicos obtenidos usando cebadores sintéticos será indistinguible del producto obtenido de ADN no amplificado. Se espera que este enfoque será útil para el mapeo de genomas . El polinucleótido que se va a mezclar se puede producir como polinucleótidos aleatorios o no aleatorios, a la discreción del practicante. Mezcla en vivo En una modalidad de mezcla en vivo, la población mezclada de la secuencia de ácido nucleico específica se introduce en células bacterianas o eucarióticas bajo condiciones tales que cuando menos dos secuencias diferentes de ácidos nucleicos están presentes en cada célula hospedera. Los polinucleótidos se pueden introducir en las células hospederas mediante una variedad de métodos diferentes. Las células hospederas se pueden transformar con los polinucleótidos más pequeños usando los métodos conocidos en la técnica, por ejemplo, tratamiento con cloruro de calcio. Si los polinucleótidos se insertan en un genoma de fago, la célula hospedera se puede transfectar con el genoma de fago recombinante que tiene las secuencias de ácido nucleico específicas. Alternativamente, las secuencias de ácido nucleico se pueden introducir en la célula huésped usando electro-incorporación, transfección, lipofección, biolística, conjugación, y similares. En general, en esta modalidad, las secuencias de ácidos nucleicos específicos estarán presentes en vectores que son capaces de replicar establemente la secuencia en la célula hospedera. Además, se contempla que los vectores codificarán un gen marcador de manera que se puedan seleccionar las células hospederas que tienen el vector. Esto asegura que la secuencia de ácido nucleico específica mutada se puede recuperar después de la introducción en la célula hospedera. Sin embargo, se contempla que la población mezclada entera de las secuencias de ácido nucleico específico no necesita estar presente en una secuencia de vector. En vez de eso solamente un número suficiente de secuencias necesitan clonarse en vectores para asegurar que después de la introducción de los polinucleótidos en las células hospederas cada célula hospedera contenga un vector que tenga cuando menos una secuencia de ácido nucleico específica presente en el mismo. También se contempla que en vez de tener un subconjunto de población de las secuencias de ácidos nucleicos específicas clonadas en vectores, este subconjunto ya puede estar establemente integrado en la célula hospedera. Se ha encontrado que cuando dos polinucleótidos que tienen regiones de identidad se insertan en las células huéspedes se presenta recombinación homologa entre los dos polinucleótidos. Esta recombinación entre las dos secuencias de ácido nucleico específicas mutadas dará como resultado la producción de híbridos dobles o triples en algunas situaciones. También se ha encontrado que la frecuentemente de recombinación aumenta si algunas de las secuencias de ácido nucleico específicas mutadas están presentes en las moléculas de ácido nucleico lineales. Por lo tanto, en una modalidad preferida, algunas de las secuencias de ácido nucleico específicas están presentes en los polinucleótidos lineales. Después de la transformación, los transformantes de células hospederas se colocan bajo selección para identificar aquellos transformantes de células hospederas que contienen secuencias de ácido nucleico específico imitado que tiene las cualidades deseadas. Por ejemplo, si sé desea resistencia aumentada a un fármaco particular entonces las células hospederas transformadas se pueden someter a concentraciones aumentadas del fármaco particular y aquellos transformantes que producen proteínas mutadas capaces de conferir resistencia al fármaco aumentada se seleccionarán. Si la habilidad aumentada de una proteína particular para enlazarse con un receptor es lo que se desea, entonces la expresión de la proteína se puede inducir a partir de los transformantes y la proteína resultante probada en un ensayo de enlace de ligando por métodos conocidos en la técnica para identificar ese subconjunto de población mutada que muestra enlace aumentado al ligando. Alternativamente, la proteína se puede expresar en otro sistema para asegurar procesamiento adecuado . En cuanto un subcon unto de las primeras secuencias de ácido nucleico específicas (secuencias hijas) que tienen las características deseadas se identifican, entonces se someten a una segunda ronda de recombinación. En el segundo ciclo de recombinación, las secuencias de ácido nucleico específicas recombinantes se pueden mezclar con las secuencias de ácido nucleico específicas mutadas originales (secuencias padres) y el ciclo se repite como se describe anteriormente. De esta manera un conjunto de segundas secuencias de ácidos nucleicos específicas recombinadas se puede identificar en donde tienen características aumentadas o codifican proteínas que tienen propiedades aumentadas. Este ciclo se puede repetir varias veces conforme se desee. También se contempla que en el segundo o siguiente ciclo de recombinación, se puede realizar una cruza hacia atrás. Una cruza hacia atrás molecular se puede realizar mezclando las secuencias de ácido nucleico específicas deseadas con un gran número de secuencias del tipo natural, de manera que cuando menos una secuencia de ácido nucleico de tipo natural y una secuencia de ácido nucleico mutada están presentes en la misma célula hospedera después de la transformación. La recombinación con la secuencia de ácido nucleico específica del tipo natural eliminará aquellas mutaciones neutras que pueden afectar características no seleccionadas tales como inmunogenicidad pero no las características seleccionadas. En otra modalidad de esta invención, se contempla que durante la primera ronda un subconjunto de secuencias de ácido nucleico específicas se puede generar como polinucleótidos más pequeños haciendo más lento o deteniendo la amplificación de reacción de cadena de polimerasa antes de la introducción en la célula hospedera. El tamaño de los polinucleótidos puede ser suficientemente grande para contener algunas regiones de identidad con las otras secuencias de manera que se recombinen homogéneamente con las otras secuencias . El tamaño de los polinucleótidos variará de 0.03 kb a 100 kb más preferiblemente de 0.2 kb a 10 kb. También se contempla que en las rondas posteriores, todas las secuencias de ácido nucleico específicas distintas de las secuencias seleccionadas a partir de la ronda anterior se puedan utilizar para generar polinucleótidos de reacción de cadena de polimerasa antes de la introducción en las células hospederas . Las secuencias de polinucleótidos más cortas pueden ser de cadena simple o de cadena doble. Si las secuencias fueron originalmente de cadena simple y se han vuelto de cadena doble se pueden desnaturalizar con calor, productos químicos o enzimas antes de la inserción en la célula hospedera. Las condiciones de la reacción convenientes para separar las cadenas de ácido nucleico son muy conocidas en la técnica. Los pasos de este proceso se pueden repetir indefinidamente, estando limitados solamente por el número de híbridos posibles que se pueden lograr. Después de un cierto número de ciclos, todos los híbridos posibles habrán sido logrado y otros ciclos son redundantes . En una modalidad el mismo ácido nucleico plantilla mutado se recombina repetidamente y los recombinantes resultantes se seleccionan para determinar la característica deseada. Por lo tanto, el depósito inicial o población de ácido nucleico en plantilla mutado se clona en un vector capaz de replicarse en una bacteria tal como E. coli. El vector particular no es esencial, en tanto sea capaz de réplica autónoma en E. coli. En una modalidad preferida, el vector se diseña para permitir la expresión y producción de cualquier proteína codificada por un ácido nucleico específico mutado enlazado con el vector. También se prefiere que el vector contenga un gen que codifica un marcador seleccionable . La población de vectores que contienen el depósito de secuencias de ácido nucleico mutadas se introducen en las células hospederas de E. coli. Las secuencias de ácido nucleico de vector se puede introducir mediante transformación, transfección o infección en el caso del fago. La concentración de vectores usada para transformar las bacterias es tal que un número de vectores se introduce en cada célula. En cuanto está presente en la célula, la eficiencia de recombinación homologa es tal que la recombinación homologa se presenta entre varios vectores . Esto da como resultado la generación de híbridos (hijas) que tienen una combinación de mutaciones que difieren de las secuencias mutadas padres originales. Las células hospederas se replican clonalmente y se seleccionan para el gen marcador presentado en el vector. Sólo aquellas células que tengan un plásmido crecerán bajo la selección. Las células hospederas que contienen un vector se prueban para determinar la presencia de mutaciones favorables. Estas pruebas pueden consistir en colocar las células bajo presión selectiva, por ejemplo, si el gene que se va a seleccionar es un gen de resistencia a fármaco mejorada. Si el vector permite la expresión de la proteína codificada por la secuencia de ácido nucleico mutada, entonces esta selección puede incluir permitir la expresión de la proteína así codificada, el aislamiento de la proteína y la prueba de la proteína para determinar si, por ejemplo, se enlaza con eficiencia aumentada al ligando de interés . En cuanto una secuencia de ácido nucleico mutada hija particular se ha identificado que confiere las características deseadas, el ácido nucleico se aisla ya sea ya enlazado al vector o separado del vector. Este ácido nucleico se mezcla entonces con la primera población padre de ácidos nucleicos y se repite el ciclo. Se ha mostrado que mediante este método las secuencias de ácidos nucleicos que tienen propiedades deseadas aumentadas se pueden seleccionar. En una modalidad alternativa, la primera generación de híbridos se retiene en la célula y las secuencias imitadas padres se añaden de nuevo a las células. De conformidad con lo anterior, el primer ciclo de la modalidad I se lleva a cabo como se describió anteriormente. Sin embargo, después de que las secuencias de ácido nucleico hijas se identifican, las células hospederas que contienen estas secuencias se retienen. La población de ácido nucleico específica mutada padre ya sea como polinucleótidos o clonado en el mismo vector se introduce en las células hospederas que contienen los ácidos nucleicos hijos. La recombinación se deja que se presente en las células y la siguiente generación de recombinantes , o nietas se seleccionan mediante los métodos descritos anteriormente. Este ciclo se puede repetir varias veces hasta que el ácido nucleico o péptido que tienen características deseadas se obtiene. Se contempla que en ciclos posteriores, la población de secuencias mutadas que se añaden a los híbridos preferidos puede venir de los híbridos padres o de cualquier generación posterior. En una modalidad alternativa, la invención proporciona un método para conducir una cruza hacia atrás "molecular" del ácido nucleico específico recombinante obtenido con el fin de eliminar cualquier mutación neutra. Las mutaciones neutras son aquellas mutaciones que no confieren al ácido nucleico o péptido las propiedades deseadas. Estas mutaciones sin embargo, pueden conferir al ácido nucleico o péptido características no deseables. De conformidad con lo anterior, es deseable eliminar estas mutaciones neutras . El método de esta invención proporciona un medio para hacerlo. En esta modalidad, después de que el ácido nucleico híbrido, que tiene las características deseadas, se obtiene mediante los métodos de las modalidades, el ácido nucleico, el vector que tiene el ácido nucleico o la célula hospedera que contiene el vector y el ácido nucleico se aislan. El ácido nucleico o vector se introduce entonces en la célula hospedera con un gran exceso de ácido nucleico del tipo natural. El ácido nucleico del híbrido y el ácido nucleico de la secuencia del tipo natural se deja que se recombinen. Los recombinantes resultantes se colocan bajo la misma selección que el ácido nucleico híbrido. Solamente aquellos recombinantes que retienen las características deseadas se seleccionarán. Cualquier mutación silenciosa que no proporcione las características deseadas se perderá a través de la recombinación con el ADN de tipo natural. Este ciclo se puede repetir varias veces hasta que todas las mutaciones silenciosas se eliminen. De este modo los métodos de esta invención se pueden usar en una cruza hacia atrás molecular para eliminar mutaciones innecesarias o silenciosas. Utilidad El método de recombinación en vivo de esta invención se puede realizar a ciegas en un depósito de híbridos desconocidos o alelos o un polinucleótido o secuencia específicos. Sin embargo, no es necesario conocer la secuencia real de ADN o ARN del polinucleótido específico. El enfoque de usar recombinación dentro de una población mezclada de genes puede ser útil para la generación de proteínas útiles por ejemplo, interleucina I, anticuerpos, tPA y hormona de crecimiento. Este enfoque se puede usar para generar proteínas que tienen especificidad o actividad alterada. El enfoque también puede ser útil para la generación de secuencias de ácidos nucleicos híbridos, por ejemplo, regiones promotoras, intrones, exones, secuencias mejoradoras, 31 regiones no traducidas o 51 regiones no traducidas de genes. Así este enfoque se puede usar para generar genes que tienen regímenes aumentados de expresión. Este enfoque puede ser útil en el estudio de secuencias de ADN repetitivo. Finalmente, este enfoque puede ser útil para mutar ribozimas o aptámeros . Las regiones parecidas a andamios que separan regiones de diversidad en proteínas pueden ser particularmente convenientes para los métodos de esta invención. El andamio conservado determina el doblado global mediante auto-asociación, al mismo tiempo que despliega ciclos relativamente no restringidos que median el enlace específico. Ejemplos de estos andamios son la barrera beta inmunoglobulina, y el haz de cuatro hélices. Los métodos de esta invención se pueden usar para crear proteínas parecidas a andamio con varias combinaciones de secuencias mutadas para enlace. Los equivalentes de algunos apareamientos genéticos estándares también se pueden realizar por los métodos de esta invención. Por ejemplo, una cruza hacia atrás "molecular" se puede realizar mediante el mezclado repetido de ácido nucleico de híbrido con el ácido nucleico del tipo natural al mismo tiempo que se selecciona la mutación de interés . Como en criadero tradicional, este enfoque se puede usar para combinar fenotipos de diferentes fuentes en un fondo de elección. Es útil, por ejemplo, para la remoción de mutaciones neutras que afectan características no seleccionadas (es decir, inmunogenicidad) . De este modo puede ser útil para determinar cuáles mutaciones en una proteína están involucradas en la actividad biológica aumentada y cuáles no. Métodos de despliegue de péptido El presente método se puede usar para mezclar, mediante recombinación in vi tro y/o en vivo por cualquiera de los métodos descritos, y en cualquier combinación, secuencias de polinucleó-tidos seleccionadas por métodos de despliegue de péptidos, en donde un polinucleótido asociado codifica un péptido desplegado que se selecciona para determinar un fenotipo (por ejemplo, por afinidad para un receptor predeterminado (ligando) ) . Un aspecto cada vez más importante del desarrollo de fármacos bio-farmacéuticos y de la biología molecular es la identificación de estructuras de péptidos, incluyendo las secuencias de aminoácidos primarias, de péptidos o peptido-miméticos que interactúan con macromoléculas biológicas. Un método para identificar péptidos que poseen una estructura deseada o propiedad funcional, tal como el enlace a una macromo-lécula biológica predeterminada (por ejemplo, un receptor) , involucra la selección de una biblioteca grande de péptidos para miembros de biblioteca individuales que poseen la estructura deseada o la propiedad funcional conferida por la secuencia de aminoácidos del péptido. Además de los métodos de síntesis química directos para generar bibliotecas de péptidos, algunos métodos de ADN recombi-nantes también se han reportado. Un tipo involucra el despliegue de una secuencia de péptidos, anticuerpo, u otra proteína en la superficie de una partícula o célula de bacteriófago. Generalmente en estos métodos cada partícula de bacteriófago o célula sirve como el miembro de biblioteca individual que despliega una sola especie de péptido desplegado además del bacteriófago natural o las secuencias de proteínas de célula. Cada bacteriófago o célula contiene la información de selección de nucleótidos que codifica a la secuencia de péptido desplegada particular; de este modo, la secuencia de péptido desplegada puede ser valorada por la determinación de secuencia de nucleótido de un miembro de la biblioteca aislado. Un método de despliegue de péptido muy conocido para la presentación de una secuencia de péptido en una superficie de un bacteriófago filamentoso, típicamente como una fusión con una proteína de recubrimiento de bacteriófago. La biblioteca de bacteriófago se puede incubar con una macromolécula inmovilizada, predeterminada o una molécula pequeña (por ejemplo, un receptor) de manera que las partículas de bacteriófago que presentan una secuencia de péptido que se enlaza con la macromolécula inmovilizada se puede partir diferencialmente de aquella que no presenta secuencias de péptidos que se enlazan con la macromolécula predeterminada. Las partículas de bacteriófago (es decir, los miembros de biblioteca) que están enlazadas a la macromolécula inmovilizada se recuperan entonces y se replican para amplificar la subpoblación de bacteriófagos seleccionada para una ronda posterior de enriquecimiento de afinidad y replicación de fago. Después de varias rondas de enriquecimiento de afinidad y replicación de fago, los miembros de la biblioteca de bacteriófagos se seleccionan y aislan de este modo y la secuencia de nucleótidos que codifica la secuencia de péptido desplegada se determina, mediante lo cual se identifican las secuencias de péptidos que se enlazan con la macromolécula predeterminada (por ejemplo, receptor) . Estos métodos se describen adicionalmente en las publicaciones de PCT WO 91/17271, WO 91/18980, WO 91/19818 y WO 93/08278. La última publicación de PCT describe un método de ADN recombinante para el despliegue de ligandos de péptidos que involucran a la producción de una biblioteca de proteínas de fusión con cada proteína de fusión compuesta de una primera porción de polipéptido, típicamente que comprende una secuencia variable, que está disponible para enlace potencial con una macromolécula predeterminada, y una segunda porción de polipéptido que se enlaza con ADN tal como el ADN de vector que codifica la proteína de fusión individual . Cuando las células hospederas transformadas se cultivan bajo condiciones que permiten la expresión de la proteína de fusión, la proteína de fusión se enlaza con el vector de ADN que la codifica. Después de la lisis de la célula huésped, los complejos de proteína de fusión/ADN de vector se pueden seleccionar contra una macromolécula predeterminada de la manera como las partículas de bacteriófagos se seleccionan en el sistema de despliegue basado en fago, con la réplica y secuenciamiento de los vectores de ADN en los complejos de proteínas de fusión/ADN de vector seleccionado sirviendo como la base para la identificación de la o las secuencias de péptidos de biblioteca seleccionada. Otros sistemas para generar bibliotecas de péptidos y polímeros similares tienen aspectos tanto de los métodos de síntesis recombinantes como de síntesis química in vi tro. En estos métodos híbridos, se emplea la maquinaria enzimática sin células para llevar a cabo la síntesis in vitro de los miembros de la biblioteca (es decir, péptidos o polinucleótidos) . En un tipo de método, las moléculas de ARN con la capacidad de enlazarse a una proteína predeterminada o a una molécula de tinte predeterminada se seleccionan mediante rondas alternas de selección y amplificación de reacción de cadena de polimerasa (Tuerk y Gold, 1990; Ellington y Szostak, 1990). Una técnica similar se usó para identificar secuencias de ADN que se enlazan con un factor de transcripción humano predeterminado (Thiesen y Bach, 1990; Beaudry y Joyce, 1992; publicaciones PCT WO 92/05258 y WO 92/14843) . De manera similar, la técnica de traducción in vitro se ha usado para sintetizar proteínas de interés y se ha propuesto como método para generar grandes bibliotecas de péptidos. Estos métodos que se basan en la traducción in vi tro que generalmente comprenden complejos de polisoma estabilizados, se describen adicionalmente en las publicaciones internacionales PCT WO 88/08453, WO 90/05785, WO 90/07003, WO 91/02076, W 91/05058, y WO 92/02536. Los solicitantes han descrito métodos en los cuales los miembros de las bibliotecas comprenden una proteína de fusión que tiene una primera porción de polipéptido con actividad de enlace de ADN y una segunda porción de polipéptido que tiene la secuencia de péptido única de miembro de biblioteca; estos métodos son convenientes para su uso en formatos de selección in vi tro sin células, entre otros. Las secuencias de péptido desplegadas pueden ser de longitudes variables, típicamente de 3-5000 aminoácidos de largo o más largas, frecuentemente de 5-100 aminoácidos de largo, y frecuentemente desde aproximadamente 8 a 15 aminoácidos de largo. Una biblioteca puede comprender miembros de biblioteca que tienen distintas longitudes de secuencia de péptidos desplegado, o pueden comprender miembros de biblioteca que tienen una longitud fija de secuencia de péptido desplegado. Las porciones de todas las secuencias de péptidos desplegadas pueden ser aleatorias, pseudo-aleatorias, nucleares de conjunto definido, fijas, o similares. Los presentes métodos de despliegue incluyen métodos para despliegue in vitro y en vivo de anticuerpos de cadena simple. Tal como scFv naciente o polisomas o scFv desplegados en fago, que permiten la selección a gran escala de bibliotecas scFv que tienen amplia diversidad de secuencias de región variable y especificidades de enlace. La presente invención también proporciona bibliotecas de péptidos de marco de secuencia definida, aleatoria, pseudo-aleatoria y métodos para generar y seleccionar esas bibliotecas para identificar compuestos útiles (por ejemplo, péptidos, incluyendo anticuerpos de cadena simple) que se enlazan con moléculas receptoras o epítopes de interés o productos de genes que modifican péptidos o AR de una manera deseada. Los péptidos de marco de secuencia definida, aleatoria, pseudo-aleatoria se producen a partir de bibliotecas de miembros de bibliotecas de péptidos que comprenden péptidos desplegados o anticuerpos de cadena simple desplegados unidos a una plantilla de polinucleóti-dos a partir de la cual el péptido desplegado se sintetiza. El modo de unión puede variar de acuerdo con la modalidad específica de la invención seleccionada, y puede incluir la encapsulación en una partícula de fago o incorporación en una célula. Un método de enriquecimiento de afinidad permite que una biblioteca muy grande de péptidos y de anticuerpos de cadena simple sean seleccionados y la secuencia de polinucleótidos que codifican al péptido o péptidos deseados o a los anticuerpos de cadena simple que se van a seleccionar. El polinucleótido se puede aislar entonces y mezclar para recombinar combinatoriamente la secuencia de aminoácidos del péptido seleccionado (o porciones predeterminadas del mismo) o los anticuerpos de cadena simple (o sólo VHI, VLI o porciones CDR del mismo) . Usando estos métodos se puede identificar un péptido o un anticuerpo de cadena simple por tener una afinidad de enlace deseada para una molécula y se puede explotar el proceso de mezcla para converger rápidamente a un péptido o scfv de alta afinidad. El péptido o anticuerpo pueden entonces sintetizarse en volumen mediante medios convencionales para cualquier uso conveniente (por ejemplo, como agente terapéutico o de diagnóstico) . Una ventaja significativa de la presente invención es que ninguna información anterior con respecto a la estructura de ligando esperada se requiere para aislar los ligandos de péptidos o anticuerpos de interés . El péptido identificado puede tener actividad biológica, lo que significa que incluye cuando menos afinidad de enlace específico para una molécula receptora seleccionada, y en algunos casos, además incluirá la capacidad para bloquear el enlace de otros compuestos, para estimular o inhibir sendas metabólicas, para actuar como una señal o mensajero, para estimular o inhibir actividad celular, y similares . La presente invención también proporciona un método para mezclar un depósito de secuencias de polinucleótidos seleccionados por afinidad seleccionando una biblioteca de polisomas que despliegan péptidos nacientes (que incluyen anticuerpos de cadena simple) para los miembros de la biblioteca que se enlazan a un receptor predeterminado (por ejemplo, un receptor proteináceo mamífero tal como, por ejemplo, un receptor de hormona peptidérgica, un receptor de superficie celular, una proteína intracelular que se enlaza con otra proteína u otras proteínas para formar complejos de proteína intracelular tales como heterodímeros y similares) o epítope (por ejemplo, una proteína inmovilizada, glicoproteína, oligosacárido, y similares) . Las secuencias de polinucleótidos seleccionadas en una primera ronda de selección (típicamente selección por afinidad para enlazarse con un receptor (por ejemplo, un ligando)) mediante cualquiera de estos métodos se combina y las combinaciones o la combinación se mezclan mediante recombinación in vitro y/o en vivo para producir una combinación mezclada que comprende una población de secuencias de polinucleótidos seleccionados recombinada. Las secuencias de polinucleótidos seleccionadas recombinadas se someten a cuando menos una ronda de selección posterior. Las secuencias de polinucleótidos seleccionadas en la o las rondas de selección posteriores se pueden usar directamente, secuenciar, y/o someter a una o más rondas de mezclado y selección posterior. Las secuencias seleccionadas también se pueden cruzar hacia atrás con secuencias de polinucleótidos que codifican secuencias neutras (es decir, que contienen efecto funcional no sustancial sobre el enlace) , tal como, por ejemplo, mediante cruce hacia atrás con una secuencia del tipo natural o que se presenta naturalmente sustancialmente idéntica a la secuencia seleccionada para producir péptidos funcionales parecidos a los naturales, que son menos inmunogénicos . Generalmente, durante la cruza hacia atrás la selección posterior se aplica para retener la propiedad de enlace al receptor predeterminado (ligando) . Antes de o junto con la mezcla de las secuencias seleccionadas, las secuencias se pueden mutagenizar. En una modalidad, los miembros de biblioteca seleccionados se clonan en un vector procariótico (por ejemplo, plásmido, fagémido, o bacteriófago) en donde una colección de colonias individuales (o placas) que representan miembros de biblioteca discreta se producen. Los miembros de biblioteca seleccionados individuales se pueden entonces manipular (por ejemplo, mediante mutagénesis dirigida al sitio, mutagénesis de cásete, mutagénesis química, mutagénesis por reacción de cadena de polimerasa, y similares) para generar una colección de miembros de biblioteca que representan un núcleo de diversidad de secuencia basado en la secuencia del miembro de biblioteca seleccionado. La secuencia de un miembro de biblioteca seleccionado individual o depósito se puede manipular para incorporar mutación aleatoria, mutación pseudo-aleatoria, mutación de núcleo definido (es decir, que comprende posiciones de residuo variante e invariante y/o que comprende posiciones de residuo variantes que pueden comprender un residuo seleccionado del subconjunto definido de residuos de aminoácidos) , mutación basada en codón, y similares, ya sea segmentalmente o sobre la longitud entera de la secuencia de miembro de biblioteca seleccionado individual. Los miembros de biblioteca seleccionados mutagenizados se mezclan mediante mezcla recombinatoria in vitro y/o en vivo como se describe en la presente. La invención también proporciona bibliotecas de péptidos que comprenden una pluralidad de miembros de bibliotecas individuales de la invención, en donde (1) cada miembro de biblioteca individual de dicha pluralidad comprende una secuencia producida por mezclar un depósito de secuencias seleccionadas, y (2) cada miembro de biblioteca individual comprende una secuencia de segmento de péptido variable o secuencia de segmentos de anticuerpos de cadena simple es distinta de las secuencias del péptido variable o de las secuencias de anticuerpos de cadena simple o de otros miembros de biblioteca individual en dicha pluralidad (aunque algunos miembros de la biblioteca pueden estar presentes en más de una copia por biblioteca debido a amplificación dispareja, probabilidad estocástica, o similares) . La invención también proporciona un producto por proceso, en donde las secuencias de polinucleótido seleccionadas que tienen (o que codifican un péptido que tiene) una especificidad enlace predeterminada se forma mediante el proceso de (1) seleccionar un péptido desplegado o desplegar una biblioteca de anticuerpos de cadena simple desplegada contra un receptor predeterminado (por ejemplo, ligando) o epítope (por ejemplo, macromolécula antígena) e identificar y/o enriquecer a los miembros de la biblioteca que se enlazan con el receptor predeterminado o epítope para producir un depósito de miembros de biblioteca seleccionados, (2) mezclar mediante recombinación los miembros de biblioteca seleccionados (o amplificados o copias clonadas de los mismos) que se enlaza con el epítope predeterminado y que ha sido mediante esto aislado y/o enriquecido a partir de la biblioteca para generar una biblioteca mezclada, y (3) seleccionar la biblioteca mezclada contra el receptor predeterminado (por ejemplo, ligando) o epítope (por ejemplo, macromolécula antígena) e identificar y/o enriquecer los miembros de biblioteca mezclados que se enlazan con el receptor predeterminado o epítope para producir una combinación de miembros de biblioteca mezclada seleccionados . Métodos de despliegue y selección de anticuerpos El presente método también se puede usar para mezclar, mediante combinación in vi tro y/o en vivo mediante cualquiera de los métodos descritos, y en cualquier combinación, secuencias de polinucleótido seleccionadas por métodos de despliegue de anticuerpos, en donde un polinucleótido asociado codifica un anticuerpo desplegado que se selecciona por un fenotipo (por ejemplo, por afinidad para enlace con un antígeno predeterminado (ligando) ) . Varios enfoques de genética molecular se han considerado para capturar el vasto repertorio inmunológico representado por el número extremadamente grande de distintas regiones variables que pueden estar presentes en cadenas de inmunoglobuli-na . El lugar de cadena pesada de inmunoglobulina de línea de germen que se presenta naturalmente está compuesto de arreglos tándem separados de genes de segmentos variables localizados corriente arriba de un arreglo tándem o en línea de genes de diversidad de segmentos, los cuales en sí mismos se localizan corriente arriba de un arreglo en tándem de genes de región de unión (i) , que se localizan corriente arriba de los genes de región constante. Durante el desarrollo de linfocito B se presenta el re-arreglo V-D-J en donde un gen de región variable de cadena pesada (VH) se forma mediante el re-arreglo para formar un segmento D fusionado seguido de un re-arreglo con un segmento V para formar un gen de producto unido V-D-J los cuales, si se re-arreglan productivamente codifican una región variable funcional (VH) de una cadena pesada. Similarmente, los lugares de cadena ligera re-arreglan uno de varios segmentos V y uno de varios segmentos J para formar un gen que codifica la región variable (VL) de una cadena ligera. El vasto repertorio de regiones variables posible en inmunoglobulina deriva en parte de las numerosas posibilidades combinatorias de unir segmentos V e i (y, en caso de los lugares de cadena pesada, segmentos D) durante el re-arreglo en el desarrollo de la célula B. Diversidad de secuencias adicional en las regiones variables de cadena pesada surge de los re-arreglos no uniformes de los segmentos D durante la unión de V-D-J y de la adición de la región N. Además, la selección de antígeno de clonas de células B específicas proporciona variantes de afinidad más alta que no tienen mutaciones en la línea de germen en una o ambas de las regiones variables de cadena pesada y ligera, un fenómeno denominado como "maduración de afinidad" o "afinación de afinidad". Típicamente, esta "afinación de afinidad" de mutaciones se ramifican en áreas específicas de la región variable, más comúnmente en las regiones de determinación de complementariedad (CDR) . Con el fin de superar muchas de las limitaciones para producir e identificar inmunoglobulina de alta afinidad a través del desarrollo de célula B estimuladas por antígenos (es decir, inmunización) , se han desarrollado varios sistemas de expresión procarióticos que se pueden manipular para producir bibliotecas de anticuerpos combinatorios los cuales se pueden seleccionar para anticuerpos de alta afinidad con antígenos específicos. Los avances recientes en la expresión de anticuerpos en Escherichia coli y sistemas de bacteriófagos (ver "métodos de despliegue de péptido alternativos" , infra) han elevado la posibilidad de que virtualmente cualquier especificidad se puede obtener ya sea clonando genes de anticuerpos a partir de hibridomas caracterizados o mediante selección de novo usando bibliotecas de genes de anticuerpos (por ejemplo, a partir de Ig ADNc) . Las bibliotecas combinatorias de anticuerpos se han generado en los sistemas de expresión de bacteriófago lambda que se pueden seleccionar como placas de bacteriófagos como colonias de lisógenos (Huse y colaboradores, 1989; Catón y Koprowski, 1990; Mullinax y colaboradores, 1990; Persson y colaboradores, 1991) . Varias modalidades de bibliotecas de despliegue de anticuerpos de bacteriófagos y bibliotecas de expresión de fago lamda se han descrito (Kang y colaboradores, 1991; Clackson y colaboradores, 1991; McCafferty y colaboradores, 1990; Burton y colaboradores, 1991; Hoogenboom y colaboradores, 1991; Chang y colaboradores, 1991; Breitling y colaboradores, 1991; Marks y colaboradores, 1991, página 581; Barbas y colaboradores, 1992; Hawkins y Winter, 1992; Marks y colaboradores, 1992, página 779; Marks y colaboradores, 1992, página 16007; y Lo man y colaboradores, 1991; Lerner y colaboradores, 1992; todas incorporadas en la presente mediante referencia) . Típicamente, una biblioteca de despliegue de anticuerpo de bacteriófago se selecciona con un receptor (por ejemplo, polipéptido, carbohidrato, glicoproteína, ácido nucleico) que se inmoviliza (por ejemplo, mediante enlace covalente con una resina de cromatografía para enriquecerse para el fago reactivo por cromatografía por afinidad) y/o etiqueta (por ejemplo, para placa de pantalla o elevaciones de colonias) . Un enfoque ventajoso particular ha sido el uso del conocido bibliotecas variables de fragmento de cadena simple (scfv) (Marks y colaboradores, 1992, página 779; Winter y Milstein, 1991; Clackson y colaboradores, 1991; Marks y colaboradores, 1991, página 581; Chaud ary y colaboradores, 1990; Chiswell y colaboradores, 1992; McCafferty y colaboradores, 1990; y Huston y colaboradores, 1988) . Varias modalidades de bibliotecas scfv desplegadas en proteínas de recubrimiento de bacteriófagos se han descrito. Comenzando en 1988, los análogos de cadena simple de los fragmentos de Fv y sus proteínas de fusión se han generado confiablemente mediante métodos de ingeniería de anticuerpos. El primer paso generalmente involucra obtener los genes que codifican los dominios VH y VL con las propiedades de enlace deseadas; estos genes V se pueden aislar a partir de la célula de la línea celular del hibridoma específico, seleccionado de una biblioteca de gen V combinatoria, o hacer mediante la síntesis del gen V. El Fv de cadena simple formado conectando los genes V componentes con un oligonucleótido que codifican un péptido enlazador diseñado apropiadamente tal como (Gly-Gly-Gly-Gly-Ser) 3 o el o los péptidos enlazadores equivalentes. El enlazador une con puente el término C de la primera región V y el término N de la segunda, ordenada ya sea VH-enlazador-VL o VL-enlazador-VH ' . En principio, el sitio de unión scfv puede replicar fielmente tanto la afinidad y la especificidad de su sitio de combinación de anticuerpo padre. De este modo los fragmentos scfv están compuestos de dominios VH y VL enlazados en una sola cadena de polipéptido mediante un péptido enlazador flexible. Después de que los genes scfv se ensamblan, se clonan en un fagémido y se expresan en la punta del fago M13 (o bacteriófago filamentoso o similar) como las proteínas de fusión con la proteína de recubrimiento del bacteriófago Pili (gen 3) . El enriquecimiento para el fago que expresa un anticuerpo de interés se lleva a cabo lavando el fago recombinante que despliega una población scfv para enlazarse con un epítope predeterminado (por ejemplo, antígeno objetivo, receptor) . El polinucleótido enlazado de un miembro de biblioteca proporciona la base para la réplica de un miembro de biblioteca después de un procedimiento de filtrado o selección, y también proporciona la base para la determinación, mediante secuencia-miento de nucleótidos, de la identidad de la secuencia de péptido desplegada o de la secuencia de aminoácidos VH y VL. El o los péptidos desplegados o el anticuerpo de cadena simple (por ejemplo, scfv) y/o sus dominios VH y VL o sus CDR se pueden clonar y expresar mediante un sistema de expresión conveniente. Frecuentemente los posición que codifican los dominios VH y VL aislados estarán ligados a polinucleótidos que codifican regiones constantes (CH y CL) para formar polinucleótidos que codifican anticuerpos completos (por ejemplo, quiméricos o completamente humanos) , fragmentos de anticuerpos, y similares. Frecuentemente los polinucleótidos que codifican los CDR aislada se pueden injertar en polinucleótidos que codifican un marco de región variable conveniente (y opcionalmente regiones constantes) para formar polinucleótidos que codifican ácidos nucleicos completos (por ejemplo, humanizados o completamente humanos) , fragmentos y anticuerpos, y similares. Los anticuerpos se pueden usar para aislar cantidades preparativas de antígeno mediante cromatografía por inmuno-afinidad. Varios otros usos de estos anticuerpos son para diagnosticar y/o determinar la etapa de la enfermedad (por ejemplo, neoplasia) y para aplicación terapéutica para tratar la enfermedad, tal como por ejemplo: neoplasia, enfermedad auto-inmune, SIDA, enfermedad cardiovascular, infecciones, y similares . Se han reportado varios métodos para aumentar la diversidad combinatoria de una biblioteca scfv para ampliar el repertorio de especies de enlace (espectro de idiotipo) . El uso de reacción de cadena de polimerasa ha permitido que las regiones variables sean clonadas rápidamente ya sea a partir de una fuente de hibridoma específico o como una biblioteca de genes a partir de células no inmunizadas, enfrentando la diversidad combinatoria en la clasificación de casetes VH y VL que se pueden combinar. Además, los casetes VH y VL pueden en sí mismas diversificarse, tales como mediante mutagénesis aleatoria, pseudo-aleatoria, o dirigida. Típicamente los casetes VH y VL se diversifican en o cerca de las regiones determinantes de complementariedad (CDR) frecuentemente la tercera CDR, CDR3. La mutagénesis de reacción de cadena de polimerasa inversa enzimática ha demostrado ser un método simple y confiable para construir bibliotecas relativamen-te grandes de híbridos dirigidos al sitio de scfv (Stemmer y colaboradores, 1993), tiene reacción de cadena de polimerasa propensa al error y mutagénesis química (Deng y colaboradores, 1994) . Riechmann (Riechmann y colaboradores, 1993) mostró un diseño semi -racional de un fragmento de anticuerpos scfv usando aleatorización dirigido al sitio mediante reacción de cadena de polimerasa de oligonucleótido degenerado y despliegue de fago subsecuente de los híbridos scfv resultantes. Barbas (Barbas y colaboradores, 1992) intentó darle la vuelta al problema de los tamaños de repertorio limitados resultantes del uso de secuencias de región variable desviada aleatorizando la secuencia en una región de CDR de un Fab de enlace toxoide de tétanos humano. La aleatorización de CDR tiene el potencial para crear aproximadamente 1 x 1020 CDR para la cadena pesada CDR 3 sola, y aproximadamente un número similar de variantes de la cadena pesada CDR 1 y CDR 2, y la cadena ligera CDR 1-3 en sus variantes. Tomados individualmente o juntos, las posibilidades de combinación de la aleatorización de CDR de las cadenas pesadas y/o ligeras requiere generar un número prohibitivo de clonas de bacteriófagos para producir una biblioteca de clonas que representa todas las combinaciones posibles, la vasta mayoría de las cuales será no enlazantes . La generación de este gran número de transformantes primarios no es factible con la tecnología de transformación actual y los sistemas de despliegue de bacteriófagos. Por ejemplo, Barbas (Barbas y colaboradores, 1992) solamente generó 5 x 107 transformantes, los cuales representan solamente una pequeña fracción de la diversidad de potencial de una biblioteca de CDR aleatorizados totalmente. A pesar de estas limitaciones sustanciales, el despliegue de bacteriófago de scfv ya ha producido una variedad de anticuerpos útiles y de proteínas de fusión de anticuerpos. Un anticuerpo de cadena simple bi -específica se ha mostrado que media la lisis de células de tumor de manera eficiente (Gruber y colaboradores, 1994) . La expresión intracelular de scfv anti-Rev ha mostrado que inhibe la réplica de virus del VIH-1 in vi tro (Duan y colaboradores, 1994) , y la expresión intracelular de un anti-p21rar, scfv ha mostrado que inhibe la maduración meiótica de los oocitos Xenopus (Biocca y colaboradores, 1993) . Los scfv recombinantes que se pueden usar para diagnosticar la infección por VIH también se han reportado, demostrando la utilidad de diagnóstico del scfv (Lilley y colaboradores, 1994) . Las proteínas de fusión en donde un scfv se enlaza a un segundo polipéptido, tal como una toxina o una proteína activadora de fibrinolítica, también se han reportado (Holvost y colaboradores, 1992; Nicholls y colaboradores, 1993) . Si fuera posible generar bibliotecas scfv que tienen diversidad de anticuerpos amplia y superar muchas de las limitaciones de las mutagénesis de las CDR convencionales y los métodos de aleatorización que pueden cubrir solamente una pequeña fracción de las combinaciones de secuencia potenciales, el número y la calidad de anticuerpos scfv convenientes para uso terapéutico y de diagnóstico se podría mejorar vastamente. Para hacer esto, en los métodos de mezclado in vitro y en vivo de la invención se usan para recombinar CDR que han sido obtenidas (típicamente vía amplificación por reacción de cadena de polimerasa o clonación) a partir de ácidos nucleicos obtenidos de anticuerpos desplegados seleccionados. Estos anticuerpos desplegados se pueden desplegar en células, y en partículas bacteriófagas, sobre polisomas, o cualquier sistema de despliegue de anticuerpos conveniente en donde el anticuerpo se asocia con su o sus ácidos nucleicos codificadores. En una variación, las CDR inicialmente se obtienen de AR c (o ADNc) a partir de células que producen anticuerpos (por ejemplo, células de plasma/esplenocitos a partir de un ratón tipo natural inmunizado, un humano o ratón transgénico capaz de hacer un anticuerpo humano como en WO 92/03918, WO 93/12227, y WO 94/25585), incluyendo hibridomas derivados de los mismos. Las secuencias de polinucleótidos seleccionadas en una primera ronda de selección (típicamente mediante selección por afinidad para enlace de anticuerpo desplegado a un antígeno (por ejemplo, un ligando)) mediante cualquiera de estos métodos se combinan y las combinaciones se mezclan mediante recombinación in vitro y/o en vivo, especialmente se mezclan las CDR (típicamente se mezclan las CDR de cadena pesada con otra CDR de cadena pesada y las CDR de cadena ligera con otras CDR de cadena ligera) para producir un depósito mezclado que comprende una población de secuencias de polinucleótidos seleccionados recombinadas . Las secuencias de polinucleótido seleccionadas recombinadas se expresan en un formato de selección conforme su anticuerpo desplegado y se someten a cuando menos una ronda de selección posterior. Las secuencias de polinucleótidos seleccionadas en la o las rondas de selección posteriores se pueden usar directamente para secuenciar y/o someter a una o más rondas adicionales de mezclado y selección posterior hasta que un anticuerpo de la afinidad de enlace deseada se obtiene. Las secuencias seleccionadas también se pueden cruzar hacia atrás con secuencias de polinucleótidos que codifican secuencias de marco de anticuerpos neutro (es decir, que tienen efecto funcional insustancial sobre el enlace de antígeno) , tal como por ejemplo, mediante cruce hacia atrás con un marco de región variable humano para producir anticuerpos de secuencia parecido a humano. Generalmente, durante el cruce hacia atrás se aplica selección posterior para retener la propiedad de enlace al antígeno predeterminado. Alternativamente, o en combinación con las variaciones notadas, la valencia del epítope objetivo puede variar para controlar la afinidad de enlace promedio de miembros de biblioteca scfv. El epítope objetivo se puede enlazar a una superficie sustrato a densidades variantes, tales como incluyendo un epítope competidor, mediante dilución, o mediante otro método conocido para los técnicos en la materia. Una densidad alta (valencia) de epítope de predeterminado se puede usar para enriquecer los miembros de la biblioteca scfv que tienen afinidad relativamente baja, mientras que una densidad baja (valencia) preferencialmente puede enriquecer miembros de biblioteca scfv de afinidad más alta . Para generar segmentos variables diversos, una colección de oligonucleótidos que codifican secuencias de péptidos aleatorias, pseudo-aleatorias , o un conjunto nuclear de secuencias definidas se puede insertar mediante ligación en un sitio predeterminado (por ejemplo, una CDR) . Similarmente , la diversidad de secuencias de una o más CDR de el o los casetes de anticuerpos de cadena simple se puede extender mutando las CDR con mutagénesis dirigida al sitio, reemplazo de CDR, y similares. Las moléculas de ADN resultantes se pueden propagar en una hospedera para clonación y amplificación antes del mezclado, o se pueden usar directamente (es decir, pueden evitar la pérdida de diversidad que se pueden presentar después de la propagación en una célula hospedera) y los miembros de la biblioteca seleccionada subsecuentemente se mezclan. Los complejos desplegados de péptido/polinucleó ido (miembros de biblioteca) que codifican una secuencia de péptidos de segmento variable de interés o un anticuerpo de cadena simple de interés se seleccionan a partir de la biblioteca mediante técnica de enriquecimiento por afinidad. Esto se lleva a cabo por medio de una macromolécula inmovilizada o epítope específico para la secuencia de péptidos de interés, tal como un receptor, otra macromolécula, u otra especie de epítope. Repitiendo el procedimiento de selección de afinidad se proporciona un enriquecimiento de los miembros de la biblioteca que codifican las secuencias deseadas, las cuales pueden entonces aislarse para combinarse y mezclarse, para secuenciar, y/o propagación adicional y enriquecimiento de afinidad. Los miembros de bibliotecas sin la especificidad deseada se remueven lavándolos . El grado y el rigor del lavado requerido será determinado para cada secuencia de péptidos o anticuerpos de cadena simple de interés y la macromolécula o epítope predeterminada inmovilizada. Un cierto grado de control se puede ejercer sobre las características de enlace de los complejos de péptido/ADN naciente recuperados ajustando las condiciones de incubación de enlace y el lavado posterior. La temperatura, pH, fuerza iónica, concentración de cationes divalentes, y el volumen y duración del lavado se seleccionará para los complejos nacientes de péptido/ADN dentro de rangos particulares de afinidad para la macromolécula inmovilizada. La selección basada en el régimen de disociación lento, que usualmente es predictivo de afinidad alta, frecuentemente es la ruta más práctica. Esto se puede hacer ya sea mediante la incubación continua en presencia de una cantidad de saturación de macromolécula predeterminada libre, o aumentando el volumen, número, y longitud de los lavados. En cada caso, el re-enlace del complejo naciente disociado de péptido/ADN o complejo de péptido ARN se evita, y con aumento en el tiempo, los complejos de péptido/ADN o péptido/ARN naciente de afinidad cada vez más alta se recuperan. Las modificaciones adicionales de los procedimientos de enlace y lavado se pueden aplicar para encontrar péptidos con características especiales. Las afinidades de algunos péptidos dependen de la fuerza iónica o de las concentraciones de cationes. Esta es una característica útil para péptidos que serán usados en purificación por afinidad de varias proteínas cuando las condiciones moderadas para remover la proteína de los péptidos se requiere. Una variación involucra el uso de objetivos de enlace múltiples (múltiples especies de epítopes, múltiples especies de receptores) , de manera que la biblioteca scfv se puede seleccionar simultáneamente para una multiplicidad de scfv que tienen diferentes especificidades de enlace. Dado que el tamaño de la biblioteca de scfv frecuentemente limita la diversidad de secuencias scfv potenciales, típicamente es deseable para nosotros bibliotecas scfv de un tamaño tan grande como sea posible. El tiempo y las consideraciones económicas de generar un número de bibliotecas de despliegue de scFv de polisoma muy grande se pueden volver prohibitivos. Para evitar este problema sustancial, múltiples especies epítopes predeterminados (especies receptoras) se pueden seleccionar al mismo tiempo en una sola biblioteca, o la selección secuencial contra un número de especies de epítope se puede usar. En una variación, múltiples especies de epítopes objetivos, cada una codificada en un listón separado (o subconjunto de listones) se pueden mezclar e incubar con una biblioteca scfv de despliegue de polisoma bajo condiciones de enlace convenientes. La colección de listones, que comprende múltiples especies de epítopes, se puede entonces usar para aislar, mediante selección por afinidad, miembros de biblioteca scfv. Generalmente, las rondas de selección de afinidad posteriores pueden incluir la misma mezcla de listones, subconjuntos de los mismos, o listones que contienen solamente una o dos especies de epítopes individuales. Este enfoque se enfrenta con la selección eficiente, y es compatible con automatización de laboratorio, procesamiento por lotes, y métodos de selección de alta producción. Una variedad de técnicas se puede usar en la presente invención para diversificar una biblioteca de péptidos o una biblioteca de anticuerpos de cadena simple, o para diversificar, antes de o al mismo tiempo con la mezcla, alrededor de péptidos de segmento variable encontrados en rondas anteriores de lavado para tener suficiente actividad de enlace con la macromolécula o epítope predeterminada. En este enfoque, los complejos de péptido/polinucleótido seleccionados positivos (aquellos identificados en una ronda anterior de enriquecimiento por afinidad) se secuencian para determinar la identidad de los péptidos activos. Los oligonucleótidos se sintetizan entonces basándose en estas secuencias de péptidos activos, empleando un nivel bajo de todas las bases incorporadas en cada paso para producir ligeras variaciones de las secuencias de oligonucleótidos primarias. Esta mezcla de oligonucleótidos degenerados (ligeramente) se clona entonces en las secuencias de segmentos variables en los lugares adecuados . Este método produce variaciones sistemáticas, controladas, de las secuencias de péptidos iniciales, que pueden entonces ser mezcladas. Sin embargo, se requiere que los complejos nacientes de pépti-dos/polinucleótidos positivos individuales se secuencien antes de la mutagénesis, y de este modo es útil para extender la diversidad de números pequeños de complejos recuperados y seleccionar variantes que tienen afinidad de enlace más alto y/o especificidad enlace más alto. En una variación, la amplificación de reacción de cadena de polimerasa mutagénica de complejos de péptido/polinucleótido seleccionados positivos (especialmente de las secuencias de región variable, los productos de la amplificación de los cuales se mezclan in vitro y/o en vivo y una o más rondas adicionales de selección se hacen antes del secuenciamien-to. El mismo enfoque general se puede emplear con anticuerpos de cadena simple con el fin de extender la diversidad y aumentar la afinidad/especificidad de enlace, típicamente diversificando las CDR o regiones de marco adyacente antes de o al mismo tiempo con la mezcla. Si se desea, las reacciones de mezcla se pueden marcar con oligonucleótidos mutagénicos capaces de recombinación in vitro con los miembros de la biblioteca seleccionada se pueden incluir. De este modo mezclas de oligonucleótidos sintéticos y polinucleótidos producidos por reacción de cadena de polimerasa (sintetizados mediante métodos propensos a error o de alta fidelidad) se pueden añadir a la mezcla de mezclado in vitro y se pueden incorporar en los miembros de biblioteca mezclados resultantes (mezclantes) . La presente invención de mezclado permite la generación de una vasta biblioteca de anticuerpos de cadena simple con CDR variante. Una manera para generar estos anticuerpos es insertando CDR sintético al anticuerpo de cadena simple y/o aleatoriza-ción de CDR antes de o al mismo tiempo con el mezclado. Las secuencias de casetes de CDR sintéticas se seleccionan haciendo referencia a datos de secuencias conocidas de CDR humanas y se seleccionan en la discreción del practicante de acuerdo con los siguientes ligamentos: las CDR sintéticas tendrán cuando menos 40 por ciento de identidad de secuencia posicional con secuencias de CDR conocidas, y preferiblemente tendrán cuando menos 50 a 70 por ciento de identidad de secuencia posicional con secuencias CDR conocidas. Por ejemplo, una colección de secuencias CDR sintéticas se puede generar sintetizando una colección de secuencias de oligonucleótidos con base en secuencias de CDR humanas que se presentan naturalmente enlistadas en abat (Kabat y colaboradores, 1991) ; el depósito o depósitos de secuencias CDR se calculan para codificar secuencias de péptidos de CDR que tienen cuando menos 40 por ciento de identidad de secuencia con cuando menos una secuencia de CDR humana que se presenta naturalmente conocida. Alternativamente, una colección de secuencias de CDR que se presenta naturalmente se puede comparar para generar secuencias de consenso de manera que los aminoácidos usados- en una posición de residuo frecuentemente (es decir, en cuando menos 5 por ciento de secuencias de CDR conocidas) se incorpora en la CDR sintéticas en la o las posiciones correspondientes. Típicamente, varias secuencias CDR conocidas (por ejemplo, de 3 a aproximadamente 50) se comparan y observan variaciones de secuencia naturales entre las CDR conocidas se tabulan, y una colección de oligonucleótidos que codifican secuencias de péptidos CDR que abarcan todas o la mayoría de las permutaciones de las variaciones de secuencia naturales observadas se sintetizan. Por ejemplo, pero no para limitación, si una colección de secuencias de CDR VH tiene aminoácidos carboxitermi-nales que son ya sea Tyr, Val, Phe, o Asp, entonces la o las combinaciones de secuencias de oligonucleótidos CDR sintéticos se diseñan para permitir que el residuo CDR carboxi terminal sea cualquiera de estos aminoácidos. En algunas modalidades, los residuos distintos de aquellos que se presentan naturalmente en una posición de residuo en la colección de secuencias de CDR se incorporan: sustituciones de aminoácidos conservadores frecuentemente se incorporan y hasta 5 posiciones de residuos se pueden variar para incorporar sustituciones de aminoácidos no conservadores en comparación con las secuencias CDR que se presentan naturalmente conocidas. Estas secuencias CDR se pueden usar en miembros de biblioteca primaria (antes de la primera ronda de selección) y/o se pueden usar para resaltar reacciones de mezcla in vitro de secuencias de miembros de bibliotecas seleccionadas. La construcción de estas combinaciones de secuencias definidas y/o degeneradas será fácilmente llevada a cabo por alguien con experiencia ordinaria en la técnica. La colección de secuencias CDR sintéticas comprende cuando menos un miembro que no se sabe que es una secuencia CDR que se presenta naturalmente. Está dentro de la discreción del practicante incluir o no incluir una porción de secuencia aleatoria o pseudo-aleatoria correspondiente a la adición de la región N en la CDR de cadena pesada; la secuencia de región N varía de un nucleótido hasta aproximadamente 4 nucleótidos presentándose en las uniones V-D y D-J. Una colección de secuencias de CDR de cadena pesada sintéticas comprende cuando menos aproximadamente 100 secuencias CDR únicas, típicamente cuando menos aproximadamente 1,000 secuencias CDR únicas, preferiblemente cuando menos aproximadamente 10,000 secuencias CDR únicas, frecuentemente más de 50,000 secuencias CDR únicas; sin embargo, usualmente no más de aproximadamente 1 x 106 secuencias de CDR únicas se incluyen en la colección, aunque ocasionalmente a x 107 hasta 1 x 108 secuencias CDR únicas están presentes, especialmente si las sustituciones de aminoácidos conservadoras se permiten en posiciones en donde el sustituyente de aminoácidos conservador no está presente o es raro (es decir, menos de 0.1 por ciento) en esa posición en CDR humano que se presenta naturalmente. En general, el número de secuencias CDR únicas incluidas en la biblioteca no deberá exceder el número esperado de transformantes primarios en la biblioteca por más de un factor de 10. Estos anticuerpos de cadena simple generalmente se enlazan en aproximadamente cuando menos 1 x 10m", preferiblemente con una afinidad de aproximadamente cuando menos 5 x 107 M-1, más preferiblemente con una afinidad de cuando menos 1 x 108 M-l hasta 1 x 109 M-l o más, algunas veces hasta 1 x 1010 M-l o más. Frecuentemente el antígeno predeterminado es una proteína humana, tal como por ejemplo, un antígeno de superficie celular humana (por ejemplo, CDR, CD8, IL-2 receptor, receptor EGF, receptor PDGF) , otras macromoléculas biológicas humanas (por ejemplo, trombomodulina, proteína C, antígeno carbohidrato, antígeno de Lewis sialilo, Lselectina) , o macromolécula asociada con enfermedad no humana (por ejemplo, LPS bacteriana, proteína de cápsido de virión o glicoproteína de envoltura) y similares. Los anticuerpos de cadena simple de alta afinidad de especificidad deseada se pueden diseñar técnicamente y expresar en una variedad de sistemas. Por ejemplo, scfv ha sido producido en plantas (Firek y colaboradores, 1993) y se puede hacer fácilmente en sistemas procarióticos (Owens y Young, 1994; Johnson y Bird, 1991) . Además, los anticuerpos de cadena simple se pueden usar como una base para construir anticuerpos enteros o varios fragmentos de los mismos (Kettleborough y colaboradores, 1994) . La secuencia de codificación de región variable se puede aislar (por ejemplo, mediante amplificación de reacción de cadena de polimerasa o sub-clonación) y traslaparse a una secuencia que codifica a una región constante humana deseada para codificar un anticuerpo de secuencia humana más conveniente para usos terapéuticos humanos en donde la inmunogenicidad preferiblemente se minimiza. El o los polinucleótidos que tienen la o las secuencias de codificación humana completamente resultante se pueden expresar en una célula hospedera (por ejemplo, a partir de un vector de expresión en una célula de mamífero) y purificar para formulación farmacéutica. Las construcciones de expresión de ADN típicamente incluirán una secuencia de ADN de control de expresión operablemente enlazada en las secuencias de codificación, que incluyen regiones asociadas naturalmente o de promotor heterólogo. Preferiblemente, las secuencias de control de expresión serán sistemas promotoras eucarióticas en vectores capaces de transformar o transfectar células hospederas eucarióticas. En cuanto el vector ha sido incorporado en la hospedera adecuada, la hospedera se mantiene bajo condiciones permanentes para la expresión a alto nivel de las secuencias de nucleótidos, y la colección y purificación de los anticuerpos "diseñados experimentalmente mutantes" . Como se dijo antes, las secuencias de ADN se expresarán en hospederas después de que las secuencias han sido operablemente enlazadas a una secuencia de control de expresión (es decir, colocadas para asegurar la transcripción y traducción del gen estructural) . Estos vectores de expresión típicamente son aplicables en los organismos hospederos ya sea como episomas o como parte integral del ADN cromosomal de la hospedera. Comúnmente, los vectores de expresión contendrán marcadores de selección, por ejemplo, tetraciclina o neomicina, para permitir la detección de aquellas células transformadas con las secuencias de ADN deseadas (ver, por ejemplo, la patente de los Estados Unidos No. 4,704,362, la cual se incorpora en la presente mediante referencia) . Además de micro-organismos eucarióticos tal como levadura, el cultivo celular de tejido de mamíferos también se puede usar para producir los polipéptidos de la presente invención (ver Winnacker, 1987) , la cual se incorpora en la presente mediante referencia) ) . Las células eucarióticas realmente se prefieren, debido a que varias líneas de células hospederas convenientes capaces de secretar inmunoglobulinas intactas se han desarrollado en la técnica, e incluyen las líneas celulares CHO, varias líneas celulares COS, células HeLa, y las líneas celulares de mieloma, pero preferiblemente las Bcélulas transformadas o hibridomas . Los vectores de expresión para estas células pueden incluir secuencias de control de expresión, tales como un origen de réplica, un promotor, un mejorador (Queen y colaboradores, 1986), y sitios de información de procesamiento necesario, tales como sitios de enlace de ribosoma, sitios de traslape de ARN, sitios de poliadenilación, y secuencias terminadores de transcripción. Las secuencias de control de expresión preferidas son promotores derivados de genes de inmunoglobulina, citomegalovirus, SV40, adenovirus, virus de papiloma bovino, y similares. La transcripción de ADN eucariótico se puede aumentar insertando una secuencia mejoradora en el vector. Los mejorado-res son secuencias de actuación cis de entre 10 a 300 pares de bases que aumentan la transcripción mediante un promotor. Los mejoradores efectivamente pueden aumentar la transcripción cuando ya sea 51 o 31 a la unidad de transcripción. También son efectivas si se localizan dentro de un intrón o dentro de la misma secuencia de codificación. Típicamente los mejoradores virales se usan incluyendo los mejoradores SV40, mejoradores de citomegalovirus, mejoradores de polioma, y mejoradores de adenovirus. Las secuencias mejoradoras de sistemas mamíferos también se usan comúnmente, tales como el mejorador de cadena pesada de inmunoglobulina de ratón. Los sistemas de expresión de vectores de mamíferos también típicamente incluirán un gen marcador seleccionable . Ejemplos de marcadores convenientes incluyen, el gen de dihidro-folato reductasa (DHFR) , el gen timidina quinasa (TK) , o genes procarióticos que contienen resistencia a fármacos. Los primeros dos genes marcadores prefieren el uso de líneas celulares mutantes que carecen de la capacidad para crecer sin la adición de timidina al medio de crecimiento. Las células transformadas se pueden entonces identificar por su capacidad para crecer en medio no suplementado . Ejemplos de genes con resistencia a fármacos procarióticos útiles como marcadores incluyen genes que contienen resistencia a G418, ácido micofenólico y la higromici-na . Los vectores que contienen segmentos de ADN de interés se pueden transferir en la célula hospedera mediante métodos muy conocidos, dependiendo del tipo de hospedera celular. Por ejemplo, la transfección por cloruro de calcio comúnmente se utiliza para células procarióticas, mientras que el tratamiento con fosfato de calcio, la lipofección, o electro-incorporación se puede usar para otras hospederas celulares. Otros métodos usados para transformar células de mamíferos incluyen el uso de polibreno, fusión de protoplasto, liposomas, electro- incorporación, y micro-inyección (ver, generalmente, Sambrook y colaboradores, 1982 y 1989) . Una vez expresados, los anticuerpos, las cadenas de inmunoglobulina mutadas individuales, los fragmentos de anticuerpos mutados, y otros polipéptidos de inmunoglobulina de la invención se pueden purificar de acuerdo con procedimientos estándares de la técnica, incluyendo precipitaciones sulfato de amonio, cromatografía en columna de fracción, electroforesis en gel y similares (ver, en general. Scopes, 1982) . En cuanto se purifican, parcialmente o a la homogeneidad conforme se desee, los polipéptidos se pueden usar entonces terapéuticamente o para desarrollar y realizar procedimientos de pruebas, manchado de inmuno- fluorescentes, y similares (ver, generalmente, Lefkovits y Pernis, 1979 y 1981; Lefkovits, 1997). Los anticuerpos generados por el método de la presente invención se pueden usar para diagnóstico y terapia. A manera de ilustración y no limitación, se pueden usar para tratar cáncer, y enfermedades auto-inmunes, o infecciones virales. Para el tratamiento del cáncer, los anticuerpos típicamente se enlazan a un antígeno expresado preferencialmente en células cancerosas, tales como erbB-2, CEA, CD33, y muchos otros antígenos y miembros de enlace muy conocidos para los técnicos en la materia. Selección de extremo Esta invención proporciona un método para seleccionar un subconjunto de polinucleótidos a partir de un conjunto inicial de polinucleótidos, este método se basa en la capacidad para discriminar una o más características seleccionables (o marcadores de selección) presentes en cualquier parte en un polinucleó-tido de trabajo, de manera que se permita realizar la selección para (selección positiva) y/o contra (selección negativa) cada polinucleótido seleccionable . En un aspecto, se proporciona un método denominado selección de extremo, este método se basa en el uso de un marcador de selección localizado en parte o completamente en una región terminal de un polinucleótido seleccionable, y este marcador de selección se puede determinar un "marcador de selección de extremo" . La selección de extremo se puede basar en la detección de secuencias que se presentan naturalmente o en la detección de secuencias introducidas experimentalmente (incluyendo mediante cualquier procedimiento de mutagénesis mencionado en la presente y no mencionado en la presente) o en ambos, aún dentro del mismo polinucleótido. Un marcador de selección de extremo puede ser un marcador de selección estructural o un marcador de selección funcional o ambos o marcador de selección estructural y funcional . Un marcador de selección de extremo puede estar compuesto de una secuencia de polinucleótidos o de una secuencia de polipéptidos o de cualquier estructura química de cualquier etiqueta biológica o bioquímica, incluyendo marcadores que se pueden seleccionar usando métodos basados en la detección de radioactividad, actividad enzimática, o fluorescencia, de cualquier característica óptica, o una propiedad magnética (por ejemplo, usando cuentas magnéticas), de inmuno-reactividad, y de hibridación. La selección de extremo se puede aplicar en combinaciones con cualquier método útil para realizar mutagénesis. Estos métodos de mutagénesis incluyen, pero no se limitan a, métodos descritos en la presente (supra e infra) . Estos métodos incluyen, a manera de ejemplificación no limitante, cualquier método al que se haga referencia en la presente o mediante otros en la técnica o por cualquiera de los siguientes términos: "mutagénesis por saturación", "mezclado", "recombinación", "reensamble", "reacción de cadena de polimerasa propensa a error", "reacción de cadena de polimerasa de ensamble" , "reacción de cadena de polimerasa sexual" , "reacción de cadena de polimerasa de cruce", "mutagénesis dirigida a cebador de oligonucleótido" , "mutagénesis de ensamble recursivo (y/o exponencial) (ver Arkin y Youvan, 1992)", "mutagénesis de cásete", "mutagénesis en vivo", y "mutagénesis in vitro" . Más aún, la selección de extremo se puede realizar en moléculas producidas por cualquier método de mutagénesis y/o amplificación (ver, por ejemplo, Arnold, 1993; Caldwell y Joyce, 1992; Stemmer, 1994) ; después de este método es deseable seleccionar (incluyendo la selección por la presencia de) moléculas de progenie deseado. Además, la selección de extremo se puede aplicar a un polinucleótido aparte de cualquier método de mutagénesis. En una modalidad preferida, la selección de extremo, como se proporciona en la presente, se puede usar con el fin de facilitar un paso de clonación, tal como un paso de ligación con otro polinucleótido (incluyendo ligación a un vector) . Esta invención de este modo proporciona la selección de extremo como un medio útil para facilitar la construcción de la biblioteca, selección y/o enriquecimiento para polinucleótidos deseables, y clonación en general . En una modalidad particularmente preferida, la selección de extremo se puede basar en la selección (positiva) de un polinucleótido; y alternativamente, la selección de extremo se puede basar en selección (negativa) contra un polinucleótido; y alternativamente, todavía, la selección de extremo se puede basar en ambas selección (positiva) para, y selección contra (negativa), un polinucleótido. La selección de extremo, junto con otros métodos de selección y/o filtrado, se puede realizar de una manera iterativa, con cualquier combinación de selección parecida o no parecida y/o métodos de filtrado y métodos de mutagénesis útil, todos los cuales se pueden realizar de una manera iterativa y en cualquier orden, combinación, y permutación. También se aprecia que, de acuerdo con una modalidad de esta invención, la selección de extremo también se puede usar para seleccionar un polinucleótido que sea cuando menos en parte: circular (por ejemplo, un plásmido o cualquier otro vector circular o cualquier otro polinucleótido que sea parcialmente circular) , y/o ramificado, y/o modificado o sustituido por cualquier grupo químico o fracción. De acuerdo con esta modalidad, un polinucleótido puede ser una molécula circular compuesta de una región intermedia o central, esta región se flanquea en un lado 5' por una región de flanqueo 5' (la cual, para el propósito de la selección de extremo, sirve de manera parecida a una región terminal 5 ' de un polinucleótido no circular) y en un lado 3' mediante una región terminal 3' (la cual, para el propósito de la selección de extremo, sirve de manera parecida a una región terminal 3 ' de un polinucleótido no circular) . Como se usa en esta ejemplificación no limitante, puede haber un traslape de secuencia entre cualesquiera dos regiones o aún entre las tres regiones . En un aspecto no limitante de esta invención, la selección de extremo de un polinucleótido lineal se realiza usando un enfoque general basado en la presencia de cuando menos un marcador de selección de extremo localizado en o cerca de un extremo de polinucleótido o término (que puede ser ya sea el extremo 5 ' o un extremo 3') . En una ej emplificación no limitante, la selección de extremo se basa en la selección de una secuencia específica en o cerca de un término tal como, pero sin limitarse a, una secuencia reconocida por una enzima que reconoce una secuencia de polinucleótidos . Una enzima que reconoce y cataliza una modificación química de un polinucleótido se conoce en la presente como una enzima que actúa en polinucleótido. En una modalidad preferida, las enzimas que actúan en polinucleótidos útiles se ejemplifica no exclusivamente por enzimas con actividad de disociación de polinucleótido, enzimas con actividad de metilación de polinucleótido, enzimas con actividad de ligación de polinucleótido, y enzimas con una pluralidad de actividades enzimáticas distinguibles (incluyendo no exclusivamente, por ejemplo, tanto actividad de disociación de polinucleó-tido como actividad de ligación de polinucleótido) . Las enzimas que actúan en polinucleótidos relevantes de este modo también incluyen cualquier endonucleasas de polinucleótidos disponibles comercialmente o no disponibles comercialmente y sus metilasas de compañía incluyendo aquellas catalogadas en el sitio de la red http://www.neb.com/rebase, y aquellas mencionadas en la siguiente referencia citada (Roberts y Macelis, 1996) . Las endonucleasas de polinucleótidos preferidas incluyen - pero no se limitan a - enzimas de restricción tipo II (incluyendo tipo IIS) , e incluyen enzimas que disocian ambas cadenas de un polinucleótido de cadena doble (por ejemplo, iVotl, que disocia ambas cadenas en 5'... GC/GGCCGC ...3 ' ) y enzimas que disocian solamente una cadena de un polinucleótido de cadena doble, es decir, enzimas que tienen actividad de formar muescas de polinucleótido, (por ejemplo, . BstNBI , que disocia solamente una cadena en 5' ... GAGTC N/ ...3 ' ) . Las enzimas que actúan sobre polinucleótidos relevantes también incluyen enzimas de restricción tipo III. Se aprecia que las enzimas que actúan en polinucleótidos relevantes también incluyen cualquier enzima que se puede desarrollar en el futuro, aunque actualmente no disponible, que es útil para generar un extremo compatible de ligación, preferiblemente un extremo pegajoso, en un polinucleótido. En una ejemplificación preferida, un marcador de selección útil es un sitio de restricción en un polinucleótido que permite una enzima de restricción tipo II correspondiente (o tipo IIS) que disocie un extremo del polinucleótido de manera que proporcione un extremo ligable (incluyendo un extremo romo o alternativamente, un extremo pegajoso con cuando menos un colgante de una base) que sea útil para una reacción de ligación deseable sin disociar el polinucleótido internamente en la manera que destruye una secuencia interna deseada en el polinucleótido. De este modo se proporciona que, entre los sitios de restricción relevantes, aquellos sitios que no se presenten internamente (es decir que no se presenten aparte de los términos) en un polinucleótido de trabajo específico se prefieren cuando el uso de una enzima o unas enzimas de restricción correspondientes no pretende cortar internamente el polinucleótido de trabajo. Esto permite que se realicen reacciones de digestión de restricción hasta completarlas o cerca de completarlas sin incurrir en disociación interna no deseada en un polinucleótido de trabajo. De acuerdo con un aspecto preferido, es de este modo preferible usar sitios de restricción que no estén contenidos o alternativamente que no se espera que estén contenidos, o alternativamente que es poco probable que estén contenidos (por ejemplo, cuando la información de secuencia con respecto al polinucleótido de trabajo es incompleta) internamente en un polinucleótido para ser sometido a una selección de extremo. De acuerdo con este aspecto, se aprecia que los sitios de restric-ción que se presentan relativamente de manera poco frecuente usualmente se prefieren sobre aquellos que se presentan más frecuentemente. Por otro lado también se aprecia que hay ocasiones en que la disociación interna de un polipéptido se desea, por ejemplo, lograr una recombinación u otros procedimientos mutagénicos junto con la selección de extremo. De acuerdo con esta invención, también se aprecia que los métodos (por ejemplo, métodos de mutagénesis) se pueden usar para remover sitios de restricción internos no deseados. También se aprecia que una reacción de digestión parcial (es decir, reacción de digestión que continúa a la consumación parcial) se puede usar para lograr digestión en el sitio de reconocimiento en una región terminal al mismo tiempo que guarda un sitio de restricción susceptible que se presenta enteramente en un polinucleótido y que es reconocido por la misma enzima. En un aspecto, las digestiones parciales son útiles debido a que se aprecia que ciertas enzimas muestran disociación preferencial de la misma secuencia de reconocimiento dependiendo de la ubicación y ambiente en la cual se presenta la secuencia de reconocimiento. Por ejemplo, se aprecia que, mientras que el ADN lambda tiene 5 sitios EcóR I, la disociación del sitio más cercano al término derecho se ha reportado que representa 10 veces más rápido que los sitios a la mitad de la molécula. También, por ejemplo, se ha reportado que, aunque SacII tiene cuatro sitios en ADN lambda, los tres centralmente arracimados en lambda se disocian 50 veces más rápido que el sitio restante cerca del término (en el nucleótido 40,386). En resumen, las preferencias de sitios se han reportado para varias enzimas por muchos investigadores (por ejemplo, Thomas y Smith, 1975; Forsblum y colaboradores, 1976; Nath y Azzolina, 1981; Brown y Smith, 1977; Gingeras y Brooks, 1983; Krüger y colaboradores, 1988; Conrad y Topal, 1989; Oller y colaboradores, 1991; Topal, 1991; y Pein, 1991; para nombrar sólo unos pocos) . Se aprecia que cualquier observación empírica así como cualquier entendimiento mecánico de las preferencias de sitio por cualquier enzima que actúa sobre polinucleótido útil, ya sea actualmente disponible o para ser procurado en el futuro, puede ser útil en la selección de extremo de acuerdo con esta invención. También se aprecia que los métodos de protección se pueden usar para proteger selectivamente sitios de restricción específica (por ejemplo, sitios internos) contra digestión no deseada por enzimas que de otro modo cortarían un polipéptido de trabajo como respuesta a la presencia de aquellos sitios; y que estos métodos de protección incluyen modificaciones tales como las metilaciones y sustituciones de base (por ejemplo, U en vez de T) que inhiben una actividad de enzima no deseada. Se aprecia que hay números limitados de enzimas de restricción disponibles que son suficientemente raras (por ejemplo, que tienen secuencias de reconocimiento muy largas) para crear fragmentos de restricción grandes (por ejemplo, de longitud de una megabase) , y que enfoques de protección (por ejemplo, mediante metilación) son útiles para aumentar la rareza de los sitios de disociación de enzima. El uso de M.FnuII (mCGCG) para aumentar la rareza aparente de ¿Votl aproximadamente dos veces no es más que un ejemplo entre muchos (Qiang y colaboradores, 1990; Nelson y colaboradores, 1984,· Maxam y Gilbert, 1980; Raleigh y Wilson, 1986) . De acuerdo con un aspecto preferido de esta invención, se proporciona que, en general, el uso de sitios de restricción se prefiere. Se aprecia que, en general, la frecuencia de ocurrencia de un sitio de restricción se determina por el número de nucleótidos contenidos en la misma, así como por la ambigüedad de los requerimientos de base contenidos en la misma. De este modo, en una ejemplificación no limitante, se aprecia que, en general, un sitio de restricción compuesto de, por ejemplo, 8 nucleótidos específicos (por ejemplo, el sitio iVotl o GC/GGCCGC, con una ocurrencia relativa estimada de una en 48, es decir, una en 65,536, 8-mers aleatorios) es relativamente más infrecuente que una compuesta de, por ejemplo, 6 nucleótidos (por ejemplo, el sitio Smal o CCC/GGG, que tiene una ocurrencia relativa estimada de l en 46, es decir, una en 4,096, 6-mers aleatorios), que a su vez es relativamente más infrecuente que una compuesta de, por ejemplo, 4 nucleótidos (por ejemplo, el sitio AfspI o C/CGG, que tiene una ocurrencia relativa estimada de 1 en 44, es decir, uno en 256, 4-mers aleatorio) . Más aún, en otra ej emplificación no liraitante, se aprecia que, en general, un sitio de restricción que no tiene requerimientos de base ambiguos (sino solamente específicos) (por ejemplo, el sitio Finí o GTCCC, que tiene una ocurrencia relativa de uno en 45, es decir, uno en 1024, 5-mers aleatorios) es relativamente más infrecuente que una que tiene un requerimiento de base ambiguo W (en donde W = A o T) (por ejemplo, el sitio Avall o G/GWCC, que tiene una ocurrencia relativa estimada de uno en 4x4x2x4x4 - es decir, uno en 512 - 5-mers aleatorios) , que a su vez es relativamente más infrecuente que una que tiene un requerimiento de base ambiguo N (en donde N = Ao C o G o T) (por ejemplo, el sitio Asul o G/GNCC, que tiene una ocurrencia relativa estimada de uno en 4x4x1x4x4, es decir, uno en 256 - 5-mers aleatorios) . Estas ocurrencias relativas se consideran estimadas generales para polinucleótidos reales, debido a que se aprecia que las bases de nucleótidos específicas (para no mencionar secuencias de nucleótidos específicos) se presentan con frecuencias distintas en polinucleótidos específicos, en especies específicas de organismos, y en agrupamientos específicos de organismos. Por ejemplo, se aprecia que el por ciento de contenido G+C de diferentes especies de organismos frecuentemente son muy diferentes y varían ampliamente. El uso de sitios de restricción relativamente más infrecuentes en un marcador de selección incluyen - de una manera no limitante - preferiblemente aquellos sitios compuestos de cuando menos una secuencia de 4 nucleótidos, más preferiblemente aquellos compuestos de cuando menos una secuencia de 5 nucleóti-dos, más preferiblemente todavía aquellos compuestos de cuando menos una secuencia de 6 nucleótidos (por ejemplo, el sitio BairiR I o G/GATCC, el sitio Bglll o A/GATCT, el sitio PstI o CTGCA/G, y el sitio Xbal o T/CTAGA) , más preferiblemente aquellos compuestos de cuando menos una secuencia de 7 nucleótidos, más preferiblemente todavía aquellos compuestos de una secuencia de 8 nucleótidos (por ejemplo, el sitio AscI o GG/CGCGCC, el sitio iVotl o GC/GGCCGC, el sitio Pací o TTAAT/TAA, el sitio Pmel o GTTT/AAAC, el sitio Srfl o GCCC/GGGC, el sitio Sse838 I o CCTGCA/GG, y el sitio SwaI o ATTT/AAAT) , más preferiblemente todavía aquellos compuestos de una secuencia de 9 nucleótidos, y aún más preferiblemente todavía aquellos compuestos de cuando menos una secuencia de 10 nucleótidos (por ejemplo, el sitio BspG I o CG/CGCTGGAC) . Se aprecia además que algunos sitios de restricción (por ejemplo, para enzimas de clase IIS) están compuestas de una porción de especificidad relativamente alta (es decir, una porción que contiene un determinante principal de la frecuencia de ocurrencia del sitio de restricción) y una porción de especificidad relativamente baja; y que un sitio de disociación puede o no estar contenido dentro de una porción de especificidad relativamente baja. Por ejemplo, en el sitio EcoSl I o CTGAAG (16/14) , hay una porción de especificidad relativamente alta (es decir, la porción CTGAAG) y una porción de especificidad relativamente baja (es decir, la secuencia N16) que contiene un sitio de disociación. En otra modalidad preferida de esta invención, un marcador de selección de extremo es una secuencia terminal que es reconocida por una enzima que actúa en polinucleótido que reconoce una secuencia de polinucleótidos específica. En un aspecto preferido de esta invención, las enzimas que actúan en polinucleótidos útiles también incluyen otras enzimas en adición a las enzimas de restricción tipo II clásicas. De acuerdo con este aspecto preferido de esta invención, las enzimas que actúan en polinucleótidos útiles también incluyen girasas, helicasas, recombinasas , relaxasas, y cualquier enzima relacionada a las mismas . Entre los ejemplos preferidos están topo-isomerasas (que han sido categorizadas por algunos como un subconjunto de las girasas) y cualquier otra enzima que tenga actividad de disociación de polinucleótido (incluyendo preferiblemente actividad de formación de muescas de polinucleótido preferiblemente) y/o actividad de ligación de polinucleótido. Entre las enzimas de topo-isomerasa preferidas están las enzimas de topo-isomerasa I, que está disponible de muchas fuentes comerciales (Epicentre Technologies, Madison, I; Invitrogen, Carlsbad, CA; Life Technologies, Gathesburg, D) y concebiblemente aún más fuentes privadas. Se aprecia que enzimas similares se pueden desarrollar en el futuro que son útiles para la selección extrema que se proporciona en la presente. Una enzima topo-isomerasa I particularmente preferida es una enzima topo-isomerasa I de origen de virus de vacuna, que tiene una secuencia de reconocimiento específica (por ejemplo, 5' ...AAGGG ...3 ' ) y tiene tanto actividad de formación de muestras de polinucleótido como actividad de ligación de polinucleótido. Debido a la actividad formación de muestras específica de esta enzima (disociación de una cadena) , los sitios de reconocimiento internos no son propensos a la destrucción de polinucleótidos resultante de la actividad de formación de muescas (si no en vez de eso permanecen recocidas) a una temperatura que causa la desnaturalización de un sitio terminal que ha sido mellada. De este modo para el uso en la selección de extremo, es preferiblemente que un sitio de muescas para la selección de extremo basada en topo-isomerasa no tenga más de 100 nucleótidos de un término, más preferiblemente no más de 50 nucleótidos de un término, más preferiblemente todavía no más de 25 nucleótidos de un término, aún más preferiblemente todavía no más de 20 nucleótidos de un término, aún más preferiblemente todavía no más de 15 nucleótidos de un término, aún más preferiblemente todavía no más de 10 nucleótidos de un término, aún más preferiblemente todavía no más de 8 nucleótidos de un término, aún más preferiblemente todavía no más de 6 nucleótidos de un término, y aún más preferiblemente todavía no más de 4 nucleótidos de un término. En una ejemplificación particularmente preferida que no es limitante aunque claramente ilustrativa, se aprecia que cuando un sitio de muesca para la selección de extremo basada en topo-isomerasa tiene 4 nucleótidos a partir de un término, la formación de muescas produce un oligo de cadena simple de cuatro bases (en una región terminal) que se puede desnaturalizar a partir de su cadena complementaria en un polinucleótido de selección de extremo; que proporciona un extremo pegajoso (compuesto de 4 bases) en un polinucleótido que es útil para una reacción de ligación. Para llevar a cabo la ligación con un vector de clonación (preferiblemente un vector de expresión) , se pueden generar extremos pegajosos compatibles en un vector de clonación por cualquier medio incluyendo por medios basados en enzimas de restricción. Los nucleótidos terminales (compuestos de 4 bases terminales en este ejemplo específico) en un término de polinucleótido seleccionable terminal se elige sabiamente para proporcionar compatibilidad con un extremo pegajoso generado en un vector de clonación al cual se va a ligar el polinucleótido. Por otro lado, la formación de muescas interna de un polinucleótido de selección de extremo, por ejemplo, 500 bases a partir del término, produce un oligo de cadena simple de 500 bases que no se desnaturaliza fácilmente a partir de su cadena complementaria, sino es útil para reparación (por ejemplo, mediante la misma enzima topo-isomerasa que produjo la muesca) . Esta invención de este modo proporciona un método - por ejemplo, que está basado en topo-isomerasa vacuna y/o basado en endonucleasa de restricción tipo II (o IIS) y/o basado en endonucleasa de restricción tipo III y/o basado en enzima de muesca (por ejemplo, usando N. BstNB I) - para producir un extremo pegajoso en un polinucleótido de trabajo, cuyo extremo es compatible a la ligación y cuyo extremo puede estar compuesto de cuando menos un colgante de 1 base. Preferiblemente este extremo pegajoso está compuesto de cuando menos un colgante de 2 bases, más preferiblemente este extremo pegajoso está compuesto de cuando menos un colgante de 3 bases, más preferiblemente todavía este extremo pegajoso está compuesto de cuando menos un colgante de 4 bases, aún más preferiblemente todavía este extremo pegajoso está compuesto de cuando menos un colgante de 5 bases, aún más preferiblemente todavía este extremo pegajoso está compuesto de cuando menos un colgante de 6 bases. Este extremo pegajoso también puede estar compuesto de cuando menos un colgante de 7 bases, o cuando menos un colgante de 8 bases, o cuando menos un colgante de 9 bases, o cuando menos un colgante de 10 bases, o cuando menos un colgante de 15 bases, o cuando menos un colgante de 20 bases, o cuando menos un colgante de 25 bases, o cuando menos un colgante de 30 bases. Estos colgantes pueden estar compuestos de cualquier base, incluyendo A, C, G, o T. Se aprecia que los colgantes de extremos pegajosos introducidos utilizando topo-isomerasa o una enzima de muesca (por ejemplo, usando N.BstNB I) se pueden diseñar para ser únicos en un ambiente de ligación, para prevenir re-ensambles de fragmentos no deseados, tales como auto-dimerizaciones y otras concatemerizaciones no deseadas. De acuerdo con un aspecto de la invención, una pluralidad de secuencias (que pueden pero no necesariamente traslaparse) se pueden introducir en una región terminal de un polinucleótido de selección de extremo mediante el uso de un oligo en una reacción basada en polimerasa. En un ejemplo relevante, pero de ninguna manera limitante, este oligo se puede usar para proporcionar una región terminal 5' preferida que es útil para la selección de extremo basada en topo-isomerasa I, este oligo está compuesto de: una secuencia de 1-10 bases que es convertible en un extremo pegajoso (preferiblemente mediante una topo-isomerasa I de vacuna) , un sitio de enlace de ribosoma (por ejemplo, un "RBS" , que es preferiblemente útil para la clonación de expresión) , y una secuencia de enlazador opcional seguida por un sitio de inicio ATG y una secuencia específica de plantilla de 0 a 100 bases (para facilitar el recocido con la plantilla en la reacción basada en polimerasa) . De este modo, de acuerdo con este ejemplo, un oligo útil (el cual se puede denominar un cebador hacia adelante) puede tener la secuencia: 5' [secuencia terminal = (N) ^,,] [sitio topo-isomerasa I y RBS AAGGGAGGAG] [enlazador = (N) 1.100] [codón inicial y secuencia específica de plantilla = ATG (N) 0-100] 3 ' . Análogamente en un ejemplo relevante, pero de ninguna manera limitante, un oligo se puede usar para proporcionar una región terminal 3 ' preferida que es útil para la selección de extremo basada en topo-isomerasa I, este oligo está compuesto de: una secuencia de 1-10 bases que es convertible en un extremo pegajoso (preferiblemente mediante una topo-isomerasa I de vacuna) , y una secuencia de enlazador opcional seguida por una secuencia específica de plantilla de 0-100 bases (para facilitar el recocido con el templado en la reacción basada en polimerasa) . De este modo, de acuerdo con este ejemplo, un oligo útil (que se puede denominar un cebador inverso) puede tener la secuencia: 5' [secuencia terminal = ( )!.^] [sitio topo-isomerasa I = AAGGG] [enlazador = (N)!.^] [secuencia específica de plantilla = (N)0- Se aprecia que, la selección de extremo se puede usar para distinguir y separar las moléculas de plantilla padres (por ejemplo, que se van a someter a mutagénesis) de las moléculas de progenie (por ejemplo, generadas por mutagénesis) . Por ejemplo, un primer conjunto de cebadores, que carecen de sitio de reconocimiento de topo-isomerasa I, se puede usar para modificar las regiones terminales de las moléculas padres (por ejemplo, en la amplificación basada en polimerasa) . Un segundo conjunto diferente de cebadores (por ejemplo, que tienen un sitio de reconocimiento de topo-isomerasa I) se puede usar entonces para generar moléculas de progenie mutadas (por ejemplo, usando cualquier método de quimerización de polinucleótidos, tales como síntesis interrumpida, amplificación basada en polimerasa cambiando de plantilla, o síntesis interrumpida; o mutagénesis por saturación; o usando cualquier otro método para introducir un sitio de reconocimiento de topo-isomerasa I en una molécula de progenie mutagenizada como se describe en la presente) a partir de moléculas templadas amplificadas. El uso de selección de extremo basada en topo-isomerasa I se puede facilitar entonces, no solamente por discernimiento, sino ligación basado en topo-isomerasa I selectiva de las moléculas de progenie deseadas. El recocido de un segundo conjunto de cebadores a las moléculas padres amplificadas de este modo se puede facilitar incluyendo secuencias en un primer conjunto de cebadores (es decir, cebadores usados para amplificar un conjunto de moléculas padres) que son similares a un sitio de reconocimiento de topo-isomerasa I, aunque diferente lo suficiente para evitar el reconocimiento de enzima de topo-isomerasa I funcional. Por ejemplo, las secuencias que divergen del sitio AAGGG por cualquiera de una base a las 5 bases se puede incorporar en el primer conjunto de cebadores (para ser usado para amplificar las plantillas padres antes del sometimiento a mutagénesis) . En un aspecto específico, pero no limitante, se proporciona de este modo que una molécula padre se puede amplificar usando el siguiente conjunto ejemplar - pero de ninguna manera limitante -de cebadores hacia adelante y en reversa: Cebador hacia adelante: 5 ' CTAGAAGAGAGGAGAAAACCATG (N) 10_ Cebador de reversa: 5 ' GATCAAAGGCGCGCCTGCAGG (N) 10.1003 ' De acuerdo con este ejemplo específico del primer conjunto de cebadores, (N)10.100 representa preferiblemente una secuencia específica de plantilla de 10 a 100 nucleótidos de largo, más preferiblemente una secuencia específica de plantilla de 10 a 50 nucleótidos de largo, más preferiblemente todavía una secuencia específica de plantilla de 10 a 30 nucleótidos de largo, y aún más preferiblemente todavía una secuencia específica de plantilla de 15 a 25 nucleótidos de largo. De acuerdo con un aspecto específico', pero no limitante, se proporciona que, después de esta amplificación (usando un primer conjunto descrito de cebadores que carecen de un sitio de reconocimiento verdadero de topo-isomerasa I) , las moléculas padres amplificadas se pueden someter entonces a mutagénesis usando uno o más conjuntos de cebadores hacia adelante y en reversa que sí tienen un sitio de reconocimiento verdadero de topo-isomerasa I. En un aspecto específico, pero no limitante, se proporciona así que . una molécula padre se puede usar como plantillas para la generación de una molécula de progenie mutagenizada usando el siguiente segundo conjunto ejemplar - pero de ninguna manera limitante - de cebadores hacia adelante y en reversa : Cebador hacia adelante: 5 ' CTAGAAGGGAGGAGAAAACCATG3 ' Cebador de reversa: 5 ' GATCAAAGGCGCGCCTGCAGG3 ' (contiene la secuencia de reconocimiento AscI) . Se aprecia que cualquier número de conjuntos de cebadores diferentes no mencionados específicamente se puede usar como primero, segundo, o conjuntos posteriores de cebadores para la selección de extremo consistente con esta invención. Note que los sitios de enzima de restricción tipo II se pueden incorporar (por ejemplo, un sitio AscI en el ejemplo anterior) . Se proporciona que, además de las otras secuencias mencionadas, el experimentador puede incorporar uno o más tripletes N,N,G/T en un cebador útil con el fin de someter un polinucleótido de trabajo a mutagénesis de saturación. En resumen, el uso de un segundo y/o conjunto posterior de cebadores puede lograr metas duales de introducir un sitio de topo-isomerasa I de mutaciones de generación en un polinucleótido de progenie. De este modo, de acuerdo con un uso proporcionado, un marcador de selección de extremo útil es un sitio de reconocimiento de enzima que permite que una enzima se disocie (incluyendo muesca) un polinucleótido en un sitio específico, para producir una desnaturalización después del extremo compatible con ligación de un oligo de cadena simple generado. La ligación del extremo polinucleótido producido se puede entonces llevar a cabo mediante la misma enzima (por ejemplo, en el caso de la topo-isomerasa I del virus de vacuna) , o alternativamente, con el uso de una enzima diferente. De acuerdo con un aspecto de esta invención, cualquier marcador de selección de extremo útil, ya sea igual (por ejemplo, dos sitios de reconocimiento de topo-isomerasa I de virus de vacuna) o diferente (por ejemplo, un sitio de reconocimiento de enzima de restricción de clase II y un sitio de reconocimiento de topo-isomerasa I del virus de vacuna) se puede usar en combinación para seleccionar un polinucleotido. Cada polinucleotido seleccionable puede entonces tener uno o más marcadores de selección de extremo, y ellos pueden ser parecidos o no parecidos marcadores de selección de extremo. En un aspecto particular, una pluralidad de marcadores de selección de extremo se pueden localizar en un extremo de un polinucleotido y pueden tener secuencias de traslape entre sí. Es importante dar énfasis en que cualquier número de enzimas, ya sea actualmente en existencia o para ser desarrolladas, pueden ser útiles en la selección de extremo de acuerdo con esta invención. Por ejemplo, en un aspecto particular de esta invención, una enzima de muesca (por ejemplo, N.BstNB I, que disocia solamente una cadena en 5 ' ... GAGTCNNN /N...3 ' ) se puede usar junto con una fuente de actividad de ligación de polinucleó-tido con el fin de lograr la selección de extremo. De acuerdo con esta modalidad, un sitio de reconocimiento para N. BstN BI -en vez de un sitio de reconocimiento para la topo-isomerasa I -deberá incorporarse en un polinucleotido de selección de extremo (ya sea que la selección de extremo se use para la selección de una molécula de progenie mutagenizada o si la selección de extremo se usa aparte de cualquier procedimiento de mutagénesis) . Se aprecia que el enfoque de selección de extremo descrito presentemente usando formación de muescas y ligación basada en topo-isomerasa tiene varias ventajas sobre los métodos de selección disponibles anteriormente. En suma, este enfoque permite que uno encuentre la clonación de dirección (incluyendo la clonación de expresión) . Específicamente, este enfoque se puede usar para el logro de: ligación directa (es decir, sin sometimiento a reacción de ligación purificación restricción clásica que es susceptible a una multitud de problemas potenciales a partir de una reacción de restricción inicial a una reacción de ligación dependiente del uso de ligasa de ADN T4; la separación de moléculas de progenie de las moléculas de plantilla original (por ejemplo, moléculas de plantilla original que carecen de sitios de topo-isomerasa I que no se introdujeron hasta después de la mutagénesis) , se resuelve la necesidad de los pasos de separación de tamaño (por ejemplo, mediante cromatogra ía en gel o mediante otros medios electrofo-réticos o mediante el uso de membranas de exclusión de tamaños) , la preservación de secuencias internas (aún cuando estén presentes sitios de topo-isomerasa I) , la solución de problemas acerca de reacciones de ligación sin éxito (por ejemplo, dependientes del uso de ligasa de ADN T4, particularmente en la presencia de actividad de enzima de restricción residual no deseada) , y clonación de expresión facilitada (incluyendo solución de problemas de cambio de marco) . Las preocupaciones acerca de disociaciones basadas en enzima de restricción no deseada - especialmente en sitios de restricción internos (o aún en sitios frecuentemente no predecibles de actividad de estrella no deseada) en un polinucleótido de trabajo - que son sitios potenciales de destrucción de un polinucleótido de trabajo también se pueden resolver mediante el enfoque de selección final descrito presentemente usando muescas y ligación basada en topo-isomerasa . Ensayos de Selección basada en Dos Híbridos El mezclado también se puede usar para diversificar recombinatoriamente un depósito de miembros de biblioteca seleccionados obtenidos mediante la selección de sistema de selección de dos híbridos para identificar miembros de biblioteca que se enlazan con una secuencia de polipéptido predeterminado. Los miembros de biblioteca seleccionados se depositan y se mezclan mediante recombinación in vitro y/o en vivo. El depósito mezclado se puede entonces seleccionar en un sistema de dos híbridos de levadura para seleccionar miembros de biblioteca que enlazan la secuencia de polipéptido predeterminada (por ejemplo, y dominio SH2) o la cual enlaza una secuencia de polipéptido predeterminada alternativa (por ejemplo, un dominio SH2 de otra especie de proteínas) . Un enfoque para identificar secuencias de polipéptidos desenlazan a una secuencia de polipéptido predeterminada ha sido usar un sistema denominado de "dos híbridos" en donde la secuencia de polipéptidos predeterminada está presente en una proteína de fusión (Chien y colaboradores, 1991). Este enfoque identifica las interacciones proteína-proteína en vivo a través de la reconstitución de un operador de transcripción (Fields y Song, 1989), la proteína de transcripción Gal4 de levadura. Típicamente, el método se basa en las propiedades de la proteína Gal4 de levadura, que consiste en dominios separables responsables del enlace de ADN y la activación de la transcripción. Los polinucleótidos que codifican dos proteínas híbridas, uno consistente del dominio de enlace del ADN Gal4 de levadura fusionado a una secuencia de polipéptidos de una proteína conocida, y la otra consistente en el dominio de activación de Gal4 fusionado a una secuencia de polipéptidos de una segunda proteína, se construyen e introducen en una célula hospedera de levadura. El enlace intermolecular entre las dos proteínas de fusión reconstituye el dominio de enlace de ADN Gal4 con el dominio de activación Gal4, que conduce a la activación de transcripción de un gen reportero (por ejemplo, la.cz, HIS3) que está operablemente enlazado con el sitio de enlace Gal4. Típicamente, el método de dos híbridos se usa para identificar las secuencias de polipéptidos novedosas que interactúan con la proteína conocida (Silver y Hunt, 1993; Durfee y colaboradores, 1993; Yang y colaboradores, 1992; Luban y colaboradores, 1993; Hardy y colaboradores, 1992; Barteel y colaboradores, 1993; y Vojtek y colaboradores, 1993) . Sin embargo, las variaciones del método de dos híbridos se han usado para identificar mutaciones de una proteína conocida que afecta su enlace con una segunda proteína conocida (Li y Fields, 1993; Lalo y colaboradores, 1993; Jackson y colaboradores, 1993; y Madura y colaboradores, 1993) . Se han usado sistemas de dos híbridos para identificar los dominios estructurales de interacción de dos proteínas conocidas (Bardwell y colaboradores, 1993; Chakrabarty y colaboradores, 1992; Staudinger y colaboradores, 1993; y Hilne y Weaver 1993) o los dominios responsables de la oligomerización de una sola proteína (Iwabuchi y colaboradores, 1993; Bogerd y colaboradores, 1993) . Las variaciones de sistemas de dos híbridos se han usado para estudiar la actividad en vivo de una enzima proteolítica (Dasmahapatra y colaboradores, 1992) . De manera alternativa, un sistema de selección interactiva de E. coli/BCCP (Germino y colaboradores, 1993; Guarente, 1993) se puede usar para identificar las secuencias de proteína de interacción (es decir, secuencias de proteínas que hetero-dimerizan o forman hetero-multímeros de orden superior) . Las secuencias seleccionadas por un sistema de dos híbridos se pueden depositar y mezclar e introducir en un sistema de dos híbridos para una o más rondas posteriores de selección para identificar secuencias de polipéptidos que se enlazan con híbridos que contienen la secuencia de enlace predeterminado. La secuencias así identificadas se pueden comparar para identificar la o las secuencias de consenso y los núcleos de secuencias de consensos. En general, las técnicas estándares de tecnología de ADN de recombinación se describen en distintas publicaciones (por ejemplo, Sambrook y colaboradores, 1989; Ausubel y colaboradores, 1987; y Berger y Kimmel, 1987), cada una de las cuales se incorporan en la presente por entero mediante referencia. Las enzimas de modificación de polinucleótidos se usaron de acuerdo con las recomendaciones del fabricante. Los oligonucleótidos se sintetizaron en un sintetizador de ADN modelo 394 de Applied Biosystems Inc. usando productos químicos ABI . Si se desea, los amplímeros de reacción en cadena de polimerasa para amplificar una secuencia de ADN predeterminada se pueden seleccionar a la discreción del practicante. Muestras de un microgramo de ADN de plantillas se obtuvieron y trataron con luz ultravioleta para causar la formación de dímeros, incluyendo dímeros TT, particularmente dímeros de purina. La exposición a ultravioleta se limitó de manera que solamente algunos fotoproductos se generaron por gen sobre la muestra de ADN de plantilla. Múltiples muestras se trataron con luz ultravioleta durante varios períodos de tiempo para obtener muestras de ADN de plantilla con números variantes de dímeros para la exposición a ultravioleta . Un juego de iniciación aleatorio que utiliza una polimerasa no a prueba de lectura (por ejemplo, Prime- It II Random Primer Labeling kit por Stratagene Cloning Systems) se utilizó para generar polinucleótidos de tamaño diferente iniciando en sitios aleatorios sobre plantillas que se prepararon mediante luz ultravioleta (como se describió anteriormente) y que se extendieron a lo largo de las plantillas. Los protocolos de iniciación tales como los descritos en el juego Prime-It II Random Primer Labeling kit se pueden utilizar para extender los cebadores. Los dímeros formados por exposición ultravioleta sirven como un bloque de carretera para la extensión de una polimerasa no a prueba de lectura. De este modo, un depósito de polinucleótidos de tamaño aleatorios está presente después de que la extensión con los cebadores aleatorios termina. La presente invención se dirige a demás a un método para generar una secuencia de polinucleótidos mutante seleccionada (sobre una población de secuencias de polinucleótidos seleccionadas) típicamente en forma de polinucleótidos amplificados y/o clonados, mediante el cual la o las secuencias de polinucleótidos seleccionadas poseen cuando menos una característica fenotípica deseada (por ejemplo, codifica un polipéptido, promueve la transcripción de polinucleótidos enlazados, enlaza una proteína, y similares) que se puede seleccionar. Un método para identificar polipéptidos híbridos que poseen una estructura deseada o propiedad funcional, tal como el enlace con una macromolécula biológica predeterminada (por ejemplo, un receptor) , e involucra la selección de una biblioteca grande de polipéptidos para miembros de biblioteca individuales que poseen la estructura deseada o la propiedad funcional conferida por la secuencia de aminoácidos del polipéptido. Una modalidad como la presente invención proporciona un método para generar bibliotecas de polipéptidos desplegados o anticuerpos desplegados convenientes para selección por interacción, por afinidad o selección de fenotipo. El método comprende (1) obtener una primera pluralidad de miembros de biblioteca seleccionada que comprende un polipéptido desplegado o anticuerpo desplegado y un polinucleótido asociado que codifica al polipéptido desplegado al anticuerpo desplegado, y obtener los polinucleótidos asociados o copias de los mismos en donde los polinucleótidos asociados comprenden una región de secuencias sustan-cialmente idénticas, introduciendo óptimamente mutaciones en los polinucleótidos o copias, (2) combinar los polinucleótidos o copias, (3) producir polinucleótidos más pequeños o más cortos interrumpiendo un proceso de iniciación o síntesis particularizada o aleatorio o un proceso de amplificación, y (4) realizar amplificación, preferiblemente amplificación por reacción de cadena de polimerasa, y opcionalmente mutagénesis para recombinar homólogamente los polinucleótidos nuevamente sintetizados. Es un objeto particularmente preferido de la invención proporcionar un proceso para producir polinucleótidos híbridos que expresan un polipéptido híbrido útil mediante una serie de pasos que comprenden: (a) producir polinucleótidos interrumpiendo un proceso de amplificación o síntesis de polinucleótidos con un medio para bloquear o interrumpir el proceso de amplificación o de síntesis y así proporcionar una pluralidad de polinucleótidos más pequeños o más cortos debido a la replica del polinucleótido que está en varias capas de consumación; (b) añadir a la población resultante de polinucleótidos de cadena simple o doble uno o más oligonucleótidos de cadenas simple o doble, en donde los oligonucleótidos añadidos comprenden un área de identidad en un área de heterología con uno o más polinucleótidos de cadena simple o doble de la población; (c) desnaturalizar los oligonucleótidos de cadena simple o doble resultantes para producir una mezcla de polinucleótidos de cadena simple, opcionalmente separando los polinucleótidos más cortos o más pequeños en depósitos de polinucleótidos que tiene varias longitudes y después opcionalmente someter a estos polinucleótidos a un procedimiento de reacción en cadena de polimerasa para amplificar uno o más oligonucleótidos compuestos por cuando menos uno de estos depósitos de polinucleótidos; (d) incubar una pluralidad de estos polinucleótidos o cuando menos un depósito de estos polinucleótidos con una polimerasa bajo condiciones que dan como resultado el recorrido de los polinucleótidos de cadena simple en regiones de identidad entre los polinucleótidos de cadena simple y así formar una cadena de polinucleótidos de cadena doble mutagenizada; (e) repetir opcionalmente los pasos (c) y (d) ; (f) expresar cuando menos un polipéptido híbrido a partir de una cadena de polinucleótido, o cadenas,- (g) seleccionar cuando menos un polipéptido híbrido por una actividad útil. En un aspecto preferido de la invención, el medio para bloquear o interrumpir la amplificación o el proceso de síntesis es mediante la utilización de luz ultravioleta, aductos de ADN, proteínas de enlace de ADN. En una modalidad de la invención, los aductos de ADN, o polinucleótidos que comprenden los aductos de ADN, se remueven de los polinucleótidos o del depósito de polinucleótidos, tal como mediante un proceso que incluye calentar la solución que comprende fragmentos de ADN antes de procesamiento adicional . Habiendo así descrito modalidades ejemplares de la presente invención, deberá notarse por los técnicos en la materia que las descripciones son ejemplares solamente y que varias otras alternativas, adaptaciones y modificaciones se pueden hacer dentro del alcance de la presente invención. De conformidad con lo anterior, la presente invención no se limita a las modalidades específicas que se ilustran en la presente. Sin elaboración adicional, se cree que un aspecto en la técnica puede usando la descripción anterior, utilizar la presente invención en toda su extensión. Los siguientes ejemplos se considerarán ilustrativos y de este modo no limitantes del resto de la descripción de ningún modo. Ejemplo 1 Fotoproductos Inducidos con Ultravioleta Muestras de un microgramo de ADN de plantilla se obtuvieron y trataron con luz ultravioleta para causar la formación de dímeros, incluyendo dímeros TT, particularmente dímeros de purina . La exposición a ultravioleta se limita de manera que solamente algunos fotoproductos son generados por gen en la muestra de ADN de plantilla. Múltiples muestras se trataron con luz ultravioleta durante varios períodos de tiempo para obtener muestras de ADN de plantilla con números variantes de dímeros a partir de la exposición a ultravioleta. Un juego de iniciación aleatoria utiliza una polimerasa no a prueba de lectura (por ejemplo, Prime- It II Random Primer Labeling kit by Stratagene cloning Systems) se utiliza para generar polinucleótidos de diferentes tamaños iniciando en sitios aleatorios en plantillas que preparan con luz ultravioleta (como se describe anteriormente) y se extienden a lo largo de las plantillas. Los protocolos de iniciación tal como se describen en el juego Prime-It II Random Primer Labeling kit se pueden utilizar para extender los cebadores. Los dímeros formados por exposición con ultravioleta sirven como un bloque de camino para la extensión mediante la polimerasa no a prueba de lectura. De este modo un depósito de polinucleótidos de tamaño aleatorio se presentan después de que la extensión con los cebadores aleatorios termina. Eiemolo 2 Aislamiento de Polinucleótidos de Tamaño Aleatorio Los polinucleótidos de interés que se generan de acuerdo con el Ejemplo 1 se aislan en gel, en un gel de agarosa al 1.5 por ciento. Los polinucleótidos en el rango de 100-300 para cebases se cortan de gel y tres volúmenes de 6 M Nal se añaden a la rebanada de gel. La mezcla se incuba a 50°C durante 10 minutos y ??µ? de leche de vidrio (Bio 101) se añade. La mezcla se arremolina durante 1 minuto y el sobrenadante se decanta. El aglomerado se lava con 500µ1 de Column Wash (el Column Wash es 50 por ciento etanol, lOmM Tris-HICpH7.5 , 100 mM NaCl y 2.5 mM EDTA) y se arremolinan durante 1 minuto y después de lo cual se decanta el sobrenadante. El lavado, el remolino y los pasos de decantado se repiten entonces . El aglomerado de leche de vidrio se re-suspende en 20 µ? de H20 y centrifugan durante 1 minuto. El ADN permanece en la parte acuosa. Ejemplo 3 Mezcla de Polinucleótidos de 100-300 Pares de Bases de Tamaño Aleatorios Aislados Los polinucleótidos de 100-300 pares de bases obtenidos en el Ejemplo 2 se recombinan en una muestra recocido (0.2mM cada dNTP, 2.2 mM MgCl2, 50 mM KC1 , 10 mM Tris-HClpH 8.8, 0.1% Tritón X-100, 0.3µ,· Taq DNA polimerasa, 50µ1 de volumen total) sin añadir cebadores. Se usó una Robocycler por Stratagene para el paso de recocido con el siguiente programa: 95°C durante 30 segundos, 25-50 ciclos de [95°C por 30 segundos, 50-60°C (preferiblemente 58°C) durante 30 segundos, y 72 °C durante 30 segundos] y 5 minutos a 72°C. De este modo, los polinucleótidos de 100-300 pares de bases se combinan para producir polinucleótidos de cadena doble que tienen una secuencia más larga. Después de separar los polinucleótidos de cadena doble re-ensamblados y desnaturalizarlos para formar polinucleótidos de cadena simple, el ciclo se repite opcionalmente de nuevo con algunas muestras utilizando las cadenas simples como plantilla y ADN cebador y otras muestras se utilizan cebadores aleatorios además de las cadenas simples. Ejemplo 4 Selección de Polipéptidos a partir de polinucleótidos Mezclados Los polinucleótidos del Ejemplo 3 se comparan y los polipéptidos se expresan a partir de los mismos. El ADN de plantilla original se utiliza como un control comparativo obteniendo polipéptidos comparativos a partir del mismo. Los polipéptidos obtenidos de los polinucleótidos mezclados del Ejemplo 3 se seleccionan por actividad de los polipéptidos obtenida de plantilla y se compara con los niveles de actividad del control. Los polinucleótidos mezclados que codifican polipéptidos interesantes descubiertos durante la selección se comparan adicionalmente para determinar rasgos deseables secundarios. Algunos polinucleótidos mezclados correspondientes a los polipéptidos seleccionados menos interesantes se someten a re-mezclado .
Eiemolo 5 Evolución Dirigida de un Enzima mediante Mutaqénesia de Saturación Mutagénesis de Saturación en el Sitio: Para llevar a cabo la mutagénesis de saturación en el sitio cada residuo (316) de una enzima deshalogenasa se convirtió en los 20 aminoácidos mediante mutagénesis dirigida al sitio usando cebadores de oligonucleótidos degenerados 32 veces como sigue: 1. Un cultivo de construcción de expresión deshalogenasa y se hizo una preparación del plásmido. 2. Se hicieron cebadores para aleatorizar cada codón -tienen la estructura común X20NN (G/T) X20. 3. Una mezcla de reacción de 25 µ? se preparó que contenía aproximadamente 50 ng de la plantilla de plásmido, 125 ng de cada cebador, IX de regulador Pfu natural, 200 µ? de cada dNTP y 2.5 U de polimerasa de ADN Pfu natural. 4. La reacción se cicló en un Robo96 Gradient Cycler como sigue: Desnaturalización inicial a 95°C durante 1 minuto 20 ciclos de 95°C durante 45 segundos, 53 °C por 1 minuto y 72 °C durante 11 minutos Paso de estiramiento final de 72 °C durante 10 minutos . La mezcla de la reacción se infirió con 10 Udpnl a 37°C durante 1 hora para digerir el ADN de plantilla metilado. 6. Dos ul de la mezcla de la reacción se usan para transformar 50 ul de células XLl-Blue y la mezcla de transformación entera se plateó en una placa grande LB-Amp-Met produciendo 200-1000 colonias. 7. Las colonias individuales se recogieron con palillos en pozos de placas de microtitulación de 96 pozos que contenían LB-Amp-IPTG y se cultivaron durante la noche. 8. Las clonas de estas placas se probaron al siguiente día . Selección: Aproximadamente 200 clonas de mutantes de cada posición se cultivaron en medio líquido (placas de microtitulación de 384 pozos) y se seleccionaron como sigue: 1. Los cultivos durante la noche en las placas de 384 pozos se centrifugaron y el medio se revolvió. A cada pozo se añadieron 0.06 mL 1 mM Tris/S042"pH 7.8. 2. Se hicieron dos placas de ensayo para cada placa de cultivo padre consistiendo en 0.02 mL de suspensión celular. 3. Una placa de ensayo se colocó a temperatura ambiente y la otra a temperatura elevada (la selección inicial usó 55°C) durante un período de tiempo (inicialmente 30 minutos) 4. Después del tiempo prescrito 0.08 mM sustrato de temperatura ambiente (TCP saturado 1 mM Tris/S042"pH 7.8 con 1.5 mM NaN3 y 0.1 mM de azul bromotimol) se añadió a cada pozo. 5. Mediciones a 620 nm se tomaron en varios puntos de tiempo para generar una curva de progreso para cada pozo. 6. Los datos se analizaron y la cinética de las células se calentaron y se compararon con las aquellas no calentadas. Cada placa que contenía 1-2 columnas (24 pozos) de controles 20F12 o untados. 7. Los pozos que parecían haber mejorado la estabilidad se re-cultivaron y se probaron bajo las mismas condiciones. Después de este procedimiento nueve mutaciones de un solo sitio parecieron conferir estabilidad térmica aumentada en la enzima. El análisis de secuencia se realizó para determinar los cambios de aminoácidos exactos en cada posición que eran específicamente responsables del mejoramiento. En suma, el mejoramiento se confirió en siete sitios por un solo cambio de aminoácidos, en un octavo sitio por cada uno de los cambios de aminoácidos, y en un noveno sitio por cada uno de tres cambios de aminoácido. Algunos imitantes se hicieron teniendo cada uno una pluralidad de estas nueve mutaciones en sitio benéficas en combinación; de estas dos mutantes demostraron ser superiores a todos los otros mutantes, incluyendo aquellas con mutaciones de un solo punto. Ejemplo 6 Clonación de Expresión Directa Usando Selección Final Un gen esterasa se amplificó usando cebadores 5' fosforilados en una reacción de cadena de polimerasa estándar (10 ng plantilla; condiciones de PCR: 3'94C; [1'94C; 1'50C; 1' 30"68C]x30; 10'68C. Cebador delantero=9511 TopF (CTAGAAGGGAGGAGAATTACATGAAGCGGCTTTTAGCCC) Cebador inverso=9511 TopR (AGCTAAGGGTCAAGGCCGCACCCGAGG) El producto de reacción de cadena de polimerasa resultante (aproximadamente 1000 pares de bases) se purificó en gel y se cuantificó. Un vector para la clonación de expresión, pASK3 (Institut fuer Bioanalytik, Goettingen, Alemania), se cortó con Xba I y Bgl II y se desfoforiló con CIP. 0.5 pmoles de un topo-isomerasa I de vacuna (Invitro-gen, Carlsbad, CA) se añadió a 60 ng (aproximadamente 0.1 pmoles) se purificó con producto de reacción de cadena de polimerasa durante 5'37C en solución reguladora NEB I (New England Biolabs, Beverly, MA) en un volumen total de 5 µ? . El producto de reacción de cadena de polimerasa topogado se clonó en el vector pASK3 (5 µ?, aproximadamente 200 ng en NEB I) para 5' a temperatura ambiente. Esta mezcla se dializó contra H20 durante 30 minutos. Se usaron 2 µ? para electro- incorporación de células DH10B (Gibco BRL, Gaithersburg, MD) . Eficiencia: Basados en los números de clonas reales, este método puede producir 2 x 106 clonas por µg de vector. Todos los recombinantes probados mostraron actividad esterasa después de la inducción con anhidrotetraciclina. Ejemplo 7 Estabilidad Térmica Deshaloaenasa Esta invención proporciona que una propiedad deseable que se va a generar mediante la evolución dirigida se ejemplifica de una manera limitante mediante una actividad residual mejorada (por ejemplo una actividad enzimática, una inmuno-reactividad, una actividad antibiótica, etcétera) de una molécula después de someterla a un ambiente alterado, incluyendo lo que se considera un ambiente áspero, mediante un tiempo específico. Este ambiente áspero puede comprende cualquier combinación de lo siguiente (iterativamente o no, y en cualquier orden o permutación) : una temperatura elevada (incluyendo una temperatura que puede causar la desnaturalización en una enzima de trabajo) , una temperatura disminuida, una salinidad elevada, una salinidad disminuida, un pH elevado, un pH disminuido, una presión elevada, una presión disminuida, y un cambio en la exposición a la fuente de radiación (incluyendo radiación ultravioleta, luz visible, así como al espectro electromagnético entero) . El siguiente ejemplo muestra una aplicación de evolución dirigida para evolucionar la capacidad de una enzima para evolucionar y/o retener la afinidad después de la exposición a una temperatura elevada. Todo residuo (316) de una enzima deshalogenasa se convirtió en los 20 aminoácidos mediante mutagénesis dirigida al sitio usando cebadores de oligonucleótidos degenerados 32 veces. Estas mutaciones se introdujeron en el variante de régimen mejorado ya Dhla 20F12. Aproximadamente 200 clonas de cada posición se cultivaron en medio líquido (placas de microtitula-ción de 384 pozos) para ser seleccionados. El procedimiento de selección es el siguiente: 1. Los cultivos durante la noche y placas de 384 pozos se centrifugaron conforme el medio se revolvió. A cada pozo se añadieron 0.06 mL 1 mM Tris/S042"pH 7.8. 2. El robot hizo 2 placas de ensayo de cada placa de cultivo padre consistente en una suspensión de células de 0.02 mL . 3. Una placa de ensayo se colocó a temperatura ambiente y la otra a temperatura elevada (la selección inicial usó 55°C) durante un período de tiempo (inicialmente 30 minutos) . 4. Después del tiempo prescrito 0.08 mL de sustrato a temperatura ambiente (TCP saturado 1 mM Tris/S042"pH 7.8 con 1.5 mM NaN3 y 0.1 mM de azul bromotimol) se añadió a cada pozo. TCP=tricloropropano . 5. Las mediciones a 620 nm se tomaron en varios puntos de tiempo para generar una curva de progreso para cada pozo. 6. Los datos se analizaron y las cinéticas de las células calentadas contra aquellas no calentadas se compararon. Cada placa contenía 1-2 columnas (24 pozos) de controles 20F12 no mutados . 7. Los pozos que parecían haber tener estabilidad mejorada se re-cultivaron y probaron bajo las mismas condiciones. Siguiendo este procedimiento aparecieron nueve mutaciones en sitio únicas para conferir estabilidad térmica fomentada sobre Dhla-20F12. El análisis de secuencia mostró que los siguientes cambios fueron benéficos: D89G F91S T159L G189Q,G189V I220L N238T W251Y P302A, P302L, P302S, P302K P302R/S306R Solamente dos sitios (189 y 302) tuvieron más de una sustitución. Los primeros 5 en la lista se combinaron (usando G189Q) en un solo gen (este imitante se conoce "Dhla5") . Todos los cambios menos S306R se incorporaron en otra variante conocida como Dhla8. La estabilidad térmica se valoró incubando la enzima a temperatura elevada (55°C y 80°C) durante algún el ensayo de actividad a 30°C. Las regímenes iniciales se graficaron contra el tiempo a temperatura más alta. La enzima estuvo en 50 mM Tris/S04pH 7.8 para la incubación como el ensayo. El producto (Cl) se detectó mediante un método estándar usando Fe(N03)3 y HgSCN . Se usó Dhla 20F12 como el tipo natural de hecho. La vida media aparente (T1/2) se calculó ajustando los datos a una función de desintegración exponencial. Los resultados se muestran en la Figura Literatura Citada A menos que se indique lo contrario, todas las referencias citadas en la presente (antes y después) son incorporadas por referencia en su totalidad. Barret A.J. y colaboradores, editores: Enzyme Nomenclature: Recomendations of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology. San Diego: Academic Press, Inc., 1992. Boyce, Col, editor: Novo's Handbook of Practical Biotechno-logy. 2a ed. , Bagsvaerd, Dinamarca 1986. Drauz K, Wladman H, eds . : Enzyme Catalysis in Organic Synthesis; a Comprehensive Handbook. Vol . . New York: VCH Publishers, 1995. Drauz K, Waldman H. , editores: Enzyme Catalysis in Organic Synthesis: A Comprehensive Handbook. Vol 2. New York. VCH Publishers, 1995. Foster GD, Taylor SC, editores: Plant Virology Protocols: From Virus Isolation to Transgenic Resistance. Methods in Molecular Biology , Vol. 81, New Jersey, Humana Press Inc., 1998.
Frank F., editor: Protein Biotechnology : Isolation, Characterization, and Stabilization. New Jersey, Humana Press Inc., 1993. Godfrey T . , West S., editores: Industrial Enzymology. 2a ed. Londres, Macmillan Press Ltd, 1996. Gottschalk G: Bacterial Metabolism. 2a ed. , New York, Springer-Verlag Inc., 1986. Gresshoff, PM, editor: Technology Transfer of Plant Biotechnology . Current Topics in Plant Molecular Biology. Boca Ratón, CRC Press, 1997. Griffin HG, Griffin AM, editores: PCR Technology: Current Innovations. Boca Ratón, CRC Press Inc., 1994. Hansen G. Chilton, MD: Lessons in gene transfer to plants by a gifted microbe. Curr Top Microbiol Immunol 240:21-57, 1999. Hartman HT, y colaboradores: Plant Propagation: Principies and Practices. 6a ed., New Jersey; Prentice Hall, Inc., 1997. Perun TJ, Propst CL, editores: Computer-Aided Drug Design; Methods and Applications. New York, Marcel Dekker, Inc. 1989. Owen MRL, Pen J: Transgenic Plants: A Production System for Industrial and Pharmaceutical proteins . Chichester; John Wiley fi. Sons, 1996. Segel IH: Enzyme Kinetics; Behavior and Analysis of Rapid Equilibrium and Steady-State Enzyme Systems. New York, John Wiley £¿ Sons, Inc. 1993. White JS, White DC: Source Book af Enzymes: Boca Ratón, CRC Press, 1997. Wong CH, Whitesides GM: Enzymes in Synthetic Organic Chemistry. Vol . 12. New York, Elsevier Science Publications, 1995. WO 97/35966; presentada 20 de marzo de 1997, publicada 2 de octubre de 1997. Minshull J. Stemmer WP: Methods and Compositions for Cellular and Metabolic Engineering. WO 98/31837; presentada 16 de enero de 1998, publicada 23 de julio de 1998. Delcardayre SB, Tobin MB, Stemmer P, Minshull, J: Evolution of Whole Cells and Organisms by Recursive Sequence Recombination . WO 98/37223; presentada 18 de febrero de 1998, publicada 27 de agosto de 1998. Pang SZ, Gonsalves D, Jan FJ: DNA Construct to Confer Múltiple Traits on Plants. Alting-Mecs MA y Short JM: Polycos vectors: a system for packing filamentous phage and phagemid vectors using lambda phage packaging extracts. Gene 137:1, 93-100, 1993. Arkin AP y Youvan DC: An algorithm for protein engineering: simulations of recursive ensemble mutagenesis. Proc Nati Acad Sci USA 89(16): 7811-7815, (15 de agosto) 1992. Arnold FH: Protein engineering for unusual environments . Current Opinión in Biotechnology 4 (4) :450-455, 1993. Ausubel FM, y colaboradores, editores, Current Protocols in Molecular Biology, Vols. 1 and 2 and suplementos (también conocidos como "The Red Book") Greene Publishing Assoc, Brooklyn, NY, ®1987. Ausubel FM, y colaboradores, editores. Current Protocols in Molecular Biology, Vols. 1 and 2 and suplementos, (también conocido como "The Red Book") Greene Publishing Assoc. , Brooklyn, NY, ®1989. Ausubel FM, y colaboradores, editores. Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocole in Molecular Biology. Greene Publishing Assoc, Brooklyn, NY, ®1989. Ausubel FM, y colaboradores, editores, Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 2a edición. Greene Publishing Assoc., Brooklyn, NY, ®1992. Barbas CF 3d, Bain JD, Hoekstra DM, Lerner RA: Semisynthetic combinatorial antibody libraries: a chemical solution to the diversity problem. Proc Nati Acad Sci USA 89(10) :4457-4461, 1992.
Bardwell J, Bardwell L, Johnson DK, Friedberg EC: Yeast DNA recombination and repair proteins Radl and RadlO a complex in vivo mediated by localized hydrophobic domains. Mol Microbiol 8 (6) :1177-1188, 1993. Bartel P, Chien CT, Sternglanz R. Fields S: Elimination of false positives that arise in using the t o-hybrid system. Biotecniques 14 (6) :920-924, 1993. Beaudry AA y Joyce GF: Directed evolution of an RNA enzyme. Science 257 (5070) :635-641, 1992. Berger y Kimmel, Methods in Enzymology, Volumen 152, Guide to Molecular Cloning Techniques. Academic press, Inc., San Diego, CA ®1987. (Cumulative Subject Index: Volúmenes 135-139, 141-1S7, 1990, 272 pp.) Bevan M: Binary Agrobacterium vectors for plant transforma-tion. Nucleic Acids Research 12 (22) :8711-21, 1994.
Biocca S, Pieranderi-Amaldi P, Cattaneo A: Intracellular expression of anti-p21ras single chain Fv fragments inhibits meiotic maturation of xenopus oocytes . Biochem Biophys Res Commun 197 (2) :422-427 , 1993. Bird y colaboradores, Plant Mol Biol 11:651, 1998. Bogered HP, Fridell RA, Blair WS, Cullen BR: Genetic evidence that the Tat proteins of human immunodeficiency virus types 1 and 2 can multimerize in the eukaryotic cell nucleus. J Virol 67 (8) ¡5030-5034, 1993. Brederode FT, Koper-Za rthoff EC, Bol JF: Complete nucleoti-de sequence of alfalfa mosaic virus RNA 4. Nucleic Acids Research 8 (10) :2213-23, 1980. Breitling F, Double S, Seehaus T, Klewinghaus I, Little M: A surface expression vector for antibody screening. Gene 104 (2) .147-153, 1991. Brown NL, Smith M: Cleavage specificity of the restriction endonuclease isolated from Heamophilus gallinarum (Hga I) . Proc Nati Acad Sci U S A 74(8) :3213-6, (agosto) 1997. Burton DR. Barbas CF 3d, Presson MA, koening S, Chanock RM, Lerner RA: A large array of human monoclonal antibodies to type 1 human immunodeficiency virus from combinational libraries of asymptomatic seropositive individual. Proc Nati Acad Sci U S A 88 (22) :10134-7. (nov 15) 1991. Caldwell RC y Joyce GF: Randomization of genes by PCR mutagenesis. PCR Methods Appl 2(10) :28-33, 1992.
Catón AJ y Kopro ski H: Influenze virus hemagglutinin-specific antibodies isolated from a combinatorial expression library are closely to the immune response of the donor. Proc Nati Acad Sci USA 87 (16) :6450-5454, 1990. Chakraborty T, Martin JF, Olson EN: Analysis of the oligomerization of myogenin and E2A products in vivo using a two-hybrid assay system. J Biol Chem 267(25:1748-501, 1992. Chang CN, Landolfi NF, queen C: Expression of antibody Fab domains on bacteriophage surfaces . Protential use for antibody selection. J Immunol 147 (10) : 3610-4 , (nov 15) 1991. Chaudhary VK, Batra JK, Gallo MG, Willmingham MC, FitzGerald DJ, Pastan I: A rapid method of cloning functional variable-región antibody genes in Escherichia coli as single-chain immunotoxins . Proc Nati Acad Sci USA 87(3) : 1066-1070, 1990. Chien CT, Bratel PL, Sternglanz R. , Fields S: The two-hybrid system: a method to identify and clone genes for proteins that interact with a protein of interest. Proc Nati Acad Sci USA 88 (21) :9578-9582, 1991. Chiswell DJ, McCafferty J: Phage antibodies: will new 1 coliclonal' antibodies replace monoclonal antibodies? Trends Biotechno 10(3):80-84, 1992. Chothia C and Lesk AM: Canonical structures for the hypervariable regions of immunoglobulins. J Mol Biol 196)4) :901-917, 1987.
Chothia C, Lesk A ; Tramontano A, Levnitt M, Smith-Gill SJ, Air G, Sheriff S, Padlan EA, Davies D, Tulip WR, y colaboradores: Confortnations of immunoglobulin hypervariable regions . Nature 342 (6252) :877-883, 1989. Clackson T, Hoogenboom HR, Griffiths AD, Winter G. Making antibody fragmenta using phage display librarles. Nature 352 (6336) :624-628, 1991. Conrad M. Topal D: DNA and spermidine provide a switch mechanism to regúlate the activity of restriction enzyme Nae I . Proc Acad Sci USA 85 (24) : 9707-11, (dic) 1989. Coruzzi G, Broglie R, Edwards C, Chua NH: Tissue-specific and light-regulated expression of a pea nuclear gene encoding the small subunit of ribulose-1, 5- bisphosphate carboxylase. EMBO J 3 (8) :1671-19, 1984. Dasmahapatra B, DiDomenico B, Dwyer S, Ma J, Sadowski I, Schwartz J: A genetic system for studying the activity of a proteolytic enzyme. Proc Nati Acad Sci USA 89(9) :4159-4162, 1992.
Davis LG, Dibner MD, Batter JF. Basic Methods in Molecular Biology. Elsevier, New York, NY, ®1986. Delegrave S y Youvan DC, Biotechnology Research 11:1548-1552, 1993. DeLong EF, Wu KY, Prezelin BB, Jovine RV: High abundance of Archaea in Anarctic marine picoplankton. Nature 371 (6499) : 695-697, 1994.
Deng SJ, MacKenzie Cr, Sadowska J. Michniewicz J. Young N , Bundle Dr, Narang SA: Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display. J Biol Chem 269 (13) : 9533-9538, 1994. Duan L, Bagasra 0, Laughlin MA, Oakes JW, Pomerantz RJ: Proteny inhibition of human immunodeficiency virus type 1 replication by an intracellular anti-Rev single-chain antibody. Proc Nati Acad Sci USA 91 (11) : 5075-5079 , 1994. Durfee T, Becherer K, Chen PL, Yeh Sh, Yang Y, Kilburn AE, Lee WH, Elledge SJ: The retinoblastoma protein associates with the protein phosphatase type 1 catalyc subunit. Genes Dev 7 (4) :555-569, 1993. Ellington AD y Szostak JW: In vitro selection of RNA molecules that bind specific ligands. -Vature 346 (6287) : 818-822 , 1990. Fields and Song 0: A novel genetic system to detect protein-protein interactions . Nature 340 (6230) : 245-246, 1989. Firek S,Draper J, Owen MR, Gandecha A, Cockbum B, Whitelam GC: Secretion 25 of a functional single-chain Fv protein in transgenic tobáceo plants and cell suspensión cultures. Plant Mol Biol 23 (4) :861-870, 1993. Forsblom S, Rigler R, Elirenberg M, Philipson L: Kinetic studies on the cleavage of adenovirus DNA by restriction endonuclease Eco Rl . Núcleic Acids Res 3(12) : 3255-69, (dec) 1976.
Germino FJ, Wang ZX, Weissman SM: Screening for in vivo protein-protein interactions . Proc Nati Acad Se¡ USA 90(3) : 93 3 -93 7, 1993. Gingeras TR, Brooks JE: Cloned restríction/modification system from. Pseudomonas aeruginosa. Proc Nati Acad Sci USA 80(2):402-6, 1983 (enero). Gluzman Y: SV40-transformed simian cells support the replication of carly SV40 mutants. Cell 23 (1) : 175-182 , 1981. Gruber M, Schodin BA, Wilson ER, Kranz D : Efficient tumor cell lysis mediated by a bispecific single chain antibody expressed in Escherichia coli. J" Immunol 152 (11) : 5368-5374, 1994.
Guarente L: Strategies for the identification of interacting proteins. Proc Nati Acad Sci USA 90 (5) : 1639-1641, 1993. Guilley H, Dudley RK, Jonard G, Balazs E, Richards KE: Transcription of Cauliflower mosaic virus DNA: detection of promoter sequences, and characterization of transcripts. Cell 30 (3) :763-73, 1982. Hardy CF, Sussel L, Shore D: A RAP 1- interacting protein involved in transcriptional silencing and telomere length regulation. Genes Dev 6 (5) : 801-814, 1992. Ha kins RE y Winter G: Cell selection strategies for making antibodies from variable gene librarles: trapping the memory pool. Eur J I munol 22 (3 ): 867-870 , 1992. Holvoet P, Laroche Y, Lijnen HR, Van Hoef B, Brouwersí E, De Cock F, Lauwereys M, Gansemans Y, Collen D: Biochemical characterization of single-chain chimeric plasminogen activators consisting of a single-chain Fv fragment of a fibrin-specific antibody and single-chain urokinase. Eur J Biochem 210(3) :945-952, 1992. Honjo T, Alt FW, Rabbitts TH (eds) : Iw unoglobulin genes. Academic Press: San Diego, CA, pp. 361-368, ®1989. Hoogeriboom HR, Griffiths AD, Johnson KS, Chiswell DJ, Judson P, Winter G: Multi-subunit proteins on the surface of filamentous phage: methodologies for displaying antibody (Fab) heavy and light chains. Nucleic Acids Res 19(15) :4133- 4137,1991.
Huse VM, Sastry L, Iverson SA, Kang AS, Alting-Mees M, Burton DR, Benkovic SJ, Lemer RA: Generat on of a large combina-torial library of the immunoglobulin repertoire in phage lambda. Science 246 (4935) : 1275-1281 , 1989. Huston JS, Levinson D, Mudgett-Hunter M, Tai MS, Novonthey J, Margolies MN, Ridge RJ, Bruccoleri RE, Haber E, Crea R, et al: Protein engineering of antibody binding sites: recovery of specific activity in an anti-digoxin single-chain Fv analogue produced in Escherichia coli. Proc Nati Acad Sci USA 85(16) :5879-5883, 1988. Iwabuchi K, Li B, Bartel P, Fields S: Use of the two-hybrid system to identify the domain of p53 involved in oligomerization. Oncogrene 8(6) : 1693-1696, 1993. Jackson AL, Pahl PM, Harrison K, Rosamond J, Sclafani RA: Cell cycle regulation of the yeast Cdc7 protein kinase by association with the Dbf4 protein. Mol Cell Biol 13(5) .-2899-2908, 1993. Johnson S and Bird RE: Methods Enzymol 203:88, 1991. Kabat et al : Sequences of Proteins of Immunological Interest. 4a ed. , U.S. Department of Health and Human Smices, Bethesda, MD (1987) . Kang AS, Barbas CF, Janda KD, Benkovic SJ, Lemer RA: Linkage of recognition and replication functions by assembling combinato-rial antibody Fab libraries along pliage surfaces. Proc Nati Acad Sci USA 88 (10) :4363-4366, 1991. Kettleborough CA, Ansell KH, Alien RW, Rosell-Vives E, Gussow DH, Bendig MM: Isolation of tumor cell-specific single-chain Fv from immunized mice using phage-antibody libraries and the re-construction of whole antibodies from these antibody fragments. Eur J Immunol 24 (4) : 952-958, 1994. Kruger DH, Barcak GJ, Reuter M, Smith HO: EcoRII can be activated to cleave refractory DNA recognition sites. Nucíeic Acids Res 16 (9) :3997-4008, (mayo 11) 1988. Lalo D, Caries C, Sentenac A, Thuriaux P: Interactions between three common subunits of yeast RNA polymerases 1 and III. Proc Nati Acad Sci USA 90 (12) : 5524-5528, 1993. Laskowski M, Sr: Purification and properties of venom phosphodiesterase . Methods Enzymol 65 (1) : 276-84 , 1980. Lefkovits I and Pernis B, Editors . Immunological Methods. Vols.I and II. Academic Press, New York, NY. Also Vol. III publicado in Orlando y Vol. IV publicado in San Diego. ®1979.
Ivan Lefkovits, editor. Itnmunology methods manual: the comprehensive sourcebook of techniques . Academic Press, San Diego, ®1997. Lerner RA, Kang AS, Bain JD, Burton DR, Barbas CF, eds : Antibodies without immunization. Science 258 (5086) : 1313-131 , 1992. Leung, D.W., et al, Technique, 1:11-15, 1989. Li B y Fields S: Identification of mutations in p53 that affect its binding to SV40 large T antigen by using the yeast two-hybrid system. FASEB J 7 (10) : 957-963 , 1993. Lilley GG, Doelzal O, Hillyard CJ, Bernard C, Hudson PJ: Recombinant single-chain antibody peptide conjugates expressed in Escherichia coli for the rapid diagnosis of HIV.J Iia unol Methods 171(2) .211-226,1994. Lowman HB, Bass SH, Simpson N, Wells JA: Selecting high-affinity binding proteins by monovalent phage display. Bioche-mistry 30 (45) : 10832-10838, 1991. Luban J, Bossolt KL, Franke EK, Kalpana GV, Goff SP: Human immunodeficiency virus type 1 Gag protein binds to cyclophilins A and B. Cell 73 (6) : 1067-1078, 1993. Madura K,Dohmen RJ, Varshavsky A: N-recognin/Ubc2 interac-tions in the N-end rule pathway. J Biol Chem 268 (16) : 12046-54 , (Jun 5) 1993. Marks JD, Hoogenboom HR, Bonnert TP, McCafferty J, Griffiths AD, Winter G: By-passing immunization. Human antibodies from V-gene libraries displayed on phage. J Mol Biol 222(3) :581-597, 1991. Marks JD, Griffiths Ad, Malmqvist M, Clackson TP,Bye JM, inter G: By-passing immuniza ion: building high affinity human antibodies by chain shuffling. Biotechnology (NY) 10 (7) : 779-783, 1992. Marks JD, Hoogenboom HIZ, Griffiths AD, Winter G: Molecular evolution of proteins on filamentous phage. Mimicking the strategy of the immune system. J Biol Chem 267 (23 ): 16007-16010,1992. Maxam AM, Gilbert W: Sequencing end-labeled DNA with base-specific chemical cleavages. Methods Enzymol 65(1) ¡499-560, 1980.
McCafferty J, Griffiths AD, Winter , Chiswell DJ : Phage antibodies filamentous phage displaying antibody variable domains. Nature 348 (6301) : 552-554 , 1990. Miller JH. A Short Course in Bacterial Genetics: A Labora-torv Manual and Handbook for Escherichia coli and Related Bacteria (ver inclusive p. 445) . Cold Spring Harbor Laboratory Press, Plainview, NY, ®1992. Milne GT y Weaver DT: Dominant negative alíeles of RAD52 reveal a DNA repair/recombination complex including Rad51 and Rad52. Genes Dev 7(9) : 1755- 1765,1993. Mullinax RL, Gross EA, Amberg JR, Hay BN, Hogrefe HH, Kubtiz MM, Greener A, Alting-Mees M, Ardourel D, Short JM, y colaboradores: Identification of human antibody fragment clones specific for tetanus toxoid in a bacteriophage lambda immunoexpression library. Proc Nati Acad Sci USA 87 (20) : 8095-9099, 1990. Nath K, Azzolina BA: in Gene Aplification and Analysis (ed. Chirikj ian JG) , vol . 1, p. 113, Elsevier North Holland, Inc., New York, New York, ®1981. Needleman SB and Wunsch CD: A general method applicable to the search for similarities in the amino acid sequence of two proteins. J MOl Biol 48 (3 ): 443 -453 , 1970. Nelson M, Christ C, Schildkraut L: Alteration of apparent restriction endonuclease recognition specificities by DNA methylases. Nucleic Acids Res 12 (13) :5165-73, 1984 (julio 11).
Nicholls PJ, Johnson VG, Andrew SM, Hoogenboom HR, Raus JC, Youle RJ: Characterization of single-chain antibody (sFv)-toxin fusión proteins produced in vitro in rabbit reticulocyte lysate . J Biol Chem 268 (7) : 5302-5308 , 1993. Oller AR, Vanden Broek , Conrad M, Topal MD: Ability of DNA and spermidine to affect the activity of restriction endonuclea-ses from several bacterial species. Biochemistry 30 (9) :2543-9, (marzo 5) 1991. Owens RJ y Young RJ: The genetic engineering of monoclonal antibodies. J Immunol Methods 168 (2) : 149-165 , 199 . Pearson WR y Lipman DJ: Improved tools for biological sequence comparison. Proc Nati Acad Sci USA 85 (8) : 2444-2448 , 1988. Pein CD, Reuter M, Meisel A, Cech D, Kruger DH: Activation of restriction endonuclease EcoRII does not depend on the cleavage of stimulator DNA. Nucleic Acids Res 19 { 19) : 5139-42 , (oct 11) 1991. Persson MA, Caothien RH, Burton DR: Generation of diverse high-affinity human monoclonal antibodies by repertoire cloning. Proc Nati Acad Sci USA 88(6):2432- 2436,1991. Queen C, Foster J, Stauber C, Stafford J: Cell-type specific regulatxon of a kappa immunoglobulin gene by promoter and enhance elements. Imunol Rev 89:49-68, 1986. Qiang BQ, McClelland M, Poddar S, Spokauskas A, Nelson M: The apparent specificity of Notl (5 ' -GCGGCCGC-3 ' ) is enhanced by M.FnuDII or M.Bepl methyltransferases (51 -mCGCG-31 ) : cutting bacterial chromosomes into a few large pieces . Gene 88(1): 10 1 -5, (marzo 30) 1990. Raleigh EA, Wilson G: Escherichia coli K-12 restricts DNA containing 5- methylcytosine . Proc Nati Acad Sci U S A 83 (23) :9070-4, (dic) 1986. Reidhaar-Olson JF y Sauer RT: Combinatorial cassette mutagenesis as a probé of the informational content. of protein sequences. Science 241 (4861) : 53-57, 1988. RiechMann L and Weill M: Phage display and selection of a site-directed randomized single-chain antibody Fv fragment for its affinity improvement. Biochemistry 32 (34) : 8848-8855, 1993.
Roberts RJ, Mecelis D: REBASE--restriction enzymes and methylases. Nucleic Acids Res 24 (1) : 223 -35 , (Jan 1) 1996.
Ryan AJ, Royal CL, Hutchinson J, Shaw CH: Genomic Sequence of a 12S seed storage protein. from oilseed rape (Brassica napus C.V. jet neuf ) , Nucí Acids Res 17(9):3584, 1989. Sambrook J, Fritsch EF, Maniatis T. Molecular Cloning: A Laboratory Manual, segunda edición. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, ®1982. Scopes RK. Protein Purification: Principies and Practice. Springer-Verlag, New York, NY, ®1982. Silver SC y Hunt S 3d: Techniques for cloning cDNAs encoding interactive transcriptional regulatory proteins. Mol Biol Rep 17 (3) : 155-165, 1993. Smith TF, Waterman MS . Adv Appl Math 2:482-fin del artículo, 1981. Smith TF, Waterman MS: Overlapping genes and information theory. J Theor Biol 91 (2) ¡379-80, (Jul 21) 1981. Smith TF, Waterman MS: Identification of common molecular subsequences . J Mol Biol 147 (1) : 195-7, (Mar 25) 1981. Smith TF, Waterman MS, Fitch WM: Comparative biosequence metrics. J Mol Evol S18 (1) : 38-46 , 1981. Staudinger J, Perry M, Elledge SJ, Olson EN: Interactions among vertébrate helix- loop-helix proteins in yeast using the two-hybrid system. J Biol Chem 268 (7) :4608-4611, 1993. Stemmer WP, Morris SK, Wilson BS: Selection of an active single chain Fv antibody from a protein linker library prepared by enzymatic inverse PCR. Biotechnigues 14 (2 ): 256-265 , 1993.
Stemmer WP: DNA shuffling by randotn fragmentation and reassembly: in vitro recombination for molecular evolution. Proc Nati Acad Sci USA 91 (22 ): 10747- 10751, 1994. Sun D, Hurley LH: Effect of the (+) -CC-1065- (N3-adenine) DNA adduct on in vitro, DNA synthesis mediated by Escherichia coli DNA polymerase. Biochemistry 31:10, 2822-9, (marzo 17) 1992, Tague BW, Dickinson CD, Chrispeels MJ: A short domain of the plant vacuolar protein phytohernagglutinin targets invertase to, the yeast vacuole. Plant Cell 2(6):533-46, (junio) 1990. Takahashi N, Kobayashi I: Evidence for the double-strand break repair model of bacteriophage lambda recombination. Proc Nati Acad Sci USA 87 (7) : 2790-4 , (abril) 1990. Thiesen HJ and Bach C: Target Detection Assay (TDA) : a versatile procedure to determine DNA binding sites as demonstra-ted on SP1 protein. Nucleic Acids Res 18 (11) :3203-3209, 1990. Thomas M, Davis RW: Studies on the cleavage of bacteriophage lambda DNA with EcoRl Restriction endonuclease . J Mol Biol 91 (3) .315-28, (enero 25) 1975. Tingey SV, Walker EL, Corruzzi GM: Glutamine synthetase genes of pea encode distinct polypeptides which are differen-tially expressed in leaves, roots and nodules. EMBOJ 6(1) :1-9, 1987. Topal MI, Thresher RJ, Conrad M, Griffith J: Nael endonuclease binding to pBR322 DNA induces looping. Biochemistry 30 (7) :2006-10, (feb 19) 1991.
Tramontano A, Chothia C, Lesk AM: Framework residue 71 is a major determinant of the position and conformation of the second hypervariable región in the VH domains of immunoglobulins . J Mol Biol 215(1) :175-182, 1990. Tuerk C y Gold L: Systematic evolution of ligands by exponential enrichment: R A ligands to bacteriophage T4 DNA polymerase. Science 249 (4968) : 505-510 , 1990. van de Poli ML, Lafleur MV, van Gog F, Vrieling H# Meerman JH: N-acetylated and deacetylated 4 ' -fluoro-4-aminobiphenyl and 4-aminobiphenyl adducts differ in their ability to inhibit DNA replication of single-stranded MI 3 in vitro and of single-stranded phi X174 in Escherichia coli. Carcinogenesis 13(5) :751-8, (mayo) 1992. Vojtek AB, Hollenberg SM, Cooper JA: Mammalian Ras interacts directly ith the serine/threonine kinase Raf. Cell 74(1):205-214, 1993. Wenzler H, Mignery G, Fisher L, Park W: Sucrose-regulated expression of a chimeric potato tuber gene in leaves of transge-nic tobáceo plants. Plant Mol Biol 13 (4) : 347-54, 1989. Williams y Barclay, in Immunoglobulin Genes. The Immunoglo-bulin Gene Superfamily Winnacker EL . From Genes to Clones: Introduction to Gene Technology. VCH Publishers, New York, NY, ® 1987. inter G y Milstein C: Man-made antibodies. Nature 349 (6307) :293-299, 1991.
Yang X, Hubbard EJ, Carlson M: A protein kinase substrate identified by the two- hybrid system. Science 257 (5070) :680-2, (Jul 31) 1992. Patente de los Estados Unidos 4,683,195; presentada el 7 de febrero de 1986, expedida el 28 de julio de 1987. Mullis KB, Erlich HA, Arnheim N, Hom GT, Saiki RK, Scharf SJ : Process for Amplifying, Detecting, and/or Cloning Nucleic Acid Sequences. Patente de los Estados Unidos 4,683,202; presentada el 25 de octubre de 1985, expedida el 28 de julio de 1987. Mullis YB: Process for Amplifying Nucleic Acid Sequences. Patente de los Estados Unidos 4,704,362; presentada el 5 de noviembre de 1979, expedida el 3 de noviembre de 1987. Itakura K, Riggs AD: Recombinant Cloning Vehicle Microbial Polypeptide Expression . WO 88/08453; presentada el 14 de abril de 1988, publicada el 3 noviembre de 1988. Alakhov JB, Baranov, VI, Ovodov SJ, Ryabova LA, Spirin AS: Method of Obtaining Polypeptides in Cell-Free Translation System. WO 90/05785; presentada el 15 de noviembre de 1989, publicada el 31 de mayo de 1990. Schultz P: Method for Site-Specifically Incorporating Unnatural Amino Acids into Proteins.
WO 90/07003; presentada el 27 de enero de 1989, publicada el 28 de junio de 1990. Baranov VI, Morozov IJ, Spirin AS: Method for Preparative Expression of Genes in a Cell-free System of Conjugated Transcription/translation .
WO 91/02076; presentada el 14 de junio de 1990, publicada el 21 de febrero de 1991. Baranov VI, Ryabova LA, Yarchuk OB, Spirin AS: Method for Obtaining Polypeptides in a Cell-free System. WO 91/05058; presentada el 5 de octubre de 1989, publicada el 18 de abril de 1991. Kawasaki G: Cell-free Synthesis and Isolation of Novel Genes and Polypeptides. WO 91/17271; presentada el 1 de mayo de 1990, publicada el 14 de noviembre de 1991. Dower WJ, Cwirla SE: Recombinant Library Screening Methods. WO 91/18980; presentada el 13 de mayo de 1991, publicada el 12 de diciembre de 1991. Devlin JJ: Compositions and Methods for Indentifying Biologically Active Molecules. WO 91/19818; presentada el 20 junio de 1990, publicada el 26 de diciembre de 1991. Dower WJ, Cwirla SE, Barrett RW: Peptide Library and Screening Systems . WO 92/02536; presentada el 1 de agosto de 1991, publicada el 20 de febrero de 1992. Gold L, Tuerk C: Systematic Polypeptide Evolution by Reverse Translation. WO 92/03918; presentada el 28 de agosto de 1991, publicada el 19 de marzo de 1992. Lonberg N, Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies. WO 92/03918; presentada el 28 de agosto de 1991, publicada el 19 de marzo de 1992. Lonberg N, Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies.
WO 92/05258; presentada el 17 de septiembre de 1991, publicada el 2 de abril de 1992. Fincher GB: Gene Encoding Barley Enzyme . WO 92/14843; presentada el 21 de febrereo de 1992, publicada el 3 de septimbre de 1992. Toóle JJ, Griffin LC, Bock LC, Latham JA, Muenchau DD. Krawczyk S: Aptamers Specific for Biomolecules and Method of Making. WO 93/08278; presentada el 15 de octubre de 1992, publicada el 29 de abril de 1993. Schatz PJ, Culi MG, Miller JF, Sternmer VYT. , Peptide Library and Screening Method. WO 93/12227; presentada el 17 de diciembre de 1992, publicada el 24 de junio 1993. Lonberg, N; Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies.
WO 93/12227; presentada el 17 de diciembre de 1992, publicada el 24 de junio de 1993. Lonberg N, Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies.
WO 94/25585; presentada el 25 de abril de 1994, publicada el 10 de noviembre de 1994. Lonberg, N, Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies. WO 94/25585; presentada el 25 de abril de 1994, publicada el 10 de noviembre de 1994. Lonberg N, Kay RM: Transgenic Non-human Animáis Capable of Producing Heterologous Antibodies. Arslan T, Abraham AT, Hecht SM: Structurally altered substrates for DNA topoisomerase I. Effects of inclusión of a single 31 -deoxynucleotide ithin the scissile strand. Nucleosides Nucleotides 1998 Jan-Mar; 17 ( 1-3 ): 515-30. Aupeix K, Toulme JJ: Binding of chemically-modified oligonucleotides to the double-stranded stem of an RNA hairpin. Nucicosides Nucleotides 1999 jun-20 jul; 18 (6-7) : 1647-50. Bazzanini R, Manfredini S, Durini E, Groschel B, Cinatl J, Balzarini J, De Clercq E, Imbach JL, Perigaud C, Gosselin G: Prodrugs of Ara-CMP and Ara-AMP with a S- acyl-2-thioethyl (SATE) biolabile phosphate protecting group: synthesis and biological evaluation. Nucleosides Nueleotides 1999 abril-mayo 18(4-5) :971-2. Blackbum GM, Liu X, Rosler A, Brenner C: Two hydrolase resistant analogues of diadenosine 5' ,5' ' % -PI , P3 -triphosphate for studies with Fhit, the human fragüe histidine triad protein. Nueleosides Nucleotides 1998 enero-marzo; 17 (1-3 ): 301-8. Bridson PK, Lin X, Meiman N, Ji XD, Jacobson KA: Synthesis and adenosine receptor affinity of 7-beta-D-ribofuranosylxanthi-ne. Nuleosides Nucleotides 1998 abril; 17 (4) :759-68. Brodin P, Gottikh M Auclair C, Mouscadet JF: Inhibition of HIV-1 integration by mono-& bi-functionalized triple helix forming oligonucleotides. Nucleosides Nucleotides 1999 jun-jul:18(6-7) :1717.8. Creighton, TE: Proteins, Structures and Molecular Principies. New York; W.H. Freeman and Co., 1984. De Clercq E: Carbocyclic adenosine analogues as S-adenosy-lhomocysteine hydrolase inhibitors and antiviral agents : recent advances. Nucleosides Nucleotides 1998, enero-marzo; 17 (1-3) :625-34. De Zwart M, Link R, von Frijtag Drabbe Kunzel JK, Cristalli G, Jacobson KA, Twonsend-Nicholson A, Ijzerman AP: A functional screening of adenosine analogues at the adenosine A2B receptor: A search for potent agonists. Nucleosides Nucleotides 1998 jun; 17 (6) :969-85. Egron D, Arzumanov AA, Dyatkina NB, Krayevsky A, Imbach JL, Aubertin AM, Gosselin G, Perigaud C: Synthesis, anti-HIV activity and stability studies of 31 -azido2 ' , 31 -dideoxythymidine 5'-fluorpphosp ate . Nucleosides Nucleotides 1999 abril-mayo; 18(4-5) :983-4. Gianolio DA, McLaughlin LW: Synthesis and triplex forming properties of pyrimidine derivative containing extended functio-nality. Nucleosides Nucleolides 1999 agosto; 18 (8) : 1751-69. Gottikh MB, Volkov EM, Romanova EA, Oretskaya TS, Shabarova ZA: Synthesis of oligonucleotide-intercalator conjugates capable to inhibit HIV-l DNA integration. Nucleosides Núcleofides 1999 jun-jul; 18 (6-7) :1645-6. Hotoda H, Koizumí M, Ohínine T, Furukawa H, Nishigaki T, Abe K, Kosaka T, Tsutsumi S, Soné J, Kaneko M: Biologically active oligodeoxyribonucleotides . 10: anti-HIV- 1 activity and stability of modified hexanueleotides containing glycerol-sfceleton. Nucleosides Nucleotides 1998 enero-marzo; 17 (1-3) :243-52. Patente japonesa 10 113194; presentada 199 '1022 , publicada 19980506. Donnelly, JJ; Dwarki, VJ ;Liu, MA ; ontgomery, DL; Parker, S ; Shiver, JW; Ulmer JB: Nucieic Acid Preparation. Kang SH, Sinhababu AK, Cho MJ: Synthesis and biological activity of bis (pivaloyloxymethyl) ester of T-azido-T-deoxyuridi-ne Y-monophosphate . Nucleosides Núcleofides 1998 junio; 17 (6) :1089-98. Krayevsky A, Arzumanov A, Shirokova E, Dyatkina N, Victorova L, Jasko M, Alexandrova L: d TP modified at triphosphate residues: substrate properties to ards DNA polymerases and stability in human serum. Nueleosides Nucleotides 1998 enero-marzo; 17(1-3) :681-93. Kmyevsky AA, Dyatkina NB, Semizarov DG, Victorova LS, Shirokova EA, Theil F, Von Janta Lipinski MJ, Gosselin G, Imbach JL: Reasons and limits of substrate activity of modified L-dNTP in DNA biosynthesis . Nucleosides Nucleotides 1999 abril-mayo; 18(43) :863-4. Kvasyuk El, Mikhailopulo IA, Suhadolnik RJ, Henderson EE, Muto NF, Iacono KT, Homon J, Pfieiderer W: Synthesis and biological activity of 21 , 5-oligoadenylate trimers containing 5" -terminal 5 ' -amino-5 ' -deoxy- and 51 -amino-3 , 5-dideoxyadenosine derivatives. Nucleosides Nucleotides 1999 jun-jul; 18 (6-7) .1483-4. Liu J, Skradis A, Koiar C, Kolath J, Anderson J, Lawson T, Talmadge J, Gmeiner VYIH: Increased cytotoxicity and decreased in vivo toxicity of FdUMP[10] relative to 5-FU. Nucleosides Nucleotides 1999 agosto; 18 (8) :1789-802. Lutz MJ, Will DW, Breipoffl G, Benner SA, Uhlmann E: Synthesis of a monocharged peptide nucleic acid (PNA) analog and its recognition as substrate by DNA polymerases . Nucleosides Nucleotides 1999 marzo; 18(3) :3 93-401. Monaco V, van de Wetering KI, Meeuwenoord NJ, van den Elst HA, Stuivenberg HR, Visse R, van der Kaaden JC, Moolenaar GF, Verhoeven EE, Goosen N, van der Marel GA, van Boom JH: Synthesis and biological evaluation of modified DNA fragments for the study of nucleotide excisión repair in E. coli. Nucleosides Nucleotides 1999 jun-jul; 18 (6-7) : 1339-41. Morozova OV, Kolpashchikov DM, Ivanova TM, Godovikova TS : Synthesis of ne photocross-linking 5-C-base-substituted UTP analogs and their application in highly selective affinity labelling of the tick-borne encephalitis virus RNA replicase proteins. Nucleosides Nucleotides 1999 jun-jul; 18 (6-7) : 1513-4.
Nguyen-Ba N, Chan L, Quimpere M, Turcotte N, Lee N, Mitchell H, Bedard J: Design and SAR study of a novel class of nucleotide analogues as potent anti-HCMV agents. Nucleosides Nucleotides 1999 abr-mayo; 18 (4-5) : 821-7 Pandolfi D, Rauzi F, Capobianco ML: Evaluation of different types of end-capping modifications on the stability of oligonu-cleotides toward 31 - and 5 ' -exonucleases . Nucleosides Nucleotides 1999 sep; 18 (9) : 2051-69. Pankiewicz , Lesiak-Watanabe K: Novel mycophenolic adenine bis (phosphonate) s as potent anticancer agents and inducers of cells differentiation. Nucleosides Nucleotides 1999 abril-mayo; 18 (43) : 927-32. Perrin DM, Garestier T, Helene C: Expanding the catalytic repertoire of nucleic acid catalysts: simultaneous incorporation of two modified deoxyribonucleoside triphosphates bearing ammonium and imidazolyl functionalities . Nucleosides Nucleotides 1999 marzo; 18 (3 ): 377-91. Pfundheller HM, Koshkin AA, Olsen CE, Wengel J: Evaluation of oligonucleotides containing two novel 21 -O-methyl modified nucleotide monomers: a Y-C-allyl and a 21 -0, 3 ' -C-linked bicyclic derivative. Nucleosides Nucleotides 1999 sep; 18(9):2017- 30. Ramasamy KS, Stoisavljevic V. : Synthesis and biophysical studies of modified oligonucleotides containing acyclic amino alcohol nucleoside analogs. Nucleosides Nucleotides 1999 agosto; 18 (8) : 1845-61. Schinazi RF, Lesnikowski ZJ: Boron containing oligonucleotides. Nucleosides Nucleotides 1998 enero-marzo; 17 (1-3 ): 635-47.
Secrist JA 3rd, Parker WB, Alian PW, Bennett LL Jr, Waud WR, Truss JW, Fowler AT, Montgomery JA, Ealick SE, Wells AH, Gillespie GY, Gadi VK, Sorscher EJ: Gene therapy of cáncer: activation of nucleoside prodrugs with E. coli purine nucleoside phosphorylase . Nucleosides Nucleotides 1999 abril-mayo; 18(4-5) :745-57. Shirokova EA, Shipitsin AV, Victorova LS, Dyatkina NB, Goryunova LE, Beabealashvilli RS, Hamilton CJ, Roberts SM, Krayevsky AA: Modified nucleoside 51 -triphosphonates as a new type of antiviral agents . Nucleosides Nucleotides 1999 abril -mayo; 18 (43) : 1027-8. Srivastava TK, Friedhoff P, Pingoud A, Katti SB: Application of oligonucleoside methylphosphonates in the studies on phospho-diester hydrolysis by Serratia endonuclease . Nucleosides Nucleotides 1999 sep; 18 (9) : 1945-60. Stattel JM, Yanachkov I, Wright GE: Synthesis and biochemi-cal study of N2 - (P-n-butylphenyl) -21 -deoxyguanosine 5'- (alpha,beta-imido) triphosphate (BuPdGMPNHPP) : a non-substrate inhibitor of B family DNA polymerases . Nucleosides Nucleotides 1998 agosto; 17 (8) : 1505-13. Terato H, Morita H, Ohyarna Y, Ide H: Novel modification of 5-forrnyluracil by cysteine derivatives in aqueous solution. Nucleosides Nucleotides 1998 enero-marzo; 17 (1-3) : 131-41. Tornikawa A, Seno M, Sato-Kiyotaki K, Ohtsulci C, Hirai T, Yamaguchi T, Kawaguchi T, Yoshida S, Saneyoshi M: Synthetic nucleosides and nucleotides. 40. Selective inhibition of eukaryotic DNA polymerase alpha by 9- (beta-D-arabinofuranosyl) -2-(p-n-butylanílino) adenine 5 ' -triphosphate (BuAaraATP) and its 2 ' -up azido analog: synthesis and enzymatic evaluations. Nucleosides Nucleotides 1998 enero-marzo, 17 (1-3 ): 487-501. Patente de los Estados Unidos 5580859; presentada 19940318, expedida 19961203. Felgner, PL; Wolff, JA; Rhodes, GH; Malone, RW; Carson, DA: Delivery of exogenous DNA sequences in a mammal.
Patente de los Estados Unidos 5589466; presentada 19950126, expedida 19961231. Felgner, PL; Wolff, JA; Rhodes, GH; Malone, RW; Carson, DA: Induction of a protective immune response in a mammal by injecting a DNA sequence. Patente de los Estados Unidos 5641665; presentada 19941128, expedida 19970624. Hobart, PM; Margalith, M; Parker, SE; Khatibi, S: Plasmids suitable for IL-2 expression. Patente de los Estados Unidos 5693622; presentada 19950607, expedida 19971202. Wolff, JA; Duke, DJ; Felgner, PL: Expression of exogenous polynucleotide sequences cardiac muscle of a mammal.
Patente de los Estados Unidos 5703055; presentada 19940126, expedida 19971230. Felgner, PL; Wolff, JA; Rhodes, GH; Malone, RW; Carson, DA: Generation of antibodies through lipid mediated DNA delivery. Patente de los Estados Unidos 5846946; presentada 19960614, expedida 19981208. Huebner, RC; Norman, JA; Liang, X; Camer, KR; Barbour, AG; Luke, CJ: Compositions and methods for administering Borrelia DNA. Patente de los Estados Unidos 5910488; presentada 19951201, expedida 19990608. Nabel, GJ; Nabel, EG; Lew, D; Marquet, M: Plasmicis suitable for gene therapy. Victorova LS, Semizarov DG, Shirolcova EA, Alexandrova LA, Arzumanov AA, Jasko MV, Krayevsky AA: Human DNA polymerases and retroviral reverse transcriptases : selectivity in respect to dNTPs modified at triphosphate residues. Nucleosides Nucleotides 1999 abril-mayo; 18 (4-5) : 1031-2. von Janta-Lipinski M, Gaertner K, Lehmann C, Scheer H, Schildt J, Matthes E: Protein and R A of human telomerase as targets for modified oligonucleotides . Nucleosides Nucleotides 1999 jun-jul; 18 (6-7) : 1719-20 W09011092; presentada 19900321, publicada 19901004. Felgner, PL; Wolff , JA; Rhodes, GH; Malone, RW; Carson, DA: Expression Of Exogenus Polynucleotide Sequences In A Vertébrate. 09314778; presentada 19930121, publicada 19930805. Rhodes, GH; Dwarki, VJ; Felgner, PL; ang-Felgner, J; Manthorpe, M: Ex Vivo Gene Transfer. W09421797; presentada 19940314, publicada 19940929. Donnelly, JJ; Dwarki, VJ; Liu, MA; Montgomery, DL; Parker, SE; Shiver, JW; Ulmer, JB: Nucleic Acid Pharmaceuticals . W09633736; presentada 19960426, publicada 19961031. Baruch, DI; Pasloske BL; Howard, RJ: Malaria Peptides and Vaccines. W09735992; presentada 19970317, publicada 19971002. Hobart, PM; Liang, X: Tetracycline Inducible/Repressible Systems. W09926663; presentada 19981120, publicada 19990603. Horton, H; Parker, S; Manthorpe, M; Feigner, P: Treatment Of Cáncer Using Cytokine-Expressing Polynucleotides And Compositions Therefor.
W09941368; presentada 19990210, publicada 19990819. Punnonen J, Stemmer WP, Whalen RG; Howard, R: Optimization of Immunomodu-latory Properties of Genetic Vaccines. o -407- W09941369; presentada 19990210, publicada 19990819. Punnonen J, Stemmer WP, Whalen RG; Howard, R: Genetic Vaccine Vector Engineering. W09941383; presentada 19990210, publicada 19990819. Punnonen J, Bass, SH, Whalen, RG, Howard, R, Stemmer, WP: Antigen Library Immunization . W09941402; presentada 19990210, publicada 19990819. Punnonen J, Stemmer, WP, Howard R, Patten PA: Targeting of Genetic Vaccine Vectors .

Claims (14)

  1. REIVINDICACIONES 1. Un método para producir un polinucleótido de progenie mutagenizado, que comprende: (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa, in vitro, de modo de producir un conjunto de polinucleótidos de progenie ,- con lo cual el proceso de re-ensamble mediado por exonucleasa es ejemplificado, de una manera no limitativa, por sumisión a un tratamiento con 3' exonucleasa, tal como tratamiento con exonucleasa III, que actúa sobre los extremos 3' colgantes y chatos, para liberar nucleótidos 31 -terminales pero no 5'-terminales a partir de un polinucleótido de doble hélice inicial, dejando una cadena remanente que está parcial o completamente libre de su socio original de modo que, si se desea, la cadena remanente puede usarse para lograr hibridación a otro socio; con lo cual el proceso de re-ensamble mediado por exonucleasa es ejemplificado adicionalmente, de una manera no limitativa, por sumisión a un tratamiento con 5' exonucleasa, tal como tratamiento con un producto de gen alfa rojo, que actúa sobre colgantes 5' para liberar nucleótidos 51 -terminales de un polinucleótido de doble hélice inicial, dejando una cadena remanente que está parcial o completamente libre de su socio original de modo que, si se desea, la cadena remanente pueda usarse para lograr hibridación a otro socio; con lo cual el proceso de re-ensamble mediado por exonucleasa es ejemplificado adicionalmente, de una manera no limitativa, por sumisión a un tratamiento con exonucleasa, tal como tratamiento con nucleasa de frijol Mung o tratamiento con nucleasa SI o tratamiento por ADN polimerasa de E. coli, que actúa sobre extremos colgantes, incluyendo extremos sin hibridar, para liberar nucleótidos terminales de un extremo no hibridado de una sola cadena de una cadena de ácido nucleico templado en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero hibridado para facilitar extensión a base de polimerasa y/o ligación mediada por ligasa del extremo tratado; y con lo cual el proceso de re-ensamble mediado por exonucleasa también es ejemplificado por un tratamiento doble, que puede llevarse a cabo, por ejemplo no simultáneamente, con tanto una exonucleasa que libera nucleótidos terminales de extremos colgantes o extremos chatos como una exonucleasa que libera nucleótidos terminales de extremos colgantes tales como v extremos sin hibridar.
  2. 2. El método de la reivindicación 1, para producir un polinucleótido de progenie mutagenizado, donde el paso de (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa, in vitro, de modo de producir un conjunto de polinucleótidos de progenie; comprende : (i) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con 31 exonucleasa que actúa sobre extremos 3' colgantes y chatos, para liberar nucleótidos 3'-terminales pero no 5 ' -terminales; con lo cual dicha 3' exonucleasa es ejemplificada, de una manera no limitativa, por tratamiento con una exonucleasa, tal como exonucleasa III, para liberar nucleótidos 31 -terminales pero no 5 ' -terminales de un polinucleótido inicial de doble hélice, dejando una cadena remanente que está parcial o completamente libre de su socio original de modo que, si se desea, la cadena remanente pueda ser usada para lograr hibridación a otro socio .
  3. 3. El método de la reivindicación 1, para producir un polinucleótido de progenie mutagenizado, donde el paso de (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa in vitro de modo de producir un conjunto de polinucleótidos de progenie, comprende : (i) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento co 5' exonucleasa que actúa sobre colgantes 5' para liberar nucleótidos 5 ' -terminales; con lo cual dicha 5' exonucleasa es ejemplificada, de una manera no limitativa, por tratamiento con una exonucleasa, tal como un producto de gen alfa rojo, para liberar nucleótidos 5 ' -terminales de un polinucleótido de doble hélice de inicio, dejando una cadena remanente que está parcial o completamente libre de su socio original de modo que, si se desea, la cadena remanente pueda usarse para lograr hibridación a otro socio.
  4. 4. El método de la reivindicación 1, para producir un polinucleótido de progenie mutagenizado, donde el paso de (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa in vi tro de modo de producir un conjunto de polinucleótidos de progenie, comprende :. (i) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con exonucleasa que libera nucleótidos terminales de colgantes de ácido nucleico; con lo cual dicho tratamiento es ejemplificado, de una manera no limitativa, por sumisión a un tratamiento con exonucleasa, tal como tratamiento con nucleasa de frijol Mung o tratamiento con nucleasa SI o tratamiento con ADN polimerasa de E. coli, que actúa sobre extremos colgantes, incluyendo extremos sin hibridar, para liberar nucleótidos de un extremo sin hibridar de una sola cadena de una cadena de ácido nucleico templado en un complejo de ácido nucleico heteromérico, dejando un extremo acortado pero sin hibridar para facilitar extensión a base de polimerasa y/o ligación mediada por ligasa del extremo tratado.
  5. 5. El método de la reivindicación 1, para producir un polinucleótido de progenie mutagenizado, donde el paso de (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa in vitro de modo de producir un conjunto de polinucleótidos de progenie, comprende : (i) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con 31 exonucleasa que actúa sobre extremo 3" colgantes y chatos, para liberar nucleótidos 3'-terminales pero no 5 ' -terminales ; y (ii) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con exonucleasa que libera nucleótidos terminales de colgantes de ácido nucleico; con lo cual el proceso de re-ensamble mediado por exonucleasa comprende un tratamiento doble, que puede llevarse a cabo, por ejemplo de manera no simultánea, tanto con una exonucleasa que libera nucleótidos terminales de extremos colgantes o chatos así como una exonucleasa que libera nucleótidos terminales de colgantes tales como extremos no hibridados.
  6. 6. El método de la reivindicación 1, para producir un polinucleótido de progenie mutagenizado, donde el paso de (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa in vitro, de modo de producir un conjunto de polinucleótidos de progenie, comprende : (i) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con 5' exonucleasa que actúa sobre extremos colgantes 5' para liberar nucleótidos 5 ' -terminales ; y (ii) someter un conjunto de polinucleótidos de inicio o parentales a un tratamiento con exonucleasa que libera nucleótidos terminales de extremos colgantes de ácido nucleico; con lo cual el proceso de re-ensamble mediado por exonucleasa comprende un tratamiento doble, que puede llevarse a cabo, por ejemplo de manera no simultánea, tanto con una exonucleasa que libera nucleótidos terminales de extremo colgantes o chatos como una exonucleasa que libera nucleótidos terminales de extremo colgantes tales como extremo sin hibridar.
  7. 7. Un método para producir un polinucleótido de progenie mutagenizado que tiene al menos una propiedad deseable, que comprende los pasos de: (a) someter un conjunto de polinucleótidos de inicio o parentales a un proceso de re-ensamble mediado por exonucleasa in vitro de modo de producir un conjunto de polinucleótidos de progenie; y (b) someter el conjunto de polinucleótidos de progenie a un proceso de análisis y enriquecimiento a base de selección de extremo, de modo de seleccionar un sub-conjunto deseable del conjunto de polinucleótidos de progenie; con lo cual los pasos anteriores pueden ser llevados a cabo de manera iterativa y en cualquier orden y en combinación; con lo cual el proceso a base de selección de extremo crea extremos compatibles con ligación; con lo cual la creación de extremos compatibles con ligación es usada opcionalmente para facilitar una o mas ligaciones inter-moleculares, que son de preferencia ligaciones direccionales, dentro de miembros del conjunto de polinucleótidos de progenie de modo de lograr mutagénesis por ensamble y/o reensamble; con lo cual la creación de extremos compatibles con ligación sirve para facilitar la ligación del conjunto de polinucleótidos de progenie en un sistema de vector de expresión y clonación de expresión; con lo cual la clonación de expresión del conjunto de polinucleótidos de progenie sirve para generar un conjunto de polipéptidos ; con lo cual el conjunto de polipéptidos generado puede ser sometido a un proceso de análisis de expresión; y con lo cual el análisis de expresión del conjunto de polipéptidos de progenie provee medios para identificar una especie deseable, por ejemplo un polipéptido mutante o alternativamente un fragmento de polipéptido, que tiene una propiedad deseable, tal como una actividad enzimática específica.
  8. 8. Un método para generar un polinucleótido de progenie mutagenizado a partir de una colección de polinucleótidos progenitores, que comprende: a) templar una cadena de ácido nucleico de poli-ligadura a dos cadenas de ácido nucleico de mono-ligadura para generar un complejo heteromérico templado de cadenas de ácido nucleico; donde la cadena de ácido nucleico de poli-ligadura y las dos cadenas de ácido nucleico de mono-ligadura son derivadas, cada una, de una diferente especie molecular en dicha colección de polinucleótidos progenitores; donde dicha colección de polinucleótidos progenitores está compuesta de preferencia por polinucleótidos progenitores no idénticos pero posiblemente relacionados, como se ejemplifica por una colección de genes que codifican deshalogenasas; y donde la cadena de ácido nucleico de poli-ligadura y las dos cadenas de ácido nucleico de mono- ligadura tienen, cada una, al menos una secuencia de siete nucleótidos de largo, de identidad con los polinucleótidos progenitores de los que se deriva; b) y someter los extremos no hibridados de una sola cadena de las cadenas de ácido nucleico de mono-ligadura, templadas, en el complejo heteromérico, a un tratamiento con exonucleasa que degrada dichos extremos no hibridados; con lo cual el templado de cadenas de poli-ligadura y mono-ligadura que funcionan, derivadas de polinucleótidos no idénticos, de esta manera permite generar una quimerización de dichos polinucleótidos no idénticos; con lo cual, en una biblioteca de dichos complejos templados de cadenas de ácido nucleico, muchas cadenas componentes tienen extremos no susceptibles de hibridación que son sub-óptimos o no funcionales para cebar extensión a base de polímera-sa; y con lo cual el tratamiento con exonucleasa retira tales extremos no susceptibles de hibridación para convertir los complejos templados de cadenas de ácido nucleico en mejores cebadores para extensión a base de polimerasa.
  9. 9. El método de la reivindicación 8, comprendiendo además el paso de : c) someter el complejo heteromérico templado a extensión a base de polimerasa.
  10. 10. El método de la reivindicación 9, comprendiendo además el paso de : d) someter las cadenas templadas de ácido nucleico a un tratamiento con ligasa ,· con lo cual la sumisión a tratamiento con ligasa es ejemplificada por sumisión a tratamiento con T4 ADN ligasa para lograr ligación inter-molecular entre las dos cadenas templadas de mono-ligadura, que de esta manera se unen ' covalentemente formando una cadena quimerizada.
  11. 11. El método de la reivindicación 10, comprendiendo además el paso de : e) separar la cadena de ácido nucleico de poli-ligadura de las cadenas de ácido nucleico de mono- ligadura ligadas; con lo cual la separación de una cadena de ácido nucleico de poli-ligadura de cadenas de ácido nucleico de mono-ligadura ligadas a las cuales está templada puede lograr, por ejemplo ya sea por desnaturalización o por exposición a una actividad enzimática que actúa selectivamente sobre las cadenas de ácido nucleico de poli-ligadura.
  12. 12. El método de la reivindicación 11, comprendiendo además el paso de: f) generar una cadena de ácido nucleico que es complementaria a la cadena de ácido nucleico de mono- ligadura ligada; con lo cual el producto resultante comprende un polinucleotido de progenie mutagenizado de doble hélice o cadena.
  13. 13. El método de cualquiera de las reivindicaciones 1-12, donde el polinucleotido de progenie mutagenizado es un gen o una trayectoria de gen.
  14. 14. El método de la reivindicación 13, comprendiendo además : expresar el polipéptido de progenie mutagenizado generado en un anfitrión adecuado; con lo cual dicha expresión lleva a la generación de un producto del polipéptido que puede detectarse por análisis de expresión . Resumen Esta invención provee métodos de obtener novedosos polinucleótidos y polipéptidos codificados mediante el uso de métodos no estocásticos de evolución dirigida (DirectEvolution™) . Una ventaja particular de los métodos de re-ensamble mediados por exonucleasa es la capacidad de re-ensamblar filamentos de ácidos nucleicos, que de otra manera serían difíciles de quimerizar. Los métodos de re-ensamble mediados por exonucleasa pueden ser usados en combinación con otros métodos de mutagénesis provistos en la presente. Estos métodos incluyen mutagénesis de saturación de sitio de polinucleótido no estocástica (Gene eassembly™) . Esta invención provee métodos de obtener novedosas enzimas que tienen propiedades físicas y/o biológicas optimizadas. Mediante el uso de los métodos reivindicados, vacunas genéticas, enzimas, moléculas pequeñas y otras moléculas deseables pueden ser evolucionadas hacia propiedades deseables. Por ejemplo, pueden obtenerse vectores de vacuna que exhiben una eficacia incrementada para uso como vacunas genéticas. Los vectores obtenidos usando los métodos pueden tener, por ejemplo, una mejorada expresión de antígenos, una incrementada toma en una célula, estabilidad incrementada en una célula, la capacidad de desarrollar una respuesta inmune a la medida, y similares. A mayor abundamiento, esta invención provee métodos de obtener una variedad de moléculas biológicamente activas, novedosas, en el campo de los antibióticos, la farmacoterapia, y rasgos transgéni-eos .
MXPA00011569A 1999-03-26 2000-03-27 Re-ensamble de acidos nucleicos mediado por exonucleasa en evolucion dirigida. MXPA00011569A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/276,860 US6352842B1 (en) 1995-12-07 1999-03-26 Exonucease-mediated gene assembly in directed evolution
US09/332,835 US6537776B1 (en) 1999-06-14 1999-06-14 Synthetic ligation reassembly in directed evolution
PCT/US2000/008245 WO2000058517A1 (en) 1999-03-26 2000-03-27 Exonuclease-mediated nucleic acid reassembly in directed evolution

Publications (1)

Publication Number Publication Date
MXPA00011569A true MXPA00011569A (es) 2004-12-03

Family

ID=26958167

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA00011569A MXPA00011569A (es) 1999-03-26 2000-03-27 Re-ensamble de acidos nucleicos mediado por exonucleasa en evolucion dirigida.

Country Status (6)

Country Link
EP (1) EP1092041A4 (es)
JP (1) JP2004500019A (es)
AU (1) AU4039400A (es)
CA (1) CA2329122A1 (es)
MX (1) MXPA00011569A (es)
WO (1) WO2000058517A1 (es)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6936289B2 (en) 1995-06-07 2005-08-30 Danisco A/S Method of improving the properties of a flour dough, a flour dough improving composition and improved food products
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6951719B1 (en) 1999-08-11 2005-10-04 Proteus S.A. Process for obtaining recombined nucleotide sequences in vitro, libraries of sequences and sequences thus obtained
US6991922B2 (en) 1998-08-12 2006-01-31 Proteus S.A. Process for in vitro creation of recombinant polynucleotide sequences by oriented ligation
JP2002526107A (ja) 1998-10-07 2002-08-20 マキシジェン, インコーポレイテッド マイコトキシンの解毒のための核酸を生成するためのdnaシャッフリング
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1073710A4 (en) * 1999-02-04 2007-12-19 Verenium Corp NON-STOCHASTIC DEVELOPMENT OF GENETIC VACCINES AND ENZYMES
US6531316B1 (en) 1999-03-05 2003-03-11 Maxyag, Inc. Encryption of traits using split gene sequences and engineered genetic elements
DE19953854C2 (de) * 1999-11-09 2002-01-17 Max Planck Gesellschaft Verfahren zur Herstellung von Biopolymeren mit veränderten Eigenschaften
US6686515B1 (en) 1999-11-23 2004-02-03 Maxygen, Inc. Homologous recombination in plants
US6479262B1 (en) 2000-05-16 2002-11-12 Hercules, Incorporated Solid phase enzymatic assembly of polynucleotides
US6858422B2 (en) 2000-07-13 2005-02-22 Codexis, Inc. Lipase genes
US7078504B2 (en) * 2000-12-01 2006-07-18 Diversa Corporation Enzymes having dehalogenase activity and methods of use thereof
AU2002227883A1 (en) 2001-01-25 2002-08-06 Evolva Biotech A/S A library of a collection of cells
US8008459B2 (en) 2001-01-25 2011-08-30 Evolva Sa Concatemers of differentially expressed multiple genes
ES2284897T3 (es) 2001-05-18 2007-11-16 Danisco A/S Procedimiento para la preparacion de una masa con una enzima.
EP1840211A1 (en) 2001-10-31 2007-10-03 Danisco A/S Pyranosone dehydratase from phanerochaete chrysosporium
EP1762622B1 (en) 2003-01-17 2011-11-16 Danisco A/S Method for the in situ production of an emulsifier in a foodstuff
BRPI0417533B1 (pt) 2003-12-24 2016-03-01 Danisco enzima variante glicolipídio aciltransferase, uso e método para sua produção, método para o preparo de um produto alimentício e produto assado de farinha, processo de refinamento enzimático
AU2005264077B2 (en) 2004-07-16 2011-06-02 Dupont Nutrition Biosciences Aps Lipolytic enzyme uses thereof in the food industry
GB0421598D0 (en) 2004-09-29 2004-10-27 Cambridge Advanced Tech Modification of plant development and morphology
GB0422052D0 (en) 2004-10-04 2004-11-03 Dansico As Enzymes
GB0423139D0 (en) 2004-10-18 2004-11-17 Danisco Enzymes
DK1844144T3 (da) * 2005-01-10 2010-07-19 Medimmune Ltd Fremgangsmåde til mutagenese
GB0500417D0 (en) 2005-01-10 2005-02-16 Cambridge Antibody Tech Method of mutagenesis
DK2405007T5 (da) 2007-01-25 2014-06-23 Dupont Nutrition Biosci Aps Fremstilling af en lipid acyltransferase ud af transformerede Bacillus licheniformis-celler
US8143046B2 (en) 2007-02-07 2012-03-27 Danisco Us Inc., Genencor Division Variant Buttiauxella sp. phytases having altered properties
MX349825B (es) 2007-03-30 2017-08-15 Univ New York State Res Found Virus atenuados utiles para vacunas.
JP5509094B2 (ja) 2007-12-21 2014-06-04 デュポン ニュートリション バイオサイエンシーズ エーピーエス 脂質アシルトランスフェラーゼを用いる食用油精製のためのプロセス
DK2406399T3 (en) 2009-03-09 2018-03-12 Bioatla Llc MIRAC PROTEINS
GB0908770D0 (en) 2009-04-24 2009-07-01 Danisco Method
MX2011012313A (es) 2009-05-19 2011-12-12 Danisco Uso.
AR077042A1 (es) 2009-06-12 2011-07-27 Danisco Metodo para tratar una composicion que contiene pirofiofitina
GB0920089D0 (en) 2009-11-17 2009-12-30 Danisco Method
WO2011110967A1 (en) 2010-03-12 2011-09-15 Danisco A/S Process
WO2011114251A1 (en) 2010-03-18 2011-09-22 Danisco A/S Foodstuff
CN103003420A (zh) 2010-06-17 2013-03-27 杜邦营养生物科学有限公司 方法
GB201011513D0 (en) 2010-07-08 2010-08-25 Danisco Method
AR085251A1 (es) 2011-02-23 2013-09-18 Danisco Proceso para tratar aceite vegetal
DK2678438T3 (en) 2011-02-23 2017-10-02 Dupont Nutrition Biosci Aps ENZYME TREATMENT OF CHLOROPHYL IN PLANT OILS
AR085253A1 (es) 2011-02-23 2013-09-18 Danisco Metodo para producir una clorofilasa
MX2013011617A (es) 2011-04-08 2013-11-21 Danisco Us Inc Composiciones.
WO2013104660A1 (en) 2012-01-13 2013-07-18 Dupont Nutrition Biosciences Aps Process for treating a plant oil comprising hydrolysing chlorophyll or a chlorophyll derivative and involving partial caustic neutralisation
WO2013104659A2 (en) 2012-01-13 2013-07-18 Dupont Nutrition Biosciences Aps Process
WO2013160372A1 (en) 2012-04-27 2013-10-31 Dupont Nutrition Biosciences Aps Process for treating plant oil involving addition of serial doses of chlorophyll or chlorophyll derivative degrading enzyme
WO2013160374A1 (en) 2012-04-27 2013-10-31 Dupont Nutrition Biosciences Aps Process for refining crude plant oil involving enzymatic hydrolysis and gum recycling
EP2909230B1 (en) 2012-10-19 2019-05-22 Danisco US Inc. Stabilization of biomimetic membranes
DK3083936T3 (en) 2013-12-19 2018-10-22 Danisco Us Inc USE OF HYDROPHOBINES TO INCREASE GAS TRANSFER IN AEROBE FERMENTATION PROCESSES
WO2015150372A1 (en) 2014-04-01 2015-10-08 Dupont Nutrition Biosciences Aps Method for increasing crude palm oil yields
BR112017008304A2 (pt) 2014-10-24 2018-05-15 Dupont Nutrition Biosciences Aps tripeptidil peptidases tolerantes à prolina e seus usos
US20170306360A1 (en) 2014-10-24 2017-10-26 Danisco Us Inc. Method for producing alcohol by use of a tripeptidyl peptidase
MX2018009216A (es) 2016-02-25 2018-11-09 Dupont Nutrition Biosci Aps Metodo para producir un hidrolizado de proteina empleando una tripeptidil peptidasa de aspergillus fumigatus.
EP3491128B1 (en) * 2016-07-29 2021-09-08 New England Biolabs, Inc. Methods and compositions for preventing concatemerization during template- switching

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0316018A3 (en) * 1985-03-29 1989-07-26 Cetus Oncology Corporation Modification of dna sequences
US4959312A (en) * 1985-05-31 1990-09-25 The University Of Tennessee Research Corporation Full spectrum mutagenesis
JP3096722B2 (ja) * 1990-01-17 2000-10-10 日本ケミカルリサーチ株式会社 ポリメラーゼ・チェーン・リアクション用プライマーの作製法およびそれを用いるdnaの増幅法
WO1991012341A1 (en) * 1990-02-12 1991-08-22 Fred Hutchinson Cancer Research Center Improved method for ordered deletions from a fixed point in a cloned insert
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
DE69631787T2 (de) * 1995-12-07 2005-03-10 Diversa Corp., San Diego Verfahren zum screening enzymatischer aktivität
US5965408A (en) * 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5830696A (en) * 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US5789166A (en) * 1995-12-08 1998-08-04 Stratagene Circular site-directed mutagenesis
IL120338A0 (en) * 1997-02-27 1997-06-10 Gesher Israel Advanced Biotecs Single step DNA fragments assembly
GB9712512D0 (en) * 1997-06-16 1997-08-20 Bioinvent Int Ab A method for in vitro molecular evolution of protein function

Also Published As

Publication number Publication date
WO2000058517A1 (en) 2000-10-05
AU4039400A (en) 2000-10-16
CA2329122A1 (en) 2000-10-05
EP1092041A1 (en) 2001-04-18
EP1092041A4 (en) 2001-09-19
JP2004500019A (ja) 2004-01-08

Similar Documents

Publication Publication Date Title
CA2374667C (en) Synthetic ligation reassembly in directed evolution
US6773900B2 (en) End selection in directed evolution
US6361974B1 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
US6358709B1 (en) End selection in directed evolution
MXPA00011569A (es) Re-ensamble de acidos nucleicos mediado por exonucleasa en evolucion dirigida.
US6709841B2 (en) Exonuclease-mediated gene assembly in directed evolution
US6696275B2 (en) End selection in directed evolution
EP1161529A2 (en) End selection in directed evolution
US6939689B2 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
AU2009212959B2 (en) Synthetic ligation reassembly in directed evolution
US20040023327A1 (en) End selection in directed evolution
AU2005203018A1 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
Class et al. Patent application title: SYNTHETIC LIGATION REASSEMBLY IN DIRECTED EVOLUTION Inventors: Jay M. Short (Del Mar, CA, US)
AU2005203719A1 (en) End selection in directed evolution

Legal Events

Date Code Title Description
GB Transfer or rights
FA Abandonment or withdrawal