ES2309175T3 - Montaje dirigido por ordenador de un polinucleotido que codifica un polipeptido diana. - Google Patents

Montaje dirigido por ordenador de un polinucleotido que codifica un polipeptido diana. Download PDF

Info

Publication number
ES2309175T3
ES2309175T3 ES02739079T ES02739079T ES2309175T3 ES 2309175 T3 ES2309175 T3 ES 2309175T3 ES 02739079 T ES02739079 T ES 02739079T ES 02739079 T ES02739079 T ES 02739079T ES 2309175 T3 ES2309175 T3 ES 2309175T3
Authority
ES
Spain
Prior art keywords
polynucleotide
initiation
oligonucleotide
chain
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02739079T
Other languages
English (en)
Inventor
Glen A. Evans
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Janssen Biotech Inc
Original Assignee
Centocor Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centocor Inc filed Critical Centocor Inc
Application granted granted Critical
Publication of ES2309175T3 publication Critical patent/ES2309175T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00686Automatic
    • B01J2219/00689Automatic using computers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00695Synthesis control routines, e.g. using computer programs
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/007Simulation or vitual synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B2200/00Indexing scheme relating to specific properties of organic compounds
    • C07B2200/11Compounds covalently bound to a solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Procedimiento de síntesis de un polinucleótido diana que comprende: a) proporcionar una secuencia de polinucleótido diana; b) identificar por lo menos un polinucleótido de iniciación presente en el polinucleótido diana de a), en el que el polinucleótido de iniciación comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5'' y una prolongación en 3''; c) identificar un segundo polinucleótido presente en el polinucleótido diana de a), en el que el segundo polinucleótido es contiguo al polinucleótido de iniciación y comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto por una prolongación en 5'', una prolongación en 3'' o una prolongación en 5'' y una prolongación en 3'', en el que por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación; d) identificar un tercer polinucleótido presente en el polinucleótido diana de a), en el que el tercer polinucleótido es contiguo a la secuencia de iniciación y comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5'', una prolongación en 3'' o una prolongación en 5'' y una prolongación en 3'', en el que por lo menos una prolongación del tercer polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación que no es complementaria con una prolongación del segundo polinucleótido; e) poner en contacto el polinucleótido de iniciación de b) con el segundo polinucleótido de c) y el tercer polinucleótido de d) en condiciones y durante un tiempo tal adecuado para su apareamiento, resultando la puesta en contacto en un polinucleótido bicatenario contiguo, en el que la secuencia de iniciación se extiende en dos direcciones; f) poner en contacto la mezcla de e) con una ligasa en condiciones adecuadas para la ligadura; y g) repetir opcionalmente b) a f) para añadir secuencialmente polinucleótidos bicatenarios al polinucleótido de iniciación extendido mediante ciclos repetidos de apareamiento y ligadura, sintetizándose un polinucleótido diana.

Description

Montaje dirigido por ordenador de un polinucleótido que codifica un polipéptido diana.
Campo técnico
La presente invención se refiere generalmente al sector de la bioinformática y más específicamente a los procedimientos, algoritmos y aparatos para el montaje de polinucleótidos dirigido por ordenador.
Antecedentes
Las enzimas, anticuerpos, receptores y ligandos son polipéptidos que han evolucionado por presión selectiva para realizar funciones biológicas muy específicas en el medio de un organismo vivo. La utilización de un polipéptido para aplicaciones tecnológicas específicas puede requerir que el polipéptido funcione en medios o en sustratos para los que no fue seleccionado progresivamente. Los polipéptidos aislados de microorganismos que se desarrollan en ambientes extremos proporcionan pruebas abundantes de que estas moléculas son, en general, maleables con respecto a la estructura y función. Sin embargo, el procedimiento para aislar un polipéptido de su medio natural es costoso y requiere mucho tiempo. Por lo tanto, se necesitan nuevos procedimientos para que evolucione sintéticamente el material genético que codifica un polipéptido que posee una actividad deseada.
Existen dos maneras de obtener material genético para manipulaciones de ingeniería genética: (1) aislamiento y purificación de un polinucleótido en forma de ADN o ARN de fuentes naturales o (2) la síntesis de un polinucleótido que utiliza varios métodos químico-enzimáticos, por ejemplo, mediante síntesis en fase sólida (procedimiento WO 90/00626). El método anterior se limita a las secuencias naturales que no se prestan fácilmente a modificación específica. El último método es mucho más complicado y de trabajo intensivo. Sin embargo, el método químico-enzimático tiene muchas propiedades atractivas incluyendo la posibilidad de preparar, sin limitaciones significativas, alguna secuencia de polinucleótido deseable.
Existen dos procedimientos generales actualmente para el montaje sintético de oligonucleótidos en fragmentos largos de polinucleótidos. En primer lugar, los oligonucleótidos que comprenden la secuencia completa que ha de sintetizarse se dejan que se apareen en primer lugar, y a continuación las muescas se reparan con ligasa. Por ejemplo, el documento WO 99/14318 da a conocer dicho procedimiento para la síntesis química completa de genes y genomas, en el que todos los oligonucleótidos que se solapan se combinan en oligonucleótidos monocatenarios o bicatenarios y se aparean en parejas. El fragmento se clona a continuación directamente o se clona tras la ampliación por la reacción en cadena de la polimerasa (PCR). El polinucleótido se utiliza ulteriormente para el montaje in vitro en secuencias más largas. El segundo procedimiento general para la síntesis del gen utiliza polimerasa para rellenar huecos de una sola cadena en las parejas apareadas de oligonucleótidos, como se da a conocer, por ejemplo, en el documento WO 94/12632, documento EP 0 385 410. Después de la reacción de la polimerasa, las zonas monocatenarias de los oligonucleótidos se convierten en bicatenarias, y después de la digestión con la endonucleasa de restricción, pueden clonarse directamente o utilizarse para el montaje adicional de secuencias más largas ligando diferentes fragmentos bicatenarios. Por lo general, después de la reacción de la polimerasa, cada segmento debe clonarse lo que retarda de manera significativa la síntesis de fragmentos de ADN largos y disminuye en gran medida la eficacia de este método. Procedimientos similares se describen también en los documentos WO 00/49142, WO 00/42560, WO 00/42561 y EP 0 316 018. Ningún documento de la técnica anterior da a conocer la prolongación en dos direcciones de un oligonucleótido de inicio de la síntesis de un polinucleótido diana.
La creación de polinucleótidos completamente nuevos, o la modificación sustancial de los polinucleótidos existentes, requiere muchísimo tiempo, es costosa, requiere etapas complejas y múltiples y en algunos casos es imposible. Por consiguiente, existe gran necesidad de un medio eficaz para montar polinucleótidos sintéticos de cualquier secuencia deseada. Dicho procedimiento podría aplicarse universalmente. Por ejemplo, el procedimiento podría utilizarse para preparar de manera eficaz una matriz de polinucleótidos con sustituciones específicas en una secuencia conocida que se expresa e identifica la función mejorada. La presente invención satisface estas necesidades proporcionando procedimientos y composiciones eficaces y potentes para la síntesis de un polinucleótido diana que codifica un polipéptido diana.
Sumario
La presente invención se refiere a las limitaciones en las presentes manipulaciones del ácido nucleico recombinante proporcionando un medio rápido y eficaz para generar una secuencia de ácido nucleico, que incluye genes completos, segmentos cromosómicos, cromosomas y genomas. Debido a que este método se basa en un método completamente sintético, no existen limitaciones, tales como la disponibilidad de ácidos nucleicos existentes, para impedir la construcción de segmentos incluso muy largos de ácido nucleico.
En una forma de realización, la invención proporciona un procedimiento de síntesis de una secuencia de polinucleótido diana que incluye; a) proporcionar una secuencia de polinucleótido diana; b) identificar por lo menos un polinucleótido de iniciación presente en el polinucleótido diana que incluye por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5' y una prolongación en 3'; c) identificar un segundo polinucleótido presente en el polinucleótido diana que es contiguo al polinucleótido de inicio e incluye por lo menos un oligonucleótido más con cadena apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto por una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', en el que por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación; d) identificar un tercer polinucleótido presente en el polinucleótido diana que es contiguo a la secuencia de iniciación e incluye por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', en el que por lo menos una prolongación del tercer polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación que no es complementaria con una prolongación del segundo polinucleótido; e) poner en contacto el polinucleótido de iniciación con el segundo polinucleótido y el tercer polinucleótido en condiciones y durante un tiempo tal adecuado para su apareamiento, la puesta en contacto resultante en un polinucleótido bicatenario contiguo, dando como resultado la prolongación en dos direcciones del polinucleótido de iniciación; f) poner en contacto la mezcla de e) con una ligasa en condiciones adecuadas para la ligadura; y g) repetir opcionalmente b) a f) para añadir sucesivamente polinucleótidos bicatenarios al polinucleótido de iniciación extendido mediante ciclos repetidos de apareamiento y ligadura, con lo que se sintetiza un polinucleótido diana.
La invención proporciona además un procedimiento de síntesis de un polinucleótido diana que incluye: a) proporcionar una secuencia de polinucleótido diana procedente de una secuencia modelo; b) identificar por lo menos una secuencia de polinucleótido de iniciación presente en la secuencia de polinucleótido diana de a), en el que el polinucleótido de iniciación que incluye: 1) un primer oligonucleótido con cadena más; 2) un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que incluye una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; c) aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más con el oligonucleótido con cadena menos de b) dando como resultado un polinucleótido de iniciación parcialmente bicatenario que incluye una prolongación en 5' y una prolongación en 3'; d) identificar una segunda secuencia de polinucleótido presente en la secuencia de polinucleótido diana de a), en la que la segunda secuencia de polinucleótido es contigua a la secuencia del polinucleótido de iniciación e incluye: 1) un primer oligonucleótido con cadena más; 2) un segundo polinucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que comprende una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; e) aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más con el oligonucleótido con cadena menos de d) dando como resultado un segundo polinucleótido parcialmente bicatenario, en el que por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación; f) identificar un tercer polinucleótido presente en el polinucleótido diana de a), en el que el tercer polinucleótido presente en el polinucleótido diana de a), en el que el tercer polinucleótido es contiguo a la secuencia de iniciación y comprende: 1) un primer oligonucleótido con cadena más; 2) un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que comprende una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; g) aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más al oligonucleótido con cadena menos de f) dando como resultado un segundo polinucleótido parcialmente bicatenario, en el que por lo menos una prolongación del tercer polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación y no complementaria con una prolongación del segundo polinucleótido; h) poner en contacto el polinucleótido de iniciación de c) con el segundo polinucleótido de e) y el tercer polinucleótido de g) en condiciones y durante un tiempo tal adecuado para su apareamiento, el polinucleótido en contacto resultante en un polinucleótido bicatenario contiguo, en el que la secuencia de iniciación se extiende en dos direcciones; i) poner en contacto la mezcla de h) con una ligasa en condiciones adecuadas para la ligadura; y j) opcionalmente repetir b) a i) para añadir sucesivamente polinucleótidos bicatenarios al polinucleótido de iniciación prolongada mediante ciclos repetidos de apareamiento y ligadura, con lo cual se sintetiza un polinucleótido diana.
En otra forma de realización, la invención proporciona un procedimiento para sintetizar un polinucleótido diana, e incluye; a) proporcionar una secuencia de polinucleótido diana procedente de una secuencia modelo; b) identificar por lo menos un polinucleótido de iniciación presente en un polinucleótido diana que incluye por lo menos un oligonucleótido con cadena más apareado a por lo menos un oligonucleótido con cadena menos; c) poner en contacto el polinucleótido de iniciación en condiciones adecuadas para el apareamiento del cebador con un primer oligonucleótido que tiene complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación, y un segundo oligonucleótido que tiene complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación; d) catalizar en condiciones adecuadas la prolongación del cebador: 1) síntesis del polinucleótido procedente del 3'-hidroxilo de la cadena más del polinucleótido de iniciación; 2) síntesis del polinucleótido del 3'-hidroxilo del primer oligonucleótido apareado; 3) síntesis del polinucleótido procedente del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación; y 4) síntesis del polinucleótido procedente del 3'-hidroxilo del segundo oligonucleótido apareado, dando como resultado la prolongación en dos direcciones de la secuencia de iniciación con lo que se forma un polinucleótido naciente de iniciación prolongado; e) poner en contacto el polinucleótido de iniciación prolongado de d) en condiciones adecuadas para el apareamiento del cebador con un tercer oligonucleótido que es complementario en parte con la parte 3' de la cadena más del polinucleótido de iniciación prolongado y un cuarto oligonucleótido que es complementario en parte con la parte 3' de la cadena menos del polinucleótido de iniciación prolongado; f) catalizar en condiciones adecuadas para la prolongación del cebador: 1) síntesis del polinucleótido del 3'-hidroxilo de la cadena más del polinucleótido de iniciación prolongado; 2) síntesis del polinucleótido procedente del 3'-hidroxilo del tercer oligonucleótido apareado; 3) síntesis del polinucleótido procedente del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación prolongado; y 4) síntesis del polinucleótido procedente del 3'-hidroxilo del cuarto oligonucleótido apareado, dando como resultado la prolongación en dos direcciones de la secuencia de iniciación con lo que se forma un polinucleótido de iniciación prolongado y naciente; y g) repetir opcionalmente desde e) hasta f) si se desea, dando como resultado la formación de la secuencia de polinucleótido diana.
La invención proporciona además un procedimiento para aislar un polipéptido diana codificado por un polinucleótido diana generado por un procedimiento de la invención; a) incorporando un polinucleótido diana en un vector de expresión; b) introduciendo el vector de expresión en una célula hospedadora adecuada; c) cultivando la célula en condiciones y durante un tiempo tal como para favorecer la expresión del polipéptido diana codificado por el polinucleótido diana; y d) aislando el polipéptido diana.
La invención proporciona además un procedimiento de síntesis de un polinucleótido diana que incluye; a) proporcionar una secuencia de polinucleótido diana obtenida a partir de una secuencia modelo; b) sintetizar químicamente una variedad de oligonucleótidos monocatenarios cada uno de los cuales es complementario en parte con por lo menos un oligonucleótido presente en la diversidad, en la que la secuencia de la diversidad de oligonucleótidos es una secuencia contigua del polinucleótido diana; c) poner en contacto los oligonucleótidos inversos en parte en condiciones y durante un tiempo tal adecuado para el apareamiento, la puesta en contacto resultante en una diversidad de polinucleótidos parcialmente bicatenarios, donde cada polinucleótido bicatenario incluye una prolongación en 5' y una prolongación en 3'; d) identificar por lo menos un polinucleótido de iniciación procedente de la secuencia modelo presente en la diversidad de polinucleótidos bicatenarios; e) someter una mezcla que incluya el polinucleótido de iniciación y 1) un polinucleótido bicatenario que se aparee con la parte en 5' de dicha secuencia de iniciación; 2) un polinucleótido bicatenario que se aparee con la parte 3' del polinucleótido de iniciación; y 3) una ADN ligasa en condiciones adecuadas para el apareamiento y ligadura, en la que el polinucleótido de iniciación se prolonga en dos direcciones; f) aparear sucesivamente los polinucleótidos bicatenarios con el polinucleótido de iniciación prolongado mediante ciclos repetidos de apareamiento, con lo que se produce el polinucleótido diana.
La invención proporciona además un medio de almacenamiento legible por ordenador que tiene un programa informático almacenado para su utilización en la generación de una secuencia de polinucleótido diana procedente de una secuencia modelo, comprendiendo el programa informático instrucciones para dar lugar a un sistema informático para: a) identificar una secuencia de polinucleótido de iniciación contenida en la secuencia de polinucleótido diana; b) analizar la secuencia de polinucleótido diana en múltiples oligonucleótidos distintos y parcialmente complementarios; c) controlar el montaje de la secuencia de polinucleótido diana controlando la prolongación en dos direcciones de la secuencia de polinucleótido de iniciación mediante la adición sucesiva de oligonucleótidos parcialmente complementarios que producen un polinucleótido bicatenario contiguo.
La invención proporciona además un procedimiento para la síntesis automática de una secuencia de polinucleótido diana, que incluye: a) proporcionar al usuario una oportunidad de comunicar una secuencia de polinucleótido diana deseada; b) permitir al usuario transmitir la secuencia de polinucleótido diana deseada a un servidor; c) proporcionar al usuario una denominación única; d) obtener la secuencia de polinucleótido diana transmitida proporcionada por el usuario, que comprende además el procedimiento de la invención para sintetizar un polinucleótido diana.
La invención proporciona además un procedimiento para la síntesis automática de una secuencia de polinucleótido, incluyendo: a) proporcionar a un usuario un mecanismo para comunicar un modelo de secuencia de polinucleótido; b) proporcionar opcionalmente al usuario una oportunidad de comunicar por lo menos una modificación deseada de la secuencia del modelo si se desea; c) permitir al usuario transmitir la secuencia del modelo y la modificación deseada a un servidor; d) proporcionar al usuario una única denominación; e) obtener la secuencia del modelo transmitida y la modificación opcional deseada proporcionada por el usuario; f) introducir en un ordenador programado, mediante un dispositivo de entrada, los datos que incluyen por lo menos una parte de la secuencia del modelo de polinucleótido; g) determinar, utilizando el procesador, la secuencia de la secuencia del modelo del polinucleótido que contiene la modificación deseada; h) determinar además, utilizando el procesador, por lo menos una secuencia de polinucleótido de iniciación presente en la secuencia del polinucleótido modelo; i) seleccionar, utilizando el procesador, un modelo para sintetizar la secuencia de polinucleótido del modelo modificada basada en la posición de la secuencia de iniciación en la secuencia de polinucleótido del modelo; y j) sacar, del dispositivo de salida, los resultados de por lo menos una determinación.
A menos que se defina de otro modo, todas las expresiones técnicas y científicas utilizadas en la presente memoria tienen el mismo significado entendido habitualmente por cualquier experto en la materia al que pertenece la presente invención. Por ejemplo, las abreviaturas de una letra y tres letras para los aminoácidos y las abreviaturas de una letra para los nucleótidos se entienden normalmente. Aunque los procedimientos y los materiales similares o equivalentes a los descritos en la presente memoria pueden utilizarse en la práctica o experimentación de la presente invención, se describen a continuación los procedimientos y materiales adecuados. Además, los materiales, procedimientos y ejemplos son a título ilustrativo solamente y no pretenden ser limitativos.
Los detalles de una o más formas de realización de la invención se publican en los dibujos adjuntos y la descripción a continuación. Otras propiedades, objetivos y ventajas de la invención resultarán evidentes a partir de la descripción y los dibujos y de las reivindicaciones.
Descripción de los dibujos
Los símbolos de referencia similares en los diversos dibujos indican elementos similares.
La Figura 1 representa placas de 96 pocillos para la síntesis de oligonucleótido F (es decir, "directo" o "cadena más"), la síntesis de oligonucleótidos R (es decir, "inverso" o "cadena menos") y una placa T (es decir, "temperatura") para el apareamiento de los oligonucleótidos F y T.
La Figura 2 representa el plano del grupo oligonucleótido en el que los oligonucleótidos F y los oligonucleótidos R están apareados para formar un polinucleótido contiguo.
La Figura 3 representa el esquema de conjunto de una secuencia de polinucleótido diana que define un gen, genoma, conjunto de genomas o secuencia polipeptídica. La secuencia se diseña por ordenador y se utiliza para generar un conjunto de fragmentos de oligonucleótido analizados que abarcan la cadena + y - de una secuencia de polinucleótido diana que codifica un polipéptido diana.
La Figura 4 representa un esquema de los módulos de síntesis del polinucleótido. Un cabezal nanodosificador con una gran cantidad de válvulas depositará productos químicos de síntesis en recipientes del conjunto. La distribución química desde el depósito de reactivo puede controlarse utilizando una bomba de jeringuilla. Debajo de las cámaras de reacción existe una serie de recipientes del conjunto unidos a microcanales que desplazarán los fluidos por microfluodinámica.
La Figura 5 representa la síntesis del oligonucleótido, el conjunto de oligonucleótido por agrupación e apareación, y la ligadura puede realizarse utilizando mezclado microfluido.
La Figura 6 representa la agrupación sucesiva de los oligonucleótidos sintetizados en las matrices.
La Figura 7 representa la etapa de agrupación de los componentes del oligonucleótido mediante los conjuntos del colector que se producen en el conjunto completo de todos los oligonucleótidos de la matriz.
La Figura 8 representa un ejemplo de un módulo del conjunto que comprende una serie completa de colectores de agrupación producidos utilizando la microfabricación en una sola unidad. Varias configuraciones del colector de agrupación permitirán el montaje de números crecientes de matrices correctas de los oligonucleótidos del componente analizados.
La Figura 9 representa la configuración para el conjunto de oligonucleótidos sintetizados en una matriz predefinida. El paso a través del dispositivo del conjunto en presencia de ADN ligasa y de otro tampón apropiado y de componentes químicos facilitará el montaje del polinucleótido bicatenario.
La Figura 10 representa un ejemplo del diseño del dispositivo de agrupamiento. Se graban microestrías o canales microfluídicos en la superficie del dispositivo de agrupamiento. El dispositivo proporciona un recipiente para la microrreacción en la unión de los dos canales para 1) el mezclado de las dos corrientes, 2) mantenimiento controlado de la temperatura o ciclación en la zona de unión y 3) expulsión de la mezcla ligada del canal de salida en la siguiente serie de cámaras de agrupación y ligadura.
La Figura 11 representa el diseño de una plataforma para la síntesis del polinucleótido que comprende placas de micropocillos estudiadas con una gran cantidad de canales para microdispersión.
La Figura 12 representa un ejemplo de una plataforma para la síntesis de polinucleótidos de gran capacidad utilizando microplacas con micropocillos de alta densidad capaces de sintetizar en exceso 1536 componentes de oligonucleótidos por placa.
La Figura 13 representa un formato del conjunto de polinucleótidos que utiliza la síntesis de oligonucleótidos unidos por la superficie en lugar de la síntesis soluble. En esta configuración, los oligonucleótidos se sintetizan con un enlazador que permite la unión a un soporte sólido.
La Figura 14 representa un diagrama del conjunto sistemático de polinucleótidos sobre un soporte sólido. Una serie de oligonucleótidos del componente analizados se ordenan en una matriz con un oligonucleótido estabilizador ligado. Se colocan en la solución un conjunto de oligonucleótidos sustrato de ligadura y se realiza el montaje sistemático en la fase sólida por apareación, ligadura y fusión sucesivas.
La Figura 15 representa el conjunto de polinucleótidos que utiliza oligonucleótidos del componente unidos a una serie de electrodos metálicos en un chip microelectrónico. Cada electrodo puede controlarse independientemente con respecto a la corriente y al voltaje.
La Figura 16 representa generalmente un procedimiento de la invención del montaje con prolongación del cebador.
La Figura 17 proporciona un diagrama del sistema de la invención.
La Figura 18 representa una vista en perspectiva de un instrumento de la invención.
Descripción detallada
La secuencia completa de los genomas complejos, incluyendo el genoma humano, hacen posible aproximaciones funcionales a gran escala a la genética. La presente invención esboza un nuevo método para utilizar los resultados de la información de la secuencia genómica mediante el montaje del polinucleótido dirigido por ordenador basándose en la información disponible en las bases de datos tales como las bases de datos del genoma humano. Específicamente, la presente invención puede utilizarse para sintetizar, montar y seleccionar una nueva secuencia de polinucleótido sintético diana que codifica un polipéptido diana. El polinucleótido diana puede codificar un polipéptido diana que presenta actividad biológica potenciada o alterada en comparación con un polipéptido modelo codificado por una secuencia de polinucleótido natural (de tipo natural) o una secuencia de polinucleótido modelo. A continuación, pueden utilizarse análisis normalizados para examinar la actividad de un polipéptido diana expresado. Por ejemplo, puede analizarse el polipéptido diana expresado para determinar su capacidad para realizar la función del correspondiente polipéptido modelo o para determinar si se ha producido un polipéptido diana que presenta una nueva función. De este modo, la presente invención proporciona unos medios para desarrollar un polipéptido modelo por síntesis, de modo dirigido por ordenador, polinucleótidos que codifican un polipéptido procedentes de un polipéptido modelo.
En una forma de realización, la invención proporciona un procedimiento de síntesis de un polinucleótido diana proporcionando una secuencia de polinucleótido diana e identificando por lo menos un polinucleótido de iniciación presente en el polinucleótido diana que incluye por lo menos un oligonucleótido de cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5' y de una prolongación en 3'. Tal como se utiliza en la presente memoria, una "secuencia de polinucleótido diana" incluye cualquier secuencia de ácidos nucleicos adecuada para codifica un polipéptido diana que puede sintetizarse por un procedimiento de la invención. Puede utilizarse una secuencia de polinucleótido diana para generar un polinucleótido diana utilizando un aparato capaz de montar secuencias nucleicas. Generalmente, una secuencia de polinucleótido diana es un segmento lineal de ADN que tiene una zona bicatenaria; el segmento puede ser de cualquier longitud suficientemente larga para ser creado por hibridación de por lo menos dos oligonucleótidos que tengan zonas complementarias. Se contempla que un polinucleótido diana puede ser de 100, 200, 300, 400, 800, 1.000, 1.500, 2.000, 4.000, 8.000, 10.000, 12.000, 18.000, 20.000, 40.000, 80.000 o más pares de bases de longitud. De hecho, se contempla que los procedimientos de la presente invención puedan crear genomas artificiales completos de longitudes comparables a los genomas bacterianos, de levadura, víricos, de mamífero, de anfibio, de reptil o de ave. En las formas de realización más específicas, el polinucleótido diana es un gen que codifica un polipéptido de interés. El polinucleótido diana puede incluir además elementos no codificadores tales como los orígenes de replicación, telómeros, activadores, potenciadores, señales de inicio e interrupción de la transcripción y traducción, intrones, puntos de corte y empalme del exón, componentes de la estructura de la cromatina y otras secuencias reguladoras. El polinucleótido diana puede comprender múltiples genes, segmentos cromosómicos, cromosomas e incluso genomas completos. Un polinucleótido de la invención puede proceder de secuencias procarióticas o eucarióticas incluyendo organismos bacterianos, levaduras, virus, de mamífero, de anfibio, de reptil, de aves, de plantas, de arqueobacterias y de otros ADN que contienen organismos vivos.
Un "Oligonucleótido", tal como se utiliza en la presente memoria, se define como una molécula compuesta por dos o más desoxirribonucleótidos o ribonucleótidos, preferentemente más de tres. Su tamaño exacto dependerá de muchos factores, tales como la temperatura de reacción, la concentración de sales, la presencia de desnaturalizantes tales como formamida y el grado de complementariedad con la secuencia con la que se desea que se aparee el oligonucleótido.
El término "nucleótido" tal como se utiliza en la presente memoria puede referirse a los nucleótidos presentes en el ADN o ARN y por lo tanto incluye nucleótidos con adenina, citosina, guanina, timina y uracilo como base, siendo la desoxirribosa o la ribosa el resto azúcar. Debe valorarse sin embargo que otras bases modificadas capaces de emparejamiento de bases con una de las bases convencionales, adenina, citosina, guanina, timina y uracilo, puedan utilizarse en un oligonucleótido utilizado en la presente invención. Dichas bases modificadas incluyen por ejemplo 8-azaguanina e hipoxantina. Si se desea los nucleótidos pueden llevar una etiqueta o marcador de modo que en la incorporación en un producto de prolongación del cebador, aumentan la señal asociada con el producto de ampliación del cebador, por ejemplo para captura en fase sólida.
Un oligonucleótido de "cadena más", por convenio, incluye un segmento de ADN corto, monocatenario, que empieza en el extremo 5' a la izquierda según se lee la secuencia. Un oligonucleótido de "cadena menos" incluye un segmento de ADN corto, monocatenario, que comienza con el extremo 3' a la izquierda según se lee la secuencia. Los procedimientos de síntesis de oligonucleótidos se encuentran, por ejemplo, en Oligonucleotide Synthesis: A Practical Approach, Gate, ed., IRL Press, Oxford (1984), incorporada a la presente memoria como referencia en su totalidad. Se han proporcionado técnicas de síntesis en fase sólida para la síntesis de varias secuencias peptídicas, por ejemplo, en numerosos "pins" (Véase por ejemplo, Geysen et al., J. Immun. Meth. (1987) 102:259-274, incorporada a la presente memoria como referencia en su totalidad).
Se han concebido procedimientos adicionales de formación de grandes matrices de oligonucleótidos y otras secuencias poliméricas en un corto periodo de tiempo. De anotación específica, Pirrung et al., patente US nº 5.143.854 (véase también la solicitud PCT nº WO 90/15070), Fodor et al., publicación PCT nº 92/10092 y Winkler et al., patente US nº 6.136.269, incorporadas todas en la presente memoria como referencia, dan a conocer procedimientos de formación de matrices extensas de secuencias de polímeros que utilizan, por ejemplo, técnicas de síntesis dirigidas por la luz. Véase también Fodor et al., Science (1991) 251: 767-777, incorporada también a la presente memoria en su totalidad como referencia. Se ha realizado algún trabajo para automatizar la síntesis de matrices de polímero. Por ejemplo, la solicitud PCT nº WO 89/10977 de Southern, describe la utilización de un trazador de pluma convencional para depositar tres monómeros diferentes en doce posiciones distintas sobre un sustrato.
Una "secuencia de polinucleótido de iniciación", tal como se utiliza en la presente memoria, es una secuencia contenida en una secuencia de polinucleótido diana e identificada mediante un algoritmo de la invención. Un "polinucleótido de iniciación" es la forma de realización física de una secuencia de polinucleótido de iniciación. Para el montaje de la ligadura de un polinucleótido diana, un polinucleótido de iniciación comienza el montaje proporcionando un anclaje para la hibridación de los polinucleótidos ulteriores contiguos al polinucleótido de iniciación. Por lo tanto, para el montaje de la ligadura, un polinucleótido de iniciación es el ácido nucleico parcialmente bicatenario con el que se proporciona la/s prolongaciones monocatenarias para la hibridación de una molécula de ácido nucleico bicatenaria y contigua. Para el montaje de la prolongación del cebador de un polinucleótido diana, un polinucleótido de iniciación comienza el montaje proporcionando una plantilla para el apareamiento de los oligonucleótidos ulteriores contiguos al polinucleótido de iniciación. Por lo tanto, para el montaje de la prolongación del cebador, un polinucleótido de iniciación puede ser bicatenario en parte o completamente bicatenario.
En una forma de realización, un polinucleótido de iniciación de la invención puede estar unido a un soporte sólido para mejorar la eficacia. La fase sólida permite la separación eficaz del polinucleótido diana montado a partir de otros componentes de la reacción. Diferentes soportes pueden aplicarse en el procedimiento. Por ejemplo, los soportes pueden ser cabezales magnéticos de látex o perlas de vidrio porosas para control magnético que permite que el producto que se desea se separe magnéticamente de la mezcla de reacción. Uniendo el polinucleótido de iniciación a dichas perlas puede llevarse a cabo una variedad de procedimientos conocidos, por ejemplo el tratamiento con carbodiimida (Gilham, Biochemistry 7:2809-2813 (1968); Mizutani y Tachbana, J. Chromatography 356:202-205 (1986); Wolf et al., Nucleic Acids Res. 15:2911-2926 (1987); Musso, Nucleic Acids Res. 15:5353-5372 (1987); Lund et al., Nucleic Acids Res. 16:10861-10880 (1988)).
El polinucleótido de iniciación unido a la fase sólida puede actuar como un anclaje para la síntesis continuada del polinucleótido diana. El conjunto puede realizarse mediante la adición de polinucleótidos contiguos junto con la ligasa para el montaje de la ligadura o mediante la adición de oligonucleótidos junto con la polimerasa para el montaje de la prolongación del cebador. Después del periodo de incubación apropiado, los componentes no unidos del procedimiento pueden lavarse y la reacción puede repetirse otra vez para mejorar la eficacia de la utilización de la plantilla. Alternativamente, puede añadirse otra serie polinucleótidos u oligonucleótidos para continuar el montaje.
La fase sólida, que debe utilizarse de manera eficaz para la síntesis, puede contener poros con suficiente espacio para la síntesis de las moléculas de ácido nucleico largas. La fase sólida puede estar compuesta de material que no puede unirse de manera no específica a ninguno de los componentes no deseados de la reacción. Una manera de resolver el problema consiste en utilizar perlas de vidrio de poro controlado apropiadas para moléculas de ADN largas. El polinucleótido de iniciación puede unirse a las perlas a través de un conector largo. La función del conector consiste en colocar el polinucleótido de iniciación en la superficie del soporte sólido a una distancia deseable.
El procedimiento de la invención incluye además identificar una segunda secuencia de polinucleótidos presente en el polinucleótido diana que está contigua al polinucleótido de iniciación e incluye por lo menos un oligonucleótido con cadena más apareado a un oligonucleótido con cadena menos dando como resultado un polinucleótido bicatenario parcial compuesto por una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', donde por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación. Dos o más oligonucleótidos que tienen zonas complementarias, donde están permitidas, "se hibridarán" (es decir, pares de bases) en condiciones apropiadas, produciendo de este modo una zona bicatenaria. Con el fin de aparearse (es decir, hibridarse) los oligonucleótidos pueden ser por lo menos parcialmente complementarios. La expresión "complementario con" se utiliza en la presente memoria en relación con los nucleótidos para significar un nucleótido que emparejará la base con otro nucleótido específico. Así el trifosfato de adenosina es complementario con el trifosfato de uridina o el trifosfato de timidina y el trifosfato de guanosina es complementario con el trifosfato de citidina.
Tal como se utiliza en la presente memoria, una prolongación en 5' ó 3' significa una zona en el extremo 5' o 3', o 5' y 3', de un polinucleótido que es monocatenario, es decir, sin bases emparejadas. Una prolongación proporciona un medio para el apareamiento ulterior de un polinucleótido contiguo que contiene una prolongación que es complementaria con la prolongación del polinucleótido contiguo. Dependiendo de la aplicación prevista, se deseará utilizar varias condiciones de apareamiento para conseguir grados variables de apareamiento de manera selectiva.
Para las aplicaciones que requieren gran selectividad, se deseará por lo general utilizar condiciones relativamente severas para formar los híbridos, por ejemplo, se seleccionarán condiciones salinas relativamente bajas y/o de alta temperatura, tal como la proporcionada por NaCl aproximadamente 0,02 M a aproximadamente 0,10 M a temperaturas entre aproximadamente 50ºC y aproximadamente 70ºC. Dichas condiciones de alta severidad toleran poco, si es que algo, la incompatibilidad entre el oligonucleótido y la plantilla o cadena diana. Generalmente se aprecia que las condiciones pueden hacerse más severas por adición de cantidades crecientes de formamida.
Para determinadas aplicaciones, por ejemplo, por analogía con la sustitución de nucleótidos por mutagénesis dirigida al sitio, se aprecia que pueden utilizarse condiciones de severidad inferior. En estas condiciones, puede ocurrir la hibridación aun cuando las secuencias de la sonda y de la cadena diana no sean perfectamente complementarias, pero están desemparejadas en una o más posiciones. Las condiciones pueden hacerse menos severas aumentando la concentración salina y disminuyendo la temperatura. Por ejemplo, una condición de severidad del medio podría proporcionarse mediante NaCl aproximadamente 0,1 a 0,25 M a temperaturas entre aproximadamente 37ºC y aproximadamente 55ºC, aunque una condición de baja severidad podría proporcionarse mediante la sal 0,15 M a aproximadamente 0,9 M, a temperaturas que oscilan entre aproximadamente 20ºC y aproximadamente 55ºC. De este modo, las condiciones de la hibridación pueden ser manipuladas fácilmente dependiendo de los resultados deseados.
En determinadas formas de realización, presentará ventajas determinar la la hibridación de los oligonucleótidos utilizando un marcador. Una amplia variedad de marcadores apropiados son conocidos en la técnica, incluyendo fluorescentes, radioactivos, enzimáticos u otros ligandos, tales como avidina/biotina, que son capaces de ser detectados. En las formas de realización preferidas, se puede desear utilizar un marcador fluorescente o una etiqueta enzimática tal como ureasa, fosfatasa alcalina o peroxidasa, en lugar de reactivos radioactivos u otros indeseables desde un punto de vista medioambiental. En el caso de las etiquetas enzimáticas, se conocen sustratos de indicador colorimétrico que pueden utilizarse para proporcionar un medio para la detección visible al ojo humano o espectrofotométricamente para identificar si se ha producido la hibridación específica con oligonucleótido inverso.
En las formas de realización que conllevan una fase sólida, por ejemplo, por lo menos un oligonucleótido de un polinucleótido de iniciación se absorbe o si no se fija a una matriz o superficie seleccionada. Este ácido nucleico monocatenario, fijado se somete a continuación a hibridación con los oligonucleótidos inversos en las condiciones deseadas. Las condiciones seleccionadas dependerán también de las circunstancias específicas basadas en criterios específicos requeridos (dependiendo, por ejemplo, del contenido de G+C, del tipo de ácido nucleico diana, de la fuente de ácido nucleico, del tamaño de la sonda de hibridación, etc.). Después del lavado de la superficie apareada para eliminar los oligonucleótidos unidos de manera no específica, la hibridación puede detectarse, o incluso cuantificarse, mediante el marcador.
El procedimiento de la invención proporciona además un tercer polinucleótido presente en el polinucleótido diana que es contiguo a la secuencia de iniciación y proporciona una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', donde por lo menos una prolongación del tercer polinucleótido es complementario con por lo menos una prolongación del polinucleótido de iniciación que no es complementario con una prolongación del segundo polinucleótido.
El procedimiento proporciona además poner en contacto el polinucleótido de iniciación con el segundo polinucleótido y el tercer polinucleótido en condiciones y para dicho tiempo adecuado para el apareamiento, la puesta en contacto resultante en un polinucleótido bicatenario contiguo, dando como resultado la prolongación en dos direcciones del polinucleótido de iniciación. Los polinucleótidos apareados se ponen en contacto con una ligasa en condiciones adecuadas para la ligadura. El procedimiento expuesto anteriormente se repite opcionalmente para añadir secuencialmente polinucleótidos bicatenarios al polinucleótido de iniciación prolongado mediante ciclos repetidos de apareamiento y ligadura.
Una secuencia de polinucleótido diana puede diseñarse de novo u obtenerse de una "secuencia de polinucleótido modelo". Tal como se utiliza en la presente memoria, una "secuencia de polinucleótido modelo" incluye cualquier secuencia de ácido nucleico que codifique una secuencia polipeptídica modelo. Una secuencia polipeptídica modelo proporciona una base para diseñar un polinucleótido modificado de modo que se sintetiza un polinucleótido diana que incorpora la modificación deseada.
La presente invención proporciona también procedimientos que pueden utilizarse para sintetizar, de novo, polinucleótidos que codifican conjuntos de genes, ya sea genes naturales expresados a partir de montajes del activador naturales o artificiales o genes artificiales procedentes de secuencias de ADN sintético, que codifican elementos de sistema biológicos que llevan a cabo una función o atribución especificada de un organismo artificial así como genomas completos. Al producir dichos sistemas y genomas, la presente invención proporciona la síntesis de una réplica competente, polinucleótido bicatenario, en la que el polinucleótido tiene un origen de réplica, una primera zona de codificación y un primer elemento regulador que dirige la expresión de la primera región de codificación. Replicación competente, significa que el polinucleótido es capaz de dirigir su propia réplica. De este modo, se prevé que el polinucleótido posea todas las señales de actuación cis requeridas para facilitar su propia síntesis. A este respecto, el polinucleótido será similar a un plásmido o un virus, de modo que una vez colocado dentro de una célula, es capaz de réplica mediante una combinación de las funciones del polinucleótido y celulares.
Una secuencia de polinucleótido que define un gen, genoma, conjunto de genes o secuencia proteínica puede diseñarse en modo asistido por ordenador (expuesto a continuación) y utilizarse para generar una serie de oligonucleótidos analizados que abarcan las cadenas más (+) y menos (-) de la secuencia. Tal como se utiliza en la presente memoria, "analizado" significa una secuencia de polinucleótido diana que se ha diseñado de mano asistido por ordenador de modo que se identifican una serie de secuencias oligonucleotídicas contiguas. Las secuencias de polinucleótido se sintetizan individualmente y se utilizan en un procedimiento de la invención para generar un polinucleótido diana. La longitud de un oligonucleótido es completamente variable. Preferentemente, los oligonucleótidos utilizados en los procedimientos de la invención tienen entre aproximadamente 15 y 100 bases y más preferentemente entre 20 y 50 bases. Las longitudes específicas incluyen, pero no se limitan a, 15,16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 y 100 bases. Dependiendo del tamaño, el solapamiento entre los oligonucleótidos con complementariedad parcial puede diseñarse para que tenga entre 5 y 75 bases por par de oligonucleó-
tidos.
Los oligonucleótidos preferentemente se tratan con polinucleótido cinasa, por ejemplo, polinucleótido T4 cinasa. La "cinasación" puede realizarse antes, o después del mezclado del conjunto de oligonucleótidos o después, pero antes de el apareamiento. Tras el apareamiento, los oligonucleótidos se tratan con una enzima que tiene una función de ligadura. Por ejemplo, una ADN ligasa se utilizará por lo general para esta función. Sin embargo, la topoisomerasa, que no requiere fosforilación en 5', es rápida y opera a temperatura ambiente, y puede utilizarse en lugar de ligasa. Por ejemplo, los oligonucleótidos de 50 pares de bases que se solapan en 25 bases pueden sintetizarse mediante un sintetizador de matriz oligonucleotídica (OAS). Un conjunto con cadena 5' (+) de oligonucleótidos se sintetiza en una placa de 96 pocillos y la segunda serie 3' o de cadena (-) se sintetiza en una segunda placa de microvaloración de 96 pocillos. La síntesis puede realizarse utilizando la química de la fosforamidita modificada para minimizar el tamaño de la reacción y generar pequeños volúmenes de reacción y rendimientos comprendidos en el intervalo de 2 a 5 nmoles. La síntesis se realiza en perlas de vidrio de poro controlado (CPG), a continuación los oligonucleótidos completados se desbloquean, desprotegen y se separan de las perlas. Los oligonucleótidos se liofilizan, se vuelven a poner en suspensión en agua y se fosforilan en 5' utilizando polinucleótido cinasa y ATP para permitir la
ligadura.
La serie de secuencias oligonucleotídicas con matriz en la placa puede montarse utilizando una estrategia de agrupamiento mixto. Por ejemplo, puede realizarse el agrupamiento generalizado de oligonucleótidos componentes utilizando un robot de pipeteado automático Beckman Biomek modificado, u otra estación de trabajo de laboratorio automática. Los fragmentos pueden combinarse con tampón y enzima (Taq I ADN ligasa o Egea Assemblase^{TM}, por ejemplo). El mezclado puede realizarse en placas de micropocillos. Después de cada etapa de agrupamiento, la temperatura se varía gradualmente para permitir el apareamiento y ligadura, a continuación se lleva a cabo el agrupamiento adicional.
El montaje del polinucleótido diana implica formar una serie de compuestos intermedios. Una serie de compuestos intermedios puede incluir un oligonucleótido de cadena más apareado con un oligonucleótido de cadena menos, como se describió anteriormente. El compuesto intermedio apareado puede formarse proporcionando un solo oligonucleótido con cadena más apareado a un solo oligonucleótido con cadena menos.
Alternativamente, dos o más oligonucleótidos pueden comprender la cadena más o la cadena menos. Por ejemplo, con el fin de construir un polinucleótido (por ejemplo, un polinucleótido de iniciación) que puede utilizarse para montar un polinucleótido diana de la invención, pueden aparearse tres o más oligonucleótidos. Por lo tanto, un primer oligonucleótido con cadena más, un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más, y un oligonucleótido con cadena menos que tiene una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más puede aparearse para formar un polinucleótido parcialmente bicatenario. El polinucleótido puede incluir una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3'. El primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más son secuencias contiguas de modo que son ligables. El oligonucleótido con cadena menos es en parte complementario con ambos oligonucleótidos con cadena más y actúa como una secuencia "puente" o "estabilizadora" apareando ambos oligonucleótidos. Los polinucleótidos ulteriores compuestos por más de dos oligonucleótidos apareados como se describió anteriormente, pueden utilizarse para montar un polinucleótido diana de manera que dé como resultado un polinucleótido bicatenario contiguo.
Un ejemplo de utilización de dos o más oligonucleótidos con cadena más para montar un polinucleótido se presenta en la Figura 3. Un triplete de tres oligonucleótidos de aproximadamente 50 bp cada uno, que se solapan mediante aproximadamente 25 bp forman un compuesto intermedio "señalizado". Dos de estos oligonucleótidos proporcionan un sustrato de ligadura unido por la ligasa y el tercer oligonucleótido es un estabilizante que une dos secuencias específicas mediante apareación que produce la formación de una parte del montaje polinucleotídico final. Este intermedio proporciona un sustrato para la ADN ligasa que, mediante su actividad de sellado de la señal, une los dos oligonucleótidos del par de 50 bases en un solo oligonucleótido monocatenario de 100 bases.
Después del mezclado inicial y de la formación de los productos apareados, los productos se reúnen en polinucleótidos cada vez más grandes. Por ejemplo, después de la formación del triplete de oligonucleótidos, los conjuntos de tripletes se unen sistemáticamente, se ligan y se montan. Cada etapa puede estar mediada por agrupamiento robótico, ligadura y ciclado térmico para conseguir el apareamiento y desnaturalización. La etapa final une las piezas ensambladas en una secuencia completa que representa todos los fragmentos en la matriz. Como la eficacia de rendimiento en cada etapa es inferior al 100%, la cantidad de masa del producto completado en la mezcla final puede ser muy pequeña. Opcionalmente, los cebadores adicionales de oligonucleótido específico, normalmente de 15 a 20 bases y complementarios con los terminales extremos del montaje, pueden aparearse y realizarse la ampliación por PCR, ampliando de este modo y purificando el producto completo final.
Los procedimientos de la invención proporcionan varias mejoras sobre la tecnología de síntesis de polinucleótidos existente. Por ejemplo, la síntesis puede utilizar microdosificación piezoeléctrica o nanodosificadores de microsolenoides que permiten la síntesis muy rápida, volúmenes de reacción mucho menores y placas de densidad mayor como recipientes de síntesis. El instrumento utilizará hasta 1.536 placas de pocillos proporcionando una capacidad muy elevada. Además, puede realizarse el mezclado controlado mediante un colector microfluido que desplace cada uno de los oligonucleótidos a través de microcanales y mezcle/ligue de manera controlada. Esto obviará la necesidad del pipeteado robótico y aumentará la velocidad y eficacia. Por lo tanto, un aparato que lleve a cabo un procedimiento de la invención tendrá una capacidad mayor para las reacciones simultáneas que dan una capacidad global mayor para alargar el gen.
Una vez se ha sintetizado el polinucleótido diana utilizando un procedimiento de la presente invención, puede ser necesario cribar las secuencias para el análisis de la función. Específicamente contempladas por el presente inventor son las tecnologías de ADN basadas en el chip. En resumen, estas técnicas implican procedimientos cuantitativos para analizar grandes cantidades de genes rápida y exactamente. Etiquetando los genes con oligonucleótidos o utilizando matrices de sonda fijadas, se puede utilizar la tecnología del chip para segregar moléculas diana como matrices de alta densidad y cribar estas moléculas basándose en la hibridación.
La utilización de la síntesis combinatoria y de ensayos de cribado de alto rendimiento son bien conocidos por los expertos en la materia. Por ejemplo, las patentes US nº 5.807.754; nº 5.807.683; nº 5.804.563; nº 5.789.162; nº 5.783.384; nº 5.770.358; nº 5.759.779; nº 5.747.334; nº 5.686.242; nº 5.198.346; nº 5.738.996; nº 5.733.743; nº 5.714.320; y nº 5.663.046 (incorporada cada una específicamente en la presente memoria como referencia) describen sistemas de identificación útiles para determinar la actividad de un polipéptido diana. Estas patentes dan a conocer varios aspectos de los procedimientos y composiciones implicados en el montaje y en los análisis de actividad de matrices de alta densidad de diferentes polisubunidades (polinucleótidos o polipéptidos). Como tal se contempla que los procedimientos y composiciones descritos en las patentes listadas anteriormente pueden ser útiles en el ensayo de los perfiles de actividad de los polipéptidos diana de la presente invención.
En otra forma de realización, la invención proporciona un procedimiento de síntesis de un polinucleótido diana proporcionando una secuencia de polinucleótido diana e identificando por lo menos una secuencia de polinucleótido de iniciación presente en la secuencia de polinucleótido diana que incluye por lo menos un oligonucleótido con cadena más apareado a por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido bicatenario. El polinucleótido de iniciación se pone en contacto en condiciones adecuadas para el apareamiento del cebador con un primer oligonucleótido que tiene complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación, y un segundo oligonucleótido que tiene complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación. La prolongación del cebador se realizó ulteriormente utilizando polinucleótido de síntesis a partir del 3'-hidroxilo de: 1) la cadena más del polinucleótido de iniciación; 2) el primer oligonucleótido apareado; 3) la cadena menos del polinucleótido de iniciación; y 4) el segundo oligonucleótido apareado. La síntesis da como resultado la secuencia de iniciación que se extiende en dos direcciones con lo que forma un polinucleótido naciente de iniciación prolongado. La secuencia de iniciación prolongada puede prolongarse más mediante ciclos repetidos de apareamiento y de prolongación del cebador.
Como se apuntó anteriormente, pueden utilizarse oligonucleótidos como bloques de construcción para montar polinucleótidos por reacciones de apareamiento y ligadura. Alternativamente, pueden utilizarse oligonucleótidos como cebadores para preparar polinucleótidos por apareación y reacciones de prolongación del cebador. El término "cebador" se utiliza en la presente memoria para referirse a un elemento de fijación que comprende un oligonucleótido, si ocurre de forma natural como en un digesto de restricción purificado o se produce por síntesis, que es capaz de actuar como punto de actuación de la síntesis cuando se coloca en condiciones en las que se produce la síntesis de un producto de ampliación del cebador que es complementario con una cadena de ácido nucleico, es decir, en presencia de nucleótidos apropiados y un agente de polimerización tal como una ADN polimerasa en un tampón apropiado ("tampón" incluye pH, fuerza iónica, cofactores, etc.) a una temperatura adecuada. El cebador es preferentemente monocatenario para la eficacia máxima en la ampliación, pero alternativamente puede ser bicatenario. Si es bicatenario, el cebador se trata en primer lugar para separar sus cadenas antes de utilizarse para preparar productos de ampliación. Preferentemente, el cebador es un oligodesoxirribonucleótido. El cebador debe ser suficientemente largo para cebar la síntesis de los productos de ampliación en presencia del agente para la polimerización. Las longitudes exactas de los cebadores dependerán de muchos factores, incluyendo la temperatura y la fuente del cebador y la utilización del procedimiento. Los cebadores que tienen solamente secuencias cortas capaces de hibridación con la secuencia de polinucleótido diana requieren generalmente temperaturas más bajas para formar complejos híbridos suficientemente estables con la plantilla.
Los cebadores en la presente memoria se seleccionan para que sean "sustancialmente" complementarios con las diferentes cadenas de cada secuencia específica que ha de ampliarse. Esto significa que los cebadores deben ser suficientemente complementarios para hibridarse con sus respectivas cadenas. Por consiguiente, la secuencia de cebador no necesita reflejar la secuencia exacta de la plantilla. Frecuentemente, sin embargo, los cebadores tienen complementariedad exacta excepto con respecto a los análisis efectuados según el procedimiento descrito en Nucleic Acids Research 17 (7) 2503-2516 (1989) o un procedimiento correspondiente que emplea ampliación lineal o una técnica de ampliación distinta de la reacción en cadena de polimerasa.
El agente para la ampliación del cebador de un oligonucleótido puede ser cualquier compuesto o sistema que funcione para realizar la síntesis de los productos de ampliación del cebador incluyendo las enzimas. Enzimas adecuadas para esta finalidad incluyen, por ejemplo, ADN polimerasa I de E. coli, fragmento de Klenow de ADN polimerasa I de E. coli, T4 ADN polimerasa, otras ADN polimerasas disponibles, transcriptasa inversa y otras enzimas, incluyendo las enzimas termoestables. La expresión "enzima termoestable" tal como se utiliza en la presente memoria se refiere a cualquier enzima que sea estable al calor y sea resistente al calor y catalice (facilite) la combinación de los nucleótidos de manera apropiada para formar los productos de ampliación del cebador que son complementarios con cada cadena de ácido nucleico. Generalmente, la síntesis se iniciará en el extremo 3' de cada cebador y procederá en dirección 5' a lo largo de la cadena de la plantilla, hasta que termine la síntesis. Una enzima termoestable preferida que puede utilizarse en el procedimiento de la presente invención es la que puede extraerse y purificarse de Thermus aquaticus. Dicha enzima tiene un peso molecular entre aproximadamente 86.000 y 90.000 daltons. La cepa YT1 acuática de Thermus está disponible sin limitación en el American Type Culture Collection, 12301 Parklawn Drive, Rockville, Md., USA. como ATCC 25.104.
Los procedimientos para ampliar un polinucleótido diana deseado son conocidos y han sido descritos en la bibliografía. K. Kleppe et al. en J. Mol. Biol., (1971), 56, 341-361 dan a conocer un procedimiento para la ampliación de una secuencia de ADN deseada. El procedimiento implica la desnaturalización de una cadena doble de ADN para formar cadenas simples. La etapa de desnaturalización se realiza en presencia de un exceso suficientemente grande de dos cebadores de ácido nucleico que se hibridan a las zonas adyacentes a la secuencia de ADN deseada. En el enfriamiento se obtienen dos estructuras que contiene cada una toda la cadena de la plantilla acomplejada de manera apropiada con el cebador. Se añaden la ADN polimerasa y una cantidad suficiente de cada trifosfato de nucleósido requerido, con lo cual se obtienen dos moléculas de la cadena doble original. El ciclo de desnaturalización anterior, la adición del cebador y la prolongación se repiten hasta que se obtiene el número de copias apropiado del polinucleótido diana deseado.
La presente invención proporciona además un procedimiento para la expresión y aislamiento de un polipéptido codificado por un polinucleótido diana. El procedimiento incluye incorporar un polinucleótido diana sintetizado por un procedimiento de la invención en un vector de expresión; introducir el vector de expresión dentro de una célula hospedadora adecuada; cultivar la célula hospedadora en condiciones y durante un tiempo como para activar la expresión del polipéptido diana codificado por el polinucleótido diana; y aislar el polipéptido diana.
La invención puede utilizarse para modificar determinadas propiedades funcionales, estructurales o filogénicas de un polinucleótido modelo que codifica un polipéptido modelo que da como resultado un polipéptido diana alterado. Una entrada o secuencia de polinucleótido modelo que codifica un polipéptido modelo puede manipularse electrónicamente para determinar un potencial para un efecto de un cambio (o varianza) de aminoácidos en un punto determinado o en múltiples puntos en el polipéptido modelo. Una vez identificada, una nueva secuencia de polinucleótido diana se monta por un procedimiento de la invención de modo que el polinucleótido diana codifica un polipéptido diana que posee una característica diferente de la del polipéptido modelo.
Los procedimientos de la invención pueden basarse en la utilización de la secuencia pública y las bases de datos de la estructura. Estas bases de datos resultan más robustas cuantas más secuencias y estructuras se añaden. La información con respecto a la secuencia de aminoácidos de un polipéptido diana y la estructura terciaria del polipéptido puede utilizarse para sintetizar oligonucleótidos que pueden montarse en un polinucleótido diana que codifica un polipéptido diana. Un polipéptido modelo debería tener suficiente información estructural para analizar los aminoácidos implicados en la función del polipéptido. La información estructural puede conseguirse por cristalografía de rayos X, RMN o alguna otra técnica para determinar la estructura de una proteína a nivel de aminoácidos o atómica. Una vez seleccionada, la secuencia y la información estructural obtenida a partir del polipéptido del modelo pueden utilizarse para generar una diversidad de polinucleótidos que codifican una diversidad de secuencias de aminoácidos variantes que comprenden un polipéptido diana. De este modo, un polipéptido del modelo puede seleccionarse basándose en la similitud de la secuencia global para la proteína diana o basándose en la presencia de una parte con similitud de secuencia con una parte del polipéptido diana.
Un "polipéptido", tal como se utiliza en la presente memoria, es un polímero en el que los monómeros son alfa aminoácidos y se unen mediante enlaces amida. Los aminoácidos pueden ser isómeros ópticos L o isómeros ópticos D. Los polipéptidos son dos o más monómeros de aminoácido largos y con frecuencia tienen una longitud de más de 20 monómeros de aminoácidos. Se utilizan abreviaturas normales para los aminoácidos (por ejemplo, P para prolina). Estas abreviaturas están incluidas en Stryer, Biochemistry, tercera ed., 1988, que está incorporada en la presente memoria como referencia para todos los fines. Con respecto a los polipéptidos, "aislado" se refiere a un polipéptido que constituye el componente principal en una mezcla de componentes, por ejemplo, 50% o más, 60% o más, 70% o más, 80% o más, 90% o más o 95% o más en peso. Los polipéptidos aislados por lo general se obtienen por purificación de un organismo en el que se ha producido el polipéptido, si bien también es posible la síntesis química. El procedimiento de purificación del polipéptido incluye, por ejemplo, técnicas de cromatografía o inmunoafinidad.
Los polipéptidos de la invención pueden ser detectados mediante electroforesis en gel de dodecilsulfato sódico (SDS), gel de poliacrilamida seguido de tinción con Coomassie Blue o análisis de inmunotransferencia Western utilizando anticuerpos monoclonales o policlonales que presentan afinidad de unión para el polipéptido que se ha de detectar.
Un "polipéptido híbrido", tal como se utiliza en la presente memoria es un polipéptido que contiene fracciones de la secuencia de aminoácidos procedentes de dos o más proteínas diferentes, o dos o más zonas de la misma proteína que no están normalmente contiguas.
Un "ligando", tal como se utiliza en la presente memoria, es una molécula que es reconocida por un receptor. Ejemplos de ligandos que pueden investigarse mediante la presente invención incluyen, pero no están limitados a, agonistas y antagonistas de receptores de la membrana celular, toxinas y venenos, epítopos víricos, hormonas, opioides, esteroides, péptidos, sustratos enzimáticos, cofactores, fármacos, lectinas, azúcares, oligonucleótidos, ácidos nucleicos, oligosacáridos y proteínas.
Un "receptor", tal como se utiliza en la presente memoria, es una molécula que tiene afinidad para un ligando. Los receptores pueden ser moléculas naturales o artificiales. Pueden utilizarse en su estado inalterado o como agregados con otras especies. Pueden acoplarse receptores, por enlace covalente o no covalente, a un elemento de enlace, bien directamente o mediante una sustancia de unión específica. Los ejemplos de receptores que pueden utilizarse mediante esta invención incluyen, pero no se limitan a, anticuerpos, receptores de la membrana celular, anticuerpos monoclonales y antisuero reactivo con determinantes antigénicos específicos, virus, células, fármacos, polinucleótidos, ácidos nucleicos, péptidos, cofactores, lectinas, azúcares, polisacáridos, membranas celulares y orgánulos. Un "par receptor del ligando" se forma cuando dos moléculas se han combinado mediante reconocimiento molécula para formar un complejo.
Los ejemplos específicos de polipéptidos que pueden sintetizarse mediante la presente invención incluyen pero no se limitan a:
a) Receptores de microorganismos: La determinación de los ligandos que se unen a receptores de microorganismos tales como las proteínas específicas para transporte o las enzimas esenciales para la supervivencia de microorganismos sería una herramienta útil para descubrir nuevas clases de antibióticos. De particular valor serían los antibióticos contra hongos oportunistas, protozoos y bacterias resistentes a antibióticos en la utilización actual.
b) Enzimas: Por ejemplo, un receptor puede comprender un punto de unión de una enzima tal como una enzima responsable de la escisión de un neurotransmisor; la determinación de ligandos para este tipo de receptor para modular la acción de una enzima que escinde un neurotransmisor es útil en el desarrollo de fármacos que pueden utilizarse en el tratamiento de trastornos de neurotransmisión.
c) Anticuerpos: Por ejemplo, la invención puede ser útil para investigar un receptor que comprende un punto de unión al ligando en una molécula de anticuerpo que se combina con un epítopo de un antígeno de interés; determinar una secuencia que simula un epítopo antigénico puede conducir al desarrollo de vacunas en las que el inmunógeno se basa en una o más de dichas secuencias o conduce al desarrollo de agentes o compuestos de diagnóstico relacionados en tratamientos terapéuticos tales como para enfermedades autoinmunitarias (por ejemplo, bloqueando el enlace de los "auto" anticuerpos).
d) Polinucleótidos: Pueden sintetizarse secuencias de polinucleótidos para crear secuencias de unión a ADN o ARN que actúan como receptores para la secuencia sintetizada.
e) Polipéptidos catalíticos: Polímeros, preferentemente anticuerpos, que son capaces de activar una reacción química que conlleva la conversión de uno o más reactivos con uno o más productos. Dichos polipéptidos generalmente incluyen un punto de fijación específico para por lo menos un reactivo o producto intermedio de la reacción y una funcionalidad activa próxima a un punto de fijación, funcionalidad que es capaz de modificar químicamente el reactivo unido. Los polipéptidos catalíticos y otros se describen en, por ejemplo, la publicación PCT nº WO 90/05476, WO 90/05749 y WO 90/05785, que se incorpora en la presente memoria como referencia para todos los fines.
f) Receptores de hormonas: La identificación de los ligandos que se unen con gran afinidad a un receptor tal como los receptores de insulina y la hormona de crecimiento es útil en el desarrollo, por ejemplo, de una sustitución oral de las inyecciones diarias que los diabéticos deben tomar para aliviar los síntomas de la diabetes o una sustitución de la hormona del crecimiento. Otros ejemplos de receptores incluyen los receptores de la hormona vasoconstrictora; la determinación de los ligandos para estos receptores puede conducir al desarrollo de fármacos para controlar la presión sanguínea.
g) Receptores de opioides: La determinación de ligandos que se unen a los receptores de opioides en el cerebro es útil en el desarrollo de sustituciones menos adictivas para la morfina y drogas relacionadas.
En el contexto de un polipéptido, el término "estructura" se refiere a la disposición tridimensional de los átomos en la proteína. "Función" se refiere a cualquier propiedad mensurable de una proteína. Ejemplos de función proteica incluyen, pero no se limitan a, catálisis, fijación a otras proteínas, fijación a moléculas que no sean proteínas (por ejemplo, fármacos) y isomerización entre dos o más formas estructurales. "Proteína biológicamente relevante" se refiere a cualquier proteína que desempeñe una función en la vida de un organismo.
Para identificar motivos estructurales significativos, se examina la secuencia del polipéptido modelo para que sea compatible con las entradas en una o más bases de datos de los dominios reconocidos, por ejemplo, los dominios de la base de datos PROSITE (Bairoch, Nucl. Acids. Res. 24:217, 1997) o la base de datos pfam HMM (Bateman et al., (2000) Nucl. Acids. Res. 28:263). La base de datos PROSITE es una recopilación de dos tipos de secuencia firmas-perfiles, que representa por lo general los dominios de la proteína completa y modelos que representan por lo general sólo los aspectos funcionales o estructurales más conservados de los dominios de la proteína.
Los procedimientos de la invención pueden utilizarse para generar polipéptidos que contienen polimorfismos que ejercen un efecto sobre la actividad catalítica de un polipéptido diana o de una actividad no catalítica del polipéptido diana (por ejemplo, estructura, estabilidad, fijación a una segunda proteína o cadena polipeptídica, fijación a una molécula de ácido nucleico, fijación a una pequeña molécula y fijación a una macromolécula que no es ni una proteína ni un ácido nucleico). Por ejemplo, la invención proporciona unos medios para montar cualquier secuencia de polinucleótido que codifica un polipéptido diana de modo que el polipéptido codificado puede expresarse y cribarse para una actividad concreta. Alterando determinados aminoácidos en puntos específicos en el polipéptido diana, puede manipularse la temperatura de operación, el pH de operación o cualquier otra característica de un polipéptido produciendo un polipéptido con actividad única. De este modo, los procedimientos de la invención pueden utilizarse para identificar sustituciones de aminoácidos que pueden realizarse para modificar genéticamente la estructura o función de un polipéptido de interés (por ejemplo, para aumentar o disminuir la actividad seleccionada o para añadir o eliminar una actividad selectiva).
Además, los procedimientos de la invención pueden utilizarse para la identificación y el análisis de polimorfismos experimentales para dirigir el polimorfismo específico por los agentes farmacéuticos o de diagnóstico, para la identificación y análisis de polimorfismos experimentales para aplicaciones farmacogenómicas, y para el análisis bioquímico experimental y estructural de las dianas farmacéuticas que presentan polimorfismo de aminoácidos.
Mediante la presente invención puede prepararse un banco de polinucleótidos diana que codifica una diversidad de polipéptidos diana. Se transforman células hospedadoras mediante la introducción artificial de los vectores que contienen el polinucleótido diana por inoculación en condiciones conductoras de dicha transformación. Los bancos resultantes de clones transformados se criban a continuación para los clones que presentan actividad para el polipéptido de interés en un ensayo fenotípico para la actividad.
Un polinucleótido diana de la invención puede incorporarse (es decir, clonarse) en un vector apropiado. Con el fin de su expresión, las secuencias diana que codifican un polipéptido diana de la invención pueden insertarse en un vector de expresión recombinante. La expresión "vector de expresión recombinante" se refiere a un plásmido, virus u otro vehículo conocido en la materia que ha sido manipulado mediante la inserción o incorporación de la secuencia de polinucleótido que codifica un polipéptido diana de la invención. El vector de expresión contiene típicamente un origen de réplica, un activador, así como genes específicos que permiten la selección fenotípica de las células transformadas. Los vectores adecuados para su utilización en la presente invención incluyen, pero no se limitan a, el vector de expresión a base de T7 para la expresión en bacterias (Rosenberg et al., Gene, 56:125, 1987), el vector de expresión pMSXND para la expresión en células de mamífero (Lee y Nathans, J. Biol. Chem., 263:3521, 1988), vectores derivados de baculovirus para la expresión en células de insecto, virus del mosaico de la coliflor, CaMV, virus del mosaico del tabaco y TMV.
Dependiendo del vector utilizado, en el vector de expresión pueden utilizarse cualquiera de los numerosos elementos de transcripción y traducción adecuados, incluyendo activadores constitutivos e inducibles, elementos potenciadores de la transcripción, terminadores de la transcripción, etc. (véase, por ejemplo, Bitter et al., Methods in Enzymology, 153:516-544, 1987). Estos elementos son bien conocidos por un experto en la materia.
La expresión "operativamente unido" o "operativamente asociado" se refiere al enlace funcional entre la secuencia reguladora y la secuencia de polinucleótido regulada por la secuencia reguladora. La secuencia reguladora unida operativamente controla la expresión del producto expresado por la secuencia de polinucleótido. Alternativamente, el enlace funcional también incluye un elemento potenciador.
"Activador" significa una secuencia reguladora de ácido nucleico suficiente para dirigir la transcripción. También están incluidos en la invención los elementos activadores que son suficientes para hacer controlable la expresión de la secuencia de polinucleótidos dependiente del activador para células de tipo específico, tejidos específicos o inducibles por señales externas o agentes; dichos elementos pueden estar situados en las zonas 5' o 3' del gen natural o en los intrones.
"Expresión génica" o "expresión de la secuencia de polinucleótido" significa el procedimiento mediante el cual una secuencia nucleotídica experimenta la transcripción y traducción con éxito de modo que los niveles detectables de la secuencia nucleotídica administrada se expresan en una cantidad y durante un periodo de tiempo de modo que se consigue un efecto biológico funcional.
En la levadura, pueden utilizarse numerosos vectores que contienen activadores constitutivos o inducibles. (Current Protocols in Molecular Biology, vol. 2, ed. Ausubel et al., Greene Publish. Assoc. & Wiley Interscience, cap. 13, 1988; Grant et al., "Expression and Secretion Vectors for Yeast", en Methods in Enzymology, eds. Wu & Grossman, Acad. Press, N.Y., vol. 153, págs. 516-544, 1987; Glover, DNA Cloning, vol. II, IRL Press, Wash., D.C., cap. 3, 1986; "Bitter, Heterologous Gene Expression in Yeast", Methods in Enzymology, eds. Berger & Kimmel, Acad. Press, N.Y., vol. 152, págs. 673-684, 1987; y The Molecular Biology of the Yeast Saccharomyces, eds. Strathern et al., Cold Spring Harbor Press, vols. I y II, 1982). Puede utilizarse un activador constitutivo de levadura, tal como ADH o LEU2, o un activador inducible, tal como GAL, ("Cloning in Yeast", cap. 3, R. Rothstein en: DNA Cloning vol. 11, A Practical Approach, ed. DM Glover, IRL Press, Wash., D.C., 1986). Alternativamente, pueden utilizarse vectores que activen la integración de las secuencias de ADN extraño en el cromosoma de la levadura.
En determinadas formas de realización, puede ser deseable incluir zonas especializadas conocidas como telómeros en el extremo de una secuencia polinucleótido diana. Los telómeros son secuencias repetidas halladas en los extremos del cromosoma y se conoce desde hace tiempo que los cromosomas con extremos truncados son inestables, tienden a fusionarse con otros cromosomas y se pierden si no durante la división celular.
Algunos datos sugieren que los telómeros interactúan con el completo de nucleoproteína y la matriz nuclear. Una supuesta función de los telómeros incluye cromosomas de estabilización y protección de los extremos de la enzima degradativa.
Otra posible función de los telómeros consiste en la duplicación. Según la presente teoría, la duplicación del ADN requiere comienzos desde los cebadores cortos de ARN apareados con el extremo T de la plantilla. El resultado de este mecanismo consiste en un "problema de duplicación del extremo" en el que la zona correspondiente al cebador de ARN no se duplica. Durante muchas divisiones celulares, esto dará como resultado el truncado progresivo del cromosoma. Se cree que los telómeros pueden proporcionar un tampón contra este efecto, por lo menos hasta que se eliminen por este efecto. Una estructura adicional que puede incluirse en el polinucleótido diana es un centrómero.
En determinadas formas de realización de la invención, la administración de un ácido nucleico en una célula puede identificarse in vitro o in vivo incluyendo un marcador en el montaje de la expresión. El marcador produciría un cambio identificable en la célula transfectada permitiendo la fácil identificación de la expresión.
Un vector de expresión generado por el procedimiento de la invención puede utilizarse para transformar una célula diana. Se entiende por "transformación" un cambio genético producido por una célula después de la incorporación de nuevo ADN (es decir, ADN exógeno a la célula). Cuando la célula es una célula de mamífero, el cambio genético se consigue generalmente mediante la introducción del ADN en el genoma de la célula. Se entiende por "célula transformada" una célula en la que (o dentro de un progenitor de la misma) se ha introducido, mediante técnicas de ADN recombinante. La transformación de una célula hospedadora con ADN recombinante puede realizarse por técnicas convencionales como son bien conocidas por los expertos en la materia. Cuando el hospedador es procariótico, tal como E. coli, las células competentes que son capaces de la absorción del ADN pueden prepararse a partir de las células recogidas después de la fase de crecimiento exponencial y tratarse ulteriormente por el método del CaCl_{2} por procedimientos bien conocidos en la técnica. Alternativamente, pueden utilizarse MgCl_{2} o RbCl. La transformación puede también realizarse después de formar un protoplasto de la célula hospedadora o por electropora-
ción.
Un polipéptido diana generado por el procedimiento de la invención puede producirse en procariotas mediante la expresión del ácido nucleico que codifica el polipéptido. Éstos incluyen, pero no se limitan a, microorganismos, tales como bacterias transformadas con ADN bacteriófago recombinante, plásmido ADN o vectores de expresión del ADN cósmido que codifican el polipéptido. Los montajes pueden expresarse en E. coli a gran escala para ensayos in vitro. La purificación de bacterias se simplifica cuando las secuencias incluyen etiquetas para la purificación de una etapa mediante cromatografía de níquel-quelato. El montaje puede también contener una etiqueta para simplificar el aislamiento del polipéptido. Por ejemplo, una etiqueta de polihistidina de, por ejemplo, 6 restos de histidina, puede incorporarse al extremo del terminal amino, o al extremo del terminal carboxi, de la proteína. La etiqueta de polihistidina permite el aislamiento conveniente de la proteína en una sola etapa por cromatografía de níquel-quelato. El polipéptido diana puede también modificarse genéticamente para que contenga una zona de escisión que ayude a la recuperación de proteínas. Alternativamente, los polipéptidos pueden expresarse directamente en una célula hospedadora deseada para análisis in situ.
Cuando el hospedador es un eucariota, pueden utilizarse dichos procedimientos de transfección de ADN como coprecipitados de fosfato cálcico, propiedades mecánicas convencionales, tales como la microinyección, electroporación o técnicas biolísticas, la inserción de un plásmido ajustada en liposomas, o vectores víricos. Las células eucarióticas pueden cotransfectarse también con secuencias de ADN que codifican un polipéptido y una segunda molécula de ADN extraño que codifica un fenotipo seleccionable, tal como el gen de timidina cinasa del herpes simple. Otro procedimiento consiste en utilizar un vector vírico eucariótico, tal como el virus 40 de simio (SV40) o virus de papiloma bovino, para infectar temporalmente o transformar células eucarióticas y expresar la proteína. (Eukaryotic Viral Vectors, Cold Spring Harbor Laboratory, Gluzman, ed., 1982). Preferentemente, se utiliza un hospedador eucariótico como célula hospedadora, tal como se describe en la presente memoria.
Los sistema eucarióticos, y preferentemente los sistemas con expresión de mamífero, permiten que se produzcan modificaciones después de la traducción apropiadas de proteínas de mamífero expresadas. Las células eucarióticas que poseen la maquinaria celular para el tratamiento apropiado del directo primario, glucosilación, fosforilación y secreción de manera ventajosa del producto génico deberían utilizarse como células hospedadoras para la expresión del polipéptido de la invención. Dichas estirpes de células hospedadoras pueden incluir, pero no se limitan a, CHO, VERO, BHK, HeLa, COS, MDCK, Jurkat, HEK-293 y WI38.
A largo plazo, se prefiere la producción con alto rendimiento de proteínas recombinantes y expresión estable. En lugar de utilizar vectores de expresión que contienen orígenes víricos de réplica, pueden transformarse células hospedadoras con un ADNc que codifica un polipéptido diana controlado por elementos de control de expresión apropiados (por ejemplo, activador, potenciador, secuencias, terminadores de transcripción, puntos de poliadenilación, etc.) y un marcador seleccionable. El marcador seleccionable en el plásmido recombinante proporciona resistencia a la selección y permite que las células se integren de manera estable en el plásmido en sus cromosomas y crezcan para formar focos que, a su vez, pueden clonarse y expandirse en estirpes celulares. Por ejemplo, tras la introducción del ADN extraño, puede dejarse que crezcan células modificadas genéticamente durante 1 a 2 días en un medio enriquecido, y a continuación se conectan a un medio selectivo. Pueden utilizarse numerosos sistemas de selección incluyendo, pero sin limitarse a, la timidina cinasa del virus del herpes simple (Wigler et al., Cell, 11:223, 1977), hipoxantina-guanina fosforribosiltransferasa (Szybalska & Szybalski, Proc. Natl. Acad. Sci. USA, 48:2026, 1962) y genes con adenina fosforribosiltransferasa (Lowy et al., Cell, 22:817, 1980) pueden utilizarse en células tk, hgprt o aprt, respectivamente. Asimismo, puede utilizarse la resistencia del antimetabolito como base de selección para dhfr, que proporciona resistencia al metotrexato (Wigler et al., Proc. Natl. Acad. Sci. USA, 77:3567, 1980; O'Hare et al., Proc. Natl. Acad. Sci. USA, 8:1527, 1981); gpt, que proporciona resistencia al ácido nucleico micofenólico (Mulligan y Berg, Proc. Natl. Acad. Sci. USA, 78:2072, 1981); neo, que confiere resistencia al aminoglucósico G-418 (Colberre-Garapin et al., J. Mol. Biol., 150:1, 1981); e hygro, que proporciona resistencia contra los genes de higromicina (Santerre et al., Gene, 30:147, 1984). Recientemente, se han descrito genes seleccionables adicionales, a saber trpB, que permite que las células utilicen indol en lugar de triptófano; hisD, que permite a las células utilizar histinol en lugar de histidina (Hartman y Mulligan, Proc. Natl. Acad. Sci. USA, 85:8047, 1988); y ODC (ornitina descarboxilasa), que proporciona resistencia contra el inhibidor de ornitina descarboxilasa, 2-(difluorometil)-DL-ornitina, DFMO (McConlogue L., en: Current Communications in Molecular Biology, Cold Spring Harbor Laboratory, ed., 1987).
Las técnicas para el aislamiento y purificación de polipéptidos expresados en microbios o eucariotas pueden ser por cualquier medio convencional, tales como, por ejemplo, separaciones cromatográficas de preparación y separaciones inmunológicas, tales como las que implican la administración de anticuerpos o antígenos monoclonales o policlonales.
Un polinucleótido diana, o el montaje de la expresión que contiene un polinucleótido diana, puede estar ocluido en un liposoma. Los liposomas son estructuras vesiculares caracterizadas por una membrana bicapa de fosfolípido y un medio acuoso interno. Los liposomas multilaminares tienen diversas capas de lípido separadas por un medio acuoso y se forman espontáneamente cuando se ponen en suspensión los fosfolípidos en un exceso de solución acuosa. Los componentes del lípido experimentan autorredisposición antes de la formación de las estructuras cerradas y atrapan agua y solutos disueltos entres las bicapas del lípido. El liposoma puede estar acomplejado con un virus de hemoaglutinación (HVJ). Esto se ha demostrado que facilita la fusión con la membrana celular y potencia la entrada celular de ADN encapsulado con liposomas. En otras formas de realización, el liposoma puede estar acomplejado o utilizarse junto con proteínas cromosómicas nucleares distintas de la histona (HMG-1). En las formas de realización adicionales todavía, el liposoma puede estar acomplejado o utilizarse junto con tanto HVJ como HMG-1. En dichos montajes de expresión se ha utilizado con éxito en la transferencia y expresión del ácido nucleico in vitro e in vivo, entonces son aplicables para la presente invención. Cuando se emplea un activador bacteriano en el montaje del ADN, también sería deseable incluir dentro del liposoma una polimerasa bacteriana apropiada.
La presente invención describe procedimientos para permitir la creación de un polinucleótido diana basado únicamente en información, es decir, sin el requisito de existencia de genes, moléculas de ADN o genomas. Generalmente, utilizando el programa de ordenador, es posible construir un polinucleótido virtual en el ordenador. Este polinucleótido está constituido por una hilera de bases de ADN, G, A, T o C, que comprende por ejemplo una secuencia de polinucleótido artificial completa en una hilera lineal. Después de la construcción de una secuencia, el programa informático del ordenador se utiliza a continuación para analizar la secuencia diana descomponiéndolo en una serie de oligonucleótidos solapantes de longitud especificada. Esto produce una serie de secuencias de ADN más cortas que se solapan para abarcar la longitud completa del polinucleótido diana en conjuntos solapantes.
Por lo general, un gen de 1.000 pares de bases se descompondría en 20 polímeros de 100 unidades en los que 10 de éstos comprenden una cadena y los otros 10 comprenden la otra cadena. Se seleccionarían para solaparse en cada cadena por 25 a 50 pares de bases.
La degeneración del código genético permite una libertad sustancial en la selección de codones para cualquier secuencia de aminoácidos específica. Los organismos transgénicos tales como las plantas frecuentemente prefieren codones concretos que, aunque codifican la misma proteína, pueden diferenciarse de los codones en el organismo del que se obtuvo el gen. Por ejemplo, la patente US nº 5.380.831 concedida a Adang et al. describe la creación de plantas transgénicas resistentes a insectos que expresan el gen de la toxina Bacillus thuringiensis (Bt). La proteína cristalina Bt, toxina de insectos, está codificada por un gen completo que se expresa poco en plantas transgénicas. Con el fin de mejorar la expresión en las plantas, un gen sintético que codifica la proteína que contiene codones preferidos en plantas fue sustituido por la secuencia natural. La invención dada a conocer en la presente memoria comprendía un gen sintetizado químicamente que codifica una proteína insecticida que frecuentemente es equivalente a una proteína insecticida natural de Bt. El gen sintético se diseñó para que se expresara en plantas a una concentración superior a un gen Bt natural.
Al diseñar un polinucleótido diana que codifica un polipéptido específico, debe considerarse el índice hidropático de aminoácidos. La importancia del índice hidropático de aminoácido al proporcionar una función biológica interactiva en una proteína generalmente se sobreentiende en la técnica. A cada aminoácido se le ha asignado un índice hidropático basándose en sus características de hidrofobia y de carga, éstos son: isoleucina (+4,5); valina (+4,2); leucina (+3,8); fenilalanina (+2,8); cisteína/cistina (+2,5); metionina (+1,9); alanina (+1,8); glicina (-0,4); treonina (47); serina (-0,8); triptófano (-0,9); tirosina (-1,3); prolina (-1,6); histidina (-3,2); glutamato (-3,5); glutamina (-3,5); aspartato (-3,5); asparagina (-3,5); lisina (-3,9); y arginina (45).
Es conocido en la técnica que determinados aminoácidos pueden ser sustituidos por otros aminoácidos con un índice hidropático o puntuación similar y aún dar como resultado una proteína con actividad biológica similar, es decir, obtener todavía una proteína biológica funcionalmente equivalente. Al realizar dichos cambios, se prefiere la sustitución de aminoácidos cuyos índices hidropáticos están comprendidos dentro de \pm2, aquellos que están comprendidos dentro de \pm1 son particularmente preferidos, y aquellos dentro de \pm0,5 son incluso más específicamente
preferidos.
Debe apreciarse también en la técnica que la sustitución de aminoácidos similares puede hacerse eficazmente basándose en la hidrofilia. La patente US nº 4.554.101, incorporada a la presente memoria como referencia, hace constar que la mayor hidrofilia media local de una proteína, controlada por la hidrofilia de sus aminoácidos adyacentes, se correlaciona con una propiedad biológica de la proteína.
Como se detalla en la patente US nº 4.554.101, se han asignado los siguientes valores de hidrofilia a restos de aminoácidos: arginina (+3,0); lisina (+3,0); aspartato (+3,0 \pm 1); glutamato (+3,0 \pm 1); serina (+0,3); asparagina (+0,2); glutamina (+0,2); glicina (0); treonina (44); prolina (-0,5 \pm 1); alanina (45); histidina (-0,5); cisteína (-1,0); metionina (-1,3); valina (1,5); leucina (-1,8); isoleucina (-1,8); tirosina (-2,3); fenilalanina (-2,5); triptófano (-3,4).
Se sobreentiende que un aminoácido puede sustituirse por otro que tenga un valor de hidrofilia similar y obtener todavía un polipéptido biológicamente equivalente e inmunológicamente equivalente. En dichos cambios, se prefiere la sustitución de aminoácidos cuyos valores de hidrofilia estén comprendidos dentro de \pm2, los que estén comprendidos dentro de \pm1 son particularmente preferidos, y los que estén comprendidos dentro de \pm0,5 son aún más particularmente preferidos.
Como se esbozó anteriormente, las sustituciones de aminoácidos se basan generalmente en la similitud relativa de los sustituyentes de la cadena lateral de aminoácidos, por ejemplo, su hidrofobia, hidrofilia, carga, tamaño y similares. Ejemplos de sustituciones que tienen en consideración varias de las características anteriores son bien conocidos por los expertos en la materia y incluyen: arginina y lisina; glutamato y aspartato; serina y treonina; glutamina y asparagina; y valina, leucina e isoleucina.
Los aspectos de la invención pueden realizarse en un equipo o un programa informático o en una combinación de ambos. Sin embargo, preferentemente, los algoritmos y procedimientos de la invención se realizan en uno o más programas informáticos que se ejecutan en ordenadores programables que comprende cada uno por lo menos un procesador, por lo menos un sistema de almacenamiento de datos (incluyendo la memoria volátil y no volátil y/o elementos de almacenamiento), por lo menos un dispositivo de entrada y por lo menos un dispositivo de salida. El código del programa se aplica a los datos de entrada para realizar las funciones descritas en la presente memoria y generar la información de salida. La información de salida se aplica a uno o más dispositivos de salida, en el modo conocido.
Cada programa puede realizarse en cualquier lenguaje informático deseado (incluyendo la máquina, conjunto, alto nivel del procedimiento o lenguajes de programación orientados al objeto) para comunicar con un sistema informático. En cualquier caso, el lenguaje puede ser un lenguaje recopilado o interpretado.
Cada programa informático se almacena preferentemente en un medio o dispositivo de almacenamiento (por ejemplo, ROM, CD-ROM, cinta o disquete magnético) legible por un ordenador programable general o especial, para configurar y operar el ordenador cuando el medio o dispositivo de almacenamiento es leído por el ordenador para realizar los procedimientos descritos en la presente memoria. El sistema de la invención puede también considerarse para ser realizado como medio de almacenamiento legible por el ordenador, configurado con un programa informático, donde el medio de almacenamiento configurado de este modo da lugar a que el ordenador opere de manera específica y predefinida para realizar las funciones descritas en la presente memoria.
Por lo tanto, en otra forma de realización, la invención proporciona un programa informático, almacenado en un medio legible por el ordenador, para generar una secuencia de polinucleótido diana. El programa informático incluye instrucciones para dar lugar a un sistema informático para: 1) identificar una secuencia de polinucleótido de iniciación contenida en una secuencia de polinucleótido diana; 2) analizar la secuencia de polinucleótido diana en oligonucleótidos, parcialmente complementarios, múltiples distintos; y 3) controlar el conjunto de la secuencia de polinucleótido diana controlando la prolongación de la secuencia de polinucleótido de iniciación en dos direcciones mediante la adición sucesiva de oligonucleótidos parcialmente complementarios que producen un polinucleótido bicatenario contiguo. El programa informático contendrá un algoritmo para analizar la secuencia del polinucleótido diana generando una serie de oligonucleótidos correspondiente a una secuencia polipeptídica. El algoritmo utiliza una secuencia de polinucleótido para generar una secuencia de ADN que utiliza una tabla específica del codón. El algoritmo genera a continuación una serie de oligonucleótidos analizados correspondiente a las cadenas (+) y (-) de la secuencia de ADN de la siguiente manera:
1. La secuencia GENE [] del ADN, matriz de bases, se genera a partir de la secuencia AA [] proteica, matriz de aminoácidos, utilizando una tabla de codón especificada. Un ejemplo de la tabla de codón para los codones tipo II de E. coli, se presenta a continuación.
a.
parámetros
i.
N = Longitud de proteína en restos de aminoácidos
ii.
L = Longitud 3N del gen en bases de ADN
iii.
Q = Longitud de cada oligonucleótido componente
iv.
X = Q/2 longitud de solapamiento entre oligonucleótidos
v.
W = 3N/Q número de oligonucleótidos la serie F
vi.
Z = 3N/Q + 1 número de oligonucleótidos en la serie R
vii.
F[1:W] serie de oligonucleótidos de la cadena (+)
viii.
R[L:Z] serie de oligonucleótidos de la cadena (-)
ix.
AA[1:N] matriz de restos de aminoácidos
x.
GENE[1:L] matriz de bases que comprende el gen
b.
obtener o diseñar una secuencia proteica AA[] constituida por una lista de restos de aminoácidos.
c.
generar la ssq de ADN, GENE[], a partir de la secuencia proteica, AA[]
i.
Para I = 1 a N
ii.
Traducir AA[J] de la tabla del codón que genera GENE[I: I+2]
iii.
I = I + 3
iv.
J = J + 1
v.
Ir a ii
2. Se generan dos series de oligonucleótidos solapantes a partir de GENE[]; F[] abarca la cadena (+) y R[] es una serie complementaria, parcialmente solapante que comprende la cadena (-).
a.
Generar la serie F[] de oligos
i.
Para I = 1 a W
ii.
F[I = GENE [I:I+Q-1]
iii.
I = I + Q
iv.
Ir a ii
b.
Generar la serie R de oligos
i.
J = W
ii.
Para I = 1 a W
iii.
R[I] = GENE [W:W-Q]
iv.
J = J - Q
v.
Ir a iii
c.
El resultado es dos series de oligos F[] y R[] de longitud Q
d.
Generar los dos oligos de acabado finales
i.
S[1] = GENE [Q/2:1]
ii.
S[2] = GENE [L-Q/2:L]
Sucesivamente, se crea el conjunto de la serie de oligonucleótidos mediante el algoritmo siguiente:
Dos series de oligonucleótidos F[1:W] R[1:Z] S[1:2]
3. Etapa 1
a.
Para I = 1 a W
b.
Ligar F[I], F[I+1], R[I]; colocar en T[I]
c.
Ligar F[I+2], R[I+1], R[I+2] T[I+1]
d.
I = I + 3
e.
Ir a b
4. Etapa 2
a.
Hacer lo siguiente hasta que quede una sola reacción
i.
Para I = 1 a W/3
ii.
Ligar T[I], T[I+1]
iii.
I = I + 2
iv.
Ir a ii
\vskip1.000000\baselineskip
TABLA DE CODONES (utilización preferida de la Clase II de E. coli)
1
Los algoritmos de la invención útiles para el montaje de un polinucleótido diana pueden describirse además como Perl script indicado a continuación. ALGORITHM 1 proporciona un procedimiento para convertir una secuencia proteica en una secuencia de polinucleótido utilizando codones de E. coli:
2
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
La siguiente lista proporciona la preferencia de codón de clase II en Perl para E. coli
4
\newpage
El ALGORITMO 2 proporciona un procedimiento para analizar una secuencia de polinucleótido en los oligonucleótidos componentes directo y complementario que pueden reunirse en un polinucleótido diana completo que codifica un polipéptido diana:
5
\newpage
El complemento complementario de la secuencia generada anteriormente está identificado por:
7
8
\vskip1.000000\baselineskip
La invención proporciona además un procedimiento asistido por ordenador para sintetizar un polinucleótido diana que codifica un polipéptido diana procedente de una secuencia modelo que utiliza un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, introduciendo en el ordenador programado, mediante el dispositivo de entrada, los datos que incluyen por lo menos una parte de la secuencia de polinucleótido diana que codifica un polipéptido diana. A continuación, se determina la secuencia de por lo menos un polinucleótido de iniciación presente en la secuencia de polinucleótido diana y se obtiene un modelo para sintetizar la secuencia de polinucleótido diana. El modelo se basa en la posición de la secuencia de iniciación en la secuencia de polinucleótido diana utilizando parámetros de la secuencia global necesarios para la expresión del polipéptido diana en un sistema biológico. La información se extrae a un dispositivo de salida que proporciona los medios para sintetizar y montar el polinucleótido diana.
Se sobreentiende que en la presente invención puede utilizarse cualquier aparato adecuado para la síntesis de polinucleótidos. Se describen a continuación varios ejemplos no limitativos de aparato, componentes, montajes y procedimientos. Por ejemplo, en una forma de realización, se contempla que un cabezal nanodosificador con hasta 16 válvulas puede utilizarse para depositar productos químicos de síntesis en recipientes del montaje (Figura 4). Los productos químicos pueden controlarse utilizando una bomba de jeringuilla desde el depósito de reactivo. Debido a la velocidad y capacidad del sistema dosificador de chorro de tinta, la síntesis puede hacerse muy pequeña y muy rápida. Por debajo de las cámaras de reacción existe un conjunto de recipientes de montaje unidos a microcanales que desplazarán los fluidos por microfluidodinámica. La configuración de los canales agrupará parejas y tripletes de oligonucleótidos sistemáticamente utilizando, por ejemplo, un dispositivo robótico. Sin embargo, la agrupación puede realizarse utilizando mecánica de fluidos y sin desplazar las piezas. Como se muestra en la Figura 5, la síntesis de oligonucleótidos, el montaje de oligonucleótidos agrupando e apareando, y la ligadura pueden realizarse utilizando mezclado por mecánica de fluidos, dando como resultado la misma serie de productos intermedios críticos triples que sirve como substrato para apareación, ligadura y unión de oligonucleótidos. La ADN ligasa y otros componentes pueden colocarse en el fluido tampón moviendo mediante el instrumento las microcámaras. Por lo tanto, la síntesis y el montaje pueden realizarse de manera muy controlada en el mismo
instrumento.
Como se muestra en la Figura 6, el colector de mezclado puede fabricarse de plástico no poroso y diseñarse para controlar el mezclado sucesivo de oligonucleótidos sintetizados en matrices. El análisis del oligonucleótido a partir de una secuencia génica diseñada en el ordenador puede programarse para la síntesis en la que las cadenas (+) y (-) se colocan en pocillos alternativamente de la matriz. Después de la síntesis en este formato, las secuencias de la fila 12 del gen se dirigen al interior del colector de agrupación que sistemáticamente agrupa tres pocillos en los recipientes de reacción formando la triple estructura crítica. Después del ciclo de temperatura para el apareamiento y ligadura, se mezclan cuatro series de tripletes en 2 series de 6 productos de oligonucleótido, a continuación 1 serie de 12 productos oligonucleotídicos. Cada fila de la matriz sintética está asociada a un colector similar dando como resultado la primera etapa del montaje de 8 series de oligonucleótidos montados que representan 12 oligonucleótidos cada una. Como se muestra en la Figura 7, la segunda etapa de mezclado en el colector se controla mediante un solo colector que agrupa los montajes en 8 filas en un solo montaje completo. El paso de los componentes oligonucleotídicos a través de los dos montajes del colector (el primero 8 y el segundo solo) produce el montaje completo de los 96 oligonucleótidos de la matriz. El módulo de montaje (Figura 8) de Genewriter^{TM} puede incluir una serie completa de 7 colectores de agrupación producidos utilizando microfabricación en un solo bloque de plástico que se ajusta por debajo de los recipientes de síntesis. Varias configuraciones del colector de mezcla permitirán el montaje de 96, 384 ó 1536 matrices del pocillo de oligonucleótidos del componente analizado.
La configuración inicial se diseña para el conjunto de 96 oligonucleótidos sintetizados en una matriz predefinida, compuesta de 48 pares de polímeros de 50 monómeros solapantes. El paso a través del dispositivo de montaje en presencia de ADN ligasa y otro tampón apropiado y componentes químicos, y con controles de temperatura apropiados en el dispositivo, reunirá éstos en un solo conjunto de gen de doble cadena de 2.400 bases (Figura 9).
El diseño del dispositivo de mezclado básico puede hacerse de Plexiglas^{TM} u otro tipo de copolímero con microsurcos o canales microfluidos grabados en la superficie y con un elemento de control de temperatura tal como un circuito Peltier colocado debajo de la confluencia de los canales. Esto produce un recipiente de microrreacción en la confluencia de dos canales para 1) mezclado de las dos corrientes, 2) mantenimiento de la temperatura controlada o ciclación en el sitio de la confluencia y 3) expulsión de la mezcla ligada del canal de salida en la siguiente serie de cámaras de mezclado y ligadura.
Como se muestra en la Figura 11, el diseño de la plataforma del conjunto puede estar constituido por 8 placas de micropocillos de síntesis en una configuración de 96 pocillos, estudiada con 16 canales de microdosificación. Debajo de cada placa está: 1) un colector de evacuación para eliminar los componentes de la síntesis; y 2) un colector del conjunto basado en el esquema de la Figura 9 para el montaje de oligonucleótidos componentes en cada matriz de 96 pocillos. La Figura 12 presenta un formato de montaje de mayor capacidad utilizando microplacas de 1.536 pocillos y capaces de síntesis de 1.536 oligonucleótidos componentes por placa. Debajo de cada placa está: 1) un colector de evacuación para eliminar los componentes de la síntesis; y 2) un montaje del colector para el montaje de 1.536 componentes oligonucleótidos de cada matriz de 1.536 pocillos. Las estrategias de mezclado y montaje pueden basarse en los conceptos utilizados para las placas de 96 pocillos.
Un formato de montaje alternativo incluye utilizar síntesis de oligonucleótidos unidos por la superficie en lugar de la síntesis soluble en perlas de vidrio CPG (Figura 13). En esta configuración, los oligonucleótidos se sintetizan con un enlazadoror de hidrocarburos que permite la unión a un soporte sólido. Después del análisis de las secuencias del componente y de la síntesis, los oligonucleótidos sintetizados se unen por enlace covalente a un soporte sólido de modo que el estabilizador está unido y los dos sustratos de ligadura se añaden a la solución sobrenadante. La ligadura tiene lugar mediada por la ADN ligasa en la solución y aumentando la temperatura por encima de la Tm se eliminan los oligonucleótidos unidos por fusión térmica. Como se muestra en la Figura 14, el montaje sistemático en un soporte sólido de una serie de oligonucleótidos del componente analizado puede disponerse en una matriz con la serie del oligonucleótido estabilizador acoplada. La serie de oligonucleótidos de substrato de ligadura se coloca en la solución y, se realiza el montaje sistemático en fase sólida por apareación, ligadura y fusión sucesivas lo que desplaza las moléculas de ADN en crecimiento a través de la superficie de la membrana.
La Figura 15 presenta un medio alternativo adicional para el montaje de oligonucleótidos, uniendo los oligonucleótidos componentes a una serie de electrodos metálicos en un chip microelectrónico, donde cada electrodo puede controlarse independientemente con respecto a la corriente y el voltaje. La matriz contiene la serie de oligonucleótidos de la cadena menos. Colocando una carga positiva en el electrodo se desplazará por electroforesis el oligonucleótido substrato de ligasa del componente sobre la superficie en la que tiene lugar el apareamiento. La presencia de ADN ligasa media la unión covalente o la ligadura de los componentes. Se cambia a continuación el electrodo o se aplica una carga negativa y la molécula de ADN se expulsa del electrodo. El siguiente elemento de la matriz que contiene el siguiente oligonucleótido estabilizador procedente de la serie analizada se conecta con una carga positiva y se realiza una segunda apareación, unión y ligadura con el siguiente oligonucleótido en la serie. La aplicación sistemática y repetitiva del control del voltaje, apareación, ligadura y desnaturalización producirá el movimiento de la cadena creciente a través de la superficie así como del montaje de los componentes en una molécula de ADN
completa.
La invención proporciona además procedimientos para la síntesis automática de polinucleótidos diana. Por ejemplo, una secuencia deseada puede ordenarse por algunos medios de comunicación disponibles para un usuario que desea ordenar dicha secuencia. Un "usuario", tal como se utiliza en la presente memoria, es cualquier entidad capaz de comunicar una secuencia de polinucleótido deseada a un servidor. La secuencia puede ser transmitida por algunos medios de comunicación disponibles para el usuario y recibibles por un servidor. El usuario puede estar dotado de una única denominación de modo que el usuario puede obtener información con respecto a la síntesis del polinucleótido durante la síntesis. Una vez obtenida, la secuencia de polinucleótido diana transmitida puede sintetizarse por cualquier procedimiento publicado en la presente invención.
La invención proporciona además un procedimiento para la síntesis automática de un polinucleótido, proporcionando un usuario con un mecanismo para comunicar una secuencia de polinucleótido modelo y opcionalmente proporcionar al usuario una oportunidad de comunicar por lo menos una modificación deseada a la secuencia modelo. La invención prevé un usuario que proporciona una secuencia modelo y una modificación deseada para esta secuencia que produce la alteración de la secuencia modelo. Cualquier modificación que altere la expresión, función o actividad de un polinucleótido diana o de un polipéptido diana codificado puede ser comunicada por el usuario de modo que un polinucleótido o polipéptido modificado se sintetiza o se expresa según un procedimiento de la invención. Por ejemplo, un polinucleótido modelo que codifica un polipéptido expresado normalmente en un sistema eucariótico puede alterarse de modo que los codones del polinucleótido diana resultante son conductores para la expresión del polipéptido en un sistema procariótico. Además, el usuario puede indicar una actividad modificada deseada de un polipéptido codificado por un polinucleótido modelo. Una vez proporcionados, los algoritmos y procedimientos de la presente invención pueden utilizarse para sintetizar un polinucleótido diana que codifica un polipéptido diana que se cree que tiene la actividad modificada deseada. Los procedimientos de la invención pueden utilizarse además para expresar el polipéptido diana y para cribar la actividad deseada. Se entiende que los procedimientos de la invención proporcionan un medio para la evolución sintética mediante los cuales cualquier parámetro de la expresión del polinucleótido y/o la actividad del polipéptido pueden alterarse como se desee.
Una vez proporcionadas por el usuario la secuencia modelo transmitida y la modificación deseada son, los datos que incluyen por lo menos una parte de la secuencia de polinucleótido modelo se introducen en un ordenador programado, mediante un dispositivo de entrada. Una vez introducidos, los algoritmos de la invención se utilizan para determinar la secuencia del polinucleótido modelo que contiene la modificación deseada y que produce un polinucleótido modelo que contiene la modificación. Ulteriormente, el procesador y los algoritmos de la invención se utilizan para identificar por lo menos una secuencia de polinucleótido de iniciación presente en la secuencia del polinucleótido. Un polinucleótido diana (es decir, un polinucleótido modelo modificado) se identifica y se sintetiza.
Ejemplos Protocolo para el diseño de la síntesis del ácido nucleico
Con el fin de montar una secuencia de ácido nucleico sintético que codifica a un polipéptido diana, se obtiene y se analiza una secuencia del polipéptido modelo o una secuencia de ácido nucleico utilizando un paquete de análisis de ADN adecuado, tal como, por ejemplo, MacVector o DNA Star. Si la proteína diana se expresa en un sistema bacteriano, por ejemplo, la secuencia modelo puede convertirse en una secuencia que codifica un polipéptido utilizando codones preferidos de E. coli (es decir, de tipo I, de tipo II o de tipo codón de preferencia tipo II). La presente invención proporciona los programas de conversión Codon I, Codon II o Codon III. Una secuencia de ácido nucleico de la invención puede diseñarse para acomodar cualquier preferencia de codón de cualquier organismo procariótico o eucariótico.
Además de las preferencias de codón anteriores, el activador específico, el potenciador, las secuencias de replicación o de resistencia al fármaco pueden incluirse en una secuencia de ácido nucleico sintética de la invención. La longitud de la construcción puede ajustarse por relleno para dar un número redondeado de bases basadas en aproximadamente la síntesis de 25 a 100 bp. La síntesis de las secuencias de aproximadamente 25 a 100 bp de longitud puede prepararse y montarse utilizando el sistema sintetizador de matriz y puede utilizarse sin purificación adicional. Por ejemplo, dos placas de 96 pocillos que contienen polímeros de 100 monómeros podrían proporcionar una construcción de 9.600 bp de una secuencia diana.
Después del diseño de los oligonucleótidos necesarios para montar la secuencia diana, los oligonucleótidos se analizan utilizando ParseOligo^{TM}, programa informático patentado que optimiza el montaje de la secuencia del ácido nucleico. Las etapas opcionales en el montaje de la secuencia incluyen secuencias de identificación y eliminación que pueden dar lugar a horquillas, repeticiones u otras secuencias con dificultad. La lista de oligonucleótidos analizados se transfiere al programa informático actuado por el Synthesizer. Los oligonucleótidos individuales se analizan en los pocillos y se lleva a cabo la síntesis del oligonucleótido.
Montaje de los oligonucleótidos analizados utilizando una reacción de PCR en dos etapas
Se obtienen series matriciales de oligonucleótidos solapantes analizados, de 50 bases cada una, con un solapamiento de aproximadamente 25 pares de bases (bp). La concentración de oligonucleótidos es de 250 nM (250 \muM/ml). Los oligos de 50 bases proporcionan T_{m} entre 75 y 85 grados C, una D.O._{260} de 6 a 10, 11 a 15 nanomoles, 150 a 300 \mug. Se vuelve a poner en suspensión en 50 a 100 \mul de H_{2}O para preparar 250 nM/ml. Se combinan cantidades iguales de cada oligonucleótido hasta una concentración final de 250 \muM (250 nM/ml). Se añade 1 \mul de cada uno para dar 192 \mul. Se añaden 8 \mul de dH_{2}O para llevarlo a 200 \mul. La concentración final es de 250 \muM de oligos mezclados. Se diluye 250 veces para tener 10 \mul de oligos mezclados y se añade a 1 ml de agua. (1/100; 2,5 \muM) a continuación se toma 1 \mul de ésta y se añaden a 24 \mul de mezcla 1\times PCR. La reacción de PCR incluye:
TRIS-HCl 10 mM, pH 9,0
MgCl_{2} 2,2 mM
KCl 50 mM
cada dNTP 0,2 mM
Triton X-100 al 0,1%
Se añade una U de TaqI polimerasa a la reacción. La reacción se termocicla en las siguientes condiciones
a. Montaje
i.
55 ciclos de
1.
94 grados 30 s
2.
52 grados 30 s
3.
72 grados 30 s
Después de la ampliación del montaje, se toman 2,5 \mul de esta mezcla de montaje y se añaden a 100 \mul de la mezcla PCR. (dilución 40\times). Se preparan cebadores externos tomando 1 \mul de F1 (cebador directo) y 1 \mul de R96 (cebador complementario) a 250 \muM (250 nm/ml - 0,250 nmoles/\mul) y se añaden a 100 \mul de la reacción PCR. Esto proporciona una concentración final de 2,5 \muM de cada oligo. Se añade 1 U de Taq1 polimerasa y se termocicla en las siguientes condiciones:
35 ciclos (o 23 ciclos del protocolo original)
94 grados
30 s
50 grados
30 s
72 grados
60 s
Se extrae con fenol/cloroformo. Se precipita con etanol. Se vuelve a poner en suspensión en 10 \mul de dH_{2}O y se analiza en un gel de agarosa.
Montaje de los oligonucleótidos analizados utilizando ligadura de Taq1
Se obtienen series matriciales de los oligonucleótidos solapantes analizados de aproximadamente 25 a 150 bases de longitud cada una, con un solapamiento de aproximadamente 12 a 75 pares de bases (bp). La concentración de oligonucleótidos es de 250 nM (250 \muM/ml). Por ejemplo, oligos de 50 bases proporcionan una T_{m} entre 75 y 85 grados C, D. O._{260} de 6 a 10, 11 a 15 nanomoles, 150 a 300 \mug. Se vuelve a poner en suspensión en 50 a 100 ml de H_{2}O para dar 250 nM/ml.
Utilizando una estación de trabajo robótica, se combinan por pares cantidades iguales de oligos directos y complementarios. Se toman 10 \mul de oligo directo y 10 \mul de complementario y se mezclan en una nueva placa de 96 pocillos con el fondo en v. Esto proporciona una matriz con series de oligonucleótidos dobles a 250 \mu\mu, según la Etapa 1 del esquema de mezcla en la Tabla 1. Se prepara una placa de montaje tomando 2 \mul de cada par de oligómeros y añadiéndolos a una placa reciente que contiene 100 \mul de mezcla de ligadura en cada pocillo. Esto proporciona una concentración eficaz de 25 \muM o 2,5 nM/ml. Se transfieren 20 \mul de cada pocillo a una placa de micropocillos reciente y se añade 1 ml de polinucleótido T4 cinasa y 1 \mul de ATP 1 mM a cada pocillo. Cada reacción tendrá 50 pmoles de oligonucleótido y 1 nmoles de ATP. Se incuba a 37 grados C durante 30 minutos.
Se inicia el montaje según las Etapas 2 a 7 de la Tabla 1. Se realiza la Etapa 2 de mezcla combinando cada pocillo sucesivo con el siguiente. Se añade 1 \mul de Taq1 ligasa a cada pocillo de mezcla. Se cicla una vez a 94 grados durante 30 s.; 52 grados durante 30 s.; a continuación 72 grados durante 10 minutos.
Se lleva a cabo la etapa (Tabla 1) del esquema de mezclado y se cicla según el esquema de temperatura anterior. Se realizan las etapas 4 y 5 del esquema de mezclado y se cicla según el esquema de temperatura anterior. Se lleva a cabo la etapa 6 del esquema de mezclado y se toman 10 \mul de cada mezcla en un micropocillo reciente. Se realiza el esquema de mezclado de la etapa 7 mezclando los tres pocillos restantes. Los volúmenes de la reacción serán:
La placa inicial tiene 20 \mul por pocillo.
9
Se realizó a continuación una ampliación final por PCR tomando 2 \mul de mezcla de ligadura final y se añaden a 20 \mul de mezcla de PCR que contiene TRIS-HCl 10 mM, pH 9,0, MgCl_{2} 2,2 mM, KCl 50 mM, cada dNTP 0,2 mM y Triton X-100 al 0,1%.
Se preparan cebadores externos tomando 1 \mul de F1 (cebador directo) y 1 \mul de R96 (cebador complementario) a 250 \muM (250 nm/ml - 0,250 nmoles/\mul) y se añaden a 100 \mul de la reacción PCR proporcionando una concentración final de 2,5 \muM de cada oligo. Se añade 1 U de Taq1 polimerasa y se ciclan durante 35 ciclos en las condiciones siguientes: 94 grados durante 30 s; 50 grados durante 30 s; y 72 grados durante 60 s. Se extrae la mezcla con fenol/cloroformo. Se precipita con etanol. Se vuelve a poner en suspensión en 10 \mul de dH_{2}O y se analiza sobre un gel de agarosa.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
(Tabla pasa a página siguiente)
TABLA 1 Esquema de mezclado para el montaje de la ligadura
10
11
Montaje de los oligonucleótidos analizados utilizando la síntesis y el montaje de Taq I
Se obtienen series matriciales de los oligonucleótidos solapantes analizados de aproximadamente 25 a 150 bases de longitud cada una, con un solapamiento de aproximadamente 12 a 75 pares de bases (bp). La concentración de oligonucleótidos es de 250 nM (250 \muM/ml). Oligos de 50 bases proporcionan una T_{m} entre 75 y 85 grados C, 6 a 10 od_{260} de 11 a 15 nanomoles, 150 a 300 \mug. Se vuelve a poner en suspensión en 50 a 100 ml de H_{2}O para preparar 250 nM/ml.
La invención prevé utilizar una estación de trabajo robótica para llevar a cabo el montaje del ácido nucleico. En el presente ejemplo, se preparan dos placas de trabajo que contienen oligonucleótidos directos e inversos en una mezcla de PCR a 2,5 mM y 1\mul de cada oligo es añadido a 100\mul de mezcla de PCR en un micropocillo reciente que proporciona una placa de oligo directo y una de complementario en una matriz. Se inicia a continuación el montaje por ciclación como se expone a continuación, según el esquema de mezclado esbozado en la Tabla 1. En el presente ejemplo, pueden realizarse 96 ciclos de montaje según este esquema.
Retirar 2 \mul del pocillo F-E1 a un pocillo fresco; retirar 2 \mul de R-E1 a un pocillo fresco; añadir 18 \mul de mezcla 1\timesPCR; añadir 1 U de Taq1 polimerasa;
Se cicla una vez: {}\hskip0.3cm 94 grados
30 s
52 grados
30 s
72 grados
30 s
Posteriormente, se retiran 2 \mul del pocillo F-E2 al recipiente de reacción; se retiran 2 \mul del pocillo R-D12 al vaso de reacción. Se cicla una vez según la temperatura anterior. Se repite el mezclado y la ciclación según el esquema esbozado en la Tabla 1 durante aproximadamente 96 ciclos.
Se lleva a cabo a continuación la ampliación por PCR tomando 2 \mul de la mezcla de reacción final y añadiéndolo a 20 \mul de una mezcla de PCR que comprende:
TRIS-HCl 10 mM, pH 9,0
MgCl_{2} 2,2 mM
KCl 50 mM
cada dNTP 0,2 mM
Triton X-100 al 0,1%
\global\parskip0.860000\baselineskip
Se preparan cebadores externos tomando 1 \mul de F1 y 1 \mul de R96 a 250 mM (250 nm/ml - 0,250 nmoles/ml) y se añaden a 100 \mul de reacción PCR. Esto proporciona una concentración final de 2,5 \muM de cada oligo. Se añade posteriormente 1 U de Taq1 polimerasa y la reacción se cicla durante aproximadamente 23 a 35 ciclos en las condiciones siguientes:
94 grados
30 s
50 grados
30 s
72 grados
60 s
La reacción se extrae posteriormente con fenol/cloroformo, se precipita con etanol y se vuelve a poner en suspensión en 10 ml de dH_{2}O para análisis en un gel de agarosa.
Las cantidades iguales de los oligos directo y complementario por parejas se añaden tomando 10 \mul del oligo directo y 10 \mul del complementario y se mezclan en una nueva placa con el fondo en v de 96 pocillos. Esto proporciona una matriz con series de oligonucleótidos dobles a 250 nM, según la Etapa 1 del esquema de mezclado en la Tabla 1. Se preparó una placa de montaje tomando 2 \mul de cada par de oligómeros y añadiéndolos a la placa que contiene 100 \mul de mezcla de ligadura en cada pocillo. Esto proporciona una concentración eficaz de 2,5 \muM ó 2,5 nM/ml. Se transfieren aproximadamente 20 \mul de cada pocillo a una placa de micropocillos fresca además de 1 \mul de polinucleótido T4 cinasa y 1 \mul de ATP 1 mM. Cada reacción tendrá 50 pmoles de oligonucleótido y 1 nmol de ATP. Se incuba a 37 grados durante 30 minutos.
El montaje del ácido nucleico se inició según las etapas 2 a 7 de la Tabla 1. La mezcla de la Etapa 2 se realiza mezclando cada pocillo con el pocillo siguiente en sucesión. Se añade 1 \mul de Taq1 ligasa a cada pocillo mezclado y se cicla una vez de la manera siguiente:
94 grados
30 s
52 grados
30 s
72 grados
10 minutos
Se lleva a cabo la Etapa 3 del esquema de mezcla y se cicla según el esquema de temperatura anterior. Se realizan las etapas 4 y 5 del esquema de mezclado y se cicla según el esquema de temperaturas anterior. Se realiza la etapa 6 del esquema de mezcla y se toman 10 \mul de cada mezcla en un micropocillo reciente. Se lleva a cabo el esquema de mezclado de la etapa 7 mezclando los tres pocillos restantes. Los volúmenes de reacción serán (la placa inicial tiene 20 \mul por pocillo):
13
Se realiza una ampliación por PCR final tomando 2 \mul de la mezcla de ligadura final y añadiéndolos a 20 \mul de una mezcla de PCR que comprende:
TRIS-HCl 10 mM, pH 9,0
MgCl_{2} 2,2 mM
KCl 50 mM
cada dNTP 0,2 mM
Triton X-100 al 0,1%
Se preparan cebadores externos tomando 1 \mul de F1 y 1 \mul de R96 a 250 mM (250 nm/ml - 0,250 nmoles/ml) y se añaden a 100 \mul de reacción PCR proporcionando una concentración final de 2,5 \muM de cada oligo. Se añade posteriormente 1 U de Taq1 polimerasa y la reacción se cicla durante aproximadamente 23 a 35 ciclos en las condiciones siguientes:
94 grados
30 s
50 grados
30 s
72 grados
60 s
El producto se extrae posteriormente con fenol/cloroformo, se precipita con etanol y se vuelve a poner en suspensión en 10 \mul de H_{2}Od y se analiza en un gel de agarosa.
\global\parskip1.000000\baselineskip
\vskip1.000000\baselineskip
TABLA 2
Esquema de mezclado para montaje utilizando Taq1 polimerasa (también topoisomerasa II)
14
15
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
TABLA 3
Esquema de mezclado alternativo (iniciando el montaje desde el extremo 5' ó 3')
16
17
18
Montaje de moléculas de ácido nucleico
Las moléculas de ácido nucleico comprendidas en la Tabla 4 se han producido utilizando los procedimientos descritos en la presente memoria. Las propiedades y características de cada molécula de ácido nucleico se describen también en la Tabla 4.
Tal como se describe en la Tabla 4, se montó un plásmido sintético de 4.800 bp de longitud. El plásmido comprende 192 oligonucleótidos (dos series de 96 polímeros de 50 monómeros solapantes; solapamiento de 25 bp). El plásmido es esencialmente el pUC que contiene resistencia a la kanamicina en lugar de resistencia a la ampicilina. El plásmido sintético también contiene los genes lux A y B del gen de la luciferasa bacteriana Vibrio fisheri. El plásmido SynPuc19 tiene una longitud de 2.700 bp que comprende una secuencia esencialmente idéntica a pUC19 solamente clasificada para precisamente 2.700 bp. Se utilizaron dos series de polímeros de 96 y 50 unidades para montar el plásmido. El plásmido Synlux4 pUC19 se clasificó y se añadió el gen luxA. Para montar el plásmido se utilizaron los oligonucleótidos de 54 y 100 monómeros que comprenden dos series de 27 oligonucleótidos. El plásmido miniQE10 que comprende 2.400 bp se montó utilizando oligonucleótidos de 48 y 50 monómeros. MiniQE10 es un plásmido de expresión que contiene una etiqueta 6\times His y el activador bacteriano para la expresión del polipéptido de gran nivel. Se montó y se sintetizó miniQE10 utilizando el procedimiento de ampliación por Taq1 polimerasa. El plásmido microQE es un plásmido mínimo que contiene solamente un gen de ampicilina, un origen de replicación y un enlazador de plásmidos pQE. El microQE se montó utilizando la ligadura combinatoria con 24 a 50 monómeros o con un tubo de ampliación por PCR. Las secuencias de ácidos nucleicos SynFib1, SynFibB y SynFibG son fibrinógenos humanos sintéticos preparados utilizando codones de E. coli para optimizar la expresión en un sistema de expresión procariótico.
TABLA 4 Moléculas de ácido nucleico sintéticas producidas utilizando los procedimientos de la invención
19

Claims (36)

1. Procedimiento de síntesis de un polinucleótido diana que comprende:
a)
proporcionar una secuencia de polinucleótido diana;
b)
identificar por lo menos un polinucleótido de iniciación presente en el polinucleótido diana de a), en el que el polinucleótido de iniciación comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5' y una prolongación en 3';
c)
identificar un segundo polinucleótido presente en el polinucleótido diana de a), en el que el segundo polinucleótido es contiguo al polinucleótido de iniciación y comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto por una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', en el que por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación;
d)
identificar un tercer polinucleótido presente en el polinucleótido diana de a), en el que el tercer polinucleótido es contiguo a la secuencia de iniciación y comprende por lo menos un oligonucleótido con cadena más apareado con por lo menos un oligonucleótido con cadena menos dando como resultado un polinucleótido parcialmente bicatenario compuesto de una prolongación en 5', una prolongación en 3' o una prolongación en 5' y una prolongación en 3', en el que por lo menos una prolongación del tercer polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación que no es complementaria con una prolongación del segundo polinucleótido;
e)
poner en contacto el polinucleótido de iniciación de b) con el segundo polinucleótido de c) y el tercer polinucleótido de d) en condiciones y durante un tiempo tal adecuado para su apareamiento, resultando la puesta en contacto en un polinucleótido bicatenario contiguo, en el que la secuencia de iniciación se extiende en dos direcciones;
f)
poner en contacto la mezcla de e) con una ligasa en condiciones adecuadas para la ligadura; y
g)
repetir opcionalmente b) a f) para añadir secuencialmente polinucleótidos bicatenarios al polinucleótido de iniciación extendido mediante ciclos repetidos de apareamiento y ligadura, sintetizándose un polinucleótido diana.
2. Procedimiento según la reivindicación 1, en el que la secuencia de polinucleótido diana codifica un polipéptido diana.
3. Procedimiento según la reivindicación 2, en el que el polipéptido diana es una proteína.
4. Procedimiento según la reivindicación 3, en el que la proteína es un enzima.
5. Procedimiento según la reivindicación 1, en el que la secuencia de polinucleótido de iniciación se identifica mediante un programa informático.
6. Procedimiento de síntesis de un polinucleótido diana según la reivindicación 1, en el que:
a)
la secuencia del polinucleótido diana es una secuencia de polinucleótido diana obtenida de una secuencia modelo;
b)
el polinucleótido de iniciación comprende: 1) un primer oligonucleótido con cadena más; 2) un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que comprende una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; comprendiendo además el procedimiento:
c)
aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más con el oligonucleótido con cadena menos de b) dando como resultado un polinucleótido de iniciación parcialmente bicatenario compuesto de una prolongación en 5' y una prolongación en 3'; y en el que
d)
la segunda secuencia de polinucleótido comprende: 1) un primer oligonucleótido con cadena más; 2) un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que comprende una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; comprendiendo además el procedimiento:
e)
aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más con el oligonucleótido con cadena menos de d) dando como resultado un segundo polinucleótido parcialmente bicatenario, en el que por lo menos una prolongación del segundo polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación; y en el que
f)
el tercer polinucleótido comprende: 1) un primer oligonucleótido con cadena más; 2) un segundo oligonucleótido con cadena más contiguo al primer oligonucleótido con cadena más; y 3) un oligonucleótido con cadena menos que comprende una primera secuencia contigua que es por lo menos parcialmente complementaria con el primer oligonucleótido con cadena más y la segunda secuencia contigua que es por lo menos parcialmente complementaria con el segundo oligonucleótido con cadena más; comprendiendo además el procedimiento:
g)
aparear el primer oligonucleótido con cadena más y el segundo oligonucleótido con cadena más al oligonucleótido con cadena menos de f) dando como resultado un segundo polinucleótido parcialmente bicatenario, en el que por lo menos una prolongación del tercer polinucleótido es complementaria con por lo menos una prolongación del polinucleótido de iniciación y no complementaria con una prolongación del segundo polinucleótido;
h)
poner en contacto el polinucleótido de iniciación de c) con el segundo polinucleótido de e) y el tercer polinucleótido de g) en condiciones y durante un tiempo tal adecuado para su apareamiento, resultando la puesta en contacto en un polinucleótido bicatenario contiguo, en el que la secuencia de iniciación se extiende en dos direcciones;
i)
poner en contacto la mezcla de h) con una ligasa en condiciones adecuadas para la ligadura; y
j)
repetir opcionalmente b) a i) para añadir secuencialmente los polinucleótidos bicatenarios al polinucleótido de iniciación extendido mediante ciclos repetidos de apareamiento y ligadura, sintetizándose un polinucleótido diana.
7. Procedimiento para sintetizar un polinucleótido diana, que comprende:
a)
proporcionar una secuencia de polinucleótido diana;
b)
identificar por lo menos un polinucleótido de iniciación presente en un polinucleótido diana de a), en el que el polinucleótido de iniciación comprende por lo menos un oligonucleótido con cadena más apareado a por lo menos un oligonucleótido con cadena menos;
c)
poner en contacto el polinucleótido de iniciación en condiciones adecuadas para el apareamiento del cebador con un primer oligonucleótido que presenta una complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación, y un segundo oligonucleótido que presenta una complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación;
d)
catalizar en condiciones adecuadas la extensión del cebador: 1) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena más del polinucleótido de iniciación; 2) la síntesis del polinucleótido a partir del 3'-hidroxilo del primer oligonucleótido apareado; 3) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación; y 4) la síntesis del polinucleótido a partir del 3'-hidroxilo del segundo oligonucleótido apareado, en el que la secuencia de iniciación se extiende en dos direcciones formándose un polinucleótido de iniciación extendido naciente;
e)
poner en contacto el polinucleótido de iniciación extendido de d) en condiciones adecuadas para el apareamiento del cebador con un tercer oligonucleótido que presenta una complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación extendido y un cuarto oligonucleótido que presenta una complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación extendido;
f)
catalizar en condiciones adecuadas para la extensión del cebador: 1) la síntesis del polinucleótido del 3'-hidroxilo de la cadena más del polinucleótido de iniciación extendido; 2) la síntesis del polinucleótido extendido del 3'-hidroxilo del tercer oligonucleótido apareado; 3) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación extendido; y 4) la síntesis del polinucleótido a partir del 3'-hidroxilo del cuarto oligonucleótido apareado, en el que la secuencia de iniciación extendida se extiende en dos direcciones formándose un polinucleótido de iniciación extendido naciente; y
g)
repetir opcionalmente e) a f) si se desea, dando como resultado la formación de la secuencia de polinucleótido diana.
8. Procedimiento según la reivindicación 7, en el que la secuencia del polinucleótido diana codifica un polipéptido diana.
9. Procedimiento según la reivindicación 8, en el que el polipéptido diana es una proteína.
10. Procedimiento según la reivindicación 9, en el que la proteína es un enzima.
11. Procedimiento según la reivindicación 7, en el que el polinucleótido de iniciación se identifica mediante un algoritmo.
12. Procedimiento según la reivindicación 1 ó 7, en el que la cadena más del segundo o tercer polinucleótido de iniciación es de aproximadamente 15 a 1.000 nucleótidos de longitud.
13. Procedimiento según la reivindicación 1 ó 7, en el que la cadena más del segundo o tercer polinucleótido de iniciación es de aproximadamente 20 a 500 nucleótidos de longitud.
14. Procedimiento según la reivindicación 1 ó 7, en el que la cadena más del segundo o tercer polinucleótido de iniciación es de aproximadamente 25 a 100 nucleótidos de longitud.
15. Procedimiento según la reivindicación 1 ó 7, en el que la cadena menos del segundo o tercer polinucleótido de iniciación es de aproximadamente 15 a 1.000 nucleótidos de longitud.
16. Procedimiento según la reivindicación 1 ó 7, en el que la cadena menos del segundo o tercer polinucleótido de iniciación es de aproximadamente 20 a 500 nucleótidos de longitud.
17. Procedimiento según la reivindicación 1 ó 7, en el que la cadena menos del segundo o tercer polinucleótido de iniciación es de aproximadamente 25 a 100 nucleótidos de longitud.
18. Procedimiento según la reivindicación 1 ó 7, en el que el polinucleótido de iniciación está acoplado a un soporte sólido.
19. Procedimiento según la reivindicación 1, en el que la secuencia del polinucleótido diana es una secuencia del polinucleótido diana obtenida a partir de una secuencia modelo; comprendiendo además el procedimiento:
h)
incorporar el polinucleótido diana en un vector de expresión;
i)
introducir el vector de expresión de h) dentro de una célula hospedadora adecuada;
j)
cultivar la célula de i) en condiciones y durante un tiempo tal para promover la expresión del polipéptido diana codificado por el polinucleótido diana; y
k)
aislar el polipéptido diana.
20. Procedimiento según la reivindicación 19, en el que el polipéptido diana es una proteína híbrida.
21. Procedimiento según la reivindicación 19, en el que el polipéptido diana es una proteína de fusión.
22. Procedimiento según la reivindicación 19, en el que el vector de expresión es un vector de expresión bacteriano.
23. Procedimiento según la reivindicación 20, en el que el vector de expresión es un vector de expresión de célula de animal.
24. Procedimiento según la reivindicación 19, en el que el vector de expresión es un vector de expresión de célula de insecto.
25. Procedimiento según la reivindicación 19, en el que el vector de expresión es un vector retrovírico.
26. Procedimiento según la reivindicación 20, en el que el vector de expresión está contenido en una célula hospedadora.
27. Procedimiento según la reivindicación 26, en el que la célula hospedadora es una célula procariótica.
28. Procedimiento según la reivindicación 26, en el que la célula hospedadora es una célula eucariótica.
29. Procedimiento de síntesis de un polinucleótido diana que comprende:
a)
proporcionar una secuencia de polinucleótido diana obtenida a partir de una secuencia modelo;
b)
sintetizar químicamente una pluralidad de oligonucleótidos monocatenarios cada uno de los cuales es complementario parcialmente con por lo menos un oligonucleótido presente en la pluralidad, en el que la secuencia de la pluralidad de oligonucleótidos es una secuencia contigua del polinucleótido diana;
c)
poner en contacto los oligonucleótidos inversos parcialmente de b) en condiciones y durante un tiempo tal adecuado para el apareamiento, dando como resultado la puesta en contacto una pluralidad de polinucleótidos parcialmente bicatenarios, en el que cada polinucleótido bicatenario está compuesto por una prolongación en 5' y una prolongación en 3';
d)
identificar por lo menos un polinucleótido de iniciación obtenido a partir de la secuencia modelo, en el que el polinucleótido de iniciación está presente en la pluralidad de polinucleótidos bicatenarios indicados en c);
e)
someter una mezcla que comprende el polinucleótido de iniciación y 1) un polinucleótido bicatenario que se apareará con la parte 5' de dicha secuencia de iniciación; 2) un polinucleótido bicatenario que se apareará con la parte 3' del polinucleótido de iniciación; y 3) una ADN ligasa en condiciones adecuadas para el apareamiento y ligadura, en el que el polinucleótido de iniciación se extiende en dos direcciones;
f)
aparear secuencialmente los polinucleótidos bicatenarios con el polinucleótido de iniciación extendido mediante ciclos repetidos de apareamiento, produciéndose el polinucleótido diana.
30. Procedimiento según las reivindicaciones 1 a 29, en el que los oligonucleótidos se producen por síntesis en un sintetizador automático de ADN.
31. Medio de almacenamiento legible por ordenador que presenta un programa informático almacenado en el mismo para su utilización en la realización del procedimiento según las reivindicaciones 1 a 30, comprendiendo el programa informático las instrucciones para hacer que un sistema informático:
a)
identificar una secuencia del polinucleótido de iniciación contenida en la secuencia de polinucleótido diana;
b)
analice la secuencia de polinucleótido diana en oligonucleótidos múltiples distintos y parcialmente complementarios;
c)
controle el montaje de la secuencia de polinucleótido diana controlando la extensión en dos direcciones de la secuencia de polinucleótido de iniciación mediante la adición secuencial de los oligonucleótidos parcialmente complementarios que dan como resultado un polinucleótido bicatenario contiguo.
32. Medio de almacenamiento legible por ordenador según la reivindicación 31, en el que el análisis se realiza mediante un algoritmo.
\newpage
33. Medio de almacenamiento legible por ordenador según la reivindicación 32, en el que el algoritmo comprende:
20
\newpage
en el que
21
\vskip1.000000\baselineskip
34. Medio de almacenamiento legible por ordenador según la reivindicación 33, en el que la secuencia directa se convierte opcionalmente en el caso superior utilizando un algoritmo que comprende:
22
\vskip1.000000\baselineskip
en el que
23
\vskip1.000000\baselineskip
35. Procedimiento para la síntesis automática de una secuencia de polinucleótido diana, que comprende:
a)
proporcionar al usuario una oportunidad de comunicar una secuencia de polinucleótido diana deseada;
b)
permitir al usuario transmitir la secuencia de polinucleótido diana deseada a un servidor;
c)
proporcionar al usuario una denominación única;
d)
obtener la secuencia de polinucleótido diana transmitida proporcionada por el usuario,
que comprende además el procedimiento según la reivindicación 1.
36. Procedimiento según la reivindicación 35, que comprende además:
e)
identificar por lo menos un polinucleótido de iniciación presente en el polinucleótido diana de d), en el que el polinucleótido de iniciación comprende por lo menos un oligonucleótido con cadena más apareado a por lo menos un oligonucleótido con cadena menos;
f)
poner en contacto el polinucleótido de iniciación en condiciones adecuadas para el apareamiento del cebador con un primer oligonucleótido que presenta complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación, y un segundo oligonucleótido que presenta complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación;
g)
catalizar en condiciones adecuadas la extensión del cebador: 1) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena más del polinucleótido de iniciación; 2) la síntesis del polinucleótido a partir del 3'-hidroxilo del primer oligonucleótido apareado; 3) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación; y 4) la síntesis del polinucleótido a partir del 3'-hidroxilo del segundo oligonucleótido apareado, en el que la secuencia de iniciación se extiende en dos direcciones formándose un polinucleótido de iniciación extendido naciente;
h)
poner en contacto el polinucleótido de iniciación extendido de g) en condiciones adecuadas para el apareamiento del cebador con un tercer oligonucleótido que presenta complementariedad parcial con la parte 3' de la cadena más del polinucleótido de iniciación extendido y un cuarto oligonucleótido que presenta complementariedad parcial con la parte 3' de la cadena menos del polinucleótido de iniciación extendido;
i)
catalizar en condiciones adecuadas para la extensión del cebador: 1) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena más del polinucleótido de iniciación extendido; 2) la síntesis del polinucleótido a partir del 3'-hidroxilo del tercer oligonucleótido apareado; 3) la síntesis del polinucleótido a partir del 3'-hidroxilo de la cadena menos del polinucleótido de iniciación extendido; y 4) la síntesis del polinucleótido a partir del 3'-hidroxilo del cuarto oligonucleótido apareado, en el que la secuencia de iniciación extendida se extiende en dos direcciones formándose un polinucleótido de iniciación extendido naciente; y
j)
repetir opcionalmente e) a f) según se desee, dando como resultado la formación de la secuencia de polinucleótido diana.
ES02739079T 2001-01-19 2002-01-18 Montaje dirigido por ordenador de un polinucleotido que codifica un polipeptido diana. Expired - Lifetime ES2309175T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26269301P 2001-01-19 2001-01-19
US262693P 2001-01-19

Publications (1)

Publication Number Publication Date
ES2309175T3 true ES2309175T3 (es) 2008-12-16

Family

ID=22998593

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02739079T Expired - Lifetime ES2309175T3 (es) 2001-01-19 2002-01-18 Montaje dirigido por ordenador de un polinucleotido que codifica un polipeptido diana.

Country Status (13)

Country Link
US (9) US20040241650A1 (es)
EP (1) EP1385950B1 (es)
JP (1) JP2004533228A (es)
KR (1) KR100860291B1 (es)
AT (1) ATE399857T1 (es)
AU (1) AU2008201007A1 (es)
CA (1) CA2433463A1 (es)
DE (1) DE60227361D1 (es)
DK (1) DK1385950T3 (es)
ES (1) ES2309175T3 (es)
MX (1) MXPA03006344A (es)
PT (1) PT1385950E (es)
WO (1) WO2002081490A2 (es)

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6670127B2 (en) * 1997-09-16 2003-12-30 Egea Biosciences, Inc. Method for assembly of a polynucleotide encoding a target polypeptide
US7563600B2 (en) 2002-09-12 2009-07-21 Combimatrix Corporation Microarray synthesis and assembly of gene-length polynucleotides
US7932025B2 (en) * 2002-12-10 2011-04-26 Massachusetts Institute Of Technology Methods for high fidelity production of long nucleic acid molecules with error control
US7879580B2 (en) * 2002-12-10 2011-02-01 Massachusetts Institute Of Technology Methods for high fidelity production of long nucleic acid molecules
US7041481B2 (en) 2003-03-14 2006-05-09 The Regents Of The University Of California Chemical amplification based on fluid partitioning
JP4093157B2 (ja) * 2003-09-17 2008-06-04 株式会社日立製作所 分散検査装置及びホスト検査装置
US8825411B2 (en) 2004-05-04 2014-09-02 Dna Twopointo, Inc. Design, synthesis and assembly of synthetic nucleic acids
US20090317873A1 (en) * 2004-05-04 2009-12-24 Sridhar Govindarajan Design, synthesis and assembly of synthetic nucleic acids
US20070148681A1 (en) * 2005-12-16 2007-06-28 Gene Oracle, Inc. Gene synthesis kit
US20070231805A1 (en) * 2006-03-31 2007-10-04 Baynes Brian M Nucleic acid assembly optimization using clamped mismatch binding proteins
US20090087840A1 (en) * 2006-05-19 2009-04-02 Codon Devices, Inc. Combined extension and ligation for nucleic acid assembly
WO2008027558A2 (en) 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
US7872120B2 (en) * 2007-08-10 2011-01-18 Venkata Chalapathi Rao Koka Methods for synthesizing a collection of partially identical polynucleotides
WO2009138954A2 (en) 2008-05-14 2009-11-19 British Columbia Cancer Agency Branch Gene synthesis by convergent assembly of oligonucleotide subsets
WO2011120024A1 (en) 2010-03-25 2011-09-29 Quantalife, Inc. Droplet generation for droplet-based assays
US10512910B2 (en) 2008-09-23 2019-12-24 Bio-Rad Laboratories, Inc. Droplet-based analysis method
US9764322B2 (en) 2008-09-23 2017-09-19 Bio-Rad Laboratories, Inc. System for generating droplets with pressure monitoring
US9417190B2 (en) 2008-09-23 2016-08-16 Bio-Rad Laboratories, Inc. Calibrations and controls for droplet-based assays
US11130128B2 (en) 2008-09-23 2021-09-28 Bio-Rad Laboratories, Inc. Detection method for a target nucleic acid
US8951939B2 (en) 2011-07-12 2015-02-10 Bio-Rad Laboratories, Inc. Digital assays with multiplexed detection of two or more targets in the same optical channel
US9132394B2 (en) 2008-09-23 2015-09-15 Bio-Rad Laboratories, Inc. System for detection of spaced droplets
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
US9194861B2 (en) 2009-09-02 2015-11-24 Bio-Rad Laboratories, Inc. Method of mixing fluids by coalescence of multiple emulsions
US9492797B2 (en) 2008-09-23 2016-11-15 Bio-Rad Laboratories, Inc. System for detection of spaced droplets
US8158391B2 (en) 2009-05-06 2012-04-17 Dna Twopointo, Inc. Production of an α-carboxyl-ω-hydroxy fatty acid using a genetically modified Candida strain
WO2011056872A2 (en) 2009-11-03 2011-05-12 Gen9, Inc. Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly
WO2011066185A1 (en) 2009-11-25 2011-06-03 Gen9, Inc. Microfluidic devices and methods for gene synthesis
WO2011085075A2 (en) 2010-01-07 2011-07-14 Gen9, Inc. Assembly of high fidelity polynucleotides
US8399198B2 (en) 2010-03-02 2013-03-19 Bio-Rad Laboratories, Inc. Assays with droplets transformed into capsules
US20110224086A1 (en) * 2010-03-09 2011-09-15 Jose Pardinas Methods and Algorithms for Selecting Polynucleotides For Synthetic Assembly
EP2556170A4 (en) 2010-03-25 2014-01-01 Quantalife Inc TRAPPING TRANSPORT AND DETECTION SYSTEM
EP3574990B1 (en) 2010-11-01 2022-04-06 Bio-Rad Laboratories, Inc. System for forming emulsions
EP2638157B1 (en) 2010-11-12 2015-07-22 Gen9, Inc. Methods and devices for nucleic acids synthesis
WO2012064975A1 (en) 2010-11-12 2012-05-18 Gen9, Inc. Protein arrays and methods of using and making the same
DE102010056289A1 (de) 2010-12-24 2012-06-28 Geneart Ag Verfahren zur Herstellung von Leseraster-korrekten Fragment-Bibliotheken
AU2012231098B2 (en) 2011-03-18 2016-09-29 Bio-Rad Laboratories, Inc. Multiplexed digital assays with combinatorial use of signals
JP2014512826A (ja) 2011-04-25 2014-05-29 バイオ−ラド ラボラトリーズ インコーポレイテッド 核酸分析のための方法および組成物
IL302248A (en) 2011-08-26 2023-06-01 Gen9 Inc Preparations and methods for high-fidelity assembly of nucleic acids
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
WO2013155531A2 (en) 2012-04-13 2013-10-17 Bio-Rad Laboratories, Inc. Sample holder with a well having a wicking promoter
CA2871505C (en) 2012-04-24 2021-10-12 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
EP2864531B2 (en) 2012-06-25 2022-08-03 Gen9, Inc. Methods for nucleic acid assembly and high throughput sequencing
US9678948B2 (en) 2012-06-26 2017-06-13 International Business Machines Corporation Real-time message sentiment awareness
US9104656B2 (en) * 2012-07-03 2015-08-11 International Business Machines Corporation Using lexical analysis and parsing in genome research
US9690775B2 (en) 2012-12-27 2017-06-27 International Business Machines Corporation Real-time sentiment analysis for synchronous communication
US9460083B2 (en) 2012-12-27 2016-10-04 International Business Machines Corporation Interactive dashboard based on real-time sentiment analysis for synchronous communication
US10167366B2 (en) 2013-03-15 2019-01-01 Melior Innovations, Inc. Polysilocarb materials, methods and uses
KR102351838B1 (ko) 2013-08-05 2022-01-18 트위스트 바이오사이언스 코포레이션 드 노보 합성된 유전자 라이브러리
US10487323B2 (en) 2014-08-01 2019-11-26 The Regents Of The University Of California One-pot multiplex gene synthesis
US10669304B2 (en) 2015-02-04 2020-06-02 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
CA2975855A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
EP3350314A4 (en) 2015-09-18 2019-02-06 Twist Bioscience Corporation BANKS OF OLIGONUCLEIC ACID VARIANTS AND SYNTHESIS THEREOF
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
EP3384077A4 (en) 2015-12-01 2019-05-08 Twist Bioscience Corporation FUNCTIONALIZED SURFACES AND THEIR PREPARATION
EP3500672A4 (en) 2016-08-22 2020-05-20 Twist Bioscience Corporation NOVO SYNTHESIZED NUCLEIC ACID BANKS
CN110248724B (zh) 2016-09-21 2022-11-18 特韦斯特生物科学公司 基于核酸的数据存储
GB2573069A (en) 2016-12-16 2019-10-23 Twist Bioscience Corp Variant libraries of the immunological synapse and synthesis thereof
CA3054303A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
CN110913865A (zh) 2017-03-15 2020-03-24 特韦斯特生物科学公司 免疫突触的变体文库及其合成
CA3066744A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
GB2581620A (en) 2017-09-11 2020-08-26 Twist Bioscience Corp GPCR binding proteins and synthesis thereof
GB2566986A (en) 2017-09-29 2019-04-03 Evonetix Ltd Error detection during hybridisation of target double-stranded nucleic acid
CN111527205A (zh) * 2017-10-13 2020-08-11 里本生物实验室有限责任公司 使用寡核苷酸的多样性文库合成多核苷酸的新方法
CA3079613A1 (en) 2017-10-20 2019-04-25 Twist Bioscience Corporation Heated nanowells for polynucleotide synthesis
EP3735459A4 (en) 2018-01-04 2021-10-06 Twist Bioscience Corporation DNA-BASED DIGITAL INFORMATION STORAGE
WO2019222706A1 (en) 2018-05-18 2019-11-21 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
JP2022522668A (ja) 2019-02-26 2022-04-20 ツイスト バイオサイエンス コーポレーション 抗体を最適化するための変異体核酸ライブラリ
KR20210143766A (ko) 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
US20220162596A1 (en) 2019-04-10 2022-05-26 Ribbon Biolabs Gmbh A library of polynucleotides
WO2020257612A1 (en) 2019-06-21 2020-12-24 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
CN115243787A (zh) * 2019-12-30 2022-10-25 源点生物科技股份有限公司 使用酶制备核酸序列的装置及方法
EP4091169A4 (en) * 2020-01-17 2024-02-14 Asklepios Biopharmaceutical Inc SYSTEMS AND METHODS FOR THE DESIGN OR PRODUCTION OF SYNTHETIC REGULATORY SEQUENCES
GB2619548A (en) * 2022-06-10 2023-12-13 Nunabio Ltd Nucleic acid and gene synthesis

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4652639A (en) * 1982-05-06 1987-03-24 Amgen Manufacture and expression of structural genes
EP0316018A3 (en) * 1985-03-29 1989-07-26 Cetus Oncology Corporation Modification of dna sequences
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
EP0427745A4 (en) * 1988-07-14 1992-11-25 Baylor College Of Medicine Solid phase assembly and reconstruction of biopolymers
US5198346A (en) * 1989-01-06 1993-03-30 Protein Engineering Corp. Generation and selection of novel DNA-binding proteins and polypeptides
ATE143696T1 (de) * 1989-02-28 1996-10-15 Canon Kk Partiell doppelsträngiges oligonukleotid und verfahren zu seiner bildung
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5837528A (en) * 1989-06-22 1998-11-17 Hoffmann La Roche, Inc. Bacterial strains which overproduce riboflavin
AU644619B2 (en) * 1989-12-21 1993-12-16 Advanced Technologies (Cambridge) Limited Modification of plant metabolism
US5747334A (en) * 1990-02-15 1998-05-05 The University Of North Carolina At Chapel Hill Random peptide library
CA2092317A1 (en) * 1990-09-28 1992-03-29 David H. Gelfand Purified thermostable nucleic acid polymerase enzyme from thermosipho africanus
AU663300B2 (en) 1990-12-06 1995-10-05 Affymetrix, Inc. Very large scale immobilized polymer synthesis
JP3169610B2 (ja) * 1991-06-27 2001-05-28 ジーンラブズ テクノロジーズ,インコーポレイテッド Dna結合分子の検出のためのスクリーニングアッセイ
WO1993005182A1 (en) * 1991-09-05 1993-03-18 Isis Pharmaceuticals, Inc. Determination of oligonucleotides for therapeutics, diagnostics and research reagents
CA2118806A1 (en) * 1991-09-18 1993-04-01 William J. Dower Method of synthesizing diverse collections of oligomers
EP1588761A3 (en) * 1991-11-22 2005-11-23 Affymetrix, Inc. Method of forming arrays of polymers
US5783384A (en) * 1992-01-13 1998-07-21 President And Fellows Of Harvard College Selection of binding-molecules
US5733743A (en) * 1992-03-24 1998-03-31 Cambridge Antibody Technology Limited Methods for producing members of specific binding pairs
WO1993024650A1 (en) * 1992-05-28 1993-12-09 Monash University Therapeutic compositions
US5807683A (en) * 1992-11-19 1998-09-15 Combichem, Inc. Combinatorial libraries and methods for their use
WO1994012632A1 (en) * 1992-11-27 1994-06-09 University College London Improvements in nucleic acid synthesis by pcr
US5714320A (en) * 1993-04-15 1998-02-03 University Of Rochester Rolling circle synthesis of oligonucleotides and amplification of select randomized circular oligonucleotides
WO1994029442A2 (en) * 1993-06-14 1994-12-22 Basf Aktiengesellschaft Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
US5591578A (en) * 1993-12-10 1997-01-07 California Institute Of Technology Nucleic acid mediated electron transfer
ZA95260B (en) * 1994-01-13 1995-09-28 Univ Columbia Synthetic receptors libraries and uses thereof
US5738996A (en) * 1994-06-15 1998-04-14 Pence, Inc. Combinational library composition and method
US5663046A (en) * 1994-06-22 1997-09-02 Pharmacopeia, Inc. Synthesis of combinatorial libraries
FR2732693B1 (fr) * 1995-04-06 1997-05-09 Bio Veto Tests Bvt Temoin de revelation de contaminants et procede d'application a la realisation d'un antibiogramme directement effectue sur prelevement
US5807754A (en) * 1995-05-11 1998-09-15 Arqule, Inc. Combinatorial synthesis and high-throughput screening of a Rev-inhibiting arylidenediamide array
US6110457A (en) * 1995-12-08 2000-08-29 St. Louis University Live attenuated vaccines based on cp45 HPIV-3 strain and method to ensure attenuation in such vaccines
US6670127B2 (en) * 1997-09-16 2003-12-30 Egea Biosciences, Inc. Method for assembly of a polynucleotide encoding a target polypeptide
WO1999014318A1 (en) * 1997-09-16 1999-03-25 Board Of Regents, The University Of Texas System Method for the complete chemical synthesis and assembly of genes and genomes
US7321828B2 (en) 1998-04-13 2008-01-22 Isis Pharmaceuticals, Inc. System of components for preparing oligonucleotides
IL141510A0 (en) * 1998-08-25 2002-03-10 Scripps Research Inst Method and systems for predicting protein function
EP1062614A1 (en) * 1999-01-19 2000-12-27 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides
US6586211B1 (en) * 1999-02-19 2003-07-01 Febit Ferrarius Biotechnology Gmbh Method for producing polymers
US7244560B2 (en) * 2000-05-21 2007-07-17 Invitrogen Corporation Methods and compositions for synthesis of nucleic acid molecules using multiple recognition sites

Also Published As

Publication number Publication date
AU2008201007A1 (en) 2008-05-15
US20050244841A1 (en) 2005-11-03
EP1385950B1 (en) 2008-07-02
DK1385950T3 (da) 2008-11-03
MXPA03006344A (es) 2004-12-03
US20040241650A1 (en) 2004-12-02
EP1385950A2 (en) 2004-02-04
JP2004533228A (ja) 2004-11-04
ATE399857T1 (de) 2008-07-15
KR20030077582A (ko) 2003-10-01
US20050118628A1 (en) 2005-06-02
US20050221340A1 (en) 2005-10-06
US7966338B2 (en) 2011-06-21
US20030138782A1 (en) 2003-07-24
US20050053997A1 (en) 2005-03-10
WO2002081490A3 (en) 2003-11-27
KR100860291B1 (ko) 2008-09-25
WO2002081490A2 (en) 2002-10-17
DE60227361D1 (de) 2008-08-14
PT1385950E (pt) 2008-08-12
CA2433463A1 (en) 2002-10-17
US20070054277A1 (en) 2007-03-08
WO2002081490A8 (en) 2004-05-21
US20050191648A1 (en) 2005-09-01
US20060154283A1 (en) 2006-07-13

Similar Documents

Publication Publication Date Title
ES2309175T3 (es) Montaje dirigido por ordenador de un polinucleotido que codifica un polipeptido diana.
ES2336086T3 (es) Metodo para el ensamblaje de un polinucleotido de cadena doble.
AU2022231730A1 (en) Variant libraries of the immunological synapse and synthesis thereof
CA2362939C (en) Method for producing polymers
US20240076654A1 (en) Automated methods for scalable, parallelized enzymatic biopolymer synthesis and modification using microfluidic devices
US20220090161A1 (en) Devices and methods for producing nucleic acids and proteins
ES2300808T3 (es) Procedimiento para la evolucion in vitro de polipeptidos.
US20040096826A1 (en) Methods for creating recombination products between nucleotide sequences
ES2292596T3 (es) Procedimiento de rastreo de matriz.
AU2002311757A1 (en) Computer-directed assembly of a polynucleotide encoding a target polypeptide
AU2008201933A1 (en) Method for assembly of a polynucleotide encoding a target polypeptide
US20190112605A1 (en) Functional ligands to igg
Gräslund Functional proteomics: Generation and analysis of cDNA-encoded proteins