ES2835673T3 - Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas - Google Patents

Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas Download PDF

Info

Publication number
ES2835673T3
ES2835673T3 ES15776901T ES15776901T ES2835673T3 ES 2835673 T3 ES2835673 T3 ES 2835673T3 ES 15776901 T ES15776901 T ES 15776901T ES 15776901 T ES15776901 T ES 15776901T ES 2835673 T3 ES2835673 T3 ES 2835673T3
Authority
ES
Spain
Prior art keywords
transposon
sequence
transposase
polynucleotide
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15776901T
Other languages
English (en)
Inventor
Jeremy Minshull
Mark Welch
Sridhar Govindrajan
Kate Caves
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DNA Twopointo Inc
Original Assignee
DNA Twopointo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=54264598&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2835673(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by DNA Twopointo Inc filed Critical DNA Twopointo Inc
Application granted granted Critical
Publication of ES2835673T3 publication Critical patent/ES2835673T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43586Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from silkworms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/463Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from amphibians
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/32Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2/00Peptides of undefined number of amino acids; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/40Vector systems having a special element relevant for transcription being an insulator
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/60Vector systems having a special element relevant for transcription from viruses

Abstract

Un polinucleótido que comprende un transposón que comprende repeticiones invertidas de los extremos de un transposón tipo piggyBac que flanquea un polinucleótido heterólogo no flanqueado naturalmente por las repeticiones invertidas de los extremos, las repeticiones invertidas están flanqueadas en sus lados externos por copias de una secuencia objetivo, en donde el transposón puede transponerse mediante una transposasa idéntica a la SEQ ID NO: 45 fusionada a una señal de localización nuclear heteróloga (NLS) en donde la SEQ ID NO: 124 proporciona la secuencia de cada repetición invertida de los extremos, la secuencia está en orientaciones invertidas en los dos extremos del transposón.

Description

DESCRIPCIÓN
Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas
1. Campo de la invención
El campo de la presente invención se refiere a configuraciones de vectores de ADN para la expresión génica heteróloga, métodos para identificar configuraciones preferidas, incluyendo aquellas que son capaces de lograr modificaciones estables de los genomas de las células objetivo, y el uso de transposones y transposasas.
2. Antecedentes de la invención
Las construcciones de ADN se propagan típicamente como plásmidos. Los plásmidos se construyen frecuentemente clonando una primera secuencia de polinucleótido en un vector. El vector generalmente comprende secuencias necesarias para la propagación en al menos una célula hospedera, pero a menudo también comprende secuencias que contribuyen al funcionamiento de la primera secuencia polinucleotídica. Por ejemplo, un vector puede comprender elementos que afectan la expresión de un polipéptido codificado por la primera secuencia polinucleotídica tales como promotores, potenciadores, intrones, terminadores, señales de inicio de la traducción, señales de poliadenilación, elementos de replicación, elementos de procesamiento y exportación de ARN y elementos que afectan la estructura de la cromatina que se une operativamente al primer polinucleótido. El proceso de optimizar un polinucleótido para una función específica a menudo comprende crear una pluralidad de polinucleótidos, clonarlos en el mismo vector para crear una primera pluralidad de polinucleótidos clonados y medir una propiedad de algunos de los polinucleótidos clonados.
Debido a que el proceso de clonación de polinucleótidos en un solo vector es relativamente simple, mientras que el proceso de construcción de un vector es más complejo y costoso, la optimización casi siempre se enfoca en crear variaciones en el polinucleótido clonado y muy raramente en variaciones en el vector. Incluso si la secuencia del vector es variada, esto normalmente se hará seleccionando entre un pequeño número de vectores preexistentes en lugar de construir deliberadamente un nuevo conjunto de vectores. Sin embargo, los vectores contienen frecuentemente muchos o incluso la mayoría de los elementos que determinan la función del polinucleótido clonado, por ejemplo, la expresión del polinucleótido en un hospedero de expresión. El desempeño funcional de muchos de estos elementos puede depender de la célula hospedera precisa que se utilice, por ejemplo, algunos elementos que funcionan bien en células humanas pueden funcionar mal en células de roedores, el mismo vector se usa a menudo en ambos.
Además, se han construido muchos vectores disponibles mediante métodos de clonación de sitios de restricción estándar y se han derivado de otros vectores en los que los elementos funcionales no se han definido bien. En consecuencia, muchos vectores contienen secuencias "fósiles" que son innecesarias para su función pero que se incluyen debido a métodos de clonación imprecisos o una falta de comprensión de la función (por ejemplo, el origen de replicación del fago f1, originalmente incorporado para la generación de fagémidos que pueden ser que se encuentran en muchos vectores que nunca se utilizan para elaborar fagémidos), o contienen secuencias que realmente comprometen la función (por ejemplo, el uso del gen de la beta lactamasa como marcador de selección que empeora la inestabilidad en vectores como los lentivirus).
Debido al inmenso tamaño del espacio de secuencia, no existe una manera eficaz de ensayar todas las posibles permutaciones de una molécula biológica polimérica, como un ácido nucleico o una proteína, para determinar una propiedad deseada. Probar cada posible base de nucleótidos en cada posición en un vector, conduce rápidamente a un número tan grande de moléculas que se deben ensayar, de modo que no es factible ningún método disponible de síntesis o prueba, incluso para un polímero de longitud modesta. Además, la mayoría de las moléculas generadas de esta manera carecerían de un nivel medible de la propiedad deseada. El espacio de secuencia total es muy grande y las soluciones funcionales en este espacio están distribuidas escasamente.
Por tanto, existe una necesidad en la técnica de métodos para identificar eficazmente los componentes del vector que contribuyen al desempeño y para evaluar este desempeño.
Los métodos típicos para introducir ADN en una célula incluyen reactivos de condensación de ADN tales como fosfato de calcio, polietilenglicol, reactivos que contienen lípidos tales como liposomas, vesículas multilaminares; así como estrategias mediadas por virus. Sin embargo, estos métodos pueden tener ciertas limitaciones. Por ejemplo, existen limitaciones de tamaño asociadas con los reactivos de condensación de ADN y las estrategias mediadas por virus. Además, la cantidad de ácido nucleico que se puede transfectar en una célula es limitada en las estrategias virales. Además, no todos los métodos facilitan la inserción del ácido nucleico proporcionado, en el ácido nucleico celular, y aunque los métodos de condensación de ADN y los reactivos que contienen lípidos son relativamente fáciles de preparar, la inserción del ácido nucleico en vectores virales puede ser laboriosa. Las estrategias mediadas por virus pueden ser específicas de tipo celular o de tejido, y el uso de estrategias mediadas por virus puede crear problemas inmunológicos cuando se usa in vivo.
La integración de ADN heterólogo en un genoma objetivo y los niveles de expresión de genes codificados por el ADN heterólogo integrado pueden incrementarse mediante la configuración de los elementos de ADN. La eficiencia de la integración, el tamaño de la secuencia de ADN heteróloga que se puede integrar y el número de copias de la secuencia de ADN heteróloga que se integran en cada genoma a menudo se pueden mejorar aún más mediante el uso de transposones. Los transposones o elementos transponibles incluyen una secuencia de ácido nucleico corta con secuencias repetidas en los extremos río arriba y río abajo. Los transposones activos pueden codificar enzimas que facilitan la escisión e inserción del ácido nucleico en secuencias de ADN objetivo. Se han descrito en la técnica varios elementos transponibles que facilitan la inserción de ácidos nucleicos en el genoma de los vertebrados. Por ejemplo, elementos transponibles descubiertos a partir de diversas fuentes, por ejemplo, un transposón diseñado del genoma de un pez salmónido llamado la bella durmiente; transposón piggyBac de células de lepidópteros; transposón piggyBac del murciélago Myotis lucifugus; el transposón marino descubierto por primera vez en Drosophila y; un transposón diseñado y repeticiones invertidas de transposón de la especie de rana, Rana pipiens, llamada príncipe rana.
Los diferentes elementos transponibles muestran diferentes preferencias por los sitios genómicos en los que se integran. Por ejemplo, los transposones piggyBac y piggyBat tienen preferencia por regiones transcripcionalmente inactivas. Aunque esto puede ser una ventaja para el transposón "silvestre" que no desea interrumpir la expresión génica en su hospedero y correr el riesgo de matarlo, es una desventaja para los transposones que se utilizan para maximizar la expresión génica. Por lo tanto, aunque en la técnica se han identificado varios elementos transponibles capaces de facilitar la inserción de ácidos nucleicos en el genoma eucariota, existe la necesidad de elementos transponibles alternativos y construcciones mejoradas que faciliten niveles de expresión más altos del ADN insertado, ya sea debido a una mayor eficiencia de inserción o porque las inserciones genómicas se realizan en posiciones más favorables dentro del genoma, en comparación con los elementos transponibles actualmente descritos en la técnica.
3. Resumen de la invención
La presente invención se refiere a un polinucleótido que comprende un transposón que comprende repeticiones invertidas en los extremos, de un transposón tipo piggyBac que flanquea un polinucleótido heterólogo que no está flanqueado naturalmente por las repeticiones invertidas en los extremos, estando las repeticiones invertidas flanqueadas en sus lados externos por copias de una secuencia objetivo, en donde el transposón es capaz de transponerse mediante una transposasa idéntica a la SEQ ID NO: 45 fusionada a una señal de localización nuclear heteróloga (NLS) en donde la SEQ ID NO: 124 proporciona la secuencia de cada repetición invertida de los extremos, estando la secuencia en orientaciones invertidas en los dos extremos del transposón.
La presente invención se refiere además a una línea celular y un animal transgénico que comprende un transposón como se describe en la presente descripción. La presente invención también se refiere al uso de un polinucleótido descrito en la presente descripción para integrar el transposón en un genoma de una célula hospedera eucariota in vitro. Además, la presente invención se refiere a una célula hospedera eucariota que tiene un genoma que comprende un transposón como se describe en la presente descripción.
Describimos formas novedosas de evaluar el desempeño de elementos individuales del vector mediante el análisis de la función de un pequeño número de vectores. Los resultados de este análisis se pueden utilizar para crear combinaciones de alto desempeño de los elementos de secuencia. Dichos mapas se utilizan para dirigir perturbaciones o modificaciones de las secuencias de la construcción de ácido nucleico para perturbar o modificar la actividad de la construcción de ácido nucleico de forma controlada.
Se describen combinaciones específicas de elementos del vector que contribuyen al desempeño del vector en células de mamífero, en particular para producir altos niveles de expresión de polipéptidos en células transfectadas de forma transitoria o estable. Los elementos del vector incluyen promotores, potenciadores, intrones, terminadores, señales de inicio de la traducción, señales de poliadenilación, elementos de replicación derivados de virus, elementos de procesamiento y exportación de ARN, transposones, transposasas y elementos que afectan la estructura de la cromatina.
En algunas modalidades, la expresión génica heteróloga se puede mejorar cuando la construcción comprende además elementos de secuencia que mejoran la expresión por efectos sobre la estructura de la cromatina, o al afectar el procesamiento de ARN o la exportación de ARN, incluyendo las regiones de unión de andamiaje y matriz, intrones y elementos de respuesta postranscripcional como WPRE, HPRE y AGS. En algunas modalidades, la expresión heteróloga se mejora cuando la construcción comprende además secuencias que reducen la propagación de heterocromatina o la interferencia entre una región de control de la expresión y otra, como los aislantes HS4 o su secuencia núcleo.
La expresión de genes heterólogos a partir de construcciones que se integran de manera estable en el genoma de la célula objetivo se puede mejorar aún más incorporando extremos de transposones: elementos de secuencia que son reconocidos y transpuestos por transposasas. Las secuencias de ADN insertadas entre un par de extremos de transposón pueden escindirse de una molécula de ADN mediante una transposasa y (a menos que la transposasa sea deficiente en integración) insertarse en una segunda molécula de ADN. Se describen dos nuevos sistemas de transposón-transposasa, uno derivado del gusano de seda Bombyx mori y el otro de la rana Xenopus tropicalis. Cada uno de estos comprende secuencias que funcionan como extremos de transposones y que pueden usarse junto con una transposasa que reconoce y actúa sobre esos extremos de transposones, como sistemas de transferencia de genes para introducir de forma estable ácidos nucleicos en el ADN de una célula. Los sistemas de transferencia de genes de la presente invención pueden usarse en métodos, por ejemplo, pero sin limitarse a, expresión génica heteróloga, terapia génica, mutagénesis por inserción o descubrimiento génico.
En un aspecto, la invención presenta un transposón que comprende un segmento de ADN heterólogo flanqueado por un par de secuencias o variantes del extremo del transposón, derivados y fragmentos de las secuencias del extremo del transposón, de manera que el transposón retiene la actividad de transposón. En un caso, la secuencia de los extremos del transposón se deriva de la especie Bombyx mori. En una modalidad, la secuencia de los extremos del transposón se deriva de la especie Xenopus tropicalis.
En algunos casos, la presente descripción comprende además una transposasa que reconoce el transposón y efectúa la integración del ADN heterólogo entre los extremos del transposón en el ADN genómico de una célula objetivo. En un caso, la transposasa tiene una mayor actividad para la escisión de transposones en comparación con la actividad para la integración de transposones. En algunos casos preferidos, la transposasa comprende además una señal de localización nuclear heteróloga (NLS). En algunos casos, la transposasa puede comprender además un dominio de unión a ADN. En algunos casos, la transposasa está codificada en un polinucleótido.
En un caso, un polinucleótido codifica una transposasa operativamente unida a un promotor heterólogo, en donde la transposasa inserta un transposón en la secuencia 5'-TTAT-3' dentro de un polinucleótido objetivo. En un caso, un polinucleótido codifica una transposasa unida operativamente a un promotor heterólogo, en donde la transposasa escinde un transposón reconociendo la secuencia 5'-TTAT-3' adyacente a las repeticiones invertidas del extremo del transposón. El polinucleótido que codifica la transposasa es al menos 85 %, al menos 90 %, al menos 95 % o al menos 98 % idéntico a la SEQ ID NO: 44. En un caso, el polinucleótido que codifica la transposasa codifica además una señal de localización nuclear heteróloga (NLS) a expresar fusionada a la transposasa. En un caso, el polinucleótido que codifica la transposasa codifica además un dominio de unión al ADN (DBD) que se puede expresar como una proteína de fusión con la transposasa. En algunos casos, la transposasa es una variante hiperactiva de SEQ ID NO: 44. En algunos casos, la transposasa es una variante defectuosa de integración de SEQ ID NO: 44.
En un caso, un polinucleótido codifica una transposasa fusionada a una NLS heteróloga y operativamente unida a un promotor heterólogo, donde la transposasa es al menos 85 %, al menos 90 %, al menos 95 % o al menos 98 % idéntica a la SEQ ID NO: 45. En un caso, el polinucleótido que codifica la transposasa codifica además un dominio de unión al ADN (DBD) a expresar como una proteína de fusión con la transposasa. En algunos casos, la transposasa es una variante hiperactiva de SEQ ID NO: 45. En otros casos, la transposasa es una variante defectuosa de integración de SEQ ID NO: 45.
En algunas modalidades, un primer polinucleótido comprende un transposón que comprende repeticiones invertidas de un transposón tipo piggyBac de la especie Xenopus tropicalis que flanquea un polinucleótido heterólogo, estando flanqueadas las repeticiones invertidas por copias de la secuencia objetivo 5'-TTAA-3' en cada extremo, de manera que el transposón se puede escindir dejando una única copia de la secuencia objetivo 5'-TTAA-3' en lugar del transposón en el polinucleótido. Algunas modalidades comprenden además un segundo polinucleótido que codifica una transposasa de modo que el transposón, pero no la transposasa, se puede escindir de sus respectivos polinucleótidos y se puede integrar en una molécula de ADN receptora en una secuencia objetivo 5'-TTAA-3' mediante la acción de la transposasa. En algunas modalidades, el primer y segundo polinucleótidos son parte de la misma molécula, en algunas modalidades son moléculas diferentes, en algunas modalidades son moléculas diferentes proporcionadas juntas como parte de un kit.
En algunas modalidades, un primer polinucleótido comprende un transposón que comprende repeticiones invertidas de un transposón tipo piggyBac que flanquea un polinucleótido heterólogo, estando las repeticiones invertidas flanqueadas por copias de la secuencia objetivo 5'-TTAT-3' en cada extremo, de modo que el transposón se puede escindir dejando una única copia de la secuencia objetivo 5'-TTAT-3' en lugar del transposón en el polinucleótido. Algunas modalidades comprenden además un segundo polinucleótido que codifica una transposasa de manera que el transposón, pero no la transposasa, se puede escindir de sus respectivos polinucleótidos y se integra en una molécula de ADN receptora en una secuencia objetivo 5'-TTAT-3' mediante la acción de la transposasa. En algunas modalidades, el primer y segundo polinucleótidos son parte de la misma molécula, en algunas modalidades son moléculas diferentes, en algunas modalidades son moléculas diferentes proporcionadas juntas como parte de un kit. En algunos casos, el transposón de tipo piggyBac se deriva de la especie Bombyx mori.
En algunos casos, un transposón o transposasa se modifica para aumentar su actividad de integración o su actividad de escisión, o para modificar su especificidad de secuencia objetivo. Esta modificación puede efectuarse transfectando en una célula (a) un primer polinucleótido que comprende un gen que codifica un marcador cuya expresión es interrumpida por un transposón, y (b) un segundo polinucleótido que codifica una transposasa a expresar a partir del polinucleótido, en donde si la transposasa tiene actividad para el transposón: transpone el transposón fuera del primer polinucleótido, lo que provoca que la expresión del marcador genere una señal que indique que la transposasa está activa en el transposón. El transposón puede tener extremos que comprenden la SEQ ID NO 1 y 2 o una variante de cualquiera o ambos, que tienen al menos un 90 % de identidad de secuencia con la SEQ ID NO: 1 o 2, y la transposasa tiene la secuencia de SEQ ID NO: 44 o una variante que muestra al menos un 90 % de identidad de secuencia al mismo. El transposón puede tener extremos que comprenden la SEQ ID NO. 5 y 6 o una variante de cualquiera o ambos que tienen al menos 90 % de identidad de secuencia con la SEQ ID NO: 5 o 6, y la transposasa tiene la secuencia de SEQ ID NO: 45 o una variante que muestra al menos 90 % de identidad de secuencia al mismo.
En algunos casos, un transposón comprende un polinucleótido heterólogo insertado entre un par de repeticiones invertidas, donde el transposón es capaz de transponerse mediante una transposasa que es al menos 85 %, al menos 90 %, al menos 95 %, al menos 98 % idéntica a la SEQ ID NO: 44. En algunas modalidades preferidas, el transposón es capaz de ser insertado por la transposasa en la secuencia 5'-TTAT-3' dentro de un ácido nucleico objetivo.
En algunos casos, el extremo del transposón comprende al menos 16 nucleótidos contiguos de la SEQ ID NO: 1 y el otro extremo del transposón comprende al menos 16 nucleótidos contiguos de la SEQ ID NO: 2. En algunos casos, el extremo del transposón comprende al menos 17, al menos 18, al menos 19, al menos 20, al menos 22, al menos 25, al menos 30 nucleótidos contiguos de la SEQ ID NO: 1 y el otro extremo del transposón comprende al menos al menos 17, al menos 18, al menos 19, al menos 20, al menos 22, al menos 25, al menos 30 nucleótidos contiguos de la SEQ ID NO: 2. En algunos casos, cada repetición invertida de los extremos (ITR) es al menos un 90 % idéntica a la SEQ ID NO: 32, en algunos casos, cada repetición invertida de los extremos (ITR) comprende la SEQ ID NO: 32. En algunos casos, un extremo del transposón es al menos el 85 %, al menos el 90 %, al menos el 95 %, al menos el 98 % idéntico a la SEQ ID NO: 1 y el otro extremo del transposón es al menos el 85 %, al menos el 90 %, al menos 95 %, al menos 98 % idéntico a la SEQ ID NO: 2.
En una modalidad de la presente invención, un polinucleótido comprende un transposón que comprende repeticiones invertidas de los extremos de un transposón tipo piggyBac que flanquea un polinucleótido heterólogo que no está flanqueado naturalmente por las repeticiones invertidas de los extremos, las repeticiones invertidas están flanqueadas en sus lados externos por copias de una secuencia objetivo, en donde el transposón es capaz de transponerse mediante una transposasa idéntica a la SEQ ID NO: 45 fusionada a una señal de localización nuclear heteróloga (NLS) donde la SEQ ID NO: 124 proporciona la secuencia de cada repetición invertida de los extremos, estando la secuencia en orientaciones invertidas en los dos extremos del transposón. En algunas modalidades, el extremo del transposón comprende al menos 14 nucleótidos contiguos de SEQ ID NO: 5 o 7 o 9 y el otro extremo del transposón comprende al menos 14 nucleótidos contiguos de SEQ ID NO: 6 u 8. En otra modalidad de la presente invención, la línea celular comprende un transposón como se describe en la presente descripción. En una modalidad adicional de la presente invención, un animal transgénico comprende un transposón como se describe en la presente descripción. En otra modalidad más de la presente invención, el uso de un polinucleótido descrito en la presente descripción para integrar el transposón en un genoma de una célula hospedera eucariota in vitro. En otra modalidad de la presente invención, una célula hospedera eucariota que tiene un genoma que comprende un transposón como se describe en la presente descripción.
En algunas modalidades, el extremo del transposón comprende al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 22, al menos 25, al menos 30 nucleótidos contiguos de la SEQ ID NO: 5 o 7 o 9 y el otro extremo del transposón comprende al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 22, al menos 25, al menos 30 nucleótidos contiguos de la SEQ ID NO: 6 u 8. En una modalidad, cada repetición invertida de los extremos del transposón (ITR) comprende la SEQ ID NO: 42. En una modalidad, una repetición invertida de los extremos (ITR) comprende la SEQ ID NO: 38 y una ITR comprende la SEQ ID NO: 41. En una modalidad, un extremo del transposón es al menos un 90 % idéntico a la SEQ ID NO: 5 y el otro extremo del transposón es al menos un 90 % idéntico a la SEQ ID NO: 6.
En algunas modalidades, el polinucleótido heterólogo comprende un promotor. En algunas modalidades, el promotor es un promotor EF1a, un promotor de CMV, un promotor de GAPDH, un promotor de timidina quinasa del virus del herpes simple (HSV-TK), un promotor de actina, un promotor de PGK o un promotor de ubiquitina. En algunas modalidades, el polinucleótido heterólogo está en un vector de transferencia de genes; en algunas modalidades, el polinucleótido heterólogo es parte del transposón. En algunas modalidades, el vector de transferencia de genes comprende además un transposón. En algunas modalidades, el polinucleótido heterólogo comprende además un segundo promotor. La dirección de transcripción del primer y segundo promotores puede ser la misma o diferente. En algunas modalidades, el promotor está unido operativamente a al menos uno o más de: i) un marco abierto de lectura; ii) un marcador de selección; iii) un marcador de contraselección; iv) un ácido nucleico que codifica una proteína reguladora; v) un ácido nucleico que codifica un ARN inhibidor. En algunas modalidades preferidas, el promotor es activo en una célula eucariota.
En otras modalidades, el polinucleótido heterólogo comprende uno o más elementos de secuencia que aumentan la expresión mejorando el procesamiento o la exportación de ARN desde el núcleo. Los elementos de procesamiento o exportación de ARN se seleccionan entre, pero no se limitan a, WPRE, HPRE (SEQ ID NO: 104-105, SAR (SEQ ID n O: 108-111, AGS (SEQ ID NO: 106-107. En otras modalidades, el polinucleótido heterólogo comprende un par de aislantes. Los aislantes se seleccionan de, pero no se limitan a, la SEQ ID NO: 112-113. En algunas modalidades, el ácido nucleico que comprende el vector de transferencia de genes comprende además una o más secuencias de replicación viral. En algunas modalidades, el ácido nucleico que comprende el transposón comprende además una o más secuencias de replicación viral, de manera que las secuencias de replicación no son capaces de transponerse mediante la transposasa. Las secuencias de replicación viral pueden incluir el antígeno T grande de SV40ori, SV40, EBVoriP y EBNA.
En algunas modalidades, el polinucleótido heterólogo unido operativamente a un promotor comprende dos marcos abierto de lectura (ORF), en los que los dos ORF están enlazados mediante elementos de acoplamiento seleccionados de IRES o CHYSEL. En algunas modalidades, los elementos IRES se seleccionan de, pero no se limitan a las SEQ ID NO: 58-100. En algunas modalidades, los elementos CHYSEL se seleccionan de, pero no se limitan a, la SEQ ID NO: 101. En algunas modalidades, los IRES son al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 %, al menos 98 % idénticos a cualquiera de las SEQ ID NO: 58-100. En algunas modalidades, IRES se selecciona de elementos 5'UTR de picornavirus. En algunas modalidades, los IRES tienen al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % de elementos 5'UTR de picornavirus. En algunas modalidades, los dos marcos abiertos de lectura codifican: i) una cadena pesada de anticuerpo (HC); ii) una cadena ligera de anticuerpo (LC). En algunas modalidades, los IRES se usan para controlar las proporciones de dos, tres, cuatro o más marcos abiertos de lectura (ORF). En algunas modalidades, dos o más IRES controlan los niveles de expresión de tres ORF. Los IRES seleccionados pueden ser iguales o diferentes. Un kit que comprende un vector de expresión con uno o más IRES seleccionados de las SEQ ID NO: 58-100. Un kit que comprende un panel de ácido nucleico de secuencias IRES seleccionadas de las SEQ ID NO: 58-100.
Un ejemplo de la presente descripción es un método para modificar el ADN genómico de una célula que comprende: a) Introducir en una célula de un organismo objetivo: i) una transposasa al menos 90 % idéntica a la SEQ ID NO: 44; y ii) un transposón que comprende extremos de transposón que flanquean un ácido nucleico heterólogo a los extremos del transposón, en donde la transposasa inserta el transposón en una secuencia 5'-TTAT-3' en el genoma de la célula; b) Aislar la célula con el transposón insertado el cual comprende el ácido nucleico heterólogo. Un ejemplo adicional de la presente descripción es un método para modificar el ADN genómico de una célula que comprende: a) Introducir en una célula de un organismo objetivo: i) una transposasa al menos 90 % idéntica a la SEQ ID NO: 45; y ii) un transposón que comprende extremos de transposón que flanquean un ácido nucleico heterólogo a los extremos del transposón; b) Aislar la célula con el transposón insertado el cual comprende el ácido nucleico heterólogo. En algunos casos, la transposasa es al menos 85 %, al menos 95 %, al menos 98 % idéntica a la SEQ ID NO: 44. En algunos casos, la transposasa es al menos el 85 %, al menos el 95 %, al menos el 98 % idéntica a la SEQ ID NO: 45. El método de la presente descripción comprende además eliminar el polinucleótido heterólogo insertado en el genoma tratando la célula con una transposasa. La transposasa es al menos un 85 %, al menos un 95 %, al menos un 98 % idéntica a la SEQ ID NO: 44. En algunos casos, la transposasa es al menos el 85 %, al menos el 95 %, al menos el 98 % idéntica a la SEQ ID NO: 45. En algunos casos, la transposasa es deficiente en integración. En algunos casos, la transposasa se proporciona como un ácido nucleico que codifica la transposasa, en otros casos, la transposasa se proporciona como una proteína. En algunos casos, la célula hospedera se obtiene de un eucariota; la célula es de un mamífero; la célula es una célula de ovario de hámster chino (CHO) o una célula embrionaria de riñón humano (HEK293). Un ejemplo de la presente descripción es un método para producir proteína a partir de una célula, comprendiendo el método i) integrar un transposón que codifica la proteína heteróloga y, ii) obtener la proteína de la célula. El transposón comprende un polinucleótido heterólogo unido operativamente a un promotor y comprende dos marcos abiertos de lectura (ORF), en los que los dos ORF están unidos por elementos de acoplamiento seleccionados de IRES o CHYSEL. En algunos casos, un método para producir la proteína a partir de una célula comprende i) introducir un vector de transferencia de genes que comprende un polinucleótido heterólogo unido operativamente a un promotor y comprende dos marcos abiertos de lectura (ORF), en los que los dos ORF están enlazados mediante elementos de acoplamiento seleccionados entre IRES o CHYSEL y, ii) obtener la proteína de una célula. En algunos casos, un método para producir un anticuerpo a partir de una célula, comprendiendo el método: i) Integrar un transposón que codifica la proteína heteróloga que comprende cadenas pesadas y ligeras del anticuerpo unidas por elementos de acoplamiento seleccionados de IRES o CHYSEL y, ii) obtener un anticuerpo de la célula. En algunos casos, un método para producir un anticuerpo a partir de una célula, comprendiendo el método: i) Introducir un vector de transferencia de genes que codifica la proteína heteróloga que comprende cadenas pesadas y ligeras del anticuerpo unidas por elementos de acoplamiento seleccionados de IRES o CHYSEL y, ii) obtener anticuerpo de la célula.
Otras modalidades de la presente invención son una línea celular que comprende el transposón como se describió anteriormente y un animal transgénico que comprende el transposón. Otros casos de la presente descripción son una línea celular producida mediante el método de modificación del ADN genómico de una célula como se describe anteriormente; una línea celular creada al eliminar el ADN heterólogo insertado en el genoma que comprende tratar la célula con una transposasa. Otros casos incluyen una proteína preparada mediante cualquiera de los métodos descritos anteriormente. En algunos casos, la proteína es un anticuerpo, un fragmento de anticuerpo o un derivado del mismo. Otros casos incluyen una composición farmacéutica que comprende el transposón y la transposasa junto con un portador, adyuvante o vehículo farmacéuticamente aceptable.
En una modalidad, la secuencia de ácido nucleico del transposón comprende una secuencia seleccionada de SEQ ID NO: 5-9. En una modalidad, la secuencia de ácido nucleico de la transposasa codifica la secuencia de aminoácidos SEQ ID NO: 45. En un caso, la secuencia de ácido nucleico del transposón comprende una secuencia seleccionada de SEQ ID NO: 1-4 y 10-29. En un caso, la secuencia de ácido nucleico de la transposasa codifica una secuencia de aminoácidos seleccionada de las SEQ ID NO: 43, 44 y 46-56.
En una modalidad, el transposón puede insertarse en el ADN de una célula.
En otras modalidades, el transposón de las modalidades anteriores comprende además un ácido nucleico que codifica un marcador de selección, por ejemplo, un gen que codifica una de entre glutamina sintasa, dihidrofolato reductasa, una proteína que confiere resistencia a puromicina, neomicina, higromicina, zeocina o blasticidina.
En algunas modalidades, el transposón se inserta en un plásmido. En una modalidad, el transposón comprende además un marco abierto de lectura. Se contempla expresamente que el transposón puede comprender combinaciones de cualquiera de los elementos de secuencia descritos anteriormente, incluyendo promotores, potenciadores, intrones, terminadores, señales de inicio de la traducción, señales de poliadenilación, procesamiento de ARN y elementos de exportación y elementos que afectan la estructura de la cromatina. Además, se contempla que los plásmidos en los que se insertan los transposones también pueden comprender combinaciones de cualquier transposasas o elementos de replicación derivados de virus.
En un caso, la presente descripción presenta un sistema de transferencia de genes que comprende un transposón según cualquiera de los casos anteriores; y una transposasa de Bombyx mori. En un caso adicional, la transposasa comprende una secuencia de aminoácidos correspondiente a las SEQ ID NO: 43-44. En una modalidad, la invención presenta un sistema de transferencia de genes que comprende un transposón de acuerdo con cualquiera de las modalidades anteriores; y una transposasa de Xenopus tropicalis. En una modalidad adicional, la transposasa comprende una secuencia de aminoácidos correspondiente a la SEQ ID NO: 45. En algunas modalidades, el transposón y la transposasa están en plásmidos separados; en algunas modalidades, el transposón y la transposasa están en el mismo plásmido.
En algunas modalidades preferidas, el sistema de transferencia de genes que comprende un transposón y una transposasa comprende además secuencias IRES (por ejemplo, las descritas en las s Eq ID NO: 58-100 de manera que la expresión relativa de dos marcos abiertos de lectura (ORF) expresados a partir de un solo promotor se puede especificar en función de la fuerza del IRES. En una modalidad adicional, los ORF codifican cadenas ligeras y pesadas de un anticuerpo. En algunas modalidades, las secuencias de IRES se utilizan como elementos potenciadores. En algunas modalidades, el IRES funciona bien en combinación con una señal de secreción. Este es un aspecto importante para la secreción de los polipéptidos expresados y es de particular importancia para la expresión secretada de cadenas pesadas y ligeras de un anticuerpo en células de ovario de hámster chino (CHO) transfectadas de forma estable y células embrionarias de riñón humano (HEK293).
En algunas modalidades, el transposón se inserta en el genoma de una célula. En algunas modalidades, la célula se elige entre líneas celulares de ovario de hámster chino (CHO) o riñón embrionario humano (HEK293). En otra modalidad, la célula se obtiene de un animal. En otra modalidad, la célula es de un vertebrado o invertebrado. En una modalidad adicional, el vertebrado es un mamífero. En otras modalidades, la presente invención también presenta una célula que comprende un transposón de cualquiera de las modalidades descritas anteriormente.
En otros casos, la presente descripción presenta una composición farmacéutica que comprende una transposasa Bombyx mori y un transposón reconocido y transpuesto por la transposasa, junto con un portador, adyuvante o vehículo farmacéuticamente aceptable. En otros casos, la presente descripción presenta una composición farmacéutica que comprende una transposasa de Xenopus tropicalis y un transposón reconocido y transpuesto por la transposasa, junto con un portador, adyuvante o vehículo farmacéuticamente aceptable.
La presente descripción también presenta un método para introducir ADN exógeno en una célula que comprende poner en contacto una célula con el sistema de transferencia de genes de las modalidades descritas anteriormente, introduciendo de ese modo ADN exógeno en una célula. En algunos casos, la célula es una célula eucariota. En algunos otros casos, la célula es de un mamífero. En algunos casos, la célula es una célula madre. En otros casos, la célula es una célula de ovario de hámster chino (CHO) o una célula embrionaria de riñón humano (HEK293).
La presente descripción también incluye un método para producir proteínas usando el método para introducir ADN exógeno en una célula como se describe en la presente descripción anteriormente. En algunos casos preferidos, la proteína es un anticuerpo, un fragmento de anticuerpo o un derivado del mismo. Otras modalidades de la presente invención incluyen una línea celular que comprende un transposón de Xenopus tropicalis; o un animal transgénico que comprende un transposón de Xenopus tropicalis. Otro ejemplo de la presente descripción incluye una línea celular que comprende un transposón Bombyx mori; o un animal transgénico no humano que comprende un transposón Bombyx mori. Un ejemplo adicional de la presente descripción es una línea celular producida por el método descrito anteriormente en la presente descripción.
En otra modalidad, la presente invención presenta un kit que comprende un transposón de Xenopus tropicalis y una transposasa de Xenopus tropicalis; y; instrucciones para introducir ADN en una célula. En otro caso, la presente descripción presenta un kit que comprende un transposón Bombyx mori y una transposasa Bombyx mori; y; instrucciones para introducir ADN en una célula. En otro caso, la presente descripción también presenta un kit que comprende: una transposasa de Bombyx mori o una transposasa de Xenopus tropicalis que tiene una integración defectuosa e instrucciones de uso.
La presente descripción también incluye métodos para producir dos o más polipéptidos dentro de la misma célula. En algunos casos, esto se logra utilizando elementos de acoplamiento traduccional como los elementos IRES. Una instancia incluye un método para expresar una pluralidad de polipéptidos a partir de una única construcción que comprende a) un promotor eucariótico y una pluralidad de polinucleótidos que codifican una pluralidad de polipéptidos b) una secuencia IRES que une cada uno de la pluralidad de polinucleótidos en el que la pluralidad de polinucleótidos-IRES -polinucleótidos están unido operativamente a un único promotor eucariota de manera que en la inserción en una célula hospedera, se expresan una pluralidad de polipéptidos y el nivel de expresión de cada uno de los polipéptidos se determina mediante la secuencia IRES. El método en donde 2, 3, 4, 5, 6 o más secuencias IRES unen la pluralidad de polinucleótidos, es otro ejemplo. Las secuencias de IRES seleccionadas pueden ser secuencias iguales o diferentes.
Algunos casos comprenden un polinucleótido que comprende: un promotor eucariota unido operativamente a un primer polinucleótido que codifica un primer polipéptido, una secuencia IRES y un segundo polinucleótido que codifica un segundo polipéptido en donde i) el primer polinucleótido, el IRES y el segundo polinucleótido están operativamente unidos a un único promotor eucariota de tal manera que en la inserción en una célula hospedera, ambos polipéptidos se expresan, ii) los dos polipéptidos interactúan en la formación de un producto de manera que la proporción de expresión de los dos polipéptidos determina la cantidad de producto formado, iii) el nivel de expresión relativo de los polinucleótidos se determina mediante la secuencia IRES, iv) la expresión de los dos polipéptidos está operativamente enlazada a una secuencia reguladora seleccionada de las SEQ ID NO: 104-111. Los elementos IRES seleccionados incluyen elementos híbridos seleccionados de las SEQ ID NO: 73-91, 95-97. En un caso, el polinucleótido comprende secuencias que codifican la cadena pesada y la cadena ligera de un anticuerpo. El polinucleótido comprende además elementos reguladores, en los que la expresión de los dos polipéptidos está operativamente enlazada a una secuencia reguladora seleccionada de HPRE (SEQ ID NO: 104-105), AGS (SEQ ID NO: 106-107), SAR (108-111).
En algunos casos, un polinucleótido comprende un elemento IRES seleccionado de las SEQ ID NO: 74-77, 81-91, 93­ 98, el elemento IRES está flanqueado por secuencias que codifican una cadena pesada y una cadena ligera de un anticuerpo unido operativamente a un solo promotor eucariota. En otros casos, el elemento IRES está flanqueado por secuencias que codifican una cadena pesada o una cadena ligera de un anticuerpo y una proteína informadora unida operativamente a un único promotor eucariota. El polinucleótido puede comprender 2, 3, 4, 5, 6 o más secuencias IRES. Las secuencias IRES son las mismas o diferentes secuencias. En algunos casos, un polinucleótido comprende un elemento IRES y secuencias reguladoras seleccionadas de HPRE (SEQ ID NO: 104-105), AGS (SEQ ID n O: 106­ 107), SAR (108-111). La secuencia de IRES se selecciona de las SEQ ID NO: 58-100. En algunos casos, el polinucleótido comprende además secuencias que codifican la cadena pesada y la cadena ligera de un anticuerpo enlazado por una secuencia IRES unida operativamente a un único promotor eucariota. En algunos casos, el polinucleótido puede comprender 2, 3, 4, 5, 6 o más secuencias IRES. Algunos casos comprenden un polinucleótido que comprende un primer polinucleótido que codifica un primer polipéptido, una secuencia de IRES y un segundo polinucleótido que codifica un segundo polipéptido unido operativamente a un único promotor eucariota, en el que la secuencia de IRES se selecciona de una de las SEQ ID NO: 58-100. En algunos casos, la secuencia IREs se selecciona de SEQ ID NO: 73-91, 95-97.
Algunos casos comprenden un polinucleótido que comprende secuencias que codifican cadenas pesadas y ligeras de un anticuerpo unido por un elemento IRES unido operativamente a secuencias de control de la transcripción. En algunos casos, las secuencias de control de la transcripción están flanqueadas por aislantes. Las secuencias de control de la transcripción son una o más secuencias seleccionadas de promotores, potenciadores, intrones. 5'UTR. En algunos casos, los intrones se seleccionan de las SEQ ID NO: 119, 123 y los potenciadores se seleccionan de las SEQ ID NO: 116-119. En algunos casos, el polinucleótido comprende además péptidos de secreción en los extremos amino de los polipéptidos. En algunos casos, la secuencia IRES está operativamente ligada a un péptido de secreción (SEQ ID NO: 114-115). En algunos casos, la secuencia IRES es una de las SEQ ID NO: 58-59. En algunos casos, el promotor EF1a está flanqueado por aislantes (SEQ ID NO: 112-113). En algunos casos, el polinucleótido comprende además secuencias que promueven la integración en una célula hospedera. En algunos casos, el polinucleótido comprende además elementos de exportación de ARN. En algunos casos, los elementos de exportación de ARN se seleccionan de WPRE, HPRE (SEQ ID NO: 104-105), SAR (SEQ ID NO: 108-111), AGS (SEQ ID NO: 106-107). En un caso, el polipéptido que comprende elementos de control transcripcional comprende un potenciador de CMV, un promotor EF1a, un intrón híbrido (SEQ ID NO: 119), que comprende además aislantes (SEQ ID NO: 112-113). En un caso, el polipéptido que comprende elementos de control transcripcional comprende un potenciador de CMV, un promotor de actina, secuencias de un intrón de actina híbrido (SEQ ID NO: 123) y una secuencia potenciadora de SV40 (SEQ ID NO: 117). En un caso, el polipéptido que comprende elementos de control de la transcripción comprende un potenciador de CMV, un promotor de GAPDH, secuencias intrónicas de CMVc y una secuencia potenciadora de SV40. En un caso, el polipéptido que comprende elementos de control de la transcripción comprende un potenciador de CMV, un promotor de CMV, secuencias potenciadoras de SV40. En algunos casos, el polinucleótido comprende además secuencias de replicación viral seleccionadas de SV40ori, antígeno T grande de SV40, EBVoriP y EBNA. Otros casos comprenden una célula hospedera con el polinucleótido de los casos anteriores, donde la célula hospedera es una célula eucariota, y es de un mamífero. Una proteína elaborada mediante los métodos descritos en la presente descripción es otro ejemplo. En algunos casos, la proteína es un anticuerpo, un fragmento de anticuerpo o un derivado del mismo. Algunos casos comprenden una composición farmacéutica que comprende los polinucleótidos de las modalidades anteriores.
Los casos adicionales comprenden un polinucleótido que comprende secuencias que codifican la cadena pesada y la cadena ligera de un anticuerpo, cada secuencia unida operativamente a secuencias de control de la transcripción. En algunos casos, las dos secuencias de control de la transcripción comprenden potenciadores, promotores e intrones. En algunos casos, las secuencias de control de la transcripción son combinaciones de un potenciador de CMV, un promotor de actina, un intrón híbrido (SEQ ID NO: 123) y el promotor EF1a y el intrón EF1a. En algunos casos, las secuencias de control de la transcripción son combinaciones de un potenciador de CMV, un promotor de actina, un intrón híbrido (SEQ ID NO: 123) y un promotor de CMV con el intrón CMVc. En algunos casos, el polinucleótido comprende además señales de poliadenilación en el extremo 3 'de la secuencia que codifica el polipéptido. En algunos casos, cada promotor y señal de poliadenilación está flanqueado por aislantes. En algunos casos, el polinucleótido comprende además secuencias de replicación viral seleccionadas de SV40 ori, antígeno T grande de SV40, EBV oriP, EBNA.
Otras modalidades resultarán evidentes para los expertos en la técnica a partir de las enseñanzas contenidas en la presente descripción en combinación con lo que se conoce en la técnica.
4. Breve descripción de los dibujos
FIGURA 1: muestra un transposón que comprende un polinucleótido heterólogo entre los extremos flanqueantes del transposón que comprenden cada uno repeticiones invertidas de los extremos (ITR) (mostradas por puntas de flecha negras y grises). Las ITR del transposón están adyacentes a una repetición directa de su secuencia objetivo. Para los transposones de Trichoplusia ni piggyBac y Xenopus de la invención, esta secuencia objetivo es 5'-Tt AA-3'. Para los transposones Bombyx de la presente descripción, esta secuencia objetivo es 5'-TTAT-3'. Por lo tanto, la secuencia objetivo en la presente invención se representa como 5-TTAW-3', donde W es A o T. Cuando el transposón se transpone por la acción de una transposasa, se escinde de una molécula de ADN donde deja una sola copia de la secuencia objetivo, y se integra en una segunda molécula de ADN donde duplica la secuencia objetivo de manera que el transposón permanece flanqueado por la secuencia objetivo. La transposasa se puede proporcionar en cis (codificada en el mismo vector) o trans (codificada en un polinucleótido separado o como proteína). Cuando la transposasa escinde el transposón, la secuencia original 5'-TTAW-3' se restaura perfectamente.
FIGURA 2 : muestra los resultados de la secuenciación con la secuencia objetivo 5'-TTAT-3' que queda después de la integración y escisión (mostrada con una flecha) por una transposasa de Bombyx mori. Se cotransfectaron células de ovario de hámster chino (CHO) con un transposón que comprende extremos de transposón (SEQ ID NO: 1 y 2) y una construcción que codifica una transposasa (SEQ ID NO: 44) de Bombyx mori; las células se cultivaron durante 14 días después de la selección con puromicina como se describe en el Ejemplo 6.1.1. El ADN se preparó a partir de lisados celulares y se sometió a PCR en condiciones de ciclo estándar con un tiempo de extensión de 5 segundos utilizando cebadores anidados de amplificación que flanquean las repeticiones invertidas de los extremos (ITR). El producto de la PCR se clonó en un vector de clonación y se transformó en E. coli. Se seleccionaron y secuenciaron 16 clones de cada uno de los productos de PCR amplificados. Los 16 clones mostraron una única secuencia de remanente 5'-TTAT-3' que mostraba que la secuencia objetivo de integración era 5'-TTAT-3'.
FIGURA 3: muestra datos de FACS para poblaciones de células de ovario de hámster chino (CHO) transfectadas de forma estable que expresan DasherGFP (SEQ ID NO: 102). Se transfectaron células CHO con vectores de transferencia de genes que comprenden extremos de transposón de Xenopus tropicalis (SEQ ID NO: 5, 6) que flanquean un ácido nucleico heterólogo que codifica DasherGFP. Los vectores de transferencia de genes comprenden diferentes combinaciones de elementos de control, incluyendo promotores y secuencias aislantes. Las cotransfecciones con un vector de expresión que codifica la transposasa (SEQ ID NO: 45) se realizaron en paralelo. Los vectores con extremos de transposón de Trichoplusia ni piggyBac (SEQ ID NO: 30, 31) y la transposasa hiperactiva de Trichoplusia ni piggyBac (SEQ ID NO: 57) se ensayaron en las mismas condiciones. Las células se cultivaron como se describe en el Ejemplo 6.2. Se muestran poblaciones de células que expresan DasherGFP para células CHO transfectadas en ausencia de transposasa (panel superior) y después de la cotransfección con transposasa (panel inferior).
FIGURA 4: muestra datos de FACS para poblaciones de células de ovario de hámster chino (CHO) transfectadas de forma estable que expresan DasherGFP (SEQ ID NO: 102) y CayenneRFP (SEQ ID NO: 103) unidas por un elemento IRES (SEQ ID NO: 59) y unidas operativamente a un solo promotor EF1a. Las células c Ho se transfectaron con un vector de transferencia de genes con la configuración que se muestra en la Tabla 13, líneas 3 y 4. Las cotransfecciones con un vector de expresión que codifica una transposasa (SEQ ID NO: 45) se realizaron en paralelo. Las células se cultivaron como se describe en el Ejemplo 6.2. Las poblaciones de células que expresan DasherGFP se muestran (Panel A) para células CHO transfectadas en ausencia de transposasa (panel superior) y con cotransfección con transposasa (panel inferior). Se muestran las poblaciones de células que expresan CayenneRFP (Panel B) para células CHO transfectadas en ausencia de transposasa (panel superior) y después de cotransfección con transposasa (panel inferior).
FIGURA 5 : muestra dos gráficos en los que los valores medidos de expresión de DasherGFP se muestran en el eje X, donde DasherGFP se expresa a partir de vectores con configuraciones que se muestran en la Tabla 15, los datos de expresión son de la Tabla 19. El eje Y de cada gráfico muestra el valor predicho para la expresión DasherGFP de estos vectores, usando un modelo construido, usando regresión de mínimos cuadrados parciales, a partir de los datos de secuencia en la Tabla 15 y las propiedades de expresión que se muestran en la Tabla 19.
5. Descripción detallada de la invención
5.1 Definiciones
El uso de las formas singulares "un", "una" y "el" incluye referencias en plural a menos que el contexto indique claramente de cualquier otra manera. Así, por ejemplo, la referencia a "un polinucleótido" incluye una pluralidad de polinucleótidos, la referencia a "un sustrato" incluye una pluralidad de tales sustratos, la referencia a "una variante" incluye una pluralidad de variantes y similares.
Términos tales como "conectado", "adjunto", "enlazado" y "conjugado" se usan indistintamente en la presente descripción y abarcan conexión, unión, enlace o conjugación directa o indirecta, a menos que el contexto indique claramente de cualquier otra manera. Cuando se indica un intervalo de valores, debe entenderse que cada valor entero intermedio, y cada fracción del mismo, entre los límites superior e inferior enumerados de ese intervalo también se describe específicamente, junto con cada subintervalo entre dichos valores. Los límites superior e inferior de cualquier intervalo se pueden incluir o excluir de forma independiente del intervalo, y cada intervalo en el que se incluyen uno o ambos límites o ambos límites también se incluye en la invención. Cuando un valor que se está discutiendo tiene límites inherentes, por ejemplo, cuando un componente puede estar presente en una concentración de 0 a 100 %, o cuando el pH de una solución acuosa puede variar de 1 a 14 esos límites inherentes se describen específicamente. Cuando se indica explícitamente un valor, debe entenderse que los valores que son aproximadamente la misma cantidad o cantidad que el valor indicado también están dentro del alcance de la invención. Cuando se divulga una combinación, cada subcombinación de los elementos de esa combinación también se divulga específicamente y está dentro del alcance de la invención. A la inversa, cuando se describen individualmente diferentes elementos o grupos de elementos, también se describen combinaciones de los mismos. Cuando se describe que cualquier elemento de una invención tiene una pluralidad de alternativas, también se describen ejemplos de esa invención en los que cada alternativa se excluye individualmente o en cualquier combinación con las otras alternativas; más de un elemento de una invención puede tener tales exclusiones, y por la presente se describen todas las combinaciones de elementos que tienen tales exclusiones.
A menos que se defina de cualquier otra manera, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que entiende habitualmente un experto en la técnica a la que pertenece esta invención. Singleton, y otros, Dictionary of Microbiology and Molecular Biology, 2da Edición, John Wiley and Sons, Nueva York (1994, y Hale & Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY, 1991, proporcionan a uno experto con un diccionario general de muchos de los términos usados en esta invención. Aunque cualquier método y material similar o equivalente a los descritos en la presente descripción puede usarse en la práctica o ensayo de la presente invención, se describen los métodos y materiales preferidos. A menos que se indique de cualquier otra manera, los ácidos nucleicos se escriben de izquierda a derecha en orientación 5' a 3'; las secuencias de aminoácidos se escriben de izquierda a derecha en orientación amino a carboxilo, respectivamente. Los términos definidos inmediatamente a continuación se definen de forma más completa por referencia a la especificación en su conjunto.
Los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" y "gen" se usan indistintamente en la presente descripción para referirse a una forma polimérica de nucleótidos de cualquier longitud, y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos, o mezclas de los mismos. Este término se refiere solo a la estructura primaria de la molécula. Por tanto, el término incluye ácido desoxirribonucleico ("ADN") de cadena triple, doble y simple, así como ácido ribonucleico ("ARN") de cadena triple, doble y simple. También incluye formas modificadas, por ejemplo, por alquilación y/o por protección, y no modificadas del polinucleótido. Más particularmente, los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" incluyen polidesoxirribonucleótidos (que contienen 2-desoxi-D-ribosa), polirribonucleótidos (que contienen D-ribosa), incluyendo ARNt, ARNr, ARNh, ARNip y ARNm, ya sea empalmado o no empalmado, cualquier otro tipo de polinucleótido que sea un N- o C-glicósido de una base purina o pirimidina, y otros polímeros que contengan cadenas principales no nucleotídicas, por ejemplo, poliamida (por ejemplo, ácidos nucleicos peptídicos ("PNA") y polimorfolino (disponible comercialmente de Anti-Virals, Inc., Corvallis, Oreg., como Neugene) polímeros, y otros polímeros de ácidos nucleicos específicos de secuencia sintética siempre que los polímeros contengan bases nucleotídicas en una configuración que permita el apareamiento de bases y apilamiento de bases, como se encuentra en el ADN y el ARN. No existe una distinción intencionada en la longitud entre los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico", y estos términos se usan indistintamente en la presente descripción. Estos términos se refieren únicamente a la estructura primaria de la molécula. Así, estos términos incluyen, por ejemplo, 3'-desoxi-2', 5'-ADN, oligodesoxirribonucleótidos N3' P5' fosforamidatos, ARN 2'-O-alquil-sustituido, a Dn bicatenario y monocatenario, así como ARN bicatenario y monocatenario e híbridos del mismo, incluyendo, por ejemplo, híbridos entre ADN y ARN o entre PNA y ADN o ARN, y también incluyen tipos conocidos de modificaciones, por ejemplo, etiquetas, alquilación, "envolturas", sustitución de uno o más de los nucleótidos con un análogo, modificaciones internucleotídicas como, por ejemplo, aquellos con enlaces no cargados (por ejemplo, metilfosfonatos, fosfotriésteres, fosforamidatos, carbamatos, o similares) con enlaces cargados negativamente (por ejemplo, fosforotioatos, fosforoditioatos o similares), y con enlaces cargados positivamente (por ejemplo, aminoalquilfosforamidatos, aminoalquilfosfotriésteres), aquellos que contienen porciones salientes, tales como, por ejemplo, proteínas (incluyendo enzimas (por ejemplo, nucleasas), toxinas, anticuerpos, péptidos señal des, poli-L-lisina, o similares), aquellos con intercaladores (por ejemplo, acridina, psoraleno, o similares), aquellos que contienen quelatos (de, por ejemplo, metales, metales radiactivos, boro, metales oxidativos o similares), aquellos que contienen alquilantes, aquellos con enlaces modificados (por ejemplo, ácidos nucleicos alfa anoméricos, o similares), así como formas no modificadas del polinucleótido u oligonucleótido.
Los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" y "gen" se refieren a la secuencia completa o gen o un fragmento del mismo. El fragmento del mismo puede ser un fragmento funcional. Cuando los polinucleótidos van a usarse para expresar proteínas codificadas, se usan nucleótidos que pueden realizar esa función o que pueden modificarse (por ejemplo, someterse a transcripción reversa) para realizar esa función. Cuando los polinucleótidos van a usarse en un esquema que requiere que se forme una cadena complementaria a un polinucleótido dado, se usan nucleótidos que permiten tal formación.
Como se usa en la presente descripción, los términos "nucleósido" y "nucleótido" incluirán aquellas porciones que contienen no sólo las bases de purina y pirimidina conocidas, sino también otras bases heterocíclicas que se han modificado. Dichas modificaciones incluyen purinas o pirimidinas metiladas, purinas o pirimidinas aciladas u otros heterociclos. Los nucleósidos o nucleótidos modificados también pueden incluir modificaciones en la porción azúcar, por ejemplo, cuando uno o más de los grupos hidroxilo se reemplazan con halógeno, grupos alifáticos o se funcionalizan como éteres, aminas o similares. El término "unidad nucleotídica" pretende abarcar nucleósidos y nucleótidos.
Los pares de bases estándar AT y GC se forman en condiciones que permiten la formación de enlaces de hidrógeno entre el N3--H y C4-oxi de timidina y el NI y C6--NH2, respectivamente, de adenosina y entre el C2-oxi, N3 y C4--NH2, de citidina y C2--NH2, N'--H y C6-oxi, respectivamente, de guanosina. Así, por ejemplo, la guanosina (2-amino-6-oxi-9-.beta.-D-ribofuranosil-purina) puede modificarse para formar isoguanosina (2-oxi-6-amino-9-.beta.-D-ribofuranosilpurina). Tal modificación da como resultado una base de nucleósido que ya no formará eficazmente un par de bases estándar con la citosina. Sin embargo, la modificación de la citosina (1-.beta.-D-ribofuranosil-2-oxi-4-amino-pirimidina) para formar isocitosina (1-.beta.-D-ribofuranosil-2-amino-4-oxi-pirimidina-) da como resultado un nucleótido modificado que no se apareará de forma eficaz con la guanosina, pero formará un par de bases con la isoguanosina (patente de Estados Unidos núm 5,681,702 de Collins y otros). La isocitosina está disponible en Sigma Chemical Co. (San Luis, Missouri); la isocitidina se puede preparar mediante el método descrito por Switzer y otros (1993 Biochemistry 32:10489-10496 y referencias allí citadas; la 2'-desoxi-5-metil-isocitidina se puede preparar mediante el método de Tor y otros, 1993, J. Am. Chem. Soc. 115: 4461-4467 y las referencias allí citadas; y los nucleótidos de isoguanina se pueden preparar usando el método descrito por Switzer y otros, 1993, arriba, y Mantsch y otros, 1993, Biochem. 14: 5593-5601, o mediante el método descrito en la patente de Estados Unidos 5,780,610 de Collins y otros. Se pueden sintetizar otros pares de bases no naturales mediante el método descrito en Piccirilli y otros, 1990, Nature 343:33-37, para la síntesis de 2,6-diaminopirimidina y su complemento (1-metilpirazolo-[4,3]pirimidina-5,7-(4H,6H)-diona. Se conocen otras unidades nucleotídicas modificadas que forman pares de bases únicos, como las descritas en Leach y otros (1992 J. Am. Chem. Soc. 114: 3675-3683 y Switzer y otros, Supra.
La frase "secuencia de ADN" se refiere a una secuencia de ácido nucleico contigua. La secuencia puede ser ADN o ARN monocatenario o bicatenario, pero son preferibles las secuencias de ADN bicatenario. La secuencia puede ser un oligonucleótido de 2 a 20 nucleótidos de longitud hasta una secuencia genómica de longitud completa de miles o cientos de miles de pares de bases.
El término "vector" o "vector de ADN" o "vector de transferencia de genes" se refiere a una secuencia de polinucleótidos que se usa para realizar una función "portadora" de otro polinucleótido. Por ejemplo, los vectores se utilizan a menudo para permitir que un polinucleótido se propague dentro de una célula viva, o para permitir que un polinucleótido sea empaquetado para su liberación en una célula, o para permitir que un polinucleótido se integre en el ADN genómico de una célula. Un vector puede comprender además elementos funcionales adicionales, por ejemplo, puede comprender un transposón.
Un "sistema de transferencia de genes" comprende un vector o vector de transferencia de genes, o un polinucleótido clonado en un vector. Un sistema de transferencia de genes también puede comprender otras características para facilitar el proceso de transferencia de genes. Por ejemplo, un sistema de transferencia de genes puede comprender un vector y una mezcla de empaquetamiento de lípidos o virus para permitir que un primer polinucleótido ingrese a una célula, o puede comprender un vector que incluye un transposón y una segunda secuencia de polinucleótidos que codifica una transposasa para mejorar la integración genómica productiva del transposón.
El término "hospedero" significa cualquier organismo procariota o eucariota que puede ser receptor de un ácido nucleico. Un "hospedero", como se usa el término en la presente descripción, incluye organismos procariotas o eucariotas que pueden modificarse genéticamente. Para ejemplos de tales hospederos, véase Maniatis y otros, Molecular Cloning. A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1982). Como se usa en la presente descripción, los términos "hospedero", "célula hospedera", "sistema hospedero" y "hospedero de expresión" se pueden usar indistintamente.
El término "construcción de expresión" significa cualquier ADN bicatenario o ARN bicatenario diseñado para transcribir un ARN, por ejemplo, una construcción que contiene al menos un promotor que está o puede estar unido operativamente a un gen, región codificante, o secuencia de polinucleótidos (por ejemplo, un ADNc o fragmento de ADN genómico que codifica un polipéptido o proteína, o una molécula efectora de ARN, por ejemplo, un ARN antisentido, ARN formador de triplex, ribozima, un ligando de ARN de alta afinidad (aptámero) seleccionado artificialmente, un ARN de doble cadena, por ejemplo, una molécula de ARN que comprende un ARNbc de tallo-bucle o horquilla, o un ARNbc de dos dedos o de múltiples dedos o un microARN, o cualquier ARN). Una "construcción de expresión" incluye un ADN o ARN bicatenario que comprende uno o más promotores, en donde uno o más de los promotores no están de hecho unidos operativamente a una secuencia polinucleotídica que se va a transcribir, sino que está diseñado para la inserción eficiente de una secuencia polinucleotídica unida operativamente para ser transcrita bajo el promotor. La transfección o transformación de la construcción de expresión en una célula receptora permite que la célula exprese una molécula, polipéptido o proteína efectora de ARN codificada por la construcción de expresión. Una construcción de expresión puede ser un plásmido, virus, virus recombinante modificado genéticamente o un cromosoma artificial derivado de, por ejemplo, un bacteriófago, adenovirus, virus adenoasociado, retrovirus, lentivirus, poxvirus o herpesvirus, o modalidades adicionales descritas en " vector de expresión "a continuación. Una construcción de expresión se puede replicar en una célula viva o se puede preparar sintéticamente. Para los propósitos de esta solicitud, los términos "construcción de expresión", "vector de expresión", "vector" y "plásmido" se utilizan indistintamente para demostrar la aplicación de la invención en un sentido general e ilustrativo, y no pretenden limitar la invención a un tipo particular de construcción de expresión.
El término "vector de expresión" o "construcción de expresión" significa una construcción de ADN que contiene al menos un promotor que está o puede estar unido operativamente a un gen, región codificante o secuencia polinucleotídica río abajo, a transcribir (por ejemplo, un ADNc o fragmento de ADN genómico que codifica una proteína, opcionalmente, unido operativamente a una secuencia que se encuentra fuera de una región codificante, una región codificante de ARN antisentido o secuencias de ARN que se encuentran fuera de una región codificante). Un vector de expresión o una construcción de expresión también puede ser una construcción de ADN que comprende uno o más promotores, en donde uno o más de los promotores no están de hecho unidos operativamente a una secuencia de polinucleótidos a transcribir, sino que están diseñados para la inserción eficiente de una secuencia polinucleotídica unida operativamente para ser transcrita bajo el promotor. La transfección o transformación del vector de expresión en una célula receptora permite que la célula exprese el ARN codificado por el vector de expresión. Un vector de expresión puede ser un plásmido, virus, transposón o cromosoma artificial manipulado genéticamente derivado de, por ejemplo, un bacteriófago, adenovirus, virus adenoasociado, retrovirus, poxvirus o herpesvirus. Dichos vectores de expresión pueden incluir secuencias de bacterias, virus o fagos. Dichos vectores incluyen vectores cromosómicos, episómicos y derivados de virus, por ejemplo, vectores derivados de plásmidos bacterianos, bacteriófagos, episomas de levadura, elementos cromosómicos de levadura y virus, vectores derivados de combinaciones de los mismos, tales como los derivados de elementos genéticos de plásmidos y bacteriófagos, cósmidos y fagémidos. Por tanto, un vector ilustrativo es un vector de fago de ADN de doble cadena. Otro vector ilustrativo es un vector viral de ADN de doble cadena. En un aspecto, la invención se refiere a vectores de expresión, plásmidos y construcciones como se describe en la presente descripción, que se aíslan y purifican para que sean útiles para cualquiera de una variedad de aplicaciones, por ejemplo, como reactivo para investigación científica, para humanos y/o uso veterinario con fines farmacéuticos terapéuticos y/o profilácticos.
Un polipéptido o polinucleótido "aislado" significa un polipéptido o polinucleótido que ha sido eliminado de su entorno natural, producido usando técnicas recombinantes o sintetizado química o enzimáticamente. Preferentemente, un polipéptido o polinucleótido de esta invención es purificado, es decir, está esencialmente libre de cualquier otro polipéptido o polinucleótido y productos celulares asociados u otras impurezas.
El término "remanentes" se refiere a secuencias de ADN adicionales que quedan como parte de una construcción polinucleotídica que son una consecuencia inevitable del método de construcción en lugar de incorporarse debido a sus propiedades funcionales convenientes. Por ejemplo, las recombinasas, integrasas y endonucleasas de restricción a menudo tienen secuencias de reconocimiento que permanecen dentro de la secuencia de un polinucleótido que se construye usando la acción de las recombinasas, integrasas y endonucleasas de restricción. El término "Tamaño del remanente" se refiere a la longitud de las secuencias adicionales de ADN. Por ejemplo, se deja un tamaño de remanente de 34 pares de bases en una construcción con una secuencia de reconocimiento para la recombinasa Cre, se agrega un tamaño de remanente de 25 pares de bases cuando se usa la integrasa attB. Los remanentes pueden interferir con las funciones de otros elementos de secuencia dentro de la construcción.
El término "sobresaliente" o "ADN sobresaliente" se refiere a la porción monocatenaria al final de una molécula de ADN bicatenaria. Los sobresalientes complementarios son aquellos que se emparejarán entre sí.
El término "marcador de selección" se refiere a un segmento polinucleotídico que permite seleccionar a favor o en contra, una molécula o una célula que lo contiene, a menudo en condiciones particulares. Estos marcadores pueden codificar una actividad, tal como, pero sin limitarse a, la producción de ARN, péptido o proteína, o pueden proporcionar un sitio de unión para ARN, péptidos, proteínas, compuestos o composiciones inorgánicos y orgánicos. Los ejemplos de marcadores de selección incluyen, pero no se limitan a: (1 segmentos de ADN que codifican productos que proporcionan resistencia contra compuestos de otra manera tóxicos (por ejemplo, antibióticos); (2 segmentos de ADN que codifican productos que de otro modo faltan en la célula receptora (por ejemplo, genes de ARNt, marcadores auxotróficos); (3 segmentos de ADN que codifican productos que suprimen la actividad de un producto génico; (4 segmentos de ADN que codifican productos que pueden identificarse fácilmente (por ejemplo, marcadores fenotípicos tales como beta-galactosidasa, proteína verde fluorescente (GFP) y proteínas de la superficie celular); (5 segmentos de ADN que se unen a productos que de otro modo serían perjudiciales para la sobrevivencia y/o función celular; (6 segmentos de ADN que inhiben de otro modo la actividad de cualquiera de los segmentos de ADN descritos en los números 1-5 anteriores (por ejemplo, oligonucleótidos antisentido); (7 segmentos de ADN que se unen a productos que modifican un sustrato (por ejemplo, endonucleasas de restricción); (8 segmentos de ADN que se pueden usar para aislar una molécula deseada (por ejemplo, sitios de unión a proteínas específicas); (9 segmentos de ADN que codifican una secuencia de nucleótidos específica que de otro modo puede ser no funcional (por ejemplo, para la amplificación por PCR de subpoblaciones de moléculas); y/o (10 segmentos de ADN, que cuando están ausentes, confieren directa o indirectamente sensibilidad a compuestos particulares.
El término "marcador de selección inversa" se refiere a una secuencia de polinucleótidos que confiere una desventaja selectiva a una célula hospedera. Ejemplos de marcadores de selección inversa incluyen sacB, rpsL, tetAR, pheS, thyA, gata-1, ccdB, kid y barnasa (Bernard, 1995, Journal/Gene, 162:159-160; Bernard y otros, 1994. Journal/Gene, 148: 71-74; Gabant y otros, 1997, Journal/Biotechniques, 23: 938-941; Gababt y otros, 1998, Journal/Gene, 207: 87­ 92; Gababt y otros, 200 0, Journal/Biotechniques, 28: 784-788; Galvao y de Lorenzo, 200 5, Journal/Appl Environ Microbiol, 71: 883-892; Hartzog y otros, 200 5, Journal/Yeat, 22: 789-798; Knipfer y otros, 1997, Journal/Plasmid, 37: 129 -140; Reyrat y otros, 1998, Journal/Infect Immun, 66: 4011-4017; Soderholm y otros, 2001, Journal/Biotechniques, 31: 306-310, 312; Tamura y otros, 200 5, Journal/Appl Environ Microbiol, 71: 587-590; Yazynin y otros, 1999, Journal/FEBS Lett, 452: 351-354. Los marcadores de selección inversa a menudo confieren su desventaja selectiva en contextos específicos. Por ejemplo, pueden conferir sensibilidad a compuestos que se pueden agregar al entorno de la célula hospedera, o pueden matar a un hospedero con un genotipo, pero no a un hospedero con un genotipo diferente. Las condiciones que no confieren una desventaja selectiva a una célula que lleva un marcador de selección o se describen como "permisivas". Las condiciones que confieren una desventaja selectiva a una célula que lleva un marcador de selección inversa se describen como "restrictivas".
El término "secuencia de reconocimiento" se refiere a secuencias de ADN particulares que son reconocidas (y unidas por) una proteína, ADN o molécula de ARN, incluyendo una endonucleasa de restricción, una metilasa de modificación y una recombinasa. Por ejemplo, la secuencia de reconocimiento para la recombinasa Cre es loxP, que es una secuencia de 34 pares de bases compuesta por dos repeticiones invertidas de 13 pares de bases (que sirven como sitios de unión de la recombinasa) que flanquean una secuencia central de 8 pares de bases. Vea la Figura 1 de Sauer, B., Current Opinion in Biotechnology 5: 521-527 (1994. Otros ejemplos de secuencias de reconocimiento son las secuencias attB, attP, attL y attR que son reconocidas por la integrasa del bacteriófago lambda. AttB es una secuencia de aproximadamente 25 pares de bases que contiene dos sitios de unión Int de tipo núcleo de 9 pares de bases y una región de superposición de 7 pares de bases. attP es una secuencia de aproximadamente 240 pares de bases que contiene sitios de unión Int de tipo núcleo y sitios de unión Int tipo brazo, así como sitios para proteínas auxiliares IHF, FIS y Xis. Véase Landy, Current Opinion in Biotechnology 3: 699-707 (1993). Dichos sitios también se diseñan de acuerdo con la presente invención para mejorar métodos y productos.
El término "recombinasa" se refiere a una enzima que cataliza el intercambio de segmentos de ADN en sitios de recombinación específicos.
El término "Clonación por recombinación" se refiere a un método descrito en la presente descripción, mediante el cual se intercambian, insertan, reemplazan, sustituyen o modifican segmentos de moléculas de ADN, in vitro o in vivo.
El término "proteínas de recombinación" incluye proteínas, enzimas, cofactores o proteínas asociadas escindibles o integradoras que están implicadas en reacciones de recombinación que implican uno o más sitios de recombinación. Ver, Landy (1994, abajo).
El término "sistema de expresión" se refiere a cualquier sistema biológico in vivo o in vitro que se usa para producir uno o más polipéptidos codificados por un polinucleótido.
El término "temperatura de hibridación" o "temperatura de desnaturalización" o "temperatura de transición" se refiere a la temperatura a la que un par de ácidos nucleicos se encuentra en un estado intermedio entre estar completamente hibridado y completamente desnaturalizado. El término se refiere al comportamiento de una población de ácidos nucleicos: la "temperatura de hibridación" o "temperatura de desnaturalización" o "temperatura de transición" es la temperatura a la que el 50 % de las moléculas se hibridan y el 50 % se separan. Las temperaturas de hibridación se pueden determinar experimentalmente. También existen métodos bien conocidos en la técnica para calcular estas temperaturas.
El término "traducción" se refiere al proceso mediante el cual un polipéptido es sintetizado por un ribosoma "leyendo" la secuencia de un polinucleótido.
El término "proteína de selección" se refiere a una proteína que proporciona un método físico, químico o biológico para seleccionar células basándose en la cantidad de proteína de selección que se expresa.
El término "elemento de acoplamiento" se refiere a una secuencia de ADN que permite enlazar la expresión de un primer polipéptido a la expresión de un segundo polipéptido. Los sitios internos de unión a ribosomas (elementos IRES) y los elementos hidrolasa que actúan en cis (elementos CHYSEL) son ejemplos de elementos de acoplamiento.
La frase "período de tiempo predeterminado" se refiere a una cantidad de tiempo especificada. Un "período de tiempo predeterminado" puede ser del orden de segundos, minutos, horas, días, semanas o meses. Por ejemplo, un "período de tiempo predeterminado" puede estar entre 1 y 59 minutos, o cualquier aumento entre 1 y 2 horas, o cualquier aumento entre 2 y 4 horas, o cualquier aumento entre 4 y 6 horas, o cualquier aumento entre 6 y 12 horas, o cualquier aumento entre 12 y 24 horas, o cualquier aumento entre 1 día y 2 días, o cualquier aumento entre 2 días y 4 días, y cualquier aumento entre 4 días y 7 días, y cualquier aumento entre 1 semana y 4 semanas, y cualquier aumento entre 1 mes y 12 meses, o cualquier combinación de períodos de tiempo que aumenten dentro de los mismo.
El término "enzima de restricción de tipo II" se usa en la presente descripción para referirse a cualquier enzima de restricción que escinde el ADN a una distancia definida fuera de su secuencia de reconocimiento, y cuya secuencia de reconocimiento no es palindrómica.
Los términos "extremos ligables" o "extremos compatibles" se utilizan en la presente descripción para describir dos extremos de moléculas de polinucleótidos que son romos o que poseen extremos sobresalientes de la misma longitud y direccionalidad (es decir, ambos son extremos sobresalientes 5' o ambos son 3') y con secuencias perfectamente complementarias, de modo que los extremos del ADN forman pares de bases estándar de Watson-Crick (es decir, C con G y T o U con A) y pueden unirse mediante una ADN ligasa.
El término "unido operativamente" se refiere al enlace funcional entre dos secuencias de manera que una secuencia modifica el comportamiento de la otra. Por ejemplo, un primer polinucleótido que comprende una secuencia de control de la expresión del ácido nucleico (tal como un promotor, secuencia IRES, potenciador o arreglo de sitios de unión a factor de transcripción) y un segundo polinucleótido están operativamente unidos si el primer polinucleótido afecta la transcripción y/o traducción del segundo polinucleótido. De manera similar, una primera secuencia de aminoácidos que comprende una señal de secreción o una señal de localización subcelular y una segunda secuencia de aminoácidos están unidas operativamente si la primera secuencia de aminoácidos hace que la segunda secuencia de aminoácidos sea secretada o localizada en una ubicación subcelular.
Un "promotor" significa una secuencia de ácido nucleico suficiente para dirigir la transcripción de una molécula de ácido nucleico unida operativamente. También se incluyen en esta definición aquellos elementos de control de la transcripción (por ejemplo, potenciadores) que son suficientes para hacer que la expresión génica dependiente del promotor sea controlable de una manera específica de tipo celular, específica de tejido o específica temporalmente, o que son inducibles por señales o agentes; dichos elementos, que son bien conocidos por los expertos en la técnica, pueden encontrarse en una región 5' o 3' de un gen o dentro de un intrón. Convenientemente, un promotor está unido operativamente a una secuencia de ácido nucleico, por ejemplo, un ADNc o una secuencia génica, o una secuencia codificante de ARN efectora, de tal manera que permita la expresión de la secuencia de ácido nucleico, o se proporciona un promotor en un casete de expresión en el que se puede insertar convenientemente una secuencia de ácido nucleico seleccionada a transcribir.
"Integración defectuosa" significa una transposasa que integra un transposón a una frecuencia más baja en el genoma del hospedero que una transposasa de tipo silvestre correspondiente.
Como se usa en la presente descripción, el término "transposón" o "elemento transponible" se refiere a un polinucleótido que puede escindirse de un primer polinucleótido, por ejemplo, un vector, e integrarse en una segunda posición en el mismo polinucleótido, o en un segundo polinucleótido, por ejemplo, el ADN genómico o extracromosómico de una célula, mediante la acción de una transposasa de transacción. Un transposón comprende un primer extremo de transposón y un segundo extremo de transposón que son secuencias de polinucleótidos reconocidas y transpuestas por una transposasa. Un transposón normalmente comprende además una primera secuencia de polinucleótidos entre los dos extremos del transposón, de manera que la primera secuencia de polinucleótidos se transpone junto con los dos extremos del transposón por la acción de la transposasa. Los transposones naturales comprenden frecuentemente ADN que codifica una transposasa que actúa sobre el transposón. La invención proporciona transposones en los que una secuencia presente de forma natural que codifica una transposasa funcional se ha reemplazado por una secuencia que codifica un polinucleótido heterólogo, que es transponible en virtud de su yuxtaposición entre los extremos del transposón.
Como se usa en la presente descripción, el término "extremo de transposón" se refiere a secuencias de nucleótidos que actúan en cis que son suficientes para el reconocimiento y la transposición por una transposasa. Un par de extremos de transposón comprende típicamente repeticiones perfectas o imperfectas emparejadas de modo que las repeticiones respectivas en los miembros de un par son complementos inversos entre sí en los dos extremos diferentes del transposón. Estos se conocen como repeticiones invertidas de los extremos (ITR) o extremos de repeticiones invertidas (TIR). En los transposones tipo piggyBac, cada extremo del transposón comprende además una secuencia objetivo inmediatamente distal al ITR (distal significa en el lado más alejado de la transposasa o polinucleótido heterólogo transpuesto por el ITR). Un extremo de transposón puede incluir o no una secuencia adicional próxima al ITR que promueve o aumenta la transposición.
Como se usa en la presente descripción, una "transposasa similar a piggyBac" significa una transposasa con al menos 20 % y preferentemente al menos 30 % de identidad de secuencia según se identifica usando el algoritmo TBLASTN para la transposasa piggyBac de Trichoplusia ni (SEQ ID NO. 57, y como se describe con más detalle en Sakar, A. y otros, (200 3. Mol. Gen. Genomics 270: 173-180. "Molecular evolutionary analysis of the widespread piggyBac transposon family and related 'domesticated' species", y además se caracteriza por un motivo DDD similar a DDE, con residuos de aspartato en las posiciones correspondientes a D268, D346 y D447 de la transposasa de Trichoplusia ni piggyBac en alineamiento máxima. Un "transposón tipo piggyBac" significa un transposón que tiene extremos de transposón que son iguales o al menos 80 % y preferentemente al menos 90, 95, 96, 97, 98 o 99 % idénticos a los extremos de transposón de un transposón natural que codifica una transposasa tipo piggyback. Un transposón tipo piggyBac incluye una secuencia repetida invertida de aproximadamente 13 bases en cada extremo, inmediatamente adyacente a una secuencia correspondiente a la secuencia objetivo que se duplica tras la integración del transposón (la duplicación del sitio objetivo o la duplicación de la secuencia objetivo o TSD). Los transposones y transposasas de tipo piggyBac se han identificado en una amplia gama de organismos, incluyendo argyrogramma agnate (GU477713, Anopheles gambiae (XP_312615; XP_320414; XP_310729, Aphis gossypii (GU329918, pisum Acyrthosiphon (XP_001948139, ypsilon Agrotis (GU477714 Bombyx mori (BAD11135, Ciona intestinalis (XP_002123602, Chilo suppressalis (JX294476, Drosophila melanogaster (AAL39784, pulicaria Daphnia (AAM76342, Helicoverpa armigera (ABS183 91, Homo sapiens (NP_689808, Heliothis virescens (ABD76335, crassisigna macdunnoughia (EU287451, Macaca fascicularis (AB179012 Mus musculus (NP_741958, Pectinophora gossypiella (GU270322, Rattus norvegicus (XP_220453, Tribolium castaneum (XP_001814566, Trichoplusia ni (XA87320 tropicalis.
Un ácido nucleico objetivo es un ácido nucleico en el que se insertará un transposón. Tal objetivo puede ser parte de un cromosoma, episoma o vector. El ácido nucleico objetivo para un transposón de la presente invención debe contener al menos un motivo reconocido por una transposición de la presente invención (5-TTAT-3' o 5-TTAA-3').
Como se usa en la presente descripción, un "sitio objetivo" o "secuencia objetivo" para una transposasa es un sitio o secuencia en una molécula de ADN objetivo en el que una transposasa puede insertar un transposón. La transposasa piggyBac de Trichoplusia ni inserta su transposón en la secuencia objetivo 5'-TTAA-3'.
Como se usa en la presente descripción, el término 'transposasa' se refiere a un polipéptido que cataliza la escisión de un transposón de un polinucleótido donante, por ejemplo, un vector, y (siempre que la transposasa no sea deficiente en integración) la posterior integración del transposón en el genoma o ADN extracromosómico de una célula objetivo. La transposasa se une a un extremo de transposón. La transposasa puede estar presente como polipéptido. Alternativamente, la transposasa está presente como un polinucleótido que incluye una secuencia codificante que codifica una transposasa. El polinucleótido puede ser ARN, por ejemplo, un ARNm que codifica la transposasa, o a Dn , por ejemplo, una secuencia codificante que codifica la transposasa. Cuando la transposasa está presente como una secuencia codificante que codifica la transposasa, en algunos aspectos de la invención la secuencia codificante puede estar presente en el mismo vector que incluye el transposón, es decir, en cis. En otros aspectos de la invención, la secuencia codificante de la transposasa puede estar presente en un segundo vector, es decir, en trans.
"IRES" o "sitio interno de entrada del ribosoma" significa una secuencia especializada que promueve directamente la unión de ribosoma, independientemente de la estructura cap.
"Marco abierto de lectura" u ORF significa una porción de una molécula de ADN que, cuando se traduce en aminoácidos, no contiene codones de terminación. El código genético lee las secuencias de ADN en grupos de tres pares de bases, lo que significa que una molécula de ADN de doble cadena puede leerse en cualquiera de los seis marcos de lectura posibles: tres en la dirección directa y tres en la reversa. Es probable que un marco abierto de lectura largo sea parte de un gen.
Dos elementos son heterólogos entre sí si no están asociados naturalmente. Por ejemplo, una secuencia de ácido nucleico que codifica una proteína unida a un promotor heterólogo significa un promotor distinto del que expresa naturalmente la proteína. Un ácido nucleico heterólogo flanqueado por extremos de transposón o ITR significa un ácido nucleico heterólogo que no está flanqueado naturalmente por esos extremos de transposón o ITR, tal como un ácido nucleico que codifica un polipéptido distinto de una transposasa, incluyendo una cadena ligera o pesada de anticuerpo. Los ácidos nucleicos heterólogos flanqueados por extremos de transposones o ITR pueden variar en longitud, por ejemplo, oscilando entre 20 pares de bases y 20 kilopares de bases o más. Un ácido nucleico es heterólogo para una célula si no se encuentra normalmente en la célula o en una ubicación diferente (por ejemplo, una ubicación episomal o genómica diferente) que la ubicación presente naturalmente dentro de una célula.
La identidad de la secuencia se puede determinar alineando secuencias usando algoritmos, como BESTFIT, FASTA y TFASTA en Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Dr., Madison, Wis.), usando parámetros predeterminados para los huecos, o por inspección y el mejor alineamiento (es decir, que da como resultado el mayor porcentaje de similitud de secuencia en una ventana de comparación). El porcentaje de identidad de secuencia se calcula comparando dos secuencias alineadas de manera óptima en una ventana de comparación, determinando el número de posiciones en las que ocurren los residuos idénticos en ambas secuencias para producir el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes por el número total de posiciones coincidentes y no coincidentes sin contar los huecos en la ventana de comparación (es decir, el tamaño de la ventana), y multiplicar el resultado por 100 para producir el porcentaje de identidad de secuencia. A menos que se indique de cualquier otra manera, la ventana de comparación entre dos secuencias se define por la longitud total de la más corta de las dos secuencias.
Para fines de clasificar las sustituciones de aminoácidos como conservadoras o no conservadoras, los aminoácidos se agrupan de la siguiente manera: Grupo I (cadenas laterales hidrófobas): norleucina, met, ala, val, leu, ile; Grupo II (cadenas laterales hidrófilas neutras): cys, ser, thr; Grupo III (cadenas laterales ácidas): asp, glu; Grupo IV (cadenas laterales básicas): asn, gln, his, lys, arg; Grupo V (residuos que influyen en la orientación de la cadena): gly, pro; y Grupo VI (cadenas laterales aromáticas): trp, tyr, phe. Las sustituciones conservadoras implican sustituciones entre aminoácidos de la misma clase. Las sustituciones no conservadoras constituyen el intercambio de un miembro de una de estas clases por un miembro de otra.
La "configuración" de un polinucleótido significa los elementos de secuencia funcional dentro del polinucleótido y el orden y dirección de esos elementos. Por ejemplo, tablas 6-18
5.2 Descripción
5.2.1 Componentes vectoriales
Las propiedades de un sistema biológico, incluyendo los sistemas naturales y no naturales con respecto a cualquier función medible, dependen de la interacción entre diferentes elementos de la secuencia de ácido nucleico, que pueden estar ubicados en posiciones en todo el componente de ácido nucleico total del sistema, aquí referido como la "construcción de ácido nucleico" del sistema. La capacidad de diseñar racionalmente una construcción de ácido nucleico con una configuración óptima de elementos es ventajosa para diversas aplicaciones, como la síntesis de proteínas a través de la optimización de vectores, el desarrollo de líneas celulares y la ingeniería de cepas. La síntesis de proteínas es un proceso altamente dinámico y de múltiples etapas que juega un papel central en la biología sintética, la producción farmacéutica y otras aplicaciones en biotecnología. Esta importancia ha llevado al desarrollo de diversas partes o elementos de control genético capaces de modular y controlar con precisión varios aspectos de la expresión de proteínas. Esta capacidad no solo es esencial para la construcción exitosa de sistemas biológicos sintéticos más complejos, sino que también proporciona las herramientas necesarias para ajustar su función para mejorar el desempeño y la confiabilidad.
Una limitación del estado actual de la técnica es que los efectos de muchos elementos de control dependen del contexto genético en el que se utilizan. Por ejemplo, la combinación del mismo promotor con diferentes RBS y genes puede resultar en niveles de expresión muy diferentes.
Si bien se han estudiado los efectos de las combinaciones de uno o dos elementos transcripcionales o de traducción, incluyendo el contexto genético en el que se utilizan, sigue existiendo la necesidad en la técnica de identificar configuraciones óptimas de múltiples elementos funcionales. Dichos elementos pueden incluir aquellos que influyen en el número de copias del ADN, los sitios de integración del ADN en los cromosomas, la velocidad de transcripción del ARN, la degradación del ARN, el procesamiento del ARN, la localización del ARN, la velocidad de inicio de la traducción y la terminación de la transcripción. Ejemplos de tales elementos son promotores, potenciadores, intrones, señales de poliadenilación, sitios de unión a ribosomas, secuencias de Kozak, secuencias no traducibles 5', orígenes de replicación, señales de exportación nuclear, sitios internos de entrada del ribosoma y terminadores de la transcripción. Los elementos funcionales también pueden incluir aquellos que codifican polipéptidos funcionales, tales como señales de secreción, marcadores de resistencia, péptidos de anclaje, señales de localización, etiquetas de fusión, etiquetas de afinidad, chaperoninas y proteasas. La capacidad de diseñar racionalmente múltiples elementos dentro del contenido de ADN de una célula hospedera o sistema de expresión es un aspecto importante de esta invención. En otra modalidad, la ingeniería de múltiples elementos dentro del contenido de a Dn de la célula hospedera o sistema de expresión junto con variables de estrés ambiental o condiciones de cultivo es otro aspecto de esta invención. Tales variables ambientales pueden incluir componentes de los medios (ya sean medios complejos o definidos), aireación, temperatura, matriz de crecimiento y otros.
5.2.2 Integración genómica
En algunas modalidades, la construcción de ácido nucleico es un vector con propiedades de expresión e integración mejoradas. Por ejemplo, se identificó una configuración óptima de elementos de vector para una expresión transitoria mejorada; así como una integración y expresión estable más eficientes mediante los métodos descritos en la presente descripción. Se generó un conjunto de variantes del vector de construcción de mamífero utilizando múltiples combinaciones de varios extremos de transposón o aislantes, potenciadores, promotores, intrones, regiones no traducibles 5' (UTR), regiones no traducibles 3' (UTR), secuencia moduladora de exportación de ARN, secuencias de poliadenilación, terminadores y elemento de unión de matriz. El conjunto de variantes de vector de mamífero se utilizó para expresar DasherGFP en células embrionarias de riñón humano (HEK 293 y células de ovario de hámster chino (CHO). También se demostró que los vectores de construcción con diferentes combinaciones de promotores afectan la expresión de DasherGFP. Se contempla expresamente una optimización adicional de este vector de construcción para diferentes líneas celulares usando los métodos descritos en la presente descripción. Una ventaja de los métodos descritos en la presente descripción es identificar rápidamente un subconjunto de elementos de secuencia que más probablemente influyan en la actividad deseada, así como para facilitar la construcción predecible de la configuración óptima de elementos.
En algunas modalidades, los elementos que son útiles para mejorar el desempeño pueden incluir aquellos localizados en el ADN genómico de una célula. Por ejemplo, la expresión puede verse influenciada por los niveles de ARN polimerasas, chaperoninas, proteasas, enzimas de procesamiento u otro factor codificado por el ADN en el cromosoma celular. También podría resultar ventajoso aumentar en el cromosoma del hospedero los elementos funcionales que influyen en el desempeño. En algunas modalidades, una variable para la ingeniería es el sitio en el que se integra un gen funcional en un cromosoma de la célula hospedera.
En algunas modalidades, la construcción de ácido nucleico es un polinucleótido que comprende elementos o combinaciones de elementos dispuestos en una configuración óptima. En algunas modalidades, el polinucleótido es lineal. En algunas modalidades, los elementos en una construcción de ácido nucleico comprenden características genéticas funcionales, por ejemplo, promotores, potenciadores, intrones, señales de poliadenilación, orígenes de replicación y terminadores. En algunas modalidades, los elementos en una construcción de ácido nucleico comprenden elementos que codifican proteínas tales como señales de secreción, marcadores de resistencia, péptidos de anclaje, señales de localización y etiquetas de fusión. En algunas modalidades, la pluralidad de elementos comprende tres o más elementos, seis o más elementos, entre tres y veinte elementos o entre tres y cien elementos. En algunas modalidades, las variantes de construcciones de ácidos nucleicos incluyen sustituciones en un único elemento que comprende una o más posiciones, tres o más posiciones, seis o más posiciones. En algunas modalidades, las variantes de ácido nucleico incluyen sustituciones en las que las sustituciones son variaciones en elementos y/o presencia o ausencia de elementos. En algunas modalidades, las sustituciones incluyen cambios en la posición de uno o más elementos. En algunas modalidades, las variantes de ácido nucleico incluyen un cambio en el orden de uno o más elementos.
5.2.3 Transposones novedosos
Los transposones de ADN se someten a un sistema de replicación de "cortar y pegar" en el que los elementos se eliminan físicamente de una molécula de ADN y se reinsertan en una segunda. Los transposones de ADN se caracterizan por repeticiones invertidas de los extremos (ITR) y son movilizados por una transposasa codificada por elementos.
Si bien los transposones de ADN están muy extendidos y son activos en una variedad de eucariotas, se ha pensado que son transposicionalmente inactivos en los genomas de mamíferos.
El proceso natural de transferencia horizontal de genes se puede imitar en condiciones de laboratorio. En las plantas, los transposones de las familias Ac/Ds y Spm se han transfectado de forma rutinaria en especies heterólogas. En los animales, sin embargo, un obstáculo considerable para la transferencia de un sistema de transposón activo de una especie a otra ha sido la especificidad de la transposición de la especie debido a la necesidad de factores producidos por el hospedero natural.
Se han descrito varios elementos transponibles en la técnica que no muestran restricción de hospedero en vertebrados, por ejemplo, un transposón modificado del genoma de peces salmónidos llamado La Bella Durmiente; transposón piggyBac de células lepidópteros; transposón piggyBat del murciélago Myotis lucifugus; transposón marino descubierto por primera vez en Drosophila y; un transposón diseñado y repeticiones invertidas de transposón de la especie de rana, Rana pipiens llamado príncipe rana; pero la eficacia de la transposición en líneas celulares derivadas de diferentes especies es variable. Por lo tanto, es ventajoso tener una paleta de diferentes transposones con diferentes preferencias de hospedero para ampliar el potencial de los transposones como herramientas genómicas en vertebrados.
Actualmente se usa para muchos propósitos, incluyendo la edición del genoma, la captura de potenciadores, el descubrimiento de genes y la identificación de la función de los genes en insectos y mamíferos. El sistema piggyBac transposón/transposasa es particularmente útil debido a la precisión con la que el transposón se integra y se escinde (ver, por ejemplo, "Fraser, M. J. (2001) The TTAA-Specific Family of Transposable Elements: Identification, Functional Characterization, and Utility for Transformation of Insects. Transgénesis de insectos: métodos y aplicaciones. AM Handler y AA James. Boca Ratón, Fla., CRC Press: 249-268"; y "documento US 20070204356 A1: PiggyBac constructs in vertebrates" y referencias dentro del mismo). Esta integración y escisión se muestra esquemáticamente en la Figura 1.
Se han encontrado muchas secuencias con similitud de secuencia con la transposasa piggyBac de Trichoplusia ni en los genomas de especies filogenéticamente distintas, desde hongos hasta mamíferos, pero se ha demostrado que muy pocas poseen actividad transposasa (ver, por ejemplo, Wu M, y otros (2011 Genetica 139: 149-54. Cloning and characterization of piggyBac-like elements in lepidopteran insects, y las referencias dentro del mismo). Para descubrir nuevos transposones y transposasas capaces de transponer un polinucleótido heterólogo al genoma de una célula hospedera, se identificaron las secuencias de 14 transposasas putativas (SEQ ID NO: 43-56) buscando en bases de datos de secuencias públicas polipéptidos con similitud de secuencia con las transposasas activas conocidas. Luego identificamos sus correspondientes extremos de transposones tomando la región no codificante asociada con la secuencia del gen de la transposasa. Diseñamos y sintetizamos un polinucleótido para expresar cada una de las 14 transposasas bajo el control del promotor de CMV, y un segundo polinucleótido para expresar cada una de las 14 transposasas fusionadas a una señal de localización nuclear heteróloga bajo el control del promotor de CMV. Para cada transposasa diseñamos además dos transposones correspondientes. El primer transposón comprende un polinucleótido heterólogo que comprende un gen de resistencia a puromicina bajo el control de un promotor de PGK murino y un gen DasherGFP bajo el control de un promotor de EF1a humano, con los dos promotores orientados de tal manera que la transcripción a partir de ellos es en direcciones opuestas y divergente, rodeado por un par de extremos de transposón. Las secuencias de los extremos del transposón y las correspondientes transposasas se describen en el Ejemplo 6.1.1 y se muestran en las Tablas 1 y 2. El segundo transposón comprende un polinucleótido heterólogo que comprende un gen de resistencia a puromicina bajo el control de un promotor de PGK murino, con un gen DasherGFP acoplado traduccionalmente al gen de resistencia a puromicina a través de una secuencia CHYSEL, rodeado por un par de extremos de transposón. Las secuencias de los extremos del transposón y las correspondientes transposasas se describen en el Ejemplo 6.1.4 y se muestran en la Tabla 5. Luego, se transfectó cada transposón en células CHO, en conjuntos paralelos con o sin su transposasa correspondiente. Las transposasas que aumentaban la fluorescencia del reportero a partir de sus transposones en relación con el transposón solo, comprenden nuevos pares de transposón-transposasa que podían integrar un polinucleótido heterólogo en el genoma de una célula.
Como se describe en los Ejemplos 6.6.1 y 6.1.4 y se muestra en las Tablas 1, 2 y 5, de 14 que identificamos y sintetizamos, solo 4 mostraron actividad transposasa detectable. Por tanto, la similitud de secuencia con la secuencia piggyBac de Trichoplusia ni es insuficiente para caracterizar una secuencia como una transposasa.
Usando este método, hemos identificado dos nuevas transposasas activas similares a piggyBac junto con sus extremos de transposón y las secuencias ITR sobre las que actúan.
Se identificó un transposón del genoma de Xenopus tropicalis con los extremos funcionales del transposón contenidos en las SEQ ID NO: 5, 6. Dos transposasas que pueden reconocer y transponer estos extremos del transposón son las SEQ ID NO: 45 y 46. Se ha identificado actividad de escisión en transposasas de Txb de Xenopus (Hikosaka y otros, Mol. Biol. Evol., 24 (12: 2648-2656, 2007), pero los autores concluyen: "En el presente estudio, demostramos que la Xtr-Uribo2 Tpasa tiene actividad de escisión hacia el transposón objetivo, aunque no hay evidencia de la integración del objetivo escindido en el genoma" Aquí identificamos los extremos de los transposones, incluyendo los ITR, que se pueden colocar en cualquier extremo de una secuencia de polinucleótidos heteróloga para efectuar la integración eficiente del polinucleótido en el ADN genómico mediante la acción de la transposasa de Xenopus. Los vectores de transferencia de genes que comprenden extremos de transposones de Xenopus y con configuraciones óptimas de los elementos del vector descritos en la presente descripción (Sección 5.2.6) muestran una integración genómica estable incluso en ausencia de transposasa. En presencia de transposasa, la expresión de transposones integrados de forma estable aumenta de 3 a 70 veces (véase, por ejemplo, la Tabla 14).
Se identificó un transposón del genoma de Bombyx mori con los extremos funcionales del transposón contenidos en la SEQ ID NO: 1,2. Una transposasa que puede reconocer y transponer un transposón que comprende estos extremos de transposón es la SEQ ID NO: 44. Observamos que la secuencia del extremo del transposón asociada con la SEQ ID NO: 43 (SEQ ID NO: 121 y 122) se termina en la secuencia de integración canónica 5'-TTAA-3' siempre observada para transposones con una identidad de secuencia significativa con Trichoplusia ni piggyBac. En contraste, la secuencia del extremo del transposón asociada con la SEQ ID NO: 44 (SEQ ID NO: 1 y 2) se termina en secuencias 5'-TTAT-3' adyacentes a las ITR. Inicialmente no sabíamos si esto indicaba que la transposasa realmente usaba una secuencia de integración novedosa. Estudios anteriores indicaron que la transposasa de Trichoplusia ni piggyBac es incapaz de transponer un transposón cuyos extremos comprenden una secuencia objetivo distinta de 5'-TTAA-3' (Mitra y otros (2008 EMBO Journal 27: 1097-1109 "piggyBac can bypass DNA synthesis during cut and paste transposition"). Las posibilidades alternativas para la secuencia objetivo 5'-TTAT-3' en los extremos del transposón dentro de la SEQ ID NO: 1,2 incluían errores de secuenciación o que el transposón había mutado y la transposasa ya no era capaz de transponer la secuencia. Debido a que los transposones activos similares a piggyBac solo se han descrito para usar secuencias de integración 5'-TTAA-3', agregamos la secuencia 5'-TTAA-3' a ambos extremos del transposón Bombyx cuando lo sintetizamos para maximizar la posibilidad de que podría reconstituir un transposón activo (por lo que la secuencia del transposón se dispuso 5'-TTAATTAT-extremo del transposón 1 -polinucleótido heterólogo - extremo del transposón 2-TTATTTAA-3'). Contrariamente a las afirmaciones de Daimon y otros (quienes describen las transposasas de Bombyx como esencialmente inactivas, ver Daimon T y otros, 2010. Genoma. 53: 585-93. "Recent transposition of yabusame, a novel piggyBac-like transposable element in the genome of the silkworm, Bombyx mori.") encontramos que el transposón Bombyx era muy activo (ver Ejemplos 6.6.1 y Tablas 1 y 2, deseamos determinar su secuencia de integración. Como se muestra en la Figura 1, cuando se transpone un transposón similar a piggyBac, deja una única copia de su secuencia objetivo en el ADN del que se escinde. Por tanto, se secuenciaron los plásmidos de los que se habían escindido los transposones mediante transposasas. La Figura 2 muestra un archivo de seguimiento de secuencia de un plásmido del que se ha eliminado el transposón Bombyx. Ambas copias de la secuencia 5'-TTAA-3' que colocamos alrededor de los extremos del transposón todavía están presentes; sin embargo, solo queda una copia del sitio 5'-TTAT-3'. Examinamos 16 eventos de transposición independientes de los transposones de Bombyx, y los 16 dejaron solo una única copia perfectamente intacta de la secuencia de integración 5'-TTAT-3'. Por el contrario, cuando examinamos 16 eventos de transposición independientes de transposones de Xenopus, los 16 dejaron solo una única copia perfectamente intacta de la secuencia de integración 5'-TTAA-3'. Tanto los transposones de Xenopus como los de Bombyx descritos aquí se transponen por sus respectivas transposasas con la misma precisión que se ha descrito para piggyBac de Trichoplusia ni, una precisión que es muy ventajosa para cualquier modificación genómica que pueda ser conveniente hacer de forma reversible. Sin embargo, a diferencia de piggyBac de Trichoplusia ni, el transposón Bombyx mori comprende una secuencia de integración 5'-TTAT-3', y la transposasa Bombyx mori puede escindir e integrar transposones Bombyx mori en secuencias de reconocimiento 5'-TTAT-3'. Esto contrasta con todas las otras transposasas conocidas con homología con piggyBac de Trichoplusia ni, todas las cuales reconocen e insertan transposones en la secuencia 5'-TTAA-3'. Esta diferencia puede ser muy ventajosa: piggyBac de Trichoplusia ni tiene preferencia por insertar transposones en ADN transcripcionalmente inactivo. Ya que 5'-TTAT-3' es complementario inverso a 5'-ATAA-3' que forma parte de la señal canónica de poliA de mamíferos 5'-aATAAa-3'. Por tanto, el sitio de inserción 5'-TTAT-3' reconocido por la transposasa Bombyx mori se producirá en casi todas las señales poliA. Las señales de poliA están asociadas con regiones transcripcionalmente activas del cromosoma. Por tanto, es probable que los transposones que se insertan en los sitios 5'-TTAT-3', incluyendo los transposones Bombyx mori, produzcan niveles de expresión más altos de los genes que portan que los transposones que insertan los sitios 5'-TTAA-3'.
La invención proporciona un polinucleótido heterólogo flanqueado por repeticiones invertidas, que a su vez están flanqueadas por una repetición directa de la secuencia objetivo, 5'-TTAT-3'. En otras palabras, de 5' a 3' tales polinucleótidos comprenden una secuencia objetivo 5'-TTAT-3', una ITR, un polinucleótido heterólogo no flanqueado naturalmente por la ITR y 5'-TTAT-3', una segunda ITR en orientación inversa a la primera ITR, y una segunda secuencia objetivo 5'-TTAT-3'. La transposición de dicho transposón por una transposasa deja un único motivo 5'-TTAT-3' en el locus previamente ocupado en un transposón. El transposón se transpone a un segundo polinucleótido que incluye un motivo 5'-TTAT-3' para generar un segundo polinucleótido modificado que incluye el transposón con los mismos componentes que cuando el transposón ocupaba el primer polinucleótido.
La presente solicitud describe un transposón Bombyx de tipo piggyBac (AB162707.1 GI: 42600553 que comprende extremos de transposón (cada extremo incluye un ITR) correspondiente a la SEQ ID NO. 1 y 2, que tiene una secuencia objetivo correspondiente a 5'-TTAT-3'. También comprende una secuencia que codifica una transposasa (SEQ ID NO.
44). Un transposón Bombyx descrito previamente (AB159601.1 GI: 41016737) comprende un extremo de transposón también idéntico a la SEQ ID NO. 1 y un segundo extremo de transposón correspondiente a la SEQ ID NO. 122. La SEQ ID NO 122 es muy similar a la SEQ ID NO. 2, pero tiene una inserción grande poco antes del ITR. Aunque las secuencias de ITR para los dos transposones son idénticas (ambos son idénticos a la SEQ ID NO. 32), tienen diferentes secuencias objetivo: el segundo transposón tiene una secuencia objetivo correspondiente a 5'-TTAA-3', proporcionando evidencia de que no es necesario ningún cambio en la secuencia de ITR para modificar la especificidad de la secuencia objetivo. La transposasa Bombyx (SEQ ID NO: 43), que está asociada con el sitio objetivo 5'-TTAA-3' difiere de la transposasa asociada a 5'-TTAT-3' (SEQ ID NO: 44) en solo 4 aminoácidos cambios (D322Y, S473C, A507T, H582R). La transposasa (SEQ ID NO: 43), que está asociada con el sitio objetivo 5'-TTAA-3' es menos activa que la transposasa asociada a 5'-TTAT-3' (SEQ ID NO: 44) en el transposón con Extremos 5'-TTAT-3' (ver, por ejemplo, la Tabla 5). Estos resultados proporcionan evidencia de que otros transposones con sitios de duplicación objetivo 5'-TTAA-3' pueden convertirse en transposasas con sitios de duplicación objetivo 5'-TTAT-3' reemplazando los sitios de duplicación objetivo 5'-TTAA-3 'con 5'-TTAT-3'. Estos nuevos transposones se pueden usar con la transposasa Bombyx (SEQ ID NO: 43), que reconoce la secuencia objetivo 5'-TTAT-3', o con una variante de la transposasa originalmente asociada con el transposón 5'-TTAA-3'. La alta similitud entre las transposasas Bombyx 5'-TTAA-3' y 5'-TTAT-3' proporciona evidencia de que muy pocos cambios en la secuencia de aminoácidos de una transposasa tipo piggyBac pueden conferir una especificidad de secuencia objetivo alterada. Por lo tanto, la invención proporciona sistemas de transferencia de transposones por transposasas que pueden formarse mediante la modificación de cualquier sistema de transferencia de genes de transposones por transposasas tipo piggyBac del que hay muchos ejemplos conocidos, en los que las secuencias objetivo 5'-TTAA-3' se reemplazan por secuencias objetivo 5'-TTAT-3', las ITR siguen siendo las mismas y la transposasa es la transposasa original o una variante de la misma resultante del uso de una mutagénesis de bajo nivel para introducir mutaciones en la transposasa. De manera similar, la invención también proporciona sistemas de transferencia de transposones por transposasas que pueden formarse mediante la modificación de un sistema de transferencia de genes de transposón por transposasa de tipo 5'-TTAT-3'-piggyBac activo como el sistema Bombyx descrito en la presente descripción, en el que las secuencias objetivo 5'-TTAT-3' se reemplazan con secuencias objetivo 5'-TTAA-3', las ITR permanecen iguales y la transposasa es la transposasa original o una variante de la misma resultante del uso de una mutagénesis de bajo nivel para introducir mutaciones en la transposasa.
Pueden seleccionarse transposasas que son activas en una nueva secuencia objetivo, tal como una secuencia objetivo 5'-TTAT-3', por ejemplo, acoplando la escisión de transposones a la producción de una secuencia codificante completa para un marcador de selección. Un transposón cuyas ITR están flanqueadas por las nuevas secuencias objetivo (por ejemplo, secuencias objetivo 5'-TTAT-3') puede insertarse en un marcador de selección de manera que se evite la expresión del marcador de selección. Por ejemplo, el transposón puede estar en medio de un marco abierto de lectura que codifica un marcador de selección de modo que la presencia del transposón evite la traducción de una versión funcional del marcador de selección, o el transposón puede estar en un intrón dentro de un marco abierto de lectura que codifica un marcador de selección, de manera que la presencia del transposón previene el corte y empalme del intrón y, por tanto, evita la síntesis del marcador de selección. El transposón se coloca de manera que cuando se escinde, el marcador de selección recupera la funcionalidad. Por ejemplo, el transposón se puede colocar en la secuencia 5'-TTAT-3' dentro de la secuencia codificante de un marcador de selección tal como un marcador auxotrófico; la escisión precisa del transposón del marco abierto de lectura del marcador de selección restaura la secuencia codificante del marcador de selección. Se introducen en una célula un gen que codifica el marcador de selección interrumpido por el transposón y un gen que codifica una transposasa. Luego, la célula se somete a condiciones restrictivas que requieren la expresión del marcador de selección para permitir que la célula sobreviva. La expresión del marcador de selección depende a su vez de la escisión del transposón que, a su vez, requiere una transposasa activa. Por tanto, la sobrevivencia celular puede usarse para identificar transposasas activas. Un ejemplo de tal esquema de selección se describió por Yusa y otros (Yusa y otros PNAS, vol 108, núm. 4, 1531-1536, 2011).
Puede obtenerse una transposasa con actividad modificada, ya sea para la actividad en una nueva secuencia objetivo que incluye una secuencia objetivo 5-TTAT-3', o una actividad aumentada en una secuencia objetivo existente utilizando variaciones del esquema de selección descrito anteriormente. Para crear la transposasa modificada, se usa una transposasa existente como punto de partida, por ejemplo, cualquiera de las SEQ ID NO: 43-57 o cualquier otra transposasa de tipo piggyBac. Se crean una o más secuencias de transposasa variantes. Estos se pueden crear de diversas formas, por ejemplo, el gen puede someterse a mutagénesis aleatoria; el gen puede ser "mezclado en el ADN" con uno o más genes homólogos; pueden introducirse sustituciones sistemáticas en el gen, incluyendo la creación de todas las posibles sustituciones de un solo aminoácido; pueden introducirse sustituciones basándose en análisis filogenético y otras reglas, por ejemplo, como se describe en la patente de Estados Unidos 8,635,029 B2. La secuencia que codifica una o más transposasas variantes está unida operativamente a un promotor de manera que las transposasas se pueden expresar en una célula. Cada variante de transposasa se introduce en una célula que contiene el marcador de transposición interrumpido por el transposón, y la célula se somete luego a condiciones restrictivas para las que requiere el marcador de selección activo para sobrevivir. Cuando una transposasa puede escindir el transposón, la célula sobrevivirá y el gen que codifica la transposasa activa puede recuperarse de la célula, por ejemplo, mediante PCR. El proceso puede realizarse en grupos de variantes: una transposasa más activa creará marcadores de selección activos con más frecuencia y, por lo tanto, estará más representada en la población.
Puede usarse un proceso comparable para aumentar la capacidad de transposición de los extremos del transposón mediante una transposasa. En este caso, el transposón puede comprender un primer marcador de selección activo. Los extremos del transposón pueden seleccionarse de cualquiera de las SEQ ID NO: 1-31 o 32-42 o de cualquier otro transposón similar a piggyBac, incluyendo los asociados con las repeticiones invertidas de los extremos mostradas en las SEQ ID NO: 125-130. La secuencia de uno o ambos extremos del transposón puede someterse a cambios de secuencia predeterminados o aleatorios, incluyendo cambios en la secuencia objetivo, la ITR o en otras partes de los extremos del transposón. A continuación, el transposón puede introducirse en una primera célula que contiene un polinucleótido objetivo que comprende un segundo marcador de selección activo y una transposasa activa. Si la transposasa puede transponer el transposón, alguna fracción de los transposones se transpondrá al polinucleótido objetivo. El polinucleótido objetivo se purifica de la primera célula y se introduce en una segunda célula que se somete a condiciones restrictivas para las que requiere el primer marcador de selección y el segundo marcador de selección para sobrevivir. El transposón puede recuperarse, por ejemplo, secuenciando fuera del transposón para identificar la secuencia flanqueante y luego amplificando el transposón mediante el uso de PCR. El proceso puede realizarse en grupos de variantes: un transposón más activo creará polinucleótidos objetivo que contienen ambos marcadores de selección con mayor frecuencia y, por lo tanto, estará más representado en la población. En este proceso, el transposón puede estar presente opcionalmente como una interrupción reversible en un marcador de selección como se describe para la pantalla de actividad de la transposasa. Sin embargo, esto no es necesario para la pantalla de actividad de transposones, ya que los transposones transpuestos se detectan directamente.
Estas nuevas transposasas permiten la inserción efectiva de un transposón en una célula eucariota, incluyendo una célula de mamífero como una célula de ovario de hámster chino (CHO) o una célula embrionaria de riñón humano (HEK293).
Así como las transposasas ejemplificadas que tienen las secuencias SEQ ID NO. 43, 44, 45 y 46, la presente descripción proporciona variantes que tienen al menos 90, 91, 92, 93, 94, 95, 96, 97, 98 o 99 % de identidad de secuencia con una secuencia ejemplificada que retiene la actividad transposasa. Las variaciones pueden ser sustituciones, inserciones y deleciones conservadoras o no conservadoras. Las eliminaciones pueden ser desde el extremo N-terminal o C-terminal o internas. Algunas variantes resultantes de la mutagénesis dirigida a alanina contienen una sustitución de alanina en posiciones únicas a lo largo de la molécula. Las variaciones retienen la actividad de la transposasa en un transposón en el que la transposasa ejemplificada está activa. Hemos identificado transposasas activas de Bombyx mori (SEQ ID NO: 44) y Xenopus tropicalis (SEQ ID NO: 45 y 46) que muestran variaciones en al menos 4 residuos que sirven como punto de partida para estudios adicionales para la identificación de variantes hiperactivas y variantes de integración deficiente que retienen la actividad de escisión. Como se usa en la presente descripción, una transposasa de Bombyx mori o una transposasa de Bombyx se refiere a un polipéptido con al menos un 90 % de identidad de secuencia con la SEQ ID NO: 44 que puede reconocer y transponer un transposón. En algunos casos, el transposón comprende dos extremos del transposón, cada uno de los cuales comprende la SEQ ID NO: 32 en orientaciones invertidas en los dos extremos del transposón. Como se usa en la presente descripción, una transposasa de Xenopus tropicalis o una transposasa de Xenopus se refiere a un polipéptido con al menos un 90 % de identidad de secuencia con la SEQ ID NO: 45 o la SEQ ID NO: 46 que puede reconocer y transponer un transposón. En algunas modalidades, el transposón comprende dos extremos del transposón, cada uno de los cuales comprende la SEQ ID NO: 42 en orientaciones invertidas en los dos extremos del transposón.
Estas nuevas transposasas permiten la inserción efectiva de un transposón en una célula eucariota, incluyendo una célula de mamífero como una célula de ovario de hámster chino (CHO) o una célula embrionaria de riñón humano (HEK293).
Así como las transposasas ejemplificadas que tienen las secuencias SEQ ID NO 43, 44, 45 y 46, la descripción proporciona variantes que tienen al menos 90, 91, 92, 93, 94, 95, 96, 97, 98 o 99 % de identidad de secuencia con una secuencia ejemplificada que retiene la actividad transposasa. Las variaciones pueden ser sustituciones, inserciones y deleciones conservadoras o no conservadoras. Las eliminaciones pueden ser desde el extremo N-terminal o C-terminal o internas. Algunas variantes resultantes de la mutagénesis dirigida a alanina contienen una sustitución de alanina en posiciones únicas a lo largo de la molécula. Las variaciones retienen la actividad de la transposasa en un transposón en el que la transposasa ejemplificada está activa. Hemos identificado variantes activas de transposasas de Bombyx mori (SEQ ID NO: 43 y 44) y Xenopus tropicalis (SEQ ID NO: 45 y 46) que muestran variaciones en al menos 4 residuos que sirven como punto de partida para más estudios de identificación de variantes hiperactivas y variantes de integración deficiente que retienen la actividad de escisión. Tal como se usa en la presente descripción, una transposasa Bombyx mori o una transposasa Bombyx se refiere a un polipéptido con al menos un 90 % de identidad de secuencia con la SEQ ID NO: 43 o la SEQ ID NO: 44 que puede reconocer y transponer un transposón. En algunos casos, el transposón comprende dos extremos del transposón, cada uno de los cuales comprende la SEQ ID NO: 32 en orientaciones invertidas en los dos extremos del transposón. Como se usa en la presente descripción, una transposasa de Xenopus tropicalis o una transposasa de Xenopus se refiere a un polipéptido con al menos un 90 % de identidad de secuencia con la SEQ ID NO: 45 o la SEQ ID NO: 46 que puede reconocer y transponer un transposón. En algunas modalidades, el transposón comprende dos extremos del transposón, cada uno de los cuales comprende la SEQ ID NO: 42 en orientaciones invertidas en los dos extremos del transposón.
La invención también proporciona variantes de secuencias ejemplificadas de extremos de transposones. La transposasa de Bombyx reconoce un transposón con una secuencia izquierda correspondiente la a SEQ ID NO: 1, y una secuencia derecha correspondiente la a SEQ ID NO: 2. Escindirá el transposón de una molécula de ADN cortando el ADN en la secuencia 5-TTAT-3' en el extremo izquierdo de un extremo del transposón hasta el 5'-TTAT-3' en el extremo derecho del segundo extremo del transposón, incluyendo cualquier ADN heterólogo que se coloque entre ellos, e inserte la secuencia escindida en una segunda molécula de ADN. Las versiones truncadas y modificadas de los extremos del transposón derecho e izquierdo también funcionarán como parte de un transposón que puede ser transpuesto por la transposasa Bombyx. Por ejemplo, el extremo del transposón izquierdo se puede reemplazar por una secuencia más corta correspondiente a la SEQ ID NO: 3, o el extremo del transposón derecho se puede reemplazar por una secuencia más corta correspondiente a la SEQ ID NO: 4. Por tanto, se contempla expresamente que las versiones modificadas de las secuencias de los extremos del transposón serán toleradas por la transposasa y pueden incluso dar como resultado un aumento de la transposición. Además, observamos que los extremos del transposón izquierdo y derecho comparten una secuencia repetida de 16 pb en sus extremos (SEQ ID NO: 32) inmediatamente adyacentes al sitio de inserción 5'-TTAT-3', que tiene una orientación invertida en el dos extremos. Es decir, el extremo del transposón izquierdo comienza con la secuencia 5'-TTATC-CCGGCGAGCATGAGG-3' (SEQ ID NO: 33), y el transposón derecho termina con el complemento inverso de esta secuencia: 5'-CCTCATGc Tc Gc CGGGTTAT-3' (SEQ ID NO: 34). La perfecta conservación de esta secuencia de 16 pb en ambos extremos del transposón sugiere que es importante para la función. Un ejemplo de la presente descripción es un transposón que comprende un polinucleótido heterólogo insertado entre la SEQ ID NO: 33 y la SEQ ID NO: 34. Como se usa en la presente descripción, un transposón Bombyx mori o un transposón Bombyx significa un transposón que comprende un polinucleótido heterólogo y cualquiera de las SEQ ID NO: 32-34 o SEQ ID NO: 1-4, o subsecuencias de las SEQ ID NO: 1-4, de tal manera que el polinucleótido heterólogo puede transponerse mediante una transposasa al menos 90 % idéntica a la SEQ ID n O: 43 o 44.
La transposasa de Xenopus reconoce un transposón final con una secuencia izquierda correspondiente a la SEQ ID NO: 5, y una secuencia derecha correspondiente a la SEQ ID NO: 6. Escindirá el transposón de una molécula de ADN cortando el ADN en la secuencia 5'-TTAA-3' en el extremo izquierdo de un extremo del transposón hasta el 5'-TTAA-3' en el extremo derecho del segundo extremo del transposón, incluyendo cualquier ADN heterólogo que se coloque entre ellos, e inserte la secuencia escindida en una segunda molécula de ADN. Las versiones truncadas y modificadas de los extremos del transposón derecho e izquierdo también funcionarán como parte de un transposón que puede ser transpuesto por la transposasa de Xenopus tropicalis. Por ejemplo, el extremo del transposón izquierdo se puede reemplazar por una secuencia correspondiente a la SEQ ID NO: 7 o a la SEQ ID NO: 9, el extremo del transposón derecho se puede reemplazar por una secuencia más corta correspondiente a la SEQ ID NO: 8. Además, observamos que los extremos del transposón izquierdo y derecho comparten una secuencia de 18 pb casi perfectamente repetida en sus extremos (5'-TTAACCYTTTKMCTGCCA: SEQ ID NO: 42) que incluye el sitio de inserción 5'-TTAA-3', cuya secuencia se invierte en la orientación en los dos extremos. Es decir, en la SEQ ID NO: 5 y la SEQ ID NO: 9, el extremo del transposón izquierdo comienza con la secuencia 5'-TTAACCTTTTTACTGCCA-3' (SEQ ID NO: 37), o en la SEQ ID NO: 7 el extremo del transposón izquierdo comienza con la secuencia 5'-TTAACCCTTTGCCTGCCA-3' (SEQ ID NO: 38); el transposón derecho termina con aproximadamente el complemento inverso de esta secuencia: en la SEQ ID NO: 6 termina con 5-TGGCAGTAAAAGGGTTAA-3' (SEQ ID NO: 40), en la SEQ ID NO: 8 termina con 5'-TGGCAGTGAAAGGGT-TAA -3' (SEQ ID NO: 41). La conservación casi perfecta de esta secuencia de 18 pb en ambos extremos del transposón sugiere que es importante para la función. Una modalidad de la invención es un transposón que comprende un polinucleótido heterólogo insertado entre dos extremos del transposón, cada uno de los cuales comprende la SEQ ID NO: 42 en orientaciones invertidas en los dos extremos del transposón. En algunas modalidades, un extremo de transposón comprende una secuencia seleccionada de las SEQ ID NO: 37-39. En algunas modalidades, un extremo de transposón comprende una secuencia seleccionada de SEQ ID NO: 40-41.
Se contemplan expresamente estudios adicionales para identificar variantes adicionales de extremos de transposones y secuencias de transposasas con actividad mejorada. La generación de variantes hiperactivas es otro aspecto de esta invención en el que los estudios mutacionales identifican mutaciones en la transposasa, que dan lugar a hiperactividad (Yusa y otros, PNAS, vol 108, no 4, 1531-1536, 2011). Una vez que los mutantes individuales se identifican y verifican su actividad de transposición en las células, estas mutaciones o combinaciones de mutaciones se pueden combinar en una secuencia para generar una transposasa hiperactiva que muestra tasas de transposición más altas que la transposasa de tipo silvestre. Las variantes hiperactivas también incluyen variantes con actividad de integración mejorada, actividad de escisión mejorada o ambas. Otro aspecto de esta invención incluye variantes de integración deficiente, en las que la transposasa muestra una menor actividad de integración, pero una mayor actividad de escisión.
Por consiguiente, la presente invención presenta transposones y transposasas de Xenopus. La presente descripción presenta transposones y transposasas de Bombyx. Otro aspecto de esta invención se refiere a un transposón, que comprende una secuencia de polinucleótidos heteróloga, como se describe en la presente descripción, colocada entre al menos dos ITR, al menos una repetición a cada lado del polinucleótido heterólogo, en el que estas repeticiones pueden unirse a una proteína transposasa y donde el transposón es capaz de insertarse en el ADN de una célula. Por consiguiente, las repeticiones son preferentemente secuencias que la transposasa reconoce y a las que se une como se define en la presente descripción.
De acuerdo con la presente invención, un transposón que está unido por una transposasa contiene un par de secuencias repetidas. La primera repetición se localiza río arriba del polinucleótido heterólogo y la segunda repetición se localiza río abajo del polinucleótido heterólogo. La segunda repetición representa la misma secuencia que la primera repetición, pero muestra una orientación invertida en comparación con la primera repetición. Es decir, considerando solo una cadena de una molécula de ADN de doble cadena, la segunda repetición ocurrirá como el complemento inverso de la primera repetición. En algunas modalidades, estas repeticiones son secuencias invertidas idénticas. En algunas modalidades, estas repeticiones invertidas pueden ser muy similares, pero no idénticas, difiriendo en 1, 2, 3 o 4 nucleótidos. Estas repeticiones se denominan "repeticiones invertidas" (IR) o "repeticiones invertidas de los extremos" (ITR), debido al hecho de que cada repetición es una copia de la otra repetida a la inversa. En ciertas modalidades, las repeticiones pueden ocurrir en un número múltiple río arriba y río abajo de la secuencia de ácido nucleico mencionada anteriormente. En determinadas formas de modalidad, las repeticiones son cortas, entre 10 y 20 pares de bases y preferentemente entre 14 y 16 pares de bases. En algunas otras modalidades, los extremos del transposón comprenden además secuencias adicionales que pueden ser repeticiones o no.
En algunas modalidades, el transposón Xenopus comprende un extremo que comprende al menos 14 o 16 o 18 o 20 o 30 o 40 nucleótidos contiguos de las SEQ ID NO: 5, 7 o 9; en algunas modalidades, el transposón Xenopus comprende un extremo que comprende al menos 14 o 16 o 18 o 20 o 30 o 40 nucleótidos contiguos de las SEQ ID NO: 6 u 8. En algunas modalidades, el transposón de Xenopus comprende un extremo con al menos un 90 % de identidad con las SEQ ID NO: 5 o 7 o 9; en algunas modalidades, el transposón de Xenopus comprende un extremo con al menos un 90 % de identidad con las SEQ ID NO: 6 u 8. En algunas modalidades del transposón Xenopus, cada repetición invertida de los extremos (ITR) comprende la SEQ ID NO: 42. En algunas modalidades del transposón Xenopus, un ITR comprende una secuencia seleccionada de SEQ ID NO: 37-39. En algunas modalidades del transposón Xenopus, un ITR comprende una secuencia seleccionada de SEQ ID NO: 40-41.
En algunos casos, el transposón Bombyx comprende un extremo que comprende al menos 14 o 16 o 18 o 20 o 30 o 40 nucleótidos contiguos de las SEQ ID NO: 1 o 3; en algunos casos, el transposón Bombyx comprende un extremo que comprende al menos 14 o 16 o 18 o 20 o 30 o 40 nucleótidos contiguos de las SEQ ID NO: 2 o 4. En algunos casos, el transposón Bombyx comprende un extremo con al menos un 90 % de identidad con las SEQ ID NO: 1 o 3; en algunos casos, el transposón Bombyx comprende un extremo con al menos un 90% de identidad con las SEQ ID NO: 2 o 4.
En algunos casos, el transposón Bombyx comprende un extremo que comprende al menos 16 nucleótidos contiguos de la SEQ ID NO: 33 y un extremo que comprende al menos 16 nucleótidos contiguos de la SEQ ID NO: 34. En algunos casos, cada ITR del transposón Bombyx comprende la SEQ ID NO: 32. En estos casos, la SEQ ID NO: 32 es inmediatamente adyacente a la secuencia 5'-TTAT-3' o 5'-TTAA-3'.
Las ITR como se describen en la presente descripción preferentemente flanquean una secuencia de ácido nucleico que se inserta en el ADN de una célula. La secuencia de ácido nucleico puede incluir todo o parte de un marco abierto de lectura de un gen (es decir, esa parte de un gen que codifica una proteína), una o más secuencias de control de la expresión (es decir, regiones reguladoras en el ácido nucleico) solas o junto con todas o parte de un marco abierto de lectura. Las secuencias de control de la expresión preferidas incluyen, pero no se limitan a, promotores, potenciadores, intrones, secuencias de poliadenilación, elementos de control de bordes, regiones de control de locus; potenciadores de la expresión que mejoran la exportación de ARN desde el núcleo, incluyendo el elemento regulador postranscripcional de la hepatitis de la marmota (WPRE), el elemento regulador postranscripcional del virus de la hepatitis B (HPRE) (por ejemplo, pero no limitado a las SEQ ID NO: 104-105 y el elemento regulador postranscripcional de suslic del ártico (AGS) (por ejemplo, pero no limitado a las SEQ ID NO: 106-107); y elementos cuyo mecanismo de acción puede no ser conocido, como secuencias de la región de unión de andamiaje (SAR) (por ejemplo, pero no limitado a las SEQ ID NO: 108-111), y secuencias aislantes que se cree que previenen la propagación de la cromatina condensada que podría silenciar la expresión y evitar la interferencia de un potenciador distal en un promotor, por ejemplo HS4 (por ejemplo, pero no limitado a las SEQ ID NO: 112-113) (Yusufzai y otros, PNAS, vol. 101, núm. 23, 8620-8624, junio de 2004).
Las células cuyos genomas contienen un transposón de Xenopus tropicalis son un aspecto de la invención. Las células cuyos genomas contienen un transposón Bombyx mori son un ejemplo de la presente descripción.
En una modalidad preferida, la secuencia de ácido nucleico comprende un promotor unido operativamente a un marco abierto de lectura. El marco abierto de lectura puede comprender un marcador de selección que permite la selección mediante un fenotipo demostrable, por ejemplo, un reportero fluorescente. De acuerdo con cierta modalidad preferida, los transposones de la presente invención pueden ocurrir preferentemente como un transposón lineal (que se extiende desde el extremo 5' al extremo 3', por convención) que puede usarse como un fragmento lineal o circularizado, por ejemplo, en un plásmido.
La actividad de las transposasas puede incrementarse mediante la fusión de la señal de localización nuclear (NLS) en el extremo N-terminal, el extremo C-terminal, tanto en el extremo N como en el extremo C-terminal o en las regiones internas de la proteína transposasa siempre que se mantenga la actividad de la transposasa. Una señal o secuencia de localización nuclear (NLS) es una secuencia de aminoácidos que "marca" o facilita la interacción de una proteína, ya sea directa o indirectamente con proteínas de transporte nuclear para su importación al núcleo celular. Las señales de localización nuclear (NLS) utilizadas pueden incluir, pero no se limitan a, secuencias de NLS consenso, secuencias de NLS virales, secuencias de NLS celulares y combinaciones de las mismas. En modalidades preferidas, las secuencias de NLS están unidas operativamente a la transposasa.
La proteína transposasa se puede introducir en una célula como una proteína o como un ácido nucleico que codifica la transposasa, por ejemplo, como un ácido ribonucleico, incluyendo el ARNm, como ADN, por ejemplo, como ADN extracromosómico que incluye, entre otros, ADN episómico, como ADN plasmídico o como ácido nucleico viral. Además, el ácido nucleico que codifica la proteína transposasa se puede transfectar en una célula como un vector de ácido nucleico, tal como un plásmido, o como un vector de expresión génica, incluyendo un vector viral. El ácido nucleico puede ser circular o lineal. Un vector, como se usa en la presente descripción, se refiere a un plásmido, un vector viral o un cósmido que puede incorporar ácido nucleico que codifica la proteína transposasa o el transposón de esta invención. El ADN que codifica la proteína transposasa puede insertarse de manera estable en el genoma de la célula o en un vector para expresión constitutiva o inducible. Cuando la proteína transposasa se transfecta en la célula o se inserta en el vector como ácido nucleico, la secuencia que codifica la transposasa está preferentemente unida operativamente a un promotor heterólogo. Hay una variedad de promotores que podrían usarse, incluyendo, entre otros, promotores constitutivos, promotores específicos de tejido, promotores inducibles y similares. Todas las secuencias de ADN o ARN que codifican las proteínas transposasa de Xenopus tropicalis se contemplan expresamente como parte de la presente invención. Todas las secuencias de ADN o ARN que codifican las proteínas transposasa de Bombyx mori se contemplan expresamente como parte de la presente descripción.
5.2.4 Sistema de transferencia de genes
La presente descripción también presenta un sistema de transferencia de genes que comprende una transposasa Bombyx mori y un transposón que comprende un polinucleótido heterólogo entre una ITR izquierda y una ITR derecha que son reconocidos y transpuestos por la transposasa. La presente invención también presenta un sistema de transferencia de genes que comprende una transposasa de Xenopus tropicalis y un transposón que comprende un polinucleótido heterólogo entre una ITR izquierda y una ITR derecha que son reconocidas y transpuestas por la transposasa. La transposasa se puede codificar en el mismo polinucleótido que el transposón en el sistema de transferencia de genes, o se puede codificar en un segundo polinucleótido. Si la transposasa está codificada en la misma molécula de ácido nucleico que el transposón, la transposasa está preferentemente en una parte de la molécula que no es transpuesta. El sistema de transferencia de genes de esta invención, por lo tanto, comprende preferentemente dos componentes: la transposasa como se describe en la presente descripción y un transposón como se describe en la presente descripción. En combinación, estos dos componentes proporcionan actividad de transposón activo y permiten reubicar el transposón. En uso, la transposasa se une a los extremos del transposón y promueve la inserción de la secuencia de ácido nucleico que interviene en el ADN de una célula como se define a continuación.
En algunos casos, un vector de transferencia de genes comprende además secuencias que codifican la transposasa fusionadas con ciertos dominios funcionales de proteínas. Dichos dominios funcionales de proteína pueden incluir, pero no se limitan a, uno o más dominios de unión a ADN, una o más señales de localización nuclear, una o más regiones de bisagra flexibles que pueden facilitar una o más fusiones de dominios y combinaciones de las mismas. Pueden realizarse fusiones en el extremo N-terminal, el extremo C-terminal o en las regiones internas de la proteína transposasa siempre que se mantenga la actividad transposasa. Los dominios de unión al ADN usados pueden incluir, pero no se limitan a, un dominio de hélice-giro-hélice, un dominio de dedo de Zn, un dominio de zipper de leucina o un dominio de hélice-lazo-hélice. Los dominios de unión a ADN específicos usados pueden incluir, pero no se limitan a, un dominio de unión a ADN de Gal4, un dominio de unión a ADN LexA o un dominio de unión a ADN Zif268. Las señales de localización nuclear (NLS) utilizadas pueden incluir, pero no se limitan a, secuencias de NLS consenso, secuencias de NLS virales, secuencias de NLS celulares y combinaciones de las mismas. Las regiones de bisagra flexibles utilizadas pueden incluir, pero no se limitan a, enlazadores de glicina/serina y variantes de los mismos.
En otros casos ilustrativos, el sistema de transferencia de genes comprende un transposón Bombyx mori como se definió anteriormente en combinación con una proteína transposasa Bombyx mori (o ácido nucleico que codifica la proteína transposasa Bombyx mori para proporcionar su actividad en una célula). En otras modalidades, el sistema de transferencia de genes comprende un transposón de Xenopus tropicalis como se definió anteriormente en combinación con una proteína transposasa de Xenopus tropicalis (o ácido nucleico que codifica la proteína transposasa de Xenopus tropicalis para proporcionar su actividad en una célula). Esta combinación da como resultado preferentemente la inserción de la secuencia de ácido nucleico en el ADN de la célula. Alternativamente, es posible insertar el transposón de Bombyx mori o Xenopus tropicalis en el ADN de una célula mediante recombinación no homóloga a través de una variedad de mecanismos reproducibles, e incluso sin la actividad de una transposasa. En cualquier caso, el transposón descrito se puede utilizar para la transferencia de genes utilizando este sistema de transferencia de genes.
En determinadas modalidades, un vector de transferencia de genes comprende además una proteína de recombinación, por ejemplo, una recombinasa, una integrasa o una transposasa que incluye la transposasa de Xenopus tropicalis y dos o más sitios de reconocimiento de integración específicos del sitio para facilitar la integración de un casete de expresión en el genoma de un hospedero de expresión. En determinadas modalidades, estas secuencias que facilitan la integración incluyen un elemento de inserción específico de la secuencia objetivo 5'-TTAA-3'. En algunas otras modalidades, las secuencias que facilitan la integración incluyen un elemento de inserción específico de la secuencia objetivo 5'-TTAT-3'. En ciertas modalidades, las secuencias que facilitan la integración son reconocidas por una integrasa o una transposasa, en ciertos casos la integrasa es una integrasa de Bombyx mori, en otras modalidades la integrasa es una integrasa de Xenopus tropicalis. En determinadas modalidades, el vector de transferencia de genes comprende además un gen que codifica la integrasa. En determinadas modalidades, un vector de expresión comprende además LTR lentiviral (repeticiones largas de los extremos) o repeticiones invertidas (IR) para facilitar la integración de un casete de expresión en el genoma de un hospedero de expresión.
En algunas modalidades, un vector de transferencia de genes tiene sitios de endonucleasa de restricción en el casete de expresión entre el promotor y la secuencia del terminador que facilitan la clonación de polinucleótidos heterólogos para la inserción. En modalidades preferidas, estos sitios de endonucleasa de restricción son sitios de restricción de tipo II. Las endonucleasas de restricción de tipo II reconocen secuencias de ADN asimétricas y escinden ambas cadenas de ADN en posiciones fijas, normalmente varios pares de bases lejos de los sitios de reconocimiento. Esta propiedad hace que las endonucleasas de restricción de tipo II sean particularmente útiles para ensamblar fragmentos de ADN, donde los fragmentos con extremos generados de tipo II coincidentes se hibridan y ligan, dejando un producto de ADN ensamblado sin remanentes de secuencia de reconocimiento de restricción en las uniones de ligación. Las endonucleasas de restricción de tipo II que reconocen secuencias no palindrómicas de 5, 6 o 7 pares de bases, se encuentran a una frecuencia promedio de uno en 512 2048 u 8192 pares de bases, respectivamente. Por tanto, es relativamente fácil identificar las endonucleasas de restricción de tipo II que no cortan dentro de un fragmento de ADN del tamaño de un gen típico o un fragmento de ARNg.
Puede construirse un vector de transferencia de genes para permitir la clonación usando endonucleasas de restricción de tipo II y ligasa incorporando un relleno, que comprende un marcador de selección inversa y flanqueado por sitios de restricción de tipo II, en un vector que comprende un marcador de selección. Es ventajoso si los sitios de restricción de tipo II se eligen de tal manera que la escisión del vector de transferencia de genes con una o más enzimas de restricción de tipo II produzca un fragmento de ácido nucleico lineal que comprende un marcador de selección y con extremos que no son compatibles entre sí. Este diseño permite la inserción direccional de un fragmento de ADN de inserción que tiene extremos cohesivos compatibles con el fragmento de ácido nucleico lineal del vector de transferencia de genes. El fragmento de ADN de inserción puede prepararse hibridando un par de oligonucleótidos, o con mayor preferencia mediante amplificación por PCR y digestión de restricción. En casos preferidos, los extremos del vector de transferencia de genes tampoco son pseudocompatibles entre sí; es decir, no se hibridan entre sí formando al menos un par de bases Watson-Crick no estándar (es decir, T o U con G) de una manera que puedan unirse mediante una ADN ligasa con una eficacia razonable.
En ciertas modalidades preferidas, el sistema de transferencia de genes media la inserción del transposón de Xenopus tropicalis en el ADN de una variedad de tipos de células y una variedad de especies utilizando la proteína transposasa de Xenopus tropicalis. En ciertos casos, el sistema de transferencia de genes media la inserción del transposón Bombyx mori en el ADN de una variedad de tipos de células y una variedad de especies utilizando la proteína transposasa Bombyx mori. Preferentemente, tales células incluyen cualquier célula adecuada en el presente contexto, incluyendo, entre otras, células animales o células de bacterias, hongos (por ejemplo, levadura y más) o plantas. Las células animales preferidas pueden ser de vertebrados o invertebrados. Por ejemplo, las células de vertebrados preferidas incluyen células de mamíferos que incluyen, pero no se limitan a, roedores, como ratas o ratones, ungulados, como vacas o cabras, ovejas, cerdos o células de un ser humano. Las células objetivo también incluyen, sin limitarse a ellas, linfocitos, hepatocitos, células neurales, células musculares, una variedad de células sanguíneas y una variedad de células de un organismo, células madre embrionarias, células madre somáticas, por ejemplo, células hematopoyéticas, embriones, cigotos, células espermatozoides (algunas de las cuales están abiertas para ser manipuladas por un entorno in vitro).
En otras modalidades ilustrativas adicionales, tales células, particularmente las células derivadas de un mamífero como se definió anteriormente, pueden ser pluripotentes (es decir, una célula cuyos descendientes pueden diferenciarse en varios tipos de células restringidas, tales como células madre hematopoyéticas u otras células madre) y células totipotentes (es decir, una célula cuyos descendientes pueden convertirse en cualquier tipo de célula en un organismo, por ejemplo, células madre embrionarias). Estas células se utilizan ventajosamente para afirmar la expresión estable de la transposasa o para obtener un número múltiple de células ya transfectadas con los componentes del sistema de transferencia de genes. Además, las células tales como ovocitos, huevos y una o más células de un embrión también pueden considerarse como objetivos para la transfección estable con el presente sistema de transferencia de genes. En determinadas modalidades preferidas de la invención, las células son células de ovario de hámster chino (CHO) o células embrionarias de riñón humano (HEK293).
En otras determinadas modalidades ilustrativas, el ADN celular que actúa como receptor del transposón descrito en la presente descripción incluye cualquier ADN presente en una célula (como se mencionó anteriormente) para ser transfectado, si el transposón de Xenopus tropicalis está en contacto con una proteína transposasa de Xenopus tropicalis dentro la célula. En otros casos, el ADN celular que actúa como receptor del transposón descrito en la presente descripción incluye cualquier ADN presente en una célula (como se mencionó anteriormente) para ser transfectado, si el transposón Bombyx mori está en contacto con una proteína transposasa Bombyx mori dentro de la célula. Por ejemplo, el ADN puede ser parte del genoma celular o puede ser extracromosómico, como un episoma, un plásmido, un fragmento de ADN circular o lineal. Los objetivos típicos para la inserción son, por ejemplo, ADN de doble cadena.
Los componentes del sistema de transferencia de genes descritos en la presente descripción, que es la proteína transposasa de Bombyx mori o Xenopus tropicalis (ya sea como una proteína o codificada por un ácido nucleico como se describe en la presente descripción) y el transposón de Bombyx mori o Xenopus tropicalis, se pueden transfectar en una célula preferentemente en una célula como se definió anteriormente, y más preferentemente en la misma célula. La transfección de estos componentes puede ocurrir además en orden posterior o en paralelo. Por ejemplo, la proteína transposasa de Bombyx mori o Xenopus tropicalis o su ácido nucleico codificante puede transfectarse en una célula como se define anteriormente antes, simultáneamente o después de la transfección del transposón Bombyx mori o Xenopus tropicalis. Alternativamente, el transposón se puede transfectar en una célula como se definió anteriormente antes, simultáneamente o después de la transfección de la proteína transposasa de Bombyx mori o Xenopus tropicalis o su ácido nucleico codificante. Si se transfecta en paralelo, preferentemente ambos componentes se proporcionan en una formulación separada y/o se mezclan entre sí directamente antes del suministro para evitar la transposición antes de la transfección. Además, el suministro de al menos un componente del sistema de transferencia de genes puede ocurrir repetidamente, por ejemplo, suministrando al menos una, dos o múltiples dosis de este componente.
Para cualquiera de las reacciones de transfección anteriores, el sistema de transferencia de genes puede formularse de una manera adecuada como se conoce en la técnica, o como una composición farmacéutica o kit como se describe en la presente descripción. En modalidades preferidas adicionales, los componentes del sistema de transferencia de genes se pueden transfectar preferentemente en una o más células mediante técnicas como bombardeo de partículas, electroporación, microinyección, combinación de los componentes con vesículas que contienen lípidos, como vesículas lipídicas catiónicas, reactivos de condensación de ADN (por ejemplo, fosfato cálcico, polilisina o polietilenimina) e insertar los componentes (es decir, los ácidos nucleicos del mismo en un vector viral y poner en contacto el vector viral con la célula). Cuando se usa un vector viral, el vector viral puede incluir cualquiera de una variedad de vectores virales conocidos en la técnica, incluyendo los vectores virales seleccionados del grupo que consiste en un vector retroviral, un vector de adenovirus o un vector viral adenoasociado.
En otra modalidad, el ácido nucleico que codifica la proteína transposasa de Xenopus tropicalis puede ser ARN o ADN. De manera similar, el ácido nucleico que codifica la proteína transposasa de Xenopus tropicalis o el transposón de esta invención se pueden transfectar en la célula como un fragmento lineal o como un fragmento circularizado, preferentemente como un plásmido o como ADN viral recombinante. En otro caso, el ácido nucleico que codifica la proteína transposasa de Bombyx mori puede ser ARN o ADN. De manera similar, el ácido nucleico que codifica la proteína transposasa de Bombyx mori o el transposón de esta descripción se pueden transfectar en la célula como un fragmento lineal o como un fragmento circularizado, preferentemente como un plásmido o como ADN viral recombinante.
En otra modalidad, el ácido nucleico que codifica la proteína transposasa de Xenopus tropicalis se inserta preferentemente de manera estable o transitoria en el genoma de la célula para facilitar la expresión temporal o prolongada de la proteína transposasa de Xenopus tropicalis en la célula. En otro caso, el ácido nucleico que codifica la proteína transposasa de Bombyx mori se inserta preferentemente de manera estable o transitoria en el genoma de la célula para facilitar la expresión temporal o prolongada de la proteína transposasa de Bombyx mori en la célula.
3.2.5 Aumentar la expresión por selección
Las secuencias que están integradas en regiones del genoma que son altamente activas transcripcionalmente pueden resultar en altos niveles de expresión de genes codificados. Además, o alternativamente, las secuencias que se integran en el genoma en múltiples copias pueden dar como resultado altos niveles de expresión de genes codificados.
Se conocen en la técnica métodos para aumentar la expresión de un primer polipéptido codificado por una construcción (el polipéptido de expresión) intentando unir la expresión del primer polipéptido a la expresión de un segundo polipéptido de selección cuantitativa. Por ejemplo, la glutamina sintasa (GS) se utiliza como marcador de selección que permite la selección mediante el metabolismo de la glutamina. La glutamina sintasa es la enzima responsable de la biosíntesis de glutamina a partir del glutamato y el amoniaco, y es un componente crucial de la única vía de formación de glutamina en una célula de mamífero. En ausencia de glutamina en el medio de crecimiento, la enzima GS es esencial para la sobrevivencia de las células de mamíferos en cultivo. Algunas líneas celulares, por ejemplo, las células de mieloma de ratón no expresan suficiente GS para sobrevivir sin glutamina añadida. En estas células, una GS transfectada puede funcionar como un marcador de selección permitiendo el crecimiento en un medio libre de glutamina. En otras líneas celulares, por ejemplo, las células de ovario de hámster chino (CHO) expresan suficiente GS para sobrevivir sin glutamina añadida de forma exógena. Estas líneas celulares pueden manipularse mediante técnicas de edición del genoma que incluyen CRISPR/Cas9 para reducir o eliminar la actividad de la enzima GS. En todos estos casos, los inhibidores de GS como la metionina sulfoximina (MSX) se pueden usar para inhibir la actividad de GS endógena de una célula. Los protocolos de selección conocidos en la técnica incluyen introducir una construcción que comprende secuencias que codifican un primer polipéptido y un marcador de selección de glutamina sintasa, y luego tratar la célula con inhibidores de glutamina sintasa como metionina sulfoximina. Mientras más altos sean los niveles de metionina sulfoximina que se utilizan, mayor será el nivel de expresión de glutamina sintasa que se requiere para permitir que la célula sintetice suficiente glutamina para sobrevivir. Algunas de estas células también mostrarán una expresión aumentada del primer polipéptido.
Un segundo sistema para aumentar la expresión por selección utiliza la enzima dihidrofolato reductasa (DHFR) que se requiere para catalizar la reducción de 5,6-dihidrofolato (DHF) a 5,6,7,8-tetrahidrofolato (THF) y se utiliza como marcador de selección. La DHFR confiere resistencia al metotrexato (MTX). La DHFR puede inhibirse por niveles más altos de metotrexato. Los protocolos de selección conocidos en la técnica incluyen introducir una construcción que comprende secuencias que codifican un primer polipéptido y un marcador de selección de DHFR en una célula, y luego tratar la célula con inhibidores de DHFR tales como metotrexato. Mientras más altos sean los niveles de metotrexato que se utilizan, mayor será el nivel de expresión de DHFR que se requiere para permitir que la célula sintetice suficiente DHFR para sobrevivir. Algunas de estas células también mostrarán una expresión aumentada del primer polipéptido.
El uso de transposones y transposasas junto con tales marcadores de selección tiene varias ventajas cuantitativamente con respecto a las construcciones sin transposones. Una es que el enlace entre la expresión del primer polipéptido y el marcador de selección cuantitativa es mejor para los transposones, porque una transposasa integrará la secuencia completa que se encuentra entre los dos extremos del transposón en el genoma. Por el contrario, cuando se introduce ADN heterólogo en el núcleo de una célula eucariota, por ejemplo, una célula de mamífero se rompe gradualmente en fragmentos aleatorios que pueden integrarse en el genoma de la célula o degradarse. Por tanto, si una construcción que comprende secuencias que codifican un primer polipéptido y un marcador de selección cuantitativa se introduce en una población de células, algunas células integrarán las secuencias que codifican el marcador de selección cuantitativa pero no las que codifican el primer polipéptido, y viceversa. La selección de células que expresan altos niveles de marcador de selección, por tanto, está correlacionada sólo algo con células que también expresan altos niveles del primer polipéptido. Por el contrario, debido a que la transposasa integra todas las secuencias entre los extremos del transposón, es muy probable que las células que expresan altos niveles de marcador de selección también expresen altos niveles del primer polipéptido.
Una segunda ventaja de los transposones y transposasas es que son mucho más eficientes en la integración de secuencias de ADN en el genoma. Por tanto, es probable que una fracción mucho mayor de la población celular reciba una o más copias de la construcción en sus genomas, por lo que habrá una probabilidad correspondientemente mayor de una buena expresión estable tanto del marcador de selección como del primer polipéptido.
Por tanto, una modalidad de la presente invención es un transposón como el descrito anteriormente, que además comprende una secuencia que codifica un primer polipéptido y un marcador de selección que puede inhibirse mediante un inhibidor de molécula pequeña. En una modalidad, el primer polipéptido es parte de un anticuerpo. Otros aspectos de la invención incluyen métodos para introducir el transposón en el genoma de una célula usando una transposasa y seleccionar altos niveles de expresión del marcador de selección cuantitativa. En algunas modalidades, el marcador de selección es glutamina sintasa, en algunas modalidades el marcador de selección es DHFR.
Las transposasas de ADN utilizan un mecanismo de cortar y pegar para insertar su transposón en una molécula de ADN. El número de copias de un transposón que pueden integrarse en el genoma mediante una transposasa está, por tanto, limitado por el número de copias del transposón que están presentes en la célula. El número de copias nucleares no integradas de un plásmido en una célula eucariota puede incrementarse si contiene secuencias de replicación viral. Por ejemplo, en células de mamíferos incluyendo células CHO y células HEK, el origen de replicación de SV40 provoca aumentos en el número de copias de un plásmido, especialmente en presencia del antígeno T grande de SV40. De manera similar, el origen de replicación del virus de Epstein-Barr (OriP) provoca aumentos en el número de copias de un plásmido, especialmente en presencia del antígeno nuclear 1 del virus de Epstein-Barr (EBNA) y sus derivados truncados. Los plásmidos que comprenden un transposón además de las secuencias de replicación viral como el origen de replicación de SV40 o el virus de Epstein-Barr OriP que no están contenidos dentro de la porción transponible del transposón, por lo tanto, se acumularán dentro del núcleo, proporcionando más copias de sustrato del transposón a integrarse en el genoma celular. Dichos plásmidos son un aspecto de la presente invención. El uso de tales plásmidos para aumentar el número de copias de un transposón que se integra en el genoma de una célula objetivo también es un aspecto de la presente invención. Estos plásmidos pueden comprender además secuencias que codifican el antígeno T grande de SV40 o el antígeno nuclear 1 del virus de Epstein-Barr (EBNA).
Los plásmidos que comprenden secuencias de replicación viral y transposones pueden introducirse en las células junto con la transposasa o pueden introducirse secuencialmente. Puede seleccionarse un mayor número de transposones integrados usando marcadores de selección cuantitativa tales como DHFR o glutamina sintasa.
5.2.6 Componentes del vector de transferencia genética
La función de los elementos de la secuencia depende del contexto en relación con las otras secuencias dentro de la secuencia de ADN. Un ejemplo de la presente descripción proporciona un método para construir un conjunto de variantes de vector de transferencia de genes para mejorar una propiedad de expresión de un polinucleótido que codifica un polipéptido. En algunos casos, la propiedad de expresión es una cantidad del polipéptido expresado, en algunos casos la propiedad de expresión es una cantidad de polipéptido soluble expresado, en algunos casos la propiedad de expresión es una cantidad de polipéptido activo expresado. En el método, se identifican una pluralidad de elementos de secuencia en un vector de transferencia de genes. La pluralidad de elementos se clasifica por agrupación funcional, por ejemplo, los elementos se clasifican como potenciadores, promotores, intrones, regiones no traducibles 5', regiones no traducibles 3', elementos promotores de la exportación de ARN, elementos que modulan la estructura de la cromatina, señales de poliadenilación o terminadores transcripcionales. Además, si el vector de transferencia de genes expresa más de un gen, los elementos se agrupan de acuerdo con el gen al que están unido operativamente. Se selecciona un primer conjunto de variantes del vector de transferencia de genes que comprende una pluralidad de configuraciones del vector de transferencia de genes, de modo que los miembros del conjunto de vectores de transferencia de genes estén relacionados entre sí mediante la sustitución de uno o más elementos de secuencia, con un elemento diferente mismo grupo funcional, o por la eliminación completa de un elemento de ese grupo funcional. Por ejemplo, un segundo miembro del conjunto de vectores polinucleotídicos puede tener la misma configuración que un primer miembro, pero con un primer elemento potenciador reemplazado por un segundo elemento potenciador, o un segundo miembro del conjunto de vectores polinucleotídicos puede tener la misma configuración que un primer elemento miembro, pero carece de un elemento potenciador. Un grupo funcional en el que hay más de un elemento posible en el conjunto de variantes del vector de transferencia de genes se denomina grupo de variantes.
A continuación, se calcula el número de grupos de variantes y el número de elementos que se pueden ensayar en cada una de esas posiciones de grupo, de modo que cada elemento estará presente en una fracción estadísticamente representativa del primer conjunto de variantes del vector de transferencia de genes. Además, cuando se utilizan métodos de búsqueda como Tabu, optimización Ant o técnicas similares, el espacio se puede buscar secuencia por secuencia utilizando una memoria del espacio que se ha visitado anteriormente y las propiedades encontradas.
En algunos casos, la selección del conjunto de variantes comprende la aplicación de un diseño factorial completo, un diseño factorial de 2k, un diseño factorial fraccional de 2k, un enfoque de cuadrados latinos, un enfoque de cuadrados grecolatinos, un diseño de Plackett-Burmann, un diseño de Taguchi, un algoritmo de monte carlo, un algoritmo genético, combinaciones de los mismos o algún otro método estadístico para el diseño de experimentos, a la distribución de elementos en el conjunto de variantes del vector de transferencia de genes.
Se construye un primer conjunto de expresión, que comprende un primer polinucleótido de expresión en todo o en una parte del primer conjunto de variantes del vector de transferencia de genes. Se mide una propiedad de expresión del primer conjunto de expresiones. En algunos casos, el polinucleótido de expresión codifica un primer polipéptido, y la propiedad de expresión es una cantidad del polipéptido expresada, o una cantidad de polipéptido soluble expresada, o una cantidad de polipéptido activo expresada. En algunos casos, el primer polinucleótido de expresión es la misma secuencia en todas las secuencias del primer conjunto de expresión.
En algunos casos de la presente descripción, la propiedad de expresión se mide en uno de los siguientes sistemas de expresión: sistemas de expresión bacterianos que incluyen Escherichia coli, especies de Salmonella, especies de Bacillus, especies de Streptomyces, especies de Pseudomonas, Ralstonia eutropha, especies de Chlamydomonas; sistemas de expresión de levadura que incluyen especies de Saccharomyces, Pichia, Klebsiella y Candida, Saccharomyces cerevisiae, Pichia pastoris, Pichia methanolica, Klebsiella lactis; sistemas de expresión fúngica que incluyen especies de Cryptosporidium y Trichoderma, sistemas de producción de proteínas fúngicas filamentosas, sistemas de expresión de protozoos que incluyen Plasmodium falciparum (el agente causante de la malaria), organismos modelo de Leishmania que incluyen Caenorhabditis elegans, Drosophila melanogaster, Xenopus laevis; plantas que incluyen soja, frijol arbustivo, maíz, algodón, tabaco, Arabidopsis, sistemas de expresión de cultivo de tejidos que incluyen células COS, células de ovario de hámster chino y fibroblastos que incluyen células 3T3, líneas celulares infectadas con adenovirus, líneas celulares de insectos como las derivadas de especies de Spodptera para cultivo baculovirus; organismos modelo para el estudio de enfermedades y pruebas de eficacia de vacunas de ADN tales como macacos, ratones, ratas, cobayas, ovejas, cabras y conejos; sistemas de expresión in vitro preparados a partir de extractos de células vivas que incluyen extractos de E. coli, extractos de germen de trigo, lisados de reticulocitos de conejo; sistemas de expresión in vitro preparados mediante ensamblaje de componentes individuales purificados.
Se pueden utilizar técnicas estándar para medir el valor de la propiedad de expresión para cada polinucleótido respectivo en la pluralidad de polinucleótidos del primer conjunto de expresión. Por ejemplo, se pueden emplear técnicas estándar usando, por ejemplo, inmunoensayos tales como, por ejemplo, transferencia tipo Western, inmunoprecipitación seguida de electroforesis en gel de poliacrilamida con dodecilsulfato de sodio (SDS-PAGE), inmunocitoquímica y similares para determinar un valor de propiedad de expresión de un polinucleótido respectivo (por ejemplo, un cantidad de una proteína codificada por el polinucleótido respectivo) en la pluralidad de polinucleótidos presentes en un sistema de expresión. Otros métodos para la detección de polipéptidos específicos incluyen espectroscopia de masas y espectroscopia de masas de muestras de proteínas que se han tratado con una o más proteasas específicas de sitio para producir fragmentos de polipéptidos que pueden identificarse de forma única mediante espectroscopia de masas. Un agente ilustrativo para detectar una proteína de interés es un anticuerpo capaz de unirse específicamente a una proteína de interés, preferentemente un anticuerpo marcado de forma detectable ya sea directa o indirectamente.
Una de las formas en que un anticuerpo específico para una proteína de interés se puede marcar de forma detectable es uniéndolo a una enzima y utilizándolo en un inmunoensayo enzimático (EIA) (Voller, 1978, "The Enzyme Linked Immunosorbent Assay (ELISA)", Diagnostic Horizons 2:1-7, publicación trimestral de Microbiological Associates, Walkersville, MD; Voller y otros, 1978, J. Clin. Pathol. 31: 507-520; Butler, JE, 198 1, Meth. Enzymol. 73: 482-523; Maggio (edición), 198 0, Enzyme Immunoassay, CRC Press, Boca Ratón, FL; Ishikawa y otros, (Editorial) 1981, Enzyme Immunoassay, Kgaku Shoin, Tokio). La enzima que está unida al anticuerpo reaccionará con un sustrato apropiado, preferentemente un sustrato cromogénico, de tal manera que produzca una porción química que se pueda detectar, por ejemplo, por medios espectrofotométricos, fluorimétricos o visuales. Las enzimas que pueden usarse para marcar de manera detectable el anticuerpo incluyen, pero no se limitan a, malato deshidrogenasa, nucleasa estafilocócica, delta-5-esteroide isomerasa, alcohol de levadura deshidrogenasa, alfa-glicerofosfato, deshidrogenasa, triosa fosfato isomerasa, peroxidasa de rábano picante, fosfatasa alcalina., asparaginasa, glucosa oxidasa, betagalactosidasa, ribonucleasa, ureasa, catalasa, glucosa-6-fosfato deshidrogenasa, glucoamilasa y acetilcolinesterasa. La detección se puede realizar mediante métodos colorimétricos que emplean un sustrato cromogénico para la enzima. La detección también se puede lograr mediante la comparación visual del grado de reacción enzimática de un sustrato en comparación con patrones preparados de manera similar.
El método de variación sistemática de los elementos del vector y el análisis de la expresión es conceptualmente bastante diferente de los métodos anteriores descritos en la técnica, y es un ejemplo de la presente descripción. Estos métodos anteriores han utilizado un número muy pequeño de diferentes configuraciones de vector y correlaciones anecdóticas entre los vectores y las propiedades de expresión para derivar reglas para un diseño vectorial óptimo. Es muy poco probable que tales datos proporcionen una base desde la cual modelar con precisión los efectos de las elecciones de elementos dentro del vector sobre la expresión. Esto se debe a que no ha habido una variación sistemática de los elementos de vector y a que los elementos interactúan con frecuencia, de modo que sin un diseño sistemático en el que se minimice la covariación de elementos, es imposible atribuir un efecto a un elemento en particular. Por el contrario, el método de la presente descripción se puede realizar sin suposiciones con respecto a las preferencias de elementos del anfitrión de expresión, o el mecanismo subyacente de dicha preferencia. En cambio, el sistema de expresión se interroga con conjuntos de secuencias y mediciones sistemáticamente variados de las propiedades de la expresión para determinar las configuraciones de los elementos que dan como resultado las propiedades de expresión deseadas. Este método puede aplicarse a cualquier sistema de expresión; así como para identificar una configuración óptima para una alta expresión en múltiples sistemas si un vector de transferencia de genes se va a utilizar en diferentes sistemas.
Una propiedad de expresión de cada uno de los polinucleótidos en la pluralidad de polinucleótidos del primer conjunto de expresión se puede comparar con la configuración del elemento en cada uno de los polinucleótidos para determinar una relación entre la configuración del elemento y la propiedad de expresión. Esta correlación también se puede lograr utilizando métodos de clasificación de patrones o métodos estadísticos. Ejemplos de métodos de clasificación de patrones o métodos estadísticos incluyen, pero no se limitan a, regresión lineal, regresión no lineal, regresión logística, análisis de datos multivariados, clasificación usando un árbol de regresión, proyección de mínimos cuadrados parciales a variables latentes, cálculo de una red neuronal, cálculo de un modelo bayesiano, cálculo de un modelo aditivo generalizado, uso de una máquina de vectores de soporte o modelado que comprende refuerzo o refuerzo adaptativo. Véase, por ejemplo, Duda y otros, 200 1, Pattern Classification, Segunda edición, John Wiley & Sons, Inc., Nueva York; Hastie, 200 3, The Elements of Statistical Learning, Springer, Nueva York; y Agresti 1996, An Introduction to Categorical Data Analysis, John Wiley & Sons, Nueva York. Este modelado o correlación se puede utilizar para asignar valores a los diferentes elementos del sistema de expresión. El diseño y síntesis de un conjunto de variantes de vector de transferencia de genes y la medición de una propiedad de expresión de los polinucleótidos dentro de un conjunto de variantes de vector de transferencia de genes con el fin de evaluar diferentes elecciones de elementos de vector dentro de un sistema de expresión es un ejemplo de la presente descripción.
En algunos casos, el método comprende además las etapas de (i) modelar una relación secuencia-actividad entre (a) una o más sustituciones en uno o más elementos en el conjunto de variantes del vector de transferencia de genes y (b) la propiedad de expresión medida para todos o la parte de las variantes en el conjunto de variantes, y (ii) definir un segundo conjunto de variantes de transferencia de genes para comprender variantes que incluyen sustituciones en la pluralidad de elementos que se seleccionan en función de la relación secuencia-actividad. En algunos casos, el modelado de una relación secuencia-actividad comprende modelar una pluralidad de relaciones secuencia-actividad, cada una de las cuales usa solo un subconjunto de los datos de secuencia y actividad disponibles.
Existen varios métodos para la regresión de datos multivariados, donde se determinan las relaciones predictivas entre algunas o todas las variables independientes y el nivel de expresión. Ejemplos de tales métodos son Partial Least Squares (PLS) y Main Components Regression (PCR) (Wold y otros, 1993, "DNA and peptide sequences and chemical processes multivariately modeled by principal component analysis and partial least-squares projections to latent structures," Analytica Chimica Acta 277, 239-253. p Ls algoritmos, por ejemplo, tratar de maximizar la correlación de los X-datos (por ejemplo, las frecuencias de codones) y la expresión al mismo tiempo maximizar la varianza-datos X capturado en el modelo. Al hacerlo, el algoritmo determina nuevas variables ortogonales, llamadas variables latentes, que son combinaciones lineales de las variables originales que capturan mejor los datos X y explican la variación de Y.
En algunos casos, la relación secuencia-expresión tiene la forma:
Y = f(W]X], W 2X2,...W ¡Xj)
en donde
Y es una medida cuantitativa de la propiedad de expresión;
xi es un descriptor de una sustitución, una combinación de sustituciones, o un componente de una o más sustituciones, en una o más posiciones en la pluralidad de posiciones;
Wi es un peso aplicado al descriptor Xi; y
f() es una función matemática.
En algunos casos, el modelado comprende la regresión:
Figure imgf000030_0001
En algunos casos, esta regresión comprende regresión lineal, regresión no lineal, regresión logística o proyección de mínimos cuadrados parciales a variables latentes.
Puede usarse una relación secuencia-expresión derivada de las propiedades de expresión de un primer conjunto de variantes de expresión para diseñar vectores de transferencia de genes para expresar un segundo polipéptido con una secuencia de aminoácidos diferente. El uso de una relación secuencia-expresión para diseñar vectores para la expresión de un polipéptido de interés, donde la relación secuencia-expresión se derivó de polinucleótidos que codifican polipéptidos que no son el polipéptido de interés es un ejemplo de la presente descripción.
En algunos casos, se utilizan técnicas de modelado para derivar relaciones secuencia-expresión. Tales técnicas de modelado incluyen enfoques lineales y no lineales. Los enfoques lineales y no lineales se diferencian entre sí en función de las relaciones algebraicas utilizadas entre las variables y las respuestas en dichos enfoques. En el sistema que se está modelando, los datos de entrada (por ejemplo, variables que sirven como descriptores de la secuencia del biopolímero), a su vez, pueden relacionarse linealmente con las variables proporcionadas o combinaciones no lineales de las variables. Por lo tanto, es posible realizar diferentes combinaciones de modelos y tipos de datos: las variables de entrada lineales se pueden incorporar en un modelo lineal, las variables de entrada no lineales se pueden incorporar en un modelo lineal y las variables no lineales se pueden incorporar en un modelo no lineal.
En algunos casos, se utilizan técnicas de aprendizaje supervisado para identificar relaciones entre configuraciones de elementos de vector en el conjunto de expresiones y propiedades de expresión medidas. Tales técnicas de aprendizaje supervisado incluyen, pero no se limitan a, modelado bayesiano, técnicas no paramétricas (por ejemplo, ventanas Parzen, algoritmos kn-Nearest-Neighbor y clasificación difusa), redes neuronales (por ejemplo, red hopfield, redes neuronales multicapa y máquinas de soporte de vector) y algoritmos de aprendizaje automático (por ejemplo, aprendizaje automático independiente de algoritmos). Véase, por ejemplo, Duda y otros, Pattern Classification, 2da edición, 200 1, John Wiley & Sons, Inc. Nueva York; y Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, segunda impresión revisada, 1988, Morgan Kaufmann, San Francisco. Por ejemplo, los datos de expresión de la secuencia se pueden usar para predecir la propiedad de expresión de cualquier secuencia dados los descriptores de codones para una secuencia usando una red neuronal. La entrada para la red son los descriptores y la salida es el valor predicho de Y. Los pesos y la función de activación se pueden entrenar usando reglas de aprendizaje basadas en decisiones supervisadas. El aprendizaje se realiza en un subconjunto de variantes denominado conjunto de entrenamiento y el desempeño de la red se evalúa en un conjunto de prueba.
En algunos casos, se utilizan técnicas de aprendizaje no supervisadas para identificar relaciones entre configuraciones de elementos de vector en el conjunto de expresiones y propiedades de expresión medidas. Tales técnicas de aprendizaje no supervisadas incluyen, entre otras, búsquedas estocásticas (por ejemplo, hibridación simulada, aprendizaje de Boltzmann, métodos evolutivos, análisis de componentes principales y métodos de agrupamiento). Véase, por ejemplo, Duda y otros, Pattern Classification, 2da edición, 200 1, John Wiley & Sons, Inc. Nueva York. Por ejemplo, los pesos en la ecuación B se pueden ajustar usando monte carlo y algoritmos genéticos. La optimización de ponderaciones para funciones no lineales puede ser complicada y ningún método analítico simple puede proporcionar una buena solución en forma cerrada. Los algoritmos genéticos se han utilizado con éxito en espacios de búsqueda de tal magnitud. También se pueden utilizar algoritmos genéticos y técnicas de programación genética para optimizar la forma de la función para que se ajuste mejor a los datos. Por ejemplo, se pueden aplicar muchas recombinaciones de formas funcionales aplicadas a los descriptores de las variantes de secuencia.
En algunos casos, se utilizan técnicas de refuerzo para construir y/o mejorar modelos desarrollados utilizando cualquiera de las otras técnicas descritas en la presente descripción. Un modelo de la relación secuencia-expresión puede describirse como una forma funcional cuyos parámetros han sido entrenados para los datos de entrada (Y y xi). Se han descrito muchos algoritmos/técnicas para construir modelos. Los algoritmos aplicados a un conjunto de datos específico pueden ser débiles en el sentido de que las predicciones pueden ser menos precisas o "débiles" (produciendo modelos deficientes). Los modelos se pueden mejorar utilizando técnicas de refuerzo. Véase, por ejemplo, Hastie y otros, The Elements of Statistical Learning, 200 1, Springer, Nueva York. El propósito de impulsar es combinar los resultados de muchos predictores "débiles" en un "comité" poderoso. En un caso de la presente descripción, el refuerzo se aplica utilizando el algoritmo AdaBoost. Aquí, el algoritmo de predicción se aplica secuencialmente a versiones modificadas repetidamente de los datos produciendo así una secuencia de modelos. Las predicciones de todos estos modelos se combinan mediante un voto mayoritario ponderado para producir la predicción final. La modificación de datos en cada etapa consiste en aplicar pesos (Wbi) a cada una de las i observaciones de entrenamiento. Inicialmente, los pesos se establecen en 1/N, donde N es el número de observación de entrenamiento (datos de secuencia-actividad). Los pesos se modifican individualmente en cada iteración sucesiva. Las observaciones de entrenamiento que fueron predichas mal por un modelo particular tienen su peso aumentado y las observaciones de entrenamiento que fueron predichas con mayor precisión tienen su peso disminuido. Esto obliga a cada modelo sucesivo a concentrarse en las observaciones de entrenamiento emitidas por el modelo anterior. La etapa de combinar los modelos para producir un "comité" asigna un peso a cada modelo en función del error de predicción general de ese modelo.
Las diversas técnicas y algoritmos de modelado descritos en la presente descripción pueden adaptarse para derivar relaciones entre una o más propiedades de expresión y la configuración de elementos de un polinucleótido y, por lo tanto, para realizar múltiples predicciones a partir del mismo modelo. Las técnicas de modelado que se han adaptado para derivar relaciones secuencia-expresión de polinucleótidos están dentro del alcance de la presente descripción. Algunos de estos métodos derivan relaciones lineales (por ejemplo, proyección de mínimos cuadrados parciales a estructuras latentes) y otros derivan relaciones no lineales (por ejemplo, redes neuronales). Los algoritmos que están especializados para las asociaciones de minería en los datos también son útiles para diseñar secuencias que se utilizarán en la próxima iteración de la exploración espacial de secuencias. Estas técnicas de modelado pueden abordar de manera sólida el ruido experimental en la actividad medida para cada variante. A menudo, los experimentos se realizan en réplicas y para cada variante habrá múltiples mediciones de la misma actividad. Estas múltiples medidas (valores replicados) se pueden promediar y tratar como un solo número para cada variante mientras se modela la relación secuencia-expresión. La media puede ser una media simple u otra forma de media, como una media geométrica o armónica. En el caso de múltiples mediciones, se pueden eliminar los valores atípicos. Además, la estimación del error para un modelo derivado utilizando cualquier algoritmo descrito en la presente descripción puede incorporar las múltiples mediciones mediante el cálculo de la desviación estándar de la medición y la comparación de la actividad predicha del modelo con el promedio y estimar el intervalo de confianza dentro del cual se encuentra la predicción. Las ponderaciones de las observaciones que se utilizarán en los modelos también se pueden derivar de la precisión de la medición, por ejemplo, mediante la estimación de la desviación estándar y los intervalos de confianza. Este procedimiento puede poner menos énfasis en variantes cuyas medidas no son precisas. Alternativamente, estos valores replicados se pueden tratar de forma independiente. Esto resultará en la duplicación de secuencias en el conjunto de datos. Por ejemplo, si la variante de secuencia, representada por los valores del descriptor {xj}i 1, se ha medido por triplicado (Yi1, Yi2, Yi3, el conjunto de entrenamiento para el modelado incluirá el valor del descriptor {xj}i2 con la actividad Yi2 y {xj}i3 con actividad Yi3 además de {xj}i1 con actividad Yi 1, donde {xj}i1 = {xj}i2 = {xj}i3.
Los modelos desarrollados utilizando varios algoritmos y métodos en la etapa anterior pueden evaluarse mediante métodos de validación cruzada. Por ejemplo, dejar datos al azar para construir un modelo y hacer predicciones de datos no incorporados en el modelo es una técnica estándar para la validación cruzada. En algunos casos, los datos se pueden generar durante un período de meses. Los datos se pueden agregar de forma incremental al procedimiento de modelado a medida que dichos datos estén disponibles. Esto puede permitir la validación del modelo con conjuntos de datos parciales o adicionales, así como predicciones de las propiedades de las configuraciones del vector de transferencia de genes para las que aún no se dispone de actividades. Esta información se puede utilizar para validar el modelo.
En un caso de la presente descripción, se pueden obtener valores promedio y desviaciones estándar para funciones de peso omitiendo una parte de los datos disponibles. Pueden omitirse las secuencias individuales y sus actividades de expresión asociadas o los codones individuales. A continuación, se puede construir una relación secuenciaexpresión a partir de estos datos parciales. Este proceso se puede repetir muchas veces, cada vez que los datos a omitir se seleccionan al azar. Finalmente, se calcula un promedio e intervalo de valores para cada función de peso. Las funciones de peso también se pueden clasificar en orden de importancia para la actividad. El intervalo de valores para cada peso puede proporcionar una medida de la confianza con la que se asigna el peso. También puede proporcionar una medida de la importancia de la variable para determinar la propiedad de expresión. Por ejemplo, en algunos casos, cuanto mayor sea la desviación estándar de una ponderación variable, mayor será el intervalo de valores de esa variable asociados con las propiedades de expresión deseables.
En algunos casos, el valor medio de la ponderación variable se utiliza para indicar la posible contribución del elemento o combinación de elementos al desempeño del vector. En algunos casos, el valor medio de la variable ponderación menos la desviación estándar de la ponderación se utiliza para indicar la posible contribución del elemento o combinación de elementos al desempeño del vector. En algunos casos, se selecciona un elemento o combinación de elementos si el valor medio del peso variable está por encima de un valor predeterminado. En algunos casos, se selecciona un elemento o combinación de elementos si el valor medio del peso menos la desviación estándar del peso está por encima de un valor predeterminado. En algunos casos, el valor predeterminado es el valor medio de todos los pesos variables en el modelo. En algunos casos, el valor predeterminado es mayor que el valor del 95 % de los pesos variables; en algunos casos, el valor predeterminado es mayor que el valor del 90 % de los pesos variables; en algunos casos, el valor predeterminado es mayor que el valor del 80% de los pesos variables; en algunos casos, el valor predeterminado es mayor que el valor del 50 % de los pesos variables.
En algunos casos, el modelado comprende una regresión de mínimos cuadrados parciales y el peso es un vector de regresión. El vector de regresión para cada variable se usa para identificar los elementos que son más favorables para la expresión en un sistema. En algunos casos, se selecciona un elemento si su vector de regresión es el más alto en el conjunto de elementos, o si tiene uno de los 2 primeros, 3 superiores, 4 superiores, 5 superiores, 6 superiores, 7 superiores, 8 superiores, 9 superiores o 10 valores principales para vectores de regresión.
El conjunto inicial de datos puede ser pequeño, por lo que los modelos creados a partir de él pueden ser inexactos. Mejorar aún más la relación modelada depende de obtener mejores valores para las ponderaciones cuyas puntuaciones de confianza son bajas. Para obtener estos datos, las variantes adicionales diseñadas proporcionarán datos adicionales útiles para establecer relaciones de secuencia-expresión más precisas.
En algunos casos, definir el segundo conjunto de variantes comprende añadir una o más variantes, cada una de las cuales tiene un elemento que no está presente en ninguno variante del primer conjunto de variantes. En algunos casos, definir el segundo conjunto de variantes comprende añadir una o más variantes, cada una de las cuales tiene un elemento cambiado en un grupo que no varía en ninguno variante del primer conjunto de variantes.
El modelado de secuencia-actividad requiere una cantidad adecuada de datos de variantes con composiciones de elementos distribuidas estadísticamente. En algunos casos, el primer conjunto de expresión comprende entre 5 y 200 vectores de transferencia de genes que difieren cada uno de los otros miembros del conjunto en al menos 1 elemento funcional, en casos preferidos el primer conjunto de expresión comprende al menos 10 vectores de transferencia de genes que difieren de los otros miembros del conjunto por al menos 2 elementos funcionales, en algunos casos el primer conjunto de expresión comprende entre 10 y 100 vectores de transferencia de genes que difieren cada uno de los otros miembros del conjunto por al menos 2 elementos funcionales, en algunos casos el primero el conjunto de expresión comprende entre 15 y 60 vectores de transferencia de genes, cada uno de los cuales se diferencia de los demás miembros del conjunto en al menos 2 elementos funcionales.
En las Tablas 15-18 se muestran ejemplos de tales conjuntos de vectores polinucleotídicos. Para dos o más grupos funcionales, el conjunto de vectores polinucleotídicos se construye con un primer polinucleótido codificante que codifica un primer polipéptido de expresión. En algunos casos, el primer polipéptido de expresión es una proteína fluorescente o una cadena de anticuerpos. Una propiedad de expresión se mide para todas o una parte de las variantes en el conjunto de variantes. Se modela una relación secuencia-actividad entre (i) una o más sustituciones en uno o más elementos del conjunto de vectores polinucleotídicos y (ii) la propiedad medida para todas o la porción de las variantes en el conjunto de variantes. El conjunto de variantes se redefine luego para comprender variantes que incluyen sustituciones en la pluralidad de elementos que se seleccionan en función de la relación secuencia-actividad. En casos preferidos el conjunto de variantes comprende entre 5 y 200 configuraciones de vector, en casos preferidos el conjunto de variantes comprende entre 10 y 100 configuraciones de vector, en casos preferidos el conjunto de variantes comprende entre 15 y 60 configuraciones de vector.
Las propiedades de un sistema biológico que incluye sistemas naturales y no naturales con respecto a cualquier propiedad medida depende de la interacción entre múltiples elementos de secuencia de ácido nucleico, que pueden estar ubicados en posiciones a lo largo del polinucleótido. La capacidad de diseñar racionalmente una construcción de ácido nucleico con una configuración óptima de elementos es ventajosa para diversas aplicaciones, como la síntesis de proteínas a través de la optimización de vectores, el desarrollo de líneas celulares y la ingeniería de cepas. La síntesis de proteínas es un proceso altamente dinámico y de múltiples etapas que juega un papel central en la biología sintética, la producción farmacéutica y otras aplicaciones en biotecnología. Esta importancia ha llevado al desarrollo de diversas partes o elementos de control genético capaces de modular y controlar con precisión varios aspectos de la expresión de proteínas. Esta capacidad no solo es esencial para la construcción exitosa de dispositivos biológicos sintéticos más complejos, sino que también proporciona las herramientas necesarias para ajustar su función a fin de mejorar el desempeño y la confiabilidad.
Se han desarrollado muchos tipos diferentes de partes capaces de controlar los aspectos transcripcionales y de traducción del proceso de síntesis de proteínas. A nivel transcripcional, se han creado bibliotecas de promotores que abarcan una amplia gama de niveles de expresión (Mey y otros, 200 7 BMC Biotechnology; Hartner y otros, 2008 Nucleic Acids Research) y se han realizado esfuerzos para comprender las posibles reglas que gobiernan la estructura promotora (Blount y otros, 2012 PLoS One 7; Blazeck y otros, 2013 Biotechnology Journal; Lubliner y otros, 2013 Nucleic Acids Research). A nivel de traducción, se han generado bibliotecas de sitios de unión de ribosomas (RBS) (Mutalik y otros, 2013 Nature Methods) y se han desarrollado algunos enfoques racionales (Salis y otros, 2009 Nature Biotechnology). Los modelos biofísicos de interacciones entre el ribosoma y el ARNm se han utilizado con éxito para predecir las fuerzas relativas de inicio del ribosoma y se han aplicado en un modo de ingeniería avanzada para sugerir posibles secuencias de RBS con la fuerza deseada (Salis y otros, 2009 Nature Biotechnology). Además de las RBS, se ha descubierto que la velocidad de traducción está fuertemente influenciada por el uso de codones sinónimos dentro del gen que se expresa. Se ha demostrado que los cambios en el uso de codones afectan fuertemente los niveles de expresión generales (Welch y otros, 2009 PLoS; Kudla y otros, 2009 Science), influyen en el plegamiento correcto de proteínas activas (Zhang y otros, 2009 Nature Structural y Biología Molecular), y para permitir respuestas dinámicas al estrés ambiental (Wohlgemuth y otros, 2013 Nucleic Acids Research).
Las configuraciones de vectores polinucleotídicos con propiedades de expresión mejoradas son un aspecto de la presente invención, incluyendo las configuraciones que se muestran en las Tablas 6-18.
En modalidades preferidas, un vector de transferencia de genes comprende elementos de expresión capaces de conducir una alta expresión de proteínas, por ejemplo, un potenciador de mamífero seleccionado entre el potenciador temprano inmediato de CMV (ver, por ejemplo, DQ000968.1 GI: 66276969; KF853603.1 GI: 576890587, el potenciador EF1a (ver, por ejemplo, J04617.1 GI: 181962, el potenciador de la proteína tardía principal adenoviral (ver, por ejemplo, JX173086.1 GI: 406679291, el potenciador SV40 (ver por ejemplo, KM486843.1 GI: 731516977; JQ394984.1 GI: 41058488; un promotor seleccionado entre el promotor EF1a (ver, por ejemplo, J04617.1 GI: 181962; AC097023.6 GI: 49615137; n M_010106.2 GI: 126032328; AY188 393.1 GI: 30313796 de cualquier especie de mamífero o ave, incluyendo pero no limitado a humanos, ratas, ratones, pollos y hámsteres chinos, el promotor de CMV (ver, por ejemplo, d Q000968.1 GI: 66276969; M64943.1 GI: 330637, el promotor de GAPDH (ver, por ejemplo, J04038.1 GI: 182980) de cualquier especie de mamífero, el promotor de timidina quinasa del virus del herpes simple (HSV-TK) (ver, por ejemplo, J04327.1 GI: 330219, el promotor de actina (ver por ejemplo, X00182.1 GI: 63017 de cualquier mamífero o especies de aves que incluyen pero no se limitan a humanos, ratas, ratones, pollos y hámsteres chinos, y el promotor de ubiquitina (véase, por ejemplo, BC000379.2 GI: 33875368; un intrón seleccionado entre el intrón A de CMV (ver, por ejemplo, M21295.1 GI: 330620, el intrón B de CMV (ver, por ejemplo, M21295.1 GI: 330620, el intrón C de Cm V (ver, por ejemplo, M21295.1 GI: 330620, el intrón EF1a (véase, por ejemplo, J04617.1 GI: 181962 de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámster chino, el intrón de actina (véase, por ejemplo, X00182.1 GI: 63017 de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos, el intrón GAPDH (ver por ejemplo, J04038.1 GI: 182980 de cualquier especie de mamíferos o aves, incluyendo pero no limitado a humanos, ratas, ratones, pollos y hámsteres chinos, el intrón de la proteína tardía principal adenoviral (ver, por ejemplo, U89672.1 GI: 189 9166, el promotor PGK (ver, por ejemplo, KC710227.1 GI: 501416041 de cualquier especies de mamíferos o aves que incluyen pero no se limitan a humanos, ratas, ratones, pollos y hámsteres chinos; regiones 5' no traducibles (5' UTR) de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos.
En modalidades preferidas, el vector de transferencia de genes puede comprender marcadores de selección para permitir la selección de células con transposones integrados de forma estable. Los ejemplos incluyen genes que confieren resistencia a puromicina, neomicina, higromicina, blasticidina y zeocina. El vector de transferencia de genes puede comprender un marcador de resistencia bacteriana y un origen de replicación bacteriano para facilitar la manipulación en células procariotas. Estos elementos procarióticos están contenidos preferentemente dentro de la porción no transponible del vector.
En modalidades preferidas, el vector de transferencia de genes puede comprender otros elementos de secuencia que potencian la expresión de los genes que codifican. Los ejemplos incluyen elementos que se cree que mejoran el procesamiento de ARN y la exportación nuclear, como el elemento regulador postranscripcional de la hepatitis de la marmota (WPRE), el elemento regulador postranscripcional del virus de la hepatitis B (HPRE) (por ejemplo, pero no limitado a la SEQ ID NO: 104- 105 y elemento regulador postranscripcional de suslic ártico (AGS) (por ejemplo, pero no limitado a la SEQ ID NO: 106-107. Los ejemplos también incluyen secuencias de poliadenilación tales como las secuencias de poliadenilación de BGH (hormona del crecimiento bovino) (ver, por ejemplo, M57764.1 GI: 163091; KF992215.1 GI: 593024220, HGH (hormona del crecimiento humana) (ver, por ejemplo, M13438. 1 GI: 183 156, las señales de poliadenilación de humanos (ver, por ejemplo, X03145.1 GI: 34173 o conejo (ver, por ejemplo, NM_001082260.2 GI: 129 270172; EF186084.1 GI: 122893039 beta globina, señales de poliadenilación viral incluyendo los de SV40 (ver, por ejemplo, AY122060.1 GI: 2200 1016 o el virus del herpes simple (ver, por ejemplo, M38699.1 GI: 330309 y secuencias terminadoras de la gastrina. Los ejemplos también incluyen secuencias que se cree que actúan como aislantes evitando la propagación de heterocromatina o interferencia promotora tales como, pero sin limitarse a, HS4 (SEQ ID NO: 112) y el núcleo de HS4 (SEQ ID NO: 113). En algunas modalidades preferidas, un par de aislantes rodean las secuencias a expresar. Los ejemplos también incluyen secuencias que se cree que median la unión al armazón de cromatina tales como, pero sin limitarse a, las SEQ ID NO: 108-111. Independientemente de su mecanismo real, se contempla expresamente la incorporación de elementos potenciadores de la expresión en vectores de transferencia de genes y transposones. En modalidades preferidas, los vectores de transferencia de genes comprenden transposones.
En algunas modalidades, la construcción de ácido nucleico es un vector con propiedades de expresión e integración mejoradas. Por ejemplo, se identificó una configuración óptima de elementos de vector para una expresión transitoria mejorada; así como una integración y expresión estable más eficientes mediante los métodos descritos en la presente descripción. Se generó un conjunto de variantes de vector de construcción de mamífero utilizando múltiples combinaciones de varios extremos de transposón, aislantes, potenciadores, promotores, regiones 5 'no traducibles (UTR), regiones 3' no traducibles (UTR), secuencia moduladora de exportación de ARN, secuencias de poliadenilación, terminadores, unión a matriz elemento y transposasas. El conjunto de variantes de vector de mamífero se probó para determinar la expresión óptima de DasherGFP en células embrionarias de riñón humano (HEK 293 para identificar una vector de construcción optimizada. Se identificaron otras construcciones de vector optimizado con configuraciones óptimas de elementos enumerados anteriormente que muestran una alta expresión de DasherGFP en líneas celulares HEK 293 y CHO como se muestra en las Tablas 6-20. También se demostró que las configuraciones de vector con diferentes combinaciones de promotores afectan la expresión de DasherGFP. Se contempla expresamente una optimización adicional de este vector de construcción para diferentes líneas celulares usando los métodos descritos en la presente descripción. Una ventaja de los métodos descritos en la presente descripción es identificar rápidamente un subconjunto de elementos de secuencia que más probablemente influyan en la actividad deseada, así como para facilitar la construcción predecible de la configuración óptima de elementos.
En algunas modalidades, dos promotores se colocan en orientación opuesta, cada uno impulsando un casete de expresión de manera que la transcripción de los dos promotores diverge. Tal configuración mejora en gran medida la expresión de las transcripciones de los casetes de expresión.
En algunas modalidades, los elementos que son útiles para mejorar el desempeño pueden incluir aquellos localizados en el ADN genómico de una célula. Por ejemplo, la expresión puede verse influenciada por los niveles de ARN polimerasas, chaperoninas, proteasas, enzimas de procesamiento u otro factor codificado por el ADN en el cromosoma celular. También podría resultar ventajoso aumentar en el cromosoma del hospedero los elementos funcionales que influyen en el desempeño. En algunas modalidades, una variable para la ingeniería es el sitio en el que se integra un gen funcional en un cromosoma de la célula hospedera.
En algunas modalidades, la construcción de ácido nucleico es un polinucleótido que comprende elementos o combinaciones de elementos dispuestos en una configuración óptima. En algunas modalidades, el polinucleótido es lineal. En algunas modalidades, los elementos en una construcción de ácido nucleico comprenden características genéticas funcionales, por ejemplo, promotores, potenciadores, intrones, señales de poliadenilación, orígenes de replicación y terminadores. En algunas modalidades, los elementos de una construcción de ácido nucleico comprenden elementos que codifican proteínas tales como señales de secreción, marcadores de resistencia, péptidos de anclaje, señales de localización y etiquetas de fusión. En algunas modalidades, la pluralidad de elementos comprende tres o más elementos, seis o más elementos, entre tres y veinte elementos o entre tres y cien elementos. En algunas modalidades, las variantes de construcciones de ácidos nucleicos incluyen sustituciones en un único elemento que comprende una o más posiciones, tres o más posiciones, seis o más posiciones. En algunas modalidades, las variantes de ácido nucleico incluyen sustituciones en las que las sustituciones son variaciones en elementos y/o presencia o ausencia de elementos. En algunas modalidades, las sustituciones incluyen cambios en la posición de uno o más elementos. En algunas modalidades, las variantes de ácido nucleico incluyen un cambio en el orden de uno o más elementos.
Un aspecto importante de la presente invención es que permite evaluar el desempeño de diferentes tipos de elementos: los que afectan la transcripción, los que afectan el procesamiento del ARN, los que afectan la exportación de ARN desde el núcleo de la célula, los que afectan la integración en el genoma del hospedero, los que afectan la replicación dentro de la célula hospedera, los que afectan el inicio de la traducción y los que afectan el alargamiento de la traducción. La presente invención permite diseñar conjuntos de construcciones de polinucleótidos para ensayar las interacciones de estos tipos de elementos.
En algunas modalidades, la configuración de los elementos de secuencia en el transposón dará como resultado una integración altamente eficaz en el genoma de la célula objetivo. En estos casos, la adición de la transposasa puede proporcionar solo una pequeña mejora en la expresión de genes en el transposón, o ninguno mejora en absoluto. La presente invención contempla expresamente que, bajo algunas circunstancias, la configuración de los elementos de secuencia dentro del transposón será suficiente para que el sistema de transferencia de genes no necesite incluir la transposasa.
5.2.7 Uso de elementos de acoplamiento en un sistema de transferencia de genes
Las moléculas de ARN mensajero en células eucariotas son generalmente monocistrónicas, es decir, generalmente codifican un solo polipéptido. Esto se debe a que la traducción en eucariotas generalmente ocurre mediante un proceso en el que el ribosoma se une a una estructura en el extremo 5' del ARNm y luego "escanea" el ARNm hasta que encuentra un codón de inicio (generalmente AUG) donde comienza la traducción. Luego traduce el ARNm, produciendo el polipéptido codificado, hasta que alcanza un codón de terminación (generalmente UAA, UAG o UGA) que hace que el ribosoma termine la traducción y se disocie del ARNm. Ciertos virus eucariotas han desarrollado mecanismos mediante los cuales pueden expresar más de un polipéptido a partir de un solo ARNm. Estos incluyen sitios internos de entrada del ribosoma (IRES) y secuencias de elementos hidrolasa que actúan en cis (CHYSEL).
Un IRES proporciona una estructura a la que puede unirse el ribosoma que no necesita estar en el extremo 5' del ARNm. Por lo tanto, puede dirigir un ribosoma para que inicie la traducción en un segundo codón de inicio dentro de un ARNm, lo que permite que se produzca más de 1 polipéptido a partir de un solo ARNm. Una secuencia de CHYSEL hace que un ribosoma eucariota que está participando en la traducción libere la cadena polipeptídica en crecimiento que sintetiza, sin disociarse del ARNm. El ribosoma continúa traduciendo y, por lo tanto, produce un segundo polipéptido. Una única construcción genética puede contener más de una secuencia de IRES o CHYSEL, y puede contener tanto secuencias de IRES como de CHYSEL, por lo que puede codificar 2 o 3 o 4 o 5 o 6 o más de 6 polipéptidos en un solo ARNm.
Por tanto, las secuencias de IRES o CHYSEL pueden usarse como elementos de acoplamiento, para unir la expresión de dos o más polipéptidos. Por ejemplo, la expresión de un primer polipéptido puede estar ligada a la expresión de una proteína de selección que proporciona un método físico, químico o biológico para seleccionar células en base a la cantidad de proteína de selección que se expresa. El uso de ciertas proteínas de selección para indicar el estado o la funcionalidad de una construcción genética dentro de un organismo es un aspecto de la invención. La combinación de proteínas de selección con sitios IRES o CHYSEL para indicar el estado o funcionalidad de un polinucleótido, o para indicar el nivel de expresión de un polinucleótido o polipéptido es otro aspecto de la invención. Las secuencias IRES se utilizan para expresar simultáneamente dos o más proteínas a partir de un único promotor.
Otra aplicación importante de las secuencias de acoplamiento traduccional, particularmente las secuencias IRES, es permitir la coexpresión de dos cadenas polipeptídicas que funcionan juntas, ya sea para catalizar diferentes etapas en una ruta metabólica o como partes de la misma molécula. Un ejemplo particularmente importante es la formación de un anticuerpo humano; un anticuerpo humano completo consta de dos cadenas pesadas y dos ligeras. Para la producción de anticuerpos, es conveniente que las cadenas pesada y ligera se expresen en una proporción óptima. Los anticuerpos monoclonales (Mab) son heterotetrámeros que consisten en una relación equimolar de genes de cadena pesada (HC) a cadena ligera (LC) codificados en uno o dos plásmidos. Aunque las cadenas están presentes en una proporción de cantidades equimolares en la molécula de anticuerpo final, generalmente se expresan cantidades más altas de anticuerpo si la cadena ligera se expresa más que la cadena pesada. Además, aunque la proporción óptima puede ser tan alta como 5 veces la cadena ligera que la cadena pesada, la proporción exacta que da la mayoría de los tetrámeros de anticuerpos ensamblados depende del anticuerpo exacto que se expresa.
La optimización de la relación de cadena pesada y ligera se logra típicamente de una de dos formas. En la primera, los polinucleótidos que codifican la cadena pesada y la cadena ligera se transportan en dos plásmidos diferentes y se cotransfectan en una célula hospedera. En la segunda, un solo plásmido porta ambos polinucleótidos (que codifican la cadena pesada y la cadena ligera), cada uno con su propio promotor y secuencia de poliadenilación. En el caso de la cotransfección, las células individuales absorben diferentes números de cada plásmido. Debido a que solo es posible controlar el número promedio de cada plásmido absorbido por cada célula, muchas células no terminan expresando la proporción óptima de cadena pesada y ligera. Este problema se amplifica en el caso de líneas celulares estables, porque existe la variable adicional de ubicación de integración que también afecta a los niveles de expresión. Las construcciones de promotor dual superan estas dificultades y, a menudo, pueden ser efectivas. Sin embargo, pueden volverse grandes y genéticamente inestables debido a secuencias repetidas: los promotores, potenciadores, secuencias de poliadenilación, secuencias de exportación de ARN como WPRE y HPRE y las regiones de unión a la matriz pueden necesitar ser duplicadas. Esto puede comprometer la eficiencia y el desempeño de la transfección; también puede haber interferencia entre dos promotores eucariotas en la misma construcción.
Estos inconvenientes pueden superarse utilizando secuencias IRES, siempre que esté disponible un conjunto de secuencias IRES que puedan producir diferentes niveles de expresión del segundo polipéptido con respecto al primero. Esto permite el equivalente de la titulación que se logra actualmente mediante la cotransfección de diferentes cantidades de los dos plásmidos. Sin embargo, tiene la ventaja significativa de que cada célula obtiene un número igual de copias de los polinucleótidos que codifican el primer polipéptido y el segundo polipéptido (porque están en el mismo plásmido), aunque diferentes células pueden obtener diferentes números de plásmidos. Por tanto, aunque la cantidad de cada polipéptido puede variar de una célula a otra, la relación entre la cantidad del primer polipéptido y el segundo polipéptido debería ser mucho menos variable.
El IRES más utilizado en sistemas de mamíferos es el del virus de la encefalomiocarditis, que incluye cuatro aminoácidos del extremo N del segundo marco abierto de lectura (MATT). Por tanto, existen dos limitaciones significativas en las herramientas actualmente disponibles para la coexpresión de múltiples genes en células eucariotas. En primer lugar, no existe un conjunto de secuencias IRES fácilmente disponible que proporcione un intervalo conocido de relaciones de expresión entre el primer y el segundo marco abierto de lectura, por lo que es difícil controlar la expresión relativa de dos proteínas. En segundo lugar, la secuencia IRES más comúnmente utilizada requiere una extensión N-terminal de la segunda proteína, que puede comprometer o modificar la función de esa proteína. Por tanto, existe una necesidad en la técnica de un conjunto de secuencias caracterizadas que puedan incorporarse fácilmente entre un primer y un segundo marco abierto de lectura para crear un equilibrio de expresión óptimo para una función o producto de la célula río abajo.
Sintetizamos secuencias inspiradas en las regiones 5' no traducibles de virus de ARN de cadena positiva, las clonamos bajo el control de un solo promotor en un vector entre un polinucleótido que codifica una proteína verde fluorescente y un polinucleótido que codifica una proteína roja fluorescente, se transfectó la construcción en células de mamífero y se midió la expresión de fluorescencia roja y verde. Usando esta prueba identificamos secuencias IRES que funcionan en células embrionarias de riñón humano (HEK) y ovario de hámster chino (CHO) (SEQ ID NO: 58-100 y que muestran diferentes niveles de expresión de la segunda proteína (controlada por IRES) en relación con la primera. Esto es de particular importancia ya que las células de ovario de hámster chino (CHO) son el hospedero dominante para la producción de anticuerpos monoclonales industriales debido a su capacidad para el plegamiento y ensamblaje de proteínas adecuados y las modificaciones posteriores a la traducción adecuadas. Cada una de estas secuencias activas se puede utilizar para buscar secuencias similares en bases de datos de secuencias y, a su vez, se pueden ensayar secuencias similares utilizando el mismo sistema. En modalidades preferidas, la secuencia IRES se selecciona de secuencias de picornavirus de murciélago o secuencias de picornavirus de roedor. Las secuencias muy similares tienen diferencias de función bastante grandes. Un método para mejorar la función de los IRES individuales es crear secuencias consenso. Otro método consiste en identificar secuencias de cepas virales que, según se informa, son las más virulentas. Otro método consiste en crear bibliotecas de secuencias variantes y ensayar miembros de estas bibliotecas utilizando un par de proteínas reporteras fluorescentes.
En algunas modalidades, la secuencia IRES tiene al menos un 80 % de similitud con las SEQ ID NO: 58-100, o es una quimera de dos o más de estas secuencias. En algunas otras modalidades, la secuencia de IRES tiene al menos un 90 % de similitud con las SEQ ID NO: 58-100. En algunas modalidades, el ácido nucleico codifica secuencias IRES, en las que el ácido nucleico tiene al menos al menos 80 %, al menos 90 % al menos 95 %, al menos 98 % o al menos 99 % de identidad de secuencia con una secuencia consenso derivada de un conjunto de secuencias de origen natural de la región 5' no traducible de genomas virales de ARN; en algunas modalidades, la secuencia consenso no es en sí misma idéntica a ninguno secuencia de origen natural. En algunas modalidades, una secuencia IRES tiene al menos 50 %, al menos 60 %, al menos 70 %, al menos 80 %, al menos 90 % de similitud con las regiones 5' no traducibles (UTR) de la familia de virus picornavirus. En algunas modalidades, los elementos IRES de la invención se incorporan en un vector de expresión con un solo promotor y uno o más elementos IRES que permiten el control de las proporciones de expresión de uno o más genes. En otras modalidades, los elementos IRES que funcionan como potenciadores se incorporan en un vector de expresión en donde los elementos IRES funcionan para potenciar la expresión de uno o múltiples genes.
Uso de secuencias IRES para controlar los niveles de expresión de dos o más proteínas en un vector de transferencia de genes que comprende transposones para la integración estable con o sin transposasas identificadas aquí, con especial énfasis en la expresión de anticuerpos en células de ovario de hámster chino (CHO) o células embrionarias de riñón humano (HEK) es otro aspecto importante de esta invención. Por ejemplo, la expresión de cadenas pesadas y ligeras de un anticuerpo se puede controlar seleccionando un IRES con la fuerza apropiada.
Otro aspecto de la invención es el uso de secuencias IRES en vectores de expresión transitoria. El uso de elementos IRES para controlar los niveles de expresión de dos o más proteínas en vectores de expresión que comprenden elementos o combinaciones de elementos dispuestos en una configuración óptima como se describe en la presente descripción (Sección 5.2.6) anteriormente es otra modalidad de la invención. Modalidades adicionales incluyen el uso de secuencias IRES para controlar los niveles de expresión de dos o más polipéptidos en vectores de expresión (con transposones para integración estable y sin expresión transitoria) con secuencias de replicación viral para incrementar el número de copias del plásmido. El uso de secuencias IRES en cualquiera de las configuraciones de vector mostradas en cualquiera de las Tablas aquí mostradas es un aspecto de la invención.
Las proporciones de genes expresados pueden controlarse utilizando los diversos elementos IRES identificados. Esto es particularmente útil cuando los productos génicos deben expresarse en una proporción fija para obtener resultados óptimos.
En algunas modalidades preferidas, las secuencias de IRES se seleccionan de las SEQ ID NO: 58-100.
En algunas modalidades, es ventajoso incluir péptidos secretores en el extremo amino de una proteína que permite la translocación de la proteína al retículo endoplásmico (RE). Esto ayuda no solo a la facilidad de purificación, sino que también permite el plegado adecuado de enlaces disulfuro complejos y la glicosilación. La selección adecuada de un péptido señal puede tener consecuencias dramáticas sobre la sobreexpresión de proteínas. Se han descrito varios péptidos de secreción eficientes, por ejemplo, interleucina-2, CD5, la cadena ligera kappa de inmunoglobulina, tripsinógeno, albúmina sérica y prolactina. Identificamos péptidos de secreción (las SEQ ID NO: 114-115) que funcionan bien en combinación con secuencias IRES. Esto es especialmente importante para la expresión de anticuerpos en una única construcción usando elementos IRES como se describe en la presente descripción.
Otro aspecto de la invención es un kit que comprende un único vector de expresión con uno o más elementos IRES y reactivos para facilitar la clonación del ORF en el vector. El kit puede incluir adicionalmente un conjunto de elementos IRES como plantillas, de modo que los elementos IRES puedan incorporarse en un vector de expresión de elección.
5.2.8 Aplicaciones adicionales del sistema de transferencia de genes
El uso del sistema de transferencia de genes para métodos como el descubrimiento de genes y/o el marcado de genes, permite, por ejemplo, la identificación, aislamiento y caracterización de genes implicados en el crecimiento y desarrollo mediante el uso de transposones como mutágenos de inserción o identificación, aislamiento y caracterización de secuencias reguladoras de la transcripción que controlan el crecimiento y el desarrollo.
El sistema de transferencia de genes de la invención representa un refinamiento considerable de la transferencia de genes mediada por ADN no viral. Por ejemplo, la adaptación de virus como agentes para la terapia génica restringe el diseño genético a las limitaciones del genoma del virus en términos de tamaño, estructura y regulación de la expresión. Los vectores no virales, como se describe en la presente descripción, se generan en gran parte a partir de materiales de partida sintéticos y, por lo tanto, se fabrican más fácilmente que los vectores virales. Es menos probable que los reactivos no virales sean inmunogénicos que los agentes virales, lo que hace posible el suministro repetido. Los vectores no virales son más estables que los vectores virales y, por tanto, son más adecuados para la formulación y aplicación farmacéuticas que los vectores virales. Además, el sistema de transferencia de genes de la presente invención es un sistema de transferencia de genes no viral que facilita la inserción en el ADN y mejora notablemente la frecuencia de transferencia de genes estable.
Se contempla expresamente un método eficaz para usar combinaciones de transposón-transposasa de la presente invención para introducir de forma estable un receptor de antígeno quimérico (CAR) para redirigir la especificidad de las células T humanas y es un ejemplo importante de la presente descripción. Por ejemplo, redirigir la especificidad de las células T para los antígenos del linaje B y las neoplasias malignas de células B avanzadas mediante la infusión de dichas células T específicas de tumor (transferencia de células adoptivas) modificadas por la transposóntransposasa de la presente descripción es otro ejemplo. La combinación de terapias basadas en células con terapias basadas en genes, en las que los receptores de antígenos quiméricos (CAR) modificados genéticamente o los genes de receptores de células T específicos de tumores se expresan en células efectoras inmunitarias tiene un enorme potencial terapéutico. Los CAR combinan dominios de señalización intracelular con un fragmento variable de cadena única de un anticuerpo (Ab) en una única proteína quimérica. Diseñar células inmunes (células T) para reconocer y atacar sus tumores es un enfoque poderoso, especialmente en el tratamiento de tumores malignos o linfomas de células B. Un receptor de antígeno quimérico (CAR) reconoce el antígeno asociado a un tumor de la superficie celular independiente del antígeno leucocitario humano (HLA) y emplea una o más moléculas de señalización para activar las células T genéticamente modificadas para matar, proliferar y producir citocinas. Por ejemplo, el objetivo de CD19 se ha logrado mediante la expresión forzada de un CAR que reconoce CD19 independientemente de HLA. A diferencia de los métodos que modifican genéticamente las células T utilizando retrovirus recombinante, un enfoque de transferencia de genes no virales que utiliza el sistema transposón-transposasa para reforzar la expresión del CAR introducido es una alternativa viable y evita algunos de los problemas, como los sitios de integración preferenciales asociados con la mayoría de los virus. Para mejorar el potencial terapéutico, también se contempla la señalización de CAR a través de CD28 y CD3-Z para mantener la proliferación de células T y reciclar las funciones efectoras in vivo.
La presente descripción proporciona además un método eficiente para producir animales no humanos transgénicos, incluyendo la etapa de aplicar el sistema de transferencia de genes de la presente descripción a un animal no humano. El a Dn transgénico no se ha insertado de manera eficiente en los cromosomas. Solo alrededor de una en un millón de moléculas de ADN extraño se inserta en el genoma celular, generalmente varios ciclos de escisión en el desarrollo. En consecuencia, la mayoría de los animales transgénicos son mosaicos (Hackett y otros, 'The molecular biology of transgenic fish'; Biochemistry and Molecular Biology of Fishes ((editoria1Hochachka & Mommsen) Vol. 2, págs. 207­ 240, 1993). Como resultado, los animales criados a partir de embriones a los que se les ha administrado ADN transgénico deben criarse hasta que los gametos puedan analizarse para detectar la presencia de ADN extraño insertado. Muchos animales transgénicos no logran expresar el transgén debido a los efectos de posición. Se necesita un procedimiento simple y confiable que dirija la inserción temprana de ADN exógeno en los cromosomas de animales no humanos en la etapa unicelular. El sistema actual ayuda a cubrir esta necesidad.
En ciertos casos preferidos, el sistema de transferencia de genes de esta descripción puede usarse fácilmente para producir animales transgénicos no humanos que portan un marcador particular o expresan una proteína particular en una o más células del animal. Generalmente, los métodos para producir animales transgénicos no humanos se conocen en la técnica y la incorporación del sistema de transferencia de genes de la presente descripción en estas técnicas no requiere experimentación adicional, por ejemplo, hay una variedad de métodos para producir animales transgénicos no humanos para investigación o para la producción de proteínas que incluyen, pero no se limitan a, Hackett y otros, (1993, arriba). En la técnica se describen otros métodos para producir animales transgénicos (por ejemplo, M. Markkula y otros Rev. Reprod., 1, 97-106 (1996; RT Wall y otros, J. Dairy ScL, 80, 2213-2224 (1997), JC Dalton y otros (Adv. Exp. Med. Biol, 411, 419-428 (1997) y H. Lubon y otros, (Transfus. Rev., 10, 131-143 (1996). Un transposón que incluye una o más proteínas que codifican ácidos nucleicos para ser expresados en el animal transgénico no humano flanqueado por ITR puede introducirse en células adecuadas, por ejemplo, un cigoto, una célula madre embrionaria o una célula adulta, para transferencia nuclear junto con una transposasa, ya sea en forma de proteína o codificada por el mismo o diferente ácido nucleico que el transposón. El transposón se integra en el genoma de la célula. Luego, la célula se propaga a un embrión y luego a un animal transgénico no humano, como ocurre con la transgénesis convencional.
En otra modalidad, la presente invención presenta un animal transgénico no humano producido por los métodos descritos en la presente descripción, preferentemente usando el sistema de transferencia de genes que se describe en la presente. Por ejemplo, los animales transgénicos no humanos pueden contener preferentemente una secuencia de ácido nucleico insertada en el genoma del animal por el sistema de transferencia de genes, permitiendo de esta manera que el animal transgénico produzca su producto génico, por ejemplo, una proteína. En animales transgénicos no humanos, esta proteína es preferentemente un producto para el aislamiento a partir de una célula, por ejemplo, la proteína de la invención se puede producir en cantidad en leche, orina, sangre o huevos. Pueden usarse promotores que promuevan la expresión en leche, orina, sangre o huevos y estos promotores incluyen, pero no se limitan a, promotor de caseína, promotor de proteína urinaria de ratón, promotor de betaglobina y promotor de ovoalbúmina, respectivamente. Se han producido hormona del crecimiento recombinante, insulina recombinante y una variedad de otras proteínas recombinantes utilizando otros métodos para producir proteína en una célula. Los ácidos nucleicos que codifican estas u otras proteínas pueden insertarse en el transposón de esta invención y transfectarse en una célula. La expresión de un transposón de la presente invención puede mejorarse cuando está presente una proteína transposasa para catalizar la integración del transposón en el ADN de una célula. Cuando la célula es parte de un tejido o parte de un animal no humano transgénico, se pueden obtener grandes cantidades de proteína recombinante. Los animales transgénicos no humanos se pueden seleccionar de vertebrados e invertebrados, por ejemplo, peces, aves, mamíferos, incluyendo, entre otros, roedores, como ratas o ratones, ungulados, como vacas o cabras, ovejas o cerdos.
La presente descripción proporciona además un método para terapia génica que comprende la etapa de introducir el sistema de transferencia de genes en las células como se describe en la presente descripción. Por lo tanto, el transposón como se describe en la presente descripción comprende preferentemente un gen para proporcionar una terapia génica a una célula u organismo. Preferentemente, el gen se coloca bajo el control de un promotor específico de tejido o de un promotor ubicuo o una o más de otras regiones de control de la expresión para la expresión de un gen en una célula que necesita ese gen. Actualmente, se están probando una variedad de genes para una variedad de terapias génicas que incluyen, entre otros, el gen CFTR para la fibrosis quística, la adenosina desaminasa (ADA) para los trastornos del sistema inmunológico, el factor IX y la interleucina-2 (IL-2 para enfermedades de las células sanguíneas, alfa-1-antitripsina para enfermedades pulmonares y factores de necrosis tumoral (INF) y proteínas de resistencia a múltiples fármacos (MDR) para terapias contra el cáncer. Estas y una variedad de secuencias de genes específicas de humanos o animales que incluyen secuencias de genes para codificar proteínas marcadoras y una variedad de proteínas recombinantes están disponibles en bases de datos de genes conocidas tales como GenBank.
Una ventaja del sistema de transferencia de genes de la presente invención con fines de terapia génica es que está limitado en mucho menor grado por el tamaño del polinucleótido entre los extremos del transposón que en el caso de muchos otros sistemas de transferencia de genes. No existe un límite conocido en el tamaño de la secuencia de ácido nucleico que puede insertarse en el ADN de una célula usando las proteínas transposasa de la presente invención. En modalidades preferidas particulares, con fines de terapia génica, pero también con otros fines inventivos, el sistema de transferencia de genes se puede transfectar en células mediante una variedad de métodos que incluyen microinyección, estrategias mediadas por lípidos o estrategias mediadas por virus. Por ejemplo, cuando se usa microinyección, hay muy poca restricción sobre el tamaño de la secuencia intermedia del transposón de esta invención. De manera similar, las estrategias mediadas por lípidos no tienen limitaciones de tamaño sustanciales. Sin embargo, otras estrategias para introducir el sistema de transferencia de genes en una célula, como las estrategias mediadas por virus, podrían limitar la longitud de la secuencia de ácido nucleico colocada entre las repeticiones.
Por consiguiente, en ciertas modalidades ilustrativas, el sistema de transferencia de genes como se describe en la presente descripción puede suministrarse a las células a través de virus, incluyendo retrovirus (tales como lentivirus), adenovirus, virus adenoasociados, virus del herpes y otros. Hay varias combinaciones potenciales de mecanismos de suministro que son posibles para la porción de transposón que contiene el polinucleótido heterólogo flanqueado por las repeticiones de los extremos y el gen que codifica la transposasa. Por ejemplo, tanto el gen del transposón como el de la transposasa pueden estar contenidos juntos en el mismo genoma viral recombinante; una sola infección libera ambas partes del sistema de transferencia de genes de manera que la expresión de la transposasa dirige luego la escisión del transposón del genoma viral recombinante para su posterior inserción en un cromosoma celular. En otro ejemplo, la transposasa y el transposón se pueden suministrar por separado mediante una combinación de virus y/o sistemas no virales tales como reactivos que contienen lípidos. En estos casos, el transposón y/o el gen de la transposasa pueden suministrarse mediante un virus recombinante. En todos los casos, el gen de transposasa expresado dirige la liberación del transposón de su ADN portador (genoma viral) para su inserción en el ADN cromosómico. En ciertas modalidades preferidas de la presente invención, los transposones pueden utilizarse para mutagénesis de inserción, preferentemente seguido de la identificación del gen mutado. Los transposones de ADN, particularmente los transposones, tienen varias ventajas en comparación con los enfoques de la técnica anterior, por ejemplo, con respecto a los métodos virales y retrovirales. Por ejemplo, a diferencia de las inserciones provirales, las inserciones de transposones se pueden volver a movilizar suministrando la actividad transposasa en trans. Por tanto, en lugar de realizar microinyecciones que consumen mucho tiempo, es posible según la presente invención generar inserciones de transposones en nuevos loci cruzando cepas transgénicas para los dos componentes del sistema de transposones mencionados anteriormente, el transposón y la transposasa. En una modalidad preferida, el sistema de transferencia de genes se dirige a la línea germinal de los animales experimentales para mutagenizar las células germinales. Alternativamente, la expresión de transposasa puede dirigirse a tejidos u órganos particulares utilizando una variedad de promotores específicos. Además, la removilización de un transposón mutagénico fuera de su sitio de inserción puede usarse para aislar revertientes y, si la escisión del transposón está asociada con una deleción del ADN flanqueante, el sistema de transferencia de genes de la presente invención puede usarse para generar mutaciones por deleción. Además, dado que los transposones están compuestos de ADN y pueden mantenerse en plásmidos simples, los sistemas de transferencia de genes y los transposones de la presente invención son mucho más seguros y más fáciles de trabajar que los retrovirus altamente infecciosos. La actividad transposasa se puede suministrar en forma de ADN, ARNm o proteína como se definió anteriormente en la fase experimental deseada.
En otro caso, la presente descripción también proporciona un sistema eficaz para el descubrimiento de genes, por ejemplo, mapeo del genoma, mediante la introducción de un transposón como se definió anteriormente en un gen usando un sistema de transferencia de genes como se describe en la presente invención. En un ejemplo, el transposón en combinación con la proteína transposasa o un ácido nucleico que codifica la proteína transposasa se transfecta en una célula. En ciertos casos, el transposón comprende preferentemente una secuencia de ácido nucleico posicionada entre al menos dos repeticiones, donde las repeticiones se unen a la proteína transposasa y donde el transposón se inserta en el ADN de la célula en presencia de la proteína transposasa. En ciertos casos, la secuencia de ácido nucleico incluye una proteína marcadora, como GFP y un sitio de reconocimiento de endonucleasas de restricción. Después de la inserción, el ADN celular se aísla y se digiere con la endonucleasa de restricción. Por ejemplo, si el sitio de reconocimiento de la endonucleasa es un sitio de reconocimiento de 6 bases y se usa una endonucleasa de restricción que emplea una secuencia de reconocimiento de 6 bases, el ADN celular se corta en fragmentos de aproximadamente 4000 pb en promedio. Estos fragmentos se pueden clonar o se pueden añadir enlazadores a los extremos de los fragmentos digeridos para proporcionar una secuencia complementaria para los cebadores de PCR. Cuando se agregan enlazadores, las reacciones de PCR se utilizan para amplificar fragmentos utilizando cebadores de los enlazadores y cebadores que se unen a las repeticiones directas de las repeticiones en el transposón. Los fragmentos amplificados se secuencian luego y el ADN que flanquea las repeticiones directas se usa para buscar bases de datos informáticas como GenBank.
En otro ejemplo ilustrativo de la presente descripción, la invención proporciona un método para movilizar una secuencia de ácido nucleico en una célula. De acuerdo con método, el transposón Bombyx mori o Xenopus tropicalis se inserta en el ADN de una célula, como se describe en la presente descripción. Una proteína o ácido nucleico que codifica la proteína transposasa de Bombyx mori o Xenopus tropicalis se transfecta a la célula y la proteína es capaz de movilizar (es decir, mover) el transposón desde una primera posición dentro del ADN de la célula a una segunda posición dentro del ADN de la célula. El ADN de la célula es preferentemente ADN genómico o ADN extracromosómico. El método descrito permite el movimiento del transposón desde una ubicación en el genoma a otra ubicación en el genoma, o por ejemplo, desde un plásmido en una célula al genoma de esa célula.
En otros casos, el sistema de transferencia de genes también se puede utilizar como parte de un método que implica técnicas de interferencia de ARN. La interferencia de ARN (ía Rn ), es una técnica en la que los ARN exógenos, bicatenarios (ARNbc), que son complementarios a los ARNm o genes/fragmentos de genes de la célula, se introducen en esta célula para unirse específicamente a un ARNm particular y/o gen y por lo tanto disminuyendo o aboliendo la expresión génica. La técnica demostró ser efectiva en Drosophila, Caenorhabditis elegans, plantas y, recientemente, en cultivos de células de mamíferos. Para aplicar esta técnica en contexto con la presente descripción, el transposón contiene preferentemente casetes de expresión en horquilla cortos que codifican ARN de interferencia pequeños (ARNip), que son complementarios a los ARNm y/o genes/fragmentos de genes de la célula. Estos ARNip tienen preferentemente una longitud de 20 a 30 ácidos nucleicos, más preferentemente una longitud de 20 a 25 ácidos nucleicos y lo más preferentemente una longitud de 21 a 23 ácidos nucleicos. El ARNip se puede dirigir a cualquier ARNm y/o un gen que codifique cualquier proteína como se definió anteriormente, por ejemplo, un oncogén. Este uso, particularmente el uso de transposones para la integración de vectores de ARNip en el genoma del hospedero, proporciona una expresión a largo plazo de ARNip in vitro o in vivo y, por tanto, permite un silenciamiento a largo plazo de productos génicos específicos.
5.2.9 Composiciones farmacéuticas
La presente descripción incluye además composiciones farmacéuticas que contienen i) una transposasa de Bombyx mori como proteína o codificada por un ácido nucleico, y/o un transposón de Bombyx mori, o un sistema de transferencia de genes que comprende una transposasa de Bombyx mori como proteína o codificado por una ácido nucleico, en combinación con un transposón activo Bombyx mori o; ii) una transposasa de Xenopus tropicalis como proteína o codificada por un ácido nucleico, y/o un transposón de Xenopus tropicalis, o un sistema de transferencia de genes que comprende una transposasa de Xenopus tropicalis como proteína o codificada por un ácido nucleico, en combinación con un transposón activo de Xenopus tropicalis.
La composición farmacéutica se puede proporcionar opcionalmente junto con un portador, adyuvante o vehículo farmacéuticamente aceptable. En este contexto, un portador, adyuvante o vehículo farmacéuticamente aceptable de acuerdo con la presente descripción se refiere a un portador, adyuvante o vehículo no tóxico que no destruye la actividad farmacológica del componente o componentes con los que se formula.
Los portadores, adyuvantes o vehículos farmacéuticamente aceptables que se pueden usar en las composiciones de esta descripción incluyen, pero no se limitan a, intercambiadores de iones, alúmina, estearato de aluminio, lecitina, proteínas del suero, tales como albúmina de suero humano, sustancias tampón tales como fosfatos, glicina, ácido sórbico, sorbato de potasio, mezclas de glicéridos parciales de ácidos grasos vegetales saturados, agua, sales o electrolitos, como sulfato de protamina, hidrogenosulfato disódico, hidrogenofosfato disódico, hidrogenofosfato de potasio, cloruro de sodio, sales de zinc, sílice coloidal, magnesio trisilicato, polivinilpirrolidona, sustancias a base de celulosa, polietilenglicol, carboximetilcelulosa de sodio, poliacrilatos, ceras, polímeros en bloque de polietilenopolioxipropileno, polietilenglicol y grasa de lana.
Las composiciones farmacéuticas de la presente descripción pueden suministrarse por vía oral, parenteral, mediante aerosol de inhalación, por vía tópica, rectal, nasal, bucal, vaginal o mediante un depósito implantado.
El término parenteral, como se usa en la presente descripción, incluye técnicas de inyección o infusión subcutánea, intravenosa, intramuscular, intraarticular, intrasinovial, intraesternal, intratecal, intrahepática, intralesional e intracraneal. Preferentemente, las composiciones farmacéuticas se administran por vía oral, intraperitoneal o intravenosa. Las formas inyectables estériles de las composiciones farmacéuticas de esta descripción pueden ser una suspensión acuosa u oleaginosa. Estas suspensiones se pueden formular de acuerdo con técnicas conocidas en la técnica usando agentes dispersantes o humectantes y agentes de suspensión adecuados. La preparación inyectable estéril también puede ser una solución o suspensión inyectable estéril en un diluyente o solvente parenteralmente aceptable no tóxico, por ejemplo, como una solución en 1,3-butanodiol. Entre los vehículos y solventes aceptables que se pueden emplear se encuentran el agua, la solución de Ringer y la solución isotónica de cloruro de sodio. Además, convencionalmente se emplean aceites fijos estériles como solvente o medio de suspensión.
Para este propósito, se puede emplear cualquier aceite fijo suave, incluyendo mono o diglicéridos sintéticos. Los ácidos grasos, como el ácido oleico y sus derivados glicéridos, son útiles en la preparación de inyectables, al igual que los aceites naturales farmacéuticamente aceptables, como el aceite de oliva o el aceite de ricino, especialmente en sus versiones polioxietiladas. Estas soluciones o suspensiones oleosas también pueden contener un diluyente o dispersante alcohólico de cadena larga, tal como carboximetilcelulosa o agentes dispersantes similares que se usan comúnmente en la formulación de formas de dosificación farmacéuticamente aceptables, incluyendo emulsiones y suspensiones. Otros tensioactivos comúnmente usados, tales como Tweens, Spans y otros agentes emulsionantes o potenciadores de la biodisponibilidad que se usan comúnmente en la fabricación de formas de dosificación sólidas, líquidas u otras aceptables farmacéuticamente, también pueden usarse para los propósitos de formulación.
Las composiciones farmacéuticamente aceptables de esta descripción pueden suministrarse por vía oral en cualquier forma de dosificación aceptable por vía oral que incluye, pero no se limita a, cápsulas, comprimidos, suspensiones o soluciones acuosas. En el caso de las tabletas para uso oral, los vehículos comúnmente usados incluyen lactosa y almidón de maíz. También se añaden típicamente agentes lubricantes, tales como estearato de magnesio. Para el suministro oral en forma de cápsula, los diluyentes útiles incluyen lactosa y almidón de maíz seco. Cuando se req uieren suspensiones acuosas para uso oral, el ingrediente activo se combina con agentes emulsionantes y de suspensión. Si se desea, también se pueden añadir ciertos agentes edulcorantes, aromatizantes o colorantes.
Alternativamente, las composiciones farmacéuticamente aceptables de esta descripción se pueden suministrar en forma de supositorios para administración rectal. Estos se pueden preparar mezclando el sistema de transferencia de genes o componentes del mismo con un excipiente no irritante adecuado que sea sólido a temperatura ambiente pero líquido a temperatura rectal y, por lo tanto, se derretirá en el recto para liberar el fármaco. Dichos materiales incluyen manteca de cacao, cera de abejas y polietilenglicoles. Las composiciones farmacéuticamente aceptables de esta descripción también pueden suministrarse tópicamente, especialmente cuando el objetivo del tratamiento incluye áreas u órganos fácilmente accesibles por aplicación tópica, incluyendo enfermedades del ojo, la piel o el tracto intestinal inferior. Se preparan fácilmente formulaciones tópicas adecuadas para cada una de estas áreas u órganos.
Para aplicaciones tópicas, las composiciones farmacéuticamente aceptables se pueden formular en una pomada adecuada que contenga el sistema de transferencia de genes o componentes del mismo suspendidos o disueltos en uno o más vehículos. Los vehículos para el suministro tópica de los componentes de esta descripción incluyen, pero no se limitan a, aceite mineral, vaselina líquida, vaselina blanca, propilenglicol, polioxietileno, componente de polioxipropileno, cera emulsionante y agua. Alternativamente, las composiciones farmacéuticamente aceptables se pueden formular en una loción o crema adecuada que contenga los componentes activos suspendidos o disueltos en uno o más vehículos farmacéuticamente aceptables. Los vehículos adecuados incluyen, entre otros, aceite mineral, monoestearato de sorbitán, polisorbato 60, cera de ésteres cetílicos, alcohol cetearílico, 2-octildo-decanol, alcohol bencílico y agua.
Para uso oftálmico, las composiciones farmacéuticamente aceptables se pueden formular como suspensiones micronizadas en solución salina estéril con pH ajustado isotónico o, preferentemente, como soluciones en solución salina estéril con pH ajustado e isotónico, con o sin un conservante tal como cloruro de bencilalconio. Alternativamente, para usos oftálmicos, las composiciones farmacéuticamente aceptables se pueden formular en una pomada como vaselina.
Las composiciones farmacéuticamente aceptables de esta descripción también pueden suministrarse mediante aerosol nasal o inhalación. Dichas composiciones se preparan según técnicas bien conocidas en la técnica de la formulación farmacéutica y se pueden preparar como soluciones en solución salina, empleando alcohol bencílico u otros conservantes adecuados, promotores de la absorción para mejorar la biodisponibilidad, fluorocarbonos y/u otros agentes solubilizantes o dispersantes convencionales.
La cantidad de los componentes de la presente descripción que pueden combinarse con los materiales portadores para producir una composición en una única forma de dosificación variará dependiendo del hospedero tratado, el modo particular de suministro. Debe tenerse en cuenta que una dosis y un régimen de tratamiento específicos para cualquier paciente en particular dependerán de una variedad de factores, incluyendo la actividad del componente específico empleado, la edad, el peso corporal, la salud general, el sexo, la dieta, el momento del suministro, tasa de excreción, combinación de fármacos y el criterio del médico tratante y la gravedad de la enfermedad particular que se está tratando. La cantidad de un componente de la presente descripción en la composición también dependerá del componente o componentes particulares de la composición. La composición farmacéutica es preferentemente adecuada para el tratamiento de enfermedades, enfermedades particulares causadas por defectos genéticos como fibrosis quística, hipercolesterolemia, hemofilia, inmunodeficiencias que incluyen VIH, enfermedad de Huntington, deficiencia de a-anti-tripsina, así como cáncer seleccionado entre cáncer de colon, melanomas, cáncer de riñón, linfoma, leucemia mieloide aguda (LMA), leucemia linfoide aguda (LLA), leucemia mieloide crónica (LMC), leucemia linfocítica crónica (LLC), tumores gastrointestinales, cáncer de pulmón, gliomas, cáncer de tiroides, mamas carcinomas, tumores de próstata, hepatomas, diversos tumores inducidos por virus como, por ejemplo, carcinomas inducidos por virus del papiloma (por ejemplo, carcinoma de cuello uterino), adenocarcinomas, tumores inducidos por virus del herpes (por ejemplo, linfoma de Burkitt, linfoma de células B inducido por EBV), tumores inducidos por hepatitis B (Hepato carcinomas celulares), linfoma inducido por HTLV-I y HTLV-2, cáncer de pulmón, cáncer de faringe, carcinoma anal, glioblastoma, linfoma, carcinoma de recto, astrocitoma, tumores cerebrales, s cáncer de tórax, retinoblastoma, basalioma, metástasis cerebrales, meduloblastoma, cáncer de vagina, cáncer de páncreas, cáncer de testículo, melanoma, cáncer de vejiga, síndrome de Hodgkin, meningeoma, enfermedad de Schneeberger, carcinoma bronquial, cáncer de pituitaria, micosis fungoide, cáncer de garganta, cáncer de mama, neurinoma, espinalioma, linfoma de Burkitt, cáncer de laringe, timoma, carcinoma de cuerpo, cáncer de huesos, linfoma no Hodgkin, cáncer de uretra, síndrome CUP, oligodendroglioma, cáncer de vulva, cáncer intestinal, carcinoma de esófago, tumores del intestino delgado, craneofaringoma, carcinoma de ovario cáncer de ovario, cáncer de hígado, leucemia o cánceres de piel o de ojos; y otros.
5.3 Kits
La presente descripción también presenta kits que comprenden una transposasa Bombyx mori como una proteína o codificada por un ácido nucleico, y/o un transposón Bombyx mori; o un sistema de transferencia de genes como se describe en la presente descripción que comprende una transposasa de Bombyx mori como una proteína o codificada por un ácido nucleico como se describe en la presente descripción, en combinación con un transposón de Bombyx mori; opcionalmente junto con un portador, adyuvante o vehículo farmacéuticamente aceptable, y opcionalmente con instrucciones de uso. Cualquiera de los componentes del kit descrito se puede suministrar y/o transfectar en células en un orden posterior o en paralelo, por ejemplo, la proteína transposasa Bombyx mori o su ácido nucleico codificante se puede suministrar y/o transfectar en una célula como se definió anteriormente, simultáneamente o después del suministro y/o transfección del transposón Bombyx mori. Alternativamente, el transposón Bombyx mori se puede transfectar en una célula como se definió anteriormente antes, simultáneamente o después de la transfección de la proteína transposasa Bombyx mori o su ácido nucleico codificante. Si se transfecta en paralelo, preferentemente ambos componentes se proporcionan en una formulación separada y/o se mezclan entre sí directamente antes del suministro para evitar la transposición antes de la transfección. Además, el suministro y/o transfección de al menos un componente del kit puede ocurrir en un modo escalonado en el tiempo, por ejemplo, suministrando múltiples dosis de este componente.
Además, la presente invención también presenta kits que comprenden una transposasa de Xenopus tropicalis como una proteína o codificada por un ácido nucleico, y/o un transposón de Xenopus laevis; o un sistema de transferencia de genes como se describe en la presente descripción que comprende una transposasa de Xenopus tropicalis como una proteína o codificada por un ácido nucleico como se describe en la presente descripción, en combinación con un transposón de Xenopus tropicalis; opcionalmente junto con un portador, adyuvante o vehículo farmacéuticamente aceptable, y opcionalmente con instrucciones de uso. Cualquiera de los componentes del kit de la invención puede suministrarse y/o transfectarse en células en un orden posterior o en paralelo, por ejemplo, la proteína transposasa de Xenopus tropicalis o su ácido nucleico codificante puede suministrarse y/o transfectarse en una célula como se define anteriormente, simultáneamente o después del suministro y/o transfección del transposón de Xenopus tropicalis. Alternativamente, el transposón de Xenopus tropicalis se puede transfectar en una célula como se definió anteriormente antes, simultáneamente con o después de la transfección de la proteína transposasa de Xenopus tropicalis o su ácido nucleico codificante. Si se transfecta en paralelo, preferentemente ambos componentes se proporcionan en una formulación separada y/o se mezclan entre sí directamente antes del suministro para evitar la transposición antes de la transfección. Además, el suministro y/o transfección de al menos un componente del kit puede ocurrir en un modo escalonado en el tiempo, por ejemplo, suministrando múltiples dosis de este componente.
6. Ejemplos
Los siguientes ejemplos están destinados a ilustrar los métodos, composiciones y kits descritos en la presente descripción y no deben interpretarse como limitantes de ninguna manera. Varios equivalentes resultarán evidentes para un experto en la técnica a partir de los siguientes ejemplos; también se contempla que tales equivalentes formen parte de la invención descrita en la presente descripción.
6.1.1 Integración estable en células de ovario de hámster (CHO)
En algunas modalidades, un sistema de transferencia de genes comprende un transposón y una transposasa. El transposón comprende un polinucleótido de expresión heterólogo que incluye elementos de control de la expresión y una secuencia que codifica un primer polipéptido a expresar. Las células en las que se introdujeron el transposón y la transposasa expresan niveles más altos del polipéptido a expresar que las células en las que sólo se introdujo el transposón.
Las Tablas 1 y 2 muestran los datos obtenidos de experimentos paralelos por triplicado que ensayan la expresión de un polinucleótido de expresión que comprende un gen de resistencia a puromicina bajo el control de un promotor PGK murino y un gen DasherGFP bajo el control de un promotor EF1a humano, con los dos promotores orientados de tal manera que su transcripción está en direcciones opuestas y divergentes. El polinucleótido de expresión se insertó entre pares putativos de extremos de transposones para crear una serie de transposones putativos. Los números de identidad de las secuencias los extremos del transposón se indican en las tablas. A continuación, los transposones se transfectaron solos en células CHO o se cotransfectaron con una transposasa. La relación de ADN de transposón a ADN que codifica transposasa se indica en las tablas.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 pg de ADN con Lipofectamine 2000 según el protocolo del fabricante. Se añadió medio con puromicina 72 horas después de la transfección. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y dos cambios de medio. La fluorescencia del reportero fluorescente que codifica el ORF DasherGFP (SEQ ID NO: 102) se midió a Ex/Em de 488/518 nm.
Una señal de fluorescencia que era más alta en las células que recibieron el transposón más la transposasa que el transposón solo indicó que la transposasa era capaz de reconocer los extremos del transposón y mejorar la integración en el ADN genómico, ya sea integrando más copias del ADN o integrando el ADN en lugares del genoma que eran más favorables para la expresión.
La Tabla 1 muestra que la expresión de un transposón que comprende los extremos del transposón Bombyx mori de SEQ ID NO: 1 y 2 aumenta aproximadamente 5 veces cuando el transposón se cotransfecta con un vector que codifica una transposasa de Bombyx mori de SEQ ID NO: 44. Las tablas 1 y 2 muestran que la expresión de un transposón que comprende los extremos del transposón de Xenopus tropicalis de SEQ ID NO: 5 y 6 aumenta entre un 50 % y 2,5 veces cuando el transposón se cotransfecta con un vector que codifica una transposasa de Xenopus tropicalis SEQ ID NO: 45 o 46, cuando la transposasa se fusionó con una señal de localización nuclear.
La identificación y ensayo de variantes hiperactivas de las transposasas identificadas también se contempla expresamente y es otro ejemplo de esta descripción.
6.1.2 Los elementos aislantes mejoran la expresión estable en células CHO
En algunas modalidades, un sistema de transferencia de genes comprende un polinucleótido que incluye elementos de control de la expresión y una secuencia que codifica un primer polipéptido a expresar. La expresión del polipéptido a expresar se puede incrementar en algunas configuraciones del sistema de transferencia de genes incorporando secuencias aislantes. En algunas modalidades, el polinucleótido y las secuencias aislantes son parte de un transposón y la expresión puede incrementarse adicionalmente por la acción de una transposasa.
La Tabla 3 muestra datos obtenidos de experimentos paralelos por triplicado que ensayan la expresión de un polinucleótido de expresión que comprende un gen de resistencia a puromicina bajo el control de un promotor PGK murino y un gen DasherGFP bajo el control de un segundo promotor como se indica en la tabla. El polinucleótido de expresión se insertó opcionalmente entre pares de secuencias aislantes como se indica en la tabla. Los polinucleótidos resultantes se insertaron luego entre pares de extremos del transposón como se indica en la tabla. A continuación, estos transposones se transfectaron en células CHO, solos o junto con una transposasa, como se indica en la tabla. Las transposasas en este ejemplo se fusionaron a una señal de localización nuclear heteróloga.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 pg de ADN con el reactivo Roche Extreme Gene 9 (relación 2:1) según el protocolo del fabricante. Se añadió medio con 5 pg/pl de puromicina 72 horas después de la transfección. La selección de puromicina se llevó a cabo durante 72 horas. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y cambios de medio. La fluorescencia representa la expresión del ORF que codifica el reportero fluorescente DasherGFP a partir de transposones integrados de forma estable y se midió a Ex/Em de 488/518 nm.
La Tabla 3 muestra que la presencia de aislantes HS4, ya sea la secuencia completa o solo la secuencia central, puede aumentar significativamente la expresión del transposón incluso en ausencia de una transposasa (por ejemplo, compare la Tabla 3 filas 1 y 3 o filas 5 y 9). Este efecto parece estar influenciado por el promotor que se usa para impulsar la expresión del polipéptido a expresar: en este contexto de vector, el aislante HS4 aumenta la expresión de un promotor EF1a en el transposón entre un 50 % y 4 veces, pero no hay efecto observado cuando el polipéptido a expresar está bajo el control del promotor de CMV (Tabla 3 filas 11, 13 y 15). En presencia de la transposasa, la expresión de casi todos los transposones aumentó, del 50 % a más de 10 veces. Los aumentos en la expresión del transposón como resultado de los aislantes y las transposasas parecieron ser sinérgicos. Las modalidades preferidas de los sistemas de transferencia de genes comprenden un gen que codifica una transposasa de Xenopus fusionada a una señal de localización nuclear y un transposón de Xenopus que comprende dos aislantes de HS4 o núcleo de HS4. Otros casos de sistemas de transferencia de genes comprenden un gen que codifica una transposasa de Bombyx fusionada a una señal de localización nuclear y un transposón de Bombyx que comprende dos aislantes de HS4 o núcleo HS4.
6.1.3 Las transposiciones se pueden proporcionar en cis o en trans
En algunas modalidades, un sistema de transferencia de genes comprende un transposón y una transposasa. El transposón comprende un polinucleótido heterólogo que incluye elementos de control de la expresión y una secuencia que codifica un primer polipéptido a expresar. En algunas modalidades, la transposasa está codificada en un vector polinucleotídico que también comprende el transposón.
La Tabla 4 muestra los datos obtenidos de experimentos paralelos por triplicado que ensayan la expresión de un polinucleótido de expresión que comprende un gen de resistencia a puromicina bajo el control de un promotor PGK murino y un gen DasherGFP bajo el control de un segundo promotor como se indica en la tabla. El gen DasherGFP va seguido de un elemento de exportación de ARN, como se indica en la tabla. El polinucleótido de expresión se insertó opcionalmente entre pares de secuencias aislantes como se indica en la tabla. Los polinucleótidos resultantes se insertaron luego entre pares de extremos del transposón como se ind ica en la tabla. Estos transposones se clonaron luego opcionalmente en vectores que también contenían un gen para la expresión de una transposasa, bajo el control de un promotor como se indica (P_Transposasa). Algunas transposasas se fusionaron a una señal de localización nuclear, como se indica en la tabla. Después, los transposones se transfectaron en células CHO, solos o junto con una transposasa, como se indica en la tabla.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 pg de ADN con el reactivo Roche Extreme Gene 9 (relación 2:1) según el protocolo del fabricante. Se añadió medio con 5 pg/pl de puromicina 72 horas después de la transfección. La selección de puromicina se llevó a cabo durante 72 horas. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y cambios de medio. La fluorescencia representa la expresión del ORF que codifica el reportero fluorescente DasherGFP a partir de transposones integrados de forma estable y se midió a Ex/Em de 488/518 nm.
La Tabla 4 muestra que la expresión de transposasa del mismo vector que contenía el transposón produjo niveles comparables de mejora de expresión a los aumentos de expresión obtenidos mediante la cotransfección de un segundo plásmido que lleva el gen de la transposasa. Esta mejora se observa en muchas configuraciones de vector diferentes, como se muestra en la tabla. Por tanto, la expresión de un transposón Bombyx mori (que no es de la invención) o un transposón de Xenopus tropicalis (de la invención) puede aumentarse mediante la acción de una transposasa que se proporciona en cis o en trans.
Los transposones descritos en la Tabla 4 también comprenden un elemento de exportación de ARN seleccionado de WPRE y HPRE; también comprenden el elemento de mejora de la expresión SARI. Las modalidades preferidas de los vectores de transferencia de genes comprenden uno o más de estos elementos.
6.1.4 Transposiciones con señales de localización nuclear
En algunas modalidades, un sistema de transferencia de genes comprende un transposón y una transposasa, donde la transposasa se fusiona con una señal de localización nuclear. El transposón comprende un polinucleótido heterólogo que incluye elementos de control de la expresión y una secuencia que codifica un primer polipéptido a expresar. Las células en las que se introdujeron el transposón y la transposasa fusionados a la señal de localización nuclear expresan niveles más altos del polipéptido a expresar que las células en las que solo se introdujo el transposón.
La Tabla 5 muestra los datos obtenidos de experimentos paralelos por triplicado que ensayan la expresión de un polinucleótido de expresión que comprende un gen de resistencia a puromicina bajo el control de un promotor PGK murino, con un gen DasherGFP acoplado traduccionalmente al gen de resistencia a puromicina a través de una secuencia CHYSEL. El polinucleótido de expresión se insertó entre pares putativos de extremos de transposones para crear una serie de transposones putativos. Los números de identidad de las secuencias los extremos del transposón se indican en las tablas. A continuación, los transposones se transfectaron solos en células CHO o se cotransfectaron con una transposasa fusionada a una secuencia de localización nuclear. La relación de ADN de transposón a ADN que codifica transposasa se indica en las tablas.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 pg de ADN con Lipofectamine 2000 según el protocolo del fabricante. Se añadió medio con puromicina 72 horas después de la transfección. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y dos cambios de medio. Se midió la fluorescencia del reportero fluorescente que codifica el ORF DasherGFP a Ex/Em de 488/518 nm.
Una señal de fluorescencia que fue más alta en las células que recibieron el transposón más la transposasa fusionada a la señal de localización nuclear que el transposón solo indicó que la transposasa fusionada a la señal de localización nuclear fue capaz de reconocer los extremos del transposón y mejorar la integración en el ADN genómico. ya sea integrando más copias del ADN o integrando el ADN en lugares del genoma que eran más favorables para la expresión.
Las transposasas de Trichoplusia ni piggyBac (no de la invención) y Bombyx mori (no de la invención) y Xenopus tropicalis (de la invención) fueron todas activas cuando se fusionaban con señales de localización nuclear en el extremo N (NLS). Una modalidad preferida de un sistema de transferencia de genes comprende un gen que codifica una transposasa que se fusiona con una señal de localización nuclear.
6.1.5 Integración estable en células embrionarias de riñón humano (HEK 293)
En algunas modalidades, el sistema de transferencia de genes comprende un transposón y una transposasa que se usan para integrar un polinucleótido de expresión en el genoma de una célula de mamífero; en algunas modalidades, la célula es una célula CHO, en algunas modalidades la célula es una célula HEK.
La Tabla 6 muestra los datos obtenidos de experimentos paralelos por triplicado que ensayan la expresión de un polinucleótido de expresión en un transposón Xenopus con extremos de SEQ ID NO: 9 y 6, que comprenden un gen de resistencia a puromicina bajo el control de un promotor PGK murino. El polinucleótido de expresión comprende además un gen DasherGFP unido operativamente a varios promotores, intrones, secuencias de exportación de ARN y secuencias de poliadenilación como se indica en la tabla. La transcripción de los dos promotores fue en direcciones opuestas y divergentes. A continuación, los transposones se transfectaron solos en células HEK o se cotransfectaron con un gen que codifica la transposasa de Xenopus de SEQ ID NO: 45 fusionado a una secuencia de localización nuclear.
Células HEK 293 se cultivaron en EMEM (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilina-estreptomicina (de ATCC) a 37 °C, 5 % de CO2 a 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 pg de ADN con el reactivo Roche Extreme Gene 9 (relación 2:1) según el protocolo del fabricante. Se añadió medio con 5 pg/pl de puromicina 72 horas después de la transfección. La selección de puromicina se llevó a cabo durante 72 horas y se pasó al medio completo menos puromicina. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y cambios de medio. La fluorescencia representa la expresión del ORF que codifica el reportero fluorescente DasherGFP a partir de transposones integrados de forma estable y se midió a Ex/Em de 488/518 nm.
Todas las configuraciones del vector de transferencia de genes probadas mostraron una expresión mejorada en las células HEK cuando se cotransfectó el gen de la transposasa. Las modalidades preferidas de un vector de transferencia de genes incluyen todas las configuraciones de vector que se muestran en la Tabla 6
6.1.6 Niveles de expresión de dos polipéptidos utilizando elementos IRES en expresión transitoria en HEK 293 y células CHO
En algunas modalidades, un sistema de transferencia de genes comprende genes que codifican dos polipéptidos. En algunas modalidades, los dos polipéptidos están codificados en un único polinucleótido. En algunas modalidades, los dos polipéptidos interactúan después de que se sintetizan. En algunas modalidades, las cantidades relativas de los dos polipéptidos expresados por una célula son importantes para el funcionamiento de los dos polipéptidos. En algunas modalidades, los dos polipéptidos son enzimas en una ruta. En algunas modalidades, los dos polipéptidos se unen entre sí o son subunidades de una molécula más grande; en algunas modalidades, los dos polipéptidos son las cadenas pesada y ligera de un anticuerpo.
Las tablas 7-11 muestran los niveles de expresión observados en células HEK y CHO para dos polipéptidos diferentes (en este caso, dos proteínas fluorescentes diferentes, Dasher GFP y CayenneRFP) codificadas en un único vector de transferencia de genes. Los genes de las dos proteínas diferentes se unieron operativamente a un solo potenciador, promotor, señal de poliadenilación y opcionalmente un intrón, como se indica en las tablas. La expresión de los dos genes se unió operativamente mediante un elemento IRES, como se indica en las tablas, siendo el orden de los elementos DasherGFP-IRES-CayenneRFP.
Se cultivaron células HEK 293a (de ATCC) en EMEM (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 a 80 % de confluencia, 1E+05 células se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó 0,5 pg de ADN con Lipofectamine 2000 según el protocolo del fabricante. Las células se recolectaron 72 horas después de la transfección. Se midió la fluorescencia de los dos ORF que codificaban los reporteros fluorescentes DasherGFP (SEQ ID NO: 102) y CayenneRFP (SEQ ID NO: 103) a Ex/Em de 488/518 nm para DasherGFP y Ex/Em de 525/580 nm para CayenneRFP.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó 0,5 pg de ADN con Lipofectamine 2000 según el protocolo del fabricante. Las células se recolectaron 72 horas después de la transfección. Se midió la fluorescencia de los dos ORF que codifican los reporteros fluorescentes DasherGFP y CayenneRFP a Ex/Em de 488/518 nm para DasherGFP y Ex/Em de 525/580 nm para CayenneRFP.
Los vectores de transferencia de genes que comprenden las dos proteínas acopladas traduccionalmente por una secuencia CHYSEL (por ejemplo, la construcción 135 171 en la Tabla 7) expresan las dos proteínas en una relación equimolar y pueden usarse para normalizar las diferentes intensidades fluorescentes de las proteínas. Las tablas 7­ 11 muestran que se pueden usar diferentes elementos de IRES para obtener diferentes proporciones de expresión entre dos polinucleótidos diferentes en una variedad de configuraciones de vector. El uso de elementos IRES es particularmente ventajoso para la expresión de polipéptidos cuando la proporción de expresión es importante a nivel de células individuales, por ejemplo, en la expresión de anticuerpos donde a menudo se piensa que la cadena ligera realiza una función de chaperonina para la cadena pesada.
Identificamos elementos IRES que muestran diferentes niveles de actividad como se ve a partir de los diferentes niveles de expresión para los dos marcos abiertos de lectura (ORF) enlazados por un elemento IRES (Tablas 7-11). Una elección de elementos IRES con diferentes actividades permite utilizar el elemento IRES apropiado para controlar los niveles de expresión relativos de dos ORF. Esto es especialmente útil para la expresión de anticuerpos en los que las relaciones de expresión de la cadena pesada a la cadena ligera influyen en el ensamblaje adecuado del anticuerpo funcional. El uso de los elementos IRES identificados para la expresión de anticuerpos es un aspecto importante de esta invención. Hemos demostrado el uso de un elemento IRES que une dos transcripciones operativamente unidas a un promotor, de manera similar, se contempla expresamente el uso de dos o más elementos IRES que unen tres o más ORF y es otro aspecto de la invención. Las construcciones de expresión con dos o más elementos IRES seleccionados de manera que los niveles de transcripción de dos o más ORF se modulan selectivamente se contemplan expresamente y son un aspecto importante de la invención. Los elementos IRES identificados de la invención funcionan bien en vectores de integración transitorios y estables en las dos líneas celulares probadas, células embrionarias de riñón humano (HEK293 y células de ovario de hámster chino (CHO). Las modalidades preferidas de un vector de transferencia de genes incluyen todas las configuraciones de vector mostradas en las Tablas 7-11, y todos los elementos IRES mostrados en estas tablas.
6.1.7 Expresión de anticuerpos utilizando elementos IRES en células HEK 293 transfectadas de forma transitoria
En algunas modalidades, el sistema de transferencia de genes se usa para expresar un anticuerpo. En algunas modalidades, los genes que codifican las dos cadenas de anticuerpos están operativamente unidos a promotores separados. En algunas modalidades, los genes que codifican las dos cadenas están operativamente unidos al mismo promotor y entre sí mediante un elemento de acoplamiento traduccional, en algunas modalidades el elemento de acoplamiento traduccional es una secuencia de IRES o CHYSEL.
La Tabla 12 muestra una variedad de configuraciones de vector que expresan dos cadenas de anticuerpos de un único vector de transferencia de genes. En algunas configuraciones, los genes que codifican las dos cadenas estaban unido operativamente a promotores separados y señales de poliadenilación; en algunas configuraciones, los genes estaban unido operativamente a un único promotor que precede al primer gen y a una única señal poliA después del segundo gen, donde los dos genes son unidos operativamente por una secuencia IRES. El número 1 indica los promotores que preceden o las señales poliA que siguen al primer gen, el número 2 indica los promotores que preceden o las señales poliA que siguen al segundo gen.
Todos estos vectores comprenden además una secuencia de amplificación viral que codifica el antígeno SV40T y el origen de replicación de SV40. La expresión de anticuerpos de estos vectores de transferencia de genes se midió mediante ELISA y se comparó con la expresión obtenida por cotransfección de dos vectores de transferencia de genes, uno que codifica la cadena pesada y el otro que codifica la cadena ligera, transfectados en diferentes proporciones como se indica en la tabla.
Se cultivaron células HEK 293a (de ATCC) en EMEM (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 a 80 % de confluencia, 1E+05 células se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó 0,5 pg de ADN con Lipofectamine 2000 según el protocolo del fabricante. Las células se recolectaron 72 horas después de la transfección. Los sobrenadantes del cultivo se recolectaron y usaron en un ensayo ELISA para la cuantificación de la cadena pesada (HC) (Tabla 12) y se procesaron en un gel para una transferencia Western para la detección de las cadenas pesada y ligera (datos no mostrados).
Placas ELISA de 96 pocilios (Núm. De cat. M9410, Sigma) se recubrieron con 50 |jl por pocilio de anticuerpo de cabra anti-IgG humana (específico de Fc) (Núm. de cat. 12136, Sigma) a 1 jg/m l en 1XPBS (Núm. de cat. P-7059, Sigma) y se incubó durante la noche a 4 °C. Las placas se lavaron 4 veces con 300 j l de PBST por pocillo (Núm. de cat. P3563, Sigma) y se bloquearon con 300 j l por pocillo de solución ELISA Block (PBST BSA al 1 % (Núm. de cat.
85040C), Sigma) durante 1 hora a temperatura ambiente. Se eliminó la solución ELISA Block y se añadieron a las placas los sobrenadantes de cultivo de las transfecciones transitorias anteriores diluidas en la solución ELISA Block a diluciones comprendidas entre 1:50 y 1:200 000 a 100 j l por pocillo y se incubaron durante 1 hora a temperatura ambiente. Las placas se lavaron 4 veces con 300 pl por pocillo de PBST (Sigma) y el anticuerpo se detectó mediante incubación con 100 pl/pocillo (0,16 pg/ml) de anti-IgG humana de cabra conjugada con HRP (específico de Fab) (Núm. de cat. 31482, Thermo Scientific) en solución ELISA Block durante 1 hora a temperatura ambiente. Las placas se lavaron 4 veces con 300 pl por pocillo de PBST (Sigma) y se midió la IgG antihumana de cabra HRP unida mediante la adición de 100 pl/pocillo de sustrato de peroxidasa fluorogénica QuantaBlu (Núm. De cat. 15162, Thermo Scientific). Las placas se incubaron durante 5 minutos a temperatura ambiente, la reacción se detuvo agregando 100 jl/pocillo de solución de parada (Núm. de cat. 15162, Thermo Scientific) y la fluorescencia se midió usando un fluorímetro a excitación (Ex) 325 nm y emisión (Em) 420 nm. La concentración de anticuerpo se calculó comparándola con una curva estándar generada usando diluciones de IgG humana purificada (Thermo Scientific) usando un ajuste de curva logística de 4 parámetros. Las concentraciones de IgG calculadas que se muestran en la Tabla 12 coincidieron bien con la cuantificación de la transferencia Western (datos no mostrados).
La Tabla 12 muestra que muchas configuraciones de vectores de transferencia de genes que utilizan promotores duales o elementos IREs producen una expresión de anticuerpos comparable o mejor que la cotransfección de dos vectores de transferencia de genes separados. Las modalidades preferidas de un vector de transferencia de genes incluyen todas las configuraciones de vector mostradas en la Tabla 12 y todos los elementos IRES mostrados en las Tablas 7-11.
El uso de secuencias IRES que pueden producir diferentes niveles de expresión del segundo polipéptido en relación con el primero tiene ventajas sobre los métodos en los que se usan transfecciones duales. En el caso de la cotransfección, las células individuales absorben diferentes números de cada plásmido. Debido a que solo es posible controlar el número promedio de cada plásmido absorbido por cada célula, muchas células no terminan expresando la proporción óptima de cadena pesada y ligera. Este problema se amplifica en el caso de líneas celulares estables, porque existe la variable adicional de ubicación de integración que también afecta a los niveles de expresión. El uso de secuencias IRES para controlar los niveles de expresión de dos o más ORF, en particular la expresión de ORF que codifican cadenas pesadas y ligeras en vectores de expresión de integración estable, se contempla expresamente y es un aspecto importante de la invención.
6.1.8 Expresión de dos ORF enlazados por elementos IRES en células CHO transfectadas de manera estable
En algunas modalidades, un sistema de transferencia de genes comprende genes que codifican dos polipéptidos codificados en un único polinucleótido para integrarse de manera estable en el genoma de una célula. En algunas modalidades, el polinucleótido comprende un transposón. En algunas modalidades, los dos polipéptidos son las cadenas pesada y ligera de un anticuerpo.
La Tabla 13 muestra las configuraciones de un conjunto de transposones que comprenden extremos de transposones de SEQ ID NO: 9 y 6. Los transposones comprenden genes que codifican DasherGFP y/o CayenneRFP como se indica en la tabla. En algunas configuraciones, cada uno de los dos genes estaba unido operativamente a promotores separados y señales de poliadenilación, en algunas configuraciones los genes estaban unido operativamente a un solo promotor que precede al primer gen y a una única señal poliA después del segundo gen, donde los dos genes están unidos operativamente por una secuencia IRES. El número 1 indica los promotores que preceden o las señales poliA que siguen al primer gen, el número 2 indica los promotores que preceden o las señales poliA que siguen al segundo gen. Todas estas secuencias comprenden además una secuencia de SAR y una secuencia de HPRE que sigue al segundo gen y precede al poliA2. Los transposones se transfectaron en células CHO, solos o junto con un gen que codifica una transposasa (SEQ ID NO: 45) fusionada a una señal de localización nuclear.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 jg de ADN con el reactivo Roche Extreme Gene 9 (relación 2:1) según el protocolo del fabricante. Se añadió medio con 5 pg/pl de puromicina 72 horas después de la transfección. La selección de puromicina se llevó a cabo durante 72 horas. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y cambios de medio. La fluorescencia representa la expresión de los ORF que codifican el reportero fluorescente DasherGFP a partir de transposones integrados establemente medidos a Ex/Em de 488/518 nm y CayenneRFP se midió a Ex/Em de 525/580 nm.
La cotransfección de transposones con el vector que codifica la transposasa aumentó la expresión de ambas proteínas codificadas por el transposón entre 4 y casi 20 veces en relación con las transfecciones con el transposón solo. Un transposón que comprende genes que codifican dos polipéptidos y un gen que codifica una transposasa fusionada a una señal de localización nuclear es una modalidad preferida de un sistema de transferencia de genes. Las configuraciones que se muestran en la Tabla 13 son modalidades preferidas.
La Figura 4 muestra el análisis FACS de poblaciones de células transfectadas con los sistemas de transferencia de genes descritos en la Tabla 13, filas 3 y 4.
6.1.9 Integración estable de transposones en células de ovario de hámster chino (CHO)
En algunas modalidades, un sistema de transferencia de genes comprende un transposón y una transposasa. El transposón comprende un polinucleótido de expresión heterólogo que incluye elementos de control de la expresión y una secuencia que codifica un primer polipéptido a expresar. Las células en las que se introdujeron el transposón y la transposasa expresan niveles más altos del polipéptido a expresar que las células en las que sólo se introdujo el transposón. En algunas modalidades, la célula es una célula de mamífero, en algunas modalidades la célula es una célula CHO o una célula HEK.
La Tabla 14 muestra un conjunto de configuraciones de vectores de transferencia de genes para la expresión de DasherGFP. Cada vector comprende los extremos de transposón de SEQ ID NO: 9 y 6. Todas estas secuencias excepto la 192462 comprenden además una secuencia de SAR y una secuencia de HPRE siguiendo la secuencia que codifica DasherGFP. Todas estas secuencias comprenden además una secuencia poliA de globina de conejo. Algunos transposones comprenden además un par de secuencias aislantes HS4 entre los extremos del transposón, como se indica en la tabla. Los transposones se transfectaron en células CHO, solos o junto con un gen que codifica una transposasa (SEQ ID NO: 45) fusionada a una señal de localización nuclear.
Se cultivaron y transfectaron células de ovario de hámster chino (CHO) como se describe en el Ejemplo 6.2 anterior.
La Tabla 14 muestra que la expresión del transposón se incrementó para cada configuración probada mediante cotransfección con un gen que codifica la transposasa. Los aumentos de expresión fueron de entre 2 y 80 veces. Los sistemas de transferencia de genes que comprenden una transposasa y un transposón con una configuración que se muestra en la Tabla 14 son modalidades preferidas de la invención.
La Figura 3 muestra un análisis FACS de las mismas poblaciones de células transfectadas de forma estable como se muestra en la Tabla 14. FACS muestra el nivel de expresión de DasherGFP en células individuales en la población transfectada de forma estable. La Figura 3 muestra que para cada vector de transferencia de genes en el conjunto, la transposasa provoca un cambio de una parte de la población del grupo de baja expresión al grupo de alta expresión. Esto puede ser causado por un aumento en el número de copias del transposón que se han integrado de manera estable, o puede ser causado por la integración del transposón en loci genómicos que dan como resultado una capacidad de expresión mejorada.
Hemos mostrado configuraciones preferidas de elementos de vector que incluyen potenciadores, promotores, intrones, 5' UTR, secuencias de exportación de ARN, poli A y aislantes que contribuyen a la actividad de expresión vista a partir de transposones integrados. Otras configuraciones de vector de los elementos de control mostrados en las Tablas 15­ 18, colocadas en un contexto de transposón para una integración estable, también son modalidades preferidas.
En una modalidad preferida para la integración estable en un genoma de mamífero, un vector de transferencia de genes comprende un transposón para la expresión de un primer polinucleótido, en el que la expresión del primer polinucleótido está operativamente ligada a un promotor de mamífero seleccionado entre los EF1a (factor de elongación de traducción 1a) promotor de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos; el promotor de CMV (citomegalovirus); el promotor de GAPDH (gliceraldehído-3-fosfato deshidrogenasa) de cualquier especie de mamífero; los promotores virales MC1 y HSV-TK (timidina quinasa del virus del herpes simple); el promotor de actina de cualquier especie de mamífero o ave que incluye pero no se limita a ser humano, rata, ratón, pollo y hámster chino; el promotor de PGK (fosfoglicerato quinasa) de cualquier especie de mamífero o ave que incluye, pero no se limita a, ser humano, rata, ratón, pollo y hámster chino; el promotor de SV40 (virus Simian 40 y el promotor de ubiquitina. En modalidades preferidas, el promotor puede estar unido operativamente a un potenciador seleccionado entre el potenciador temprano inmediato de CMV, el potenciador EF1a (por ejemplo, pero no limitado a la SEQ ID NO: 116), el potenciador de proteína tardía principal adenoviral (por ejemplo, pero no limitado a la SEQ ID NO: 118), el potenciador de SV40 (por ejemplo, pero no limitado a la SEQ ID NO: 117), y un LTR retroviral. En modalidades preferidas adicionales, la expresión del primer polinucleótido está operativamente unida a un intrón seleccionado entre un intrón de CMV (citomegalovirus), que incluye los intrones A, B y C de CMV; un intrón EF1a (factor de elongación de traducción 1a) de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos; el intrón de actina de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos; un intrón de GAPDH (gliceraldehído-3-fosfato deshidrogenasa) de cualquier especie de mamífero o ave, incluyendo, entre otros, humanos, ratas, ratones, pollos y hámsteres chinos; intrones sintéticos (por ejemplo, pero no limitado a la SEQ ID NO: 119) e intrones naturales quiméricos (por ejemplo, la SEQ ID NO: 123). En modalidades preferidas adicionales, la expresión del primer polinucleótido está operativamente ligada a un elemento de exportación de ARN (por ejemplo, pero no limitado a SEQ ID NO: 104-107), una secuencia aislante (por ejemplo, pero no limitado a las SEQ ID NO: 112-113), o un elemento potenciador de la expresión (por ejemplo, pero no limitado a la SEQ ID NO: 108-111).
Independientemente de su mecanismo real, hemos demostrado que la incorporación de elementos potenciadores de la expresión en vectores de transferencia de genes con extremos de transposón mejora enormemente la expresión de proteínas de estos vectores, tanto en ausencia como en presencia de transposasa.
Además de los elementos del vector dentro del transposón, el uso de elementos del vector ubicados en el vector de manera que estos elementos no sean transpuestos por la transposasa, por ejemplo, elementos de replicación viral como el origen de replicación de SV40 (ori de SV40 con el antígeno T grande de SV40 y EBV (virus de Epstein Barr) oriP con EBNA (antígeno nuclear de Epstein-Barr) es otro aspecto de la invención.
6.1.10 Creación y ensayo de combinaciones de elementos vectoriales en células HEK y CHO transfectadas de forma transitoria (ejemplo de referencia)
En algunos casos, las configuraciones preferidas de los elementos de control de la expresión en un vector de transferencia de genes se determinan creando un conjunto de vectores que comprenden diferentes combinaciones de elementos y luego midiendo la expresión del conjunto. En casos preferidos, el conjunto comprende entre 5 y 200 miembros, en casos preferidos el conjunto comprende entre 10 y 100 miembros, en casos preferidos el conjunto comprende entre 15 y 60 miembros.
Se diseñaron 48 vectores de manera que el conjunto de vectores comprendiera 3 elementos potenciadores diferentes (CMV, SV40, ninguno); 9 elementos promotores diferentes (CMV, Ub-B, SV40, PGK, MC1, HSV-TK, GAPDH, EF1a, actina de pollo); 10 elementos intrón diferentes (intrón a de CMV, intrón c de CMV, actina de pollo (parcial), GAPDH, actina de pollo/conejo, EF1a-v1, EF1a-v2, EF1a híbrido, sintético y ninguno); 2 UTR 5 'diferentes (CMV y ninguno); 7 secuencias de poliadenilación diferentes (SV40 tardío, SV40 temprano, hormona del crecimiento bovino, sintético, beta globina humana, beta globina de conejo, HSV-TK); 3 orígenes de replicación viral diferentes (virus de Epstein Barr oriP, ori de SV40 y ninguno) y 3 proteínas de replicación viral diferentes (virus de Epstein Barr EBNA, antígeno T de SV40 y ninguno). Las combinaciones específicas del conjunto se muestran en la Tabla 15. El número total de combinaciones posibles de estos elementos es 34020.
Se clonó Dasher GFP en cada uno de los vectores y cada construcción se transfectó por triplicado en células HEK y células CHO. Las células se sembraron en placas de 24 pocillos en DMEM (a Tc C) 10 % FBS penicilina/estreptomicina para células HEK293a y F12K (ATCC) 10 % FBS penicilina/estreptomicina para células CHO-K1 y se cultivaron durante 24 horas hasta aproximadamente 70-80 % de confluencia. Las células se transfectaron por duplicado en placas de 24 pocillos usando 1 pl de Lipofectamine 2000 por 0,5 pg de ADN. Después de 72 horas, las células se lisaron usando 200 pl/pocillo de reactivo de extracción de proteínas de mamíferos M-PER (Thermo Scientific Pierce®) y se midió la fluorescencia total en un lector de placas de fluorescencia a longitudes de onda de excitación/emisión de 505/525 nm. Las lecturas de fluorescencia promedio se muestran en la Tabla 19.
Se construyeron modelos de regresión de mínimos cuadrados parciales a partir de los datos de fluorescencia, y se calcularon los pesos de regresión para cada uno de los elementos de secuencia. Los pesos de regresión indican la importancia del elemento para el desempeño del vector. Está claro que algunos elementos o combinaciones de elementos son más favorables para la expresión tanto en HEK como en CHO (potenciador, promotor e intrón a de CMV, por ejemplo); algunos elementos son más favorables para la expresión en HEK pero menos favorables para la expresión en CHO (ori de SV40 más antígeno T de SV40, señal de poliadenilación de HSVTK, oriP de EBV); algunos elementos son más favorables para la expresión en CHO, pero menos favorables para la expresión en HEK (promotor de GAPDH, señal de poliadenilación de beta globina humana); algunos elementos son menos favorables para la expresión en HEK o c Ho (señal de poliadenilación tardía de SV40, promotor de HSV-TK).
Particularmente favorables para la expresión en células HEK fueron los vectores que contenían el origen de replicación de SV40 y el antígeno T de SV40. Estos fueron incluso más eficaces cuando se combinaron con el potenciador de CMV más el promotor de actina de pollo más el intrón de actina de pollo/conejo, o el potenciador de CMV con el promotor de CMV con el intrón a de CMV. Particularmente favorables para la expresión en células CHO fueron los vectores que carecían de cualquier secuencia de replicación viral. Las configuraciones de vector mostradas en la Tabla 15 son ejemplos preferidos de la presente descripción.
6.1.11 Creación y prueba de un segundo conjunto de combinaciones de elementos de vectores en células HEK y CHO transfectadas de forma transitoria (ejemplo de referencia)
En algunos casos, las configuraciones preferidas de los elementos de control de la expresión en un vector de transferencia de genes se determinan creando un conjunto de vectores que comprenden diferentes combinaciones de elementos, midiendo la expresión del conjunto y luego diseñando un segundo conjunto de vectores en el que los elementos más favorables para la expresión del primer conjunto se retienen y recombinan y, opcionalmente, se agregan nuevos elementos al nuevo conjunto de vectores. En casos preferidos, el segundo conjunto comprende entre 5 y 200 miembros, en casos preferidos el segundo conjunto comprende entre 10 y 100 miembros, en casos preferidos el segundo conjunto comprende entre 15 y 60 miembros.
Se diseñaron 48 vectores de manera que el conjunto de vectores comprendiera 4 elementos potenciadores diferentes (CMV, sintético, EF1a, ninguno); 4 elementos promotores diferentes (CMV, GAPDH, EF1a, EF1a_LTR-HTLV); 6 elementos intrónicos diferentes (intrón a de CMV, intrón c de CMV, GAPDH, actina de pollo/conejo, EF1a y ninguno); 8 UTR 5 'diferentes (CMV, virus de la necrosis del tabaco satélite (sTNV), beta globina humana, poliedrina, virus de la necrosis del tabaco (TNV), virus de la enana amarilla de la cebada (BYDV), globina de Xenopus y ninguno); 63'UTR diferentes (virus de la necrosis del tabaco satélite (sTNV), poliedrina, virus de la necrosis del tabaco (TNV), virus de la enana amarilla de la cebada (BYDV), globina de Xenopus y ninguno); 6 secuencias de poliadenilación diferentes (hormona de crecimiento bovina, hormona de crecimiento bovina más terminador de gastrina, beta globina de conejo, beta globina de conejo más terminador de gastrina, HSV-TK, HSV-TK más terminador de gastrina); 3 orígenes de replicación viral diferentes (virus de Epstein Barr oriP, ori de SV40 y ninguno) y 3 proteínas de replicación viral diferentes (virus de Epstein Barr EBNA, antígeno T de SV40 y ninguno). Las combinaciones específicas del conjunto se muestran en la Tabla 16. El número total de combinaciones posibles de estos elementos es 248832.
Se clonó Dasher GFP en cada uno de los vectores y cada construcción se transfectó por triplicado en células HEK y células CHO. Las células se sembraron en placas de 24 pocillos en DMe M (a Tc C) 10 % FBS penicilina/estreptomicina para células HEK293a y F12K (ATCC) 10 % FBS penicilina/estreptomicina para células CHO-K1 y se cultivaron durante 24 horas hasta aproximadamente 70-80 % de confluencia. Las células se transfectaron por duplicado en placas de 24 pocillos usando 1 pl de Lipofectamine 2000 por 0,5 pg de ADN. Después de 72 horas, las células se lisaron usando 200 pl/pocillo de reactivo de extracción de proteínas de mamíferos M-PER (Thermo Scientific Pierce®) y se midió la fluorescencia total en un lector de placas de fluorescencia a longitudes de onda de excitación/emisión de 505/525 nm. Las lecturas de fluorescencia promedio relativas a las construcciones de control se muestran en la Tabla 20.
Se construyeron modelos de regresión de mínimos cuadrados parciales a partir de los datos de fluorescencia y se calcularon de nuevo los pesos de regresión para cada uno de los elementos de secuencia. De nuevo, algunos elementos son más favorables para la expresión tanto en HEK como en CHO, algunos elementos son más favorables para la expresión en HEK, pero menos favorables en CHO, algunos elementos son más favorables para la expresión en CHO, pero menos favorables en HEK y algunos elementos son menos favorables para expresión tanto en HEK como en CHO.
Particularmente favorables para la expresión en células HEK fueron los vectores que combinaron el potenciador de CMV con el promotor de CMV, el intrón a o el intrón c de CMV, y la señal de poliadenilación de beta globina de conejo o la señal de poliadenilación de HSV-TK más el terminador de gastrina. Incluso combinaciones más favorables también incluyeron el origen de replicación de SV40 y el antígeno T de SV40. Las configuraciones de vector mostradas en la Tabla 16 son ejemplos preferidos de la presente descripción.
6.1.12 Creación y ensayo de un conjunto de combinaciones de elementos de vectores en células CHO transfectadas de forma transitoria (ejemplo de referencia)
En algunos casos, las configuraciones preferidas de los elementos de control de la expresión en un vector de transferencia de genes se determinan creando un conjunto de vectores que comprenden diferentes combinaciones de elementos, midiendo la expresión del conjunto y luego diseñando un segundo conjunto de vectores en el que los elementos más favorables para la expresión del primer conjunto se retienen y recombinan y, opcionalmente, se agregan nuevos elementos al nuevo conjunto de vectores. En algunos casos, este proceso se repite.
Los elementos más favorables para CHO se seleccionaron para crear un tercer conjunto de vectores como se muestra en la Tabla 17. Se clonó Dasher GFP en cada uno de los vectores y cada construcción se transfectó por triplicado en células CHO. Las células se sembraron en placas de 24 pocillos en DMEM (ATCC) 10 % FBS penicilina/estreptomicina para células HEK293a y F12K (ATCC) 10 % FBS penicilina/estreptomicina para células CHO-K1 y se cultivaron durante 24 horas hasta aproximadamente 70-80 % de confluencia. Las células se transfectaron por duplicado en placas de 24 pocillos usando 1 pl de Lipofectamine 2000 por 0,5 pg de ADN. Después de 72 horas, las células se lisaron usando 200 pl/pocillo de reactivo de extracción de proteínas de mamíferos M-PER (Thermo Scientific Pierce®) y se midió la fluorescencia total en un lector de placas de fluorescencia a longitudes de onda de excitación/emisión de 505/525 nm. Las lecturas de fluorescencia promedio en relación con las construcciones de control se muestran en la Tabla 17.
Las configuraciones de vector que se muestran en la Tabla 17 son ejemplos preferidos de la descripción. Los elementos del vector particularmente favorables para la expresión en CHO incluyen el potenciador de CMV junto con el promotor de CMV, el promotor de GAPDH y el promotor de actina. La expresión se potencia con el intrón GAPDH, el intrón A del CMV o el intrón C del CMV o el potenciador de la proteína tardía principal adenoviral.
6.1.13 Creación y ensayo de un conjunto de combinaciones de elementos de vectores en células CHO transfectadas de manera estable (ejemplo de referencia)
En algunos casos, un vector de transferencia de genes comprende un elemento de exportación de ARN. La Tabla 18 muestra un conjunto de diferentes configuraciones de vector. Los vectores comprenden además una secuencia de SAR. Se clonó un gen que codifica DasherGFP en los vectores, se transfectó de manera estable en células CHO y se midió la expresión de Dasher GFP. Los transposones no se cotransfectaron con transposasas.
Células CHO-K1 (de ATCC) se cultivaron en F12-K (de ATCC) 10 % de FBS (de ATCC) 1 % de penicilinaestreptomicina (de ATCC) a 37 °C, 5 % de CO2 al 80 % de confluencia. Las células 5E+05 se sembraron en placas de cultivo de tejidos de 24 pocillos y se incubaron a 37 °C, 5 % de CO2 durante 24 horas antes de la transfección, las transfecciones se establecieron por triplicado. Cada transfección utilizó un total de 0,5 |jg de ADN con el reactivo Roche Extreme Gene 9 (relación 2:1) según el protocolo del fabricante. Se añadió medio con 5 pg/pl de puromicina 72 horas después de la transfección. La selección de puromicina se llevó a cabo durante 72 horas. Las células se cultivaron durante 14 días después de la selección con puromicina con dos pases y cambios de medio. La fluorescencia representa la expresión de los ORF que codifican el reportero fluorescente DasherGFP a partir de transposones integrados de forma estable medidos a Ex/Em de 488/518 nm.
Particularmente favorables para la expresión en células CHO transfectadas de forma estable fueron los vectores que combinaron los elementos de exportación de ARN de SAR más HPRE. Incluso combinaciones más favorables también incluyeron el promotor EF1a o aislantes HS4. Particularmente favorables para la expresión en células HEK transfectadas de forma estable fueron los vectores que combinaron los elementos de exportación de ARN SAR más HPRE o SAR más AGS_1 o SAR más AGS_3.
6.1.14 Selección de elementos de vectores preferidos por diferentes sistemas de expresión (ejemplo de referencia)
En algunos casos, se prueba un conjunto de vectores de transferencia de genes para determinar una propiedad de expresión de un primer polinucleótido en un sistema de expresión. En algunos casos, se construye un modelo de secuencia-actividad entre una propiedad de expresión y la configuración del elemento en los vectores de transferencia de genes. En algunos casos, el sistema de expresión es una célula de mamífero, en algunos casos la célula de mamífero es una célula humana o una célula de roedor, en algunos casos la célula de mamífero es una célula HEK293 o una célula de ovario de hámster chino.
Se construyó un modelo que relaciona los elementos de los vectores de transferencia de genes mostrados en la Tabla 15 y los datos de expresión mostrados en la Tabla 19 usando regresión de mínimos cuadrados parciales. En la Figura 5 se muestra una comparación entre la propiedad de expresión medida y la propiedad de expresión predicha. La Tabla 21 muestra los pesos de regresión para cada elemento o combinación de elementos calculados a partir del modelo para los sistemas de expresión HEK y CHO.
La Tabla 21 muestra que diferentes combinaciones de elementos son más favorables en diferentes sistemas de expresión. Los elementos pueden seleccionarse o rechazarse para incorporarlos a nuevas configuraciones de vector, según los pesos de regresión del modelo. Por ejemplo, el sistema de amplificación viral SV40 es muy favorable para la expresión en un sistema de expresión HEK (peso de regresión 2679) pero desfavorable para un sistema CHO (peso de regresión -113). Por tanto, las secuencias de replicación de SV40 se incluyeron en un nuevo conjunto de vectores diseñados para HEK (Tabla 16) pero no en un nuevo conjunto de vectores diseñados para CHO (Tabla 17). El modelo también indica que hay algunas señales de poliA que son favorables para ambos sistemas (por ejemplo, la secuencia de beta globina de conejo y algunas que son menos favorables (la señal de poliadenilación tardía de SV40).
Breve descripción de las tablas
Tabla 1. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones que comprenden un casete de expresión para DasherGFP, y con secuencias de los extremos del transposón como se identifica en las columnas D y E, se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (columna G) en una proporción predeterminada (columna C). Se seleccionaron las células y se midió la expresión de DasherGFP (columnas IK) como se describe en el Ejemplo 6.1.1.
Tabla 2. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones que comprenden un casete de expresión para DasherGFP, y con secuencias de los extremos del transposón como se identifica en las columnas D y E, se transfectaron en células CHO, opcionalmente en una proporción predeterminada (columna C) junto con un gen que codifica una transposasa (columna G) que se fusionó opcionalmente a una secuencia de localización nuclear heteróloga (columna H). Se seleccionaron las células y se midió la expresión de DasherGFP (columnas I y J) como se describe en el Ejemplo 6.1.1.
Tabla 3. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones comprenden secuencias de los extremos de los transposones (columnas B y C), un casete de expresión con un promotor (columna E) unido operativamente a un gen que codifica DasherGFP y, opcionalmente, secuencias aislantes a ambos lados del casete de expresión Dasher (columna F). Los transposones se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (columna G) fusionada a una señal de localización nuclear heteróloga. Se seleccionaron las células y se midió la expresión de las columnas HJ) de DasherGFP como se describe en el Ejemplo 6.1.2.
Tabla 4. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones comprenden secuencias de los extremos de los transposones (columnas B y C), un casete de expresión con un promotor (columna E) y un elemento para mejorar la exportación de ARN (columna F) unido operativamente a un gen que codifica DasherGFP y, opcionalmente, secuencias aislantes a ambos lados del Casete de expresión de Dasher (columna G). Los transposones se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (columna H) opcionalmente fusionada a una señal de localización nuclear heteróloga (columna L) y operativamente enlazada a un promotor (columna K). En algunas configuraciones, un único polinucleótido comprende el transposón y el gen que codifica la transposasa (columna J). Se seleccionaron las células y se midió la expresión de DasherGFP (columnas MO) como se describe en el Ejemplo 6.1.3.
Tabla 5. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones que comprenden un casete de expresión para DasherGFP, y con secuencias de los extremos del transposón como se identifica en las columnas C y D, se transfectaron en células CHO, opcionalmente en una proporción predeterminada (columna B) junto con un gen que codifica una transposasa (columna F) que se fusionó opcionalmente a una secuencia de localización nuclear heteróloga (columna G). Se seleccionaron las células y se midió la expresión de DasherGFP (columnas HJ) como se describe en el Ejemplo 6.1.4.
Tabla 6. Expresión de sistemas de transferencia de genes que comprenden transposones y transposasas. Los transposones comprenden secuencias de los extremos de los transposones de SEQ ID NO. 9 y SEQ ID NO. 6, y un casete de expresión con un potenciador (columna C), promotor (columna D), intrón (columna E), elemento para mejorar la exportación de ARN (columna F) y secuencia de poliadenilación (columna G) unida operativamente a un gen que codifica DasherGFP. Los transposones se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (SEQ ID NO. 45) fusionado a una señal de localización nuclear heteróloga. Se seleccionaron las células y se midió la expresión de DasherGFP (columnas H e I, sin transposasa, columnas J y K más transposasa) como se describe en el Ejemplo 6.1.5.
Tabla 7. Expresión de sistemas de transferencia de genes que comprenden genes que codifican dos polipéptidos unidos por elementos de acoplamiento traduccional. Los vectores de transferencia de genes comprenden un potenciador (columna E), un promotor (columna F), un intrón (columna G) y una señal de poliadenilación (columna I) operativamente unida a un gen que codifica DasherGFP (filas 1 y 3-22) o CayenneRFP (fila 2). Para las filas 3 a 22, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna H). Los vectores se transfectaron en células HEK293 (columnas JM) o células CHO (columnas NQ) y se midió la expresión de las proteínas fluorescentes como se describe en el Ejemplo 6.1.6.
Tabla 8. Expresión de sistemas de transferencia de genes que comprenden genes que codifican dos polipéptidos unidos por elementos de acoplamiento traduccional. Los vectores de transferencia de genes comprenden un potenciador (columna E), un promotor (columna F), un intrón (columna G) y una señal de poliadenilación (columna I) unida operativamente a un gen que codifica DasherGFP (filas 1-27 y 29) o CayenneRFP (fila 28). Para las filas 1-27, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna H). Los vectores se transfectaron en células HEK293 (columnas JM) o células CHO (columnas NQ) y se midió la expresión de las proteínas fluorescentes como se describe en el Ejemplo 6.1.6.
Tabla 9. Expresión de sistemas de transferencia de genes que comprenden genes que codifican dos polipéptidos unidos por elementos de acoplamiento traduccional. Los vectores de transferencia de genes comprenden un potenciador (columna E), un promotor (columna F), un intrón (columna G) y una señal de poliadenilación (columna I) unida operativamente a un gen que codifica DasherGFP (filas 1-20) o CayenneRFP (fila 21). Para las filas 1 a 19, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna H). Los vectores se transfectaron en células CHO y se midió la expresión de las proteínas fluorescentes (columnas JM) como se describe en el Ejemplo 6.1.6.
Tabla 10. Expresión de sistemas de transferencia de genes que comprenden genes que codifican dos polipéptidos unidos por elementos de acoplamiento traduccional. Los vectores de transferencia de genes comprenden un potenciador (columna E), un promotor (columna F), un intrón (columna G) y una señal de poliadenilación (columna I) unida operativamente a un gen que codifica DasherGFP (filas 1-22) o CayenneRFP (fila 23). Para las filas 1-21, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna H). Los vectores se transfectaron en células HEK293 (columnas JM) o células CHO (columnas NQ) y se midió la expresión de las proteínas fluorescentes como se describe en el Ejemplo 6.1.6.
Tabla 11. Expresión de sistemas de transferencia de genes que comprenden genes que codifican dos polipéptidos unidos por elementos de acoplamiento traduccional. Los vectores de transferencia de genes comprenden un potenciador (columna E), un promotor (columna F), un intrón (columna G) y una señal de poliadenilación (columna I) unida operativamente a un gen que codifica DasherGFP (filas 1-12) o CayenneRFP (fila 13). Para las filas 1 a 11, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna H). Los vectores se transfectaron en células CHO y se midió la expresión de las proteínas fluorescentes (columnas JM) como se describe en el Ejemplo 6.1.6.
Tabla 12. Expresión de anticuerpos a partir de sistemas de transferencia de genes que comprenden genes que codifican ambas cadenas de anticuerpos. Los vectores de transferencia de genes comprenden un potenciador (columna C), un promotor (columna D), un intrón (columna E) y una señal de poliadenilación (columna F) unida operativamente a un gen que codifica la cadena ligera de Herceptin. Para las filas 7-12 y 17, los vectores comprenden además un gen que codifica la cadena pesada de Herceptin operativamente unida a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna G). Para las filas 1-6, los vectores comprenden además un gen que codifica la cadena pesada de Herceptin operativamente enlazada a un segundo potenciador (columna I), un segundo promotor (columna J), un segundo intrón (columna K) y una segunda señal de poliadenilación (columna L). Opcionalmente, se interpuso una secuencia de aislante entre la primera señal de poliadenilación y el segundo potenciador (columna H). Los vectores se transfectaron en células HEK293 y se midió la expresión de las proteínas de anticuerpos secretadas ensambladas como se describe en el Ejemplo 6.1.7. Los vectores que codifican las dos cadenas por separado también se cotransfectaron en 3 proporciones diferentes (filas 13-15.
Tabla 13. Expresión de proteínas fluorescentes a partir de un sistema de transferencia de genes que comprende un transposón y una transposasa. Los transposones comprenden secuencias de los extremos de los transposones de SEQ ID NO. 9 y SEQ ID NO. 6, y un potenciador (columna F), promotor (columna G), intrón (columna H) y señal de poliadenilación (columna I) operativamente unida a un gen que codifica DasherGFP. Para las filas 3-6, los vectores comprenden además un gen que codifica CayenneRFP unido operativamente a los elementos de control de la expresión mediante una secuencia de acoplamiento traduccional (secuencias identificadas en la columna J). Para las filas 7-18, los vectores comprenden además un gen que codifica Cayenne RFP unido operativamente a un segundo potenciador (columna L), un segundo promotor (columna M), un segundo intrón (columna N) y una segunda señal de poliadenilación (columna O). Opcionalmente, se interpuso una secuencia aislante entre la primera señal de poliadenilación y el segundo potenciador (columna K). Los transposones se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (SEQ ID NO. 45 fusionado a una señal de localización nuclear heteróloga, se seleccionaron las células y se midió la expresión de las proteínas fluorescentes (columnas QV) como se describe en el Ejemplo 6.1.8. Las filas 1-2 y 19-20 muestran la transfección de construcciones que codifican solo GFP (filas 1 -2 o RFP (filas 19-20. Las filas 21 y 22 muestran la cotransfección de las construcciones mostradas en las filas 1 y 19.
Tabla 14. Expresión de una proteína fluorescente de un sistema de transferencia de genes que comprende un transposón y una transposasa. Los transposones comprenden secuencias de los extremos de los transposones de s Eq ID No .9 y SEQ ID NO. 6, un potenciador (columna B), un promotor (columna C), un intrón (columna D) y una señal de poliadenilación de beta globina de conejo unida operativamente a un gen que codifica DasherGFP y, opcionalmente, secuencias aislantes a ambos lados del casete de expresión de Dasher (columna E). Los transposones se transfectaron en células CHO, opcionalmente junto con un gen que codifica una transposasa (columna G) fusionado a una señal de localización nuclear heteróloga, se seleccionaron las células y se midió la expresión de la proteína fluorescente (columnas HJ) como se describe en el Ejemplo 6.1.9.
Tabla 15. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes. Los vectores de transferencia de genes comprenden un gen que codifica DasherGFP unido operativamente a un potenciador (columna B), un promotor (columna C), un intrón (columna D), un 5'UTR (columna E), una secuencia para mejorar la exportación de ARN (columna F) y una señal de poliadenilación (columna G). Algunos vectores comprenden además un origen de replicación viral (columna H) y/o un gen que codifica una proteína de replicación viral (columna I), como se describe en el Ejemplo 6.1.10.
Tabla 16. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes. Los vectores de transferencia de genes comprenden un gen que codifica DasherGFP unido operativamente a un potenciador (columna B), un promotor (columna C), un intrón (columna D), un 5'UTR (columna E), un 3'UTR (columna F), una secuencia para mejorar la exportación de ARN (columna G) y una señal de poliadenilación (columna H). Algunos vectores comprenden además un origen de replicación viral (columna I) y/o un gen que codifica una proteína de replicación viral (columna J), como se describe en el Ejemplo 6.1.11.
Tabla 17. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes. Los vectores de transferencia de genes comprenden un gen que codifica DasherGFP unido operativamente a un potenciador (columna B), un promotor (columna C), un intrón (columna D), un 5'UTR (columna E), una secuencia para mejorar la exportación de ARN (columna F) y una señal de poliadenilación (columna G). Los vectores se transfectaron en células CHO y se midió DasherGFP (columnas HJ), como se describe en el Ejemplo 6.1.12.
Tabla 18. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes. Los transposones comprenden las secuencias de los extremos de transposones de SEQ ID NO 9 y SEQ ID NO 6, un potenciador (columna B), un promotor (columna C), un intrón (columna D) y una señal de poliadenilación (columna F) unida operativamente a un gen que codifica DasherGFP, y, opcionalmente, secuencias aislantes a ambos lados del casete de expresión de Dasher (columna G). Los transposones se transfectaron en células CHO, las células se seleccionaron y se midió la expresión de la proteína fluorescente (columnas HJ), como se describe en el Ejemplo 6.1.13.
Tabla 19. Expresión de una proteína fluorescente de un sistema de transferencia de genes diseñado para ensayar configuraciones de elementos de control. Los vectores de transferencia de genes configurados como se muestra en la Tabla 15 se ensayaron para la expresión en células HEK (D-E) y CHO (B-C) como se describe en el Ejemplo 6.1.10. Se muestran los conteos de fluorescencia promedio de transfecciones por triplicado independientes.
Tabla 20. Expresión de una proteína fluorescente de un sistema de transferencia de genes diseñado para ensayar configuraciones de elementos de control. Los vectores de transferencia de genes configurados como se muestra en la Tabla 16 se ensayaron para la expresión en células HEK (D-E) y CHO (B-C) como se describe en el Ejemplo 6.1.11. Se muestran los conteos de fluorescencia promedio de transfecciones por triplicado independientes.
Tabla 21. Pesos de regresión para elementos de vectores utilizados en la expresión transitoria en células HEK y CHO. Se construyó un modelo que relaciona los elementos de los vectores de transferencia de genes mostrados en la Tabla 15 y los datos de expresión mostrados en la Tabla 19 usando regresión de mínimos cuadrados parciales. Se indican los pesos de regresión para cada elemento o combinación de elementos calculados a partir del modelo para los sistemas de expresión HEK y CHO.
Tablas
T a b la 1. E xp re s ión de ve c to re s de tra n s fe re n c ia de ge ne s qu e co m p re n d e n tra n s p o s o n e s y tra n sp o sa sa . A
B C D E F G H I
Figure imgf000054_0001
J
Transposasa Fusión TP
Proporción Transposón (Tn) Expresión de GFP
Figure imgf000054_0002
T a b la 2. E xp re s ió n de v e c to re s de tra n s fe re n c ia de g e n e s que co m p re n d e n tra n s p o s o n e s y tra n sp o sa sa s .
Figure imgf000055_0001
____ ____
Fila extremo Identificador Promedio DS derecho del gen (N = 3) 1 SEQ ID NO: 6 134 925 ninguno 172 N/A 2 SEQ ID NO: 6 134925 Q ID NO: 204 1,19 3 SEQ ID NO: 6 134 925 Q ID NO: 281 1,63 4 SEQ ID NO: 6 134925 Q ID NO: 184 1,07 5 SEQ ID NO: 6 134 925 Q ID NO: 161 0,94 6 SEQ ID NO: 6 134 925 Q ID NO: 577 3,36 _7_ SEQ ID NO: 6 134925 Q ID NO: 483 2,81 8 SEQ ID NO: 31 133371 ninguno 288 N/A _9_ SEQ ID NO: 31 133371 Q ID NO: 3674 12,8 10 SEQ ID NO: 25 134922 ninguno 327 N/A 11 SEQ ID NO: 25 134922 Q ID NO: 193 0,59 _12 SEQ ID NO: 25 134922 Q ID NO: 277 0,85 13 SEQ ID NO: 11 133366 ninguno 332 N/A 14 SEQ ID NO: 11 133366 Q ID NO: 5 0,02 1 5 SEQ ID NO: 11 133366 Q ID NO: 393 1,18 16 SEQ ID NO: 13 133367 ninguno 505 N/A 17 SEQ ID NO: 13 133367 Q ID NO: 185 0,37 1 8 SEQ ID NO: 13 133367 Q ID NO: 179 0,35 19 SEQ ID NO: 23 134717 ninguno 303 N/A 20 SEQ ID NO: 23 134717 Q ID NO: 208 0,68 21 SEQ ID NO: 23 134717 Q ID NO: 177 0,58 22 SEQ ID NO: 15 133368 ninguno 277 N/A 23 SEQ ID NO: 15 133368 Q ID NO: 243 0,88 24 SEQ ID NO: 15 133368 Q ID NO: 169 0,61 25 SEQ ID NO: 17 133369 ninguno 256 N/A 26 SEQ ID NO: 17 133369 Q ID NO: 161 0,63 27 SEQ ID NO: 17 133369 Q ID NO: 184 0,72 28 SEQ ID NO: 19 133370 ninguno 248 N/A 29 SEQ ID NO: 19 133370 Q ID NO: 148 0,6 30 SEQ ID NO: 19 133370 Q ID NO: 133 0,54 31 SEQ ID NO: 21 134716 ninguno 97 N/A 32 SEQ ID NO: 21 134716 Q ID NO: 67 0,69 33 SEQ ID NO: 21 134716 Q ID NO: 92 0,95 34 SEQ ID NO: 27 134923 ninguno 319 N/A 35 SEQ ID NO: 27 134923 Q ID NO: 189 0,59
36
Figure imgf000055_0002
SEQ ID NO: 27 134923
Figure imgf000055_0004
Q ID NO:
Figure imgf000055_0003
270 0,85 T a b la 3. E xp re s ió n de v e c to re s de tra n s fe re n c ia de g e n e s que co m p re n d e n tra n s p o s o n e s y tra n sp o sa sa s .
Figure imgf000056_0001
Figure imgf000057_0001
T a b la 5. E xp re s ió n de v e c to re s de tra n s fe re n c ia de g e n e s que co m p re n d e n tra n s p o s o n e s y tra n sp o sa sa s .
Figure imgf000058_0001
Figure imgf000059_0001
Figure imgf000060_0001
Figure imgf000061_0001
Figure imgf000062_0001
Figure imgf000063_0001
Figure imgf000064_0001
Figure imgf000065_0001
Tabla 13. Expresión de proteínas fluorescentes a partir de un sistema de transferencia de genes que comprende un transposón y una transposasa.
Figure imgf000066_0001
Figure imgf000067_0001
Tabla 15. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes.
rep Const
Figure imgf000068_0001
l 128975 P-actina Actina de
pollo (parcial) ninguno ninguno sv40 tardío ninguno ninguno 128986 CMV ninguno ninguno WPRE GH-bovino oriP EBNA 129966 CMV ninguno ninguno ninguno GH-bovino ninguno ninguno 128978 CMV ninguno ninguno ninguno sv40 tardío ninguno ninguno Intrón c de
128985 CMV CMV ninguno ninguno sv40 tardío ninguno ninguno 129091 CMV ninguno ninguno WPRE GH-bovino oriP ninguno 133139 GAPDH GAPDH ninguno ninguno sv40 tardío ninguno ninguno 136024 CMV ninguno ninguno ninguno poliA sintético SV40 SV40 T tina de Actina de
136025 c
pollo pollo/conejo ninguno ninguno GH-bovino SV40 SV40 T 136026 ctina de Actina de ninguno ninguno sv40 te oriP gunopollo pollo/conejo mprano nin 136027 ctina de Actina de
pollo pollo/conejo ninguno ninguno sv40 tardío ninguno ninguno 136028 ctina de Actina de ninguno ninguno beta globina SV40pollo pollo (parcial) humana SV40 T 136029 ctina de Actina de ninguno ninguno beta globina- ninguno ningunopollo pollo (parcial) conejo 136030 ctina de Actina de ninguno ninpollo pollo (parcial) guno sv40 temprano oriP ninguno 136031 CMV ninguno ninguno ninguno beta globina- oriP EB conejo NA 136032 CMV ninguno ninguno ninguno sv40 temprano ninguno ninguno 136033 CMV Intrón de
CMV a ninguno beta globina-conejo oriP ninguno 136034 CMV Intrón de
CMV a ninguno GH-bovino oriP EBNA Intrón de
136035 CMV CMV a ninguno sv40 tardío SV40 SV40 T Intrón de
136036 CMV CMV a
Figure imgf000068_0002
ninguno poliA sintético ninguno ninguno 136037 CMV Intrón c de
CMV ninguno ninguno eta globina
humana ninguno ninguno Intrón c de
136038 CMV ninguno ninguno HSV-TK oriP EBNA
CMV
Intrón c de
136039 CMV CMV ninguno ninguno
Figure imgf000068_0004
sv40 tardío oriP ninguno 136040 CMV Intrón c de
CMV ninguno ninguno poliA sintético SV40 SV40 T 136041 EF1a EF1a_v1 ninguno ninguno beta globina- conejo SV40 SV40 T 136 042 EF1a EF1a v1 ninguno ninguno HSV-TK oriP ninguno 136043 EF1a EF1a v1 ninguno ninguno sv40 temprano ninguno ninguno 136044 EF1a EF1a v1 ninguno ninguno sv40 tardío oriP EBNA 136045 EF1a EF1a_v2 ninguno ninguno beta globina
humana oriP ninguno 136046 EF1a EF1a_v2 ninguno ninguno beta globina- conejo SV40 SV40 T 136047 EF1a
Figure imgf000068_0005
EF1a v2 ninguno ninguno GH-bovino oriP EBNA 136048 EF1a EF1a v2 ninguno ninguno HSV-TK ninguno ninguno 136049 EF1a EF1a hybrid ninguno ninguno GH-bovino oriP ninguno 136050 EF1a EF1a hybrid ninguno ninguno HSV-TK SV40 SV40 T 136051 EF1a EF1a hybrid ninguno ninguno poliA sintético oriP EBNA 136052 GAPDH GAPDH ninguno ninguno beta globina
humana oriP ninguno 136053 GAPDH GAPDH ninguno ninguno beta globina- conejo ninguno ninguno
136054
Figure imgf000068_0003
GAPDH
Figure imgf000068_0006
GAPDH ninguno ninguno HSV-TK SV40 SV40 T Continuación
Figure imgf000069_0001
Figure imgf000070_0001
Figure imgf000071_0001
Tabla 18. Combinaciones de elementos de vectores utilizadas en vectores de transferencia de genes.
Figure imgf000072_0001
178620 CMV CMV ninguno SEQ ID NO:
104 BGH ninguno 1513 1572 1490 178621 CMV CMV ninguno SEQ ID NO:
106 BGH ninguno 1272 1185 1109 178622 CMV CMV ninguno SEQ ID NO:
107 BGH ninguno 865 891 979 178623 ninguno EF1a EF1a SEQ ID NO:
104 BGH HS4 2698 2302 2388 178624 ninguno EF1a EF1a SEQ ID NO:
106 BGH HS4 138 122 114 178625 ninguno EF1a EF1a SEQ ID NO:
107 BGH HS4 2547 2303 2551 178626 CMV CMV ninguno SEQ ID NO:
104 BGH HS4 245 258 137 178627 CMV CMV ninguno SEQ ID NO:
106 BGH HS4 950 884 844 negativo ninguno ninguno ninguno ninguno ninguno ninguno 29 12 30 145736 CMV CMV ninguno WPRE BGH ninguno 908 1106 952 142628 ninguno EF1a EF1a WPRE sintético HS4 3377 4151 3699 150708 CMV CMV ninguno WPRE sintético HS4 1074 1080 1056 150711 CMV EF1a EF1a WPRE sintético HS4 1634 1246 1798 147759
Figure imgf000072_0002
ninguno
Figure imgf000072_0003
EF1a
Figure imgf000072_0004
ninguno 850 812 1003 Tabla 19. Expresión de una proteína fluorescente de un sistema de transferencia de genes diseñado para ensayar configuraciones de elementos de control.
Figure imgf000073_0001
Tabla 20. Expresión de una proteína fluorescente de un sistema de transferencia de genes diseñado para ensayar configuraciones de elementos de control
Figure imgf000074_0001

Claims (15)

REIVINDICACIONES
1. Un polinucleótido que comprende un transposón que comprende repeticiones invertidas de los extremos de un transposón tipo piggyBac que flanquea un polinucleótido heterólogo no flanqueado naturalmente por las repeticiones invertidas de los extremos, las repeticiones invertidas están flanqueadas en sus lados externos por copias de una secuencia objetivo, en donde el transposón puede transponerse mediante una transposasa idéntica a la SEQ ID NO: 45 fusionada a una señal de localización nuclear heteróloga (NLS) en donde la SEQ ID NO: 124 proporciona la secuencia de cada repetición invertida de los extremos, la secuencia está en orientaciones invertidas en los dos extremos del transposón.
2. El polinucleótido de la reivindicación 1, en donde el transposón comprende SEQ ID NO: 37 o 38 o 39 para proporcionar una copia de la secuencia objetivo y una repetición invertida, y SEQ ID NO: 40 o 41 para proporcionar la otra copia de la secuencia objetivo y la otra repetición invertida.
3. El polinucleótido de la reivindicación 1, en donde el transposón comprende una secuencia que es al menos un 90 % idéntica a la SEQ ID NO: 9 y una secuencia que es al menos un 90 % idéntica a la SEQ ID NO: 6.
4. El polinucleótido de la reivindicación 1, en donde el polinucleótido heterólogo comprende un promotor, opcionalmente en donde el promotor es un promotor de EFla, un promotor de CMV, un promotor de GAPDH, un promotor de timidina quinasa del virus del herpes simple (HSVTK), un promotor de actina, un promotor de PGK o un promotor de ubiquitina.
5. El polinucleótido de la reivindicación 4, en donde el polinucleótido heterólogo comprende además un segundo promotor y en donde las direcciones de transcripción del primer y segundo promotores son diferentes.
6. El polinucleótido de la reivindicación 4, en donde el promotor está unido operativamente a uno o más de: i) un marco abierto de lectura; ii) un ácido nucleico que codifica un marcador de selección, por ejemplo, glutamina sintetasa (GS) o dihidrofolato reductasa (DHFR), o una proteína que confiere resistencia a puromicina, neomicina, higromicina, zeocina o blasticidina; iii) un ácido nucleico que codifica un marcador de selección inversa; iv) un ácido nucleico que codifica una proteína reguladora; v) un ácido nucleico que codifica un ARN inhibidor.
7. El polinucleótido de la reivindicación 1, en donde el ácido nucleico heterólogo comprende uno o más elementos de secuencia, por ejemplo, un intrón, que aumentan la expresión al mejorar el procesamiento o la exportación de ARN desde el núcleo.
8. El polinucleótido de la reivindicación 7, en donde uno o más elementos de secuencia se seleccionan de las SEQ ID NO: 104-105, las SEQ ID NO: 108-111 y las SEQ ID NO: 106-107.
9. El polinucleótido de la reivindicación 1, en donde el ácido nucleico heterólogo comprende un par de aislantes.
10. El polinucleótido de la reivindicación 1, en donde el polinucleótido heterólogo comprende dos marcos abiertos de lectura unidos operativamente a un promotor, en donde los dos marcos abiertos de lectura están unidos por elementos de acoplamiento traduccional seleccionados de un sitio interno de entrada del ribosoma (IRES).
11. El polinucleótido de la reivindicación 1, en donde el ADN heterólogo codifica una cadena pesada de anticuerpo y/o una cadena ligera de anticuerpo.
12. Una línea celular que comprende el transposón de la reivindicación 1.
13. Un animal transgénico no humano que comprende el transposón de la reivindicación 1.
14. Uso del polinucleótido de la reivindicación 1 para integrar el transposón en un genoma de una célula hospedera eucariota in vitro.
15. Una célula hospedera eucariota que tiene un genoma que comprende el transposón de la reivindicación 1.
ES15776901T 2014-04-09 2015-04-09 Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas Active ES2835673T3 (es)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201461977474P 2014-04-09 2014-04-09
US201462003397P 2014-05-27 2014-05-27
US201462046875P 2014-09-05 2014-09-05
US201462046705P 2014-09-05 2014-09-05
US201462069656P 2014-10-28 2014-10-28
US201562120522P 2015-02-25 2015-02-25
PCT/US2015/025209 WO2015157579A2 (en) 2014-04-09 2015-04-09 Enhanced nucleic acid constructs for eukaryotic gene expression

Publications (1)

Publication Number Publication Date
ES2835673T3 true ES2835673T3 (es) 2021-06-22

Family

ID=54264598

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15776901T Active ES2835673T3 (es) 2014-04-09 2015-04-09 Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas

Country Status (8)

Country Link
US (5) US20150291975A1 (es)
EP (2) EP3670660A1 (es)
CA (1) CA2944887A1 (es)
DK (1) DK3129487T3 (es)
ES (1) ES2835673T3 (es)
HU (1) HUE052552T2 (es)
LT (1) LT3129487T (es)
WO (1) WO2015157579A2 (es)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2835673T3 (es) 2014-04-09 2021-06-22 Dna Twopointo Inc Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas
US10927384B2 (en) 2014-04-09 2021-02-23 Dna Twopointo Inc. DNA vectors, transposons and transposases for eukaryotic genome modification
LT3359671T (lt) * 2015-10-08 2021-12-10 Dna Twopointo Inc. Dnr vektoriai, transpozonai ir transpozazės, skirti eukariotinio genomo modifikacijai
JP2018534946A (ja) * 2015-10-27 2018-11-29 セルテオン コーポレイション キメラ転写後調節要素
CA3004665C (en) * 2015-12-14 2021-08-24 GenomeFrontier Therapeutics, Inc. Transposon system, kit comprising the same, and uses thereof
US11261462B2 (en) 2016-01-27 2022-03-01 Just-Evotec Biologics, Inc. Inducible expression from transposon-based vectors and uses
EP3408397B1 (en) 2016-01-27 2020-07-15 Just-Evotec Biologics, Inc. Hybrid promoter and uses thereof
US11098310B2 (en) 2016-01-27 2021-08-24 Just-Evotec Biologics, Inc. Expression from transposon-based vectors and uses
US11325948B2 (en) 2016-03-19 2022-05-10 Exuma Biotech Corp. Methods and compositions for genetically modifying lymphocytes to express polypeptides comprising the intracellular domain of MPL
WO2018013546A1 (en) * 2016-07-11 2018-01-18 The Regents Of The University Of California Bic inhibitor of cry-cry and cry-cib oligomerization/clustering
US20190119636A1 (en) 2017-10-23 2019-04-25 Poseida Therapeutics, Inc. Modified stem cell memory t cells, methods of making and methods of using same
WO2018064681A1 (en) * 2016-09-30 2018-04-05 Poseida Therapeutics, Inc. Modified stem cell memory t cells, methods of making and methods of using same
JP7275043B2 (ja) 2016-12-16 2023-05-17 ビー-モーゲン・バイオテクノロジーズ,インコーポレーテッド 増大したhATファミリートランスポゾン媒介遺伝子導入ならびに関連する組成物、システムおよび方法
US11278570B2 (en) 2016-12-16 2022-03-22 B-Mogen Biotechnologies, Inc. Enhanced hAT family transposon-mediated gene transfer and associated compositions, systems, and methods
AU2018234918B2 (en) * 2017-03-17 2023-11-02 Adverum Biotechnologies, Inc. Compositions and methods for enhanced gene expression
US11713468B2 (en) 2017-08-02 2023-08-01 Dna Twopointo Inc. DNA vectors and elements for sustained gene expression in eukaryotic cells
US10329543B2 (en) 2017-10-23 2019-06-25 Poseida Therapeutics, Inc. Modified stem cell memory T cells, methods of making and methods of using same
CN109988759A (zh) * 2017-12-29 2019-07-09 上海细胞治疗研究院 一种在t细胞中具有高转录活性的嵌合启动子
JP2021527427A (ja) 2018-06-21 2021-10-14 ビー−モーゲン・バイオテクノロジーズ,インコーポレーテッド 強化されたhATファミリーのトランスポゾンが介在する遺伝子導入ならびに関連する組成物、システム、及び方法
CA3121268A1 (en) * 2018-12-10 2020-06-18 Amgen Inc. Mutated piggybac transposase
WO2020132595A1 (en) * 2018-12-21 2020-06-25 The Regents Of The University Of California Il-10-containing vaccines and uses thereof
US20220090142A1 (en) 2019-02-13 2022-03-24 Probiogen Ag Transposase with enhanced insertion site selection properties
US20220119757A1 (en) 2019-02-15 2022-04-21 Just-Evotec Biologics, Inc. Automated biomanufacturing systems, facilities, and processes
US11216742B2 (en) 2019-03-04 2022-01-04 Iocurrents, Inc. Data compression and communication using machine learning
KR20210144861A (ko) * 2019-04-08 2021-11-30 디앤에이 투포인토 인크. 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
AU2020272668B2 (en) * 2019-04-08 2023-07-06 Dna Twopointo Inc. Integration of nucleic acid constructs into eukaryotic cells with a transposase from oryzias
JP7284833B2 (ja) 2019-05-13 2023-05-31 ディーエヌエー ツーポイントオー インク. 特性を変えるための人工マイクロrnaを用いた哺乳類細胞の改変及びその生産物の組成物
MX2022002521A (es) * 2019-09-01 2022-06-14 Exuma Biotech Corp Metodos y composiciones para la modificacion y administracion de linfocitos.
BR112022016617A2 (pt) * 2020-02-19 2022-11-22 Wuxi Biologics Ireland Ltd Ácido nucleico, vetor, vetor de transposon, sistema de expressão, ácido nucleico isolado, método para gerar uma célula, célula, método de expressão de uma proteína, proteína, composiçao farmacêutica, sistema de expressão, linhagem celular
KR20230005865A (ko) 2020-05-04 2023-01-10 살리오젠 테라퓨틱스 인코포레이티드 전위-기반 요법
JP2023541219A (ja) * 2020-07-17 2023-09-29 プロバイオジェン アーゲー 高活性トランスポゾン及びトランスポザーゼ
EP4196490A1 (en) * 2020-10-27 2023-06-21 PACT Pharma, Inc. Compositions and methods for the treatment of cancer using next generation engineered t cell therapy
CN112481289B (zh) * 2020-12-04 2023-06-27 苏州科锐迈德生物医药科技有限公司 一种转录环状rna的重组核酸分子及其在蛋白表达中的应用
US20240087685A1 (en) * 2021-01-20 2024-03-14 The Texas A&M University System Systems and methods for evaluation of structure and property of polynucleotides
EP4284834A1 (en) 2021-01-29 2023-12-06 Merck Sharp & Dohme LLC Compositions of programmed death receptor 1 (pd-1) antibodies and methods of obtaining the compositions thereof
CA3212093A1 (en) * 2021-03-15 2022-09-22 R. Keith SLOTKIN Targeted insertion via transposition
CN113186221A (zh) * 2021-05-24 2021-07-30 广西大学 水牛源lif的制备及其在水牛精原干细胞体外培养的应用
WO2023287707A1 (en) 2021-07-15 2023-01-19 Just-Evotec Biologics, Inc. Bidirectional tangential flow filtration (tff) perfusion system
WO2023081814A2 (en) * 2021-11-04 2023-05-11 Saliogen Therapeutics, Inc. Mobile elements and chimeric constructs thereof
WO2023154734A2 (en) * 2022-02-08 2023-08-17 Iowa State University Research Foundation, Inc. Mrna expression and delivery systems
WO2024068995A1 (en) 2022-09-30 2024-04-04 Boehringer Ingelheim International Gmbh Novel transposase system

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5681702A (en) 1994-08-30 1997-10-28 Chiron Corporation Reduction of nonspecific hybridization by using novel base-pairing schemes
ZA973367B (en) 1996-04-19 1997-11-18 Innogenetics Nv Method for typing and detecting HBV.
US6136597A (en) 1997-09-18 2000-10-24 The Salk Institute For Biological Studies RNA export element
US6897066B1 (en) * 1997-09-26 2005-05-24 Athersys, Inc. Compositions and methods for non-targeted activation of endogenous genes
US20030150007A1 (en) 2000-03-21 2003-08-07 Charalambos Savakis Method of generating transgenic organisms using transposons
CA2413156C (en) 2000-07-03 2009-08-18 Gala Design, Inc. Expression vectors
US8005620B2 (en) 2003-08-01 2011-08-23 Dna Twopointo Inc. Systems and methods for biopolymer engineering
TW200613554A (en) * 2004-06-17 2006-05-01 Wyeth Corp Plasmid having three complete transcriptional units and immunogenic compositions for inducing an immune response to HIV
CA2578908C (en) * 2005-03-17 2020-05-26 Yves Durocher Expression vectors for enhanced transient gene expression and mammalian cells expressing them
BRPI0520212A2 (pt) 2005-05-14 2009-08-18 Univ Fudan métodos de geração de um vertebrado não humano transgênico, e de uma célula de vertebrado recombinante, célula de vertebrado em cultura, e, ácido nucleico
TWI300441B (en) 2005-09-21 2008-09-01 Univ Chung Yuan Christian A polynucleotide with ires activity
US20070204356A1 (en) 2006-02-28 2007-08-30 University Of Notre Dame Du Lac PiggyBac constructs in vertebrates
DK2134847T3 (en) * 2007-03-07 2015-10-05 Univ Aarhus Pig Model for atherosclerosis
US20110130444A1 (en) * 2007-05-04 2011-06-02 Stefan Moisyadi Methods and compositions for targeted delivery of gene therapeutic vectors
US20090042297A1 (en) * 2007-06-01 2009-02-12 George Jr Alfred L Piggybac transposon-based vectors and methods of nucleic acid integration
GB0903207D0 (en) * 2009-02-25 2009-04-08 Ucb Pharma Sa Method for expressing multimeric proteins
EP2401367B1 (en) 2009-02-26 2016-11-30 Transposagen Biopharmaceuticals, Inc. Hyperactive piggybac transposases
US9790489B2 (en) * 2009-10-26 2017-10-17 Chang Gung University Method for performing genetic modification under a drug-free environment and components thereof
CN105612176B (zh) * 2012-07-31 2021-01-19 阿格克斯治疗有限公司 Hla g修饰的细胞及方法
ES2835673T3 (es) 2014-04-09 2021-06-22 Dna Twopointo Inc Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas

Also Published As

Publication number Publication date
US20150291977A1 (en) 2015-10-15
US9428767B2 (en) 2016-08-30
LT3129487T (lt) 2020-12-28
EP3129487A4 (en) 2017-09-13
EP3129487A2 (en) 2017-02-15
US20150291976A1 (en) 2015-10-15
US9574209B2 (en) 2017-02-21
US20160333328A1 (en) 2016-11-17
EP3129487B1 (en) 2020-10-07
US9580697B2 (en) 2017-02-28
EP3670660A1 (en) 2020-06-24
WO2015157579A2 (en) 2015-10-15
DK3129487T3 (da) 2020-11-30
WO2015157579A3 (en) 2015-12-17
CA2944887A1 (en) 2015-10-15
US20150291975A1 (en) 2015-10-15
US20160340691A1 (en) 2016-11-24
US9534234B2 (en) 2017-01-03
HUE052552T2 (hu) 2021-05-28

Similar Documents

Publication Publication Date Title
ES2835673T3 (es) Construcciones de ácido nucleico mejoradas para la expresión de genes eucariotas
RU2745563C2 (ru) Способы преодоления иммунологической толерантности с использованием множества направляющих рнк
JP7301332B2 (ja) Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
US20200291395A1 (en) Novel crispr-associated transposon systems and components
JP2021516970A (ja) 新規crispr dnaターゲティング酵素及びシステム
ES2891087T3 (es) Vectores de ADN, trasposones y transposasas para la modificación del genoma eucariota
KR20220004674A (ko) Rna를 편집하기 위한 방법 및 조성물
KR20150027756A (ko) Dna 수복, 변경 및 대체를 위한 도구로서의 초나선 미니벡터
WO2022068912A1 (en) Engineered crispr/cas13 system and uses thereof
US20230058054A1 (en) Crispr/cas system and uses thereof
EP4222253A1 (en) Engineered crispr/cas13 system and uses thereof
US20180105835A1 (en) TARGETED RNA KNOCKDOWN AND KNOCKOUT BY TYPE III-A Csm COMPLEXES
US20230313173A1 (en) Systems and methods for identifying cells that have undergone genome editing
JP2023131616A (ja) Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法
EA040859B1 (ru) Способ получения эукариотических клеток с отредактированной днк и набор, используемый в этом способе