ES2780692T3 - Constructo y secuencia para la expresión genética mejorada - Google Patents
Constructo y secuencia para la expresión genética mejorada Download PDFInfo
- Publication number
- ES2780692T3 ES2780692T3 ES14825469T ES14825469T ES2780692T3 ES 2780692 T3 ES2780692 T3 ES 2780692T3 ES 14825469 T ES14825469 T ES 14825469T ES 14825469 T ES14825469 T ES 14825469T ES 2780692 T3 ES2780692 T3 ES 2780692T3
- Authority
- ES
- Spain
- Prior art keywords
- promoter
- sequence
- expression
- interest
- nucleotide sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/395—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
- A61K39/39533—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum against materials from animals
- A61K39/3955—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum against materials from animals against proteinaceous materials, e.g. enzymes, hormones, lymphokines
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/24—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
- C07K16/241—Tumor Necrosis Factors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/21—Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/24—Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/51—Complete heavy chain or Fd fragment, i.e. VH + CH1
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/515—Complete light chain, i.e. VL + CL
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Plant Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Endocrinology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
Abstract
Metodo para la transcripcion y/o expresion y, opcionalmente, la purificacion del transcrito y/o proteina o polipeptido de interes producidos que comprende los pasos de: a) proporcionar un constructo de acidos nucleicos que comprende un primer promotor, un segundo promotor y una secuencia de nucleotidos de interes, en donde dichos primer promotor y segundo promotor estan operativamente enlazados a dicha secuencia de nucleotidos de interes, y en donde dicho segundo promotor esta flanqueado por una primera secuencia intronica ubicada aguas arriba de dicho promotor y una segunda secuencia intronica ubicada aguas abajo de dicho promotor; y, b) poner en contacto una celula con dicho constructo de acidos nucleicos para obtener una celula transformada; y, c) permitir que dicha celula transformada produzca un transcrito de la secuencia de nucleotidos de interes y/o exprese la proteina o el polipeptido de interes; y opcionalmente d) purificar dicho transcrito y/o proteina o polipeptido de interes producidos.
Description
DESCRIPCIÓN
Constructo y secuencia para la expresión genética mejorada
Campo de la invención
[0001] La invención se refiere a un método de transcripción y expresión usando un constructo de ácidos nucleicos que se caracteriza por la presencia de un promotor seguido de un promotor intrónico. La invención se refiere además a dicho constructo de ácidos nucleicos, un vector de expresión y una célula que comprende dicho constructo y su uso.
[0002] La invención también se refiere a métodos para la transcripción y opcionalmente la expresión usando una secuencia de nucleótidos. La invención se refiere además a dicha secuencia de nucleótidos y un constructo, vector de expresión y célula que comprende dicha secuencia de nucleótidos y su uso.
Antecedentes de la invención
[0003] Christensen et al., 1996, transgenic res., 5 (3): p. 213-218 se refiere a vectores basados en promotores de ubiquitina para la expresión de alto nivel de genes marcadores seleccionables y/o cribables en plantas monocotiledóneas. Sivamani et al. (DOI: 10.1007/S11103-005-3853-Z) se refiere a la mejora de la expresión de un promotor del gen de la poliubiquitina de arroz. Bianchi et al. (DOI: 10.1371 /journal.pone.0065932) se refiere a la forma en que las secuencias de unión intrónica de Yin Yang 1 y el empalme provocan la mejora mediada por intrones de la expresión del gen de ubiquitina C. Nenoi et al. (DOI: 10.1016/S0378-1119 (96) 00380-0) se refiere a las regiones aguas arriba del gen de poliubiquitina evolutivamente equivalente de humanos y hámsteres chinos. Nenoi yet al. discuten el mismo tema en Biochim Biophys Acta (1994) 1204(2): pág. 271-278.
[0004] Todavía existe la necesidad en la técnica de métodos alternativos y preferiblemente mejorados para regular la transcripción de un transcrito y opcionalmente regular la expresión de una proteína o un polipéptido de interés en células huésped.
Resumen de la invención
[0005] La presente invención se refiere a un método para la transcripción y opcionalmente a la purificación del transcrito producido que comprende los pasos de:
a) proporcionar un constructo de ácidos nucleicos que comprende un primer promotor, un segundo promotor y una secuencia de nucleótidos de interés, en donde dichos primer promotor y segundo promotor están operativamente enlazados a dicha secuencia de nucleótidos de interés, y en donde dicho segundo promotor está flanqueado por una primera secuencia intrónica ubicada aguas arriba de dicho promotor y una segunda secuencia intrónica ubicada aguas abajo de dicho promotor; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca un transcrito de la secuencia de nucleótidos de interés; y opcionalmente
d) purificar dicha transcrito producido.
[0006] La presente invención se refiere además a un método para expresar y opcionalmente purificar una proteína o un polipéptido de interés que comprende el paso de:
a) proporcionar un constructo de ácidos nucleicos que comprende un primer promotor, un segundo promotor y una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés, en donde dichos primer promotor y segundo están operativamente enlazados a dicha secuencia de nucleótidos que codifica una proteína o un polipéptido de interés, y en donde dicho segundo promotor está flanqueado por una primera secuencia intrónica ubicada aguas arriba de dicho promotor y una segunda secuencia intrónica ubicada aguas abajo de dicho promotor; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada exprese la proteína o polipéptido de interés; y opcionalmente purificar dicha proteína o polipéptido de interés.
[0007] Preferiblemente, dicha primera secuencia intrónica comprende al menos un sitio de empalme donador y dicha segunda secuencia intrónica comprende al menos un sitio de empalme aceptor. Además, el constructo de ácidos nucleicos del paso a) del método de la invención comprende las siguientes secuencias de nucleótidos indicadas aquí en sus posiciones relativas en la dirección 5' a 3': (i) un primer promotor (ii) una primera secuencia intrónica que comprende al menos un sitio de empalme donador, (iii) un segundo promotor, (iv) una segunda secuencia intrónica que comprende al menos un sitio de empalme aceptor; y (v) una secuencia de nucleótidos
que codifica una proteína o un polipéptido de interés, en donde preferiblemente dicho primer promotor, dicha primera secuencia intrónica que comprende al menos un sitio de empalme donador, dicho segundo promotor y dicha segunda secuencia intrónica que comprende al menos un sitio de empalme aceptor están todos operativamente enlazados a dicha secuencia de nucleótidos que codifica una proteína o un polipéptido de interés.
[0008] Preferiblemente, dicho primer promotor tiene al menos un 50 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1 o los nucleótidos 1-614 de la SEC ID n.°: 2 en toda su longitud. En la tabla 1 se proporciona una descripción general de todos los n.° de SEC ID. Preferiblemente, una secuencia de nucleótidos que comprende dicho primer promotor y dicha primera secuencia intrónica que comprende al menos un sitio de empalme donador tiene al menos un 50 % de identidad con las SEC ID n.°: 1 o 2 en toda su longitud. Preferiblemente, dicho segundo promotor tiene al menos un 50 % de identidad de secuencia con la SEC ID n.°: 57 o la SEC ID n.°: 58 en toda su longitud.
[0009] La presente invención se refiere además a un constructo de ácidos nucleicos que comprende un primer promotor y un segundo promotor, en donde dichos primer promotor y segundo promotor están configurados para estar operativamente enlazados a una secuencia de nucleótidos de interés, y en donde dicho segundo promotor está flanqueado por una primera secuencia intrónica ubicada aguas arriba de dicho promotor y una segunda secuencia intrónica ubicada aguas abajo de dicho promotor. Preferiblemente, dicha primera secuencia intrónica comprende al menos un sitio de empalme donador y preferiblemente dicha segunda secuencia intrónica comprende al menos un sitio de empalme aceptor. Además, preferiblemente un constructo de ácidos nucleicos de la invención comprende las siguientes secuencias de nucleótidos indicadas aquí en sus posiciones relativas en la dirección 5' a 3': (i) un primer promotor (ii) una primera secuencia intrónica que comprende al menos un sitio de empalme donador , (iii) un segundo promotor, (iv) una segunda secuencia intrónica que comprende al menos un sitio de empalme aceptor; y opcionalmente (v) una secuencia de nucleótidos de interés, en donde preferiblemente dicho primer promotor, dicha primera secuencia intrónica que comprende al menos un sitio de empalme donador, dicho segundo promotor y dicha segunda secuencia intrónica que comprende al menos un sitio de empalme aceptor están todos configurados para estar operativamente enlazado a dicha secuencia de nucleótidos opcional de interés.
[0010] Preferiblemente, dicho primer promotor tiene al menos un 50 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1 o los nucleótidos 1-614 de la SEC ID n.°: 2 en toda su longitud. Preferiblemente, una secuencia de nucleótidos que comprende dicho primer promotor y dicha primera secuencia intrónica que comprende al menos un sitio de empalme donador tiene al menos un 50 % de identidad con las SEC ID n.°: 1 o 2 en toda su longitud. Preferiblemente, dicho segundo promotor tiene al menos un 50 % de identidad de secuencia con la SEC ID n.°: 57 o la SEC ID n.°: 58 en toda su longitud.
[0011] Preferiblemente, dicho constructo de ácidos nucleicos es un constructo aislado. Preferiblemente, dicho constructo de ácidos nucleicos es un constructo de ácidos nucleicos recombinante. Preferiblemente, dicha secuencia de nucleótidos opcional de interés es una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o polipéptido heterólogo.
[0012] La presente invención se refiere además a un vector de expresión que comprende un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante tal como se define en el presente documento.
[0013] La presente invención se refiere además a una célula que comprende un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante tal como se define en el presente documento y/o un vector de expresión tal como se define en el presente documento.
[0014] La presente invención también se refiere a un uso de un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante tal como se define en el presente documento y/o un vector de expresión tal como se define en el presente documento y/o una célula tal como se define en el presente documento para la transcripción de una secuencia de nucleótidos de interés.
[0015] La presente invención se refiere además a un uso de un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante tal como se define en el presente documento y/o un vector de expresión tal como se define en el presente documento y/o una célula tal como se define en el presente documento para la expresión de una proteína o un polipéptido de interés.
[0016] La presente divulgación se refiere además a un método para la transcripción y opcionalmente a la purificación del transcrito producido que comprende los pasos de:
a) proporcionar un constructo de ácidos nucleicos que comprende un elemento potenciador de la expresión, un promotor heterólogo y una secuencia de nucleótidos de interés de la divulgación, en donde dicho
elemento potenciador de la expresión y dicho promotor heterólogo están operativamente enlazados a dicha secuencia de nucleótidos de interés; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca un transcrito de la secuencia de nucleótidos de interés; y opcionalmente
d) purificar dicha transcrito producido.
[0017] La presente divulgación se refiere además a un método para expresar y opcionalmente purificar una proteína o un polipéptido de interés que comprende el paso de:
a) proporcionar un constructo de ácidos nucleicos que comprende un elemento potenciador de la expresión, un promotor heterólogo y una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés, en el que dicho elemento potenciador de la expresión y dicho promotor heterólogo están operativamente enlazados a dicha secuencia de nucleótidos que codifica una proteína o un polipéptido de interés; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada exprese la proteína o polipéptido de interés; y opcionalmente d) purificar dicha proteína o polipéptido de interés.
[0018] Preferiblemente, dicho constructo de ácidos nucleicos de dicho método de transcripción y/o expresión y opcionalmente de purificación de un transcrito y/o proteína o polipéptido de interés comprende además un elemento regulador adicional de la expresión operativamente enlazado a dicha secuencia de nucleótidos de interés y/o dicha secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicho elemento regulador adicional de la expresión comprende una secuencia intrónica. Un elemento regulador de expresión adicional preferido comprende o es un elemento potenciador de expresión adicional. Más preferiblemente, dicho elemento regulador adicional de la expresión comprende además un elemento potenciador de la traducción.
[0019] La presente divulgación se refiere además a una molécula de ácidos nucleicos que está representada por una secuencia de nucleótidos que comprende un elemento potenciador de la expresión de la divulgación, es decir, una secuencia de nucleótidos que tiene al menos un 50 % de identidad con las SEC ID n.°: 1 o 2 en toda su longitud. En la tabla 1 se proporciona un resumen general de todos los n.° de SEC ID. Preferiblemente, dicha molécula de ácidos nucleicos es una molécula de ácidos nucleicos aislada. Preferiblemente, dicha molécula de ácidos nucleicos o molécula de ácidos nucleicos aislada está representada por una secuencia de nucleótidos que tiene al menos un 50 % de identidad de secuencia con las SEC ID n.°: 1 o 2 en toda su longitud. Preferiblemente, dicha molécula de ácidos nucleicos o molécula de ácidos nucleicos aislada está representada por una secuencia de nucleótidos que comprende una secuencia derivada del gen Cricetulus griseus para poliubiquitina de como máximo 8000 nucleótidos. La presente invención se refiere además a un constructo de ácidos nucleicos que comprende una molécula de ácidos nucleicos de la invención. Preferiblemente, dicho constructo de ácidos nucleicos está representado por una secuencia de nucleótidos que comprende además un promotor heterólogo, en el que preferiblemente dicho elemento potenciador de la expresión y dicho promotor heterólogo están configurados para estar los dos operativamente enlazados a una secuencia de nucleótidos opcional de interés. Preferiblemente, dicho constructo de ácidos nucleicos comprende además un elemento regulador adicional de la expresión, en donde preferiblemente dicho elemento potenciador de la expresión, dicho promotor heterólogo y dicho elemento regulador adicional de la expresión están configurados para estar todos operativamente enlazados a dicha secuencia de nucleótidos opcional de interés. Preferiblemente, dicho elemento regulador adicional de la expresión comprende además un elemento potenciador de la traducción. Preferiblemente, dicho elemento regulador adicional de la expresión comprende una secuencia intrónica. Preferiblemente, dicha secuencia de nucleótidos opcional de interés es una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o polipéptido heterólogo.
[0020] Preferiblemente, dicho constructo de ácidos nucleicos es un constructo de ácidos nucleicos recombinante y/o aislado.
[0021] La presente invención se refiere además a un vector de expresión que comprende una molécula de ácidos nucleicos o una molécula de ácidos nucleicos aislada tal como se define en el presente documento, y/o un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante y/o aislado tal como se define en el presente documento.
[0022] La presente invención se refiere además a una célula que comprende una molécula de ácidos nucleicos o una molécula de ácidos nucleicos aislada tal como se define en el presente documento, y/o un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante tal como se define en el presente documento, y/o un vector de expresión tal como se define en el presente documento.
[0023] La presente invención también se refiere al uso de una molécula de ácidos nucleicos o una molécula de ácidos nucleicos aislada tal como se define en el presente documento, y/o un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante y/o aislado tal como se define en el presente documento, y/o un vector de expresión tal como se define en el presente documento y/o una célula tal como se define en el presente documento para la transcripción de una secuencia de nucleótidos de interés.
[0024] La presente invención se refiere además a un uso de una molécula de ácidos nucleicos o una molécula de ácidos nucleicos aislada tal como se define en el presente documento, y/o un constructo de ácidos nucleicos o un constructo de ácidos nucleicos recombinante y/o aislado tal como se define en el presente documento, y/o un vector de expresión tal como se define en el presente documento y/o una célula tal como se define en el presente documento para la expresión de una proteína o un polipéptido de interés.
Descripción de la invención.
[0025] Los inventores identificaron un constructo de expresión para aumentar la expresión de una proteína o un polipéptido de interés. El constructo de expresión de la invención se caracteriza por dos promotores operativamente enlazados a una secuencia codificante de una proteína o un polipéptido de interés. Un constructo de expresión de la invención típicamente comprende un primer promotor seguido de un segundo promotor, una secuencia codificante de la proteína o polipéptido de interés y una secuencia de poliadenilación, en donde dicho segundo promotor está flanqueado por secuencias intrónicas. Dicho promotor flanqueado por secuencias intrónicas se denomina en este documento promotor intrónico. Se pueden insertar secuencias reguladoras de la expresión adicionales aguas arriba y aguas abajo de dichos primer y/o segundo promotor y/o aguas abajo de la secuencia de poliadenilación. Los inventores descubrieron sorprendentemente que un constructo de expresión de la invención que comprende un promotor seguido de un promotor intrónico operativamente enlazado a una secuencia codificante de una proteína o un polipéptido de interés, da como resultado un aumento significativo en la expresión de dicha proteína o polipéptido de interés en comparación con un constructo de expresión que comprende solo un promotor operativamente enlazado a dicha secuencia de codificación. Los inventores han descubierto que la expresión de proteínas en principio pobremente expresadas aumenta a niveles apreciables cuando se usa la combinación de un promotor y un promotor intrónico de la invención en lugar de un único promotor en un constructo de expresión que codifica estas proteínas, como se muestra en los ejemplos, más específicamente en el ejemplo 1. La combinación de un promotor y un promotor intrónico de la invención en un constructo de expresión para una proteína en principio pobremente expresada facilita la generación de líneas clonales y permite la generación de líneas clonales con niveles de expresión aumentados y relevantes, como se muestra en los ejemplos, más específicamente en el ejemplo 3. Además, la expresión de proteínas en principio altamente expresadas se incrementa aún más cuando se usa la combinación de un promotor y un promotor intrónico de la invención en lugar de un único promotor en un constructo de expresión que codifica estas proteínas, como se muestra en los ejemplos, más específicamente en el ejemplo 5. Además, se encontró un aumento en la cantidad total de ARNm y en la expresión medido en el nivel de proteína tal como se detalla a continuación en el presente documento y se muestra en los ejemplos adjuntos. Además, el porcentaje de líneas celulares de alto productor en un grupo transfectado de manera estable es significativamente mayor en comparación con los grupos con un único promotor operativamente enlazado a la secuencia codificante. Ya que la secuencia de nucleótidos de la invención que comprende tanto un promotor como un promotor intrónico operativamente enlazados a una secuencia de nucleótidos de interés da como resultado un aumento en la transcripción, la presente invención no se limita al uso de esta secuencia en la expresión de proteínas y/o polipéptidos y/o en la producción de proteínas y/o polipéptidos, sino que extiende al uso de esta combinación de un promotor y un promotor intrónico en métodos en los que se desean niveles más altos de transcripción, por ejemplo, en métodos para producir transcriptos de ARN no codificantes tal como se especifica adicionalmente en este documento. Además, un beneficio adicional de la invención es que, aparte de un aumento en el nivel de transcripción y/o un incremento en el nivel de expresión de la proteína o polipéptido de interés, la invención permite que se formen diferentes transcritos tal como se muestra más detalladamente en el presente documento.
[0026] Los inventores identificaron un elemento potenciador de la expresión para aumentar la expresión de una proteína o un polipéptido de interés. La presente divulgación se refiere a dicho elemento potenciador de la expresión. La aplicación del elemento potenciador de la expresión de la divulgación en un constructo de expresión que comprende además un promotor heterólogo operativamente enlazado a una secuencia que codifica una proteína o un polipéptido de interés, da como resultado un marcado aumento en la expresión de dicha proteína o polipéptido de interés en comparación con dicha expresión usando un constructo de expresión similar que solo difiere del constructo de expresión anterior en que el elemento potenciador de la expresión de la divulgación está ausente. Los inventores han encontrado que la expresión de proteínas en principio pobremente expresadas aumenta a niveles apreciables después de la inserción del elemento en un constructo de expresión que codifica estas proteínas tal como se muestra en los ejemplos, más específicamente en el ejemplo 1. La inserción del elemento potenciador de la expresión en un constructo de expresión para una proteína en principio pobremente expresada facilita la generación de líneas clonales y permite la generación de líneas clonales con niveles de expresión relevantes, como se muestra en los ejemplos, más específicamente en el ejemplo 3. Además, la expresión de proteínas en principio altamente expresadas se incrementa aún más después de la
inserción del elemento en un constructo de expresión que codifica estas proteínas tal como se muestra en los ejemplos, más específicamente en el ejemplo 5. Además, se encontró un aumento en la cantidad total del nivel de ARNm y/o en la expresión medido en el nivel de proteína tal como se detalla a continuación en el presente documento y se muestra en los ejemplos adjuntos. Ya que el elemento potenciador de la expresión de la divulgación puede dar como resultado un aumento en la transcripción, la presente divulgación no se limita al uso de este elemento en la expresión de proteínas y/o polipéptidos y/o la producción de proteínas y/o polipéptidos, sino que se extiende al uso de este elemento en métodos donde se desean niveles más altos de transcripto, por ejemplo, en métodos para producir transcripciones de ARN no codificantes tal como se especifica más adelante en este documento.
Primer aspecto
[0027] En un primer aspecto, la presente invención proporciona un constructo de ácidos nucleicos para aumentar la transcripción y/o expresión, que comprende un primer promotor y un segundo promotor, que están configurados para estar ambos operativamente enlazados a una secuencia de nucleótidos opcional de interés dentro de un constructo de expresión. «Opcional» se entiende en el presente documento como no necesariamente presente en un constructo de expresión. Por ejemplo, dicha secuencia de nucleótidos de interés no necesita estar presente en un vector de expresión comercializado, sino que una persona experta en la técnica puede introducirla fácilmente antes de usarla en un método de la invención.
[0028] Preferiblemente, dentro de este primer aspecto, dicho constructo de nucleótidos de la invención que comprende un primer promotor y un segundo promotor es capaz de aumentar la transcripción de una secuencia de nucleótidos de interés que está bajo el control de dichos primer promotor y segundo promotor. Alternativamente o en combinación con la transcripción incrementada, dicho constructo de nucleótidos también es preferiblemente capaz de aumentar la expresión de una proteína o un polipéptido de interés codificado por dicha secuencia de nucleótidos de interés. Preferiblemente, los niveles de transcripción se evalúan en un sistema de expresión usando un constructo de expresión que comprende dichos primer promotor y segundo promotor operativamente enlazados a una secuencia de nucleótidos de interés usando un ensayo adecuado tal como RT-qPCR. Preferiblemente, dentro de este primer aspecto, el constructo de nucleótidos de la invención que comprende el primer promotor y el segundo promotor de la invención permite un aumento en la transcripción de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70 %, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % de dicha secuencia de nucleótidos de interés en comparación con la transcripción que usa un constructo que solo difiere en que la secuencia de nucleótidos de interés está bajo el control de un único promotor, preferiblemente cuando se ensaya en un sistema como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, la transcripción de una secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide preferiblemente en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un primera secuencia promotora y una segunda secuencia promotora que se van a ensayar operativamente enlazadas a dicha secuencia de nucleótidos de interés. La transcripción se mide preferiblemente usando RT-qPCR y los niveles de transcripción se comparan con los niveles de transcripción de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que dichos primer promotor y segundo promotor se reemplazan por un único promotor, preferiblemente un promotor de c Mv representado por la SEC ID n.°: 57, en el vector de expresión utilizado.
[0029] Preferiblemente, dentro de este primer aspecto, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión que comprende dichos primer promotor y segundo promotor operativamente enlazados a una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo de inmunoabsorción ligada a enzimas (ELISA), una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, el primer promotor y el segundo promotor de la invención permiten un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70 %, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la expresión de dicha proteína o polipéptido que usa un constructo que solo difiere en que la secuencia de codificación de la proteína o polipéptido de interés está bajo el control de un único promotor, preferiblemente cuando se ensaya en un sistema como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un primera secuencia promotora y una segunda secuencia promotora que se van a ensayar operativamente enlazadas a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión solo difiere en que dichos primer promotor y segundo promotor son
reemplazados por un único promotor, preferiblemente un promotor de CMV representado por la SEC ID n.°: 57, en el vector de expresión utilizado.
[0030] Preferiblemente, dentro de dicho primer aspecto, el aumento de la expresión de proteínas o polipéptidos
es independiente del número de copias según lo establecido por un ensayo adecuado para determinar la dependencia del número de copias realizado por una persona experta tal como, por ejemplo, un ensayo Taqman
tríplex tal como se detalla adicionalmente en el ejemplo 4 de la presente invención.
[0031] Preferiblemente, dentro de dicho primer aspecto, dicho primer promotor está ubicado aguas arriba o en el
sitio 5 'de dicho segundo promotor. Preferiblemente, dicho segundo promotor tal como se define en el presente documento debería estar desprovisto de elementos de secuencia que actuarán como terminadores de la transcripción. Los terminadores de la transcripción bien conocidos por los expertos en la técnica son secuencias
que pueden dar como resultado la terminación prematura de la transcripción, como por ejemplo, estructuras de
horquilla estables, secuencias repetidas tales como repeticiones terminales largas (LTR) o repeticiones Alu,
motivos de poliadenilación y elementos transponibles
[0032] Dentro del contexto del primer aspecto de la invención, un promotor es un promotor capaz de iniciar la transcripción en la célula huésped elegida. Los promotores tal como se usan en el presente documento incluyen promotores específicos de tejido, preferidos de tejido, específicos del tipo de célula, inducibles y constitutivos, tal
como se define en el presente documento en la sección Definiciones. Los promotores que pueden estar comprendidos dentro de dichos primer o segundo promotor tal como se define en el presente documento son promotores que pueden emplearse en la transcripción de secuencias de nucleótidos de interés y/o la expresión
de proteínas o polipéptidos de interés, preferiblemente en células de mamífero, e incluyen, entre otros, el promotor de citomegalovirus (CMV) humano o murino, un promotor del virus del simio (SV40), un promotor de
ubiquitina C (UBC) humana o de ratón, un promotor del factor de elongación alfa (EF1-a) humano, de ratón o de
rata, un promotor de beta-actina de ratón o hámster o un promotor de hámster rpS21. Los elementos de
respuesta de Tet-Off y Tet-On aguas arriba de un promotor mínimo tal como un promotor de CMV son un
ejemplo de promotor inducible de mamífero. Ejemplos de promotores adecuados de levadura y hongos son el promotor Leu2, el promotor de galactosa (Gall o Ga17), el promotor de alcohol deshidrogenasa I (ADH1), el promotor de glucoamilasa (Gla), el promotor de triosa fosfato isomerasa (TPI), el factor de elongación de
traducción EF-I alfa (TEF2), el promotor de la gliceraldehído-3-fosfato deshidrogenasa (gpdA), promotor de la
alcohol oxidasa (AOX1) o el promotor de la glutamato deshidrogenasa (gdhA). Un ejemplo de un promotor
ubicuo fuerte para la expresión en plantas es el promotor 35S del virus del mosaico de la coliflor (CaMV).
[0033] En una realización dentro de dicho primer aspecto, dichos primer promotor y segundo promotor son promotores similares. Preferiblemente, dicho primer promotor tiene al menos un 20 %, un 25 %, un 30 %, un
35 %, un 40 %, un 45 %, un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %,
un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad
con dicho segundo promotor.
[0034] En otra realización dentro de dicho primer aspecto, dichos primer promotor y segundo promotor son promotores distintos o diferentes. Preferiblemente, dicho primer promotor tiene menos de un 80 %, un 75 %, un
70 %, un 65 %, un 60 %, un 55 %, un 50 %, un 45 %, un 40 %, un 35 %, un 30 %, un 25 %, un 20 %, un 15 %,
un 10 % o un 5 % de identidad de secuencia con dicho segundo promotor.
[0035] En una realización preferida dentro de dicho primer aspecto, dicha primera secuencia promotora comprende o consta de un promotor de UBC o un promotor de CCT8 y dicho segundo promotor comprende o
consta de un promotor de CMV, o viceversa. Preferiblemente, dicho primer promotor comprende o consta de una
secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un
90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de
identidad con los nucleótidos 1-969 de la SEC ID n.°: 1 o con los nucleótidos 1-614 de la SEC ID n.°: 2.
Preferiblemente, dicho segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un
55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 58, o preferiblemente con la SEC ID n.°: 57. Se prefiere dentro de dicho primer aspecto una secuencia de nucleótidos de la invención
en la que dicho primer promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un
60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 9 un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1 dicho segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %,
un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 57.
También se prefiere dentro de dicho primer aspecto una secuencia de nucleótidos de la invención en la que
dicho primer promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un
65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 9 un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-614 de la SEC ID n.°: 2 y dicho
segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65
%, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 57. También se prefiere dentro de dicho primer aspecto una secuencia de nucleótidos de la invención en la que dicho primer promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 58, o preferiblemente con la SEC ID n.°: 57 y en donde dicho segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-969 de la SEC ID n.° 1 o con los nucleótidos 1-614 de la SEC ID n.° 2. Preferiblemente dentro de dicho primer aspecto una secuencia de nucleótidos de la invención en la que dicho primer promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97%, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 57 y dicho segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1. También se prefiere una secuencia de nucleótidos de la invención en la que dicho primer promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: Preferiblemente y dicho segundo promotor comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-614 de la SEC ID n.°: 2.
[0036] Debe entenderse que dentro de dicho primer aspecto, dichos primer promotor y/o segundo promotor no constan solo de una secuencia potenciadora del promotor, tal como una secuencia seleccionada del grupo que consta de las SEC ID n.°: 52-54. Preferiblemente, dichos primer promotor y segundo promotor no constan solo de una secuencia potenciadora del promotor, tal como una secuencia seleccionada del grupo que consta de las SEC ID n.°: 52-54. Preferiblemente, una secuencia de nucleótidos de la invención no comprende o no consta de las SEC ID n.°: 55 o 56.
[0037] En una realización preferida dentro de dicho primer aspecto, dicho segundo promotor está flanqueado por una primera secuencia intrónica en el sitio 5' o aguas arriba de dicho segundo promotor y una segunda secuencia intrónica en el sitio 3' o aguas abajo de dicho segundo promotor. Estar «flanqueado» se entiende aquí como estar posicionado entre dichas secuencias indicadas opcionalmente separadas por 1-50, 1-60, 1-70, 1-80, 1-90, 1-100, 1-200, 1-300, 1-400, 1-500, 1-600, 1-700, 1-800, 1-900, 1-1000, 1-5000 o 1-100 000 nucleótidos, entendiéndose que estos nucleótidos abarcan la 5'-UTR. Se entiende que una secuencia intrónica es al menos parte de la secuencia de nucleótidos de un intrón. Preferiblemente, dicha primera secuencia intrónica en el sitio 5' o aguas arriba de dicho segundo promotor comprende al menos un sitio de empalme donador o sitio de empalme GT. Un sitio de empalme donador se entiende en el presente documento como un sitio de empalme que, cuando se combina con un sitio de empalme aceptor tal como se define en el presente documento, da como resultado la formación de un intrón según se define en la sección Definición. Preferiblemente, una secuencia de nucleótidos es un intrón si al menos un 2 %, un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 % o un 100 % del ARN primario pierde esta secuencia mediante empalme de ARN usando un ensayo adecuado para detectar el empalme de intrones, como por ejemplo, entre otros, la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) seguido de un análisis de tamaño o secuencia de la RT-PCR. Los sitios de empalme donadores preferidos de la invención son M-W-G-[corte]-G-T-R-A-G-K o M-A-R-[corte]-G-T-R-A-G-K en caso de que la célula huésped sea una célula de mamífero, AG-[corte]-G-T-A-W-K en caso de que la célula huésped sea una célula vegetal, [corte]-G-T-A-W-G-T-T en caso de que la célula huésped sea una célula de levadura y RG-[corte]-G-T-R-A-G, en caso de que la célula huésped sea una célula de insecto. «[corte]» debe entenderse aquí como el sitio de corte específico donde se realizará el empalme. El empalme de intrones se puede evaluar funcionalmente usando un ensayo según se detalla en la sección Definición bajo «intrón». Más preferiblemente, el sitio de empalme donador comprendido dentro de la primera secuencia intrónica de la invención es C-T-G- [corte]-G-T-G-A-G-G o A-A-A- [corte]-G-T-G-A-G-G. Preferiblemente, dicha primera secuencia intrónica consta de dicho sitio de empalme donador o sitio de empalme GT. Preferiblemente, dicha primera secuencia intrónica comprende un único sitio de empalme donador tal como se define en el presente documento. Preferiblemente, dicha primera secuencia intrónica está libre de un sitio de empalme aceptor tal como se define más adelante en el presente documento.
[0038] Preferiblemente, dentro de dicho primer aspecto, dicha segunda secuencia intrónica en el sitio 3' o aguas abajo de dicho promotor comprende al menos un sitio de empalme aceptor que se entiende aquí como el sitio de empalme AG precedido preferiblemente por una secuencia rica en pirimidina o una secuencia de nucleótidos del tracto de polipirimidina, opcionalmente separado del sitio de empalme AG por 1-50 nucleótidos, y que opcionalmente comprende además un sitio de ramificación que comprende la secuencia Y-T-N-A-Y, en el sitio 5' de la secuencia de nucleótidos del tracto de polipirimidina, en donde el sitio de ramificación puede tener la secuencia de nucleótidos C-Y-G-A-C. Un sitio de empalme aceptor se entiende en el presente documento como
un sitio de empalme que, cuando se combina con un sitio de empalme donador incluido dentro de un constructo, da como resultado la formación de un intrón tal como se define en la sección Definición. Preferiblemente, el sitio de empalme aceptor o el sitio de empalme AG tienen la secuencia [Y-rico] -N-Y-A-G- [corte]. Preferiblemente, el sitio de empalme aceptor o sitio de empalme AG tienen la secuencia [Y-rico]-N-Y-A-G-[corte]-R en caso de que la célula huésped sea una célula de mamífero, [Y-rico]-D-Y-A-G-[corte]-R o [Y-rico]-DY-A-G-[corte]-R-W en caso de que la célula huésped sea una célula vegetal, [Y-rico]-A-Y-A-G-[corte] en caso de que la célula huésped sea una célula de levadura y [Y-rico]-N-Y-A-G-[corte] en caso de que la célula huésped sea una célula de insecto. «[Y-rico]» debe entenderse aquí como el tracto de polipirimidina que se define preferiblemente como una secuencia consecutiva de al menos 10 nucleótidos que comprende al menos 6, 7, 8, 9 o preferiblemente 10 nucleótidos de pirimidina. Preferiblemente, dicho sitio de empalme aceptor o sitio de empalme GT tiene la secuencia Y-A-G-[corte]-R. Preferiblemente, dicha segunda secuencia intrónica comprende un único sitio de empalme aceptor. En una realización, dicha segunda secuencia intrónica está libre de un sitio de empalme donador tal como se define en el presente documento. En una realización alternativa, dicha segunda secuencia intrónica comprende tanto un sitio de empalme donador como un sitio de empalme aceptor tal como se define en el presente documento. Más preferiblemente, dicha segunda secuencia intrónica es un intrón tal como se define en la sección Definición. Preferiblemente, el segundo promotor y las secuencias intrónicas que flanquean al segundo promotor están configurados para formar un promotor intrónico (se hace referencia a la figura 1). Un promotor intrónico es conocido por una persona experta en la técnica como un promotor ubicado dentro de una secuencia intrónica. Preferiblemente, dicho promotor intrónico es un intrón tal como se define en la sección Definición. Preferiblemente, los límites del promotor intrónico de la presente invención están formados por el sitio de empalme donador de la secuencia intrónica en el sitio 5' o aguas arriba del segundo promotor de la invención y el sitio de empalme aceptor de la secuencia intrónica en el sitio 3' o aguas abajo del segundo promotor de la invención. El promotor intrónico de la invención puede tener una longitud que sea comparable o similar a los intrones de origen natural, preferiblemente comparable o similar a los intrones de origen natural en la célula u organismo huésped tal como se define en el presente documento. Preferiblemente, dicho promotor intrónico tal como se define en el presente documento tiene como máximo 12000 nucleótidos de longitud. Preferiblemente, dicha primera secuencia intrónica en el sitio 5' o aguas arriba de dicho segundo promotor está ubicada en el sitio 3' o aguas abajo de dicho primer promotor. Preferiblemente, el primer promotor y el segundo promotor, las secuencias intrónicas que flanquean al segundo promotor y una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés están configurados de tal manera que el primer promotor esté aguas arriba del segundo promotor, en donde el segundo promotor está flanqueado por dichas secuencias intrónicas para formar un promotor intrónico, y en donde dichos primer promotor y segundo promotor están configurados para estar tanto aguas arriba como operativamente enlazados a la secuencia de nucleótidos que codifica una proteína o un polipéptido de interés (figura 1). El promotor intrónico puede comprender más elementos potenciadores de la expresión, pero preferiblemente el promotor intrónico está libre de sitios de empalme adicionales además de los sitios de empalme donador y aceptor tal como se define en el presento documento dentro de la primera y segunda secuencias intrónicas tal como se define en el presente documento. Preferiblemente, una o más secuencias potenciadoras de la expresión están comprendidas dentro de dicho primer y/o dicho segundo promotor. Sin querer estar sujeto a ninguna teoría, la transcripción que comienza desde cualquiera de los dos promotores puede dar como resultado diferentes transcritos (pre-ARNm) que, al empalmar, dan como resultado diferentes ARNm tal como se ilustra en la figura 1. En apoyo de esta teoría, los inventores descubrieron que se forman diferentes transcritos usando un constructo de la invención (a este respecto se hace referencia a la figura 1, el ejemplo 8 y la figura 10). Además, se encuentra que la actividad aumentada se ve severamente disminuida por la mutación de 4 nucleótidos en el promotor intrónico que evita el empalme intrónico correcto (a este respecto se hace referencia a la figura 9 y al ejemplo 7), lo que apoya también la teoría de que ambos promotores están activos en el constructo. Por lo tanto, un beneficio adicional de la invención es que, aparte de un aumento en la transcripción de la secuencia de nucleótidos de interés y/o un aumento en el nivel de expresión de la proteína o el polipéptido de interés, la invención permite que se formen diferentes transcritos. Los «diferentes transcritos» se entienden aquí como transcritos que son estructuralmente diferentes o distintos, es decir, que tienen una secuencia de nucleótidos diferente o distinta. Por lo tanto, un beneficio adicional de la invención es dirigir o redirigir el empalme de una secuencia de nucleótidos de interés. Dependiendo de la ubicación de los sitios de empalme intrónico, los transcritos pueden tener una secuencia UTR diferente o distinta y/o una secuencia codificante diferente o distinta. También es posible que solo se forme un tipo de transcrito, p. ej., en caso de que las secuencias 5'-UTR de dichas primera y segunda secuencias intrónicas sean las mismas. La evaluación de si se forman diferentes transcritos se puede hacer usando cualquier método adecuado conocido por la persona experta en la técnica, tal como, entre otros, la amplificación rápida de extremos de ADNc con reacción en cadena de polimerasa (RACE-PCR).
[0039] Preferiblemente, dentro de dicho primer aspecto, dicha primera secuencia intrónica en el sitio 5' o aguas arriba de dicho segundo promotor, tiene al menos un 80 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con los nucleótidos 970-1449 de la SEC ID n.°: 1 o al menos un 80 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con los nucleótidos 667-1228 de SEC ID n.°: 2, que comprende preferiblemente al menos un sitio de empalme donador o sitio de empalme GT.
[0040] Preferiblemente, dentro de dicho primer aspecto, dicha secuencia intrónica aguas abajo o en el sitio 3 'de
dicho segundo promotor comprende una secuencia de nucleótidos que tiene al menos un 80 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con los nucleótidos 171-277 de la SEC ID n.°: 14, los nucleótidos 171-274 de la SEC ID n.°: 19, los nucleótidos 133-210 de la SEC ID n.°: 20, los nucleótidos 134-211 de la SEC ID n.°: 21, los nucleótidos 134-226 de la SEC ID n.°: 22, los nucleótidos 134-226 de la SEC ID n.°: 23, los nucleótidos 133-225 de la SEC ID n.°: 24, los nucleótidos 134-226 de la SEC ID n.°: 25, los nucleótidos 146-257 de la SEC ID n.°: 26 o los nucleótidos 147 223 de la SEC ID n.°: 27, que comprende preferiblemente al menos un sitio de empalme aceptor AG precedido por una secuencia de nucleótidos rica en TC, opcionalmente separada del sitio de empalme AG por 1-50 nucleótidos y un sitio de ramificación que comprende la secuencia Y-T-N-A-Y o C-Y-G-A-C, en el sitio 5' de la secuencia de nucleótidos rica en TC.
[0041] En una realización preferida dentro de dicho primer aspecto, dicho primer promotor está flanqueado en su sitio 3' por dicha primera secuencia intrónica. En una realización, dicho primer promotor y dicha primera secuencia intrónica no están alineadas en la naturaleza sino alineadas en un constructo de la invención mediante recombinación. En otra realización, dicha secuencia que comprende dicho primer promotor flanqueado en su sitio 3' por dicha primera secuencia intrónica se deriva de una secuencia de origen natural. En una realización preferida, dicha secuencia de nucleótidos que comprende tanto un primer promotor como una primera secuencia intrónica según la presente invención es una secuencia derivada del gen de ubiquitina UBC. Preferiblemente, dicha secuencia se deriva de un gen de ubiquitina UBC de mamífero. Más preferiblemente, dicha secuencia de nucleótidos que comprende tanto un primer promotor como una primera secuencia intrónica según la presente invención se deriva del gen Cricetulus griseus homólogo del gen de ubiquitina UBC humana, dicho gen se indica como gen Cricetulus sp. para poliubiquitina o CRUPUQ (GenBank D63782). En una realización preferida, dicha secuencia de nucleótidos derivada de CRUPUQ comprende tanto un primer promotor como una primera secuencia intrónica de la invención y es una secuencia contigua de al menos 500, 600, 700, 800, 900, 1000 o 1117 de longitud, preferiblemente al menos 1449 nucleótidos de longitud de la SEC ID n.°: 1. Preferiblemente, dicha secuencia de nucleótidos tiene al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 1 tiene como máximo 80007000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 de longitud. Más preferiblemente, dicha secuencia tiene 1449 nucleótidos de longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 65 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 70% de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 75% de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 80% de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 85% de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 90% de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 95% de identidad con la SEC ID n.°: 1 en toda su longitud. También se prefiere una secuencia de, como máximo, 8000 nucleótidos que tengan al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 1.
[0042] En una realización preferida adicional dentro de dicho primer aspecto, dicha secuencia de nucleótidos que comprende tanto un primer promotor como una primera secuencia intrónica según la presente invención es una secuencia derivada del gen de ubiquitina UBC. Preferiblemente, dicha secuencia se deriva de un gen CCT8 de mamífero. Más preferiblemente, dicha secuencia de nucleótidos que comprende tanto un primer promotor como una primera secuencia intrónica según la presente invención se deriva del gen CCT8 humano u homo sapiens. En una realización preferida, dicha secuencia de nucleótidos derivada de dicho gen CCT8 que comprende tanto un primer promotor como una primera secuencia intrónica de la invención es una secuencia contigua de al menos 500, 600, 700, 791 o 1223 de longitud, preferiblemente al menos 1228 nucleótidos de longitud de la SEC ID n.°: 2. Preferiblemente, dicha secuencia de nucleótidos tiene al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 2 tiene como máximo 8000 nucleótidos de longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 de longitud. Más preferiblemente, dicha secuencia tiene 1228 nucleótidos de longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 65 % de identidad con la SEC
ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 70% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 75% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 80% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 85% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 90% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 95% de identidad con la SEC ID n.°: 2 en toda su longitud.
También se prefiere una secuencia de, como máximo, 8000 nucleótidos que tengan al menos un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94%, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 2 en toda su longitud.
[0043] Preferiblemente dentro de dicho primer aspecto, dicha secuencia de nucleótidos que comprende un primer promotor y una primera secuencia intrónica tal como se define en el presente documento tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90%, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con cualquiera de SEC ID n.°: 1, 2 y 59-61 en toda su longitud. Preferiblemente, dicha secuencia de nucleótidos que comprende un primer promotor y una primera secuencia intrónica tal como se define en el presente documento comprende o consta de cualquiera de las secuencias seleccionadas del grupo que consta de las SEC ID n.°: 1, 2 y 59-61. Más preferiblemente, dicha secuencia de nucleótidos que comprende un primer promotor y una primera secuencia intrónica tal como se define en el presente documento comprende o consta de cualquiera de las secuencias seleccionadas del grupo que consta de las SEC ID n.°: 1,2 y 59.
[0044] Preferiblemente, el constructo de nucleótidos del primer aspecto comprende además una o más secuencias reguladoras de la expresión adicionales, en donde preferiblemente dicho primer promotor, dichas secuencias intrónicas tal como se definen en el presente documento y, opcionalmente, dicha secuencia reguladora adicional de la expresión están todos configurados para estar operativamente enlazados a una secuencia de nucleótidos opcional de interés. Una «secuencia reguladora adicional de la expresión» debe entenderse en el presente documento como una secuencia o elemento además del primer y/o segundo promotor y/o la primera y/o segunda secuencia intrónica tal como se ha definido anteriormente en el presente documento, y puede ser una secuencia de mejora adicional de la expresión y/o una secuencia que mejora la expresión distinta. Una secuencia reguladora adicional de la expresión que abarca la presente invención puede ser, por ejemplo, una regulación transcripcional y/o traduccional de un gen, que incluye, entre otras, una 5'-UTR, una 3'-UTR, un potenciador, un promotor, un intrón, una señal de poliadenilación y elementos de control de cromatina como S/MAR (región de asociación a andamiaje/matriz), un elemento de apertura de cromatina ubicuo, una isla de guanina fosfodiéster citosina y un STAR (elemento estabilizador y antirrepresor), y cualquier derivado de los mismos. Otras secuencias reguladoras opcionales que pueden estar presentes en el constructo de ácidos nucleicos de la invención incluyen, entre otras, secuencias codificantes de nucleótidos de secuencias de nucleótidos homólogas y/o heterólogas, que incluyen el elemento sensible al hierro (IRE), elemento traslacional cis-regulador (TLRE) o uORF en las 5'-UTR y tramos de poli(U) en las 3'-UTR. Dichos elemento o elementos reguladores de la expresión adicionales, preferiblemente potenciadores, pueden ubicarse en cualquier posición en el constructo, preferiblemente alineándose directamente o comprendidos dentro de dichos primer promotor y/o segundo promotor.
[0045] Una secuencia reguladora preferida adicional dentro de dicho primer aspecto comprende o consta de un elemento potenciador de la traducción. Preferiblemente, un elemento potenciador de la traducción permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la expresión de dicha proteína o polipéptido que usa un constructo que solo difiere en que está libre de dicho elemento potenciador de la traducción, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, preferiblemente la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la traducción que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión está libre de dicho elemento potenciador de la traducción que se va a ensayar.
[0046] Preferiblemente, dentro de dicho primer aspecto, dicho elemento potenciador de la traducción comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con cualquiera de las SEC ID n.°: 3-51 en toda su longitud, o un elemento potenciador de la traducción que comprende o consta de una secuencia de nucleótidos que comprende:
i) una secuencia de nucleótidos repetida GAA, una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T;
ii) una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T, dicha primera secuencia de nucleótidos no comprende una secuencia de nucleótidos repetida GAA; o,
iii) una secuencia de nucleótidos repetida GAA, una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T, en donde dicha secuencia de nucleótidos repetida GAA se encuentra en 3' de cualquiera de dichas secuencias de nucleótidos ricas en TC, secuencias de nucleótidos ricas en A y/o secuencias de nucleótidos ricas en GT.
[0047] La secuencia de nucleótidos repetida GAA se define en el presente documento de manera que comprende al menos 3 repeticiones Ga A. La secuencia de nucleótidos repetida GAA puede comprender una repetición GAA imperfecta. La secuencia de nucleótidos repetida GAA puede tener al menos un 50 % de identidad de secuencia o al menos un 60 % de identidad de secuencia o al menos un 70 % de identidad de secuencia o al menos un 80 % de identidad de secuencia o al menos un 90 % de identidad de secuencia o un 100% de identidad de secuencia con los nucleótidos 14-50 de la SEC ID n.°: 3. La repetición imperfecta de GAA puede comprender la secuencia de nucleótidos (GAA)sATAA (GAA)s.
[0048] La secuencia de nucleótidos rica en TC se define en el presente documento de modo que tiene al menos un 70 %, un 80 %, un 90 % o un 100 % de identidad de secuencia con los nucleótidos 54-68 de la SEC ID n.°: 3.
[0049] La secuencia de nucleótidos rica en A se define en el presente documento de modo que tiene al menos una identidad de secuencia de un 70 %, un 80 %, un 90 % o un 100 % con cualquiera de los nucleótidos 77-87, los nucleótidos 93-105, los nucleótidos 111-121, los nucleótidos 126-132 o los nucleótidos 152-169 de la SEC ID n.°: 3, respectivamente.
[0050] La secuencia de nucleótidos rica en GT se define en el presente documento de modo que tiene al menos un 70 %, un 80 %, un 90 % o un 100 % de identidad de secuencia con los nucleótidos 133-148 de la SEC ID n.°: 3.
[0051] Preferiblemente, dentro de dicho primer aspecto, dicha secuencia potenciadora de la traducción comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con cualquiera de las SEC ID n.°: 19. Preferiblemente, dicha secuencia potenciadora de la traducción se encuentra aguas abajo o en el sitio 3' de la segunda secuencia promotora de la invención y aguas arriba o en el sitio 5' de una secuencia de nucleótidos opcional que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha secuencia potenciadora de la traducción está ubicada aguas abajo o en el sitio 3' de la segunda secuencia promotora de la invención y aguas arriba o en el sitio 5' de la segunda secuencia intrónica tal como se define en el presente documento.
[0052] Más preferiblemente dentro de dicho primer aspecto, dicho constructo de ácidos nucleicos del primer aspecto de la invención que comprende un primer promotor, una primera secuencia intrónica, un segundo promotor y una segunda secuencia intrónica, tiene al menos un 45%, un 50%, un 55%, un 60%, un 65%, un 70%, un 75%, un 80%, un 85%, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con las SEC ID n.°: 73, 74, 75 o 76.
[0053] Preferiblemente dentro de dicho primer aspecto, el constructo de ácidos nucleicos de la invención comprende además una secuencia de nucleótidos de interés operativamente enlazada y/o bajo el control de dichos primer promotor y segundo promotor y opcionalmente dicha secuencia reguladora adicional de la expresión tal como se define en el presente documento. Debe entenderse que dichos primer promotor y segundo promotor y opcionalmente dicha secuencia reguladora adicional de la expresión, están configurados para estar operativamente enlazados a la misma secuencia de nucleótidos sencilla de interés. En una realización preferida, dicha secuencia de nucleótidos de interés es una secuencia de nucleótidos que codifica una proteína o un
polipéptido de interés. La proteína o el polipéptido de interés pueden ser una proteína o un polipéptido homólogos, pero en una realización preferida de la invención, la proteína o el polipéptido de interés son una proteína o un polipéptido heterólogos. Una secuencia de nucleótidos que codifica una proteína o un polipéptido heterólogos puede derivarse total o parcialmente de cualquier fuente conocida en la técnica, incluyendo un genoma o episoma bacteriano o viral, ADN eucariótico nuclear o de plásmido, ADNc o ADN sintetizado químicamente. La secuencia de nucleótidos que codifica una proteína o un polipéptido de interés puede constituir una región codificante ininterrumpida o puede incluir uno o más intrones unidos por uniones de empalme apropiadas, puede además estar compuesta de segmentos derivados de diferentes fuentes naturales o sintéticas. La secuencia de nucleótidos que codifica la proteína o el polipéptido de interés según el método de la invención es preferiblemente una secuencia de nucleótidos de longitud completa, pero también puede ser una parte funcionalmente activa u otra parte de dicha secuencia de nucleótidos de longitud completa. La secuencia de nucleótidos que codifica la proteína o el polipéptido de interés también puede comprender secuencias de señal que dirigen la proteína o polipéptido de interés cuando se expresa en una ubicación específica de la célula o tejido. Además, la secuencia de nucleótidos que codifica la proteína o el polipéptido de interés también puede comprender secuencias que facilitan la purificación de proteínas y la detección de proteínas mediante, por ejemplo, transferencia de Western y ELISA (por ejemplo, secuencias de c-myc o polihistidina).
[0054] Dentro del contexto de la invención, la proteína o el polipéptido de interés pueden tener aplicaciones industriales o médicas (farmacéuticas). Los ejemplos de proteínas o polipéptidos con aplicaciones industriales incluyen enzimas tales como, p. ej., lipasas (p. ej., utilizadas en la industria de los detergentes), proteasas (utilizadas, entre otras cosas, en la industria de los detergentes, en la elaboración de cerveza y similares), enzimas que degradan la pared celular (tales como celulasas, pectinasas, beta-1,3/4-beta-1,6-glucanasas, ramnogalacturonasas, mananasas, xilanasas, pululanasas, galactanasas, esterasas y similares, utilizadas en el procesamiento de frutas, en fabricación de vino y similares o en piensos), fitasas, fosfolipasas, glucosidasas (tales como amilasas, beta-glucosidasas, arabinofuranosidasas, ramnosidasas, apiosidasas y similares) y enzimas lácteas (por ejemplo, quimosina). Las proteínas o polipéptidos y/o enzimas de mamíferos, y preferiblemente humanos, con aplicaciones terapéuticas, cosméticas o de diagnóstico incluyen, entre otros, insulina, albúmina sérica (HSA), lactoferrina, hemoglobina a y p, activador del plasminógeno tisular (tPA), eritropoyetina (EPO), factores de necrosis tumoral (TNF), BMP (proteína morfogénica ósea), factores de crecimiento (G-CSF, GM-CSF, M-CSF, PDGF, EGF y similares), hormonas peptídicas (por ejemplo, calcitonina, somatomedina , somatotropina, hormonas de crecimiento, hormona foliculoestimulante (FSH), interleucinas (IL-x), interferones (IFN-y), fosfatasas, anticuerpos y proteínas similares a los anticuerpos, como, entre otros, anticuerpos multiespecíficos como DART (reorientación de doble afinidad) y proteína tricuerpo y fragmentos de anticuerpos como Fc, Fab, Fab2, Fv y scFv. También se incluyen antígenos bacterianos y víricos, por ejemplo, para su uso como vacunas, que incluyen, por ejemplo, la subunidad p de la toxina termolábil, la subunidad p de la toxina del cólera, la proteína de la superficie de la envoltura del virus de la hepatitis B, la proteína de la cápside del virus de Norwalk, la glucoproteína B de citomegalovirus humano, la glucoproteína S, interferones y receptores de coronavirus de gastroenteritis transmisible y similares. Además se incluyen genes que codifican mutantes o análogos de dichas proteínas.
[0055] Dentro del contexto de la invención, en una realización alternativa, dicha secuencia de nucleótidos de interés no es una secuencia codificante de una proteína o un polipéptido, sino que puede ser una secuencia de nucleótidos funcional tal como, entre otras, una secuencia que codifica un a Rn no codificante, en donde se entiende que un ARN no codificante es un ARN que no codifica una proteína o polipéptido. Preferiblemente, dicho ARN no codificante es una secuencia de referencia o molécula reguladora que puede regular la expresión de genes o regular la actividad o localización de proteínas o polipéptidos. Por ejemplo, un ARN no codificante puede ser una molécula de ARN o ARNmi antisentido. Puesto que se cree que el primer promotor y el segundo promotor de la invención funcionan a nivel de transcripción, es decir, se cree que el aumento de la expresión mediante la secuencia de la invención que comprende dichos primer promotor y segundo promotor tal como se muestra en el presente documento es el resultado de un aumento en la transcripción, el constructo de la invención también puede usarse para producir niveles aumentados de transcritos, así como para producir transcritos con diferentes secuencias. Los niveles de transcripción pueden cuantificarse usando métodos de cuantificación de transcripción regulares conocidos por la persona experta en la técnica, tales como, entre otros, transferencia de Northern y RT-qPCR.
Segundo aspecto
[0056] En un segundo aspecto, la presente invención proporciona un vector de expresión que comprende un constructo de ácidos nucleicos según el primer aspecto de la invención. El constructo de ácidos nucleicos según la invención es preferiblemente un vector, en particular un plásmido, cósmido o fago o secuencia de nucleótidos, lineal o circular, de un ADN o ARN monocatenario o bicatenario, derivado de cualquier fuente, en el que varias secuencias de nucleótidos se han unido o recombinado en un constructo único capaz de introducir cualquiera de las secuencias de nucleótidos de la invención en una célula en las orientaciones sentido o antisentido. La elección del vector depende de los procedimientos recombinantes seguidos y de la célula huésped utilizada. El vector puede ser un vector de replicación autónoma o puede replicarse junto con el cromosoma en el que se ha integrado. Preferiblemente, el vector contiene un marcador de selección. Los marcadores útiles dependen de la
célula huésped elegida, son bien conocidos por los expertos en la técnica y se seleccionan de, entre otros, los marcadores de selección tal como se define en el tercer aspecto de la invención. Un vector de expresión preferido es el vector de expresión ADNpc3.1. Los marcadores de selección preferidos son el gen de resistencia a la neomicina, el gen de resistencia a la zeocina y el gen de resistencia a la blasticidina.
Tercer aspecto
[0057] En un tercer aspecto, la presente invención proporciona una célula que comprende un constructo de ácidos nucleicos según el primer aspecto de la invención y/o un vector de expresión según el segundo aspecto de la invención tal como se define aquí.
[0058] Dentro del contexto de la invención, una célula puede ser una célula de mamífero, incluyendo una célula humana, una célula de planta, una célula de animal, una célula de insecto, una célula de hongo, una célula de levadura o una célula bacteriana. Una célula huésped recombinante, por ejemplo, una célula de mamífero, incluyendo humanos, de planta, de animal, de insecto, de hongo o bacteriana, que contiene una o más copias de un constructo de ácidos nucleicos según la invención es un tema adicional de la invención. Por célula huésped se entiende una célula que contiene un constructo de ácidos nucleicos, por ejemplo, un vector y respalda la replicación y/o expresión del constructo de ácidos nucleicos. Ejemplos de bacterias adecuadas son bacterias gram positivas, tal como varias especies de los géneros Bacillus, Streptomyces y Staphylococcus o bacterias Gram negativas, tales como varias especies de los géneros Escherichia y Pseudomonas. Las células fúngicas incluyen células de levadura. La expresión en la levadura se puede lograr mediante el uso de cepas de levadura tales como Pichia pastoris, Saccharomyces cerevisiae y Hansenula polymorpha. Otras células fúngicas de interés incluyen células de hongos filamentosos como Aspergillus niger, Trichoderma reesei y similares. Además, las células de insecto tales como las células o líneas celulares de Drosophila melanogaster, Spodoptera frugiperda y Trichoplusia ni, tales como, entre otras, células S2, Sf9, Sf21 y High Five, pueden usarse como células huésped. Alternativamente, un sistema de expresión adecuado puede ser un sistema de baculovirus o sistemas de expresión que usan células de mamífero tales como células CHO, COS, CPK (riñón porcino), MDCK, BHK, Sp2/0, NS0 y Vero. Una célula humana o línea celular humana adecuada es una célula o línea celular de astrocito, adipocito, condrocito, endotelial, epitelial, fibroblastos, cabello, queratinocitos, melanocitos, osteoblastos, músculo esquelético, músculo liso, célula madre o sinoviocito. Los ejemplos de líneas celulares humanas adecuadas también incluyen HEK 293 (riñón embrionario humano), HeLa, Per.C6, CAP (líneas celulares derivadas de amniocitos humanos primarios) y células de melanoma de Bowes. En una realización, una célula humana no es una célula madre embrionaria.
[0059] Por lo tanto, otro aspecto de la invención se refiere a una célula huésped que está modifica genéticamente, preferiblemente mediante un método de la invención, en el sentido de que una célula huésped comprende un constructo de ácidos nucleicos tal como se ha definido en el presente documento anteriormente. La célula huésped es una célula que ha sido modificada genéticamente. La célula huésped de expresión puede reemplazarse por una célula modificada o una célula transformada o una célula recombinante o una célula huésped modificada o una célula huésped transformada o una célula huésped recombinante. Para los procedimientos de transformación en plantas, las bacterias adecuadas incluyen Agrobacterium tumefaciens y Agrobacterium rhizogenes.
[0060] Un constructo de ácidos nucleicos preferiblemente se mantiene de manera estable, ya sea como un elemento de replicación autónoma, o, más preferiblemente, el constructo de ácidos nucleicos se integra en el genoma de la célula huésped, en cuyo caso el constructo generalmente se integra en posiciones aleatorias en el genoma de la célula huésped, por ejemplo, mediante recombinación no homóloga. Las células huésped transformadas de forma estable se producen mediante métodos conocidos. El término «transformación estable» se refiere a exponer las células a métodos para transferir e incorporar ADN extraño en su genoma. Estos métodos incluyen, entre otros, la transferencia de ADN purificado a través de reactivos lipídicos catiónicos y polietilenimida (PEI), coprecipitación de fosfato de calcio, bombardeo de micropartículas, electroporación de protoplastos y microinyección o uso de fibras de silicio para facilitar la penetración y transferencia de ADN en la célula huésped.
[0061] Alternativamente, una proteína o un polipéptido de interés pueden expresarse en una célula huésped, por ejemplo, una célula de mamífero, apoyándose en la expresión transitoria de los vectores.
[0062] Un constructo de ácidos nucleicos según la invención también comprende preferiblemente un gen marcador que puede proporcionar capacidad de selección o cribado en una célula huésped tratada. Los marcadores seleccionables generalmente se prefieren para los eventos de transformación del huésped, pero no están disponibles para todas las células del huésped. Un constructo de ácidos nucleicos descrito en el presente documento también puede incluir una secuencia de nucleótidos que codifica un producto marcador. Se puede usar un producto marcador para determinar si el constructo o parte del mismo se ha suministrado a la célula y una vez suministrado se está expresando. Los ejemplos de genes marcadores incluyen, entre otros, el gen lacZ de E. coli, que codifica la p-galactosidasa, y un gen que codifica la proteína verde fluorescente.
[0063] Dentro del contexto de la invención, los ejemplos de marcadores seleccionables adecuados para células de mamífero incluyen, entre otros, dihidrofolato reductasa (DHFR), glutatión sintetasa (GS), timidina quinasa, neomicina, análogo de neomicina G418, higromicina, blasticidina, zeocina y puromicina.
[0064] Otros marcadores seleccionables adecuados incluyen, entre otros, genes resistentes a antibióticos, genes metabólicos, genes auxotróficos o genes resistentes a herbicidas que, cuando se insertan en una célula huésped en cultivo, conferirían a esas células la capacidad de resistir la exposición a un antibiótico. Los genes marcadores metabólicos o auxotróficos permiten que las células transformadas sinteticen un componente esencial, generalmente un aminoácido, que permite que las células crezcan en medios que carecen de este componente. Otro tipo de gen marcador es uno que puede cribarse mediante análisis histoquímico o bioquímico, incluso aunque el gen no pueda seleccionarse. Un gen marcador adecuado que es útil en dicha experiencia de transformación de células huésped es un gen de luciferasa. La luciferasa cataliza la oxidación de la luciferina, lo que da lugar a la producción de oxiluciferina y luz. Por lo tanto, el uso de un gen de luciferasa proporciona un ensayo conveniente para la detección de la expresión de ADN introducido en células huésped mediante análisis histoquímico de las células. En un ejemplo de un proceso de transformación, una secuencia de nucleótidos que intenta expresarse en una célula huésped puede acoplarse en tándem con el gen de la luciferasa. El constructo en tándem podría transformarse en células huésped, y las células huésped resultantes podrían analizarse para la expresión de la enzima luciferasa. Una ventaja de este marcador es el procedimiento no destructivo de aplicación del sustrato y la posterior detección.
[0065] Cuando dichos marcadores seleccionables se transfieren con éxito a una célula huésped, la célula huésped transformada puede sobrevivir si se coloca bajo presión selectiva. Hay dos categorías distintas de regímenes selectivos ampliamente utilizados. La primera categoría se basa en el metabolismo de una célula y el uso de una línea celular mutante que carece de la capacidad de crecer de manera independiente de un medio suplementado. Dos ejemplos no limitantes son las células CHO DHFR y las células LTK de ratón. Estas células carecen de la capacidad de crecer sin la adición de nutrientes tales como la timidina o la hipoxantina. Debido a que estas células carecen de ciertos genes necesarios para una ruta completa de síntesis de nucleótidos, no pueden sobrevivir a menos que los nucleótidos ausentes se proporcionen mediante un medio suplementado. Una alternativa para suplementar los medios es introducir un gen DHFR o TK intacto en las células que carecen de los genes respectivos, alterando así sus requisitos de crecimiento. Las células individuales que no se transformaron con el gen DHFR o TK no serán capaces de sobrevivir en medios no suplementados.
[0066] La segunda categoría es la selección dominante que se refiere a un esquema de selección utilizado en cualquier tipo de célula y no requiere el uso de una línea celular mutante. Estos esquemas suelen usar un medicamento para detener el crecimiento de una célula huésped. Aquellas células que tienen un gen nuevo expresarían una proteína que transmite resistencia frente a los medicamentos y sobrevivirían a la selección. Los ejemplos de tal selección dominante usan los medicamentos neomicina, (Southern P. y Berg, P., J. Molec. Appl. Genet. 1: 327 (1982)), ácido micofenólico, (Mulligan, R.C. y Berg, P. Science 209: 1422 (1980)) o higromicina, (Sugden, B. et al., Mol. Cell. Biol. 5: 410-413 (1985)). Los tres ejemplos emplean genes bacterianos bajo control eucariótico para transmitir resistencia frente al fármaco apropiado G418 o neomicina (geneticina), xgpt (ácido micofenólico) o higromicina, respectivamente. Otros incluyen el análogo de neomicina G418 y la puromicina. Otros marcadores útiles dependen de la célula huésped elegida y son bien conocidos por los expertos en la técnica.
[0067] Cuando se obtiene una célula huésped transformada con un método según la invención (véase más adelante), se puede regenerar un tejido huésped a partir de dicha célula transformada en un medio adecuado, que opcionalmente puede contener antibióticos o biocidas conocidos en la técnica para la selección de células transformadas.
[0068] Los tejidos huésped transformados resultantes se identifican preferiblemente mediante selección usando un gen marcador de selección presente en un constructo de ácidos nucleicos tal como se define en el presente documento.
Cuarto aspecto
[0069] En un cuarto aspecto, la presente invención proporciona un método para expresar y opcionalmente purificar una proteína o un polipéptido de interés que comprende el paso de:
a) proporcionar un constructo de ácidos nucleicos según el primer aspecto de la invención que comprende una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada exprese la proteína o polipéptido de interés; y opcionalmente d) purificar dicha proteína o polipéptido de interés.
[0070] El método de la invención puede ser un método in vitro o ex vivo. El método de la invención se puede aplicar en un cultivo celular, cultivo de organismos o cultivo de tejidos. Alternativamente, junto a la expresión en células huésped, la proteína o el polipéptido de interés pueden producirse en sistemas de traducción sin células usando ARN derivados de los constructos de ácidos nucleicos de la presente invención. El método de la invención puede ejecutarse en células cultivadas.
[0071] El experto en la técnica es capaz de transformar células según el paso b). Los métodos de transformación que se usan en el paso b) incluyen, entre otros, la transferencia de ADN purificado a través de reactivos lipídicos catiónicos y polietilenimida (PEI), coprecipitación de fosfato de calcio, bombardeo de micropartículas, electroporación de protoplastos y microinyección o uso de fibras de silicio para facilitar la penetración y transferencia de ADN en la célula huésped.
[0072] En el paso c) se permite que la célula transformada exprese la proteína o el polipéptido de interés, y opcionalmente dicha proteína o polipéptido se recupera a continuación. Por ejemplo, la célula transformada puede someterse a condiciones que producen la expresión de la proteína o el polipéptido de interés. Los expertos en la técnica conocen bien las técnicas que se van a utilizar para expresar o sobreexpresar la proteína o el polipéptido de interés. Los métodos en los que la célula transformada no necesita someterse a condiciones específicas que producen la expresión de la proteína o el polipéptido de interés pero en los que la proteína o el polipéptido de interés se expresan automáticamente (por ejemplo, constitutivamente), también se incluyen en el método de la presente invención.
[0073] Dentro del contexto de la invención, los pasos de purificación dependen de la proteína o el polipéptido expresados y la célula huésped utilizada, pero pueden comprender el aislamiento de la proteína o el polipéptido. Cuando se aplica a una proteína/polipéptido, el término «aislamiento» indica que la proteína o el polipéptido se encuentran en una condición diferente a la de su entorno nativo. En una forma preferida, la proteína o el polipéptido aislado está sustancialmente libre de otras proteínas, particularmente otras proteínas homólogas. Se prefiere proporcionar la proteína o el polipéptido en una forma con una pureza superior al 40 %, más preferiblemente en una forma con una pureza superior al 60 %. Incluso más preferiblemente, se prefiere proporcionar la proteína o el polipéptido en una forma altamente purificada, es decir, una pureza superior al 80 %, más preferiblemente una pureza superior al 95% y aún más preferiblemente una pureza superior al 99%, según lo determinado mediante SDS-PAGE. Si se desea, la secuencia de nucleótidos que codifica una proteína o un polipéptido de interés se puede ligar a una secuencia de nucleótidos heteróloga para codificar una proteína o un polipéptido de fusión para facilitar la purificación de proteínas y la detección de proteínas, por ejemplo, en transferencia Western y ELISA. Las secuencias heterólogas adecuadas incluyen, entre otras, las secuencias de nucleótidos que codifican proteínas tales como, por ejemplo, glutatión-S-transferasa, proteína de unión a maltosa, polihistidina de unión a metal, proteína fluorescente verde, luciferasa y beta-galactosidasa. La proteína o el polipéptido también se pueden acoplar a vehículos, etiquetas o marcadores no peptídicos que facilitan el rastreo de la proteína o el polipéptido, tanto in vivo como in vitro, y permiten la identificación y la cuantificación de la unión de la proteína o el polipéptido a sustratos. Dichas etiquetas, marcadores o vehículos son bien conocidos en la técnica e incluyen, entre otros, biotina, marcadores radiactivos y marcadores fluorescentes.
[0074] Preferiblemente, el método de este cuarto aspecto de la invención permite un aumento en la expresión de una proteína o un polipéptido de interés. Preferiblemente, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión según el primer aspecto de la invención que comprende un primer y un segundo promotor según el primer aspecto de la invención, operativamente enlazados a una secuencia de nucleótidos que codifica una proteína o polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo ELISA, una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, el método de la invención permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho primer promotor y dicho segundo promotor y está operativamente enlazado a un único promotor, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un primera secuencia promotora y una segunda secuencia promotora que se van a ensayar operativamente enlazadas a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que dichos primer promotor y segundo promotor son reemplazados por un único promotor, preferiblemente un promotor de CMV representado por la SEC ID n.°: 57, en el vector de expresión utilizado.
Quinto aspecto
[0075] En un quinto aspecto, la presente invención proporciona un método para expresar una proteína o un polipéptido de interés en un organismo, que comprende los pasos de:
a) proporcionar un constructo de ácidos nucleicos según el primer aspecto de la invención que comprende una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés; y,
b) poner en contacto una célula diana y/o tejido diana de un organismo con dicho constructo de ácidos nucleicos para obtener una célula diana transformada y/o tejido diana transformado, permitiendo que dicha célula transformada exprese la proteína o el polipéptido de interés; y opcionalmente
c) permitir que dicha célula diana transformada y/o tejido diana se desarrolle en un organismo transformado; y, opcionalmente,
d) permitir que dicho organismo transformado exprese la proteína o el polipéptido de interés, por ejemplo, sometiendo dicho organismo transformado a condiciones que produzcan la expresión de la proteína o el polipéptido de interés, y opcionalmente recuperar dicha proteína o polipéptido.
[0076] Dentro del contexto de la invención, la célula diana puede ser una célula diana embrionaria, p. ej., una célula madre embrionaria, por ejemplo, derivada de un mamífero no humano, tal como de las especies bovina, porcina, etc. Preferiblemente, dicha célula diana no es una célula madre embrionaria humana. En el caso de un hongo multicelular, dicha célula diana puede ser una célula fúngica que puede proliferar en dicho hongo multicelular. Cuando se obtiene un tejido vegetal transformado o una célula vegetal (por ejemplo, trozos de hoja, segmentos de tallo, raíces, pero también protoplastos o células vegetales cultivadas por suspensión) con el método según la invención, se pueden regenerar plantas enteras a partir de dicho tejido o célula transformados en un medio adecuado, que opcionalmente puede contener antibióticos o biocidas conocidos en la técnica para la selección de células transformadas. El método de la invención se puede aplicar en vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano. Se incluye dentro de la presente invención un método de tratamiento que comprende el método del presente aspecto, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico. La invención también se refiere a un constructo del primer aspecto de la invención para el tratamiento, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico. Además, la invención también se refiere a un constructo del primer aspecto de la invención para la fabricación de un medicamento, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico.
[0077] Además, una parte de la invención es un organismo transformado no humano. Dicho organismo se transforma con una secuencia de nucleótidos, un constructo de ácidos nucleicos recombinante o un vector según la presente invención, y es capaz de producir el polipéptido de interés. Esto incluye un organismo transgénico no humano, tal como un mamífero transgénico no humano, una planta transgénica (incluyendo la propagación, la cosecha y el material de tejido de dicha planta transgénica, que incluye, entre otros, hojas, raíces, brotes y flores), un hongo multicelular y similares.
[0078] Preferiblemente, el método de este quinto aspecto de la invención permite un aumento en la expresión de una proteína o un polipéptido de interés en dicho organismo o al menos en un tejido u orgánulo u órgano de dicho organismo. Preferiblemente, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión según el primer aspecto de la invención que comprende un primer y un segundo promotor según el primer aspecto de la invención, operativamente enlazados a una secuencia de nucleótidos que codifica una proteína o polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo ELISA, una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, el método de la invención permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en dicho organismo o al menos en un tejido u orgánulo u órgano de dicho organismo en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho primer promotor y dicho segundo promotor y está operativamente enlazado a un único promotor, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un primera secuencia promotora y una segunda secuencia promotora que se van a ensayar operativamente enlazadas a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que dichos primer promotor y segundo promotor son reemplazados por un único promotor, preferiblemente un promotor de CMV representado por la
SEC ID n.°: 57, en el vector de expresión utilizado. Preferiblemente, dicho aumento de la expresión de proteínas o polipéptidos es independiente del número de copias según lo establecido por un ensayo adecuado para determinar la dependencia del número de copias realizado por una persona experta tal como, por ejemplo, un ensayo Taqman tríplex tal como se detalla adicionalmente en el ejemplo 4 de la presente invención.
Sexto aspecto
[0079] En un sexto aspecto, la presente invención proporciona un método para la transcripción y opcionalmente la purificación del transcrito producido que comprende el paso de:
a) proporcionar un constructo de ácidos nucleicos según el primer aspecto de la invención que comprende una secuencia de nucleótidos de interés; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca un transcrito de la secuencia de nucleótidos de interés; y opcionalmente
d) purificar dicha transcrito producido.
[0080] En una realización preferida del método según la invención, se usa un constructo de ácidos nucleicos tal como se ha definido anteriormente. El método de la invención puede ser un método in vitro o ex vivo. El método de la invención se puede aplicar en un cultivo celular, cultivo de organismos o cultivo de tejidos. El método de la invención se puede aplicar en vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, preferiblemente en un ser humano. Se incluye dentro de la presente invención un método para el tratamiento que comprende o consta del método del presente aspecto, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico. La invención también se refiere a un constructo del primer aspecto de la invención para su uso en el tratamiento, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico. Además, la invención también se refiere a un constructo del primer aspecto de la invención para la fabricación de un medicamento, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico.
[0081] El experto en la técnica es capaz de transformar células según el paso b). Los métodos de transformación que se usan en el paso b) incluyen, entre otros, la transferencia de ADN purificado a través de reactivos lipídicos catiónicos y polietilenimida (PEI), coprecipitación de fosfato de calcio, bombardeo de micropartículas, electroporación de protoplastos y microinyección o uso de fibras de silicio para facilitar la penetración y transferencia de ADN en la célula huésped.
[0082] En el paso c) se permite que la célula transformada produzca un transcrito de la secuencia de nucleótidos de interés y opcionalmente el transcrito producido se recupera posteriormente. Por ejemplo, la célula transformada puede someterse a condiciones que producen la transcripción de la secuencia de nucleótidos de interés. Los expertos en la técnica conocen bien las técnicas que se van a utilizar para la transcripción de la secuencia de nucleótidos de interés. Los métodos en los que la célula transformada no necesita someterse a condiciones específicas que producen la transcripción de la secuencia de nucleótidos de interés, pero en los que la secuencia de nucleótidos de interés se transcribe automáticamente (por ejemplo, constitutivamente), también se incluyen en el método de la presente invención.
[0083] Los pasos de purificación dependen del transcrito producido. El término «aislamiento» indica que el transcrito se encuentra en una condición distinta de su entorno nativo. En una forma preferida, el transcrito aislado está sustancialmente libre de otros componentes celulares, particularmente otros componentes celulares homólogos tales como proteínas homólogas. Se prefiere proporcionar el transcrito en una forma con una pureza superior al 40 %, más preferiblemente en una forma con una pureza superior al 60 %. Incluso más preferiblemente, se prefiere proporcionar el transcrito en una forma altamente purificada, es decir, con una pureza superior al 80 %, más preferiblemente con una pureza superior al 90 % e incluso más preferiblemente con una pureza superior al 99 %, según se determina mediante transferencia Northern.
[0084] Preferiblemente, el método de este aspecto de la invención permite un aumento en la transcripción de una secuencia de nucleótidos de interés. Preferiblemente, los niveles de transcripción se establecen en un sistema de expresión usando un constructo de expresión según el primer aspecto de la invención que comprende un primer y un segundo promotor según el primer aspecto de la invención, operativamente enlazados a una secuencia de nucleótidos que codifica una proteína o polipéptido de interés. Preferiblemente, la transcripción de dicha secuencia de nucleótidos de interés se detecta mediante un ensayo adecuado tal como RT-qPCR. Preferiblemente, el método de la invención permite un aumento en la transcripción de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90%, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho primer promotor y dicho segundo promotor y está operativamente enlazado a un único promotor, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, la transcripción de
una secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide preferiblemente en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un primera secuencia promotora y una segunda secuencia promotora que se van a ensayar operativamente enlazadas a dicha secuencia de nucleótidos de interés. La transcripción se mide preferiblemente usando RT-qPCR y los niveles de transcripción se comparan con los niveles de transcripción de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que dichos primer promotor y segundo promotor se reemplazan por un único promotor, preferiblemente un promotor de CMV representado por la SEC ID n.°: 57, en el vector de expresión utilizado.
Séptimo aspecto
[0085] En un séptimo aspecto, la presente divulgación proporciona un método para empalmar o redirigir el empalme de una secuencia de nucleótidos de interés, y opcionalmente purificar los transcritos producidos que comprende la etapa de:
a) proporcionar un constructo de ácidos nucleicos según el primer aspecto de la invención que comprende una secuencia de nucleótidos de interés; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca transcritos de la secuencia de nucleótidos de interés que da como resultado la producción de un transcrito; y opcionalmente
d) purificar dichos transcritos producidos.
[0086] Preferiblemente dentro de este aspecto, dicho constructo de ácidos nucleicos usado en el paso a) comprende una secuencia de nucleótidos aguas arriba o en el sitio 5' de la segunda secuencia intrónica de la invención que es diferente o distinta de la secuencia de nucleótidos aguas arriba o en el sitio 5' de la primera secuencia intrónica de la invención. Preferiblemente, la secuencia de nucleótidos entre el primer promotor y el 5' de dicha primera secuencia intrónica y la secuencia de nucleótidos entre el segundo promotor y el 5' de dicha segunda secuencia intrónica difiere al menos en un 5 %, un 10 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 % o un 100 % en la secuencia de nucleótidos. Preferiblemente, un método de este aspecto de la divulgación en el que se usa dicho constructo de ácidos nucleicos da como resultado la producción de dos transcritos diferentes o distintos, que difieren en la secuencia de nucleótidos en el sitio 5' de los transcritos. En caso de que la secuencia de nucleótidos de interés esté ubicada aguas abajo o en el sitio 3' de la segunda secuencia intrónica, los transcritos resultantes diferirán en la secuencia aguas arriba de dicha secuencia de nucleótidos de interés tal como puede detectarse mediante cualquier ensayo adecuado conocido por la persona experta en la técnica, por ejemplo, entre otros, 5' RACE-PCR.
[0087] En una realización preferida dentro de este aspecto, la secuencia de nucleótidos de interés es una secuencia que codifica una proteína o un polipéptido de interés. El método de este aspecto se puede usar para producir dos proteínas o polipéptidos con N-terminales diferentes o distintos usando el constructo de la invención. Preferiblemente, una primera proteína o polipéptido que comprende un primer N-terminal y una segunda proteína o polipéptido que comprende un segundo N-terminal se producen usando el método de este aspecto, en el que preferiblemente, una primera secuencia de nucleótidos que codifica dicho primer N-terminal se ubica directamente aguas arriba o en el sitio 5' de dicha primera secuencia intrónica y una segunda secuencia de nucleótidos que codifica dicho segundo N-terminal está ubicada directamente aguas arriba o en el sitio 5' de dicha segunda secuencia intrónica. Preferiblemente, dicha primera secuencia de nucleótidos que codifica dicho primer N-terminal está ubicada aguas abajo o en el sitio 3' de dicho primer promotor y aguas arriba o en el sitio 5' de dicha primera secuencia intrónica. Preferiblemente, dicha segunda secuencia de nucleótidos que codifica dicho segundo N-terminal está ubicada aguas abajo o en el sitio 3' de dicho segundo promotor y aguas arriba o en el sitio 5' de dicha segunda secuencia intrónica. Preferiblemente, dicho constructo de ácidos nucleicos comprende además una secuencia de nucleótidos que codifica un C-terminal situado aguas abajo o en el sitio 3' de dicha segunda secuencia intrónica. En esta realización, se requiere que dicha segunda secuencia intrónica sea un intrón tal como se define en la sección Definición. La diferencia entre los N terminales puede estar limitada a una secuencia señal y dar como resultado proteínas o polipéptidos expresados idénticos, en donde la ubicación de las proteínas o polipéptidos puede diferir. Si se realiza en un sistema de expresión tal como se ha definido anteriormente en el presente documento, el método de esta realización preferiblemente da como resultado la producción de dos proteínas o polipéptidos de interés, en donde dicha primera proteína o polipéptido comprenderá dicho primer N-terminal enlazado a dicho C-terminal y dicha segunda proteína o polipéptido comprenderá dicho segundo N-terminal enlazado a dicho C-terminal, según puede detectarse mediante cualquier ensayo adecuado conocido por la persona experta en la técnica, tales como, entre otros, ensayo ELISA, transferencia Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por la persona experta en la técnica. Preferiblemente, dicho ensayo usado para detectar las dos proteínas o polipéptidos diferentes o distintos producidos está adaptado específicamente para distinguir entre las diferentes proteínas o polipéptidos producidos, por ejemplo, usando un anticuerpo de detección que se une específicamente al primer o al segundo N-terminal de proteínas o polipéptidos producidos.
Octavo aspecto
[0088] En un octavo aspecto, la presente invención proporciona un uso de un constructo de ácidos nucleicos según el primer aspecto de la invención y/o un uso de un vector de expresión según el segundo aspecto de la invención y/o un uso de una célula según el tercer aspecto de la invención para la expresión de una proteína o polipéptido de interés.
Noveno aspecto
[0089] En un noveno aspecto, la presente invención proporciona un constructo de ácidos nucleicos según el primer aspecto de la invención y/o un vector de expresión según el segundo aspecto de la invención y/o una célula según el tercer aspecto de la invención para usar como medicamento. La invención también se refiere a un método de tratamiento que comprende la administración de un constructo de ácidos nucleicos según el primer aspecto de la invención y/o un vector de expresión según el segundo aspecto de la invención y/o una célula según el tercer aspecto de la invención, en donde preferiblemente dicha administración se realiza a un mamífero, más preferiblemente a un humano. Preferiblemente, dicho tratamiento es una vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano. Además, la invención se refiere al uso de un constructo de ácidos nucleicos según el tercer aspecto de la invención y/o el uso de un vector de expresión según el segundo aspecto de la invención y/o el uso de una célula según el tercer aspecto de la invención para la preparación de un medicamento. Preferiblemente dicho medicamento es para vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano.
Décimo aspecto
[0090] En un décimo aspecto, la presente divulgación proporciona una molécula de ácidos nucleicos que está representada por una secuencia de nucleótidos que comprende o consta de un elemento potenciador de la expresión para aumentar la transcripción de una secuencia de nucleótidos de interés y/o la expresión de una proteína o un polipéptido de interés. Preferiblemente, el elemento potenciador de la expresión de la divulgación es capaz de aumentar la transcripción de una secuencia de nucleótidos de interés y/o la expresión de una proteína o un polipéptido de interés. Preferiblemente en este aspecto, el elemento potenciador de la expresión de la divulgación capaz de aumentar la transcripción de una secuencia de nucleótidos de interés y/o la expresión de una proteína o un polipéptido de interés se encuentra aguas arriba o en el sitio 5' de un promotor que está operativamente enlazado a dicha secuencia de nucleótidos de interés.
[0091] Preferiblemente dentro de este aspecto, los niveles de transcripción se establecen en un sistema de expresión usando un constructo de expresión que comprende dicho elemento potenciador de la expresión operativamente enlazado a una secuencia de nucleótidos de interés usando un ensayo adecuado tal como RT-qPCR. Preferiblemente, el elemento potenciador de la expresión de la divulgación permite un aumento en la transcripción de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con los niveles de transcripción usando un constructo que solo difiere en que está libre de dicho elemento potenciador de la expresión, preferiblemente como se muestra en los ejemplos que están incluidos en el presente documento. Más específicamente, preferiblemente la transcripción de una secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la expresión que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La transcripción se mide preferiblemente usando RT-qPCR y los niveles de transcripción se comparan con los niveles de transcripción de dicha secuencia de nucleótidos de interés medida en las mismas condiciones, excepto que el vector de expresión usado está libre de dicho elemento potenciador de la expresión que se va a ensayar.
[0092] Preferiblemente dentro de este aspecto, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión que comprende dicho elemento potenciador de la expresión operativamente enlazado a una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo de inmunoabsorción ligada a enzimas (ELISA), una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, el elemento potenciador de la expresión de la divulgación permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la expresión de dicha proteína o polipéptido que usa un constructo que solo difiere en que está libre de dicho elemento potenciador de la expresión, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente
documento. Más específicamente, preferiblemente la expresión de una secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la expresión que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión está libre de dicho elemento potenciador de la expresión que se va a ensayar.
[0093] Preferiblemente dentro de este aspecto, dicha molécula de ácidos nucleicos es una molécula de ácidos nucleicos aislada como tal como se define en el presente documento. En una realización preferida, dicho elemento potenciador de la expresión es una secuencia que se deriva del gen de ubiquitina UBC. Preferiblemente, dicho elemento potenciador de la expresión se deriva de un gen de ubiquitina UBC de mamífero. Más preferiblemente, dicho elemento potenciador de la expresión se deriva del gen homólogo de Cricetulus griseus del gen de ubiquitina UBC humana, indicando dicho gen como el gen Cricetulus sp. para poliubiquitina o CRUPUQ (GenBank D63782).
[0094] En una realización preferida, dicho elemento potenciador de la expresión derivado de CRUPUQ comprende o consta de una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1. Preferiblemente, dicha secuencia tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-969 de la SEC ID n.°: 1 es un promotor tal como se define en la sección Definición. Preferiblemente, dicho promotor es capaz de iniciar la transcripción de una secuencia de nucleótidos de interés y/o la expresión de un polipéptido o una proteína de interés codificados por una secuencia de nucleótidos en una célula huésped tal como se define más adelante en el presente documento. En una realización preferida adicional, dicho elemento potenciador de la expresión derivado de CRUPUQ comprende o consta de una secuencia intrónica. Se entiende que una secuencia intrónica es al menos parte de la secuencia de nucleótidos de un intrón. Preferiblemente, dicha secuencia intrónica comprende al menos un sitio de empalme donador o un sitio de empalme GT. Un sitio de empalme donador se entiende en el presente documento como un sitio de empalme que, cuando se combina con un sitio de empalme aceptor tal como se define en el presente documento, da como resultado la formación de un intrón según se define en la sección Definición. Preferiblemente, una secuencia de nucleótidos es un intrón si al menos un 2 %, un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 % o un 100 % del ARN primario pierde esta secuencia mediante empalme de ARN usando un ensayo adecuado para detectar el empalme de intrones, como por ejemplo, entre otros, la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) seguido de un análisis de tamaño o secuencia de la RT-PCR. Los sitios de empalme donadores preferidos de la divulgación son M-W-G-[corte]-G-T-R-A-G-K en caso de que la célula huésped sea una célula de mamífero, AG-[corte]-G-T-A-W-K en caso de que la célula huésped sea una célula vegetal, [corte]-G-T-A-W-G-T-T en caso de que la célula huésped sea una célula de levadura y RG-[corte]-G-T-R-A-G, en caso de que la célula huésped sea una célula de insecto. «[corte]» debe entenderse aquí como el sitio de corte específico donde se realizará el empalme. El empalme de intrones se puede evaluar funcionalmente usando un ensayo según se detalla en la sección Definición bajo «intrón». Más preferiblemente, el sitio de empalme donador comprendido dentro del elemento potenciador de la expresión de la divulgación es C-T-G-[corte]-G-T-G-A-G-G. Preferiblemente, dicha secuencia intrónica incluida dentro de dicho elemento potenciador de la expresión consiste en dicho sitio de empalme donador o sitio de empalme GT. Preferiblemente, dicha secuencia intrónica incluida dentro de dicho elemento potenciador de la expresión está libre de un sitio de empalme aceptor tal como se define más adelante en el presente documento. Preferiblemente, dicho elemento potenciador de la expresión que comprende una secuencia intrónica tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 970-1449 de la SEC ID n.°: 1. En una realización preferida, dicho elemento potenciador de la expresión comprende o consta de un promotor y una secuencia intrónica tal como se define en el presente documento. Preferiblemente, el elemento potenciador de la expresión de la divulgación tiene al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión de la divulgación que tiene al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 1 en toda su longitud comprende tanto un promotor como una secuencia intrónica tal como se define en el presente documento. Preferiblemente, dicho elemento potenciador de la expresión para aumentar la expresión es una secuencia contigua de al menos 500, 600, 700, 800, 900, 1000, 1100 o 1117 nucleótidos de longitud, preferiblemente al menos 1449 nucleótidos de longitud de la SEC ID n.°: 1. Preferiblemente, dicho elemento potenciador de la expresión con al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70%, un 75 %, un 80 %, un 85 %, un
90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 1 tiene como máximo 8000 nucleótidos de longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700,
1600, 1500 o 1449 nucleótidos de longitud. Más preferiblemente, dicha secuencia tiene 1449 nucleótidos de longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000,
5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 65 %
de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 70 % de identidad con la SEC ID n.°: 1 en toda su longitud.
Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000,
3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 75 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 80 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900,
1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 85 % de identidad con la SEC ID n.°:
1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000,
7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 90 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700,
1600, 1500 o 1449 nucleótidos de longitud y tiene al menos un 95 % de identidad con la SEC ID n.°: 1 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión comprende o consta de una secuencia que está representada por la SEC ID n.°: 1.
[0095] En una realización preferida adicional dentro de este aspecto, dicho elemento potenciador de la expresión de la divulgación es una secuencia derivada del gen CCT8. Preferiblemente, dicho elemento se deriva de un gen
CCT8 de mamífero. Más preferiblemente, dicho elemento potenciador de la expresión se deriva del gen CCT8 humano u Homo sapiens.
[0096] En una realización preferida dentro de dicho aspecto, dicho elemento potenciador de la expresión derivado del gen CCT8 de Homo sapiens comprende o consta de una secuencia que tiene al menos un 50 %, un
55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91%, un 92 %, un 93 %, un 94 %, un
95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-614 de la SEC ID n.°:
2. Preferiblemente, dicha secuencia tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un
80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con los nucleótidos 1-614 de la SEC ID n.°: 2 es un promotor tal como se define en la sección Definición. En una realización preferida adicional, dicho elemento potenciador de la expresión derivado del gen CCT8 de Homo sapiens comprende o consta de una secuencia intrónica. Preferiblemente, dicha secuencia intrónica es una secuencia intrónica tal como se ha definido anteriormente en el presente documento que comprende al menos un sitio de empalme donador o sitio de empalme GT tal como se ha definido anteriormente en el presente documento. Preferiblemente, dicho sitio de empalme donador tiene la secuencia M-A-R-[corte]-G-T-R-A-G-K, más preferiblemente A-A-A-[corte]-G-T-G-A-G-G. Preferiblemente, dicha secuencia intrónica incluida dentro de dicho elemento potenciador de la expresión consiste en dicho sitio de empalme donador o sitio de empalme GT. Preferiblemente, dicho elemento potenciador de la expresión que comprende una secuencia intrónica tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un
85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 %
de identidad con los nucleótidos 667-1228 de la SEC ID n.°: 2.
[0097] En una realización preferida dentro de dicho aspecto, dicho elemento potenciador de la expresión comprende o consta de un promotor y una secuencia intrónica tal como se define en el presente documento.
Preferiblemente, el elemento potenciador de la expresión de la divulgación tiene al menos un 50 %, un 51 %, un
52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión de la divulgación que tiene al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un
56 %, 57 %, un 58 %, un 59 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 2 en toda su longitud comprende tanto un promotor como una secuencia intrónica tal como se define en el presente documento. Preferiblemente, dicho elemento potenciador de la expresión para aumentar la expresión es una secuencia contigua de al menos 500, 600, 700, 791 o 1223 nucleótidos de longitud, preferiblemente al menos 1228 nucleótidos de la SEC ID n.°: 2. Preferiblemente, dicho elemento potenciador de la expresión con al menos un 50 %, un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, 57 %, un 58 %, un 59 %, un 60 %, un
65 %, un 70%, un 75 %, un 80%, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un
97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 2 tiene como máximo 8000 nucleótidos de longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000,
5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud. Más preferiblemente,
dicha secuencia tiene 1228 nucleótidos de longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 65 % de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 70% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 75% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 80% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 85% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 90% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión tiene como máximo 8000, 7000, 6000, 5000, 4000, 3000, 2000, 1900, 1800, 1700, 1600, 1500 o 1228 nucleótidos de longitud y tiene al menos un 95% de identidad con la SEC ID n.°: 2 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión comprende o consta de una secuencia que está representada por la SEC ID n.°: 2.
[0098] Más preferida es una secuencia de nucleótidos que comprende un elemento potenciador de la expresión tal como se define en el presente documento que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90%, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con cualquiera de SEC ID n.°: 59-61 en toda su longitud. Preferiblemente, dicho elemento potenciador de la expresión comprende o consta de cualquiera de las secuencias seleccionadas del grupo que consiste en la SEC ID n.°: 59-61. Más preferiblemente, dicho elemento potenciador de la expresión comprende o consta de una secuencia que está representada por la SEC ID n.°: 59.
Undécimo aspecto
[0099] En un undécimo aspecto, la presente divulgación proporciona un constructo de ácidos nucleicos que comprende una molécula de ácidos nucleicos según el décimo aspecto de la divulgación. Un constructo de ácidos nucleicos de la divulgación comprende un elemento potenciador de la expresión según el décimo aspecto de la presente divulgación. Preferiblemente, dicho constructo de ácidos nucleicos es un constructo recombinante y/o aislado tal como se define en el presente documento. Preferiblemente, dicho constructo de ácidos nucleicos comprende además un promotor heterólogo, en el que preferiblemente dicho elemento potenciador de la expresión y dicho promotor heterólogo están configurados para estar los dos operativamente enlazados a una secuencia de nucleótidos opcional de interés tal como se define más adelante en el presente documento. El «promotor heterólogo» debe entenderse en el presente documento como un promotor que no está operativamente enlazado de forma natural al elemento potenciador de la expresión de la divulgación, es decir, una secuencia contigua que comprende dicho elemento potenciador de la expresión y dicho promotor heterólogo no se produce en la naturaleza como secuencias vecinas, pero puede sintetizarse como una secuencia recombinante.
[0100] Preferiblemente dentro de este aspecto, dicho promotor heterólogo está ubicado dentro de un constructo de ácidos nucleicos de la divulgación aguas abajo o en el sitio 3' del elemento potenciador de la expresión de la divulgación. Preferiblemente, dicho promotor heterólogo se encuentra dentro de un constructo de la divulgación aguas arriba o en el sitio 5' de la secuencia de nucleótidos de la divulgación que codifica una proteína o un polipéptido de interés. En una realización de la divulgación, el promotor heterólogo es un promotor capaz de iniciar la transcripción en la célula huésped elegida. Los promotores tal como se usan en el presente documento incluyen promotores específicos de tejido, preferidos de tejido, específicos del tipo de célula, inducibles y constitutivos, tal como se define en el presente documento. Los promotores heterólogos y/o las secuencias reguladoras que pueden emplearse en la expresión de polipéptidos de según la presente divulgación, preferiblemente en células de mamífero, incluyen, entre otros, el promotor de citomegalovirus (CMV) humano o murino, un promotor del virus del simio (SV40), un promotor de ubiquitina C humana o de ratón, un promotor alfa (EF1-a) del factor de elongación humano o de ratón o rata, un promotor de beta-actina de ratón o hámster o un promotor de hámster rpS21. Los elementos Tet-Off y Tet-On aguas arriba de un promotor mínimo tal como un promotor de CMV forman un ejemplo de promotor inducible de mamífero. Ejemplos de promotores adecuados de levadura y hongos son el promotor Leu2, el promotor de galactosa (Gall o Ga17), el promotor de alcohol deshidrogenasa I (ADH1), el promotor de glucoamilasa (Gla), el promotor de triosa fosfato isomerasa (TPI), el factor de elongación de traducción EF-I alfa (TEF2), el promotor de la gliceraldehído-3-fosfato deshidrogenasa (gpdA), promotor de la alcohol oxidasa (AOX1) o el promotor de la glutamato deshidrogenasa (gdhA). Un ejemplo de un promotor ubicuo fuerte para la expresión en plantas es el promotor 35S del virus del mosaico de la coliflor (CaMV). Preferiblemente, el constructo de ácidos nucleicos de la divulgación comprende un promotor heterólogo que está representado por una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un
97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 58. Más preferiblemente, el constructo de ácidos nucleicos de este aspecto de la divulgación comprende un promotor heterólogo que está representado por una secuencia que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con la SEC ID n.°: 57.
[0101] En una realización preferida adicional dentro de este aspecto, el constructo de ácidos nucleicos de la divulgación comprende además uno o varios elementos reguladores de la expresión adicionales, en donde preferiblemente dicho elemento potenciador de la expresión, dicho promotor heterólogo y dicho elemento o elementos reguladores de la expresión adicionales están configurados para estar todos operativamente enlazados a una secuencia de nucleótidos opcional de interés tal como se define más adelante en el presente documento. Un «elemento regulador de expresión adicional» debe entenderse en el presente documento como un elemento adicional al elemento potenciador de la expresión y/o promotor tal como se ha definido anteriormente en el presente documento, que puede ser un elemento potenciador de la expresión adicional o un elemento potenciador de la expresión distinto o un elemento regulador de la expresión en su sentido más amplio. Un elemento regulador de la expresión adicional como el incluido en la presente divulgación puede estar implicado en la regulación transcripcional y/o traduccional de un gen, que incluye, entre otros, una 5'-UTR, una 3'-UTR, un potenciador, un promotor, una secuencia intrónica, una seña de poliadenilación y elementos de control de cromatina tales como regiones de unión de andamiaje/matriz, un elemento de apertura de cromatina ubicuo, pares de guanina fosfodiéster citosina y elementos estabilizadores y antirrepresores, y cualquier derivado de los mismos. Otros elementos reguladores opcionales que pueden estar presentes en el constructo de ácidos nucleicos de la divulgación incluyen, entre otros, secuencias codificantes de nucleótidos de secuencias de nucleótidos homólogas y/o heterólogas, que incluyen el elemento sensible al hierro (IRE), elemento traslacional cis-regulador (TLRE) o uORF en las 5'-UTR y tramos de poli(U) en las 3'-UTR.
[0102] Preferiblemente dentro de este aspecto, dicho elemento regulador de la expresión adicional comprende o consta de una secuencia intrónica tal como se define en el presente documento. Preferiblemente, la secuencia intrónica incluida dentro del elemento regulador de la expresión adicional comprende al menos un sitio de empalme aceptor que se entiende en el presente documento que comprende el sitio de empalme AG, precedido preferiblemente por una secuencia de nucleótidos del tracto de polipirimidina, opcionalmente separada del sitio de empalme AG por 1-50 nucleótidos, y que opcionalmente comprende además un sitio de ramificación que comprende la secuencia Y-T-N-A-Y, en el sitio 5' de la secuencia de nucleótidos del tracto de polipirimidina, en donde el sitio de ramificación puede tener la secuencia de nucleótidos C-Y-G-A-C. Un sitio de empalme aceptor se entiende en el presente documento como un sitio de empalme que, cuando se combina con un sitio de empalme donador incluido dentro de un constructo, da como resultado la formación de un intrón tal como se define en la sección Definición. Preferiblemente, el sitio de empalme aceptor o el sitio de empalme AG tienen la secuencia [Y-rico] -N-Y-A-G-[corte]. Preferiblemente, el sitio de empalme aceptor o sitio de empalme AG tienen la secuencia [Y-rico]-N-Y-A-G-[corte]-R en caso de que la célula huésped sea una célula de mamífero, [Y-rico]-D-Y-A-G-[corte]-R o [Y-rico]-DY-A-G-[corte]-R-W en caso de que la célula huésped sea una célula vegetal, [Y-rico]-A-Y-A-G-[corte] en caso de que la célula huésped sea una célula de levadura y [Y-rico]-N-Y-A-G-[corte] en caso de que la célula huésped sea una célula de insecto. «[Y-rico]» debe entenderse aquí como un tracto de polipirimidina que se define preferiblemente como una secuencia consecutiva de al menos 10 nucleótidos que comprende al menos 6, 7, 8, 9 o preferiblemente 10 nucleótidos de pirimidina. Preferiblemente, dicho sitio de empalme aceptor o sitio de empalme GT tiene la secuencia Y-A-G-[corte]-R. Preferiblemente, dicha secuencia intrónica incluida dentro de dicho elemento regulador de expresión adicional consta de dicho sitio de empalme aceptor o sitio de empalme AG. La secuencia intrónica preferiblemente comprende o consta de una secuencia de nucleótidos que tiene al menos un 80 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con los nucleótidos 171-277 de la SEC ID n.°: 14, los nucleótidos 171-274 de la SEC ID n.°: 19, los nucleótidos 133-210 de la SEC ID n.°: 20, los nucleótidos 134 211 de la SEC ID n.°: 21, los nucleótidos 134-226 de la SEC ID n.°: 22, los nucleótidos 134-226 de la SEC ID n.°: 23, los nucleótidos 133-225 de la SEC ID n.°: 24, los nucleótidos 134-226 de la SEC ID n.°: 25, los nucleótidos 146-257 de la SEC ID n.°: 26 o los nucleótidos 147-223 de la SEC ID n.°: 27 o los nucleótidos 970-1449 de la SEC ID n.°: 1 o los nucleótidos 667-1228 de la SEC ID n.°: 2. Preferiblemente, dicha secuencia intrónica comprendida dentro de dicho elemento regulador adicional de la expresión comprende además un sitio de empalme donador tal como se define en el presente documento. Aún más preferido, dicha secuencia intrónica incluida dentro del elemento regulador adicional de la expresión es un intrón tal como se define en la sección Definición. Más preferiblemente, la secuencia intrónica incluida dentro del elemento regulador de la expresión adicional comprende o consta de una secuencia de nucleótidos que tiene al menos un 80 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad de secuencia con los nucleótidos 171-277 de la SEC ID n.°: 14, los nucleótidos 171-274 de la SEC ID n.°: 19, los nucleótidos 133-210 de la SEC ID n.°: 20, los nucleótidos 134-211 de la SEC ID n.°: 21, los nucleótidos 134-226 de la SEC ID n.°: 22, los nucleótidos 134-226 de la SEC ID n.°: 23, los nucleótidos 133-225 de la SEC ID n.°: 24, los nucleótidos 134-226 de la SEC ID n.°: 25, los nucleótidos 146-257 de la SEC ID n.°: 26 o los nucleótidos 147 223 de la SEC ID n.°: 27.
[0103] También se prefiere dentro de este aspecto un elemento regulador de la expresión que es un elemento
potenciador de la traducción. Preferiblemente, un elemento potenciador de la traducción permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la expresión de dicha proteína o polipéptido que usa un constructo que solo difiere en que está libre de dicho elemento potenciador de la traducción, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, preferiblemente la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la traducción que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión está libre de dicho elemento potenciador de la traducción que se va a ensayar.
[0104] Preferiblemente, dentro de este aspecto, dicho elemento potenciador de la traducción comprende o consta de una secuencia de nucleótidos que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con cualquiera de las SEC ID n.°: 3-51 en toda su longitud. Preferiblemente, dicho elemento potenciador de la traducción comprende o consta de una secuencia de nucleótidos que tiene al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % de identidad con cualquiera de las SEC ID n.°: 19 en toda su longitud. Más preferiblemente, dicho elemento potenciador de la traducción comprende o consta de una secuencia de nucleótidos que tiene al menos un 90 % de identidad con la SEC ID n.°: 3-51 en toda su longitud. También se prefiere dentro de este aspecto un elemento potenciador de la traducción que comprende o consta de una secuencia de nucleótidos que comprende:
i) una secuencia de nucleótidos repetida GAA, una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T;
ii) una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T, dicho elemento potenciador de la expresión no comprende una secuencia de nucleótidos repetida GAA; o,
iii) una secuencia de nucleótidos repetida GAA, una secuencia de nucleótidos rica en TC que comprende al menos 8 nucleótidos C o T consecutivos, al menos 3 secuencias de nucleótidos ricas en A que comprenden al menos 5 nucleótidos A consecutivos, una secuencia de nucleótidos rica en GT que comprende al menos 10 nucleótidos, al menos el 80 % de los cuales son nucleótidos G o T, en donde dicha secuencia de nucleótidos repetida GAA se encuentra en 3' de cualquiera de dichas secuencias de nucleótidos ricas en TC, secuencias de nucleótidos ricas en A y/o secuencias de nucleótidos ricas en GT.
[0105] La secuencia de nucleótidos repetida GAA, la secuencia de nucleótidos rica en TC, la secuencia de nucleótidos rica en A, la secuencia de nucleótidos rica en GT ya se han definido en el presente documento en el primer aspecto de la invención. Estas definiciones también se aplican aquí.
[0106] Preferiblemente dentro de dicho aspecto, dicho elemento regulador adicional de la expresión comprende un elemento potenciador de la traducción tal como se define en el presente documento y una secuencia intrónica.
[0107] Preferiblemente dentro de dicho aspecto, dicho elemento regulador de la expresión adicional está ubicado dentro de un constructo de ácidos nucleicos de la descripción aguas abajo o en el sitio 3' de un promotor heterólogo. Preferiblemente, dicho elemento regulador adicional de la expresión está ubicado dentro de un constructo de ácidos nucleicos de la divulgación aguas arriba o en el sitio 5' de una secuencia de ácidos nucleicos que codifica una proteína o un polipéptido de interés. Además, preferiblemente un constructo de ácidos nucleicos de la divulgación comprende las siguientes secuencias de nucleótidos indicadas aquí en sus posiciones relativas en la dirección 5' a 3': (i) un elemento potenciador de la expresión, (ii) un promotor heterólogo, opcionalmente (iii) un elemento regulador de expresión adicional, y opcionalmente (iv) una secuencia de nucleótidos de interés, en donde preferiblemente dicho elemento potenciador de la expresión, dicho promotor heterólogo y dicho elemento regulador de expresión adicional están configurados para estar todos operativamente enlazados a dicha secuencia de nucleótidos opcional de interés tal como se define más adelante en el presente documento. Debe entenderse que dicho elemento potenciador de la expresión, dicho promotor heterólogo y, opcionalmente, dicho elemento regulador de la expresión adicional del constructo de ácidos nucleicos de la divulgación están todos configurados para estar operativamente enlazados a la misma secuencia de nucleótidos sencilla de interés.
[0108] Los inventores encontraron un efecto sinérgico inesperado cuando el elemento potenciador de la expresión de la divulgación se combina con un elemento regulador de la expresión adicional tal como se define en el presente documento en un constructo de expresión para expresar una proteína o un polipéptido de interés. En un grupo transfectado de manera estable con un elemento potenciador de la expresión y un elemento regulador de la expresión adicional, el rendimiento de proteína fue significativamente mayor que el rendimiento esperado basado en la suma de los efectos separados de cualquiera de los elementos. Preferiblemente, dicho aumento de la expresión de proteínas o polipéptidos es independiente del número de copias según lo establecido por un ensayo adecuado para determinar la dependencia del número de copias realizado por una persona experta tal como, por ejemplo, un ensayo Taqman tríplex tal como se detalla adicionalmente en el ejemplo 4. Preferiblemente, dicho constructo de ácidos nucleicos es un constructo recombinante y/o aislado tal como se define en el presente documento. Preferiblemente, dicho constructo de ácidos nucleicos comprende además una secuencia de nucleótidos de interés operativamente enlazada y/o bajo el control de dicho elemento potenciador de la expresión, dicho promotor heterólogo y opcionalmente dicho elemento regulador adicional de la expresión tal como se define en el presente documento. La presencia de una secuencia de nucleótidos de interés es opcional. «Opcional» debe entenderse en el presente documento como no necesariamente presente en un constructo de expresión. Por ejemplo, dicha secuencia de nucleótidos de interés no necesita estar presente en un vector de expresión comercializado, sino que una persona experta en la técnica puede introducirla fácilmente antes de usarla en un método de la divulgación. Debe entenderse que dicho elemento potenciador de la expresión, dicho promotor heterólogo y, opcionalmente, dicho elemento regulador de la expresión adicional están configurados para estar operativamente enlazados a la misma secuencia de nucleótidos sencilla de interés. Preferiblemente, dicho constructo de ácidos nucleicos del décimo aspecto de la divulgación tiene al menos un 20%, un 25%, un 30%, un 35%, un 40%, un 45%, un 50%, 55%, un 60%, un 65%, un 70%, un 75 %, un 80%, un 85%, un 90%, un 91%, un 92%, un 93%, un 94%, un 95%, un 96%, un 97%, un 98%, un 99% o un 100 % de identidad con las SEC ID n.° 73, 74, 75 o 76.
[0109] En una realización preferida dentro de este aspecto, dicha secuencia de nucleótidos de interés es una secuencia que codifica una proteína o un polipéptido de interés. La proteína o el polipéptido de interés pueden ser una proteína o un polipéptido homólogos, pero en una realización preferida de la divulgación, la proteína o el polipéptido de interés son una proteína o un polipéptido heterólogos. Una secuencia de nucleótidos que codifica una proteína o un polipéptido heterólogos puede derivarse total o parcialmente de cualquier fuente conocida en la técnica, incluyendo un genoma o episoma bacteriano o viral, ADN eucariótico nuclear o de plásmido, ADNc o ADN sintetizado químicamente. La secuencia de nucleótidos que codifica una proteína o un polipéptido de interés puede constituir una región codificante ininterrumpida o puede incluir uno o más intrones unidos por uniones de empalme apropiadas. Además puede estar compuesta por segmentos derivados de diferentes fuentes, de origen natural o sintético. La secuencia de nucleótidos que codifica la proteína o el polipéptido de interés según el método de la divulgación es preferiblemente una secuencia de nucleótidos de longitud completa, pero también puede ser una parte funcionalmente activa u otra parte de dicha secuencia de nucleótidos de longitud completa. La secuencia de nucleótidos que codifica la proteína o el polipéptido de interés también puede comprender secuencias de señal que dirigen la proteína o polipéptido de interés cuando se expresa en una ubicación específica de la célula o tejido. Además, la secuencia de nucleótidos que codifica la proteína o el polipéptido de interés también puede comprender secuencias que facilitan la purificación de proteínas y la detección de proteínas mediante, por ejemplo, transferencia de Western y ELISA (por ejemplo, secuencias de cmyc o polihistidina).
[0110] La proteína o el polipéptido de interés en este aspecto ya se ha definido anteriormente aquí en el primer aspecto de la invención.
[0111] En una realización alternativa, dicha secuencia de nucleótidos de interés no es una secuencia codificante para una proteína o un polipéptido, sino que puede ser una secuencia de nucleótidos funcional. Esta realización alternativa de este aspecto ya se ha definido anteriormente aquí en el primer aspecto de la invención.
Duodécimo aspecto
[0112] En un duodécimo aspecto, la presente divulgación proporciona un vector de expresión que comprende un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación. El vector de expresión de la divulgación es preferiblemente una secuencia de plásmido, cósmido o fago o nucleótido, lineal o circular, de un ADN o ARN monocatenario o bicatenario, derivado de cualquier fuente, en el que varias secuencias de nucleótidos se han unido o recombinado en un constructo único capaz de introducir cualquiera de las secuencias de nucleótidos de la divulgación en una célula en las orientaciones sentido o antisentido. La elección del vector depende de los procedimientos recombinantes seguidos y de la célula huésped utilizada. El vector puede ser un vector de replicación autónoma o puede replicarse junto con el cromosoma en el que se ha integrado. Preferiblemente, el vector contiene un marcador de selección. Los marcadores útiles dependen de la célula huésped elegida, son bien conocidos por los expertos en la técnica y se seleccionan de, entre otros, los marcadores de selección tal como se define en el tercer aspecto de la invención. Un vector de expresión
preferido es el vector de expresión ADNpc3.1. Los marcadores de selección preferidos son el gen de resistencia a la neomicina, el gen de resistencia a la zeocina y el gen de resistencia a la blasticidina.
Decimotercer aspecto
[0113] En un decimotercer aspecto, la presente divulgación proporciona una célula que comprende una molécula de ácidos nucleicos según el décimo aspecto de la divulgación y/o un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación y/o un vector de expresión según el duodécimo aspecto de la divulgación tal como se define en el presente documento. El tipo de célula dentro del contexto de este aspecto es el mismo que el definido en el contexto del tercer aspecto. Por lo tanto, otro aspecto de la divulgación se refiere a una célula huésped que está modifica genéticamente, preferiblemente mediante un método de la divulgación, en el sentido de que una célula huésped comprende un constructo de ácidos nucleicos tal como se ha definido anteriormente en el decimotercer aspecto. Para los procedimientos de transformación en plantas, las bacterias adecuadas incluyen Agrobacterium tumefaciens y Agrobacterium rhizogenes.
[0114] Un constructo de ácidos nucleicos dentro del contexto de este decimotercer aspecto es como el del tercer aspecto: preferiblemente se mantiene de manera estable, ya sea como un elemento de replicación autónoma, o, más preferiblemente, el constructo de ácidos nucleicos se integra en el genoma de la célula huésped, en cuyo caso el constructo generalmente se integra en posiciones aleatorias en el genoma de la célula huésped, por ejemplo, mediante recombinación no homóloga. Las células huésped transformadas de forma estable se producen mediante métodos conocidos. La definición del término transformación estable y los métodos incluidos para la transformación estable ya se han proporcionado bajo el tercer aspecto.
[0115] Alternativamente, una proteína o un polipéptido de interés pueden expresarse en una célula huésped, por ejemplo, una célula de mamífero, apoyándose en la expresión transitoria de los vectores.
[0116] Un constructo de ácidos nucleicos según este aspecto preferiblemente también comprende un gen marcador que puede proporcionar capacidad de selección o cribado en una célula huésped tratada.
[0117] Todas las definiciones relacionadas con marcadores seleccionables y tipos de marcadores seleccionables, incluyendo el ejemplo del uso del gen de la luciferasa como marcador seleccionable, el ejemplo de una primera categoría de marcador basada en el metabolismo celular y el uso de una línea celular mutante que carece de la capacidad para crecer independientemente de un medio complementado y el ejemplo de selección dominante ya se han proporcionado en el tercer aspecto. También se aplican aquí en el decimotercer aspecto de la divulgación.
[0118] Cuando se obtiene una célula huésped transformada con un método según la divulgación (véase más adelante), se puede regenerar un tejido huésped a partir de dicha célula transformada en un medio adecuado, que opcionalmente puede contener antibióticos o biocidas conocidos en la técnica para la selección de células transformadas.
[0119] Los tejidos huésped transformados resultantes se identifican preferiblemente mediante selección usando un gen marcador de selección presente en un constructo de ácidos nucleicos tal como se define en el presente documento.
Decimocuarto aspecto
[0120] En un decimocuarto aspecto, la presente divulgación proporciona un método para expresar y opcionalmente purificar una proteína o un polipéptido de interés que comprende el paso de:
a. proporcionar un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación que comprende una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés; y, b. poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c. permitir que dicha célula transformada exprese la proteína o polipéptido de interés; y opcionalmente d. purificar dicha proteína o polipéptido de interés.
[0121] En una realización preferida del método según la divulgación, se usa un constructo de ácidos nucleicos tal como se ha definido anteriormente en el undécimo aspecto de la divulgación. El método de la divulgación puede ser un método in vitro o ex vivo. El método de la divulgación se puede aplicar en un cultivo celular, cultivo de organismos o cultivo de tejidos. Alternativamente, junto a la expresión en células huésped, la proteína o el polipéptido de interés pueden producirse en sistemas de traducción sin células usando ARN derivados de los constructos de ácidos nucleicos de la presente divulgación. El método de la divulgación puede ejecutarse en células cultivadas.
[0122] El experto en la técnica es capaz de transformar células según el paso b). Los métodos de transformación
que se usan en el paso b) incluyen, entre otros, la transferencia de ADN purificado a través de reactivos lipídicos catiónicos y polietilenimida (PEI), coprecipitación de fosfato de calcio, bombardeo de micropartículas, electroporación de protoplastos y microinyección o uso de fibras de silicio para facilitar la penetración y transferencia de ADN en la célula huésped.
[0123] En el paso c) se permite que la célula transformada exprese la proteína o el polipéptido de interés, y opcionalmente dicha proteína o polipéptido se recupera a continuación. Por ejemplo, la célula transformada puede someterse a condiciones que producen la expresión de la proteína o el polipéptido de interés. Los expertos en la técnica conocen bien las técnicas que se van a utilizar para expresar o sobreexpresar la proteína o el polipéptido de interés. Los métodos en los que la célula transformada no necesita someterse a condiciones específicas que producen la expresión de la proteína o el polipéptido de interés pero en los que la proteína o el polipéptido de interés se expresan automáticamente (por ejemplo, constitutivamente), también se incluyen en el método de la presente divulgación.
[0124] Los pasos de purificación y las definiciones relacionadas con estos pasos, por ejemplo, la definición de una proteína o un polipéptido aislado, son los mismos que en el método del cuarto aspecto y se han definido anteriormente en el presente documento. Si se desea tal como se define en el método del cuarto aspecto, la secuencia de nucleótidos que codifica una proteína o un polipéptido de interés se puede ligar a una secuencia de nucleótidos heteróloga para codificar una proteína o un polipéptido de fusión para facilitar la purificación y la detección de proteínas, por ejemplo, en transferencia Western y en un ELISA. Las secuencias heterólogas adecuadas incluyen, entre otras, las secuencias de nucleótidos que codifican proteínas tales como, por ejemplo, glutatión-S-transferasa, proteína de unión a maltosa, polihistidina de unión a metal, proteína fluorescente verde, luciferasa y beta-galactosidasa. La proteína o el polipéptido también se pueden acoplar a vehículos, etiquetas o marcadores no peptídicos que facilitan el rastreo de la proteína o el polipéptido, tanto in vivo como in vitro, y permiten la identificación y la cuantificación de la unión de la proteína o el polipéptido a sustratos. Dichas etiquetas, marcadores o vehículos son bien conocidos en la técnica e incluyen, entre otros, biotina, marcadores radiactivos y marcadores fluorescentes.
[0125] Preferiblemente, el método de este decimocuarto aspecto de la divulgación permite un aumento en la expresión de una proteína o un polipéptido de interés. Preferiblemente, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión según el undécimo aspecto de la divulgación que comprende un elemento potenciador de la expresión y un promotor heterólogo operativamente enlazado a una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés según el undécimo aspecto de la divulgación. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo ELISA, una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, el método de la divulgación permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho elemento potenciador de la expresión, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, preferiblemente la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema de células de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la expresión que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión está libre de dicho elemento potenciador de la expresión que se va a ensayar. Preferiblemente, dicho aumento de la expresión de proteínas o polipéptidos es independiente del número de copias según lo establecido por un ensayo adecuado para determinar la dependencia del número de copias realizado por una persona experta tal como, por ejemplo, un ensayo Taqman tríplex tal como se detalla adicionalmente en el ejemplo 4.
Decimoquinto aspecto
[0126] En un decimoquinto aspecto, la presente divulgación proporciona un método para expresar una proteína o un polipéptido de interés en un organismo, que comprende los pasos de:
a) proporcionar un constructo de ácidos nucleicos según el undécimo aspecto que comprende una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés de la divulgación; y, b) poner en contacto una célula diana y/o tejido diana de un organismo con dicho constructo de ácidos nucleicos para obtener una célula diana transformada y/o tejido diana transformado, permitiendo que dicha célula transformada exprese la proteína o el polipéptido de interés; y opcionalmente
c) permitir que dicha célula diana transformada se desarrolle en un organismo transformado; y, opcionalmente,
d) permitir que dicho organismo transformado exprese la proteína o el polipéptido de interés, por ejemplo, sometiendo dicho organismo transformado a condiciones que produzcan la expresión de la proteína o el polipéptido de interés, y opcionalmente recuperar dicha proteína o polipéptido.
[0127] La célula diana puede ser una célula diana embrionaria, p. ej., una célula madre embrionaria, por ejemplo, derivada de un mamífero no humano, tal como de las especies bovina, porcina, etc. Preferiblemente, dicha célula diana no es una célula madre embrionaria humana. En el caso de un hongo multicelular, dicha célula diana puede ser una célula fúngica que puede proliferar en dicho hongo multicelular. Cuando se obtiene un tejido vegetal transformado o una célula vegetal (por ejemplo, trozos de hoja, segmentos de tallo, raíces, pero también protoplastos o células vegetales cultivadas por suspensión) con este método según la divulgación, se pueden regenerar plantas enteras a partir de dicho tejido o célula transformados en un medio adecuado, que opcionalmente puede contener antibióticos o biocidas conocidos en la técnica para la selección de células transformadas. Este método de la divulgación se puede aplicar en vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano. En la presente divulgación se incluye un método de tratamiento que comprende el método del presente aspecto, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico. La divulgación también se refiere a un constructo del undécimo aspecto de la divulgación para el tratamiento, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico. Además, la divulgación también se refiere a un constructo del undécimo aspecto de la divulgación para la fabricación de un medicamento, en el que la proteína o polipéptido de interés es una proteína o polipéptido terapéutico y/o inmunogénico.
[0128] Además, una realización de la divulgación es un organismo transformado no humano. Dicho organismo se transforma con una secuencia de nucleótidos, un constructo de ácidos nucleicos recombinante o un vector según la presente divulgación, y es capaz de producir el polipéptido de interés. Esto incluye un organismo transgénico no humano, tal como un mamífero transgénico no humano, una planta transgénica (incluyendo la propagación, la cosecha y el material de tejido de dicha planta transgénica, que incluye, entre otros, hojas, raíces, brotes y flores), un hongo multicelular y similares.
[0129] Preferiblemente, el método de este aspecto de la divulgación permite un aumento en la expresión de una proteína o un polipéptido de interés en dicho organismo o al menos en un tejido u orgánulo u órgano de dicho organismo. Preferiblemente, los niveles de expresión se establecen en un sistema de expresión usando un constructo de expresión según el undécimo aspecto de la divulgación que comprende un elemento potenciador de la expresión y un promotor heterólogo operativamente enlazado a una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés según el undécimo aspecto de la divulgación. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo ELISA, una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Preferiblemente, este método de la divulgación permite un aumento en la expresión de proteínas o polipéptidos de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en dicho organismo o al menos en un tejido u orgánulo u órgano de dicho organismo en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho elemento potenciador de la expresión, preferiblemente cuando se prueba en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, preferiblemente la expresión de la secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema de células de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la expresión que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La expresión se mide preferiblemente midiendo la conversión de cualquier sustrato de fosfatasa alcalina adecuado y los niveles de expresión se comparan con los niveles de expresión de dicha secuencia de nucleótidos de interés que se miden en las mismas condiciones, excepto que el vector de expresión está libre de dicho elemento potenciador de la expresión que se va a ensayar.
[0130] Preferiblemente, dicho aumento de la expresión de proteínas o polipéptidos es independiente del número de copias según lo establecido por un ensayo adecuado para determinar la dependencia del número de copias realizado por una persona experta tal como, por ejemplo, un ensayo Taqman tríplex tal como se detalla adicionalmente en el ejemplo 4 de la presente divulgación.
Decimosexto aspecto
[0131] En un decimosexto aspecto, la presente divulgación proporciona un método para la transcripción y opcionalmente la purificación del transcrito producido que comprende el paso de:
a) proporcionar un constructo de ácidos nucleicos según el undécimo aspecto que comprende una secuencia de nucleótidos de interés de la divulgación; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca un transcrito de la secuencia de nucleótidos de interés; y opcionalmente
d) purificar dicha transcrito producido.
[0132] En una realización preferida de este método según la divulgación, se usa un constructo de ácidos nucleicos tal como se ha definido anteriormente en el undécimo aspecto. El método de la divulgación puede ser un método in vitro o ex vivo. El método de la divulgación se puede aplicar en un cultivo celular, cultivo de organismos o cultivo de tejidos. El método de la divulgación se puede aplicar en vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, preferiblemente en un ser humano. En la presente divulgación se incluye un método para el tratamiento que comprende o consta del método del presente aspecto, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico. La divulgación también se refiere a un constructo del undécimo aspecto de la divulgación para su uso en el tratamiento, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico. Además, la divulgación también se refiere a un constructo del undécimo aspecto de la divulgación para la fabricación de un medicamento, en el que la secuencia de nucleótidos de interés codifica un transcrito terapéutico.
[0133] El experto en la técnica es capaz de transformar células según el paso b). Los métodos de transformación que se usan en el paso b) incluyen, entre otros, la transferencia de ADN purificado a través de reactivos lipídicos catiónicos y polietilenimida (PEI), coprecipitación de fosfato de calcio, bombardeo de micropartículas, electroporación de protoplastos y microinyección o uso de fibras de silicio para facilitar la penetración y transferencia de ADN en la célula huésped.
[0134] En el paso c) se permite que la célula transformada produzca un transcrito de la secuencia de nucleótidos de interés y opcionalmente el transcrito producido se recupera posteriormente. Por ejemplo, la célula transformada puede someterse a condiciones que producen la transcripción de la secuencia de nucleótidos de interés. Los expertos en la técnica conocen bien las técnicas que se van a utilizar para la transcripción de la secuencia de nucleótidos de interés. Los métodos en los que la célula transformada no necesita someterse a condiciones específicas que producen la transcripción de la secuencia de nucleótidos de interés, pero en los que la secuencia de nucleótidos de interés se transcribe automáticamente (por ejemplo, constitutivamente), también se incluyen en el método de la presente divulgación.
[0135] Los pasos de purificación dependen del transcrito producido. El término «aislamiento» indica que el transcrito se encuentra en una condición distinta de su entorno nativo. En una forma preferida, el transcrito aislado está sustancialmente libre de otros componentes celulares, particularmente otros componentes celulares homólogos tales como proteínas homólogas. Se prefiere proporcionar el transcrito en una forma con una pureza superior al 40 %, más preferiblemente en una forma con una pureza superior al 60 %. Incluso más preferiblemente, se prefiere proporcionar el transcrito en una forma altamente purificada, es decir, con una pureza superior al 80 %, más preferiblemente con una pureza superior al 90 % e incluso más preferiblemente con una pureza superior al 99 %, según se determina mediante transferencia Northern.
[0136] Preferiblemente, el método de este aspecto de la divulgación permite un aumento en la transcripción de una secuencia de nucleótidos de interés. Preferiblemente, los niveles de transcripción se establecen en un sistema de expresión usando un constructo de expresión según el segundo aspecto de la divulgación que comprende un elemento potenciador de la expresión y un promotor heterólogo operativamente enlazado a una secuencia de nucleótidos de interés según el segundo aspecto de la divulgación. Preferiblemente, la transcripción de dicha secuencia de nucleótidos de interés se detecta mediante un ensayo adecuado tal como RT-qPCR. Preferiblemente, el método de la divulgación permite un aumento en la transcripción de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50%, un 60 %, un 70%, un 80 %, un 90%, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con un método que solo difiere en que se utiliza un constructo en el paso a) que está libre de dicho elemento potenciador de la expresión, preferiblemente cuando se ensaya en un sistema tal como se muestra en los ejemplos que se incluyen en el presente documento. Más específicamente, preferiblemente la transcripción de una secuencia de nucleótidos de interés que codifica fosfatasa alcalina secretada (SeAP) se mide en un sistema celular de mamífero, más preferiblemente en células CHO, usando un vector de expresión ADNpc3.1 que comprende un elemento potenciador de la expresión que se va a ensayar y un promotor de CMV representado por la SEC ID n.°: 57, operativamente enlazado a dicha secuencia de nucleótidos de interés. La transcripción se mide preferiblemente usando RT-qPCR y los niveles de transcripción se comparan con los niveles de transcripción de dicha secuencia de nucleótidos de interés medida en las mismas condiciones, excepto que el vector de expresión usado está libre de dicho elemento potenciador de la expresión que se va a ensayar.
Decimoséptimo aspecto
[0137] En un decimoséptimo aspecto, la presente divulgación proporciona un uso de una molécula de ácidos nucleicos según el décimo aspecto de la divulgación y/o un uso de un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación y/o un uso de un vector de expresión según el duodécimo aspecto de la divulgación y/o un uso de una célula según el decimotercer aspecto de la divulgación, para la transcripción de una secuencia de nucleótidos de interés y/o la expresión de una proteína o un polipéptido de interés.
Decimoctavo aspecto
[0138] En un decimoctavo aspecto, la presente divulgación proporciona una molécula de ácidos nucleicos de acuerdo con el décimo aspecto de la divulgación y/o un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación y/o un vector de expresión según el duodécimo aspecto de la divulgación y/o una célula de acuerdo con el decimotercer aspecto de la divulgación para su uso como medicamento. La divulgación también se refiere a un método de tratamiento que comprende la administración de una molécula de ácidos nucleicos según el décimo aspecto de la divulgación, y/o de un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación y/o un vector de expresión según el duodécimo aspecto de la divulgación y/o una célula según el decimotercer aspecto de la divulgación, en donde preferiblemente dicha administración se realiza a un mamífero, más preferiblemente a un humano. Preferiblemente, dicho tratamiento es una vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano. Además, la divulgación se refiere al uso de una molécula de ácidos nucleicos según el décimo aspecto de la divulgación y/o el uso de un constructo de ácidos nucleicos según el undécimo aspecto de la divulgación y/o el uso de un vector de expresión según el duodécimo aspecto de la divulgación y/o el uso de una célula según el decimotercer aspecto de la divulgación para la preparación de un medicamento. Preferiblemente dicho medicamento es para vacunación basada en ácidos nucleicos y/o terapia génica preferiblemente en un mamífero, más preferiblemente en un ser humano.
Definiciones
[0139] La frase «ácido nucleico», tal como se usa en el presente documento, se refiere a un oligonucleótido o polinucleótido sintético o natural, ya sea ADN o ARN o híbrido de ADN-ARN, monocatenario o bicatenario, sentido o antisentido, que es capaz de hibridarse con un ácido nucleico complementario mediante apareamiento de bases Watson-Crick. Un ácido nucleico de la invención se modifica preferiblemente en comparación con su contrapartida natural cuando comprende al menos 1, 2, 3, 4, 5, 10, 20, 30 o 50 mutaciones de nucleótidos en comparación con su contrapartida natural. Preferiblemente, un ácido nucleico de la invención no se produce en la naturaleza. Los ácidos nucleicos de la invención también pueden incluir análogos de nucleótidos (por ejemplo, BrdU) y enlaces internucleosídicos no fosfodiéster (por ejemplo, enlaces de ácido peptidonucleico (APN) o tiodiéster). En particular, los ácidos nucleicos pueden incluir, entre otros, ADN, ARN, ADNc, ADNg, ADNmc, ADNbc, ARNmc, ARNbc, ARN no codificante, ARNnh, ARNpre-m, ARNm madurado o cualquier combinación de los mismos. Los términos «secuencia de ácidos nucleicos» y «secuencia de nucleótidos» tal como se usan en el presente documento son intercambiables y tienen su significado habitual en la técnica. El término se refiere a una molécula de ADN o ARN en forma monocatenaria o bicatenaria. Una «secuencia de ácidos nucleicos aislada» se refiere a una secuencia de ácidos nucleicos que ya no se encuentra en el entorno natural del que se aisló. Una molécula de ácidos nucleicos está representada por una secuencia de nucleótidos. Además, un elemento tal como, por ejemplo, un elemento potenciador de la expresión y un elemento regulador de la transcripción está representado por una secuencia de nucleótidos.
[0140] Un «constructo recombinante» (o constructo quimérico) se refiere a cualquier secuencia o molécula de ácidos nucleicos, que normalmente no se encuentra en la naturaleza en una especie, en particular una secuencia, molécula o gen de ácidos nucleicos en el que están presentes una o más partes de la secuencia de ácidos nucleicos que no están asociadas entre sí en la naturaleza. Por ejemplo, un constructo recombinante comprende un promotor que no está asociado en la naturaleza con parte o la totalidad de la región transcrita o con otra región reguladora comprendida dentro de dicho constructo recombinante. Se entiende que el término «constructo recombinante» incluye constructos de expresión en los que un promotor o una secuencia reguladora de la expresión están operativamente enlazados a una o varias secuencias sentido (por ejemplo, secuencias codificantes) o antisentido (complemento inverso de la cadena sentido) o secuencia de repetición invertida (sentido y antisentido, en donde el transcrito de ARN forma ARN bicatenario tras la transcripción) o cualquier otra secuencia que codifique una molécula de ARN funcional.
[0141] Un «constructo de ácidos nucleicos» se define como un polinucleótido que se aísla de un gen natural o que se ha modificado para contener segmentos de polinucleótidos que se combinan o yuxtaponen de una manera que de otra manera no existiría en la naturaleza. Opcionalmente, un polinucleótido presente en un constructo de ácidos nucleicos está operativamente enlazado a una o más secuencias de control, que dirigen la producción o transcripción de una secuencia de nucleótidos de interés y/o la expresión de un péptido o polipéptido de interés en una célula o en un sujeto.
[0142] Se entiende que un «vector» o «plásmido»" significa una molécula de ácidos nucleicos artificial
(generalmente circular) que resulta del uso de tecnología de ADN recombinante y que se usa para administrar ADN exógeno a una célula huésped. Los vectores generalmente comprenden elementos genéticos adicionales para facilitar su uso en la clonación molecular, como p. ej., marcadores seleccionables, sitios de clonación múltiples y similares (ver más adelante). Un constructo de ácidos nucleicos también puede ser parte de un vector vírico recombinante para la expresión de una proteína en una planta o célula vegetal (por ejemplo, un vector derivado del virus del mosaico de la coliflor, CaMV o el virus del mosaico del tabaco, t Mv ) o en un organismo mamífero o un sistema celular mamífero (por ejemplo, un vector derivado del virus de la leucemia murina de Moloney (MMLV; un retrovirus), un lentivirus, un virus adenoasociado (AAV) o un adenovirus (AdV)).
[0143] Una «célula transformada» es un término que se refiere a una nueva célula (u organismo) individual, que surge como resultado de la introducción en dicha célula de al menos una molécula de ácidos nucleicos, que comprende especialmente un constructo quimérico o recombinante que codifica una proteína o una secuencia de ácidos nucleicos deseadas que tras la transcripción produce un ARN antisentido para silenciar un gen diana/familia de genes. La célula huésped puede ser una célula vegetal, una célula bacteriana (por ejemplo, una cepa de Agrobacterium), una célula fúngica (que incluye una célula de levadura), una célula animal (que incluye insectos, mamíferos), etc. La célula transformada puede contener el constructo de ácidos nucleicos como una molécula replicante extracromosómica (episomal), como una molécula no replicante o comprende el constructo recombinante integrado en el ADN nuclear o de orgánulo de la célula huésped. El término «organismo», tal como se usa en el presente documento, abarca todos los organismos que consisten en más de una célula, es decir organismos multicelulares, e incluye hongos multicelulares. «Transformación» y «transformado» se refieren a la transferencia de una secuencia de ácidos nucleicos, generalmente una secuencia de ácidos nucleicos que comprende un constructo recombinante o un gen de interés (GOI), en el genoma nuclear de una célula para crear una célula u organismo «transgénico» que comprende un transgén. La secuencia de ácidos nucleicos introducida generalmente está integrada en el genoma del huésped, pero no siempre. Cuando la secuencia de ácidos nucleicos introducida no está integrada en el genoma del huésped, se puede hablar de «transfección», «transfectada transitoriamente» y «transfectada». Para los fines de la presente memoria descriptiva de la patente, los términos «transformación», «transfectado transitoriamente» y «transfección» se usan indistintamente y se refieren a la presencia estable o transitoria de una secuencia de ácidos nucleicos en una célula u organismo. Cuando la célula es una célula bacteriana, el término generalmente se refiere a un vector extracromosómico, autorreplicante, que alberga una resistencia a los antibióticos seleccionable.
[0144] La «identidad de secuencia» o «identidad» en el contexto de la secuencia de aminoácidos o de ácidos nucleicos se define en el presente documento como una relación entre dos o más secuencias de aminoácidos (péptidos, polipéptidos o proteínas) o dos o más ácidos nucleicos (nucleótidos, secuencias de polinucleótidos), según lo determinado mediante la comparación de las secuencias. En la técnica, «identidad» también significa el grado de relación de secuencia entre las secuencias de aminoácidos o nucleótidos, según sea el caso, de acuerdo con lo determinado mediante la coincidencia entre cadenas de tales secuencias. Dentro de la presente invención, la identidad de secuencia con una secuencia particular indicada con una SEC ID n.° particular significa preferiblemente identidad de secuencia en toda la longitud de dicha secuencia de polipéptidos o polinucleótidos particular indicada con dicha SEC ID n.° particular. Sin embargo, la identidad de secuencia con una secuencia particular indicada con una SEC ID n.° particular también puede significar que la identidad de secuencia se evalúa sobre una parte de dicha SEC ID n.°. Una parte puede significar al menos un 50 %, un 60 %, un 70 %, un 80 %, un 90 % o un 95 % de la longitud de dicha SEC iD n.°. La información de secuencia que se proporciona en este documento no debe interpretarse tan estrictamente como para requerir la inclusión de bases identificadas erróneamente. La persona experta en la técnica es capaz de identificar tales bases identificadas erróneamente y sabe cómo corregir dichos errores.
[0145] Cualquier secuencia de nucleótidos capaz de hibridarse con las secuencias de nucleótidos de la invención se define como parte de los elementos de acción en cis de la invención. Las condiciones de hibridación rigurosas se definen en el presente documento como condiciones que permiten que una secuencia de ácidos nucleicos de al menos 25, preferiblemente 50, 75 o 100 y más preferiblemente 150 o más nucleótidos, se hibride a una temperatura de aproximadamente 65 °C o de 65 °C en una solución que comprende aproximadamente 1 M de sal o 1 M de sal, preferiblemente 6 x SSC o cualquier otra solución que tenga una fuerza iónica comparable, y se lave a 65 °C en una solución que comprende aproximadamente 0.1 M de sal, o 0.1 M de sal o menos, preferiblemente 0.2 x SSC o cualquier otra solución que tenga una fuerza iónica comparable. Preferiblemente, la hibridación se realiza durante la noche, es decir al menos durante 10 horas y preferiblemente el lavado se realiza durante al menos una hora con al menos dos cambios de la solución de lavado. Estas condiciones generalmente permitirán la hibridación específica de secuencias que tienen aproximadamente un 90 % o más de identidad de secuencia o al menos un 90 % de identidad de secuencia. Las condiciones de hibridación moderadas se definen en el presente documento como condiciones que permiten que una secuencia de ácidos nucleicos de al menos 50, preferiblemente 150 o más nucleótidos, se hibride a una temperatura de aproximadamente 45 °C o de 45 °C en una solución que comprende aproximadamente 1 M de sal o 1 M de sal, preferiblemente 6 x SSC o cualquier otra solución que tenga una fuerza iónica comparable, y se lave a temperatura ambiente en una solución que comprende aproximadamente 1 M de sal, o 1 M de sal preferiblemente 6 x SSC o cualquier otra solución que tenga una fuerza iónica comparable. Preferiblemente, la hibridación se realiza durante la noche, es decir al menos durante 10 horas y preferiblemente el lavado se realiza durante al menos una hora con al menos dos
cambios de la solución de lavado. Estas condiciones generalmente permitirán la hibridación específica de secuencias que tienen una identidad de secuencia de hasta un 50 %. La persona experta en la materia podrá modificar estas condiciones de hibridación para identificar específicamente secuencias que varían en identidad entre un 50 % y un 90 %.
[0146] La «identidad» se puede calcular fácilmente mediante métodos conocidos, incluidos, entre otros, los descritos en Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, Nueva York, 1988; Biocomputing: Informatics andGenome Projects, Smith, D. W., ed., Academic Press, Nueva York, 1993; Computer Analysis of Sequence Data, Parte I, Griffin, A. M. y Griffin, H. G., eds., Humana Press, Nueva Jersey, 1994; Sequence Analysis in Molecular Biology, von Heine, G., Academic Press, 1987; y Sequence Analysis Primer, Gribskov, M. y Devereux, J., eds., M Stockton Press, Nueva York, 1991; y Carillo, H. y Lipman, D., SIAM J. Applied Math., 48: 1073 (1988).
[0147] Los métodos preferidos para determinar la identidad están diseñados para proporcionar la mayor coincidencia entre las secuencias ensayadas. Los métodos para determinar la identidad y la similitud se codifican en programas informáticos disponibles para el público. Los métodos informáticos preferidos para determinar la identidad y similitud entre dos secuencias incluyen, p. ej., el paquete del programa GCG (Devereux, J., et al., Nucleic Acids Research 12 (1): 387 (1984)), BestFit, BLASTP, BLASTN y FASTA (Altschul, S. F. et al., J. Mol. Biol. 215: 403-410 (1990) El programa BlAst X está disponible públicamente en NCBI y otras fuentes (BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215: 403-410 (1990) El conocido algoritmo Smith Waterman también se puede usar para determinar la identidad.
[0148] Los parámetros preferidos para la comparación de secuencias de polipéptidos incluyen los siguientes: Algoritmo: Needleman y Wunsch, J. Mol. Biol. 48: 443-453 (1970); matriz de comparación: BLOSSUM62 de Hentikoff y Hentikoff, Proc. Natl. Acad. Sci. EE. UU. 89: 10915-10919 (1992); penalización de gap: 12; y penalización de longitud de gap: 4. Un programa útil con estos parámetros está disponible para el público como el programa «Ogap» de Genetics Computer Group, ubicado en Madison, WI. Los parámetros antes mencionados son los parámetros predeterminados para las comparaciones de aminoácidos (junto con ausencia de penalización de gaps finales).
[0149] Los parámetros preferidos para la comparación de ácidos nucleicos incluyen los siguientes: Algoritmo: Needleman y Wunsch, J. Mol. Biol. 48: 443-453 (1970); matriz de comparación: coincidencias = 10, falta de coincidencia = 0; penalización de gap: 50; penalización de longitud de gap: 3. Disponible como el programa Gap de Genetics Computer Group, ubicado en Madison, Wisconsin. Los parámetros predeterminados para las comparaciones de ácido nucleico son los anteriores.
[0150] El programa y el parámetro preferidos para evaluar la identidad de la comparación de ácidos nucleicos se calculan utilizando el algoritmo de alineación de nucleótidos EMBOSS Needle con los siguientes parámetros: matriz DNAfull con las siguientes penalizaciones de gap: abierto = 10; extensión = 0.5 tal como se lleva a cabo en el ejemplo 9.
[0151] El término «derivado de» en el contexto de la derivación a partir de un gen o secuencia de origen natural particular se define en el presente documento de modo que está sintetizado químicamente de acuerdo con un gen o secuencia natural y/o aislado y/o purificado a partir de un gen o secuencia de origen natural. Las técnicas para síntesis química, aislamiento y/o purificación de moléculas de ácidos nucleicos son bien conocidas en la técnica. En general, una secuencia derivada es una secuencia parcial del gen o secuencia de origen natural o una fracción del gen o secuencia de origen natural. Opcionalmente, la secuencia derivada comprende sustituciones o mutaciones de ácidos nucleicos, preferiblemente dando como resultado una secuencia de al menos un 50 %, un 55 %, un 60 %, un 65 %, un 70 %, un 75 %, un 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idénticos en toda su longitud al gen o gen parcial o secuencia o secuencia parcial del gen de origen natural.
[0152] «Polipéptido», tal como se usa en el presente documento, se refiere a cualquier péptido, oligopéptido, polipéptido, producto génico, producto de expresión o proteína. Un polipéptido está compuesto de aminoácidos consecutivos. El término «polipéptido» abarca moléculas naturales o sintéticas. Un polipéptido está representado por una secuencia de aminoácidos. Un polinucleótido está representado por una secuencia de nucleótidos. Un polipéptido está representado por una secuencia de aminoácidos.
[0153] El término «homólogo» cuando se usa para indicar la relación entre una molécula de ácidos nucleicos o de polipéptido dada y un organismo huésped o célula huésped dada, significa que en la naturaleza la molécula de ácidos nucleicos o de polipéptido es producida por una célula u organismo huésped de la misma especie, preferiblemente de la misma variedad o cepa. Si es homóloga a una célula huésped, una secuencia de ácidos nucleicos de interés, que preferiblemente codifica un polipéptido, estará operativamente enlazada a otra secuencia promotora o, si corresponde, a otra secuencia señal secretora y/o secuencia de terminación que en su entorno natural.
[0154] Cuando se usa para indicar la relación de dos secuencias de ácidos nucleicos, el término «homólogo» significa que una secuencia de ácido nucleico monocatenario puede hibridarse con una secuencia complementaria de ácido nucleico monocatenario. El grado de hibridación puede depender de una serie de factores, incluido el grado de identidad entre las secuencias y las condiciones de hibridación, tales como la temperatura y la concentración de sal, según se describe más adelante. Preferiblemente, la región de identidad es mayor que 5 pb, más preferiblemente la región de identidad es mayor que 10 pb.
[0155] El término «heterólogo» cuando se usa para indicar la relación entre una molécula de ácidos nucleicos o de polipéptido dada (recombinante) y un organismo o célula huésped dados, se entiende que significa una molécula de ácido nucleico o de polipéptido de una célula extraña que no ocurre de manera natural como parte del organismo, célula, genoma o secuencia de ADN o ARN en la que está presente, o que se encuentra en una célula o ubicación o ubicaciones en el genoma o las secuencias de ADN o ARN que difiere de aquellas en las que se encuentra en la naturaleza. Los ácidos nucleicos o proteínas heterólogos no son endógenos a la célula en la que se introducen, sino que se han obtenido de otra célula o se han producido de forma sintética o recombinante.
[0156] Cuando se usa para indicar la relación de dos secuencias de ácidos nucleicos, el término «secuencia heteróloga» o «ácido nucleico heterólogo» es aquel que no se encuentra operativamente enlazado de manera natural como secuencia vecina de la otra secuencia. Tal como se usa en el presente documento, el término «heterólogo» puede significar «recombinante». «Recombinante» se refiere a una entidad genética distinta de la que generalmente se encuentra en la naturaleza. Según se aplica a una secuencia de nucleótidos o molécula de ácidos nucleicos, esto significa que dicha secuencia de nucleótidos o molécula de ácidos nucleicos es el producto de varias combinaciones de pasos de clonación, restricción y/o de ligadura y otros procedimientos que dan como resultado la producción de un constructo que es distinto de una secuencia o molécula encontrada en la naturaleza.
[0157] «Operativamente enlazado» se define en el presente documento como una configuración en la que una secuencia de control o secuencia reguladora se coloca apropiadamente en una posición relativa a la secuencia de nucleótidos de interés, preferiblemente codificando el polipéptido de interés de tal manera que la secuencia de control o regulación dirige o afecta a la transcripción y/o producción o expresión de la secuencia de nucleótidos de interés, que codifica preferiblemente un péptido o polipéptido de la invención en una célula y/o un sujeto. Por ejemplo, un promotor está operativamente enlazado a una secuencia codificante si el promotor puede iniciar o regular la transcripción o la expresión de una secuencia codificante, en cuyo caso la secuencia codificante debe entenderse que está «bajo el control» del promotor. Cuando una o más secuencias de nucleótidos y/o elementos comprendidos dentro de un constructo se definen en el presente documento como «configurados para estar operativamente enlazados a una secuencia de nucleótidos opcional de interés», se entiende que dichas secuencias de nucleótidos y/o elementos están configurados dentro de dicho constructo de tal manera que estas secuencias de nucleótidos y/o elementos están operativamente enlazados a dicha secuencia de nucleótidos de interés una vez que dicha secuencia de nucleótidos de interés está presente en dicho constructo.
[0158] «Promotor» se refiere a una secuencia de ácidos nucleicos ubicada aguas arriba o en 5' de un codón de inicio de traducción de un marco de lectura abierto (o región codificante de proteínas) de un gen y que está involucrado en el reconocimiento y la unión de la ARN polimerasa II y otras proteínas (factores de transcripción de acción en trans) para iniciar la transcripción. El término promotor se refiere a un fragmento de ácidos nucleicos que funciona para controlar la transcripción de uno o más genes, ubicados aguas arriba con respecto a la dirección de transcripción del sitio de inicio de la transcripción del gen y se identifica estructuralmente por la presencia de un sitio de unión para ARN polimerasa dependiente de ADN, sitios de iniciación de la transcripción y cualquier otra secuencia de ADN, incluyendo, entre otras, sitios de unión a factores de transcripción, sitios de unión a proteínas represoras y activadoras y cualquier otra secuencia de nucleótidos conocida por una persona experta en la técnica para actuar directamente o indirectamente para regular la cantidad de transcripción del promotor. El promotor no incluye el sitio de inicio de la transcripción (TSS), sino que termina en el nucleótido -1 del sitio de transcripción y no incluye secuencias de nucleótidos que se convierten en regiones no traducidas en el ARNm transcrito tales como la 5'-UTR. Los promotores de la invención pueden ser promotores específicos de tejido, preferidos de tejido, específicos de tipo celular, inducibles y constitutivos. Los promotores específicos de tejido son promotores que inician la transcripción solo en ciertos tejidos y se refieren a una secuencia de ADN que proporciona señales de reconocimiento para la ARN polimerasa y/u otros factores necesarios para que comience la transcripción, y/o para controlar la expresión de la secuencia codificante precisamente dentro de ciertos tejidos o dentro de ciertas células de ese tejido. La expresión de una manera específica de tejido puede ser solo en tejidos individuales o en combinaciones de tejidos. Los promotores preferidos de tejido son promotores que inician preferentemente la transcripción en ciertos tejidos. Los promotores específicos del tipo celular son promotores que impulsan principalmente la expresión en ciertos tipos de células. Los promotores inducibles son promotores que son capaces de activar la transcripción de una o más secuencias de ADN o genes en respuesta a un inductor. Las secuencias o genes de ADN no se transcribirán cuando el inductor esté ausente. La activación de un promotor inducible se establece mediante la aplicación del inductor. Los promotores
constitutivos son promotores activos bajo muchas condiciones ambientales y en muchos tipos de tejidos diferentes. Preferiblemente, la capacidad para iniciar la transcripción se establece en un sistema de expresión usando un constructo de expresión que comprende dicho promotor operativamente enlazado a una secuencia de nucleótidos de interés usando un ensayo adecuado tal como RT-qPCR o transferencia Northern. Se dice que un promotor es capaz de comenzar la transcripción si se puede detectar una transcripción o si se encuentra un aumento en el nivel de transcripción de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la transcripción usando un constructo que solo difiere en que está libre de dicho promotor. En una realización preferida adicional, la capacidad para iniciar la expresión se establece en un sistema de expresión usando un constructo de expresión que comprende dicho promotor operativamente enlazado a una secuencia de nucleótidos que codifica una proteína o un polipéptido de interés. Preferiblemente, dicha proteína o polipéptido de interés es una proteína o un polipéptido secretado y la expresión de dicha proteína o polipéptido de interés se detecta mediante un ensayo adecuado tal como un ensayo ELISA, una transferencia de Western o, dependiendo de la identidad de la proteína o polipéptido de interés, cualquier ensayo de identificación y/o cuantificación de proteínas adecuado conocido por el experto en la técnica. Se dice que un promotor es capaz de iniciar la expresión si se puede detectar la proteína o el polipéptido de interés o si se encuentra un aumento en el nivel de expresión de al menos un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 %, un 100 %, un 200 %, un 300 %, un 500 %, un 1000 %, un 1500 % o un 2000 % en comparación con la expresión usando un constructo que solo difiere en que está libre de dicho promotor. Se puede usar como primer y segundo promotor de la invención un promotor inducido o constitutivo o una combinación de los mismos en la presente invención.
[0159] Un «intrón» es una secuencia de nucleótidos dentro de un transcrito de ARN primario que se elimina mediante empalme de ARN o empalme de intrón mientras se genera el producto de ARN maduro final. Se puede evaluar si se produce el empalme de intrones utilizando cualquier método adecuado conocido por la persona experta en la materia, como por ejemplo, entre otros, la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) seguida de análisis de tamaño o secuencia del producto RT-PCR . Preferiblemente, una secuencia de nucleótidos es un intrón si al menos un 2 %, un 5 %, un 10 %, un 15 %, un 20 %, un 30 %, un 40 %, un 50 %, un 60 %, un 70 %, un 80 %, un 90 % o un 100 % del ARN primario pierde esta secuencia mediante empalme de ARN usando un ensayo adecuado para detectar el empalme de intrones tal como se ha indicado anteriormente. Preferiblemente, un intrón comprende un sitio de empalme GT en el extremo 5' de la secuencia de nucleótidos y un sitio de empalme AG en el extremo 3' de la secuencia de nucleótidos, cuyo sitio de empalme AG está precedido por una secuencia de nucleótidos rica en pirimidina o un tracto de polipirimidina, opcionalmente separado del sitio de empalme AG por 1-50 nucleótidos. Un intrón puede comprender además un sitio de ramificación que comprende la secuencia Y-T-N-A-Y en el lado 5' del tracto de polipirimidina. El sitio de ramificación puede tener la secuencia de nucleótidos C-Y-G-A-C. Se entiende que una «secuencia intrónica» es al menos parte de la secuencia de nucleótidos de un intrón.
[0160] Se entenderá que «expresión» incluye cualquier paso implicado en la producción del péptido o polipéptido, que incluye, entre otros, transcripción, modificación postranscripcional, traducción, modificación postraduccional y secreción.
[0161] Opcionalmente, un promotor representado por una secuencia de nucleótidos presente en un constructo de ácidos nucleicos está operativamente enlazado a otra secuencia de nucleótidos que codifica un péptido o un polipéptido tal como se identifica en el presente documento.
[0162] Un vector de expresión puede ser cualquier vector que pueda someterse convenientemente a procedimientos de ADN recombinante y puede provocar la expresión de una secuencia de nucleótidos que codifica un polipéptido de la invención en una célula y/o un sujeto.
[0163] Tal como se usa en el presente documento, el «5'-UTR» es la secuencia que comienza con el nucleótido 1 del ARNm y termina con el nucleótido -1 del codón de inicio. Es posible que una parte reguladora del promotor esté comprendida dentro de la secuencia de nucleótidos que se convierte en una 5'-UTR; sin embargo, en tal caso, la 5'-UTR todavía no es parte del promotor tal como se define en el presente documento.
[0164] El término "secuencias de control" se define en el presente documento para incluir todos los componentes, que son necesarios o beneficiosos para la expresión de un polinucleótido o un polipéptido. Cada secuencia de control puede ser nativa o extranjera para la secuencia de ácidos nucleicos que alberga o codifica el polinucleótido o el polipéptido. Dichas secuencias de control incluyen, entre otras, un líder, secuencias de iniciación de traducción óptimas (tal como se describe en Kozak, 1991, J. Biol. Chem 266: 19867-19870), una secuencia de poliadenilación, una secuencia de propéptido, una secuencia de prepropéptido, un promotor, una secuencia señal y un terminador de transcripción. Como mínimo, las secuencias de control incluyen un promotor, y señales de parada transcripcionales y traduccionales.
[0165] Las secuencias de control pueden proporcionarse con enlazadores con el fin de introducir sitios de
restricción específicos que faciliten la ligadura de las secuencias de control con la región codificante de la secuencia de nucleótidos que codifica un polipéptido.
[0166] La secuencia de control puede ser una secuencia promotora apropiada, una secuencia de ácidos nucleicos, que es reconocida por una célula huésped para la expresión de la secuencia de ácidos nucleicos. La secuencia promotora contiene secuencias de control transcripcionales que median la expresión del polipéptido. El promotor puede ser cualquier secuencia de ácidos nucleicos que muestre actividad transcripcional en la célula, incluyendo promotores mutantes, truncados e híbridos, y puede obtenerse a partir de genes que codifican polipéptidos extracelulares o intracelulares, ya sean homólogos o heterólogos a la célula huésped.
[0167] La secuencia de control también puede ser una secuencia terminadora de transcripción adecuada, una secuencia reconocida por una célula huésped para terminar la transcripción. La secuencia terminadora está operativamente enlazada al terminal 3' de la secuencia de ácidos nucleicos de interés, que codifica preferiblemente un polipéptido de interés. Cualquier terminador que sea funcional en la célula puede usarse en la presente invención.
[0168] La secuencia de control también puede ser una secuencia líder adecuada, una región no traducida de un ARNm que es importante para la traducción por parte de la célula huésped. La secuencia líder está operativamente enlazada al terminal 5' de la secuencia de ácidos nucleicos de interés, que codifica preferiblemente un polipéptido de interés. Cualquier secuencia líder que sea funcional en la célula puede usarse en la presente invención.
[0169] La secuencia de control también puede ser una secuencia de poliadenilación, una secuencia operativamente enlazada al terminal 3' de la secuencia de ácidos nucleicos y que, cuando se transcribe, es reconocida por la célula huésped como una señal para añadir residuos de adenina al ARNm transcrito. Cualquier secuencia de poliadenilación que sea funcional en la célula puede usarse en la presente invención.
[0170] En este documento y en sus reivindicaciones, el verbo «comprender» y sus conjugaciones se utilizan en su sentido no limitante para indicar que se incluyen los elementos que siguen a la palabra, pero no se excluyen los elementos que no se mencionan específicamente. Además, el verbo «constar» puede reemplazarse por «constar esencialmente de» que significa que un producto o una composición o una molécula de ácidos nucleicos o un péptido o polipéptido de un constructo de ácidos nucleicos o un vector o una célula tal como se definen en el presente documento pueden comprender componente(s) adicional(es) a los identificados específicamente; dicho(s) componente(s) adicional(es) no altera(n) la característica única de la invención. Además, la referencia a un elemento por los artículos indefinidos «un» o «una» no excluye la posibilidad de que más de uno de los elementos esté presente, a menos que el contexto requiera claramente que haya uno y solo uno de los elementos. De este modo, los artículos indefinidos «un» o «una» significan generalmente «al menos uno».
Tabla 1: Identificación de secuencia
Figuras
[0171]
Fig. 1. Mapa esquemático del constructo del promotor intrónico y diferentes transcritos. El constructo comprende 2 promotores. La transcripción por el promotor 1 da como resultado un transcrito primario que incluye el intrón que contiene la secuencia completa del promotor 2 y está bordeado por los sitios de empalme 5' y 3'. Después del empalme de intrones, dicho transcrito primario da como resultado un ARNm sin que dicho intrón (transcrito 1) codifique un «gen». La transcripción a partir del promotor 2 también da como resultado un ARNm (transcrito 2) que codifica el mismo «gen».
Fig. 2. Mapa esquemático de los elementos EEE1 (A) y EEE2 (B) que muestra algunas características de los genes de UBC y CCT8 relevantes para su actividad promotora en un contexto genómico. Las características incluyen el sitio de inicio de transcripción pronosticado (TSS), las 5'-UTR y la información de exón e intrón. Fig. 3. Mapa esquemático de un vector de expresión para una cadena ligera de Ig (IgLC) con la secuencia EEE1 integrada aguas arriba del promotor de CMV.
Fig. 4. Comparación de la producción de HuMabl mediante grupos de CHO-S transfectados de manera estable con constructos de referencia o EEE1. Vector de expresión sin (A) y con (B) el elemento regulador de expresión adicional. Las barras representan los títulos promedio de cuatro grupos derivados de dos transfecciones independientes. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 5. Comparación de la producción de HuMab1 mediante conjuntos de CHO-S transfectadas de manera estable con constructos de referencia o EEE2. Las barras representan los títulos promedio de cuatro grupos derivados de dos transfecciones independientes. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 6. Análisis de la producción de HuMab1 mediante las 10 líneas celulares clonales CHO-S principales transfectadas de manera estable con constructos EEE1-TEE que albergan EEE1. Las células se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 7. Comparación de la producción de HuMab2 mediante los grupos CHO-S transfectados de manera estable con EEE1 en el vector de referencia (A, panel izquierdo) y en el vector con un elemento regulador adicional (A, panel derecho). Las barras representan los títulos promedio de cuatro grupos derivados de dos transfecciones independientes. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO. (B) Análisis de la producción de HuMab2 mediante las 12 líneas celulares clonales principales de referencia y EEE1-TEE CHO-S. Las células se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 8. Comparación de la actividad de SeAP en los medios de los grupos CHO-S transfectados de manera estable con constructos de referencia o EEE1. Vector de expresión sin (panel izquierdo) y con (panel derecho) elemento regulador de expresión adicional. Las barras representan las actividades promedio de cuatro grupos derivados de dos transfecciones independientes, medidas utilizando el kit de ensayo de genes SEAP Reporter, Abcam. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 9. Comparación de la actividad de SeAP en los medios de los grupos CHO-S transfectados de manera estable con constructos que contienen diferentes versiones del elemento EEE1. Las barras representan las actividades promedio de cuatro grupos derivados de dos transfecciones independientes, medidas utilizando el kit de ensayo de genes SEAP Reporter, Abcam. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO.
Fig. 10. Amplificación 5'-RACE de los extremos 5' de transcritos de cadena pesada de clones de CHO-S transfectados de manera estable con constructos EEE1-TEE que expresan HuMab1 (A). Se detectan dos bandas en gel de agarosa, que corresponden a las transcripciones generadas por el promotor de CMV (transcrito 1) y el promotor de UBC (transcrito 2). La diferencia de tamaño entre el transcrito 1 y el transcrito 2 se explica en un mapa esquemático del constructo del promotor intrónico y diferentes transcritos. (B). El constructo comprende 2 promotores, UBC y CMV. El promotor de CMV está vinculado a una secuencia TEE que también comprende un intrón corto. La transcripción mediante el promotor de CMV da como resultado, después del empalme de intrones, ARNm con TEE como 5'-UTR (transcrito 1). El promotor de UBC está vinculado a una región parcial 5'-UTR de UBC que comprende un sitio de empalme donador 5' y precede al promotor de CMV. La transcripción por el promotor de UBC da como resultado ARNm con la secuencia 5'-UTR de UBC (transcrito 2). El intrón grande que se empalma a partir del transcrito primario se extiende desde la secuencia de empalme donadora 5' en la secuencia de UBC hasta el sitio de empalme aceptor 3' en TEE y contiene la secuencia completa de CMV.
Fig 11. Efecto de EEE en Pichia pastoris que expresa interleucina humana recombinante 8. Cada barra representa la expresión promedio de 10 clones independientes.
[0172] La invención se explicará con más detalle en la siguiente sección de ejemplos, haciendo referencia a las figuras adjuntas. Los ejemplos sirven solo para fines ilustrativos y no pretenden limitar la presente invención de ninguna manera.
Ejemplos
[0173] El elemento potenciador de la expresión representado por la SEC ID n.°: 1 se basa en el gen de ubiquitina C (UBC) de hámster chino (Cricetulus griseus). Comprende la secuencia promotora pronosticada y parte de la región 5' no traducida (Fig. 2A). El elemento potenciador de la expresión representado por la SEC ID n.°: 2 se basa en el gen CCT8 humano (chaperonina que contiene TCP1, subunidad 8). Comprende la secuencia promotora pronosticada y parte de la región 5' no traducida, así como una secuencia corta que codifica 27 aminoácidos y parte del primer intrón (Fig. 2B).
Ejemplo 1
[0174] Los plásmidos de expresión se construyeron basándose en el vector de expresión ADNpc3.1 (SEC ID n.°: 71). El vector se modificó mediante la eliminación del f1 -ori. Se insertaron secuencias codificantes para genes de cadena pesada (representada por una secuencia que tiene al menos un 96 % de identidad con la SEC ID n.°: 68) y cadena ligera (representada por una secuencia que tiene al menos un 99 % de identidad con la SEC ID n.°: 67) de IgG1 (HuMab1) en este vector (la secuencia codificante de cadena ligera se insertó en el vector representado por la SEC ID n.°: 65 y la secuencia codificante de cadena pesada se insertó en el vector representado por la
SEC ID n.°: 66), lo que dio como resultado los constructos de referencia. Para generar los vectores EEE1 (elemento potenciador de la expresión 1), la secuencia EEE1 (SEC ID n.°: 1) se insertó aguas arriba del promotor de CMV (SEC ID n.°: 57) (Fig. 3). EEE2 (SEC ID n.°: 2) se introdujo de manera similar, lo que dio como resultado los vectores EEE2. Se generó un vector con un elemento regulador de la expresión adicional reemplazando la 5'-UTR de ADNpc3.1 para la SEC ID n.°: 19 (elemento potenciador de la transcripción; TEE).
[0175] Las células CHO-S (Life Technologies) se mantuvieron según las instrucciones del fabricante. Se realizaron transfecciones duplicadas usando células 3E7, 50 pg de ADN linealizado y reactivo FreeStyle MAX (Life Technologies). Los grupos postransfección se dividieron en dos y se seleccionaron en medio CD FortiCHO suplementado con glutamina 8 mM y 800 pg/ml de G418. Se sembraron grupos seleccionados en 30 ml del mismo medio a una densidad de 3E5 células/ml en matraces de agitación de 125 ml. Los títulos de HuMab1 se determinaron mediante ELISA (Fig. 4). Los títulos de los grupos de referencia eran demasiado bajos para una determinación precisa. Esto indica que el anticuerpo está mal expresado. Los grupos EEE1 produjeron aproximadamente 1 pg/ml (Fig. 4A). Se observó un efecto similar en el vector con un elemento regulador adicional de la expresión. En este vector, la introducción de EEE1 aumentó la producción desde aproximadamente 0.2 pg/ml hasta 9-12 pg/ml en grupos estables de tres experimentos de transfección independientes (Fig. 4B). Estos datos muestran que un anticuerpo mal expresado puede expresarse a niveles significativamente más altos mediante la introducción del elemento EEE1.
Ejemplo 2
[0176] El efecto de introducir el elemento EEE2 se estudió en un vector que alberga un elemento regulador de la expresión adicional (véase el ejemplo 1, Fig. 4B). Las células CHO-S se transfectaron con la referencia o con los constructos de EEE2 tal como se ha descrito anteriormente. Los títulos de anticuerpos de los grupos de EEE2 transfectados de forma estable eran más de 20 veces más altos que los grupos de referencia (Fig. 5).
Ejemplo 3
[0177] El EEE1-TEE y los grupos de referencia generados previamente se sembraron en seis placas de 96 pocillos a una densidad de 0.5 células/pocillo en medio de selección CD FortiCHO. Las células de referencia mostraron un crecimiento deteriorado en comparación con los clones EEE1-TEE y, por lo tanto, no se produjo HuMab1. Los clones de EEE1-TEE mostraron un crecimiento normal y producción de HuMab1 (ver más adelante). Se evaluaron 100 líneas clonales EEE1-TEE para la producción de HuMab1 en placas de microtitulación. Los 10 clones con la productividad específica más alta se expandieron a matraces de agitación de 125 ml. Los clones se sembraron en 30 ml de medio de selección CD FortiCHO a una densidad de 3E5 células/ml y los títulos de HuMab1 se determinaron mediante ELISA (Fig. 6). Los clones produjeron hasta 0.25 pg/ml de HuMab1. Estos datos indican que el EEE1 puede facilitar la generación de líneas clonales y permite la generación de líneas clonales con niveles de expresión relevantes.
Ejemplo 4
[0178] Se determinó el número de copias de clones que comprenden EEE que expresan anticuerpos. El programa PrimerExpress (Life Technologies) se utilizó para diseñar cebadores y sondas Taqman específicos para las cadenas pesadas y ligeras de la microglobulina HuMab1 y p-2. Los cebadores se combinaron en un ensayo tríplex Taqman para medir copias de genes en muestras de ADNg de clones y grupos de HuMab1 de EEE1-TEE. Los números de copias de genes se compararon con los títulos de HuMab1 (Tabla 2). Las líneas celulares clonales que producían títulos similares de HuMab1 tenían diferentes números de copias de genes de cadena ligera y pesada (clon 1 y 2). Además, los clones que producían títulos de HuMab1 muy diferentes tenían números de copias de genes similares (clones 3 y 4). En los grupos, se emparejaron números relativamente altos de genes de cadena ligera y pesada con niveles de expresión relativamente bajos. Estos datos (Tabla 2) indican que no hay correlación entre el EEE que comprende el número de copia del gen y los niveles de expresión de HuMab1.
Tabla 2: Títulos de IgG1 y números de copias de genes
Título de IgG CL CP
Clon1 123.7 36.8 25.1
Clon2 118.2 1.7 1.7
Clon3 143.6 3.1 1.2
Clon4 7.2 4.6 0.7
Grupo 9.0 17.5 21.1
Ejemplo 5
[0179] Los genes de cadena pesada y ligera HuMabl de los ejemplos anteriores fueron reemplazados por genes de cadena pesada y ligera (SEC ID n.°: 69 y 70) que codifican un anticuerpo biosimilar (HuMab2 derivado del número de acceso de DrugBank DB00072). Los constructos se usaron para generar grupos de CHO-S tal como se ha descrito anteriormente. Los títulos se determinaron usando ELISA. Los datos (6.3 pg/ml sin elemento potenciador) indican que este anticuerpo se produce a un nivel más alto que el anticuerpo de los ejemplos anteriores. Sin la introducción de ningún elemento regulador de la expresión adicional del EEE, se produjo un aumento de 3.7 veces (Fig. 7A, panel izquierdo), en el vector modificado el aumento es de 7 veces (Fig. 7A, panel derecho). Dado que el elemento regulador de expresión adicional da como resultado un aumento del 40 %, los datos también indican un efecto sinérgico entre el EEE y el elemento regulador de expresión adicional. Las líneas clonales se aislaron de los grupos de referencia y EEE1-TEE tal como se ha descrito anteriormente. Los mejores clones de EEE1-TEE produjeron títulos de HuMab2 tres veces más altos en comparación con los mejores clones de referencia (Fig. 7B). Estos datos indican que el elemento EEE1 se puede aplicar con éxito para mejorar la expresión de proteínas recombinantes a partir de líneas celulares estables.
Ejemplo 6
[0180] El gen de la cadena ligera HuMabl de los constructos del ejemplo 1 se reemplazó por el gen que codifica la fosfatasa alcalina secretada (SeAP; SEC ID n.°: 72). Los constructos se usaron para generar grupos de CHO-S tal como se ha descrito anteriormente. La actividad de SeAP se midió en el medio usando el kit de ensayo de genes SEAP Reporter, Abcam. Los grupos de EEE1 mostraron una actividad dos veces mayor en comparación con los grupos de referencia (Fig. 8). En los grupos de EEE1-TEE, el aumento fue casi cuatro veces mayor en comparación con el grupo de referencia. Estos datos muestran que el EEE1 mejora la expresión de una proteína de subunidad única no anticuerpo en una línea celular transfectada.
Ejemplo 7
[0181] Todos los constructos de SeAP usados en el ejemplo 6 comprendían el promotor de CMV. Se hicieron dos variantes del vector TEE que contenían el promotor EF-1a humano en lugar de CMV (SEC ID n.°: 79). Los constructos se usaron para generar grupos de CHO-S tal como se ha descrito anteriormente. La actividad de SeAP se midió en el medio usando el kit de ensayo de genes SEAP Reporter, Abcam. El grupo de EEE1-TEE con EF-1a como promotor intrónico produjo una actividad de SeAP 2,8 veces mayor en comparación con el grupo de promotores EF-1a de referencia sin EEE1. Estos datos muestran que EEE1 mejora la expresión de una proteína en un constructo de promotor intrónico cuando el promotor intrónico no es el promotor de CMV, por ejemplo, el promotor EF-1a.
Ejemplo 8
[0182] El elemento EEE1 del vector de expresión de SeAP EEE1 fue reemplazado por las siguientes variantes: 1. EEE1-80 representado por la SEC ID n.°: 60 tiene un truncamiento de 290 pb desde el extremo 5'; 2. EEE1-60 representado por la SEC ID n.°: 61 con un truncamiento de 580 pb desde el extremo 5'; 3. EEE1-50 representado por la SEC ID n.°: 62 con un truncamiento de 725 pb desde el extremo 5'; 4. EEE1-Xt representado por la SEC ID n.°: 59 con una extensión de 800 pb desde la secuencia de UBC de C. griseus genómica en el extremo 5'; 5. El EEE1-SL (SEC ID n.°: 63) tiene los principales sitios de empalme pronosticados donadores y aceptores mutados. La actividad de SeAP en el sobrenadante de células transfectadas con el elemento EEE1 se estableció en el 100 % y disminuyó hasta un 39 % de actividad sin el elemento EEE1 (Fig. 9). Los truncamientos 5' de los constructos EEE1-80 y EEE1-60 disminuyeron gradualmente la actividad, pero seguían mostrando una actividad mejorada en comparación con el constructo sin EEE. El elemento EEE1-50 disminuyó la actividad de SeAP hasta el 40 %, que es similar a la del constructo sin EEE. El constructo EEE1-Xt mostró casi un 40 % más de actividad en comparación con el constructo EEE1. Los datos sugieren que las secuencias con más del 50% de identidad con EEE1 pueden funcionar como elementos potenciadores de la expresión. El constructo EEE1-Xt produjo casi un 40 % más de actividad en comparación con el constructo EEE1, que muestra que las secuencias potenciadoras adicionales residen en la región aguas arriba de la secuencia genómica de la que se tomó el EEE1. La actividad del elemento EEE1 se ve gravemente perjudicada por mutaciones de 4 nt del constructo EEE1-SL que evitan el empalme correcto de intrones, lo que da como resultado una reducción significativa en la expresión de SeAP en comparación con el constructo EEE1.
Ejemplo 9
[0183] El elemento EEE1 del vector de expresión de SeAP de EEE1 fue reemplazado por nueve variantes del elemento EEE1, que se pueden agrupar basándose en dos tipos diferentes de mutaciones. El primer tipo de variantes de EEE1 (EEE1-A) experimentó cambios dentro de los elementos EEE1 o EEE1-Xt con más del 30 por ciento de nucleótidos mutados, cada uno en otra de las tres regiones que constaban de al menos 244 pb. El segundo tipo de variantes de EEE1 (EEE1-B) también tenía el mismo tamaño que el elemento EEE1 (1449 pb)
con al menos un 96 por ciento de identidad de secuencia, con mutaciones que apuntaban a secuencias funcionales de la secuencia EEE1. Las diferentes mutaciones se enumeran en la tabla 3.
Tabla 3: Modificaciones de EEE1
Tipo A: más del 30 % de mutaciones en 3 regiones de EEE1
Variante SEC Identidad Región de EEE1 modificada Región de tamaño modificado (pb)
ID n.°: con EEE11)
EEE1- 80 71.6 % 2) región promotora 5' 1526
A1
EEE1- 81 95.0 % región promotora 3' 244
A2
EEE1- 82 81.8 % región intrón 480
A3
Tipo B: mutaciones que apuntan a dominios específicos de EEE1
Variante SEC Identidad Modificación de la secuencia de EEE1
ID n.°: con EEE11)
EEE1- 83 97.9 % 1: 7 nt cambiados en nt 144-152
B1
2: 4 nt cambiados en nt 612-615
3: 4 nt cambiados en nt 667-670
4: 6 nt cambiados en nt 816-823
5: 5 nt cambiados en nt 1.106-1.112
6: 5 nt cambiados en nt 1.432-1.438
EEE1- 84 96.5 % 50 mutaciones de pb sencillas = 50 % de los CG mutados en nt 227-1409; se B2 mantienen los sitios de unión del factor de transcripción pronosticados.
EEE1- 85 99.7 % 5 mutaciones de pb sencillas = 50 % de los CG mutados en nt 549-603 B3
EEE1- 86 96.5 % 50 mutaciones de pb sencillas = 50 % de los CG mutados en nt 227-1409; 8 B4 sitios pronosticados para los factores de transcripción SP1, HSF y NFKB afectados.
EEE1- 87 96.0 % se realizaron 51 mutaciones de pb en 12 regiones con actividad de unión del B5 factor de transcripción pronosticada que abarcan nt 105-1449.
EEE1- 63 99.7 % 4 mutaciones de pb sencillas que eliminan los sitios de empalme donadores o B63) aceptores pronosticados y conocidos, incluyendo el sitio donador conocido (nt 970), nt 545 y 552 en la región promotora, nt 1267 en la región intrón.
[0184] Se midió la actividad de SeAP en el sobrenadante de células transfectadas con las diferentes variantes. La actividad de las células con el elemento EEE1 se utilizó como referencia (100 %). Sin el elemento EEE1, la actividad fue del 24 % en este experimento. La actividad de SeAP de las células transfectadas con los constructos EEE1-A2 y EEE1-A3 se redujo a hasta el 75 % y el 48 % en relación con EEE1, respectivamente (Tabla 4). Esto es superior al 24 % de actividad observada con el constructo sin EEE en este experimento. El constructo EEE1-A1 disminuyó la actividad de SeAP hasta el 30 % en relación con el constructo EEE1-Xt en el que se basa, que sigue siendo superior al constructo sin EEE que produce solo el 18 % de la actividad de SeAP en relación con el constructo EEE1-Xt. Los datos muestran que las variantes de EEE1 con tan solo un 72 % de identidad global y un 50% de identidad local con la secuencia genómica de UBC pueden funcionar como elementos potenciadores de la expresión.
[0185] La actividad de SeAP de las células transfectadas con los constructos EEE1-B1 hasta B6 se redujo hasta en un 42% con respecto al constructo EEE1 (Tabla 4). Los datos muestran que las mutaciones en regiones con
una funcionalidad pronosticada en la actividad promotora intrónica del elemento EEE1 pueden limitar significativamente la capacidad de mejora de la expresión del elemento EEE1. Por ejemplo, la mutación de 4 nt implicados en el empalme de intrones dio como resultado una disminución del 38 % en los títulos de SeAP (EEE1-B6). La mutación de diferentes conjuntos de CpG también dio como resultado una disminución de los títulos de SeAP (B1, B2, B4).
Tabla 4: Actividad de SeAP de variantes de EEE1
Constructo Actividad relativa a EEE1 (%)1)
Sin EEE1 24
EEE1 100
EEE1-A2 75
EEE1-A3 48
EEE1-B1 58
EEE1-B2 60
EEE1-B3 73
EEE1-B4 58
EEE1-B5 84
EEE1-B6 62
Constructo Actividad relativa a EEE1-Xt (%)1)
Sin EEE1 18
EEE1-Xt 100
EEE1-A1 30
Ejemplo 10
[0186] Se cultivó un clon de EEE1-TEE de CHO-S del ejemplo 3 y las células se cosecharon en la fase logarítmica. El ARN total se aisló de las células usando el mini kit AllPrep DNA/RNA (Qiagen). El ADNc se sintetizó usando el kit 5' y 3' RACE de mRNA eucariótico Epicentre Exact Start. El ADNc de la primera cadena se amplificó usando el cebador RACE 5' del kit combinándolo con un cebador específico de cadena pesada (SEC ID n.°: 64) y la ADN polimerasa ZymoTaq. El producto de PCR se analizó en geles de agarosa al 1.2 %, mostrando dos bandas discretas (Fig. 10A) que se aislaron por separado y se insertaron en un vector PCR4-TOPO (Life Technologies). El análisis de secuenciación reveló que la banda superior vista en el gel de agarosa corresponde al transcrito iniciado desde el promotor de CMV. La banda inferior corresponde al transcrito iniciado desde el promotor UBC. Ambos productos tienen la secuencia intrónica pronosticada correctamente dividida. Las diferencias de tamaño corresponden a las diferentes longitudes de las 5'-UTR, tal como se muestra en la figura 10B. Los datos muestran que ambos promotores contribuyen a la transcripción.
Ejemplo de referencia 11
[0187] Los grupos de CHO-S transfectados de forma estable con constructos de tres promotores individuales diferentes se compararon mediante la actividad de SeAP en el sobrenadante. Los grupos se cultivaron en matraces de agitación de 125 ml en 30 ml de medio de selección CD FortiCHO y la actividad de SeAP se midió usando el kit de ensayo de genes SEAP Reporter (Abcam) en 4 grupos por constructo derivados de 2 transfecciones independientes. Los constructos contenían el promotor de CMV (ejemplo 6), el promotor EF-1a (ejemplo 7) o el promotor de UBC (Ejemplo 11). El promotor de UBC produjo una actividad de SeAP 2.7 veces mayor en comparación con el constructo del promotor de CMV. El promotor de UBC produjo una actividad de SeAP seis veces mayor en comparación con el promotor EF-1a. Los datos muestran que la expresión con el promotor de UBC en solitario es mayor en comparación con el promotor de CMV o el promotor EF-1a en solitario.
Ejemplo 12 Secreción inducida por metanol de IL8 en transformantes integradores GS115 de Pichia pastoris
[0188] Los plásmidos para la transformación estable de Pichia pastoris con constructos de expresión de
Claims (8)
1. Método para la transcripción y/o expresión y, opcionalmente, la purificación del transcrito y/o proteína o polipéptido de interés producidos que comprende los pasos de:
a) proporcionar un constructo de ácidos nucleicos que comprende un primer promotor, un segundo promotor y una secuencia de nucleótidos de interés, en donde dichos primer promotor y segundo promotor están operativamente enlazados a dicha secuencia de nucleótidos de interés, y en donde dicho segundo promotor está flanqueado por una primera secuencia intrónica ubicada aguas arriba de dicho promotor y una segunda secuencia intrónica ubicada aguas abajo de dicho promotor; y,
b) poner en contacto una célula con dicho constructo de ácidos nucleicos para obtener una célula transformada; y,
c) permitir que dicha célula transformada produzca un transcrito de la secuencia de nucleótidos de interés y/o exprese la proteína o el polipéptido de interés; y opcionalmente
d) purificar dicho transcrito y/o proteína o polipéptido de interés producidos.
2. Método según la reivindicación 1, en donde
- dicha primera secuencia intrónica comprende al menos un sitio de empalme donador y en donde dicha segunda secuencia intrónica comprende al menos un sitio de empalme aceptor, preferiblemente en donde dicha secuencia que comprende dicho primer promotor y/o dicha primera secuencia intrónica tiene al menos un 50 % de identidad con la SEC ID n.°: 1 o 2 en toda su longitud y/o
- en el que dicho segundo promotor tiene al menos un 50 % de identidad con la SEC ID n.°: 57 o 58 en toda su longitud.
3. Método según la reivindicación 1 o 2, en el que dicho constructo de ácidos nucleicos comprende además una secuencia reguladora de la expresión adicional, en donde preferiblemente dicha secuencia reguladora de la expresión adicional comprende o consta de un intrón.
4. Constructo de ácidos nucleicos tal como se define en el paso a) de la reivindicación 1 o como se define en las reivindicaciones 2 o 3, en donde la secuencia de nucleótidos de interés es opcional y preferiblemente donde dicha secuencia de nucleótidos opcional codifica una proteína o un polipéptido de interés, y más preferiblemente dicha proteína o polipéptido de interés son una proteína o un polipéptido heterólogos.
5. Vector de expresión que comprende un constructo de ácidos nucleicos según la reivindicación 4.
6. Célula que comprende un constructo de ácidos nucleicos según la reivindicación 4 y/o un vector de expresión según la reivindicación 5.
7. Constructo de ácidos nucleicos según la reivindicación 4 y/o un vector de expresión según la reivindicación 5 y/o una célula según la reivindicación 6 para usar como medicamento.
8. Uso in vitro de un constructo de ácidos nucleicos según la reivindicación 4 y/o un vector de expresión según la reivindicación 5 y/o una célula según la reivindicación 6 para la transcripción y/o expresión de una secuencia de nucleótidos de interés.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13199875 | 2013-12-31 | ||
EP13199873 | 2013-12-31 | ||
PCT/NL2014/050907 WO2015102487A1 (en) | 2013-12-31 | 2014-12-24 | Construct and sequence for enhanced gene expression |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2780692T3 true ES2780692T3 (es) | 2020-08-26 |
Family
ID=52345489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES14825469T Active ES2780692T3 (es) | 2013-12-31 | 2014-12-24 | Constructo y secuencia para la expresión genética mejorada |
Country Status (8)
Country | Link |
---|---|
US (3) | US10889822B2 (es) |
EP (2) | EP3666287A1 (es) |
CN (1) | CN106061511A (es) |
AU (1) | AU2014374516B2 (es) |
CA (2) | CA3197228A1 (es) |
DK (1) | DK3089760T3 (es) |
ES (1) | ES2780692T3 (es) |
WO (1) | WO2015102487A1 (es) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3197228A1 (en) * | 2013-12-31 | 2015-07-09 | Proteonic Biotechnology Ip B.V. | Construct and sequence for enhanced gene expression |
GB201518792D0 (en) * | 2015-10-23 | 2015-12-09 | Univ Manchester | Production of proteins |
CL2016001661A1 (es) | 2016-06-29 | 2017-03-03 | Univ Chile | Promotor hibrido de ß-actina (de cricetulus griseus) y citomegalovirus (cmv), con región rica en dinucleótidos, citosina-guanina, vectores, líneas celulares, procedimiento para producir proteínas recombinantes. |
EP3931319A1 (en) | 2019-02-28 | 2022-01-05 | ProteoNic Biotechnology IP B.V. | Self-immolative plasmid backbone |
CN112779257B (zh) * | 2020-03-02 | 2022-06-07 | 山东农业大学 | 来自苹果多聚泛素基因的核苷酸片段及其应用 |
CN112877330B (zh) * | 2020-03-02 | 2022-06-21 | 山东农业大学 | 一种在原生质体细胞中高效表达目标基因的方法 |
WO2024084398A2 (en) | 2022-10-17 | 2024-04-25 | Bio Immunitas Ltd. | Vectors and cells for producing alpha 2 macroglobulin and soluble klotho |
CN117925624B (zh) * | 2024-03-22 | 2024-05-31 | 上海凌医生物科技有限公司 | 一种金属响应调控元件 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5547862A (en) * | 1993-07-29 | 1996-08-20 | Ambion Inc. | Vectors containing multiple promoters in the same orientation |
DE19539493A1 (de) * | 1995-10-24 | 1997-04-30 | Thomae Gmbh Dr K | Starker homologer Promotor aus Hamster |
FR2757178B1 (fr) * | 1996-12-13 | 1999-03-05 | Centre Nat Rech Scient | Utilisation d'un vecteur exprimant l'adn polymerase beta comme medicament |
US6368825B1 (en) * | 1998-08-10 | 2002-04-09 | Academia Sinica | Baculovirus containing minimal CMV promoter |
US20050101017A1 (en) * | 2003-11-10 | 2005-05-12 | Wojtek Auerbach | Method of improving gene targeting using a ubiquitin promoter |
ES2385679T3 (es) * | 2006-08-24 | 2012-07-30 | Virovek, Inc. | Expresión de células de insecto de genes con marcos de lectura abiertos superpuestos, métodos y composiciones de éstos |
US8758998B2 (en) * | 2006-11-09 | 2014-06-24 | Gradalis, Inc. | Construction of bifunctional short hairpin RNA |
CA2833905C (en) * | 2010-04-23 | 2019-09-10 | University Of Massachusetts | Multicistronic expression constructs |
DK2611915T3 (da) * | 2010-09-01 | 2015-06-22 | Cellagenics B V | Nukleinsyrefragmenter fra en ribosomal proteinpromoter til forstærkning af genekspression |
US20130239236A1 (en) * | 2010-10-01 | 2013-09-12 | R1 B3 Holdings B.V. | Regulation of translation of expressed genes |
US9284588B2 (en) * | 2010-12-16 | 2016-03-15 | Novozymes, Inc. | Promoters for expressing genes in a fungal cell |
WO2012099279A1 (ja) * | 2011-01-21 | 2012-07-26 | 独立行政法人理化学研究所 | 酸化ストレスインジケーター発現用核酸構築物とその使用 |
CA3197228A1 (en) * | 2013-12-31 | 2015-07-09 | Proteonic Biotechnology Ip B.V. | Construct and sequence for enhanced gene expression |
-
2014
- 2014-12-24 CA CA3197228A patent/CA3197228A1/en active Pending
- 2014-12-24 AU AU2014374516A patent/AU2014374516B2/en active Active
- 2014-12-24 CA CA2935724A patent/CA2935724C/en active Active
- 2014-12-24 WO PCT/NL2014/050907 patent/WO2015102487A1/en active Application Filing
- 2014-12-24 DK DK14825469.1T patent/DK3089760T3/da active
- 2014-12-24 CN CN201480076619.9A patent/CN106061511A/zh active Pending
- 2014-12-24 EP EP20150069.1A patent/EP3666287A1/en active Pending
- 2014-12-24 EP EP14825469.1A patent/EP3089760B1/en active Active
- 2014-12-24 ES ES14825469T patent/ES2780692T3/es active Active
- 2014-12-24 US US15/109,301 patent/US10889822B2/en active Active
-
2021
- 2021-01-11 US US17/146,170 patent/US20210198677A1/en active Pending
-
2022
- 2022-05-20 US US17/749,460 patent/US20220282261A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA2935724C (en) | 2023-06-20 |
US20210198677A1 (en) | 2021-07-01 |
CA3197228A1 (en) | 2015-07-09 |
EP3089760A1 (en) | 2016-11-09 |
AU2014374516B2 (en) | 2020-08-06 |
EP3089760B1 (en) | 2020-01-15 |
US10889822B2 (en) | 2021-01-12 |
US20170029826A1 (en) | 2017-02-02 |
EP3666287A1 (en) | 2020-06-17 |
AU2014374516A1 (en) | 2016-07-14 |
WO2015102487A1 (en) | 2015-07-09 |
US20220282261A1 (en) | 2022-09-08 |
DK3089760T3 (da) | 2020-03-16 |
CA2935724A1 (en) | 2015-07-09 |
CN106061511A (zh) | 2016-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2780692T3 (es) | Constructo y secuencia para la expresión genética mejorada | |
JP2023156355A (ja) | 細胞または生物のゲノムへのDNA配列の標的化組み込みのためのCas9レトロウイルスインテグラーゼおよびCas9レコンビナーゼ系 | |
Ye et al. | Identification of the promoter region of human interleukin 1 type I receptor gene: multiple initiation sites, high G+ C content, and constitutive expression. | |
CN101688222A (zh) | 启动子 | |
US20230340476A1 (en) | Regulation of translation of expressed genes | |
BR112014004830B1 (pt) | Célula de levedura geneticamente modificada, seu uso e método para produzir uma proteína ou polipeptídio recombinante de interesse | |
JP2024099642A (ja) | 藻類における遺伝子の誘導発現 | |
EP3365452A1 (en) | Expression in mammalian cells with gaussia luciferase signal peptide | |
EP2611915B1 (en) | Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression | |
ES2564227T3 (es) | Elemento de ADN que tiene actividad de aumento de expresión de un gen exógeno | |
KR20100097123A (ko) | 신규한 재조합 서열 | |
CN106459940B (zh) | 新型过氧化氢酶信号序列及利用其的过氧化氢酶表达方法 | |
KR101574554B1 (ko) | 벼 현탁 배양을 이용한 재조합 인간 트립신의 생산방법 | |
CN104059128B (zh) | 一种人工合成的信号肽及其应用 | |
CN111040028B (zh) | 能促进较大基因表达的Bcl2突变体及应用 | |
KR101244025B1 (ko) | 벼 형질전환용 재조합 벡터 및 이를 이용한 소 트립신의 대량생산방법 | |
KR101646991B1 (ko) | 외래 유전자의 비-광주기성 발현용 프로모터 | |
JP4300271B2 (ja) | ウニ由来インスレーターを用いた遺伝子発現ベクター | |
KR100952960B1 (ko) | 돼지 β-카제인 게놈 DNA를 이용하여 생리활성물질을생산하기 위한 넉-인 벡터 및 이를 이용하여생리활성물질을 생산하는 방법 | |
CA2574227C (en) | Utilisation of constructs comprising recombination sequence motifs for enhancing gene expression in moss | |
Toku et al. | The primary structure of chicken ribosomal protein L37a | |
EP2288712A1 (en) | Regulation of the expression of a protein in a mammalian cell | |
Class et al. | Patent application title: Regulation of translation of expressed genes Inventors: Raymond Michael Dimphena Verhaert (Breda, NL) Pieter Victor Schut (Leiden, NL) Sharief Barends (Voorschoten, NL) Maurice Wilhelmus Van Der Heijden (Gouda, NL) Assignees: R1 B3 Holdings BV | |
Lee et al. | Molecular and functional characterization of monocot-specific Pex5p splicing variants, using OsPex5pL and OsPex5pS from rice (Oryza sativa) | |
JP2009537151A (ja) | ヒトoct−2変異体ペプチド鎖、核酸、および方法 |