ES2912291T3 - Elementos potenciadores de CPMV modificados - Google Patents

Elementos potenciadores de CPMV modificados Download PDF

Info

Publication number
ES2912291T3
ES2912291T3 ES15769248T ES15769248T ES2912291T3 ES 2912291 T3 ES2912291 T3 ES 2912291T3 ES 15769248 T ES15769248 T ES 15769248T ES 15769248 T ES15769248 T ES 15769248T ES 2912291 T3 ES2912291 T3 ES 2912291T3
Authority
ES
Spain
Prior art keywords
sequence
plant
cpmv
seq
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15769248T
Other languages
English (en)
Inventor
Marc-Andre D'aoust
Pierre-Olivier Lavoie
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Medicago Inc
Original Assignee
Medicago Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CA2014/050326 external-priority patent/WO2014153674A1/en
Application filed by Medicago Inc filed Critical Medicago Inc
Application granted granted Critical
Publication of ES2912291T3 publication Critical patent/ES2912291T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/11Orthomyxoviridae, e.g. influenza virus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pulmonology (AREA)
  • Communicable Diseases (AREA)
  • Cell Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Physiology (AREA)
  • Botany (AREA)

Abstract

Un potenciador de la expresión que comprende, en serie, una primera secuencia que comprende una secuencia de nucleótidos 5'UTR de CPMV que comprende los nucleótidos 1-160 de la SEQ ID No.: 1, o que comprende una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de identidad de secuencia con los nucleótidos 1-160 de la SEQ ID No.: 1, una segunda secuencia que comprende de 10 a 351 nucleótidos de los nucleótidos 161-509 de la SEQ ID NO:1 o los nucleótidos 161-511 de la SEQ ID NO:56, y una o más secuencias Kozak unidas al extremo 3' de la segunda secuencia, la una o más secuencias Kozak se seleccionan del grupo que consiste en: caA(A/C)a, aaA(A/C)a, aa(A/G)(A/C)a, AGAAA, AGACA, AGGAA, AAAAA, AAACA, AAGCA, AAGAA, AAAGAA y AAAGAA, y activo en una planta.

Description

DESCRIPCIÓN
Elementos potenciadores de CPMV modificados
Campo de la invención
La presente invención se refiere a los potenciadores de expresión en particular para las proteínas de interés en plantas. La presente invención también proporciona sistemas de expresión en plantas y métodos para la producción de proteínas de interés en plantas.
Antecedentes de la invención
Las plantas ofrecen un gran potencial como sistemas de producción de proteínas recombinantes. Un enfoque para producir proteínas extrañas en plantas es generar líneas de plantas transgénicas estables. Sin embargo, este es un proceso que requiere mucho tiempo y trabajo. Una alternativa a las plantas transgénicas es el uso de vectores de expresión basados en virus vegetales. Los vectores basados en virus vegetales permiten la expresión rápida, de alto nivel y transitoria de proteínas en las plantas.
Un método para lograr la expresión transitoria de alto nivel de proteínas extrañas en plantas implica el uso de vectores basados en virus vegetales de ARN, lo que incluye los comovirus, tales como el virus del mosaico del caupí (CPMV; véase, por ejemplo, los documentos WO2007/135480; WO2009/087391; US 2010/0287670, Sainsbury F. y otros, 2008, Plant Physiology; 148: 121-1218; Sainsbury F. y otros, 2008, Plant Biotechnology Journal; 6: 82-92; Sainsbury F. y otros, 2009, Plant Biotechnology Journal; 7: 682-693; Sainsbury F. y otros 2009, Methods in Molecular Biology, Recombinant Proteins From Plants, volumen 483: 25-39).
Los comovirus son virus de ARN con un genoma bipartito. Los segmentos del genoma del ARN comoviral se denominan como ARN-1 y ARN-2. El ARN-1 codifica las proteínas VPg, replicasa y proteasa. El virus requiere la replicasa para la replicación del genoma viral. El ARN-2 del comovirus virus del mosaico del caupí (CPMV) produce una poliproteína de 105 kDa o 95 kDa procesada en 4 péptidos funcionales.
La región 5' del ARN-2 del CPMV comprende codones de inicio (AUG) en las posiciones 115, 161, 512 y 524. Los codones de inicio en las posiciones 161 y 512 están en el mismo marco de lectura del triplete. La iniciación en el codón de inicio en la posición 161 da como resultado la síntesis de la poliproteína de 105 K mientras que la iniciación en el codón de inicio en la posición 512 dirige la síntesis de la poliproteína de 95 K. La iniciación de la traducción en el codón de inicio en la posición 512 en el CPMV es más eficiente que la iniciación en la posición 161, lo que da como resultado la producción de más poliproteína de 95 K que poliproteína de 105 K. El codón de inicio en la posición 115 no es esencial para la replicación del virus (Wellink y otros, 1993 Biochimie. 75(8): 741-7).
Se requiere el mantenimiento del marco entre los sitios de iniciación en las posiciones 161 y 512 en el ARN-2 del CPMV para la replicación eficiente del ARN-2 por la replicasa codificada por el ARN-1 (Holness y otros, 1989; Virology 172, 311- 320; van Bokhoven y otros 1993, Virology 195, 377-386; Rohll y otros, 1993 Virology 193, 672-679; Wellink y otros, 1993, Biochimie. 75(8): 741-7). Este requisito afecta la longitud de las secuencias que pueden insertarse aguas arriba del codón de inicio 512 en formas replicativas de vectores de expresión del ARN-2 del CPMV. Además, el uso de polienlazadores debe usarse con precaución ya que pueden desplazar el marco abierto de lectura (ORF) entre estos sitios de iniciación.
El CPMV ha servido como base para el desarrollo de sistemas de vectores adecuados para la producción de polipéptidos heterólogos en plantas (Liu y otros, 2005 Vaccine 23, 1788-1792; Sainsbury y otros, 2007 Virus Expression Vectors (Hefferon, K. editor), páginas 339-555). Estos sistemas se basan en la modificación del ARN-2, pero difieren en si se usan versiones de longitud completa o con eliminaciones. La replicación del ARN-2 modificado se logra mediante la inoculación conjunta con ARN-1. Las proteínas extrañas están fusionadas al extremo C-terminal de las poliproteínas derivadas del ARN-2. La liberación del polipéptido N-terminal está mediada por la acción de la secuencia del péptido catalítico 2A del virus de la fiebre aftosa (Gopinathy otros, 2000, Virology 267: 159-173). Las moléculas de ARN-2 resultantes son capaces de propagarse tanto dentro como entre plantas. Esta estrategia se ha usado para expresar una serie de proteínas recombinantes, tales como el antígeno central de la hepatitis B (HBcAg) y las proteínas inmunitarias pequeñas (SIP), en plantas de caupí (Mechtcheriakova y otros J. Virol. Methods 131, 10­ 15; 2006; Monger y otros, 2006, Plant Biotechnol. J. 4, 623-631; Alamillo y otros, 2006, Biotechnol. J. 1, 1103-1111). Aunque tiene éxito, el uso de un vector viral de longitud completa limita el tamaño de las secuencias insertadas, y el movimiento entre plantas genera preocupaciones sobre la biocontención del virus.
Para abordar el problema de la biocontención y el tamaño del inserto, Canizares y otros (2006 Plant Biotechnol, J 4: 183-193) reemplazaron la mayor parte de la región codificante del ARN-2 con una secuencia de interés para producir una versión inhabilitada del ARN-2 del CPMV (deIARN-2). La secuencia a expresar se fusionó al AUG en la posición 512 del ARN-2, inmediatamente aguas arriba de la región 3' no traducida (UTR) para crear una molécula que imita al ARN-2. Tales constructos fueron capaces de replicarse cuando se introdujeron en plantas en presencia del ARN-1 y un supresor del silenciamiento, y dirigieron la síntesis de niveles sustanciales de proteínas heterólogas (Sainsbury y otros, 2008 Plant Biotechnol J 6:82-92).
La mutación del codón de inicio en la posición 161 en un vector de ARN-2 del CPMV (U162C; HT) aumenta los niveles de expresión de una proteína codificada por una secuencia insertada después del codón de inicio en la posición 512. Esto permite la producción de altos niveles de proteínas extrañas sin necesidad de la replicación viral y se denominó el sistema CPMV-HT (documento (WO2009/087391; Sainsbury y Lomonossoff, 2008, Plant Physiol. 148, 1212-1218). En los plásmidos de expresión pEAQ (Sainsbury y otros, 2009, Plant Biotechnology Journal, 7, páginas 682-693; documento US 2010/0287670), la secuencia a expresar se coloca entre la UTR 5' y la UTR 3'. La UTR 5' en la serie pEAQ porta la mutación U162C (HT).
Resumen de la invención
La presente invención se refiere a los potenciadores de expresión en particular para la expresión de proteínas de interés en plantas. La presente invención también proporciona sistemas de expresión en plantas y métodos para la producción de proteínas de interés en plantas. La invención es como se define en las reivindicaciones adjuntas.
Como se describe en la presente descripción, se proporciona un potenciador de la expresión que comprende en serie, una secuencia de nucleótidos 5'UTR de CPMV que comprende los nucleótidos 1-160 de SEQ ID NO: 1, o que comprende una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de similitud de secuencia con SEQ ID NO: 1, y un fragmento de relleno, comprendiendo el fragmento de relleno una secuencia de nucleótidos que codifica una proteína M incompleta, una o más secuencias kozak activas en una planta, o ambas. El fragmento de relleno puede comprender una longitud de 10 a aproximadamente 500 nucleótidos, o cualquier longitud intermedia. La proteína M incompleta del fragmento de relleno puede comprender una longitud de aproximadamente 10 a aproximadamente 351 nucleótidos, o cualquier longitud intermedia. El fragmento de relleno puede comprender además un sitio de clonaje múltiple. El sitio de clonaje múltiple comprende una longitud de aproximadamente 0 a aproximadamente 100 nucleótidos, o cualquier longitud intermedia.
También se proporciona el potenciador de la expresión como se definió anteriormente, en donde la secuencia kozak se selecciona del grupo de secuencias como las que se muestra en las SEQ ID NO: 5-17.
También se proporciona un sistema de expresión vegetal que comprende una secuencia de ácido nucleico que comprende una región reguladora, unida operativamente con un potenciador de la expresión que comprende en serie, una secuencia de nucleótidos 5'UTR de CPMV que comprende los nucleótidos 1-160 de SEQ ID NO: 1, o que comprende un nucleótido secuencia que comprende de aproximadamente 80 % a 100 % de similitud de secuencia con SEQ ID NO: 1, y un fragmento de relleno, comprendiendo el fragmento de relleno una secuencia de nucleótidos que codifica una proteína M incompleta y una o más secuencias kozak de plantas, el potenciador de la expresión unido operativamente con un secuencia de nucleótidos de interés. El sistema de expresión en plantas puede comprender además una 3'UTRde comovirus. El sistema de expresión en plantas puede comprender además una segunda secuencia de ácido nucleico que codifica un supresor del silenciamiento, por ejemplo, HcPro o p19.
La secuencia de nucleótidos de interés del sistema de expresión en plantas como se definió anteriormente puede codificar una proteína viral o un anticuerpo. Por ejemplo, la proteína viral puede seleccionarse del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 y hemaglutinina de influenza tipo B. La secuencia de nucleótidos que codifica la proteína viral o el anticuerpo puede comprender una secuencia del péptido señal nativo, o un péptido señal no nativo, por ejemplo, el péptido señal no nativo puede obtenerse a partir de la proteína disulfuro isomerasa (PDI).
Como se describe en la presente descripción, se proporciona un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir en la planta o en la porción de una planta el sistema de expresión en plantas como se definió anteriormente, e incubar la planta o la porción de una planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.
También se describe en la presente descripción una planta o porción de una planta transfectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas como se describió anteriormente.
Los sistemas de expresión basados en plantas preferentemente tienen una serie de propiedades tales como, por ejemplo, que contienen sitios de clonaje convenientes para genes de interés, pueden infectar plantas fácilmente de una manera rentable, pueden provocar una infección local o sistémica eficiente de las plantas inoculadas. Además, la infección debería proporcionar un buen rendimiento de material proteico útil.
Este resumen de la invención no describe necesariamente todas las características de la invención.
Breve descripción de los dibujos
Estas y otras características de la invención serán más evidentes a partir de la siguiente descripción en la que se hace referencia a los dibujos adjuntos en donde:
La Figura 1A muestra un esquema general de un ejemplo de una secuencia potenciadora del estado de la técnica (CPMV HT) y como se describe en la presente descripción (CPMV HT+) fusionada a una secuencia de nucleótidos de interés. No todos los elementos mostrados en esta figura pueden ser necesarios dentro de la secuencia potenciadora. Pueden incluirse elementos adicionales en el extremo 3' de la secuencia de nucleótidos de interés (no mostrada) que incluyen una secuencia que codifica una región no traducida 3' (UTR) de comovirus, una 3' UTR de plastocianina, o una combinación de la 3' UTR de comovirus y la 3' UTR de plastocianina. La Figura 1B muestra constructos que comprenden secuencias potenciadoras, como se describe en el estado de la técnica (CPMV HT) y como se describe en la presente invención (CPMV HT+), unidas operativamente a la región reguladora de la planta (en estos ejemplos no limitativos 2X35S) en sus extremos 5', y en sus extremos 3', un fragmento de relleno, una secuencia de nucleótidos de interés, "GOI" que comprende un sitio de iniciación ATG. En estos ejemplos, el fragmento de relleno para CPMV HT comprende una proteína M incompleta y un sitio de clonaje múltiple, y en el ejemplo para CPMV HT+, el fragmento de relleno comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas.
La Figura 2 muestra el título relativo de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior), y constructos de expresión basados en CPMV HT+, unidos operativamente con una secuencia de nucleótidos de interés. Se muestran datos para la expresión de HA a partir de H1 A/California/07/2009 con un péptido señal PDI (constructo número 484: CMPV HT; y constructo número 1805: CPMV HT+, véase el Ejemplo 4), H3 A/Victoria/361/2011 con un péptido señal PDI (constructo número 1391: CMPV HT; y constructo número 1819: CPMV HT+, véase los Ejemplos 1 y 2, respectivamente), B Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI (constructo número 1039: CMPV HT; y constructo número 1829: CPMV HT+; véase el Ejemplo 8), B Brisbane/60/08 H1TM, con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009, y con un péptido señal PDI (constructo número 1067: CMPV HT; y constructo número 1875: CPMV HT+; véase el Ejemplo 9), B Massachusetts/2/20122012 con bucle proteolítico eliminado y con un péptido señal PDI (constructo número 2072: CMPV HT; y constructo número 2052: CPMV HT+; véase el Ejemplo 10), B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con un péptido señal PDI (constructo número 2074: CMPV HT; y constructo número 2062: CPMV HT+; véase el Ejemplo 11), B Wisconsin/1/2010 con bucle proteolítico eliminado y con el péptido señal nativo (constructo número 1445: CMPV HT; y constructo número 1839: CMPV HT+; véase el Ejemplo 12), y B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con el péptido señal nativo (constructo número 1454: CMPV HT; y constructo número 1860: CPMV HT+; véase el Ejemplo 13).
La Figura 3 muestra los títulos relativos de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior) y constructos de expresión basados en CPMV HT+. Se muestran datos para la expresión de H5 de Influenza A/Indonesia/5/2005 con un péptido señal PDI (H5 Indo; constructo número 409: CPMV HT; y constructo número 2319: CPMV HT+; véase el Ejemplo 5), H7 de Influenza A/Hangzhou /1/2013 con una isomerasa de disulfuro de proteína de alfalfa (H7 Han; constructo número 2140: CPMV HT; y constructo número 2142: CPMV HT+; véase el ejemplo 6), H7 de Influenza A/Hangzhou/1/2013 fusionado con el dominio transmembrana y cola citoplasmática (TMCT) de H5 de influenza A/Indonesia/5/2005 y con el péptido señal de la disulfuro isomerasa de la proteína de alfalfa (H7Han+H5Tm; constructo número 2130: CPMV HT; número de constructo 2146: CPMV HT+; véase ejemplo 7).
La Figura 4A muestra ejemplos de variantes ensayadas de secuencias kozak de plantas. Los constructos muestran una secuencia parcial de CPMV HT+, una región reguladora de plantas, un 5'UTR, un fragmento de relleno y una secuencia de nucleótidos de interés (GOI). En este ejemplo no limitante, el constructo comprende una región reguladora 2X35S, CPMV HT+ que comprende un fragmento de relleno que comprende una proteína M incompleta y un sitio de clonaje múltiple (sitios de restricción), una secuencia kozak (también se indica el extremo 5' de una secuencia de nucleótidos de interés: "ATG... GOI"; en donde el GOI es H3 A/Victoria/361). Las variantes de las secuencias kozak de plantas también se muestran más abajo de la secuencia (ver también la Figura 7). Cada variante de secuencia Kozak de plantas se fusionó al extremo 3' del fragmento de relleno y al sitio 5'-ATG de la secuencia de nucleótidos de interés (en estos ejemplos no limitantes, H3 A/Victoria/361). Los otros elementos de los constructos permanecieron iguales. La Figura 4B muestra los títulos de HA de una secuencia de nucleótidos de interés producida en plantas que comprende el constructo de expresión CPMV HT+ y una variante de secuencias Kozak de plantas como se indica.
La Figura 5 muestra los componentes de secuencia usados para preparar el constructo número 1391(A-2X35S CPMV-HT PDISP H3Victoria NOS; véase el Ejemplo 1). El constructo número 1391 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPv con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/H3 Victoria)). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La Figura 5A muestra la secuencia del cebador IF-PDI.S1=3c (SEQ ID NO: 18). La Figura 5B muestra la secuencia del cebador IF-H3V36111.s1-4r (SEQ ID NO: 19). La Figura 5C muestra la secuencia de PDISP/H3 Victoria (SEQ ID NO: 20). La Figura 5D muestra una representación esquemática del constructo 1191. La Figura 5E muestra el constructo 1191; desde el borde izquierdo al derecho de ADN-t de (subrayado), 2X35S CPMV-HT NOS, con casete de expresión de inhibidor de silenciamiento Plastocianina-P19-Plastocianina; SEQ ID NO: 21). La Figura 5F muestra el casete de expresión número 1391 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada; la UTR 5' del CPMV en negrita; la proteína M incompleta en cursiva (SEQ ID NO: 22). La Figura 5G muestra la secuencia de aminoácidos de PDISP/H3 Victoria (SEQ ID NO: 23). La Figura 5H muestra una representación esquemática del constructo número 1391 (un constructo de referencia).
La Figura 6 muestra los componentes de secuencia usados para preparar el constructo número 1819 (2X35S CPMV-HT+ PDISP H3Victoria NOS; véase el Ejemplo 1). El constructo número 1819 incorpora una secuencia de CPMV-HT+ (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a un fragmento de relleno que codifica una proteína M incompleta, un sitio de clonaje múltiple, y comprende una secuencia kozak de plantas entre el sitio de clonaje múltiple y la secuencia de nucleótidos de interés (PDISP/H3 Victoria)). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa.
La Figura 6A muestra la secuencia del cebador IF(SacII)-Kozac_PDI.c (SEQ ID NO:24).
La Figura 6B muestra una representación esquemática del constructo 2181. La Figura 6C muestra la secuencia para el constructo 2181 (desde el borde izquierdo al derecho de ADN-t, subrayado; 2X35S/CPMV-HT+/NOS con casete de expresión de inhibidor de silenciamiento Plastocianina-P19-Plastocianina; SEQ ID NO:25). La Figura 6D muestra el casete de expresión número 1819 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada (SEQ ID NO: 26). La Figura 6E muestra una representación esquemática del constructo 1819.
La Figura 7 muestra secuencias que comprenden variaciones en una secuencia kozak de plantas usada para preparar una selección de constructos basados en " CPMV HT+" (números de constructos 1952 a 1959). Se muestra la variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV HT+/NOS, que comprende variaciones en una secuencia kozak de plantas (las secuencias se muestran como variaciones de la secuencia correspondiente a partir del constructo 1819; véase el Ejemplo 2). La variante de secuencia kozak de plantas está subrayada. PDISP: péptido señal de proteína disulfuro isomerasa. La Figura 7A muestra la secuencia de nucleótidos de IF-HT1*-PDI.c (SEQ ID NO: 27; usada para preparar el constructo número 1952). La Figura 7B muestra la secuencia de nucleótidos de IF-HT2*-PDI.c (SEQ ID NO:28; usada para preparar el constructo número 1953). La Figura 7C muestra la secuencia de nucleótidos de IF-HT3*-PDI.c (SEQ ID NO:29; usada para preparar el constructo número 1954). La Figura 7D muestra la secuencia de nucleótidos de IF-HT4*-PDI.c (SEQ ID NO:30; usada para preparar el constructo número 1955). La Figura 7E muestra la secuencia de nucleótidos de IF-HT5*-PDI.c (SEQ ID NO:31; usada para preparar el constructo número 1956). La Figura 7F muestra la secuencia de nucleótidos de IF-HT6*-PDI.c (SEQ ID NO:32; usada para preparar e constructo número 1957). La Figura 7G muestra la secuencia de nucleótidos de IF-HT7*-PDI.c (SEQ ID NO:33; usada para preparar el constructo número 1958). La Figura 7H muestra la secuencia de nucleótidos de IF-HT8*-PDI.c (SEQ ID NO:34; usada para preparar el constructo número 1959). La Figura 7I muestra una representación esquemática del constructo número 1952 que comprende una secuencia kozak de plantas (Kozak1) mediante el uso de la SEQ ID NO: 27 (Figura 7A). Los constructos 1953­ 1959 comprenden las mismas características que el constructo 1952, excepto que cada constructo (1953-1959) comprende una secuencia Kozak de plantas modificada (Kozak1) como se muestra en las Figuras 7B a 7H ( S e Q ID NO: 28 a 34), respectivamente.
La Figura 8 muestra los componentes de secuencia usados para preparar los constructos número 484 y 1805 (2X35S/CPMV HT PDISP/H1 California NOS y 2X35S/CPMV HT+ PDISP/H1 California NOS, respectivamente; véase el Ejemplo 4). El constructo número 484 incorpora una secuencia CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/H1 California). El constructo número 1805 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La Figura 8A muestra la secuencia de nucleótidos de PDISP/H1 California (SEQ ID NO: 35). La Figura 8B muestra la secuencia de aminoácidos de PDISP/H1 California (SEQ ID NO: 36). La Figura 8C muestra una representación esquemática del constructo número 484 (2X35S/CPMV HT; constructo de referencia). La Figura 8D muestra una representación esquemática del constructo número 1805 (2X35S/CPMV HT+).
La Figura 9 muestra los componentes de la secuencia usados para preparar los constructos números 409 y 2319 (2X35S/CPMV HT PDISP/H5 Indonesia NOS; CPMV HT+ PDISP/H5 Indonesia NOS, respectivamente; véase el Ejemplo 5). El constructo número 409 incorpora una secuencia de CPMV-HT la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/H5 Indonesia). El constructo número 2319 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. NOS: terminador de nopalina sintasa. La Figura 9A muestra la secuencia de nucleótidos de PDISP/H5 Indonesia (SEQ ID NO: 37). La Figura 9B muestra la secuencia de aminoácidos de PDISP/H5 Indonesia (SEQ ID NO: 38). La Figura 9C muestra una representación esquemática del constructo número 409 (2X35S/CPMV HT; constructo de referencia). La Figura 9D muestra una representación esquemática del constructo número 2319 (2X35S/CPMV HT+).
La Figura 10 muestra los componentes de secuencia usados para preparar los constructos números 2140 y 2142 (2X35S/CPMV HT H7 Hangzhou NOS; CPMV HT+ H7 Hangzhou NOS, respectivamente; véase el Ejemplo 6). El constructo número 2140 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou). El constructo número 2142 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. NOS: terminador de nopalina sintasa. La Figura 10A muestra la secuencia de nucleótidos de Hangzhou H7 nativa (SEQ ID NO: 39). La Figura 10B muestra la secuencia de aminoácidos de Hangzhou H7 nativa (SEQ ID NO: 40). La Figura 10C muestra una representación esquemática del constructo número 2140 (2X35S/CPMV HT; constructo de referencia). La Figura 10D muestra una representación esquemática del constructo número 2142 (2X35S/CPMV HT+).
La Figura 11 muestra los componentes de secuencia usados para preparar los constructos números 2130 y 2146 (2X35S/CPMV HT H7 Hangzhou+H5 Indonesia TMCT NOS; CPMV HT+ H7 Hangzhou+H5 Indonesia TMCT NOS, respectivamente; véase el Ejemplo 7). El constructo número 2130 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou+H5 Indonesia TMCT). El constructo número 2146 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. NOS: terminador de nopalina sintasa. La Figura 11A muestra la secuencia de nucleótidos de H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 41). La Figura 11B muestra la secuencia de aminoácidos de H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 42). La Figura 11C muestra una representación esquemática del constructo número 2130 (2X35S/CPMV HT; constructo de referencia). La Figura 11D muestra una representación esquemática del constructo número 2146 (2X35S/CPMV HT+).
La Figura 12 muestra los componentes de secuencia usados para preparar los constructos números 1039 y 1829 (2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS y 2X35S/CPMV HT+ PDISP/HA B Brisbane (PrL-) NOS, respectivamente; véase el Ejemplo 8). El constructo número 1039 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)). EL constructo número 1829 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia Kozak de planta y es un ejemplo de un constructo basado en CPMV HT+. PDISP: péptido señal de la proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La Figura 12A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-) ( S e Q ID NO: 43). La Figura 12B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-); SEQ ID NO: 44). La Figura 12C muestra una representación esquemática del constructo número 1039 (2X35S/CPMV HT; constructo de referencia). La Figura 12D muestra una representación esquemática del constructo número 1829 (2X35S/CPMV HT+).
La Figura 13 muestra los componentes de secuencia usados para preparar los constructos números 1067 y 1875 (2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS y 2X35S/CPMV HT+ PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS, respectivamente; véase el Ejemplo 9). El constructo número 1067 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)+H1 California TMCT). El constructo número 1875 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia Kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La Figura 13A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (SEQ ID NO: 45). La Figura 13B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (SEQ ID NO: 46). La Figura 13C muestra una representación esquemática del constructo número 1067 (2X35S/CPMV HT; constructo de referencia). La Figura 13D muestra una representación esquemática del constructo número 1875 (2X35S/CPMV160+).
La Figura 14 muestra los componentes de secuencia usados para preparar los constructos números 2072 y 2052 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS y 2X35S/CPMV HT+ PDISP/HA B Massachusetts (PrL-) NOS, respectivamente; véase el Ejemplo 10). El constructo número 2072 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)). El constructo número 2052 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. PDISP: péptido señal de la proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La Figura 14A muestra la secuencia de nucleótidos de PDISP/HA B Massachusetts (PrL-) (SEQ ID NO: 47). La Figura 14B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-) (SEQ ID NO: 48). La Figura 14C muestra una representación esquemática del constructo número 2072 (2X35S/CPMV HT; constructo de referencia). La Figura 14D muestra una representación esquemática del constructo número 2052 (2X35S/CPMV HT+).
La Figura 15 muestra los componentes de secuencia usados para preparar los constructos números 2074 y 2062 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS y 2X35S/CPMV HT+ PDISP/HA B Massachusetts (PrL-)+H1 California TMCT N o s , respectivamente; véase el Ejemplo 11). El constructo número 2074 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT). El constructo número 2062 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. PDISP: péptido señal de la proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La Figura 15A muestra la secuencia de nucleótidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SEQ ID NO: 49). La Figura 15B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SEQ ID NO: 50). La Figura 15C muestra una representación esquemática del constructo número 2074 (2X35S/CPMV HT; constructo de referencia). La Figura 15D muestra una representación esquemática del constructo número 2062 (2X35S/CPMV HT+).
La Figura 16 muestra los componentes de secuencia usados para preparar los constructos números 1445 y 1839 (2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, y 2X35S/CPMV HT+ HA B Wisconsin (PrL-) NOS, respectivamente; véase el Ejemplo 12). El constructo número 1445 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés (HA B Wisconsin (PrL-)). EL constructo número 1839 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia Kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. PrL-: bucle proteolítico eliminado; NOS: terminador de nopalina sintasa. La Figura 16A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-) (SEQ ID NO: 51). La Figura 16B muestra la secuencia de aminoácidos de HA B Wisconsin (PrL-) (SEQ ID NO: 52). La Figura 16C muestra una representación esquemática del constructo número 1445 (2X35S/CPMV HT; constructo de referencia).
La Figura 16D muestra una representación esquemática del constructo número 1839 (2X35S/CPMV HT+).
La Figura 17 muestra los componentes de secuencia usados para preparar los constructos números 1454 y 1860 (2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS y 2X35S/CPMV HT+ HA B Wisconsin (PrL-)+H1 California TMCT NOS, respectivamente; véase el Ejemplo 13). El constructo número 1454 incorpora una secuencia de CPMV-HT de la técnica anterior (5'UTR de C m P v con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la 5'UTR y la secuencia de nucleótidos de interés ( H a B Wisconsin (PrL-)+H1 California TMCT). El constructo número 1860 incluye una 5'UTR de CPMV que comprende 160 nucleótidos, un fragmento de relleno que comprende una proteína M incompleta, un sitio de clonaje múltiple y una secuencia kozak de plantas y es un ejemplo de un constructo basado en CPMV HT+. NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La Figura 17A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-)+H1 California TMCT (SEQ ID NO: 53). La Figura 17B muestra la secuencia de aminoácidos de PDISP/HA B Wisconsin (PrL-)+H1 California TMCT (SEQ ID NO: 54). La Figura 17C muestra una representación esquemática del constructo número 1454 (2X35S/CPMV HT; constructo de referencia). La Figura 17D muestra una representación esquemática del constructo número 1893 (2X35S/CPMV HT+).
Descripción detallada
La presente invención se refiere a potenciadores de la expresión en particular para la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y sistemas de expresión de plantas para la producción de proteínas de interés en plantas.
En la descripción que sigue, se usan ampliamente varios términos, se proporcionan las siguientes definiciones para facilitar la comprensión de diversos aspectos de la invención. El uso de ejemplos en la memoria descriptiva, que incluye ejemplos de términos, tiene únicamente propósitos ilustrativos y no pretende limitar el alcance y el significado de las modalidades invención de la presente descripción.
Como se usa en la presente, el uso de la palabra "un" o "una" cuando se usa en la presente descripción junto con el término "que comprende" pueden significar "uno", pero también es coherente con el significado de "uno o más", "al menos uno" y "uno o más de uno". El término "aproximadamente" se refiere a una variación de aproximadamente /-10 % de un valor dado. El término "pluralidad" significa más de uno, por ejemplo, dos o más, tres o más, cuatro o más, y similares.
La presente invención proporciona ácidos nucleicos, potenciadores de la expresión y sistemas de expresión para producir proteínas de interés en plantas, que comprenden una región no traducida (UTR) 5' de comovirus y una secuencia de relleno modificada, alargada o truncada. También se proporcionan células vegetales, tejidos vegetales, plantas enteras, inóculos, ácidos nucleicos, constructos que comprenden secuencias de interés y métodos para expresar una proteína de interés en plantas.
Un ejemplo de un potenciador de la expresión de la presente invención incluye, pero sin limitarse a, CPMV HT+, como se muestra en la Figura 1A. Se proporciona un ejemplo no limitante de la secuencia de nucleótidos de CPMV HT+ con referencia a las SEQ ID NO: 1, 3 y 4.
El potenciador de la expresión CPMV HT+, puede unirse operativamente en el extremo 5' de la secuencia potenciadora con una región reguladora que es activa en una planta, y unirse operativamente a una secuencia de nucleótidos de interés en el extremo 3' del potenciador de la expresión (Figura 1A), para conducir la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.
También se proporcionan sistemas de expresión para producir una o más proteínas de interés en una planta mediante el uso de CMPV HT. Los sistemas de expresión descritos en la presente descripción comprenden un casete de expresión que comprende CPMV HT+, o una secuencia que comprende del 80 % al 100 %, o cualquier cantidad intermedia, de similitud de secuencia con CPMV HT+. El casete de expresión que comprende CMPV HT+, puede comprender además una región reguladora que está activa en una planta que está unida operativamente al extremo 5' del potenciador de la expresión. Una secuencia de nucleótidos de interés puede unirse operativamente al extremo 3' del casete de expresión de modo que cuando se introduce dentro de una planta, se logra la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.
Con referencia a las Figuras 1A y 1B, se muestran potenciadores de la expresión que comprenden una secuencia 5'UTR de un genoma de comovirus (comovirus 5'UTR) junto con una proteína M modificada. En las Figuras 1A y 1B, se muestra un potenciador CPMV HT de la técnica anterior que comprende una proteína M incompleta (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; documento WO 2009/087391) junto con el CPMV HT+ de la presente invención.
El potenciador de la expresión de HT de CPMV de la técnica anterior (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; documento WO 2009/087391) comprende los nucleótidos 1-160 de la UTR 5' de CPMV con un a Tg modificado en la posición 115 (ATG se modifica a CGT), fusionado con una proteína M incompleta que comprende los nucleótidos 161-509 de la SEQ ID NO: 2, la proteína M incompleta que consiste en un ATG modificado en la posición 162 (ATG se modifica a ACG), y una secuencia enlazadora (véase la SEQ ID NO:2). Un nucleótido de interés se fusiona con el extremo 3' de la secuencia enlazadora (véanse las Figuras 1A y 1B). El CPMV HT de la técnica anterior carece de una secuencia kozak de plantas inmediatamente aguas arriba de la ubicación en la que el nucleótido de interés se fusiona con el potenciador de la expresión.
El CPMV HT+ de la presente invención puede comprender los nucleótidos 1-160 de la 5' UTR de CPMV con un ATG modificado en la posición 115-117 (en donde ATG se modifica a GTG; A en la posición 115 se modifica a G), fusionado a una secuencia de relleno que se modifica y comprende: un ATG modificado (ATG se modifica a ACG en las posiciones 161-163; con "T" modificada a "C" en la posición 162), una proteína M incompleta, una secuencia enlazadora y una secuencia kozak de plantas. Los ejemplos no limitantes de una secuencia de nucleótidos CPMV HT+ se muestran en la SEQ ID NO: 1 y 4. Un nucleótido de interés puede fusionarse con el extremo 3' de la secuencia kozak, por ejemplo, una secuencia kozak de plantas, de CPMV HT+ (véanse las Figuras 1A y 1B).
La 5'UTR del potenciador de la expresión de la presente invención también puede incluir una "A" en la posición 115 e incluir la secuencia ATG nativa en los nucleótidos 115-117 como se muestra en la SEQ ID NO: 4, fusionada a una secuencia de relleno que está modificada y comprende: un ATG modificado en los nucleótidos 161-163, a ACG (en donde "T" en la posición 162 se modifica a "C") una proteína M incompleta, una secuencia enlazadora y una secuencia kozak de plantas. Un potenciador de la expresión que comprende un "A" nativo o de tipo salvaje en la posición 115 puede denominarse CPMV HT+ [WT115]. Un ejemplo no limitante de una secuencia de nucleótidos CPMV HT+ [WT115] se muestra en la SEQ ID NO: 3. Un nucleótido de interés puede fusionarse con el extremo 3' de la secuencia kozak de la planta de CPMV HT+[WT115] (véanse las Figuras 1A y 1B). La secuencia CPMV HT+ [WT115] puede considerarse una variante de CPMV HT+, ya que CPMV HT+ comprende el nucleótido "G" en la posición 115 (SEQ ID NO: 1). Además, CPMV HT+ [511] también puede considerarse una variante de CPMV HT+, ya que CPMV HT+ [511] incluye los nucleótidos 161-511 de la proteína M incompleta (véase la SEQ ID NO:56). De esta manera, el término "Cp Mv h T+" es un término genérico que incluye variantes como CPMV HT+ [WT115] y CPMV HT+ [511].
Los ejemplos no limitantes de un potenciador de la expresión de CPMV HT+ se presentan en las SEQ ID NO: 1, 3 y 4, sin embargo, debe entenderse que pueden realizarse variaciones o modificaciones en la secuencia de relleno de CPMV HT+ y CPMV HT+ [WT115] sin apartarse de la presente invención, siempre que el fragmento de relleno comprenda una proteína M incompleta, y cuando se fusione con una secuencia de nucleótidos de interés, una secuencia kozak activa en una planta, por ejemplo, una secuencia kozak de plantas, se coloque en el extremo 5' de la secuencia de nucleótidos de interés. Otro ejemplo de un potenciador de la expresión de CPMV HT+ (que comprende una secuencia kozak nativa de proteína M) se proporciona en la SEQ ID NO: 56 (CPMV HT+ [511]).
La secuencia de relleno puede modificarse mediante inserción, truncamiento o eliminación, de modo que la secuencia de proteína M incompleta sea más larga, truncada o acortada en comparación con la secuencia de proteína M incompleta inicial (no modificada) del potenciador CPMV HT de la técnica anterior (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; documento WO 2009/087391). Además de la proteína M incompleta, la secuencia de relleno del potenciador de la expresión CPMV HT+ puede comprender además uno o más sitios de restricción (un polienlazador, un sitio de clonaje múltiple, uno o más sitios de clonaje), una o más secuencias kozak de plantas o una secuencia kozak nativa de proteína M, una o más secuencias enlazadoras, uno o más sitios de recombinación o una combinación de los mismos. Por ejemplo, lo que no debe considerarse limitante, una secuencia de relleno puede comprender en serie, una proteína M incompleta (nucleótidos 161-509 de las SEQ ID NO: 1 o 2, o nucleótido 161-511 de la SEQ ID NO: 56), un sitio de clonaje múltiple de una longitud deseada fusionado con una secuencia kozak activa en una planta, por ejemplo, una secuencia kozak de planta.
La secuencia de nucleótidos de interés puede fusionarse (unirse operativamente) a la secuencia potenciadora de CPMV HT+ (o CPMV HT+ [WT115], o CPMV HT+ [511]) de la presente invención mediante el uso de una variedad de enfoques. Por ejemplo, que no deben considerarse limitantes:
a) Una secuencia de nucleótidos de interés, por ejemplo, un ácido nucleico que codifica una proteína de interés, puede fusionarse con el potenciador de la expresión CPMV HT+ inmediatamente después del fragmento de relleno que consiste en una secuencia de proteína M incompleta (con o sin un sitio de clonaje múltiple). En este caso, la secuencia de nucleótidos de interés se fusiona con el extremo 3' de la secuencia de proteína M incompleta (o el sitio de clonaje múltiple si está presente), y la secuencia de nucleótidos de interés incluye en su extremo 5', una secuencia kozak de plantas inmediatamente aguas arriba del sitio de iniciación a Tg de la secuencia de nucleótidos de interés.
b) La secuencia de nucleótidos de interés puede fusionarse con el potenciador de la expresión que comprende un fragmento de relleno (que incluye una proteína M incompleta, un sitio de clonaje múltiple opcional y una secuencia kozak de plantas), inmediatamente después de la secuencia kozak de plantas ubicada en el extremo 3' del fragmento de relleno. En este caso, la secuencia de nucleótidos de interés no incluiría un sitio de clonaje múltiple correspondiente o una secuencia kozak de plantas.
c) La secuencia de nucleótidos de interés puede fusionarse con el potenciador de la expresión CPMV HT+ mediante el uso del sitio de clonaje múltiple. En este caso, la secuencia de nucleótidos de interés puede incluir en su extremo 5' un sitio de clonaje correspondiente para permitir la fusión con el potenciador de la expresión y una secuencia kozak de plantas inmediatamente aguas arriba del sitio de iniciación ATG de la secuencia de nucleótidos de interés.
El resultado general mediante el uso de cualquiera de los métodos anteriores es un constructo, o un casete de expresión, que comprende una región reguladora de la planta en asociación operativa (conectada operativamente) con una secuencia 5'UTR, la secuencia 5'UTR se fusiona con el extremo 5' de un fragmento de relleno que comprende una proteína M incompleta fusionada con una secuencia kozak de plantas, el extremo 3' de la secuencia kozak de plantas fusionado con el extremo 5' de la secuencia de nucleótidos de interés. El constructo puede comprender además una secuencia que comprende una región no traducida (UTR) 3' de comovirus, por ejemplo, una 3'UTRde plastocianina u otra 3'UTRque es activa dentro de una planta, y una secuencia terminadora, por ejemplo, un terminador NOS, unido operativamente al extremo 3' de la secuencia de nucleótidos de interés (véase Figura 1A).
Un sistema de expresión en plantas que comprende una primera secuencia de ácido nucleico que comprende una región reguladora, unida operativamente con uno o más de un potenciador de la expresión como se describe en la presente descripción (por ejemplo, CPMV HT+, CPMV HT+[WT115], CPMV HT+ [511]), y también se proporciona la secuencia de nucleótidos de interés. Además, se describe un ácido nucleico que comprende una secuencia promotora (región reguladora), un potenciador de la expresión (por ejemplo, CPMV HT+, CPMV HT+[WT115] o CPMV H t [511]) que comprende una 5'UTR de comovirus y una secuencia de relleno con una secuencia kozak de plantas fusionada con una o más secuencias de ácido nucleico que codifican una o más proteínas de interés. El ácido nucleico puede comprender además una secuencia que comprende una región no traducida (UTR) 3' de comovirus, por ejemplo, una 3'UTRde plastocianina u otra 3'UTRactiva en una planta, y una secuencia terminadora, por ejemplo, una terminación NOS, operativamente unido al extremo 3' de la secuencia de nucleótidos de interés (véase Figura 1A), de manera que la secuencia de nucleótidos de interés se inserta aguas arriba de la región no traducida (UTR) 3' del comovirus, la plastocianina 3'UTR u otra secuencia 3'UTR.
Por "unida operativamente" se entiende que las secuencias particulares interactúan ya sea directa o indirectamente para llevar a cabo una función prevista, tal como la mediación o la modulación de la expresión de una secuencia de ácido nucleico. La interacción de secuencias unidas operativamente puede, por ejemplo, mediarse por proteínas que interactúan con las secuencias unidas operativamente.
"Potenciador(es) de la expresión", "secuencia(s) potenciadora(s)" o "elemento(s) potenciador(es)", tal como se hace referencia en la presente descripción, incluyen secuencias derivadas de, o que comparten entre aproximadamente el 80 % y el 100 %, o cualquier cantidad intermedia, similitud de secuencia con los nucleótidos 1-160 de la SEQ ID NO: 1. Una secuencia potenciadora puede potenciar la expresión de un marco abierto de lectura (ORF) heterólogo aguas abajo al que están unidos.
El término "5'UTR" o "región no traducida 5'" o "secuencia líder 5'" se refiere a regiones de un ARNm que no están traducidas. La 5'UTR generalmente comienza en el sitio de inicio de la transcripción y termina justo antes del sitio de inicio de la traducción o el codón de inicio (generalmente AUG en un ARNm, ATG en una secuencia de ADN) de la región codificante. La 5'UTR puede modificarse en longitud, o mediante la mutación de un codón de inicio natural o un sitio de iniciación de la traducción de manera que el codón ya no funcione como codón de inicio y la traducción puede iniciarse en un sitio de iniciación alternativo. Por ejemplo, el ATG que comienza en las posiciones 115, 161, 512, 524 0 una combinación de los mismos, del 5'UTR de CPMV nativo puede modificarse para eliminar la secuencia ATG, por ejemplo, a ACG, GTG o CGT u otra secuencia no ATG.
Por "proteína M incompleta" se entiende una secuencia codificante de proteína M que comprende de aproximadamente 10 a aproximadamente 351 nucleótidos, o cualquier cantidad intermedia, de los nucleótidos 161­ 509 de la SEQ ID NO: 1, o los nucleótidos 161-511 de la SEQ ID NO: 56. Los nucleótidos 161-509 de la SEQ ID NO: 1, o nucleótidos 161-511 de la SEQ ID NO: 56, corresponden a la secuencia de la proteína M presente en la secuencia del genoma del ARN 2 del CPMV nativo (véase la SEQ ID NO: 55 en la presente descripción; también véase la Tabla 1 del documento WO 2009/087391) con una modificación (sustitución) de uno o más de los nucleótidos en las posiciones 161-163 para eliminar el sitio de inicio "atg". Los ejemplos no limitantes de una secuencia de proteína M incompleta incluyen, una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de similitud de secuencia, o cualquier cantidad intermedia, con la secuencia definida por los nucleótidos 161 a 509 de las SEQ ID NO: 1-4, los nucleótidos 161 -511 de la SEQ ID NO:55, o los nucleótidos 161-511 de la SEQ ID NO:56. La secuencia puede modificarse para eliminar un codón de inicio o un sitio de inicio de manera que la secuencia no comprenda el codón "atg". Además, los ejemplos no limitantes de una proteína M incompleta comprenden los nucleótidos 161 a 509 de las SEQ ID NO: 1-4, los nucleótidos 161-511 de la SEQ ID NO: 55 o los nucleótidos 161-511 de la SEQ ID NO: 56. Los ejemplos no limitantes de una secuencia que comprende modificaciones a la secuencia nativa de ARN 2 de CPMV (SEQ ID NO: 55) para su uso como se describe en la presente descripción incluyen CPMV HT+, (SEQ ID NO: 1) y CPMV HT+ [511] (SEQ ID NO: 56).
La SEQ ID NO: 55 comprende un segmento de la secuencia nativa (de tipo salvaje) del genoma de ARN 2 de CPMV de los nucleótidos 1-514 (la secuencia completa del segmento genómico de ARN-2 de CMPV nativo se presenta en la Tabla 1 del documento WO 2009/087391). La secuencia 5'UTR de los nucleótidos 1-511 de la S e Q ID NO: 55 comprende secuencias "atg" de tipo salvaje que comienzan en las posiciones 115 y 161 (cursivas en negrita), y una proteína M incompleta subrayada, de los nucleótidos 161 - 511 (el " atg" en la posición 512 también se muestra para el contexto; la iniciación en "atg" en la posición 512 de la región 5' nativa del ARN-2 de CPMV da como resultado la síntesis de una poliproteína de 95K):
Figure imgf000011_0001
La 5'UTR de los nucleótidos 1-160 de la secuencia de ARN-2 de CPMV (véase la SEQ ID NO: 1), comienza en el sitio de inicio de la transcripción hasta el primer codón de inicio del marco (en la posición 161), que sirve como sitio de iniciación para la producción de la más larga de las dos proteínas coterminales carboxi codificadas por un segmento del genoma de comovirus de tipo salvaje (la más corta de las dos proteínas codificadas comienza en la posición 155). Además, un “tercer” sitio de iniciación en (o correspondiente a) la posición 115 en la secuencia genómica de ARN-2 del CPMV también puede estar mutado, eliminado o alterado de otra manera. Se ha demostrado que la eliminación de AUG 115 además de la eliminación de AUG en la posición 161 mejora la expresión de una secuencia de nucleótidos de interés cuando se combina con una proteína M incompleta (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212 -1218; documento WO 2009/087391).
El potenciador de la expresión puede comprender los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4, los nucleótidos 1-511 de la SEQ ID NO: 55 o los nucleótidos 1-511 de la SEQ ID NO: 56, e incluye una región CPMV 5' no traducida (UTR) fusionada a un fragmento de relleno que comprende una proteína M incompleta y una secuencia kozak de plantas en el extremo 3' del fragmento de relleno y, opcionalmente, un sitio de clonaje múltiple, o una secuencia que comprende del 80 % al 100 %, o cualquier cantidad entre ellos, similitud de secuencia con los nucleótidos 1-160 de la SEQ ID NO: 1, los nucleótidos 161-509 de la SEQ ID NO: 1, los nucleótidos 1-509 de la SEQ ID NO: 1, los nucleótidos 1-511 de la SEQ ID NO: 55, o los nucleótidos 1-511 de la SEQ ID NO: 56, e incluye un fragmento de relleno que comprende una proteína M incompleta, y además incluye una secuencia kozak que es activa en una planta, ya sea una secuencia kozak de planta o una secuencia kozak nativa de la proteína M, en el extremo 3 'del fragmento de relleno y, opcionalmente, un sitio de clonaje múltiple, y exhibe la propiedad de mejorar la expresión de un nucleótido se secuencia que codifica un marco abierto de lectura heterólogo que está unido operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora "CPMV HT" de la técnica anterior (SEQ ID NO:2; Sainsbury F. y Lomonossoff GP, 2008, Plant Physiol. 148: págs. 1212-1218).
La secuencia de relleno puede incluir de aproximadamente 50 a 351 nucleótidos, o cualquier cantidad entre ellos, de una proteína M incompleta, por ejemplo, pero sin limitarse a, los nucleótidos 161-509 de la SEQ ID NO: 1 o los nucleótidos 161-511 de las s Eq ID NO: 55 o 56, una secuencia kozak de planta, o una secuencia kozak de la proteína M nativa, ubicada en el extremo 3' del fragmento de relleno, y un sitio de clonaje múltiple (MCS) de aproximadamente 0 a 100 nucleótidos de longitud, o cualquier cantidad entre ellos ubicado entre la secuencia que codifica la proteína M incompleta y la secuencia kozak, por ejemplo, una secuencia kozak de plantas. Por lo tanto, la secuencia de relleno puede tener una longitud de aproximadamente 50 a aproximadamente 500 nucleótidos, o cualquier cantidad intermedia, fusionada con el extremo 3' de la secuencia 5'UTR de CPMV, por ejemplo, la secuencia de relleno puede tener una longitud de 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500 nucleótidos, o cualquier cantidad entre ellos, fusionada con el extremo 3' de la secuencia 5'UTR de CPMV.
El potenciador de la expresión puede comprender además uno o más "sitio(s) de restricción" o "sitio(s) de reconocimiento de restricción", "sitio(s) de clonaje múltiple", "MCS", "sitio(s) de clonaje", "secuencia polienlazadora" o "enlazador poliviníli
sitios de restricción son motivos de secuencia específicos que se reconocen por enzimas de restricción como se conoce bien en la técnica. El potenciador de la expresión puede comprender uno o más sitios de restricción o sitios de clonación que se encuentran aguas abajo (3') de la proteína M incompleta. El uno o más sitios de restricción o sitios de clonaje pueden ubicarse cadena arriba (5') de una o más secuencias kozak, y ubicarse entre una proteína M incompleta y una secuencia kozak. La secuencia polienlazadora (sitio de clonaje múltiple) puede comprender cualquier secuencia de ácidos nucleicos que sea útil para añadir y eliminar secuencias de ácidos nucleicos, incluida una secuencia de nucleótidos que codifica una proteína de interés, al extremo 3' de la 5'UTR. Una secuencia polienlazadora puede comprender de 4 a aproximadamente 100 ácidos nucleicos, o cualquier cantidad entre ellos.
El potenciador de la expresión de CPMV HT+ (incluidos CPMV HT+ [WT115]; CPMV HT+ [511]), definido por la secuencia de las SEQ ID NO: 1,3, 4 o 56, son ejemplos que no deben considerarse limitantes de potenciadores de la expresión de la presente invención. También se incluyen en la presente invención casetes de expresión o vectores que comprenden CPMV HT+, CPMV HT+ [WT115] o CPMV HT+ [511], tal como se define en las SEQ ID NO: 1, 3, 4 o 56 y que además incluyen una región reguladora de plantas en asociación operativa con la expresión la secuencia potenciadora y una secuencia de nucleótidos de interés (GOI; con un 3'UTR y secuencias terminadoras) fusionadas al extremo 3' del potenciador de la expresión. También se incluyen en la presente invención variantes del potenciador de la expresión CPMV HT+ tal como se define en las SEQ DI NO: 1,3, 4 o 56.
Si la secuencia potenciadora comprende una secuencia 5'UTR de CPMV, una proteína M incompleta y una secuencia kozak activa en una planta, por ejemplo, una secuencia kozak de plantas, en el extremo 3' de la secuencia potenciadora, entonces la secuencia potenciadora puede denominarse una "secuencia potenciadora CPMV HT+", siempre que la secuencia potenciadora CPMV HT+ presente la propiedad de potenciar la expresión de una secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo que está ligado operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo ligado operativamente a la secuencia potenciadora "CPMV HT" de la técnica anterior (SEQ ID NO:2; Sainsbury F. y Lomonossoff GP, 2008, Plant Physiol. 148: págs. 1212-1218;).
Las variaciones que pueden existir en CPMV HT+ pueden incluir:
a) modificaciones en la longitud de la proteína M incompleta de aproximadamente 50 a aproximadamente 351 nucleótidos o cualquier cantidad intermedia;
b) modificación en el sitio de clonaje múltiple (MCS), tanto las secuencias incluidas como la longitud del MCS, de aproximadamente 0 a aproximadamente 100 nucleótidos de longitud, o cualquier longitud intermedia; y c) la secuencia kozak puede ser cualquier secuencia kozak que sea activa en una planta e incluir una secuencia kozak de planta, o una secuencia kozak nativa de la proteína M.
Por ejemplo, la UTR 5' de CPMV comprende los nucleótidos 1 a 160 de las SEQ ID NO: 1 o 3, o de aproximadamente 80 % a aproximadamente 100 %, o cualquier cantidad intermedia, similitud de secuencia con los nucleótidos 1-160 de las SEQ ID NO: 1 o 3.
La SEQ ID NO: 1 es un ejemplo de un potenciador de la expresión que comprende CPMV HT+ (nucleótido 1-160, 5'UTR, incluido ATG modificado en las posiciones 115 (GTG) minúsculas, negrita y cursiva; fragmento de relleno que comprende: una proteína M incompleta subrayada, los nucleótidos 161 - 509, con nucleótido modificado en 162 (ACG); un sitio de clonación múltiple, cursiva, nucleótidos 510-528; y una secuencia kozak en plantas, mayúsculas y negrita, nucleótidos 529-534):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgragc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgrttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggAGAAAA
(SEQ IDNO:1)
Los constructos 1819, 1805, 2319, 2142, 2146, 1829, 1875, 2052, 2062, 1839 y 1860 (véanse los Ejemplos 1 y 4-13, respectivamente) son representativos de los constructos que comprenden un potenciador de la expresión CPMV HT+ que comprende la SEQ ID NO:1. Los resultados que usan estos constructos pueden encontrarse en las Figuras 2 y 3.
La SEQ ID NO: 2 comprende un potenciador de la expresión "CPMV HT" como se conoce en la técnica anterior (por ejemplo, la Figura 1 de Sainsbury y Lomonossoff 2008, Plant Physiol. 148: págs. 1212-1218). La CPMV HT incluye la secuencia 5'UTR de los nucleótidos 1-160 de la SEQ ID NO: 2 con nucleótidos modificados en la posición 115 (cgt), y una proteína M incompleta con un nucleótido modificado en la posición 162 (acg), y carece de una secuencia kozak en plantas (5'UTR: nucleótidos 1-160; proteína M incompleta subrayada, nucleótidos 161 - 509). La SEQ ID NO: 2 también incluye un sitio de clonaje múltiple (cursiva, nucleótidos 510-517) que no está presente en la secuencia CPMV HT de la técnica anterior como se describe en Sainsbury y Lomonossoff 2008:
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgrttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttgt cgggccc SEQ ID NO: 2
Los constructos que comprenden CPMV HT se usan en la presente descripción como construcciones de referencia, de manera que los niveles de expresión de una secuencia de nucleótidos de interés, o un producto codificado por la secuencia de nucleótidos de interés producido mediante el uso de un constructo que comprende CPMV HT+, CPMV HT+ [WT115] o CPMV HT+ [511], pueden compararse. Los constructos 1391,484,409, 2140, 2130, 1039, 1067, 2072, 2074, 1445 y 1454 (véanse los Ejemplos 1 y 4-13, respectivamente) son representativos del constructo de referencia CPMV HT y comprenden la SEQ ID NO:2. Los resultados que usan estas constructos pueden encontrarse en las Figuras 2 y 3.
La secuencia kozak de plantas de CPMV HT+ como se describe en la presente descripción, puede ser cualquier secuencia kozak de plantas, incluida, pero sin limitarse a, una de las secuencias de SEQ ID NO: 5-17 (consulte también la Figura 4, CPMV HT+ con kozak de plantas; las constructos de La Figura 4 incluye los nucleótidos 1-528 de SEQ ID NO: 1, uno de varios ejemplos de una secuencia kozak de plantas, e incluye una región reguladora de plantas y el sitio de iniciación de la transcripción ATG de una secuencia de nucleótidos de interés: GOI).
El potenciador de la expresión puede comprender además una o más "secuencia consenso kozak" o "secuencia kozak". La secuencia kozak puede incluir cualquier secuencia kozak que sea activa en una planta, por ejemplo, una secuencia kozak de plantas (por ejemplo, C p M v HT+; CPMV HT WT115), o una secuencia kozak presente en la proteína M nativa (por ejemplo, C p M v H t 511). Las secuencias kozak juegan un papel importante en la iniciación de la traducción. La tasa de traducción puede optimizarse asegurándose de que cualquier secuencia de inestabilidad de ARNm se elimine del constructo del transgén y, de acuerdo a como sea necesario, que el sitio de inicio de la traducción o el sitio de iniciación coincidan con el consenso kozak para plantas (Gutierrrez, R.A. y otros, 1999, Trends Plant Sci.
4, 429-438; Kawaguchi, R. y Bailey-Serres, J., 2002, Curr. Opin. Plant Biol. 5, 460-465). La posición más altamente conservada en este motivo es la purina (que es más a menudo una A) tres nucleótidos aguas arriba del codón ATG, lo que indica el inicio de la traducción (Kozak, M., 1987, J. Mol. Biol. 20:947-950). La secuencia kozak puede incluir una secuencia nativa presente dentro de la proteína M incompleta. Por ejemplo, la secuencia inmediatamente aguas arriba del nucleótido 512 de la proteína M incompleta como se muestra en las SEQ ID NO: 55 o 56, por ejemplo, los nucleótidos 508-511 de la SEQ ID NO: 55.
Las secuencias consenso kozak en plantas se conocen en la técnica (véase, por ejemplo, Rangan y otros, Mol. Biotechnol., 2008, julio 39(3), págs. 207-213). Tanto las secuencias kozak sintéticas como las naturales pueden usarse en el potenciador de la expresión o pueden fusionarse a la secuencia de nucleótidos de interés como se describe en la presente descripción.
La secuencia kozak de plantas puede ser cualquier secuencia kozak conocida de plantas (véase, por ejemplo, L. Rangan y otros, Mol. Biotechnol.2008), incluidas, pero sin limitarse a, las siguientes secuencias consenso en plantas:
caA(A/C)a
aaA(A/C)a
aa (A/G) (A/C) a
La secuencia kozak de plantas también puede seleccionarse del grupo de (véase la Figura 4):
AGAAA AGACA AGGAA AAAAA AAACA AAGCA AAGAA AAAGAA AAAGAA
( A / - ) A {A/G} ( A/ G) ( A / C ) A. (S ecu en cia consenso}
Se proporciona CPMV HT+ con una secuencia kozak consenso de plantas en la SEQ ID NO:16 (nucleótidos 1-160, 5'u Tr , incluido ATG modificado en las posiciones 115 (GTG) en minúscula, negrita y cursiva; fragmento de relleno que comprende: una proteína M incompleta subrayada, los nucleótidos 161-509, con un nucleótido modificado en 162 (ACG); un sitio de clonaje múltiple, cursiva, los nucleótidos 510-528; y una secuencia consenso kozak de plantas, mayúsculas y negrita, los nucleótidos 529-534).
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc
61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgrtgragc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc
181 gaaatcaaag atctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcgg (A/-)A(A/G)
(A/G) (A/C)A (SEQ IDNO:4)
La SEQ ID NO:56 ("CPMV HT+ [511]") comprende un segmento de la secuencia nativa del genoma de ARN 2 de CPMV de los nucleótidos 1-154. La secuencia 5'UTR de los nucleótidos 1-511 de la SEQ ID NO:56 comprende las secuencias "atg" modificadas en las posiciones 115 ("g" en lugar de "a"; cursiva en negrita) y 162 ("c" en lugar de "t "; cursiva en negrita), y una proteína M incompleta (subrayada) de los nucleótidos 161 - 511. La CPMV HT+ 511 comprende una secuencia kozak consenso de la proteína M nativa (nucleótidos 508-511; negrita):
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgrtgragc 121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgrttttctt tcactgaagc
181 gaaatcaaagatctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
Figure imgf000015_0001
481 taagcttctg tatattctgc ccaaatttga a... SEQ ID NO: 56
Los constructos 1952 - 1959 son ejemplos de potenciadores de la expresión de CPMV HT+ que comprenden la SEQ ID NO: 1 con secuencias kozak variantes de plantas (véase Ejemplo 3 y
Figuras 4 y 7).
Otro ejemplo no limitativo de una secuencia potenciadora de CPMV HT+ lo proporciona la secuencia de SEQ ID NO:3 (CPMV HT+[WT115]). Los casetes o vectores de expresión que comprenden CPMV HT+ e incluyen una región reguladora de la planta en asociación operativa con la secuencia potenciadora de la expresión de la SEQ ID NO: 3, y el sitio de inicio de la transcripción (ATG) en el extremo 3' fusionado con una secuencia de nucleótidos de interés (GOI) también forman parte de la presente invención.
La SEQ ID NO: 3 (CPMV HT+[WT115]) comprende los nucleótidos 1-160, 5'UTR, con un ATG en la posición 115-117, minúsculas en negrita, un fragmento de relleno que comprende: una proteína M incompleta subrayada, los nucleótidos 161 - 509, con un ATG modificado en la posición 161-163 (acg) en negrita minúscula y subrayado, un sitio de clonaje múltiple, cursiva, los nucleótidos 510-528; y una secuencia kozak de plantas, mayúsculas y negrita, los nucleótidos 529-534.
1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc 61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc
121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca acgrttttctt tcactgaagc
181 gaaatcaaagatctctttgt ggacacgtag tgcggcgcca ttaaataacg tgtacttgtc
241 ctattcttgt cggtgtggtc ttgggaaaag aaagcttgct ggaggctgct gttcagcccc
301 atacattact tgttacgatt ctgctgactt tcggcgggtg caatatctct acttctgctt
361 gacgaggtat tgttgcctgt acttctttct tcttcttctt gctgattggt tctataagaa
421 atctagtatt ttctttgaaa cagagttttc ccgtggtttt cgaacttgga gaaagattgt
481 taagcttctg tatattctgc ccaaatttgt tcgggcccaa taccgcggAGAAAA
(SEQ ID NO:3)
La secuencia kozak de plantas de la SEQ ID NO: 3 puede ser cualquier secuencia kozak de plantas, incluida, pero sin limitarse a, una de las secuencias de las SEQ ID NO: 5-17 (véase también la Figura 4, CPMV HT+ con kozak de plantas; los constructos de la Figura 4 incluyen los nucleótidos 1-528 de la SEQ ID NO: 1, uno de varios ejemplos de una secuencia kozak de plantas, e incluye una región reguladora de plantas y el sitio de iniciación de la transcripción ATG de una secuencia de nucleótidos de interés: GOI).
El potenciador de la expresión de CPMV HT+ puede tener al menos un 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % y 80 % de identidad con la secuencia definida por los nucleótidos 1-160 de las SEQ ID NO. : 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO: 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4. Por ejemplo, la secuencia potenciadora puede tener desde aproximadamente el 80 % hasta aproximadamente el 100 %, o cualquier cantidad intermedia, identidad con la secuencia definida por los nucleótidos 1-160 de las SEQ ID NO: 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO. : 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4, o desde aproximadamente el 90 % hasta aproximadamente el 100 %, o cualquier cantidad intermedia, identidad con la secuencia definida por los nucleótidos 1-160 de las SEQ ID NO: 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO: 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4, o aproximadamente 95 % a aproximadamente 100 %, o cualquier cantidad entre ellos, identidad con la secuencia definida por los nucleótidos 1-160 de las SEQ ID NO: 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO: 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4, o cualquier cantidad intermedia, en el que el potenciador de la expresión, cuando se une operativamente a una región reguladora de la planta y a una secuencia kozak de la planta como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que se une operativamente al potenciador de la expresión cuando se compara con el nivel de expresión de la secuencia de nucleótidos de interés fusionada con CPMV HT (SEQ ID NO: 2) mediante el uso de la misma región reguladora de la planta.
Los términos "por ciento de similitud" o "por ciento de identidad" cuando se refieren a una secuencia particular se usan, por ejemplo, como se expone en el programa de software GCG de la Universidad de Wisconsin, o mediante alineamiento manual e inspección visual (véase, por ejemplo, Current Protocols in Molecular Biology, Ausubel y otros, editores. Suplemento de 1995). Los métodos de alineamiento de secuencias para la comparación se conocen bien en la técnica. Puede realizarse un alineamiento óptimo de secuencias para la comparación, mediante el uso de, por ejemplo, el algoritmo de Smith y Waterman, (1981, Adv. Appl. Math. 2:482), mediante el algoritmo de alineamiento de Needleman & Wunsch, (1970, J. Mol. Biol. 48:443), mediante el método de búsqueda de similitud de Pearson y Lipman, (1988, Proc. Nat'l. Acad. Sci. USA 85: 2444), mediante implementaciones computarizadas de estos algoritmos (por ejemplo: GAP, BESTFIT, FASTA y TFASTA en el paquete de software de Wisconsin Genetics, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).
Un ejemplo de un algoritmo adecuado para determinar el por ciento de identidad de secuencia y similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul y otros, (1977, Nuc. Acids Res. 25:3389-3402) y Altschul y otros (1990, J. Mol. Biol. 215:403-410), respectivamente Se usan b La ST y BLAST 2.0, con los parámetros descritos en la presente descripción, para determinar el porcentaje de identidad de secuencia para los ácidos nucleicos y las proteínas de la invención. Por ejemplo, el programa BLASTN (para secuencias de nucleótidos) puede usar como valores predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=-4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP puede usar por defecto una longitud de palabra de 3 y una expectativa (E) de 10, y la matriz de puntuación BLOSUM62 (ver Henikoff & Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89:10 915) alineaciones (B) de 50, expectativa (E) de 10, M=5, N=-4 y una comparación de ambas cadenas. El software para realizar el análisis BLAST está disponible públicamente a través del National Center for Biotechnology Information (ver la URL: ncbi.nlm.nih.gov/).
Como se muestra en las Figuras 2-4, el uso de los potenciadores de la expresión como se describe en la presente descripción generalmente resultó en un aumento de la expresión de la secuencia de nucleótidos de interés, en comparación con la expresión de la misma secuencia de nucleótidos de interés mediante el uso del mismo promotor, 3' UTR y secuencias terminadoras, y ligadas operativamente a un potenciador de la expresión de la técnica anterior. Por ejemplo, con referencia a las Figuras 2 y 3, se muestra una comparación de la expresión de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-Ht (técnica anterior) y constructos de expresión basados en CPMV HT+, vinculados operativamente con:
H1 A/California/07/2009 ("PDI-H1 Cal" o "H1 A/California/07/2009"): constructo número 1805 basado en CPMV HT+, constructo número 484 basado en CPMV HT (véase Ejemplo 4);
H3 A/Victoria/361/2011 ("PDI-H3 Vic", o "H3 A/Victoria/361/2011"): constructo número 1819 basado en CPMV HT+; constructo número 1391 basado en CPMV HT (véase Ejemplos 1 y 2, respectivamente);
B/Wisconsin/1/2010 con bucle proteolítico eliminado y con un péptido señal nativo ("WtSp-B Wis-PrL" o "B/Wisconsin/1/2010"): constructo número 1831 basado en CPMV Ht ; constructo número 1445 basado en CPMV HT (véase el Ejemplo 12);
B Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI ("B Brisbane/60/08"): constructo número 1829 basado en CPMV HT+; constructo número 1039 basado en CPMV HT (véase el Ejemplo 8); B Brisbane/60/08+H1Tm, con bucle proteolítico eliminado fusionado con el dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Brisbane/60/08+H1Tm"): constructo número 1875 basado en CPMV HT+; constructo número 1067 basado en CPMV HT (véase el Ejemplo 9);
B Massachusetts/2/2012 2012 con bucle proteolítico eliminado y con un péptido señal PDI ("B Massachusetts/2/20122012"): constructo número 2052 basado en CPMV HT+; constructo número 2072 basado en CPMV HT (véase el Ejemplo 10);
B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado fusionado con el dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Massachusetts/2/2012+H1Tm"): constructo número 2062 basado en CPMV h T+; constructo número 2074 basado en CPMV HT (véase el Ejemplo 11);
B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado fusionado con el dominio transmembrana y la cola citoplasmática y con el péptido señal nativo ("B Wisconsin/1/2010+H1Tm"): constructo número 1860 basado en CPMV HT+; constructo número 1454 basado en CPMV HT (véase el Ejemplo 13);
La H5 de Influenza A/Indonesia/5/2005 (PDI H5 Indo) con un péptido señal de PDI: constructo número 2319 basado en CPMV HT+; constructo número 409 basado en CPMV HT (véase el Ejemplo 5);
La H7 de Influenza A/Hangzhou/1/2013 en la que el péptido señal nativo se reemplazó por el de disulfuro isomerasa de proteína de alfalfa (H7 Han): constructo número 2142 basado en CPMV HT+; constructo número 2140 basado en CPMV HT (véase el Ejemplo 6).
La H7 de Influenza A/Hangzhou/1/2013 fusionado con el dominio transmembrana y cola citoplasmática (TMCT) de la H5 de influenza A/Indonesia/5/2005 y con el péptido señal de isomerización de disulfuro de proteína de alfalfa (H7 Han+H5Tm): constructo número 2146 basado en CPMV HT+; constructo número 2130 basado en CPMV HT (véase el Ejemplo 7).
En general, la expresión (determinada como la actividad de hemaglutinación) aumenta en el constructo basado en CPMV HT+ en comparación con el constructo basado en CPMV HT de la técnica anterior.
Además, varias de las secuencias de nucleótidos de interés codifican proteínas quiméricas o modificadas, por ejemplo, que comprenden péptidos señal heterólogos (por ejemplo, PDI), secuencias de cola citoplasmática del dominio transmembrana heterólogo (TDCT) y/o secuencias modificadas que incluyen un bucle proteolítico eliminado (PrL-), y aún se observó un aumento en la actividad.
El aumento en la expresión observado mediante el uso de los constructos basados en CPMV HT+ también se observa si la secuencia kozak de plantas usada en los constructos anteriores basados en CPMV HT+ se reemplaza con otras secuencias kozak de plantas, por ejemplo, una de esas secuencias kozak de plantas definidas en la SEQ ID NO: 8­ 16. Por ejemplo, con referencia a la Figura 4, se muestra una comparación de la expresión de proteínas producidas en plantas que comprenden constructos de expresión basados en CPMV HT+, unidos operativamente con una secuencia de nucleótidos de interés (H3 A/Victoria/361), cada uno fusionado a varias secuencias kozak de plantas. En cada caso, la expresión (determinada como título de hemaglutinación) del constructo basado en CPMv HT+ demuestra niveles de expresión significativos y superiores a los del constructo basado en CPMV HT de la técnica anterior.
Una secuencia de nucleótidos de interés que codifica una proteína requiere la presencia de un "sitio de iniciación de la traducción" o "sitio de iniciación" o "sitio de inicio de la traducción" o "sitio de inicio" o "codón de inicio" ubicado aguas arriba del gen que va a expresarse. Dichos sitios de iniciación pueden proporcionarse ya sea como parte de una secuencia potenciadora o como parte de una secuencia de nucleótidos que codifica la proteína de interés.
El "casete de expresión" se refiere a una secuencia de nucleótidos que comprende un ácido nucleico de interés bajo el control de, y unido operablemente (u operativamente) a, un promotor apropiado u otros elementos reguladores para la transcripción del ácido nucleico de interés en una célula huésped.
Por "bucle proteolítico" o "sitio de escisión" se entiende la secuencia consenso del sitio proteolítico que está implicada en la escisión del precursor HA0. "Consenso" o "secuencia consenso", como se usa en la presente, significa una secuencia (secuencia de aminoácidos o de nucleótidos) que comprende la variabilidad de secuencia de las secuencias relacionadas basado en el análisis de alineamiento de secuencias múltiples, por ejemplo, subtipos de una secuencia particular de HA0 de la influenza. La secuencia consenso del sitio de escisión de HA0 de la influenza puede incluir secuencias de aminoácidos de hemaglutinina consenso de influenza A, que incluyen, por ejemplo, secuencias de aminoácidos de hemaglutinina consenso de H1, consenso de H3, consenso de h 5 o consenso de influenza B, por ejemplo, pero sin limitarse a, B Florida, B Malaysia, B Wisconsin y B Massachusetts. Los ejemplos no limitantes de secuencias de la región del bucle proteolítico se muestran en las Figuras 15 y 18B de la solicitud provisional de los Estados Unidos núm. 61/806,227 (presentada el 28 de marzo de 2013; véase también Bianchi y otros, 2005, Journal of Virology, 79: 7380-7388).
Los residuos en el bucle proteolítico o en el sitio de escisión pueden estar mutados, por ejemplo, pero no limitados a, mutación puntual, sustitución, inserción o eliminación. El término "mutación de aminoácidos" o "modificación de aminoácidos" como se usa en la presente pretende abarcar sustituciones, deleciones, inserciones y modificaciones de aminoácidos. Puede realizarse cualquier combinación de sustitución, deleción, inserción y modificación como se describe en la solicitud provisional de los Estados Unidos núm. 61/806,227 (presentada el 28 de marzo de 2013) para llegar al constructo final, siempre y cuando el constructo final posea las características deseadas, por ejemplo, la escisión reducida o abolida del bucle proteolítico o el sitio de escisión por una proteasa.
Como se describe en la presente descripción, se proporciona un constructo de ácido nucleico (sistema de expresión) que comprende una secuencia potenciadora de la expresión unida operativamente a una secuencia de nucleótidos de interés que codifica una proteína de interés. También se proporcionan sistemas de expresión en plantas que comprenden una secuencia potenciadora como se describe en la presente descripción. También se proporciona un sistema de expresión en plantas que comprende una región reguladora de plantas, en asociación operativa con una secuencia potenciadora que está unida operativamente a una secuencia de nucleótidos de interés, en donde la secuencia de nucleótidos de interés codifica una proteína de interés. La secuencia potenciadora puede seleccionarse de las SEQ ID NO: 1 o 3 o una secuencia de nucleótidos que muestra una identidad del 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % con los nucleótidos 1-160 de las SEQ ID NO: 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO: 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de la planta y una secuencia kozak de la planta como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que se une operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada con el CPMV HT (SEQ ID NO: 2; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol.
148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.
El potenciador de la expresión de la presente invención puede usarse para expresar una proteína de interés en un organismo huésped, por ejemplo, una planta. En este caso, la proteína de interés también puede ser heteróloga para el organismo huésped en cuestión e introducirse en las células vegetales mediante el uso de técnicas de transformación conocidas en la técnica. Un gen heterólogo en un organismo puede reemplazar un gen endógeno equivalente, es decir, uno que normalmente realiza la misma función o una función similar, o la secuencia insertada puede ser adicional al gen endógeno u otra secuencia.
También se describe un casete de expresión que comprende en serie un promotor o una región reguladora de la planta, unido operativamente a una secuencia potenciadora de la expresión como se describe en la presente descripción que está fusionada con una secuencia de nucleótidos de interés y una secuencia 3'UTR y una secuencia terminadora. La secuencia potenciadora puede definirse, por ejemplo, pero sin limitarse a, cualquiera de las SEQ ID NO: 1, 3 y 4 o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % o 80 % de identidad con los nucleótidos 1-160 de las Se Q ID NO: 1, 3 o 4, los nucleótidos 161-509 de las SEQ ID NO: 1, 3 o 4, o los nucleótidos 1-509 de las SEQ ID NO: 1, 3 o 4. El potenciador de la expresión o la secuencia de nucleótidos de interés pueden comprender una secuencia kozak de plantas.
Como apreciaría un experto en la técnica, la secuencia de terminación (terminadora) puede ser cualquier secuencia que está activa en la planta huésped, por ejemplo, la secuencia de terminación puede derivarse del segmento del genoma del ARN-2 de un virus de ARN bipartito, por ejemplo, un comovirus, o la secuencia de terminación puede ser un terminador NOS.
Los constructos pueden comprender además una región no traducida (UTR) 3'. Una región no traducida 3' contiene una señal de poliadenilación y cualquier otra señal reguladora capaz de efectuar el procesamiento del ARNm o la expresión génica. La señal de poliadenilación se caracteriza generalmente por efectuar la adición de colas de ácido poliadenílico al extremo 3' del precursor de ARNm. Las señales de poliadenilación se reconocen comúnmente por la presencia de homología con la forma canónica 5' AATAAA-3', aunque las variaciones no son infrecuentes. Ejemplos no limitantes de regiones 3' adecuadas son las regiones no traducidas transcritas en 3' que contienen una señal de poliadenilación de genes de plásmido inductor de tumores (Ti) de Agrobacterium, tales como la nopalina sintasa (gen Nos) y genes vegetales tales como los genes de la proteína de almacenamiento de la soja, la subunidad pequeña del gen de la ribulosa-1,5-bisfosfato carboxilasa (ssRUBISCO; documento US 4,962,028), el promotor usado para regular la expresión de plastocianina (Pwee y Gray 1993). La secuencia de terminación (terminador) puede obtenerse de la 3'UTR del gen de la plastocianina de alfalfa.
Por "secuencia de nucleótidos (o ácido nucleico) de interés", o "región codificante de interés", se entiende cualquier secuencia de nucleótidos, o región codificante (estos términos pueden usarse indistintamente) que se expresará dentro de un organismo huésped, por ejemplo, una planta, para producir una proteína de interés. Dicha secuencia de nucleótidos de interés puede codificar, pero sin limitarse a, proteínas nativas o modificadas, una enzima industrial o una enzima industrial modificada, una proteína agrícola o una proteína agrícola modificada, una proteína auxiliar, un suplemento proteico, una proteína farmacéuticamente activa, un nutracéutico, un producto de valor añadido o un fragmento del mismo para piensos, alimentos o tanto para piensos como para uso alimentario.
La proteína de interés puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal u obtenido de un polipéptido animal o bacteriano. El péptido señal nativo puede corresponder al de la proteína de interés que se expresa, adicionalmente, el péptido señal puede ser de una proteína estructural o hemaglutinina de un virus distinto de la influenza. Los ejemplos no limitantes de un péptido señal que puede usarse es el de la proteína disulfuro isomerasa de alfalfa (PDI SP; nucleótidos 32-103 de número de acceso Z11499) o el péptido señal de patatina (PatA SP; nucleótidos localizados 1738 - 1806 de número de acceso en GenBank A08215). La secuencia de nucleótidos de PatA SP para este número de acceso es:
atggcaaCtaCtaaaactttttt¿v\ttttaitttttatgatattaGCaactaCta
GTTC-^ acatgtgct SEQ ID NO: 57;
la secuencia de aminoácidos del péptido señal patatina A es:
MATTKTFLILFFMILATTSSTCA (SEQ ID NO: 58)
La secuencia de nucleótidos de interés, o la región codificante de interés también puede incluir una secuencia de nucleótidos que codifica una proteína farmacéuticamente activa, por ejemplo factores de crecimiento, reguladores del crecimiento, anticuerpos, antígenos y fragmentos de los mismos, o sus derivados útiles para la inmunización o vacunación y similares. Dichas proteínas incluyen, pero sin limitarse a, una proteína que es un patógeno humano, una proteína viral, por ejemplo, pero sin limitarse a, una o más proteínas del virus sincitial respiratorio (RSV), rotavirus, virus de la influenza, virus de la inmunodeficiencia humana (VIH), virus de la rabia, virus del papiloma humano (VPH), enterovirus 71 (EV71) o interleucinas, por ejemplo, una o más de IL-1 a IL-24, IL-26 e IL-27, citocinas, eritropoyetina (EPO), insulina, G-CSF, GM-CSF, hPG-CSF, M-CSF o sus combinaciones, interferones, por ejemplo, interferón-alfa, interferón-beta, interferón-gamma, factores de coagulación sanguínea, por ejemplo, Factor VIII, Factor IX, o tPA hGH, receptores, agonistas de receptores, anticuerpos, por ejemplo, entre otros, Rituxan, neuropolipéptidos, insulina, vacunas, factores de crecimiento, por ejemplo, entre otros, factor de crecimiento epidérmico, factor de crecimiento de queratinocitos, factor de crecimiento de transformación, reguladores de crecimiento, antígenos, autoantígenos, fragmentos de los mismos o sus combinaciones.
La proteína de interés también puede incluir una hemaglutinina de influenza (HA; véase el documento WO 2009/009876). La HA es una glicoproteína de membrana de tipo I homotrimérica, que generalmente comprende un péptido señal, un dominio HA1 y un dominio HA2 que comprende un sitio de anclaje que abarca la membrana en el extremo C-terminal y una cola citoplasmática pequeña. Las secuencias de nucleótidos que codifican HA se conocen bien y están disponibles (véase, por ejemplo, la Base de Datos BioDefense and Public Health (Influenza Research Database; Squires y otros, 2008 Nucleic Acids Research 36:D497-d 503) en URL: biohealthbase.org/GSearch/home.do?decorator=Influenza; o las bases de datos mantenidas por el Centro Nacional de Información Biotecnológica (ver URL: ncbi.nlm.nih.gov).
Una proteína HA puede ser de una influenza tipo A, una influenza tipo B o es un subtipo de HA de influenza tipo A seleccionada del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16. En algunos aspectos de la invención, la HA puede ser de una influenza tipo A, seleccionada del grupo H1, H2, H3, H5, H6, H7 y H9. Los fragmentos de las HA enumeradas anteriormente también pueden considerarse una proteína de interés. Además, los dominios de un tipo o subtipo de las HA enumeradas anteriormente pueden combinarse para producir HA quiméricas (véase, por ejemplo, el documento WO2009/076778).
Los ejemplos de subtipos que comprenden proteínas HA incluyen A/New Caledonia/20/99 (H1N1), A/Indonesia/5/2006 (H5N1), A/chicken/New York/1995, A/herring gull/DE/677/88 (H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/828189/02, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H11N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/Gurjev/263/82, A/duck/Australia/341/83 (H15N8), A/black-headed gull/Sweden/5/99(H16N3), B/Lee/40, C/Johannesburg/66, A/PuertoRico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands 3/2006 (H1N1), A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/1/57 (H2N2), A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1), A/Teal/HongKong/W312/97 (H6N1), A/Equine/Prague/56 (H7N7), A/HongKong/1073/99 (H9N2)).
La proteína HA puede ser un subtipo H1, H2, H3, H5, H6, H7 o H9. Por ejemplo, la proteína H1 puede ser de la cepa A/New Caledonia/20/99 (H1N1), A/PuertoRico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands 3/2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 también puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/New York/39/2012 (H3N2), o A/Perth/16/2009 (H3N2). La proteína H2 puede ser de la cepa A/Singapore/1/57 (H2N2). La proteína H5 puede ser de la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1), o A/Indonesia/5/2005 La proteína H6 puede ser de la cepa A/Teal/HongKong/W312/97 (H6N1). La proteína H7 puede ser de la cepa A/Equine/Prague/56 (H7N7) strain, o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9), o A/Shanghai/2/2013 (H7N9). En un aspecto de la invención, la proteína H9 es de la cepa A/HongKong/1073/99 (H9N2 ). En un aspecto adicional de la invención, la proteína HA puede provenir de un virus influenza que puede ser un virus tipo B, que incluye un virus similar a B/Malaysia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje de Yamagata) o B/Wisconsin/1/2010 (linaje de Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, H9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, WO 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.
La HA también puede ser una HA quimérica, en donde un dominio transmembrana nativo de HA se reemplaza por un dominio transmembrana heterólogo. El dominio transmembrana de las proteínas HA está muy conservado (véase, por ejemplo, la Figura 1C del documento WO 2010/148511). El dominio transmembrana heterólogo puede obtenerse de cualquier dominio transmembrana HA, por ejemplo, pero sin limitarse al dominio transmembrana de H1 California, B/Florida/4/2006 (número de acceso al GenBank ACA33493.1), B/Malaysia/2506/2004 (número de acceso al GenBank ABU99194.1), H1/Bri (número de acceso al GenBank ADE28750.1), H1 A/Solomon Islands/3/2006 (número de acceso al GenBank ABU99109.1), H1/NC (número de acceso al GenBank AAP34324.1), H2 A/Singapore/1/1957 (número de acceso al GenBank AAA64366.1), H3 A/Brisbane/10/2007 (número de acceso al GenBank ACI26318.1), H3 A/Wisconsin/67/2005 (número de acceso al GenBank ABO37599.1), H5 A/Anhui/1/2005 (número de acceso al GenBank ABD28180.1), H5 A/Vietnam/1194/2004 (número de acceso al GenBank ACR48874.1), H5-Indo (número de acceso al GenBank ABW06108.1). El dominio transmembrana también puede definirse por la siguiente secuencia de aminoácidos consenso:
iLXiYystvAiSslXlXXmlagXsXwmcs (SEQ ID NO:59)
Los ejemplos de constructos que comprenden una HA quimérica con un dominio transmembrana heterólogo incluyen: constructo número 1875 (B Brisbane/60/08 H1TM, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009; véase el Ejemplo 9), constructo número 2074 (B Massachusetts/2/2012+H1Tm, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009; véase el Ejemplo 11), y constructo número 1860 (B Wisconsin/ 1/2010+H1Tm con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009; véase el Ejemplo 13). La actividad de estos HA quiméricos se muestra en la Figura 2.
El potenciador de la expresión como se define en la presente descripción también puede usarse para impulsar la expresión de cualquier secuencia de nucleótidos de interés que codifique una o más de una proteína de interés. Los ejemplos de una proteína incluyen, por ejemplo, pero sin limitarse a, una enzima industrial, por ejemplo, celulasa, xilanasa, proteasa, peroxidasa, subtilisina, un suplemento proteico, un nutracéutico, un producto de valor añadido o un fragmento del mismo para alimentación, comida, o uso tanto para alimento como para comida, una proteína farmacéuticamente activa, por ejemplo, pero sin limitarse a, factores de crecimiento, reguladores de crecimiento, anticuerpos, antígenos y fragmentos de los mismos, o sus derivados útiles para inmunización o vacunación y similares. Las proteínas adicionales de interés pueden incluir, pero sin limitarse a, interleucinas, por ejemplo, una o más de IL-1 a IL-24, IL-26 e IL-27, citocinas, eritropoyetina (EPO), insulina, G- CSF, GM-CSF, hPG-CSF, M-CSF o sus combinaciones, interferones, por ejemplo, interferón-alfa, interferón-beta, interferón-gamma, factores de coagulación de la sangre, por ejemplo, factor VIII, factor IX o tPA hGH, receptores, agonistas de receptores, anticuerpos, neuropolipéptidos, insulina, vacunas, factores de crecimiento, por ejemplo, pero sin limitarse a, factor de crecimiento epidérmico, factor de crecimiento de queratinocitos, factor de crecimiento de transformación, reguladores de crecimiento, antígenos, autoantígenos, fragmentos de los mismos, un anticuerpo, un anticuerpo monoclonal, un anticuerpo monoclonal quimérico, un anticuerpo monoclonal de cadena sencilla, una partícula similar a un virus (VLP), o sus combinaciones,
Si la proteína de interés es una VLP, entonces la VLP puede comprender una forma precursora de HA0, o los dominios HA1 o HA2 retenidos juntos por la forma de puentes disulfuro. Una VLP puede tener un tamaño promedio de aproximadamente 20 nm a 1 pm o cualquier cantidad intermedia, por ejemplo, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 120, 130, 140, 150 160, 170, 180, 190 o 200 nm, o cualquier cantidad intermedia, por ejemplo, 100 nm, y puede incluir una membrana lipídica. La VLP puede estar envuelta o no envuelta, por ejemplo, una proteína de la envoltura viral, una proteína estructural viral, una proteína de la cápside viral o una proteína de la cubierta viral. La VLP puede comprender además uno o más lípidos, fosfolípidos, ácidos nucleicos, membranas o similares.
La HA puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal. Por ejemplo, el péptido señal puede ser un péptido señal de proteína disulfuro isomerasa (PDI). El péptido señal nativo puede corresponder al de la hemaglutinina que se expresa o puede corresponder a una segunda hemaglutinina.
La presente invención también proporciona moléculas de ácido nucleico que comprenden secuencias que codifican una proteína HA. Las moléculas de ácido nucleico pueden comprender además una o más regiones reguladoras unidas operativamente a la secuencia que codifica una proteína HA. Las moléculas de ácido nucleico pueden comprender una secuencia que codifica una H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 o hA de influenza tipo B. Por ejemplo, la proteína HA codificada por la molécula de ácido nucleico puede ser un subtipo H1, H2, H3, H5, H6, H7, H9, una HA de tipo B. La proteína H1 codificada por el ácido nucleico puede ser de la cepa A/New Caledonia/20/99 (H1N1), A/PuertoRico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands 3/2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 codificada por la molécula de ácido nucleico puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/New York/39/2012 (H3N2), o A/Perth/16/2009 (H3N2). La proteína H2 codificada por la molécula de ácido nucleico puede ser de la cepa A/Singapur/1/57 (H2N2). La proteína H5 codificada por la molécula de ácido nucleico puede ser la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1), o A/Indonesia/5/2005. La proteína H6 codificada por la molécula de ácido nucleico puede ser de la cepa A/Teal/HongKong/W312/97 (H6N1). La proteína H7 codificada por la molécula de ácido nucleico puede ser de la cepa A/Equine/Prague/56 (H7N7) strain, o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9), o A/Shanghai/2/2013 (H7N9). Adicionalmente, la proteína H9 codificada por la molécula de ácido nucleico puede ser de la cepa A/Hong Kong/1073/99 (H9N2). La proteína HA codificada por la molécula de ácido nucleico puede ser de un virus de la influenza tipo B, que incluye virus similar a B/Malaysia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje Yamagata) o B/Wisconsin/1/2010 (linaje Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, H9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, WO 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.
Tabla 1: Ejemplos de constructos que se han preparado como se describe en la presente descripción:
Figure imgf000021_0001
Si la secuencia de ácido nucleico de interés codifica un producto que es directa o indirectamente tóxico para la planta, entonces dicha toxicidad puede reducirse al expresar selectivamente la secuencia de nucleótidos de interés dentro de un tejido deseado o en una etapa deseada del desarrollo de la planta.
La región codificante de interés o la secuencia de nucleótidos de interés puede expresarse en cualquier planta huésped adecuada que esté transformada o comprenda las secuencias de nucleótidos, o moléculas de ácido nucleico, o constructos genéticos o vectores de la presente descripción. Los ejemplos de huéspedes adecuados incluyen, pero sin limitarse a, Arabidopsis, cultivos agrícolas que incluyen, por ejemplo, canola, Brassica spp., planta de maíz, Nicotiana spp., (tabaco), por ejemplo, Nicotiana benthamiana, alfalfa, patata, batata (Ipomoea batatus), ginseng, guisante, avena, arroz, soja, trigo, cebada, girasol, algodón, maíz, centeno (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), cártamo (Carthamus tinctorius).
Los términos "biomasa" y "materia vegetal" como se usan en la presente, se refieren a cualquier material derivado de una planta. La biomasa o materia vegetal puede comprender una planta completa, o parte de la planta, incluida la hoja, raíz, tallo, flor, semilla, también puede incluir cualquier tejido de la planta, cualquier célula de la planta o cualquier fracción de la planta, parte o la planta, tejido o célula. Además, la biomasa o materia vegetal puede comprender componentes vegetales intracelulares, componentes vegetales extracelulares, extractos líquidos o sólidos de plantas, o una combinación de los mismos. Además, la biomasa o materia vegetal puede comprender plantas, células vegetales, tejidos, un extracto líquido, o una combinación de los mismos, de hojas, tallos, frutos, raíces de las plantas o una combinación de los mismos. Una parte de una planta puede comprender materia vegetal o biomasa.
Por "región reguladora", "elemento regulador" o "promotor" se entiende una parte de ácido nucleico típicamente, pero no siempre, aguas arriba de la región codificante de proteínas de un gen, que puede estar compuesto por ADN o ARN, o tanto ADN como ARN. Cuando una región reguladora está activa, y en asociación operativa, o unida operativamente, con un gen de interés, esta puede dar como resultado la expresión del gen de interés. Un elemento regulador puede ser capaz de mediar la especificidad en un órgano o controlar la activación de genes temporal o por el desarrollo. Una "región reguladora" incluye elementos promotores, elementos promotores mínimos que exhiben una actividad promotora basal, elementos que son inducibles en respuesta a un estímulo externo, elementos que median la actividad promotora tales como elementos reguladores negativos o potenciadores de la transcripción. "Región reguladora", como se usa en la presente, también incluye elementos que son activos después de la transcripción, por ejemplo, elementos reguladores que modulan la expresión génica tales como potenciadores de la transcripción y la traducción, represores de la transcripción y la traducción, secuencias activadoras aguas arriba y determinantes de inestabilidad del ARNm. Varios de estos últimos elementos pueden ubicarse próximos a la región codificante.
En el contexto de esta descripción, la expresión "elemento regulador" o "región reguladora" típicamente se refiere a una secuencia de ADN, generalmente, pero no siempre, corriente arriba (5') a la secuencia codificante de un gen estructural, que controla la expresión de la región codificante al proporcionar el reconocimiento para la ARN polimerasa y/u otros factores necesarios para que la transcripción comience en un sitio particular. Sin embargo, debe entenderse que otras secuencias de nucleótidos, ubicadas dentro de los intrones o 3' de la secuencia también pueden contribuir a la regulación de la expresión de una región codificante de interés. Un ejemplo de un elemento regulador que proporciona el reconocimiento de la ARN polimerasa u otros factores de transcripción para garantizar el inicio en un sitio particular es un elemento promotor. La mayoría, pero no todos, los elementos promotores eucariotas contienen una caja TATA, una secuencia de ácidos nucleicos conservada compuesta por pares de bases de nucleótidos de adenosina y timidina, generalmente situados aproximadamente a 25 pares de bases aguas arriba de un sitio de inicio de la transcripción. Un elemento promotor comprende un elemento promotor basal, responsable del inicio de la transcripción, así como también otros elementos reguladores (como se enumeró anteriormente) que modifican la expresión génica.
Hay varios tipos de regiones reguladoras, incluidas aquellas que son reguladas por el desarrollo, inducibles o constitutivas. Una región reguladora que es regulada por el desarrollo, o controla la expresión diferencial de un gen bajo su control, se activa dentro de ciertos órganos o tejidos de un órgano en momentos específicos durante el desarrollo de ese órgano o tejido. Sin embargo, algunas regiones reguladoras que son reguladas por el desarrollo pueden estar activas preferentemente dentro de ciertos órganos o tejidos en etapas específicas del desarrollo, también pueden estar activas de una manera regulada por el desarrollo, o también a un nivel basal en otros órganos o tejidos dentro de la planta. Los ejemplos de regiones reguladoras específicas de tejido, por ejemplo, una región reguladora específica, incluyen el promotor de napina y el promotor de cruciferina (Rask y otros, 1998, J. Plant Physiol. 152: 595­ 599; Bilodeau y otros, 1994, Plant Cell 14: 125-130). Un ejemplo de un promotor específico de la hoja incluye el promotor de plastocianina (véase el documento US 7,125,978).
Una región reguladora inducible es una que es capaz de activar directamente o indirectamente la transcripción de una o más secuencias de ADN o genes en respuesta a un inductor. En ausencia de un inductor, las secuencias de ADN o los genes no se transcribirán. Típicamente, el factor proteico que se une específicamente a una región reguladora inducible para activar la transcripción puede estar presente en una forma inactiva, que después se convierte directamente o indirectamente en la forma activa por el inductor. Sin embargo, el factor proteico también puede estar ausente. El inductor puede ser un agente químico tal como una proteína, metabolito, regulador del crecimiento, herbicida o compuesto fenólico o un estrés fisiológico impuesto directamente por calor, frío, sal o elementos tóxicos o indirectamente a través de la acción de un patógeno o agente patógeno tal como un virus. Una célula que contiene una región reguladora inducible puede exponerse a un inductor al aplicar externamente el inductor a la célula o planta tal como por pulverización, riego, calentamiento o métodos similares. Los elementos reguladores inducibles pueden derivarse de genes ya sea de plantas o no (por ejemplo, Gatz, C. y Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Los ejemplos de promotores inducibles potenciales incluyen, pero sin limitarse a, promotor inducible por tetraciclina (Gatz, C.,1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), promotor inducible por esteroides (Aoyama, T. y Chua, N.H., 1997, Plant J. 2, 397-404) y promotor inducible por etanol (Salter, M.G., y otros, 1998, Plant Journal 16, 127-132; Caddick, M.X., y otros, 1998, Nature Biotech. 16, 177-180) genes IB6 y CKI1 inducibles por citoquina (Brandstatter, I. y Kieber, J.J.,1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985) y el elemento inducible por auxina DR5 (Ulmasov, T., y otros, 1997, Plant Cell 9, 1963-1971).
Una región reguladora constitutiva dirige la expresión de un gen a través de las diversas partes de una planta y de manera continua a lo largo del desarrollo de la planta. Los ejemplos de elementos reguladores constitutivos conocidos incluyen promotores asociados con el transcrito 35S de CaMV. (p35S; Odell y otros, 1985, Nature, 313: 810-812), los genes 1 de activa del arroz (Zhang y otros, 1991, Plant Cell, 3: 1155-1165), actina 2 (An y otros, 1996, Plant J., 10: 107-121),), o tms 2 (U.S. 5,428,147) y triosafosfato isomerasa 1 (Xu y otros, 1994, Plant Physiol. 106: 459-467), el gen de ubiquitina 1 de la planta de maíz (Cornejo y otros, 1993, Plant Mol. Biol. 29: 637-646), los genes de ubiquitina 1 y 6 de Arabidopsis (Holtorf y otros, 1995, Plant Mol. Biol. 29: 637-646), y el gen del factor de inicio de la traducción 4A del tabaco (Mandel y otros, 1995 Plant Mol. Biol. 29: 995-1004) el promotor del virus del mosaico de la vena de la yuca, pCAS, (Verdaguer y otros, 1996); el promotor de la subunidad pequeña de la ribulosa bifosfato carboxilasa, pRbcS: (Outchkourov y otros, 2003), el pUbi (para monocotiledóneas y dicotiledóneas).
Como se describe en la presente descripción, se ha encontrado que las regiones reguladoras que comprenden secuencias potenciadoras con eficacia demostrada en la expresión de la hoja son eficaces en la expresión transitoria. Sin desear limitarse por la teoría, la unión de elementos reguladores aguas arriba de un gen fotosintético por unión a la matriz nuclear puede mediar una expresión fuerte. Por ejemplo, puede usarse hasta -784 desde el sitio de inicio de la traducción de la plastocianina de guisante (documento US 7,125,978) para mediar la expresión fuerte del gen reportero.
El término "constitutivo", como se usa en la presente, no indica necesariamente que una secuencia de nucleótidos bajo el control de la región reguladora constitutiva se expresa al mismo nivel en todos los tipos de células, sino que la secuencia se expresa en una amplia variedad de tipos de células aun cuando a menudo se observa variación en la abundancia.
Los constructos de expresión descritos anteriormente pueden estar presentes en un vector. El vector puede comprender secuencias borde que permiten la transferencia e integración del casete de expresión en el genoma del organismo o huésped. El constructo puede ser un vector binario de plantas, por ejemplo, un vector de transformación binario basado en pPZP (Hajdukiewicz, y otros, 1994). Otros constructos de ejemplo incluyen pBin19 (véase Frisch, D.A., L.W. Harris-Haller, y otros, 1995, Plant Molecular Biology 27: 405-409).
Si se desea, los constructos de esta descripción pueden manipularse además para incluir marcadores seleccionables. Sin embargo, es posible que esto no sea necesario. Los marcadores seleccionables útiles incluyen enzimas que proporcionan resistencia a productos químicos tales como antibióticos, por ejemplo, gentamicina, higromicina, kanamicina, o herbicidas tales como fosfinotricina, glifosato, clorosulfurón y similares. De manera similar, pueden usarse enzimas que proporcionan la producción de un compuesto identificable por cambio de color, tal como GUS (beta-glucuronidasa) o luminiscencia, tal como luciferasa o GFP.
Un vector también puede incluir un potenciador de la expresión como se describe en la presente descripción. El potenciador de la expresión puede colocarse en un ADN-T que también contiene un supresor del silenciamiento génico y NPTII. El polienlazador también puede codificar uno o dos conjuntos de residuos de histidina 6 x para permitir la inclusión de marcadores His N- o C-terminales en la proteína de interés para facilitar la purificación de la proteína.
El silenciamiento génico postranscripcional (PTGS) puede estar implicado en la limitación de la expresión de transgenes en plantas, y la coexpresión de un supresor del silenciamiento del virus Y de la patata (HcPro) puede usarse para contrarrestar la degradación específica de los ARNm transgénicos (Brigneti y otros, 1998, EMBO J. 17, 6739-6746). Los supresores de silenciamiento alternativos se conocen bien en la técnica y pueden usarse como se describe en la presente descripción (Chiba y otros, 2006, Virology 346:7-14), por ejemplo, pero sin limitarse a, TEV-p1/HC-Pro (virus del grabado del tabaco-pl/HCPro), BYV -p21, p19 del virus del enanismo ramificado del tomate (TBSV p19; el constructo de p19 se describe en el documento WO 2010/0003225), proteína de la cápside del virus del arrugamiento del tomate (TCV -CP), 2b del virus del mosaico del pepino; CMV-2b), p25 del virus X de la patata (PVX-p25), p11 del virus M de la patata (PVM-p11), p11 del virus S de la patata (PVS-p11), p16 del virus de la quemadura del arándano (BScV -p16), p23 del virus de la tristeza de los cítricos (CTV-p23), p24 del virus-2 asociado al enrollamiento de la hoja de la vid, (GLRaV-2 p24), p10 del virus A de la vid, (GVA-p10), p14 del virus B de la vid (GVB-p14), p10 del virus latente de Heracleum (HLV-p10) o p16 del virus latente común del ajo (GCLV-p16).
Por lo tanto, uno o más supresores de silenciamiento, por ejemplo, pero sin limitarse a, HcPro, TEV -p1/HC-Pro, BYV-p21, TBSV p19, TCV-CP, CMV-2b, PVX-p25, rgscam, proteína B2 de FHV, la proteína de envoltura pequeña de CPMV y la proteína de envoltura de TCV, PVM-p11, PVS-p11, BScV-p16, CTV-p23, GLRaV-2 p24, GBV-p14, HLV-p10, GCLV-p16 o GVA-p10 pueden coexpresarse junto con el casete de expresión basado en comovirus, el elemento de amplificación derivado de geminivirus y la secuencia de ácido nucleico que codifica la proteína de interés para garantizar aún más altos niveles de producción de proteínas dentro de una planta.
Los constructos descritos en la presente descripción pueden introducirse en células de la planta mediante el uso de plásmidos Ti, plásmidos Ri, vectores de virus de plantas, transformación directa de ADN, microinyección, electroporación, etcétera. Para reseñas de tales técnicas véase, por ejemplo, Weissbach y Weissbach, Methods for Plant Molecular Biology, Academy Press, Nueva York VIII, págs. 421-463 (1988) ;); Geierson y Corey, Plant Molecular Biology, 2da Edición. (1988); y Miki e Iyer, Fundamentals of Gene Transfer in Plants. En Plant Metabolism, 2da Edición. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (editores), Addison Wesly, Langmans Ltd. Londres, págs. 561-579 (1997). Otros métodos incluyen la captación directa de ADN, el uso de liposomas, la electroporación, por ejemplo, con el uso de protoplastos, microinyección, microproyectiles o fibras e infiltración al vacío. Véase, por ejemplo, Bilang, y otros (1991, Gene 100: 247-250), Scheid y otros (1991, Mol. Gen. Genet. 228: 104-112), Guerche y otros (1987, Plant Science 52: 111-116), Neuhause y otros (1987, Theor. Appl Genet. 75: 30-36), Klein y otros, (2987, Nature 327: 70­ 73); Freeman y otros (1984, Plant Cell Physiol. 29: 1353), Howell y otros (1980, Science 208: 1265), Horsch y otros (1985, Science 227: 1229-1231), DeBlock y otros, (1989, Plant Physiology 91: 694-701), Methods for Plant Molecular Biology (Weissbach y Weissbach, editores., Academic Press Inc., 1988), Methods in Plant Molecular Biology (Schuler y Zielinski, editores., Academic Press Inc., 1989), documentos WO 92/09696, WO 94/00583, EP 331083, e P 175966, Liu y Lomonossoff (2002, J Virol Meth, 105:343-348), EP 290395; WO 8706614; patentes de Estados Unidos núms 4,945,050; 5,036,006; y 5,100,792, solicitudes de patente de Estados Unidos núms. de serie 08/438,666, presentada el 10 de mayo de 1995, y 07/951,715, presentada el 25 de septiembre de 1992.
Los métodos de expresión transitoria pueden usarse para expresar los constructos descritos de la presente descripción (véase D'Aoust y otros, 2009, Methods in molecular biology, Volumen 483, páginas 41-50; Liu y Lomonossoff, 2002, Journal of Virological Methods, 105:343-348). Alternativamente, puede usarse un método de expresión transitoria basado en vacío, como se describe en Kapila y otros, (1997, Plant Sci. 122, 101-108) o los documentos WO 00/063400, WO 00/037663. Estos métodos pueden incluir, por ejemplo, pero sin limitarse a, un método de agroinoculación o agroinfiltración, infiltración con jeringa, sin embargo, también pueden usarse otros métodos transitorios como se indicó anteriormente. Con agroinoculación, agroinfiltración o infiltración con jeringa, una mezcla de Agrobacteria que comprende el ácido nucleico deseado se introduce en los espacios intercelulares de un tejido, por ejemplo, las hojas, la porción aérea de la planta (que incluye el tallo, las hojas y la flor), otra porción de la planta (tallo, raíz, flor) o la planta completa. Después de cruzar la epidermis, la Agrobacteria infecta y transfiere
t se transcribe de manera episomal y el ARNm se traduce, lo que conduce a la producción de la proteína de interés en las células infectadas, sin embargo, el paso del ADN-t dentro del núcleo es transitorio.
En la presente descripción también se describen plantas, células vegetales o semillas transgénicas que contienen el constructo génico que puede usarse como una planta de plataforma adecuada para la expresión transitoria de proteínas descrita en la presente descripción. Los métodos para regenerar plantas completas a partir de células vegetales también se conocen en la técnica (por ejemplo, véase Guerineau y Mullineaux (1993, Plant transformation and expression vectors. En: Plant Molecular Biology Labfax (Croy RRD editor) Oxford, BIOS Scientific Publishers, págs. 121-148). En general, las células vegetales transformadas se cultivan en un medio apropiado, que puede contener agentes de selección tales como antibióticos, en donde se usan marcadores de selección para facilitar la identificación de las células vegetales transformadas. Una vez que se forma el callo, puede fomentarse la formación de brotes con el empleo de las hormonas vegetales apropiadas de acuerdo con métodos conocidos y los brotes se transfieren a un medio de enraizamiento para la regeneración de las plantas. Las plantas pueden usarse después para establecer generaciones repetitivas, ya sea a partir de semillas o mediante el uso de técnicas de propagación vegetativa. Las plantas transgénicas también pueden generarse sin usar cultivo de tejidos. Los métodos para la transformación estable y la regeneración de estos organismos se establecen en la técnica y se conocen para un experto en la técnica. Las técnicas disponibles se reseñan en Vasil y otros, (Cell Culture and Somatic Cell Genetics of Plants, Volúmenes I, II y III, Laboratory Procedures and Their Applications, Academic Press, 1984), y Weissbach y Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). El método para obtener plantas transformadas y regeneradas no es crucial para la presente invención.
Si las plantas, porciones de plantas o células vegetales van a transformarse o cotransformarse con dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en el Agrobacterium en un solo evento de transfección, los ácidos nucleicos se combinan y las células bacterianas se transfectan como se describió. Alternativamente, los constructos pueden introducirse en serie. En este caso, se introduce un primer constructo en las Agrobacterium como se describió, las células se cultivan en condiciones de selección (por ejemplo, en presencia de un antibiótico) en donde solo pueden crecer las bacterias transformadas individualmente. Después de esta primera etapa de selección, se introduce un segundo constructo de ácido nucleico en Agrobacterium como se describió, y las células se cultivan en condiciones de doble selección, en donde solo pueden crecer las bacterias doblemente transformadas. Las bacterias doblemente transformadas pueden usarse después para transformar una planta, porción de la planta o célula vegetal como se describe en la presente descripción o pueden someterse a una etapa de transformación adicional para acomodar un tercer constructo de ácido nucleico.
Alternativamente, si las plantas, porciones de plantas o células vegetales van a transformarse o cotransformarse mediante dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en la planta mediante la coinfiltración de una mezcla de células de Agrobacterium con la planta, porción de la planta o célula vegetal, cada célula de Agrobacterium puede comprender uno o más constructos a introducir dentro de la planta. Para variar los niveles de expresión relativa dentro de la planta, parte de la planta o célula vegetal, de una secuencia de nucleótidos de interés dentro de un constructo, durante la etapa de infiltración, puede variarse la concentración de las diversas poblaciones de Agrobacteria que comprenden los constructos deseados.
La presente descripción proporciona además una planta transgénica que comprende el sistema de expresión como se define en la presente descripción, en donde el ácido nucleico heterólogo de interés en el casete se expresa a un nivel potenciado en comparación con otros sistemas de expresión análogos que carecen de uno o más componentes del sistema de expresión como se describe en la presente, por ejemplo, CMPV HT (SEQ ID NO: 2).
La presente descripción comprende además un método para generar una proteína de interés, que comprende las etapas de proporcionar una planta, o parte de la planta, que exprese el sistema de expresión como se describe en la presente descripción, recolectar, al menos, un tejido en donde la proteína de interés se ha expresado y, opcionalmente, aislar la proteína de interés a partir del tejido.
Así en varios aspectos, y sin limitación, se describe:
un potenciador de la expresión, que comprende una UTR 5' de comovirus seleccionada de cualquiera de las Se Q ID NO: 1 o 3 o una secuencia de nucleótidos que presenta 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1 o 3, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 2; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F., y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.
uno o más sistemas de expresión que comprenden un potenciador de la expresión o casete de expresión basado en comovirus como se definió anteriormente, un promotor (región reguladora), opcionalmente un polienlazador, una secuencia kozak, un ácido nucleico que codifica una proteína de interés y un terminador. métodos para expresar una proteína de interés, en un organismo huésped, tal como una planta, mediante el uso de uno o más sistemas de expresión o vectores como se describe en la presente descripción.
Células huésped y organismos que expresan proteínas de interés a partir de uno o más sistemas de expresión o vectores y métodos para la producción de los huéspedes y organismos.
Tabla 2: lista de secuencias
Figure imgf000025_0001
Figure imgf000026_0001
Ejemplo 1: 2X35S/CPMV-HT/ PDISP/H3 Victoria/ NOS (constructo número 1391)
Una secuencia que codifica la H3 de influenza A/Victoria/361/2011 en la que el péptido señal nativo se reemplazó con el de la proteína disulfuro isomerasa de la alfalfa (PDISP/H3 Victoria) se clonó en el casete de expresión 2X35S-CPMV-HT-NOS mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF-PDI.S 1+3c (Figura 5A, SEQ ID NO: 18) y IF-H3V36111.s1-4r (Figura 5B, SEQ ID NO: 19), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 5C, SEQ ID NO: 20) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV-HT/NOS mediante el uso del sistema de clonaje In-Fusion (Clontech, Mountain View, CA). El constructo número 1191 (Figuras 5D y 5E, SEQ ID NO: 21) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El constructo número 1191 es un plásmido aceptor destinado para el clonaje "In Fusion" de genes de interés en un casete de expresión basado en CPMV-HT. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho del ADN-t se presenta en la Figura 5E (SEQ ID NO: 21). El constructo resultante recibió el número 1391 (Figura 5F, SEQ ID NO: 22). La secuencia de aminoácidos de la H3 madura de influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 5G (SEQ ID NO: 23). Una representación del plásmido 1391 se presenta en la Figura 5H.
Ejemplo 2: 2X35S/CPMV-HT+/ PDISP/H3 Victoria/ NOS (Constructo número 1819)
Una secuencia que codifica H3 de influenza A/Victoria/361/2011 en la que el péptido señal nativo se reemplazó con el de la proteína disulfuro isomerasa de la alfalfa (PDISP/H3 Victoria) se clonó en el casete de expresión 2X35S-CPMV-HT+/NOS mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF(SacII)-Kozac_PDI.c (Figura 6A, SEQ ID NO: 24) e IF-H3V36111.s1-4r (Figura 5B, SEQ ID NO: 19), mediante el uso de la secuencia de p DiSP/H3 Victoria (Figura 8C, SEQ ID NO: 20) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV-HT+/NOS mediante el uso del sistema de clonaje “ In-Fusion” (Clontech, Mountain View, CA). El constructo número 2181 (Figura 6B) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El constructo número 2181 es un plásmido aceptor destinado al clonaje "In Fusion" de genes de interés en un casete de expresión basado en CPMV-HT+. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho de ADN-t se presenta en la Figura 6C (SEQ ID NO: 25). El constructo resultante recibió el número 1819 (Figura 6D, SEQ ID NO: 26). La secuencia de aminoácidos de la H3 madura de influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 5G (SEQ ID NO: 23). Una representación del plásmido 1819 se presenta en la Figura 6E.
Ejemplo 3 - Variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV HT+/NOS (Constructos número 1952 a 1959)
Se crearon ocho constructos que comprenden variaciones de secuencia entre el sitio de restricción SacII y el ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV HT+/NOS mediante el uso del mismo método basado en PCR que para el constructo número 1819 (véase el Ejemplo 2) mediante el uso de un cebador directo modificado y la conservación de todos los demás componentes iguales. Las variantes HT1* a HT8*] se amplificaron mediante el uso de los cebadores enumerados en las Figuras 7A -7H:
IF-HT1*(-Mprot)-PDI.c (Figura 7A, SEQ ID NO: 27),
IF-HT2*(-Mprot)-PDI.c (Figura 7B, SEQ ID NO: 28),
IF-HT3*(-Mprot)-PDI.c (Figura 7C, SEQ ID NO: 29)
IF-HT4*(-Mprot)-PDI.c (Figura 7D, SEQ ID NO: 30)
IF-HT5*(-Mprot)-PDI.c (Figura 7E, SEQ ID NO: 31)
IF-HT6*(-Mprot)-PDI.c (Figura 7F, SEQ ID NO: 32)
IF-HT7*(-Mprot)-PDI.c (Figura 7G, SEQ ID NO: 33) y
IF-HT8*(-Mprot)-PDI.c (Figura 7H, SEQ ID NO: 34),
para crear los constructos número 1952 a 1959, respectivamente. La representación del plásmido 1952 se presenta en la Figura 7I. Se usaron características análogas para preparar los constructos 1953-1959.
Ejemplo 4 - 2X35S/CPMV HT (constructo número 484) y HT+ (constructo número 1805) para PDISP/H1 California
Una secuencia de codificación correspondiente a H1 de Influenza A/California/7/2009 en la que el péptido señal nativo se reemplazó por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H1 California) (Figura 8A, SEQ ID NO: 35) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (véase los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H1 California. La secuencia de aminoácidos de la H1 madura de Influenza A/California/7/2009 fusionada con PDISP se presenta en la Figura 8B (SEQ ID NO: 36). Las representaciones de los plásmidos 484 y 1805 se presentan en la Figura 8C y la Figura 8D.
Ejemplo 5: 2X35S/CPMV HT (constructo número 409) y HT+ (constructo número 2319) para H5 Indonesia
Una secuencia de codificación correspondiente a la H5 de Influenza A/Indonesia/5/2005 en la que el péptido señal nativo se reemplazó por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H5 Indonesia) (Figura 9A, SEQ ID NO: 37) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H1 California. La secuencia de aminoácidos de la H5 madura de la Influenza A/California/5/2005 fusionada con PDISP se presenta en la Figura 9B (SEQ ID NO: 38). Representaciones de los plásmidos 409 y 2319 se presentan en la Figura 9C y la Figura 9D.
Ejemplo 6 - 2X35S/CPMV HT (constructo número 2140) y HT+ (constructo número 2142) para PDISP-H7 Hangzhou
Una secuencia codificante correspondiente a H7 de la influenza A/Hangzhou/1/2013 en la que el péptido señal nativo se reemplazó por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou) (Figura 10A, SEQ ID NO: 39) se clonó en h T original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou. La secuencia de aminoácidos de la H7 madura de influenza A/Hangzhou/1/2013 fusionada con PDISP se presenta en la Figura 10B (SEQ ID NO: 40). Las representaciones de los plásmidos 2140, 2142 y 2168 se presentan en la Figura 10C y la Figura 10D.
Ejemplo 7 - 2X35S/CPMV HT (constructo número 2130) y HT+ (constructo número 2146) para PDISP/H7 Hangzhou+H5 Indonesia TMCT
Una secuencia codificante quimérica de hemaglutinina correspondiente al ectodominio de la H7 de Influenza A/Hangzhou/1/2013 fusionada al dominio transmembrana y cola citoplasmática (TMCT) de H5 de influenza A/Indonesia/5/2005 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou+H5 Indonesia TMCT) (Figura 11A, SEQ ID NO: 41) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou+H5 Indonesia TMCT. La secuencia de aminoácidos de H7 Hangzhou+H5 Indonesia TMCT fusionada con PDISP se presenta en la Figura 11B (SEQ ID NO: 42). Las representaciones de los plásmidos 2130 y 2146 se presentan en las Figuras 11C y 11D.
Ejemplo 8 - 2X35S/CPMV HT (constructo número 1039) y HT+ (constructo número 1829) para PDISP/HA B Brisbane (PrL-)
Una secuencia codificante correspondiente a la HA de Influenza B/Brisbane/60/2008 con el bucle proteolítico eliminado (PrL-) en la que el péptido señal nativo se reemplazó por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Brisbane (PrL-; Figura 12A, SEQ ID NO: 43) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para P D I S p / H a B Brisbane (PrL-). La secuencia de aminoácidos de HA B Brisbane (PrL-) madura fusionada con PDISP se presenta en la Figura 12B (SEQ ID NO: 44). Las representaciones de los plásmidos 1039 y 1829 se presentan en las Figuras 12C y 12D.
Ejemplo 9: 2X35S/CPMV HT (constructo número 1067) y HT+ (constructo número 1875) para PDISP/HA B Brisbane (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de la HA de influenza B/Brisbane/60/08 con el bucle proteolítico eliminado (PrL-) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de influenza A/California/7/2009 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PD iSp /HA B Brisbane (PrL-)+H1 California TMCT) (Figura 13A, SEQ ID NO: 45) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Brisbane (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA madura de B Brisbane (PrL-)+H1 California TMCT fusionada con PDISP se presenta en la Figura 13B (SEQ ID NO: 46). Las representaciones de los plásmidos 1067 y 1875 se presentan en las Figuras 13C y 13D.
Ejemplo 10: 2X35S/CPMV HT (constructo número 2072) y HT+ (constructo número 2052) para PDISP/HA B Massachusetts (PrL-)
Una secuencia codificante correspondiente a la HA de Influenza B/Massachusetts/2/2012 con el bucle proteolítico eliminado (PrL-) en la que el péptido señal nativo se reemplazó por el de proteína disulfuro isomerasa de alfalfa (PDISP/HA B Massachusetts (PrL-)) (Figura 14A, SEQ ID NO: 47) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachusetts (PrL-). La secuencia de aminoácidos de la HA madura de B Massachusetts (PrL-) fusionada con PDISP se presenta en la Figura 14B (SEQ ID NO: 48). Las representaciones de los plásmidos 2072 y 2052 se presentan en la Figura 14C y la Figura 14D.
Ejemplo 11 - 2X35S/CPMV HT (constructo número 2074) y HT+ (constructo número 2062) para PDISP/HA B Massachusetts (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de la HA de Influenza B/Massachusetts/2/2012 con bucle proteolítico eliminado (PrL-) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de influenza A/California/7/2009 y con el péptido señal de proteína disulfuro isomerasa de alfalfa (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT) (Figura 15A, SEQ ID NO: 49) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachusetts (PrL-)+H1 California TMCT. La secuencia de aminoácidos de la HA madura de B Massachusetts (PrL-)+H1 California TMCT fusionada con PDISP se presenta en la Figura 15B (SEQ ID NO: 50). Las representaciones de los plásmidos 2074 y 2062 se presentan en la Figura 15C y la Figura 15D.
Ejemplo 12: 2X35S/CPMV HT (constructo número 1445) y HT+ (constructo número 1839) para HA B Wisconsin (PrL-)
Una secuencia codificante correspondiente a HA de influenza B/Wisconsin/1/2010 con el bucle proteolítico eliminado (PrL-) con su péptido señal nativo (HA B Wisconsin (PrL-)) (Figura 16A, SEQ ID NO: 51) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-). La secuencia de aminoácidos de HA B Wisconsin (PrL-) con su péptido señal nativo se presenta en la Figura 16B (SEQ ID NO: 52). Las representaciones de los plásmidos 1445 y 1839 se presentan en las Figuras 16C y 16D.
Ejemplo 13: 2X35S/CPMV HT (constructo número 1454) y HT+ (constructo número 1860) para HA B Wisconsin (PrL-)+H1 California TMCT
Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de influenza B/ Wisconsin /2/2012 con bucle proteolítico eliminado (PrL-) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de influenza A/California/7/2009 con el péptido señal nativo de HA B Wisconsin (HA B Wisconsin (PrL-)+H1 California TMCT) (Figura 17A, SEQ ID NO: 53) se clonó en HT original y HT+ modificado mediante el uso del mismo método basado en PCR que los constructos 1391 y 1819 (ver los Ejemplos 1 y 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA B Wisconsin (PrL-)+H1 California TMCT se presenta en la Figura 17B (SEQ ID NO: 54). Las representaciones de los plásmidos 1454 y 1860 se presentan en las Figuras 17C y 17D.
Ejemplo 14: Transfección de Agrobacterium
La cepa de Agrobacterium AGL1 se transfectó por electroporación con los constructos de ADN mediante el uso de los métodos descritos por D'Aoust y otros 2008 (Plant Biotechnology Journal 6:930-940). Agrobacterium transfectadas se cultivaron en medio YEB suplementado con ácido 2-(N-morfolino)etanosulfónico (MES) 10 mM, acetosiringona 20 pM, kanamicina 50 pg/ml y carbenicilina 25 pg/ml pH 5,6 a una DO600 entre 0,6 y 1,6. Las suspensiones de Agrobacterium se centrifugaron antes de su uso y se resuspendieron en medio de infiltración (MgCh 10 mM y MES 10 mM pH 5,6).

Claims (10)

REIVINDICACIONES
1. Un potenciador de la expresión que comprende, en serie,
una primera secuencia que comprende una secuencia de nucleótidos 5'UTR de CPMV que comprende los nucleótidos 1-160 de la SEQ ID No.: 1, o que comprende una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de identidad de secuencia con los nucleótidos 1-160 de la SEQ ID No.: 1, una segunda secuencia que comprende de 10 a 351 nucleótidos de los nucleótidos 161-509 de la SEQ ID NO:1 o los nucleótidos 161-511 de la SEQ ID NO:56, y
una o más secuencias Kozak unidas al extremo 3' de la segunda secuencia, la una o más secuencias Kozak se seleccionan del grupo que consiste en: caA(A/C)a, aaA(A/C)a, aa(A/G)(A/C)a, AGAAA, AGACA, AGGAA, AAAAA, AAAc A, a Ag CA, AAGAA, AAAGAA y AAAg Aa , y activo en una planta.
2. El potenciador de la expresión de la reivindicación 1, en donde la segunda secuencia comprende una longitud de 50 a aproximadamente 500 nucleótidos, o cualquier longitud intermedia.
3. El potenciador de la expresión de la reivindicación 1, en donde el potenciador de la expresión comprende una secuencia de nucleótidos seleccionada del grupo que consiste en SEQ ID No.: 1, 3, 4 y 56.
4. Un sistema de expresión en plantas que comprende una secuencia de ácido nucleico que comprende una región reguladora, unida operativamente con el potenciador de la expresión de la reivindicación 1 y una secuencia de nucleótidos de interés.
5. El sistema de expresión en plantas de la reivindicación 4, que comprende además una 3'UTR de comovirus.
6. El sistema de expresión en plantas de la reivindicación 4, en donde la secuencia de nucleótidos de interés codifica una proteína viral o un anticuerpo.
7. El sistema de expresión en plantas de la reivindicación 6, en donde la proteína viral es una hemaglutinina de influenza seleccionada del grupo que consiste en H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 y hemaglutinina de influenza tipo B.
8. Un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir por transformación en la planta o en la porción de una planta el sistema de expresión en plantas de la reivindicación 4, e
incubar la planta o la porción de una planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.
9. El método de la reivindicación 8, en donde la transformación es una transformación transitoria.
10. Un ácido nucleico que comprende el potenciador de la expresión de la reivindicación 1, unido operativamente a:
una secuencia de nucleótidos de interés;
una hemaglutinina (HA) de influenza, seleccionada del grupo que consiste en B, HA, C, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16, o
una hemaglutinina (HA) de influenza, en donde la HA es una HA quimérica, en donde un dominio transmembrana nativo de la HA se reemplaza por un dominio transmembrana heterólogo.
ES15769248T 2014-03-27 2015-03-27 Elementos potenciadores de CPMV modificados Active ES2912291T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461971274P 2014-03-27 2014-03-27
PCT/CA2014/050326 WO2014153674A1 (en) 2013-03-28 2014-03-28 Influenza virus-like particle production in plants
PCT/CA2015/050240 WO2015143567A1 (en) 2014-03-27 2015-03-27 Modified cpmv enhancer elements

Publications (1)

Publication Number Publication Date
ES2912291T3 true ES2912291T3 (es) 2022-05-25

Family

ID=54193828

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15769248T Active ES2912291T3 (es) 2014-03-27 2015-03-27 Elementos potenciadores de CPMV modificados

Country Status (8)

Country Link
US (1) US10563213B2 (es)
EP (1) EP3122883B1 (es)
JP (1) JP6599354B2 (es)
CN (1) CN106460005B (es)
AU (1) AU2015234595B2 (es)
CA (1) CA2943796C (es)
ES (1) ES2912291T3 (es)
WO (1) WO2015143567A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0800272D0 (en) 2008-01-08 2008-02-13 Plant Bioscience Ltd Protein expression systems
EP3092309B1 (en) * 2014-01-10 2021-02-24 Medicago Inc. Cpmv enhancer elements
EP3122883B1 (en) 2014-03-27 2022-03-02 Medicago Inc. Modified cpmv enhancer elements
US20210246462A1 (en) * 2018-03-14 2021-08-12 Medicago Inc. Plant expression enhancer
EP3938511A4 (en) 2019-03-14 2023-02-08 Mitsubishi Tanabe Pharma Corporation ENDOGENOUS PLANT EXPRESSION ACTIVATOR
JP2024514875A (ja) * 2021-04-15 2024-04-03 バイオーケストラ カンパニー, リミテッド タンパク質発現を増強できるポリヌクレオチド及びその使用

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
CA1280081C (en) 1984-09-24 1991-02-12 Calgene, Inc. Plant cell microinjection technique
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
EP0265502A1 (en) 1986-04-30 1988-05-04 Boyce Thompson Institute For Plant Research, Inc. Electric field mediated dna transformation of plant cells and organelles
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4692028A (en) 1986-08-19 1987-09-08 Crafco, Inc. Sealant melter/applicator with automatic load switching system
AU615905B2 (en) 1987-05-05 1991-10-17 Novartis Ag Plant tissue transformation
FI890917A (fi) 1988-03-02 1989-09-03 Eidgenoess Tech Hochschule Foerfarande foer framstaellning av transgena vaexter.
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
JP3234598B2 (ja) 1990-11-23 2001-12-04 プラント・ジエネテイツク・システムズ・エヌ・ベー 単子葉植物の形質転換方法
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
AU4539593A (en) 1992-06-23 1994-01-24 South Dakota State University Transformation of plants by direct injection of dna
EP1141356A2 (en) 1998-12-23 2001-10-10 The Samuel Roberts Noble Foundation, Inc. Plant transformation process
WO2000063400A2 (en) 1999-04-21 2000-10-26 The Samuel Roberts Noble Foundation Plant transformation process
US7125978B1 (en) 1999-10-04 2006-10-24 Medicago Inc. Promoter for regulating expression of foreign genes
JP4972264B2 (ja) 1999-12-06 2012-07-11 ボード オブ トラスティーズ オブ ザ ユニバーシティ オブ イリノイ 高親和性tcrタンパク質および方法
DE10109354A1 (de) 2001-02-27 2002-09-05 Icon Genetics Ag Rekombinante virale Schaltersysteme
US8080255B2 (en) 2003-07-11 2011-12-20 Novavax Inc. Functional influenza virus like particles (VLPs)
RU2483751C2 (ru) 2005-10-18 2013-06-10 Новавакс, Инк. ФУНКЦИОНАЛЬНЫЕ ВИРУСОПОДОБНЫЕ ЧАСТИЦЫ ГРИППА (VLPs)
CA2638760A1 (en) 2006-03-07 2007-09-13 Vaxinnate Corporation Compositions that include hemagglutinin, methods of making and methods of use thereof
US7618815B2 (en) 2006-03-08 2009-11-17 University Of Kentucky Research Foundation Viral vectors useful in soybean and methods of use
US8519113B2 (en) 2006-05-22 2013-08-27 Plant Bioscience Limited Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants
WO2008148104A1 (en) 2007-05-25 2008-12-04 Novavax, Inc. Novel vlps derived from cells that do not express a viral matrix or core protein
CA2615372A1 (en) 2007-07-13 2009-01-13 Marc-Andre D'aoust Influenza virus-like particles (vlps) comprising hemagglutinin
CA2707235C (en) 2007-11-27 2013-11-19 Medicago Inc. Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin
GB0800272D0 (en) * 2008-01-08 2008-02-13 Plant Bioscience Ltd Protein expression systems
SG187500A1 (en) 2008-01-21 2013-02-28 Medicago Inc Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin
EP2454229B1 (en) 2009-05-06 2017-09-13 Risen (Shanghai) Pharma Tech Co, Ltd. Amino acid derivatives for the treatment of neuropathic pain
BRPI1015053A2 (pt) 2009-06-24 2019-07-09 Medicago Inc partículas similares a vírus da influenza quiméricas compreendendo hemaglutinina
KR20120093193A (ko) 2009-09-04 2012-08-22 신젠타 파티서페이션즈 아게 식물 폴리펩티드 발현 증가를 위한 번역 향상제 요소의 적층
AU2011325827B2 (en) * 2010-11-04 2016-08-04 Medicago Inc. Plant expression system
TWI526539B (zh) 2010-12-22 2016-03-21 苜蓿股份有限公司 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp
TWI620816B (zh) 2011-03-23 2018-04-11 苜蓿股份有限公司 植物衍生蛋白回收方法
KR101963792B1 (ko) * 2011-06-13 2019-07-31 메디카고 인코포레이티드 식물에서 광견병 바이러스 유사 입자 생성
PL220281B1 (pl) 2011-09-23 2015-09-30 Inst Biochemii I Biofizyki Polskiej Akademii Nauk Szczepionka DNA, sposób indukowania odpowiedzi immunologicznej, przeciwciała specyficznie rozpoznające białko hemaglutyniny H5 wirusa grypy i zastosowanie szczepionki DNA
SI2760882T1 (sl) * 2011-09-30 2023-10-30 Medicago Inc. Povečanje količine virusom podobnih delcev v rastlinah
BR112014011345A2 (pt) 2011-11-11 2017-05-16 Philip Morris Products Sa partículas tipo vírus da influenza (vlps) compreendendo nicotiana tabacum produzida por hemaglutinina
EP2978848B1 (en) 2013-03-28 2020-05-06 Medicago Inc. Influenza virus-like particle production in plants
EP3122883B1 (en) 2014-03-27 2022-03-02 Medicago Inc. Modified cpmv enhancer elements

Also Published As

Publication number Publication date
CA2943796C (en) 2023-02-14
AU2015234595B2 (en) 2021-03-25
WO2015143567A1 (en) 2015-10-01
EP3122883A4 (en) 2017-11-29
US10563213B2 (en) 2020-02-18
CN106460005A (zh) 2017-02-22
EP3122883B1 (en) 2022-03-02
EP3122883A1 (en) 2017-02-01
AU2015234595A1 (en) 2016-10-13
JP2017513467A (ja) 2017-06-01
JP6599354B2 (ja) 2019-10-30
US20180119158A1 (en) 2018-05-03
CN106460005B (zh) 2020-01-03
CA2943796A1 (en) 2015-10-01

Similar Documents

Publication Publication Date Title
JP6025214B2 (ja) 植物発現系
ES2912291T3 (es) Elementos potenciadores de CPMV modificados
US11884929B2 (en) CPMV enhancer elements
JP7423875B6 (ja) 植物発現エンハンサ
US20220154195A1 (en) Endogenous plant expression enhancer