ES2864081T3

ES2864081T3 - Elementos potenciadores de CPMV

Info

Publication number: ES2864081T3
Application number: ES15735364T
Authority: ES
Inventors: Pierre-Olivier Lavoie; Marc-Andre D'aoust
Original assignee: Medicago Inc
Current assignee: Medicago Inc
Priority date: 2014-01-10
Filing date: 2015-01-08
Publication date: 2021-10-13
Anticipated expiration: 2035-01-08
Also published as: US20170029832A1; US11884929B2; RU2699982C2; CN105980561B; RU2016132865A3; EP3092309B1; AU2015205805B2; CA2936350C; DK3092309T3; EP3092309A4; US20200283784A1; JP6518257B2; US11441150B2; BR112016015875A2; JP2017501738A; WO2015103704A1; EP3092309A1; CA2936350A1; AU2015205805A1; TW201610154A

Abstract

Un potenciador de la expresión que comprende una secuencia de nucleótidos de UTR 5' del CPMV derivada del ARN-2 del CPMV, la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69.

Description

DESCRIPCIÓN

Elementos potenciadores de CPMV

Campo de la invención

La presente invención se refiere a la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y composiciones para la producción de proteínas de interés en plantas.

Antecedentes de la invención

Las plantas ofrecen un gran potencial como sistemas de producción de proteínas recombinantes. Un enfoque para producir proteínas extrañas en plantas es generar líneas de plantas transgénicas estables. Sin embargo, este es un proceso que requiere mucho tiempo y trabajo. Una alternativa a las plantas transgénicas es el uso de vectores de expresión basados en virus vegetales. Los vectores basados en virus vegetales permiten la expresión rápida, de alto nivel y transitoria de proteínas en las plantas.

Un método para lograr la expresión transitoria de alto nivel de proteínas extrañas en plantas implica el uso de vectores basados en virus vegetales de ARN, lo que incluye los comovirus, tales como el virus del mosaico del caupí (CPMV; ver, por ejemplo, los documentos WO2007/135480; WO2009/087391; US 2010/0287670, Sainsbury F. y otros, 2008, Plant Physiology; 148: 121-1218; Sainsbury F. y otros, 2008, Plant Biotechnology Journal; 6: 82-92; Sainsbury F. y otros, 2009, Plant Biotechnology Journal; 7: 682-693; Sainsbury F. y otros, 2009, Methods in Molecular Biology, Recombinant Proteins From Plants, vol. 483: 25-39).

Los comovirus son virus de ARN con un genoma bipartito. Los segmentos del genoma del ARN comoviral se denominan como ARN-1 y ARN-2. El ARN-1 codifica las proteínas VPg, replicasa y proteasa. El virus requiere la replicasa para la replicación del genoma viral. El ARN-2 del comovirus virus del mosaico del caupí (CPMV) produce una poliproteína de 105 kDa o 95 kDa procesada en 4 péptidos funcionales.

La región 5' del ARN-2 del CPMV comprende codones de inicio (AUG) en las posiciones 115, 161, 512 y 524. Los codones de inicio en las posiciones 161 y 512 están en el mismo marco de lectura de triplete. La iniciación en el codón de inicio en la posición 161 da como resultado la síntesis de la poliproteína de 105 K mientras que la iniciación en el codón de inicio en la posición 512 dirige la síntesis de la poliproteína de 95 K. La iniciación de la traducción en el codón de inicio en la posición 512 en el CPMV es más eficiente que el inicio en la posición 161, lo que da como resultado la producción de más poliproteína de 95 K que poliproteína de 105 K. El codón de inicio en la posición 115 no es esencial para la replicación del virus (Wellink y otros, 1993 Biochimie. 75(8): 741-7).

Se requiere el mantenimiento del marco entre los sitios de iniciación en las posiciones 161 y 512 en el ARN-2 del CPMV para la replicación eficiente del ARN-2 por la replicasa codificada por el ARN-1 (Holness y otros, 1989; Virology 172, 311-320; van Bokhoven y otros, 1993, Virology 195, 377-386; Rohll y otros, 1993 Virology 193, 672-679; Wellink y otros, 1993, Biochimie. 75(8):741-7). Este requisito afecta la longitud de las secuencias que pueden insertarse aguas arriba del codón de inicio 512 en formas replicativas de vectores de expresión del ARN-2 del CPMV. Además, el uso de polienlazadores debe usarse con precaución ya que pueden desplazar el marco de lectura de codones (ORF) entre estos sitios de iniciación.

El CPMV ha servido como base para el desarrollo de sistemas de vectores adecuados para la producción de polipéptidos heterólogos en plantas (Liu y otros, 2005 Vaccine 23, 1788-1792; Sainsbury y otros, 2007 Virus Expression Vectors (ed. Hefferon, K.), págs. 339-555). Estos sistemas se basan en la modificación del ARN-2, pero difieren en si se usan versiones de longitud completa o con eliminaciones. La replicación del ARN-2 modificado se logra mediante la inoculación conjunta con ARN-1. Las proteínas extrañas están fusionadas al extremo C-terminal de las poliproteínas derivadas del ARN-2. La liberación del polipéptido N-terminal está mediada por la acción de la secuencia del péptido catalítico 2A del virus de la fiebre aftosa (Gopinath y otros, 2000, Virology 267: 159-173). Las moléculas de ARN-2 resultantes son capaces de propagarse tanto dentro como entre plantas. Esta estrategia se ha usado para expresar una serie de proteínas recombinantes, tales como el antígeno central de la hepatitis B (HBcAg) y las proteínas inmunitarias pequeñas (SIP), en plantas de caupí (Mechtcheriakova y otros, J. Virol. Methods 131, 10-15; 2006; Monger y otros, 2006, Plant Biotechnol. J. 4, 623-631; Alamillo y otros, 2006, Biotechnol. J. 1, 1103-1111). Aunque tiene éxito, el uso de un vector viral de longitud completa limita el tamaño de las secuencias insertadas, y el movimiento entre plantas genera preocupaciones sobre la biocontención del virus.

Para abordar el problema de la biocontención y el tamaño del inserto, Canizares y otros (2006 Plant Biotechnol, J 4: 183-193) reemplazaron la mayor parte de la región codificante del ARN-2 con una secuencia de interés para producir una versión inhabilitada del ARN-2 del CPMV (deIARN-2). La secuencia a expresar se fusionó al AUG en la posición 512 del ARN-2, inmediatamente aguas arriba de la región no traducida (UTR) 3' para crear una molécula que imita al ARN-2. Tales constructos fueron capaces de replicarse cuando se introdujeron en plantas en presencia del ARN-1 y un supresor del silenciamiento, y dirigieron la síntesis de niveles sustanciales de proteínas heterólogas (Sainsbury y otros, 2008 Plant Biotechnol J 6: 82-92).

La mutación del codón de inicio en la posición 161 en un vector de ARN-2 del CPMV (U162C; HT) aumenta los niveles de expresión de una proteína codificada por una secuencia insertada después del codón de inicio en la posición 512. Esto permite la producción de altos niveles de proteínas extrañas sin la necesidad de replicación viral y se denominó el sistema CPMV-HT (documento WO2009/087391; Sainsbury y Lomonossoff, 2008, Plant Physiol. 148, 1212-1218). En los plásmidos de expresión pEAQ (Sainsbury y otros, 2009, Plant Biotechnology Journal, 7, págs. 682-693; documento US 2010/0287670), la secuencia a expresar se coloca entre la UTR 5' y la UTR 3'. La UTR 5' en la serie pEAQ porta la mutación U162C (HT).

Resumen de la invención

La presente invención se refiere a la expresión de proteínas de interés en plantas. La presente invención también proporciona métodos y composiciones para la producción de proteínas de interés en plantas. La presente invención proporciona un potenciador de la expresión que comprende una secuencia de nucleótidos de la UTR 5' del CPMV derivada del ARN-2 del CPMV, donde la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69. La presente invención también proporciona un ácido nucleico que comprende el potenciador de la expresión y una secuencia de nucleótidos de interés, donde la secuencia de nucleótidos de interés está unida operativamente al extremo 3' del potenciador de la expresión, y la secuencia de nucleótidos de interés codifica una proteína de interés. La presente invención también proporciona un sistema de expresión en plantas que comprende el potenciador de la expresión, en donde el potenciador de la expresión está unido operativamente a una región reguladora en el extremo 5' del potenciador de la expresión. La presente invención también proporciona un método para producir una proteína de interés en una planta o una porción de una planta que comprende, introducir en la planta o la porción de la planta el sistema de expresión en plantas e incubar la planta o la porción de la planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés. La presente invención también proporciona una planta o porción de una planta infectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas.

Como se describe en la presente descripción, se proporciona un potenciador de la expresión que comprende una secuencia de nucleótidos de la UTR 5' del CPMV que consiste en X nucleótidos (CMPVX), donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o que consiste en una secuencia de nucleótidos que comprende de aproximadamente 80 % a 100 % de similitud de secuencia con CMPVX, donde X=160, 155, 150 o 114 de la SEQ ID n O: 1. El potenciador de la expresión puede comprender una secuencia de nucleótidos seleccionada del grupo de la SEQ ID NO: 24, 27, 68, 69, 70 y 71.

La presente descripción también proporciona el potenciador de la expresión como se definió anteriormente, donde el potenciador de la expresión comprende además una secuencia de relleno (CPMVX+, donde X=160, 155, 150, 114 de la SEQ ID NO: 1). La secuencia de relleno puede comprender una longitud de 0 a aproximadamente 100 nucleótidos, o cualquier longitud entre ellos, una o más secuencias kozak de plantas, un sitio de clonación múltiple, una o más secuencias enlazadoras, uno o más sitios de recombinación o una combinación de los mismos. La presente descripción también proporciona el potenciador de la expresión como se definió anteriormente, donde la secuencia kozak se selecciona del grupo de secuencias como las que se muestra en las SEQ ID NO: 5-17. El potenciador de la expresión como se acaba de definir (CPMVX+, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1) puede comprender una secuencia de nucleótidos seleccionada del grupo de la SEQ ID NO: 2, 72, 73, 74, 75, 76 y 77.

También se proporciona un sistema de expresión en plantas que comprende una secuencia de ácido nucleico que comprende una región reguladora, unida operativamente con el potenciador de la expresión CPMVX, CPMVX+, como se definió anteriormente, donde el potenciador de la expresión está unido operativamente a una secuencia de nucleótidos de interés. El sistema de expresión en plantas puede comprender además una UTR 3' de comovirus. El sistema de expresión en plantas puede comprender además una segunda secuencia de ácido nucleico que codifica un supresor del silenciamiento, por ejemplo, HcPro o p19.

La secuencia de nucleótidos de interés del sistema de expresión en plantas como se definió anteriormente puede codificar una proteína viral o un anticuerpo. Por ejemplo, la proteína viral puede ser una hemaglutinina de influenza y puede seleccionarse del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 y una hemaglutinina de influenza tipo B. La secuencia de nucleótidos que codifica la proteína viral o el anticuerpo puede comprender una secuencia de péptido señal nativo, o un péptido señal no nativo, por ejemplo, el péptido señal no nativo puede obtenerse a partir de la proteína disulfuro isomerasa (PDI).

Como se describe en la presente descripción, se proporciona un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir en la planta o en la porción de una planta el sistema de expresión en plantas que comprende CPMVx o CPMVX+, como se definió anteriormente, e incubar la planta o la porción de una planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.

La presente descripción también proporciona una planta o porción de una planta transfectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas como se describió anteriormente.

Los sistemas de expresión basados en plantas como se describen en la presente descripción dan como resultado el aumento o potenciación de la expresión de una secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo que está unido operativamente al potenciador de la expresión, ya sea CPMVX o CPMVX+ como se define en la presente descripción. El aumento en la expresión puede determinarse al comparar el nivel de expresión obtenido mediante el uso de los potenciadores de la expresión basados en CPMVX o basados en CPMVX+ con el nivel de expresión de la misma secuencia de nucleótidos que codifica el marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora de la técnica anterior (CPMV HT) que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218). En la SEQ ID NO: 4 se proporciona un ejemplo de una secuencia CPMV HT de la técnica anterior.

Los sistemas de expresión basados en plantas como se describen en la presente descripción también pueden tener una serie de propiedades tales como, por ejemplo, que contienen sitios de clonación convenientes para genes o secuencias de nucleótidos de interés, pueden infectar plantas fácilmente de una manera rentable, pueden provocar una infección local o sistémica eficiente de las plantas inoculadas. Además, la infección debería proporcionar un buen rendimiento de material proteico útil.

Este resumen de la invención no describe necesariamente todas las características de la invención.

Breve descripción de los dibujos

Estas y otras características de la invención serán más evidentes a partir de la siguiente descripción en la que se hace referencia a los dibujos adjuntos en donde:

La FIGURA 1A muestra un esquema general de un ejemplo de varias secuencias potenciadoras, CPMVX y CPMVX+ (que comprende CPMVX y un fragmento de relleno, que en este ejemplo no limitante, comprende un sitio de clonación múltiple y una secuencia kozak de plantas), como se describe en la presente descripción. CPMCX y CPMVX+ se muestran cada uno unidos operativamente a la región reguladora de plantas en sus extremos 5', y en sus extremos 3', en serie, una secuencia de nucleótidos de interés (que incluye un sitio de iniciación ATG y un sitio de parada), una UTR 3' y una secuencia terminadora. Un ejemplo de constructo CPMVX como se describe en la presente descripción, es CPMV160. Un ejemplo de constructo CPMVX+ como se describe en la presente descripción, es CPMV160+. La FIGURA 1B muestra ejemplos de varias variantes de constructos que comprenden secuencias potenciadoras, como se describe en la presente descripción (CPMV160, secuencia completa proporcionada como SEQ ID NO: 1; CPMV155, secuencia completa proporcionada como SEQ ID NO: 24; CPMV150, secuencia completa proporcionada como SEQ ID NO: 27; y CPMV114, secuencia completa proporcionada como SEQ ID NO: 68), unidas operativamente a la región reguladora (en estos ejemplos no limitantes 2X35S) en sus extremos 5', y en sus extremos 3', una secuencia de nucleótidos de interés, o "GOI", que incluye una secuencia kozak de plantas adyacente al sitio de iniciación ATG (los elementos mostrados entre corchetes se incluyen para el contexto y no son parte de las secuencias potenciadoras de CPMVX o CPMVX+). La FIGURA 1C muestra ejemplos de varias variantes de constructos que comprenden secuencias potenciadoras, como se describe en la presente descripción (CPMV 160+, secuencia completa proporcionada como SEQ ID NO: 2; CPMV155+, secuencia completa proporcionada como SEQ ID NO: 72; CPMV150+, secuencia completa proporcionada como SEQ ID NO: 73; y CPMV114+, secuencia completa proporcionada como SEQ ID NO: 74), unidas operativamente a la región reguladora de plantas (en estos ejemplos no limitantes 2X35S) en sus extremos 5', y en sus extremos 3', un fragmento de relleno (en estos ejemplos no limitantes, que comprende un sitio de clonación múltiple y una secuencia kozak de plantas), una secuencia de nucleótidos de interés, "GOI", que comprende un sitio de iniciación ATG (los elementos que se muestran entre corchetes se incluyen para el contexto, y no son parte de las secuencias potenciadoras CPMVX o CPMVX+).

La FIGURA 2 muestra el título relativo de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior), y constructos de expresión basados en CPMV160+, unidos operativamente con una secuencia de nucleótidos de interés. Se muestran datos para la expresión de HA a partir de H1 A/California/07/2009 con un péptido señal PDI (PDI-H1 Cal; número de constructo 484 UTR 5': CPMV HT; y número de constructo 1897, UTR 5': CPMV160+; ver el Ejemplo 5), H3 A/Victoria/361/2011 con un péptido señal de PDI (PDI-H3 Vic; número de constructo 1391, UTR 5': c Pm V Ht ; y número de constructo 1800, u Tr 5': CMPV160+; ver los Ejemplos 1 y 2, respectivamente), H5 a partir de Influenza A/Indonesia/5/2005 con un péptido señal nativo (WtSp-H5 Indo; número de constructo 489, UTR 5': CMPV HT; y número de constructo 1880, Ut R 5': CMPV160+; ver el Ejemplo 6), y B/Wisconsin/1/2010 con bucle proteolítico eliminado y con un péptido señal nativo (WtSp-B Wis-PrL; número de constructo 1445, UTR 5': CMPV HT; y número de constructo 1975, UTR 5': CMPV160+, ver el Ejemplo 13). PDI: péptido señal de proteína disulfuro isomerasa; PrL-: bucle proteolítico eliminado.

La FIGURA 3 muestra los títulos relativos de hemaglutinación (HMG) en extractos proteicos crudos de proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior) y constructos de expresión basados en CPMV160+. Se muestran datos para la expresión de HA a partir de H1 A/California/07/2009 con un péptido señal PDI (número de constructo 484, UTR 5': CMPV HT; y número de constructo 1897 UTR 5': CMPV160+, ver el Ejemplo 5), H3 A/Victoria/361/2011 con un péptido señal Pd I (número de constructo 1391, UTR 5': CMPV HT; y número de constructo 1800 UTR 5': CMPV160+, ver los Ejemplos 1 y 2, respectivamente), B Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI (número de constructo 1039, UTR 5': CMPV HT; y número de constructo 1937, UTR 5': CMPV160+; ver el Ejemplo 9), B Brisbane/60/08+H1Tm, con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009, y con un péptido señal PDI (número de constructo 1067, UTR 5': CMPV Ht ; y número de constructo 1977, Ut R 5': CMPV160+; ver el Ejemplo 10), B Massachusetts/2/2012 2012 con bucle proteolítico eliminado y con un péptido señal PDI (número de constructo 2072, UTR 5': CMPV HT; y número de constructo 2050, UTR 5': CMPV 160+; ver el Ejemplo 11), B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con un péptido señal PDI (número de constructo 2074, UTR 5': CMPV HT; y número de constructo 2060, UTR 5': CMPV160+; ver el Ejemplo 12), B Wisconsin/1/2010 con bucle proteolítico eliminado y con el péptido señal nativo (número de constructo 1445, UTR 5': CMPV HT; y número de constructo 1975, UTR 5': CMPV160+; ver el Ejemplo 13), y B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado, con dominio transmembrana y cola citoplasmática reemplazados por los de H1 A/California/07/2009 y con el péptido señal nativo (número de constructo 1454, UTR 5': CMPV h T; y número de constructo 1893, UTR 5': CMPV160+; ver el Ejemplo 14).

La FIGURA 4A muestra ejemplos de variantes de secuencias kozak de plantas ensayadas. Los constructos muestran una secuencia parcial de CPMVX+, una región reguladora de plantas, un fragmento de relleno y una secuencia de nucleótidos de interés (GOI). En este ejemplo no limitante, el constructo comprende una región reguladora 2X35S, CPMV 160+, un fragmento de relleno que comprende un sitio de clonación múltiple y una secuencia kozak de plantas (también se indica el extremo 5' de una secuencia de nucleótidos de interés: "ATG...GOI": donde la GOI es H3 A/Victoria/361). Las variantes de las secuencias kozak de plantas también se muestran debajo de la secuencia (ver también la Figura 9). Cada variante de secuencia kozak de plantas se fusionó al extremo 3' del fragmento de relleno y al sitio 5'-ATG de la secuencia de nucleótidos de interés (en estos ejemplos no limitantes, H3 A/Victoria/361). Los otros elementos de los constructos permanecieron iguales). La FIGURA 4B muestra los títulos de HA de una secuencia de nucleótidos de interés producida en plantas que comprende el constructo de expresión de CMPV160+ y una variante de secuencias kozak de plantas como se indica.

La FIGURA 5 muestra la expresión del anticuerpo rituximab (Rituxan) bajo el control de CPMV-HT (números de constructo 5001 y 5002, ver los ejemplos 15 y 16) o CPMV160 (números de constructo 2100 y 2109, ver el Ejemplo 15 y 16) y con ya sea su péptido señal nativo o el péptido señal nativo reemplazado con el péptido señal de proteína disulfuro isomerasa (PDl).

La FIGURA 6 muestra los componentes de secuencia usados para preparar el número de constructo 1391(A-2X35S CPMV-HT PDISP H3Victoria NOS; ver el Ejemplo 1). El número de constructo 1391 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' de CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H3 Victoria)). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 6A muestra la secuencia del cebador IF-PDI.S1=3c (SEQ ID NO: 67). La FIGURA 6B muestra la secuencia del cebador IF-H3V36111.s1-4r (SEQ ID NO: 17). La FIGURA 6C muestra la secuencia de PDISP/H3 Victoria (SEQ ID NO: 18). La FIGURA 6D muestra una representación esquemática del constructo 1191. La FIGURA 6E muestra el constructo 1191; de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S CPMV-HT NOS, con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina; SEQ ID NO: 19). La FIGURA 6F muestra el casete de expresión número 1391 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada; la UTR 5' del CPMV en negrita; la proteína M incompleta en cursiva (SEQ ID NO: 20). La FIGURA 6G muestra la secuencia de aminoácidos de PDISP/H3 Victoria (SEQ ID NO: 21). La FIGURA 6h muestra una representación esquemática del número de constructo 1391 (un constructo de referencia).

La FIGURA 7 muestra los componentes de secuencia usados para preparar el número de constructo 1800 (A-2X35S CPMV160+ PDISP H3Victoria NOS; ver el ejemplo 2). El número de constructo 1800 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 7A muestra la secuencia del cebador IF**(SacII)-PDI.s1+4c (SEQ ID NO: 22). La FIGURA 7B muestra la secuencia del cebador IF-H3V3611 1.s1-4r (SEQ ID NO: 23). La secuencia de PDISP/H3 Victoria se muestra en la Figura 6C (SEQ ID NO: 18). La FIGURA 7C muestra una representación esquemática del constructo 2171 (se indican los sitios de enzimas de restricción SacII y StuI usados para la linealización del plásmido). La FIGURA 7D muestra el constructo 2171 de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S/CPMV160+/NOS con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina, una cola citoplasmática transmembrana de H1 California y la UTR 3' del CPMV (SEQ ID NO: 25). La FIGURA 7E muestra el casete de expresión número 1800 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada; la UTR 5' se muestra en negrita; la secuencia kozak de plantas está subrayada doble; un fragmento de relleno (sitio de clonación múltiple) de 16 pares de bases está ubicado entre la UTR 5' y la secuencia kozak de plantas (SEQ ID NO: 26). La secuencia de aminoácidos de PDISP/H3 Victoria se muestra en la Figura 6G (SEQ ID NO: 27). La FIGURA 7F muestra una representación esquemática del número de constructo 1800 (un constructo basado en CPMVX+, donde X=160).

La FIGURA 8 muestra los componentes de secuencia usados para preparar el número de constructo 1935 (2X35S/CPMV160/PDISP/H3 Victoria/NOS; ver el ejemplo 3). El número de constructo 1935 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160 (CPMVX, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 8A muestra la secuencia del cebador IF-CPMV(fl5'UTR)_SpPDI.c (SEQ ID NO: 28). La FIGURA 8B muestra una representación esquemática del constructo 1190. La FIGURA 8C muestra la secuencia de ácido nucleico del constructo 1190 de bordes de ADN-t izquierdo a derecho (subrayados), 2X35S/CPMV160/NOS con casete de expresión del inhibidor de silenciamiento de plastocianina-P19-plastocianina y una UTR 3' del CPMV (SEQ ID NO: 29). La FIGURA 8D muestra el casete de expresión número 1935 desde el promotor 2X35S hasta el terminador NOS. La secuencia de nucleótidos de PDISP/H3 Victoria está subrayada, la UTR 5' se muestra en negrita (SEQ ID NO: 30). Este casete no incluye una secuencia kozak de plantas o un fragmento de relleno (sitio de clonación múltiple). La FIGURA 8E muestra una representación esquemática del número de constructo 1935 (un constructo basado en CPMVX, donde X=160).

La FIGURA 9 muestra secuencias que comprenden variaciones en una secuencia kozak de plantas usada para preparar una selección de constructos basados en "CPMV160+" (números de constructos 1992 a 1999). Se muestra la variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS, que comprende variaciones en una secuencia kozak de plantas (las secuencias se muestran como variaciones de la secuencia correspondiente a partir del constructo 1800; ver el Ejemplo 4). La variante de secuencia kozak de plantas está subrayada. PDISP: péptido señal de proteína disulfuro isomerasa. La FIGURA 9A muestra la secuencia de nucleótidos de IF-HT1*(-Mprot)-PDI.c (SEQ ID NO: 31; usada para preparar el número de constructo 1992). La FIGURA 9B muestra la secuencia de nucleótidos de IF-HT2*(-Mprot)-PDI.c (SEQ ID NO: 32; usada para preparar el número de constructo 1993). La FIGURA 9C muestra la secuencia de nucleótidos de IF-HT3*(-Mprot)-PDI.c (SEQ ID NO: 33; usada para preparar el número de constructo 1994). La FIGURA 9D muestra la secuencia de nucleótidos de IF-HT4*(-Mprot)-PDI.c (SEQ ID NO: 34; usada para preparar el número de constructo 1995). La FIGURA 9E muestra la secuencia de nucleótidos de IF-HT5*(-Mprot)-PDI.c (SEQ ID NO: 35; usada para preparar el número de constructo 1996). La FIGURA 9F muestra la secuencia de nucleótidos de IF-HT6*(-Mprot)-PDI.c (SEQ ID NO: 36 usada para preparar el número de constructo 1997). La FIGURA 9G muestra la secuencia de nucleótidos de IF-HT7*(-Mprot)-PDI.c (SEQ ID NO: 37; usada para preparar el número de constructo 1998). La FIGURA 9H muestra la secuencia de nucleótidos de IF-HT8*(-Mprot)-PDI.c (SEQ ID NO: 38; usada para preparar el número de constructo 1999). La FIGURA 9I muestra una representación esquemática del número de constructo 1992 que comprende una secuencia kozak de plantas (Kozak1) mediante el uso de la SEQ ID NO: 31 (FIGURA 9A). Los constructos 1993-1999 comprenden las mismas características que el constructo 1992, excepto que cada constructo (1993-1999) comprende una secuencia kozak de plantas modificada (Kozak1) como se muestra en las Figuras 9B a 9H (SEQ ID NO: 32 a 38), respectivamente.

La FIGURA 10 muestra los componentes de secuencia usados para preparar los números de constructo 484 y 1897 (2X35S/CPMV HT PDISP/H1 California NOS y 2X35S/CPMV160+ PDISP/H1 California NOS, respectivamente; ver el Ejemplo 5). El número de constructo 484 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H1 California). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 10A muestra la secuencia de nucleótidos de PDISP/H1 California (SEQ ID NO: 39). La FiGu RA 10B muestra la secuencia de aminoácidos de PDISP/H1 California (SEQ ID NO: 40). La FIGURA 10C muestra una representación esquemática del número de constructo 484 (2X35S/CPMV HT; constructo de referencia). La FIGURA 10D muestra una representación esquemática del número de constructo 1897 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 11 muestra los componentes de secuencia usados para preparar los números de constructo 489, 1880 y 1885 (2X35S/CPMV HT H5 Indonesia NOS; CPMV160+ H5 Indonesia NOS y CPMV160 H5 Indonesia NOS, respectivamente; ver el Ejemplo 6). El número de constructo 489 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H1 California). El número de constructo 1880 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). El número de constructo 1885 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160 (CPMVX, donde X=160). NOS: terminador de nopalina sintasa. La Fig UrA 11A muestra la secuencia de nucleótidos de H5 Indonesia nativa (SEQ ID NO: 41). La FIGURA 11B muestra la secuencia de aminoácidos de H5 Indonesia nativa (SEQ ID NO: 42). La FIGURA 11C muestra una representación esquemática del número de constructo 489 (2X35S/CPMV HT; constructo de referencia). La FIGURA 11D muestra una representación esquemática del número de constructo 1880 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160). La FIGURA 11E muestra una representación esquemática del número de constructo 1885 (2X35S/CPMV160; un constructo basado en CPMVX, donde X=160).

La FIGURA 12 muestra los componentes de secuencia usados para preparar los números de constructo 1240 y 2168 (2X35S/CPMV HT PDISP/H7 Hangzhou NOS y 2X35S/CPMV160+ PDISP/H7 Hangzhou NOS, respectivamente; ver el Ejemplo 7). El número de constructo 1240 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa. NOS: terminador de nopalina sintasa. La FIGURA 12A muestra la secuencia de nucleótidos de PDISP/H7 Hangzhou (SEQ ID NO: 43). La FlGuRA 12B muestra la secuencia de aminoácidos de PDISP/H7 Hangzhou (SEQ ID NO: 44). La FIGURA 12C muestra una representación esquemática del número de constructo 2140 (2X35S/CPMV HT; constructo de referencia). La FIGURA 12D muestra una representación esquemática del número de constructo 2168 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 13 muestra los componentes de secuencia usados para preparar los números de constructo 2130 y 2188 (2X35S/CPMV HT PDISP/H7 Hangzhou+H5 Indonesia TMCT NOS y 2X35S/CPMV160+ PDISP/H7 Hangzhou+H5 Indonesia TMCT NOS, respectivamente; ver el Ejemplo 8). El número de constructo 2130 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/H7 Hangzhou+H5 Indonesia TMCT). El número de constructo 1897 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 13A muestra la secuencia de nucleótidos de PDISP/H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 45). La FIGURA 13B muestra la secuencia de aminoácidos de PDISP/H7 Hangzhou+H5 Indonesia TMCT (SEQ ID NO: 46). La FIGURA 13C muestra una representación esquemática del número de constructo 2130 (2X35S/CPMV HT; constructo de referencia). La FIGURA 13D muestra una representación esquemática del número de constructo 2188 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 14 muestra los componentes de secuencia usados para preparar los números de constructo 1039 y 1937 (2X35S/CPMV HT PDISP/HA B Brisbane (PrL-) NOS y 2X35S/CPMV160+ PDISP/HA B Brisbane (PrL-) NOS, respectivamente; ver el Ejemplo 9). El número de constructo 1039 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)). El número de constructo 1937 incluye una UTR 5' del CPMV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La FIGURA 14A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-) (SEQ ID NO: 47). La FIGURA 14B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-) (Se Q ID NO: 48). La FIGURA 14C muestra una representación esquemática del número de constructo 1039 (2X35S/CPMV h T; constructo de referencia). La FIGURA 14D muestra una representación esquemática del número de constructo 1937 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X = 160).

La FIGURA 15 muestra los componentes de secuencia usados para preparar los números de constructo 1067 y 1977 (2X35S/CPMV HT PDISP/HA B Brisbane (Prl-)+H1 California TMCT NOS y 2X35S/CPMV160+ PDISP/HA B Brisbane (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 10). El número de constructo 1067 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Brisbane (PrL-)+H1 California TMCT). El número de constructo 1977 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 15A muestra la secuencia de nucleótidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (SEQ ID NO: 49). La FIGURA 15B muestra la secuencia de aminoácidos de PDISP/HA B Brisbane (PrL-)+H1 California TMCT (s Eq ID NO: 50). La FIGURA 15C muestra una representación esquemática del número de constructo 1067 (2X35S/CPMV HT; constructo de referencia). La FIGURA 15D muestra una representación esquemática del número de constructo 1977 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 16 muestra los componentes de secuencia usados para preparar los números de constructo 2072 y 2050 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-) NOS y 2X35S/CPMV160+ PDISP/HA B Massachusetts (PrL-) NOS, respectivamente; ver el Ejemplo 11). El número de constructo 2072 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)). El número de constructo 2050 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia Kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado. La FIGURA 16A muestra la secuencia de nucleótidos de PDISP/Ha B Massachusetts (PrL-) (SEQ ID NO: 51). La FIGURA 16B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-) (SEQ ID NO: 52). La FIGURA 16C muestra una representación esquemática del número de constructo 2072 (2X35S/CPMV HT; constructo de referencia). La FIGURA 16D muestra una representación esquemática del número de constructo 2050 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 17 muestra los componentes de secuencia usados para preparar los números de constructo 2074 y 2060 (2X35S/CPMV HT PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS y 2X35S/CPMV160+ PDISP/HA B Massachusetts (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 12). El número de constructo 2074 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HA B Massachusetts (PrL-)+H1 California TMCT). El número de constructo 2060 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 17A muestra la secuencia de nucleótidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SEQ ID NO: 53). La FIGURA 17B muestra la secuencia de aminoácidos de PDISP/HA B Massachusetts (PrL-)+H1 California TMCT (SeQ ID NO: 54). La FIGURA 17C muestra una representación esquemática del número de constructo 2074 (2X35S/CPMV HT; constructo de referencia). La FIGURA 17D muestra una representación esquemática del número de constructo 2060 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 18 muestra los componentes de secuencia usados para preparar los números de constructo 1445, 1820 y 1975 (2X35S/CPMV HT HA B Wisconsin (PrL-) NOS, 2X35S/CPMV160+ HA B Wisconsin (PrL-) NOS y 2X35S/CPMV160 HA B Wisconsin (PrL-) NOS, respectivamente; ver el Ejemplo 13). El número de constructo 1445 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HA B Wisconsin (PrL-)). El número de constructo 1820 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). El número de constructo 1975 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, y no incluye un fragmento de relleno (sitio de clonación múltiple) o una secuencia kozak de plantas (este constructo tampoco comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en "CPMV160" (CPMVX). PrL-: bucle proteolítico eliminado; NOS: terminador de nopalina sintasa. La FIGURA 18A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-) (SEQ ID NO: 55). La FIGURA 18B muestra la secuencia de aminoácidos de HA B Wisconsin (PrL-) (SEQ ID NO: 56). La FIGURA 18C muestra una representación esquemática del número de constructo 1445 (2X35S/CPMV HT; constructo de referencia). La FIGURA 18D muestra una representación esquemática del número de constructo 1820 (2X35S/CPMV160+; un constructo basado en CPMVX+). La FIGURA 18E muestra una representación esquemática del número de constructo 1975 (2X35S/CPMV160; un constructo basado en CPMVX, donde X=160).

La FIGURA 19 muestra los componentes de secuencia usados para preparar los números de constructo 1454 y 1893 (2X35S/CPMV HT HA B Wisconsin (PrL-)+H1 California TMCT NOS y 2X35S/CPMV160+ HA B Wisconsin (PrL-)+H1 California TMCT NOS, respectivamente; ver el Ejemplo 14). El número de constructo 1454 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HA B Wisconsin (PrL-)+H1 California TMCT). El número de constructo 1893 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). NOS: terminador de nopalina sintasa; PrL-: bucle proteolítico eliminado; TMCT: cola citoplasmática del dominio transmembrana. La FIGURA 19A muestra la secuencia de nucleótidos de HA B Wisconsin (PrL-)+H1 California TMCT (SEQ ID NO: 57). La FIGURA 19B muestra la secuencia de aminoácidos de PDISP/HA B Wisconsin (PrL-)+H1 California TMCT (Se Q ID NO: 58). La FIGURA 19C muestra una representación esquemática del número de constructo 1454 (2X35S/CPMV HT; constructo de referencia). La FIGURA 19D muestra una representación esquemática del número de constructo 1893 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 20 muestra los componentes de secuencia usados para preparar los números de constructo 5001 y 2100 (2X35S/CPMV HT HC rituximab (Rituxan) NOS y 2X35S/CPMV160+ h C rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 15). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (HC rituximab (Rituxan)). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 20A muestra la secuencia de nucleótidos de HC rituximab (Rituxan; SEQ ID NO: 59). La FIGURA 20B muestra la secuencia de aminoácidos de HC rituximab (Rituxan; SEQ ID NO: 60). La FIGURA 20C muestra una representación esquemática del número de constructo 5001 (2X35S/CPMV HT; constructo de referencia). La FIGURA 20D muestra una representación esquemática del número de constructo 2100 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 21 muestra los componentes de secuencia usados para preparar los números de constructo 5002 y 2109 (2X35S/CPMV HT PDISP/HC rituximab (Rituxan) NOS y 2X35S/CPMV160+ PDISP/HC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 16). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/HC Rituzan). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 2 lA muestra la secuencia de nucleótidos de PDISP/HC rituximab (Rituxan; SEQ ID NO: 61). La FIGURA 21B muestra la secuencia de aminoácidos de PDISP/HC rituximab (Rituxan; SEQ ID NO: 62). La FIGURA 21C muestra una representación esquemática del número de constructo 5002 (2X35S/CPMV HT; constructo de referencia). La FIGURA 21D muestra una representación esquemática del número de constructo 2109 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 22 muestra los componentes de secuencia usados para preparar los números de constructo 5021 y 2120 (2X35S/CPMV HT LC rituximab (Rituxan) NOS y 2X35S/CPMV160+ lC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 17). El número de constructo 5021 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (LC rituximab (Rituxan)). El número de constructo 2120 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). LC: cadena ligera; NOS: terminador de nopalina sintasa. La FIGURA 22A muestra la secuencia de nucleótidos de LC rituximab (Rituxan; SEQ ID NO: 63). La FIGURA 22B muestra la secuencia de aminoácidos de LC rituximab (Rituxan; SEQ ID NO: 64). La FIGURA 22C muestra una representación esquemática del número de constructo 5021 (2X35S/CPMV HT; constructo de referencia). La FIGURA 22D muestra una representación esquemática del número de constructo 2120 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

La FIGURA 23 muestra los componentes de secuencia usados para preparar los números de constructo 5022 y 2129 (2X35S/CPMV HT PDISP/LC rituximab (Rituxan) NOS y 2X35S/CPMV160+ PDISP/LC rituximab (Rituxan) NOS, respectivamente; ver el Ejemplo 18). El número de constructo 5001 incorpora una secuencia de CPMV-HT de la técnica anterior (UTR 5' del CMPV con codón de inicio mutado en la posición 161 fusionado a una secuencia que codifica una proteína M incompleta) y no comprende una secuencia kozak heteróloga entre la UTR 5' y la secuencia de nucleótidos de interés (PDISP/LC rituximab (Rituxan)). El número de constructo 2100 incluye una UTR 5' del CMPV que comprende 160 nucleótidos, un fragmento de relleno (sitio de clonación múltiple) y una secuencia kozak de plantas (este constructo no comprende una secuencia que codifica una proteína M incompleta) y es un ejemplo de un constructo basado en CPMV160+ (CPMVX+, donde X=160). PDISP: péptido señal de proteína disulfuro isomerasa; HC: cadena pesada; NOS: terminador de nopalina sintasa. La FIGURA 23A muestra la secuencia de nucleótidos de PDISP/LC rituximab (Rituxan; SEQ ID NO: 65). La FIGURA 23B muestra la secuencia de aminoácidos de PDISP/LC rituximab (Rituxan; SEQ ID NO: 66). La FIGURA 23C muestra una representación esquemática del número de constructo 5022 (2X35S/CPMV HT; constructo de referencia). La FIGURA 23D muestra una representación esquemática del número de constructo 2129 (2X35S/CPMV160+; un constructo basado en CPMVX+, donde X=160).

Descripción detallada

En la descripción que sigue, se usan ampliamente varios términos, se proporcionan las siguientes definiciones para facilitar la comprensión de diversos aspectos de la invención. El uso de ejemplos en la memoria descriptiva, que incluye ejemplos de términos, tiene únicamente propósitos ilustrativos y no pretende limitar el alcance y el significado de las modalidades de la presente invención.

Como se usa en la presente descripción, el uso de la palabra "un" o "una" cuando se usa en la presente descripción junto con el término "que comprende" puede significar "uno", pero también es coherente con el significado de "uno o más", "al menos uno" y "uno o más de uno". El término "aproximadamente" se refiere a una variación de aproximadamente /-10 % de un valor dado. El término "pluralidad" significa más de uno, por ejemplo, dos o más, tres o más, cuatro o más, y similares.

La presente descripción proporciona un potenciador de la expresión que comprende una región no traducida 5' (UTR) del CPMV, "CPMVX", que comprende X nucleótidos de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende entre 80 % a 100 % de similitud de secuencia con CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1. Este potenciador de la expresión se denomina generalmente como CPMVX (ver la Figura 1A).

La secuencia potenciadora CPMVX puede fusionarse adicionalmente a una secuencia de relleno, en donde CMPVX comprende X nucleótidos de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende entre 80 a 100 % de similitud de secuencia con CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, y la secuencia de relleno comprende de 1-100 nucleótidos fusionados al extremo 3' de la secuencia CMPVX. Por ejemplo, la secuencia de relleno puede comprender aproximadamente 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 nucleótidos, o cualquier número de nucleótidos entre ellos.

Si la secuencia CMPVX comprende un fragmento de relleno, entonces este potenciador de la expresión puede denominarse como CPMVX+ (ver la Figura 1A), donde X=160, 155, 150, 114 de la SEQ ID NO: 1, también puede denominarse como CMPVX que comprende una secuencia de relleno, o puede denominarse CPMV160+; CPMV155+; CPMV150+; CPMV114+, cuando X=160, 155, 150 o 114, respectivamente. Los constructos que comprenden CPMVX que no comprenden una secuencia de relleno pueden denominarse CPMVX+, donde X=160, 155, 150, 114 de la SEQ ID NO: 1, y donde la secuencia de relleno tiene 0 nucleótidos de longitud.

La secuencia de relleno puede modificarse por truncamiento, deleción o reemplazo de la secuencia nativa de UTR 5' del CMPV que está ubicada en dirección 3' con respecto al nucleótido 160. La secuencia de relleno modificada puede eliminarse, reemplazarse, truncarse o acortarse en comparación con la secuencia de relleno inicial o no modificada (es decir, nativa) asociada con la UTR 5' (como se describe en Sainsbury F., y Lomonossoff G.P., 2008, Plant Physiol.

148: págs. 1212-1218). La secuencia de relleno puede comprender uno o más sitios de restricción (polienlazador, sitio de clonación múltiple, uno o más sitios de clonación), una o más secuencias kozak de plantas, una o más secuencias enlazadoras, uno o más sitios de recombinación, o una combinación los mismos. Por ejemplo, que no debe considerarse limitante, una secuencia de relleno puede comprender en serie, un sitio de clonación múltiple de una longitud deseada, fusionado a una secuencia kozak de planta. La secuencia de relleno no comprende una secuencia de nucleótidos de la secuencia UTR 5' nativa que está ubicada en dirección 3' con respecto al nucleótido 160 de la UTR 5' nativa del CPMV, por ejemplo los nucleótidos 161 al 512 como se muestra en la Figura 1 de Sainsbury F. y Lomonossoff G.P. (2008, Plant Physiol. 148: págs. 1212-1218), o los nucleótidos 161-509 de la SEQ ID NO: 4. Es decir, la proteína M incompleta presente en la secuencia de CPMV HT de la técnica anterior (Figura 1; de Sainsbury F. y Lomonossoff G.P., 2008) se elimina de la UTR 5' en la presente invención.

El potenciador de la expresión CPMVX, o CPMVX+, puede unirse operativamente en el extremo 5' de la secuencia potenciadora con una región reguladora que está activa en una planta, y unirse operativamente a una secuencia de nucleótidos de interés en el extremo 3' del potenciador de la expresión (Figura 1A), para conducir la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.

También se proporcionan sistemas de expresión para producir una o más proteínas de interés en una planta mediante el uso de CMPVX o CPMVX+. Los sistemas de expresión descritos en la presente descripción comprenden un casete de expresión que comprende CPMVX, o una secuencia que comprende un 80 % de similitud de secuencia con CPMVX y, opcionalmente, una secuencia de relleno fusionada a CMPVX (CPMVX+). El casete de expresión que comprende CMPVX o CMPVX+, puede comprender además una región reguladora que está activa en una planta que está unida operativamente al extremo 5' del potenciador de la expresión. Una secuencia de nucleótidos de interés puede unirse operativamente al extremo 3' del casete de expresión de modo que cuando se introduce dentro de una planta, se logra la expresión de la secuencia de nucleótidos de interés dentro de una planta huésped.

También se proporcionan células vegetales, tejidos vegetales, plantas enteras, inóculos, ácidos nucleicos, constructos que comprenden secuencias de nucleótidos de interés que codifican proteínas de interés, casetes de expresión o sistemas de expresión que comprenden CPMVX o CPMVX+ como se describe en la presente descripción, y métodos para expresar una proteína de interés en plantas.

Con referencia a las Figuras 1A, 1B y 1C, se proporcionan ejemplos no limitantes de un potenciador de la expresión que comprende una secuencia UTR 5' del CPMV (CPMVX) que comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1. El potenciador de la expresión CMPVX también puede denominarse como CPMV160; CPMV155; CPMV150; CPMV114, cuando X=160, 155, 150 o 114, respectivamente.

La secuencia de nucleótidos de interés puede fusionarse (unirse operativamente) a la secuencia potenciadora que comprende una región reguladora de plantas, mediante el uso de una diversidad de enfoques. Por ejemplo, que no deben considerarse limitantes:

1) Una secuencia de nucleótidos de interés que codifica una proteína de interés puede fusionarse al extremo 3' del potenciador de la expresión inmediatamente después de la secuencia UTR 5', por ejemplo CPMVX, donde X=160, 155, 150, 114 nucleótidos de la SEQ ID NO: 1. En este ejemplo, la secuencia de nucleótidos de interés está fusionada a la UTR 5' sin un sitio de clonación múltiple, y la secuencia de nucleótidos de interés puede incluir en su extremo 5' una secuencia kozak de plantas inmediatamente aguas arriba de un sitio de iniciación ATG de la secuencia de nucleótidos de interés (ver la Figura 1B). Si X=160 (es decir, CPMV160), entonces una secuencia de nucleótidos de interés que está unida operativamente a CPMV160 puede no requerir una secuencia kozak de plantas fusionada a su extremo 5', ya que los nucleótidos 150-160, o 155-160, de la SEQ ID NO: 1 comprenden una secuencia de tipo kozak. Sin embargo, puede incluirse una secuencia kozak de plantas en constructos que comprenden CPMV160 si se desea (ver la Figura 1B: "+/kozak de plantas"). Si es X=155, 150 o 114, se recomienda incluir una secuencia kozak de plantas que está fusionada al extremo 5' de la secuencia de nucleótidos de interés en los constructos que comprenden CPMV155, CPMV150 o CPMV114 para una expresión óptima de la secuencia de nucleótidos de interés.

2) La secuencia de nucleótidos de interés puede fusionarse a un potenciador de la expresión CMPVX+ (donde X=160, 155, 150, 114 de la SEQ ID NO: 1) que comprende una secuencia kozak de plantas en el extremo 3' del potenciador de la expresión, de modo que la secuencia de nucleótidos de interés está ubicada inmediatamente después de la secuencia kozak de plantas. En este ejemplo, la secuencia de nucleótidos de interés que está fusionada a CPMVX+ no incluiría un sitio de clonación múltiple o una secuencia kozak de plantas (el constructo resultante sería análogo a los que se presentan en la Figura 1B).

3) La secuencia de nucleótidos de interés puede fusionarse a un potenciador de la expresión CPMVX+ (donde X=160, 155, 150, 114 de la SEQ ID NO: 1), que comprende un sitio de clonación múltiple (MCS) en el extremo 3' del potenciador de la expresión, mediante el uso del sitio de clonación múltiple. En este ejemplo, la secuencia de nucleótidos de interés puede incluir en su extremo 5' una secuencia correspondiente para permitir la fusión con el sitio de clonación múltiple del potenciador de la expresión, y una secuencia kozak de plantas inmediatamente aguas arriba del sitio de iniciación ATG de la secuencia de nucleótidos de interés (ver la Figura 1C).

El resultado general mediante el uso de cualquiera de los métodos anteriores, es un constructo (o casete de expresión) que comprende una región reguladora de plantas en asociación operativa (unida operativamente) con una secuencia Ut R 5' del CPMV que comprende X nucleótidos, donde X=160, 155, 150, 114 de la SEQ ID NO: 1 (o una secuencia potenciadora que comprende un 80 % de similitud de secuencia con la secuencia UTR 5' de CPMV), el extremo 3' de la secuencia de UTR 5' del CPMV está fusionado al extremo 3' de una secuencia kozak de plantas, el extremo 3' de la secuencia kozak de plantas fusionado y adyacente al extremo 5' de la secuencia de nucleótidos de interés comprende una secuencia de iniciación ATG. El constructo puede comprender, o no, un sitio de clonación múltiple ubicado entre la UTR 5' y la secuencia kozak de plantas. El constructo puede comprender además una secuencia de la región no traducida 3' (UTR), por ejemplo, una UTR 3' de comovirus, o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, unido operativamente al extremo 3' de la secuencia de nucleótidos de interés (ver la Figura 1A).

Se proporciona, además, un sistema de expresión en plantas que comprende un ácido nucleico que comprende una región reguladora, unida operativamente a uno o más de un potenciador de la expresión como se describe en la presente descripción (por ejemplo, CPMVX), y una secuencia de nucleótidos de interés. Además, se describe un ácido nucleico que comprende una secuencia promotora (región reguladora), unida operativamente a un potenciador de la expresión que comprende una UTR 5' del CPMV y una secuencia de relleno modificada o eliminada (por ejemplo, CPMVX+) y una secuencia de nucleótidos de interés. El ácido nucleico puede comprender además una secuencia que codifica una UTR 3', por ejemplo, una UTR 3' de comovirus, o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, de modo que la secuencia de nucleótidos de interés está insertada aguas arriba a partir de la UTR 3'.

Por "unida operativamente" se entiende que las secuencias particulares interactúan ya sea directa o indirectamente para llevar a cabo una función prevista, tal como la mediación o la modulación de la expresión de una secuencia de ácido nucleico. La interacción de secuencias unidas operativamente puede, por ejemplo, estar mediada por proteínas que interactúan con las secuencias unidas operativamente.

"Potenciador(es) de la expresión", "secuencia(s) potenciadora(s)" o "elemento(s) potenciador(es)", como se hace referencia en la presente descripción, incluyen secuencias derivadas de, o que comparten similitud de secuencia con, porciones de la UTR 5' del CPMv a partir del segmento del genoma de a RN-2. Una secuencia potenciadora puede potenciar la expresión de un marco abierto de lectura (ORF) heterólogo aguas abajo al que están unidos.

El término "UTR 5'" o "región no traducida 5'" o "secuencia líder 5'" se refiere a regiones de un ARNm que no están traducidas. La UTR 5' comienza típicamente en el sitio de inicio de la transcripción y termina justo antes del sitio de iniciación de la traducción o codón de inicio (generalmente AUG en un ARNm, ATG en una secuencia de ADN) de la región codificante. La longitud de la UTR 5' puede modificarse mediante mutación, por ejemplo, sustitución, deleción o inserción de la UTR 5'. La UTR 5' puede modificarse adicionalmente mediante la mutación de un codón de inicio natural o un sitio de iniciación de la traducción de modo que el codón ya no funcione como codón de inicio y la traducción pueda iniciarse en un sitio de inicio alternativo.

La UTR 5' de los nucleótidos 1-160 de la secuencia del ARN-2 del CPMV (SEQ ID NO: 1), comienza en el sitio de inicio de la transcripción hasta el primer codón de iniciación en marco (en la posición 161), que sirve como el sitio de iniciación para la producción de la más larga de dos proteínas carboxi coterminales codificadas por un segmento de genoma de comovirus de tipo silvestre. Además, un “tercer” sitio de iniciación en (o correspondiente a) la posición 115 en la secuencia genómica de ARN-2 del CPMV también puede estar mutado, eliminado o alterado de cualquier otra manera. Se ha demostrado que la eliminación de AUG 115 además de la eliminación de AUG 161 mejora la expresión cuando se combina con una proteína M incompleta (Sainsbury y Lomonossoff, 2008, Plant Physiology; 148: 1212-1218; documento WO 2009/087391).

El potenciador de la expresión puede comprender una región no traducida (UTR) 5' del CPMV que comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1 (CPMVX), o una secuencia que comprende 80 % de similitud de secuencia con CPMVX (donde X=160, 155, 150 o 114 de la SEQ ID NO: 1; ver las Figuras 1A y 1B) y exhibe la propiedad de mejorar la expresión de una secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo que está unido operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora de CPMV HT de la técnica anterior que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218).

La secuencia potenciadora CPMVX también puede fusionarse a una secuencia de relleno, por ejemplo, un sitio de clonación múltiple (MCS), o un MCS unido a una secuencia kozak de plantas, en donde el CMPVx comprende nucleótidos de X de la SEQ ID NO: 1, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, o una secuencia que comprende un 80 % de similitud de secuencia con CPMVX (donde X=160, 155, 150 o 114 de la SEQ ID NO: 1), y exhibe la propiedad de mejorar la expresión de la secuencia de nucleótidos que codifica un marco abierto de lectura heterólogo unido operativamente al potenciador de la expresión, en comparación con la expresión de la misma secuencia que codifica un marco abierto de lectura heterólogo unido operativamente a la secuencia potenciadora CPMV HT de la técnica anterior que comprende una proteína M incompleta (como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218). La secuencia de relleno comprende de 0-500 nucleótidos fusionados al extremo 3' de la secuencia CMPVX. Preferentemente, la secuencia de relleno comprende un sitio de clonación múltiple (MCS), o un MCS unido a una secuencia kozak de plantas, y no incluye una proteína M. Si la secuencia CMPVX comprende un fragmento de relleno (sin una proteína M), entonces este potenciador de la expresión puede denominarse como "CPMVX+" (ver las Figuras 1A y 1C), como "CMPVX que comprende una secuencia de relleno y una secuencia kozak de plantas", o como "CMPVX que comprende un MCS junto con una secuencia kozak de plantas".

El potenciador de la expresión CPMVX, donde X=160, consiste en los nucleótidos 1-160 de la SEQ ID NO: 1:

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgcgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca (SSQ ID NO:l)

Si el potenciador de la expresión consiste en el nucleótido 1-160 de la SEQ ID NO: 1 (CPMV160), entonces una secuencia de nucleótidos de interés con o sin una secuencia kozak de plantas 5' ubicada en el extremo 5' adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 160 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV160). El constructo que comprende CPMV160 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. Sin desear limitarse por la teoría, CPMV160 puede no requerir la adición de una secuencia kozak de plantas al extremo 5' de la secuencia de nucleótidos de interés, ya que la secuencia en las posiciones 150-155, 155-160 o 150-160 de la SEQ ID NO: 1 puede funcionar como una secuencia kozak activa (nativa) en una planta. El número de constructo 1935 (ver el Ejemplo 3) y el número de constructo 1885 (ver el Ejemplo 6) son ejemplos de constructos basados en CPMV160 (Cp Mv X, donde X=160).

El potenciador de la expresión puede comprender CPMVX+, donde X=160. Un ejemplo no limitante de tal potenciador es CPMV160+ (ver la Figura 1C) que comprende la secuencia de SEQ ID NO: 2 (Ut R 5': nucleótido 1-160; sitio de clonación múltiple en cursiva nucleótidos 161-176; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 177-181):

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca gggcccaata ccgcggAGAA

181 A (SEQ ID NO:2)

Los ejemplos de constructos mediante el uso de la SEQ ID NO: 2 como un potenciador de la expresión incluyen los constructos 1800, 1897, 1880, 2168, 2188, 1937, 1977, 2050, 2060, 1975, 1893, 2100, 2109, 2120, 2129 (ver los Ejemplos 3 y 5-18, respectivamente).

Como sería evidente para un experto en la técnica, puede usarse cualquier sitio de clonación múltiple (MCS) o un MCS de diferente longitud (ya sea más corto o más largo) en lugar de la secuencia en los nucleótidos 161-176 de la SEQ ID NO: 2. Además, la secuencia kozak de plantas de SEQ ID NO: 2 (mostrada en los nucleótidos 177-181) puede ser cualquier secuencia kozak de plantas, que incluye, pero no se limita a, una de las secuencias seleccionadas de las SEQ ID NO: 5-17 (ver también la Figura 4A; el constructo de la Figura 4 incluye la SEQ ID NO: 2, con variaciones de la secuencia kozak de plantas como se indica, y comprende una región reguladora de plantas unida al extremo 5' de la UTR 5', y el sitio de iniciación de la transcripción, ATG, de una secuencia de nucleótidos de interés, ubicada en dirección 3' con respecto a la secuencia kozak de plantas).

El potenciador de la expresión CPMVX, puede incluir una "A" en la posición 115 (115A), de modo que CMPVX, 115A, donde X=160, 155 o 150, comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver el documento WO 2009/087391, para la secuencia completa del segmento del genoma del ARN2 del CPMV de tipo silvestre). Un ejemplo de un potenciador de la expresión CPMVX, 115A es "CPMV 160, 115A", como se define en la SEQ ID n O: 69 (la "A" se muestra en negrita y subrayada):

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca (SEQ ID NO:69)

El potenciador de la expresión CPMVX+, también puede incluir una "A" en la posición 115 (115A), de modo que CMPVX+, 115A, donde X=160, 155 o 150, comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento WO 2009/087391). Un ejemplo no limitante de un potenciador de la expresión CPMVX+, 115A es "CPMV 160+, 115A", como se define en la SEQ ID NO: 75 (la "A" se muestra en negrita y subrayado):

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caccagtaca gggcccaata ccgcggAGAA

181 A (SEQ ID NO:75)

Como se indicó anteriormente para la SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 75, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.

Si el potenciador de la expresión consiste en los nucleótidos 1-155 de la SEQ ID NO: 1 (CPMV155):

g IiaiIIiaaaSIIC ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttgtcagat cgtgcttcgg cacea (SEQ ID NO:24),

entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 155 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV155). El constructo que comprende CPMV155 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida 3' (UTR) de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que está eliminada la secuencia kozak nativa o una porción de esta secuencia (nucleótidos 155-160 de la SEQ ID NO: 1).

El potenciador de la expresión puede comprender CPMV155+, que comprende la secuencia de SEQ ID NO: 72 (UTR 5': nucleótido 1-155; sitio de clonación múltiple en cursiva nucleótidos 156-171; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 172-176):

1 tattaaaatc TI.TIaataggCC TltgaTiaaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caceagggcc caataccgcg ^ctAGAAA

(SEQ ID NO:72)

Como se indicó anteriormente para CPMV160+ (SEQ ID NO: 2), puede usarse cualquier MCS, que incluye un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 72, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.

El potenciador de la expresión CPMV155, puede incluir una "A" en la posición 115 (115A), de modo que "CMPV155, 115a " comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver el documento WO 2009/087391), como se define por la SEQ ID NO: 70 ("A" está en negrita y subrayada):

J- ^{17 cL}t 17aaaa 1-C ¹⁷¹⁷a a 1.a g gi71 t x g a t a a a a g Cg a a c g t g g g g a a a C C C gaa CCclclclCC11.C

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg cacea (SEQ ID NO:70)

El potenciador de la expresión CPMV155+, también puede incluir una "A" en la posición 115 (115A), de modo que "CMPV155+, 115a" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento Wo 2009/087391), como se define por la SEQ ID NO: 76 (la "A" se muestra en negrita y subrayada):

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg caceagggcc caataccgcg gAGAA

181 A (SEQ ID NO:76)

Como se indicó anteriormente para SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 76, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.

Si el potenciador de la expresión consiste en los nucleótidos 1-150 de la SEQ ID NO: 1 (CPMV150):

1 Cel1.tcLcL3.3tC ttaataggtt ttgSXciclclclCJ cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttgtcagat cgtgcttcgg (SEQ ID NO:;27),

entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 150 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV150). El constructo que comprende CPMV150 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo, un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que está eliminada la secuencia kozak nativa en la posición 150-160 de la SEQ ID NO: 1.

El potenciador de la expresión puede comprender CPMV150+, que comprende la secuencia de SEQ ID NO: 73 (UTR 5': nucleótido 1-150; sitio de clonación múltiple en cursiva, nucleótidos 156-166; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 167-171):

1 t a11 aa aat c 11 aa t ag g11 t a.gat a aa ag cg aa cg t ggg g aa acc cg aa ccaaa c ca t a

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttgtcagat cgtgcttcgg gggcccaata ccgcggAGAA A

(SEQ ID N O ;73)

Como se indicó anteriormente para CPMV160+ (SEQ ID NO: 2), puede usarse cualquier MCS, lo que incluye un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 73, y la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas.

El potenciador de la expresión CPMV150, puede incluir una "A" en la posición 115 (115A), de modo que "CMPV150, 115A" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (ver documento w O 2009/087391) como se define por la SEQ ID NO: 71 (la "A" se muestra en negrita y subrayada):

1 tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg (SEQ ID NO:71)

El potenciador de la expresión CPMV150+, también puede incluir una "A" en la posición 115 (115A), de modo que "CMPV150+, 115A" comprende la secuencia del genoma del ARN2 del CPMV de tipo silvestre (documento Wo 2009/087391), como se define por la SEQ ID NO: 77 (la "A" se muestra en negrita y subrayada):

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcatgagc

121 gatcttcaac gttgtcagat cgtgcttcgg gggcccaata ccgcggRGAA

181 A (SEQ ID NO:77)

Como se indicó anteriormente para la SEQ ID NO: 2, puede usarse cualquier MCS, o un MCS de diferente longitud, en lugar de la secuencia MCS de la SEQ ID NO: 77, y la secuencia Kozak de plantas puede ser cualquier secuencia kozak de plantas.

Si el potenciador de la expresión consiste en los nucleótidos 1-114 de la SEQ ID NO: 1:

entonces una secuencia de nucleótidos de interés con una secuencia kozak de plantas ubicada en el extremo 5', adyacente a una secuencia de iniciación (ATG), puede fusionarse al extremo 3' de la UTR 5' (después del nucleótido 114 de la SEQ ID NO: 1), de modo que el constructo general se asemeja al que se muestra en la Figura 1B (CPMV114). El constructo que comprende CPMV1114 puede comprender además una región reguladora unida operativamente al extremo 5' del potenciador de la expresión y una secuencia que codifica una UTR 3', por ejemplo una región no traducida (UTR) 3' de comovirus o una UTR 3' de plastocianina, y una secuencia terminadora, por ejemplo un terminador NOS, fusionada al extremo 3' de la secuencia de nucleótidos de interés. En este ejemplo, la secuencia de nucleótidos de interés comprende una secuencia kozak de plantas en su extremo 5', ya que existe una secuencia de tipo kozak en dirección 5' con respecto al nucleótido 114 de la SEQ ID NO: 1.

El potenciador de la expresión puede comprender CPMV114+, que comprende la secuencia de SEQ ID NO: 74 (UTR 5': nucleótido 1-114; sitio de clonación múltiple en cursiva, nucleótidos 115-130; secuencia kozak de plantas en mayúsculas y negrita, nucleótidos 131-135):

1 2 a a t ac c gc gg AGAAA

(SEQ ID NO:74)

El potenciador de la expresión también puede comprender los nucleótidos 1-160 de la SEQ ID NO: 1, fusionado con una secuencia kozak de plantas ubicada aguas abajo a partir de la posición 160 de la SEQ ID NO: 1. La secuencia kozak de plantas puede ubicarse inmediatamente adyacente al nucleótido 160 de la SEQ ID NO: 1, o el potenciador de la expresión puede comprender un fragmento de relleno de aproximadamente 0 a aproximadamente 500 nucleótidos, o cualquier cantidad entre ellos, ubicado inmediatamente adyacente al nucleótido 160 de la SEQ ID NO: 1 (CPMVX+) y la secuencia kozak de plantas unida al extremo 3' del fragmento de relleno. El fragmento de relleno puede comprender un sitio de clonación múltiple (MCS) de aproximadamente 4 a 100 nucleótidos o cualquier cantidad entre ellos, y una secuencia de nucleótidos de interés que comprende una secuencia kozak de plantas y un sitio de clonación correspondiente en su extremo 5' puede unirse operativamente al potenciador de la expresión de CMPVX mediante el uso de MCS, o el fragmento de relleno puede comprender un sitio de clonación múltiple de aproximadamente 4 a 100 nucleótidos fusionados a una secuencia kozak de plantas, y una secuencia de nucleótidos de interés puede fusionarse al potenciador de la expresión inmediatamente aguas abajo de la secuencia kozak de plantas. Preferentemente, el fragmento de relleno no comprende una secuencia que codifica una proteína M.

Un ejemplo, que no debe considerarse limitante, de un constructo, que comprende en serie, una región reguladora de plantas fusionada a una UTR 5' de CPMV que consiste en los nucleótidos 1-160 de la SEQ ID NO: 1, que está fusionada a un fragmento de relleno es CPMV160+ como se muestra en la Figura 1C (en la Figura 1C, el sitio de inicio ATG de la secuencia de nucleótidos de interés "GOI", también se muestra para mayor claridad). En este ejemplo, el fragmento de relleno está fusionado al extremo 3' de la secuencia CPMV 1-160 y comprende, en serie, un sitio de clonación múltiple fusionado a una secuencia kozak de plantas (en este ejemplo, que no debe considerarse limitante, la secuencia kozak de plantas es: AGAAA). El fragmento de relleno no comprende ninguna secuencia que codifica una proteína M. Si el constructo CPMV 160+ está fusionado a una secuencia de nucleótidos de interés (como se muestra en la Figura 1C), entonces la secuencia kozak de plantas está ubicada en dirección 5' con respecto a la secuencia de nucleótidos de interés, y adyacente al sitio de iniciación ATG de la secuencia de nucleótidos de interés. Como apreciará un experto en la técnica, el sitio de clonación múltiple puede comprender uno o más de un sitio de restricción adecuado, y la secuencia del sitio de clonación múltiple no está limitada al ejemplo mostrado en la Figura 1C. Además, la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas y no se limita a la secuencia mostrada en la Figura 1C. Los números de constructo 1800, 1897, 1880, 2168, 2188, 1937, 1977, 2050, 2060, 1975, 1893, 2100, 2109, 2120, 2129 (ver los Ejemplos 3 y 5-18, respectivamente) son ejemplos de constructos basados en CPMV160+ (CPMVX+, donde X=160).

También se muestran en la Figura 1C ejemplos de potenciadores de la expresión CPMV155+, CPMV150+ y CPMV114+, cada uno de los cuales comprende los nucleótidos 1-155, 1-150 o 1-114 de la SEQ ID NO: 1, respectivamente, fusionados a un fragmento de relleno de manera similar al descrito para CPMV160+, arriba. En la Figura 1C, el sitio de inicio ATG de la secuencia de nucleótidos de interés (GOI) también se muestra para cada CPMV155+, CPMV150+ y CPMV 114+. En estos ejemplos, el fragmento de relleno está fusionado al extremo 3' de la secuencia potenciadora de CPMV que comprende, en serie, un sitio de clonación múltiple fusionado a una secuencia kozak de plantas. El fragmento de relleno no comprende ninguna secuencia que codifica una proteína M. Como apreciará un experto en la técnica, el sitio de clonación múltiple puede comprender uno o más de un sitio de restricción adecuado, y la secuencia del sitio de clonación múltiple no está limitada a los ejemplos mostrados en la Figura 1C. Además, la secuencia kozak de plantas puede ser cualquier secuencia kozak de plantas y no está limitada a la secuencia mostrada en la Figura 1C (AGAAA).

El potenciador de la expresión también puede comprender el potenciador de la expresión CPMVX, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1, en combinación con un sitio de clonación múltiple (polienlazador, sitio de restricción; sitio de clonación) fusionado al extremo 3' de la secuencia UTR 5', y que carece de una secuencia kozak de plantas (es decir, CPMVX+, donde X=160, 155, 150 o 114 de la SEQ ID NO: 1). En estos casos, la secuencia de ácido nucleico que codifica una proteína de interés (secuencia de nucleótidos de interés) que se unirá al potenciador, comprenderá, en serie desde el extremo 5' al extremo 3' de la secuencia de nucleótidos de interés, un sitio de clonación múltiple (complementario con el fragmento de relleno; el fragmento de relleno no comprende ninguna secuencia que codifica una proteína M) fusionado a una secuencia kozak de plantas ubicada aguas arriba y adyacente a un sitio de iniciación ATG (sitio de inicio de la transcripción) de la secuencia de nucleótidos de interés.

El potenciador de la expresión puede comprender además una o más "secuencia consenso kozak" o "secuencia kozak". Las secuencias kozak juegan un papel importante en la iniciación de la traducción. La tasa de traducción puede optimizarse al asegurar que cualquier secuencia de inestabilidad de ARNm se elimine del constructo transgénico y que el sitio de inicio de la traducción o el sitio de iniciación coincida con el consenso Kozak para plantas (Gutierrrez, R.A. y otros, 1999, Trends Plant Sci. 4, 429-438; Kawaguchi, R. y Bailey-Serres, J., 2002, Curr. Opin. Plant Biol. 5, 460-465). La posición más altamente conservada en este motivo es la purina (que es más a menudo una A) tres nucleótidos aguas arriba del codón ATG, lo que indica el inicio de la traducción (Kozak, M., 1987, J. Mol. Biol. 20: 947-950). Las secuencias consenso Kozak en plantas se conocen en la técnica (ver, por ejemplo, Rangan y otros, Mol. Biotechnol., 2008, julio 39(3), págs. 207-213). Tanto las secuencias Kozak sintéticas como las naturales pueden usarse en el potenciador de la expresión o pueden fusionarse a la secuencia de nucleótidos de interés como se describe en la presente descripción.

La secuencia kozak de plantas puede ser cualquier secuencia kozak conocida de plantas (ver, por ejemplo, L. Rangan y otros, Mol. Biotechnol., 2008, julio 39(3), pp. 207-213), que incluye, pero no se limita a, las siguientes secuencias consenso de plantas:

caA(A/C)a (SEQ ID NO: 5; reino vegetal)

aaA(A/C)a (SEQ ID NO: 6; dicotiledóneas)

aa(A/G)(A/C)a (SEQ ID NO: 7; arabidopsis)

La secuencia kozak de plantas también puede seleccionarse del grupo de (ver la Figura 4):

AGAAA (SEQ ID NO: 8)

AGACA (SEQ ID NO: 9)

AGGAA (SEQ ID NO: 10)

AAAAA (SEQ ID NO: 11)

AAACA (SEQ ID NO: 12)

AAGCA (SEQ ID NO: 13)

AAGAA (SEQ ID NO: 14)

AAAGAA (SEQ ID NO: 15)

AAAGAA (SEQ ID NO: 16)

(A/-)A(A/G)(A/G)(A/C)A. (SEQ ID NO: 3; Secuencia consenso)

El potenciador de la expresión puede comprender además uno o más "sitio(s) de restricción" o "sitio(s) de reconocimiento de restricción", "sitio(s) de clonación múltiple", "MCS", "sitio(s) de clonación" "secuencia polienlazadora" o "polienlazador" para facilitar la inserción del nucleótido de interés en el sistema de expresión en plantas. Los sitios de restricción son motivos de secuencia específicos que son reconocidos por enzimas de restricción como se conoce bien en la técnica. El potenciador de la expresión puede comprender uno o más sitios de restricción o sitios de clonación que se ubican aguas abajo (3') de la UTR 5'. El uno o más sitios de restricción o sitios de clonación pueden ubicarse además aguas arriba (5') de una o más secuencias kozak, y ubicarse entre una UTR 5' y una secuencia kozak. La secuencia polienlazadora (sitio de clonación múltiple) puede comprender cualquier secuencia de ácidos nucleicos que sea útil para añadir y eliminar secuencias de ácidos nucleicos, lo que incluye una secuencia de nucleótidos que codifica una proteína de interés, en el extremo 3' de la UTR 5'. Una secuencia polienlazadora puede comprender de 4 a aproximadamente 100 ácidos nucleicos, o cualquier cantidad entre ellos.

El potenciador de la expresión también puede comprender la secuencia de SEQ ID NO: 1 en asociación operativa con una región reguladora de plantas y un sitio de inicio de la transcripción (ATG) fusionado a una secuencia de nucleótidos de interés (GOI), como se muestra en la Figura 1B (CPMVX; donde X=160, 155, 150 o 114). CPMVX también puede comprender cualquier secuencia kozak de plantas que incluye, pero no se limita a, una de las secuencias de las s Eq ID NO: 5-17.

La UTR 5' para su uso en el potenciador de la expresión descrito en la presente descripción (CPMVX o CPMVX+, donde X=160, 155, 150 o 144), puede derivarse a partir de un virus de a Rn bipartito, por ejemplo, del segmento del genoma de ARN-2 de un virus de ARN bipartito, tal como un comovirus, siempre que muestre 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1 y 2. Por ejemplo, la secuencia potenciadora puede tener de aproximadamente 80 % a aproximadamente 100 % de identidad con la secuencia de las SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, de aproximadamente 90 % a aproximadamente 100 % de identidad con la secuencia de las SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, aproximadamente 95 % a aproximadamente 100 %, de identidad con la secuencia de SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, o aproximadamente 98 % a aproximadamente 100 %, de identidad con la secuencia de SEQ ID NO: 1 y 2, o cualquier cantidad intermedia, en donde el potenciador de la expresión, cuando está unido operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión cuando se compara con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.

La SEQ ID NO: 4 comprende un potenciador de la expresión CPMV HT como se conoce en la técnica anterior (por ejemplo, la Figura 1 de Sainsbury y Lomonossoff 2008, Plant Physiol. 148: págs. 1212-1218). El "CPMV HT" incluye la secuencia UTR 5' de los nucleótidos 1-160 de la SEQ ID NO: 4 con nucleótidos modificados en las posiciones 115 (cgt) y 162 (acg), y una proteína M incompleta, y carece de una secuencia kozak de plantas (UTR 5': nucleótidos 1-160; proteína M incompleta subrayada, nucleótidos 161-509). La SEQ ID NO: 4 incluye, además, un sitio de clonación múltiple (cursiva, nucleótidos 510-528) que no está presente en la secuencia de CPMV HT de la técnica anterior:

tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa ccaaaccttc

61 ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ttgcgtgagc

121 gatcttcaac gttqtcaqat cqtqcttcqq caccagtaca acqrttttctt tcactqaaqc

181 gaaatcaaag atctctttqt qqacacqtaq tqcqqcqcca ^l.1.aaa "caacq tqtacttqtc

241 ctattcttgt cqqtqtqqtc ttqqqaaaaq aaaqcttqct qqaqqctqct qttcaqcccc

301 atacattact tqttacqatt ctqctqactt tcqqcqqqtq caatatctct acttctqctt

361 qacqaqqtat tqttqcctqt acttctttct tcttcttctt qctqattqqt ^{t e}Laraaqaa

421 atctagtatt ttctttqaaa cagaqttttc ccqtqqtttt cgaacttqqa qaaaqattqt

481 taagcttctg tatattctqc ccaaatttgt cgqgccc SEQ ID NO: 4

Los constructos que comprenden CPMV HT se usan en la presente descripción como constructos de referencia, de modo que pueden compararse los niveles de expresión de una secuencia de nucleótidos de interés, o un producto codificado por la secuencia de nucleótidos de interés producida mediante el uso de un constructo que comprende CPMVX o CPMVX+. Los constructos 1391, 484, 489, 2140, 2130, 1039, 1067, 2072, 2074, 1445, 1454, 5001, 5002, 5021 y 5022 (ver los Ejemplos 1 y 5-18, respectivamente) comprenden el constructo de referencia CPMV HT.

Como se muestra en las Figuras 2-5, el uso de los potenciadores de la expresión como se describe en la presente descripción da como resultado un aumento de la expresión de la secuencia de nucleótidos de interés, cuando se compara con la expresión de la misma secuencia de nucleótidos de interés mediante el uso del mismo promotor y las secuencias de UTR 3' y terminadoras. Por ejemplo, con referencia a las Figuras 2, 3 y 5, se muestra una comparación de la expresión de las proteínas producidas en plantas que comprenden constructos de expresión de CPMV-HT (técnica anterior) y constructos de expresión basados en CPMV160+, unidos operativamente con:

H1 A/California/07/2009 ("PDI-H1 Cal", o "H1 A/California/07/2009"): número de constructo 1897 basado en CPMV160+, número de constructo 484 basado en CPMV HT número (ver el Ejemplo 5);

H3 A/Victoria/361/2011 ("PDI-H3 Vic" o "H3 A/Victoria/361/2011"): número de constructo 1800 basado en CPMV160+; número de constructo 1391 basado en CPMV HT (ver los Ejemplos 1 y 2, respectivamente); H5 de Influenza A/Indonesia/5/2005 con un péptido señal nativo (WtSp-H5 Indo): número de constructo 1880 basado en CPMV160+; número de constructo 489 basado en CPMV HT (ver el Ejemplo 6);

B/Wisconsin/1/2010 con bucle proteolítico eliminado y con un péptido señal nativo ("WtSp-B Wis-PrL", o "B/Wisconsin/1/2010"): número de constructo 1975 basado en CPMV160+; número de constructo 1445 basado en CPMV HT (ver el Ejemplo 13);

B Brisbane/60/08 con bucle proteolítico eliminado y con un péptido señal PDI ("B Brisbane/60/08"): número de constructo 1937 basado en CPMV160+; número de constructo 1039 basado en CMPV HT (ver el Ejemplo 9); B Brisbane/60/08+H1Tm, con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Brisbane/60/08+H1Tm"): número de constructo 1977 basado en Cp Mv 160+; constructo 1067 basado en CMPV HT (ver el Ejemplo 10),

B Massachusetts/2/2012 2012 con bucle proteolítico eliminado y con un péptido señal PDI ("B Massachusetts/2/2012 2012"): número de constructo 2050 basado en CPMV160+; número de constructo 2072 basado en CPMV HT (ver el Ejemplo 11),

B Massachusetts/2/2012+H1Tm con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con un péptido señal PDI ("B Massachusetts/2/2012+H1Tm"): número de constructo 2060 basado en CPMV160+; número de constructo 2074 basado en CPMV HT (ver el Ejemplo 12),

B Wisconsin/1/2010+H1Tm con bucle proteolítico eliminado fusionado al dominio transmembrana y la cola citoplasmática y con el péptido señal nativo ("B Wisconsin/1/2010+H1Tm"): número de constructo 1893 basado en CPMV160+; constructo 1454 basado en CPMV HT (ver el Ejemplo 14);

Rituximab (Rituxan) bajo el control de CPMV-HT con un péptido señal nativo o PDI ("CPMV-HT/SP tipo silvestre" y "CPMV-HT/PDISP"; números de constructo 5001 y 5002, respectivamente, ver los ejemplos 15 y 16) o CPMV160+ ("CPMV 160+/SP tipo silvestre" y "CPMV 160+/PDISP"; números de constructo 2100 y 2109, respectivamente, ver los ejemplos 15 y 16).

En cada caso, la expresión (determinada como actividad de hemoaglutinación o expresión de rituximab (Rituxan) según sea el caso) aumenta en el constructo basado en CMPV160+ en comparación con la del constructo basado en CPMV de la técnica anterior. Además, varias de las secuencias de nucleótidos de interés codificaron proteínas quiméricas o modificadas, por ejemplo, que comprenden péptidos señal heterólogos (por ejemplo, PDI), secuencias de la cola citoplasmática del dominio transmembrana heterólogo (TDCT) y/o secuencias modificadas que incluyen un bucle proteolítico eliminado (PrL-).

El aumento de la expresión observado mediante el uso de constructos basados en CPMV160+ también se observa si la secuencia kozak de plantas usada en los constructos basados en CPMV160+ anteriores se reemplaza con otras secuencias kozak de plantas, por ejemplo, una de esas secuencias kozak de plantas definidas en las SEQ ID NO: 8-16. Por ejemplo, con referencia a la Figura 4, se muestra una comparación de la expresión de las proteínas producidas en plantas que comprenden constructos de expresión basados en CPMV160+, unidos operativamente con una secuencia de nucleótidos de interés (H3 A/Victoria/361) cada una fusionada a diversas secuencias kozak de plantas. En cada caso, la expresión (determinada como título de hemoaglutinación) del constructo basado en CMPV160+ demuestra niveles de expresión significativos y mayores que el constructo basado en CMPV HT de la técnica anterior.

Los términos "por ciento de similitud" o "por ciento de identidad" cuando se refieren a una secuencia particular se usan, por ejemplo, como se expone en el programa de software GCG de la Universidad de Wisconsin, o mediante alineamiento manual e inspección visual (ver, por ejemplo, Current Protocols in Molecular Biology, Ausubel y otros, Eds. Suplemento de 1995). Los métodos de alineamiento de secuencias para la comparación se conocen bien en la técnica. Puede realizarse un alineamiento óptimo de secuencias para la comparación, mediante el uso de, por ejemplo, el algoritmo de Smith y Waterman, (1981, Adv. Appl. Math. 2:482), mediante el algoritmo de alineamiento de Needleman y Wunsch, (1970, J. Mol. Biol. 48: 443), mediante el método de búsqueda de similitud de Pearson y Lipman, (1988, Proc. Nat'l. Acad. Sci. USA 85: 2444), mediante implementaciones computarizadas de estos algoritmos (por ejemplo: GAP, BESTFIT, FASTA y TFASTA en el paquete de software de Wisconsin Genetics, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).

Un ejemplo de un algoritmo adecuado para determinar el por ciento de identidad de secuencia y similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul y otros, (1977, Nuc. Acids Res. 25: 3389-3402) y Altschul y otros, (1990, J. Mol. Biol. 215: 403-410), respectivamente. Se usan BLAST y BLAST 2.0, con los parámetros descritos en la presente descripción, para determinar el por ciento de identidad de secuencia para los ácidos nucleicos y las proteínas. Por ejemplo, el programa BLASTN (para secuencias de nucleótidos) puede usar como valores predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=-4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP puede usar como valores predeterminados una longitud de palabra de 3 y una expectativa (E) de 10, y la matriz de puntuación BLOSUM62 (ver Henikoff y Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) alineamientos (B) de 50, expectativa (E) de 10, M=5, N=-4, y una comparación de ambas cadenas. El software para realizar el análisis BLAST está disponible públicamente a través del National Center for Biotechnology Information (ver la URL: ncbi.nlm.nih.gov/).

Una secuencia de nucleótidos de interés que codifica una proteína requiere la presencia de un "sitio de iniciación de la traducción" o "sitio de iniciación" o "sitio de inicio de la traducción" o "sitio de inicio" o "codón de inicio" ubicado aguas arriba del gen que va a expresarse. Dichos sitios de iniciación pueden proporcionarse ya sea como parte de una secuencia potenciadora o como parte de una secuencia de nucleótidos que codifica la proteína de interés.

"Casete de expresión" se refiere a una secuencia de nucleótidos que comprende un ácido nucleico de interés bajo el control de, y unido operablemente (u operativamente) a, un promotor apropiado u otros elementos reguladores para la transcripción del ácido nucleico de interés en una célula huésped.

Por "bucle proteolítico" o "sitio de escisión" se entiende la secuencia consenso del sitio proteolítico que está implicada en la escisión del precursor HA0. "Consenso" o "secuencia consenso", como se usa en la presente descripción, significa una secuencia (secuencia de aminoácidos o de nucleótidos) que comprende la variabilidad de secuencia de las secuencias relacionadas basado en el análisis de alineamiento de secuencias múltiples, por ejemplo, subtipos de una secuencia particular de HA0 de la influenza. La secuencia consenso del sitio de escisión de HA0 de la influenza puede incluir secuencias de aminoácidos de hemaglutinina consenso de influenza A, que incluyen, por ejemplo, secuencias de aminoácidos de hemaglutinina consenso de H1, consenso de H3, consenso de H5 o consenso de influenza B, por ejemplo, pero no se limitan a, B Florida, B Malaysia, B Wisconsin y B Massachusetts. Los ejemplos no limitantes de secuencias de la región del bucle proteolítico se muestran en las Figuras 15 y 18B de la solicitud provisional de los EE. UU. núm. 61/806,227 (presentada el 28 de marzo de 2013; ver también Bianchi y otros, 2005, Journal of Virology, 79: 7380-7388).

Los residuos en el bucle proteolítico o en el sitio de escisión pueden estar mutados, por ejemplo, pero no limitado a, mutación puntual, sustitución, inserción o eliminación. El término "mutación de aminoácidos" o "modificación de aminoácidos" como se usa en la presente descripción pretende abarcar sustituciones, deleciones, inserciones y modificaciones de aminoácidos. Puede realizarse cualquier combinación de sustitución, deleción, inserción y modificación como se describe en la solicitud provisional de los EE. UU. núm. 61/806,227 (presentada el 28 de marzo de 2013) para llegar al constructo final, siempre y cuando el constructo final posea las características deseadas, por ejemplo, escisión reducida o abolida del bucle proteolítico o sitio de escisión por una proteasa.

Como se describe en la presente descripción, se proporciona un constructo de ácido nucleico (sistema de expresión) que comprende una secuencia potenciadora de la expresión unida operativamente a una secuencia de nucleótidos de interés que codifica una proteína de interés. También se proporcionan sistemas de expresión en plantas que comprenden una secuencia potenciadora como se describe en la presente descripción. También se proporciona un sistema de expresión en plantas que comprende una región reguladora de plantas, en asociación operativa con una secuencia potenciadora que está unida operativamente a una secuencia de nucleótidos de interés, donde la secuencia de nucleótidos de interés codifica una proteína de interés. La secuencia potenciadora puede seleccionarse de cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.

La secuencia potenciadora de la presente descripción puede usarse para expresar una proteína de interés en un organismo huésped, por ejemplo, una planta. En este caso, la proteína de interés también puede ser heteróloga para el organismo huésped en cuestión e introducirse en las células vegetales mediante el uso de técnicas de transformación conocidas en la técnica. Un gen heterólogo en un organismo puede reemplazar un gen endógeno equivalente, es decir, uno que normalmente realiza la misma función o una función similar, o la secuencia insertada puede ser adicional al gen endógeno u otra secuencia.

La secuencia potenciadora unida operativamente a una secuencia de nucleótidos de interés también puede estar unida operativamente al promotor, o región reguladora de plantas, y una UTR 3' y secuencias terminadoras. La secuencia potenciadora puede definirse mediante, por ejemplo, cualquiera de las SEQ ID NO: 1, 2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77. Por lo tanto, la secuencia de nucleótidos de interés está ubicada entre la secuencia potenciadora y la secuencia de terminación (ver la Figura 1A). El potenciador de la expresión o la secuencia de nucleótidos de interés pueden comprender una secuencia kozak de plantas.

La descripción proporciona además un casete de expresión que comprende en serie, un promotor o una región reguladora de plantas, unida operativamente a una secuencia potenciadora de la expresión como se describe en la presente descripción que está fusionada con una secuencia de nucleótidos de interés, una secuencia UTR 3' y una secuencia terminadora. La secuencia potenciadora puede definirse mediante, por ejemplo, cualquiera de las s Eq ID NO: 1,2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que exhibe 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se establece en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77. El potenciador de la expresión o la secuencia de nucleótidos de interés pueden comprender una secuencia kozak de plantas.

Como apreciaría un experto en la técnica, la secuencia de terminación (terminadora) puede ser cualquier secuencia que está activa en la planta huésped, por ejemplo, la secuencia de terminación puede derivarse del segmento del genoma del ARN-2 de un virus de ARN bipartito, por ejemplo, un comovirus, o la secuencia de terminación puede ser un terminador NOS.

Los constructos de la presente descripción pueden comprender además una región no traducida (UTR) 3'. Una región no traducida 3' contiene una señal de poliadenilación y cualquier otra señal reguladora capaz de efectuar el procesamiento del ARNm o la expresión génica. La señal de poliadenilación se caracteriza generalmente por efectuar la adición de pistas de ácido poliadenílico al extremo 3' del precursor de ARNm. Las señales de poliadenilación se reconocen comúnmente por la presencia de homología con la forma canónica 5' AATAAA-3', aunque las variaciones no son infrecuentes. Ejemplos no limitantes de regiones 3' adecuadas son las regiones no traducidas transcritas en 3' que contienen una señal de poliadenilación de genes del plásmido inductor de tumores (Ti) de Agrobacterium, tal como la nopalina sintasa (gen Nos) y genes vegetales tales como los genes de la proteína de almacenamiento de la soja, la subunidad pequeña del gen de la ribulosa-1,5-bisfosfato carboxilasa (ssRUBISCO; documento US 4,962,028), el promotor usado para regular la expresión de plastocianina (Pwee y Gray 1993). La secuencia de terminación (terminadora) puede obtenerse de la UTR 3' del gen de la plastocianina de alfalfa.

Por "secuencia de nucleótidos (o ácido nucleico) de interés", o "región codificante de interés", se entiende cualquier secuencia de nucleótidos, o región codificante (estos términos pueden usarse indistintamente) que se expresará dentro de un organismo huésped, por ejemplo, una planta, para producir una proteína de interés. Dicha secuencia de nucleótidos de interés puede codificar, pero no se limita a, proteínas nativas o modificadas, una enzima industrial o una enzima industrial modificada, una proteína agrícola o una proteína agrícola modificada, una proteína auxiliar, un suplemento proteico, una proteína farmacéuticamente activa, un nutracéutico, un producto de valor agregado o un fragmento del mismo para piensos, alimentos o tanto para piensos como para uso alimentario.

La proteína de interés puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal. Por ejemplo, el péptido señal puede ser un péptido señal de proteína disulfuro isomerasa (PDI). El péptido señal nativo puede corresponder al de la proteína de interés que se expresa.

La secuencia de nucleótidos de interés, o la región codificante de interés también puede incluir una secuencia de nucleótidos que codifica una proteína farmacéuticamente activa, por ejemplo factores de crecimiento, reguladores del crecimiento, anticuerpos, antígenos y fragmentos de los mismos, o sus derivados útiles para la inmunización o vacunación y similares. Tales proteínas incluyen, pero no se limitan a, una proteína que es un patógeno humano, una proteína viral, por ejemplo, pero no limitado a, antígenos que forman VLP, una o más proteínas del virus sincitial respiratorio (RSV), rotavirus, virus de la influenza, virus de la inmunodeficiencia humana (VIH), virus de la rabia, virus del papiloma humano (HPV), enterovirus 71 (EV71) o interleucinas, por ejemplo, una o más de una de IL-1 a IL-24, IL-26 e IL-27, citocinas, eritropoyetina (EPO), insulina, G-CSF, GM-Cs F, hPG-CSF, M-CSF o combinaciones de los mismos, interferones, por ejemplo, interferón alfa, interferón beta, interferón gamma, factores de coagulación de la sangre, por ejemplo, Factor VIII, Factor IX o tPA hGH, receptores, agonistas de receptores, anticuerpos, por ejemplo, pero no limitado a, rituximab (Rituxan), neuropolipéptidos, insulina, vacunas, factores de crecimiento, por ejemplo, pero no limitado a, factor de crecimiento epidérmico, factor de crecimiento de queratinocitos, factor de crecimiento de transformación, reguladores del crecimiento, antígenos, autoantígenos, fragmentos de los mismos o combinaciones de los mismos.

La proteína de interés también puede incluir una hemaglutinina de influenza (HA; ver el documento WO 2009/009876). La HA es una glicoproteína de membrana de tipo I homotrimérica, que generalmente comprende un péptido señal, un dominio HA1 y un dominio HA2 que comprende un sitio de anclaje que abarca la membrana en el extremo C-terminal y una cola citoplasmática pequeña. Las secuencias de nucleótidos que codifican HA se conocen bien y están disponibles (ver, por ejemplo, la Base de Datos BioDefense and Public Health (Influenza Research Database; Squires y otros, 2008 Nucleic Acids Research 36:D497-D503) en URL:

biohealth-base.org/GSearch/home.do?decorator=Influenza; o las bases de datos mantenidas por el National Center for Biotechnology Information (ver URL: ncbi.nlm.nih.gov).

Una proteína HA puede ser de una influenza tipo A, una influenza tipo B o es un subtipo de HA de influenza tipo A seleccionada del grupo de H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16. La HA puede ser de una influenza tipo A, seleccionada del grupo H1, H2, H3, H5, H6, H7 y H9. Los fragmentos de las HA enumeradas anteriormente también pueden considerarse una proteína de interés. Además, los dominios de un tipo o subtipo de las HA enumeradas anteriormente pueden combinarse para producir HA quiméricas (ver, por ejemplo, el documento WO2009/076778).

Los ejemplos de subtipos que comprenden proteínas HA incluyen A/Nueva Caledonia/20/99 (H1N1), A/Indonesia/5/2006 (H5N1), A/pollo/Nueva York/1995, A/gaviota argéntea/DE/677/88 (H2N8), A/Texas/32/2003, A/ánade/MN/33/00, A/pato/Shanghai/1/2000, A/ánade rabudo/TX/828189/02, A/Pavo/Ontario/6118/68 (H8N4), A/pato cuchareta/Irán/G54/03, A/pollo/Alemania/N/1949 (H10N7), A/pato/Inglaterra/56 (H11N6), A/pato/Alberta/60/76 (H12N5), A/Gaviota/Maryland/704/77 (H13N6), A/Ánade/Gurjev/263/82, A/pato/Australia/341/83 (H15N8), A/gaviota de cabeza negra/Suecia/5/99 (H16N3), B/Lee/40, C/Johannesburgo/66, A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/2006 (H1N1), A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), B/Malasia/2506/2004, B/Florida/4/2006, A/Singapur/1/57 (H2N2), A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1), A/Cerceta/Hong-Kong/W312/97 (H6N1), A/Equino/Praga/56 (H7N7), A/Hong Kong/1073/99 (H9N2)).

La proteína HA puede ser un subtipo H1, H2, H3, H5, H6, H7 o H9. Por ejemplo, la proteína H1 puede ser de la cepa A/Nueva Caledonia/20/99 (H1N1), A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/Cepa 2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 también puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/Nueva York/39/2012 (H3N2) o A/Perth/16/2009 (H3N2). La proteína H2 puede ser de la cepa A/Singapur/1/57 (H2N2). La proteína H5 puede ser de la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1) o A/Indonesia/5/2005. La proteína H6 puede ser de la cepa A/Cerceta/Hong Kong/W312/97 (H6N1). La proteína H7 puede ser de la cepa A/Equino/Praga/56 (H7N7), o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9) o A/Shanghai/2/2013 (H7N9). La proteína H9 es de la cepa A/HongKong/1073/99 (H9N2). La proteína HA puede provenir de un virus de la influenza que puede ser un virus tipo B, que incluye virus similar a B/Malasia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje de Yamagata) o B/Wisconsin/1/2010 (linaje de Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, h 9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, Wo 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.

La HA también puede ser una HA quimérica, en donde un dominio transmembrana nativo de HA se reemplaza por un dominio transmembrana heterólogo. El dominio transmembrana de las proteínas HA está muy conservado (ver, por ejemplo, la Figura 1C del documento WO 2010/148511). El dominio transmembrana heterólogo puede obtenerse de cualquier dominio transmembrana de HA, por ejemplo, pero no limitado a, el dominio transmembrana de H1 California, B/Florida/4/2006 (Número de acceso de GenBank ACA334 93.1), B/Malasia/2506/2004 (Número de acceso de GenBank ABU99194.1), H1/Bri (Número de acceso de GenBank ADE28750.1), H1 A/Islas Salomón/3/2006 (Número de acceso de GenBank ABU99109.1), H1/NC (Número de acceso de GenBank AAP34 324.1), H2 A/Singapur/1/1957 (Número de acceso de GenBank AAA64366.1), H3 A/Brisbane/10/2007 (Número de acceso de GenBank ACI26318.1), H3 A/Wisconsin/67/2005 (Número de acceso de GenBank ABO37599.1), H5 A/Anhui/1/2005 (Número de acceso de GenBank ABD28180.1), H5 A/Vietnam/1194/2004 (Número de acceso de GenBank ACR48874.1), H5-Indo (Número de acceso de GenBank ABW06108.1). El dominio transmembrana también puede definirse por la siguiente secuencia de aminoácidos consenso:

iLXiYystvAiSslXlXXmlagXsXwmcs (SEQ ID NO: 78)

La HA puede comprender un péptido señal nativo o no nativo; el péptido señal no nativo puede ser de origen vegetal. El péptido señal nativo puede corresponder al de la hemaglutinina que se expresa o puede corresponder a una segunda hemaglutinina. Adicionalmente, el péptido señal puede ser de una proteína estructural o hemaglutinina de un virus distinto de la influenza. Ejemplos no limitantes de un péptido señal que puede usarse es el de la proteína disulfuro isomerasa de alfalfa (SP de PDI; nucleótidos 32-103 del número de acceso Z11499) o el péptido señal de patatina (SP de PatA; ubicado en los nucleótidos 1738 - 1806 de núm. de acceso de GenBank A08215). La secuencia de nucleótidos de SP de PatA para este número de acceso es:

ATGGCAACTACTAAAACTTTTTTAATTTTATTTTTTATGATATTAGCAACTACTAGTTCAACATGTGCT (SEQ ID NO: 79)

la secuencia de aminoácidos del péptido señal de patatina A es:

MATTKTFLILFFMILATTSSTCA (SEQ ID NO: 80)

La presente descripción también proporciona moléculas de ácido nucleico que comprenden secuencias que codifican una proteína HA. Las moléculas de ácido nucleico pueden comprender además una o más regiones reguladoras unidas operativamente a la secuencia que codifica una proteína HA. Las moléculas de ácido nucleico pueden comprender una secuencia que codifica una H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16 o hA de influenza tipo B. Por ejemplo, la proteína HA codificada por la molécula de ácido nucleico puede ser un subtipo H1, H2, H3, H5, H6, H7, H9, una HA de tipo B. La proteína H1 codificada por el ácido nucleico puede ser de la cepa A/Nueva Caledonia/20/99 (H1N1), A/Puerto Rico/8/34 (H1N1), A/Brisbane/59/2007 (H1N1), A/Islas Salomón 3/2006 (H1N1), A/California/04/2009 (H1N1) o A/California/07/2009 (H1N1). La proteína H3 codificada por la molécula de ácido nucleico puede ser de la cepa A/Brisbane 10/2007 (H3N2), A/Wisconsin/67/2005 (H3N2), A/Victoria/361/2011 (H3N2), A/Texas/50/2012 (H3N2), A/Hawaii/22/2012 (H3N2), A/Nueva York/39/2012 (H3N2) o A/Perth/16/2009 (H3N2). La proteína H2 codificada por la molécula de ácido nucleico puede ser de la cepa A/Singapur/1/57 (H2N2). La proteína H5 codificada por la molécula de ácido nucleico puede ser la cepa A/Anhui/1/2005 (H5N1), A/Vietnam/1194/2004 (H5N1) o A/Indonesia/5/2005. La proteína H6 codificada por la molécula de ácido nucleico puede ser de la cepa A/Cerceta/Hong-Kong/W312/97 (H6N1). La proteína H7 codificada por la molécula de ácido nucleico puede ser de la cepa A/Equino/Praga/56 (H7N7) o H7 A/Hangzhou/1/2013, A/Anhui/1/2013 (H7N9) o A/Shanghai/2/2013 (H7N9). Adicionalmente, la proteína H9 codificada por la molécula de ácido nucleico puede ser de la cepa A/Hong Kong/1073/99 (H9N2). La proteína HA codificada por la molécula de ácido nucleico puede ser de un virus de la influenza tipo B, que incluye virus similar a B/Malasia/2506/2004, B/Florida/4/2006, B/Brisbane/60/08, B/Massachusetts/2/2012 (linaje Yamagata) o B/Wisconsin/1/2010 (linaje Yamagata). Los ejemplos no limitantes de secuencias de aminoácidos de las proteínas HA de los subtipos H1, H2, H3, H5, H6, H7, H9 o B incluyen secuencias como se describe en los documentos WO 2009/009876, WO 2009/076778, WO 2010/003225. La proteína HA del virus de la influenza puede ser H5 Indonesia.

Tabla 1: EiemDlos de constructos aue se han DreDarado como se describe en la Dresente descriDción:

Si la secuencia de ácido nucleico de interés codifica un producto que es directa o indirectamente tóxico para la planta, entonces dicha toxicidad puede reducirse al expresar selectivamente la secuencia de nucleótidos de interés dentro de un tejido deseado o en una etapa deseada del desarrollo de la planta.

La región codificante de interés o la secuencia de nucleótidos de interés puede expresarse en cualquier planta huésped adecuada que esté transformada o comprenda las secuencias de nucleótidos, o moléculas de ácido nucleico, o constructos genéticos o vectores de la presente descripción. Los ejemplos de huéspedes adecuados incluyen, pero no se limitan a, Arabidopsis, cultivos agrícolas que incluyen, por ejemplo, canola, Brassica spp., planta de maíz, Nicotiana spp., (tabaco), por ejemplo, Nicotiana benthamiana, alfalfa, patata, batata (Ipomoea batatus), ginseng, guisante, avena, arroz, soja, trigo, cebada, girasol, algodón, maíz, centeno (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), cártamo (Carthamus tinctorius).

Los términos "biomasa" y "materia vegetal" como se usan en la presente descripción, se refieren a cualquier material derivado de una planta. La biomasa o materia vegetal puede comprender una planta completa, o parte de la planta, incluida la hoja, raíz, tallo, flor, semilla, también puede incluir cualquier tejido de la planta, cualquier célula de la planta o cualquier fracción de la planta, parte o la planta, tejido o célula. Además, la biomasa o materia vegetal puede comprender componentes vegetales intracelulares, componentes vegetales extracelulares, extractos líquidos o sólidos de plantas, o una combinación de los mismos. Además, la biomasa o materia vegetal puede comprender plantas, células vegetales, tejidos, un extracto líquido, o una combinación de los mismos, de hojas, tallos, frutos, raíces de las plantas o una combinación de los mismos. Una parte de una planta puede comprender materia vegetal o biomasa.

Por "región reguladora", "elemento regulador" o "promotor" se entiende una parte de ácido nucleico típicamente, pero no siempre, aguas arriba de la región codificante de proteínas de un gen, que puede estar compuesto por ADN o ARN, o tanto ADN como ARN. Cuando una región reguladora está activa, y en asociación operativa, o unida operativamente, con un gen de interés, esta puede dar como resultado la expresión del gen de interés. Un elemento regulador puede ser capaz de mediar la especificidad en un órgano o controlar la activación de genes por el desarrollo o temporal. Una "región reguladora" incluye elementos promotores, elementos promotores mínimos que exhiben una actividad promotora basal, elementos que son inducibles en respuesta a un estímulo externo, elementos que median la actividad promotora tales como elementos reguladores negativos o potenciadores de la transcripción. "Región reguladora", como se usa en la presente descripción, también incluye elementos que son activos después de la transcripción, por ejemplo, elementos reguladores que modulan la expresión génica tales como potenciadores de la transcripción y la traducción, represores de la transcripción y la traducción, secuencias activadoras aguas arriba y determinantes de inestabilidad del ARNm. Varios de estos últimos elementos pueden ubicarse próximos a la región codificante.

En el contexto de esta descripción, el término "elemento regulador" o "región reguladora" se refiere típicamente a una secuencia de ADN, generalmente, pero no siempre, aguas arriba (5') a la secuencia codificante de un gen estructural, que controla la expresión de la región codificante al proporcionar el reconocimiento para la ARN polimerasa y/u otros factores necesarios para que la transcripción comience en un sitio particular. Sin embargo, debe entenderse que otras secuencias de nucleótidos, ubicadas dentro de los intrones, o en dirección 3' de la secuencia también pueden contribuir a la regulación de la expresión de una región codificante de interés. Un ejemplo de un elemento regulador que proporciona el reconocimiento de la ARN polimerasa u otros factores de transcripción para garantizar el inicio en un sitio particular es un elemento promotor. La mayoría, pero no todos, los elementos promotores eucariotas contienen una caja TATA, una secuencia de ácidos nucleicos conservada compuesta por pares de bases de nucleótidos de adenosina y timidina, generalmente situados aproximadamente a 25 pares de bases aguas arriba de un sitio de inicio de la transcripción. Un elemento promotor comprende un elemento promotor basal, responsable del inicio de la transcripción, así como también otros elementos reguladores (como se enumeró anteriormente) que modifican la expresión génica.

Hay varios tipos de regiones reguladoras, incluidas aquellas que son reguladas por el desarrollo, inducibles o constitutivas. Una región reguladora que es regulada por el desarrollo, o controla la expresión diferencial de un gen bajo su control, se activa dentro de ciertos órganos o tejidos de un órgano en momentos específicos durante el desarrollo de ese órgano o tejido. Sin embargo, algunas regiones reguladoras que son reguladas por el desarrollo pueden estar activas preferentemente dentro de ciertos órganos o tejidos en etapas específicas del desarrollo, también pueden ser activas de una manera regulada por el desarrollo, o también a un nivel basal en otros órganos o tejidos dentro de la planta. Los ejemplos de regiones reguladoras específicas de tejido, por ejemplo, una región reguladora específica, incluyen el promotor de napina y el promotor de cruciferina (Rask y otros, 1998, J. Plant Physiol.

152: 595-599; Bilodeau y otros, 1994, Plant Cell 14: 125-130). Un ejemplo de un promotor específico de la hoja incluye el promotor de plastocianina (ver el documento US 7,125,978).

Una región reguladora inducible es una que es capaz de activar directamente o indirectamente la transcripción de una o más secuencias de ADN o genes en respuesta a un inductor. En ausencia de un inductor, las secuencias de ADN o los genes no se transcribirán. Típicamente, el factor proteico que se une específicamente a una región reguladora inducible para activar la transcripción puede estar presente en una forma inactiva, que después se convierte directamente o indirectamente en la forma activa por el inductor. Sin embargo, el factor proteico también puede estar ausente. El inductor puede ser un agente químico tal como una proteína, metabolito, regulador del crecimiento, herbicida o compuesto fenólico o un estrés fisiológico impuesto directamente por calor, frío, sal o elementos tóxicos o indirectamente a través de la acción de un patógeno o agente patógeno tal como un virus. Una célula que contiene una región reguladora inducible puede exponerse a un inductor al aplicar externamente el inductor a la célula o planta tal como por pulverización, riego, calentamiento o métodos similares. Los elementos reguladores inducibles pueden derivarse de genes ya sea vegetales o no vegetales (por ejemplo, Gatz, C. y Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Los ejemplos de promotores inducibles potenciales incluyen, pero no se limitan a, promotor inducible por tetraciclina (Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), promotor inducible por esteroides (Aoyama, T. y Chua, N.H., 1997, Plant J. 2, 397-404) y promotor inducible por etanol (Salter, M.G., y otros, 1998, Plant Journal 16, 127-132; Caddick, M.X., y otros, 1998, Nature Biotech. 16, 177-180) genes IB6 y CKI1 inducibles por citoquinina (Brandstatter, I. y Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985) y el elemento inducible por auxina, DR5 (Ulmasov, T., y otros, 1997, Plant Cell 9, 1963-1971).

Una región reguladora constitutiva dirige la expresión de un gen a través de las diversas partes de una planta y de manera continua a lo largo del desarrollo de la planta. Los ejemplos de elementos reguladores constitutivos conocidos incluyen promotores asociados con el transcrito 35S de CaMV. (p35S; Odell y otros, 1985, Nature, 313: 810-812), los genes de actina de arroz 1 (Zhang y otros, 1991, Plant Cell, 3: 1155-1165), actina 2 (An y otros, 1996, Plant J., 10: 107-121), o tms 2 (documento U.S. 5,428,147) y triosafosfato isomerasa 1 (Xu y otros, 1994, Plant Physiol. 106: 459-467), el gen de ubiquitina 1 de la planta de maíz (Cornejo y otros, 1993, Plant Mol. Biol. 29: 637-646), los genes de ubiquitina 1 y 6 de Arabidopsis (Holtorf y otros, 1995, Plant Mol. Biol. 29: 637-646), y el gen del factor de inicio de la traducción 4A del tabaco (Mandel y otros, 1995 Plant Mol. Biol. 29: 995-1004), el promotor del virus del mosaico de la vena de la yuca, pCAS, (Verdaguer y otros, 1996); el promotor de la subunidad pequeña de la ribulosa bifosfato carboxilasa, pRbcS: (Outchkourov y otros, 2003), el pUbi (para monocotiledóneas y dicotiledóneas).

Como se describe en la presente descripción, se ha encontrado que las regiones reguladoras que comprenden secuencias potenciadoras con eficacia demostrada en la expresión foliar son eficaces en la expresión transitoria. Sin desear limitarse por la teoría, la unión de elementos reguladores aguas arriba de un gen fotosintético por unión a la matriz nuclear puede mediar una expresión fuerte. Por ejemplo, puede usarse hasta -784 desde el sitio de inicio de la traducción de la plastocianina de guisante (documento US 7,125,978) para mediar en la expresión fuerte del gen indicador.

El término "constitutivo", como se usa en la presente descripción, no indica necesariamente que una secuencia de nucleótidos bajo el control de la región reguladora constitutiva se expresa al mismo nivel en todos los tipos de células, sino que la secuencia se expresa en una amplia variedad de tipos de células aun cuando a menudo se observa variación en la abundancia.

Los constructos de expresión descritos anteriormente pueden estar presentes en un vector. El vector puede comprender secuencias borde que permiten la transferencia e integración del casete de expresión en el genoma del organismo o huésped. El constructo puede ser un vector binario de plantas, por ejemplo, un vector de transformación binario basado en pPZP (Hajdukiewicz, y otros, 1994). Otros constructos de ejemplo incluyen pBin19 (ver Frisch, D.A., L.W. Harris-Haller, y otros, 1995, Plant Molecular Biology 27: 405-409).

Si se desea, los constructos de esta descripción pueden manipularse adicionalmente para incluir marcadores seleccionables. Sin embargo, es posible que esto no sea necesario. Los marcadores seleccionables útiles incluyen enzimas que proporcionan resistencia a productos químicos tales como antibióticos, por ejemplo, gentamicina, higromicina, kanamicina, o herbicidas tales como fosfinotricina, glifosato, clorosulfuron y similares. De manera similar, pueden usarse enzimas que proporcionan la producción de un compuesto identificable por cambio de color, tal como GUS (beta-glucuronidasa), o luminiscencia, tal como luciferasa o g Fp .

Un vector también puede incluir un potenciador de la expresión como se describe en la presente descripción. El potenciador de la expresión puede ubicarse en un ADN-T que también contiene un supresor del silenciamiento génico y NPTII. El polienlazador también puede codificar uno o dos conjuntos de residuos de histidina 6 x para permitir la inclusión de etiquetas His N- o C-terminales en la proteína de interés para facilitar la purificación de la proteína.

El silenciamiento génico postranscripcional (PTGS) puede estar implicado en la limitación de la expresión de transgenes en plantas, y la coexpresión de un supresor del silenciamiento del virus Y de la patata (HcPro) puede usarse para contrarrestar la degradación específica de los ARNm transgénicos (Brigneti y otros, 1998, EMBO J. 17, 6739-6746). Los supresores de silenciamiento alternativos se conocen bien en la técnica y pueden usarse como se describe en la presente descripción (Chiba y otros, 2006, Virology 346: 7-14), por ejemplo, pero no limitado a, TEV-p1/HC-Pro (virus del grabado del tabaco-pl/HCPro), BYV -p21, p19 del virus del enanismo ramificado del tomate (TBSV p19; el constructo de p19 descrito en el documento w O 2010/0003225), proteína de la cápside del virus del arrugamiento del tomate (TCV -CP), 2b del virus del mosaico del pepino; CMV-2b), p25 del virus X de la patata (PVX-p25), p11 del virus M de la patata (PVM-p11), p11 del virus S de la patata (PVS-p11), p16 del virus de la quemazón del arándano (BScV -p16), p23 del virus de la tristeza de los cítricos (CTV-p23), p24 del virus-2 asociado al enrollamiento de la hoja de vid, (GLRaV-2 p24), p10 del virus de la vid A, (GVA-p10), p14 del virus de la vid B (GVB-p14), p10 del virus latente de Heracleum (HLV-p10) o p16 del virus latente común del ajo (GCLV-p16).

Por lo tanto, uno o más supresores de silenciamiento, por ejemplo, pero no limitado a, HcPro, TEV-p1/HC-Pro, BYV-p21, TBSV p19, TCV-CP, CMV-2b, PVX-p25, rgscam, proteína B2 de FHV, la proteína de envoltura pequeña de CPMV y la proteína de la envoltura de TCV, PVM-p11, PVS-p11, BScV-p16, CTV-p23, GLRaV-2 p24, GBV-p14, HLV-p10, GCLV-p16 o GVA-p10 pueden coexpresarse junto con el casete de expresión basado en comovirus, el elemento de amplificación derivado de geminivirus y la secuencia de ácido nucleico que codifica la proteína de interés para garantizar aún más altos niveles de producción de proteínas dentro de una planta.

Los constructos descritos en la presente descripción pueden introducirse en células vegetales mediante el uso de plásmidos Ti, plásmidos Ri, vectores de virus de plantas, transformación directa de ADN, microinyección, electroporación, etcétera. Para reseñas de tales técnicas ver, por ejemplo, Weissbach y Weissbach, Methods for Plant Molecular Biology, Academy Press, Nueva York VIII, págs. 421-463 (1988); Geierson y Corey, Plant Molecular Biology, 2da Ed. (1988); y Miki e Iyer, Fundamentals of Gene Transfer in Plants. En Plant Metabolism, 2da Ed. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (eds), Addison Wesly, Langmans Ltd. Londres, págs. 561-579 (1997). Otros métodos incluyen la captación directa de ADN, el uso de liposomas, la electroporación, por ejemplo con el uso de protoplastos, microinyección, microproyectiles o fibras e infiltración al vacío. Ver, por ejemplo, Bilang, y otros (1991, Gene 100: 247-250), Scheid y otros (1991, Mol. Gen. Genet. 228: 104-112), Guerche y otros (1987, Plant Science 52: 111-116), Neuhause y otros (1987, Theor. Appl Genet. 75: 30-36), Klein y otros, (2987, Nature 327: 70-73); Freeman y otros (1984, Plant Cell Physiol. 29: 1353), Howell y otros (1980, Science 208: 1265), Horsch y otros (1985, Science 227: 1229-1231), DeBlock y otros, (1989, Plant Physiology 91: 694-701), Methods for Plant Molecular Biology (Weissbach y Weissbach, eds., Academic Press Inc., 1988), Methods in Plant Molecular Biology (Schuler y Zielinski, eds., Academic Press Inc., 1989), documentos WO 92/09696, WO 94/00583, EP 331083, EP 175966, Liu y Lomonossoff (2002, J Virol Meth, 105:343-348), documentos EP 290395; WO 8706614; patentes de EE. UU. núms. 4,945,050; 5,036,006; y 5,100,792, solicitudes de patente de EE. UU. núms. de serie 08/438,666, presentada el 10 de mayo de 1995 y 07/951,715, presentada el 25 de septiembre de 1992.

Los métodos de expresión transitoria pueden usarse para expresar los constructos de la presente descripción (ver D'Aoust y otros, 2009, Methods in molecular biology, Vol 483, páginas 41-50; Liu y Lomonossoff, 2002, Journal of Virological Methods, 105: 343-348). Alternativamente, puede usarse un método de expresión transitoria basado en vacío, como se describe en Kapila y otros, (1997, Plant Sci. 122, 101-108) o los documentos WO 00/063400, WO 00/037663. Estos métodos pueden incluir, por ejemplo, pero no se limitan a, un método de agroinoculación o agroinfiltración, infiltración con jeringa, sin embargo, también pueden usarse otros métodos transitorios como se indicó anteriormente. Con agroinoculación, agroinfiltración o infiltración con jeringa, una mezcla de agrobacterias que comprende el ácido nucleico deseado se introduce en los espacios intercelulares de un tejido, por ejemplo, las hojas, la porción aérea de la planta (que incluye el tallo, las hojas y la flor), otra porción de la planta (tallo, raíz, flor) o la planta completa. Después de cruzar la epidermis, las agrobacterias infectan y transfieren

ADN-t se transcribe de manera episomal y el ARNm se traduce, lo que conduce a la producción de la proteína de interés en las células infectadas, sin embargo, el paso del ADN-t dentro del núcleo es transitorio.

También se consideran parte de esta descripción plantas, células vegetales o semillas transgénicas que contienen el constructo génico de la presente descripción que pueden usarse como una plataforma de planta adecuada para la expresión transitoria de proteínas descrita en la presente descripción. Los métodos para regenerar plantas completas a partir de células vegetales también se conocen en la técnica (por ejemplo, ver Guerineau y Mullineaux (1993, Plant transformation and expression vectors. En: Plant Molecular Biology Labfax (Croy RRD ed.) Oxford, BIOS Scientific Publishers, págs. 121-148). En general, las células vegetales transformadas se cultivan en un medio apropiado, que puede contener agentes de selección tales como antibióticos, donde se usan marcadores de selección para facilitar la identificación de las células vegetales transformadas. Una vez que se forma el callo, se puede fomentar la formación de brotes con el empleo de las hormonas vegetales apropiadas de acuerdo con métodos conocidos y los brotes se transfieren a un medio de enraizamiento para la regeneración de las plantas. Las plantas pueden usarse después para establecer generaciones repetitivas, ya sea a partir de semillas o mediante el uso de técnicas de propagación vegetativa. Las plantas transgénicas también pueden generarse sin usar cultivo de tejidos. Los métodos para la transformación estable y la regeneración de estos organismos están establecidos en la técnica y son conocidos para un experto en la técnica. Las técnicas disponibles se reseñan en Vasil y otros, (Cell Culture and Somatic Cell Genetics of Plants, Vol. I, II y III, Laboratory Procedures and Their Applications, Academic Press, 1984), y Weissbach y Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). El método para obtener plantas transformadas y regeneradas no es crucial para la presente invención.

Si las plantas, la parte de la planta o la célula vegetal van a transformarse o cotransformarse con dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en las Agrobacterium en un solo evento de transfección, los ácidos nucleicos se combinan y las células bacterianas se transfectan como se describió. Alternativamente, los constructos pueden introducirse en serie. En este caso, se introduce un primer constructo en las Agrobacterium como se describió, las células se cultivan en condiciones de selección (por ejemplo, en presencia de un antibiótico) donde solo pueden crecer las bacterias transformadas individualmente. Después de esta primera etapa de selección, se introduce un segundo constructo de ácido nucleico en las Agrobacterium como se describió, y las células se cultivan en condiciones de doble selección, donde solo pueden crecer las bacterias doblemente transformadas. Las bacterias doblemente transformadas pueden usarse después para transformar una planta, parte de la planta o célula vegetal como se describe en la presente descripción, o pueden someterse a una etapa de transformación adicional para acomodar un tercer constructo de ácido nucleico.

Alternativamente, si las plantas, una parte de la planta o una célula vegetal van a transformarse o cotransformarse con dos o más constructos de ácido nucleico, el constructo de ácido nucleico puede introducirse en la planta mediante la coinfiltración de una mezcla de células de Agrobacterium con la planta, parte de la planta o célula vegetal, cada célula de Agrobacterium puede comprender uno o más constructos a introducir dentro de la planta. Para variar los niveles de expresión relativa dentro de la planta, parte de la planta o célula vegetal, de una secuencia de nucleótidos de interés dentro de un constructo, durante la etapa de infiltración, puede variarse la concentración de las diversas poblaciones de agrobacterias que comprenden los constructos deseados.

La presente descripción proporciona además una planta transgénica que comprende el sistema de expresión como se define en la presente descripción, en donde el ácido nucleico heterólogo de interés en el casete se expresa a un nivel potenciado en comparación con otros sistemas de expresión análogos que carecen de uno o más componentes del sistema de expresión como se describe en la presente descripción, por ejemplo CMPV HT (SEQ ID NO: 4).

La presente descripción comprende además un método para generar una proteína de interés, que comprende las etapas de proporcionar una planta, o parte de la planta, que exprese el sistema de expresión como se describe en la presente descripción, recolectar, al menos, un tejido en donde la proteína de interés se ha expresado y, opcionalmente, aislar la proteína de interés a partir del tejido.

Por lo tanto, en diversos aspectos, y sin limitación, la descripción proporciona:

- un potenciador de la expresión, que comprende una UTR 5' de comovirus seleccionada de cualquiera de las SEQ ID NO: 1, 2, 24, 27, 68, 69 y 70-77, o una secuencia de nucleótidos que presenta 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 90 %, 85 % u 80 % de identidad con la secuencia como se expone en cualquiera de las SEQ ID NO: 1,2, 24, 27, 68, 69 y 70-77, en donde el potenciador de la expresión, cuando se une operativamente a una región reguladora de plantas y una secuencia kozak de plantas como se describe en la presente descripción, aumenta el nivel de expresión de una secuencia de nucleótidos de interés que está unida operativamente al potenciador de la expresión en comparación con el nivel de expresión de la secuencia de nucleótidos de interés fusionada al CMPV HT (SEQ ID NO: 4; secuencia potenciadora de la técnica anterior que comprende una proteína M incompleta como se describe en Sainsbury F. y Lomonossoff G.P., 2008, Plant Physiol. 148: págs. 1212-1218) mediante el uso de la misma región reguladora de plantas.

- uno o más sistemas de expresión que comprenden un potenciador de la expresión o casete de expresión basado en comovirus como se definió anteriormente, un promotor (región reguladora), opcionalmente un polienlazador, una secuencia kozak, un ácido nucleico que codifica una proteína de interés y un terminador.

- métodos para expresar una proteína de interés, en un organismo huésped, tal como una planta, mediante el uso de uno o más sistemas de expresión o vectores como se describe en la presente descripción.

- células huésped y organismos que expresan proteínas de interés a partir de uno o más sistemas de expresión o vectores de la descripción y métodos para la producción de los huéspedes y organismos.

Tabla 2: lista de secuencias

continuación

Ejemplo de referencia 1 - 2X35S/CPMV-HT/PDISP/H3 Victoria/ NOS (número de constructo 1391)

Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H3 Victoria) se clonó en el sistema de expresión 2X35S-CPMV-HT-NOS (CMPV-HT original) mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF-PDI.S1+3c (Figura 6A, SEQ ID NO: 67) e IF-H3V36111.s1-4r (Figura 6B, SEQ ID NO: 17), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 6C, SEQ ID NO: 18) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV-HT/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, CA). El número de constructo 1191 (Figura 6D) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 1191 es un plásmido aceptor destinado para la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV-HT. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia del borde izquierdo al derecho del ADN-t se presenta en la Figura 6E (SEQ ID NO: 19). El constructo resultante recibió el número 1391 (Figura 6F, SEQ ID NO: 20). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 6G (SEQ ID NO: 21). Una representación del plásmido 1391 se presenta en la Figura 6H.

Ejemplo 2 - 2X35S/CPMV160+/PDISP/H3 Victoria/NOS (número de constructo 1800)

Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H3 Victoria) se clonó en el sistema de expresión 2X35S/CPMV160+/NOS (CPMV160+) mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF**(SacII)-PDI.s1+4c (Figura 7A, SEQ ID NO: 22) e IF-H3V36111.s1-4r (Figura 7B, SEQ ID NO: 23), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 7C, SEQ ID NO: 24) como molde. El producto de p Cr se clonó en el sistema de expresión 2X35S/CPMV160+/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, CA). El número de constructo 2171 (Figura 7D) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 2171 es un plásmido aceptor destinado a la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV160+. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho del ADN-t se presenta en la Figura 7E (SEQ ID NO: 25). El constructo resultante recibió el número 1800 (Figura 7F, SEQ ID NO: 26). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 7G (SEQ ID NO: 27). Una representación del plásmido 1800 se presenta en la Figura 7H.

Ejemplo 3 - 2X35S/CPMV160/PDISP/H3 Victoria/ NOS (número de constructo 1935)

Una secuencia que codifica H3 de la influenza A/Victoria/361/2011 en la que el péptido señal nativo se ha reemplazado con el de la proteína disulfuro isomerasa de la alfalfa (PDISP/H3 Victoria) se clonó en el casete de expresión 2X35S-CPMV160-NOS mediante el uso del siguiente método basado en PCR. Un fragmento que contenía la secuencia codificante de PDISP/H3 Victoria se amplificó mediante el uso de los cebadores IF-CPMV(fl5'UTR)_SpPDI.c (Figura 8A, SEQ ID NO: 28) e IF-H3V36111.s1-4r (Figura 7B, SEQ ID NO: 23), mediante el uso de la secuencia de PDISP/H3 Victoria (Figura 7C, SEQ ID NO: 24) como molde. El producto de PCR se clonó en el sistema de expresión 2X35S/CPMV160/NOS mediante el uso del sistema de clonación In-Fusion (Clontech, Mountain View, c A). El número de constructo 1190 (Figura 8B) se digirió con las enzimas de restricción SacII y StuI y el plásmido linealizado se usó para la reacción de ensamblaje In-Fusion. El número de constructo 1190 es un plásmido aceptor destinado para la clonación "In Fusion" de genes de interés en un casete de expresión basado en CPMV160. También incorpora un constructo génico para la coexpresión del supresor de silenciamiento de TBSV P19 bajo el promotor y terminador del gen de Plastocianina de la alfalfa. La cadena principal es un plásmido binario pCAMBIA y la secuencia desde el borde izquierdo al derecho del ADN-t se presenta en la Figura 8C (SEQ ID NO: 29). El constructo resultante recibió el número 1935 (Figura 8D, SEQ ID NO: 30). La secuencia de aminoácidos de la H3 madura de la influenza A/Victoria/361/2011 fusionada con PDISP se presenta en la Figura 7G (SEQ ID NO: 27). Una representación del plásmido 1935 se presenta en la Figura 8E.

Ejemplo 4 - Variación de secuencia entre el sitio de restricción SacII y ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS (Número de constructos 1992 a 1999)

Se crearon ocho constructos que comprenden variaciones de secuencia entre el sitio de restricción SacII y el ATG de PDISP/H3 Victoria en el sistema de expresión 2X35S/CPMV160+/NOS mediante el uso del mismo método basado en PCR que para el número de constructo 1800 (ver el Ejemplo 2) mediante el uso de un cebador directo modificado y la conservación de todos los demás componentes iguales. Las variantes HT1* a HT8* se amplificaron mediante el uso de los cebadores enumerados en las Figuras 9A - 9H, cebadores:

IF-HT1*(-Mprot)-PDI.c (Figura 9A, SEQ ID NO: 31),

IF-HT2*(-Mprot)-PDI.c (Figura 9B, SEQ ID NO: 32),

IF-HT3*(-Mprot)-PDI.c (Figura 9C, SEQ ID NO: 33)

IF-HT4*(-Mprot)-PDI.c (Figura 9D, SEQ ID NO: 34)

IF-HT5*(-Mprot)-PDI.c (Figura 9E, SEQ ID NO: 35)

IF-HT6*(-Mprot)-PDI.c (Figura 9F, SEQ ID NO: 36)

IF-HT7*(-Mprot)-PDI.c (Figura 9G, SEQ ID NO: 37) y

IF-HT8*(-Mprot)-PDI.c (Figura 9H, SEQ ID NO: 38),

para crear el número de constructo 1992 a 1999, respectivamente. Representación del plásmido 1992 se presenta en la Figura 9I. Se usaron características análogas para preparar los constructos 1993-1999.

Ejemplo 5 - 2X35S/CPMV HT (número de constructo 484) y 2X35S/CPMV160+ (número de constructo 1897) para PDISP/H1 California

Una secuencia de codificación correspondiente a H1 de Influenza A/California/7/2009 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H1 California) (Figura 10A, SEQ ID NO: 39) se clonó en CPMV-HT original y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H1 California. La secuencia de aminoácidos de la H1 madura de la Influenza A/California/7/2009 fusionada con PDISP se presenta en la Figura 10B (SEQ ID NO: 40). Representaciones de los plásmidos 484 y 1897 se presentan en las Figuras 10C y 10D.

Ejemplo 6 - 2X35S/CPMV HT (número de constructo 489), 2X35S/CPMV160+ (número de constructo 1880) y 2X35S/CPMV160 (número de constructo 1885) para H5 Indonesia

Una secuencia codificante correspondiente a H5 nativa de la influenza A/Indonesia/5/2005 (Figura 11A, SEQ ID NO: 41) se clonó en CPMV-HT original, CPMV160+ y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1), 1800 (ver el Ejemplo 2) y 1935 (ver el Ejemplo 3) respectivamente, pero con cebadores de PCR modificados diseñados específicamente para H5 Indonesia. La secuencia de aminoácidos de H5 nativa de la influenza A/Indonesia/5/2005 se presenta en la Figura 11B (SEQ ID NO: 42). Representaciones de los plásmidos 489, 1880 y 1885 se presentan en la Figura 11C a la Figura 11E.

Ejemplo 7 - 2X35S/CPMV HT (número de constructo 2140) y 2X35S/CPMV160+ (número de constructo 2168) para PDISP-H7 Hangzhou

Una secuencia codificante correspondiente a H7 de la influenza A/Hangzhou/1/2013 en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou) (Figura 12A, SEQ ID NO: 43) se clonó en CPMv HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou. La secuencia de aminoácidos de la H7 madura de la influenza A/Hangzhou/1/2013 fusionada con PDISP se presenta en la Figura 12B (SEQ ID NO: 44). Representaciones de los plásmidos 2140 y 2168 se presentan en las Figuras 12C y 12D.

Ejemplo 8 - 2X35S/CPMV HT (número de constructo 2130) y 2X35S/CPMV160+ (número de constructo 2188) para PDISP/H7 Hangzhou+H5 Indonesia TMCT

Una secuencia codificante quimérica de hemaglutinina correspondiente al ectodominio de H7 de Influenza A/Hangzhou/1/2013 fusionada al dominio transmembrana y cola citoplasmática (TMCT) de H5 de influenza A/Indonesia/5/2005 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/H7 Hangzhou+H5 Indonesia TMCT) (Figura 13A, SEQ ID NO: 45) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/H7 Hangzhou+H5 Indonesia TMCT. La secuencia de aminoácidos de HA madura de H7 Hangzhou+H5 Indonesia TMCT fusionada con PDISP se presenta en la Figura 13B (SEQ ID NO: 46). Representaciones de los plásmidos 2130 y 2188 se presentan en las Figuras 13C y 13D.

Ejemplo 9 - 2X35S/CPMV HT (número de constructo 1039) y 2X35S/CPMV160+ (número de constructo 1937) para PDISP/HA B Brisbane (PrL-)

Una secuencia codificante correspondiente a HA de la influenza B/Brisbane/60/2008 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas del bucle proteolítico en secuencias de HA) en las que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Brisbane (PrL-)) (Figura 14A, SEQ ID NO: 47) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Brisbane (PrL-). La secuencia de aminoácidos de HA B Brisbane (PrL-) madura fusionada con PDISP se presenta en la Figura 14B (SEQ ID NO: 48). Representaciones de los plásmidos 1039 y 1937 se presentan en la Figura 14C y la Figura 14D.

Ejemplo 10 - 2X35S/CPMV HT (número de constructo 1067) y 2X35S/CPMV160+ (número de constructo 1977) para PDISP/HA B Brisbane (PrL-)+H1 California TMCT

Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la influenza B/Brisbane/60/08 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013, para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Brisbane (PrL-)+H1 California TMCT) (Figura 15A, SEQ ID NO: 49) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Brisbane (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA madura de B Brisbane (PrL-)+H1 California TMCT fusionada con PDISP se presenta en la Figura 15B (SEQ ID NO: 50). Representaciones de los plásmidos 1067 y 1977 se presentan en la Figura 15C y la Figura 15D.

Ejemplo 11 - 2X35S/CPMV HT (número de constructo 2072) y 2X35S/CPMV160+ (número de constructo 2050) para PDISP/HA B Massachussetts (PrL-)

Una secuencia codificante correspondiente a HA de la influenza B/Massachussetts/2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Massachussetts (PrL-)) (Figura 16A, SEQ ID NO: 51) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachussetts (PrL-). La secuencia de aminoácidos de HA madura de B Massachussetts (PrL-) fusionada con PDISP se presenta en la Figura 16B (SEQ ID NO: 52). Representaciones de los plásmidos 2072 y 2050 se presentan en la Figura 16C y la Figura 16D.

Ejemplo 12 - 2X35S/CPMV HT (número de constructo 2074) y 2X35S/CPMV160+ (número de constructo 2060) para PDISP/HA B Massachussetts (PrL-)+H1 California TMCT

Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la influenza B/Massachussetts/2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm.

61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 y con el péptido señal de la proteína disulfuro isomerasa de alfalfa (PDISP/HA B Massachussetts (PrL-)+H1 California TMCT) (Figura 17A, Se Q ID NO: 53) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HA B Massachussetts (PrL-)+H1 California TMCT. La secuencia de aminoácidos de la HA madura de B Massachussetts (PrL-)+H1 California Tm Ct fusionada con PDISP se presenta en la Figura 17B (SEQ ID NO: 54). Representaciones de los plásmidos 2074 y 2060 se presentan en las Figuras 17C y 17D.

Ejemplo 13 - 2X35S/CPMV HT (número de constructo 1445), 2X35S/CPMV160+ (número de constructo 1820) y CPMV160 (número de constructo 1975) para HA B Wisconsin (PrL-)

Una secuencia codificante correspondiente a HA de la influenza B/Wisconsin/1/2010 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) con su péptido señal nativo (HA B Wisconsin (PrL-)) (Figura 18A, SEQ ID NO: 55) se clonó en CPMV-HT original, CPMV160+ y CPMV160 mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1), 1800 (ver el Ejemplo 2) y 1935 (ver el Ejemplo 3), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-). La secuencia de aminoácidos de HA B Wisconsin (PrL-) con su péptido señal nativo se presenta en la Figura 18B (SEQ ID NO: 56). Representaciones de los plásmidos 1445, 1820 y 1975 se presentan en las Figuras 18C, 18D y 18E, respectivamente.

Ejemplo 14 - 2X35S/CPMV HT (número de constructo 1454) y 2X35S/CPMV160+ (número de constructo 1893) para HA B Wisconsin (PrL-)+H1 California TMCT

Una secuencia codificante de hemaglutinina quimérica correspondiente al ectodominio de HA de la Influenza B/ Wisconsin /2/2012 con bucle proteolítico eliminado (PrL-) (ver la solicitud provisional de EE. UU. núm. 61/806,227 presentada el 28 de marzo de 2013 para obtener información adicional sobre: regiones eliminadas de bucle proteolítico en secuencias de HA) fusionada con el dominio transmembrana y la cola citoplasmática (TMCT) de H1 de la influenza A/California/7/2009 con el péptido señal nativo de HA B Wisconsin (HA B Wisconsin (PrL-)+H1 California TMCT) (Figura 19A, SEQ ID NO: 57) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HA B Wisconsin (PrL-)+H1 California TMCT. La secuencia de aminoácidos de HA B Wisconsin (PrL-)+H1 California TMCT se presenta en la Figura 19B (SEQ ID NO: 58). Representaciones de los plásmidos 1454 y 1893 se presentan en las Figuras 19C y 19D.

Ejemplo 15 - 2X35S/CPMV HT (número de constructo 5001) y 2X35S/CPMV160+ (número de constructo 2100) para HC rituximab (Rituxan)

Una secuencia codificante correspondiente a la cadena pesada del anticuerpo IgG1 monoclonal Rituximab (HC rituximab (Rituxan); Figura 20A, SEQ ID NO: 59) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 (ver el Ejemplo 1) y 1800 (ver el Ejemplo 2), respectivamente, pero con cebadores de PCR modificados diseñados específicamente para HC rituximab (Rituxan). La secuencia de aminoácidos de HC rituximab (Rituxan) se presenta en la Figura 20B (SEQ ID NO: 60). Representaciones de los plásmidos 5001 y 2100 se presentan en la Figura 20C y la Figura 20D.

Ejemplo 16 - 2X35S/CPMV HT (número de constructo 5002) y 2X35S/CPMV160+ (número de constructo 2109) para PDISP/HC rituximab (Rituxan)

Una secuencia codificante correspondiente a la cadena pesada del anticuerpo monoclonal IgG1 Rituximab en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/HC rituximab (Rituxan); Figura 21A, SEQ ID NO: 61) se clonó en CPMV-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 y 1800, respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/HC rituximab (Rituxan). La secuencia de aminoácidos de HA madura de B Massachussetts (PrL-) fusionada con PDISP se presenta en la Figura 21B (SEQ ID NO: 62). Representaciones de los plásmidos 5002 y 2109 se presentan en la Figura 21C y la Figura 21D.

Ejemplo 17 - 2X35S/CPMV-HT (número de constructo 5021) y 2X35S/CPMV160+ (número de constructo 2120) para LC rituximab (Rituxan)

Una secuencia codificante correspondiente a la cadena ligera del anticuerpo monoclonal IgG1 Rituximab (LC rituximab (Rituxan; Figura 22A, SEQ ID NO: 63) se clonó en CPMV-HT original y c Pm V160+ mediante el uso del mismo método basado en PCR que los constructos 1391 y 1800 respectivamente, pero con cebadores de PCR modificados diseñados específicamente para LC rituximab (Rituxan). La secuencia de aminoácidos de LC rituximab (Rituxan) se presenta en la Figura 22B (SEQ ID NO: 64). Representaciones de los plásmidos 5021 y 2120 se presentan en la Figura 22C y la Figura 22D.

Ejemplo 18 - 2X35S/CPMV-HT (número de constructo 5022) y 2X35S/CPMV160+ (número de constructo 2129) para PDISP/LC rituximab (Rituxan)

Una secuencia codificante correspondiente a la cadena ligera del anticuerpo monoclonal IgG1 Rituximab en la que el péptido señal nativo se ha reemplazado por el de la proteína disulfuro isomerasa de alfalfa (PDISP/LC rituximab (Rituxan; Figura 23A, SEQ ID NO: 65) se clonó en CPm V-HT original y CPMV160+ mediante el uso del mismo método basado en PCR que el constructo 1391 y 1800, respectivamente, pero con cebadores de PCR modificados diseñados específicamente para PDISP/LC rituximab (Rituxan). La secuencia de aminoácidos de HA madura de LC rituximab (Rituxan) fusionada con PDISP se presenta en la Figura 23B (SEQ ID NO: 66). Representaciones de los plásmidos 5022 y 2129 se presentan en la Figura 23C y la Figura 23D.

Ejemplo 19: Transfección en Agrobacterium

La cepa de Agrobacterium AGL1 se transfectó por electroporación con los constructos de ADN mediante el uso de los métodos descritos por D'Aoust y otros 2008 (Plant Biotechnology Journal 6: 930-940). Las Agrobacterium transfectadas se cultivaron en medio YEB suplementado con ácido 2-(N-morfolino)etanosulfónico (MES) 10 mM, acetosiringona 20 j M, kanamicina 50 jg/m l y carbenicilina 25 jg/m l pH 5,6 a una DO600 entre 0,6 y 1,6. Las suspensiones de Agrobacterium se centrifugaron antes de su uso y se resuspendieron en medio de infiltración (MgCh 10 mM y MES 10 mM pH 5,6).

Preparación de biomasa vegetal, inóculo y agroinfiltración

Las plantas de Nicotiana benthamiana se cultivaron a partir de semillas en bandejas llenas con un sustrato de turba comercial. Se permitió que las plantas crecieran en el invernadero con un fotoperiodo de 16/8 y un régimen de temperaturas de 25 °C de día/20 °C de noche. Tres semanas después de la siembra, se escogieron plántulas individuales, se trasplantaron en macetas y se dejaron crecer en el invernadero durante tres semanas adicionales en las mismas condiciones ambientales.

Las agrobacterias transfectadas con cada constructo se cultivaron en un medio YEB suplementado con ácido 2-(N-morfolino)etanosulfónico (MES) 10 mM, acetosiringona 20 j M, kanamicina 50 jg/m l y carbenicilina 25 jg/ml, pH 5,6 hasta que alcanzaron una DO600 entre 0,6 y 1,6. Las suspensiones de Agrobacterium se centrifugaron antes de su uso y se resuspendieron en medio de infiltración (MgCh 10 mM y MES 10 mM, pH 5,6) y se almacenaron durante la noche a 4 °C. El día de la infiltración, los lotes de cultivo se diluyeron en 2,5 volúmenes de cultivo y se permitió que se calentaran antes de su uso. Las plantas completas de N. benthamiana se colocaron al revés en la suspensión bacteriana en un tanque de acero inoxidable hermético a vacío de 20-40 Torr durante 2 min. Las plantas se devolvieron al invernadero durante un período de incubación de 2-6 días hasta la cosecha.

Cosecha de hojas y extracción de proteínas totales

Después de la incubación, la parte aérea de las plantas se cosechó, se congeló a -80 °C y se trituró en pedazos. Las proteínas solubles totales se extrajeron mediante homogeneización (Polytron) de cada muestra de material vegetal congelado triturado en 3 volúmenes de Tris 50 mM frío pH 8,0, NaCl 0,15 M, Triton X-100 al 0,1 % y fluoruro de fenilmetanosulfonilo 1 mM. Después de la homogeneización, las suspensiones se centrifugaron a 10000 g durante 10 minutos a 4 °C y estos extractos crudos clarificados (sobrenadante) se guardaron para su análisis.

Ejemplo 20 - Análisis de proteínas e inmunotransferencia

El contenido de proteína total de los extractos crudos clarificados se determinó mediante el ensayo de Bradford (Bio-Rad, Hercules, CA) mediante el uso de albúmina de suero bovino como patrón de referencia. Las proteínas se separaron por SDS-PAGE y se transfirieron por electrotransferencia a membranas de difluoruro de polivinileno (PVDF) (Roche Diagnostics Corporation, Indianápolis, IN) para la inmunodetección. Antes de la inmunotransferencia, las membranas se bloquearon con leche descremada al 5 % y Tween-20 al 0,1 % en solución salina tamponada con Tris (TBS-T) durante 16-18 h a 4 °C.

Claims

REIVINDICACIONES

1. Un potenciador de la expresión que comprende una secuencia de nucleótidos de UTR 5' del CPMV derivada del ARN-2 del CPMV, la secuencia de nucleótidos de la UTR 5' del CPMV consiste en los nucleótidos 1-160 de la SEQ ID NO: 1 o consiste en los nucleótidos 1-160 de la SEQ ID NO: 69.

2. El potenciador de la expresión de la reivindicación 1, que comprende además una segunda secuencia de aproximadamente 1 a 100 nucleótidos de longitud, fusionada al extremo 3' de la secuencia de nucleótidos de UTR 5' del CPMV.

3. El potenciador de la expresión de la reivindicación 2, en donde la segunda secuencia comprende una secuencia kozak de plantas, un sitio de clonación múltiple, un enlazador, un polienlazador, un sitio de recombinación o una combinación de los mismos.

4. El potenciador de la expresión de la reivindicación 3, en donde la segunda secuencia comprende una secuencia kozak de plantas seleccionada de las SEQ ID NO: 5 -17.

5. El potenciador de la expresión de la reivindicación 2, que comprende una secuencia de nucleótidos de SEQ ID NO: 2.

6. El potenciador de la expresión de la reivindicación 2, que comprende una secuencia de nucleótidos de SEQ ID NO: 75.

7. Un ácido nucleico que comprende el potenciador de la expresión de cualquiera de las reivindicaciones 1 a 6 y una secuencia de nucleótidos de interés, la secuencia de nucleótidos de interés está unida operativamente al extremo 3' del potenciador de la expresión, la secuencia de nucleótidos de interés codifica una proteína de interés.

8. El ácido nucleico de la reivindicación 7, la secuencia de nucleótidos de interés comprende un ATG en el extremo 5', la secuencia de nucleótidos de interés está fusionada al extremo 3' de la secuencia de nucleótidos de la UTR 5' del CPMV del potenciador de la expresión.

9. Un sistema de expresión en plantas que comprende el potenciador de la expresión de cualquiera de las reivindicaciones 1 a 6, en donde el potenciador de la expresión está unido operativamente a una región reguladora en el extremo 5' del potenciador de la expresión.

10. El sistema de expresión en plantas de la reivindicación 9, en donde el potenciador de la expresión está unido operativamente a una secuencia de nucleótidos de interés en el extremo 3' del potenciador de la expresión, la secuencia de nucleótidos de interés codifica una proteína de interés.

11. El sistema de expresión en plantas de la reivindicación 10, en donde el potenciador de la expresión comprende además una UTR 3' de comovirus fusionada al extremo 3' de la secuencia de nucleótidos de interés.

12. El ácido nucleico de la reivindicación 7 o el sistema de expresión en plantas de la reivindicación 10, en donde la secuencia de nucleótidos de interés comprende una secuencia de nucleótidos que codifica una proteína viral o un anticuerpo.

13. El ácido nucleico de la reivindicación 7 o el sistema de expresión en plantas de la reivindicación 10, en donde la secuencia de nucleótidos de interés es una hemaglutinina (HA) de la influenza, seleccionada de B HA, H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 y H16.

14. Un método para producir una proteína de interés en una planta o en una porción de una planta que comprende, introducir por transformación en la planta o en la porción de la planta el sistema de expresión en plantas de la reivindicación 10, e incubar la planta o la porción de la planta en condiciones que permitan la expresión de la secuencia de nucleótidos que codifica la proteína de interés.

15. Una planta o porción de una planta transfectada transitoriamente o transformada de manera estable con el sistema de expresión en plantas de la reivindicación 10.