ES2799735T3 - Células de mamífero que expresan antígenos de citomegalovirus - Google Patents

Células de mamífero que expresan antígenos de citomegalovirus Download PDF

Info

Publication number
ES2799735T3
ES2799735T3 ES15791768T ES15791768T ES2799735T3 ES 2799735 T3 ES2799735 T3 ES 2799735T3 ES 15791768 T ES15791768 T ES 15791768T ES 15791768 T ES15791768 T ES 15791768T ES 2799735 T3 ES2799735 T3 ES 2799735T3
Authority
ES
Spain
Prior art keywords
cell
protein
pul128
pul131
pul130
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15791768T
Other languages
English (en)
Inventor
Andrea Carfi
Claudio Ciferri
Irmgard Hofmann
Holger Laux
Anders Lilja
Yingxia Wen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GlaxoSmithKline Biologicals SA
Original Assignee
GlaxoSmithKline Biologicals SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GlaxoSmithKline Biologicals SA filed Critical GlaxoSmithKline Biologicals SA
Application granted granted Critical
Publication of ES2799735T3 publication Critical patent/ES2799735T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16151Methods of production or purification of viral material

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • Reproductive Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

Una célula CHO recombinante, que comprende: una o más secuencias de polinucleótidos que codifican el complejo pentamérico de citomegalovirus (CMV), en la que dicho complejo pentamérico comprende: gH o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, gL o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL128 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL130 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo y pUL131 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo; en la que dicha una o más secuencias de polinucleótidos están integradas en el ADN genómico de dicha célula CHO; y en la que el nivel de expresión o actividad de la proteína C12orf35 se reduce en dicha célula CHO, en comparación con una célula de tipo silvestre.

Description

DESCRIPCIÓN
Células de mamífero que expresan antígenos de citomegalovirus
Campo de la invención
La presente invención se refiere a células hospedadoras que expresan proteínas de citomegalovirus (CMV) adecuadas para usos de vacuna.
Antecedentes de la invención
El citomegalovirus es un género de virus que pertenece a la familia vírica conocida como Herpesviridae o herpesvirus. La especie que infecta a los humanos se conoce comúnmente como citomegalovirus humano (HCMV) o herpesvirus-5 humano (HHV-5). Dentro de Herpesviridae, el HCMV pertenece a la subfamilia Betaherpesvirinae, que también incluye citomegalovirus de otros mamíferos.
Aunque pueden encontrarse en todo el cuerpo, las infecciones por HCMV se asocian frecuentemente a las glándulas salivales. El HCMV infecta entre el 50 % y el 80 % de los adultos en los Estados Unidos (40 % en todo el mundo), como lo indica la presencia de anticuerpos en gran parte de la población general. La infección por HCMV suele pasar desapercibida en personas sanas, pero puede ser mortal para los inmunocomprometidos, tales como las personas infectadas por el VIH, receptores de trasplantes de órganos o recién nacidos. E1HCMV es el virus que se transmite con mayor frecuencia a un feto en desarrollo. Después de la infección, el HCMV tiene la capacidad de permanecer latente dentro del cuerpo durante toda la vida del hospedador, con reactivaciones ocasionales por latencia. Dada la gravedad e importancia de esta enfermedad, obtener una vacuna eficaz se considera una prioridad de salud pública (Sung, H., y col., (2010) Expert review of vaccines 9, 1303-1314; Schleiss, Expert Opin Ther Pat. Abr 2010; 20(4): 597­ 602).
Se han secuenciado los genomas de más de 20 cepas diferentes de HCMV, incluyendo aquellos de cepas de laboratorio y aislados clínicos. Por ejemplo, se han secuenciado las siguientes cepas de HCMV: Towne (GL239909366), AD169 (GI:219879600), Toledo (GL290564358) y Merlin (GI: 155573956). Las cepas de HCMV Ad169, Towne y Merlin pueden obtener de la American Type Culture Collection (ATCC VR538, ATCC VR977 y ATCC VR1590, respectivamente).
El CMV contiene un número desconocido de complejos de proteínas de membrana. De las aproximadamente 30 glucoproteínas conocidas en la envoltura vírica, gH y gL han surgido como particularmente interesantes debido a su presencia en varios complejos diferentes: gH/gL dimérico, gH/gL/gO trimérico (también conocido como el complejo gCIII) y el gH/gL/pUL128/pUL130/pUL131 pentamérico (pUL131 también denominado "pUL131A", "pUL131a" o "UL131A"; las subunidades pUL128, pUL130 y pUL131 a veces también se denominan UL128, UL130, UL131). Se cree que el CMV usa los complejos pentaméricos para ingresar a las células epiteliales y endoteliales por endocitosis y fusión dependiente de pH bajo, pero se cree que ingresa a los fibroblastos por fusión directa en la membrana plasmática en un proceso que implica gH/gL o posiblemente gH/gL/gO. El complejo o complejos gH/gL y/o gH/gL/gO es/son suficientes para la infección por fibroblastos, mientras que el complejo pentamérico es necesario para infectar células endoteliales y epiteliales.
El complejo pentamérico se considera una diana principal para la vacunación contra el CMV. Los genes víricos UL128, UL130 y UL131 son necesarios para la entrada endotelial (Hahn, Journal of Virology 2004; 78:10023-33). Las cepas tropicales no endoteliales adaptadas a fibroblastos contienen mutaciones en al menos uno de estos tres genes. La cepa Towne, por ejemplo, contiene una inserción de 2 pares de bases que causa un desplazamiento de marco en el gen UL130, mientras que AD169 contiene una inserción de 1 par de bases en el gen UL131. Tanto Towne como AD169 podrían adaptarse para el crecimiento en células endoteliales y, en ambos casos, se repararon las mutaciones de desplazamiento de marco en los genes UL130 o UL131.
El documento US7704510 desvela que se requiere pUL131A para el tropismo de células epiteliales. El documento US7704510 también desvela que pUL128 y pUL130 forman un complejo con gH/gL, que se incorpora a los viriones. Este complejo se requiere para infectar células endoteliales y epiteliales, pero no fibroblastos. Se descubrió que los anticuerpos anti-CD46 inhiben la infección por HCMV de las células epiteliales.
Las vacunas contra el CMV probadas en ensayos clínicos incluyen la vacuna de Towne, quimeras Towne-Toledo, un replicón de virus alfa con gB como el antígeno, vacuna gB/MF59, una vacuna gB producida por GlaxoSmithKline y una vacuna de ADN que usa gB y pp65. pp65 es una proteína vírica que es un potente inductor de respuestas CD8+ dirigidas contra el CMV. Todas estas vacunas son inductores pobres de anticuerpos que bloquean la entrada vírica en las células endoteliales/epiteliales (Adler, SP (2013), British Medical Bulletin, 107, 57-68.doi:10.1093/bmb/ldt023).
Generalmente se cree que los anticuerpos neutralizantes contra el complejo pentamérico (gH/gLpUL128/pUL130/pUL131) serán significativamente más potentes que los anticuerpos neutralizantes generados contra la subunidad gB del CMV o el complejo dimérico gH/gL. Por lo tanto, para desarrollar una vacuna eficaz contra el CMV, existe una necesidad urgente de producir grandes cantidades (por ejemplo, escalas comerciales) de complejo pentamérico CMV.
Sin embargo, la producción recombinante de complejo pentamérico del CMV sigue siendo un desafío. Las cinco subunidades deben expresarse (preferentemente en una cantidad sustancialmente igual y preferentemente en un período de tiempo sostenido), plegarse correctamente y ensamblarse adecuadamente en un pentámero. Además, también es necesario evitar el ensamblaje no deseado de complejos contaminantes (tales como el dímero gH/gL, el tetrámero gH/gL (dos copias de gH y dos copias de gL), el tetrámero gH/gLpUL128/pUL130, etc.).
La expresión recombinante tal como un complejo de proteínas eucariotas requeriría la identificación de construcciones adecuadas y hospedadores adecuados, para la expresión de cantidades suficientes de proteínas plegadas adecuadamente en un período de tiempo sostenido, que después puede ensamblarse adecuadamente en complejos de proteínas. Adicionalmente, la selección de un hospedador de expresión adecuado tiene un impacto significativo en el rendimiento y la calidad de las proteínas, así como también sobre los costes reales del procedimiento de producción.
Sumario de la invención
En el presente documento se desvelan y ejemplifican células hospedadoras de mamífero, en particular células CHO, en las que la secuencia o secuencias que codifican proteínas del CMV gH, gL, pUL128, pUL130, pUL131 (o un fragmento que forma complejo del mismo) se integran de manera estable en el genoma. Dichas células hospedadoras proporcionan una fuente confiable en la que el complejo pentamérico gH/gL/pUL128/pUL130/pUL131 puede producirse de forma recombinante.
En un aspecto, la invención proporciona una célula CHO recombinante, que comprende: una o más secuencias de polinucleótidos que codifican el complejo pentamérico de citomegalovirus (CMV), en la que dicho complejo pentamérico comprende: gH o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, gL o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL128 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL130 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo y pUL131 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo; en la que dicha una o más secuencias de polinucleótidos están integradas en el ADN genómico de dicha célula CHO; y en la que el nivel de expresión o actividad de la proteína C12orf35 se reduce en dicha célula CHO, en comparación con una célula de tipo silvestre. Debido a que las secuencias de polinucleótidos están integradas de manera estable en el ADN genómico de la célula, pueden transmitirse a su progenie como parte de las secuencias genómicas. Dichas células a menudo se denominan en la técnica líneas celulares estables. Particularmente, la célula no comprende las secuencias víricas de CMV que podrían dar como resultado la producción de virus de CMV infecciosos. Cuando se cultiva en una condición adecuada, dicho complejo pentamérico del CMV se expresa por dicha célula hospedadora.
Las células CHO adecuadas incluyen, por ejemplo, cualquier línea celular CHO disponible en la American Type Culture Collection (ATCC) o en la European Collection of Cell Cultures (ECACC). Las líneas celulares CHO ejemplares incluyen, por ejemplo, célula CHO-K1, CHO-DUXB11, CHO-DG44 o células CHO-S. Para facilitar la selección de clones integrados de forma estable, las células hospedadoras pueden ser deficientes en dihidrofolato reductasa (DHFR). La expresión de proteínas de recombinación en líneas celulares deficientes en DHFR o competentes en DHFR también puede seleccionarse mediante selección con metotrexato (MTX).
La célula hospedadora puede tener una o más modificaciones adicionales para mejorar aún más la producción de complejo pentamérico de CMV. En determinadas realizaciones, el nivel de expresión o actividad de la proteína FAM60A se reduce en la célula hospedadora, en comparación con un control. En determinadas realizaciones, el nivel de expresión o actividad de la matriptasa se reduce en la célula hospedadora, en comparación con un control. Las modificaciones descritas en el presente documento pueden usarse de forma individual o en cualquier combinación.
El complejo pentamérico CMV producido de forma recombinante puede ser soluble (por ejemplo, carece del dominio transmembrana de gH). Para facilitar la producción, el complejo pentamérico CMV producido de forma recombinante puede secretarse de la célula hospedadora al medio de cultivo.
Las células hospedadoras de mamífero descritas en el presente documento son particularmente adecuadas para la producción a gran escala, tales como cultivos que tienen al menos 20 litros (por ejemplo, 50 litros, 100 litros, etc.) de tamaño. En determinadas realizaciones, el rendimiento del complejo pentamérico de CMV es de al menos 0,05 g/l o de al menos 0,1 g/l.
Breve descripción de las figuras
La FIGURA 1 ilustra diversas estrategias de diseño para la coexpresión de cinco componentes del pentámero.
La FIGURA 2 muestra los mapas plasmídicos de los vectores de expresión usados para la transfección de células CHO.
La FIGURA 3 muestra el análisis SDS-PAGE de pentámero purificado producido con los 12 clones principales.
La FIGURA 4 ilustra los diseños experimentales utilizados para estudiar la estabilidad de los 12 clones principales.
La FIGURA 5 muestra el rendimiento de pentámero producido por el clon principal VF7.
Descripción detallada de la invención
1. VISIÓN GENERAL
Una de las dianas principales para la vacunación contra el CMV es el complejo pentamérico (gH/gL/pUL128/pUL130/pUL131). Para producir pentámero de CMV recombinante a escala comercial, existe la necesidad de identificar construcciones adecuadas y hospedadores adecuados, de tal manera que las cinco subunidades del pentámero puedan expresarse en cantidades suficientes durante un período de tiempo sostenido y puedan ensamblarse adecuadamente en un complejo pentamérico. El pentámero de CMV es una diana primaria de anticuerpos neutralizantes contra el CMV humano.
El pentámero de CMV se ha producido de forma recombinante utilizando HEK293 como células hospedadoras. Véase, el documento WO2014/005959. Sin embargo, La línea celular HEK293 es generalmente reconocida en la técnica como una de las mejores líneas celulares hospedadoras para la expresión transitoria de genes. Véase, Meyer y col., PLoS One, 17 jul 2013, 8(7):e68674. doi: 10.1371/journal.pone.0068674. Sin embargo, sería difícil mantener la expresión del pentámero durante un período de tiempo sostenido en células HEK293 transfectadas transitoriamente. Además, en los ejemplos desvelados en el documento WO 2014/005959, las cinco subunidades del pentámero se introdujeron en las células HEK293 a través de cinco plásmidos diferentes. Bajo tal configuración, sería difícil mantener la expresión de cada una de las subunidades del pentámero en un nivel sustancialmente igual. Una cantidad desigual de las subunidades puede reducir la eficiencia del ensamblaje del pentámero, especialmente dado que estas subunidades ya tienen tendencia a formar complejos contaminantes, tales como el dímero gH/gL, el tetrámero gH/gL (2 copias de gH y 2 copias de gL), el tetrámero gH/gLpUL128/pUL130. Además, el plásmido que codifica gH se seleccionó con neomicina, los cuatro plásmidos que codifican gL, pUL128, pUL130 y pUL131, respectivamente, se seleccionaron todos con kanamicina. Por lo tanto, debido a que los cuatro plásmidos se seleccionaron con kanamicina, la pérdida de un solo plásmido en una célula hospedadora no se podría detectar fácilmente, pero la pérdida de un solo plásmido impediría el ensamblaje del pentámero.
Como se desvela y ejemplifica en el presente documento, los presentes inventores superaron las dificultades de la producción recombinante del pentámero de CMV mediante el uso de células de ovario de hámster chino (CHO). En estas células CHO, las secuencias que codifican gH, gL, pUL128, pUL130, pUL131 (o un fragmento formador de complejos de las mismas) se integran de manera estable en el genoma de las células CHO. Al integrar secuencias codificantes del pentámero en el genoma de la célula CHO, los presentes inventores lograron una expresión genómica estable de pentámero recombinante, con una alta eficiencia y estabilidad genómica. Como se ejemplifica en la sección de Ejemplos, se descubrió que, en comparación con las células HEK293 transfectadas transitoriamente, las líneas estables de CHO lograron consistentemente un rendimiento 100 veces más alto, haciendo a estas líneas celulares CHO particularmente adecuadas para la producción comercial de pentámero de CMV. La integración estable también permite una fácil manipulación del cultivo celular a gran escala, en comparación con las células HEK transfectadas transitoriamente con cinco plásmidos exógenos. De hecho, los clones principales produjeron pentámero con un rendimiento tan alto como 0,1 g/l a 0,5 g/l.
En el presente documento también se proporcionan mejoras adicionales de las células hospedadoras para la producción de pentámeros de CMV. En particular, se ejemplifican tres células hospedadoras modificadas: (i) células hospedadoras en las que se reduce el nivel de expresión o la actividad de la proteína C12orf35, en comparación con un control; (ii) células hospedadoras en las que se reduce el nivel de expresión o la actividad de la proteína FAM60A, en comparación con un control; (iii) células hospedadoras en las que se reduce el nivel de expresión o la actividad de la matriptasa, en comparación con un control. Se descubrió que la reducción del nivel de expresión o actividad de la proteína C12orf35 o la proteína FAM60A da como resultado un aumento significativo en el nivel de expresión de una proteína recombinante. También se descubrió que la reducción del nivel de expresión o actividad de la matriptasa disminuye significativamente la degradación proteolítica ("recorte") de una proteína recombinante. Estas modificaciones pueden usarse de forma individual o en cualquier combinación.
En consecuencia, se describen en el presente documento células hospedadoras de mamíferos, en particular células CHO, en las que la secuencia o secuencias polinucleotídicas que codifican el complejo pentamérico de CMV que comprende gH, gL, pUL128, pUL130, pUL131 (o un fragmento que forma complejo del mismo) se integran de manera estable en el ADN genómico. Cuando se cultiva en una condición adecuada, dicho complejo pentamérico del CMV se expresa por dichas células hospedadoras.
También se describe en el presente documento un complejo pentamérico de citomegalovirus (CMV) producido por las células de mamífero descritas en el presente documento.
También se proporciona en el presente documento un procedimiento para producir el complejo pentamérico de citomegalovirus (CMV), en el que dicho complejo pentamérico comprende: gH o un fragmento formador de complejos del mismo, gL o un fragmento formador de complejos del mismo, pUL128 o un fragmento formador de complejos del mismo, pUL130 o un fragmento formador de complejos del mismo y pUL131 o un fragmento formador de complejos del mismo, que comprende: (i) cultivar la célula de mamífero como se describe en el presente documento en una condición adecuada, expresando de ese modo dicho complejo pentamérico; y cosechar dicho complejo pentamérico del cultivo. El complejo pentamérico puede comprender además estar purificado. También se describe en el presente documento un complejo pentamérico de citomegalovirus (CMV) producido mediante este procedimiento.
También se describe en el presente documento una composición que comprende el complejo pentamérico descrito en el presente documento. La composición puede comprender un complejo pentamérico de CMV purificado que sea adecuado para la administración in vivo. Por ejemplo, el complejo pentamérico en una composición tal puede tener una pureza de al menos el 85 %, al menos el 86 %, al menos el 87 %, al menos el 88 %, al menos el 89 %, al menos el 90 %, al menos el 91 %, al menos el 92 %, al menos el 93 %, al menos el 94 %, al menos el 95 %, al menos el 96 %, al menos el 97 %, al menos el 98 % o al menos el 99 %, en masa. La composición puede comprender además un adyuvante, tales como una sal de aluminio o MF59.
También se describe en el presente documento una composición para su uso en la inducción de una respuesta inmunitaria contra el CMV. También se describe el uso de la composición descrita en el presente documento para inducir una respuesta inmunitaria contra el CMV y el uso de la composición descrita en el presente documento en la fabricación de un medicamento para inducir una respuesta inmune contra el CMV.
2. COMPLEJOS PENTAMÉRICOS DE CMV Y SECUENCIAS CODIFICANTES
A. Complejos pentaméricos del CMV
En un aspecto de la divulgación, se describe una célula hospedadora de mamífero que expresa el complejo pentamérico del CMV, en la que dicho complejo pentamérico comprende (i) gH o un fragmento formador de complejos del mismo, (ii) gL o un fragmento formador de complejos del mismo, (iii) pUL128 o un fragmento formador de complejos del mismo, (iv) pUL130 o un fragmento formador de complejos del mismo y (v) pUL131 o un fragmento formador de complejos del mismo. Las secuencias de polinucleótidos que codifican el complejo pentamérico CMV se integran en el ADN genómico de la célula hospedadora y, cuando se cultiva en una condición adecuada, dicho complejo pentamérico del CMV se expresa por dicha célula hospedadora.
En determinadas realizaciones, dicho complejo pentamérico es soluble. Puede obtenerse el complejo pentamérico soluble, por ejemplo, mediante el uso de un fragmento de gH en el que se elimina el dominio transmembrana de la subunidad gH, como se describe en detalle a continuación.
En determinadas realizaciones, dicho complejo pentamérico se secreta por la célula hospedadora. Se ha informado que la presencia de las cinco subunidades, gH, gL, pUL128, pUL131 y pUL131, es suficiente para el ensamblaje del complejo pentamérico en ER antes de exportarlo al aparato de Golgi. Véase, Ryckman y col., J Virol. Ene 2008; 82(1): 60-70. Alternativamente o además, puede usarse un péptido señal apropiado en una o más de las cinco subunidades (por ejemplo, haciendo una proteína de fusión con una señal secretora). Las secuencias señal (y el casete de expresión) para producir proteínas secretoras se conocen en la técnica. En general, los péptidos líderes tienen una longitud de 5-30 aminoácidos y típicamente están presentes en el extremo N de una proteína recién sintetizada. El núcleo del péptido señal generalmente contiene un largo tramo de aminoácidos hidrófobos que tiende a formar una única hélice alfa. Además, muchos péptidos señal comienzan con un corto tramo de aminoácidos con carga positiva, lo que puede ayudar a hacer cumplir la topología apropiada del polipéptido durante la translocación. Al final del péptido señal típicamente hay un tramo de aminoácidos que es reconocido y escindido por la peptidasa señal. La peptidasa señal puede escindir durante o después de la finalización de la translocación para generar un péptido señal libre y una proteína madura.
La glucoproteína H (gH) del CMV humano, codificada por el gen UL75, es una glucoproteína del virión que es esencial para la infectividad y que se conserva entre los miembros de los virus del herpes alfa, beta y gamma. Puede formar un complejo estable con gL y la formación de este complejo facilita la expresión de gH en la superficie celular. Basado en las estructuras cristalinas de los complejos gH/gL del HSV-2 y el e Bv , la subunidad gL y los restos N-terminales de gH forman un dominio globular en un extremo de la estructura (la "cabeza"), que está implicado en las interacciones con gB y la activación de la fusión de membrana. El dominio C-terminal de gH, proximal a la membrana vírica (la "cola"), también está implicado en la fusión de membrana. gH muestra determinantes que son reconocidos por el factor del hospedador TLR2 e interactúa directamente con un heterodímero formado entre los factores del hospedador TLR2 y TLR1. TLR2 media la activación de NF-kB y las respuestas inflamatorias de citocinas de las células.
La gH de la cepa Merlin de CMV se muestra como SEQ ID NO: 1 (GI:52139248, 742 restos de aminoácidos). El gH de la cepa Towne de CMV se muestra como SEQ ID NO: 2 (GI:138314, también 742 restos de aminoácidos). La gH de Towne se ha caracterizado por tener: (i) seis sitios de N-glucosilación (en los restos 55, 62, 67, 192, 641 y 700); (ii) una secuencia señal hidrófoba en su extremo N (restos de aminoácidos 1-23); (iii) un ectodominio (restos 24-717) que se proyecta fuera de la célula hacia el espacio extracelular; (iv) un dominio transmembrana hidrófobo (TM) (restos 718-736); y (v) un dominio citoplasmático C-terminal (restos 737-742). La SEQ ID NO: 2 comparte el 99 % y el 96 % de identidad de secuencia de aminoácidos con SEQ ID NO: 1 y la gH de la cepa CMV AD169 (GI:138313, SEQ ID NO: 3), respectivamente.
Habitualmente, la secuencia señal N-terminal de la proteína gH de longitud completa se escinde por una peptidasa señal de la célula hospedadora para producir una proteína gH madura. Como tal, la proteína gH expresada por la célula hospedadora descrita en el presente documento puede carecer de la secuencia señal N-terminal (por ejemplo, gH está codificada por una secuencia de nucleótidos que carece de la secuencia de codificación para la secuencia señal N-terminal).
También se describen en el presente documento fragmentos formadores de complejos de gH, tales como un fragmento de gH que carece del dominio transmembrana (TM) (por ejemplo, restos 718-736 de SEQ ID NO: 2), el dominio C-terminal (por ejemplo, restos 737-742 de SEQ ID NO: 2), la secuencia señal N-terminal (por ejemplo, restos 1-23 de SEQ ID NO: 2), o una combinación de los mismos. Un fragmento formador de complejo de gH puede ser cualquier parte o trozo de la proteína gH que retiene la capacidad de formar un complejo con otra proteína CMV. Por ejemplo, un fragmento formador de complejo de gH forma parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131. Por ejemplo, la expresión de la secuencia de gH de longitud completa puede dificultar la purificación del complejo pentamérico soluble porque el dominio TM de gH es hidrófobo. En cambio, el complejo pentamérico puede comprender un fragmento de gH con al menos una porción del dominio TM de gH eliminado.
Por ejemplo, puede usarse un fragmento de gH que comprende la secuencia señal N-terminal y el ectodominio de gH, pero no el dominio TM. Un fragmento de gH adecuado también puede comprender una porción del ectodominio de gH (por ejemplo, al menos aproximadamente el 70 %, al menos aproximadamente el 80 %, al menos aproximadamente el 85 %, al menos aproximadamente el 90 %, al menos aproximadamente el 95 %, al menos aproximadamente el 96 %, al menos aproximadamente el 97 %, al menos aproximadamente el 98 % o al menos aproximadamente el 99 % de la secuencia de ectodominio de gH), pero ninguno, o solo una pequeña porción del dominio TM. Alternativamente, el fragmento de gH descrito en el presente documento puede carecer entre 1 y 20 restos de aminoácidos (por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 restos de aminoácidos, o carecen de 1-20 restos, 1­ 15 restos, 1-10 restos, 2-20 restos, 2-15 restos, 2-10 restos, 5-20 restos, 5-15 restos o 5-10 restos) en el N-terminal y/o C-terminal del ectodominio de longitud completa. Se cree que los restos en los dominios C-terminales no son necesarios para la inmunogenicidad. Un ejemplo de fragmento de gH adecuado descrito en el presente documento se muestra como SEQ ID NO: 4, que corresponde a los restos de aminoácidos 1-715 de la SEQ ID NO: 1. Otro ejemplo de fragmento de gH descrito en el presente documento se muestra como SEQ ID NO: 5, que carece de la secuencia señal N-terminal, el dominio TM y el dominio C-terminal de gH y corresponde a los restos de aminoácidos 24-715 de la SEQ ID NO: 1. Otro ejemplo de fragmento de gH descrito comprende la secuencia señal N-terminal completa y el etcodominio, pero carece del dominio C-terminal.
El ectodominio de gH corresponde al dominio extracelular de gH. La ubicación y la longitud del ectodominio de una gH (o un homólogo o una variante de la misma) pueden predecirse en función de la alineación por pares de su secuencia con SEQ ID NO: 1, 2, 3, 4 o 5, por ejemplo, alineando la secuencia de aminoácidos de una gH con la SEQ ID NO: 1 e identificando la secuencia que se alinea con los restos 24-717 de la SEQ ID NO: 1. De forma similar, las ubicaciones de la secuencia señal, el dominio TM y el dominio C-terminal pueden predecirse alineando la secuencia de aminoácidos de una gH con las SEQ ID NO: 1, 2, 3, 4 o 5, e identificando las secuencias que se alinean con las regiones correspondientes (por ejemplo, restos 1-23 (secuencia señal), 718-736
(TM) y 737-742 (dominio C-terminal) de SEQ ID NO: 1, respectivamente). Alternativamente, la ubicación y la longitud del ectodominio, la secuencia señal, el dominio TM y el dominio C-terminal pueden predecirse basándose en el análisis computacional de la hidrofobicidad a lo largo de una secuencia dada de gH. La secuencia señal y el dominio TM tienen los niveles más altos de hidrofobicidad y estas dos regiones flanquean el ectodominio, que es menos hidrófobo.
También puede obtenerse o determinarse un fragmento de gH formador de complejo adecuado mediante ensayos convencionales conocidos en la técnica, tales como el ensayo de coinmunoprecipitación, reticulación o co-localización por tinción fluorescente, etc. También puede usarse SDS-PAGE o transferencia Western (por ejemplo, mostrando que las cinco subunidades están presentes en una electroforesis en gel). Por ejemplo, el fragmento formador de complejo de gH (i) puede formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) puede comprender al menos un epítopo de SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 o SEQ ID NO: 5; y/o (iii) puede provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
Otras proteínas gH adecuadas pueden ser variantes de gH que tienen diversos grados de identidad con las SEQ ID NO: 1,2, 3, 4 o 5, tal como al menos el 60 %, el 70 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a la secuencia mencionada en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 o SEQ ID NO: 5. Por ejemplo, las proteínas variantes de gH: (i) pueden formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID nO: 3, SeQ ID NO: 4 o SeQ iD NO: 5; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
La glucoproteína L (gL) del CMV humano está codificada por el gen UL115. Se cree que gL es esencial para la replicación vírica y todas las propiedades funcionales conocidas de gL están directamente asociadas con su dimerización con gH. El complejo gL/gH es necesario para la fusión de membranas víricas y plasmáticas que conducen a la entrada del virus en la célula hospedadora. Se ha informado que gL de la cepa Merlin de CMV (Gl:39842115, SEQ ID NO: 6) y la cepa Towne de cMv (Gl:239909463, SEQ ID NO: 7) tienen 278 aminoácidos de longitud. Se ha informado que gL dela cepa AD169 de hCmV (Gl:2506510, SEQ ID NO: 8) tiene 278 aminoácidos de longitud, con una secuencia señal en su N-terminal (restos de aminoácidos 1-35), dos sitios de N-glucosilación (en los restos 74 y 114) y que carece de un dominio TM. Se predice que la secuencia señal N-terminal en SEQ ID NO: 6 comprende los restos de aminoácidos 1-30. La SEQ ID NO: 7 comparte una identidad de secuencia de aminoácidos del 98 % con la SEQ ID NO: 6. La secuenciación del gen gL de longitud completa de 22 a 39 aislados clínicos, así como las cepas de laboratorio AD169, Towne y Toledo revelaron menos del 2 % de variación en las secuencias de aminoácidos entre los aislados.
Habitualmente, la secuencia señal N-terminal de la proteína gL de longitud completa se escinde por una peptidasa señal de la célula hospedadora para producir una proteína gL madura. Como tal, la proteína gL expresada por la célula hospedadora descrita en el presente documento puede carecer de la secuencia señal N-terminal (por ejemplo, gL está codificada por una secuencia de nucleótidos que carece de la secuencia de codificación para la secuencia señal N-terminal). Un ejemplo de una secuencia señal que carece de gL es la SEQ ID NO: 9, que comprende los restos de aminoácidos 31-278 de SEQ ID NO: 6 y carece de una secuencia señal N-terminal de SEQ ID NO: 6. La secuencia de señal de otras proteínas gL puede determinarse mediante herramientas de alineación de secuencia o análisis de secuencia como se describió anteriormente.
También se describen en el presente documento fragmentos formadores de complejos de gL. Un fragmento formador de complejo de gL puede ser cualquier parte o trozo de la proteína gL que retiene la capacidad de formar un complejo con otra proteína CMV. Por ejemplo, un fragmento formador de complejo de gL forma parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131.
Puede obtenerse o determinarse un fragmento de gL formador de complejo adecuado mediante ensayos convencionales conocidos en la técnica, tales como el ensayo de coinmunoprecipitación, reticulación o co-localización por tinción fluorescente, etc. También puede usarse SDS-PAGE o transferencia Western (por ejemplo, mostrando que las cinco subunidades están presentes en una electroforesis en gel). Por ejemplo, el fragmento formador de complejo de gL (i) puede formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 o SEQ ID NO: 9; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
Otras proteínas gL adecuadas pueden ser variantes de gL (y fragmentos de variantes) que tienen diversos grados de identidad con las SEQ ID NO: 6, 7, 8 o 9, tal como al menos el 60 %, el 70 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a la secuencia mencionada en SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 o SEQ ID NO: 9. Por ejemplo, las proteínas variantes de gL: (i) pueden formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 o SEQ ID NO: 9; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
Se ha informado que la pUL128 de la cepa Merlin de CMV humano (GI:39842124, SEQ ID NO: 10) tiene 130 restos de aminoácidos y con una sustitución de 1 nucleótido que provoca la terminación prematura. Se ha informado que la pUL128 de las cepas Towne (GI:39841882, SEQ ID NO: 11) y AD169 (GI:59803078, SEQ ID NO: 12) de CMV humano tienen 171 restos de aminoácidos. Las SEQ ID NO: 10 y 12 comparten más del 99 % de identidad de secuencia en toda la longitud de la SEQ ID NO: 10; sin embargo, debido a la terminación prematura de la traducción, la SEQ ID NO: 10 no tiene los 41 restos de aminoácidos C-terminales de la SEQ ID NO: 12 (aproximadamente el 75 % de identidad de secuencia en toda la longitud de la SEQ ID NO: 12).
Se predice que pUL128 tiene una secuencia señal N-terminal, que se encuentra en los restos 1-27 de la SEQ ID NO: 10, pero se predice que carece de un dominio TM. La secuencia señal N-terminal de la proteína pUL128 de longitud completa puede escindirse mediante una peptidasa señal de la célula hospedadora para producir una proteína pUL128 madura. Como tal, la proteína pUL128 expresada por la célula hospedadora descrita en el presente documento puede carecer de la secuencia señal N-terminal (por ejemplo, pUL128 está codificada por una secuencia de nucleótidos que carece de la secuencia de codificación para la secuencia señal N-terminal). Un ejemplo de una proteína pUL128 madura es la SEQ ID NO: 13, que carece de una secuencia señal N-terminal y corresponde a los restos de aminoácidos 28-171 de la SEQ ID NO: 11. La SEQ ID NO: 13 también coincide con los restos de aminoácidos 28-171 de la SEQ ID NO: 12.
También se describen en el presente documento fragmentos formadores complejos de pUL128. Un fragmento formador de complejo de pUL128 puede ser cualquier parte o trozo de la proteína pUL128 que retiene la capacidad de formar un complejo con otra proteína CMV. Por ejemplo, un fragmento formador de complejo de pUL128 forma parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131.
Puede obtenerse o determinarse un fragmento de pUL128 formador de complejo adecuado mediante ensayos convencionales conocidos en la técnica, tales como el ensayo de coinmunoprecipitación, reticulación o co-localización por tinción fluorescente, etc. También puede usarse SDS-PAGE o transferencia Western (por ejemplo, mostrando que las cinco subunidades están presentes en una electroforesis en gel). Por ejemplo, el fragmento formador de complejo de pUL128 (i) puede formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) comprende al menos un epítopo de SEQ ID NO: 10, SEQ ID nO: 11, SEQ ID NO: 12 o SEQ ID NO: 13; y/o (iii) puede provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
Otras proteínas pUL128 adecuadas pueden ser variantes de pUL128 (y fragmentos de variantes) que tienen diversos grados de identidad con las SEQ ID NO: 10, 11, 12 o 13, tal como al menos el 60 %, el 70 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a la secuencia mencionada en SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12 o SEQ ID NO: 13. Por ejemplo, las proteínas variantes de pUL128: (i) pueden formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SEQ ID NO: 10, sEq ID NO: 11, SEQ ID NO: 12 o SeQ ID No: 13; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de cMv.
UL130 es el gen central y el más grande (214 codones) del locus UL131A-128. La traducción conceptual del gen predice una secuencia señal N-terminal larga (25 aminoácidos) que precede a una proteína hidrófila, con dos sitios potenciales de glucosilación enlazados en N (Asn85 y Asn118) dentro de un supuesto dominio de quimiocinas (aminoácidos 46 a 120) y un sitio adicional de N-glucosilación (Asn201) cerca del final de una región C-terminal única. Se predice que pUL130 carece de un dominio TM. Se ha informado que es una glucoproteína luminal que se secreta de manera ineficiente desde las células infectadas pero se incorpora a la envoltura del virión como una forma madurada por Golgi. Las secuencias de pUL130 de las cepas Merlin y Towne de CMV humano están disponibles públicamente (GI:39842125, SEQ ID NO: 14, 214 restos de aminoácidos; y GI:239909473, SEQ ID NO: 15, 229 restos de aminoácidos, respectivamente). Se ha informado que la SEQ ID NO: 15 contiene una mutación de desplazamiento de marco en la región C-terminal de pUL130 y comparte una identidad del 94 % con la SEQ ID NO: 14 de1HCMV en toda la longitud de la SEQ ID NO: 14.
La secuencia señal N-terminal de la proteína pUL130 de longitud completa puede escindirse mediante una peptidasa señal de la célula hospedadora para producir una proteína pUL130 madura. Como tal, la proteína pUL130 expresada por la célula hospedadora descrita en el presente documento puede carecer de la secuencia señal N-terminal (por ejemplo, pUL130 está codificada por una secuencia de nucleótidos que carece de la secuencia de codificación para la secuencia señal N-terminal). Un ejemplo de una proteína pUL130 madura es la SEQ ID NO: 16, que carece de una secuencia señal N-terminal y corresponde a los restos de aminoácidos 26-214de la SEQ ID NO: 14.
También se describen en el presente documento fragmentos formadores complejos de pUL130. Un fragmento formador de complejo de pUL130 puede ser cualquier parte o trozo de la proteína pUL130 que retiene la capacidad de formar un complejo con otra proteína CMV. Por ejemplo, un fragmento formador de complejo de pUL130 forma parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131.
Puede obtenerse o determinarse un fragmento de pUL30 formador de complejo adecuado mediante ensayos convencionales conocidos en la técnica, tales como el ensayo de coinmunoprecipitación, reticulación o co-localización por tinción fluorescente, etc. También puede usarse SDS-PAGE o transferencia Western (por ejemplo, mostrando que las cinco subunidades están presentes en una electroforesis en gel). Por ejemplo, el fragmento formador de complejo de pUL130 (i) puede formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) comprende al menos un epítopo de SEQ ID NO: 14, SEQ ID NO: 15 o SEQ ID NO: 16; y/o (iii) puede provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de cMv.
Otras proteínas pUL130 adecuadas pueden ser variantes de pUL130 (y fragmentos de variantes) que tienen diversos grados de identidad con las SEQ ID NO: 14, 15 o 16, tal como al menos el 60 %, el 70 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a la secuencia mencionada en SEQ ID NO: 14, SEQ ID NO: 15 o SEQ ID NO: 16. Por ejemplo, las proteínas variantes de pUL130: (i) pueden formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SeQ ID NO: 14, SeQ ID NO: 15 o SEQ iD NO: 16; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
La función pUL131A es necesaria para la replicación del CMV humano no solo en las células endoteliales sino también en las células epiteliales. Se han informado pUL131A de las cepas Merlin (GI:39842126, SEQ ID NO: 17, 129 aminoácidos) y Towne (GI:239909474, SEQ ID NO: 18, 129 aminoácidos) y AD169 (GI:219879712, SEQ ID NO: 19, 76 aminoácidos) de CMV humano. Se predice que pUL131A contiene una secuencia de señal N-terminal, que se encuentra en los restos 1-18 de SEQ ID NO: 18 y que carece de un dominio TM. Se ha informado que pUL131A de la cepa AD169 contiene una inserción de 1 par de bases, que provoca un desplazamiento de marco. La SEQ ID NO: 17 es un 96 % idéntica a SEQ ID NO: 19 en los 28 aminoácidos N-terminales, pero es solo un 36 % idéntica a SEQ ID NO: 19 sobre la longitud total de SEQ ID NO: 17, debido al desplazamiento de marco en el gen AD169 UL131A.
La secuencia señal N-terminal de la proteína pUL131 de longitud completa puede escindirse mediante una peptidasa señal de la célula hospedadora para producir una proteína pUL131 madura. Como tal, la proteína pUL131 expresada por la célula hospedadora descrita en el presente documento puede carecer de la secuencia señal N-terminal (por ejemplo, pUL131 está codificada por una secuencia de nucleótidos que carece de la secuencia de codificación para la secuencia señal N-terminal). Un ejemplo de una proteína pUL130 madura es la SEQ ID NO: 20, que carece de una secuencia señal N-terminal y corresponde a los restos de aminoácidos 19-129 de la SEQ ID NO: 17. La SEQ ID NO: 35 también corresponde a los restos de aminoácidos 19-129 de la SEQ ID NO: 18.
También se describen en el presente documento fragmentos formadores complejos de pUL131. Un fragmento formador de complejo de pUL131 puede ser cualquier parte o trozo de la proteína pUL131 que retiene la capacidad de formar un complejo con otra proteína CMV. Por ejemplo, un fragmento formador de complejo de pUL131 forma parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131.
Puede obtenerse o determinarse un fragmento de pUL31 formador de complejo adecuado mediante ensayos convencionales conocidos en la técnica, tales como el ensayo de coinmunoprecipitación, reticulación o co-localización por tinción fluorescente, etc. También puede usarse SDS-PAGE o transferencia Western (por ejemplo, mostrando que las cinco subunidades están presentes en una electroforesis en gel). Por ejemplo, el fragmento formador de complejo de pUL131 (i) puede formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) comprende al menos un epítopo de SEQ ID NO: 17, SEQ ID n O: 18, SEQ ID NO: 19 o SEQ ID NO: 20; y/o (iii) puede provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de CMV.
Otras proteínas pUL131 adecuadas pueden ser variantes de pUL131 (y fragmentos de variantes) que tienen diversos grados de identidad con las SEQ ID NO: 17, 18, 19 o 20, tal como al menos el 60 %, el 70 %, el 80 %, el 85 %, el 90 %, el 91 %, el 92 %, el 93 %, el 94 %, el 95 %, el 96 %, el 97 %, el 98 % o el 99 % idénticas a la secuencia mencionada en SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 o SEQ ID NO: 20. Por ejemplo, las proteínas variantes de pUL131: (i) pueden formar parte del complejo pentamérico gH/gL/pUL128/pUL130/pUL131; (ii) pueden comprender al menos un epítopo de SEQ ID NO: 17, s Eq ID NO: 18, SEQ ID NO: 19 o Se Q ID No : 20; y/o (iii) pueden provocar anticuerpos in vivo que reaccionan inmunológicamente de forma cruzada con un virión de c Mv .
Las gH, gL, pUL128, pUL130, pUL131 (o un fragmento de las mismas) descritas en el presente documento pueden contener restos de aminoácidos adicionales, tales como extensiones N-terminal o C-terminal. Dichas extensiones pueden incluir una o más etiquetas, que pueden facilitar la detección (por ejemplo, una etiqueta de epítopo para la detección por anticuerpos monoclonales) y/o la purificación (por ejemplo, una etiqueta de polihistidina para permitir la purificación en una resina quelante de níquel) de las proteínas. Algunos ejemplos de etiquetas de purificación por afinidad incluyen, por ejemplo, etiqueta His (hexahistidina (SEQ ID NO: 36), se une al ion metálico), proteína de unión a maltosa (MBP) (se une a la amilosa), glutatión-S-transferasa (GST) (se une al glutatión), etiqueta FLAG (Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO: 37), se une a un anticuerpo anti-flag), etiqueta Strep (Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly (SEQ ID NO: 38), o Trp-Ser- His-Pro-Gln-Phe-Glu-Lys (SEQ ID NO: 39 ), se unen a estreptavidina o un derivado de la misma).
Pueden usarse enlazadores escindibles. Esto permite que la etiqueta se separe del complejo purificado, por ejemplo mediante la adición de un agente capaz de escindir el enlazador. Los expertos en la materia conocen una cantidad de diferentes enlaces escindibles. Dichos enlazadores pueden escindirse, por ejemplo, por irradiación de un enlace fotolábil o hidrólisis catalizada por ácido. También hay enlazadores polipeptídicos que incorporan un sitio de reconocimiento de proteasa y que pueden escindirse mediante la adición de una enzima proteasa adecuada.
Puede ser más deseable tener proteínas gH, gL, pUL128, pUL130, pUL131 (o un fragmento de las mismas) que no comprendan una secuencia de etiqueta exógena, por ejemplo, por razones de seguridad clínica o eficacia.
Aunque las proteínas gH, gL, pUL130 a veces se denominan glucoproteínas, esta nomenclatura no debe entenderse como que estas proteínas deben estar glucosiladas cuando se usan con la invención. Si bien se han mencionado anteriormente cepas específicas, debe entenderse que pueden usarse proteínas de CMV gH, gL, pUL128, pUL130, pUL131 (o fragmentos de las mismas) de diferentes cepas de CMV. A modo de ejemplo no limitante, otra cepa de CMV puede incluir las cepas Towne, Toledo, AD169, Merlin, TB20 y VR1814.
B. Ácido nucleico que codifican proteínas y complejos de CMV
También se describen en el presente documento ácidos nucleicos que codifican las proteínas y complejos de CMV para la integración genómica y la posterior expresión de pentámero de CMV.
Pueden usarse una o más construcciones de ácido nucleico que codifican las proteínas y complejos de CMV descritos en el presente documento para la integración genómica. Por ejemplo, una sola construcción de ácido nucleico que codifica las cinco subunidades, gH, gL, pUL128, pUL130, pUL131 (o fragmentos de las mismas), puede introducirse en una célula hospedadora. Alternativamente, las secuencias codificantes para las cinco subunidades (o fragmentos de las mismas) pueden transportarse por dos o más construcciones de ácido nucleico, que después se introducen en la célula hospedadora de forma simultánea o secuencial.
Por ejemplo, se describe en el presente documento una construcción de ácido nucleico único que codifica: el ectodominio de gH, gL, pUL128, pUL130 y pUL131. Alternativamente, se describen en el presente documento dos construcciones de ácido nucleico que codifican: el ectodominio de gH, gL, pUL128, pUL130 y pUL131. Véase, la Figura 1. En ambos ejemplos, se logró una integración genómica exitosa.
La construcción de ácido nucleico puede comprender ADN genómico que comprende uno o más intrones o ADNc. Algunos genes se expresan de manera más eficiente cuando los intrones están presentes. La secuencia genómica nativa que codifica pUL128 comprende dos intrones, la secuencia genómica nativa que codifica pUL131 comprende un exón, mientras que la secuencia genómica nativa que codifica pUL130 no comprende ningún intrón. La secuencia genómica nativa que codifica pUL128 comprende tres exones, la secuencia genómica nativa que codifica pUL131 comprende dos exones y la secuencia genómica nativa que codifica pUL130 comprende un exón. Particularmente la secuencia de ácido nucleico es adecuada para la expresión de polipéptidos exógenos en dicha célula de mamífero.
También se describen en el presente documento vectores que comprenden secuencias codificantes para gH, gL, pUL128, pUL130 y/o pUL131 (o un fragmento de las mismas). Los vectores ejemplares incluyen plásmidos que pueden replicarse de forma autónoma o replicarse en una célula de mamífero. Los vectores de expresión típicos contienen promotores, potenciadores y terminadores adecuados que son útiles para la regulación de la expresión de la secuencia o secuencias codificantes en la construcción de expresión. Los vectores también pueden comprender marcadores de selección para proporcionar un rasgo fenotípico para la selección de células hospedadoras transformadas (tales como conferir resistencia a antibióticos tales como ampicilina o neomicina).
Algunos promotores adecuados incluyen, por ejemplo, promotor de CMV, adenovirus, EF1a, promotor de metalotionina GAPDH, promotor temprano de SV-40, promotor tardío de SV-40, promotor del virus del tumor mamario murino, promotor del virus del sarcoma de Rous, promotor de polihedrina, etc. Los promotores pueden ser constitutivos o inducibles. Pueden usarse uno o más vectores (por ejemplo, un vector que codifica las cinco subunidades o fragmentos de las mismas o dos o más vectores que codifican juntos las cinco subunidades o fragmentos de las mismas); véase, por ejemplo, la Figura 1.
Cuando la célula hospedadora es una célula CHO, el promotor, el potenciador o terminador está activo en las células CHO. Un promotor de uso frecuente es el promotor del gen de citomegalovirus humano (hCMV) temprano inmediato (IE). El promotor de este gen dirige altos niveles de expresión transgénica en una amplia diversidad de tipos celulares. La actividad de este promotor depende de una serie de repeticiones imperfectas de 17, 18, 19 y 21 pb, algunas de los cuales se unen a factores de transcripción de la proteína de unión sensible a AMPc NF-kB (CREB) y las familias de factor nuclear-1.
Un promotor fuerte es aquel que hace que los ARNm se inicien a una frecuencia alta igual o mayor que la del fragmento promotor/potenciador central de hCMV (descrito en la Pat. de EE.UU. N.° 5.168.062) en una célula CHO. Dicho promotor puede ser un promotor fuerte dependiente del tipo celular, como se describe en la Pat. de EE.UU. N.° 5.589.392, o un promotor fuerte ubicuamente activo. Los promotores víricos constitutivamente activos ejemplares incluyen, por ejemplo, promotores tempranos y tardíos del virus SV40, el promotor temprano inmediato del citomegalovirus humano (hCMV) o del citomegalovirus murino (mCMV), el promotor de timidina quinasa (TK) del virus del herpes simple o el promotor de repetición terminal larga del virus del sarcoma de Rous (RS-LTR). Otros ejemplos incluyen, por ejemplo, el promotor hCMV-MIE como se define por el fragmento Pst I de 2,1 kb descrito en la Pat. de EE.UU. N.° 5.385.839 y/o EP-323997-A1 o una parte funcional del mismo que tiene actividad promotora.
También pueden usarse el sitio interno de entrada al ribosoma (I RES) y las secuencias peptídicas 2A. I RES y el péptido 2A proporcionan enfoques alternativos para la co-expresión de secuencias múltiples. IRES es una secuencia de nucleótidos que permite el inicio de la traducción en el medio de una secuencia de a Rn mensajero (ARNm) como parte del mayor proceso de síntesis de proteínas. Habitualmente, en eucariotas, la traducción solo puede iniciarse en el extremo 5' de la molécula de ARNm. Los elementos IRES permiten la expresión de múltiples genes en un transcrito. Los vectores policistrónicos basados en IRES, que expresan múltiples proteínas de un transcrito, pueden reducir el escape de clones que no se expresan a partir de la selección.
El péptido 2A permite la traducción de múltiples proteínas en un solo marco de lectura abierto en una poliproteína que posteriormente se divide en proteínas individuales a través de un mecanismo de omisión de ribosomas. El péptido 2A puede proporcionar una expresión más equilibrada de múltiples productos proteicos.
Algunos ejemplos de secuencias IRES incluyen, por ejemplo, EV71 IRES, EMCV IRES, HCV IRES.
Para la integración genómica, la integración puede ser específica del sitio o aleatoria. La recombinación específica del sitio puede lograrse mediante la introducción de secuencias homólogas en las construcciones de ácido nucleico descritas en el presente documento. Dicha secuencia homóloga coincide sustancialmente con la secuencia endógena en un sitio diana específico en el genoma del hospedador. Alternativamente, puede usarse integración aleatoria. A veces, el nivel de expresión de una proteína puede variar dependiendo del sitio de integración. Por lo tanto, puede ser deseable seleccionar un número de clones de acuerdo con el nivel de expresión de proteína recombinante para identificar un clon que logre el nivel de expresión deseado.
3. CÉLULAS HOSPEDADORAS
En otro aspecto de la divulgación, se describen células hospedadoras en las que las secuencias codificantes de pentámeros están integradas de manera estable en el genoma de las células hospedadoras y, cuando se cultivan bajo una condición adecuada, expresan el pentámero CMV como se desvela en el presente documento. La célula hospedadora puede ser una célula de mamífero. Por ejemplo, la célula hospedadora puede ser una célula de roedor.
Los ejemplos de líneas celulares de roedores incluyen, por ejemplo, riñón de hámster bebé (BHK) (por ejemplo, BHK21, BH TK), Sertoli de ratón (TM4), hígado de rata búfalo (Br L 3A), tumor mamario de ratón (Mm T), hepatoma de rata (HTC), mieloma de ratón (NS0), hibridoma murino (Sp2/0), timoma de ratón (EL4), ovario de hámster chino (CHO) y derivados de células CHO, embrión murino (NIH/3T3, 3T3 Li), miocardio de rata (H9c2), mioblastos de ratón (C2C12) y riñón de ratón (miMCD-3).
Las células CHO adecuadas incluyen, por ejemplo, líneas DUXB11 y DG44. Estas dos líneas celulares son deficientes en la actividad de dihidrofolato reductasa (DHFR) y, por lo tanto, dependen de una fuente exógena de precursores de nucleótidos para el crecimiento. La deficiencia de DHFR es un fenotipo fácilmente manipulable adecuado para seleccionar la integración del genoma y la expresión estable de ADN exógeno. La integración genómica se logra mediante la transfección de las células con casetes de expresión para el gen de interés y un gen DHFR. Después de la transfección, las células se colocan en medios de selección que carecen de precursores de nucleótidos.
La expresión de proteínas de recombinación en líneas celulares deficientes en DHFR puede mejorarse aún más añadiendo metotrexato (MTX) a los cultivos, de tal manera que pueda seleccionarse un número alto de copias del vector de expresión introducido. MTX es un inhibidor competitivo de la enzima DHFR. La aplicación de esta presión de selección adicional sobre la ausencia de precursores de nucleótidos permite la selección y el aislamiento de la población menor de células que han sufrido una amplificación espontánea del vector de expresión integrado que contiene el marcador seleccionable DHFR y, en la mayoría de los casos, el gen de interés. La presencia de múltiples copias de genes ayuda a lograr un alto nivel de expresión de proteínas exógenas. Alternativamente, la selección de MTX puede llevarse a cabo independientemente de la deficiencia de DHFR (es decir, usar MTX para seleccionar una célula hospedadora que sea originalmente competente para DHFR), como se ejemplifica en los Ejemplos desvelados en el presente documento.
Otra línea celular CHO adecuada es la línea celular CHO-K1 de tipo silvestre y su derivado CHO-K1SV.
Un procedimiento de selección comúnmente usado para las líneas celulares CHO-K1 es la selección de glutamina sintetasa (GS). En ausencia de una fuente exógena de glutamina, la supervivencia celular depende de la enzima GS para producir glutamina. Con líneas celulares huésped tales como células NS/0 derivadas de mieloma murino y células CHO, que tienen una actividad enzimática GS relativamente baja endógena, el procedimiento permite un esquema de selección sencillo cuando se usa un marcador seleccionable GS en el vector de expresión y los medios de selección libres de glutamina. Similar al sistema DHFR/MTX, el inhibidor competitivo GS metionina sulfoximina (MSX) puede añadirse a los medios para aplicar presión adicional y seleccionar las células CHO que están impulsando altos niveles de expresión del vector integrado.
Las células CHO-K1, o cualquier otra célula CHO comúnmente usada, también puede seleccionarse en función de la deficiencia de DHFR como se ha descrito anteriormente. Por ejemplo, una célula CHO-K1, o cualquier otro tipo de célula CHO, puede tener deficiencia de DHFR, tal como una deleción en la que al menos una copia de la secuencia genómica del gen de dihidrofolato reductasa (DHFR) o al menos el 30 % (por ejemplo, al menos el 40 %, al menos el 50 %, al menos el 60 %, al menos el 70 %, al menos el 80 %, al menos el 90 % o el 100 %) de la secuencia codificante de dicho gen DHFR, está eliminada. Otras formas de introducir la deficiencia de DHFR incluyen la creación de mutaciones en el gen endógeno DHFR. Las líneas celulares pueden mejorarse adicionalmente añadiendo metotrexato (MTX) a los cultivos como se describió anteriormente.
Las células CHO-K1, o cualquier otra célula CHO comúnmente usada, también puede seleccionarse en función de MTX, con o sin deficiencia de DHFR. En los ejemplos proporcionados en el presente documento, las células CHO se seleccionaron basándose en MTX, sin deficiencia de DHFR (es decir, la célula CHO original usada para la integración genómica es competente para DHFR). En un sistema tal, normalmente, el número de copias de secuencias exógenas (por ejemplo, las secuencias que codifican las proteínas de CMV) es generalmente bajo. Se estima que las líneas celulares en los Ejemplos descritos en el presente documento tienen aproximadamente 1-10 copias de secuencias exógenas que codifican las proteínas de CMV, en un número muy limitado de sitios de integración (por ejemplo, 1-2 sitios de integración). En general, cuando se usa una línea celular deficiente en DFHR, el número de copias de secuencias exógenas es típicamente mucho más alto, a veces tan alto como unos cientos de copias. Se espera que ambos procedimientos sean adecuados para producir líneas celulares CHO desveladas en el presente documento, aunque cuando el número de copias es alto, la célula hospedadora puede perder una o más copias de secuencias exógenas durante el pasaje y/o la expansión de la línea celular.
Otras cepas de células CHO adecuadas para la invención descrita en el presente documento incluyen, por ejemplo, células CHO-ICAM-1 y células CHO-hIFNY. Estas células genéticamente modificadas permiten la inserción estable de ADN recombinante en un gen específico o región de expresión de las células, amplificación del ADN insertado y selección de células que exhiben un alto nivel de expresión de la proteína recombinante.
Las líneas celulares CHO ejemplares disponibles en la European Collection of Cell Cultures (ECACC) se enumeran en la Tabla 1. Puede usarse cualquier célula CHO enumerada en la Tabla 1.
Tabla 1
Figure imgf000011_0001
continuación
Figure imgf000012_0001
Diversas líneas celulares CHO también están disponibles de la American Type Culture Collection (ATCC), tales como las líneas celulares CHO hCBE11 (ATCC® PTA-3357™), E77.4 (ATCC® PTA-3765™), hLT-B: R-hG1 CHO n.° 14 (ATCC® CRL-11965™), MOR-CHO- MORAb-003-RCB (ATCC® PTA-7552™), AQ.C2 clon 11B (ATCC® PTA-3274™), AQ.C2 clon 11B (ATCC® PTA-3274™), hsAQC2 en CHO-DG44 (ATCC® PTA-3356™), xrs5 (ATCC® CRL-2348™), CHO-K1 (ATCC® CCL-61™), Lec1 [originalmente denominado Pro-5WgaRI3C] (ATCC® CRL-1735™), Pro-5 (ATCC® CRL-1781™), ACY1-E (ATCC® 65421™), ACY1-E (ATCC® 65420™), pgsE-606 (ATCC® CRL-2246™), CHO-CD36 (ATCC® CRL-2092™), pgsC-605 (ATCC® CRL-2245™), MC2/3 (ATCC® CRL-2143™), CHO-ICAM-1 (ATCC® CRL-2093™) y pgsB-618 (ATCC® cRl-2241™). Puede usarse una cualquiera de estas líneas celulares CHO.
Otras líneas celulares CHO disponibles en el mercado incluyen, por ejemplo, Células CHO-S FreeStyle™ y Línea Celular FIp-In™-CHO de Life Technologies.
Se han desvelado procedimientos para expresar proteínas recombinantes en células CHO en general. Véase, por ejemplo, en las Patentes de EE.UU. N.° 4.816.567 y N.° 5.981.214.
Además de las células CHO, otras células de mamíferos también pueden usarse como hospedadores. Las células de roedores ejemplares incluyen células BHK21, células NS0, células Sp2/0, células EL4, células NIH/3T3, células 3T3-L1, células ES-D3, células H9c2, células C2C12, YB2/0, células mimed 3, etc. Las células humanas ejemplares incluyen: células SH-SY5Y, células IM 32, células LAN, células MCFIOA, células 293T, células SK-BR3, células huvec, células huasmc, células HKB-1, células hmsc, células U293, células HE 293, células PERC6®, células Jurkai, células HT-29, células Incap.FGC, célula A549, células MDA MB453, células hepg2, células THP-1, células bxpc-3, células Capan-1, células DU145 y células PC-3.
Por ejemplo, la línea celular PERC6®, célula de mieloma de ratón NS0, célula de riñón de hámster bebé (BHK) y la línea celular de riñón embrionario humano (HEK293) recibieron la aprobación reglamentaria para la producción de proteínas recombinantes.
Algunos ejemplos de líneas celulares de primates no humanos útiles en los procedimientos proporcionados en el presente documento incluyen las líneas celulares de riñón de mono (CVI-76), riñón de mono verde africano (VERO-76), fibroblastos de mono verde (COS-1) y células de riñón de mono (CVI) transformadas por SV40 (COS-7). Los expertos en la materia conocen líneas celulares de mamíferos adicionales y están catalogadas en el catálogo de la American Type Culture Collection (Manassas, VA).
Las células hospedadoras pueden ser adecuadas para el crecimiento en cultivos en suspensión. Las células hospedadoras competentes en suspensión están generalmente monodispersas o crecen en agregados sueltos sin agregación sustancial. Las células hospedadoras competentes en suspensión incluyen células que son adecuadas para el cultivo en suspensión sin adaptación o manipulación (por ejemplo, células hematopoyéticas, células linfoides) y células que se han hecho competentes en suspensión mediante modificación o adaptación de células dependientes de la unión (por ejemplo, células epiteliales, fibroblastos).
Alternativamente, la célula hospedadora puede ser una célula dependiente de unión que se cultiva y se mantiene en cultivo adherente. Los ejemplos de líneas celulares adherentes humanas útiles en los procedimientos proporcionados en el presente documento incluyen las líneas celulares de neuroblastoma humano (SH-SY5 Y, IMR32 y LANS), carcinoma cervical humano (HeLa), epitelial de mama humana (MCFIOA), riñón embrionario humano (293T) y carcinoma de mama humano (SK-BR3).
Genes C12orf35 y proteínas C12orf35
La célula hospedadora de la invención es una célula en la que se reduce el nivel de expresión o actividad de la proteína C12orf35, en comparación con un control. La Solicitud de Patente Provisional de EE.UU. N.° 61/919.313, presentada el 20 de diciembre de 2013 proporciona una descripción detallada de las células de mamíferos en las que el nivel de expresión o actividad de la proteína C12orf35 se reduce en comparación con un control.
Puede usarse una diversidad de controles. El nivel de expresión o actividad de la proteína C12orf35 de una célula de tipo silvestre correspondiente puede usarse como control. Alternativamente, un control puede ser un nivel predeterminado o un nivel umbral que puede identificarse en las referencias bibliográficas o en la base de datos.
El gen C12orf35 humano se refiere a la secuencia de nucleótidos que codifica el marco de lectura abierta 35 del cromosoma 12. La proteína C12orf35 codificada no está caracterizada. El homólogo Cricetulus griseus (hámster chino) del gen humano C12orf35, llamado Kiaa1551, se cree que se encuentra en el cromosoma 8. Se cree que el homólogo de Mus musculus del gen humano C12orf35 se encuentra en el cromosoma 6. La ID del gen para el gen CHO C12orf35 se publica como ID del gen de GenBank N.° 100762086; y para el gen C12orf35 humano se publica como ID del gen de GenBank N.° 55196. La información sobre el gen C12orf35 en Cricetulus griseus, la secuencia de codificación y la proteína C12orf35 predicha también están disponibles en GenBank con el número de referencia de NCBI: XM_003512865.
El gen C12orf35 se expresa endógenamente en células eucariotas como, por ejemplo, especies de mamíferos tales como humano, ratón y hámster. La proteína predicha codificada por el gen C12orf35 es una proteína grande que excede los 1500 restos. La lista de secuencias muestra ejemplos de secuencias de aminoácidos o secuencias de aminoácidos putativas de la proteína codificada por el gen endógeno C12orf35 de diferentes especies de mamíferos tales como hámster (SEQ ID NO: 21 y 22), humano (SEQ ID NO: 23 y 24) y ratón (SEQ ID NO: 35). La CDS (secuencia de ADN codificante, por sus siglas en inglés) de C12orf35 del hámster chino se muestra como SEQ ID NO: 25. Adicionalmente, se secuenció una sección del 5'UTR (véase la SEQ ID NO: 26) y del 3'UTR (véase la SEQ ID NO: 27) del ARNm C12orf35 del hámster chino.
En humanos, el gen C12orf35 también se conoce como KIAA1551. El gen C12orf35 también se conoce como tipo C12orf35 u homólogo C12orf35 en hámster o 2810474O19Rik en ratón. Pueden asignarse diferentes nombres en diferentes especies para la proteína o el gen y los nombres alternativos no limitantes (alias) también se enumeran anteriormente en la Tabla 2. Por simplicidad, en la presente divulgación, los homólogos y ortólogos de diferentes especies se denominan "gen C12orf35" o "proteína C12orf35".
Contra este contexto científico, es sorprendente e inesperado que cuando el nivel de expresión o actividad de la proteína C12orf35 se reduce en comparación con un control (por ejemplo, al eliminar el gen C12orf35 o al introducir mutaciones), el rendimiento de la proteína recombinante se mejora significativamente. Como tal, las células hospedadoras de mamífero (por ejemplo, células CHO) con nivel de expresión reducido o actividad de la proteína C12orf35 son particularmente adecuadas para la producción recombinante de complejo pentamérico.
La reducción del nivel de expresión o actividad de una proteína C12orf35 puede lograrse por diversos medios. Por ejemplo, el nivel de expresión o actividad de una proteína C12orf35 puede reducirse por inactivación génica, mutación génica, deleción génica, silenciamiento génico o una combinación de cualquiera de los anteriores. La inactivación génica es una técnica genética mediante la cual un gen se vuelve inoperativo al interrumpir su función. Por ejemplo, puede insertarse un ácido nucleico en la secuencia codificante, interrumpiendo de esta manera la función del gen. Adicionalmente, el gen C12orf35 de longitud completa (o un fragmento del mismo) puede eliminarse, por lo que la expresión de la proteína C12orf35 funcional se elimina sustancialmente. Por ejemplo, la deleción puede ser de al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 55 %, al menos el 60 %, al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 % o el 100 % de la secuencia codificante del gen C12orf35. Otra opción es introducir una o más mutaciones en la secuencia codificante, que produce una proteína C12orf35 no funcional o menos funcional. Por ejemplo, pueden introducirse una o más mutaciones de desplazamiento de marco, dando como resultado una proteína C12orf35 no funcional o menos funcional. Alternativa o adicionalmente, pueden introducirse uno o más codones de parada en la secuencia codificante de tal manera que se obtiene una proteína truncada, no funcional o menos funcional. Otras opciones incluyen, pero no se limitan a, una o más mutaciones en el promotor, en el 5'- y/o 3' UTR u otros elementos reguladores, por ejemplo, introduciendo una deleción del promotor o introduciendo una construcción entre el promotor y el inicio de la transcripción. Los procedimientos para la interrupción génica para suprimir o eliminar la expresión del gen diana también son bien conocidos por la persona experta.
Como cada célula tiene dos copias del gen C12orf35 en su genoma, en determinadas realizaciones, al menos una copia de la secuencia genómica del gen C12orf35, o al menos el 50% de la secuencia codificante de dicho gen C12orf35, está eliminada. Por ejemplo, pueden eliminarse ambas copias de las secuencias genómicas del gen C12orf35 (o al menos el 50 % de la secuencia codificante de dicho gen C12orf35 de cada copia).
En determinadas realizaciones, la secuencia eliminada comprende una porción de la región telomérica del cromosoma 8 de una célula CHO. Una región telomérica es una región de secuencias repetitivas de nucleótidos en cada extremo de una cromátida, que protege el extremo del cromosoma del deterioro o de la fusión con los cromosomas vecinos. Por ejemplo, al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 55 %, al menos el 60 %, al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 % o el 100% de la secuencia de nucleótidos de la región telomérica del cromosoma 8 de una célula CHO puede eliminarse.
Como se describe en el presente documento, la secuencia eliminada puede comprender además la deleción de un gen seleccionado del grupo que consiste en: Bicd1, Amn1, proteína similar a la metiltransferasa 20, Dennd5b, FAM60A, Caprin2, Ipo8, RPS4Y2 y una combinación de los mismos.
La deleción del gen C12orf35 (o un fragmento del mismo) puede deberse a una ruptura cromosómica. La ruptura cromosómica puede inducirse, por ejemplo, tratando las células eucariotas con un agente tóxico que promueve la ruptura cromosómica, tales como por ejemplo MTX, afidicolina o higromicina. Otras opciones para inducir rupturas cromosómicas incluyen, pero no se limitan a, radiación, irradiación, mutágenos, sustancias cancerígenas y bleomicina. Las rupturas cromosómicas también pueden producirse espontáneamente durante la transfección, por ejemplo, electroporación. Los procedimientos para inducir la ruptura cromosómica también son conocidos por la persona experta y, por lo tanto, no necesitan ninguna descripción detallada en este punto. Después de inducir la ruptura cromosómica, las células eucariotas que tienen el punto de ruptura deseado (que da como resultado una deleción del gen C12orf35, o un fragmento del mismo) pueden identificarse, por ejemplo, analizando el ADN o usando el procedimiento de acuerdo con el quinto aspecto de la presente divulgación. Por ejemplo, el perfil de expresión de las células tratadas puede analizarse para determinar si el gen C12orf35 o los genes ubicados centroméricos del gen C12orf35 se expresan, si la expresión se reduce o si los genes no se expresan. Por ejemplo, en el caso de las células de ratón o hámster, puede analizarse si el gen C12orf35 se expresa y, alternativamente o además de ello, puede analizarse si uno o más genes seleccionados del grupo que consiste en la proteína 20 similar a la metiltransferasa, Dennd5b, FAM60A, Caprin2, Ipo8, Tmtc1 o genes que se encuentran teloméricos de los genes mencionados anteriormente (en el que telomérico significa a este respecto en la dirección del extremo telomérico) se expresan por la célula y/o si la expresión se reduce o se elimina sustancialmente.
La reducción del nivel de expresión de la proteína C12orf35 puede lograrse mediante silenciamiento génico posttranscripcional, por ejemplo, por moléculas de ácido nucleico antisentido, o moléculas que median la interferencia de ARN. Los ejemplos no limitantes incluyen ARNip, ARNhc, miARN, oligonucleótidos antisentido, etc., todos los cuales son bien conocidos en la técnica.
El nivel de expresión de la proteína C12orf35 puede evaluarse mediante procedimientos conocidos en la técnica, por ejemplo, midiendo el nivel de ARNm que codifica la proteína C12orf35, o la propia proteína C12orf35. Dichos procedimientos incluyen, por ejemplo transferencia Northern, FACS, ImageStream, transferencia Western, qPCR, RT-PCR, qRT-PCR, ELISA, Luminex, Multiplex, etc.
El nivel de expresión o actividad de la proteína C12orf35 puede reducirse al menos 3 veces, al menos 5 veces, al menos 10 veces, al menos 20 veces, al menos 30 veces, al menos 40 veces, al menos 50 veces, al menos 60 veces, al menos 70 veces, al menos 75 veces, al menos 80 veces, al menos 90 veces, al menos 100 veces, en comparación con un control.
Genes FAM60A y proteínas FAM60A
En determinadas realizaciones, la célula hospedadora es una célula en la que se reduce el nivel de expresión o actividad de la proteína FAM60A, en comparación con un control. La Solicitud de Patente Provisional de e E.UU. N.° 61/919.340, presentada el 20 de diciembre de 2013 proporciona una descripción detallada de las células de mamíferos en las que se reduce el nivel de expresión o actividad de la proteína FAM60A.
Puede usarse una diversidad de controles como se analizó anteriormente. El nivel de expresión o actividad de la proteína FAM60A de una célula de tipo silvestre correspondiente puede usarse como control. Alternativamente, un control puede ser un nivel predeterminado o un nivel umbral que puede identificarse en las referencias bibliográficas o en la base de datos.
La proteína FAM60A es una subunidad del complejo SIN3-histona desacetilasa (HDAC) (complejo SIN3/HDAC) que funciona en la represión transcripcional (Munoz y col., 2012, THE Journal of Biological Chemistry VOL. 287, N.° 39, pp. 32346-32353; Smith y col., 2012, Mol Cell Proteomics 11 (12): 1815-1828). Las desacetilasas de histonas (HDAC) catalizan la retirada de grupos acetilo de las histonas. La acetilación de histonas en lisinas es un mecanismo principal para modular la conformación de la cromatina. La acetilación de histonas promueve un estado de cromatina relajado, transcripcionalmente activo, mientras que la desacetilación catalizada por histona desacetilasas (HDAC) favorece un estado inactivo, silente. El análisis de la base de datos reveló la presencia de al menos un ortólogo FAM60A en la mayoría de los metazoos, pero no en nematodos. El gen FAM60A se conserva en metazoos y puede encontrarse en todos los genomas de vertebrados y la mayoría de invertebrados que se han secuenciado por completo. La investigación de similitud de secuencia de los homólogos de FAM60A indica que predominantemente, solo hay un miembro representativo de esta familia en el genoma. Solo hay algunas excepciones. De acuerdo con Smith y col., 2012, la proteína FAM60A tiene una secuencia única que carece de cualquier dominio de proteína conocido. Además, se describió por Smith y col. 2012, que no exhibe ninguna homología de secuencia con otras proteínas conocidas en el proteoma humano. La comparación de secuencias entre las proteínas FAM60A de diferentes especies mostró que la proteína FAM60A generalmente comprende tres regiones: (1) un N-terminal que comprende segmentos altamente conservados en todos los metazoos (2) una región media que está altamente conservada a través de vertebrados, mientras que en los invertebrados consiste en un espaciador no conservado de longitud variable (3) un C-terminal que comprende segmentos altamente conservados en todos los metazoos. Por lo tanto, la conservación más alta se observó en las regiones N- y C-terminales de FAM60A.
Los estudios indican que la proteína FAM60A se asocia con los complejos SIN3/HDAC en diversos tipos de células eucariotas, como en particular las células de mamíferos. Sin embargo, hasta la fecha, la información funcional sobre la proteína FAM60A es limitada. Estudios funcionales recientes (véase Smith y col., 2012) indican que la proteína FAM60A puede reprimir la expresión génica y regula un subconjunto específico de genes. Smith y col. 2012 informan un papel de la proteína FAM60A en la regulación de la ruta de señalización de TGF-beta, que juega un papel fundamental en procesos como la progresión del cáncer, la metástasis, la migración celular y la vigilancia inmunitaria. Hay hallazgos que indican que la proteína FAM60A actúa como un represor transcripcional de los componentes de la ruta de señalización de TGF-beta, mientras que esta función de la proteína FAM60A parece estar permitida a través de su papel en el complejo SIN3-HDAC. El agotamiento de la proteína FAM60A en diferentes líneas celulares de cáncer usando ARNip contra la secuencia codificante de FAM60A dio como resultado un cambio de la morfología celular normal del cáncer. Adicionalmente, se descubrió que los niveles de proteína FAM60A cambian periódicamente en el transcurso del ciclo celular en las células U2OS (Muñoz y col., 2012). Los experimentos de inactivación de FAM60A usando ARNip de FAM60A en células de osteosarcoma de hueso humano U2OS revelaron que la proteína FAM60A restringe la expresión del gen de ciclina D1.
Contra este contexto científico, fue sorprendente descubrir que reducir la expresión o actividad de la proteína FAM60A en una célula de mamífero aumenta la estabilidad de la expresión de proteínas recombinantes, sin afectar negativamente a otras características de la célula que son importantes para la expresión recombinante. Esta correlación entre los efectos de la proteína FAM60A y la estabilidad de la expresión durante el cultivo prolongado de las células fue inesperada. Como tal, las células hospedadoras de mamífero (por ejemplo, células CHO) con nivel de expresión reducido o actividad de la proteína FAM60A son particularmente adecuadas para la producción recombinante de complejo pentamérico.
El gen FAM60A se expresa endógenamente en metazoos y, por lo tanto, en especies de mamíferos tales como humano, ratón, rata y hámster, y la secuencia de aminoácidos de FAM60A está altamente conservada en especies de mamíferos, así como en vertebrados. Pueden asignarse diferentes nombres en diferentes especies para la proteína o el gen y los nombres alternativos no limitantes (alias) también se enumeran anteriormente en la Tabla 2 (a continuación). Por simplicidad, en la presente divulgación, los homólogos y ortólogos de diferentes especies se denominan "gen FAM60A" o "proteína FAM60A".
El listado de secuencias muestra secuencias de aminoácidos ejemplares de proteínas FAM60A conocidas y/o predichas de diferentes especies de vertebrados, a saber, Homo sapiens (SEQ iD NO: 28), Mus musculus (SEQ ID NO: 29), Cricetulus griseus (SEQ ID NO: 30). El ADNc de FAM60A predicho de Cricetulus griseus se muestra en SEQ ID NO: 31 (secuencia codificante de 14-679; véase también la Secuencia de Referencia NCBI: XM_003505482.1). La proteína FAM60A no se ha descrito en detalle en las referencias bibliográficas. Por lo tanto, fue sorprendente que la estabilidad de la expresión de una célula hospedadora recombinante pueda mejorarse, si el genoma de la célula hospedadora se altera de tal manera que se reduce el nivel de expresión o la actividad de la proteína endógena FAM60A, en comparación con un control. Fue inesperado que la proteína FAM60A influya en la estabilidad de la expresión de un producto recombinante de interés.
Se han informado secuencias del gen FAM60A que codifica la proteína FAM60A en Homo sapiens (NCBI Gene-ID: 58516); Rattus norvegicus (ID de gen NCBI: 686611); Mus musculus (ID de gen NCBI: 56306); Bos taurus (ID de gen NCBI: 538649) y otros. Las variantes de transcripción pueden existir de una manera dependiente de la especie y en diferentes números (por ejemplo, el gen FAM60A humano expresa tres isoformas de transcripción putativas que difieren en las UTR pero codifican la misma proteína).
La reducción del nivel de expresión o actividad de una proteína FAM60A puede lograrse por diversos medios. Por ejemplo, el nivel de expresión o actividad de una proteína FAM60A puede reducirse por inactivación génica, mutación génica, deleción génica, silenciamiento génico o una combinación de cualquiera de los anteriores. La inactivación génica es una técnica genética mediante la cual un gen se vuelve inoperativo al interrumpir su función. Por ejemplo, puede insertarse un ácido nucleico en la secuencia codificante, interrumpiendo de esta manera la función del gen. Adicionalmente, el gen FAM60A de longitud completa (o un fragmento del mismo) puede eliminarse, por lo que la expresión de la proteína FAM60A funcional se elimina sustancialmente. Por ejemplo, la deleción puede ser de al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 55 %, al menos el 60 %, al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 % o el 100 % de la secuencia codificante del gen FAM60A. Otra opción es introducir una o más mutaciones en la secuencia codificante, que produce una proteína FAM60A no funcional o menos funcional. Por ejemplo, pueden introducirse una o más mutaciones de desplazamiento de marco, dando como resultado una proteína FAM60A no funcional o menos funcional. Alternativa o adicionalmente, pueden introducirse uno o más codones de parada en la secuencia codificante de tal manera que se obtiene una proteína truncada, no funcional o menos funcional. Otras opciones incluyen, pero no se limitan a, una o más mutaciones en el promotor, en el 5'- y/o 3' UTR u otros elementos reguladores, por ejemplo, introduciendo una deleción del promotor o introduciendo una construcción entre el promotor y el inicio de la transcripción. Los procedimientos para la interrupción génica para suprimir o eliminar la expresión del gen diana también son bien conocidos por la persona experta.
Como cada célula tiene dos copias del gen FAM60A en su genoma, en determinadas realizaciones, al menos una copia de la secuencia genómica del gen FAM60A, o al menos el 50 % de la secuencia codificante de dicho gen FAM60A, está eliminada. Por ejemplo, ambas copias de las secuencias genómicas del gen FAM60A (o al menos el 50 % de la secuencia codificante de dicho gen FAM60A de cada copia) se eliminan.
En determinadas realizaciones, la secuencia eliminada comprende una porción de la región telomérica del cromosoma 8 de una célula CHO. Una región telomérica es una región de secuencias repetitivas de nucleótidos en cada extremo de una cromátida, que protege el extremo del cromosoma del deterioro o de la fusión con los cromosomas vecinos. Por ejemplo, al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 55 %, al menos el 60 %, al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 % o el 100 % de la secuencia de nucleótidos de la región telomérica del cromosoma 8 de una célula CHO se elimina.
La secuencia eliminada puede comprender además una deleción del gen seleccionado del grupo que consiste en: Caprin2 e Ipo8, y una combinación de los mismos.
La eliminación del gen FAM60A se debe a una ruptura cromosómica. La ruptura cromosómica puede inducirse por los procedimientos descritos anteriormente. Después de inducir la ruptura cromosómica, las células que tienen el punto de corte deseado (que da como resultado una deleción del gen FAM60A) pueden identificarse, por ejemplo, analizando el ADN o usando el procedimiento de acuerdo con el quinto aspecto de la presente divulgación. Por ejemplo, el perfil de expresión de las células tratadas puede analizarse para determinar si el gen FAM60A o los genes ubicados centroméricos del gen FAM60A se expresan, si la expresión se reduce o si los genes no se expresan. Por ejemplo, en el caso de células de ratón o hámster, puede analizarse si el gen FAM60A se expresa y, alternativamente o además de ello, puede analizarse si uno o más genes seleccionados del grupo que consiste en Bicd1, C12orf35, proteína similar a la metiltransferasa 20, Dennd5b, Caprin2, Ipo8, Tmtc1 o genes que se encuentran teloméricos de los genes mencionados anteriormente (en el que telomérico significa a este respecto en la dirección del extremo telomérico) se expresan por la célula y/o si la expresión se reduce o se elimina sustancialmente.
La reducción del nivel de expresión de la proteína FAM60A puede lograrse mediante el silenciamiento génico posttranscripcional, por ejemplo, por moléculas de ácido nucleico antisentido, o moléculas que median la interferencia de ARN. Los ejemplos no limitantes incluyen ARNip, ARNhc, miARN, oligonucleótidos antisentido, etc., todos los cuales son bien conocidos en la técnica.
El nivel de expresión de la proteína FAM60A puede evaluarse mediante procedimientos conocidos en la técnica, por ejemplo, midiendo el nivel de ARNm que codifica la proteína FAM60A, o la propia proteína FAM60A. Dichos procedimientos incluyen, por ejemplo transferencia Northern, FACS, ImageStream, transferencia Western, qPCR, RT-PCR, qRT-PCR, ELISA, Luminex, Multiplex, etc.
El nivel de expresión o actividad de la proteína FAM60A puede reducirse al menos 3 veces, al menos 5 veces, al menos 10 veces, al menos 20 veces, al menos 30 veces, al menos 40 veces, al menos 50 veces, al menos 60 veces, al menos 70 veces, al menos 75 veces, al menos 80 veces, al menos 90 veces, al menos 100 veces, en comparación con un control.
Genes de Matriptasa y Matriptasas
En determinadas realizaciones, la célula hospedadora es una célula en la que se reduce el nivel de expresión o actividad de la matriptasa, en comparación con un control. La solicitud de patente provisional de eE.UU. n.° 61/985.589, presentada el 29 de abril de 2014 y la Solicitud de Patente Provisional de EE.UU. N.° 61/994.310, presentada el 16 de mayo de 2014 proporciona una descripción detallada de las células de mamíferos en las que se reduce el nivel de expresión o la actividad de la matriptasa.
Puede usarse una diversidad de controles como se analizó anteriormente. El nivel de expresión o actividad de la matriptasa de una célula de tipo silvestre correspondiente puede usarse como control. Alternativamente, un control puede ser un nivel predeterminado o un nivel umbral que puede identificarse en las referencias bibliográficas o en la base de datos.
La matriptasa se describió por primera vez en 1993 como una nueva actividad gelatinolítica en células de cáncer de mama cultivadas. La matriptasa pertenece a la familia de las serina proteasas transmembrana de tipo II (TTSP). Los ortólogos de matriptasa están presentes en diferentes especies de vertebrados, incluyendo especies de mamíferos, y se identificaron, por ejemplo, en humano, chimpancé, perro, ratón, rata, pollo, pez cebra, pez globo verde manchado y pez globo tigre lo que sugiere una función evolutiva conservada. La matriptasa figura en la nomenclatura de enzimas IUBMB como EC 3.4.21.109. La matriptasa también se conoce como serina proteasa 1 de tipo membrana (MT-SP1) y supresor de tumorigenicidad-14 (ST14) (véase Chen y col., The Transmembrane Serine Protease Matriptase: Implications for Cellular Biology and Human Diseases J Med Sci 2012; 32 (3): 097-108). Es una proteína de membrana integral con un dominio transmembrana de un solo tramo cerca del N-terminal citoplasmático. La parte extracelular consiste en una región madre (que incluye un solo SEA, 2 dominios CUB y 4 dominios LDLRA) y el dominio de serina proteasa C-terminal que es estructuralmente muy similar a otros TTSP e incluye una tríada catalítica histidina/ácido aspártico/serina (HDS) conservada esencial para la actividad catalítica (véase, por ejemplo, List y col., Matriptase: Potent Proteolysis on the cell Surface; Mol Med 12 (1-3) 1-7, Enero-Marzo de 2006 y Chen y col., The Transmembrane Serine Protease Matriptase: Implications for Cellular Biology and Human Diseases J Med Sci 2012; 32 (3): 097-108). La matriptasa se describe como estando expresada en los epitelios en muchos sistemas de órganos tales como piel, mama, pulmón, epidermis, córnea, glándula salival, cavidades orales y nasales, tiroides, timo, esófago, tráquea, bronquiolos, alveolos, estómago, páncreas, vesícula biliar, duodeno, intestino delgado, colon, recto, riñón, adrenales, vejiga urinaria, uréter, vesículas seminales, epidídimo, próstata, ovarios, útero y vagina (véase List y col., 2006 y Chen y col., 2012). La matriptasa se sintetiza como un zimógeno inactivo y se convierte a su forma activa a través de un procedimiento complicado. Los detalles relacionados con el procedimiento de activación que implica la escisión endoproteolítica se describen para la matriptasa humana en List y col. 2006 y Chen y col. 2012. La matriptasa se une a la membrana como proteína transmembrana de tipo II con el dominio catalítico orientado hacia el espacio extracelular. Adicionalmente, se describe en las referencias bibliográficas que un desprendimiento significativo de matriptasa, respectivamente su parte extracelular, se produce in vivo (véase List y col., 2006 y Chen y col. 2012). Se describe en las referencias bibliográficas que la matriptasa se desprende en forma de un complejo, por ejemplo, complejado con el inhibidor de la serina proteasa de tipo Kunitz HAI-1. Diferentes estudios sugieren que en las células humanas el inhibidor específico HAI-1 facilita el transporte de la matriptasa a la membrana celular, ya que se demostró que la eliminación o incluso mutaciones puntuales en HAI-1 conducen a una acumulación de la matriptasa en el compartimento de Golgi. En las referencias bibliográficas, se han descrito varios inhibidores endógenos diferentes de la matriptasa además de HAI-1 tales como HAI-2, antitrombina, alfa-1 antitripsina y alfa -2-antiplasmina. Adicionalmente, también se han descrito otros inhibidores de la matriptasa (véase, por ejemplo, Chen y col., 2012). En las referencias bibliográficas se describe que la matriptasa puede desempeñar numerosos papeles en la fisiología normal tales como la función de barrera cutánea, integridad epitelial, desarrollo del folículo piloso y homeostasis del timo, y en patologías humanas, tales como osteoartritis, ateroscleorisis y progresión tumoral, invasión y metástasis.
Contra este contexto científico que no está relacionado con la producción recombinante de una proteína, el hallazgo actual de que la matriptasa es una proteasa implicada en el recorte de proteínas producidas de forma recombinante que son secretadas por las células hospedadoras en el medio de cultivo celular fue muy sorprendente. Considerando la gran cantidad y variedad de proteasas expresadas en células de vertebrados, tales como en particular las células de mamíferos, fue aún más sorprendente que la reducción del nivel de expresión o actividad de esta proteína puede reducir significativamente el recorte del polipéptido secretado de interés en el medio de cultivo celular. Estos efectos ventajosos no se ven con otras proteasas incluso estrechamente relacionadas. Como tal, las células hospedadoras de mamífero (por ejemplo, células CHO) con nivel de expresión reducido o actividad de matriptasa son particularmente adecuadas para la producción recombinante de complejo pentamérico.
La lista de secuencias muestra secuencias de aminoácidos ejemplares de matriptasa de diferentes especies de vertebrados tales como el hámster (SEQ ID NO: 32 - secuencia de referencia NCBI: XP_003495890), humano (SEQ ID NO: 33 - Secuencia de referencia NCBI: NP_068813), ratón (SEQ ID NO: 34 - Secuencia de referencia NcBI: NP_035306).
También se han informado las secuencias de nucleótidos que codifican matriptasa de diferentes especies de mamíferos. Véase, por ejemplo, hámster chino (ID de gen NCBI: 100755225); Homo sapiens (ID de gen NCBI: 6768); Mus musculus (ID de gen NCBI: 19143); Rattus norvegicus (ID de gen Nc B i: 114093); Pan Troglodytes (ID de gen NCBI: 100188950) y otros. Los sinónimos de algunos de los genes de la matriptasa se enumeran en la Tabla 3, es comúnmente usado "ST14" o "St14".
Como se muestra en la Tabla 3, la matriptasa también se conoce como "supresor de la proteína 14 de tumorigenicidad" (por ejemplo, para humanos) y "supresor de la proteína homogénea 14 de tumorigenicidad" (por ejemplo, en ratón y hámster chino). Por simplicidad, en la presente divulgación, Los homólogos y ortólogos de diferentes especies se denominan "gen de matriptasa" o "matriptasa" (proteína).
También se describen en el presente documento variantes funcionales de una matriptasa (variantes que tienen sustancialmente las mismas actividades catalíticas que una matriptasa de tipo silvestre). Por ejemplo, una variante de matriptasa puede comprender una secuencia que es al menos el 50 %, al menos el 60 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 %, al menos el 96 %, al menos el 97 %, al menos el 98 % o al menos el 99 % idéntica a cualquiera de las secuencias de SEQ ID NO: 32-34 y tiene las mismas, o sustancialmente las mismas actividades catalíticas que una proteína de matriptasa de tipo silvestre. La actividad catalítica de una variante de matriptasa puede evaluarse, por ejemplo, por la reacción química para escindir varios sustratos sintéticos con Arg o Lys en la posición P1 y prefieren aminoácidos de cadena lateral pequeña, tales como Ala y Gly, en la posición P2 (véase EC 3.4.21.109).
También se describen en el presente documento fragmentos funcionales de una matriptasa (fragmentos que tienen sustancialmente las mismas actividades catalíticas de una matriptasa de longitud completa). Un fragmento funcional de una matriptasa puede ser un subconjunto de aminoácidos contiguos de la matriptasa de longitud completa desvelada en el presente documento, y tiene la misma actividad catalítica, o sustancialmente la misma, que la secuencia proteica de longitud completa. La actividad catalítica de un fragmento de matriptasa puede evaluarse, por ejemplo, por la reacción química para escindir varios sustratos sintéticos con Arg o Lys en la posición P1 y prefieren aminoácidos de cadena lateral pequeña, tales como Ala y Gly, en la posición P2 (véase EC 3.4.21.109).
La reducción del nivel de expresión o actividad de una matriptasa puede lograrse por diversos medios. Por ejemplo, el nivel de expresión o actividad de una matriptasa puede reducirse por la inactivación de genes, mutación génica, deleción génica, silenciamiento génico o una combinación de cualquiera de los anteriores. La inactivación génica es una técnica genética mediante la cual un gen se vuelve inoperativo al interrumpir su función. Por ejemplo, puede insertarse un ácido nucleico en la secuencia codificante, interrumpiendo de esta manera la función del gen. Adicionalmente, el gen de la matriptasa de longitud completa (o un fragmento del mismo) puede eliminarse, por lo que la expresión de matriptasa funcional se elimina sustancialmente. Por ejemplo, la deleción puede ser de al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 55 %, al menos el 60 %, al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 % o el 100 % de la secuencia de codificación del gen de la matriptasa. Otra opción es introducir una o más mutaciones en la secuencia codificante, que produce una matriptasa no funcional o menos funcional. Por ejemplo, pueden introducirse una o más mutaciones de desplazamiento de marco, dando como resultado una matriptasa no funcional o menos funcional. Alternativa o adicionalmente, pueden introducirse uno o más codones de parada en la secuencia codificante de tal manera que se obtiene una proteína truncada, no funcional o menos funcional. Otras opciones incluyen, pero no se limitan a, una o más mutaciones en el promotor, en el 5'- y/o 3' UTR u otros elementos reguladores, por ejemplo, introduciendo una deleción del promotor o introduciendo una construcción entre el promotor y el inicio de la transcripción. Los procedimientos para la interrupción génica para suprimir o eliminar la expresión del gen diana también son bien conocidos por la persona experta.
Como cada célula tiene dos copias del gen de la matriptasa en su genoma, en determinadas realizaciones, al menos una copia de la secuencia genómica del gen de la matriptasa, o al menos el 50 % de la secuencia de codificación de dicho gen de la matriptasa, o un fragmento funcional de dicho gen de la matriptasa, está eliminada. Por ejemplo, ambas copias de las secuencias genómicas del gen de la matriptasa (o al menos el 50 % de la secuencia codificante de dicho gen de la matriptasa, o un fragmento funcional de dicho gen de la matriptasa, de cada copia) se eliminan.
En determinadas realizaciones, la célula hospedadora comprende una mutación en el exón 2 del gen de la matriptasa. El exón 2 es particularmente adecuado como una diana para alterar la actividad de la matriptasa porque existen varias variantes de corte y empalme funcional diferentes. Por lo tanto, los exones cercanos al N-terminal de la matriptasa tales como, por ejemplo, el exón 1, el exón 2 y el exón 3, son ventajosos para introducir una o más mutaciones, en particular una o más mutaciones de desplazamiento de marco. Una mutación de desplazamiento de fotograma en uno de estos exones muy probablemente conduce a un codón de detención temprano en la secuencia. Las mutaciones también pueden introducirse en uno de los exones posteriores, por ejemplo, seleccionado de los exones 4 a 19.
La matriptasa puede comprender como una mutación en el dominio catalítico. El dominio catalítico es la región de una enzima que interactúa con su sustrato para provocar la reacción enzimática. Pueden introducirse una o más mutaciones en este dominio para que la actividad catalítica de la proteína se reduzca en comparación con un control. El dominio catalítico comprende secuencias codificadas por los exones 16, 17, 18 y 19. Las mutaciones pueden ser una deleción, una inserción, una sustitución o una combinación de los mismos. Las mutaciones pueden causar una mutación de desplazamiento de marco, una mutación puntual específica, una mutación de codón de parada o una recombinación de las mismas, en la secuencia que codifica el dominio catalítico. También se han descrito mutantes catalíticos inactivos de matriptasa tales como, por ejemplo, G827R-matriptasa o S805A-matriptasa (véase Desilets y col., The Journal of Biological Chemistry Vol. 283, N.° 16, pp. 10535-10542, 2008). Adicionalmente, se conoce la estructura cristalina del dominio catalítico de una matriptasa recombinante. A partir de esta estructura y datos de secuencia, la persona experta puede derivar dianas específicas adicionales para mutaciones que perjudiquen la función catalítica de la matriptasa.
La reducción del nivel de expresión de la matriptasa puede lograrse mediante el silenciamiento génico posttranscripcional, por ejemplo, por moléculas de ácido nucleico antisentido, o moléculas que median la interferencia de ARN. Los ejemplos no limitantes incluyen ARNip, ARNhc, miARN, oligonucleótidos antisentido, etc., todos los cuales son bien conocidos en la técnica.
El nivel de expresión de matriptasa puede evaluarse mediante procedimientos conocidos en la técnica, por ejemplo, midiendo el nivel de ARNm que codifica la matriptasa o la propia matriptasa. Dichos procedimientos incluyen, por ejemplo transferencia Northern, FACS, ImageStream, transferencia Western, qPCR, RT-PCR, qRT-PCR, ELiSa , Luminex, Multiplex, etc. La actividad de la matriptasa puede evaluarse, por ejemplo, de acuerdo con su actividad enzimática.
El nivel de expresión o actividad de la matriptasa puede reducirse al menos 3 veces, al menos 5 veces, al menos 10 veces, al menos 20 veces, al menos 30 veces, al menos 40 veces, al menos 50 veces, al menos 60 veces, al menos 70 veces, al menos 75 veces, al menos 80 veces, al menos 90 veces, al menos 100 veces, en comparación con un control.
Tabla 2: Abreviaturas y nombres alternativos (alias) de productos codificados por genes ubicados en el cromosoma 8 del hámster chino o el cromosoma 6 del ratón.
Figure imgf000019_0001
continuación
Figure imgf000020_0001
continuación
Figure imgf000021_0001
continuación
Figure imgf000022_0001
Tabla 3: Ejemplos de nombres alternativos del gen de matriptasa y/o el producto de proteína codificado matriptasa usados en las referencias bibliográficas (orden alfabético)
Figure imgf000022_0002
Una célula hospedadora adecuada puede tener cualquier combinación de modificaciones descritas en el presente documento, por ejemplo, una célula en la que tanto el nivel de expresión o actividad de la proteína C12orf35 se reduce en dicha célula, en comparación con un control, y el nivel de expresión o actividad de la proteína FAM60A se reduce en dicha célula, en comparación con un control. Otras combinaciones incluyen, por ejemplo, reducción del nivel o actividad de expresión de proteína C12orf35, y reducción del nivel o actividad de expresión de matriptasa; reducción del nivel o actividad de expresión de proteína FAM60A, y reducción del nivel o actividad de expresión de matriptasa; reducción del nivel o actividad de expresión de proteína C12orf35, reducción del nivel o actividad de expresión de proteína FAM60A, y reducción del nivel o actividad de expresión de matriptasa; reducción del nivel o actividad de expresión de la proteína C12orf35 e inclusión de la secuencia de dihidrofolato reductasa (DHFR) como un marcador de selección, etc.
Las células hospedadoras descritas en el presente documento son adecuadas para cultivo a gran escala. Por ejemplo, los cultivos celulares pueden ser de 10 l, 30 l, 50 l, 100 l, 150 l, 200 l, 300 l, 500 l, 1000 l, 2000 l, 3000 l, 4000 l, 5000 l, 10.000 l o más grandes. Por ejemplo, el tamaño del cultivo celular puede variar de 10 l a 5000 l, de 10 l a 10.000 l, de 10 l a 20.000 l, de 10 l a 50.000 l, de 40 l a 50.000 l, de 100 l a 50.000 l, de 500 l a 50.000 l, de 1000 l a 50.000 l, de 2000 l a 50.000 l, de 3000 l, a 50.000 l, de 4000 l a 50.000 l, de 4500 l a 50.000 l, de 1000 l a 10.000 l, de 1000 l a 20.000 l, de 1000 l a 25,000 l, de 1000 l a 30.000 l, de 15 l a 2000 l, de 40 l a 1000 l, de 100 l a 500 l, de 200 l a 400 l, o cualquier número entero entre ellos.
Los componentes de medios para el cultivo celular son conocidos en la técnica y pueden incluir, por ejemplo, tampones, contenido de aminoácidos, contenido de vitaminas, contenido de sal, contenido mineral, contenido de suero, contenido de fuente de carbono, contenido de lípidos, contenido de ácido nucleico, contenido hormonal, contenido de elementos traza, contenido de amoniaco, contenido de cofactor, contenido del indicador, contenido de molécula pequeña, contenido de hidrolizado y contenido de modulador enzimático.
4. PURIFICACIÓN DEL COMPLEJO PENTAMÉRICO DEL CULTIVO CELULAR
El complejo pentamérico producido de acuerdo con los procedimientos descritos en el presente documento puede cosecharse de células hospedadoras y purificarse usando cualquier procedimiento adecuado. Los procedimientos adecuados incluyen precipitación y diversos tipos de cromatografía, tales como de interacción hidrófoba, de intercambio iónico, de afinidad, de quelación y de exclusión por tamaño, todas las cuales se conocen en la técnica. Pueden crearse esquemas de purificación adecuados usando dos o más de estos u otros procedimientos adecuados. Si se desea, una o más de las subunidades del complejo pentamérico pueden comprender una "etiqueta" que facilita la purificación, tales como una etiqueta epítopo o una etiqueta HIS, etiqueta Strep. Tales polipéptidos etiquetados pueden purificarse convenientemente, por ejemplo de medios condicionados, por cromatografía quelante o cromatografía de afinidad. Opcionalmente, la secuencia de etiqueta puede escindirse después de la purificación.
Por ejemplo, El documento WO2014/005959 desvela procedimientos ejemplares de purificación de complejo pentamérico por cromatografía de afinidad.
Como se describe en el presente documento, una o más subunidades del complejo pentamérico pueden comprender una etiqueta para la purificación por afinidad. Algunos ejemplos de etiquetas de purificación por afinidad incluyen, por ejemplo, etiqueta His (se une al ion metálico), un anticuerpo (se une a la proteína A o proteína G), proteína de unión a maltosa (MBP) (se une a la amilosa), glutatión-S-transferasa (GST) (se une al glutatión), etiqueta FLAG (Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys (SEQ ID NO: 37)) (se une a un anticuerpo anti-flag), etiqueta Strep (se une a estreptavidina o un derivado de la misma).
Se desconoce la estructura del complejo pentamérico gH/gL/pUL128/pUL130/pUL131. Sin embargo, si la etiqueta de purificación por afinidad está adherida a un sitio que interfiere con la formación del complejo pentamérico o un sitio que está enterrado dentro del complejo, la purificación por afinidad no sería exitosa. Se cree que los siguientes sitios son adecuados para unir una etiqueta de purificación por afinidad, ya que la etiqueta no parece interferir con la formación del complejo pentamérico y parece estar expuesta en la superficie de un pentámero ensamblado: (i) región C-terminal de pUL130, (ii) región N-terminal de pUL130, (iii) región C-terminal de pUL131, (iv) región N-terminal de pUL131, (v) región C-terminal de pUL128, (vi) región N-terminal de pUL128 o una combinación de los mismos.
El complejo pentamérico puede no comprender una etiqueta de purificación.
Otro procedimiento adecuado es la cromatografía de intercambio iónico. Los ejemplos de materiales útiles en la cromatografía de intercambio iónico incluyen DEAE-celulosa, QAE-celulosa, DEAE-cefalosa, QAE-cefalosa, DEAE-Toyopearl, QAE-Toyopearl, Mono Q, Mono S, Q sepharose, SP sepharose, etc. En particular, el procedimiento puede usar la columna Mono S. Alternativamente, el procedimiento puede usar la columna Mono Q.
El rendimiento del complejo pentamérico de CMV puede ser de al menos aproximadamente 0,01 g/l. al menos aproximadamente 0,02 g/l, al menos aproximadamente 0,03 g/l, al menos aproximadamente 0,05 g/l, al menos aproximadamente 0,06 g/l, al menos aproximadamente 0,07 g/l, al menos aproximadamente 0,08 g/l, al menos aproximadamente 0,09 g/l, al menos aproximadamente 0,1 g/l, al menos aproximadamente 0,15 g/l, al menos aproximadamente 0,20 g/l, al menos aproximadamente 0,25 g/l, al menos aproximadamente 0,3 g/l, al menos aproximadamente 0,35 g/l, al menos aproximadamente 0,4 g/l, al menos aproximadamente 0,45 g/l, al menos aproximadamente 0,5 g/l, al menos aproximadamente 0,55 g/l. al menos aproximadamente 0,6 g/l, al menos aproximadamente 0,65 g/l, al menos aproximadamente 0,7 g/l, al menos aproximadamente 0,75 g/l, al menos aproximadamente 0,8 g/l, al menos aproximadamente 0,85 g/l. al menos aproximadamente 0,9 g/l, al menos aproximadamente 0,95 g/l o al menos aproximadamente 1,0 g/l.
5. DEFINICIONES
La expresión "fragmento formador complejo" de una proteína CMV (tales como gH, gL, pUL128, pUL130 o pUL131) se refiere a cualquier parte o porción de la proteína que retiene la capacidad de formar un complejo con otra proteína CMV. Dichos complejos incluyen, por ejemplo, complejo pentamérico gH/gL/pUL128/pUL130/pUL131. Los fragmentos que retienen la capacidad de formar el complejo pentamérico también se denominan "fragmentos formadores de pentámero".
Un "cultivo a gran escala" se refiere a un cultivo que tiene al menos aproximadamente 10 litros de tamaño, (por ejemplo, un volumen de al menos aproximadamente 10 l, al menos aproximadamente 20 l, al menos aproximadamente 30 l, al menos aproximadamente 40 l, al menos aproximadamente 50 l, al menos aproximadamente 60 l, al menos aproximadamente 70 l, al menos aproximadamente 80 l, al menos aproximadamente 90 l, al menos aproximadamente 100 l, al menos aproximadamente 150 l, al menos aproximadamente 200 l, al menos aproximadamente 250 l, al menos aproximadamente 300 l, al menos aproximadamente 400 l, al menos aproximadamente 500 l, al menos aproximadamente 600 l, al menos aproximadamente 700 l, al menos aproximadamente 800 l, al menos aproximadamente 900 l, al menos aproximadamente 1000 l, al menos aproximadamente 2000 l, al menos aproximadamente 3000 l, al menos aproximadamente 4000 l, al menos aproximadamente 5000 l, al menos 6000 l, al menos aproximadamente 10.000 l, a al menos aproximadamente 15,000 l, al menos 20.000 l, al menos aproximadamente 25,000 l, al menos aproximadamente 30.000 l, al menos 35,000 l, al menos aproximadamente 40.000 l, al menos aproximadamente 45,000 l, al menos 50.000 l, al menos aproximadamente 55,000 l, al menos aproximadamente 60.000 l, al menos 65,000 l, al menos aproximadamente 70.000 l, al menos aproximadamente 75,000 l, al menos
Figure imgf000024_0001
80.000 l, al menos aproximadamente 85,000 l, al menos aproximadamente 90.000 l, al menos
aproximadamente 95,000 l, al menos aproximadamente 100.000 l, etc.
Un complejo pentamérico "soluble" se refiere al complejo gH/gL/pUL128/pUL130/pUL131 en el que la subunidad gH no comprende el dominio transmembrana.
A lo largo de la memoria descriptiva, incluyendo las reivindicaciones, cuando el contexto lo permite, la expresión "que comprende" y variantes como "comprende" o "que comprenden", deben interpretarse como que incluyen el número entero o los números enteros indicados sin excluir necesariamente ningún otro número entero.
La identidad de secuencia se calcula de acuerdo con el porcentaje de coincidencias de restos entre dos secuencias de polinucleótidos, o coincidencias de nucleótidos entre dos secuencias de polinucleótidos, alineados usando un algoritmo normalizado. Un algoritmo tal puede insertar, de manera normalizada y reproducible, huecos en las secuencias que se comparan para optimizar la alineación entre dos secuencias y, por lo tanto, lograr una comparación más significativa de las dos secuencias. El porcentaje de identidad puede medirse sobre la longitud de una secuencia definida completa, o puede medirse sobre una longitud más corta, por ejemplo, a lo largo de un fragmento tomado de una secuencia definida más grande, por ejemplo, un fragmento de al menos 45, al menos 60, al menos 90, al menos 120, al menos 150, al menos 210 o al menos 450 restos o nucleótidos contiguos. Si no se especifica la longitud, la identidad de secuencia se calcula a través de la longitud completa de la más corta de las dos secuencias.
La presente invención se ilustra adicionalmente mediante los siguientes ejemplos que no deben interpretarse como limitantes.
Ejemplos
Este ejemplo se refiere a la producción del complejo de la proteína pentamérica del CMV mediante líneas celulares CHO en las que las secuencias codificantes de las subunidades pentaméricas se integraron de manera estable en el cromosoma. Las líneas celulares también se denominan líneas celulares estables CHO.
Como se muestra en este ejemplo, estas líneas celulares CHO estables produjeron pentámero de CMV funcional, con las cinco subunidades ensambladas en la conformación natural. El rendimiento es alto, permitiendo de esta manera la producción de complejos pentaméricos a gran escala comercial. Estas líneas celulares son particularmente adecuadas para la fabricación a gran escala de vacunas contra el CMV usando pentámero.
Como se muestra en este ejemplo, las secuencias de nucleótidos que codifican el ectodominio gH, gL, pUL128, pUL130 y pUL131 se clonaron en vectores de expresión únicos o dobles, con promotores subgenómicos e IRES para impulsar la expresión del componente individual (Figura 1). Específicamente, las secuencias codificantes para el ectodominio gH, gL de longitud completa, pUL128, pUL130 y pUL131 fueron codones optimizados para la expresión de cultivos de mamíferos, sintetizados y clonados en un solo vector de expresión (con selección Neo y DHFR) dirigido por el promotor CMV (para gH y UL128) y EV71 IRES (para gL, UL130, UL131) para expresión; o vectores de doble expresión, uno con selección Neo y DHFR para gH impulsado por el promotor CMV, y gL impulsado por el promotor CMV o EV71 IRES, y uno con selección Hyg y Fra para UL128 dirigido por el promotor CMV, UL130 y UL131 dirigidos por EV71 IRES (Figura 1). Las etiquetas de purificación por afinidad, tales como la etiqueta His y/o la etiqueta Strep, se introdujeron en el extremo C del ectodominio gH y/o UL130 para facilitar la purificación. El codón de parada y el dominio transmembrana de gH también se introdujeron en el extremo C del ectodominio de gH para facilitar la subclonación de FACS (Figura 1).
El plásmido o plásmidos de expresión se transfectaron en un panel de células hospedadoras CHO, incluyendo (i) CHOC8TD, (ii) CHOHPT3 y (iii) líneas celulares CHOC8TD matriptasa KO.
CHOC8TD deriva de una línea celular CHO K1 y se modifica adicionalmente eliminando la región telomérica del cromosoma, entonces esta línea celular tiene las siguientes características: (i) telómero del cromosoma 8 eliminado; (ii) alta productividad y buen crecimiento celular; y (iii) problemas potenciales de alta degradación proteolítica. CHOHPT3 es una línea celular CHO K1 que muestra actividad proteolítica reducida, entonces esta línea celular tiene las siguientes características: (i) menor degradación proteolítica que CHOC8TD y (ii) menor crecimiento, productividad y eficiencia de clonación que CHOC8TD. CHOC8TD metriptasa KO derivó de CHOC8TD, con matriptasa inactivada, entonces esta línea celular tiene las siguientes características: (i) Matriptasa (serina proteasa) inactivada; y (ii) menos degradación proteolítica.
El plásmido o plásmidos de expresión que comprenden secuencias codificantes para gH, gL, UL128, UL130 y UL131 se transfectaron en las tres células hospedadoras con nucleofección AMAXA. Para la estrategia de un solo vector, las células transfectadas se seleccionaron por G418 y MTX secuencialmente. Para la estrategia de vector doble, las células transfectadas se seleccionaron por Hyg y después MTX secuencialmente.
Los grupos de células supervivientes se cultivaron en lotes para producir proteína pentámero para evaluar el rendimiento de la proteína con ELISA indirecto, la contaminación de gH/gL y degradación de gL con transferencia Western y SDS-PAGE. Basado en el rendimiento del pentámero y el crecimiento celular, el grupo de transfecto CHO con Vector Strategy 2 (Figura 1), usando células hospedadoras CHOC8TD, se seleccionaron para la clonación de células individuales (plásmidos de expresión mostrados en la Figura 2). Los clones seleccionados muestran alto rendimiento y menos contaminación por gH/gL.
Los clones individuales se clasificaron con FACS usando mAb específico de pentámero (-200). Los 30 clones principales se seleccionaron primero a base del título de pentámero evaluado con ELISA indirecto y después se seleccionaron a los 12 clones principales. El cultivo discontinuo en lotes seguido de purificación por afinidad con Strep mostró que los 12 principales pueden producir pentámero con rendimiento > 300 mg/l y alta pureza (Figura 3). De hecho, los clones superiores produjeron pentámero con un rendimiento de aproximadamente 0,3 g/l a aproximadamente 0,5 g/l. Se evaluó la unión del complejo proteico purificado con un panel de mAb contra pentámero, y se mostró que presentaba todos los epítopos clave.
Los 12 clones principales se evaluaron adicionalmente a través de estudios de estabilidad de 14 semanas (Figura 4). Se evaluaron los lotes controlados y no controlados para determinar el crecimiento celular y el título de pentámero y se seleccionó el Clon VF7.
También se evaluó la producción de biorreactor de pentámero con el clon superior VF7. Este clon produjo > 100 mg/l de pentámero purificado (Figura 5).
Como se ejemplifica en el presente documento, pueden usarse células CHO estables para expresar pentámero. Esto está en contraste con la expresión transitoria por las células HEK293. Las líneas celulares estables de CHO de la invención pueden producir proteína pentámero consistentemente con un rendimiento 100 veces mayor.
La capacidad de producir líneas celulares CHO estables en las que las secuencias de codificación de las cinco subunidades del pentámero se integran en el cromosoma, como se ejemplifica en el presente documento, es bastante notable. Siempre existen incertidumbres sobre si se puede generar una línea celular estable, incluso para una sola proteína. Por ejemplo, cuando se introdujo una secuencia codificante para IGF-1 humano en células CHO para generar una línea estable, se descubrió que las líneas celulares IGF-1/CHO resultantes mostraban inhibición del crecimiento celular y títulos bajos. Esta medida de título máximo fue de aproximadamente 8 ug/ml, que corresponde a 100 mg/l de un título de anticuerpos (basado en la masa molar). En comparación, las mediciones de título promedio de un anticuerpo recombinante en el procedimiento de biorreactor son alrededor de 3 g/l. Una causa del bajo título de IGF-1 fue la reducción del crecimiento celular y la baja viabilidad celular de las células que expresan IGF-1. Durante un procedimiento de expresión de anticuerpos, Las células celulares derivadas de CHO-K1 crecen hasta 2 x 107 células/ml y la viabilidad celular es superior al 97 % durante las primeras 230-260 h de cultivo. En contraste, las células derivadas de CHO-K1 que expresan IGF-1 crecieron solo hasta 0,5 x 107 células/ml y la viabilidad celular ya había caído a menos del 97 % después de dos días. Para detalles adicionales, véase, la Solicitud provisional de EE.UU. N.° 61/738466, presentada el 18 de diciembre de 2012 y la publicación de solicitud PCT N.° WO/2014/097113, presentada el 16 de diciembre de 2013.
Por lo tanto, los presentes inventores enfrentaron dificultades adicionales significativas porque las secuencias de codificación para las cinco subunidades pentámeras de CMV deben integrarse de manera estable en el genoma de la célula CHO. Los inventores superaron estas dificultades, como lo demuestran los clones seleccionados que muestran

Claims (14)

REIVINDICACIONES
1. Una célula CHO recombinante, que comprende:
una o más secuencias de polinucleótidos que codifican el complejo pentamérico de citomegalovirus (CMV), en la que dicho complejo pentamérico comprende: gH o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, gL o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL128 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL130 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo y pUL131 o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo;
en la que dicha una o más secuencias de polinucleótidos están integradas en el ADN genómico de dicha célula CHO; y en la que el nivel de expresión o actividad de la proteína C12orf35 se reduce en dicha célula CHO, en comparación con una célula de tipo silvestre.
2. La célula CHO de la reivindicación 1, en la que dicha célula CHO es una célula CHO-K1, CHO-DUXB11, célula CHO-DG44 o célula CHO-S.
3. La célula CHO de la reivindicación 2, en la que al menos una copia de la secuencia genómica del gen C12orf35, o al menos el 50 % de la secuencia codificante de dicho gen C12orf35, está eliminada.
4. La célula CHO de la reivindicación 3, en la que dicha secuencia eliminada comprende una porción de la región telomérica del cromosoma 8 de una célula CHO.
5. La célula CHO de una cualquiera de las reivindicaciones 1-4, en la que el nivel de expresión o actividad de la proteína FAM60A se reduce en dicha célula, en comparación con una célula de tipo silvestre.
6. La célula CHO de la reivindicación 5, en la que al menos una copia de la secuencia genómica del gen FAM60A, o al menos el 50 % de la secuencia codificante de dicho gen FAM60A, está eliminada.
7. La célula CHO de una cualquiera de las reivindicaciones 1-6, en la que el nivel de expresión o actividad de matriptasa se reduce en dicha célula, en comparación con una célula de tipo silvestre.
8. La célula CHO de la reivindicación 7, en la que dicha célula comprende una mutación en el exón 2 del gen de la matriptasa.
9. La célula CHO de una cualquiera de las reivindicaciones 1-8, en la que dicho fragmento de formación de complejo de gH comprende el ectodominio de una proteína gH de longitud completa.
10. La célula CHO de una cualquiera de las reivindicaciones 1-9, en la que dicho complejo pentamérico es soluble.
11. La célula CHO de una cualquiera de las reivindicaciones 1-10, en la que dicho complejo pentamérico se secreta de la célula hospedadora.
12. Un cultivo a gran escala que comprende la célula CHO de una cualquiera de las reivindicaciones 1-11, en el que dicho cultivo tiene al menos 20 litros de tamaño.
13. El cultivo a gran escala de la reivindicación 12, en el que el rendimiento del complejo pentamérico CMV es de al menos 0,05 g/l.
14. Un procedimiento de producción de complejo pentamérico de citomegalovirus (CMV), en el que dicho complejo pentamérico comprende: gH o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, gL o un fragmento formador del complejo pentamérico gH/gL/pUL128/pUL130/pUL131 del mismo, pUL128 o un fragmento formador de complejos del mismo, pUL130 o un fragmento formador de complejos del mismo y pUL131 o un fragmento formador de complejos del mismo, que comprende:
(i) cultivar la célula CHO de una cualquiera de las reivindicaciones 1-11 en una condición adecuada, expresando de ese modo dicho complejo pentamérico; y
(ii) cosechar dicho complejo pentamérico del cultivo.
ES15791768T 2014-10-31 2015-10-29 Células de mamífero que expresan antígenos de citomegalovirus Active ES2799735T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14191385.5A EP3015475A1 (en) 2014-10-31 2014-10-31 Mammalian cells expressing cytomegalovirus antigens
PCT/IB2015/058349 WO2016067239A1 (en) 2014-10-31 2015-10-29 Mammalian cells expressing cytomegalovirus antigens

Publications (1)

Publication Number Publication Date
ES2799735T3 true ES2799735T3 (es) 2020-12-21

Family

ID=51844603

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15791768T Active ES2799735T3 (es) 2014-10-31 2015-10-29 Células de mamífero que expresan antígenos de citomegalovirus

Country Status (19)

Country Link
US (1) US10414802B2 (es)
EP (2) EP3015475A1 (es)
JP (1) JP6688297B2 (es)
CN (1) CN107075486B (es)
AR (1) AR102464A1 (es)
BE (3) BE1023364B1 (es)
BR (1) BR112017008827A2 (es)
CA (1) CA2964859C (es)
CY (1) CY1123405T1 (es)
DK (1) DK3212660T3 (es)
ES (1) ES2799735T3 (es)
HR (1) HRP20200932T1 (es)
HU (1) HUE049356T2 (es)
LT (1) LT3212660T (es)
MX (1) MX2017005661A (es)
PL (1) PL3212660T3 (es)
PT (1) PT3212660T (es)
SI (1) SI3212660T1 (es)
WO (1) WO2016067239A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104853771A (zh) 2012-07-06 2015-08-19 诺华股份有限公司 巨细胞病毒蛋白的复合物
EP3052106A4 (en) 2013-09-30 2017-07-19 ModernaTX, Inc. Polynucleotides encoding immune modulating polypeptides
DK3137595T3 (da) * 2014-04-29 2019-06-17 Novartis Ag Hidtil ukendte vertebratceller og fremgangsmåder til rekombinant ekspression af et polypeptid af interesse
EP3048114A1 (en) 2015-01-22 2016-07-27 Novartis AG Cytomegalovirus antigens and uses thereof
AU2016342045A1 (en) 2015-10-22 2018-06-07 Modernatx, Inc. Human cytomegalovirus vaccine
EP3528821A4 (en) 2016-10-21 2020-07-01 ModernaTX, Inc. VACCINE AGAINST THE HUMANE CYTOMEGALOVIRUS
CN107723276B (zh) * 2017-11-02 2021-08-13 上海交通大学 一种稳定高表达目标产物的细胞株的构建方法和试剂盒
BR112020022393A2 (pt) 2018-05-04 2021-02-02 SpyBiotech Limited composição, vacina compreendendo uma composição, método para produzir uma composição, molécula de ácido nucleico, e, vetor, célula hospedeira, kit compreendendo uma composição, e, vacinas para uso na profilaxia e/ou tratamento de infecção por citomegalovírus e por vírus sincicial respiratório.
CA3121915A1 (en) * 2018-12-10 2020-06-18 Km Biologics Co., Ltd. Vaccine for preventing or treating congenital infection with cytomegalovirus
US11406703B2 (en) 2020-08-25 2022-08-09 Modernatx, Inc. Human cytomegalovirus vaccine
JP2023551982A (ja) * 2020-12-02 2023-12-13 セキラス インコーポレイテッド マルチシストロン性rnaワクチン及びその使用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
GB8717430D0 (en) 1987-07-23 1987-08-26 Celltech Ltd Recombinant dna product
EP0747485B1 (en) 1989-11-06 1998-12-02 Cell Genesys, Inc. Production of proteins using homologous recombination
US5589392A (en) 1991-01-14 1996-12-31 Stratagene Nucleic acid construct encoding a nuclear transport peptide operatively linked to an inducible promoter
EP2037959B1 (en) 2006-06-07 2016-01-27 The Trustees Of Princeton University Cytomegalovirus surface protein complex for use in vaccines and as a drug target
TR201903651T4 (tr) * 2010-10-11 2019-04-22 Glaxosmithkline Biologicals Sa Antijen uygulama platformları.
CN104853771A (zh) 2012-07-06 2015-08-19 诺华股份有限公司 巨细胞病毒蛋白的复合物
EP2935319B1 (en) 2012-12-18 2019-04-24 Novartis AG Production of therapeutic proteins in genetically modified mammalian cells
DK3083677T3 (da) 2013-12-20 2019-11-25 Novartis Ag Hidtil ukendte eukaryote celler og fremgangsmåder til rekombinant ekspression af et produkt af interesse
KR102288857B1 (ko) 2013-12-20 2021-08-11 노파르티스 아게 신규한 진핵 세포 및 관심 생성물의 재조합 발현 방법
WO2015165480A1 (en) * 2014-04-30 2015-11-05 Institute For Research In Biomedicine Human cytomegalovirus vaccine compositions and method of producing the same
DK3137595T3 (da) 2014-04-29 2019-06-17 Novartis Ag Hidtil ukendte vertebratceller og fremgangsmåder til rekombinant ekspression af et polypeptid af interesse

Also Published As

Publication number Publication date
LT3212660T (lt) 2020-07-10
US20170362278A1 (en) 2017-12-21
SI3212660T1 (sl) 2020-07-31
BE1023841B1 (fr) 2017-08-10
CN107075486B (zh) 2021-06-22
MX2017005661A (es) 2017-06-26
BE1023364B1 (fr) 2017-02-20
BE1023840A1 (fr) 2017-08-09
DK3212660T3 (da) 2020-06-15
BE1023840B1 (fr) 2017-08-10
CA2964859C (en) 2023-04-04
JP6688297B2 (ja) 2020-04-28
US10414802B2 (en) 2019-09-17
EP3212660A1 (en) 2017-09-06
BR112017008827A2 (pt) 2018-03-27
EP3212660B1 (en) 2020-03-25
CA2964859A1 (en) 2016-05-06
PT3212660T (pt) 2020-06-23
PL3212660T3 (pl) 2020-10-05
HRP20200932T1 (hr) 2020-09-18
BE1023841A1 (fr) 2017-08-09
CN107075486A (zh) 2017-08-18
HUE049356T2 (hu) 2020-09-28
AR102464A1 (es) 2017-03-01
BE1023364A1 (fr) 2017-02-20
CY1123405T1 (el) 2021-12-31
JP2017534283A (ja) 2017-11-24
EP3015475A1 (en) 2016-05-04
WO2016067239A1 (en) 2016-05-06

Similar Documents

Publication Publication Date Title
ES2799735T3 (es) Células de mamífero que expresan antígenos de citomegalovirus
JP4138479B2 (ja) 動物細胞に使用する発現ベクター
ES2345508T3 (es) Procedimiento para la preparacion de lineas celulares humanas permanentes.
US20210171591A1 (en) Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)
ES2731246T3 (es) Células de vertebrado novedosas y métodos para expresar de forma recombinante un polipéptido de interés
ES2738641T3 (es) Producción de proteínas terapéuticas en células de mamífero modificadas genéticamente
ES2239387T3 (es) Vectores de expresion de insecto.
CN109068621B (zh) 具有人源化的tmprss基因的啮齿类动物
Tan et al. Conditional disruption of ubiquitous calpains in the mouse
WO2002048379A1 (en) Expression vector for animal cell containing nuclear matrix attachment region fo interferon beta
CA3077594C (en) Modified ec7 cells having low toxicity to viral production payloads
ES2742724T3 (es) Producción de factor X funcional y completamente procesado en un sistema de expresión de mamífero que secreta furina
US20210108188A1 (en) Non-covalent systems and methods for dna editing
Reil et al. Test system for determination of HIV-1 frameshifting efficiency in animal cells
WO2014188042A1 (es) Vectores alfavirales y líneas celulares para la producción de proteínas recombinantes
US20100015654A1 (en) Negative regulation of NK cell functions by EAT-2, a sap-related adaptor expressed in innate immune cells
WO2020152163A1 (en) Improved cre/lox dna construct
WO2003064644A1 (fr) Methode de retroposition de sequences line
CN117836417A (zh) 真核基因表达的方法
KR101225564B1 (ko) 개 IgG의 FC 도메인의 세포 표면 발현용 벡터, 상기 벡터에 의해 형질전환된 숙주세포 및 상기 숙주세포를 이용한 개 질병 관련 바이러스에 대한 백신의 제조방법
WO2015133611A1 (ja) 標的タンパク質の量の低減のためのポリペプチド、単離された核酸、組み換えベクター、及び形質転換体